2023 批量抓取公眾號歷史文章數據(閱讀數點贊數在看數留言數等)
我寫了個腳本批量抓取公眾號歷史文章數據(閱讀數點贊數在看數留言數)
2023 批量下載公眾號文章內容/話題/圖片/封面/視頻/音頻,導出文章pdf和文章數據包含閱讀數/點贊數/在看數/留言數

下載的excel文章數據包含文章日期,文章標題,文章鏈接,文章簡介,文章作者,文章封面圖,是否原創(chuàng),IP歸屬地,閱讀數,在看數,點贊數,留言數,贊賞次數,視頻數,音頻數等,比如深圳衛(wèi)健委2022年的1000多篇文章閱讀數都是10萬+,excel數據分析見這篇文章2022年過去,抓取公眾號閱讀數點贊數在看數留言數做數據分析, 以深圳衛(wèi)健委這個號為例?。

以微信派這個號2022年所有文章為例。

文章總數量168:
>>> len(wechat) 168
原創(chuàng)只有1篇:
wechat.groupby('是否原創(chuàng)')['在看數'].count().sort_values(ascending=False).head(5) wechat.groupby('是否原創(chuàng)').agg({"在看數":'count'}).sort_values(by=['在看數'],ascending=False).head(5) >>> wechat.是否原創(chuàng).value_counts().sort_values(ascending=False).head(5) 否 ? ?167 是 ? ? ?1 Name: 是否原創(chuàng), dtype: int64
頭條164篇,次條4篇

文章作者只有2個,可能大部分沒填:
>>> wechat.文章作者.value_counts().sort_values(ascending=False).head(5) 不會畫 ? ? ?1 持錘鑒寶的 ? ?1 Name: 文章作者, dtype: int64
閱讀數10萬+的文章有10篇,總閱讀數6290254:

平均閱讀數,點贊數,在看數和留言數:

然后再分析留言數據excel文件,包括文章日期,文章鏈接,文章標題,留言昵稱,留言內容,留言點贊數,留言回復,留言時間,留言地區(qū)等。

python分析留言次數最多的10個小伙伴
>>> wechat2.評論昵稱.value_counts().sort_values(ascending=False).head(10) 喵 ? ? ? ? 50 萬景明 ? ? ? 47 ? ? ? ? ? 43 迷路的男人 ? ? 41 Korin ? ? 38 謝卓錕 ? ? ? 37 宗琦 ? ? ? ?35 ?櫻桃小玩子 ? ?33 HM灬濤 ? ? ?25 Enemy ? ? 23 Name: 評論昵稱, dtype: int64
順便再統(tǒng)計下留言中省份最多的10個,廣東排第一。

文章下的留言也在pdf文件里,點擊左側標題書簽可以跳轉到對應文章:


2023 更新版:蘇生不惑開發(fā)過的那些原創(chuàng)工具和腳本
再次更新:2023批量下載公眾號文章內容/話題/圖片/封面/視頻/音頻,導出文章pdf,文章數據含閱讀數/點贊數/在看數/留言數
微博圖床又搞事情不能用了,盤它,我順便寫了個微博圖片/視頻/內容/文章批量下載工具
2023 年數字圖書館 zlibrary 復活,新推出客戶端人人可用
總有人問我 Cookie 是什么?