散文網 » 生活 »日常 » 2023 批量抓取公眾號歷史文章數據（閱讀數點贊數在看數留言數等）

2023 批量抓取公眾號歷史文章數據（閱讀數點贊數在看數留言數等）

2023-08-10 21:43 作者:蘇生不惑 0人讀過 | 我要投稿

我寫了個腳本批量抓取公眾號歷史文章數據（閱讀數點贊數在看數留言數）

2023 批量下載公眾號文章內容/話題/圖片/封面/視頻/音頻，導出文章pdf和文章數據包含閱讀數/點贊數/在看數/留言數

下載的excel文章數據包含文章日期，文章標題，文章鏈接，文章簡介，文章作者，文章封面圖，是否原創(chuàng)，IP歸屬地，閱讀數，在看數，點贊數，留言數，贊賞次數，視頻數，音頻數等，比如深圳衛(wèi)健委2022年的1000多篇文章閱讀數都是10萬+，excel數據分析見這篇文章2022年過去，抓取公眾號閱讀數點贊數在看數留言數做數據分析，以深圳衛(wèi)健委這個號為例?。

以微信派這個號2022年所有文章為例。

文章總數量168：

>>> len(wechat) 168

原創(chuàng)只有1篇：

wechat.groupby('是否原創(chuàng)')['在看數'].count().sort_values(ascending=False).head(5) wechat.groupby('是否原創(chuàng)').agg({"在看數":'count'}).sort_values(by=['在看數'],ascending=False).head(5) >>> wechat.是否原創(chuàng).value_counts().sort_values(ascending=False).head(5) 否 ? ?167 是 ? ? ?1 Name: 是否原創(chuàng), dtype: int64

頭條164篇，次條4篇

文章作者只有2個，可能大部分沒填：

>>> wechat.文章作者.value_counts().sort_values(ascending=False).head(5) 不會畫 ? ? ?1 持錘鑒寶的 ? ?1 Name: 文章作者, dtype: int64

閱讀數10萬+的文章有10篇，總閱讀數6290254：

平均閱讀數，點贊數，在看數和留言數：

然后再分析留言數據excel文件，包括文章日期，文章鏈接，文章標題，留言昵稱，留言內容，留言點贊數，留言回復，留言時間，留言地區(qū)等。

python分析留言次數最多的10個小伙伴

>>> wechat2.評論昵稱.value_counts().sort_values(ascending=False).head(10) 喵 ? ? ? ? 50 萬景明 ? ? ? 47 ? ? ? ? ? 43 迷路的男人 ? ? 41 Korin ? ? 38 謝卓錕 ? ? ? 37 宗琦 ? ? ? ?35 ?櫻桃小玩子 ? ?33 HM灬濤 ? ? ?25 Enemy ? ? 23 Name: 評論昵稱, dtype: int64

順便再統(tǒng)計下留言中省份最多的10個，廣東排第一。