2023批量下載公眾號(hào)文章并抓取數(shù)據(jù):閱讀數(shù)點(diǎn)贊數(shù)在看數(shù)留言數(shù)等導(dǎo)出備份excel
批量下載公眾號(hào)文章我是通過(guò)抓包用python下載的,我在之前的文章說(shuō)過(guò),下載效果如圖:
視頻更新版:批量下載公眾號(hào)文章內(nèi)容/話題/圖片/封面/音頻/視頻,導(dǎo)出html,pdf,excel包含閱讀數(shù)/點(diǎn)贊數(shù)/留言數(shù)


下載的excel文件是文章數(shù)據(jù),包含了文章日期,文章標(biāo)題,文章鏈接,文章簡(jiǎn)介,文章作者,文章封面圖,是否原創(chuàng),IP歸屬地,閱讀數(shù),在看數(shù),點(diǎn)贊數(shù),留言數(shù),贊賞次數(shù)等, 深圳衛(wèi)健委的閱讀數(shù)都是10萬(wàn)+:

文章下的留言 也可以下載到excel,包含文章日期,文章標(biāo)題文章鏈接,留言昵稱,留言內(nèi)容,點(diǎn)贊數(shù),回復(fù)和留言時(shí)間等 ,比如深圳衛(wèi)健委在2月份就有1萬(wàn)6千多條留言。

接著可以用python來(lái)分析excel里的數(shù)據(jù),wechat=pd.read_csv('xxx公眾號(hào)歷史文章.csv',encoding='utf-8')
查看文章總數(shù)量:
len(wechat)
查看閱讀數(shù)總數(shù):
>>> wechat.閱讀數(shù).sum()
文章發(fā)布作者前5的文章列表:
>>> wechat.文章作者.value_counts().sort_values(ascending=False).head(5)
閱讀數(shù)10萬(wàn)+文章列表:
>>> wechat[wechat.閱讀數(shù)>100000]
? ? ? ? ? 文章日期 ? ? ? ? ? ? ? ? ?文章標(biāo)題 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章鏈接 ?... ? ? 閱讀數(shù) ?在
閱讀數(shù)排行前10的文章列表:
>>> wechat[['文章日期','文章標(biāo)題','文章鏈接','閱讀數(shù)']].sort_values(by='閱讀數(shù)', ascending=False).head(10)
更新版:整理下蘇生不惑開(kāi)發(fā)過(guò)的那些工具和腳本
如果只是下載單篇文章的內(nèi)容,圖片,視頻,音頻,封面,我也寫(xiě)了個(gè)工具:
神器又更新了,解放雙手,一鍵下載
下載的音頻文件保存在audio目錄,視頻文件保存在video目錄,封面保存在cover目錄,圖片保存在images目錄,文章內(nèi)容保存在html目錄,非常清晰。

