2023 批量抓取公眾號(hào)歷史文章數(shù)據(jù)(閱讀數(shù),點(diǎn)贊數(shù),留言數(shù)),導(dǎo)出文章pdf
2023年我寫(xiě)了個(gè)腳本批量下載某個(gè)公眾號(hào)的所有歷史文章批量下載公眾號(hào)文章內(nèi)容/話題/圖片/封面/音頻/視頻,導(dǎo)出html,pdf,excel包含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)/贊賞數(shù)?,效果如圖:

下載的excel文件數(shù)據(jù)包含文章日期,文章標(biāo)題,文章鏈接,文章簡(jiǎn)介,文章作者,文章封面圖,是否原創(chuàng),IP歸屬地,閱讀數(shù),在看數(shù),點(diǎn)贊數(shù),留言數(shù),贊賞次數(shù),視頻數(shù),音頻數(shù)等,比如深圳衛(wèi)健委2022年的1000多篇文章閱讀數(shù)都是10萬(wàn)+,excel的數(shù)據(jù)分析見(jiàn)這篇文章2022年過(guò)去,抓取公眾號(hào)閱讀數(shù)點(diǎn)贊數(shù)在看數(shù)留言數(shù)做數(shù)據(jù)分析, 以深圳衛(wèi)健委這個(gè)號(hào)為例?,我用的python的pandas。

為了方便找歷史文章,部分公眾號(hào)的所有歷史文章同步到了博客,會(huì)持續(xù)更新,不用在手機(jī)上一直下拉翻歷史文章了 ,比如深圳衛(wèi)健委從2014到2023發(fā)布了1萬(wàn)多篇文章,第一篇文章很快就能找到:

每篇文章下的留言內(nèi)容也可以單獨(dú)導(dǎo)出到excel,數(shù)據(jù)包含文章日期,文章標(biāo)題文章鏈接,留言昵稱,留言內(nèi)容,點(diǎn)贊數(shù),回復(fù)和留言時(shí)間,比如深圳衛(wèi)健委這個(gè)號(hào)在2月份就有1萬(wàn)6千多條留言。

下載所有文章這里以莫言老師的公眾號(hào)為例,包括文章內(nèi)容(含留言),音頻和視頻等 :


最后我還寫(xiě)了個(gè)工具將所有文章合并成一個(gè)pdf文件(含留言),點(diǎn)擊左側(cè)書(shū)簽跳轉(zhuǎn)到對(duì)應(yīng)文章,保存在電腦和手機(jī)上看方便多了:


2023 更新版:我開(kāi)發(fā)過(guò)的那些原創(chuàng)工具和腳本
再次更新:2023批量下載公眾號(hào)文章內(nèi)容/話題/圖片/封面/視頻/音頻,導(dǎo)出文章pdf,文章數(shù)據(jù)含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)
微博圖床又搞事情不能用了,盤(pán)它,我順便寫(xiě)了個(gè)微博圖片/視頻/內(nèi)容/文章批量下載工具
2023 年數(shù)字圖書(shū)館 zlibrary 復(fù)活,新推出客戶端人人可用
總有人問(wèn)我 Cookie 是什么?