2023年批量下載公眾號(hào)文章,導(dǎo)出文章pdf,抓取文章數(shù)據(jù)含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)
2023批量下載公眾號(hào)文章內(nèi)容/話題/圖片/封面/視頻/音頻,導(dǎo)出html和pdf格式,含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)/贊賞數(shù)

經(jīng)常看公眾號(hào)文章,于是寫了腳本批量抓取下載公眾號(hào)文章內(nèi)容/話題/圖片/封面/視頻/音頻,導(dǎo)出文章html和pdf格式,抓取數(shù)據(jù)含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)/贊賞數(shù)等,下載效果如圖:

下載的音頻保存在audio目錄,視頻保存在video目錄,封面保存在cover目錄,圖片保存在images目錄,文章內(nèi)容保存在html目錄。


第2次下載會(huì)跳過已經(jīng)下載過的文章。

以莫言老師的公眾號(hào)為例,所有文章合成的pdf效果:


下載的excel文章數(shù)據(jù)包含文章日期,文章標(biāo)題,文章鏈接,文章簡(jiǎn)介,文章作者,文章封面圖,是否原創(chuàng),IP歸屬地,閱讀數(shù),在看數(shù),點(diǎn)贊數(shù),留言數(shù),贊賞次數(shù),視頻數(shù),音頻數(shù)等,比如深圳衛(wèi)健委2022年的文章閱讀數(shù)都是10萬+,文章數(shù)據(jù)分析見文章2022年過去,抓取公眾號(hào)閱讀數(shù)點(diǎn)贊數(shù)在看數(shù)留言數(shù)做數(shù)據(jù)分析, 以深圳衛(wèi)健委這個(gè)號(hào)為例。

文章下的留言內(nèi)容也可以導(dǎo)出到excel(包含文章日期,文章標(biāo)題文章鏈接,留言昵稱,留言內(nèi)容,點(diǎn)贊數(shù),回復(fù)和留言時(shí)間),比如深圳衛(wèi)健委在一個(gè)月就有1萬6千多條留言。

更新版:整理下蘇生不惑開發(fā)過的那些工具和腳本