2023 批量下載公眾號文章內(nèi)容/話題/圖片/封面/視頻/音頻,導(dǎo)出文章pdf和文章數(shù)據(jù)
分享下我開發(fā)的幾個公眾號下載工具。
公眾號文章/音頻/視頻下載
輸入文章地址即可下載文章和文章里的文章,比如這篇文章鏈接視頻更新版:批量下載公眾號文章內(nèi)容/話題/圖片/封面/音頻/視頻,導(dǎo)出html,pdf,excel包含閱讀數(shù)/點(diǎn)贊數(shù)/留言數(shù)? ?,下載效果如圖:

輸入文件名下載文件里的公眾號文章,每行一個鏈接:

我之前還錄制了個視頻視頻更新版:批量下載公眾號文章內(nèi)容/話題/圖片/封面/音頻/視頻,導(dǎo)出html,pdf,excel包含閱讀數(shù)/點(diǎn)贊數(shù)/留言數(shù)?:
下載的音頻保存在audio目錄,視頻保存在video目錄,封面保存在cover目錄,圖片保存在images目錄,文章內(nèi)容保存在html目錄。



下載過的文章鏈接在文件wechat_list.txt,第2次下載會跳過已經(jīng)下載過的文章。

公眾號話題文章/音頻/視頻下載
比如這個話題:

打開wechat_topic_down.exe輸入話題鏈接下載話題里的文章,下載效果如圖:

音頻/視頻和文章html都下載了:


下載過的文章鏈接在文件wechat_topic_list.txt,第2次下載會跳過已經(jīng)下載過的文章,效果:

純音頻話題也支持:

1000個音頻很快就下載完了。

下載過的音頻保存在文件wechat_topic_audio_list.txt ,如果第2次下載也會跳過已經(jīng)下載過的音頻,效果:

公眾號模板文章/音頻/視頻下載
以支付寶這個模板頁面為例:

打開wechat_homepage.exe輸入地址,下載效果:


還生成了一個文章列表excel文件,包含文章日期,文章標(biāo)題,文章鏈接和文章封面。

第2次下載會跳過已經(jīng)下載過的文章:

html和pdf轉(zhuǎn)換
上面的工具只下載了文章html,如果想轉(zhuǎn)pdf用我開發(fā)的html2pdf.exe可以將html批量轉(zhuǎn)換為pdf, 下載安裝wkhtmltopdf再添加到環(huán)境變量,運(yùn)行html2pdf.exe就可以了,批量轉(zhuǎn)換后的pdf文件保存在pdf目錄。

批量下載公眾號歷史文章內(nèi)容和數(shù)據(jù)
上面的工具只能下載部分文章,為了下載一個號的所有文章,我寫了個腳本批量下載某個公眾號的所有歷史文章批量下載公眾號文章內(nèi)容/話題/圖片/封面/音頻/視頻,導(dǎo)出html,pdf,excel包含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)/贊賞數(shù)?,下載效果如圖:

下載的excel文章數(shù)據(jù)包含文章日期,文章標(biāo)題,文章鏈接,文章簡介,文章作者,文章封面圖,是否原創(chuàng),IP歸屬地,閱讀數(shù),在看數(shù),點(diǎn)贊數(shù),留言數(shù),贊賞次數(shù),視頻數(shù),音頻數(shù)等,比如深圳衛(wèi)健委2022年的1000多篇文章閱讀數(shù)都是10萬+,excel數(shù)據(jù)分析見這篇文章2022年過去,抓取公眾號閱讀數(shù)點(diǎn)贊數(shù)在看數(shù)留言數(shù)做數(shù)據(jù)分析, 以深圳衛(wèi)健委這個號為例?。

比如深圳衛(wèi)健委從2014到2023發(fā)布了1萬多篇文章,第一篇文章是這個:

另外每個月我還會更新一次公眾號深圳衛(wèi)健委的封面表情包圖,無水印,歡迎收藏?2022 年公眾號深圳衛(wèi)健委所有歷史文章無水印封面表情包合集,分享到網(wǎng)盤了,所有封面圖的文件名為文章發(fā)布日期加標(biāo)題,方便搜索?。
每篇文章下的留言內(nèi)容也可以單獨(dú)導(dǎo)出excel,包含文章日期,文章標(biāo)題文章鏈接,留言昵稱,留言內(nèi)容,點(diǎn)贊數(shù),回復(fù)和留言時間,比如深圳衛(wèi)健委在2月份就有1萬6千多條留言。

下載所有文章包括文章內(nèi)容(含留言),音頻和視頻 :

最后將所有文章合并成一個pdf文件(含留言),點(diǎn)擊左側(cè)書簽跳轉(zhuǎn)到對應(yīng)文章,在電腦和手機(jī)上看方便多了:

