散文網(wǎng) » 生活 »日常 » 2023年我開發(fā)了個pdf合并生成書簽工具，將公眾號所有文章下載導(dǎo)出合成一個pdf文件

2023年我開發(fā)了個pdf合并生成書簽工具，將公眾號所有文章下載導(dǎo)出合成一個pdf文件

2023-07-29 10:46 作者:蘇生不惑 0人讀過 | 我要投稿

pdf文件太多想合并成一個，于是用PDFShaper合并pdf，但合并后的pdf沒有書簽：

于是用python寫了個pdf合并工具，這里以莫言的公眾號文章為例，先下載他的所有公眾號文章，詳情見我之前的文章?一鍵批量下載微信公眾號文章內(nèi)容/圖片/封面/視頻/音頻，支持導(dǎo)出html和pdf格式，包含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)??，導(dǎo)出的文章數(shù)據(jù)包含文章日期，文章標(biāo)題，文章鏈接，文章簡介，文章作者，文章封面圖，是否原創(chuàng)，IP歸屬地，閱讀數(shù)，在看數(shù)，點(diǎn)贊數(shù)和留言數(shù)等，看IP歸屬地莫言在上海：

文章也同步到博客了

所有音頻也下載了：

如果是批量下載文章里的音頻/視頻可以使用我開發(fā)的這個小工具我又開發(fā)了個公眾號音頻視頻和話題批量下載工具，效果：

話題下的音頻也支持，代碼如下：

下載效果：

下載的文章html先轉(zhuǎn)換成pdf：

代碼如下：

def?to_pdf(): ????import?pdfkit ????print('導(dǎo)出?PDF...') ????htmls?=?[] ????for?root,?dirs,?files?in?os.walk('.'): ?????for?name?in?files: ??????if?name.endswith(".html"): ???????print(name) ???????try: ????????pdfkit.from_file(name,?'pdf/'+name.replace('.html',?'')+'.pdf') ???????except?Exception?as?e: ????????print(e) def?to_word(): ????print('導(dǎo)出?word...') ????htmls?=?[] ????for?root,?dirs,?files?in?os.walk('.'): ????????for?name?in?files: ????????????if?name.endswith(".pdf"): ????????????????print(name) ????????????????try: ????????????????????cv?=?Converter(name) ????????????????????cv.convert('word/'+name.replace('.pdf',?'')+'.docx') ????????????????????cv.close() ????????????????except?Exception?as?e: ????????????????????print(e) to_pdf() #?to_word()