2023年我開發(fā)了個pdf合并生成書簽工具,將公眾號所有文章下載導(dǎo)出合成一個pdf文件
pdf文件太多想合并成一個,于是用PDFShaper合并pdf,但合并后的pdf沒有書簽:

于是用python寫了個pdf合并工具,這里以莫言的公眾號文章為例,先下載他的所有公眾號文章,詳情見我之前的文章?一鍵批量下載微信公眾號文章內(nèi)容/圖片/封面/視頻/音頻,支持導(dǎo)出html和pdf格式,包含閱讀數(shù)/點(diǎn)贊數(shù)/在看數(shù)/留言數(shù)??,導(dǎo)出的文章數(shù)據(jù)包含文章日期,文章標(biāo)題,文章鏈接,文章簡介,文章作者,文章封面圖,是否原創(chuàng),IP歸屬地,閱讀數(shù),在看數(shù),點(diǎn)贊數(shù)和留言數(shù)等,看IP歸屬地莫言在上海:

文章也同步到博客了

所有音頻也下載了:

如果是批量下載文章里的音頻/視頻可以使用我開發(fā)的這個小工具我又開發(fā)了個公眾號音頻視頻和話題批量下載工具,效果:


話題下的音頻也支持,代碼如下:
下載效果:


下載的文章html先轉(zhuǎn)換成pdf:

代碼如下:
def?to_pdf():
????import?pdfkit
????print('導(dǎo)出?PDF...')
????htmls?=?[]
????for?root,?dirs,?files?in?os.walk('.'):
?????for?name?in?files:
??????if?name.endswith(".html"):
???????print(name)
???????try:
????????pdfkit.from_file(name,?'pdf/'+name.replace('.html',?'')+'.pdf')
???????except?Exception?as?e:
????????print(e)
def?to_word():
????print('導(dǎo)出?word...')
????htmls?=?[]
????for?root,?dirs,?files?in?os.walk('.'):
????????for?name?in?files:
????????????if?name.endswith(".pdf"):
????????????????print(name)
????????????????try:
????????????????????cv?=?Converter(name)
????????????????????cv.convert('word/'+name.replace('.pdf',?'')+'.docx')
????????????????????cv.close()
????????????????except?Exception?as?e:
????????????????????print(e)
to_pdf()
#?to_word()

然后將轉(zhuǎn)換的pdf合并成一個文件并生成書簽。


合并后的效果:

點(diǎn)擊左側(cè)書簽跳轉(zhuǎn)到對應(yīng)文章pdf(含留言):


當(dāng)然也可以導(dǎo)出pdf的書簽到excel,包含書簽名和頁碼。
