PyQt爬蟲綜合案例:多線程、QSS
2023-07-18 16:01 作者:矢來美羽MIUYARAI | 我要投稿
通過 PyQt 開發(fā)的界面,顯示爬蟲爬取到的內(nèi)容。在本章,我們會爬取“Quotes to Scrape”名人名言網(wǎng)站(https://quotes.toscrape.com/)的內(nèi)容,并將爬蟲功能融入 PyQt 開發(fā)的界面中,從而開發(fā)一款可視化爬取軟件,如圖 9-1 所示。(參考《PyQt編程快速上手》第9章)

第一步 目標網(wǎng)站分析
“Quotes to Scrape”名人名言網(wǎng)站:https://quotes.toscrape.com/
部分HTML技巧:https://www.bilibili.com/video/BV1d54y1g7db?p=7
打開網(wǎng)頁,右鍵檢查,左上角圖標:

提取目標為名言、作者、標簽的文本,首先是名言的文本:

div標簽下的span內(nèi)部:

因此XPath語句為:
同理,作者和標簽的文本:

從而得到:1. crawl.py
第二步 界面布局
確定布局界面,以及使用Qt-Material庫來美化界面。
從而得到:2. window.py
使用Qt-Material美化的主程序:3. main.py
第三步 古古怪怪的音效
準備三個音頻文件:

音效模塊:sound.py
第四步 打包
打包相關(guān)知識參考:PyQt完整軟件綜合案例:登錄框
打包后大小為59MB:

標簽: