不會吧?學(xué)過爬蟲連這個網(wǎng)站都爬不了?那Python豈不是白學(xué)了
本文內(nèi)容
系統(tǒng)分析目標(biāo)網(wǎng)頁
html標(biāo)簽數(shù)據(jù)解析方法
海量圖片數(shù)據(jù)一鍵保存
環(huán)境介紹
python 3.8
pycharm
模塊使用
requests >>> pip install requests
parsel >>> pip install parsel
time 時間模塊 記錄運(yùn)行時間
通用爬蟲
導(dǎo)入模塊
請求數(shù)據(jù)
解析數(shù)據(jù)
解析速度 bs4 解析速度會慢一些,如果你想要對于字符串?dāng)?shù)據(jù)內(nèi)容,直接取值,只能正則表達(dá)式
保存數(shù)據(jù)

共耗時:61秒

多線程爬蟲
發(fā)送求情
獲取圖片url地址,以及圖片名字
保存數(shù)據(jù)
主函數(shù)
入口

共耗時:19秒
標(biāo)簽: