軟件教程 | 用Python爬取巨潮資訊上的企業(yè)公告:程序設(shè)計(jì)思路及實(shí)際操作
2022-01-28 19:47 作者:歲月應(yīng)無(wú)虞 | 我要投稿
導(dǎo)言
之前有朋友讓我?guī)兔ε廊【蕹辟Y訊上大概三百多家企業(yè)近十年的公司治理報(bào)告,最近又有朋友因?yàn)轭愃频男枨髞?lái)找我?guī)兔Γ越裉炀徒o大家出一期詳細(xì)的教程來(lái)介紹如何用Python爬取巨潮資訊上的企業(yè)公告。
Part1:網(wǎng)頁(yè)分析
打開(kāi)巨潮資訊官網(wǎng):
判斷網(wǎng)頁(yè)為靜態(tài)結(jié)構(gòu)還是動(dòng)態(tài)結(jié)構(gòu)
如果網(wǎng)頁(yè)為動(dòng)態(tài)結(jié)構(gòu),如何設(shè)計(jì)爬取步驟
通過(guò)分析不同傳遞參數(shù)的含義來(lái)自定義要爬取的內(nèi)容
Part2:準(zhǔn)備工作
Step1:收集待爬企業(yè)信息
格式:
.xls
內(nèi)容:?股票代碼、企業(yè)名稱
布局:?第一列股票代碼,第二列企業(yè)名稱,不加表頭

Step2:導(dǎo)入工具包
Step3:獲取巨潮資訊的數(shù)據(jù)源格式信息
Step4:導(dǎo)出到Excel備用(可選)
Step5:生成待爬取股票清單列表
Part3:正式工作
Step1:定義爬取函數(shù)
Step2:自定義保存路徑
Step3:設(shè)定參數(shù)進(jìn)行遍歷爬取
后臺(tái)回復(fù)爬取巨潮資訊
可下載本教程.pdf
和.ipynb
文件!
標(biāo)簽: