最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

小象學(xué)院爬蟲實(shí)戰(zhàn)課

2023-05-26 16:45 作者:31775301  | 我要投稿

爬蟲的基本流程:

用戶獲取網(wǎng)絡(luò)數(shù)據(jù)的方式:


方式1:瀏覽器提交請(qǐng)求--->下載網(wǎng)頁代碼--->解析成頁面


方式2:模擬瀏覽器發(fā)送請(qǐng)求(獲取網(wǎng)頁代碼)->提取有用的數(shù)據(jù)->存放于數(shù)據(jù)庫或文件中


爬蟲要做的就是方式2;

爬蟲的基本流程:

用戶獲取網(wǎng)絡(luò)數(shù)據(jù)的方式:


方式1:瀏覽器提交請(qǐng)求--->下載網(wǎng)頁代碼--->解析成頁面


方式2:模擬瀏覽器發(fā)送請(qǐng)求(獲取網(wǎng)頁代碼)->提取有用的數(shù)據(jù)->存放于數(shù)據(jù)庫或文件中


爬蟲要做的就是方式2;

1、發(fā)起請(qǐng)求


使用http庫向目標(biāo)站點(diǎn)發(fā)起請(qǐng)求,即發(fā)送一個(gè)Request


Request包含:請(qǐng)求頭、請(qǐng)求體等


Request模塊缺陷:不能執(zhí)行JS 和CSS 代碼


2、獲取響應(yīng)內(nèi)容


如果服務(wù)器能正常響應(yīng),則會(huì)得到一個(gè)Response


Response包含:html,json,圖片,視頻等


3、解析內(nèi)容


解析html數(shù)據(jù):正則表達(dá)式(RE模塊),第三方解析庫如Beautifulsoup,pyquery等


解析json數(shù)據(jù):json模塊


解析二進(jìn)制數(shù)據(jù):以wb的方式寫入文件


4、保存數(shù)據(jù)


數(shù)據(jù)庫(MySQL,Mongdb、Redis)


文件


小象學(xué)院爬蟲實(shí)戰(zhàn)課的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
灵寿县| 东乡| 保定市| 象州县| 依安县| 凌源市| 德阳市| 包头市| 南雄市| 马边| 湘阴县| 浠水县| 运城市| 永定县| 富顺县| 东海县| 开原市| 红河县| 芜湖县| 桦川县| 清丰县| 论坛| 江陵县| 棋牌| 手机| 东平县| 辛集市| 长宁县| 晋城| 新乡县| 砚山县| 平乡县| 寻甸| 米易县| 临武县| 奇台县| 兴宁市| 甘谷县| 乳山市| 镇康县| 旬阳县|