Python爬取豆瓣Top250并可視化(一) —— 保存數(shù)據(jù)到Excel —— xlwt
今天看了某招聘平臺(tái)的Python崗,好多數(shù)據(jù)分析崗,感覺(jué)上,不復(fù)習(xí)一下Python爬蟲(chóng)和數(shù)據(jù)可視化就要被淘汰了。于是我來(lái)做一期自己復(fù)習(xí)的材料。
做可視化,得先有數(shù)據(jù),所以第一個(gè)是爬蟲(chóng),代碼如下:
解釋一下思路,方便以后自己復(fù)習(xí):
1,請(qǐng)求數(shù)據(jù),要請(qǐng)求25次,每次請(qǐng)求都解析網(wǎng)頁(yè)數(shù)據(jù),然后將每次請(qǐng)求得到的網(wǎng)頁(yè)數(shù)據(jù)用一個(gè)列表存儲(chǔ)起來(lái),以供需要的時(shí)候直接從內(nèi)存中調(diào)用;
2,寫(xiě)到excel中這里是用的xlwt,下次用openpyxl,相對(duì)來(lái)說(shuō)邏輯會(huì)簡(jiǎn)單很多。xlwt建的excel格式是xls的,不是xlsx,然后左上角的第一格是0,0。這個(gè)邏輯建議參考一下前面的99乘法表的文章;
3,代碼可能存在多次debug,然后會(huì)產(chǎn)生I/O問(wèn)題,將打開(kāi)的文件關(guān)閉試試看。
最后是保存截圖:

聲明:本文僅供交流學(xué)習(xí),特別是作者復(fù)習(xí)使用。不具備任何其他用途。
標(biāo)簽: