使用python requests模塊爬取《王者榮耀》英雄皮膚
requests 模塊介紹?
?Requests是用python語言基于urllib編寫的,采用的是Apache2 Licensed開源協(xié)議的HTTP庫。與urllib相比,Requests更加方便,可以節(jié)約我們大量的工作,建議爬蟲使用Requests庫。
pip install requests
?思路分析
獲取王者榮耀英雄列表:https://pvp.qq.com/web201605/js/herolist.json 該地址返回的是一個(gè)json對(duì)象
獲取王者榮耀英雄皮膚地址:http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{}/{}-bigskin-{}.jpg {}表示王者榮耀地址需要的英雄id(可以在上面的json文件中找到 ename,) 最后一個(gè){}需要的是第幾個(gè)皮膚,相信大家有辦法能夠自己解決(通過獲取列表的長度)
然后獲取皮膚圖片的下載地址
這里需要用到 urllib中的request來進(jìn)行圖片的保存(urllilb為python自帶的模塊,不需要安裝)
代碼實(shí)現(xiàn)
1、使用requests.get()獲取json文件
url =?'https://pvp.qq.com/web201605/js/herolist.json'
resp = requests.get(url)

2、遍歷json文件中的每個(gè)英雄

3、拿到皮膚名字后需要進(jìn)行處理
hero_pifu = hero_pifu.split('|') ?# ?使用split方法進(jìn)行字符串切割
4、對(duì)英雄進(jìn)行分類存儲(chǔ),需要自動(dòng)創(chuàng)建文件夾

5、對(duì)英雄的皮膚列表進(jìn)行遍歷 獲取對(duì)應(yīng)的皮膚下載地址,然后進(jìn)行存儲(chǔ)

效果展示


歡迎大家轉(zhuǎn)發(fā)本文+評(píng)論回復(fù),并且收藏,學(xué)習(xí)上面有問題可以私聊小年。