【Python爬蟲(chóng)】從最簡(jiǎn)單的調(diào)用接口采集網(wǎng)易云音樂(lè)數(shù)據(jù),到升級(jí)版JS加密解析數(shù)據(jù)爬取
2021-10-13 19:14 作者:松鼠愛(ài)吃餅干 | 我要投稿
環(huán)境
python3.8
pycharm2021.2
知識(shí)點(diǎn)
requests >>> pip install requests
execjs >>> pip install PyExecJS
第一步
打開(kāi)這個(gè)網(wǎng)站 在里面去分析我們需要的數(shù)據(jù) 每個(gè)音樂(lè)的名稱(chēng) id

去網(wǎng)頁(yè)源代碼查找數(shù)據(jù),發(fā)現(xiàn)并沒(méi)有,這個(gè)網(wǎng)頁(yè) 并不是一個(gè)靜態(tài)頁(yè)面

打開(kāi)開(kāi)發(fā)者工具,找到歌曲的id

找到真正的目標(biāo)網(wǎng)址?https://music.163.com/discover/toplist


第二步
通過(guò)代碼去實(shí)現(xiàn)當(dāng)前這一個(gè)步驟
通過(guò)代碼去訪(fǎng)問(wèn)當(dāng)這個(gè)頁(yè)面 -- 拿到網(wǎng)頁(yè)源代碼
提取我們真正想要的 音樂(lè)的名稱(chēng) id
下載音樂(lè): id獲取是為了下載音樂(lè)
分析里面音樂(lè)數(shù)據(jù)的 加密規(guī)則 去下載歌曲
開(kāi)始代碼
先導(dǎo)入所需模塊
請(qǐng)求數(shù)據(jù)
提取我們真正想要的 音樂(lè)的名稱(chēng) id
導(dǎo)入js文件
保存文件


標(biāo)簽: