【Python爬蟲(chóng)】如何把抖音漂亮的小姐姐(高清、無(wú)水?。┍4娴接脖P(pán)里
2021-10-23 15:56 作者:松鼠愛(ài)吃餅干 | 我要投稿
前言
現(xiàn)在自媒體平臺(tái)上經(jīng)常有一些視頻素材需要保存下來(lái),但是大部分平臺(tái)下載下來(lái)都帶上了平臺(tái)水印,影響視頻美觀。這次我們用爬蟲(chóng),可以爬到高清無(wú)水印的視頻
本文知識(shí)點(diǎn)
1、selenium模塊的使用
2、requests模塊的使用
3、re正則表達(dá)式的使用
環(huán)境介紹
python 3.8
pycharm 2021專業(yè)版 >>> 激活碼
谷歌瀏覽器/火狐瀏覽器
谷歌驅(qū)動(dòng)/火狐驅(qū)動(dòng)
模塊使用
requests >>> pip install requests
selenium >>> pip install selenium
re
time
內(nèi)容
本次目標(biāo):爬取漂亮小姐姐視頻內(nèi)容

分析網(wǎng)頁(yè)
F12或者鼠標(biāo)右鍵點(diǎn)擊檢查 >>>選擇network 下面 media 過(guò)濾音頻和視頻數(shù)據(jù)包

找到播放地址 (指定的當(dāng)前視頻的播放地址),視頻播放地址, 是可以在視頻詳情頁(yè)網(wǎng)頁(yè)源代碼里面可以獲取
代碼實(shí)現(xiàn)步驟:
發(fā)送請(qǐng)求, 對(duì)于視頻詳情頁(yè)發(fā)送請(qǐng)求
獲取數(shù)據(jù), 獲取網(wǎng)頁(yè)源代碼數(shù)據(jù)內(nèi)容
解析數(shù)據(jù), 提取視頻播放地址 以及 視頻標(biāo)題
保存數(shù)據(jù), 把小姐姐視頻保存到本地
爬取一個(gè)視頻內(nèi)容
導(dǎo)入模塊
發(fā)送請(qǐng)求
獲取數(shù)據(jù)

解析數(shù)據(jù)
提取視頻播放地址,以及視頻標(biāo)題
保存數(shù)據(jù)
運(yùn)行代碼,得到數(shù)據(jù)

批量獲取數(shù)據(jù)數(shù)據(jù)
導(dǎo)入模塊
實(shí)例化一個(gè)瀏覽器對(duì)象
提取標(biāo)簽

執(zhí)行頁(yè)面滾動(dòng)的操作
替換特殊字符
運(yùn)行代碼


標(biāo)簽: