關(guān)于爬取番劇和視頻這件事
手動(dòng)爬取
1.分析b站視頻
首先隨機(jī)打開一個(gè)番劇的播放主頁,并摁F12打開開發(fā)者工具

在番劇播放過程中,前端會(huì)持續(xù)不斷的向后臺(tái)發(fā)送請(qǐng)求,而瀏覽器network能把它從后端返回過來的響應(yīng)抓到,并顯示出來

找到里面含有m4s的響應(yīng),并隨機(jī)選兩個(gè)響應(yīng)分別鼠標(biāo)單擊,點(diǎn)擊Response,如果能看到的效果是這種亂碼的話,就基本是視頻或者音頻沒跑了, 即便爬取失敗也沒關(guān)系,繼續(xù)找。

打開headers然后截取復(fù)制URL, 黏貼到py文件中

?注意:這里有時(shí)候會(huì)訪問不到因?yàn)闆]帶上referer 就需要下載來看看

2.因?yàn)閎站的視頻是音頻和視頻分開的,所以要分別爬取

運(yùn)行后就能在文件的當(dāng)前目錄看到爬到的音頻和視頻了


3.使用一個(gè)第三方庫 moviepy
如果在導(dǎo)入過程中出現(xiàn)紅線,就在終端下載moviepy
看到進(jìn)度條就只需耐心等待就可以

通過上面的分析可得知番劇是可以這樣爬取的,同樣up主發(fā)布的視頻也是可以的,不過除了官方發(fā)布的視頻(番劇,國(guó)漫,電影,紀(jì)錄片等),爬取up主發(fā)布的視頻還有一個(gè)更加方便的方法,就是主頁自動(dòng)爬取
? ? 主頁自動(dòng)爬取
1.把主頁的網(wǎng)址放到py文件保存好

直接發(fā)送請(qǐng)求獲取響應(yīng)

運(yùn)行打印結(jié)果,查看響應(yīng)數(shù)據(jù),在終端中摁ctrl+f 輸入video和audio


使用正則表達(dá)式的findall匹配出來,因?yàn)檫@個(gè)方法匹配出來的是個(gè)列表所以指向第一個(gè)索引就可以

結(jié)果:

下面的步驟同上,? 把url的變量放到get當(dāng)中去請(qǐng)求服務(wù)器獲取響應(yīng)

保存

合成視頻

最后再運(yùn)行下,等進(jìn)度條到100%就能合成視頻
