0代碼采集b站動(dòng)態(tài)頁
前文我講述了關(guān)于我是一名b站重度用戶的事,由此產(chǎn)生了采集一份b站動(dòng)態(tài)頁數(shù)據(jù)的想法。
以下就是我使用八爪魚采集器采集b站動(dòng)態(tài)頁數(shù)據(jù)的詳細(xì)步驟。
01
進(jìn)入bilibili主站
鼠標(biāo)移至右上角的導(dǎo)航欄。

02
點(diǎn)擊動(dòng)態(tài)大風(fēng)車按鈕

03
進(jìn)入b站動(dòng)態(tài)頁面

到達(dá)指定采集頁面。
04
點(diǎn)擊視頻投稿
篩選出視頻動(dòng)態(tài)。
這里就是需要的采集目標(biāo)。

確定了需要采集的數(shù)據(jù)所在的具體位置,接下來就是打開八爪魚采集器。
05
新建自定義任務(wù)

我們在采集器中打開b站。
如果是首次打開,在八爪魚內(nèi)置的瀏覽器中沒有cookie,所以需要登錄一下才能看到自己的動(dòng)態(tài)頁。
登陸完成后。
06
進(jìn)入動(dòng)態(tài)頁面

右側(cè)會(huì)出現(xiàn)一個(gè)操作流程圖。
07
點(diǎn)擊打開流程圖

08
設(shè)置流程圖

可以看一下循環(huán)列表中間這個(gè)提取列表數(shù)據(jù)步驟。
09
點(diǎn)擊提取列表數(shù)據(jù)

在左側(cè)頁面中就選中了需要采集的數(shù)據(jù)元素位置。
這是包含了目標(biāo)頁中所有我需要的數(shù)據(jù)。
10
點(diǎn)擊右上角的采集

選擇本地采集,就會(huì)在本地跑程序,自動(dòng)將當(dāng)前頁面中目標(biāo)列表中所有需要的數(shù)據(jù)都采集出來。
11
點(diǎn)擊導(dǎo)出數(shù)據(jù)

也可以導(dǎo)出為文件,文件格式多種可選,也可以直接導(dǎo)出為數(shù)據(jù)庫文件,主流多種數(shù)據(jù)庫可選。
12
選擇excel確定

我這里演示導(dǎo)出為excel文件。
以上就是整個(gè)b站動(dòng)態(tài)頁數(shù)據(jù)采集全流程。
我 是哪個(gè):
金九億
95后進(jìn)化不完全的前后端不分離程序猿。
我的關(guān)鍵詞
2015-2018:社團(tuán)、交友、戀愛、兼職。
2018-2019:創(chuàng)業(yè)、路演、校招。
2019-2022:職場、健身。
2022~未來:表達(dá)。
我的信條
堅(jiān)持健身,持續(xù)學(xué)習(xí),刻意表達(dá)。
我的目標(biāo)
從現(xiàn)在開始,我刻意練習(xí)表達(dá)能力,為了更好地進(jìn)化。