小紅書單個筆記數(shù)據(jù)采集
▲點擊上方卡片關(guān)注,您的關(guān)注是我持續(xù)更新優(yōu)質(zhì)文章的動力。
功能、效果說明
之前就有考慮過做一個小紅書單個筆記的數(shù)據(jù)采集的功能。
筆記頁面有圖片、標(biāo)題、描述信息、評論。
如若存在其他信息:地點、話題、艾特用戶等。后續(xù)也會將此類信息歸納整理。
這個功能完整版包含了
采集下載所有圖片到指定目錄。
筆記描述保存成文本數(shù)據(jù)文件。
評論單獨保存為一個文本數(shù)據(jù)文件。
效果演示
請求筆記詳情頁的接口可以獲得以下數(shù)據(jù)。

寫入到csv文件的數(shù)據(jù)結(jié)構(gòu)大概如下圖所示。

實現(xiàn)思路
先前有做過小紅書關(guān)鍵詞采集功能。
在那個功能中,我可以獲得筆記基礎(chǔ)信息。
在采集結(jié)果文件中有筆記的id
。
我們只需要把id
加上url
前綴,就可以拿到指定筆記頁面主要的數(shù)據(jù)。
再借助程序,采集該頁面的數(shù)據(jù)即可。
實現(xiàn)代碼
以下是獲取筆記數(shù)據(jù)并寫入csv文件的相關(guān)代碼。

實現(xiàn)原理
用request
模擬get
請求小紅書微信端的筆記詳情接口。
就可以拿到所有的筆記詳情頁的基礎(chǔ)數(shù)據(jù)。
用csv簡單處理數(shù)據(jù),將所有數(shù)據(jù)寫入到csv
文件中。
這個保存了筆記詳情頁數(shù)據(jù)的文件可以用于后續(xù)完整功能的編寫。
總結(jié)與拓展
采集單個小紅書筆記有助于我們對高贊高質(zhì)量筆記進(jìn)行內(nèi)容分析。
對于內(nèi)容運營者的我們,可以學(xué)習(xí)他們優(yōu)秀的地方。
只有知己知彼方能百戰(zhàn)不殆。
希望這個點子能幫助你我創(chuàng)作出更優(yōu)質(zhì)的小紅書筆記。
推薦閱讀
一鍵下載小紅書熱門筆記封面
不會代碼的你也能一鍵批量采集數(shù)據(jù)
小紅書關(guān)鍵詞數(shù)據(jù)采集
我?是哪個:
金九億
95后進(jìn)化不完全的前后端不分離程序猿。
我的關(guān)鍵詞
2015-2018:社團(tuán)、交友、戀愛、兼職。
2018-2019:創(chuàng)業(yè)、路演、校招。
2019-2022:職場、健身。
2022~未來:表達(dá)。
我的信條
堅持健身,持續(xù)學(xué)習(xí),刻意表達(dá)。
我的目標(biāo)
從現(xiàn)在開始,我刻意練習(xí)表達(dá)能力,為了更好地進(jìn)化。
本文使用 文章同步助手 同步