《雙城之戰(zhàn)》口碑爆炸,卻有評(píng)論說它不如國漫?Python采集好評(píng)、中評(píng)、差評(píng),看它真有
前言
上次爬了《雙城之戰(zhàn)》的視頻彈幕,效果很不理想,這次的目標(biāo)是豆瓣的評(píng)論數(shù)據(jù)
分別把好評(píng)、一般和差評(píng)都一起爬下來


知識(shí)點(diǎn)
爬蟲基本流程
requests
制作詞云
jieba
imageio
wordcloud
環(huán)境
Python 3.8
pycharm 2021.2
代碼實(shí)現(xiàn)部分
發(fā)送請(qǐng)求
解析數(shù)據(jù)
保存數(shù)據(jù)
制作詞云圖
評(píng)論爬蟲代碼
導(dǎo)入模塊
請(qǐng)求數(shù)據(jù)
先打開開發(fā)者工具找到數(shù)據(jù)

解析數(shù)據(jù)
翻頁
找到不同頁數(shù)的規(guī)律,用for page進(jìn)行翻頁

保存數(shù)據(jù)
實(shí)現(xiàn)效果

詞云代碼
導(dǎo)入模塊
導(dǎo)入imageio庫中的imread函數(shù),并用這個(gè)函數(shù)讀取本地圖片,作為詞云形狀圖片
讀取文件內(nèi)容
jiabe 分詞 分割詞匯
詞云圖設(shè)置
給詞云輸入文字
詞云圖保存圖片地址
全部評(píng)論詞云圖

好評(píng)詞云圖

一般詞云圖

差評(píng)詞云圖

標(biāo)簽: