最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

Python Cemotion庫快速進(jìn)行文本情感分析

2022-05-05 10:09 作者:安然Nano  | 我要投稿

臨近畢業(yè)答辯,有些人畢設(shè)還沒怎么寫,找我?guī)兔仔r完成知乎問答爬取和情感分析功能。爬蟲一小時左右就寫好并爬取完數(shù)據(jù)存到CSV里,但情感分析怎么能幾小時內(nèi)完成。我研究方向是CV,對NLP的了解只限于transfomer和常用模型的名詞,但四年的室友我還是得幫個忙。

我首先想到的是否有現(xiàn)成的Python庫可以調(diào)用,因為趕時間所以不能涉及自定義詞典、模型訓(xùn)練等花費時間長的工作,能直接用幾行代碼得出預(yù)測值。最后鎖定了SnowNLP和Cemotion。SnowNLP用的是經(jīng)典機(jī)器學(xué)習(xí)的貝葉斯算法,但已經(jīng)有七年沒有更新了;Cemotion使用的是深度學(xué)習(xí)RNN模型,最近更新時間也比較近。在未經(jīng)訓(xùn)練的情況下簡單試用后Cemotion的預(yù)測準(zhǔn)確率略高于SnowNLP。

兩個庫的更新情況

Cemotion通過pip安裝即可,但涉及TensorFlow等庫且要下載RNN模型,我在Colab環(huán)境上下載模型花了47s,建議使用國內(nèi)鏡像安裝。

安裝好之后就通過pandas讀取CSV文件中的回答并對其進(jìn)行情感分析,將結(jié)果寫入新的CSV文件中。完整代碼如下:

幾個小時完成的情感分析過于粗糙,預(yù)測值和個人對回答的實際感受有些誤差,但應(yīng)付畢設(shè)應(yīng)該足夠,之后就是對這些數(shù)據(jù)放到web頁面可視化。

最后希望畢設(shè)不要趕ddl才寫,真的對延畢無所謂嗎。

Python Cemotion庫快速進(jìn)行文本情感分析的評論 (共 條)

分享到微博請遵守國家法律
扎赉特旗| 鄂尔多斯市| 桓仁| 泰顺县| 特克斯县| 通化县| 隆安县| 肥东县| 克拉玛依市| 白沙| 礼泉县| 陈巴尔虎旗| 绥化市| 环江| 都昌县| 象州县| 汉沽区| 边坝县| 高台县| 阜阳市| 贺兰县| 巴林左旗| 响水县| 上高县| 庆城县| 隆昌县| 平武县| 凤台县| 商河县| 平邑县| 策勒县| 潜江市| 新民市| 东海县| 托里县| 常州市| 沛县| 井陉县| 光山县| 全椒县| 宁安市|