最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R中使用樸素貝葉斯的欺詐短信息識別(順帶推薦精華R教材)

2023-04-04 20:30 作者:時晴charles  | 我要投稿


我總是會收到莫名其妙的欺詐短信,有的還裝得和真的一樣,點看之后才知道浪費了時間,天知道都是哪里來的。

使用Naive Bayes,我們可以基于簡單的NLP(自然語言處理)進行文本分析,構(gòu)建一個分類器來預(yù)測消息是否是垃圾短信,很多服務(wù)商現(xiàn)在還在用類似的算法。

data: http://www.dt.fee.unicamp.br/~tiago/smsspamcollection

首先整理和編碼數(shù)據(jù),這一步對MAC用戶很重要,因為原數(shù)據(jù)似乎并非UTF8. 正經(jīng)的信息我們叫做HAM,不正經(jīng)的叫做SPAM哈哈。

最后幾個主要步驟都包含在一起了,用一個簡單的table直觀看到預(yù)測的結(jié)果。

最后推薦一本書《Machine Learning with R》,建議讀原版

包含了用R實現(xiàn)機器學習的最基本和公認最必要的內(nèi)容,結(jié)構(gòu)清晰合理。

從概念和數(shù)學方法開始,然后一步一步地介紹如何用代碼示例在R中運行,然后以優(yōu)化和參數(shù)調(diào)整結(jié)束。極為精華的R入門書。

2017年美國Goodreads rating 4.17/5.00,現(xiàn)在分數(shù)漲到4.23了,可見其質(zhì)量。


R中使用樸素貝葉斯的欺詐短信息識別(順帶推薦精華R教材)的評論 (共 條)

分享到微博請遵守國家法律
浮梁县| 泰来县| 桃江县| 金溪县| 张家港市| 诸城市| 四子王旗| 长阳| 温泉县| 庄河市| 黄大仙区| 巴塘县| 武强县| 北川| 邮箱| 松潘县| 德昌县| 石棉县| 台江县| 宾川县| 惠来县| 颍上县| 清徐县| 错那县| 沛县| 措勤县| 北票市| 玉田县| 巴中市| 台东县| 大埔区| 垣曲县| 增城市| 嘉祥县| 湖口县| 屏东县| 环江| 盐源县| 莱西市| 双柏县| 南康市|