最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

推薦系統(tǒng)——電影評(píng)分預(yù)測(cè)算法(基于用戶的協(xié)同過(guò)濾、基于物品的協(xié)同過(guò)濾)

2023-08-19 22:45 作者:thisishui  | 我要投稿

一、協(xié)同過(guò)濾算法原理

協(xié)同過(guò)濾是一種常用的推薦系統(tǒng)方法,它根據(jù)用戶或物品之間的相似度,為目標(biāo)用戶推薦他們可能感興趣的物品。協(xié)同過(guò)濾有兩種主要的類型:基于用戶的協(xié)同過(guò)濾(UBCF)和基于物品的協(xié)同過(guò)濾(IBCF)

1、User-Based CF(基于用戶的協(xié)同過(guò)濾)

UBCF是一種方法,它找到和目標(biāo)用戶興趣相似的用戶集合,并推薦這些相似用戶喜歡的、目標(biāo)用戶沒(méi)有接觸過(guò)的物品。1例如,如果A和B都喜歡科幻電影和書籍,而A看過(guò)并喜歡一部新的科幻電影,那么UBCF就會(huì)把這部電影推薦給B

UBCF的核心是計(jì)算用戶之間的相似度,通常使用皮爾遜相關(guān)系數(shù)或余弦相似度作為相似度度量。給定用戶u和用戶v,令N(u)表示用戶u曾經(jīng)有過(guò)正反饋的物品集合,令N(v)為用戶v曾經(jīng)有過(guò)正反饋的物品集合。2那么,皮爾遜相關(guān)系數(shù)可以定義為:

其中,rui表示用戶u對(duì)物品i的評(píng)分,rˉu表示用戶u對(duì)所有物品的平均評(píng)分。
根據(jù)用戶之間的相似度,可以為目標(biāo)用戶預(yù)測(cè)他對(duì)某個(gè)物品的評(píng)分。預(yù)測(cè)公式如下:

其中,r^ui表示預(yù)測(cè)評(píng)分,S(u,K)表示和用戶u最相似的K個(gè)用戶集合,N(i)表示對(duì)物品i有過(guò)評(píng)分的用戶集合。


2、Item-Based CF(基于物品的協(xié)同過(guò)濾)

IBCF是一種方法,它找到和目標(biāo)用戶喜歡的物品相似的物品,并推薦這些相似物品給目標(biāo)用戶。例如,如果A喜歡某系列的書籍和電影,而有一本新的奇幻小說(shuō)和某系列書籍很相似,那么IBCF就會(huì)把這本小說(shuō)推薦給A。

IBCF的核心是計(jì)算物品之間的相似度,通常也使用皮爾遜相關(guān)系數(shù)或余弦相似度作為相似度度量。給定物品i和物品j,令U(i)表示對(duì)物品i有過(guò)正反饋的用戶集合,令U(j)為對(duì)物品j有過(guò)正反饋的用戶集合。那么,皮爾遜相關(guān)系數(shù)可以定義為:

其中,rui表示用戶u對(duì)物品i的評(píng)分,rˉi表示物品i的平均評(píng)分。
根據(jù)物品之間的相似度,可以為目標(biāo)用戶預(yù)測(cè)他對(duì)某個(gè)物品的評(píng)分。預(yù)測(cè)公式如下:

其中,r^ui表示預(yù)測(cè)評(píng)分,S(i,K)表示和物品i最相似的K個(gè)物品集合,N(u)表示用戶u有過(guò)評(píng)分的物品集合。


二、 數(shù)據(jù)集下載

MovieLens Latest Datasets Small

下載ml-latest-small.zip,數(shù)據(jù)量小,便于我們單機(jī)使用和運(yùn)行

下載地址:https://files.grouplens.org/datasets/movielens/ml-latest-small.zip

目標(biāo):根據(jù)m1-latest-sma11/ratings.csv(用戶-電影評(píng)分?jǐn)?shù)據(jù)),分別實(shí)現(xiàn)User-Based CF和ltem-BasedCF,并進(jìn)行電影評(píng)分的預(yù)測(cè),然后為用戶實(shí)現(xiàn)電影推薦

三、數(shù)據(jù)集加載

加載數(shù)據(jù)集中的rating.csv,并轉(zhuǎn)化為用戶-電影評(píng)分矩陣

四、相似度計(jì)算

計(jì)算用戶或物品兩兩相似度

五、User-Based CF 和Item-Based CF預(yù)測(cè)評(píng)分(基于用戶的協(xié)同過(guò)濾和基于物品的協(xié)同過(guò)濾)

評(píng)分預(yù)測(cè)公式:

1、User-Based CF 算法


2、Item-Based CF 算法


3、預(yù)測(cè)全部評(píng)分

六、電影評(píng)分預(yù)測(cè)

1、基于用戶的協(xié)同過(guò)濾的評(píng)分預(yù)測(cè)(以用戶1對(duì)所有電影的評(píng)分預(yù)測(cè)為例)

……

2、基于物品的協(xié)同過(guò)濾的評(píng)分預(yù)測(cè)(以用戶1對(duì)所有電影的評(píng)分預(yù)測(cè)為例)

……


推薦系統(tǒng)——電影評(píng)分預(yù)測(cè)算法(基于用戶的協(xié)同過(guò)濾、基于物品的協(xié)同過(guò)濾)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
康乐县| 玉林市| 城市| 南宁市| 班戈县| 于田县| 噶尔县| 丹棱县| 平塘县| 历史| 东乌珠穆沁旗| 云安县| 林西县| 伊宁市| 怀柔区| 延寿县| 河池市| 大冶市| 大厂| 井陉县| 北辰区| 枣庄市| 锡林浩特市| 中宁县| 台东市| 临江市| 延安市| 乌兰浩特市| 三都| 井陉县| 长兴县| 穆棱市| 三穗县| 延安市| 东光县| 资兴市| 巴林右旗| 东乡| 偏关县| 华池县| 南靖县|