基于商品的協(xié)同過濾推薦算法與預(yù)測評分實(shí)踐【matlab實(shí)現(xiàn)】
正如昨天所介紹的,我們之前介紹了基于用戶的協(xié)同過濾推薦算法,但是這種算法存在一種重大缺陷,即:
我們計(jì)算的用戶相似度是歷史記錄中的“老客戶”,這種推薦算法對新注冊用戶,或者缺少行為記錄的用戶是極其不友好的,因?yàn)闊o法計(jì)算與其相似的用戶,因而不能進(jìn)行個(gè)性化推薦,因此,我們從商品的相似度出發(fā),解決用戶冷啟動問題。


現(xiàn)在簡單介紹基于基于商品的協(xié)同過濾推薦算法:
基于用戶的協(xié)同過濾基本思想非常簡單,就是找到志同道合的朋友,并把朋友感興趣的而用戶沒有接觸過的商品推薦給用戶。
? ? 但是這有一個(gè)問題,由于新用戶的注冊量非常高,基于用戶的協(xié)同過濾推薦需要計(jì)算新用戶和之前的用戶之間的相似度,這會將數(shù)據(jù)稀疏,延展性差等問題暴露的非常明顯。
? ? 所以基于商品的協(xié)同過濾方法被提出,相較于用戶之間的相似度,商品之間的相似度相對是靜態(tài)的,當(dāng)新用戶注冊并有了一些自己感興趣的商品信息時(shí),無需再進(jìn)行計(jì)算,直接根據(jù)之前存儲的商品之間的相似度,將用戶可能感興趣的商品推薦給用戶。

可以看出基于商品的協(xié)同過濾推薦算法也是分為兩步,第一步是根據(jù)數(shù)據(jù)庫中已有的信息求出商品的相似度,第二步是利用求出的商品之間的相似度計(jì)算用戶對某種商品可能的興趣程度。
? ? ?商品之間的相似度可以利用皮爾遜相似度,余弦相似度或是改進(jìn)的余弦相似度來進(jìn)行計(jì)算。
皮爾遜相似度:

至于數(shù)據(jù)集,與昨日所采用的的數(shù)據(jù)集一致
我們要將得到的數(shù)據(jù)進(jìn)行預(yù)處理,過程與昨日的相同。



由此,我們得到了商品相似度矩陣。

最后進(jìn)行預(yù)測

