kaggle推薦系統(tǒng)top方案全分享(附baseline+金牌開源代碼)
推薦系統(tǒng)可以很好地解決信息過載以及信息不足等問題,廣泛應(yīng)用與電商、金融、新聞咨詢、社交、旅游等行業(yè),其中最典型并具有良好的發(fā)展和應(yīng)用前景的領(lǐng)域就是電子商務(wù)領(lǐng)域。
在學(xué)術(shù)界,推薦系統(tǒng)同樣是熱門的研究方向,在各大頂會中的論文數(shù)目相當(dāng)可觀。在kaggle平臺,推薦系統(tǒng)相關(guān)的競賽同樣也不少。
這次學(xué)姐就幫同學(xué)們整理了部分kaggle推薦系統(tǒng)比賽,各場比賽的金牌方案也分享了,baseline代碼合集看這里??
掃碼添加小享,回復(fù)“RS金牌”
免費獲取金牌方案baseline代碼合集
(附贈190+場比賽top方案)

1.OTTO多目標(biāo)推薦系統(tǒng)大賽

比賽鏈接:https://www.kaggle.com/competitions/otto-recommender-system
比賽背景:擁有超過1900個品牌、1000萬種產(chǎn)品的最大德國線上商店Otto(奧托),是總部位于漢堡的跨國奧托集團旗下子公司,該集團還擁有Crate & Barrel(美國)和3 Suisses(法國)。
本次競賽的目標(biāo)是預(yù)測電子商務(wù)點擊、購物車添加和訂單。參賽者將根據(jù)用戶會話中的先前事件構(gòu)建多目標(biāo)推薦系統(tǒng)。參賽者的工作將有助于改善所有相關(guān)人員的購物體驗??蛻魧⑹盏礁嗔可矶ㄖ频慕ㄗh,而在線零售商可能會增加銷售額。
評估標(biāo)準(zhǔn):提交內(nèi)容根據(jù)每個操作“類型”的Recall@20進行評估,三個召回值進行加權(quán)平均:

比賽時間:2022.11-2023.1
??金牌方案:
第一名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/384022
第二名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/382790
第三名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383013
第四名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/382783
第五名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/382802
第六名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/384120
第七名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383769
第八名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383130
第九名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383792
第十名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/382851
第十一名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383374
第十二名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/382834
第十三名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383229
第十四名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/383382
第十五名:https://www.kaggle.com/competitions/otto-recommender-system/discussion/382905
2.H&M個性化時尚推薦大賽

比賽鏈接:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/overview
比賽背景:H&M集團是一個品牌和企業(yè)家族,擁有53個在線市場和約4850家商店。我們的在線商店為購物者提供了廣泛的產(chǎn)品選擇供您瀏覽。但是,由于選擇太多,客戶可能無法快速找到他們感興趣或正在尋找的內(nèi)容,最終他們可能不會購買。為了增強購物體驗,產(chǎn)品推薦是關(guān)鍵。更重要的是,幫助客戶做出正確的選擇也對可持續(xù)性產(chǎn)生了積極影響,因為它減少了回報,從而最大限度地減少了運輸?shù)呐欧拧?/p>
在本次競賽中,H&M集團邀請參賽者根據(jù)先前交易的數(shù)據(jù)以及客戶和產(chǎn)品元數(shù)據(jù)制定產(chǎn)品推薦??捎玫脑獢?shù)據(jù)范圍從服裝類型和客戶年齡等簡單數(shù)據(jù)到產(chǎn)品描述中的文本數(shù)據(jù),再到服裝圖像中的圖像數(shù)據(jù)。
評估標(biāo)準(zhǔn):提交內(nèi)容根據(jù)平均平均精度@12(MAP@12)進行評估:

比賽時間:2022.2-2022.5
??金牌方案:
第一名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324070
第二名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324197
第三名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324129
第四名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324094
第五名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324098
第六名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324075
第八名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324185
第九名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324127
第十名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324223
第十一名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324084
第十二名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324310
第十三名:https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324207
3.Elo 商家類別推薦大賽

比賽鏈接:https://www.kaggle.com/c/elo-merchant-category-recommendation
比賽背景:Elo已經(jīng)建立了機器學(xué)習(xí)模型來了解客戶生命周期中最重要的方面和偏好,從食物到購物。但到目前為止,沒有一個模型是專門針對個人或配置文件定制的。
在這個競賽中,Kaggle用戶將開發(fā)算法來識別和為個人提供最相關(guān)的機會,方法是發(fā)掘客戶忠誠度中的信號。參賽者的貢獻將改善客戶的生活,并幫助Elo減少不必要的活動,為客戶創(chuàng)造恰到好處的體驗。
評估標(biāo)準(zhǔn):提交結(jié)果的評分基于均方根誤差。均方根誤差定義為:

比賽時間:2019.2
??金牌方案:
第一名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82036
第五名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82314
第七名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82055
第十名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82093
第十一名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82127
第十四名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82375
第十六名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82166
第十八名:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/discussion/82107
掃碼添加小享,回復(fù)“RS金牌”
免費獲取金牌方案baseline代碼合集
(附贈190+場比賽top方案)

4.WSDM - KKBox的音樂推薦大賽

比賽鏈接:https://www.kaggle.com/competitions/kkbox-music-recommendation-challenge
比賽背景:雖然公眾現(xiàn)在聽各種音樂,但算法仍然在關(guān)鍵領(lǐng)域掙扎,如果沒有足夠的歷史數(shù)據(jù),算法如何知道聽眾會喜歡一首新歌還是新藝術(shù)家?而且,它如何知道推薦哪些歌曲來推薦全新的用戶?
WSDM向Kaggle ML社區(qū)提出了挑戰(zhàn),以幫助解決這些問題并構(gòu)建更好的音樂推薦系統(tǒng)。該數(shù)據(jù)集來自亞洲領(lǐng)先的音樂流媒體服務(wù)KKBOX,擁有世界上最全面的亞洲流行音樂庫,擁有超過30萬首曲目。他們目前使用基于協(xié)同過濾的算法,在他們的推薦系統(tǒng)中使用矩陣分解和詞嵌入,但相信新技術(shù)可以帶來更好的結(jié)果。
評估標(biāo)準(zhǔn):提交內(nèi)容根據(jù)預(yù)測概率和觀測目標(biāo)之間的ROC曲線下面積進行評估。
比賽時間:2017.12-2018.2
??金牌方案:
第一名:https://www.kaggle.com/competitions/kkbox-music-recommendation-challenge/discussion/45942
第二名:https://www.kaggle.com/competitions/kkbox-music-recommendation-challenge/discussion/45971
第六名:https://www.kaggle.com/competitions/kkbox-music-recommendation-challenge/discussion/45999
5.桑坦德產(chǎn)品推薦大賽

比賽鏈接:https://www.kaggle.com/c/santander-product-recommendation/
比賽背景:在他們目前的系統(tǒng)下,桑坦德銀行的少數(shù)客戶會收到許多建議,而其他許多客戶很少看到任何導(dǎo)致客戶體驗不平衡的建議。在他們的第二場比賽中,桑坦德銀行正在挑戰(zhàn)Kagglers,根據(jù)他們過去的行為和類似客戶的行為來預(yù)測他們的現(xiàn)有客戶將在下個月使用哪些產(chǎn)品。
有了更有效的推薦系統(tǒng),桑坦德銀行可以更好地滿足所有客戶的個性化需求,并確保他們的滿意度,無論他們身在何處。
評估標(biāo)準(zhǔn):提交內(nèi)容根據(jù)平均平均精度@7 (MAP@7)進行評估:

比賽時間:2016.12
??金牌方案:
第一名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26835
第二名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26824
第三名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26899
第四名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26845
第五名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26841
第七名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26802
第八名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26838
第九名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26809
第十一名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26823
第十三名:https://www.kaggle.com/competitions/santander-product-recommendation/discussion/26816
6.Expedia 網(wǎng)站酒店推薦大賽

比賽鏈接:https://www.kaggle.com/competitions/expedia-hotel-recommendations
比賽背景:Expedia想要通過為用戶提供個性化的酒店推薦來消除酒店搜索中的難題。這對一個每個月有數(shù)億訪問量的網(wǎng)站來說不是一個小任務(wù)!
目前,Expedia使用搜索參數(shù)來調(diào)整他們的酒店推薦,但沒有足夠的客戶特定數(shù)據(jù)來為每個用戶定制。在這個競賽中,Expedia正在挑戰(zhàn)Kaggle用戶根據(jù)客戶數(shù)據(jù)的上下文來預(yù)測用戶入住100個不同酒店集團的可能性。
評估標(biāo)準(zhǔn):提交內(nèi)容根據(jù)<平均平均精度@5>(MAP@5)進行評估:

比賽時間:2016.6
??金牌方案:
第一名:https://www.kaggle.com/competitions/expedia-hotel-recommendations/discussion/21607
第六名:https://www.kaggle.com/competitions/expedia-hotel-recommendations/discussion/21615
7.活動推薦引擎挑戰(zhàn)賽

比賽鏈接:https://www.kaggle.com/competitions/event-recommendation-engine-challenge
比賽背景:該挑戰(zhàn)賽要求參賽者根據(jù)用戶過去響應(yīng)的事件、用戶人口統(tǒng)計信息以及事件來預(yù)測用戶會對哪些事件感興趣。從這些數(shù)據(jù)中發(fā)現(xiàn)的見解以及獲獎?wù)邉?chuàng)建的算法將使我們能夠改進我們的活動推薦算法,這是我們應(yīng)用程序的核心部分,也是改善用戶體驗的關(guān)鍵要素。
評估標(biāo)準(zhǔn):本次比賽的評價指標(biāo)是平均精度200(任何一個用戶的最大事件數(shù)是116,所以200不會產(chǎn)生有意義的限制)。
比賽時間:2013.1-2013.2
??金牌方案:
第七名:https://www.kaggle.com/competitions/event-recommendation-engine-challenge/discussion/3894
掃碼添加小享,回復(fù)“RS金牌”
免費獲取金牌方案baseline代碼合集
(附贈190+場比賽top方案)
