2023美賽建模C題:預(yù)測Wordle結(jié)果 - 思路分析
背景
Wordle是《紐約時報》每日推出的一款很受歡迎的拼圖游戲。玩家試圖解決通過在六次或更少的嘗試中猜出一個五個字母的單詞,每次猜測都得到反饋。對于這個版本,每個猜測必須是一個實(shí)際的英語單詞。無法識別的猜測因為比賽中的詞語是不允許的。Wordle的流行度和版本不斷增長這款游戲現(xiàn)在有超過60種語言版本。

玩家可以在普通模式或“困難模式”中玩游戲。Wordle的困難模式使游戲更加難度在于要求玩家在單詞中找到正確的字母(貼圖是黃色或綠色),這些字母必須在后續(xù)的猜測中使用。圖1中的示例被播放困難模式。
許多(但不是全部)用戶在Twitter上報告他們的分?jǐn)?shù)。對于這個問題,MCM生成了一個2022年1月7日至2022年12月31日的每日結(jié)果文件(見附件1)文件包括日期,比賽號碼,當(dāng)天的單詞,報告分?jǐn)?shù)的人數(shù)那天,進(jìn)入困難模式的玩家人數(shù),以及在一分鐘內(nèi)猜出單詞的百分比嘗試,兩次嘗試,三次嘗試,四次嘗試,五次嘗試,六次嘗試,或無法解決謎題(由X)。例如,在圖2中,2022年7月20日的單詞為“TRITE”,結(jié)果為通過挖掘推特獲得。盡管在某些情況下,圖2中的百分比總和為100%由于四舍五入,這可能不是真的

回答以下問題
《紐約時報》要求你對這份文件中的結(jié)果進(jìn)行分析回答幾個問題。
?報告結(jié)果的數(shù)量每天都在變化。建立一個模型來解釋這種變化使用您的模型為3月份報告的結(jié)果數(shù)量創(chuàng)建一個預(yù)測區(qū)間1, 2023。這個詞的任何屬性會影響被報告的分?jǐn)?shù)的百分比嗎在困難模式下玩?如果有,怎么做?如果不是,為什么不是?
?對于一個給定的未來解決方案,在未來的日期,建立一個模型,讓你預(yù)測報告結(jié)果的分布。換句話說,預(yù)測相關(guān)的(1、2、3、4、5、6、X)的百分比。不確定性與什么有關(guān)你的模型和預(yù)測?舉一個你預(yù)測這個單詞的具體例子2023年3月1日的《怪誕》。你對模型的預(yù)測有多大信心?
?開發(fā)并總結(jié)了一個模型,按難度對解詞進(jìn)行分類。識別與每個分類相關(guān)聯(lián)的給定單詞的屬性。用你的模型,EERIE這個詞有多難?討論你的分類模型的準(zhǔn)確性。
?列出并描述該數(shù)據(jù)集的一些其他有趣的特征
思路分析
本題的核心思路可以使用lstm做時間序列預(yù)測,具體思路會放到群里,持續(xù)更新
資料思路分享Q群:714452621