2023美賽C題保姆級(jí)思路及代碼 wordle
C題思路:
C題是數(shù)據(jù)挖掘題,通過分析wordle的游戲機(jī)制,挖掘不同單詞所對應(yīng)的得分情況對其難度的影響,這道題的難度主要是如何提取不同單詞難度的特征,相對來說反而是最好實(shí)現(xiàn)的。
完整解題思路將持續(xù)更新,大家也可持續(xù)關(guān)注
題目背景:
Wordle是《紐約時(shí)報(bào)》目前每天提供的一個(gè)流行的謎題。玩家試圖通過六次或更少的時(shí)間猜測一個(gè)五個(gè)字母的單詞來解決謎題,每次猜測都會(huì)得到反饋。對于這個(gè)版本,每個(gè)猜測都必須是一個(gè)真實(shí)的英語單詞,不被比賽認(rèn)定為文字的猜測是不允許的。
Nordre越來越受歡迎,游戲版本現(xiàn)在有60多種語言紐約時(shí)報(bào)》網(wǎng)站上的 orde說明指出,在你提交文字后,瓷磚的顏色將會(huì)改變。黃色平貼表示該貼中的字母在單詞中,但它在錯(cuò)誤的位置。綠色的貼表示該貼中的字母在單詞中并且在正確的位置?;疑N表示該貼中的字母根本不包含在單詞中(見附件2)圖1是一個(gè)示例解決方案,在三次嘗試中都找到了正確的結(jié)果
第一問:報(bào)告結(jié)果的數(shù)量每天都在變化,建立一個(gè)模型來解釋這種變化,并使用你的模型為2023年3月1日的報(bào)告結(jié)果數(shù)量建立一個(gè)預(yù)測區(qū)間。詞語的任何屬性是否影響到報(bào)告的在困難模式下進(jìn)行的分?jǐn)?shù)的百分比 ?如果是,如何影響 ?如果沒有,為什么沒有 ?


第二問:對于一個(gè)給定的未來日期的解字,建立個(gè)模型,使你能預(yù)測結(jié)果的分布。換句話 說,預(yù)測未來某一天的(1、2、3、4、5、6、X) 的相關(guān)百分比。你的模型和預(yù)測有哪些不 確定因素 ?請舉一個(gè)具體的例子,說明你對2023年3月1日EERIE這個(gè)詞的預(yù)測。你對你的 模型的預(yù)測有多大信心?

第三問:開發(fā)和總結(jié)一個(gè)模型,按難度分類解決方案詞。識(shí)別與每個(gè)分類關(guān)聯(lián)的給定單詞的屬性。 使用你的模型,EERIE這個(gè)詞有多難?討論你的分類模型的準(zhǔn)確性。
列出并描述此數(shù)據(jù)集的其他一些有趣的特性。

最后,在一封給《紐約時(shí)報(bào)》拼圖編輯的一到兩頁的信中總結(jié)你的結(jié)果。 您的PDF解決方案總共不超過25頁,應(yīng)該包括: 一頁紙的總結(jié)表
目錄。 你的解決方案。 一到兩頁的信。 參考清單。
注:MCM競賽的頁面限制版數(shù)為25頁。您提交的所有方面都有25頁的限制(摘要表、目錄
、報(bào)告、參考列表和任何附錄)。您必須引用您的想法、圖像和您的報(bào)告中使用的任何
其他材料的來源