是的,四場全中,凌晨4點被家人們送上熱搜。。。
大家好,我是 Jack。
事情是這樣的,我不是出了一期 AI 預(yù)測世界杯的視頻嗎?
截止目前為至,4 場比賽,都預(yù)測對了,目前準(zhǔn)確率 100%。
包括凌晨?1 場的平局:

勝率 0.5 就是五五開唄,平局的意思。
然后一幫熬夜看球的老哥,紛紛過來留言。

凌晨四點,硬生生地把我視頻頂上了熱門。

視頻熱門我上過,但頭一次是凌晨4點上,可見大家看球的熱情有多高。
但我這里也不得不提醒一句:千萬不要靠著這個去賭球??!
因為我知道,這種基于機器學(xué)習(xí)的預(yù)測算法,其實很簡單。
我不賭球
接下來,我說下這期視頻是怎么來的吧。
有一位小伙伴,私信我,說可以出期 AI 預(yù)測世界杯的視頻。
我覺得很有意思,決定玩一玩。
因為時間緊,需要盡量簡化工作量。
所以我的構(gòu)思也很簡單,就用簡單的機器學(xué)習(xí)算法:
找球隊比賽、排名等數(shù)據(jù)
做特征工程,挖掘關(guān)鍵特征
對比各個機器學(xué)習(xí)算法的效果
要說找這類統(tǒng)計數(shù)據(jù),我第一個想到的就是 Kaggle,于是我就去翻了下。
然后我就看到了有很多前人的工作,也有做足球比賽結(jié)果預(yù)測的。
那正好,我就不用重復(fù)早輪子了,在別人的開源代碼基礎(chǔ)上測試吧。
于是,我看了各種別人開源的項目,比如這樣的:

對比了多個開源項目,我看到了這個:
https://www.kaggle.com/code/sslp23/predicting-fifa-2022-world-cup-with-ml/notebook
里面做了很多特征挖掘的分析,比如用小提琴圖:

然后我對比了多個開源項目的分析和效果,感覺這個跟我的想法最接近。
于是就在這個開源項目的基礎(chǔ)上,做了一些可視化、本地化的一些工作。
項目里的一些數(shù)據(jù)下載,需要用到一些你懂得的工具才能下載,我直接打包到了本地,然后增加了平均的判定、結(jié)果可視化的工作。
畢竟要做成視頻嘛,一場比賽一場比賽自己畫對比結(jié)果,得累死。

Opencv 畫圖,幫我解決了這個問題。
我本人,不賭球。
我其實不太懂足球,甚至每個球隊的隊員,我都認(rèn)識不全。
這期視頻,純粹是出于,很有意思,想學(xué)習(xí)一下的心態(tài),去做的。
千萬別賭!
總之,千萬別靠著這期視頻去賭球。
正如評論區(qū)小伙伴所說:

事先說好,我可不對賭球負(fù)責(zé)哦~
這種基于統(tǒng)計學(xué)習(xí)的方法,雖然有參考意義,但有一個很大的弊端:全是紙面數(shù)據(jù)。
所以大家也看到了,預(yù)測結(jié)果很少有爆冷的。
我本人的性格,其實偏保守,從我玩炒股就能看出來,我追求的是長期穩(wěn)定收益。
我最近買的股票,很多都是這樣的:

可以看到我的成本線,基本都很穩(wěn),你以為我賺了很多?
其實我半山腰就賣了。
我是屬于見好就收類型的,達(dá)到自己的預(yù)期,就收手。
起個大早,爬起來寫文章,有點跑題,拉回來。
總之,千萬別賭,這都是紙面數(shù)據(jù)。
僅供學(xué)習(xí)參考。
如果覺得預(yù)測結(jié)果有意思,與其去賭球,不如看看我發(fā)的代碼吧?
最后說下數(shù)據(jù)+代碼的獲取方式:
1、B 站獲取:
B 站關(guān)注,然后私信:666,即可獲得。
不過 B 站有時候自動回復(fù)會掛掉,如果有時候掛了,可以去的公眾號獲取。
之前 B 站設(shè)置的自動回復(fù)關(guān)鍵詞是:世界杯,就莫名奇妙掛掉了。
2、公眾號獲?。?/p>
掃碼關(guān)注的個人微信公眾號,然后回復(fù):世界杯,即可獲取。

網(wǎng)盤鏈接就不直接放了,設(shè)置個門檻,直接放到公網(wǎng)上也會掛,已經(jīng)修復(fù)幾次了,我太難了~
好了,今天就聊這么多吧,我是 Jack,我們下期見~