這份巨詳細(xì)的足球比賽數(shù)據(jù)值得擁有(有世界杯,有梅西)
StatsBomb提供了一份非常詳細(xì)的足球比賽數(shù)據(jù),向公眾開放。該數(shù)據(jù)包含1200多場比賽的記錄,有多年的西甲數(shù)據(jù),有世界杯。當(dāng)然,其中有梅西。
該數(shù)據(jù)維度非常詳盡,大的方面,記錄了每場比賽舉行時(shí)間、雙方隊(duì)伍、裁判、舉辦場地以及進(jìn)球個(gè)數(shù)等。 具體到每場比賽,記錄詳細(xì)到每秒,以傳球?yàn)槔?,哪位球員哪秒在哪個(gè)位置傳到哪個(gè)位置均記錄詳細(xì)。僅僅傳球記錄就有120萬行,這意味著平均每場比賽有1000次左右的傳球。 讀者可以在以下網(wǎng)址下載完整數(shù)據(jù)(JSON格式),看看可以發(fā)現(xiàn)什么:
https://github.com/statsbomb/open-data
以下針對Power BI導(dǎo)入數(shù)據(jù)進(jìn)行一些簡要的說明。 首先,使用文件夾的方式導(dǎo)入,Power Query中的Json.Document函數(shù)展開數(shù)據(jù)。 數(shù)據(jù)中的絕大多數(shù)字段為文本,少數(shù)字段為Record或者List,如果是Record,可以選中一條數(shù)據(jù)預(yù)覽,按需要進(jìn)行展開。 如果是List,比如下方的傳球終點(diǎn)坐標(biāo),預(yù)覽得知XY坐標(biāo)縱向排列,此時(shí)不能直接展開,展開會(huì)導(dǎo)致其他數(shù)據(jù)重復(fù)。 需要將List轉(zhuǎn)換為Record,添加自定義列,使用Record.FromList函數(shù)進(jìn)行轉(zhuǎn)換。轉(zhuǎn)換完成后的坐標(biāo)XY各占一列。 數(shù)據(jù)非常規(guī)整,除了以上注意點(diǎn)不用再多說什么。官方寫了詳細(xì)的文檔對數(shù)據(jù)進(jìn)行說明,文檔也在以上鏈接中。