Kaggle新賽來了!睡眠狀態(tài)檢測大賽高分攻略分享!
賽題名稱:Child Mind Institute - Detect Sleep States
賽題鏈接:https://www.kaggle.com/competitions/child-mind-institute-detect-sleep-states

賽題背景
睡眠會影響從發(fā)育到認(rèn)知功能的一切。即便如此,對睡眠的研究仍然具有挑戰(zhàn)性,因為缺乏自然主義的數(shù)據(jù)捕獲和準(zhǔn)確的注釋。如果數(shù)據(jù)科學(xué)可以幫助研究人員更好地分析腕戴式加速度計數(shù)據(jù)以進(jìn)行睡眠監(jiān)測,那么睡眠專家可以更容易地進(jìn)行大規(guī)模的睡眠研究,從而提高對睡眠重要性和功能的理解。
賽題方向
時間序列
賽題任務(wù)
本次比賽的目標(biāo)是檢測入睡和覺醒。參賽者將開發(fā)一個基于腕戴式加速度計數(shù)據(jù)進(jìn)行訓(xùn)練的模型,以確定一個人的睡眠狀態(tài)。
參賽者的工作可以使研究人員在一系列人群和背景下進(jìn)行更可靠、更大規(guī)模的睡眠研究。這些研究的結(jié)果可以提供更多關(guān)于睡眠的信息。
評價指標(biāo)
參賽者將根據(jù)檢測到事件的平均精度進(jìn)行評估,該平均精度在時間戳誤差容限閾值上進(jìn)行平均,并在事件類別上進(jìn)行平均。
檢測結(jié)果將與地面真實事件在誤差容限內(nèi)匹配,模糊性按照置信度遞減的順序解決。對于兩種事件類別,我們使用1、3、5、7.5、10、12.5、15、20、25、30分鐘或20、60、100、150、200、250、300、400、500、600步的誤差容限閾值。
數(shù)據(jù)描述
該數(shù)據(jù)集包含約500個帶注釋的多天腕式加速度計數(shù)據(jù)記錄,注釋了兩種事件類型:onset,睡眠開始;wakeup,睡眠結(jié)束。參賽者的任務(wù)是在加速度計系列中檢測這兩種事件的發(fā)生。
雖然睡眠日志仍然是黃金標(biāo)準(zhǔn),但在使用加速度計數(shù)據(jù)時,我們將睡眠定義為佩戴手表時最長的單一靜止期。對于這些數(shù)據(jù),我們給評分者提供了幾個具體的指示:
單次睡眠周期必須至少30分鐘。
單次睡眠周期可以被不超過30分鐘的活動中斷。
除非手表被認(rèn)為在整個過程中佩戴,否則無法檢測到睡眠窗口。
記錄夜間最長的睡眠窗口。
如果無法識別有效的睡眠窗口,則該夜晚不記錄onset或wakeup事件。
睡眠事件不需要跨越白天黑夜的界線,因此沒有硬性規(guī)則定義在給定時間內(nèi)可以發(fā)生多少次。但是,每個晚上只應(yīng)分配一個窗口。例如,在同一日歷日內(nèi)從01:00到06:00和從19:00到23:30擁有睡眠窗口是有效的,盡管分配給連續(xù)的夜晚。
系列中記錄的夜晚數(shù)量與該系列中的24小時周期數(shù)量大致相同。
盡管每個系列都是連續(xù)的記錄,但系列中可能有一些時期手表被移除。這些時期被確定為加速度計信號在擴(kuò)展時期內(nèi)變化極小的時期,這對典型的人類參與者來說是不現(xiàn)實的。這些時期不進(jìn)行事件注釋,參賽者應(yīng)該盡量避免在這些時期進(jìn)行事件預(yù)測:事件預(yù)測將被評分為假陽性。
每個數(shù)據(jù)系列表示一個唯一實驗對象的連續(xù)(多天/事件)記錄。
文件和字段描述
train_series.parquet
- 要用作訓(xùn)練數(shù)據(jù)的系列。每個系列都是單個受試者的連續(xù)加速度計數(shù)據(jù)記錄,跨越多天。series_id
- 每個加速度計系列的唯一標(biāo)識符。step
- 系列中每個觀測中的整數(shù)時間步。timestamp
- 符合ISO 8601格式%Y-%m-%dT%H:%M:%S%z
的相應(yīng)日期時間。anglez
- 如GGIR 包所計算和描述的,z-angle是從各個加速度計分量派生的指標(biāo),常用于睡眠檢測,指的是相對于身體垂直軸的手臂角度。enmo
- 如GGIR 包所計算和描述的,ENMO是所有加速度計信號的歐幾里德范數(shù)減一,負(fù)值四舍五入為零。雖然該領(lǐng)域不存在標(biāo)準(zhǔn)的加速度度量,但這是幾個常用的計算特征之一。test_series.parquet
- 要用作測試數(shù)據(jù)的系列,包含與上述相同的字段。train_events.csv
:訓(xùn)練集中系列的睡眠日志,記錄了入睡和醒來事件。series_id
- 在train_series.parquet中的每個加速度計數(shù)據(jù)系列的唯一標(biāo)識符。night
- 潛在的onset / wakeup事件對的枚舉。每晚最多可以發(fā)生一對事件。event
- 事件類型,是onset(入睡)還是wakeup(醒來)。step
和timestamp
- 事件在加速度計系列中發(fā)生的記錄時間。sample_submission.csv
:正確格式的示例提交文件。詳細(xì)信息請參閱評估頁面。
時間安排
2023 年 9 月 5 日 - 開始日期
2023 年 11 月 28 日 - 報名截止日期
2023 年 11 月 28 日 - 合并截止日期
2023 年 12 月 5 日 - 提交截止日期
賽題獎金
第一名 - 15,000美元
第二名 - 10,000美元
第三名 - 8,000美元
第四名 - 7,000美元
第五名 - 5,000美元
第六名 - 5,000美元
新賽火熱報名中?。?!
戳海報了解詳情??

添加小享,報名新賽
有其他問題也可以咨詢哦
