Kaggle賽題-海底海星目標檢測Baseline

Frankie ♂
目前本科在讀
師從深度之眼比賽班導(dǎo)師-Taylor老師
剛接觸圖像算法競賽半年
已經(jīng)獲得 IFLYTEK 1024 Challenge - X光目標檢測第二名
華為云-重慶語義分割算法大賽二等獎等
?

?
1、賽題鏈接
https://www.kaggle.com/c/tensorflow-great-barrier-reef
2、賽題描述
本次競賽的目標是通過建立一個在珊瑚礁水下視頻中訓(xùn)練的物體檢測模型,實時準確地識別海星。
商業(yè)價值:幫助研究人員識別威脅澳大利亞大堡礁的物種,并采取明智的行動,為子孫后代保護珊瑚礁。
?
※ 比賽時間線
2021 11 月 22 日 年 - 開始日期。
2022 2 月 7 日 年 - 報名截止日期。 您必須在此日期之前接受比賽規(guī)則才能參加比賽。
2022 2 月 7 日 年 - 團隊合并截止日期。 這是參與者可以加入或合并團隊的最后一天。
2022 2 月 14 日 年 - 最終提交截止日期。
?
※ 豐厚的獎金
一等獎:30,000美元
二等獎:25,000美元
三等獎:20,000美元
四等獎:15,000美元
五等獎:10,000美元
?
3、數(shù)據(jù)描述
?

?
train.csv中包含了三個視頻抽幀后的圖片信息標注,其中幾個重要參數(shù):
video_id圖像所屬視頻的 ID 號。視頻 ID 沒有有意義的排序。
video_frame視頻中圖像的幀數(shù)。當(dāng)潛水員浮出水面時,預(yù)計會偶爾看到幀數(shù)的差距。
sequence給定視頻的無間隙子集的 ID。序列 id 沒有有意義的排序。
sequence_frame給定序列中的幀號。
image_id圖像的 ID 代碼,格式為“{video_id}-{video_frame}”
annotations邊界框由其在圖像內(nèi)左上角的像素坐標 (x_min, y_min) 及其寬度和高度(以像素為單位)描述。
?
關(guān)注公眾號
回復(fù)“海星”即可獲取比賽baseline源碼!

可視化標注

其中,只有4919張圖片有標注

?
?
視頻0: 2143張有目標
視頻1: 2099張有目標
視頻2: 677張有目標
?
Bbox長寬比例分析

?
4、評價指標
F2-Score
選擇F2指標目的是為了盡量不漏檢允許一些FP. 因此處理FN比處理FP要重要
?

5、對賽題標簽的理解
?
劃分數(shù)據(jù)集時,為了避免數(shù)據(jù)泄露,可以對0,1視頻進行訓(xùn)練。2視頻進行線下驗證
5.1、篩選出有標注的數(shù)據(jù)
?
?
5.2、生成bbox函數(shù)
?
?
5.3、生成標注文件
?
?
6、Baseline流程
Baseline以簡單的Faster-RCNN入手 (詳細見baseline README文件)
安裝編譯mmdet
定義數(shù)據(jù)
修改配置文件
添加測試腳本
調(diào)參提交
7、賽題難點思考
1、如何利用無目標圖片
2、如何有效利用連續(xù)幀中目標處理(如下兩圖為連續(xù)幀)
?


關(guān)注公眾號
回復(fù)“海星”即可獲取比賽baseline源碼!
