CCF BDCI人工智能比賽天氣以及時間分類
文章較長完整代碼關(guān)注【學(xué)姐帶你玩AI】公眾號,回復(fù)“天氣”領(lǐng)取
來源:投稿
作者:livingbody
編輯:學(xué)姐
#?賽題背景
在自動駕駛場景中,天氣和時間(黎明、早上、下午、黃昏、夜晚)會對傳感器的精度造成影響,比如雨天和夜晚會對視覺傳感器的精度造成很大的影響。此賽題旨在對拍攝的照片天氣和時間進行分類,從而在不同的天氣和時間使用不同的自動駕駛策略。

#?賽題任務(wù)
此賽題的數(shù)據(jù)集由云測數(shù)據(jù)提供。比賽數(shù)據(jù)集中包含3000張真實場景下行車記錄儀采集的圖片,其中訓(xùn)練集包含2600張帶有天氣和時間類別標(biāo)簽的圖片,測試集包含400張不帶有標(biāo)簽的圖片。參賽者需基于Oneflow框架在訓(xùn)練集上進行訓(xùn)練,對測試集中照片的天氣和時間進行分類。
#?數(shù)據(jù)簡介
本賽題的數(shù)據(jù)集包含2600張人工標(biāo)注的天氣和時間標(biāo)簽。
天氣類別:多云、晴天、雨天、雪天和霧天5個類別
時間:黎明、早上、下午、黃昏、夜晚5個類別

下午 多云

早上 雨天
#?數(shù)據(jù)說明
數(shù)據(jù)集包含anno和image兩個文件夾,anno文件夾中包含2600個標(biāo)簽json文件,image文件夾中包含3000張行車記錄儀拍攝的JPEG編碼照片。圖片標(biāo)簽將字典以json格式序列化進行保存:

#?提交要求
參賽者使用Oneflow框架對數(shù)據(jù)集進行訓(xùn)練后對測試集圖片進行推理后:
1.將測試集圖片的目標(biāo)檢測和識別結(jié)果以與訓(xùn)練集格式保持一致的json文件序列化保存,并上傳至參賽平臺由參賽平臺自動評測返回結(jié)果。?
2.在提交時的備注附上自己的模型github倉庫鏈接
#?提交示例
{ “annotations”: [ { “filename”: “test_images\00008.jpg”, “period”: “Morning”, “weather”: “Cloudy” }] }
#?解題思路
總體上看,該任務(wù)可以分為2個:一個是預(yù)測時間、一個是預(yù)測天氣。
具體如下:
預(yù)測時間、天氣數(shù)據(jù)標(biāo)簽列表生成
數(shù)據(jù)集劃分
數(shù)據(jù)均衡(數(shù)據(jù)很不均衡)
分別預(yù)測
合并預(yù)測結(jié)果
數(shù)據(jù)集準(zhǔn)備
數(shù)據(jù)下載
數(shù)據(jù)解壓縮
按時間制作標(biāo)簽
注意事項:雖然數(shù)據(jù)描述說時間** Period 為 黎明、早上、下午、黃昏、夜晚**,但是經(jīng)過遍歷發(fā)現(xiàn)只有4類。。。。。,故如下制作標(biāo)簽
數(shù)據(jù)集劃分并數(shù)據(jù)均衡

按天氣分制作標(biāo)簽
數(shù)據(jù)集劃分并均衡

環(huán)境準(zhǔn)備
飛槳圖像識別套件PaddleClas是飛槳為工業(yè)界和學(xué)術(shù)界所準(zhǔn)備的一個圖像識別任務(wù)的工具集,助力使用者訓(xùn)練出更好的視覺模型和應(yīng)用落地。此次計劃使用端到端的PaddleClas圖像分類套件來快速完成分類。此次使用PaddleClas框架完成比賽。
模型訓(xùn)練 and 評估
時間訓(xùn)練
以PaddleClas/ppcls/configs/ImageNet/VisionTransformer/ViT_small_patch16_224.yaml 為基礎(chǔ)進行修改
天氣訓(xùn)練
配置文件為:
** PaddleClas/ppcls/configs/ImageNet/VisionTransformer/ViT_base_patch16_224_weather.yaml**
預(yù)測
時間模型導(dǎo)出
開始預(yù)測
編輯 PaddleClas/deploy/python/predict_cls.py,按提交格式輸出預(yù)測結(jié)果到文件。
天氣模型導(dǎo)出
天氣預(yù)測
合并并提交
最后一部分代碼在公眾號【學(xué)姐帶你玩AI】,B站的編輯器卡的不行了,關(guān)注公眾號查看全文把!
完整代碼關(guān)注學(xué)姐回復(fù)“天氣”領(lǐng)取