散文網(wǎng) » 科技 »學(xué)習(xí) » ACCV2022｜大規(guī)模細(xì)粒度圖像分類冠軍方案

ACCV2022｜大規(guī)模細(xì)粒度圖像分類冠軍方案

2022-12-14 10:03 作者:極市平臺 0人讀過 | 我要投稿

作者丨ABCDEFG

編輯丨極市平臺

在剛剛結(jié)束的 ACCV 2022 國際細(xì)粒度圖像分析挑戰(zhàn)賽中，我們團(tuán)隊(duì)在?133?支參賽隊(duì)伍中脫穎而出，在?Leadboard-B?上以 2.5 的絕對優(yōu)勢取得冠軍。

在比賽過程中，我們使用了一些對細(xì)粒度分類十分有效的解決方案。

例如，在數(shù)據(jù)清洗方面我們?nèi)サ舳x性的圖片；
模型選擇和方法方面我們使用了 ViT-L和 Swin-v2；
為了提高實(shí)驗(yàn)效率，方便整個實(shí)驗(yàn)過程的管理，我們基于?MMSelfSup?和?MMClassification?兩個開源算法框架開展比賽。

所有的模型權(quán)重和全部代碼都已經(jīng)開源，歡迎大家使用。

本次賽事相關(guān)的所有預(yù)訓(xùn)練，微調(diào)以及推理的代碼和配置文件分別放在 MMSelfSup 以及 MMClassification 的 projects 中, 歡迎大家 star 和使用。

自監(jiān)督預(yù)訓(xùn)練部分:?https://github.com/open-mmlab/mmselfsup/tree/dev-1.x/projects/fgia_acCV2022_1st

微調(diào)與模型推理：?https://github.com/open-mmlab/mmclassification/tree/dev-1.x/projects/fgia_acCV2022_1st

今天這篇文章我們將整體介紹此次奪冠的方案，希望為大家提供一些經(jīng)驗(yàn)以供參考。

比賽介紹

ACCV 2022 細(xì)粒度圖像分析挑戰(zhàn)賽是由南京理工大學(xué)和澳大利亞 University of Wollongong 主辦、極市平臺提供技術(shù)支持的國際性賽事。

本賽事涉及的細(xì)粒度圖像分析是計(jì)算機(jī)視覺和模式識別中的熱門研究課題，其目標(biāo)是對細(xì)粒度級別圖像中的物體子類（如不同種類的“狗”：“哈士奇”、“阿拉斯加”、“薩摩耶”）進(jìn)行定位、識別及檢索等視覺分析任務(wù)的研究，具有真實(shí)場景下廣泛的應(yīng)用價值。然而因細(xì)粒度級別子類別間較小的類間差異和較大的類內(nèi)差異，使其區(qū)別于傳統(tǒng)圖像分析問題成為更具挑戰(zhàn)的任務(wù)。

此次我們參加的賽題是：網(wǎng)絡(luò)監(jiān)督的細(xì)粒度識別，接下來我們將從數(shù)據(jù)清洗、模型選擇、訓(xùn)練技巧（Bag-of-tricks）、模型集成和后處理等角度介紹我們的方案。

數(shù)據(jù)清洗

官方提供的數(shù)據(jù)包含: Train、Test-A 和 Test-B。Train 是用于訓(xùn)練的數(shù)據(jù)，這部分?jǐn)?shù)據(jù)官方提供了 label。同時因?yàn)檫@項(xiàng)比賽分為 A/B 榜，所以 Test A 和 Test B 分別是用于評測的數(shù)據(jù)，這兩部分?jǐn)?shù)據(jù)是可以獲得的，但是他們的 label 是不提供的。

這幾部分的數(shù)據(jù)的詳細(xì)信息如下: