天樞(Learth)第三講:模型訓(xùn)練實(shí)戰(zhàn)篇之“一起來數(shù)羊”

按照慣例,我們先回顧一下天樞前兩講文章內(nèi)容,在天樞(第一講)里也講到了AI計算機(jī)視覺技術(shù)在圖像處理領(lǐng)域常用的四種算法:圖像分類、目標(biāo)檢測(識別)、語義分割、實(shí)例分割。基于這幾種算法,天樞平臺結(jié)合遙感行業(yè)現(xiàn)狀需求,打造出了以下三個功能板塊:

基于這三個板塊,其實(shí)我們就能解決很多遙感甚至非遙感業(yè)務(wù)場景下的解譯需求了,但天樞平臺本著“授人以漁”的理念,將模型訓(xùn)練的主動權(quán)和模型資產(chǎn)管理權(quán)交到用戶手中,所以作為天樞平臺最大亮點(diǎn)功能的模型訓(xùn)練,究竟能給我們創(chuàng)造出什么樣的價值?

今天主要給大家?guī)淼氖?strong>“目標(biāo)識別——草原數(shù)羊”的模型訓(xùn)練案例分享,對模型訓(xùn)練還不夠了解的朋友,建議先移步到天樞(第二講),熟知一下模型訓(xùn)練流程以及影響模型訓(xùn)練的主要因素。
平臺中目標(biāo)識別模型訓(xùn)練使用的網(wǎng)絡(luò)框架是百度飛槳的PaddleDetection開發(fā)套件,其模塊化地實(shí)現(xiàn)了多種主流目標(biāo)檢測算法,提供了豐富的數(shù)據(jù)增強(qiáng)策略、網(wǎng)絡(luò)模塊組件(如骨干網(wǎng)絡(luò))、損失函數(shù)等,并集成了模型壓縮和跨平臺高性能部署能力。


本篇文章將會按照“明確需求→樣本制作(算量)→服務(wù)器搭建(算力)→天樞平臺訓(xùn)練(算法)”的四大步貫穿全文,詳細(xì)講述用天樞平臺訓(xùn)練模型的整體思路。
一、明確需求
模型訓(xùn)練嘛,老觀眾應(yīng)該都知道要怎么做了,先要明確需求對吧,而明確需求也需要兩步走:
1.明確大類(地物分割、變化檢測、目標(biāo)識別中哪一種?)——目標(biāo)識別
2.明確小類(識別哪種地物或哪些組合地物?)——羊
二、樣本制作
再接著干嘛? ....... 沒錯,準(zhǔn)備樣本。(關(guān)于樣本的制備原則也叨叨了很多回了,這里不再贅述。)
挺有意思的是,這次我們僅是拿著大疆無人機(jī)在草原上追著羊群,跟拍了十幾張照片,然后回來挑選其中5張有代表性的照片用作訓(xùn)練集和測試集,通過一人半天時間的標(biāo)注,即完成了全部樣本集的制作。從數(shù)據(jù)采集到模型出爐不到一天時間,可以堪稱是有史以來“最廉價”的模型了吧。

訓(xùn)練集測試集劃分如下:

說明 : 訓(xùn)練集 是用于模型訓(xùn)練的數(shù)據(jù)集。
測試集 是用于模型結(jié)果測試的數(shù)據(jù)集,不參與訓(xùn)練。
一般來說,測試集需要和訓(xùn)練集保持有很強(qiáng)的特征相似性,才能取得好的得分。但這里還是刻意挑選了Y3、Y5兩組稍微復(fù)雜的測試集,來進(jìn)一步測驗(yàn)一下模型的泛化能力。
三、服務(wù)器搭建
軟硬件環(huán)境我們也已提前搭建好,相關(guān)配置如下:

四、天樞平臺訓(xùn)練
好,到了這里,萬事俱備,只欠“天樞”。
首先,打開天樞平臺,輸入影像和矢量標(biāo)注。(直接是輸入整張大圖哦~)

接著,創(chuàng)建訓(xùn)練任務(wù),配置訓(xùn)練參數(shù),提交訓(xùn)練。

最后,訓(xùn)練結(jié)束,利用3組測試集來分別測試模型好壞。

我們再來回顧一下整個模型訓(xùn)練的效率和模型精度統(tǒng)計

測試結(jié)論
從結(jié)果可以看出,在與訓(xùn)練集特征比較接近的Y4測試集上模型效果非常佳,準(zhǔn)召率均能達(dá)到94%以上;而在有密集羊群或是傾斜角度拍攝照片的Y3、Y5測試集上,模型沒有辦法很好的區(qū)分聚集在一塊的羊群,以及會錯誤的識別到一些裸巖、巨石等白色物體,這也和我們的標(biāo)注方式、樣本量不足、樣本的特征覆蓋度有一定的關(guān)系。
但是,不需要任何編程基礎(chǔ),利用兩張圖片即可訓(xùn)練出如此高精度的模型,足以看出天樞平臺所依賴的國產(chǎn)的百度AI算法在圖像識別領(lǐng)域的可信賴之處。
由于本次樣本數(shù)量的有限,其實(shí)模型性能還有上升的空間,我們可以繼續(xù)增加樣本,調(diào)整訓(xùn)練超參數(shù),最終總會收獲到一個非常完美的模型,更關(guān)鍵 關(guān)鍵 關(guān)鍵的是,模型的使用權(quán)完全歸屬用戶本人所有。
部分測試效果圖展示:

誤檢截圖:

漏檢截圖:

結(jié)語
“數(shù)羊”其實(shí)只是我們?nèi)f千世界中一個很小的事件縮影,現(xiàn)實(shí)生活中還有很多很小很不起眼的工作,比如數(shù)汽車、數(shù)井蓋、數(shù)電力塔......
對于這些傳統(tǒng)的密集型勞動工作,如果還是一如既往的通過人工去解決顯然不符合如今科技飛速發(fā)展的今天,這就要求我們?nèi)祟惐仨氁岣咦陨淼乃季S模式,而AI思維的宗旨即是解放人類的雙手,讓人類有時間去探索更多有意義的事情。
任正非說過:“人類最終是要走向人工智能的,在華為20秒一部手機(jī)的全自動化流水線上,你如果不重視教育和思維,文化素質(zhì)不夠,在未來可能連做工人的機(jī)會都不存在。”