天樞(Learth)第一講:樣本庫制作

如果說20世紀(jì)最重要的資源是石油,那么毫無疑問在21世紀(jì)“數(shù)據(jù)”將會(huì)取代石油的地位成為新時(shí)代的“寵兒”。當(dāng)然,這里的數(shù)據(jù)并不是普通意義上的數(shù)據(jù),而是指經(jīng)過處理、組織之后的數(shù)據(jù),因?yàn)橹挥羞@樣它才擁有了價(jià)值。隨著近幾年計(jì)算機(jī)硬件的快速發(fā)展以及深度學(xué)習(xí)算法的日趨成熟,遙感技術(shù)與AI(Artificial Intelligence)技術(shù)的結(jié)合已呈必然之勢,這也將會(huì)為測繪行業(yè)帶來新一輪的變革。因此如何將手里的遙感數(shù)據(jù)轉(zhuǎn)換為AI技術(shù)可使用的樣本(建立樣本庫)是每一個(gè)測繪單位都要面臨的問題。

1、遙感中的深度學(xué)習(xí)
在真正了解如何制作樣本之前,我們需要先了解一些深度學(xué)習(xí)的基礎(chǔ)知識(shí),搞清楚一些專有名詞,這樣我們才能知其然并知其所以然。在計(jì)算機(jī)視覺中,我們常常會(huì)聽到這幾個(gè)名詞,如圖片分類、目標(biāo)檢測、語義分割以及實(shí)例分割等等。那么他們到底是什么呢?

簡單來講,圖片分類是指將某一個(gè)圖片進(jìn)行分門別類,更準(zhǔn)確的說就是將圖片中的主體給識(shí)別出來,舉個(gè)例子就是“這個(gè)圖片里有個(gè)建筑物”,所以這個(gè)圖片屬于建筑物那一類。不過僅僅知道“這個(gè)圖片里有個(gè)建筑物”其實(shí)并沒有什么實(shí)際意義,因?yàn)槲覀兂岁P(guān)心一個(gè)物體的類別之外,更關(guān)心物體的位置,因此目標(biāo)檢測就是不僅可以將某一個(gè)圖片中我們感興趣的單個(gè)或多個(gè)物體給識(shí)別出來,而且還可以使用矩形框(Bounding Box)將物體的大致位置給標(biāo)出來。但是很容易發(fā)現(xiàn)目標(biāo)識(shí)別也有它的問題,那就是僅僅只用一個(gè)矩形框來表示一個(gè)物體的邊界太粗糙了,因此語義分割就派上用場了,如果說前兩者更關(guān)注于圖片中的物體對象類別,那么語義分割則更關(guān)注于每個(gè)像素的類別,它可以將圖片中每個(gè)像素分類到對應(yīng)的類別上,這樣就自然而然的可以得到更為精細(xì)的邊界。到了這里我們可以停下來思考一下,語義分割真的就完美了嗎?答案自然是否定的。因?yàn)檎Z義分割只能識(shí)別某一類物體的類別,但無法區(qū)分同一類物體,舉個(gè)例子就是假設(shè)一個(gè)圖片中有兩個(gè)建筑物,那么語義分割會(huì)怎么做呢,它會(huì)幫你把屬于建筑物的像素給標(biāo)出來,但是這中間會(huì)讓人感覺缺少了一些東西,缺少了什么呢?其實(shí)就是“數(shù)量”,因?yàn)檎Z義分割無法將同一類物體給區(qū)分開來,也就是說它無法將兩個(gè)建筑物分為建筑物A和建筑物B,所以實(shí)例分割也就出現(xiàn)了,它可以將圖像中的每個(gè)物體給識(shí)別出來并進(jìn)行編號。
到這里我們可以簡單總結(jié)一下,圖像分類關(guān)注的是“類別”,目標(biāo)檢測和語義分割關(guān)注的是“類別+位置”,實(shí)例分割關(guān)注的是“類別+位置+數(shù)量”,記住這幾個(gè)關(guān)鍵詞,我們的樣本制作過程也將圍繞著它們而展開。
2、遙感數(shù)據(jù)樣本制作
如果說你真正了解了上述所說的內(nèi)容,那么這一部分你即使不看也可以自己制作出樣本數(shù)據(jù),但正所謂“形而上學(xué)謂之道,形而下學(xué)謂之器,舍器而近道者幾稀”,所以這里還是以遙感中最常用的語義分割與實(shí)例分割為例來了解樣本制作的整個(gè)流程。
2.1 語義分割樣本制作
1)遙感影像預(yù)處理。我們不可能拿一幅本身與實(shí)際地物就有很大偏差的影像去做樣本,所以影像的預(yù)處理工作是必不可少的一步,如輻射定標(biāo)、大氣校正以及幾何校正等等,更多內(nèi)容可以參看這篇文章“教程 | 遙感圖像處理流程”
2)樣本標(biāo)注。在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型的設(shè)計(jì)和訓(xùn)練中,數(shù)據(jù)的標(biāo)注質(zhì)量會(huì)直接影像到模型的最終效果,所以在樣本的標(biāo)注過程中一定要嚴(yán)格遵守幾點(diǎn)通用原則:
規(guī)則先行:根據(jù)業(yè)務(wù)場景需求,明確標(biāo)注規(guī)則,保證規(guī)則統(tǒng)一可區(qū)分,即嚴(yán)格遵守遙感影像地類標(biāo)注原則和經(jīng)驗(yàn),同一種類別標(biāo)簽在影像上的定義不可摸棱兩可。

圖1 不同規(guī)則下的地物
最大最?。簶?biāo)注框在框選目標(biāo)區(qū)域時(shí),要盡量大,大到能夠包含目標(biāo)區(qū)域的主要邊界;要盡量小,小到除了目標(biāo)區(qū)域邊界以外,不包含其他無關(guān)區(qū)域??蚺c標(biāo)注目標(biāo)的邊緣基本呈外接關(guān)系。冗余標(biāo)注會(huì)對模型的特征提取、標(biāo)注框回歸等造成較大擾動(dòng),從而使模型的檢測結(jié)果不精確。

標(biāo)簽完整性:用作訓(xùn)練的數(shù)據(jù)集如明確出現(xiàn)判定規(guī)則內(nèi)的地物或變化地物,均需要標(biāo)注出來,嚴(yán)格避免遺漏或錯(cuò)標(biāo)情況。

所標(biāo)即所見:標(biāo)注過程中,不要添加主觀想象力和先驗(yàn)知識(shí),只標(biāo)注從視覺上看到確定是目標(biāo)的部分。不要對有遮擋或只有一面無法確定的地物橫加想象進(jìn)行標(biāo)注,更不可利用外業(yè)數(shù)據(jù)或其他影像來輔助判斷??扇藶閱为?dú)定義一類,來囊括規(guī)則之外的地類或場景,比如云層、霧氣、陰影、曝光區(qū)等等。

在滿足上述原則下,我們以一個(gè)小范圍影像為例來構(gòu)建遙感數(shù)據(jù)樣本庫,如下圖所示:

3)根據(jù)標(biāo)注對遙感影像進(jìn)行切片并生成標(biāo)簽。在保證標(biāo)注和影像套和的前提下,我們選擇一個(gè)切片工具來對影像進(jìn)行切片,這類軟件有很多,如Labelme、Arcgis Pro等等,以Arcgis Pro中的“導(dǎo)出訓(xùn)練數(shù)據(jù)進(jìn)行深度學(xué)習(xí)”功能為例。

如圖6所示,最左側(cè)是原始的影像與矢量疊加圖,中間是原始影像的切片(1024*1024),最右側(cè)就是生成的標(biāo)簽圖片。值得注意的是標(biāo)簽是一個(gè)單波段的圖像,它的每一個(gè)不同的像素值就代表了一個(gè)類別,如像素值0代表背景(黑色)、1代表林地(灰色)以及2代表道路(白色),如果你還記得之前所說的語義分割關(guān)注的是“類別+位置”,那么再來看這個(gè)標(biāo)簽圖就顯得合情合理了,剩下的只需要將原始影像切片與標(biāo)簽一一對應(yīng)就建立好了語義分割的數(shù)據(jù)集。

與語義分割類似,我們在進(jìn)行圖像預(yù)處理和標(biāo)注之后,就可以生成實(shí)例分割樣本,如下圖所示。

還記得實(shí)例分割的關(guān)鍵詞是什么嗎?“類別+位置+數(shù)量”,所以在這里的標(biāo)簽圖(僅有林地)中,像素值0代表背景、1代表林地1、2代表林地2,…,以此類推。之后同語義分割一樣建立影像切片與標(biāo)簽對應(yīng)關(guān)系即完成了實(shí)例分割數(shù)據(jù)集的構(gòu)建,如下圖所示。

3、AI遙感解譯產(chǎn)品:天樞(Learth)
從上述的樣本制作過程中,不難看出在使用深度學(xué)習(xí)進(jìn)行遙感解譯的過程中,最為核心的那自然是神經(jīng)網(wǎng)絡(luò)算法,但要說最為繁瑣、耗費(fèi)時(shí)間的一步那就要數(shù)遙感數(shù)據(jù)樣本的制作,它可能會(huì)占到整個(gè)過程大約80%的時(shí)間;此外,AI算法對大部分人仍是比較遙遠(yuǎn)的,即使是有一定造詣的AI算法工程師,也很難單靠一個(gè)人就可以訓(xùn)練出精確且穩(wěn)定的解譯模型。喬布斯曾說過:“懶人推動(dòng)世界”,既然我們的最終目的是想得到一個(gè)AI遙感解譯的模型,那么有沒有一種“偷懶”的方式,不用這么耗時(shí)耗力的去制作樣本和構(gòu)建算法也可以快速的獲得AI模型呢?答案自然是有的。
中科北緯(北京)科技有限公司與百度聯(lián)合開發(fā)的“天樞(Learth)”平臺(tái)就是這樣一款A(yù)I遙感解譯產(chǎn)品,該平臺(tái)依托于深度學(xué)習(xí)技術(shù)和國產(chǎn)開源的深度學(xué)習(xí)框架(飛槳),集成了海量數(shù)據(jù)管理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、模型測試和發(fā)布、遙感推理服務(wù),以及模型知識(shí)資產(chǎn)的安全管控功能,實(shí)現(xiàn)了數(shù)據(jù)到信息再到價(jià)值的挖掘路徑。產(chǎn)品架構(gòu)如下所示:

它不僅支持在線制作樣本庫(圖11),而且也支持人機(jī)交互式樣本的標(biāo)注和直接利用已有的地理國情檢測以及三調(diào)標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練(圖12)。


此外,它最大的特點(diǎn)就是對無編程基礎(chǔ)的人非常友好,鼠標(biāo)點(diǎn)選即可在線訓(xùn)練模型(圖13),這大大節(jié)省了我們制作遙感樣本這一過程,無需再進(jìn)行數(shù)據(jù)切片處理和生成標(biāo)簽,直接就可以獲得可用于生產(chǎn)的AI模型(圖14)。


如果您還處在觀望的階段或是您還有一些額外的功能要求,我們公司已開通在線試用版“天樞”產(chǎn)品,并且我們平臺(tái)也支持二次開發(fā),可以很方便為您提供定制版天樞平臺(tái),在這里也歡迎每個(gè)對AI感興趣的人前來試用和提供您的寶貴意見。
4、小結(jié)
遙感數(shù)據(jù)樣本庫的制作作為邁向AI技術(shù)的第一步,它對每一個(gè)想要學(xué)習(xí)和了解AI技術(shù)的人都至關(guān)重要,但是僅僅只會(huì)制作樣本仍與我們最終的目的相差甚遠(yuǎn)。未來十年,遙感是否可以深刻地影響社會(huì)發(fā)展,切實(shí)解決生產(chǎn)生活中的問題,兼具普適性和經(jīng)濟(jì)價(jià)值,其關(guān)鍵點(diǎn)就在于AI技術(shù)在遙感領(lǐng)域的工業(yè)化。因此以天樞平臺(tái)為代表的諸多AI解譯平臺(tái)也必將成為這場工業(yè)化中的主力軍,在這里我們誠心希望每一位遙感行業(yè)中的從業(yè)者都可以參加到這場工業(yè)化之中,與我們一起共創(chuàng)AI遙感新時(shí)代。
關(guān)注中科北緯公眾號:Zhongke-NB,即可申請平臺(tái)試用!