在國(guó)際生物多樣性日,看動(dòng)物保護(hù)中的昇騰AI身影
作者 | 曾響鈴
文 | 響鈴說(shuō)
大量的野外拍攝照片需要專家人工識(shí)別并進(jìn)行注釋,費(fèi)時(shí)費(fèi)力;
決策者可以很快決定該如何采取行動(dòng),但在這之前要花很長(zhǎng)時(shí)間等待數(shù)據(jù)分析結(jié)果;
幫助行業(yè)專家和公益界人士更好地優(yōu)化保護(hù)方式的科學(xué)研究,常常因?yàn)橐巴鈭D像數(shù)據(jù)支撐還不夠?qū)е逻M(jìn)展緩慢……
動(dòng)物保護(hù)已經(jīng)成為人類共識(shí),但在行動(dòng)上卻因?yàn)閿?shù)據(jù)處理和挖掘速度根不上而面臨種種尷尬。隨著渡渡鳥(niǎo)、大海雀、塔斯馬尼亞虎、西部黑犀牛等珍惜動(dòng)物的滅絕,生態(tài)系統(tǒng)所面臨的潛在不利影響正在放大,強(qiáng)化動(dòng)物保護(hù)的科研認(rèn)知、加快實(shí)踐落地工作變得更加緊迫。
在這樣的大背景下,人工智能介入動(dòng)物保護(hù)就變得順理成章,這些年從國(guó)內(nèi)到國(guó)外大量的公益組織與科技企業(yè)都在嘗試用AI推動(dòng)與動(dòng)物保護(hù)有關(guān)的圖像數(shù)據(jù)處理工作。
然而,對(duì)AI模型開(kāi)發(fā)而言,瀕危野生動(dòng)物保護(hù)與其他多數(shù)領(lǐng)域相比面臨十分復(fù)雜的挑戰(zhàn),高效的AI開(kāi)發(fā)框架和專業(yè)的技術(shù)團(tuán)隊(duì)支撐變得更加重要,在業(yè)內(nèi),已有相關(guān)的合作在開(kāi)展,例如某自然保護(hù)機(jī)構(gòu)就與來(lái)自昇騰AI產(chǎn)業(yè)生態(tài)的昇思MindSpore開(kāi)源社區(qū)合作,共同將AI 應(yīng)用于生物多樣性保護(hù)場(chǎng)景。
這種合作,將推動(dòng)照片識(shí)別流程的速度,節(jié)省人力和時(shí)間,并將野外相機(jī)抓拍到的珍貴動(dòng)物數(shù)據(jù)更快地反饋到科研和保護(hù)工作當(dāng)中,而其過(guò)程,也是克服動(dòng)物保護(hù)領(lǐng)域的獨(dú)特挑戰(zhàn)。
數(shù)據(jù)端被“扎口”,AI動(dòng)物保護(hù)在模型端承受更大壓力
經(jīng)過(guò)數(shù)年積淀,立足自主AI計(jì)算架構(gòu)的昇騰AI產(chǎn)業(yè)生態(tài)已經(jīng)度過(guò)原始的積累期,在生態(tài)伙伴、行業(yè)場(chǎng)景等方面不斷突破,推動(dòng)著千行百業(yè)的智能化升級(jí)?,F(xiàn)在,昇騰以昇思MindSpore開(kāi)源社區(qū)進(jìn)入公益領(lǐng)域并不令人意外。
而無(wú)論與誰(shuí)合作、服務(wù)于誰(shuí),昇騰AI產(chǎn)業(yè)要“搞定”一個(gè)場(chǎng)景往往需要針對(duì)性的合作模式與技術(shù)創(chuàng)新——在與上述自然保護(hù)機(jī)構(gòu)的合作中,AI參與動(dòng)物保護(hù)就面臨獨(dú)特的訓(xùn)練數(shù)據(jù)挑戰(zhàn)。
從官方公布的信息看,雙方首期投入作為訓(xùn)練集的數(shù)據(jù)主要來(lái)自上述自然保護(hù)機(jī)構(gòu)與其他合作機(jī)構(gòu)從2011開(kāi)始所積累的野外紅外相機(jī)數(shù)據(jù),一共12680 張照片,其中12180 張作為訓(xùn)練集,500 張作為驗(yàn)證集。
這些照片來(lái)支撐一個(gè)AI模型的開(kāi)發(fā),面臨兩個(gè)問(wèn)題:
一是數(shù)據(jù)總量“不上不下”,上萬(wàn)張照片用人工去分析、挖掘數(shù)據(jù)耗時(shí)費(fèi)力,但對(duì)AI來(lái)說(shuō)又似乎并不充裕,尤其是照片還分為了雪豹、巖羊、白唇鹿等常見(jiàn)的 10 個(gè)物種或物種類別,進(jìn)一步“稀釋”了數(shù)據(jù)的垂直度,而照片數(shù)據(jù)的獲取與增長(zhǎng)本身還受限于采集條件;
二是數(shù)據(jù)質(zhì)量不佳,部署于野外的紅外相機(jī)所獲取的圖像往往難以清晰、完整,模糊的身影、與周邊環(huán)境難以區(qū)分等問(wèn)題常常出現(xiàn)。
這就形成了一個(gè)尷尬的邏輯鏈條:一個(gè)動(dòng)物越瀕危,其保護(hù)就越重要,AI越是應(yīng)當(dāng)參與進(jìn)來(lái),但是,能夠獲取到的圖像數(shù)量和質(zhì)量往往也越差,又給AI帶來(lái)了更大的挑戰(zhàn),即“越重要就越困難”。
于是,一個(gè)AI模型開(kāi)發(fā)所主要關(guān)注的兩個(gè)環(huán)節(jié)——數(shù)據(jù)和算法,隨著數(shù)據(jù)端被“扎口”,壓力就更大程度上來(lái)到了算法開(kāi)發(fā)上。而且,由于很多圖片本身即便是人工識(shí)別也有一定難度。
這又對(duì)AI模型的能力提出了其他領(lǐng)域少見(jiàn)的“超越人眼而不是追平人眼”的要求。一邊是數(shù)據(jù)受限,另一邊是對(duì)效果有高期許,動(dòng)物保護(hù)領(lǐng)域的AI模型開(kāi)發(fā)“兩頭承壓”,也就對(duì)開(kāi)發(fā)框架提出了更高的支撐要求。
成為國(guó)內(nèi)首個(gè)參與動(dòng)物保護(hù)的AI開(kāi)發(fā)框架,MindSpore的探索不僅限于技術(shù)
昇騰與自然保護(hù)機(jī)構(gòu)的合作,讓昇思MindSpore成為國(guó)內(nèi)首個(gè)參與動(dòng)物保護(hù)的AI開(kāi)發(fā)框架,而為了應(yīng)對(duì)上述挑戰(zhàn),可以認(rèn)為,此次合作中昇騰除了技術(shù)本身,還在合作模式上做了探索。
首先,是既然“數(shù)據(jù)采集”(原始數(shù)據(jù)獲?。┦芟?,那么就不斷提升對(duì)數(shù)據(jù)的“珍視度”,在“數(shù)據(jù)標(biāo)注”(用標(biāo)注框框出照片中的識(shí)別對(duì)象的位置)階段發(fā)力。
一般而言,用于AI模型訓(xùn)練的數(shù)據(jù)往往都是通過(guò)“勞動(dòng)密集”的標(biāo)注工作來(lái)輸出,目前較少有前沿技術(shù)和專業(yè)人士的參與。而此次合作,昇思MindSpore 團(tuán)隊(duì)線上指導(dǎo)了自然保護(hù)機(jī)構(gòu)團(tuán)隊(duì)使用AI標(biāo)注平臺(tái)開(kāi)展物種標(biāo)注工作,并后續(xù)邀請(qǐng)了 61 位志愿者來(lái)一同進(jìn)行數(shù)據(jù)標(biāo)注——準(zhǔn)確標(biāo)注的數(shù)據(jù)再去“喂養(yǎng)”AI模型,將直接提升模型訓(xùn)練的效果。
然后,是通過(guò)權(quán)衡取舍確定最佳的算法路徑,不迷信于單一類別的基礎(chǔ)模型,而是根據(jù)實(shí)際情況結(jié)合AI開(kāi)放框架的創(chuàng)新綜合考慮。
針對(duì)經(jīng)典的one-stage模型精度低但速度快,而two-stage模型精度高但速度慢的現(xiàn)實(shí),昇思MindSpore 開(kāi)源運(yùn)營(yíng)團(tuán)隊(duì)和自然保護(hù)機(jī)構(gòu)討論后采用了YOLOv3 目標(biāo)檢測(cè)模型,其歸屬于one-stage但同時(shí)得益于昇思MindSpore的創(chuàng)新開(kāi)發(fā)能夠平衡檢測(cè)的質(zhì)量和速度,能在效率的基礎(chǔ)上保證識(shí)別的效果。
再有,是以開(kāi)源推進(jìn)的方式讓公益領(lǐng)域的AI也能群策群力。
本次合作的所有代碼、模型文件和部署文檔均已在昇思MindSpore社區(qū)開(kāi)源,大量的開(kāi)發(fā)者參與其中,為模型的優(yōu)化做出貢獻(xiàn),更好地應(yīng)對(duì)動(dòng)物保護(hù)領(lǐng)域的獨(dú)特挑戰(zhàn)。而模型被開(kāi)源后也不單服務(wù)于上述自然保護(hù)機(jī)構(gòu)一家機(jī)構(gòu),還能夠幫助到更多需要的人和機(jī)構(gòu),發(fā)揮出更大的價(jià)值。群策群力、群體價(jià)值共享的開(kāi)源社區(qū)基礎(chǔ)愿景在公益領(lǐng)域得到踐行。
最后,是公益組織與科技平臺(tái)進(jìn)行了“初創(chuàng)式”的合作模式探索。
在直觀上,是自然保護(hù)機(jī)構(gòu)與昇思MindSpore探索了一套從需求出發(fā)的緊密協(xié)作機(jī)制,可以往其他公益機(jī)構(gòu)、領(lǐng)域進(jìn)行復(fù)制。
而內(nèi)里,是開(kāi)源模式在公益領(lǐng)域的有效落地。在環(huán)保已經(jīng)成為普遍共識(shí)的今天,通過(guò)技術(shù)的手段來(lái)強(qiáng)化公益工作已經(jīng)是許多公益組織的必選項(xiàng),公益組織與商業(yè)組織一樣在積極擁抱AI,擁抱能夠加深A(yù)I技術(shù)廣度與深度的開(kāi)源打法。華為當(dāng)然十分有意愿加入到公益事業(yè)當(dāng)中,發(fā)揮自身技術(shù)和業(yè)務(wù)沉淀的價(jià)值,而更應(yīng)該強(qiáng)調(diào)的是,它作為昇思MindSpore 開(kāi)源社區(qū)的一員,也是通過(guò)開(kāi)源社區(qū)在貢獻(xiàn)自己的力量,努力推進(jìn)優(yōu)質(zhì)識(shí)別模型的發(fā)展。
開(kāi)源時(shí)代,AI社區(qū)“社會(huì)意義”的一面正在不斷強(qiáng)化
從自然保護(hù)機(jī)構(gòu)與昇思MindSpore開(kāi)源社區(qū)的合作不難看出,作為一種推動(dòng)“技術(shù)進(jìn)步”的模式存在,開(kāi)源的打法不負(fù)眾望,幫助了AI識(shí)別模型的不斷優(yōu)化并分享給了更多人。
而從另一個(gè)角度看,通過(guò)開(kāi)源的方式,很多希望為公益出一份力的開(kāi)發(fā)者有了新的抵達(dá)路徑,在捐錢(qián)、捐物、抵制珍惜動(dòng)植物消費(fèi)等做法之外,能夠?qū)⒓夹g(shù)的力量通過(guò)社區(qū)貢獻(xiàn)注入到公益工作當(dāng)中去,也許未來(lái)某一次的雪豹保護(hù)工作中所采用過(guò)的AI識(shí)別應(yīng)用就有自己所貢獻(xiàn)的技術(shù)的痕跡,這是不可否認(rèn)且能夠長(zhǎng)期發(fā)揮價(jià)值的公益舉動(dòng)。
自2020 年 3 月正式開(kāi)源以來(lái),兩年時(shí)間過(guò)去,昇思MindSpore社區(qū)已擁有 80 萬(wàn)社區(qū)開(kāi)發(fā)者,下載量超過(guò) 166 萬(wàn),5000+企業(yè)應(yīng)用上線,認(rèn)證開(kāi)發(fā)者/布道師近300人,社區(qū)貢獻(xiàn)者4500+,成為了國(guó)內(nèi)第一熱度的 AI 開(kāi)源社區(qū)。參與公益合作,讓快速發(fā)展的昇思MindSpore展示了AI社區(qū)在推動(dòng)“技術(shù)進(jìn)步”之外更能推動(dòng)“社會(huì)進(jìn)步”的意義,社區(qū)越是繁榮,能夠吸引到參與公益的開(kāi)發(fā)者就越是廣泛,公益事業(yè)也就有了更好的技術(shù)支撐和保障。
而昇思MindSpore開(kāi)源社區(qū)與上述自然保護(hù)機(jī)構(gòu)聯(lián)合成立的AI for Biodiversity Conservation Working Group(簡(jiǎn)稱:WG-AI4BC)就是基于此目的,以常態(tài)化合作機(jī)制匯聚更多的社會(huì)力量,強(qiáng)化人工智能技術(shù)研究,幫助尋找、保護(hù)中華水塔中的珍惜野生動(dòng)植物。
就在520當(dāng)天,華為官方公眾號(hào)還發(fā)布了關(guān)注昇騰AI(喻為“愛(ài)”)幫助世界更美好的推文(見(jiàn)文末鏈接),其中首先提到了利用昇騰AI保護(hù)雪豹,可見(jiàn)AI參與動(dòng)物保護(hù)正在以凸顯人文關(guān)懷的方式來(lái)獲得更廣泛的關(guān)注和參與——本文的撰寫(xiě)就一定程度上受到了這種人文關(guān)懷的推動(dòng)。
現(xiàn)在,WG-AI4BC還在邀請(qǐng)更多開(kāi)發(fā)者參與,在查閱立項(xiàng)文檔后,開(kāi)發(fā)者可以選擇通過(guò)在社區(qū)提交ISSUE或者PR的方式參與到開(kāi)源貢獻(xiàn)當(dāng)中來(lái),或者直接通過(guò) naturewatch@shanshui.org提交提案。

回過(guò)頭來(lái)看,昇思MindSpore開(kāi)源社區(qū)所匯聚的行業(yè)、科研及開(kāi)源力量,已經(jīng)推動(dòng)了醫(yī)療、交通、金融、互聯(lián)網(wǎng)、制造、能源、運(yùn)營(yíng)商等8大行業(yè)的智能化變革,幫助昇騰AI與產(chǎn)業(yè)的融合深度不斷加深,千行百業(yè)的產(chǎn)業(yè)智能化升級(jí)既有了高效可靠的底層AI基礎(chǔ)設(shè)施,也有了全面業(yè)務(wù)助力的AI使能者。
隨著昇思MindSpore開(kāi)源社區(qū)開(kāi)始往公益領(lǐng)域深入,昇騰AI產(chǎn)業(yè)生態(tài)將增添又一個(gè)重要的垂直領(lǐng)域,AI在公益領(lǐng)域的落地表現(xiàn)將更值得期待。
*本文圖片均來(lái)源于網(wǎng)絡(luò)