使用機器學習解碼動物交流
過去幾年,人們對使用機器學習 (ML) 方法研究非人類動物(以下簡稱“動物”)行為的興趣激增 ( 1 )。一個引起特別關(guān)注的話題是使用深度學習和其他方法解碼動物通信系統(tǒng) ( 2 )。現(xiàn)在是時候應對有關(guān)數(shù)據(jù)可用性、模型驗證和研究倫理的挑戰(zhàn),并抓住建立跨學科和倡議合作的機會了。 研究人員必須通過觀察和實驗來推斷動物信號的含義或功能(3)。這是一項具有挑戰(zhàn)性的任務,尤其是因為動物使用多種通信方式,包括視覺、聽覺、觸覺、化學和電信號——通常結(jié)合在一起,超出了人類的感知能力。觀察工作的重點是記錄感興趣的信號以及詳細的上下文信息,包括信號發(fā)送者和接收者的身份、狀態(tài)和行為、他們的關(guān)系和過去的交互以及相關(guān)的環(huán)境條件。某些信號類型可能僅在某些情況下產(chǎn)生,從而引發(fā)特定的行為反應;一個典型的例子是黑長尾猴(Chlorocebus pygerythrus當它發(fā)現(xiàn)捕食者時會發(fā)出警報,導致群體成員尋求庇護。建立這種相關(guān)性使得能夠制定關(guān)于信號功能的假設,然后可以通過實驗來測試這些假設(例如,通過受控回放)。 機器學習正在幫助繪制和理解使用工具的夏威夷烏鴉( Corvus hawaiiensis )的聲音。 照片:圣地亞哥動物園野生動物聯(lián)盟 在查看器中打開 按照這種方法,數(shù)十年的仔細研究在理解動物交流方面取得了重大進展 ( 3 )。但存在相當大的挑戰(zhàn),例如避免數(shù)據(jù)收集和解釋中的人類中心偏見、處理不斷增加的數(shù)據(jù)量、繪制動物信號行為的全部復雜性以及實現(xiàn)全面的功能解碼。機器學習提供了一些潛在的解決方案。 訂閱科學eTOC 獲取直接發(fā)送給您的《科學》最新目錄!報名 可以使用日益強大的機器學習方法的豐富工具包來研究動物信號,這些方法在建模目標、數(shù)據(jù)要求和對專家注釋的依賴方面各不相同。除其他方法外,這包括監(jiān)督學習(例如,用于確定哪些特征準確預測人類標記的信號類型)以及無監(jiān)督和自監(jiān)督學習(例如,用于發(fā)現(xiàn)個體、群體或群體的信號庫)。 自監(jiān)督深度學習方法(4)很有趣,因為它們既不需要帶注釋的數(shù)據(jù)集,也不需要與通信潛在相關(guān)的預定義特征。它們也是“基礎(chǔ)模型”的基礎(chǔ),能夠跨任務進行出色的概括(5)。例如,經(jīng)過訓練以根據(jù)給定單詞序列預測下一個單詞的大型語言模型隨后可用于執(zhí)行更復雜的任務,例如推斷語言單元的句法類別和之間的關(guān)系,或生成現(xiàn)實文本(5)。 可以集成不同數(shù)據(jù)模態(tài)的方法對于促進功能解碼似乎特別有前途,因為它們可以提供對通信事件的更全面的描述。ML 模型已經(jīng)開發(fā)出來,可以有效地學習將圖像與單詞、單詞與語音以及跨其他模態(tài)組合的內(nèi)容鏈接起來 ( 5 ),并且這種方法可以有效地應用于動物研究系統(tǒng),例如,通過將發(fā)聲與特定行為相關(guān)聯(lián)。機器學習將有效地協(xié)助檢測跨模式關(guān)聯(lián)(和結(jié)構(gòu))這一具有挑戰(zhàn)性的任務,而跨模式關(guān)聯(lián)(和結(jié)構(gòu))反過來又可以為驗證實驗的設計提供信息,以建立因果關(guān)系(見圖)。 由于許多機器學習方法最初是為自然語言處理而開發(fā)的,因此令人興奮的途徑已經(jīng)開始開放,用于探索人類語言和動物通信系統(tǒng)之間備受爭議的潛在相似性 ( 6 )。觀察和實驗工作表明,至少有一些動物,例如南方斑鶇(Turdoides bicolor),表現(xiàn)出人類語言特有的一些順序敏感性和組合性(7)。機器學習方法可以利用大型數(shù)據(jù)集來搜索傳統(tǒng)方法無法發(fā)現(xiàn)的微妙性和復雜性,從而有可能擴展不同類群之間共享的已知通信特征集。 越來越多的研究正在利用機器學習的潛力來研究動物交流,包括大型合作項目,例如地球物種計劃 (ESP);跨尺度溝通與協(xié)調(diào)(CCAS);人類、動物和機器人之間的聲音互動(VIHAR);種間互聯(lián)網(wǎng);CETI 項目(鯨類翻譯計劃)最近為抹香鯨 ( Physeter macrocephalus ) 通信的機器學習輔助工作提供了詳細的路線圖 ( 2 )。盡管應對這一重大研究挑戰(zhàn)的努力正在明顯加強,但該領(lǐng)域至少面臨兩個與數(shù)據(jù)相關(guān)的主要障礙:大多數(shù)方法需要大量數(shù)據(jù)(4),并且單一模態(tài)(例如發(fā)聲)的錄音不足以進行功能解碼;需要額外的背景信息,包括有關(guān)動物行為和環(huán)境的信息。 大量音頻和視頻數(shù)據(jù)保存在社區(qū)檔案館(例如麥考利圖書館或 xeno-canto)中,通過被動記錄陣列積累,或者可以從互聯(lián)網(wǎng)上抓取。挖掘這些數(shù)據(jù)源將為動物交流的豐富性提供令人著迷的一瞥,但就其本身而言,此類工作不太可能在解碼信號功能方面取得突破。這主要是因為通常缺乏有關(guān)發(fā)送者和接收者的身份和狀態(tài)以及特定通信上下文的可靠信息。 某些類群可以獲得高質(zhì)量的數(shù)據(jù)集,從而能夠快速實現(xiàn)核心模型開發(fā)目標。但很明顯,需要社區(qū)動員和適當?shù)馁Y源配置,以確保物種專家充分參與現(xiàn)有記錄的注釋和解釋,并能夠領(lǐng)導有針對性的工作,在實驗室和野外大規(guī)模收集新數(shù)據(jù)。對于野生動物,可以使用一系列方法來收集合適的數(shù)據(jù)集,包括觀察焦點對象、自主攝像頭和錄音機、無人機和機器人以及動物可穿戴設備(生物記錄儀)。一些生物記錄設備可以同時收集同一個人的音頻和身體運動數(shù)據(jù),為多模態(tài) ML 模型提供有價值的輸入。 這次旅行可能是最大的回報。在廣泛的分類單元上訓練機器學習的鏡頭可能會發(fā)現(xiàn)動物交流行為中先前隱藏的復雜性程度令人驚訝。許多似乎只使用少數(shù)基本叫聲類型的物種可能會擁有豐富的發(fā)聲能力,而那些以復雜的交流方式而聞名的物種可能會表現(xiàn)得更加令人印象深刻。最近的一項研究強調(diào)了機器學習的發(fā)現(xiàn)潛力,該研究探討了斑馬雀 ( Taeniopygia guttata ) 發(fā)聲行為的個體和群體差異 ( 8 )。 使用多模式數(shù)據(jù)和實驗來理解動物信號 機器學習 (ML) 方法可用于集成發(fā)送者、接收者和通信環(huán)境的信息,揭示可能為有關(guān)信號功能的假設提供信息的模式,進而為受控實驗的設計提供信息。機器學習輔助的動物交流研究可能會產(chǎn)生重要的好處,例如改善動物保護和福利,但也面臨著挑戰(zhàn);解決道德問題是當務之急。 圖:K. HOLOSKI/科學 在查看器中打開 機器學習能夠在不同的分類群中生成聲音(或其他信號)輸出的系統(tǒng)清單,這將實現(xiàn)前所未有的比較分析,幫助研究人員查明進化驅(qū)動因素、基因組特征、生活史相關(guān)性以及認知和感覺基礎(chǔ)。不同的通信系統(tǒng)。同時,個體受試者的縱向記錄可以揭示溝通技巧是如何產(chǎn)生和成熟的(9)。 但也許最重要的是,這一領(lǐng)域的進步可以促進動物保護和福利。例如,在夏威夷烏鴉(Corvus hawaiiensis)等極度瀕危物種中,與歷史基線數(shù)據(jù)進行比較可以生成有關(guān)種群瓶頸如何改變發(fā)聲能力的詳細記錄,從而可能導致溝通能力下降(10);可以想象,失去的與健康高度相關(guān)的叫聲,例如那些與覓食、求愛或反捕食者行為有關(guān)的叫聲,可能會被重新引入。此外,人們越來越認識到,社會傳播的信息可能會影響種群的生存能力(11 ),虎鯨( Orcinus orca)的覓食專門化就說明了這一點。)(12)。如果聲音方言可以被確立為“文化標記”,那么機器學習方法將能夠自動繪制社會人口結(jié)構(gòu)圖,并識別面臨失去關(guān)鍵知識風險的動物群體。 機器學習還可以用于識別與壓力、不適、疼痛和逃避或積極狀態(tài)(例如興奮和玩耍)相關(guān)的動物信號。這可以為改善牲畜和其他圈養(yǎng)動物的生活條件提供動力,甚至可以通過對野生種群進行分析來衡量人為壓力源的影響。目前,生態(tài)“聲景”分析主要集中在物種檢測上,但應該可以在景觀層面上聆聽動物的福利(13)。這個想法可以通過超越通信來進一步發(fā)展,例如,通過開發(fā)機器學習工具來檢查衛(wèi)星記錄的動物運動軌跡,以發(fā)現(xiàn)疾病、痛苦或人類回避的特征。 盡管有許多潛在的好處,但機器學習輔助的動物交流研究提出了重大的倫理問題,例如在什么情況下可以接受對野生動物進行回放實驗。先進的聊天機器人可能使研究人員能夠在信號功能完全被理解之前與動物進行交流,從而可能造成意想不到的傷害。例如,向野生座頭鯨(Megaptera novaeangliae)廣播發(fā)聲可能會無意中引發(fā)洋盆范圍內(nèi)歌唱行為的變化。這些問題必須正面解決,而不是事后才考慮。迫切需要跨利益相關(guān)者協(xié)商來制定最佳實踐指南和適當?shù)牧⒎蚣埽?4)。 未來還有其他挑戰(zhàn)和機遇。例如,重要的是協(xié)調(diào)現(xiàn)有舉措的研究工作,并加強專家在動物交流、追蹤、保護和福利方面的參與。盡管技術(shù)進步迅速,該領(lǐng)域的進展將繼續(xù)取決于對每個研究物種的生物學的仔細考慮、對交流環(huán)境的詳細了解以及受控行為實驗(3 )。這種專業(yè)知識對于通知和驗證機器學習分析以及加強數(shù)據(jù)解釋和收集工作至關(guān)重要。專業(yè)協(xié)會和網(wǎng)絡可以幫助協(xié)調(diào)包容性社區(qū)驅(qū)動的合作。 應使用數(shù)據(jù)收集和實驗驗證相對簡單的研究系統(tǒng)來開發(fā)工作流程。在圈養(yǎng)環(huán)境中,研究人員可以確保出色的實驗控制以及最高的道德和福利標準;好的模型包括嚙齒動物、蝙蝠和鳥類。這些工作可以通過對某些物種已有的廣泛實地數(shù)據(jù)集的分析來補充。一旦建立了方法,就可以謹慎地將它們應用于研究難以觀察的野生動物這一更具挑戰(zhàn)性的問題。 目前機器學習的發(fā)展速度異常快。除了使用深度學習方法之外,還可以嘗試其他機器學習框架,例如強化學習和元學習(即從其他機器學習模型的輸出中學習)。隨著模型的開發(fā),正式的“基準測試”將是提高分析管道的可靠性和效率的關(guān)鍵(15),盡管必須采取保障措施以防止濫用開放資源,例如試圖干擾、殺戮或武器化動物。 機器學習有可能在我們對動物通信系統(tǒng)的理解方面產(chǎn)生革命性的進步,揭示出難以想象的豐富性和復雜性。但至關(guān)重要的是,未來的進步必須用于造福于所研究的動物。