數(shù)據(jù)標簽標注企業(yè)AIMMO完成A輪1200萬美元融資,變革人工標注方式

“大多數(shù)人工智能模型依賴監(jiān)督學習對已標注數(shù)據(jù)分類,來預測未標注數(shù)據(jù),無論是圖像、視頻、文本還是聲音,大部分還是依賴于人工標注。”
作者:康佑醍
編輯:tuya
出品:財經涂鴉
近日,韓國數(shù)據(jù)標簽初創(chuàng)企業(yè)AIMMO宣布已在 A 輪融資中籌集了 1200 萬美元,參與投資的機構包括DS Asset Management、韓國興業(yè)銀行、韓華投資證券、S&S Investment、Toss Investment、Korea Asset Investment & Securities和 Venture Field。
數(shù)據(jù)是訓練機器學習模型的基礎,一個普遍的觀念認為,提供的數(shù)據(jù)越多,模型性能就越好。為了獲得數(shù)據(jù)來訓練模型,企業(yè)可以選擇公開數(shù)據(jù)集、購買數(shù)據(jù)、或是自己生成數(shù)據(jù)等方式,沒有數(shù)據(jù),就沒有AI/ML(Artificial Intelligence人工智能/Machine Learning機器學習)。然而,低質量或錯誤標記的數(shù)據(jù)比沒有數(shù)據(jù)更加糟糕,一個很明顯的例子就是自動駕駛,消費者不會信任低質量數(shù)據(jù)訓練出的自動駕駛模型,因此自動駕駛企業(yè)往往也是數(shù)據(jù)標簽企業(yè)最大的合作方。
數(shù)據(jù)標簽則處于AI/ML行業(yè)的漏斗頂端,其標記的數(shù)據(jù)質量對于AI公司后續(xù)的應用至關重要。據(jù)Grand View Research市場分析報告,2021年全球數(shù)據(jù)收集和標簽市場規(guī)模為16億美元,預計2028年將達到82億美元。通常,數(shù)據(jù)標注包括數(shù)據(jù)標注,注釋,審核,分類,轉錄和處理,而這些流程目前大部分通過人工來完成。
而AIMMO則構建了自動數(shù)據(jù)標注工具平臺,希望減輕數(shù)據(jù)預處理這一步驟所需的人力,讓科技公司能夠更聚焦于AI模型本身,其中智慧城市和自動駕駛是AIMMO最著重的領域。AIMMO在官網中給出了22個數(shù)據(jù)集用例,主要應用包括物體檢測、語義分割、區(qū)域分割、對象跟蹤、關鍵點聚焦、文字識別等。

來源:AIMMO官網
這一領域面臨著激烈的競爭,存在著Amazon Mechanical Turk、Hive、Appen、Upwork、Unity、Lionbridge、Labelbox、AI.Reverie和Scale等企業(yè),F(xiàn)acebook、微軟、谷歌等巨頭公司也在嘗試拓展這一領域,F(xiàn)acebook 的計算機視覺系統(tǒng) DINO,可以在沒有任何訓練數(shù)據(jù)的情況下分割圖像,Goole reCAPTCHA 則通過驗證碼獲取數(shù)據(jù)標注。
巨頭公司紛紛入場或許預示了一種前景——數(shù)據(jù)標簽成為AI領域的基礎設施入口。數(shù)據(jù)的注釋、管理、自動化、評估、收集和生成有助于為所有公司提供搭建人工智能模型的基礎,就像AWS搭建的云基礎設施,數(shù)據(jù)的全流程管理或許也將成為AI領域的基礎架構,而數(shù)據(jù)標簽公司在這一競爭中處于優(yōu)勢地位。
AIMMO已經與現(xiàn)代汽車、SK Telecom、Naver、Kakao等知名企業(yè)達成合作,2021年,其自動駕駛領域收入達到1000萬美元,同比增長200%。預計隨著全球自動駕駛領域需求增大,2022年AIMMO會繼續(xù)保持高速增長。