“百模競逐”,打響垂直領域的科技硬仗
2023年以來,科技圈最熱的詞語就是ChatGPT及其背后的大模型技術。
此前有百度文心一言、阿里云通義千問、華為盤古、科大訊飛星火等,近期李開復入局建立零一萬物、火山引擎推出“火山方舟”。短短數(shù)月,各類企業(yè)研發(fā)和發(fā)布大模型應用已成潮流。國內(nèi)10億級參數(shù)規(guī)模以上大模型已超80個,并且還在快速增加。一場圍繞大模型的商業(yè)戰(zhàn)爭的備戰(zhàn)氛圍已經(jīng)極為濃厚。

在“百模大戰(zhàn)”一觸即發(fā)之際,要素齊備的巨頭公司是否會演變成技術能力的無限內(nèi)卷?垂直賽道的小巨頭能否借助大模型夯實自己的領先地位?在獲得門票的新玩家中,誰有可能是行業(yè)統(tǒng)治地位的有力競爭者?
對于“人有我優(yōu)”的大模型玩家而言,優(yōu)先探索應用層,及早開放測試,誰能積累更為珍貴的交互數(shù)據(jù),將是接下來競爭的破局點。
垂直大模型之困境
通用大模型的角逐,更多是基礎設施制定權(quán)的爭奪,而垂直大模型,則是在特定場景中依托開源大模型或API接口,在細分行業(yè)形成差異化競爭能力,更多聚焦在場景上的應用。
此外,要兼顧垂直性與專業(yè)性要求,數(shù)據(jù)是硬傷,數(shù)據(jù)深度足夠且能形成穩(wěn)定護城河的行業(yè)更少。這些行業(yè)的數(shù)據(jù)是否便于獲得,已經(jīng)獲得的數(shù)據(jù)能否滿足特定行業(yè)日新月異的要求,都很難具體評定?;ヂ?lián)網(wǎng)巨頭擁有大量電商、社交、搜索等網(wǎng)絡數(shù)據(jù),但數(shù)據(jù)類型不夠全面,數(shù)據(jù)質(zhì)量也沒有保障,中文可供訓練的語料還需要做大量的挖掘工作。
同時,垂直大模型所需要的數(shù)據(jù)往往并不局限在本行業(yè),某些業(yè)務也許需要另一個或多個行業(yè)的數(shù)據(jù)整合,其模型的訓練和應用就依賴于企業(yè)的跨業(yè)合作或者互聯(lián)網(wǎng)巨頭的資源整合。
近期許多垂直大模型正在陸續(xù)公開內(nèi)測。例如,實在智能就發(fā)布了TARS大模型,作為自研垂直領域的大語言模型,其中疊加了多項自然語言處理等前沿技術,在落地場景上,實在TARS大模型將作為實在智能IDP文檔審閱產(chǎn)品的下一代核心引擎,提供語言理解和深度學習能力,為用戶提供與文檔直接“對話”的能力,即使用戶可更準確地識別、提取和審閱文檔內(nèi)容,打出一套文檔高效審核處理的“組合拳”,為更多企業(yè)提供更準確、高效的文檔處理能力,大幅提升自動化辦公效率。
總之,對于各行各業(yè)來說,垂直大模型是一種全新的生產(chǎn)力,底層能力的突破不僅可以降本增效,長期來看必然帶來上層應用的躍遷和變革。大模型必須“通用”,只有通用才能走進千家萬戶、賦能百行千業(yè),進而主導人工智能新革命。