ChatGPT之后,垂直大模型興起
由ChatGPT掀起的這一波大模型浪潮中,?百度、阿里等大廠相繼下場(chǎng),王慧文、王小川、李開(kāi)復(fù)等大佬也紛紛入場(chǎng)。年初,比爾蓋茨高呼“人工智能時(shí)代已經(jīng)開(kāi)始”,給大模型定下了宏偉的基調(diào)。隨著競(jìng)爭(zhēng)的展開(kāi),大模型已不是“是否”問(wèn)題,而是“如何”問(wèn)題。
大巨頭公司也好,小巨人企業(yè)也罷,都需要這樣的動(dòng)作展現(xiàn)自身對(duì)前沿科技的敏感度與長(zhǎng)期以來(lái)的積累。目前,大模型的玩家主要分為三類:一是在資源與場(chǎng)景上具備身位優(yōu)勢(shì)的互聯(lián)網(wǎng)(百度、阿里、騰訊等)和產(chǎn)業(yè)巨頭(中國(guó)電信與中國(guó)聯(lián)通等),二是專研AI的人工智能公司(實(shí)在智能、商湯、云從、光年之外等),最后一類則是以上海人工智能實(shí)驗(yàn)室、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)等為代表的科研院所單位。
而專研AI的人工智能公司,目前大都已經(jīng)研發(fā)了自己的垂直大模型。垂直領(lǐng)域大模型是指在特定的領(lǐng)域或行業(yè)中經(jīng)過(guò)訓(xùn)練和優(yōu)化的大型語(yǔ)言模型。與通用語(yǔ)言模型相比,垂直領(lǐng)域大模型更專注于某個(gè)特定領(lǐng)域的知識(shí)和技能,具備更高的領(lǐng)域?qū)I(yè)性和實(shí)用性。
相對(duì)于GPT這類通用大模型,垂直領(lǐng)域大模型具有以下優(yōu)勢(shì):
領(lǐng)域?qū)I(yè)性:垂直領(lǐng)域大模型經(jīng)過(guò)專門的訓(xùn)練,能夠更好地理解和處理特定領(lǐng)域的知識(shí)、術(shù)語(yǔ)和上下文。
高質(zhì)量輸出:由于在特定領(lǐng)域中進(jìn)行了優(yōu)化,垂直領(lǐng)域大模型在該領(lǐng)域的輸出質(zhì)量通常比通用大模型更高。
特定任務(wù)效果更好:對(duì)于特定領(lǐng)域的任務(wù),垂直領(lǐng)域大模型通常比通用大模型表現(xiàn)更好。
例如實(shí)在智能近期發(fā)布的TARS大模型,作為一家致力于將AI與RPA等自動(dòng)化技術(shù)融合創(chuàng)新,打造各類數(shù)字員工的企業(yè),實(shí)在智能基于開(kāi)源基座模型,在千億級(jí)高質(zhì)量Tokens上進(jìn)行了充分訓(xùn)練,完整復(fù)現(xiàn)了Pretrain、SFT和RLHF三個(gè)階段,語(yǔ)言理解能力及指令跟隨能力等在橫向?qū)Ρ葴y(cè)試中均取得良好效果。

對(duì)于垂直大模型而言,核心和關(guān)鍵離不開(kāi)算力、算法和數(shù)據(jù)。在一定程度上,錢可以解決算力和算法,但卻很難買到數(shù)據(jù),尤其是在垂直領(lǐng)域,很多都是私有數(shù)據(jù),能買到的數(shù)據(jù)意義并不大。這對(duì)一直深耕在垂直行業(yè)的公司而言,是天然的優(yōu)勢(shì)。
實(shí)在TARS大模型可以通過(guò)快速學(xué)習(xí)垂直行業(yè)的大量數(shù)據(jù),可具備思維鏈、情景學(xué)習(xí)等能力,生成具有語(yǔ)法和意義的自然語(yǔ)言,可與人類進(jìn)行對(duì)話并執(zhí)行指令。
不遠(yuǎn)的將來(lái)會(huì)有更多垂直領(lǐng)域的大模型面世,百模大戰(zhàn)已經(jīng)拉開(kāi)序幕,AI滲透到千行百業(yè)只是時(shí)間問(wèn)題,我們一起見(jiàn)證機(jī)器崛起吧。