搜索能力奠定大模型技術(shù)優(yōu)勢 夸克大模型部分能力優(yōu)于GPT-4
AIGC+搜索引擎會有怎樣的化學反應?夸克給出了自己的答案。11月22日,夸克公布了其面向搜索、生產(chǎn)力工具和資產(chǎn)管理助手的大模型技術(shù)布局??淇思夹g(shù)負責人蔣冠軍表示,在研發(fā)大模型的過程中,夸克在搜索業(yè)務和智能技術(shù)上的優(yōu)勢發(fā)揮了核心作用,通過數(shù)十億高質(zhì)量的網(wǎng)頁以及累積的行業(yè)數(shù)據(jù)和知識圖譜,目前夸克大模型的整體能力已經(jīng)超過GPT-3.5,在健康等部分場景中能力優(yōu)于GPT-4。
在新一輪大模型和AIGC技術(shù)創(chuàng)新風潮之下,搜索也迎來了全新機會。清華大學新聞學院教授、博士生導師沈陽認為,搜索與大模型的結(jié)合是天然之配。首先,搜索擁有海量數(shù)據(jù),這是大模型的基礎(chǔ)能力。其次,在安全能力上,搜索平臺經(jīng)歷了長時間的考驗,沉淀了大量的經(jīng)驗。最后,搜索可以更好地了解用戶真實需求,帶來全新的交互體驗。其中,夸克大模型在數(shù)據(jù)規(guī)模和健康領(lǐng)域上展現(xiàn)出的實力,已經(jīng)成為國內(nèi)大模型的佼佼者。

數(shù)據(jù)顯示,夸克千億級參數(shù)大模型登頂C-Eval和CMMLU兩大權(quán)威榜單,夸克百億級參數(shù)大模型同樣在法律、醫(yī)療、問答等領(lǐng)域的性能評測中奪冠。值得注意的是,夸克大模型的四大優(yōu)勢源自于智能技術(shù)實力與搜索業(yè)務基礎(chǔ),第一、最全面的通用知識數(shù)據(jù)和行業(yè)知識數(shù)據(jù),以及知識理解和評估體系;第二、得益于搜索技術(shù)體系的積累,擁有千億級參數(shù)平臺的模型訓練能力;第三、擁有長期智能化產(chǎn)品經(jīng)驗的智能技術(shù)產(chǎn)運團隊。第四、擁有全行業(yè)的知識增強技術(shù)體系及能力。
目前,大模型和搜索仍處在協(xié)同發(fā)展的狀態(tài)。但是隨著大模型發(fā)展,其能力會向搜索中滲透。先是大模型輔助搜索完成部分信息服務,逐步再變成以大模型為核心,用搜索幫大模型進行升級。
未來大模型和AIGC在哪些場景中會有更廣泛的應用?蔣冠軍認為,首先,大模型技術(shù)會在創(chuàng)意領(lǐng)域大顯身手,國內(nèi)外已經(jīng)有很多廣告公司進行了嘗試。其次,偏向文字處理的崗位,大模型可以進一步提升收集資料的效率。再次,搜索場景接入大模型后,內(nèi)容的生成能力、理解能力和交互能力都會呈現(xiàn)出指數(shù)級上升,夸克正在推進搜索的全面革新。最后是健康、教育等垂直領(lǐng)域,夸克會探索提供更好的信息服務體驗。