對(duì)話網(wǎng)易有道CEO周楓:“子曰”大模型與教育個(gè)性化革命


“一個(gè)好的技術(shù)有沒有價(jià)值、能不能發(fā)揮巨大的作用,很多時(shí)候關(guān)鍵在場(chǎng)景和應(yīng)用的選擇以及細(xì)節(jié)的打磨。通過軟件、硬件、AI技術(shù)的結(jié)合,做出精品是我們現(xiàn)在做的事”。7月26日,教育科技公司網(wǎng)易有道(NYSE: DAO)舉辦了“powered by 子曰”教育大模型應(yīng)用成果發(fā)布會(huì)。發(fā)布會(huì)現(xiàn)場(chǎng),網(wǎng)易有道CEO周楓如此表示。
會(huì)上網(wǎng)易有道推出國內(nèi)首個(gè)教育領(lǐng)域垂直大模型——“子曰”,并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應(yīng)用,即“LLM翻譯”“虛擬人口語教練”“AI作文指導(dǎo)”“語法精講”“AI Box”以及“文檔問答”。
一系列大模型全家桶的發(fā)布,瞬時(shí)引發(fā)行業(yè)熱議。
大模型熱潮進(jìn)入“千模大戰(zhàn)”,各家從概念落地,到場(chǎng)景應(yīng)用,競(jìng)爭(zhēng)一度陷入白熱化,而在教育領(lǐng)域,并未有過大聲量,此次網(wǎng)易有道可謂打響了教育大模型第一槍。“子曰大模型在教育行業(yè)的應(yīng)用,不僅可以幫助學(xué)生更好地學(xué)習(xí),也可以幫助老師更好地教學(xué),借此實(shí)現(xiàn)因材施教的教育理想?!卑l(fā)布會(huì)現(xiàn)場(chǎng),周楓多次強(qiáng)調(diào)“場(chǎng)景拉動(dòng)”的重要性。
不同于通用大模型,“子曰”大模型的定位是“場(chǎng)景為先”的教育垂類大模型。在AI助力各行各業(yè)變革的當(dāng)下,“子曰”大模型給教育行業(yè)帶來的機(jī)會(huì)在哪里?周楓給出的答案是“助力因材施教”。
發(fā)布會(huì)現(xiàn)場(chǎng),較為矚目的便是——虛擬人口語教練Hi Echo的面世,有道詞典業(yè)務(wù)負(fù)責(zé)人與 Echo 進(jìn)行了多組隨機(jī)對(duì)話,在對(duì)話過程中,Echo能夠像真人老師一樣進(jìn)行實(shí)時(shí)反饋。對(duì)話結(jié)束后,Echo會(huì)從發(fā)音、語法等維度給予建議和潤色。

▲圖:虛擬人口語教練Hi Echo
此外,有道在發(fā)布會(huì)上推出的“AI作文指導(dǎo)”應(yīng)用不僅具備“作文批改”功能,針對(duì)學(xué)生在寫作前中后過程中面臨的題目主旨難確定、寫作素材匱乏等難題,AI作文指導(dǎo)還會(huì)從表達(dá)、結(jié)構(gòu)、內(nèi)容深度、情感豐富度四大維度全面提供改進(jìn)建議。
個(gè)性化教育備受推崇之下,子曰大模型能夠?yàn)閷W(xué)生提供個(gè)性化的分析和指導(dǎo);同時(shí),大模型能夠?qū)崿F(xiàn)引導(dǎo)式學(xué)習(xí),提出問題并引導(dǎo)學(xué)生自行探索答案;當(dāng)然,更重要的是,大模型具備全科知識(shí)整合能力。通過連接多模態(tài)知識(shí)庫、跨學(xué)科整合知識(shí)內(nèi)容,隨時(shí)滿足學(xué)生的動(dòng)態(tài)需求,幫助孩子培養(yǎng)更綜合的能力。
作為國內(nèi)和業(yè)界知名的教育科技公司,可以說,網(wǎng)易有道從未停止過技術(shù)和產(chǎn)品深度融合的探索。
早在2008年,有道就推出自主研發(fā)的國內(nèi)首家統(tǒng)計(jì)機(jī)器翻譯線上引擎。2016年起,有道協(xié)同構(gòu)建AI基礎(chǔ)能力,同步組建語言、視覺、聲音等團(tuán)隊(duì),目前積累了有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、計(jì)算機(jī)視覺、智能語音AI技術(shù)、高性能計(jì)算(HPC)四大底層技術(shù)能力。2017年,有道就與主流技術(shù)Transformer“雙向奔赴”,將AI能力統(tǒng)一在大模型之下,并尤其重視在端側(cè)的落地應(yīng)用。2022年,有道詞典筆P5中搭載了自研的離線ASR,也已升級(jí)為Transformer技術(shù)。
AI大模型風(fēng)起之后,如何以實(shí)際的教育場(chǎng)景驅(qū)動(dòng),用技術(shù)創(chuàng)新助力教育創(chuàng)新,成為團(tuán)隊(duì)上下共同攻克的核心目標(biāo),為此團(tuán)隊(duì)將目標(biāo)拆解為不同模塊:向所有下游場(chǎng)景提供語義理解、知識(shí)表達(dá)等基礎(chǔ)能力;為不同學(xué)習(xí)場(chǎng)景設(shè)計(jì)定制化的模型,力爭(zhēng)實(shí)現(xiàn)模型與場(chǎng)景的高度契合等命題。
此次子曰大模型的發(fā)布,可以說是AI+教育的進(jìn)一步落地實(shí)踐,為什么是網(wǎng)易有道?子曰大模型能否引領(lǐng)教育個(gè)性化革命?
發(fā)布會(huì)后,零態(tài)LT(ID:LingTai_LT)等,也共同對(duì)話了網(wǎng)易有道CEO周楓,關(guān)于子曰大模型的探索歷程,成本問題以及商業(yè)化預(yù)期,與其進(jìn)行了深度交流。
以下為對(duì)話實(shí)錄(有刪節(jié))

問題:子曰大模型的六個(gè)場(chǎng)景讓人震撼,而且大模型是團(tuán)隊(duì)自研,不久前Meta發(fā)布了新的開源以及免費(fèi)大模型,直接接入開源成本或許會(huì)更低,這個(gè)層面,網(wǎng)易有道的思考是什么?
周楓:關(guān)于Meta開源的問題,這也是內(nèi)部非常非常關(guān)心的問題,我們是非常擁抱開源的,有道以前也有很多開源產(chǎn)品,我們自己也開源不少自己的項(xiàng)目,包括AI方面的。
但今天的發(fā)布會(huì)側(cè)重的是應(yīng)用,AI發(fā)力的重點(diǎn)是產(chǎn)品落地,這也是為什么子曰大模型進(jìn)行自研的原因。當(dāng)下一些開源的模型暫時(shí)不能滿足我們對(duì)落地的需求。比如像語法、答疑這些,這些都搞不定的,因?yàn)闆]有這些數(shù)據(jù)(可供直接訓(xùn)練)。
當(dāng)然,自研過程中,除了最基礎(chǔ)技術(shù)的技術(shù)層面,最后要落地的是完整產(chǎn)品,并且用戶在使用時(shí),非常絲滑的產(chǎn)品,如果哪一天開源項(xiàng)目很成熟,我們也一定會(huì)用。
問題:未來有道智能硬件接入子曰大模型后,會(huì)帶來哪些升級(jí)和變革呢?
周楓:有道在策略上的關(guān)鍵詞是“場(chǎng)景拉動(dòng)”——大模型在多個(gè)場(chǎng)景中的應(yīng)用成果,覆蓋口語訓(xùn)練、作文批改、習(xí)題答疑等六大教育的細(xì)分領(lǐng)域。
在AI虛擬人的驅(qū)動(dòng)方面,有道基于自主研發(fā)的情感識(shí)別算法和實(shí)時(shí)渲染驅(qū)動(dòng)引擎,對(duì)播放的語音數(shù)據(jù)進(jìn)行深度分析,實(shí)時(shí)驅(qū)動(dòng)虛擬人的面部表情和語音同步的口型變化,使虛擬人能夠貼近真人,以更加自然和生動(dòng)的方式與用戶一對(duì)一交互,從而顯著提升對(duì)話的真實(shí)感和用戶體驗(yàn)。
例如,虛擬人口語教練在語音識(shí)別能力方面進(jìn)行了巨大的革新,它支持多語種的流式低延遲語音識(shí)別技術(shù),讓Echo在中式英語、英語、中英混合等場(chǎng)景下游刃有余;聲學(xué)降噪、回聲消除、自動(dòng)語音檢測(cè)、自動(dòng)斷句等技術(shù),則讓它像一個(gè)真正的傾聽者和交流者,不僅能判斷用戶說話的起始,還能讓用戶隨時(shí)打斷,智能觸發(fā)后續(xù)流程。
問題:“子曰”大模型的成本構(gòu)成是什么?產(chǎn)品化以后會(huì)不會(huì)影響利潤率,甚至是虧損?在線教育前期技術(shù)成本很高,但是后期隨著用戶規(guī)模擴(kuò)大,成本會(huì)顯著下降,大模型不斷的訓(xùn)練之后,會(huì)不會(huì)改變這個(gè)成本模型?
周楓:做公司永遠(yuǎn)是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會(huì)管理好成本。
像剛才講的,很多時(shí)候這是相對(duì)的過程,你如果能做到行業(yè)內(nèi)對(duì)資金利用率,對(duì)人員利用率比較高的話,成本其實(shí)是可以的。大模型研發(fā),總體上不需要增加什么額外的特別大的投入,因?yàn)橛械肋^往的AI團(tuán)隊(duì)也不小,可以直接復(fù)用。
跟剛才開源的問題相關(guān),我覺得這個(gè)世界上大部分的大模型都是免費(fèi)的。所以很適合開放。大模型的邊際成本其實(shí)非常低,復(fù)制模型其實(shí)不需要成本,推理時(shí)才需要成本,無論對(duì)于一個(gè)公司也好,個(gè)人也好,情況都是如此。

但大模型技術(shù)非常特別,很多技術(shù)拿到代碼還是不會(huì)用。即便你會(huì)用,你也不會(huì)改進(jìn),因?yàn)槟阕x不懂這個(gè)代碼,回到剛才的問題,我們目前也需要資金來進(jìn)行自研,確實(shí)現(xiàn)有的市面上的大模型,不滿足我們對(duì)產(chǎn)品的要求,長(zhǎng)期來看,我們技術(shù)本身深耕了好多年,有很多現(xiàn)成的東西可以復(fù)用。
模型雖然越變?cè)酱蟮情_放性會(huì)增強(qiáng),對(duì)于想做AI應(yīng)用的創(chuàng)業(yè)者或者公司來說,現(xiàn)在是非常好的時(shí)候,未來成本問題也會(huì)隨著規(guī)模,會(huì)有所改變。但是大模型具體成本,我們財(cái)務(wù)可能比我更清楚。
問題:作為一個(gè)教育大模型,在具體落地過程中,怎么防范學(xué)生的“抄作業(yè)”心態(tài)?
周楓:它是有家長(zhǎng)管控功能,所以不用擔(dān)心這個(gè)問題。
問題:剛剛我們看了演示,有教數(shù)學(xué)題也有教寫作文,比如同樣一道數(shù)學(xué)題三年級(jí)的解法跟初中解法完全不同,大模型怎么判斷我對(duì)面的人是三歲還是六歲?是不是一個(gè)人會(huì)有自己的專屬大模型?
周楓:不用把大模型神秘化。
很簡(jiǎn)單的邏輯,現(xiàn)在的大模型跟以前的AI不一樣的地方是,確實(shí)有語言推理能力。如果是文字型的應(yīng)用,不需要特別強(qiáng)的推理,是挺好用的。但是數(shù)學(xué)本身就難,數(shù)學(xué)光喂內(nèi)容沒用,再多也沒用,因?yàn)樗窃韱栴},現(xiàn)有的技術(shù)不是說套一下就能使用。大模型想的比較淺。這也是當(dāng)下大模型的局限性。
問題:“子曰”大模型的團(tuán)隊(duì)配置是怎樣的?
周楓:百人級(jí),肯定不會(huì)考慮千人級(jí)。
問題:現(xiàn)在這個(gè)大模型是會(huì)員制?
周楓:目前可能有這個(gè)想法,但是我希望越便宜越好,像電子書的邏輯,希望讓好技術(shù)讓更多人使用,這樣才能倒過來推動(dòng)技術(shù)發(fā)展。
作者|胡展嘉
運(yùn)營|陳佳慧
出品|零態(tài)LT(ID:LingTai_LT)