加速大模型生態(tài)產(chǎn)教融合,“中國軟件杯”大賽歷史首個(gè)大模型賽題即將發(fā)布
當(dāng)前,大模型作為人工智能領(lǐng)域的熱點(diǎn)技術(shù)之一,正在以前所未有的速度成為 AI 新時(shí)代的新基座。深度學(xué)習(xí)平臺(tái)+大模型,貫通了從硬件適配、模型訓(xùn)練、推理部署,到場景應(yīng)用的 AI 全產(chǎn)業(yè)鏈。其中,大模型能夠關(guān)聯(lián)來自多種模態(tài)的信息、涌現(xiàn)出先進(jìn)的信息表達(dá)能力,在推動(dòng)產(chǎn)業(yè)變革和升級(jí)的同時(shí),也為高校同學(xué)們帶來了全新的開發(fā)范式、場景空間和創(chuàng)新創(chuàng)業(yè)機(jī)會(huì)。

為了提升高校學(xué)子應(yīng)用大模型技術(shù)的能力,加速我國大模型生態(tài)的繁榮,由國家工業(yè)和信息化部、教育部、江蘇省人民政府共同主辦,全國軟件行業(yè)規(guī)格最高、最具影響力的國家級(jí)一類賽事——“中國軟件杯”大學(xué)生軟件設(shè)計(jì)大賽,近期將發(fā)布賽事歷史上的首個(gè)大模型賽題:“基于文心大模型多模態(tài)能力的創(chuàng)意軟件開發(fā)”,歡迎高校師生參與!
?
聚焦大模型能力獲取的三大通道
在賽題任務(wù)上,概括來講,本賽題要求選手基于文心大模型 ERNIE ,利用包括但不限于大模型 API 、套件 ERNIEKit 、 BML/EasyDL 開發(fā)平臺(tái)和場景化平臺(tái)等百度領(lǐng)先的大模型能力,進(jìn)行大模型時(shí)代下的創(chuàng)意軟件開發(fā)。
這些豐富的工具和平臺(tái),從能力類型上,大體可以分為三類:
API 型能力:可以供選手直接調(diào)用;
預(yù)訓(xùn)練模型微調(diào)能力:可以允許選手使用小樣本數(shù)據(jù),在文心各個(gè)模型的預(yù)訓(xùn)練模型基礎(chǔ)上進(jìn)行微調(diào)(Fine-tuning)。選手可以使用AI編程訓(xùn)練平臺(tái)(如 AI Studio、BML 工具上進(jìn)行),也可使用零代碼訓(xùn)練工具(如 EasyDL );
Prompt 能力:選手可以設(shè)計(jì)一系列文本提示及模板,驅(qū)動(dòng)大模型生產(chǎn)不同的下游任務(wù)(“下游任務(wù)”通俗來講就是“應(yīng)用”,即真實(shí)想要解決的任務(wù),如生產(chǎn)圖文、視頻等)

基于 API 、預(yù)訓(xùn)練模型微調(diào)和 Prompt 這三類通道,選手們可以更方便地開發(fā)大模型應(yīng)用。那么,從產(chǎn)品開發(fā)流程角度看,高校學(xué)子要開發(fā)一個(gè)大模型時(shí)代的應(yīng)用,完整流程是怎樣的呢,需要哪些技能?
培養(yǎng)大模型開發(fā)的四層技能
在本屆賽題中,我們要求選手在基于大模型技術(shù)開發(fā)應(yīng)用時(shí),應(yīng)至少關(guān)注四個(gè)方面的工作:
產(chǎn)品創(chuàng)意層面
選手需要設(shè)計(jì)具有創(chuàng)意和競爭力的產(chǎn)品目標(biāo)。在產(chǎn)品概念的醞釀期,選手需要尋找、激活、甚至創(chuàng)造出某個(gè)場景下的特定需求,并轉(zhuǎn)化產(chǎn)品設(shè)計(jì)的功能點(diǎn)、人機(jī)交互流程和服務(wù)藍(lán)圖(Service Blueprint),以視覺化的圖稿呈現(xiàn)和模擬出來,用于指導(dǎo)后續(xù)的開發(fā)。
大模型能力層面
選手可以通過大模型的API、預(yù)訓(xùn)練模型微調(diào)技術(shù)(Fine-tuning)和 Prompt 三大通道,獲取強(qiáng)大的AI能力。
值得一提的是,預(yù)訓(xùn)練模型微調(diào)技術(shù)(Fine-tuning)能夠使選手在對(duì)大模型進(jìn)行微調(diào),或者不進(jìn)行微調(diào)的情況下,就可以完成多個(gè)應(yīng)用場景的任務(wù)——這是由于大模型具有自監(jiān)督學(xué)習(xí)能力,不需要或很少需要人工標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,能夠降低訓(xùn)練成本,從而可以加快不同場景的模型生產(chǎn)速度,降低AI應(yīng)用門檻。而 Prompt 是一種利用預(yù)訓(xùn)練模型知識(shí)的技術(shù),它通過在輸入中添加額外的文本或向量,來指導(dǎo)模型完成特定的任務(wù)。
總的來說,在這一層面,賽事將關(guān)注最有價(jià)值的數(shù)據(jù)和訓(xùn)練部分:
即對(duì)大模型在該場景下發(fā)揮價(jià)值的、用于微調(diào)的獨(dú)特場景數(shù)據(jù),鼓勵(lì)選手自制數(shù)據(jù)集;
有科學(xué)的模型微調(diào)訓(xùn)練過程。
當(dāng)然,模型能力部分也可以使用API進(jìn)行獲得,但鼓勵(lì)大家自行訓(xùn)練。
軟件開發(fā)層面
選手可以基于 AI 模型,面向終端用戶的過程使用需求和結(jié)果呈現(xiàn)需求,構(gòu)建流暢、合理和精彩的交互式軟件系統(tǒng)。針對(duì)不同的用戶使用場景,選手可以開發(fā)不限于移動(dòng)端應(yīng)用、桌面版軟件、可多端適配的網(wǎng)站、 VR/AR 等應(yīng)用,這個(gè)過程,將重點(diǎn)考驗(yàn)選手的硬件適配和推理部署能力,為產(chǎn)品上線做最后沖刺。
運(yùn)營模式/商業(yè)模式層面
選手需要思考自己的軟件產(chǎn)品如何進(jìn)行市場化運(yùn)營,來保障有可觀的用戶注冊(cè)量、使用率和滿意度,并實(shí)現(xiàn)業(yè)務(wù)的商業(yè)成功。這樣的思考也可反作用于產(chǎn)品設(shè)計(jì)、模型構(gòu)建及開發(fā)工作本身。
最終,本賽事將在區(qū)域賽和總決賽階段,對(duì)選手的產(chǎn)品創(chuàng)意層、模型能力層、軟件開發(fā)層和運(yùn)營模式層的實(shí)現(xiàn)過程、典型創(chuàng)新點(diǎn)和每個(gè)階段的成果,進(jìn)行評(píng)價(jià)。賽事即將發(fā)布,更多資料和培訓(xùn),可移步飛槳官方公眾號(hào)獲取。
加速大模型生態(tài)產(chǎn)教融合,“中國軟件杯”大賽歷史首個(gè)大模型賽題即將發(fā)布的評(píng)論 (共 條)
