浙江大學(xué)聯(lián)合摸象科技發(fā)布金融零售的語(yǔ)言大模型—智海-金磐大模型
(一)
2023年8月21日,在由中國(guó)工程院院刊《Engineering》、中國(guó)人工智能學(xué)會(huì)和中國(guó)工程院信息學(xué)部分刊《Frontiers of Information Technology & Electronic Engineering》聯(lián)合主辦的Engineering大講堂暨“智行中國(guó)”第五期系列論壇上,浙大發(fā)布了系列 AI+X:各行業(yè)垂直領(lǐng)域基座模型,其中,垂直于零售金融的【智海-金磐】語(yǔ)言大模型尤其引起了業(yè)內(nèi)關(guān)注。

2023年6月麥肯錫發(fā)布的《生成式人工智能的經(jīng)濟(jì)潛力》研究報(bào)告指出:銀行業(yè)、高科技和生命科學(xué)等行業(yè)可能會(huì)受到來(lái)自生成式AI的影響最大。銀行業(yè)是一個(gè)知識(shí)和技術(shù)驅(qū)動(dòng)的行業(yè),該技術(shù)可以帶來(lái)的價(jià)值相當(dāng)于每年額外增加 2000 億至3400 億美元。
中國(guó)銀行業(yè)的AIGC需要立足于國(guó)產(chǎn)自研的金融垂直大模型。近日,摸象科技和浙大人工智能研究所聯(lián)合研發(fā)中國(guó)首個(gè)垂直金融零售的語(yǔ)言大模型-【智海-金磐】大模型,目前模型基座7B,即將擴(kuò)展到13B,在超過(guò)60個(gè)使用描述模板的數(shù)據(jù)集上進(jìn)行微調(diào),訓(xùn)練數(shù)據(jù)來(lái)源于金融語(yǔ)料、金融行業(yè)公開(kāi)信息及銀行提供的專(zhuān)業(yè)金融知識(shí)庫(kù),訓(xùn)練用的高質(zhì)量數(shù)據(jù)集涵蓋了金融知識(shí)圖譜、金融文本、金融對(duì)話(huà)等多種數(shù)據(jù)源,數(shù)據(jù)集為百億級(jí)。金磐大模型是一個(gè)集場(chǎng)景識(shí)別、語(yǔ)義理解及智能對(duì)話(huà)的深度語(yǔ)言大模型系統(tǒng),能夠?qū)崿F(xiàn)對(duì)金融場(chǎng)景的精準(zhǔn)理解和響應(yīng),為金融機(jī)構(gòu)提供高效、智能、可信賴(lài)的語(yǔ)言服務(wù),包括金融知識(shí)問(wèn)答、金融文本生成、金融對(duì)話(huà)機(jī)器人等多種應(yīng)用場(chǎng)景。
【智海-金磐】寓意堅(jiān)固的金融智能,并同時(shí)具有無(wú)限的可能性和創(chuàng)造力。展示了這個(gè)語(yǔ)言大模型的特點(diǎn)和優(yōu)勢(shì),即能夠充分適應(yīng)金融行業(yè)的安全需求,提供堅(jiān)實(shí)穩(wěn)固的AI能力。
【智海-金磐】大模型是是摸象科技和浙江大學(xué)在金融智能領(lǐng)域的重要成果,基于浙大在自然語(yǔ)言處理、知識(shí)圖譜、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)等領(lǐng)域的前沿研究,結(jié)合金融零售業(yè)務(wù)的實(shí)際需求,構(gòu)建了這個(gè)面向金融零售的垂直大模型,其具有以下特點(diǎn):
1) 支持金融行業(yè)客戶(hù)私有化部署,滿(mǎn)足數(shù)據(jù)安全合規(guī)要求。
2)具有大模型的基礎(chǔ)能力和較強(qiáng)的金融領(lǐng)域泛化能力,同時(shí)模型體積小,參數(shù)量適中,單個(gè)金融企業(yè)有限算力可以承載。
3)模型具有靈活遷移的能力,垂直訓(xùn)練后能夠方便地嵌入生產(chǎn)場(chǎng)景賦能應(yīng)用并提升效率。
4)能夠支撐上層應(yīng)用對(duì)模型進(jìn)行精調(diào),并以MaaS的模式為客戶(hù)提供解決方案。
【智海-金磐】大模型主要應(yīng)用的銀行零售場(chǎng)景包括:
1)在線(xiàn)咨詢(xún)場(chǎng)景。語(yǔ)言大模型可以作為銀行的在線(xiàn)客服,通過(guò)網(wǎng)站、APP、微信等渠道,與客戶(hù)進(jìn)行實(shí)時(shí)的對(duì)話(huà),回答客戶(hù)的各類(lèi)金融問(wèn)題,如賬戶(hù)管理、產(chǎn)品介紹、業(yè)務(wù)辦理等,提高客戶(hù)的滿(mǎn)意度和忠誠(chéng)度。
2)智能推薦場(chǎng)景。語(yǔ)言大模型可以根據(jù)客戶(hù)的特征、偏好、需求、風(fēng)險(xiǎn)承受能力等數(shù)據(jù),為客戶(hù)提供個(gè)性化的金融產(chǎn)品推薦,如存款、貸款、基金、保險(xiǎn)等,提高客戶(hù)的轉(zhuǎn)化率和留存率。
3)投資顧問(wèn)場(chǎng)景。語(yǔ)言大模型可以根據(jù)客戶(hù)的投資目標(biāo)、資產(chǎn)配置、收益預(yù)期等數(shù)據(jù),為客戶(hù)提供專(zhuān)業(yè)的投資組合建議,如股票、債券、期貨、期權(quán)等,提高客戶(hù)的收益率和風(fēng)險(xiǎn)控制能力。
在中國(guó),金融領(lǐng)域有強(qiáng)數(shù)據(jù)安全和合規(guī)應(yīng)用要求,因此不能通過(guò)互聯(lián)網(wǎng)API等公有云方式調(diào)用大模型,大模型面臨私有化部署到金融企業(yè)體內(nèi)的問(wèn)題,因此金融行業(yè)需要建立研發(fā)垂直金融的中型模型,百億級(jí)參數(shù),用于高頻的金融核心業(yè)務(wù),尤其是零售場(chǎng)景。【智海-金磐】大模型作為中國(guó)第一個(gè)垂直金融零售領(lǐng)域研發(fā)的大模型,將利用大數(shù)據(jù)和人工智能技術(shù),為金融零售領(lǐng)域提供智能化、個(gè)性化、高效化的解決方案,提升金融服務(wù)的質(zhì)量和覆蓋度,降低金融風(fēng)險(xiǎn)和成本,促進(jìn)金融普惠和創(chuàng)新。
(二)
摸象科技是一家浙大系A(chǔ)I科技公司,創(chuàng)始人高鵬博士師從潘云鶴院士,是中國(guó)唯一專(zhuān)注于銀行場(chǎng)景做垂直金融大語(yǔ)言模型(LLM)和大規(guī)模預(yù)訓(xùn)練AI員工的科技公司。自主研發(fā)大規(guī)模預(yù)訓(xùn)練的金融零售大模型-金磐大模型,為中國(guó)的2000+銀行提供高智能的AI員工,目前相當(dāng)于入行1-3年客戶(hù)經(jīng)理的智能水平,可應(yīng)用于銀行的智能外呼、網(wǎng)點(diǎn)直營(yíng)、遠(yuǎn)程銀行、員工咨詢(xún)、培訓(xùn)和輔助、APP數(shù)字人等場(chǎng)景,嵌入在工作流程中,以對(duì)話(huà)的形式協(xié)助銀行完成營(yíng)銷(xiāo)和推薦服務(wù)。
截止到2022年底,公司已與中國(guó)建設(shè)銀行、工商銀行、中國(guó)銀行、郵儲(chǔ)銀行、郵政金融、浦發(fā)銀行、光大銀行、興業(yè)銀行、華夏銀行、渤海銀行等客戶(hù)合作,目前已有8000名AI員工,每年提供4億次以上AI智能對(duì)話(huà)服務(wù),幫助銀行智能化降本增效。
自2018年以來(lái),摸象科技持續(xù)投入基于谷歌Bert模型的AI員工研發(fā),進(jìn)行預(yù)訓(xùn)練金融業(yè)務(wù)的理解和決策,但AI員工反饋的答案仍基于標(biāo)準(zhǔn)知識(shí)圖譜。自2022年底以來(lái),摸象科技聯(lián)合浙大人工智能所共同投入研究金融領(lǐng)域大語(yǔ)言模型,涵蓋從海量數(shù)據(jù)清洗處理、預(yù)訓(xùn)練、監(jiān)督微調(diào)、獎(jiǎng)勵(lì)模型反饋到金融領(lǐng)域應(yīng)用落地的全鏈路技術(shù)體系,運(yùn)用模型量化、模型剪枝、模型蒸餾等方法進(jìn)行模型壓縮,提升模型計(jì)算效率,使其具有大模型的基礎(chǔ)能力和較強(qiáng)的金融領(lǐng)域智能水平,滿(mǎn)足單個(gè)金融企業(yè)有限算力要求。突破分布式異構(gòu)算力集群資源調(diào)度技術(shù),實(shí)現(xiàn)跨集群、跨平臺(tái)、跨場(chǎng)景的資源調(diào)度,提升集群計(jì)算效率;研發(fā)模型高效推理框架,實(shí)現(xiàn)多種終端的高效推理計(jì)算。

在應(yīng)用場(chǎng)景上,金融零售其實(shí)是天然的AIGC場(chǎng)景,未來(lái)大模型的競(jìng)爭(zhēng)就是AIGC場(chǎng)景入口的競(jìng)爭(zhēng)。對(duì)于銀行客戶(hù)經(jīng)理來(lái)說(shuō),核心的工作就是銷(xiāo)售和轉(zhuǎn)化客戶(hù)。下一代AI將會(huì)被集成到現(xiàn)有工作流中,幫助客戶(hù)經(jīng)理更加高效的處理客戶(hù)觸達(dá)、聯(lián)系、銷(xiāo)售的整個(gè)業(yè)務(wù)閉環(huán)。生成式AI和配置式NLP的區(qū)別以生成式AI為基礎(chǔ)的對(duì)話(huà)機(jī)器人,和傳統(tǒng)配置式NLP機(jī)器人是不同的,生成式AI基于金融大規(guī)模數(shù)據(jù)集的學(xué)習(xí)后,主要區(qū)別在于經(jīng)過(guò)了大規(guī)模訓(xùn)練后AI具有策略智能,可根據(jù)不同語(yǔ)境和意圖結(jié)合輸出應(yīng)對(duì)策略,生成對(duì)話(huà)結(jié)果,因此機(jī)器人有“隨機(jī)應(yīng)變”的智慧,可用于營(yíng)銷(xiāo)場(chǎng)景,大大提高銀行線(xiàn)上互動(dòng)營(yíng)銷(xiāo)的效率。

目前摸象科技已經(jīng)擁有包括AI助手、AI員工、AI數(shù)字人等多個(gè)成熟產(chǎn)品,可快速實(shí)現(xiàn)大模型落地后的產(chǎn)品化、工程化,全面應(yīng)用在中國(guó)的各銀行零售場(chǎng)景,據(jù)測(cè)算,每100個(gè)AI員工與客戶(hù)經(jīng)理協(xié)同經(jīng)營(yíng)長(zhǎng)尾客戶(hù)后,可為銀行帶來(lái)近20億元的資產(chǎn)提升。有了國(guó)產(chǎn)自主可控大模型之后,大模型賦能的高智能AI員工廣泛參與銀行運(yùn)營(yíng)整個(gè)流程,可極大的緩解銀行“管戶(hù)人力不足、長(zhǎng)尾客戶(hù)缺乏經(jīng)營(yíng)”的困境,幫助銀行降本增效,進(jìn)入AI+人工的零售經(jīng)營(yíng)新范式。
(三)
浙江大學(xué)上海高等研究院常務(wù)副院長(zhǎng)、浙江大學(xué)人工智能研究所所長(zhǎng)吳飛教授介紹說(shuō),浙大立足于“AI+X垂直領(lǐng)域大模型”的大模型技術(shù)前沿,基于浙大團(tuán)隊(duì)在垂直領(lǐng)域大模型的研究現(xiàn)狀及基座能力,基于先期落地的業(yè)界首個(gè)端到端、通用型、規(guī)?;a(chǎn)業(yè)應(yīng)用的端云協(xié)同模型訓(xùn)練系統(tǒng),推出了【智?!肯盗械拇怪贝竽P?。除了與摸象科技合作推出【智海-金磐】金融垂直大模型賦能銀行之外,浙大還與阿里巴巴達(dá)摩院合作,在阿里巴巴司法領(lǐng)域垂直大模型LegalMind基礎(chǔ)上,與浙江大學(xué)上海高等研究院、浙江大學(xué)計(jì)算機(jī)學(xué)院和法學(xué)院與阿里巴巴達(dá)摩院正在打造更輕量級(jí)司法垂直領(lǐng)域大模型【智海-錄問(wèn)】;與高等教育出版社、華院計(jì)算等合作,在新一代人工智能系列教材基礎(chǔ)上,以教科書(shū)級(jí)高質(zhì)量語(yǔ)料正在打造【智海-三樂(lè)】人工智能領(lǐng)域教育大模型,以“教材建設(shè)、課程共享和平臺(tái)增效”三位一體形成數(shù)字化和智能化的教學(xué)基座能力,賦能101計(jì)劃核心課程《人工智能引論》的教學(xué)育人。