AI從田間到天空 螞蟻越過山丘扎根科技

從征服天空的殿堂AI,到走出大山的就業(yè)工具
作者/ IT時報記者 孫妍
編輯/ 孫妍
3年,靴子落地,螞蟻集團完成整改。
螞蟻在調(diào)整中前進,越過山丘卻始終未變的是,科技這一核心基因。這3年以來,每年世界人工智能大會(下簡稱WAIC)都是螞蟻集團AI技術(shù)“大賞”,也見證了螞蟻“根技術(shù)”的進化。其實3年前,在準(zhǔn)備IPO之前,螞蟻集團就已明確自身定位是科技公司,而非金融公司。
在WAIC 2023上,一半的國產(chǎn)大模型都來“秀肌肉”,或?qū)⒊蔀椤鞍倌4髴?zhàn)”的開端。但螞蟻卻另辟蹊徑,當(dāng)AIGC被幻覺頻發(fā)、結(jié)果不可控、隱私安全、歧視偏見等問題困擾時,螞蟻祭出了給AI“祛毒”的一招:AI安全檢測平臺“蟻鑒2.0”,用生成式AI能力檢測生成式AI模型。
去年WAIC 2022,螞蟻就展示了隱私計算、區(qū)塊鏈、圖計算這三大“根技術(shù)”。今年WAIC 2023上,這三大“根技術(shù)”開花結(jié)果,“蟻鑒”升級為“蟻鑒2.0”,增加了AIGC安全檢測;隱私計算“隱語技術(shù)?!遍_源升級,推出隱語框架1.0,并開源首個國產(chǎn)金融安全級TEE方案“HyperEnclave”;螞蟻區(qū)塊鏈隱私協(xié)作平臺AntChain FAIR 全新架構(gòu)升級,引入零知識證明(ZKP)為核心的可驗證計算技術(shù),在Web3技術(shù)攻堅上再進一步。
01 大模型的“安全體檢軟件”
“百模大戰(zhàn)”開啟中國AI追趕賽,自然不是一件壞事,但當(dāng)人類開始依賴大模型這一生產(chǎn)工具,如果大模型胡說八道,誰來判定它是對是錯,它產(chǎn)生的假數(shù)據(jù)是否會污染數(shù)據(jù)池?
在WAIC 2023上,螞蟻集團聯(lián)合清華大學(xué)發(fā)布AI安全檢測平臺“蟻鑒2.0”,用生成式AI能力檢測生成式AI模型,可識別數(shù)據(jù)安全、內(nèi)容安全、科技倫理三大類數(shù)百種風(fēng)險,覆蓋表格、文本、圖像等多種數(shù)據(jù)和任務(wù)類型,是業(yè)內(nèi)首個實現(xiàn)產(chǎn)業(yè)級應(yīng)用的全數(shù)據(jù)類型AI安全檢測平臺。

在展臺C位,《IT時報》記者見到了這一大會的“鎮(zhèn)館之寶”——“蟻鑒2.0”,左側(cè)的“蟻鑒機器人”自動生成海量測試集,對右側(cè)的大模型進行交互誘導(dǎo),每分鐘可調(diào)用10余種不同難度系數(shù)的對抗手法生成超過30個誘導(dǎo)問題。它很像一個24小時不眠不休的“安全黑客”在找茬大模型,比“安全黑客”更智能的是,在誘導(dǎo)的同時,會對大模型的回答進行實時、自動化的檢測計算,從近200個子類緯度,找到大模型存在的弱點和安全問題,最后生成大模型的安全體檢報告。
“生成式大模型是一種‘深黑盒’技術(shù),這種AI對AI的評測是教學(xué)相長,好比生成式考官考核生成式運動員,在對抗中雙方能力互相提升,進一步提高整個行業(yè)的AI安全水位?!蔽浵伡瘓F大安全事業(yè)群技術(shù)部總裁李俊奎表示。
另一項硬核能力是,“蟻鑒2.0”融入了可解釋性檢測工具,從完整性、準(zhǔn)確性、穩(wěn)定性等7個維度及20余項評估指標(biāo),對AI系統(tǒng)的解釋質(zhì)量量化分析,幫助用戶更清晰驗證與優(yōu)化可解釋方案。
“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利,支持零編碼測評。開發(fā)者通過API接口,將AI模型接入蟻鑒,就可以一鍵識別和挖掘模型漏洞。
螞蟻集團宣布,“蟻鑒2.0”全面開放,面向全球開發(fā)者免費提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具,可服務(wù)于數(shù)字金融、教育、文化、醫(yī)療、電商等領(lǐng)域的大規(guī)模復(fù)雜業(yè)務(wù)場景。
當(dāng)然,大模型是對是錯的標(biāo)準(zhǔn)如若只是“一家之言”,是沒有說服力的。于是,中國信通院、上海人工智能實驗室、武漢大學(xué)和螞蟻集團等多家單位共同發(fā)起《AIGC可信倡議》。該倡議得到數(shù)十家單位參與,圍繞人工智能可能引發(fā)的經(jīng)濟、安全、隱私和數(shù)據(jù)治理等問題,提出構(gòu)建AIGC可信發(fā)展的全球治理合作框架,采用安全可信的數(shù)據(jù)資源、技術(shù)框架、計算方法和軟件平臺等提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可解釋。
02 云的下一步是天空計算
上榜WAIC 2022“八大鎮(zhèn)館之寶”之一的是螞蟻另一項產(chǎn)品:可信隱私計算隱語技術(shù)棧。該技術(shù)棧歷時6年研發(fā),今年,螞蟻將該隱私計算技術(shù)棧里的兩大產(chǎn)品開源,分別是“隱語開源框架1.0”和首個國產(chǎn)金融安全級TEE方案“HyperEnclave”。

“隱語開源框架”是“隱語技術(shù)?!敝械挠嬎阋鎸?,HyperEnclave是其可信基座。該技術(shù)棧是螞蟻自研,積累了千余項專利,集合了隱語開源框架、Occlum TEE開源操作系統(tǒng),HyperEnclave等隱私計算技術(shù)產(chǎn)品,孵化了可信密態(tài)計算(TECC)等新型隱私計算技術(shù)。此次開源兩個新產(chǎn)品功能,有望為隱私計算在易用、通用性上帶來跨越式提升。
隱語框架去年7月首次開源,歷時1年升級到1.0版,更好地實現(xiàn)了“拎包入住”式服務(wù)。新版本有三大優(yōu)勢:解決與第三方系統(tǒng)互通等問題,打造黑白盒全棧互聯(lián)互通能力,推出“開箱即用”輕量化部署體驗包,降低了隱私計算應(yīng)用門檻。
TEE是隱私計算的技術(shù)路線之一,被認(rèn)為是數(shù)據(jù)安全上云和隱私保護計算的最有效技術(shù)手段。此次開源的HyperEnclave的優(yōu)勢是安全、兼容。它支持國內(nèi)外主流CPU硬件平臺,提供統(tǒng)一TEE抽象,核心代碼經(jīng)過形式化驗證。同時,它滿足國產(chǎn)自研要求,已具備規(guī)模化商業(yè)場景的落地經(jīng)驗。
一些技術(shù)“軟基建”也有了重要進展。IEEE(電氣與電子工程師協(xié)會)發(fā)布了行業(yè)首個“可信執(zhí)行環(huán)境安全”國際標(biāo)準(zhǔn)IEEE2952-2023。該標(biāo)準(zhǔn)由螞蟻集團牽頭,制定了基于TEE技術(shù)的安全計算系統(tǒng)的技術(shù)框架,中國信通院、中國移動、中國聯(lián)通、中國電信、螞蟻集團和洞見科技聯(lián)合發(fā)布了《隱私計算 跨平臺互聯(lián)互通開放協(xié)議 第2部分:SS-LR》。該協(xié)議將搭建更加開放、透明、安全的隱私計算互聯(lián)互通平臺,保護數(shù)據(jù)安全。
“云的下一步將是天空計算”,在螞蟻集團副總裁、首席技術(shù)安全官韋韜看來,隱私計算可以擺脫云的束縛,實現(xiàn)云與云的互通,計算、大數(shù)據(jù)和數(shù)據(jù)要素密態(tài)化是必經(jīng)的三大階段,核心是降低數(shù)據(jù)流通和安全保障的成本。
03 產(chǎn)業(yè)數(shù)字化是最大的確定性機會
在一個不確定的時代,大家都在找一個確定性機會?!爱a(chǎn)業(yè)數(shù)字化是數(shù)字經(jīng)濟的核心領(lǐng)域,是最大的確定性機會?!蔽浵伡瘓F資深副總裁蔣國飛在WAIC 2023上說道。
螞蟻區(qū)塊鏈(螞蟻鏈)一直在挖掘一條Web3之路,今年WAIC 2023上,螞蟻鏈宣布隱私協(xié)作平臺 AntChain FAIR 全新架構(gòu)升級,引入零知識證明(ZKP)為核心的可驗證計算技術(shù),從可信數(shù)據(jù)流轉(zhuǎn)拓展到計算過程、數(shù)據(jù)屬性以及身份的可驗證。
目前,F(xiàn)AIR 已經(jīng)在杭數(shù)交、貴數(shù)所等多家數(shù)據(jù)交易所應(yīng)用。

零知識證明被業(yè)內(nèi)看作是 Web3 下一個 5 年最關(guān)鍵的技術(shù)之一,它指的是證明者能夠在不向驗證者提供任何有用信息的狀況下,使驗證者相信某個論斷是正確的。相較于隱私計算強調(diào)在保護數(shù)據(jù)隱私基礎(chǔ)上進行數(shù)據(jù)分析和計算,零知識證明的特點在于“可驗證”。
元宇宙不能建立在沙灘上,AI大模型訓(xùn)練、身份驗證、數(shù)據(jù)流轉(zhuǎn)、資產(chǎn)交易、鏈上鏈下協(xié)同等也要基于全流程可信,這將加速 Web3從數(shù)字世界向更復(fù)雜的產(chǎn)業(yè)場景滲透。
零知識證明最關(guān)鍵的環(huán)節(jié)是“證明生成階段”,即對數(shù)據(jù)、身份、計算過程等生成一個“證明”。螞蟻鏈通過在軟件算法優(yōu)化,“證明生成”端到端加速了原有基線的2.8倍。
作為國內(nèi)最早布局 Web3 技術(shù)的廠商,螞蟻鏈在 Web3 技術(shù)領(lǐng)域全面自主可控,區(qū)塊鏈、隱私計算等授權(quán)專利全球第一。
03 AI走進田間地頭 AI訓(xùn)練師走出大山
對于來百姓來說,螞蟻根植多年的“根技術(shù)”或許晦澀難懂。不過這幾年,螞蟻一直將技術(shù)落地的重點放在實體經(jīng)濟,尤其是幫小微群體創(chuàng)造更大的價值,而這正是老百姓能切身體會到的AI。
AI走進了田間地頭,以前,農(nóng)村網(wǎng)貸的授信調(diào)查都是要靠雙腿去跑的?,F(xiàn)在,網(wǎng)商銀行基于“AI+遙感”技術(shù)研發(fā)的大山雀系統(tǒng),首次將衛(wèi)星遙感技術(shù)應(yīng)用于農(nóng)村金融領(lǐng)域,解決農(nóng)戶在無抵押、無擔(dān)保、不提交紙質(zhì)材料的情況下的授信問題。在貸款授信環(huán)節(jié),大山雀系統(tǒng)通過深度學(xué)習(xí)等人工智能技術(shù)來觀察和解析衛(wèi)星圖像,識別作物的種植面積、種類和長勢,預(yù)測產(chǎn)量產(chǎn)值,從而給予合理的額度。目前大山雀系統(tǒng)已覆蓋31省市自治區(qū),服務(wù)超過120萬種植戶。

來自甘肅省積石山縣的人工智能訓(xùn)練師張娟走出縣城,像她一樣,更多的AI訓(xùn)練師來到WAIC這個世界舞臺,與大模型企業(yè)們面對面。在AI越來越聰明的背后,少不了AI訓(xùn)練師一步步教它,把圖片、語言、文本、視頻等原始數(shù)據(jù)標(biāo)注成AI能理解的結(jié)構(gòu)化語言。
2019年,螞蟻集團、螞蟻公益基金會聯(lián)合中國婦女發(fā)展基金會等共同發(fā)起“數(shù)字木蘭|AI豆計劃”,至2022年底,該計劃已支持在陜西、山西、甘肅、貴州、寧夏等地建立了17個縣域數(shù)字就業(yè)中心,累計幫助4000人在地就業(yè),成為“人工智能訓(xùn)練師”,其中超過6成員工為女性。相關(guān)數(shù)字就業(yè)中心所開展的標(biāo)注業(yè)務(wù),已經(jīng)涵蓋200余個具體應(yīng)用場景,年數(shù)據(jù)標(biāo)注量過億,多個中心成為當(dāng)?shù)刈畲笥霉て髽I(yè)。
從征服天空的殿堂科技,到走出大山的就業(yè)工具,AI的意義是在自我學(xué)習(xí)中成就社會,而企業(yè)也該從自我調(diào)整中越過高峰和低谷,創(chuàng)造更多機會與未來。
排版/ 季嘉穎
圖片/ 螞蟻集團
來源/《IT時報》公眾號vittimes