百分點(diǎn)科技&機(jī)器之心聯(lián)合舉辦數(shù)據(jù)智能技術(shù)實(shí)踐論壇

8月27日,由百分點(diǎn)科技和機(jī)器之心聯(lián)合舉辦的數(shù)據(jù)智能技術(shù)實(shí)踐論壇成功舉行。本次論壇主題為“從數(shù)據(jù)到知識的‘智變’”,百分點(diǎn)科技CTO劉譯璟作為本次論壇的主持人在致辭中表示,隨著大數(shù)據(jù)與人工智能技術(shù)交叉融合態(tài)勢的日趨增強(qiáng),從數(shù)據(jù)到知識的轉(zhuǎn)換過程及應(yīng)用也在發(fā)生多重“智變”。希望通過本次論壇,能促進(jìn)大家對數(shù)據(jù)智能技術(shù)發(fā)展及實(shí)踐應(yīng)用的探討,加深產(chǎn)學(xué)研之間的相互交流。

本次論壇特別邀請了百度視覺技術(shù)部主任架構(gòu)師劉經(jīng)拓、百分點(diǎn)科技數(shù)據(jù)開發(fā)部負(fù)責(zé)人馬偉凱、復(fù)旦大學(xué)教授肖仰華和百分點(diǎn)科技首席算法科學(xué)家蘇海波分別做了主題演講,從感知、數(shù)據(jù)治理、認(rèn)知各個(gè)層面詳細(xì)解讀了數(shù)據(jù)到知識是如何一步步地發(fā)生變化并支持智能應(yīng)用的。
融合創(chuàng)新,從“治理”到“智理”
近年來,伴隨數(shù)字政府的快速落地,無論是數(shù)據(jù)的生產(chǎn)環(huán)節(jié)還是治理環(huán)節(jié),都對數(shù)據(jù)智能技術(shù)應(yīng)用提出了越來越高的需求。計(jì)算機(jī)視覺作為在感知層的核心技術(shù),在結(jié)合城市感知、工業(yè)能源、人機(jī)交互、視頻生產(chǎn)等業(yè)務(wù)場景中得到了不斷發(fā)展。同時(shí),數(shù)字政府項(xiàng)目中還存在眾多的文本、語音等形式復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù),如何基于視覺技術(shù)及政府已經(jīng)有的業(yè)務(wù)數(shù)據(jù)進(jìn)行多模態(tài)數(shù)據(jù)的融合,以及運(yùn)用智能化技術(shù)的實(shí)現(xiàn)高效的“智”理,對支撐數(shù)字政府智能應(yīng)用、提升治理水平起著至關(guān)重要的作用。

百度視覺技術(shù)部主任架構(gòu)師劉經(jīng)拓在《融合創(chuàng)新——計(jì)算機(jī)視覺技術(shù)與產(chǎn)業(yè)化發(fā)展之道》的主題分享中介紹,隨著行業(yè)應(yīng)用的逐步深入,通過某個(gè)單點(diǎn)算法創(chuàng)新就能大大提升應(yīng)用效果的方式已不復(fù)存在,需要用全流程、全棧的方式。因此,為了實(shí)現(xiàn)更好的技術(shù)發(fā)展和落地效果,百度在技術(shù)和產(chǎn)業(yè)兩個(gè)維度上都進(jìn)行了融合創(chuàng)新,提出了計(jì)算機(jī)視覺領(lǐng)域從預(yù)訓(xùn)練、定制化到小型化,以及平臺化的一體化的研發(fā)方案。具體來說,首先通過用超大規(guī)模非結(jié)構(gòu)性的數(shù)據(jù)做預(yù)訓(xùn)練,能夠在同樣少量數(shù)據(jù)的情況下取得更好的效果;定制化是指結(jié)合特定場景進(jìn)行自適應(yīng)遷移學(xué)習(xí),根據(jù)場景數(shù)據(jù)進(jìn)行有監(jiān)督定制化調(diào)優(yōu);小型化主要是基于模型剪枝、蒸餾、量化等技術(shù),對模型進(jìn)行裁剪。
他表示,大規(guī)模有監(jiān)督數(shù)據(jù)的技術(shù)紅利逐漸減弱,AI新基建需要更低的研發(fā)與部署成本,通過預(yù)訓(xùn)練與自訓(xùn)練平臺,最終還要沉淀成標(biāo)準(zhǔn)化、低成本復(fù)制的模型,并與產(chǎn)業(yè)進(jìn)行更深度的融合,挖掘出更多降低人工成本的新應(yīng)用點(diǎn)。

百分點(diǎn)科技數(shù)據(jù)開發(fā)部負(fù)責(zé)人馬偉凱在《從“治”理到“智”理,多模態(tài)數(shù)據(jù)管理PAI應(yīng)用方法論》主題分享中表示,數(shù)據(jù)治理中的技術(shù)挑戰(zhàn)除了數(shù)據(jù)孤島、數(shù)據(jù)質(zhì)量等問題,還存在多模態(tài)下如何解決數(shù)據(jù)不可用、不能用及不好用等挑戰(zhàn)。他介紹,基于多源異構(gòu)數(shù)據(jù)源的復(fù)雜場景下數(shù)字政府?dāng)?shù)據(jù)治理項(xiàng)目,百分點(diǎn)科技沉淀了一套數(shù)據(jù)治理“PAI”實(shí)施方法論,即流程化(process-oriented)、自動(dòng)化(automation)、智能化(intelligence)。通過引入機(jī)器學(xué)習(xí)算法、NLP等數(shù)據(jù)智能技術(shù),可以更好地開展數(shù)據(jù)治理工作,建立全域數(shù)據(jù)標(biāo)準(zhǔn)、提升數(shù)據(jù)質(zhì)量、盤活數(shù)據(jù)資產(chǎn),從而支撐數(shù)據(jù)融通,最終釋放數(shù)據(jù)價(jià)值指導(dǎo)業(yè)務(wù)創(chuàng)新。
他認(rèn)為,未來數(shù)據(jù)治理領(lǐng)域會有四大應(yīng)用趨勢:一是智能化建模和數(shù)據(jù)加工優(yōu)化,需要不斷地提升建模的能力沉淀到知識庫;二是智能化完善數(shù)據(jù)安全管理,包括智能化控制數(shù)據(jù)權(quán)限分配、智能化數(shù)據(jù)審計(jì)并制定數(shù)據(jù)加密脫敏策略;三是智能化設(shè)計(jì)并維護(hù)數(shù)據(jù)生命周期管理,由于數(shù)據(jù)量大有時(shí)候不一定是好事,對于很多單位來說可能是負(fù)擔(dān),因此智能化識別數(shù)據(jù)、智能化制定數(shù)據(jù)保留策略非常重要;四是與Data Fabric更好的融合,增強(qiáng)數(shù)據(jù)目錄,實(shí)現(xiàn)動(dòng)態(tài)的獲取數(shù)據(jù),保證數(shù)據(jù)的安全。
數(shù)據(jù)到知識的“知”變與“智”變
在實(shí)踐中,行業(yè)客戶對知識圖譜的應(yīng)用訴求愈發(fā)強(qiáng)烈,核心需求是將行業(yè)數(shù)據(jù)知識化,并通過搜索、推薦、問答,以及用知識輔助進(jìn)行更加智能的決策。因此,將結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)有效的“智”理起來后,能夠進(jìn)行數(shù)據(jù)和知識挖掘,提取當(dāng)中有價(jià)值的信息,并以可視化的分析,為政府和企業(yè)決策提供支持成為當(dāng)今亟待解決的問題。

復(fù)旦大學(xué)肖仰華教授在《知識圖譜技術(shù)及行業(yè)應(yīng)用實(shí)踐》的主題分享中表示,作為大數(shù)據(jù)知識工程的典型代表,知識圖譜技術(shù)近年來取得了長足進(jìn)步,并在一系列實(shí)際應(yīng)用中取得了顯著效果。但隨著應(yīng)用的深化,知識圖譜的落地過程單靠其所代表的知識智能本身這套技術(shù)體系和范式已經(jīng)難以解決很多問題:一是數(shù)據(jù)獲取和治理困難;二是在知識層面,小樣本、低資源情況下知識的表示和獲取代價(jià)仍然非常大;此外,獲取知識之后,在應(yīng)用、服務(wù)能力方面也存在很多挑戰(zhàn)。
因此,未來破題的關(guān)鍵在于要突破以知識圖譜為代表的知識智能的邊界,向認(rèn)知智能這樣的智能新形態(tài)發(fā)展。他認(rèn)為,認(rèn)知智能作為數(shù)據(jù)智能、知識智能融合創(chuàng)新產(chǎn)物,將是知識圖譜等知識工程技術(shù)發(fā)展的必然歸宿。

百分點(diǎn)科技首席算法科學(xué)家蘇海波在《知識圖譜技術(shù)及行業(yè)應(yīng)用實(shí)踐》主題分享中表示,近些年,人工智能逐漸從感知智能向認(rèn)知智能發(fā)展,知識圖譜則是實(shí)現(xiàn)認(rèn)知智能的關(guān)鍵技術(shù)方法,在構(gòu)建出知識圖譜后,可以實(shí)現(xiàn)各種智能場景應(yīng)用。蘇海波以此為背景介紹了百分點(diǎn)科技知識圖譜抽取、知識圖譜問答等技術(shù)的算法原理和實(shí)踐,以及在多個(gè)行業(yè)場景中的具體應(yīng)用。
他強(qiáng)調(diào),未來知識圖譜一定會深入到各行各業(yè),未來五年將呈現(xiàn)三個(gè)趨勢:一是通過人機(jī)結(jié)合的方式,自動(dòng)化程度越來越高;二是知識圖譜的多模態(tài)發(fā)展;三是知識圖譜與數(shù)據(jù)治理相結(jié)合。只有掌握通用的人工智能技術(shù),并將技術(shù)和業(yè)務(wù)需求對應(yīng)起來,才能真正發(fā)揮出知識圖譜的價(jià)值,解決行業(yè)問題。
當(dāng)前,已經(jīng)進(jìn)入到一個(gè)從數(shù)據(jù)到知識的“智變”時(shí)代,隨著大數(shù)據(jù)、知識圖譜、NLP等數(shù)據(jù)智能技術(shù)的進(jìn)一步成熟,數(shù)據(jù)中的價(jià)值將不斷被挖掘利用,幫助我們進(jìn)行合理地決策。未來,百分點(diǎn)科技也將繼續(xù)結(jié)合行業(yè)需求,融合“政產(chǎn)學(xué)研用”產(chǎn)業(yè)生態(tài)鏈條,聯(lián)合業(yè)界伙伴和產(chǎn)學(xué)研各界專家,深化布局大數(shù)據(jù)和人工智能全棧技術(shù),打造從感知、認(rèn)知、決策到行動(dòng)的端到端的智能決策閉環(huán),真正賦能各行各業(yè)。