知識圖譜:認知智能理論與實戰(zhàn)
鏈接:https://pan.baidu.com/s/1E8ETU-MWoD2bzCYO0Z1gKw?pwd=fjfy?
提取碼:fjfy

編輯推薦
詳解ChatGPT底層技術(shù)Transformer,知識圖譜為谷歌Bard關(guān)于現(xiàn)實事實的響應(yīng)提供憑據(jù)。
全彩印刷,圖解精致:一百余張精美彩圖,詳細解析數(shù)十個知識圖譜前沿算法。
理論完備,應(yīng)用豐富:創(chuàng)新提出知識圖譜建模方法論——六韜法及模式設(shè)計工程模型。在理論方面,本書深入每個概念、理論和算法的本質(zhì),給出推導(dǎo)、解析和闡述,便于讀者理解概念與算法背后的邏輯;在應(yīng)用方面,完整涵蓋知識計算、知識推理等方面內(nèi)容,并系統(tǒng)梳理了三大行業(yè)應(yīng)用場景。
內(nèi)容全面,結(jié)構(gòu)有序:全面涵蓋知識圖譜模式設(shè)計、構(gòu)建、存儲和應(yīng)用技術(shù),對應(yīng)大腦學(xué)習(xí)、記憶和使用知識的模式,符合在實踐中應(yīng)用知識圖譜的通常做法。
各章獨立,主題明確:各章主題相對獨立,既可以作為行業(yè)參考資料,也適合作為高校教材;讀者既可以系統(tǒng)性地學(xué)習(xí),也可以有選擇性地學(xué)習(xí)知識圖譜。
內(nèi)容簡介
知識圖譜作為認知智能的核心技術(shù)正蓬勃發(fā)展。本書系統(tǒng)全面地介紹了知識圖譜的核心技術(shù),既有宏觀整體的技術(shù)體系,也有關(guān)鍵技術(shù)和算法細節(jié),內(nèi)容包括:知識圖譜模式設(shè)計的方法論——六韜法;知識圖譜構(gòu)建中的實體抽取和關(guān)系抽?。恢R存儲中的屬性圖模型及圖數(shù)據(jù)庫,重點介紹了JanusGraph分布式圖數(shù)據(jù)庫;知識計算中的圖論基礎(chǔ),以及中心性、社區(qū)檢測等經(jīng)典圖計算算法;知識推理中的邏輯推理、幾何變換推理和深度學(xué)習(xí)推理,及其編程實例。最后,本書以金融、醫(yī)療和智能制造三大行業(yè)的應(yīng)用場景為例,梳理了知識圖譜的應(yīng)用價值和應(yīng)用程序形態(tài)。
本書既適合人工智能行業(yè)從業(yè)者和研究人員系統(tǒng)學(xué)習(xí)知識圖譜,也適合一線工程師和技術(shù)人員參考使用,并可作為企業(yè)管理人員、政府人員、政策制定人員、公共政策學(xué)者的參考材料,以及高等院校計算機、金融和人工智能等相關(guān)專業(yè)師生的參考資料和培訓(xùn)學(xué)校的教材。
作者簡介
王文廣,浙江大學(xué)計算機科學(xué)與技術(shù)碩士,高級工程師,知識圖譜與認知智能領(lǐng)域知名專家。
現(xiàn)任達觀數(shù)據(jù)副總裁,專注于自然語言處理、知識圖譜、圖像與語音分析、認知智能、大數(shù)據(jù)和圖分析等方向的技術(shù)研究、產(chǎn)品開發(fā)和產(chǎn)業(yè)應(yīng)用,為金融、智能制造、醫(yī)療與生物醫(yī)藥、半導(dǎo)體等行業(yè)提供認知智能產(chǎn)品和技術(shù)服務(wù)。
現(xiàn)為上海市人工智能技術(shù)標準化委員會委員,上海市科學(xué)技術(shù)委員會評審專家、人工智能領(lǐng)域標準編制專家,CCF 高級會員,CIPS語言與知識計算專委會委員,CAAI深度學(xué)習(xí)專委會委員。主導(dǎo)或參與過百余個人工智能科學(xué)研究和產(chǎn)業(yè)應(yīng)用項目,曾獲得國際、國內(nèi)多個算法競賽獎項,申請人工智能領(lǐng)域國家發(fā)明專利數(shù)十項,并參與編制人工智能領(lǐng)域的多個國家標準、行業(yè)標準和團體標準。
內(nèi)頁插圖




精彩書評
知識圖譜是人工智能領(lǐng)域的前沿技術(shù)方向,在許多行業(yè)具有廣泛的應(yīng)用前景。本書系統(tǒng)介紹了知識圖譜基礎(chǔ)理論方法,同時提供了豐富的應(yīng)用實例和代碼,真正做到了理論與實踐兼顧,對相關(guān)領(lǐng)域從業(yè)者具有很高的參考價值。
萬小軍
北京大學(xué)王選計算機研究所教授
中國計算機學(xué)會自然語言處理專委會秘書長
近年來,知識圖譜一直是各通用搜索引擎及面向企業(yè)服務(wù)的公有云廠商激烈競爭的焦點之一。在概念和理論上,本書對知識圖譜模式、內(nèi)容構(gòu)建和存儲應(yīng)用等方面內(nèi)容覆蓋全面且講解深入;在實用性上,本書探討了很多在企業(yè)界已經(jīng)得到大規(guī)模數(shù)據(jù)驗證的有效方法。因此,不論你是想了解知識圖譜領(lǐng)域的理論知識,還是正積極準備在該領(lǐng)域大展拳腳,本書都是你不可錯過的參考書之一!
于志偉
Staff Software Engineer,Google Search
近年來,知識圖譜得到學(xué)術(shù)界和工業(yè)界越來越多的關(guān)注,不僅在大規(guī)模知識圖譜構(gòu)建與融合、知識問答與推理、圖查詢與計算一體化,以及各種可解釋圖神經(jīng)網(wǎng)絡(luò)等方面涌現(xiàn)出大量算法創(chuàng)新,而且在金融、醫(yī)療、智能制造等諸多行業(yè)產(chǎn)生了井噴式的賦能落地。在這樣的大背景下,知識圖譜的人才培養(yǎng)及各種配套教材就顯得十分重要。
文廣是知識圖譜領(lǐng)域的資深從業(yè)者,不僅具備扎實的理論功底,更難能可貴的是,他在圖譜落地過程中積累了很多寶貴經(jīng)驗。因此,當(dāng)文廣第一時間告訴我,他打算撰寫一本理論結(jié)合實踐的圖書時,我就百分之百地支持并翹首以待這本新書的出版。最近,我有幸在第一時間閱讀了本書的不少章節(jié),發(fā)現(xiàn)其內(nèi)容極其翔實,深入淺出,在呈現(xiàn)各種知識時不忘結(jié)合案例。
我真誠地向所有致力于知識圖譜工作的研發(fā)工程師、在校師生,以及各行各業(yè)的從業(yè)者和決策者推薦此書,相信大家閱讀后一定能對知識圖譜的價值、技術(shù)趨勢和應(yīng)用案例有更全面的了解,并更好地在工作中運用知識圖譜。
王昊奮
同濟大學(xué)特聘研究員、博士生導(dǎo)師
OpenKG發(fā)起人
知識是寶貴的、稀缺的,擁有知識就擁有了競爭力。應(yīng)用知識圖譜這種新的人工智能技術(shù),能夠使工程師充分利用企業(yè)的集體智慧,提升企業(yè)知識的使用效率并激發(fā)創(chuàng)新,形成可持續(xù)的競爭優(yōu)勢。本書系統(tǒng)介紹了知識圖譜技術(shù),既有完備的理論,又很好地融合了作者的實踐經(jīng)驗,并提供了大量的應(yīng)用實例;既是知與行的統(tǒng)一,又是企業(yè)應(yīng)用知識圖譜的ji佳參考書籍。
樂承筠
微創(chuàng)投資控股有限公司商業(yè)發(fā)展與項目管理資深副總裁
從人工智能技術(shù)誕生開始,知識表示和推理一直是一個核心課題,但因受限于算力和數(shù)據(jù)而沒有重大突破,直到谷歌提出了知識圖譜,并成功將其用于改進搜索質(zhì)量。從此,知識圖譜開始得到業(yè)界的關(guān)注,并隨著深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展而突飛猛進,開始在不同行業(yè)得到廣泛應(yīng)用。市面上不少介紹知識圖譜的書籍,或是偏于理論,或是偏于科普。文廣的這本書很好地結(jié)合了理論和實踐,深入淺出,可以幫助工程師、產(chǎn)品經(jīng)理、AI技術(shù)愛好者等不同行業(yè)的人掌握知識圖譜的關(guān)鍵技術(shù),并快速用它來解決實際問題,這是一本不可多得的參考書。
Alex Lu
百度商業(yè)平臺前技術(shù)總監(jiān)
盛大集團前副總裁
知識圖譜是人工智能發(fā)展的重要基礎(chǔ)設(shè)施之一。隨著知識圖譜應(yīng)用的日益深化,從應(yīng)用實戰(zhàn)角度總結(jié)知識圖譜的落地經(jīng)驗,對于進一步推廣知識圖譜技術(shù),以及進一步推動基于知識圖譜的行業(yè)認知智能發(fā)展具有更加重要的意義。本書是作者多年深耕知識圖譜行業(yè)應(yīng)用與實踐,并持續(xù)反思與系統(tǒng)總結(jié)的成果,其中不乏犀利獨特的視角,多有精彩驚奇的類比。讀此書如同與好友品茶論道,愿讀者能從中有所啟發(fā),有所感悟。
肖仰華
復(fù)旦大學(xué)教授
知識工場實驗室負責(zé)人
作為人類知識的z新載體,知識圖譜正驅(qū)動著人工智能在邁向認知智能的征途中飛速發(fā)展。作者以通俗易懂的語言解析了什么是知識圖譜,并從全局視角概覽了知識圖譜技術(shù)體系。同時,本書全面介紹了知識圖譜構(gòu)建、存儲和應(yīng)用技術(shù)體系,契合人類大腦的知識獲取、記憶和使用的方式。
在構(gòu)建方面,作者以自然語言處理技術(shù)為核心介紹了知識抽?。辉诖鎯Ψ矫?,知識圖譜的很多技術(shù)來源于工程應(yīng)用實踐,本書體現(xiàn)了作者在知識圖譜產(chǎn)業(yè)中耕耘多年的豐富經(jīng)驗和思考,涵蓋了知識圖譜構(gòu)建、存儲和應(yīng)用等方面的內(nèi)容,理論簡煉完備,圖示和算法實例豐富,是一本非常實用的知識圖譜技術(shù)圖書,既可以作為高校師生的教科書,也可以作為學(xué)術(shù)研究和工程應(yīng)用的參考書。
陳華鈞
浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院教授
OpenKG 發(fā)起人
知識圖譜是認知智能中的一項關(guān)鍵性技術(shù),我們對海量的數(shù)據(jù)、文本、圖像等進行加工提煉,將知識萃取出來填入圖網(wǎng)絡(luò),并進行充分地挖掘、推理、分析和應(yīng)用。這個從信息變?yōu)閿?shù)據(jù),然后提煉知識,并最終轉(zhuǎn)化為智慧的過程,有力地促進了人工智能的行業(yè)應(yīng)用。
王文廣和他所在的達觀數(shù)據(jù)知識圖譜產(chǎn)品團隊,一直在負責(zé)達觀數(shù)據(jù)知識圖譜的產(chǎn)品構(gòu)建和行業(yè)應(yīng)用,不僅研發(fā)了很多圖譜算法,也為眾多客戶解決了工程實踐問題。在處理知識圖譜落地應(yīng)用的各類疑難問題中,文廣積累了非常豐富的工程實踐經(jīng)驗,也對達觀知識圖譜的產(chǎn)品理念有了更深刻的感悟。在寫作本書的過程中,文廣仔細查閱了很多行業(yè)z新論文,引用了大量相關(guān)技術(shù)資料,并細致地提供了算法源代碼,對大家學(xué)習(xí)和掌握知識圖譜技術(shù)有很好的啟發(fā)。
知識圖譜是對人類專家經(jīng)驗的提煉總結(jié),是促進人工智能落地應(yīng)用的一把金鑰匙,是大數(shù)據(jù)相關(guān)產(chǎn)品的核心發(fā)動機。我們需要滿懷精益求精的底層技術(shù)鉆研精神、腳踏實地的務(wù)實態(tài)度,以及一點一滴的積累,才能最終達成知識圖譜的成功應(yīng)用。我相信這也是這本著作創(chuàng)作的初衷和愿景!
陳運文
達觀數(shù)據(jù)董事長
國家“萬人計劃”專家
本書系統(tǒng)介紹了分布式圖數(shù)據(jù)庫的底層邏輯和應(yīng)用實例;在應(yīng)用方面,本書不僅完整涵蓋知識計算、知識推理等方面的內(nèi)容,還系統(tǒng)梳理了行業(yè)應(yīng)用場景。
本書內(nèi)容豐富,視野開闊,語言生動,閱讀起來流暢親切,可見作者王文廣先生深厚的技術(shù)與文字功底、精湛的專業(yè)知識,以及豐富的技術(shù)實踐。這是一本對知識圖譜產(chǎn)業(yè)實踐非常有價值的教科書及參考書。
陳宏剛
微軟亞洲研究院前部門總經(jīng)理
微軟亞洲互聯(lián)網(wǎng)工程院前資深總監(jiān)
人工智能正邁向認知智能的發(fā)展階段,而知識圖譜為認知智能提供了知識的基礎(chǔ)設(shè)施,是前沿的技術(shù)和研究方向。本書選取了知識圖譜核心內(nèi)容進行講解,理論和技術(shù)體系完整,實踐案例豐富。本書通過精粹流暢的語言來描述理論,并配以精心編寫的程序?qū)嵗瑸槔碚撆c實踐搭起了一座橋梁,是一本令人印象深刻的好書,既可作為高校教材,也是工程實踐的ji佳參考書。
李涓子
清華大學(xué)教授
清華大學(xué)人工智能研究院知識智能中心主任
十年前,我就對知識圖譜在搜索領(lǐng)域產(chǎn)生的影響十分感興趣,但一直沒有機會學(xué)習(xí)相關(guān)的知識。在閱讀此書及與作者的交流過程中,我認識到了知識圖譜技術(shù)的巨大價值,并學(xué)習(xí)了相關(guān)的實現(xiàn)原理與應(yīng)用方法。本書系統(tǒng)介紹了知識圖譜技術(shù),其中的“六韜法”更是令人耳目一新。書中引用了不少文學(xué)典籍,令我十分享受整個閱讀過程。推薦大家閱讀此書,深入掌握知識圖譜。
桑文鋒
神策數(shù)據(jù)創(chuàng)始人兼 CEO
《數(shù)據(jù)驅(qū)動:從方法到實踐》作者
這是一本難得的關(guān)于知識圖譜的經(jīng)典之作。全書高度概括、專業(yè)清晰,讀下來受益匪淺。作者以深厚的文化底蘊生動描繪了知識圖譜技術(shù)框架體系,以及與知識圖譜相關(guān)技術(shù)之間的關(guān)系,為讀者打開了一扇輕松了解知識圖譜的大門。人類正在探索和打造與現(xiàn)實世界平行的數(shù)字空間(元宇宙),作為人工智能進步階梯的知識圖譜,展示出越來越豐富的應(yīng)用前景,為我們帶來無盡的發(fā)展和想象空間。
郭敏
中國平安集團采購管理中心總經(jīng)理
中國金融學(xué)會金融采購專業(yè)委員會專家
這是一本從應(yīng)用實踐視角出發(fā),系統(tǒng)介紹知識圖譜技術(shù)體系和實戰(zhàn)經(jīng)驗的書籍。全書不僅完整地涵蓋了知識圖譜構(gòu)建、存儲和應(yīng)用技術(shù),而且梳理了大量的知識圖譜應(yīng)用方法和應(yīng)用場景。本書語言生動流暢,不少見解令人印象深刻。對學(xué)生、企業(yè)工程師、行業(yè)研究者及決策者來說,這是一本不錯的參考書。
黃萱菁
復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師
自然語言處理領(lǐng)域著名學(xué)者
目錄
第1章 知識圖譜概述 0
1.1 從李白的《靜夜思》開始 2
1.2 什么是知識圖譜 3
1.3 DIKW模型 6
1.4 從DIKW模型到知識圖譜 8
1.5 知識圖譜技術(shù)體系 9
1.5.1 知識圖譜模式設(shè)計與管理 11
1.5.2 知識圖譜構(gòu)建技術(shù) 11
1.5.3 知識圖譜存儲技術(shù) 13
1.5.4 知識圖譜應(yīng)用技術(shù) 14
1.5.5 用戶接口與界面 17
1.6 知識圖譜辨析 17
1.6.1 知識圖譜與自然語言處理 18
1.6.2 知識圖譜與圖數(shù)據(jù)庫 20
1.6.3 知識圖譜與語義網(wǎng)絡(luò) 20
1.6.4 知識圖譜與搜索引擎 21
1.6.5 知識圖譜與深度學(xué)習(xí) 21
1.7 知識圖譜是人工智能進步的階梯 22
1.7.1 明鑒歷史 23
1.7.2 預(yù)見未來 26
1.8 本章小結(jié) 27
第2章 知識圖譜模式設(shè)計 30
2.1 知識圖譜模式 32
2.2 模式與本體 35
2.2.1 本體 35
2.2.2 模式與本體辨析 37
2.3 本體概論 38
2.3.1 本體的構(gòu)成要素 39
2.3.2 本體分類 40
2.3.3 資源描述框架RDF 41
2.3.4 網(wǎng)絡(luò)本體語言O(shè)WL 42
2.3.5 知名本體介紹 44
2.4 模式設(shè)計的三大基本原則 52
2.4.1 賦予一類事物合適的名字 53
2.4.2 建立事物間清晰的聯(lián)系 54
2.4.3 明確、正式的語義表達 55
2.5 六韜法 56
2.5.1 場景 58
2.5.2 復(fù)用 59
2.5.3 事物 63
2.5.4 聯(lián)系 65
2.5.5 約束 67
2.5.6 評價 71
2.6 模式設(shè)計的工程模型 72
2.6.1 瀑布模型 72
2.6.2 螺旋模型 74
2.7 本章小結(jié) 76
第3章 實體抽取 78
3.1 實體、命名實體和實體抽取 80
3.2 基于規(guī)則的實體抽取 82
3.2.1 基于詞典匹配的實體抽取方法 83
3.2.2 編寫正則表達式抽取實體 84
3.2.3 基于模板的實體抽取方法 85
3.3 如何評價實體抽取的效果 88
3.4 傳統(tǒng)機器學(xué)習(xí)方法 91
3.4.1 概率圖模型 92
3.4.2 樸素貝葉斯模型 93
3.4.3 最大熵模型 95
3.4.4 隱馬爾可夫模型 100
3.4.5 條件隨機場 102
3.4.6 標記方法 106
3.4.7 用CRF++進行實體抽取 108
3.5 深度學(xué)習(xí)方法 114
3.5.1 基于深度學(xué)習(xí)的通用實體抽取框架 114
3.5.2 BiLSTM-CRF模型 117
3.5.3 預(yù)訓(xùn)練模型用于實體抽取 122
3.6 弱監(jiān)督學(xué)習(xí)方法 134
3.7 本章小結(jié) 136
第4章 關(guān)系抽取 138
4.1 關(guān)系和關(guān)系抽取 140
4.2 基于規(guī)則的關(guān)系抽取方法 145
4.2.1 詞法分析與依存句法分析 146
4.2.2 基于語法結(jié)構(gòu)的關(guān)系抽取 149
4.3 基于深度學(xué)習(xí)的關(guān)系抽取方法 154
4.3.1 關(guān)系分類 154
4.3.2 基于BERT的關(guān)系分類 158
4.4 實體-關(guān)系聯(lián)合抽取的方法 161
4.4.1 實體-關(guān)系聯(lián)合抽取方法 162
4.4.2 基于片段預(yù)測的實體-關(guān)系聯(lián)合抽取 165
4.5 弱監(jiān)督學(xué)習(xí)與關(guān)系抽取 171
4.5.1 引導(dǎo)法 171
4.5.2 遠程監(jiān)督 174
4.5.3 弱監(jiān)督學(xué)習(xí)與Snorkel 176
4.5.4 Snorkel用于關(guān)系抽取 179
4.6 本章小結(jié) 184
第5章 知識存儲 186
5.1 數(shù)據(jù)與知識存儲 188
5.1.1 數(shù)據(jù)存儲模型 188
5.1.2 知識存儲極簡史 189
5.2 圖數(shù)據(jù)庫模型 193
5.2.1 屬性圖模型 193
5.2.2 完整性約束 196
5.2.3 事務(wù)、ACID與BASE 200
5.2.4 查詢語言 202
5.3 JanusGraph分布式圖數(shù)據(jù)庫 202
5.3.1 JanusGraph的存儲模型 205
5.3.2 JanusGraph的屬性圖模式 209
5.3.3 事務(wù)和故障恢復(fù) 220
5.3.4 圖查詢語言Gremlin 221
5.3.5 JanusGraph和Gremlin入門指南 222
5.4 其他圖數(shù)據(jù)庫介紹 235
5.4.1 Neo4j 236
5.4.2 Dgraph 239
5.4.3 NebulaGraph 243
5.4.4 圖數(shù)據(jù)對比一覽表 246
5.5 本章小結(jié) 248
第6章 知識計算 250
6.1 知識計算及其數(shù)學(xué)基礎(chǔ) 252
6.1.1 知識圖譜與圖 252
6.1.2 圖論 253
6.1.3 鄰接矩陣 256
6.1.4 譜圖理論 257
6.2 遍歷與最短路徑算法 258
6.2.1 廣度優(yōu)先搜索 258
6.2.2 深度優(yōu)先搜索 260
6.2.3 Dijkstra單源最短路徑 262
6.2.4 最短路徑快速算法 265
6.2.5 Floyd算法 268
6.3 中心性 270
6.3.1 度中心性 270
6.3.2 親密中心性 272
6.3.3 中介中心性 274
6.3.4 特征向量中心性 279
6.3.5 PageRank 281
6.4 社區(qū)檢測 284
6.4.1 模塊度 286
6.4.2 GN社區(qū)檢測算法 290
6.4.3 Louvain社區(qū)檢測算法 291
6.5 知識計算工具與系統(tǒng) 297
6.5.1 圖數(shù)據(jù)庫計算框架 297
6.5.2 分布式圖計算引擎 298
6.5.3 圖分析工具包 298
6.6 本章小結(jié) 299
第7章 知識推理 300
7.1 知識的表示與推理 302
7.1.1 因果推理 303
7.1.2 演繹推理 303
7.1.3 歸納推理 304
7.1.4 概率推理 305
7.1.5 知識圖譜的推理技術(shù) 306
7.2 基于規(guī)則和邏輯的知識推理方法 308
7.2.1 基于規(guī)則的方法 308
7.2.2 基于邏輯的方法 311
7.2.3 定性時空推理 313
7.3 幾何空間嵌入的知識推理方法 316
7.3.1 歐幾里得空間的平移變換方法 317
7.3.2 復(fù)數(shù)向量空間的RotatE模型 330
7.3.3 雙曲空間嵌入的知識推理方法 334
7.4 知識推理的深度學(xué)習(xí)方法 353
7.4.1 卷積神經(jīng)網(wǎng)絡(luò)的知識推理方法 353
7.4.2 圖神經(jīng)網(wǎng)絡(luò)模型 358
7.5 本章小結(jié) 368
第8章 知識圖譜行業(yè)應(yīng)用 370
8.1 行業(yè)知識圖譜 372
8.1.1 行業(yè)知識圖譜的特點 372
8.1.2 行業(yè)知識圖譜的應(yīng)用價值 376
8.2 知識圖譜行業(yè)應(yīng)用范式 382
8.3 共通的應(yīng)用程序 385
8.3.1 數(shù)據(jù)與知識中臺 385
8.3.2 可視化與交互式分析 388
8.3.3 智能問答 391
8.3.4 認知推薦 396
8.3.5 輔助決策模型 400
8.4 金融 400
8.4.1 反洗錢和反恐怖融資 400
8.4.2 個人信用評估與風(fēng)險控制 402
8.4.3 企業(yè)風(fēng)險識別、控制與管理 404
8.4.4 系統(tǒng)性金融風(fēng)險 406
8.4.5 審計 407
8.4.6 證券分析與投資研究 408
8.4.7 保險 410
8.5 醫(yī)療、生物醫(yī)藥和衛(wèi)生健康 411
8.5.1 基因知識圖譜 411
8.5.2 生物醫(yī)藥 412
8.5.3 智慧醫(yī)療 414
8.5.4 公共衛(wèi)生 416
8.5.5 中醫(yī)藥知識圖譜 418
8.6 智能制造 418
8.6.1 設(shè)計研發(fā) 419
8.6.2 質(zhì)量與可靠性工程 420
8.6.3 設(shè)備的管理、維護與維修 422
8.6.4 BOM物料清單管理 425
8.6.5 供應(yīng)鏈管理 427
8.6.6 售后服務(wù) 428
8.7 本章小結(jié) 429
查看全部↓
精彩書摘
序一
《知識圖譜:認知智能理論與實戰(zhàn)》一書深入淺出地介紹了知識圖譜的知識,并且指出“知識圖譜是人工智能發(fā)展的階梯”。人工智能的目的在于處理知識,有知識圖譜這種形式化的知識表示方式作為階梯,人工智能當(dāng)然會取得蒸蒸日上的進步。我同意王文廣的這個觀點。
早在1956年于美國的達特茅斯學(xué)院召開的達特茅斯會議上,學(xué)者們就提出了“人工智能”的設(shè)想,此后人工智能迅速地發(fā)展起來。自然語言處理是人工智能的重要研究領(lǐng)域,在自然語言處理的研究中,學(xué)者們開始構(gòu)建自動推理模型對問題進行求解,提出了語義網(wǎng)絡(luò)、框架、腳本等一系列知識描述的理論和方法。
Sowa等人在1983年提出了“概念網(wǎng)絡(luò)”,對知識進行描述。根據(jù)符號主義的原則,學(xué)者們將實體之間的關(guān)系局限于“擁有、導(dǎo)致、屬于”等特殊的基本關(guān)系,并定義了一些在圖譜上推理的規(guī)則,希望通過邏輯推理的方式實現(xiàn)人工智能。
在這些知識描述理論和方法的基礎(chǔ)上,領(lǐng)域?qū)<议_始使用人工的方式編寫實例數(shù)據(jù),建立知識庫,這些研究在一些受限的領(lǐng)域獲得成功。學(xué)者們開始關(guān)注知識資源的研究。
互聯(lián)網(wǎng)出現(xiàn)之后,人們在與自然和社會的交互中創(chuàng)造了大規(guī)模的數(shù)據(jù),人類社會進入了大數(shù)據(jù)時代,這些大數(shù)據(jù)以文字、圖片、音頻、視頻等不同的模態(tài)存在。怎樣讓計算機自動識別、閱讀、分析、理解這些龐雜而海量的大數(shù)據(jù),從中挖掘出有價值的信息,為用戶提供精準的信息服務(wù),成為下一代信息服務(wù)的核心目標之一。
2001年,Tim Berners Lee提出了語義網(wǎng)的概念,定義了一種描述客觀世界的概念化規(guī)范,通過一套統(tǒng)一的元數(shù)據(jù),對互聯(lián)網(wǎng)的內(nèi)容進行詳細的語義標注,從而給互聯(lián)網(wǎng)賦予語義,把網(wǎng)頁互聯(lián)的萬維網(wǎng)(WWW)轉(zhuǎn)化為內(nèi)容互聯(lián)的語義網(wǎng)。在語義網(wǎng)思想的影響下,億萬網(wǎng)民協(xié)同構(gòu)建了“維基百科”(Wikipedia),促進了知識資源的迅速增長,使知識類型、覆蓋范圍和數(shù)據(jù)規(guī)模都達到了空前的水平。
1972年的文獻中就出現(xiàn)了“知識圖譜”(Knowledge Graph)這個術(shù)語。2012年5月,谷歌公司明確提出了知識圖譜的概念并構(gòu)建了一個大規(guī)模的知識圖譜,開啟了知識圖譜研究之先河。從此,知識圖譜便在自然語言處理的研究中普及開來,成為自然語言處理研究的一個重要內(nèi)容。
知識圖譜用節(jié)點(Vertex)表示語義符號,用邊(Edge)表示符號與符號之間的語義關(guān)系,因而構(gòu)成了一種通用的語義知識形式化描述框架。在計算機中,節(jié)點和邊等符號都可以通過“符號具化”(Symbol Grounding)的方式表征物理世界和認知世界中的對象,并作為不同個體對認知世界中信息和知識進行描述和交換的橋梁。知識圖譜使用統(tǒng)一形式的知識描述框架,便于知識的分享和學(xué)習(xí),因而受到了自然語言處理研究者的普遍歡迎。
自谷歌構(gòu)建知識圖譜,并在2012年發(fā)布了包含507億個實體的大規(guī)模知識圖譜以來,不少互聯(lián)網(wǎng)公司很快跟進,紛紛構(gòu)建各自的知識圖譜。例如,微軟建立了Probase,百度建立了“知心”,搜狗建立了“知立方”。金融、醫(yī)療、司法、教育、出版等各個行業(yè)也紛紛建立起各自垂直領(lǐng)域的知識圖譜,大幅提高了這些行業(yè)的智能化水平。Amazon、eBay、IBM、LinkedIn、Uber等公司相繼發(fā)布了開發(fā)知識圖譜的公告。與此同時,學(xué)術(shù)界也開始研究構(gòu)建知識圖譜的理論和方法,越來越多的關(guān)于知識圖譜主題的書籍和論文被出版和發(fā)表,其中包括新技術(shù)及有關(guān)知識圖譜的調(diào)查。知識圖譜得到了產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛認可和關(guān)注。
知識圖譜技術(shù)的發(fā)展有著深厚的歷史淵源,它源于對人工智能中自然語言的語義知識表示的研究,并經(jīng)歷了互聯(lián)網(wǎng)信息服務(wù)不斷深化需求的洗禮,現(xiàn)在已經(jīng)發(fā)展成為互聯(lián)網(wǎng)知識服務(wù)的核心工具。
以語義網(wǎng)絡(luò)(Semantic Network)為代表的知識表示的相關(guān)理論研究,對互聯(lián)網(wǎng)智能化信息處理的應(yīng)用實踐,以維基百科為代表的網(wǎng)絡(luò)協(xié)同構(gòu)建知識資源的創(chuàng)舉,這些因素共同推動了知識圖譜的進一步發(fā)展。
目前,大規(guī)模的知識圖譜有DBpedia、YAGO、Freebase、Wikidata、NELL、Knowledge Vault等,它們用豐富的語義表示能力和靈活的結(jié)構(gòu)來描述認知世界和物理世界中的信息和知識,是知識的有效載體。
《知識圖譜:認知智能理論與實戰(zhàn)》一書系統(tǒng)全面地介紹了知識圖譜的核心技術(shù),既有宏觀整體的技術(shù)體系介紹,也深入關(guān)鍵技術(shù)和算法細節(jié);既適合作為高等學(xué)校人工智能課程的參考資料,也可以作為產(chǎn)業(yè)界系統(tǒng)開發(fā)的指南。
馮志偉
中國中文信息學(xué)會會士
中國計算機學(xué)會 NLPCC杰出貢獻獎獲得者
2022年2月10日
序二
隨著數(shù)字化日漸成熟,知識圖譜的應(yīng)用正在廣泛滲透到C端用戶生活的方方面面,比如智能搜索。實際上,“知識圖譜”概念最早由谷歌在2012年提出,它能夠在反饋正確結(jié)果、給出全面總結(jié)、更深入廣泛探索三大方面優(yōu)化搜索效果。再比如電商智能推薦,阿里巴巴從2017年開始搭建電商認知圖譜,將用戶需求表達為圖中的節(jié)點,并將需求點和電商領(lǐng)域的商品、類目、電商外部的通用領(lǐng)域知識等關(guān)聯(lián)起來,從中挖掘客戶的購物偏好和潛在的感興趣的商品,使客戶與商品和場景更好地連接。此外,還有O2O領(lǐng)域線上線下生活場景圖譜,以美團為例,美團點評從2018年開始建立基于知識圖譜的美團大腦,在客戶、線下店鋪和商品及不同的消費場景之間構(gòu)建知識關(guān)聯(lián),從而優(yōu)化客戶的使用體驗。
在B端,知識圖譜在企業(yè)關(guān)聯(lián)和企業(yè)分析方向也有很好的應(yīng)用。比如對企業(yè)的法人或高管、企業(yè)之間的投資關(guān)系和關(guān)聯(lián)風(fēng)險進行分析,呈現(xiàn)在圖譜上會非常直觀。這種方式能夠使海量信息以十分有效的方式在短時間內(nèi)觸達使用者。
知識圖譜是企業(yè)將核心業(yè)務(wù)競爭能力和隱形數(shù)字資產(chǎn)融合形成新發(fā)展模式并獲得持續(xù)競爭優(yōu)勢的關(guān)鍵技術(shù),其應(yīng)用領(lǐng)域日趨廣泛,尤其在金融、醫(yī)療、制造等領(lǐng)域應(yīng)用中發(fā)揮了極其重要的作用。王文廣的這本書將知識圖譜核心內(nèi)容與深度學(xué)習(xí)技術(shù)融合,體系合理,理論完備,實踐豐富,語言深入淺出,是研究與應(yīng)用知識圖譜的優(yōu)秀參考書。
朱琳
微軟人工智能和物聯(lián)網(wǎng)實驗室前首席執(zhí)行官
微軟-儀電人工智能創(chuàng)新院總經(jīng)理
2022年3月13日
查看全部↓
前言/序言
近些年來,我一直在做計算機視覺、自然語言處理和知識圖譜等人工智能領(lǐng)域相關(guān)的理論研究和產(chǎn)品開發(fā)工作,針對不同行業(yè)的業(yè)務(wù)場景,為企業(yè)和機構(gòu)提供智能化的咨詢服務(wù)和應(yīng)用系統(tǒng)。同時,我也與頗多的高校和研究所共同合作,與不同研究方向的老師探討前沿技術(shù)和未來的發(fā)展方向。這些工作使我有足夠多的機會與不同背景、不同行業(yè)、不同工作方向和不同訴求的人進行交流,了解他們對人工智能,特別是知識圖譜相關(guān)的理論、技術(shù)和產(chǎn)品應(yīng)用等方面的看法和觀點。這些不同的見解也促使我對知識圖譜理論及其應(yīng)用進行思考,既有面向未來的理論發(fā)展方向,也有面向?qū)嵺`的技術(shù)落地應(yīng)用。
在思考的過程中,我萌生了寫書的念頭,而持續(xù)不斷的交流與思考則是鞭策我完成本書的原始動力。一方面,編寫技術(shù)圖書能夠讓我系統(tǒng)地總結(jié)前沿技術(shù)和應(yīng)用實踐,梳理以往深度思考的結(jié)果;另一方面,我也希望通過此書與更多不同行業(yè)、不同研究方向的人們進行交流——有關(guān)知識圖譜與認知智能的前沿研究成果、未來發(fā)展方向,以及技術(shù)應(yīng)用實踐等。
在有關(guān)知識圖譜的交流與思考中,我常常會聯(lián)想到人類自身是如何學(xué)習(xí)、記憶和使用知識的。事實上,認知智能本身就希望賦予機器像人類一樣的認知能力,特別是與人類一樣獲得知識和應(yīng)用知識的能力,而知識圖譜則是當(dāng)前認知智能研究的核心。知識圖譜構(gòu)建、存儲和應(yīng)用知識的機制,與人類學(xué)習(xí)、記憶和使用知識的機制有諸多共通之處。那么,什么是知識圖譜呢?
事實上,不同背景的人們對知識圖譜的理解大相徑庭。比如,有些人認為帶標簽的搜索是知識圖譜,這與他們見過的搜索引擎和知識庫的印象相符合,并且更為高級一些;有些人則認為圖數(shù)據(jù)庫就是知識圖譜,他們通常使用Neo4j 或 JanusGraph 等