圖數(shù)據(jù)管理與挖掘-第六講 知識(shí)圖譜與圖數(shù)據(jù)庫(kù)(2)-北京大學(xué)2021暑期-鄒磊教

PART 1:RDF圖數(shù)據(jù)模型 & SPARQL查詢語(yǔ)言



RFG圖(邊==主謂賓的線)

RDF字面值(只出現(xiàn)在客體)

RDF空白節(jié)點(diǎn)(用來(lái)引入更多元的關(guān)系、結(jié)構(gòu)化數(shù)據(jù)值)

RDF Schema (RDFS)

有一些核心類,核心屬性,便于定義一套通用的基礎(chǔ)定義工具
SPARQL查詢語(yǔ)言

SPARQL語(yǔ)法

from/from named 默認(rèn)圖/指定圖
查詢方式:


最基本:三元組模式<每個(gè)元素內(nèi)部都允許出現(xiàn)變量V>

【圖模式】的遞歸定義
(基本圖模式只是其中的一種)

【組圖模式】【聯(lián)合圖模式】

操作符優(yōu)先級(jí)(高到低):
- (group)
- UNION
- AND
- OPTIONAL(左結(jié)合)
- FILTER
圖模式二叉樹(shù)示例

SPARQL結(jié)果修飾

- 選擇
- 投影(會(huì)去重)
- 并集
- 要求相容:屬性數(shù)目相同(同元)且一一對(duì)應(yīng)
- 差集
- 要求相容
- 笛卡爾積
- 自然連接?:在某個(gè)公共屬性B傷相等的所有元組的去重組合
- θ連接:從兩個(gè)關(guān)系的廣義笛卡爾積中選取給定屬性間滿足一定條件的元組
- θ是算術(shù)比較符,它為等號(hào)時(shí)該運(yùn)算可稱為等值連接
- 外連接:避免自然連接時(shí)因失配導(dǎo)致信息丟失,在其中一個(gè)表設(shè)置一個(gè)懸掛空行,和另一個(gè)表的任何一個(gè)未匹配元組都能匹配
- 外連接=自然連接+未匹配元組
- 分為左外/右外/全外連接,X外即為加上X側(cè)表中的未匹配元組
- 外連接不滿足結(jié)合律
匹配

匹配的互相兼容

圖模式在RDF數(shù)據(jù)集上的執(zhí)行結(jié)果:

新特性:屬性路徑、聯(lián)邦查詢(分布式)
====
PART 2:屬性圖模型和Cypher查詢語(yǔ)言
背景:neo4j

和三元組的區(qū)別:屬性圖中的點(diǎn)只可能是實(shí)體,不存在屬性值的點(diǎn)

值

圖

表

查詢示例

<介紹了一系列cypher中的子句,原理和前面的類似,只不過(guò)因?yàn)檫@兩個(gè)模型的固有差異所以看起來(lái)會(huì)有一些不同>
Cypher語(yǔ)言語(yǔ)法
- 表達(dá)式
- 圖模式
- 點(diǎn)模式:三元組 (a, L, P) ,對(duì)應(yīng)于所查詢的店的【變量名,標(biāo)簽集合,在屬性上需要滿足的條件】
- 關(guān)系模式:五元組 (d, a, T, P, I) ,對(duì)應(yīng)于所查詢關(guān)系的【方向,變量名,需要滿足的邊類型集合,在邊屬性上需要滿足的條件,可以對(duì)應(yīng)多少條邊】
- 子句(table to table的函數(shù))
- 查詢(子句的組合+RETURN結(jié)尾,或他們的并)
====
PART 3:TinkerPop圖計(jì)算框架與Gremlin圖遍歷語(yǔ)言及遍歷機(jī)
背景

和SPARQL不一樣:是函數(shù)式語(yǔ)言,需要指定各種操作過(guò)程


<講了這種復(fù)雜但靈活的圖遍歷語(yǔ)言的多種遍歷模式>
