最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

多表 Join 查詢能力

2023-03-23 16:34 作者:程序員-王堅(jiān)  | 我要投稿

在構(gòu)建實(shí)時(shí)數(shù)據(jù)分析的場景中,我們常在數(shù)據(jù)加工的過程中,將多張表通過一些關(guān)聯(lián)字段打平成一張寬表,通過一張表對(duì)外提供分析能力,即大寬表模型。其實(shí)大寬表依然有它的局限性,一是,生成每一張大寬表都需要數(shù)據(jù)開發(fā)人員不小的工作量,而且生成過程也需要一定的時(shí)間;二是,生成寬表會(huì)產(chǎn)生大量的數(shù)據(jù)冗余。

?

針對(duì)寬表模型的局限性,我們從 0 到 1 自研實(shí)現(xiàn)了查詢優(yōu)化器,非常好的支持復(fù)雜查詢的需求,有如下特性:

  1. 兼容兩種 SQL 語法,支持 ANSI SQL 和原生 CLICKHOUSE SQL ;

  2. 支持基于 RBO 優(yōu)化能力,即支持:列裁剪、分區(qū)裁剪、表達(dá)式簡化、子查詢解關(guān)聯(lián)、謂詞下推、冗余算子消除、Outer-JOIN 轉(zhuǎn) INNER-JOIN、算子下推存儲(chǔ)、分布式算子拆分等常見的啟發(fā)式優(yōu)化能力;

  3. 支持基于 CBO 優(yōu)化能力,基于 Cascade 搜索框架,實(shí)現(xiàn)了高效的 Join 枚舉算法,以及基于 Histogram 的代價(jià)估算,對(duì) 10 表全連接級(jí)別規(guī)模的 Join Reorder 問題,能夠全量枚舉并尋求最優(yōu)解,同時(shí)針對(duì)大于 10 表規(guī)模的 Join Reorder 支持啟發(fā)式枚舉并尋求最優(yōu)解。CBO 支持基于規(guī)則擴(kuò)展搜索空間,除了常見的 Join Reorder 問題以外,還支持 Outer-Join/Join Reorder,Magic Set Placement 等相關(guān)優(yōu)化能力;

  4. 分布式計(jì)劃優(yōu)化,面向分布式 MPP 數(shù)據(jù)庫,生成分布式查詢計(jì)劃,并且和 CBO 結(jié)合在一起。相對(duì)業(yè)界主流實(shí)現(xiàn):分為兩個(gè)階段,首先尋求最優(yōu)的單機(jī)版計(jì)劃,然后將其分布式化。我們的方案則是將這兩個(gè)階段融合在一起,在整個(gè) CBO 尋求最優(yōu)解的過程中,會(huì)結(jié)合分布式計(jì)劃的訴求,從代價(jià)的角度選擇最優(yōu)的分布式計(jì)劃。對(duì)于 Join/Aggregate 的還支持 Partition 屬性展開。

  5. 高階優(yōu)化能力,實(shí)現(xiàn)了 Dynamic Filter pushdown、單表物化視圖改寫、基于代價(jià)的 CTE (公共表達(dá)式共享)。


多表 Join 查詢能力的評(píng)論 (共 條)

分享到微博請遵守國家法律
桐城市| 水富县| 岳阳市| 景德镇市| 宣恩县| 宽城| 通山县| 定日县| 锦屏县| 从江县| 凯里市| 孝感市| 晴隆县| 梓潼县| 万宁市| 南雄市| 台北市| 共和县| 仙游县| 东兰县| 福贡县| 灵丘县| 阿尔山市| 天台县| 安平县| 日喀则市| 福建省| 洪江市| 哈尔滨市| 阿尔山市| 孟州市| 庆元县| 延庆县| 白河县| 南丹县| 和静县| 通江县| 江油市| 重庆市| 井研县| 勐海县|