玩轉(zhuǎn)分布式架構(gòu)下的可觀測(cè)性

可觀測(cè)性背景
云原生可觀測(cè)性是從傳統(tǒng)軟件監(jiān)控及數(shù)據(jù)分析可視化工具中,總結(jié)出在云原生領(lǐng)域中,從底層容器基礎(chǔ)設(shè)施、通用技術(shù)組件到業(yè)務(wù)應(yīng)用系統(tǒng)全鏈路監(jiān)控運(yùn)維、運(yùn)營(yíng)治理等產(chǎn)品化體系化的能力訴求。
可觀測(cè)性是云原生技術(shù)架構(gòu)的重要特征,確切的體現(xiàn)了云原生的核心理念,自提出就被廣泛的認(rèn)可
實(shí)現(xiàn)可觀測(cè)性需要什么能力?
可觀測(cè)性的三大支柱Metrics、Trace、Log (指標(biāo)、鏈路、日志):

當(dāng)前,在Metrics與logging方面基于原有技術(shù)架構(gòu)有眾多較為成熟的解決方案,如聚焦于Metrics的Prometheus+、聚焦于logging的ELK解決方案。但是對(duì)于tracing的解決方案,多種多樣,如開(kāi)源的skywalking、jaeger等。
使用開(kāi)源產(chǎn)品面臨的問(wèn)題有哪些?
由于tracing的解決方案無(wú)論從底層技術(shù)門(mén)檻還是使用者自身業(yè)務(wù)復(fù)雜度都相對(duì)較高,采用免費(fèi)開(kāi)源的產(chǎn)品在實(shí)際使用中會(huì)遇到各種問(wèn)題,如:
采集端探針性能損耗過(guò)大,影響現(xiàn)有業(yè)務(wù);
需獨(dú)立配置數(shù)據(jù)存儲(chǔ),數(shù)據(jù)量大,成本高;
使用者業(yè)務(wù)架構(gòu)不能百分百兼容適配,需二次開(kāi)發(fā);
....
基于以上原因,使用者更傾向于選擇更加成熟的解決方案
Bonree Server通過(guò)嵌入Smartagent探針,自動(dòng)識(shí)別后端服務(wù),通過(guò)業(yè)務(wù)拓?fù)?、?yīng)用拓?fù)淝逦宫F(xiàn)調(diào)用邏輯關(guān)系,概覽系統(tǒng)全局。全面實(shí)時(shí)獲取服務(wù)端性能數(shù)據(jù),通過(guò)應(yīng)用、組件、集群、容器及代碼等逐層深入分析,最終從代碼層和環(huán)境層幫助企業(yè)定位分析自身服務(wù)端性能問(wèn)題,提高云原生服務(wù)可觀測(cè)性。
功能優(yōu)勢(shì)
1、分布式鏈路檢索和分析
通過(guò)代碼級(jí)調(diào)用跟蹤技術(shù),自動(dòng)繪制服務(wù)拓?fù)洌ㄟ^(guò)traceID和業(yè)務(wù)數(shù)據(jù)檢索調(diào)用鏈,快速定位慢調(diào)用、慢方法、慢SQL和錯(cuò)誤調(diào)用、方法異常。

2、拓?fù)渥詣?dòng)發(fā)現(xiàn)
支持在系統(tǒng)、應(yīng)用、服務(wù)、接口、實(shí)例等各級(jí)別進(jìn)行監(jiān)控分析。自動(dòng)拓?fù)浒l(fā)現(xiàn),上下游的影響依賴(lài)一目了然。

3、智能告警
通過(guò)智能的時(shí)序數(shù)據(jù)異常檢測(cè)和預(yù)測(cè)發(fā)現(xiàn)問(wèn)題,可靈活定義告警策略、告警通知渠道。

4、主機(jī)和實(shí)例監(jiān)控

5、靈活配置
服務(wù)和接口識(shí)別、自定義熱點(diǎn)方法、參數(shù)采集、健康度、黑白名單等靈活配置
