聊點技術 | 全新功能,讓Bonree ONE變得更強
4月21日,博睿數(shù)據(jù)ONE有引力2023春季產(chǎn)品發(fā)布會圓滿落幕,Bonree ONE 2023春季正式版正式發(fā)布,帶來更輕、更強、更智能的一體化智能可觀測平臺。

全新功能,讓Bonree?ONE變得更強
本文作者
產(chǎn)品經(jīng)理高天明、產(chǎn)品經(jīng)理吳學飛、產(chǎn)品經(jīng)理袁澤璽、產(chǎn)品經(jīng)理張宇
全文共2676字,閱讀大約需15分鐘。
20w+超大規(guī)模探針采集
痛點難點
1.機房多,不同的區(qū)域網(wǎng)絡隔離,探針上報數(shù)據(jù)聯(lián)通配置復雜?
2.服務動態(tài)擴縮容時,探針隨進程停止而消亡,緩存數(shù)據(jù)無法上報?
3.流量峰值后端處理壓力大?

方案簡述
ONE平臺采用探針三層架構的方式,將SmartAgent和SmartGate根據(jù)網(wǎng)絡區(qū)域ID劃分上報路徑。SmartAgent和SmartGate同一網(wǎng)絡區(qū)域內(nèi)相互可見,SmartAgent根據(jù)鏈路負載策略選擇最佳上報路徑,平衡流量負載。

用戶價值
解決數(shù)據(jù)聯(lián)通問題:部署SmartAgent、SmartGate、配置簡單,通過配置一個網(wǎng)絡區(qū)域ID輕松搞定。

流量削峰、數(shù)據(jù)緩存,防止數(shù)據(jù)丟失:默認緩存650MB數(shù)據(jù),可配置緩存數(shù)據(jù)大小,自動滾動清除歷史數(shù)據(jù)。
SmartGate轉(zhuǎn)發(fā)能力強,資源消耗低:單機4CPU、8GB配置下,SmartGate最大接入支持4.1K個探針,資源消耗CPU:40%左右,內(nèi)存消耗220MB。
低代碼流式數(shù)據(jù)集成
產(chǎn)品概述
讓復雜的數(shù)據(jù)集成在幾分鐘內(nèi)通過可視化配置完成。
僅需 2 步,即建立數(shù)據(jù)接入平臺和Bonree間的連接,就可以快速構建數(shù)據(jù)流拓撲。且支持在數(shù)據(jù)流實時同步過程中按業(yè)務需求對數(shù)據(jù)模型和內(nèi)容進行復雜轉(zhuǎn)換和處理。

簡單、直觀、強大的數(shù)據(jù)集成
如此簡單
Bonree針對國內(nèi)外主流數(shù)據(jù)服務提供商及云平臺提供了開箱即用的特色數(shù)據(jù)接入解決方案。選配數(shù)據(jù)源,數(shù)據(jù)直達監(jiān)控平臺。

如此直觀
低代碼式數(shù)據(jù)流配置讓您直觀看到數(shù)據(jù)的處理流,無需埋頭分析冷冰冰的代碼。

如此強大
強大的數(shù)據(jù)處理組件,無論是結構/半結構/異構數(shù)據(jù)的各種數(shù)據(jù)結構數(shù)據(jù),在OneIntegration面前統(tǒng)統(tǒng)不在話下。

通過實體及關系提取,補充數(shù)據(jù)視角,規(guī)范數(shù)據(jù)體系。
200+技術組件輕松接入
方案簡述
ONE平臺采用SmartGate采集技術組件(中間件)的業(yè)務指標,支持自集成Exporter直接的部署,以及對接外部部署的Prometheus Exporter。覆蓋Prometheus已有的所有技術組件監(jiān)控對象類型。

用戶價值
開箱即用:內(nèi)置Redis、Redis Cluster、Kafka、MySQL、Tomcat、ES、Druid、Nginx、Zookeeper等9種技術組件的最佳實踐儀表盤,方便用戶快速巡檢對比。也支持用戶根據(jù)儀表盤自行搭建儀表盤,方便用戶個性化需求。

200+技術組件監(jiān)控輕松接入:配置接入方式統(tǒng)一,內(nèi)置技術組件和自定義組件接入步驟一致,在配置界面三步即可完成接入。

業(yè)務分析洞察業(yè)務和技術關聯(lián)
方案簡述
業(yè)務事件是ONE平臺業(yè)務分析的最小業(yè)務單元,在客戶的業(yè)務體系中每個業(yè)務事件都負責完成一種特定的業(yè)務目標(比如:登錄、查詢用戶信息、提交訂單等)。客戶可在ONE平臺配置業(yè)務事件采集規(guī)則,ONE探針(Smartagent、客戶端SDK)將會根據(jù)用戶配置規(guī)則自動采集業(yè)務事件并上報,包括:事件關鍵業(yè)務參數(shù)、事件關聯(lián)業(yè)務上下文等;已上報數(shù)據(jù)待系統(tǒng)自動進行事件注冊及指標聚合后即可在業(yè)務分析模塊及平臺其它通用功能(如:儀表盤、告警等)中消費使用。
業(yè)務事件采用標準cloudevent格式,支持數(shù)據(jù)集成;如客戶存在系統(tǒng)中關鍵業(yè)務參數(shù)加密不支持采集或客戶存在其它來源業(yè)務數(shù)據(jù)等情況,可通過自定義上報的形式向業(yè)務分析模塊集成數(shù)據(jù)后使用平臺業(yè)務分析能力。
用戶價值
業(yè)務事件分析:業(yè)務事件分析提供業(yè)務表現(xiàn)和系統(tǒng)質(zhì)量兩種視角,客戶可直觀感受對應業(yè)務的真實表現(xiàn)及業(yè)務關聯(lián)運維實體的質(zhì)量表現(xiàn),同時提供數(shù)據(jù)對比視圖及數(shù)據(jù)關聯(lián)追蹤能力,讓客戶能深入分析業(yè)務異常是否與系統(tǒng)質(zhì)量相關,如相關可繼續(xù)追蹤關鍵記錄以確認根因進行優(yōu)化修復。
事件業(yè)務表現(xiàn)

事件系統(tǒng)質(zhì)量

對比追蹤

業(yè)務線概覽:ONE平臺提供業(yè)務線概念供用戶進行業(yè)務事件管理,客戶可以根據(jù)組織內(nèi)的職責劃分將各個業(yè)務事件劃分到不同業(yè)務線下,并為業(yè)務線添加概覽儀表盤,以對整個業(yè)務線的業(yè)務相關情況進行關注。

業(yè)務流程分析:ONE業(yè)務分析模塊支持客戶按自己的實際業(yè)務路徑將業(yè)務事件組合定義為一個個業(yè)務流程,系統(tǒng)將自動根據(jù)業(yè)務事件上報數(shù)據(jù)為客戶提供對應業(yè)務流轉(zhuǎn)化、用戶體驗、業(yè)務事件表現(xiàn)相關的分析內(nèi)容,幫助客戶快速發(fā)現(xiàn)業(yè)務流程中的瓶頸節(jié)點并協(xié)助用戶判斷瓶頸的出現(xiàn)是否與用戶體驗相關。

業(yè)務全局視圖:業(yè)務全局視圖是ONE平臺業(yè)務分析模塊根據(jù)用戶已定義的業(yè)務流程及對應業(yè)務事件數(shù)據(jù)自動組織形成的業(yè)務流轉(zhuǎn)相關的全局視圖,此視圖可以幫助客戶了解自己業(yè)務體系的業(yè)務總體流轉(zhuǎn)情況及各流程直接的依賴情況,并給出用戶已存在的業(yè)務事件、業(yè)務線、業(yè)務流表現(xiàn)相關的見解。
全局視圖

業(yè)務見解

日志分析構建“真正”全鏈路可觀測場景
產(chǎn)品概述
解決用戶日志管理中的煩惱,專注挖掘日志中的業(yè)務價值。
簡單、強大、實惠的日志分析
如此簡單
平臺支持SmartAgent采集日志,無需配置,自動發(fā)現(xiàn)重要日志路徑。對于未檢測到的路徑,支持自定義數(shù)據(jù)源,極大地降低采集門檻。

如此強大
支持實時查看所有接入的日志:LIVETAIL模式支持實時查看所有接入的日志數(shù)據(jù),即使我們并沒有存儲它。在排查問題時,可實現(xiàn)多主機下的grep查詢。

指標數(shù)據(jù)基于全量日志生成,但是日志并不需要全量存儲:平臺支持基于全量接入的數(shù)據(jù)進行指標分析,可以基于全量的日志生成指標,以便分析日志的趨勢。
字段提取自動靈活:GROK自動生成解析規(guī)則,支持靈活的字段識別與標準屬性,對于復雜系統(tǒng)中多KEY同義字段可以實現(xiàn)串聯(lián)。
如此實惠
大容量的日志數(shù)據(jù),支持實時查看全量數(shù)據(jù),在保證整體可見度的情況,僅存儲部分日志,降低存儲成本。
操作分析洞察用戶體驗
什么是用戶體驗

數(shù)字業(yè)務是通過用戶和應用之間的交互來進行的。用戶操作,應用執(zhí)行其業(yè)務邏輯,最終反饋用戶,如此往復。用戶體驗就是衡量這個過程的順暢程度,要衡量用戶體驗,必須將用戶操作和應用的代碼執(zhí)行、反饋關聯(lián)起來。
行為和性能數(shù)據(jù)割裂
1.行為分析廠商只采集了用戶行為數(shù)據(jù),但在用戶操作之后,應用具體是如何反饋的,執(zhí)行了哪些代碼是無法知道的,也就無法度量應用質(zhì)量和用戶體驗。
2.傳統(tǒng)的客戶端應用性能廠商雖然采集了用戶行為和應用反饋數(shù)據(jù),但沒有將二者關聯(lián),也就無法度量應用質(zhì)量對用戶體驗的影響。
我們的方案
代碼級準確關聯(lián)用戶操作及之后應用執(zhí)行的方法。如:是否執(zhí)行了發(fā)送請求的方法?是否執(zhí)行了json解析?是否有奔潰卡頓等可能影響用戶體驗的方法?
熱點方法定位性能瓶頸
痛點難點
1.按條排查緩慢調(diào)用鏈,效率低,單條調(diào)用鏈定位到的緩慢方法不具備問題的共性解釋?
2.非埋點方法怎么定位執(zhí)行緩慢的問題?
方案簡述
ONE平臺采用采集調(diào)用鏈的同時,采集服務的堆棧快照。聚合堆??煺眨治鰲m敺椒ǖ呢暙I占比(棧頂方法出現(xiàn)的次數(shù))。通過貢獻占比TOP即可分析非埋點方法的執(zhí)行情況,定位服務緩慢的具體方法。
用戶價值
資源消耗低:對比傳統(tǒng)的代碼性能分析工具,性能損耗只占0.1~1.2%左右。
步驟簡單:無需手動部署性能分析工具,配置調(diào)試,開啟調(diào)用鏈采集即可。
及時性高:實時聚合堆棧信息,可分析任意一段時間內(nèi)的服務性能問題。
性能瓶頸分析:通過ONE平臺內(nèi)置的方法分類規(guī)則,可按磁盤IO、網(wǎng)絡IO、Lock等待、Waiting等待、業(yè)務代碼執(zhí)行查看服務運行占比高的功能分類,從而分析服務性能瓶頸。
