ONE 2.0應(yīng)用場景解讀 | 如何通過時序拓撲直觀還原故障傳導(dǎo)鏈路?


近年來,隨著數(shù)字化轉(zhuǎn)型的不斷推進,電子商務(wù)發(fā)展迅速,推動人們的購物行為隨之發(fā)生轉(zhuǎn)變,在線購物已成為人們的主要購物方式之一。相關(guān)數(shù)據(jù)表明,超過九成的中國網(wǎng)民使用過在線購物平臺。
面對龐大的在線用戶流量,購物網(wǎng)站的業(yè)務(wù)規(guī)模和復(fù)雜程度不斷提升,維護系統(tǒng)穩(wěn)定性的重要程度和難度也隨之增大。當故障問題產(chǎn)生時,如何直觀地還原故障傳導(dǎo)鏈路,快速定位和解決問題,就成為了重中之重。
Bonree ONE 2.0設(shè)計的初衷,便是將所有運維訴求“ALL in ONE”,讓IT運營更智能、讓業(yè)務(wù)創(chuàng)新更高效、讓問題解決更快速。對于客戶來說,開箱即用、操作便捷,使用第一個功能可以解決的問題就不需要再點擊第二個功能。
四大場景提升網(wǎng)站應(yīng)用性能與用戶體驗
一、用戶登錄網(wǎng)站購物時遇到問題,如何進行故障定位
Bonree One 2.0可深度還原故障場景,并將其轉(zhuǎn)化為為IT語言,通過查看前端問題,關(guān)聯(lián)整體調(diào)用鏈,展示調(diào)用鏈樹和代碼,快速定位故障,找到緩慢代碼,助力快速解決問題。
操作步驟
步驟一:該購物網(wǎng)站登錄、搜索產(chǎn)品、選擇產(chǎn)品、付費、登出的全過程;
步驟二:在Bonree ONE 2.0平臺中找到該次用戶會話,還原使用過程,查看后端緩慢問題;



步驟三:跳轉(zhuǎn)到調(diào)用鏈,展示調(diào)用鏈樹,展示調(diào)用架構(gòu),找到緩慢的代碼調(diào)用的耗時分析、錯誤、日志等;




步驟四:通過端到端的能力,反向查找用戶會話。


二、主動模擬故障發(fā)生場景,進行智能告警與根因分析
Bonree ONE 2.0的智能告警可以做到真正意義上告知用戶問題及根因,同時依賴獨家根因智能算法和模型,不依賴人工調(diào)參,無監(jiān)督自動學習;也可接受人工結(jié)果反饋,自動修正模型提高結(jié)果準確性,實現(xiàn)低成本、高靈活度、高準確性的智能根因分析能力。
操作步驟
步驟一:在故障中找到智能根因分析產(chǎn)生的告警信息,展示告警信息的內(nèi)容;


步驟二:展示根因分析結(jié)果,與模擬的故障相符;


步驟三:通過根因回放,呈現(xiàn)故障產(chǎn)生的過程。


三、用戶訪問量下降,監(jiān)測后端服務(wù)響應(yīng)時間是否異常
面對用戶訪問量下降、訪問異常等情況,Bonree ONE 2.0可對后端服務(wù)響應(yīng)時間進行監(jiān)測,以此診斷系統(tǒng)是否存在故障,助力快速排障。
操作步驟
步驟一:查看過去一段時間的用戶訪問量,并做同期對比,發(fā)現(xiàn)訪問量下降;

步驟二:分析用戶訪問量下降的原因,同時發(fā)現(xiàn)用戶訪問緩慢;
步驟三:利用數(shù)據(jù)分析模塊,將與用戶訪問量相關(guān)的指標(如后端服務(wù)響應(yīng)時間等)進行對比分析,發(fā)現(xiàn)隨著服務(wù)響應(yīng)時間變長,用戶訪問量下降;

步驟四:點擊服務(wù)響應(yīng)時間峰值點,查看相關(guān)調(diào)用鏈,發(fā)現(xiàn)數(shù)據(jù)庫該時間段訪問緩慢,查找數(shù)據(jù)訪問緩慢原因,如某項SQL語句邏輯有問題;

步驟五、問題解決后,用戶訪問量恢復(fù)。
四、監(jiān)控面板功能與流程
操作步驟
步驟一:通過儀表盤,展示關(guān)鍵指標,以及儀表盤的篩選、刷新、輪播等功能;

步驟二:儀表盤出現(xiàn)告警的處理流程,如關(guān)聯(lián)用戶會話、調(diào)用鏈,進行診斷。




Bonree ONE 2.0憑借穩(wěn)健的技術(shù)底盤和強大的中臺能力,支撐了多個應(yīng)用場景,不僅覆蓋了 IT運維監(jiān)控,還做到了向左支持敏捷開發(fā),向右支撐業(yè)務(wù)運營,形成了真正的一體化智能可觀測平臺。