數(shù)據(jù)鏈DNA:可觀測助力云原生時代服務(wù)可達
2021年7月23日~25日,為期三天的iTechClub第五屆華北區(qū)互聯(lián)網(wǎng)技術(shù)精英高峰論壇在天津盛大開幕。本次論壇以“擁抱云原生”為主題,邀請華北區(qū)會員、互聯(lián)網(wǎng)行業(yè)和傳統(tǒng)行業(yè)技術(shù)高管作為本次峰會的參會者。

博睿數(shù)據(jù)產(chǎn)品管理部高級總監(jiān)孫麗女士應(yīng)邀發(fā)表了“數(shù)據(jù)鏈DNA賦能云原生可觀測性建設(shè)”的主題演講。

博睿數(shù)據(jù)產(chǎn)品管理部高級總監(jiān),云計算行業(yè)8年產(chǎn)品從業(yè)經(jīng)驗,負責APM產(chǎn)品規(guī)劃與建設(shè)
?
現(xiàn)如今,企業(yè)的數(shù)字化轉(zhuǎn)型給IT帶來了新的挑戰(zhàn),業(yè)務(wù)越來越豐富,迭代越來越快。Devops、容器、微服務(wù)、Serverless等技術(shù)在滿足業(yè)務(wù)發(fā)展的同時也帶來了運維監(jiān)控難的問題。如何在動態(tài)的復(fù)雜的IT系統(tǒng)中采集數(shù)據(jù)、匯總分析、告警、排障?顯然,傳統(tǒng)的人工配置探針、人工梳理數(shù)據(jù)關(guān)系是不現(xiàn)實的。如何實現(xiàn)在云原生時代服務(wù)的可觀測性建設(shè),基于自動化、智能化的應(yīng)用性能監(jiān)控(APM)監(jiān)控系統(tǒng),助力企業(yè)在在新的IT架構(gòu)下促進數(shù)字化的發(fā)展。
從監(jiān)控到可觀測,從Known到Unknown
監(jiān)控和可觀測性的根本區(qū)別究竟是什么?孫麗總給出了答案:Monitoring tells you whether the system works. Observability lets you ask why it’s not working.建設(shè)業(yè)務(wù)與系統(tǒng)的可觀測性意味著監(jiān)控系統(tǒng)從1.0走向2.0時代。

她表示,基于業(yè)務(wù)洞察的Code?to?Customer全鏈路觀測,是當前IT數(shù)字化轉(zhuǎn)型中系統(tǒng)運維的必然選擇。
以往“Monitoring”僅僅能夠簡單檢測系統(tǒng)健康情況,出現(xiàn)問題進行告警,知道系統(tǒng)是否正常工作;而“Observability”則是將檢查部分擴展到業(yè)務(wù)指標、系統(tǒng)日志等,并能夠進行根因分析和問題追蹤,獲知以往不可知部分。
?
云原生與微服務(wù)趨勢下,建設(shè)系統(tǒng)可觀測性成為必要
在云原生與微服務(wù)成為行業(yè)發(fā)展趨勢的前提下,更多全新的問題和挑戰(zhàn)出現(xiàn)了:
Devops普及對交付效率要求更高,持續(xù)構(gòu)建與發(fā)布對應(yīng)用戶體驗的影響以及故障時對用戶的影響如何評估?
微服務(wù)架構(gòu)模型下,系統(tǒng)復(fù)雜度更高,云、中間件、k8s、容器、業(yè)務(wù)、應(yīng)用等上下游更多,如何進行問題定位?
微服務(wù)架構(gòu),容器化部署下,實例生命周期更短。問題發(fā)生后環(huán)境和現(xiàn)場可能已被破壞,如何解決問題?

?
這一切問題,都能通過系統(tǒng)可觀測性建設(shè)得到答案。
可觀測性的建設(shè)包含如下幾個要點:1,數(shù)據(jù)的全面采集;2,Serverless的可觀測性能力建設(shè);3,數(shù)據(jù)的可觀測大屏。
Code To Customer是建設(shè)可觀測性的核心
Code?To?Customer即從代碼到用戶,這是博睿數(shù)據(jù)倡導(dǎo)的數(shù)據(jù)鏈DNA理念的核心,也是系統(tǒng)可觀測性建設(shè)的核心,它包含了從代碼端、網(wǎng)絡(luò)端、應(yīng)用端、服務(wù)端等全數(shù)據(jù)鏈的全面采集和監(jiān)控,當具備完整可檢測性的IT系統(tǒng)建立之后,自動化、智能化的應(yīng)用性能管理、數(shù)字化體驗管理和網(wǎng)絡(luò)性能管理等才能更好的發(fā)揮作用,構(gòu)建更加完備統(tǒng)一的運維體系。
?
博睿數(shù)據(jù)基于數(shù)據(jù)鏈DNA理念打造的解決方案,是以全面的telemetry data作為可觀測性的基礎(chǔ)的、創(chuàng)新構(gòu)建統(tǒng)一標準的運維指標體系的智能運維解決方案。
?

?
“D”—DEM(Digital Experience Management):
用戶數(shù)字體驗管理,包含客戶端APP體驗監(jiān)控、瀏覽器體驗監(jiān)控、小程序體驗監(jiān)控、瀏覽器撥測和手機撥測等一系列技術(shù)。博睿數(shù)據(jù)的DEM基于用戶會話的監(jiān)控視角和分析模型,是國內(nèi)DEM領(lǐng)域監(jiān)控工具中獨家具備了用戶會話及全量訪問事件的監(jiān)控和分析能力的產(chǎn)品。
?
“N”—NPMD(Network Performance Monitoring and Diagnostics):
網(wǎng)絡(luò)性能監(jiān)測和診斷,通過網(wǎng)絡(luò)嗅探、BigIP大數(shù)據(jù)引擎、Nginx Telemetry等技術(shù),從業(yè)務(wù)、應(yīng)用、系統(tǒng)、網(wǎng)絡(luò)、硬件幾個維度分析診斷,實現(xiàn)網(wǎng)絡(luò)傳輸?shù)穆窂桨l(fā)現(xiàn),異常發(fā)現(xiàn),故障發(fā)現(xiàn)。
?
“A”—APM(APPlication Performance Management):
應(yīng)用性能管理通過字節(jié)碼注入和微服務(wù)探針,無需應(yīng)用代碼變更的情況下實現(xiàn)對代碼運行效率、SQL調(diào)用效率、PaaS API調(diào)用邏輯追蹤,以及微服務(wù)的性能監(jiān)控。

?
數(shù)字化轉(zhuǎn)型帶來了IT系統(tǒng)迅速擴張,博睿數(shù)據(jù)所基于數(shù)據(jù)鏈DNA理念打造的智能運維解決方案,通過大數(shù)據(jù)平臺打通“云-管-邊-端”,將不斷擴大的IT系統(tǒng)各環(huán)節(jié)所產(chǎn)生的信息進行觀測收集,并結(jié)合數(shù)據(jù)的信息特征與業(yè)務(wù)流程、系統(tǒng)表現(xiàn)、用戶體驗各環(huán)節(jié)的特點進行特征關(guān)聯(lián),實現(xiàn)全系統(tǒng)觀測、實時預(yù)警、分布式追蹤以及代碼級問題預(yù)警解決,方案還基于機器學(xué)習、人工智能等技術(shù)不斷學(xué)習升級,提供更具業(yè)務(wù)價值的智能預(yù)警,從而保障用戶業(yè)務(wù)系統(tǒng)全環(huán)節(jié)的穩(wěn)定,助力云原生時代服務(wù)可達。