玩轉(zhuǎn)Zabbix智能告警:降噪、排班、認領(lǐng)、升級、IM協(xié)同

Zabbix作為一款流行的企業(yè)級監(jiān)控工具,可以監(jiān)控各種網(wǎng)絡(luò)設(shè)備和服務(wù)的狀態(tài),并提供強大的告警功能,能夠在出現(xiàn)異常情況時及時通知管理員。以下是Zabbix的一些特點:
支持多種監(jiān)控方式,包括SNMP、JMX、IPMI等,可以監(jiān)控各種網(wǎng)絡(luò)設(shè)備、服務(wù)器、虛擬化平臺等;
提供了豐富的監(jiān)控項和模板,可以輕松地監(jiān)控各種指標,如CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等;
提供了靈活的告警方式,可以通過郵件、短信、電話等方式通知管理員,并且可以根據(jù)不同的告警級別設(shè)置不同的通知方式。
盡管Zabbix在監(jiān)控和告警方面非常強大,但在處理告警事件方面仍有不足之處:
缺乏告警降噪和抑制風暴的能力;
沒有提供oncall值班調(diào)度的能力;
沒有提供IM工具內(nèi)閉環(huán)處理告警的能力;
告警協(xié)同處理能力薄弱,沒有數(shù)據(jù)沉淀和分析。
不僅僅是Zabbix,很多告警系統(tǒng)存在類似的問題,而FlashDuty正是為了解決這些問題而存在:
提供豐富的集成來源,支持接收Zabbix等告警事件,在一個平臺處理公司內(nèi)所有告警;
提供靈活的告警降噪、聚合、靜默、抑制、收斂能力,避免告警風暴,不錯過任何敏感信息;
提供強大的值班能力,支持各種排班場景,告警僅通知對的人;
打通飛書、釘釘和企業(yè)微信,真正做到在IM內(nèi)部隨時隨地處理告警;
提供完善告警協(xié)同、故障協(xié)同能力,支持知識沉淀和關(guān)鍵指標分析。
快速接入Zabbix告警
FlashDuty支持接入Zabbix 3.x~6.x 所有版本的告警事件。不同版本接入方式略有不同:
3.x~4.x版本:支持Script方式接入
5.x~6.x版本:支持Webhook方式以及腳本方式接入
Webhook接入方式(3步,詳情參照文檔,本文僅簡述):
下載并導入FlashDuty定制的Media Type,配置好URL等信息
關(guān)聯(lián)FlashDuty Media Type到一個User
創(chuàng)建Action,配置觸發(fā)、恢復與更新Operations通過FlashDuty Media Type發(fā)送信息到User
Script接入方式(4步,詳情參照文檔,本文僅簡述):
創(chuàng)建Script類型的Media Type,配置好Parameters
登錄 Zabbix server 所在服務(wù)器,切換到腳本目錄,下載并導入FlashDuty定制的推送腳本
關(guān)聯(lián)FlashDuty Media Type到一個User
創(chuàng)建Action,配置觸發(fā)、恢復與更新Operations通過FlashDuty Media Type發(fā)送信息到User。注意修改Default Message配置,F(xiàn)lashDuty將解析Message中加密的信息,來獲得更豐富的告警詳情
Zabbix告警詳情:
FlashDuty提取Zabbix告警詳情中的部分信息作為標簽

2.多條相關(guān)的原始告警信息將被合并到一條告警中,可以在關(guān)聯(lián)事件
中回溯

設(shè)定靈活的觸達策略
FlashDuty通知策略非常靈活,可以針對不同場景設(shè)定不同的通知策略:
支持按照
時間
和條件
來過濾事件,并發(fā)送到不同的人群;支持設(shè)置
聚合發(fā)送
窗口,如果在等待期內(nèi)告警自動恢復或被人工處理,則不會發(fā)送該條告警;支持單聊群聊通知方式,以及多樣的通知渠道。推薦以IM方式進行通知;
支持告警在不同人群中升級;

支持自定義通知模板渲染(Golang模板語法及上百種常用函數(shù)),配合預覽調(diào)試能力;

支持告警靜默、告警抑制,提前設(shè)定策略,減少不必要的告警通知。

設(shè)置專屬值班日歷
支持日常值班、節(jié)假日值班、臨時調(diào)班等值班場景,支持自定義值班角色等高級選項,可靈活擴展。

自定義值班角色為高級功能,需要聯(lián)系我們開通
在IM內(nèi)外處理告警
全面打通飛書、釘釘和企業(yè)微信,支持在聊天頁面直接處理告警,操作狀態(tài)將在多端同步,真正做到隨時隨地處理告警
首次登錄即完成賬戶關(guān)聯(lián),后續(xù)免登錄
提供關(guān)鍵功能按鈕,可以直接在卡片消息上操作
處理進度實時同步卡片,全員可見
以下分別為在飛書、釘釘和企業(yè)微信iOS客戶端內(nèi)處理告警過程:

?

?

查看告警治理趨勢分析
支持統(tǒng)計關(guān)鍵的告警治理指標:
支持告警、故障的MTTx指標按多維度統(tǒng)計;
支持告警、故障等數(shù)量統(tǒng)計;
支持TopK告警策略和告警對象發(fā)現(xiàn)。

最后
總的來說,F(xiàn)lashDuty可以彌補Zabbix等監(jiān)控系統(tǒng)在告警降噪、值班調(diào)度、告警協(xié)同處理等方面的不足。它支持多種告警來源,靈活的告警降噪和靜默功能,強大的值班能力,以及完善的告警協(xié)同、故障處理、趨勢分析能力。
如果您正在尋找一款更好的告警處理系統(tǒng),那么FlashDuty值得一試?,F(xiàn)在注冊(地址:https://console.flashcat.cloud/ ),自動獲得專業(yè)版14天試用機會!