全場景式全流程監(jiān)控,博睿數(shù)據(jù)為券商IT運維難題提供范例
在金融科技浪潮以及證券行業(yè)生態(tài)競爭加劇的多重因素下,數(shù)字化轉型已成為券商未來發(fā)展的全新戰(zhàn)略高地。
2020年8月,中國證券業(yè)協(xié)會發(fā)布了《關于推進證券行業(yè)數(shù)字化轉型發(fā)展的研究報告》,其中提到,我國證券行業(yè)在信息技術投入方面經(jīng)歷了以交易無紙化為重點的電子化階段、以業(yè)務線上化為重點的互聯(lián)網(wǎng)證券階段,目前正處于向數(shù)字化轉型階段。

此外,隨著數(shù)字技術漸趨成熟,為證券行業(yè)探索“新業(yè)態(tài)、新模式”創(chuàng)造了條件,尤其是疫情防控催生金融服務線上化需求,為證券行業(yè)數(shù)字化轉型發(fā)展提供了契機。如何推進證券行業(yè)數(shù)字化轉型,以科技賦能業(yè)務發(fā)展,從而實現(xiàn)證券公司高質(zhì)量發(fā)展,成為擺在資本市場重要參與主體面前的重大課題。
證券行業(yè)屬于高度信息化行業(yè),早已“贏在起跑線上”。但即便如此,數(shù)字化技術的應用還是在一定程度上改變了證券行業(yè)的傳統(tǒng)商業(yè)模式,以及運維、運營、風控等傳統(tǒng)工作方式,給證券行業(yè)帶來了前所未有的機遇與挑戰(zhàn)。
同時,券商隊伍日益健壯,金融業(yè)務不斷延長,摩根大通等外資券商的入局也對行業(yè)帶來“鯰魚效應”,市場對券商的服務質(zhì)量與服務效率提出了更高的要求。
這倒逼券商紛紛開展以IT技術為核心的數(shù)字化轉型,提升市場競爭力,越來越多的科技型券商紛紛出圈,引領數(shù)字化轉型潮流。
監(jiān)控被動成券商用戶體驗“硬傷”
伴隨近些年人工智能技術的蓬勃發(fā)展與推廣使用,IT運維領域也逐漸展現(xiàn)新的演進趨勢,智能運維逐漸成為各金融企業(yè)應對新業(yè)態(tài)、發(fā)展金融科技的強有力抓手之一。隨著證券業(yè)務的迅速發(fā)展,IT的規(guī)模也越來越大;原來豎井式的IT系統(tǒng)管理和運維平臺工具建設的模式越來越不適應實際需求規(guī)模的擴大同樣帶來資源無法有效利用,原有工具分散建設未能統(tǒng)一規(guī)劃數(shù)據(jù)共享,給成本核算帶來影響;資源精細管理缺乏數(shù)據(jù)支持,存在一定程度的浪費,不利于資源的有效利用。支持業(yè)務創(chuàng)新能力不足,應用越來越復雜,需要記錄系統(tǒng)邏輯架構、評審記錄、應用相關配置;應用規(guī)模越來越大,更新速度加快,要求自動化、彈性交付等都無法滿足。
對于運維內(nèi)部來講,人員精力陷于人工溝通、手工數(shù)據(jù)搜集等工作,技能提升慢成就感低,單一資源請求需要反復提交多個申請單才能完成,緊急需求無法滿足,缺乏流程進度跟進,用戶無法獲知請求處理情況,用戶體驗較差。
為了應對戰(zhàn)略轉型下的IT系統(tǒng)運維管理難題,需要構建統(tǒng)一運維管理平臺,統(tǒng)一納管資源,IT基礎資源的分配、回收、日常操作和監(jiān)控通過平臺自動化完成;IT系統(tǒng)監(jiān)控指標自動采集,根據(jù)預先設定的規(guī)則處理性能狀態(tài)數(shù)據(jù),實時告警;運維流程納入線上管理,結合監(jiān)控和自動化工具,嚴格控制變更和操作風險;同時就IT整體運行情況定期出具運營報告,根據(jù)容量管理指引對容量趨勢做分析,為運營管理提供數(shù)據(jù)支撐。
需要注意的是,證券系統(tǒng)關系到用戶的資產(chǎn)信息,天然敏感度極高。交易系統(tǒng)的響應時延和穩(wěn)定性直接影響用戶的利益。
監(jiān)管機構對開市期間的核心交易系統(tǒng)的故障有一個5分鐘的紅線。系統(tǒng)不可用超過5分鐘可能面臨嚴重的處罰。
其次,隨機波動的行情給業(yè)務系統(tǒng)的穩(wěn)定運行帶來了極大挑戰(zhàn)。毫不夸張的說,當行情來臨時,天天都是雙十一。但是,就跟拆盲盒一樣,你永遠也不知道雙十一會在哪天到來。
第三,由于缺乏有效的性能測試結果作為參考基準,應用系統(tǒng)的部署主要依靠人工經(jīng)驗來推算。當故障來臨時,只能被動應對。
第四,復雜的架構導致線上故障定位困難。證券行業(yè)核心交易系統(tǒng)長期依賴外購,但是近些年業(yè)務創(chuàng)新對我們的軟件交付速度提出了更高的要求。

因此,對于證券行業(yè)而言只有深入運維一線,才能獲得最真實的數(shù)據(jù),只有摸清客戶最基本的需求,才能拿出有針對性的解決方案,才能兼顧‘用得容易’和‘解決問題’兩個方面的問題。
此外,艾媒咨詢發(fā)布《2020年中國互聯(lián)網(wǎng)證券行業(yè)發(fā)展狀況研究報告》顯示,中國證券類APP用戶規(guī)模穩(wěn)定增長,2019年達到1.11億人,2020年預計增至1.29億人。券商APP用戶在迅速增長。這促使用戶對于券商移動端應用的兼容性、功能性、性能效率等眾多維度產(chǎn)生更高要求。
全景式監(jiān)控全流程,化被動為主動
基于此,博睿數(shù)據(jù)的睿視數(shù)據(jù)可視化分析平臺幫助客戶實現(xiàn)運維從工具化向自動化、智能化方向的演進。從用戶的實際情況出發(fā),以數(shù)據(jù)作為切入點進行面向業(yè)務的數(shù)據(jù)可視化分析,解決目前運維管理中面臨的一些實際問題。達到提升業(yè)務連續(xù)性管理水平,提升運維管理水平,從而最終提升IT服務質(zhì)量及用戶滿意度。
通過網(wǎng)絡旁路鏡像的方式,7*24 小時實時采集數(shù)據(jù)中心關鍵 網(wǎng)絡節(jié)點的網(wǎng)絡流量。對現(xiàn)有網(wǎng)絡、應用不產(chǎn)生任何影響;并且采用集中管理的方式,管控分離的方式進行穩(wěn)定多級的 管理,并且可以針對不同的角色進行權限控制。

在網(wǎng)絡性能監(jiān)控層面,通過Reesii提供的數(shù)據(jù)進行優(yōu)化,經(jīng)過優(yōu)化后明顯提升數(shù)據(jù)中心內(nèi)部的網(wǎng)絡質(zhì)量,目前各網(wǎng)絡區(qū)域的網(wǎng)絡評分大部分接近滿分,個別區(qū)域未優(yōu)化完的也保持在95分以上。

在端到端場景監(jiān)控層面實現(xiàn)了從客戶端到交易主機各個應用節(jié)點的訪問關系路徑和詳細網(wǎng)絡指標端到端的可視化。并且可針對各訪問節(jié)點網(wǎng)絡參數(shù)的整體時間趨勢的可視化,能夠分鐘級快速定位故障到某一單一節(jié)點并且提供對該節(jié)點故障的下鉆智能分析,快速解決應用端到端故障。

在專線鏈路場景監(jiān)控層面,突破傳統(tǒng)運維只能通過單 一維度關注線路的情況以及排障盲點。以地圖的形式更生動直觀地對所有專線實現(xiàn)可視化。結合智能告警和多維度指標多視角對線路當前情況有更全面的了解。

在根因分析及告警方面,突破傳統(tǒng)運維告警通過一刀切的閾值設置方式,增加更加靈活的告警設置策略,降低運維人員對業(yè)務告警策略的設置難度,也減少了對變化莫測的數(shù)據(jù)業(yè)務量配置的工作量;提供更加準確的有效告警信息,從而進行下鉆分析直至定位到具體對象。

并且,針對告警重要程度進行告警層級區(qū)分,對不同機房和告警應用策略類型占比也做了差異化處理,并且可以統(tǒng)計機房內(nèi)部業(yè)務網(wǎng)絡分區(qū)告警分布情況,可更細粒度定位告警來源區(qū)域和類型。
綜上,博睿數(shù)據(jù)不僅可以為客戶清晰直觀監(jiān)控每個場景的網(wǎng)絡情況,問題出現(xiàn)時直觀展示在監(jiān)控界面上; 而且可以幫助券商提高客戶的排障能力,并對歷史問題提供了回溯功能,責任界定更清晰。