您是否遇到過以下困擾:
業務問題:系統突發故障,多人緊急排查,還不一定能在短時間內找到故障所在,想要快速定位故障,怎么辦呢?
技術問題:告警事件太多了,如何從海量告警事件中處理甑別出有用的故障信息?
管理問題:工作人員每天要面對多個網管終端,靠人工在海量告警事件中人工去分辨出真實的故障信息,耗人又耗財?
如果以上問題困擾到您,別擔心,普坤科技的綜合網管解決方案來幫你解決煩憂!
綜合網管解決方案框架
綜合網管系統是通過特征告警觸發故障場景判斷,從服務關聯的進程和進程相關的機器開始向下逐個追溯資源匯集點,找到告警根因精確定位故障點,發出通知信息,進而進行故障修復。
系統建設主要效果:
1、多探針部署,每個網管對應一個探針,分割成小股流量先期壓縮過濾歸并
2、多級收斂,逐級壓縮,并設立告警白名單,分別處理打標簽
3、采集層收集了全量的探針處理后告警信息,并實時入庫
4、基于標簽,白名單告警送呈現層,此時的告警量已壓縮過濾了近90%
主要特點:
1、海量告警事件處理能力:分布式并行處理+多級壓縮機制,每日處理告警事件可以達數百萬級,并可根據系統負荷按照定義優先級自動過濾事件
2、靈活強大的告警關聯分析機制:包括告警間的關聯分析和客戶影響分析
3、直觀的告警顯示:統一的告警模型,可根據不同業務系統,將告警集中呈現
4、告警壓縮處理:多條重復告警,系統會壓縮歸并成一條,記錄初始發生的告警時間和最新發生的告警時間,同時累加告警次數