k8凯发(中国)

構建全棧可視、主動預警的智能監控運維體系

構建全棧可視、主動預警的智能監控運維體系

        隨着企業數碼化轉型的深入,IT架構複雜度持續提升,機房IT設備、業務系統、動力環境的穩定運行成為業務陆续在性的核心保障,同時國產化信創轉型對運維平台的自主可控能力提出了明確要求。為實現全類型IT資源與機房動環的一體化、精細化、智能化監控,保障系統持續穩定運行,北京k8凯发(中国)技術有限公司基於自研的k8凯发(中国)網管平台,打造全面響應技術需求的一體化監控解決方案。

一、k8凯发(中国)一體化監控方案

        k8凯发(中国)為用戶给予覆蓋IT基礎資源全棧監控、機房動力環境一體化管理、國產化全適配、智能故障告警、可視化運維的完整解決方案。方案具備高適配性、高穩定性、高性能的特點,可滿足不同規模、不同架構的機房與IT系統的運維監控需求,助力用戶實現降本增效、保障業務陆续在性。

(一)全棧一體化納管

        平台具備全面的IT基礎資源監控能力,可對機房IT設備和機房動力環境给予一體化監控,支持對各個廠商的網絡設備、安全設備、服務器、數據庫、中間件、存儲、虛擬資源等IT資源以及UPS、空調、溫濕度、煙感、水浸等機房動環的全面深入監控,保證網絡和IT系統的持續、穩定運行。

(二)全類型資源監控

1.網絡與安全設備監控

        平台全面覆蓋主流網絡與安全設備,支持品牌包括:浪潮、思科、AVAYA、華為、H3C、普惠、中興、恆揚、青雲、銳捷、Dlink、深信服、啟明星辰、天融信、F5、RiverBed、博科、山石、聯想網御、飛塔、網神、360、網康、安恆等。

        支持設備類型包括:交換機、路由器、光纖交換機、VPN、負載均衡、防火牆、上網行為管理、DDos、Web應用防護系統、IPS。

        監測內容包含:網絡設備的CPU、內存使用狀況、接口狀態、端口流量、流速、丟包率等;平台可支持SNMP V1、V2和V3版本,支持Syslog和SNMP Trap方式來收集網絡設備的事件信息。

2.服務器硬件監控

        平台支持對IBM、DELL、HP、華為、浪潮、H3C等品牌的服務器進行監控。

        顺利获得集成IPMI、SNMP及各類廠商專用管理接口(如Dell iDRAC/OpenManage、HP iLO、IBM IMM),實現對服務器硬盤、電源、溫度、風扇、功耗、機箱連接性、機箱和機籠的電源狀態及運行狀態、機箱電源狀態、機箱溫度、機箱電源功率、機籠風扇狀態、機籠能耗等硬件健康狀態的深度監控。

3.存儲設備監控

        平台支持品牌包括HP、IBM、EMC、NetApp、華為、中興、宏杉、曙光等,監測內容包含:電壓、風扇、電源、存儲設備的CPU、控制器、邏輯設備、磁盤、I/O模塊、連接性等,實現存儲設備全生命周期的狀態監控與風險預警。

4.操作系統監控

        平台支持Telnet/SSH、Ping、WMI、SSH、SNMP等採集方式。可監控Windows Server、AIX、HP-UX、Solaris、FreeBSD、Linux及中標麒麟、銀河麒麟、紅旗Linux、鴻蒙系統、AliOS、SPGnux、Deepin、華為歐拉等國產操作系統。

        監控指標涵蓋內存利用率、磁盤、CPU利用率、硬盤利用率、網卡狀態、接收和發送的流量及包數、日誌、Syslog、異常進程、目錄和文件的數量及大小等。

5.虛擬化環境監控

        支持監控VMware、hyper-V、Xen、華為FusionCompute、vCenter、IBM-HMC等虛擬化平台,同時監控宿主機與虛擬機的運行狀態。

        監控內容包含:服務成功率、平均響應時間、CPU使用狀況、內存使用狀況、磁盤讀寫性能、網絡接收速率、網絡傳輸狀況、電源狀態、存儲使用狀況等,實現虛擬化資源從底層到業務的全鏈路監控。

6.數據庫監控

        平台全面覆蓋國內外主流數據庫,支持監控品牌包括:Oracle、MySQL、SQL Server、DB2、SyBase、MongoDB、intersystems Cache、PostgreSQL、Rdis、OceanBase、人大金倉、神通、達夢、海量、ClickHouse等。

        監控內容包含:表空間、死鎖數、用戶連接、請求、內存及緩存使用等指標參數等;同時平台支持SQL自定義監測,支持顺利获得撰寫SQL語句,自定義監測指標,滿足個性化的數據庫監控需求。

7.中間件監控

        平台可監測WebSphere、JBOSS、Tomcat、Weblogic、IBM MQ、MS MQ、Sharepoint、Docker、WildFly、Apache、ActiveMQ、Apache-Artemis、Elasticsearch、Emqx、kafka、nginx、redis、zookeeper等。

        監控內容包含:中間件的可訪問性、連接狀況、活動連接數、等待連接數、線程池負載、會話數、中間件使用的端口狀況、中間件運行性能等,保障業務中間件的穩定運行。

8.無線AP/AC監控

        平台可監控華為、銳捷、H3C、思科、TP-Link、Tenda、D-Link、NETGEAR、極進等品牌的無線AP/AC,小眾或較為老舊的品牌型號也可顺利获得靈活可配的模型庫進行擴展適配並给予AP狀態總覽、網關狀態總覽、用戶狀態總覽等信息。

        監控內容包含:CPU、內存、射頻、關聯站點數、連接用戶數等。

9.動環及物聯網設備監控

        平台實現IT與動環的一體化監控,支持監控設備包括:UPS、攝像頭、門禁、溫濕度、水浸、氣體監測、空調、紅外監測、智能電錶,全面保障機房物理環境的安全穩定。

        可顺利获得2.5D/3D的形式呈現機房內部場景,並以不同顏色圖標展現機房內設備的實時狀態信息,直觀呈現機櫃總U位數,使用U位數以及剩餘U位數。

(三)高性能輪詢採集

        平台具備行業領先的秒級採集性能,支持秒級輪詢採集技術,實現故障發現可達秒級。納入監控內任何設備的任何監測指標都可以單獨設置監測頻率,採集時間間隔包括秒級到分鐘級等多種自定義輪詢頻率,最快輪詢頻率可達到5秒。

        顺利获得高性能的採集能力,實現故障的秒級發現,大幅縮短故障響應時間,保障業務系統的高可用性。

(四)高效運維管理

1.可視化運維

        给予設備儀錶盤、業務儀錶盤、拓撲視圖等多種總覽視圖。「我的儀錶盤」支持自定義拖拽編排,並支持視圖輪播。

        给予靈活的拓撲管理功能,支持给予拓撲圖功能,包括拓撲展示、拓撲配置、面板圖。拓撲配置中可以導入設備、自動搜索設備、搜索物理線,自動生成物理網絡拓撲,直觀呈現設備鏈路與運行狀態,助力快速定位網絡故障。

2.一鍵添加設備

        给予智能發現技術,用戶只需要輸入IP範圍一步操作,即可自動完成如下全部功能:網絡設備發現、設備類型識別、設備鏈路發現、設備故障和性能採集、鏈路流量和狀態以及網絡拓撲生成。

        平台支持下載設備模板方式批量添加設備、下載監測點模板方式批量添加監測點。支持指定網段,自動發現設備,大幅降低大規模設備上線的運維成本,提升部署效率。

3.批量修改監控任務

        平台支持批量修改閾值、批量修改監控指標監測頻率、批量修改錯誤重試次數,滿足大規模監控資源的批量配置需求,提升運維效率。

(五)智能故障告警

        给予多級別、多方式的告警機制,支持告警閾值靈活自定義配置。顺利获得主動式故障監控能力,對海量事件與狀態數據進行深度聚合分析,將離散狀態信息提煉為系統全景視圖,並精準識別異常狀態並觸發告警,實現故障的早發現、早預警。

        给予界面顏色、提示聲、光效閃爍、信息列表、Email、短訊、釘釘、企業微信、個人微信等多種通知渠道,可自定義配置告警模板,顺利获得預設置參數添加設備信息、監測點信息、閾值設置、故障時間等。

        支持設置多種不同的告警策略,包括設置以下內容:事件陆续在發生多少次時發送告警、設定時間內有幾次同樣狀態時發送告警、事件陆续在發生多少次後停止發送告警、當發過告警監測點恢復正常時發送一次告警等。顺利获得靈活的告警配置,實現故障的精準預警、快速通知,避免告警風暴,提升故障處置效率。

二、方案價值

        全棧一體化監控,打破運維孤島:實現IT基礎資源與機房動環的一體化監控,覆蓋全類型設備與系統,避免多平台切換的運維痛點,實現一站式運維管理。

        國產化全適配,滿足信創要求:全面適配國產化軟硬件生態,滿足國家自主可控的政策要求,助力用戶信創轉型落地。

        秒級監控與智能告警,降低業務風險:秒級採集能力實現故障的快速發現,以靈活的告警策略實現精準預警,大幅降低故障停機時間,保障業務陆续在性。

        高效批量運維,降本增效:批量設備添加、批量配置修改等能力,大幅降低大規模環境的運維人力成本,提升運維效率。

        可視化運維,降低門檻:自定義儀錶盤、自動化網絡拓撲等可視化能力,直觀呈現系統運行狀態,降低運維門檻,提升故障定位效率。



立即諮詢