• <nav id="5jebs"></nav>
    <button id="5jebs"></button>
        • 案例中心

          案例中心??>??AI運維助力桂冠電力“數字桂冠”建設
          AI運維助力桂冠電力“數字桂冠”建設
          背景圖 2023-09-08 14:38:47

          *轉載自《網絡安全和信息化》雜志8月刊

          編者:分析了桂冠電力當前面臨的運維難題,結合公司實際業務基礎和多年運維經驗,構建了“智能運維大腦”,助力桂冠電力“數字桂冠”建設。

          隨著互聯網技術的不斷發展和普及,國家出臺了一系列政策和文件,鼓勵和引導企業進行數字化轉型,越來越多的企業開始意識到數字化轉型的重要性。當前,國內企業數字化轉型已經進入了快速發展的階段。

          桂冠電力股份有限公司(以下簡稱“桂冠電力”“公司”)結合企業自身發展,積極布局數字化轉型,一直走在數字化轉型的前端,當前已構建“數字桂冠”基礎的工業大數據云平臺,為桂冠電力的智慧企業建設提供數據鏈接能力、數據存儲能力、數據計算能力、業務流程能力、數據應用能力。“數字桂冠”云平臺底層服務器、存儲、網絡等硬件設備多,承載的發電業務系統和應用多元;桂冠電力各基層企業差異大,發電設備類型、供應商、運行數據多等現狀,均對日常運維提出了高要求。

           

          數字化規模擴大,運維難度增加

          在數字經濟持續深化的大背景下,IT運維在公司的基礎性地位愈加凸顯,對公司管理和業務創新有重要意義。桂冠電力基礎設施的穩定性與可靠性離不開IT運維,公司一直特別重視IT運維的投入。當前,桂冠電力IT運維面臨幾個普遍性問題。

          第一,系統風險發現難。基礎設施系統的高復雜性、運維人員技能水平不能匹配、運維監控手段不足等原因,導致很多時候系統問題要靠業務部門和用戶問題反饋來進行被動式運維,潛在的風險和安全隱患很難被及時發現并解決。系統風險往往影響各部門正常辦公,甚至影響公司發電等核心生產業務,給公司帶來嚴重的損失。

          第二,系統故障定位難。公司數據中心、生產環境設備多,業務系統豐富多元,故障問題經常涉及多個系統、設備、設備供應商等供應鏈,涉及到的技術和知識領域非常廣泛,故障分析高度依賴運維人員專業度。運維人員沒有精力深入學習所有知識,無法有效對整個系統進行全面的分析和理解,通常只能依靠經驗嘗試解決,短時間無法定位問題原因,導致運維效率經常低下。

          第三,系統故障處置難。故障問題往往涉及數據中心硬件設備的核心部件和發電控制系統、電力計算機監控系統、數據采集系統等核心生產軟件系統,還有生產管控、財務管理、人事管理等諸多管理系統,此類故障問題繁多,解決過程較為復雜。運維人員需要耗費大量的時間和精力,具備較高的技術水平和專業知識才能夠有效地處理設備故障。同時,運維人員面臨專業度、解決問題時效等壓力,工作難度較大。小故障逐步積累成為大問題,最終影響到公司的辦公業務和生產業務。

           

          打造“智能運維大腦”,AI助力運維

          桂冠電力認為,企業競爭不再是單靠發電能力就能取勝,而是依托平臺的數字化生態系統之間的競爭和管理。“三分建設、七分運維”,運維是全天24?h的,是每時每刻都不能缺少的,智能、高效、專業的數字化運維承載著關鍵作用。結合公司實際業務基礎和多年的運維經驗,桂冠電力決定基于以下幾個理念全新建設公司運維能力。

          第一,被動運維轉變為主動運維。主動運維可以有效地降低系統故障率,提高系統的可用性和可靠性,大幅降低業務風險,也可以減少運維工作量和管理成本,提高運維效率和質量,改變傳統“救火式運維”的困境。

          第二,線上值守釋放線下運維精力。通過遠程監控和管理系統,及時發現和解決線上運行問題的工作,實現快速響應、減少意外故障、降低運維成本、定期維護和優化IT基礎設施。

          第三,在系統發生故障時,為運維人員提供有效處置思路和建議。通過AI對故障特征、日志等數據分析,輸出處置建議,幫助運維人員快速定位故障,恢復業務,降低經驗依賴,提高故障處置效率。

          第四,數據中心實時掌控,可實時查看IT系統狀態。運維人員可以通過Web、釘釘、微信小程序等實時掌控IT資產狀態,能全棧監控系統告警信息,包括發電設備、數據中心的服務器、云主機、數據庫和應用等。

          第五,能夠預測業務故障,主動處置,提前解決。運維體系能夠結合業界標準,實時分析底層硬件運行狀態、日志,進行AI大模型持續訓練,在硬件發生故障前識別告警,減少IT設備故障率。

          當前桂冠電力已構建“智能運維大腦”,工作架構如圖1所示。

          “智能運維大腦”工作架構圖

          圖1 “智能運維大腦”工作架構圖

          1.“智能運維大腦”工作流程

          第一,統一數據。智能運維大腦對接桂冠電力的所有IT資產,實現公司多源異構數據的大匯集,形成IT數據湖。涵蓋云平臺計算、存儲、網絡和發電設施的精細化日志信息,從網絡、應用等多維度支持運維人員快速梳理業務或系統的邏輯。

          第二,AI分析。“智能運維大腦”通過AI引擎對數據湖中的IT數據進行統一分析和編排,識別正在發生的問題,比如為什么會發生?將來會發生什么?從而實現IT問題檢測、溯源、處置和防范。

          第三,AI處理。“智能運維大腦”通過AI引擎模型訓練,持續學習,積累問題庫,該問題庫可由運維團隊進行配置。故障發生時,“智能運維大腦”會根據問題庫的處置策略線上自動處理大部分問題;對于一些危險處置操作或者新問題,“智能運維大腦”第一時間主動推送故障問題、處置建議至運維人員。

          第四,運維團隊介入。運維工程師只需登錄“智能運維大腦”,就可對公司所有IT資產狀態全局可視,并且按照處置向導快速解決問題。對于不能處理的問題,可聯動工單系統發起流程,請求運維專家協助。

           

          2.“智能運維大腦”核心能力

          第一,“智能運維大腦”可從系統中抽取各項指標,通過深度學習、小樣本學習、遷移學習等,預測系統故障并輸出分析報告,準確率可達90%以上。

          第二,對于運維側常見的告警風暴,“智能運維大腦”可對告警去重,并通過NLP算法對信息進行模板化處理,隨后“智能運維大腦”進行分詞和熵值運算,根據告警信息熵值分成重要告警和非重要告警兩類,從而達到收斂告警信息的效果,幫助用戶解決在系統異常時的告警風暴問題,集中管理人員精力,聚焦關鍵業務。

          第三,對于故障處置,“智能運維大腦”通過對系統指標離線分析構建因果圖,在系統發生異常事件時導入因果圖譜,并通過隨機游走算法計算異常事件根因,1?s定位故障根因并輸出處置建議;也可以對故障進行預測和防范,改變傳統運維故障后疲于“救火”的困境,預防業務中斷。

           

          AI運維保障業務穩定運行,助力“數字桂冠”建設

          “智能運維大腦”是桂冠電力數字化轉型的重要組成部分,作用于桂冠電力IT業務全生命周期。它可以對設備數據實時監測和分析,實現對設備異常預測和故障預防,提高設備的可靠性和可用性,降低企業的維護成本,提高生產效率,降低生產成本,為公司的數字化轉型提供有力支撐。據統計,“智能運維大腦”覆蓋150多個典型故障場景,實現7~30天提前預測,1?min及時發現,3?min快速定位。

          在未來,“智能運維大腦”可以全方位保障桂冠電力生產系統穩定運行,將業務故障率降低60%,將維護成本降低40%,將生產效率提高10%。

          “智能運維大腦”是“數字桂冠”整體規劃的重要組成部分,為桂冠電力大數據業務保駕護航,在公司各業務系統的穩定運行中起著關鍵性作用,提供智能化、高效化、安全化的服務,幫助公司提高競爭力和市場占有率。

          桂冠電力未來將基于工業大數據云平臺和本次建設的“智能運維大腦”,逐步打造包含智慧運營中心、設備狀態診斷中心、安全應急中心、智慧營銷中心與智慧電廠的核心智慧化平臺,實現數字化業務管控、智慧化企業經營和生態化運維服務的完整生態,加強企業的數字化轉型。

          久久在精品线影院,久久视频这里只精品亚洲,99欧美精品含羞草,欧洲精品性爽视频