0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息InManage,再獲Gartner數(shù)據(jù)中心智能運維標(biāo)桿

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-09-12 02:10 ? 次閱讀

近期,國際權(quán)威研究機構(gòu)高德納(Gartner)發(fā)布中國AIOps市場指南報告《Market Guide for AIOps, China》,報告從數(shù)據(jù)中心運維需求變化、技術(shù)影響等角度,為中國的組織和I&O領(lǐng)導(dǎo)在采用或推進(jìn)AIOps提供了深刻見解和實施建議。其中,浪潮信息InManage作為唯一的一款服務(wù)器廠商軟件產(chǎn)品,憑借領(lǐng)先的AI能力,以及多個行業(yè)數(shù)據(jù)中心智能化運維的成功經(jīng)驗,獲評AIOps標(biāo)桿。

大模型對數(shù)據(jù)中心運維帶來全新挑戰(zhàn)

在AIGC等大模型創(chuàng)新技術(shù)的驅(qū)動下,算力成為了行業(yè)關(guān)注的焦點。為滿足數(shù)字經(jīng)濟(jì)對于多元算力的旺盛需求,算力規(guī)模迅速增長,給數(shù)據(jù)中心運維帶來全新挑戰(zhàn),構(gòu)建智能化的運維管理AIOps 能力勢在必行。

首先,數(shù)據(jù)中心運維的難度與質(zhì)量要求不斷提升。在大模型訓(xùn)練等負(fù)載的驅(qū)動下,數(shù)據(jù)中心部署了越來越多的設(shè)備與應(yīng)用,這些設(shè)備與應(yīng)用在架構(gòu)、管理接口等方面存在很大差異,因此系統(tǒng)的復(fù)雜性與數(shù)據(jù)中心的不確定性增大,可能會對數(shù)據(jù)中心業(yè)務(wù)穩(wěn)定性造成嚴(yán)重的影響。

其次是數(shù)據(jù)中心運維效率亟待提升。伴隨著數(shù)據(jù)中心設(shè)備規(guī)模的不斷增長與運維難度的提升,運維的工作量呈現(xiàn)出大幅增長趨勢,大量重復(fù)冗余的工作不僅容易出錯,也降低數(shù)據(jù)中心運維效率,亟需將運維人員從復(fù)雜、依賴人工的告警和修復(fù)等運維工作中解放出來。

再次是對數(shù)據(jù)中心設(shè)備故障智能診斷、預(yù)測性運維需求的提升。為保障數(shù)據(jù)中心穩(wěn)定運行,需要盡可能地降低設(shè)備的故障率,通過精準(zhǔn)的故障預(yù)警、預(yù)測性運維等方式,提前解決潛在隱患,提升數(shù)據(jù)中心各類 IT 資產(chǎn)的使用率。

同時,如何完善數(shù)據(jù)中心IT設(shè)備能耗管理是運維要考慮的一個關(guān)鍵。由于人工智能、數(shù)據(jù)分析、數(shù)據(jù)庫等工作負(fù)載對計算能力的需求不斷增長,以及半導(dǎo)體工藝的巨大改進(jìn),CPU、GPU等多元芯片已經(jīng)集成了極多的晶體管。盡管單核功耗因工藝技術(shù)的改進(jìn)而不斷下降,但芯片的熱設(shè)計功率 (TDP) 卻由于性能大幅度的增長而在不斷增加,數(shù)據(jù)中心能耗管理的不完善可能會導(dǎo)致部分設(shè)備隨機斷電或由于功率不足而出現(xiàn)性能降低等問題。

AIOps引領(lǐng)數(shù)據(jù)中心運維的進(jìn)化之路

面對數(shù)據(jù)中心的多重運維挑戰(zhàn),AIOps即智能運維已被業(yè)界廣泛使用。早在2016年,Gartner就已將AIOps納入中國ICT技術(shù)成熟度曲線的關(guān)鍵技術(shù),指出在人工智能、大模型等新技術(shù)的促進(jìn)下,AIOps成為未來數(shù)據(jù)中心運維發(fā)展的重要方向,并呈現(xiàn)出快速替代傳統(tǒng)運維的趨勢。以軟件定義、API驅(qū)動的AIOps模塊化平臺架構(gòu)將有助于實現(xiàn)快速產(chǎn)品創(chuàng)新,將基礎(chǔ)設(shè)施、運維納入統(tǒng)一發(fā)展方向規(guī)劃,具備統(tǒng)一數(shù)據(jù)采集、存儲,強大的數(shù)據(jù)分析和機器學(xué)習(xí)能力,提供自動化運維和決策支持的能力并具備可視化的操作界面。

對于如今數(shù)據(jù)中心發(fā)展面臨的挑戰(zhàn),AIOps提供了如下關(guān)鍵優(yōu)勢:

通過智能化的響應(yīng)流程,以及數(shù)據(jù)驅(qū)動的決策支持,AIOps將極大將提升核心業(yè)務(wù)的穩(wěn)定性和可靠性,保證業(yè)務(wù)持續(xù)運行,提升業(yè)務(wù)價值。同時,運維效率提升和成本降低將為企業(yè)釋放更多的資源,用于核心業(yè)務(wù)的創(chuàng)新和發(fā)展。

在基于故障、告警觸發(fā)的被動響應(yīng)式運維的基礎(chǔ)上,AIOps提供了主動智能止損、主動定位故障等能力,將引領(lǐng)數(shù)據(jù)中心運維從被動響應(yīng)向主動預(yù)防、從主動預(yù)防向智能化預(yù)防不斷演進(jìn)。

AIOps將不斷引入異常情況模擬等混沌工程能力,助力評估智能運維系統(tǒng)在故障發(fā)生時的彈性和可恢復(fù)性,監(jiān)控系統(tǒng)在異常情況下的行為,有效識別和收集關(guān)鍵的運維指標(biāo)和管理數(shù)據(jù),從而通過迭代和改進(jìn)來不斷提高系統(tǒng)的運維能力和韌性。

隨著人工智能等技術(shù)的不斷發(fā)展,AIOps 還在不斷進(jìn)化之中,憑借著長期運維所積累的海量數(shù)據(jù),以及飛速發(fā)展的大模型等應(yīng)用,AIOps面臨著新一輪技術(shù)創(chuàng)新的契機。例如,大模型在云事件管理、根因定位具體場景中的應(yīng)用為AIOps開辟了新的領(lǐng)域,大模型的涌現(xiàn)能力,也在為AIOps技術(shù)的革新、提高AIOps運維效率提供了有效的支撐。

浪潮信息InManage 打造數(shù)據(jù)中心智能管理行業(yè)標(biāo)桿

浪潮信息數(shù)據(jù)中心管理平臺InManage順應(yīng)AIOps發(fā)展趨勢,依托自研的面向基礎(chǔ)設(shè)施的AIOps平臺,有效解決局部硬件概率性故障下系統(tǒng)容錯的問題,智能故障診斷和故障根因定位故障診斷率達(dá)到95%以上,硬盤故障預(yù)測可提前15天感知風(fēng)險,內(nèi)存故障預(yù)測準(zhǔn)確率提高30%,此外,結(jié)合AI算法進(jìn)行性能和容量預(yù)測,實現(xiàn)精準(zhǔn)算力調(diào)配,讓用戶數(shù)據(jù)中心更加高效、穩(wěn)定、可靠。

同時,InManage還在資產(chǎn)管理、監(jiān)控管理、配置管理和能效管理方面提供一系列的智能化管理能力,幫助企業(yè)用戶統(tǒng)一運維服務(wù)器、存儲、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施,提升運維效率和質(zhì)量、降低運維成本:

智能資產(chǎn)管理:InManage結(jié)合智能網(wǎng)絡(luò)自動發(fā)現(xiàn)技術(shù)和RFID射頻識別技術(shù),能夠精準(zhǔn)搜索和識別整機型和部件型資產(chǎn),可以納管400多種不同品牌不同類型的資產(chǎn)設(shè)備。借助自動拓?fù)渑c3D建模技術(shù),InManage能夠幫助用戶構(gòu)建數(shù)字孿生式資產(chǎn)可視化,清晰展示資產(chǎn)的網(wǎng)絡(luò)架構(gòu)、空間位置和關(guān)聯(lián)關(guān)系,沉浸式了解資產(chǎn)狀況。同時,InManage采用基于物聯(lián)網(wǎng)IoT)的技術(shù)方案,實現(xiàn)自動化的線上線下資產(chǎn)管理,支持自動巡檢、資產(chǎn)報表、維保管理、出入庫管控等功能,打通采購、使用、審計、財務(wù)壁壘,全面滿足企業(yè)管理需求,運維工作量降低40%,資產(chǎn)管理效率提升90%。

智能監(jiān)控管理:InManage通過"一中心多網(wǎng)格"的分布式設(shè)計,突破海量基礎(chǔ)設(shè)施數(shù)據(jù)收集和分析的性能瓶頸,支持10萬級IT設(shè)備的統(tǒng)一納管。同時為保障數(shù)據(jù)中心穩(wěn)定運行,InManage基于日志、指標(biāo)、關(guān)系鏈等高維數(shù)據(jù),能夠進(jìn)行特征構(gòu)建、算法優(yōu)化及模型訓(xùn)練、結(jié)合業(yè)界領(lǐng)先的運維專家?guī)?,實現(xiàn)對CPU、內(nèi)存、硬盤,PCIe等設(shè)備故障的精準(zhǔn)定位和故障預(yù)測,故障診斷率達(dá)到95%以上,其中,硬盤故障預(yù)測可提前15天感知風(fēng)險,內(nèi)存故障預(yù)測準(zhǔn)確率提高30%。InManage基于自研的ETF無閾值告警算法,支持服務(wù)器集群性能和容量無閾值告警,告警準(zhǔn)確率高達(dá)95.26%,極大提升數(shù)據(jù)中心運維效率。

智能配置管理:InManage 基于在線鏡像平臺實現(xiàn)服務(wù)器全量固件智能匹配和自動推送,遵循業(yè)務(wù)策略智能升級,實現(xiàn)零人工干預(yù),升級效率800%。依托多年服務(wù)器運維經(jīng)驗和多行業(yè)客戶需求,內(nèi)置數(shù)百種開箱即用模板,涵蓋全量固件升級、BIOS/BMC/RAID配置、電源策略、操作系統(tǒng)安裝、壓力測試、應(yīng)用部署等運維場景,基于可視化編排,實現(xiàn)大規(guī)模服務(wù)器一站式智能上架和業(yè)務(wù)自動上線交付,有效地保障數(shù)據(jù)中心快速投產(chǎn)、可靠運行。

智能化能耗分析:InManage打通動環(huán)和IT能耗數(shù)據(jù),通過多種智能化算法和模型,提供豐富的功耗策略,完成數(shù)據(jù)中心能耗優(yōu)化和碳排放管理,實現(xiàn)機架密度優(yōu)化,數(shù)據(jù)中心能耗調(diào)整可視化。同時InManage可分析用戶服務(wù)器功耗和溫度分布范圍提供制冷方案,優(yōu)化機房環(huán)境;分析數(shù)據(jù)中心空載服務(wù)器及服務(wù)器負(fù)載運行時間分布,優(yōu)化業(yè)務(wù)系統(tǒng);優(yōu)化配置能源使用策略,管理服務(wù)器的功耗,能耗降低 15-20%。有效降低數(shù)據(jù)中心PUE,助力數(shù)據(jù)中心碳中和目標(biāo),推動綠色數(shù)據(jù)中心建設(shè)。

目前,浪潮信息InManage在海內(nèi)外收獲了廣泛的客戶認(rèn)可,正在為全球互聯(lián)網(wǎng)、金融、通信、IT、教科研等用戶的數(shù)據(jù)中心提供全程無憂的運維服務(wù)。在科研高校,借助InManage平臺,助力高校數(shù)據(jù)中心實現(xiàn)了服務(wù)器的智能化、一體化管理,運維成本降低50%,但整個數(shù)據(jù)中心的運維效率提高了10倍以上。在某世界TOP級銀行巨頭的數(shù)據(jù)中心,浪潮信息以"主備HA模式"部署InManage平臺,管理規(guī)模超過10萬節(jié)點,管理各項參數(shù)指標(biāo)超過300萬,覆蓋了數(shù)據(jù)中心設(shè)備的所有組件,幫助該行數(shù)據(jù)中心運維效率實現(xiàn)3倍提升,保障業(yè)務(wù)穩(wěn)定可靠運行。

在日新月異的數(shù)字化創(chuàng)新環(huán)境中,浪潮信息正在持續(xù)推進(jìn)InManage的技術(shù)創(chuàng)新與場景化落地,助力數(shù)據(jù)中心運維效率、質(zhì)量的提升,為更多企業(yè)的數(shù)字化轉(zhuǎn)型賦能。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    450

    瀏覽量

    23784
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4633

    瀏覽量

    71900
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2279

    瀏覽量

    2361
收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息趙帥:開放計算創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

    北京2024年8月15日?/美通社/ -- 日前在2024開放計算中國峰會上,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥表示,智能時代,開源模型和開放計算激發(fā)了人工智能產(chǎn)業(yè)生態(tài)的創(chuàng)新活力,面對大模型
    的頭像 發(fā)表于 08-15 16:02 ?237次閱讀
    <b class='flag-5'>浪潮信息</b>趙帥:開放計算創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

    金融數(shù)據(jù)中心最大規(guī)模!浪潮信息InManage助力大行10萬+IT設(shè)備統(tǒng)一管理

    ,主要分布在上海和北京,形成了錯綜復(fù)雜的數(shù)據(jù)中心布局。 面對巨量、復(fù)雜的IT設(shè)備的管理挑戰(zhàn),該行攜手浪潮信息,歷經(jīng)五年聯(lián)合開發(fā),依托InManage基礎(chǔ)設(shè)施智能管理平臺,持續(xù)提升數(shù)字化
    的頭像 發(fā)表于 07-23 18:07 ?714次閱讀
    金融<b class='flag-5'>數(shù)據(jù)中心</b>最大規(guī)模!<b class='flag-5'>浪潮信息</b><b class='flag-5'>InManage</b>助力大行10萬+IT設(shè)備統(tǒng)一管理

    AI時代,我們需要怎樣的數(shù)據(jù)中心?AI重新定義數(shù)據(jù)中心

    超過60%的中國企業(yè)計劃在未來12至24個月內(nèi)部署生成式人工智能。AI、模型的構(gòu)建,將顛覆數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)、維和運營。一個全新的數(shù)據(jù)中心智能化時代已經(jīng)拉開序幕。
    發(fā)表于 07-16 11:33 ?632次閱讀
    AI時代,我們需要怎樣的<b class='flag-5'>數(shù)據(jù)中心</b>?AI重新定義<b class='flag-5'>數(shù)據(jù)中心</b>

    期待攜手浪潮信息,共赴2024中國軍民兩用智能裝備與通信技術(shù)展覽會

    ,我們將見證浪潮信息如何以其PCIe光互連技術(shù),引領(lǐng)數(shù)據(jù)中心的未來。 PCIe光互連技術(shù):數(shù)據(jù)中心的革命性突破 浪潮信息的PCIe光互連技術(shù),以其卓越的性能和創(chuàng)新的解決方案,成功提升了
    的頭像 發(fā)表于 07-16 10:19 ?218次閱讀

    浪潮信息推出AIGC存儲解決方案

    近日,在科技創(chuàng)新的浪潮中,浪潮信息成功舉辦了“元腦中國行”全國巡展的杭州站活動,此次盛會不僅匯聚了業(yè)界的精英與目光,更見證了浪潮信息在AIGC(人工智能生成內(nèi)容)領(lǐng)域的一次重大突破。會
    的頭像 發(fā)表于 07-03 11:16 ?648次閱讀

    整數(shù)智能浪潮信息攜手,共創(chuàng)AI數(shù)據(jù)管理新紀(jì)元

    近日,整數(shù)智能浪潮信息兩大科技巨頭正式簽署元腦生態(tài)戰(zhàn)略合作協(xié)議,標(biāo)志著雙方在AI與數(shù)據(jù)科學(xué)領(lǐng)域的合作邁出了堅實步伐。
    的頭像 發(fā)表于 05-31 11:21 ?617次閱讀

    分布式KVM坐席管理系統(tǒng)在數(shù)據(jù)中心管理中的應(yīng)用與案例分析

    分布式KVM坐席管理系統(tǒng)在數(shù)據(jù)中心管理中的應(yīng)用,極大地提高了數(shù)據(jù)中心效率和安全性。該系統(tǒng)通過其獨特的分布式架構(gòu)和
    的頭像 發(fā)表于 05-16 16:27 ?455次閱讀

    中心動態(tài)】 走進(jìn)浪潮信息

    5月8日,RISC-V國際人才培養(yǎng)認(rèn)證中心主任蔣學(xué)剛一行,到訪浪潮電子信息產(chǎn)業(yè)股份有限公司(以下簡稱“浪潮信息”),受到深圳區(qū)域副總經(jīng)理段青云、產(chǎn)品經(jīng)理陶耀民的熱情接待。
    的頭像 發(fā)表于 05-13 17:42 ?394次閱讀
    【<b class='flag-5'>中心</b>動態(tài)】 走進(jìn)<b class='flag-5'>浪潮信息</b>

    智能維新標(biāo)桿:訊管理平臺深度解讀

    的功能和性能,為企業(yè)提供了全新的解決方案,成為了行業(yè)的新標(biāo)桿。 一、強大的智能功能 訊
    的頭像 發(fā)表于 04-16 16:24 ?453次閱讀

    分布式管理平臺解決大型數(shù)據(jù)中心難題的案例

    一、案例背景 隨著信息技術(shù)的快速發(fā)展,大型數(shù)據(jù)中心已成為企業(yè)存儲、處理和傳輸數(shù)據(jù)的核心設(shè)施。然而,這些數(shù)據(jù)中心面臨著日益增長的數(shù)據(jù)量、復(fù)雜的
    的頭像 發(fā)表于 03-26 16:10 ?392次閱讀
    分布式<b class='flag-5'>運</b><b class='flag-5'>維</b>管理平臺解決大型<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>運</b><b class='flag-5'>維</b>難題的案例

    浪潮信息提出未來五年金融數(shù)據(jù)中心的十大技術(shù)趨勢

    開創(chuàng)新時代金融工作新局面?;谏鲜瞿繕?biāo)要求,聚焦科技、綠色、普惠、數(shù)字等金融領(lǐng)域關(guān)鍵詞,浪潮信息從金融業(yè)務(wù)發(fā)展的實際需求出發(fā),前瞻性提出了未來五年金融數(shù)據(jù)中心的十大技術(shù)趨勢,以凝聚共識、洞察先機,加速釋放新質(zhì)生產(chǎn)力與數(shù)據(jù)要素潛能
    的頭像 發(fā)表于 03-19 18:11 ?854次閱讀

    淺析大數(shù)據(jù)時代下的數(shù)據(jù)中心管理

    淺析大數(shù)據(jù)時代下的數(shù)據(jù)中心管理 張穎姣 安科瑞電氣股份有限公司?上海嘉定201801 摘要:本文將從數(shù)據(jù)中心
    的頭像 發(fā)表于 02-22 14:40 ?320次閱讀
    淺析大<b class='flag-5'>數(shù)據(jù)</b>時代下的<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>運</b><b class='flag-5'>維</b>管理

    液冷數(shù)據(jù)中心生態(tài)建設(shè)啟動:浪潮信息力推綠色算力產(chǎn)業(yè)發(fā)展

    "液冷數(shù)據(jù)中心生態(tài)建設(shè)",浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥受邀出席。此次生態(tài)建設(shè)啟動旨在進(jìn)一步完善液冷數(shù)據(jù)中心的生態(tài),未來將聯(lián)合多家產(chǎn)業(yè)上下游單位,打通產(chǎn)、學(xué)、研、用多層級,通過技術(shù)創(chuàng)新、標(biāo)準(zhǔn)建立、測試認(rèn)證、人才培育等方式,推動
    的頭像 發(fā)表于 01-07 10:53 ?616次閱讀

    AI智能管理平臺助力指揮中心,實現(xiàn)高效智能管理!

    AI智能管理平臺,作為新型智能管理解決方
    的頭像 發(fā)表于 12-29 15:32 ?1270次閱讀
    AI<b class='flag-5'>智能</b><b class='flag-5'>運</b><b class='flag-5'>維</b>管理平臺助力指揮<b class='flag-5'>中心</b>,實現(xiàn)高效<b class='flag-5'>智能</b><b class='flag-5'>運</b><b class='flag-5'>維</b>管理!

    “融合”+“智能”:浪潮信息InView融合智能存儲管理平臺讓IT更高效

    隨著5G、云原生、大數(shù)據(jù)、人工智能等新舊技術(shù)不斷融合,IT基礎(chǔ)架構(gòu)愈加復(fù)雜,可視化管理和的難度日益增大,對企業(yè)IT管理水平提出巨大挑戰(zhàn)。近年業(yè)界提出“可觀測性”理念,既要求業(yè)務(wù)全程
    的頭像 發(fā)表于 12-11 17:15 ?1037次閱讀
    “融合”+“<b class='flag-5'>智能</b>”:<b class='flag-5'>浪潮信息</b>InView融合<b class='flag-5'>智能</b>存儲管理平臺讓IT<b class='flag-5'>運</b><b class='flag-5'>維</b>更高效