0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為了在數(shù)據(jù)中心成功部署實時監(jiān)控,IT團隊應(yīng)先解決的六大問題

如意 ? 來源:TechTarget中國 ? 作者:鄒錚 ? 2020-10-08 11:33 ? 次閱讀

對于數(shù)據(jù)中心運營,可能很難確定哪些數(shù)據(jù)至關(guān)重要,哪些數(shù)據(jù)是背景噪音。篩選數(shù)據(jù)的能力至關(guān)重要,因為數(shù)據(jù)中心經(jīng)理必須迅速確定哪些警報至關(guān)重要,哪些警報可以幫助提供有關(guān)其基礎(chǔ)架構(gòu)運行情況的信息。

在2020年數(shù)據(jù)中心世界大會上,在《Real-time Environmental Monitoring for Your Data Center Management Platforms and Getting Common Data Into Your New Hybrid World》的演講中,Critical Environments Group公司數(shù)據(jù)中心解決方案主管Andrew Graham和RLE Technologies公司國際和西方國家銷售主管Cam Rogers介紹了一個框架,該框架可以幫助企業(yè)在混合環(huán)境中設(shè)置實時監(jiān)控,以有效管理和擴展基礎(chǔ)架構(gòu)。

為了成功部署實時監(jiān)控,IT團隊應(yīng)該解決五個問題:誰、什么、何時、何地、為什么以及如何。

1. 弄清楚為什么需要實時監(jiān)控

在IT團隊投資于任何類型的實時監(jiān)控前,他們應(yīng)該弄清楚為什么在數(shù)據(jù)中心內(nèi)需要實時監(jiān)控。潛在的原因包括降低成本、提高生產(chǎn)率、簡化管理以及減少意外和停機時間。

當企業(yè)試圖將基礎(chǔ)設(shè)施擴展到本地數(shù)據(jù)中心之外,并整合主機托管和邊緣作為整個基礎(chǔ)結(jié)構(gòu)的一部分時,這些原因尤其引人注目。Graham說,隨著混合IT不斷發(fā)展,那些運營自己數(shù)據(jù)中心的企業(yè)發(fā)現(xiàn),容量管理成為巨大的問題。

實時監(jiān)控技術(shù)最初用于提供數(shù)據(jù)中心基礎(chǔ)設(shè)施的快照,因此非常適合幫助IT團隊更有效地管理數(shù)據(jù)中心,并幫助解決日益復(fù)雜的設(shè)置問題—其中涉及多種技術(shù)類型。

RSP Architects的負責人Rajan Battish說:“實時監(jiān)控已經(jīng)取得很大的進步;它一直存在。多年來,我們看到的是,它們在機架級別獲取信息,并嘗試通過基礎(chǔ)架構(gòu)對其進行優(yōu)化。監(jiān)控系統(tǒng)開始獲取數(shù)據(jù)中心的運行情況數(shù)據(jù),并且它成為自動化和優(yōu)化的方式?!?/p>

2. 確定誰必須參與

當IT團隊建立業(yè)務(wù)用例,他們就必須考慮誰應(yīng)該參與到新的實時監(jiān)控設(shè)置中。

這包括必須向誰報告問題、該系統(tǒng)應(yīng)及時將信息提供給誰、誰關(guān)注設(shè)施狀況、哪些人員負責新應(yīng)用的推出,以及哪些團隊關(guān)注流程的改進和有效性。

如果企業(yè)具有非本地基礎(chǔ)架構(gòu),則管理員必須說明可能需要報告的任何外部方,例如托管服務(wù)提供商、主機托管和云提供商、合作伙伴和供應(yīng)商。

IT團隊必須建立主要的利益相關(guān)者,因為這樣做會影響報告結(jié)構(gòu)和軟件警報。這還可以減少報告的冗余。

Rogers表示:“每個利益相關(guān)者都有不同的優(yōu)先事項,IT經(jīng)理可能與設(shè)施經(jīng)理有不同的需求。應(yīng)該由他們決定什么重要,什么不那么重要。”

他補充說,企業(yè)可以從本地化警報開始,這些警報不一定關(guān)聯(lián)所有事物。

他說:“除非你的員工24/7全天候工作,否則當你無法看到警報時,問題就會非常迅速地發(fā)酵。你需要查看設(shè)施并將警報發(fā)送給合適的人?!?/p>

3. 查看最有用的指標是哪些

企業(yè)有很多數(shù)據(jù)需要跟蹤-特別是在基礎(chǔ)架構(gòu)方面。通過實時監(jiān)視設(shè)置,管理人員應(yīng)確定哪些指標對他們很重要,以及哪些指標可以快速提供信息。

Rogers說:“這實際上取決于你希望管理和匯集哪些資產(chǎn)?!?/p>

大多數(shù)企業(yè)都依賴一些通用指標,例如電源使用效率(PUE)、數(shù)據(jù)中心基礎(chǔ)架構(gòu)效率(DCIE)、能耗降低和IT設(shè)備利用率。但是管理員應(yīng)謹慎對待這些指標。

PUE是廣泛使用的度量標準,但它基于對IT設(shè)施功率和總設(shè)備功率的總體估計。如果團隊進行IT升級,則PUE可能會上升。Graham建議,IT管理員使用PUE作為內(nèi)部度量,而不是嘗試將其與企業(yè)外部的其他數(shù)據(jù)中心進行比較。

Graham和Rogers解釋說,管理人員可以使用PUE和DCIE之外的其他指標,例如冷卻指標,但是這些指標可能需要更多數(shù)據(jù)和分析,從而導(dǎo)致部署率較低。

4. 確定何時部署監(jiān)控或擴大容量

對于何時增加容量或系統(tǒng)應(yīng)用程序,可能很困難,尤其是隨著IT需求的不斷變化。你的團隊應(yīng)該考慮你的監(jiān)視和管理工具是否可以幫助內(nèi)部開發(fā)和改進的規(guī)劃、進度和性能。

Graham說:“你不能只是考慮你何時需要使設(shè)備可用和運行以推出應(yīng)用程序。你需要從上線日期開始工作,以覆蓋部署過程中每一步所需的所有資源。”

實時監(jiān)控還可以通過針對特定事件的指標來為日常工作提供幫助:事件發(fā)生的時間、報告時間和解決的時間。識別這些時間可以幫助企業(yè)更加主動地響應(yīng)事件,特別是如果這些實例顯示出隨時間變化的模式或以特定間隔定期發(fā)生的情況。

5. 了解基礎(chǔ)設(shè)施的位置

企業(yè)還應(yīng)該考慮他們應(yīng)該在何處部署監(jiān)控軟件和硬件-無論是在本地數(shù)據(jù)中心、在邊緣節(jié)點的異地還是在主機托管地點。從內(nèi)部角度來看,應(yīng)該有連續(xù)的流程來跟蹤容量和連接的設(shè)備。

還有云提供商提供的信息,因此IT團隊應(yīng)詢問是否可以在云端跟蹤和追蹤數(shù)據(jù),并確定任何合規(guī)性需求–文檔或?qū)S脩?yīng)用程序等。

通過更準確地了解所有數(shù)據(jù)和硬件在IT設(shè)置中所處的位置,企業(yè)可以確定哪種實時監(jiān)控產(chǎn)品最能滿足其需求,并且可以支持所有必需的技術(shù)類型。在部署實時監(jiān)控后,這將確保一致的性能和有效的容量管理。

6. 了解如何監(jiān)控基礎(chǔ)架構(gòu)

在IT團隊、管理人員和利益相關(guān)者討論完何時、何地以及什么后,管理員應(yīng)調(diào)查企業(yè)應(yīng)如何部署實時監(jiān)控并增加基礎(chǔ)架構(gòu)容量。這涉及了解可能影響基礎(chǔ)架構(gòu)增長的因素,例如熱點、地面空間用盡、中斷、缺乏冷卻資源和水資源等。

Battish說,大多數(shù)企業(yè)在部署過程中都面臨挑戰(zhàn),特別是在使硬件和軟件相互通信方面。

這使得匯聚協(xié)議非常重要,因為大多數(shù)企業(yè)通過多家供應(yīng)商來構(gòu)建數(shù)據(jù)中心基礎(chǔ)架構(gòu)。然而,傳感器和協(xié)議轉(zhuǎn)換器可以幫助收集數(shù)據(jù)并提高實時監(jiān)視功能。

Rogers說:“傳感器有很多選擇,因此請確保做好功課,不要將自己鎖定在專有產(chǎn)品,而沒有辦法支持明天及未來需要的功能?!?/p>

行業(yè)產(chǎn)品包括用于配電單元和不間斷電源的有線和無線傳感器,以及一系列軟件,企業(yè)可購買現(xiàn)成產(chǎn)品或根據(jù)內(nèi)部需求定制產(chǎn)品。傳感器和軟件的這種組合可以幫助管理員和經(jīng)歷減少日常補救任務(wù)的數(shù)量。

Graham稱:“當人們在不斷解決相同的問題時,這對士氣不利。我們并不是說每個人都需要單一視圖,但他們應(yīng)該減少冗余,整合并解決正確的問題。監(jiān)視和管理的轉(zhuǎn)變允許人們要更有效率,并在我們的行業(yè)中處于領(lǐng)先地位,并專注于更多的優(yōu)化工作。”
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    半導(dǎo)體存儲器在數(shù)據(jù)中心中的應(yīng)用

    半導(dǎo)體存儲器在數(shù)據(jù)中心中的應(yīng)用是極其重要且廣泛的,它們不僅是數(shù)據(jù)中心存儲系統(tǒng)的核心組件,還直接關(guān)系到數(shù)據(jù)處理的效率、可靠性和安全性。以下將詳細闡述半導(dǎo)體存儲器在數(shù)據(jù)中心中的具體應(yīng)用,包
    的頭像 發(fā)表于 08-20 10:17 ?482次閱讀

    在數(shù)據(jù)中心使用智能負載組是個好主意#負載 #負載組

    數(shù)據(jù)中心
    深圳崧皓電子
    發(fā)布于 :2024年08月19日 07:43:30

    混合冷卻在數(shù)據(jù)中心中仍將是必不可少的#混合冷卻

    數(shù)據(jù)中心
    深圳崧皓電子
    發(fā)布于 :2024年08月06日 06:58:06

    安科瑞數(shù)據(jù)中心精密配電監(jiān)控裝置--列頭柜/UPS柜用電監(jiān)控

    效方式。要實現(xiàn)數(shù)據(jù)中心的節(jié)能,首先需要監(jiān)測每個用電負載,而數(shù)據(jù)中心負載回路非常的多,傳統(tǒng)的測量 儀表無法滿足成本、體積、安裝、施工等多方面的要求,因此需要采用適用于數(shù)據(jù)中心集中監(jiān)控
    的頭像 發(fā)表于 05-27 14:24 ?404次閱讀
    安科瑞<b class='flag-5'>數(shù)據(jù)中心</b>精密配電<b class='flag-5'>監(jiān)控</b>裝置--列頭柜/UPS柜用電<b class='flag-5'>監(jiān)控</b>

    訊維分布式KVM坐席管理系統(tǒng)在數(shù)據(jù)中心管理中的應(yīng)用與案例分析

    系統(tǒng)能夠?qū)崿F(xiàn)數(shù)據(jù)中心的集中管理和控制。通過整合數(shù)據(jù)中心的各類系統(tǒng)和設(shè)備,系統(tǒng)可以實時監(jiān)控各節(jié)點的運行狀態(tài),具備自檢和故障診斷功能,為運維人員提供及時、準確的信息反饋。這使得運維人員能夠
    的頭像 發(fā)表于 05-16 16:27 ?455次閱讀

    #mpo極性 #數(shù)據(jù)中心mpo

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年04月07日 10:05:13

    數(shù)據(jù)中心末端配電監(jiān)控解決方案-AMC100精密配電柜監(jiān)控

    數(shù)據(jù)中心的節(jié)能,首先需要監(jiān)測每個用電負載,而數(shù)據(jù)中心負載回路非常的多,傳統(tǒng)的測量儀表無法滿足成本、體積、安裝、施工等多方面的要求,因此需要采用適用于數(shù)據(jù)中心集中監(jiān)控要求的多回路
    的頭像 發(fā)表于 03-28 09:47 ?643次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>末端配電<b class='flag-5'>監(jiān)控</b>解決方案-AMC100精密配電柜<b class='flag-5'>監(jiān)控</b>

    多業(yè)務(wù)光端機在數(shù)據(jù)中心的應(yīng)用:提升網(wǎng)絡(luò)效率的關(guān)鍵

    網(wǎng)絡(luò)效率方面的作用不可忽視。 一、多業(yè)務(wù)光端機在數(shù)據(jù)中心的應(yīng)用 在數(shù)據(jù)中心中,多業(yè)務(wù)光端機主要承擔以下任務(wù): 高速數(shù)據(jù)傳輸 :數(shù)據(jù)中心內(nèi)部需要處理大量的
    的頭像 發(fā)表于 02-23 14:09 ?581次閱讀

    安科瑞精密配電監(jiān)控在數(shù)據(jù)中心的應(yīng)用

    呈現(xiàn)出指數(shù)級增長。此外,數(shù)字經(jīng)濟作為經(jīng)濟的新引擎,已成為衡量國家綜合國力的重要指標。因此,要加快構(gòu)建全國一體化大數(shù)據(jù)中心體系,強化算力統(tǒng)籌智能調(diào)度,建設(shè)若干國家樞紐節(jié)點和大數(shù)據(jù)中心集群。 1、行業(yè)政策 2020年,數(shù)據(jù)中心建設(shè)被
    的頭像 發(fā)表于 02-18 15:55 ?216次閱讀
    安科瑞精密配電<b class='flag-5'>監(jiān)控</b><b class='flag-5'>在數(shù)據(jù)中心</b>的應(yīng)用

    數(shù)據(jù)中心電氣火災(zāi)監(jiān)控系統(tǒng)解決方案

    系統(tǒng),數(shù)據(jù)可集成至商業(yè)中心消控室監(jiān)控系統(tǒng)。 數(shù)據(jù)中心電氣火災(zāi)監(jiān)控系統(tǒng)以建筑為單位設(shè)置,采集數(shù)據(jù)
    的頭像 發(fā)表于 01-31 08:58 ?412次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>電氣火災(zāi)<b class='flag-5'>監(jiān)控</b>系統(tǒng)解決方案

    集中電源控制器在數(shù)據(jù)中心的應(yīng)用

    集中電源控制器在數(shù)據(jù)中心的應(yīng)用非常廣泛。數(shù)據(jù)中心通常需要大量的電源來支持服務(wù)器、網(wǎng)絡(luò)設(shè)備和存儲設(shè)備等關(guān)鍵基礎(chǔ)設(shè)施的運行。集中電源控制器可以提供穩(wěn)定、可靠的電源供應(yīng),確保數(shù)據(jù)中心的正常運行。
    的頭像 發(fā)表于 01-30 15:24 ?437次閱讀
    集中電源控制器<b class='flag-5'>在數(shù)據(jù)中心</b>的應(yīng)用

    IDc數(shù)據(jù)中心需要哪些產(chǎn)品

    IDC數(shù)據(jù)中心是一個專門提供服務(wù)器和網(wǎng)絡(luò)設(shè)備的租用、托管和管理服務(wù)的場所。它通常由大型的硬件設(shè)施和專業(yè)的技術(shù)團隊組成,可以為企業(yè)和機構(gòu)提供高效、安全和可靠的數(shù)據(jù)存儲和處理解決方案。這篇文章中將詳細
    的頭像 發(fā)表于 01-16 17:40 ?1858次閱讀

    光纖KVM在數(shù)據(jù)中心的應(yīng)用與優(yōu)勢

    光纖KVM(鍵盤、視頻、鼠標)在數(shù)據(jù)中心的應(yīng)用與優(yōu)勢主要體現(xiàn)在以下幾個方面: 來百度APP暢享高清圖片 集中管理 :在數(shù)據(jù)中心,通常需要對大量的服務(wù)器進行管理。光纖KVM技術(shù)允許管理員在中央控臺上
    的頭像 發(fā)表于 01-11 15:38 ?338次閱讀
    光纖KVM<b class='flag-5'>在數(shù)據(jù)中心</b>的應(yīng)用與優(yōu)勢

    數(shù)據(jù)中心智能母線監(jiān)測系統(tǒng)及產(chǎn)品監(jiān)控選型

    數(shù)據(jù)中心末端智能母線通過現(xiàn)代通信網(wǎng)絡(luò)監(jiān)控技術(shù),實時監(jiān)控母線的溫升、電能運行參數(shù)等數(shù)據(jù),并對采集的實時數(shù)據(jù)
    的頭像 發(fā)表于 01-08 16:56 ?489次閱讀

    數(shù)據(jù)中心為什么要部署FPGA?

    FPGA 芯片在數(shù)據(jù)中心領(lǐng)域主要用于硬件加速,在云服務(wù)器廠商中已有廣泛部署。數(shù)據(jù)中心使用 FPGA 芯片代替?zhèn)鹘y(tǒng)的 CPU 方案后,處理其自定義算法時可實現(xiàn)顯著的加速效果。因此近年來,微軟 Azure、亞馬遜 AWS、阿里云的服
    發(fā)表于 11-16 09:55 ?739次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>為什么要<b class='flag-5'>部署</b>FPGA?