0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮存儲(chǔ)亞健康狀態(tài)監(jiān)控功能保障用戶數(shù)據(jù)服務(wù)的可靠、高效

科技綠洲 ? 來(lái)源:浪潮存儲(chǔ) ? 作者:浪潮存儲(chǔ) ? 2022-05-09 14:40 ? 次閱讀

“亞健康”這個(gè)詞不僅在生活中被熟知,而且大家經(jīng)常使用的信息系統(tǒng)中也會(huì)經(jīng)常遇到;亞健康狀態(tài),顧名思義,是存儲(chǔ)系統(tǒng)介于健康狀態(tài)和故障狀態(tài)之間的一種狀態(tài),系統(tǒng)仍在運(yùn)行且功能正常但處于降級(jí)模式的一種情況,它的存在會(huì)造成系統(tǒng)性能嚴(yán)重低于預(yù)期。

浪潮存儲(chǔ)基于對(duì)亞健康狀態(tài)的研究,在分布式存儲(chǔ)平臺(tái)進(jìn)行技術(shù)創(chuàng)新,研發(fā)了亞健康狀態(tài)監(jiān)控功能,對(duì)硬件、系統(tǒng)、網(wǎng)絡(luò)等進(jìn)行實(shí)時(shí)監(jiān)測(cè),當(dāng)系統(tǒng)發(fā)現(xiàn)運(yùn)行過(guò)程中存在亞健康狀態(tài)時(shí),可快速定位原因、上報(bào)、并對(duì)處于亞健康的部件進(jìn)行必要的處理,降低亞健康狀態(tài)對(duì)存儲(chǔ)系統(tǒng)的影響,保障用戶數(shù)據(jù)服務(wù)的可靠、高效。

過(guò)去因大部分應(yīng)用系統(tǒng)規(guī)模較小,一般會(huì)將亞健康狀態(tài)劃歸到故障進(jìn)行處理,系統(tǒng)在這種情況下雖處于亞健康狀態(tài),但仍可以對(duì)外提供服務(wù),處于亞健康的部件卻被當(dāng)成故障處理擴(kuò)大了亞健康狀態(tài)的影響范圍,有時(shí)甚至?xí)?dǎo)致系統(tǒng)不可提供服務(wù),也造成了資源浪費(fèi)。近十年,隨著新技術(shù)的快速發(fā)展,以及分布式系統(tǒng)部署規(guī)模的增加,亞健康狀態(tài)對(duì)于存儲(chǔ)系統(tǒng)的破壞已經(jīng)越來(lái)越顯著,之前亞健康狀態(tài)處理方式已經(jīng)不適合現(xiàn)在的大規(guī)模系統(tǒng)。亟待更加智能、高效的機(jī)制來(lái)保障存儲(chǔ)系統(tǒng)健康運(yùn)行。

亞健康狀態(tài)是隱形的系統(tǒng)殺手

以網(wǎng)絡(luò)亞健康為例,網(wǎng)卡故障、驅(qū)動(dòng)程序故障、設(shè)備故障、接線松動(dòng)、溫度過(guò)高過(guò)低等都可能引起網(wǎng)絡(luò)亞健康狀態(tài),盡管產(chǎn)生網(wǎng)絡(luò)亞健康狀態(tài)的原因眾多,但其對(duì)外表現(xiàn)的現(xiàn)象相對(duì)簡(jiǎn)單,主要是網(wǎng)絡(luò)時(shí)延的增加和網(wǎng)絡(luò)丟包率的增加。如下為網(wǎng)絡(luò)丟包率和時(shí)延對(duì)分布式存儲(chǔ)系統(tǒng)性能的影響。

在一個(gè)分布式存儲(chǔ)系統(tǒng)中,單個(gè)節(jié)點(diǎn)網(wǎng)絡(luò)丟包率或網(wǎng)絡(luò)時(shí)延增加時(shí),存儲(chǔ)系統(tǒng)的性能會(huì)極快速的下降,5%的丟包率或50ms時(shí)延,就足以使存儲(chǔ)系統(tǒng)性能下降一半左右。

從網(wǎng)絡(luò)亞健康實(shí)例中可以看出,亞健康狀態(tài)對(duì)系統(tǒng)的危害,微小的一個(gè)亞健康狀態(tài),對(duì)系統(tǒng)性能的影響都是巨大的。此外CPU、內(nèi)存、硬盤(pán)模塊、網(wǎng)卡等硬件部件、操作系統(tǒng)以及軟件運(yùn)行均有可能進(jìn)入亞健康狀態(tài)。

浪潮存儲(chǔ)基于大量來(lái)自企業(yè)、大學(xué)、實(shí)驗(yàn)室等案例的亞健康狀態(tài)的研究,進(jìn)行了故障分類和根因分析,可以看出,硬件亞健康狀態(tài)占比33%,網(wǎng)絡(luò)亞健康狀態(tài)占比38%,這兩類故障占比超過(guò)整體的70%。

亞健康狀態(tài)監(jiān)控

讓分布式存儲(chǔ)運(yùn)行更穩(wěn)定

基于對(duì)亞健康狀態(tài)的表象根因等分析與研究,浪潮在分布式存儲(chǔ)上實(shí)現(xiàn)了亞健康狀態(tài)監(jiān)控功能,對(duì)硬件亞健康狀態(tài)、系統(tǒng)亞健康狀態(tài)以及網(wǎng)絡(luò)亞健康狀態(tài)的實(shí)時(shí)監(jiān)控,當(dāng)系統(tǒng)發(fā)現(xiàn)運(yùn)行過(guò)程中存在亞健康狀態(tài)時(shí),可快速定位亞健康狀態(tài)的原因、上報(bào)故障、并對(duì)亞健康的部件進(jìn)行必要的處理(如嘗試恢復(fù)、隔離部件等),最大限度的降低亞健康狀態(tài)對(duì)存儲(chǔ)系統(tǒng)的影響。

浪潮分布式存儲(chǔ)AS13000配置了亞健康狀態(tài)監(jiān)控之后可以進(jìn)行亞健康狀態(tài)監(jiān)控告警服務(wù)的同時(shí)還具有如下優(yōu)勢(shì):

01精準(zhǔn)定位

亞健康狀態(tài)的場(chǎng)景復(fù)雜,癥狀、根因眾多,檢測(cè)難度大。亞健康狀態(tài)監(jiān)控系統(tǒng)通過(guò)建立硬件亞健康檢測(cè)、網(wǎng)絡(luò)亞健康檢測(cè)以及系統(tǒng)亞健康檢測(cè)的機(jī)制,有效的覆蓋了亞健康狀態(tài)的各種檢測(cè)場(chǎng)景,再加上檢測(cè)信息的精準(zhǔn)分析,能更精準(zhǔn)的定位亞健康狀態(tài)。

02快速處理

存儲(chǔ)系統(tǒng)長(zhǎng)期以亞健康狀態(tài)的狀態(tài)運(yùn)行,會(huì)影響整體性能,監(jiān)控功能可以在短期內(nèi)發(fā)現(xiàn)亞健康狀態(tài),并及時(shí)做出必要的處理。以往為了確保系統(tǒng)運(yùn)行的穩(wěn)定性,運(yùn)維人員預(yù)計(jì)需要每周執(zhí)行一次巡檢腳本,對(duì)整個(gè)集群進(jìn)行健康巡檢。這種方式一方面時(shí)效性差,平均3-4天才可以發(fā)現(xiàn)問(wèn)題;另一方面是巡檢腳本檢測(cè)并不全面。亞健康狀態(tài)監(jiān)控可以150秒內(nèi)發(fā)現(xiàn)網(wǎng)絡(luò)亞健康狀態(tài)并進(jìn)行網(wǎng)口隔離處理、30分鐘內(nèi)發(fā)現(xiàn)系統(tǒng)亞健康狀態(tài)并告警、60分鐘內(nèi)發(fā)現(xiàn)磁盤(pán)溫度異常并告警等;平均發(fā)現(xiàn)系統(tǒng)亞健康狀態(tài)并處理的時(shí)間縮短了四分之三,并且檢測(cè)的項(xiàng)目更全面、結(jié)果更準(zhǔn)確。

具備亞健康狀態(tài)監(jiān)控功能的分布式存儲(chǔ)AS13000,已經(jīng)在金融、通信、教科研、醫(yī)療等行業(yè)規(guī)模部署,在運(yùn)行過(guò)程中亞健康狀態(tài)監(jiān)控功能快速響應(yīng)機(jī)制,降低了亞健康狀態(tài)對(duì)存儲(chǔ)系統(tǒng)的影響與運(yùn)維成本,保障了客戶業(yè)務(wù),讓企業(yè)輕松應(yīng)對(duì)數(shù)字經(jīng)濟(jì)時(shí)代的海量數(shù)據(jù)挑戰(zhàn)。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    450

    瀏覽量

    23784
  • 存儲(chǔ)系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    403

    瀏覽量

    40823
  • 數(shù)據(jù)服務(wù)

    關(guān)注

    0

    文章

    29

    瀏覽量

    9862
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    IP數(shù)據(jù)服務(wù)在保險(xiǎn)行業(yè)的應(yīng)用

    。 IP數(shù)據(jù)服務(wù)在保險(xiǎn)行業(yè)的應(yīng)用主要體現(xiàn)在理賠欺詐檢測(cè)、用戶身份驗(yàn)證、風(fēng)險(xiǎn)監(jiān)控與預(yù)警以及市場(chǎng)需求分析等多個(gè)層面。 ?通過(guò)深入分析用戶的IP地址及行為
    的頭像 發(fā)表于 10-18 09:25 ?146次閱讀

    企業(yè)云存儲(chǔ)如何收費(fèi)?企業(yè)云存儲(chǔ)收費(fèi)標(biāo)準(zhǔn)

    企業(yè)云存儲(chǔ)的收費(fèi)方式因不同的服務(wù)提供商和具體的服務(wù)選項(xiàng)而異,通常從用戶數(shù)量、存儲(chǔ)容量、功能、混合
    的頭像 發(fā)表于 10-09 14:55 ?121次閱讀

    請(qǐng)問(wèn)DIX4192要讀取或者寫(xiě)入狀態(tài)用戶數(shù)據(jù)寄存器的邏輯是什么?

    使用DIX4192通過(guò)SPDIF發(fā)送和接收用戶數(shù)據(jù),配置為48kHZ的采樣率,每次進(jìn)入到接收塊開(kāi)始中斷,延時(shí)2ms去讀取Register Page 1的寄存器. 這樣配置后,上電運(yùn)行幾秒鐘后,鎖相環(huán)會(huì)UNLOCK.下面是寄存器配置,請(qǐng)問(wèn)一下要讀取或者寫(xiě)入狀態(tài)
    發(fā)表于 09-30 07:06

    SpaceX星鏈全球用戶數(shù)量突破400萬(wàn)

    SpaceX的星鏈(Starlink)服務(wù)再次刷新紀(jì)錄,宣布其全球用戶數(shù)量已突破400萬(wàn)大關(guān)。這一成就標(biāo)志著自今年5月底以來(lái),短短四個(gè)月內(nèi),星鏈新增用戶量即達(dá)百萬(wàn)之眾,展現(xiàn)出其低軌道寬帶衛(wèi)星網(wǎng)絡(luò)的強(qiáng)勁增長(zhǎng)勢(shì)頭。
    的頭像 發(fā)表于 09-29 18:17 ?542次閱讀

    隨機(jī)存儲(chǔ)器的特點(diǎn)和結(jié)構(gòu)

    隨機(jī)存儲(chǔ)器最顯著的特點(diǎn)是其易失性,即當(dāng)電源關(guān)閉時(shí),存儲(chǔ)在RAM中的數(shù)據(jù)會(huì)立即丟失。這是因?yàn)镽AM依賴于電流來(lái)維持其存儲(chǔ)數(shù)據(jù)
    的頭像 發(fā)表于 09-26 18:18 ?543次閱讀

    這是幾種HTTPS代理保障用戶數(shù)據(jù)安全的方式#HTTPS代理

    HTTP
    jf_62215197
    發(fā)布于 :2024年08月23日 08:14:11

    閃存的哪些扇區(qū)可用于用戶數(shù)據(jù)存儲(chǔ)?

    我想問(wèn)一下閃存的哪些扇區(qū)可用于用戶數(shù)據(jù)存儲(chǔ)(例如配置、登錄名/密碼)。目前,我正在使用外部存儲(chǔ)器,但使用板載閃存的某些扇區(qū)會(huì)更便宜。我嘗試在用 blank.bin 編寫(xiě)的一些扇區(qū)中寫(xiě)入數(shù)據(jù)
    發(fā)表于 07-12 08:13

    請(qǐng)問(wèn)CYW20829能否通過(guò)Quad SPI連接固件、用戶數(shù)據(jù)和Quad SPI SRAM?

    我計(jì)劃在下圖所示的配置中使用 CYW20829。 是否可以使用 Quad SPI 連接固件、用戶數(shù)據(jù)和 Quad SPI SRAM?
    發(fā)表于 07-03 06:25

    中國(guó)移動(dòng)4月用戶數(shù)增173萬(wàn) 總數(shù)達(dá)9.97億戶

    中國(guó)移動(dòng)4月用戶數(shù)增173萬(wàn) 根據(jù)中國(guó)移動(dòng)公布的2024年4月客戶統(tǒng)計(jì)數(shù)據(jù)顯示,在移動(dòng)業(yè)務(wù)方面,中國(guó)移動(dòng)目前客戶總數(shù)約9.97億戶,中國(guó)移動(dòng)在2024年4月份凈增客戶數(shù)173.7萬(wàn)戶,在24年累計(jì)凈增客
    的頭像 發(fā)表于 05-21 16:10 ?746次閱讀

    Avast因違規(guī)處理用戶數(shù)據(jù)被處以罰款

    據(jù)最新報(bào)道,安全軟件廠商阿瓦斯(Avast)因違規(guī)處理用戶數(shù)據(jù),遭受捷克個(gè)人數(shù)據(jù)保護(hù)部門(mén)罰款高達(dá)3.51億捷克克朗(相當(dāng)于約1.09億元人民幣)。該事件并不是阿瓦斯首次因用戶數(shù)據(jù)處理問(wèn)題受到監(jiān)管部門(mén)懲罰。
    的頭像 發(fā)表于 05-08 14:51 ?425次閱讀

    YouTube Premium新功能“精彩部分跳轉(zhuǎn)”上線,用戶喜好預(yù)測(cè)跳轉(zhuǎn)功能亮相

    這項(xiàng)服務(wù)基于AI技術(shù)和用戶數(shù)據(jù)分析,能夠準(zhǔn)確預(yù)測(cè)用戶可能感興趣的視頻片段,并直接跳轉(zhuǎn)至最精彩的部分。自今年3月起,YouTube已開(kāi)始進(jìn)行此功能的測(cè)試,最初僅向美國(guó)的部分高級(jí)
    的頭像 發(fā)表于 05-06 16:25 ?868次閱讀

    Netflix利潤(rùn)創(chuàng)新高,付費(fèi)用戶數(shù)達(dá)2.696億,季度報(bào)告公布

    Netflix在股東信中指出,未來(lái)將更注重收入及其他財(cái)務(wù)數(shù)據(jù)的披露,而非單純關(guān)注用戶數(shù)。同時(shí),Netflix宣布自2025年Q1起,將不再披露訂閱用戶數(shù)數(shù)據(jù),但在達(dá)到特定里程碑后仍會(huì)
    的頭像 發(fā)表于 04-19 11:27 ?1096次閱讀

    HarmonyOS開(kāi)發(fā)實(shí)例:【分布式數(shù)據(jù)服務(wù)

    分布式數(shù)據(jù)服務(wù)(Distributed Data Service,DDS)為應(yīng)用程序提供不同設(shè)備間數(shù)據(jù)分布式的能力。
    的頭像 發(fā)表于 04-18 10:18 ?666次閱讀
    HarmonyOS開(kāi)發(fā)實(shí)例:【分布式<b class='flag-5'>數(shù)據(jù)服務(wù)</b>】

    達(dá)6000條測(cè)試用例!憶聯(lián)消費(fèi)級(jí)存儲(chǔ)實(shí)驗(yàn)室向業(yè)界標(biāo)桿看齊

    用戶數(shù)據(jù)安全,為終端用戶打造極致的數(shù)據(jù)存儲(chǔ)體驗(yàn)。憶聯(lián)消費(fèi)級(jí)存儲(chǔ)實(shí)驗(yàn)室面積約1000平方米,配備筆記本電腦、Chromebook等大量終端設(shè)備
    的頭像 發(fā)表于 12-25 11:20 ?441次閱讀
    達(dá)6000條測(cè)試用例!憶聯(lián)消費(fèi)級(jí)<b class='flag-5'>存儲(chǔ)</b>實(shí)驗(yàn)室向業(yè)界標(biāo)桿看齊

    4G藍(lán)牙網(wǎng)關(guān)M1000功能及產(chǎn)品介紹

    云平臺(tái)或手機(jī)APP,用戶可以遠(yuǎn)程管理和監(jiān)控M1000的運(yùn)行狀態(tài),包括設(shè)備連接情況、數(shù)據(jù)傳輸速率等。 安全性:M1000采用先進(jìn)的加密技術(shù),保護(hù)用戶數(shù)
    發(fā)表于 12-22 14:38