隨著大數(shù)據(jù)的大量來源以及企業(yè)可用數(shù)據(jù)量的增加,存儲(chǔ)容量規(guī)劃已成為存儲(chǔ)管理員的問題。據(jù)估計(jì),每天產(chǎn)生2.5萬億字節(jié)的數(shù)據(jù)。現(xiàn)在,如果以神經(jīng)元計(jì)算的話,那就是相當(dāng)于2.5億個(gè)人類大腦的海量數(shù)據(jù)。而且,相同的估計(jì)表明,全球總數(shù)據(jù)的90%是從2016年到2018年生成的。
可以簡(jiǎn)單地說,每天生成越來越多的數(shù)據(jù),這正增加了存儲(chǔ)工作負(fù)載的規(guī)模和復(fù)雜性。但是,人工智能可以拯救存儲(chǔ)管理員,幫助他們高效地存儲(chǔ)和管理數(shù)據(jù)。通過使用AI數(shù)據(jù)存儲(chǔ),供應(yīng)商和企業(yè)可以將存儲(chǔ)管理提升到一個(gè)新的水平。而且,存儲(chǔ)管理員可以找到他們目前正在努力管理的指標(biāo)的解決方案。
存儲(chǔ)管理員需要努力的主要指標(biāo)
存儲(chǔ)管理員在管理存儲(chǔ)問題時(shí)面臨一些挑戰(zhàn)。而且,如果他們克服了這些挑戰(zhàn),將幫助他們?cè)跀?shù)據(jù)存儲(chǔ)的各個(gè)方面之間找到適當(dāng)?shù)钠胶?,例如在哪里分配工作?fù)載,如何分配工作負(fù)載以及如何優(yōu)化堆棧等等。
一般而言,吞吐量是指處理某事物的速率。在網(wǎng)絡(luò)級(jí)別,吞吐量的度量單位是Mbps(兆位/秒),而在存儲(chǔ)級(jí)別,吞吐量的度量單位是MB /秒(兆字節(jié)/秒)。由于一個(gè)字節(jié)等于八兆位,因此生產(chǎn)率在存儲(chǔ)級(jí)別上提高了。并且,變得難以管理提高的生產(chǎn)率。
延時(shí)
延遲是服務(wù)器完成請(qǐng)求所花費(fèi)的時(shí)間。關(guān)于存儲(chǔ),這是指滿足單個(gè)存儲(chǔ)塊的請(qǐng)求所花費(fèi)的時(shí)間。存儲(chǔ)塊或塊存儲(chǔ)是將數(shù)據(jù)存儲(chǔ)在卷中的塊。純延遲不受吞吐量影響,但是如果單個(gè)塊請(qǐng)求很大,則應(yīng)用延遲可能會(huì)隨著吞吐量的增加而偏離。
IOPS(每秒輸入/輸出操作)
IOPS是指存儲(chǔ)堆棧每秒可以處理的離散讀寫任務(wù)的數(shù)量。存儲(chǔ)堆棧是一種允許過程調(diào)用的數(shù)據(jù)結(jié)構(gòu)。這意味著將多個(gè)過程彼此存儲(chǔ)在堆棧中,然后在調(diào)用和返回的基礎(chǔ)上一個(gè)接一個(gè)地執(zhí)行所有過程。例如,如果一個(gè)過程被調(diào)用,它將被執(zhí)行,然后返回,以便在堆棧中調(diào)用下一個(gè)過程。而且,在談?wù)揑OPS時(shí),基礎(chǔ)輸入/輸出任務(wù)可以達(dá)到存儲(chǔ)系統(tǒng)的堆棧限制。例如,讀取一個(gè)大文件和多個(gè)小文件可能會(huì)對(duì)IOPS產(chǎn)生影響。由于讀取單個(gè)大文件僅需要執(zhí)行一個(gè)讀取任務(wù),因此可以以較高的速度執(zhí)行它,而另一方面,讀取多個(gè)文件的速度非常慢,因?yàn)樾枰獔?zhí)行許多讀取任務(wù)。
AI數(shù)據(jù)存儲(chǔ)如何解決存儲(chǔ)問題
企業(yè)管理員和存儲(chǔ)供應(yīng)商處理各種各樣的存儲(chǔ)類型。而且,它們還滿足不同輸入/輸出服務(wù)的指標(biāo)。大型文件共享應(yīng)用可能需要適當(dāng)?shù)耐掏铝?,但也必須允許延遲損失,因?yàn)榇笮投鴱?fù)雜的應(yīng)用可能會(huì)對(duì)延遲產(chǎn)生不利影響。另一方面,電子郵件服務(wù)器可能需要大量存儲(chǔ),低延遲和良好的吞吐量,但它可能不需要非常苛刻的IOPS配置文件。并且,存儲(chǔ)管理員應(yīng)該決定應(yīng)該為哪些存儲(chǔ)分配什么資源。因此,在組織中運(yùn)行著成千上萬的服務(wù)時(shí),對(duì)基礎(chǔ)存儲(chǔ)的管理超過了人們進(jìn)行明智更改的能力。而且,這就是AI算法派上用場(chǎng)的地方。
人工智能支持的存儲(chǔ)管理和計(jì)劃
AI可以監(jiān)控存儲(chǔ)以檢測(cè)多種工作負(fù)載的模式和性能。這里的工作負(fù)載是由各種輸入/輸出特征或應(yīng)用任務(wù)生成的數(shù)據(jù)流。通過檢測(cè)這些工作負(fù)載模式,AI可以幫助存儲(chǔ)管理員洞悉哪些工作負(fù)載可能使他們面臨最大化存儲(chǔ)陣列的風(fēng)險(xiǎn)。此外,存儲(chǔ)監(jiān)視還可以幫助了解是否有任何額外的工作負(fù)載可以放入陣列中。而且,如果添加到陣列中,那么工作負(fù)載將造成多少中斷。
例如,假設(shè)一家企業(yè)正在向流程中添加電子郵件服務(wù)器。在這種情況下,人工智能系統(tǒng)可以幫助預(yù)測(cè)存儲(chǔ)陣列將能夠滿足該服務(wù)器的存儲(chǔ)需求還是將其最大化。借助此類技術(shù),存儲(chǔ)管理員可以主動(dòng)獲取有關(guān)如何將不同的工作負(fù)載分配給不同的存儲(chǔ)堆棧并最大程度地減少延遲的信息。因此,將AI集成到存儲(chǔ)陣列,存儲(chǔ)供應(yīng)商和組織中可以優(yōu)化存儲(chǔ)堆棧。
除了監(jiān)視存儲(chǔ)活動(dòng)外,存儲(chǔ)管理員還需要檢查和分析存儲(chǔ)系統(tǒng)要使用的應(yīng)用的編碼和錯(cuò)誤。這有助于他們更好地了解如何圍繞應(yīng)用的需求設(shè)計(jì)存儲(chǔ)體系結(jié)構(gòu)。他們通過了解應(yīng)用的輸入/輸出模式來做到這一點(diǎn)。用于執(zhí)行此操作的最常見技術(shù)是捕獲應(yīng)用的跟蹤。
Strace是Linux的用戶空間實(shí)用程序,可用于診斷、調(diào)試和獲取有關(guān)輸入和輸出功能的指令。但是,由于復(fù)雜的應(yīng)用可以具有多個(gè)輸入/輸出功能,因此這對(duì)人類來說可能是一個(gè)挑戰(zhàn)。另一方面,ML算法可以輕松地提取和分析大量數(shù)據(jù),并解決許多存儲(chǔ)問題,最好是通過查看存儲(chǔ)系統(tǒng)本身來解決。此外,通過使用大量數(shù)據(jù)訓(xùn)練算法,以了解特定堆?;蛘麄€(gè)應(yīng)用如何收集和存儲(chǔ)數(shù)據(jù),它們可以幫助實(shí)現(xiàn)對(duì)該特定應(yīng)用存儲(chǔ)活動(dòng)的實(shí)時(shí)觀察,以防止堆棧最大化并改善存儲(chǔ)容量。
AI數(shù)據(jù)存儲(chǔ)可滿足客戶需求
遙測(cè)數(shù)據(jù)是自動(dòng)記錄和無線傳輸來自遠(yuǎn)程或不可訪問來源的數(shù)據(jù)。遙測(cè)以下列方式起作用:傳感器在源處測(cè)量數(shù)據(jù),它們將其轉(zhuǎn)換為電壓,然后將其與定時(shí)數(shù)據(jù)合并為單個(gè)數(shù)據(jù)流,該數(shù)據(jù)流將傳輸?shù)竭h(yuǎn)程接收器。接收后,可以根據(jù)用戶要求對(duì)數(shù)據(jù)進(jìn)行處理。
AI的計(jì)算機(jī)視覺技術(shù)可以掃描遙測(cè)數(shù)據(jù),以保護(hù)存儲(chǔ)陣列免受漏洞侵害。當(dāng)使用有關(guān)漏洞的歷史數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),機(jī)器學(xué)習(xí)算法可以將來自各種應(yīng)用程序的傳入數(shù)據(jù)與歷史數(shù)據(jù)進(jìn)行匹配,以發(fā)現(xiàn)漏洞的可能性。因此,借助AI的預(yù)測(cè)分析,存儲(chǔ)供應(yīng)商可以著眼于在遇到客戶之前防止存儲(chǔ)問題。
AI數(shù)據(jù)存儲(chǔ)仍處于起步階段,但已經(jīng)顯示出了驚人的結(jié)果。而且,因此云供應(yīng)商和其他存儲(chǔ)管理員正在對(duì)AI進(jìn)行越來越多的投資,以使用超融合存儲(chǔ)系統(tǒng)進(jìn)行存儲(chǔ)維護(hù)。采用主流AI數(shù)據(jù)存儲(chǔ)肯定會(huì)幫助企業(yè)控制上述所有指標(biāo),并為其客戶提供更好的服務(wù)。
責(zé)任編輯:YYX
-
人工智能
+關(guān)注
關(guān)注
1789文章
46659瀏覽量
237093 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8854瀏覽量
137212
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論