存儲廠商NGD Systems公司副總裁Scott Shadley在一次專題訪談中,探討了SNIA計算存儲(CS)工作組自成立以來的技術進步。Scott Shadley除了擔任NGD Systems副總裁的職位外,Scott還是存儲網(wǎng)絡行業(yè)協(xié)會(SNIA)的董事會成員。
標準組織推出的新技術獲得“官方定義”并不多見。但要獲得這樣的“定義”,這項技術需要相當大的突破。因此,希望正式引入計算存儲(CS)——這是一種淘汰傳統(tǒng)計算機存儲技術的存儲架構,以提供一種更快、更經(jīng)濟、更省電的方式來存儲和分析PB字節(jié)的數(shù)據(jù)。
企業(yè)存儲的發(fā)展
簡而言之,計算存儲是一種IT架構,其中數(shù)據(jù)在存儲設備級別進行處理,以減少必須在存儲和計算平臺之間移動的數(shù)據(jù)量。因此,該技術提供了一種更快、更高效的方法來應對數(shù)據(jù)密集型世界的獨特挑戰(zhàn),通過減少數(shù)據(jù)移動和允許對分析的響應速度高達20到40倍來滿足減少的多余帶寬,并提供非常低的延遲響應時間。
如果考慮一下企業(yè)存儲的發(fā)展歷史,計算存儲的發(fā)展速度是適當?shù)?。得益于NVMe和NVMe Over Fabrics輔助的新閃存技術,該技術的發(fā)展越來越快。當今的數(shù)據(jù)中心(包括超大規(guī)模數(shù)據(jù)中心)主要依賴于使用馮·諾依曼體系結構的基本方法構建的傳統(tǒng)服務器硬件,馮·諾依曼體系結構適用于幾乎所有通用服務器,是具有70年歷史的計算機體系結構,坦率地說,這種體系結構多年來從未經(jīng)歷過太多的變化。
而一些新方法并沒有取得太大的成功?,F(xiàn)在有了諸如人工智能和機器學習之類的應用程序,這些應用程序需要大量的原始數(shù)據(jù)(結構化和非結構化),這些數(shù)據(jù)需要高計算能力來“學習”,因此計算能力已成為瓶頸。在傳統(tǒng)的橫向擴展模型中,此問題通過添加節(jié)點來解決,從而獲得更多的分布式計算能力和更多的內存。不幸的是,從投資成本和運營成本角度來看,添加服務器節(jié)點的成本很高。添加更多節(jié)點還增加了互連的長度,從而增加了數(shù)據(jù)移動和分析所需的時間。
計算存儲這種技術可以將傳感器(例如自動駕駛汽車、視頻監(jiān)控攝像頭、交通信號燈)中的原始信息巧妙地組織為有意義的數(shù)據(jù),因為缺乏移動性可以促進實時數(shù)據(jù)分析,從而通過減少輸入來提高性能/輸出瓶頸。隨著人工智能、機器學習、物聯(lián)網(wǎng)工作負載涌現(xiàn)出驚人的數(shù)據(jù)量(IDC公司的研究表明,到2025年,數(shù)據(jù)總量將超過163 ZB,其中95%是由物聯(lián)網(wǎng)設備生成的),這項新技術是真正缺失的環(huán)節(jié)。
調研機構Dimensional Research公司最近對300多位計算機存儲專業(yè)人員進行的一項調查揭示了這一挑戰(zhàn),表明存儲瓶頸可能發(fā)生在10 TB以下。這樣,計算存儲可以提供更強大的處理能力來輔助每個主機CPU,從而使組織可以提取其可以生成的所有數(shù)據(jù),并僅提供真正需要的數(shù)據(jù),從而使“管道”盡可能保持開放。這樣一來,就可以收集更多分析所需的原始數(shù)據(jù),并為組織提供僅從該數(shù)據(jù)中提取實現(xiàn)價值所需的自由。在比較中,當組織必須處理整個數(shù)據(jù)集時,就會延誤增值。這種方法可最大程度地提高效率,減少功耗,并降低運營成本。這種“分類、轉換、發(fā)送”方法使快速、全面和有意義的實時數(shù)據(jù)應用成為可能。
計算存儲的官方定義只花了一年時間就制定出來了,這是一個相當迅速的過程,證明了對這種截然不同的計算機存儲技術的迫切需求。一年多前,存儲網(wǎng)絡行業(yè)協(xié)會(SNIA)召開會議,研究如何圍繞計算存儲技術定義和制定標準。SNIA是一個非盈利組織,由198家信息技術領域的成員公司組成。經(jīng)過幾個月的會議和一些辯論,他們現(xiàn)在已經(jīng)制定了官方定義:
?“計算存儲體系結構可通過集成計算資源(直接與存儲、存儲附近或主機與存儲之間)集成來提高應用程序性能和/或基礎設施效率。這些計算資源不在傳統(tǒng)的計算和內存體系結構之外。
?這些體系結構的目標是:啟用并行計算;減少I/O流量;減輕對現(xiàn)有計算、內存、存儲和I/O的其他限制?!?/p>
受益于計算存儲的行業(yè)
當將計算存儲應用于多個用例時,將變得更易于理解。要求計算存儲技術強大和高效的行業(yè)示例是新型“智能”汽車和即將推出的全自動駕駛汽車,這些汽車必須處理數(shù)據(jù)負載(每天高達28TB)以進行分析,否則可能會影響駕駛員的安全性。一些設計計算存儲架構的公司已經(jīng)能夠提供利用小型化技術的技術,該技術可以與SSD硬盤一起使用來處理數(shù)據(jù)負載。這在空間受限的邊緣相關(例如汽車)中效果很好。但是,盡管外形尺寸很大,計算存儲解決方案仍可以將功能提高20倍甚至更多,并且使支持人工智能的系統(tǒng)能夠以前所未有的方式讀取和分析數(shù)據(jù)。
在數(shù)以千計的物理服務器和數(shù)百萬個虛擬機上運行的超大規(guī)模數(shù)據(jù)中心(例如AWS的數(shù)據(jù)中心基礎設施)必須并行執(zhí)行各種工作負載。這些超大規(guī)模數(shù)據(jù)中心開始使用計算存儲驅動器(CSD)來處理PB級的數(shù)據(jù),同時也帶來了體積小、功耗低但仍具有巨大計算能力的更小尺寸的優(yōu)點。這樣,體積小巧但功能強大的計算存儲驅動器(CSD)可以幫助提高超大規(guī)模架構的計算能力,這些超大規(guī)模架構將機器用于人工智能(AI)和機器學習(ML)應用程序,而這些應用程序通常需要諸如實時、復雜和并行索引的操作和模式匹配。
例如,出于欺詐檢測目的而需要實時分析大量數(shù)據(jù)以獲取銷售點數(shù)據(jù)的零售企業(yè),也可能會受益于計算存儲更快的響應時間。Storage Switzerland公司發(fā)布的調查報告指出,“這些應用程序必須在執(zhí)行分析請求之前掃描大量數(shù)據(jù),以識別與查詢相關的信息子集。將大量數(shù)據(jù)移出存儲系統(tǒng),跨網(wǎng)絡并移入主機內存會導致時間和延遲損失,這是實時分析應用程序無法承受的?!?/p>
內容交付網(wǎng)絡(CDN)是利用計算存儲技術的另一個市場。在這里,該技術可以幫助進行加密/數(shù)字版權管理(用于驗證用戶可以訪問內容)。在這種情況下,計算存儲通過安全地解鎖內容而不共享密鑰來提供更好的數(shù)據(jù)管理。這種將每個服務器機架的密鑰匹配提高40倍的能力僅僅是這項工作的開始。
總結
事實上,在當今數(shù)據(jù)密集的世界中,更少的數(shù)據(jù)移動是至關重要的。數(shù)據(jù)移動的成本不僅僅是時間,還有資源,有時還會浪費分析資源?,F(xiàn)在是采取下一步存儲和實施NVMe計算存儲驅動器的時候了。按照數(shù)據(jù)的步驟進行操作,注意在硬盤驅動器內部做了多少工作將節(jié)省數(shù)據(jù)移動時間,這將提高效率,并減少主機CPU和內存負載的采用。
責任編輯:ct
評論
查看更多