0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

對象存儲適合AI和機器學習工作負載的三個原因

如意 ? 來源:51cto ? 作者:51cto ? 2020-07-06 09:27 ? 次閱讀

各種各樣的企業(yè)在加快AI機器學習項目,但要真正發(fā)揮潛力,需要克服重大的技術障礙。雖然計算基礎架構常常是關注的重點,但存儲同樣重要。這三個主要的原因表明了為什么對象存儲(而不是文件存儲或塊存儲)特別適合AI和機器學習工作負載:

1. 可擴展性——有龐大且多樣的數(shù)據(jù)源可供學習時,AI和機器學習最有效。數(shù)據(jù)科學家利用這些豐富的數(shù)據(jù)來訓練領域模型。在“大數(shù)據(jù)的五個V”(容量、種類、速度、準確性和價值)中,前兩個(容量和種類)最重要。簡而言之,AI和機器學習依賴大量多樣化的數(shù)據(jù)(圖像、文本、結構化和半結構化數(shù)據(jù)),構建有用的模型、提供準確的結果并最終提供業(yè)務價值。

對象存儲是最具擴展性的存儲架構,特別適合支持AI和機器學習所需的大量數(shù)據(jù)。對象存儲旨在通過橫向擴展方法支持無限增長,使企業(yè)組織能夠通過隨時隨地添加節(jié)點來擴大部署范圍。由于對象存儲使用單個全局命名空間,也可以同時跨多個地方進行這種擴展。另一方面,文件和塊系統(tǒng)通常采用縱向擴展方法。這意味著這種平臺通過為單個節(jié)點添加更多計算資源實現(xiàn)縱向擴展,這種方法最終受到限制。它們無法通過部署額外節(jié)點來增加計算資源以高效地橫向擴展。

2. API——健壯靈活的數(shù)據(jù)API對于AI和機器學習很重要,如前所述,AI和機器學習使用多種類型的數(shù)據(jù)。存儲平臺需要支持API以容納各種數(shù)據(jù)。此外,AI和機器學習方面的創(chuàng)新日益在公共云上完成,但是仍有相當一部分的AI和機器學習在本地或私有云中進行,這取決于使用場合的具體情況(比如說,科學研究和醫(yī)療保健等領域的容量密集型工作負載往往最適合私有云)。這意味著企業(yè)需要在公共云和本地/私有云中都支持工作負載的存儲API。

文件和塊存儲平臺在它們支持的API方面受到限制,部分原因是它們是較舊的架構。相比之下,對象存儲使用云端更高級的API,這種API旨在以應用程序為中心,并支持比文件和塊存儲更廣泛的API,包括版本控制、生命周期管理、加密、對象鎖定和元數(shù)據(jù)。此外,支持AI和機器學習使用場景的新對象存儲API(比如支持流數(shù)據(jù)和海量數(shù)據(jù)集的查詢)也有可能。

由于對象存儲API圍繞Amazon S3實現(xiàn)了標準化,更容易整合本地和公共云中的軟件。企業(yè)可以輕松地將部署的AI和機器學習從本地/私有云環(huán)境擴展到公共云,或者將云原生的AI和機器學習工作負載遷移到本地環(huán)境,功能不會減損。這種雙模式方法使企業(yè)能夠以合作、可互換的方式利用本地/私有云和公共云上的資源。

由于S3 API已成為對象存儲事實上的標準,許多軟件工具和庫都可以充分利用該API。這允許共享代碼、軟件和工具,促進AI/機器學習社區(qū)更快速的開發(fā)。例子包括流行的機器學習平臺,比如擁有內置S3 API的TensorFlow和Apache Spark。

3.元數(shù)據(jù)——與API一樣,使用AI和機器學習的企業(yè)利用無限制、可自定義的元數(shù)據(jù)顯得至關重要。元數(shù)據(jù)就是關于數(shù)據(jù)的數(shù)據(jù)——從最基本的層面上講,某個數(shù)據(jù)何時在何地創(chuàng)建、創(chuàng)建者是誰。但是元數(shù)據(jù)可以描述更多信息:用戶可以創(chuàng)建任意的元數(shù)據(jù)標簽來描述他們需要的任何屬性。

數(shù)據(jù)科學家需要豐富的元數(shù)據(jù)來查找特定數(shù)據(jù)以構建和使用AI和機器學習模型。隨著更多信息添加到數(shù)據(jù)中,元數(shù)據(jù)注釋便于逐步積累知識。

文件和塊存儲僅支持有限的元數(shù)據(jù),比如上述基本屬性。這在很大程度上歸結為可擴展性,因為文件和塊系統(tǒng)無力支持快速無縫的增長,如果存儲系統(tǒng)為依賴龐大數(shù)據(jù)集的AI和機器學習應用程序支持豐富的元數(shù)據(jù),自然會出現(xiàn)這種情況。然而,對象存儲支持無限制的、完全可自定義的元數(shù)據(jù),從而更容易找到用于AI和機器學習算法的數(shù)據(jù),并從中獲得更準確的信息。

以一家醫(yī)院針對X射線圖像使用圖像識別應用程序為例:有了元數(shù)據(jù),可以使用TensorFlow模型來分析添加到對象存儲系統(tǒng)的每個圖像,然后為每個圖像分配細化的元數(shù)據(jù)標簽(比如,傷病類型、基于骨骼大小或生長情況來判斷患者的年齡或性別)。然后可以針對該元數(shù)據(jù)訓練TensorFlow模型,并加以分析,對患者獲得新的寶貴信息(比如說,二三十歲的女性比五年前更容易患骨骼疾?。?。

幾乎每家《財富》 500強公司都在大張旗鼓地搞AI和機器學習,可以想象這些技術在可預見的將來將是最重要的企業(yè)IT項目。然而,AI/機器學習項目要獲得回報,企業(yè)就要使用合適的存儲基礎架構。由于可擴展性、支持各種API(尤其是S3)和豐富的元數(shù)據(jù),對象存儲可謂是AI和機器學習的最佳支柱。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4226

    瀏覽量

    85580
收藏 人收藏

    評論

    相關推薦

    關于對象存儲和云硬盤區(qū)別,你了解多少?

    掛載到云服務器上使用,適合高性能、低延遲的數(shù)據(jù)庫和文件系統(tǒng)存儲。選擇哪種方案應根據(jù)具體業(yè)務需求和數(shù)據(jù)類型決定。UU云小編將從定義特點、使用方式與共享、存儲與訪問特性、應用場景等四方面
    的頭像 發(fā)表于 11-01 10:57 ?64次閱讀

    AI大模型與傳統(tǒng)機器學習的區(qū)別

    多個神經網絡層組成,每個層都包含大量的神經元和權重參數(shù)。 傳統(tǒng)機器學習 :模型規(guī)模相對較小,參數(shù)數(shù)量通常只有幾千到幾百萬,模型結構相對簡單。 二、訓練數(shù)據(jù)需求 AI大模型 :需要大規(guī)
    的頭像 發(fā)表于 10-23 15:01 ?296次閱讀

    使用帶有三個DC-DC模塊的UCC39002的48VIN、12VOUT負載共享系統(tǒng)

    電子發(fā)燒友網站提供《使用帶有三個DC-DC模塊的UCC39002的48VIN、12VOUT負載共享系統(tǒng).pdf》資料免費下載
    發(fā)表于 10-22 10:23 ?0次下載
    使用帶有<b class='flag-5'>三個</b>DC-DC模塊的UCC39002的48VIN、12VOUT<b class='flag-5'>負載</b>共享系統(tǒng)

    RISC-V如何支持不同的AI機器學習框架和庫?

    RISC-V如何支持不同的AI機器學習框架和庫?還請壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    AI引擎機器學習陣列指南

    云端動態(tài)工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數(shù)據(jù)科學家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應用的性能。AI 引擎
    的頭像 發(fā)表于 09-18 09:16 ?286次閱讀
    <b class='flag-5'>AI</b>引擎<b class='flag-5'>機器</b><b class='flag-5'>學習</b>陣列指南

    機器人語言系統(tǒng)包括三個基本狀態(tài)

    機器人語言系統(tǒng)(有時也被稱為機器人語言操作系統(tǒng))確實包括三個基本狀態(tài),這些狀態(tài)是機器人程序運行和管理的核心組成部分。它們分別是: 監(jiān)控狀態(tài) :在此狀態(tài)下,系統(tǒng)負責對
    的頭像 發(fā)表于 09-04 09:24 ?288次閱讀

    LM258A兩上電后燒穿,三個不正常工作是什么原因導致的?

    您好 客戶在使用LM258AD/SOIC-8,小批100臺,遇到兩上電后燒穿,三個不正常工作。原理圖如下, VDD± 12V,輸出DC 2.5V,麻煩問下,可能是什么原因,有沒有好
    發(fā)表于 08-02 11:54

    簡述極管的三個工作區(qū)域

    極管的三個區(qū)域,通常指的是其在不同工作條件下的狀態(tài)區(qū)域,即截止區(qū)、放大區(qū)和飽和區(qū)。這三個區(qū)域定義了極管在不同電壓和電流條件下的行為特性,
    的頭像 發(fā)表于 07-29 10:50 ?2213次閱讀

    可調變阻器三個引腳怎么區(qū)分

    的區(qū)分對于正確使用可調變阻器至關重要。本文將介紹可調變阻器的三個引腳的區(qū)分方法。 一、可調變阻器的工作原理 在了解可調變阻器的三個引腳之前,我們首先需要了解其工作原理??烧{變阻器主要由
    的頭像 發(fā)表于 07-24 11:12 ?788次閱讀

    機器人視覺可以分為哪三個部分?

    機器人視覺是機器人技術中的一重要分支,它涉及到圖像處理、計算機視覺、機器學習等多個領域。機器
    的頭像 發(fā)表于 07-04 11:17 ?512次閱讀

    微波測量的三個基本參量是什么

    微波測量是電子工程領域中的一重要分支,它涉及到對微波信號的頻率、幅度、相位等參數(shù)的測量。在微波測量中,有三個基本參量:頻率、幅度和相位。這三個參量是微波信號的基本特征,對于微波系統(tǒng)的設計、調試
    的頭像 發(fā)表于 05-28 14:46 ?1036次閱讀

    籬笆三個樁——記晶體極管的發(fā)明

    籬笆三個樁——記晶體極管的發(fā)明
    的頭像 發(fā)表于 05-12 08:14 ?617次閱讀
    一<b class='flag-5'>個</b>籬笆<b class='flag-5'>三個</b>樁——記晶體<b class='flag-5'>三</b>極管的發(fā)明

    三個高速放大器中的一出現(xiàn)震蕩是什么原因?

    三個高速放大器中的一出現(xiàn)震蕩,請問這是什么原因?
    發(fā)表于 11-27 07:54

    AI Transformer模型支持機器視覺對象檢測方案

    使用機器視覺進行對象檢測需要 AI 模型/算法在 AI 芯片、FPGA 或模塊上運行。它們通常被稱為“人工智能引擎”。在首次訓練后,可以部署 AI
    發(fā)表于 11-23 10:31 ?459次閱讀
    <b class='flag-5'>AI</b> Transformer模型支持<b class='flag-5'>機器</b>視覺<b class='flag-5'>對象</b>檢測方案

    mos管三個引腳怎么區(qū)分

    工作原理中起到不同的作用,下面將詳細介紹這三個引腳的區(qū)分。 首先,我們來了解MOS管的基本結構和工作原理。MOS管是基于金屬-氧化物-半導體(Metal-Oxide-Semiconductor,簡稱MOS)結構制造的一種晶體管
    的頭像 發(fā)表于 11-22 16:51 ?6920次閱讀