0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能和對象存儲相遇,將會產(chǎn)生什么化學(xué)反應(yīng)

牽手一起夢 ? 來源:IT168網(wǎng)站 ? 作者:葉毓睿 ? 2020-04-23 17:00 ? 次閱讀

每當(dāng)看到人工智能(也即AI),我們通常會想到機(jī)器人、自動化、圖像語音或視頻識別、算法等高大上的黑科技。而對象存儲則給人一種低調(diào)、海量的感覺。是什么原因,讓這兩者相遇,并擦出了火花?

什么是對象存儲?

對象存儲是自包含、自愈合的智能存儲設(shè)備,具有容量大、速度快、擴(kuò)展靈活的特點(diǎn)。每一個對象除了存放數(shù)據(jù)本身之外,還存放了唯一標(biāo)識符和數(shù)據(jù)的元信息,例如創(chuàng)建的日期和時間,屬主,大小,索引,保留周期,QoS等。對象本身使得數(shù)據(jù)的組織得到了簡化,避免了傳統(tǒng)存儲文件目錄樹形結(jié)構(gòu)的復(fù)雜。對象的存放是扁平化地方式保存在bucket(桶)中的,變得更簡單。而且對象的元信息,也方便了檢索。

拿生活中常見的例子來比喻,當(dāng)圖書館購進(jìn)新的紙質(zhì)書籍需要存放時,需要按照圖書分類法(按照圖書的內(nèi)容、形式、體裁和讀者用途等進(jìn)行分類),清楚地知道大類、子類和更詳細(xì)的分類,才能找到合適的位置上架。文件存儲的數(shù)據(jù)存放就類似圖書分門別類地存放,如下圖。

當(dāng)我們逛超市需要存包的時候,盡管有那么多儲物柜,但是大家都覺得存取包很簡單。存的時候,按一下存包按鍵,啪的一聲,一個柜子打開,同時你會得到包含二維碼的紙條,你把包放到柜子里,但是不用記住柜子的位置和編號,瀟灑的離開。當(dāng)你取包的時候,你刷一下二維碼,也是啪的一聲,放包的柜子自動打開,所存物品唾手可得。對象存儲的數(shù)據(jù)存放方式就和超市存取包很類似,存儲對象的唯一標(biāo)識符就相當(dāng)于那個二維碼。

下圖是對象存儲的一些特點(diǎn)。

人工智能和對象存儲相遇,將會產(chǎn)生什么化學(xué)反應(yīng)

對象存儲特點(diǎn)

不過,我們需要注意的是,文件存儲和對象存儲有著各自適用的場景。下圖列出了分布式文件存儲和分布式對象存儲的區(qū)別:

分布式文件存儲與分布式對象存儲的區(qū)別

當(dāng)文件數(shù)量級過億的時候,文件目錄樹形結(jié)構(gòu)會對數(shù)據(jù)的讀寫造成巨大的挑戰(zhàn),例如在linux中如果用ls查看文件,可能都要等待幾十分鐘以上。但是,量級沒有如此之大時,因?yàn)檫^去的使用習(xí)慣,以及相對成熟的生態(tài),使用文件存儲還是不錯的選擇。

如何避免錯誤理解對象存儲

當(dāng)我們談對象存儲時,需要注意討論的是存儲接口,還是內(nèi)部數(shù)據(jù)組織形式。

1)實(shí)際上,討論對象存儲大多數(shù)是指存儲接口,是否支持RestFul或S3,也即對象接口的形式來訪問存儲空間。

2)少數(shù)情況下,對象存儲指存儲設(shè)備的內(nèi)部數(shù)據(jù)組織形式。在數(shù)據(jù)猛增的背景下,越來越多的存儲設(shè)備內(nèi)部采用對象存儲的這種內(nèi)部數(shù)據(jù)組織形式。例如VMware vSAN,其實(shí)是是一種基于服務(wù)器端存儲的共享分布式對象存儲系統(tǒng),只不過存儲接口主要采用的是SCSI方式;或者具備高可靠、高性能、高安全和易管理的浪潮AS13000,如下圖。

浪潮AS13000G5的對象存儲功能

AI與對象存儲

在許多人的印象中,AI需要大量的算力,是計(jì)算密集型的典型應(yīng)用。而對象存儲大多時候用于海量非結(jié)構(gòu)化數(shù)據(jù)的存放,備份歸檔,云存儲、企業(yè)云盤、文檔影像或視頻的存儲等。從存儲特征來看,對象存儲的延遲可能較難滿足AI的性能需求;從使用習(xí)慣來看,大多數(shù)AI用戶都是采用文件接口。

實(shí)際上,有計(jì)算,就會有存儲,只是或多或少,或快或慢,或過渡或長期保存的區(qū)別。

在微信公眾號浪潮存儲《2020:下一個十年,存儲發(fā)展的趨勢是什么》上篇也即鑒往事篇 一文中,曾提到:

AI所需存儲,可以分為準(zhǔn)備、訓(xùn)練、推理和歸檔等階段,每個階段的IO特征不一樣,對于存儲的要求也不一樣。例如,在推理階段,IO的特征是讀寫混合,并且要求存儲的延時低,能快速響應(yīng)。

下圖列出了AI各個階段的IO特征,及其對存儲的要求。

AI各個階段的IO特征及存儲需求

綜合考慮用戶使用習(xí)慣、性價比、性能和容量,如果能夠取得一個平衡的話,對象存儲能夠用在AI的多個不同階段中,如提取、準(zhǔn)備、訓(xùn)練、歸檔等。

NVIDIA收購SwiftStack用來做什么呢?

首先,我們來看一下做為事實(shí)上的標(biāo)準(zhǔn)的AWS S3,從骨子里說,它代表的對象存儲,是一種在線的海量數(shù)據(jù)較低成本的存儲方式,適合跨地域讀寫;因此,雖然備份歸檔是對象存儲的使用場景之一,但只是做備份歸檔,其實(shí)是委屈了對象存儲。

其次,對象存儲的高并發(fā),特別適合前端呈現(xiàn)分布式負(fù)載的場景。AI場景的使用,包括AI訓(xùn)練、AI推理,是由許許多多個任務(wù)并發(fā)進(jìn)行的,任務(wù)與任務(wù)之間幾乎沒有數(shù)據(jù)的交互,因此很少考慮存儲通常要顧及的寫一致性。

因此,在我們看來,NVIDIA收購SwiftStack或許有如下幾個原因:

1)NVIDIA欲整合AI基礎(chǔ)架構(gòu)

NVIDIA是一個非常注重生態(tài)的公司,它的版圖里應(yīng)該不僅僅是計(jì)算以及衍生出來的各個組件,從近兩年的動作來看,NVIDIA想整合整個AI基礎(chǔ)架構(gòu)。2019年3月11日NVIDIA以69億美元收購 Mellanox;2020年3月6日宣布收購SwiftStack。

2)SwiftStack具備數(shù)據(jù)跨云管理和高并發(fā)的優(yōu)勢

據(jù)報(bào)道:“Manuvir Das表示,NVIDIA尤其喜歡SwiftStack的1space技術(shù),該技術(shù)可以為忙于處理緩存和分層等任務(wù)的GPU助一臂之力。

SwiftStack V7于2019年發(fā)布,提供數(shù)PB的規(guī)模,可處理數(shù)千個worker節(jié)點(diǎn)同時訪問數(shù)據(jù)的任務(wù)。它提供了超過100GB /秒的吞吐速度,性能和容量都能實(shí)現(xiàn)線性擴(kuò)展。

1space是NVIDIA收購Swiftstack的主要原因,這是一種文件連接件,使云原生應(yīng)用程序可以通過S3或Swift對象API訪問本地?cái)?shù)據(jù)或AWS數(shù)據(jù),并可以確保不斷向數(shù)據(jù)提供計(jì)算資源”

我個人認(rèn)為,AI訓(xùn)練有個特點(diǎn),它一次性將原始訓(xùn)練集的數(shù)據(jù)加載到計(jì)算節(jié)點(diǎn)的內(nèi)存或者SSD后,需要經(jīng)過一段較長的時間(也即計(jì)算或說訓(xùn)練),才會再次讀取存儲上的數(shù)據(jù)。因此,對象存儲的延遲可能不會構(gòu)成障礙,這一點(diǎn)可以通過高并發(fā)來彌補(bǔ)。

3)還可將SwiftStack用于數(shù)據(jù)提取,或者數(shù)據(jù)歸檔階段。海量的數(shù)據(jù),采用對象存儲是一個不錯的選擇。

4)維護(hù)原有使用習(xí)慣

NVIDIA內(nèi)部大量使用SwiftStack來存儲數(shù)據(jù),幾年下來,習(xí)慣已經(jīng)養(yǎng)成,而且猜測數(shù)據(jù)量也非常龐大。通過收購SwiftStack,以免未來受人制肘,也是有可能的。

無論如何,對象存儲在云計(jì)算和AI迅猛普及的情況下,一定會迎來它的春天。IDC中國SDS市場數(shù)據(jù)顯示,2019年對象存儲增長率55.3%,是中國軟件定義存儲市場里增速最快的細(xì)分領(lǐng)域。

在中國的對象存儲市場中,浪潮的AS13000做出了貢獻(xiàn)。2019年,AS13000對象存儲成功地在某銀行(國內(nèi)排名前15)總行的影像系統(tǒng)中部署,并實(shí)現(xiàn)了同城容災(zāi)功能。如下圖所示:

浪潮AS13000對象存儲的實(shí)際案例

浪潮分布式存儲在不斷迭代的過程中,除了前面提到的同城容災(zāi)之外,還開發(fā)了大量的其他高級特性。一是小對象聚合。浪潮對象存儲針對海量小文件場景,通過小對象聚合,節(jié)約HDD的磁盤IO,提升存儲效率。二是讀Cache加速。在卡口圖片、AI計(jì)算場景,通過讀Cache加速提升數(shù)據(jù)讀取效率。三是元數(shù)據(jù)檢索。在存儲系統(tǒng)內(nèi)集成索引引擎,實(shí)現(xiàn)根據(jù)對象元數(shù)據(jù)多條件模糊檢索對象的技術(shù),有效地提升了海量非結(jié)構(gòu)化數(shù)據(jù)中“大海撈針”的效率。四是企業(yè)級WORM,滿足企業(yè)客戶數(shù)據(jù)的法規(guī)性要求,結(jié)合應(yīng)用特點(diǎn),靈活設(shè)置寬限期和保護(hù)期。此外,還有存儲OS加固、桶策略配置等等。

展望未來

受“新冠疫情”影響,在線化、數(shù)字化、分散化、自動化等新形態(tài)新模式,也對AI、大數(shù)據(jù)中心(含計(jì)算、存儲、網(wǎng)絡(luò)和安全)等的發(fā)展提出了迫切的需求。

疫情趨勢預(yù)測、風(fēng)險預(yù)警、醫(yī)療資源和物質(zhì)的預(yù)測和調(diào)配,要做到快速、準(zhǔn)確、科學(xué)的判斷,需要和AI結(jié)合。

另外,非接觸的服務(wù)和工作、自動化、快速分析決策和響應(yīng)的需求等,將會爆發(fā)。例如,人臉識別(包括免摘口罩的人臉識別)、AI輔助診斷、應(yīng)急管理、安防監(jiān)控、知識圖譜、基因研究、醫(yī)藥研發(fā)、金融服務(wù)、智能配送、各行各業(yè)的無人值守(例如零售)、物流運(yùn)輸、個人畫像、軌跡追蹤、輿情分析等等。

我們相信,作為新基建的一部分,包含AI和存儲在內(nèi)的信息基礎(chǔ)設(shè)施將迎來更好更快的發(fā)展。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    8273

    瀏覽量

    150026
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4134

    瀏覽量

    85312
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46103

    瀏覽量

    235322
收藏 人收藏

    評論

    相關(guān)推薦

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學(xué)家做了什么? 人工智能將如何改變我們所生
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    西部數(shù)據(jù)發(fā)布全新人工智能數(shù)據(jù)周期存儲框架,助力用戶發(fā)掘人工智能價值

    Data Cycle)框架,助力推動下一代人工智能革新。該框架共分為六個階段,詳細(xì)闡明了如何通過優(yōu)化存儲組合來應(yīng)對大規(guī)模人工智能運(yùn)算負(fù)載。該框架旨在為用戶搭建先進(jìn)的存儲基礎(chǔ)架構(gòu)提供指
    的頭像 發(fā)表于 06-11 10:57 ?302次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識指引 14分50秒 https
    發(fā)表于 05-10 16:46

    化學(xué)電池的工作原理是什么

    化學(xué)電池的工作原理基于氧化還原反應(yīng),這是一種化學(xué)反應(yīng),涉及電子從一個物質(zhì)轉(zhuǎn)移到另一個物質(zhì)。
    的頭像 發(fā)表于 04-28 14:38 ?1714次閱讀

    化學(xué)儲能的特點(diǎn)包括哪些?電化學(xué)儲能的效率?

    化學(xué)儲能是一種通過電池或其他電化學(xué)設(shè)備的化學(xué)反應(yīng)存儲和釋放能量的技術(shù)。它在電力系統(tǒng)、新能源汽車、便攜式電子設(shè)備等領(lǐng)域有著廣泛的應(yīng)用。
    的頭像 發(fā)表于 04-26 15:15 ?1047次閱讀

    什么是電化學(xué)儲能?電化學(xué)儲能技術(shù)主要包括哪些?

    化學(xué)儲能是一種通過電化學(xué)反應(yīng)將電能轉(zhuǎn)換為化學(xué)能進(jìn)行存儲,并在需要時再將化學(xué)能轉(zhuǎn)換回電能的技術(shù)。
    的頭像 發(fā)表于 04-26 15:09 ?4290次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎(chǔ)知識指引
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    鉛酸蓄電池正極反應(yīng)式為什么可以吸引硫酸根離子

    、過氧化鉛和硫酸組成的。而負(fù)極是由鉛材料組成。在電池放電過程中,正極發(fā)生化學(xué)反應(yīng),以產(chǎn)生電流供給外部電路使用。 鉛酸蓄電池正極為什么可以吸引硫酸根離子?這涉及到電化學(xué)反應(yīng)和物質(zhì)間的吸引力。以下是詳細(xì)解釋: 1.電
    的頭像 發(fā)表于 01-17 10:06 ?1534次閱讀

    如何使單片機(jī)與無線供電結(jié)合,從而使人工智能脫離電池和線路?

    如何使單片機(jī)與無線供電結(jié)合,從而使人工智能脫離電池和線路
    發(fā)表于 10-31 06:34

    什么是模擬人工智能,模擬人工智能的優(yōu)勢

    的增長格局中。   然而,人工智能無處不在并非沒有成長的痛苦。在許多方面,大型語言模型 (LLM)、自然語言處理、語音識別、強(qiáng)化學(xué)習(xí)和其他系統(tǒng)背后的深度神經(jīng)網(wǎng)絡(luò) (DNN) 技術(shù)使用大量存儲、內(nèi)存和處理作為創(chuàng)建有效 AI 技術(shù)
    的頭像 發(fā)表于 09-29 10:22 ?1849次閱讀
    什么是模擬<b class='flag-5'>人工智能</b>,模擬<b class='flag-5'>人工智能</b>的優(yōu)勢