0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

分布式融合存儲解決方案驅(qū)動非結(jié)構(gòu)化數(shù)據(jù)多模計算

浪潮存儲 ? 來源:未知 ? 2023-10-30 19:45 ? 次閱讀

隨著5G、AI、大數(shù)據(jù)等新一代信息技術在千行百業(yè)中深度應用,非結(jié)構(gòu)化數(shù)據(jù)呈來源多樣化、維度豐富化、數(shù)據(jù)量爆炸式增長的特征,數(shù)據(jù)體量從早期的TB級、PB級過渡到現(xiàn)今的EB級。據(jù)IDC預測,2025年全球新增數(shù)據(jù)可達175ZB,其中80%為非結(jié)構(gòu)化數(shù)據(jù),大量數(shù)據(jù)以多模態(tài)形式呈現(xiàn)。

非結(jié)構(gòu)化數(shù)據(jù)多模計算的應用場景

非結(jié)構(gòu)化數(shù)據(jù)多模計算涵蓋海洋觀測、自動駕駛、石油勘探、天文觀測、生命科學、AIGC、六大應用場景。

海洋觀測預報系統(tǒng)。海洋多模態(tài)數(shù)據(jù)具有超巨系統(tǒng)屬性,根據(jù)當前關于海洋數(shù)據(jù)量的研究,2030年全球海洋數(shù)據(jù)總量將達到275PB。NETCDF(Network Common Data Form)是海洋多模態(tài)數(shù)據(jù)最常用的存儲格式,海洋遙感圖像和時空序列數(shù)值是其數(shù)據(jù)主體。海洋物聯(lián)網(wǎng)的快速機動組網(wǎng)觀測系統(tǒng)是海洋科學研究的基礎,由信息感知層、信息傳輸層、信息處理層及信息應用層組成。目前海洋觀測手段正由固定平臺觀測向固定與移動平臺協(xié)同觀測方向發(fā)展;海洋信息傳輸系統(tǒng)主要以岸基移動通信、海上無線通信、衛(wèi)星通信和水聲通信等網(wǎng)絡體系實現(xiàn)對全球覆蓋;信息處理層是指開發(fā)快速機動組網(wǎng)觀測系統(tǒng)軟件,基于海洋觀測裝備及傳輸鏈路,研究多平臺、多要素海洋環(huán)境及目標實時數(shù)據(jù)采集技術;信息應用層是指生成數(shù)據(jù)分析產(chǎn)品,提供信息分發(fā)與共享服務,并與國家海洋環(huán)境安全保障平臺對接。

自動駕駛感知系統(tǒng)。自動駕駛驅(qū)動的核心是高質(zhì)量的標注數(shù)據(jù),并基于海量的數(shù)據(jù)來優(yōu)化訓推模型。據(jù)統(tǒng)計每輛測試車每天產(chǎn)生約25TB數(shù)據(jù),一個中等規(guī)模的車隊每年產(chǎn)生幾十甚至上百PB的數(shù)據(jù)。自駕車輛終端采集的數(shù)據(jù)類型包括LiDAR數(shù)據(jù)(bin格式)、RGB圖像(jpeg格式)、標簽數(shù)據(jù)(txt格式)與CALIB校正數(shù)據(jù)(txt格式)。自駕的全生命周期過程包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)預處理、數(shù)據(jù)標注、模型訓練、仿真測試與部署發(fā)布,上述環(huán)節(jié)中所使用的工具和平臺,被稱作“工具鏈”。以數(shù)據(jù)處理為例,單數(shù)據(jù)類型就多種多樣,包括攝像頭數(shù)據(jù)、毫米波雷達數(shù)據(jù)、激光雷達點云數(shù)據(jù),需要先對這些數(shù)據(jù)進行去噪,也就是所謂的“數(shù)據(jù)清洗”。數(shù)據(jù)處理完成后,下一步便開始數(shù)據(jù)標注。標注的類型大致可分為2D、3D目標物標注、聯(lián)合標注、車道線標注和語義分割等,還要涉及到具體標注規(guī)范和標注質(zhì)檢流程,整個流程異常繁瑣。而這復雜流程的每一個環(huán)節(jié),都需要與之對應的工具和存儲的支撐。

勘探開發(fā)一體化系統(tǒng)。石油勘探開發(fā)包含地震、鉆測井、油氣水井等與生產(chǎn)開發(fā)相關的多種數(shù)據(jù)類型。目前陸上高精度三維地震數(shù)據(jù)體規(guī)??蛇_幾十TB,海上原始地震數(shù)據(jù)體可以達到上百TB。地震數(shù)據(jù)是地震勘探中體量最大的數(shù)據(jù)類型,SEG(Society of Exploration Geophysicists)是地震多模態(tài)數(shù)據(jù)最常用的存儲格式,野外采集地震數(shù)據(jù)為64位SEG-D格式,室內(nèi)地震處理在數(shù)據(jù)交換基本都采用32位SEG-Y格式。鉆測井中核磁共振與成像測井數(shù)據(jù)的體量最大,對測井數(shù)據(jù)存儲速度、可靠性、安全性與精確性的要求較高。油氣井等開發(fā)數(shù)據(jù)以現(xiàn)場大量的實時傳感數(shù)據(jù)為基礎的,處理時限要求高,各類傳感終端產(chǎn)生實時、連續(xù)的事件流,數(shù)據(jù)流處理系統(tǒng)必須快速對其進行響應并及時輸出結(jié)果。

非結(jié)構(gòu)化數(shù)據(jù)多模計算融合存儲解決方案

不同應用場景的非結(jié)構(gòu)化多模計算涉及計算、感知、調(diào)查、文獻與結(jié)果等多種數(shù)據(jù)類型。計算數(shù)據(jù)包括科研平臺、功能實驗室等產(chǎn)生的數(shù)據(jù);感知數(shù)據(jù)涉及大數(shù)據(jù)物聯(lián)網(wǎng)前端傳感器、視頻與雷達等實時采集的數(shù)據(jù);調(diào)查數(shù)據(jù)指統(tǒng)一的調(diào)查報告平臺,如科研數(shù)據(jù)、任務報告、數(shù)據(jù)報告等匯總的過程數(shù)據(jù);文獻數(shù)據(jù)是通過網(wǎng)絡、爬蟲、期刊、會議、輿情等途徑收集到的相關新聞、論文、報告等數(shù)據(jù);結(jié)果數(shù)據(jù)涵蓋云平臺、容器平臺、大數(shù)據(jù)平臺、GPU渲染節(jié)點和AI計算節(jié)點在離線渲染和計算產(chǎn)生的結(jié)果數(shù)據(jù)?;诜墙Y(jié)構(gòu)多模計算的應用場景,浪潮信息發(fā)布新一代分布式存儲產(chǎn)品與端到端一體化的解決方案,幫助客戶存好、用好、管好核心數(shù)據(jù)資產(chǎn)。

新一代分布式存儲產(chǎn)品

AS13000G7/AS15000G7

AS13000G7面向多模數(shù)據(jù)融合應用場景,提供多源數(shù)據(jù)零拷貝技術,實現(xiàn)文件、對象、大數(shù)據(jù)、視頻四種協(xié)議融合互通,承載非結(jié)構(gòu)化多模計算的實際應用,減少數(shù)據(jù)拷貝過程中的性能開銷。有效解決非結(jié)構(gòu)化數(shù)據(jù)多模計算應用場景下,各協(xié)議數(shù)據(jù)無法互相訪問、高效融合共享的問題,消除存儲信息孤島。

AS15000G7則是面向高性能應用場景,是一種專門為集群環(huán)境設計的高性能、可擴展的、具有全局統(tǒng)一命名空間的并行文件系統(tǒng)??梢栽谌杭械亩鄠€節(jié)點間實現(xiàn)對共享文件系統(tǒng)中文件的快速存取操作,并提供穩(wěn)定的故障恢復和容錯機制,存儲軟件功能包括生命周期管理、GDS、文件雙活、數(shù)據(jù)壓縮與隔離、遠程異步復制等。

wKgaomU_mHuAAYFIAAQIqFKG6-0384.png

端到端一體化存儲解決方案

一套集群配置高速SSD與大容量HDD等多個存儲池,依據(jù)業(yè)務需求靈活調(diào)整,更好地對接現(xiàn)有和未來可能部署的云平臺、容器、大數(shù)據(jù)、物聯(lián)網(wǎng)(IOT)等各種應用。同時,整個集群也可以將多種存儲池進行統(tǒng)一管理,部署成一個存儲集群,這樣既能更好地滿足業(yè)務需求,也能保護投資,避免資源閑置。基于標準協(xié)議,分布式存儲集群無縫對接云平臺應用,并為計算資源提供塊、文件、對象、大數(shù)據(jù)、視頻等多樣化的數(shù)據(jù)服務,靈活承載私有云、公有云和混合云平臺。存儲容量和性能實現(xiàn)彈性擴展,安全隔離租戶底層的數(shù)據(jù)資源,數(shù)據(jù)可靠性為99.9999%,實現(xiàn)存儲資源的統(tǒng)一管理和調(diào)度。

應用“存算分離”大數(shù)據(jù)集群架構(gòu),數(shù)據(jù)存放在專業(yè)的存儲節(jié)點,便于客戶分級分類管理。分布式存儲通過原生HDFS協(xié)議對接大數(shù)據(jù)平臺,提高數(shù)據(jù)訪問效率,簡化運維管理。存儲集群基于CSI接口對接容器平臺,承載非結(jié)構(gòu)化多模計算場景中的敏態(tài)業(yè)務,為Kubernetes集群中的應用自動地提供持久化存儲服務,同時也便于其它容器平臺通過CSI接口獲取存儲信息并調(diào)配底層存儲資源。人工智能平臺作為AI軟硬件技術的融合載體,將為AI產(chǎn)業(yè)的發(fā)展提供大規(guī)模數(shù)據(jù)處理和高性能智能計算支撐,具有高度并行的特點。應用高性能并行存儲文件系統(tǒng)對接AI訓推一體化平臺,滿足模型訓練推理過程中超高帶寬、極低時延與極致IOPS需求。

面對增長迅速、多維、海量等特性的非結(jié)構(gòu)化多模數(shù)據(jù),傳統(tǒng)集中式文件存儲方式在數(shù)據(jù)使用率、查詢分析效率、安全維護和管理上存在不足。浪潮信息通過軟件化的模塊定義方式,提供非結(jié)構(gòu)化數(shù)據(jù)多模計算場景下端到端一體化的融合存儲的解決方案,實現(xiàn)同一基礎架構(gòu)上不同應用之間的數(shù)據(jù)業(yè)務應用融合,提升集群“存算協(xié)同”的能力,降低了用戶投資、維護和管理的成本。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4122

    瀏覽量

    85271
  • 浪潮
    +關注

    關注

    1

    文章

    442

    瀏覽量

    23711

原文標題:分布式融合存儲解決方案驅(qū)動非結(jié)構(gòu)化數(shù)據(jù)多模計算

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案
    的頭像 發(fā)表于 09-14 09:53 ?127次閱讀
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>系統(tǒng)醫(yī)療影像<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    基于分布式對象存儲WDS的信托結(jié)構(gòu)化數(shù)據(jù)整合平臺

    基于分布式對象存儲WDS的信托結(jié)構(gòu)化數(shù)據(jù)整合平臺
    的頭像 發(fā)表于 08-28 09:56 ?141次閱讀
    基于<b class='flag-5'>分布式</b>對象<b class='flag-5'>存儲</b>WDS的信托<b class='flag-5'>非</b><b class='flag-5'>結(jié)構(gòu)化</b><b class='flag-5'>數(shù)據(jù)</b>整合平臺

    醫(yī)療PACS影像數(shù)據(jù)的極速分布式存儲解決方案

    醫(yī)療PACS影像數(shù)據(jù)的極速分布式存儲解決方案
    的頭像 發(fā)表于 08-23 10:13 ?144次閱讀
    醫(yī)療PACS影像<b class='flag-5'>數(shù)據(jù)</b>的極速<b class='flag-5'>分布式</b>塊<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案

    黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案
    的頭像 發(fā)表于 07-01 09:54 ?222次閱讀
    黑龍江電力高性能WDS<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>系統(tǒng)<b class='flag-5'>解決方案</b>

    分布式存儲計算:大數(shù)據(jù)時代的解決方案

    分布式存儲計算技術應運而生,并迅速成為處理大數(shù)據(jù)的首選方案。本文將深入探討分布式
    的頭像 發(fā)表于 03-07 14:42 ?565次閱讀

    分布式智慧終端:挑戰(zhàn)與解決方案

    分布式智慧終端在應用中面臨多種挑戰(zhàn),以下是其中一些關鍵的挑戰(zhàn)以及可能的解決方案數(shù)據(jù)一致性挑戰(zhàn) :在分布式系統(tǒng)中,數(shù)據(jù)的一致性是一個關鍵問
    的頭像 發(fā)表于 01-24 14:50 ?314次閱讀

    分布式光伏電力監(jiān)控解決方案

    分布式光伏電力監(jiān)控解決方案
    的頭像 發(fā)表于 01-14 08:07 ?343次閱讀
    <b class='flag-5'>分布式</b>光伏電力監(jiān)控<b class='flag-5'>解決方案</b>

    分布式IO工業(yè)自動數(shù)據(jù)采集與分析的核心

    代替人工操縱機器和機器體系進行加工生產(chǎn)的趨勢,分布式I/O可以與各種傳感器、執(zhí)行器和控制系統(tǒng)相連接,實現(xiàn)生產(chǎn)線的自動控制。通過實時采集和傳輸數(shù)據(jù),分布式I/O能夠精確控制生產(chǎn)過程中的
    發(fā)表于 12-28 14:47

    CFD 設計利器:結(jié)構(gòu)化結(jié)構(gòu)化網(wǎng)格的組合使用

    在CFD的發(fā)展歷史中,結(jié)構(gòu)化網(wǎng)格出現(xiàn)最早,至今仍在使用。結(jié)構(gòu)化網(wǎng)格有幾個主要優(yōu)點,如精度高、生成速度快、單元分布均勻。有些工具擅長繪制這類網(wǎng)格,例如CadenceFidelityAutomesh
    的頭像 發(fā)表于 12-23 08:12 ?1271次閱讀
    CFD 設計利器:<b class='flag-5'>結(jié)構(gòu)化</b>和<b class='flag-5'>非</b><b class='flag-5'>結(jié)構(gòu)化</b>網(wǎng)格的組合使用

    一圖讀懂《分布式融合存儲研究報告(2023)》

    轉(zhuǎn)自:存儲產(chǎn)業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟 2023年11月30日, 存 儲產(chǎn)業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟、中國電子技術標準研究院聯(lián)合發(fā)布《分布式融合存儲研究報
    的頭像 發(fā)表于 12-21 18:05 ?527次閱讀
    一圖讀懂《<b class='flag-5'>分布式</b><b class='flag-5'>融合</b><b class='flag-5'>存儲</b>研究報告(2023)》

    redis分布式鎖可能出現(xiàn)的問題及解決方案

    Redis分布式鎖是一種常見的解決分布式系統(tǒng)中并發(fā)問題的方案。雖然Redis分布式鎖具有許多優(yōu)點,但也存在一些潛在的問題需要注意。本文將詳細介紹Redis
    的頭像 發(fā)表于 12-04 11:29 ?795次閱讀

    springcloud 分布式事務解決方案實例

    么都執(zhí)行成功,要么都執(zhí)行失敗。本文將介紹如何使用Spring Cloud來實現(xiàn)分布式事務。 在分布式系統(tǒng)中,使用數(shù)據(jù)庫事務來保證數(shù)據(jù)一致性是常見的做法。Spring Cloud通過集成
    的頭像 發(fā)表于 12-03 16:32 ?917次閱讀

    分布式數(shù)據(jù)恢復-hbase+hive分布式存儲誤刪除文件的數(shù)據(jù)恢復方案

    hbase+hive分布式存儲數(shù)據(jù)恢復環(huán)境: 16臺某品牌R730XD服務器節(jié)點,每臺物理服務器節(jié)點上有數(shù)臺虛擬機,虛擬機上配置的分布式,上層部署hbase
    的頭像 發(fā)表于 11-24 15:55 ?329次閱讀

    分布式融合存儲研究報告(2023)》即將發(fā)布 | 釋放數(shù)據(jù)潛能,筑基數(shù)字經(jīng)濟

    隨著云計算、大數(shù)據(jù)、人工智能、高性能和計算等技術的發(fā)展,以文本、圖片和視頻為代表的
    的頭像 發(fā)表于 11-03 18:35 ?442次閱讀

    高效管理海量數(shù)據(jù)!憶聯(lián) SSD 為分布式存儲提供極致性能

    近年來,為滿足大規(guī)模的存儲應用需求,分布式存儲成為云環(huán)境下存儲底座構(gòu)建的重要選擇,相較于傳統(tǒng)集中式存儲
    的頭像 發(fā)表于 10-13 15:55 ?512次閱讀
    高效管理海量<b class='flag-5'>數(shù)據(jù)</b>!憶聯(lián) SSD 為<b class='flag-5'>分布式</b>塊<b class='flag-5'>存儲</b>提供極致性能