0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文詳解計(jì)算型存儲(chǔ)協(xié)議框架

UnionMemory憶聯(lián) ? 來(lái)源:UnionMemory憶聯(lián) ? 2024-10-31 14:20 ? 次閱讀

引言

近年來(lái),AI應(yīng)用態(tài)勢(shì)迅猛增加,對(duì)計(jì)算側(cè)的算力和內(nèi)存提出了更高的要求。GPU、HBM這些高性能高密計(jì)算部件和內(nèi)存部件,在AI計(jì)算場(chǎng)景中作為必需品,成為市場(chǎng)熱點(diǎn)。業(yè)界也在討論能否把計(jì)算側(cè)的業(yè)務(wù)卸載到存儲(chǔ)側(cè),稱為計(jì)算型存儲(chǔ)(Computational Storage),通過(guò)存儲(chǔ)側(cè)卸載數(shù)據(jù)預(yù)處理,如數(shù)據(jù)校驗(yàn)、解壓、數(shù)據(jù)提取,甚至卸載局部機(jī)器學(xué)習(xí)訓(xùn)練,從而減輕計(jì)算側(cè)的算力負(fù)載和內(nèi)存負(fù)載。這兩年,SNIA和NVMe陸續(xù)定義了計(jì)算型存儲(chǔ)框架和協(xié)議接口,而IBM、Intel、Dell、Solidigm、Kioxia等知名廠商也在通過(guò)存儲(chǔ)應(yīng)用和SSD盤(pán)聯(lián)合定制,開(kāi)拓計(jì)算型存儲(chǔ)應(yīng)用道路。

01計(jì)算型存儲(chǔ)協(xié)議框架

SNIA在2022年8月發(fā)布的Computational Storage Architecture and Programming Model,描述了計(jì)算型存儲(chǔ)的架構(gòu)和模型定義。計(jì)算型存儲(chǔ)設(shè)備定義為三種模型:計(jì)算型存儲(chǔ)處理器(Computational Storage Processor,CSP)、計(jì)算型存儲(chǔ)盤(pán)(Computational Storage Drive,CSD)和計(jì)算型存儲(chǔ)陣列(Computational Storage Array,CSA)。

b98c0eb2-9734-11ef-a511-92fbcf53809c.png

◎圖1 CSD架構(gòu)

以計(jì)算型存儲(chǔ)盤(pán)(CSD)為例,其架構(gòu)框架如圖1所示。Storage Controller可以對(duì)應(yīng)于SSD的管理控制器,控制Device Memory(如SSD內(nèi)的DDR)和Device Storage(如SSD內(nèi)的NAND Flash)。計(jì)算型存儲(chǔ)主要是定義計(jì)算型存儲(chǔ)資源(Computational Storage Resource, CSR),用于設(shè)備提供用戶可支配使用的計(jì)算資源和內(nèi)存資源。

其中,計(jì)算型存儲(chǔ)引擎(Computational Storage Engine, CSE),是用于提供計(jì)算資源。CSE里面包括計(jì)算型存儲(chǔ)引擎環(huán)境(Computational Storage Engine Environment, CSEE)用于提供執(zhí)行計(jì)算環(huán)境或者平臺(tái),譬如操作系統(tǒng)、Container容器,或者FPGA這種硬件環(huán)境。計(jì)算環(huán)境里通過(guò)計(jì)算型存儲(chǔ)功能(Computational Storage Function, CSF),提供具體的計(jì)算功能,如壓縮、加密、數(shù)據(jù)filter、Erasure Code、RAID、hash/CRC、重刪、正則表達(dá)式計(jì)算等功能。

另一方面,功能數(shù)據(jù)內(nèi)存(Function Data Memory,F(xiàn)DM)是設(shè)備提供給CSE進(jìn)行計(jì)算使用的內(nèi)存區(qū)域。用戶通過(guò)分配功能數(shù)據(jù)內(nèi)存(Allocated Function Data Memory,AFDM)綁定給具體CSF,用于具體計(jì)算存儲(chǔ)輸入數(shù)據(jù)、中間過(guò)程數(shù)據(jù)和輸出結(jié)果。

NVM Express在2024年發(fā)布的Computational Programs Command Set Specification和Subsystem Local Memory Command Set Specification兩個(gè)協(xié)議標(biāo)準(zhǔn),具象化了計(jì)算型存儲(chǔ)框架在NVMe接口上的實(shí)現(xiàn)。NVM Express在原有用于數(shù)據(jù)持久化存儲(chǔ)的NVM Namespace外,額外定義了Compute Namespace和Subsystem Local Memory (SLM) Namespace,分別對(duì)應(yīng)SNIA定義的CSE和FDM,為用戶提供計(jì)算資源和內(nèi)存資源。

b99725a4-9734-11ef-a511-92fbcf53809c.png

◎圖2 NVM Express計(jì)算型存儲(chǔ)框架

NVM Express的計(jì)算型存儲(chǔ)接口架構(gòu)和運(yùn)作,如上圖所示。一個(gè)Compute Namespace可以支持多個(gè)程序(Program)。Program可以支持主機(jī)加載(Downloadable Program),或者是盤(pán)內(nèi)預(yù)設(shè)(Device-defined Program)。用戶在使用前,需要通過(guò)Program Activation Management命令激活這些Program。

Subsystem Local Memory (SLM) 可以提供給Program用作數(shù)據(jù)輸入輸出的內(nèi)存區(qū)域。用戶可以通過(guò)Memory Range Set Management命令,為Compute Namespace建立SLM Namespace中的多個(gè)內(nèi)存區(qū)域(Memory Range)。

用戶在激活需要的Program和建立Program所需的內(nèi)存區(qū)域后,可以通過(guò)以下步驟執(zhí)行Program:

1主機(jī)下發(fā)Memory Copy命令,盤(pán)片從NVM Namespace,即SSD存儲(chǔ)LBA數(shù)據(jù)區(qū)域,讀出數(shù)據(jù)后,拷貝數(shù)據(jù)到SLM的內(nèi)存區(qū)域。此外,主機(jī)也可以下發(fā)Memory Write命令,盤(pán)片從主機(jī)內(nèi)存拷貝數(shù)據(jù)到SLM的內(nèi)存區(qū)域。以準(zhǔn)備好Program執(zhí)行所需要的輸入數(shù)據(jù)。圖2中A1-A3示例是將SSD存儲(chǔ)的數(shù)據(jù)庫(kù)數(shù)據(jù),拷貝到SLM的內(nèi)存區(qū)域。

2主機(jī)通過(guò)下發(fā)Excute Program命令,執(zhí)行Compute Namespace的Program,采用內(nèi)存區(qū)域中的數(shù)據(jù)作為輸入,Program進(jìn)行計(jì)算后,輸出到內(nèi)存區(qū)域中。圖2中B1-B4示例過(guò)程是,主機(jī)調(diào)用盤(pán)內(nèi)的filter program,對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行篩選計(jì)算,將篩選結(jié)果輸出到SLM的內(nèi)存區(qū)域后,上報(bào)主機(jī)。

3主機(jī)通過(guò)下發(fā)Memory Read命令,盤(pán)片將SLM內(nèi)存區(qū)域中的數(shù)據(jù),讀出到主機(jī)內(nèi)存,如圖2中C1-C2所示。

02計(jì)算型存儲(chǔ)應(yīng)用思路

SNIA和NVMe定義了一整套盤(pán)片和主機(jī)進(jìn)行計(jì)算交互的框架和接口,SNIA還定義了一整套的API(見(jiàn)Computational Storage API, SNIA)。這樣可以有效推動(dòng)應(yīng)用規(guī)范化,將計(jì)算型存儲(chǔ)接口落入到設(shè)備驅(qū)動(dòng)、操作系統(tǒng)內(nèi)核等,支撐起主機(jī)應(yīng)用層訪問(wèn)接口標(biāo)準(zhǔn)化。

從SSD設(shè)備的角度來(lái)看,SSD作為存儲(chǔ)部件,在存儲(chǔ)系統(tǒng)內(nèi)分配的空間、功耗和成本都是受約束的。SSD的設(shè)計(jì)規(guī)劃上,SSD并不是一個(gè)強(qiáng)算力系統(tǒng)。對(duì)于一個(gè)15W的SSD來(lái)說(shuō),可能分配到內(nèi)部CPU計(jì)算的功耗不到2W。從SSD CPU和總線選取和設(shè)計(jì)來(lái)說(shuō),CPU的作用主要是進(jìn)行SSD內(nèi)部控制,而不是進(jìn)行數(shù)據(jù)計(jì)算。這樣,在SSD內(nèi)要實(shí)現(xiàn)靈活的、用戶可加載的計(jì)算引擎,如通過(guò)OS或者Container平臺(tái)進(jìn)行軟件計(jì)算,通過(guò)SSD內(nèi)部CPU計(jì)算達(dá)到高性能是很困難的。

從目前業(yè)界趨勢(shì)來(lái)說(shuō),一方面是在SSD控制器外,增加FPGA作為計(jì)算引擎,或者是FPGA同時(shí)用于SSD控制和計(jì)算(如IBM FlashCore Module方案),由于FPGA在芯片封裝大小、成本和功耗上不如ASIC,這樣會(huì)造成整盤(pán)性能、硬件布局、功耗、散熱、成本等一系列的問(wèn)題。另一方面是通過(guò)在控制器ASIC提供定制的硬化引擎,這就對(duì)盤(pán)片廠商有很高的能力要求,除了有盤(pán)片設(shè)計(jì)生產(chǎn)能力,還要有SSD控制器芯片定義和設(shè)計(jì)能力,并且能夠拉通上層應(yīng)用廠商,識(shí)別盤(pán)片卸載業(yè)務(wù)趨勢(shì)進(jìn)行長(zhǎng)遠(yuǎn)規(guī)劃。

這里以2023年Solidigm在Flash Memory Summit發(fā)表的Data scrubbing卸載定制作為示例。存儲(chǔ)服務(wù)器會(huì)經(jīng)常巡檢全部的數(shù)據(jù),即把數(shù)據(jù)全部讀出,進(jìn)行hash計(jì)算(如CRC32、MD5等),再和存儲(chǔ)保存在元數(shù)據(jù)的結(jié)果進(jìn)行比對(duì)。這個(gè)場(chǎng)景下對(duì)于服務(wù)器的算力、內(nèi)存、NVMe/TCP接口都有很大壓力,會(huì)成為業(yè)務(wù)瓶頸。

b99e5eaa-9734-11ef-a511-92fbcf53809c.png

◎圖3 Data scrubbing

Solidigm提出的方案是在盤(pán)內(nèi)進(jìn)行hash計(jì)算。主機(jī)側(cè)組織需計(jì)算的LBA list下發(fā)到盤(pán),盤(pán)片從LBA區(qū)域讀出數(shù)據(jù),存放到盤(pán)內(nèi)內(nèi)存區(qū)域,調(diào)用盤(pán)內(nèi)硬化引擎進(jìn)行CRC32等計(jì)算,只將計(jì)算結(jié)果返回到主機(jī)。

這樣,卸載了主機(jī)側(cè)進(jìn)行hash計(jì)算的算力,由于盤(pán)片只上報(bào)結(jié)果,節(jié)省大量接口數(shù)據(jù)讀取帶寬,以及主機(jī)內(nèi)存,而且可以隨著盤(pán)數(shù)量增加擴(kuò)展計(jì)算能力。

b9c897f6-9734-11ef-a511-92fbcf53809c.png

◎圖4 CSD實(shí)現(xiàn)

03憶聯(lián)端到端能力構(gòu)建

計(jì)算型存儲(chǔ)SSD隨著協(xié)議標(biāo)準(zhǔn)的成熟化,可與客戶聯(lián)合定制實(shí)現(xiàn)業(yè)務(wù)卸載。其價(jià)值是減輕客戶側(cè)的系統(tǒng)算力、內(nèi)存壓力,減少網(wǎng)絡(luò)和設(shè)計(jì)接口帶寬,從而在AI高速發(fā)展的趨勢(shì)下,突破系統(tǒng)瓶頸,發(fā)揮系統(tǒng)能力。

作為一家領(lǐng)先的SSD廠商,憶聯(lián)正積極整合內(nèi)外部資源,深入探索計(jì)算型存儲(chǔ)的前沿領(lǐng)域。通過(guò)引入先進(jìn)的計(jì)算技術(shù),優(yōu)化控制器設(shè)計(jì),并結(jié)合智能存儲(chǔ)管理,致力于開(kāi)發(fā)具有高性能、高可靠性和智能化特性的存儲(chǔ)解決方案。

憶聯(lián)不僅關(guān)注對(duì)數(shù)據(jù)傳輸效率和存儲(chǔ)容量的提升,更關(guān)注探索各垂直應(yīng)用領(lǐng)域的融合技術(shù)創(chuàng)新。憶聯(lián)擁有成熟的芯片、軟件、硬件、以及生產(chǎn)團(tuán)隊(duì),能夠支撐SSD從控制器芯片、軟件業(yè)務(wù)、硬件設(shè)計(jì)、裝備生產(chǎn)的端到端規(guī)劃和設(shè)計(jì)開(kāi)發(fā),可支撐各垂直行業(yè)客戶實(shí)現(xiàn)SSD聯(lián)合定制,滿足多樣化市場(chǎng)需求,突破客戶業(yè)務(wù)瓶頸,創(chuàng)造各行各業(yè)的客戶價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19096

    瀏覽量

    228792
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4222

    瀏覽量

    85569
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    20

    文章

    2833

    瀏覽量

    117116
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29780

    瀏覽量

    268063

原文標(biāo)題:Tech Talk: 淺談AI浪潮下的計(jì)算型存儲(chǔ)SSD

文章出處:【微信號(hào):UnionMemory憶聯(lián),微信公眾號(hào):UnionMemory憶聯(lián)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    解析SpringBoot2整合SSM框架

    SpringBoot2整合SSM框架詳解
    發(fā)表于 06-09 16:43

    解析Spring框架

    Spring框架詳解 - 03
    發(fā)表于 06-17 17:15

    讀懂什么是NEC協(xié)議

    讀懂什么是NEC協(xié)議
    發(fā)表于 10-15 09:22

    基于EVMS和SNMP的存儲(chǔ)管理框架

    提出種基于企業(yè)卷管理系統(tǒng)(EVMS)和簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)的存儲(chǔ)管理框架,有效解決了SonD系統(tǒng)中存儲(chǔ)服務(wù)器磁盤(pán)、分區(qū)、軟件RAI
    發(fā)表于 04-22 09:53 ?10次下載

    tcp ip協(xié)議詳解

    tcp ip協(xié)議詳解:《TCP/IP詳解,卷1:協(xié)議》是本完整而詳細(xì)的TCP/IP
    發(fā)表于 05-19 12:02 ?712次下載

    詳解藍(lán)牙模塊原理與結(jié)構(gòu)

    電子發(fā)燒友網(wǎng)站提供《詳解藍(lán)牙模塊原理與結(jié)構(gòu).pdf》資料免費(fèi)下載
    發(fā)表于 11-26 16:40 ?94次下載

    詳解區(qū)塊鏈的存儲(chǔ)體系

    從數(shù)據(jù)庫(kù)的角度看待區(qū)塊鏈的存儲(chǔ)機(jī)制會(huì)簡(jiǎn)單直觀很多。在個(gè)標(biāo)準(zhǔn)的關(guān)系數(shù)據(jù)庫(kù)中,存儲(chǔ)般分為日志存儲(chǔ)
    發(fā)表于 11-26 14:59 ?8857次閱讀

    詳解精密封裝技術(shù)

    詳解精密封裝技術(shù)
    的頭像 發(fā)表于 12-30 15:41 ?1601次閱讀

    詳解分立元件門(mén)電路

    詳解分立元件門(mén)電路
    的頭像 發(fā)表于 03-27 17:44 ?2863次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>詳解</b>分立元件門(mén)電路

    詳解pcb和smt的區(qū)別

    詳解pcb和smt的區(qū)別
    的頭像 發(fā)表于 10-08 09:31 ?3143次閱讀

    詳解pcb地孔的作用

    詳解pcb地孔的作用
    的頭像 發(fā)表于 10-30 16:02 ?1507次閱讀

    詳解pcb不良分析

    詳解pcb不良分析
    的頭像 發(fā)表于 11-29 17:12 ?1104次閱讀

    詳解pcb的msl等級(jí)

    詳解pcb的msl等級(jí)
    的頭像 發(fā)表于 12-13 16:52 ?8654次閱讀

    詳解pcb微帶線設(shè)計(jì)

    詳解pcb微帶線設(shè)計(jì)
    的頭像 發(fā)表于 12-14 10:38 ?2673次閱讀

    詳解pcb的組成和作用

    詳解pcb的組成和作用
    的頭像 發(fā)表于 12-18 10:48 ?1397次閱讀