0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DPU應(yīng)用場景系列(二) 存儲(chǔ)功能卸載

中科馭數(shù)(北京)科技有限公司 ? 2022-05-19 14:34 ? 次閱讀

DPU應(yīng)用場景系列(二)存儲(chǔ)功能卸載

一、NVMe-oF硬件加速

NVMe over Fabric(又名NVMe-oF)是一個(gè)相對(duì)較新的協(xié)議規(guī)范,旨在使用NVMe通過網(wǎng)絡(luò)結(jié)構(gòu)將主機(jī)連接到存儲(chǔ),支持對(duì)數(shù)據(jù)中心的計(jì)算和存儲(chǔ)進(jìn)行分解。NVMe-oF協(xié)議定義了使用各種通用的傳輸協(xié)議來實(shí)現(xiàn)NVMe功能的方式。

在NVMe-oF誕生之前,數(shù)據(jù)存儲(chǔ)協(xié)議可以分為三種:

(1)iSCSI:是一種基于IP的存儲(chǔ)網(wǎng)絡(luò)標(biāo)準(zhǔn),在TCP/IP網(wǎng)絡(luò)上通過發(fā)送SCSI命令來訪問塊存儲(chǔ)服務(wù)。

(2)光纖通道(Fibre Channel):是一種高速的數(shù)據(jù)傳輸協(xié)議,提供有序無損的塊數(shù)據(jù)傳輸。主要用于關(guān)鍵高可靠要求的業(yè)務(wù)上。

(3)SAS(Serial Attached SCSI):一種點(diǎn)對(duì)點(diǎn)串行協(xié)議,通過SAS線纜傳輸數(shù)據(jù)。

上述數(shù)據(jù)存儲(chǔ)協(xié)議,在當(dāng)今數(shù)據(jù)爆發(fā)的時(shí)代,已經(jīng)無法滿足大數(shù)據(jù)量的傳輸。NVMe-oF的出現(xiàn),不僅解決了上述協(xié)議的性能瓶頸問題,它還允許組織為高度分布式、高度可用的應(yīng)用程序?qū)嵤M向擴(kuò)展的存儲(chǔ)。通過將NVMe協(xié)議擴(kuò)展到SAN設(shè)備,NVMe-oF提高了CPU的使用效率,同時(shí)提高了服務(wù)器和存儲(chǔ)應(yīng)用程序之間的連接速度。

NVMe-oF主要支持三大類Fabric傳輸選項(xiàng),分別是FC、RDMA和TCP,其中RDMA支持InfiniBand、RoCEv2和iWARP。

NVMe-oF/FC和第六代FC可以共存于同一基礎(chǔ)設(shè)施中,避免了數(shù)據(jù)中心的叉車升級(jí)。但是,NVMe-oF/FC不具有軟件定義存儲(chǔ)的能力。

NVMe-oF/RDMA利用了RDMA網(wǎng)絡(luò)的優(yōu)勢,是理想的Fabric,提供了低延遲、低抖動(dòng)和低CPU使用率低傳輸層協(xié)議,可以最大限度利用硬件加速,避免軟件協(xié)議棧開銷。同時(shí),由于RDMA是一種內(nèi)存讀寫技術(shù),可以應(yīng)用在眾多場景中,如GPUDirect Storage的應(yīng)用場景。

NVMe-oF/TCP利用了TCP協(xié)議的可靠性傳輸?shù)奶攸c(diǎn),以及TCP/IP網(wǎng)絡(luò)的通用性和良好的互操作性,可以完美的應(yīng)用于現(xiàn)代數(shù)據(jù)中心網(wǎng)絡(luò)。在相對(duì)性能要求不是非常高的場景,NVMe-oF/TCP可作為備選。

NVMe支持Host端(Initiator或Client)和Controller端(Target或Server),目前DPU智能網(wǎng)卡硬件加速的場景中,包括如下四種情況:

(1)普通智能網(wǎng)卡硬件加速NVMe-oF Initiator。智能網(wǎng)卡支持NVMe-oF/TCP和NVMe-oF/RoCEv2作為Initiator,通過硬件卸載NVMe-oF/TCP或NVMe-oF/RoCEv2,用于計(jì)算和存儲(chǔ)之間,來達(dá)到較高性能。

(2)支持GPUDirect Storage的智能網(wǎng)卡加速NVMe-oF Initiator和Target。GPUDirect Storage是NVIDIA提出的GPU可以繞過CPU直接訪問存儲(chǔ)磁盤的技術(shù),RDMA技術(shù)是GPUDirect Storage的基礎(chǔ)。這類網(wǎng)卡可以通過硬件卸載NVMe-oF/RDMA來實(shí)現(xiàn)GPU與遠(yuǎn)端存儲(chǔ)服務(wù)的直接訪問。常見的如NVMe-oF/RDMA IB和NVMe-oF/RoCEv2。

(3)智能網(wǎng)卡硬件加速NVMe-oF Target。該場景主要是通過智能網(wǎng)卡提供PCIe Root Complex能力和NVMe-oF Controller端的硬件卸載加速,來實(shí)現(xiàn)NVMe存儲(chǔ)服務(wù)器。如Broadcom Stingray PS1100R是這個(gè)場景的代表之一。

(4)DPU芯片硬件加速NVMe-oF Target。該場景是通過DPU芯片提供多個(gè)PCIe Root Complex通道以及多個(gè)100Gbps的網(wǎng)卡實(shí)現(xiàn)的超大吞吐的存儲(chǔ)服務(wù)器。Fungible FS1600 12x100Gbps帶寬吞吐的存儲(chǔ)服務(wù)器是這個(gè)場景的典型代表。

pYYBAGKFupmAbU6GAAFYS2wa4kA531.png

圖NVMe-oF硬件卸載方式

OpenStack從Rocky版本已經(jīng)支持了NVMe-oF,通過OpenStack Cinder通過消息在NVMe-oF Target上來創(chuàng)建,查詢和刪除卷等,OpenStack Nova在主機(jī)上通過NVMe-oF Initiator發(fā)現(xiàn)NVMe-oF存儲(chǔ)設(shè)備,并將存儲(chǔ)設(shè)備信息傳遞給Hypervisor來實(shí)現(xiàn)虛擬機(jī)掛載磁盤。另外,OpenStack集成Ceph做塊存儲(chǔ)和對(duì)象存儲(chǔ)已經(jīng)非常成熟,Ceph的后端存儲(chǔ)也漸漸的從使用本地磁盤的方式轉(zhuǎn)向遠(yuǎn)端NVMe存儲(chǔ),這樣NVMe-oF為Ceph存儲(chǔ)服務(wù)提供了容量可伸縮的能力。

二、Virtio-blk硬件加速

基于virtio的virtio-blk是KVM-Qemu虛擬化生態(tài)中的虛擬化塊存儲(chǔ)的一種實(shí)現(xiàn)方式,利用了virtio共享內(nèi)存的機(jī)制,提供了一種高效的塊存儲(chǔ)掛載的方法。GuestOS內(nèi)核通過加載virtio-blk驅(qū)動(dòng),實(shí)現(xiàn)塊存儲(chǔ)的讀寫,無需額外的廠家專用驅(qū)動(dòng)。Virtio-blk設(shè)備在虛擬機(jī)以一個(gè)磁盤的方式呈現(xiàn),是目前應(yīng)用最廣泛的虛擬存儲(chǔ)控制器

poYBAGKFupmAdQV5AAEoXHEAVQs832.png

圖基于vDPA架構(gòu)的virtio-blk硬件卸載

由于virtio機(jī)制通過硬件實(shí)現(xiàn)加速已經(jīng)是通用做法,所以利用這個(gè)優(yōu)勢,virtio-blk卸載到硬件,已經(jīng)是必然趨勢。在智能網(wǎng)卡中,將virtio-blk到后端映射到如NVMe-oF的遠(yuǎn)端磁盤上,這樣相比較當(dāng)前virtio-blk的用法,不需要在主機(jī)系統(tǒng)中掛載很多的遠(yuǎn)端NVMe磁盤,由智能網(wǎng)卡直接完成映射,更加安全。

在2021年KVM論壇會(huì)議中,Redhat提出統(tǒng)一軟硬件卸載virtio-blk方案,正式將virtio-blk加入vDPA框架,同virtio-net公用相同的框架,來完成硬件卸載控制平面。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    343

    瀏覽量

    24044
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    簡述半導(dǎo)體存儲(chǔ)器的應(yīng)用場景

    半導(dǎo)體存儲(chǔ)器,作為現(xiàn)代電子系統(tǒng)的核心組成部分,其應(yīng)用場景極為廣泛,幾乎涵蓋了所有需要數(shù)據(jù)存儲(chǔ)和處理的領(lǐng)域。以下將從多個(gè)方面詳細(xì)闡述半導(dǎo)體存儲(chǔ)器的應(yīng)
    的頭像 發(fā)表于 08-20 10:01 ?396次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)、安全等處理性能,助力服務(wù)器運(yùn)行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設(shè)時(shí),圍繞 DPU 構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)的基礎(chǔ)設(shè)施
    發(fā)表于 07-24 15:32

    能耗監(jiān)測網(wǎng)關(guān)的功能和應(yīng)用場景

    能耗監(jiān)測網(wǎng)關(guān)是一種用于采集、處理和傳輸能耗數(shù)據(jù)的智能設(shè)備。它通常連接到一系列能源使用設(shè)備(如電表、水表、氣表等)并通過網(wǎng)絡(luò)將數(shù)據(jù)發(fā)送到中央管理系統(tǒng)。以下是能耗監(jiān)測網(wǎng)關(guān)的主要功能和應(yīng)用場景
    的頭像 發(fā)表于 06-19 14:21 ?233次閱讀
    能耗監(jiān)測網(wǎng)關(guān)的<b class='flag-5'>功能</b>和應(yīng)<b class='flag-5'>用場景</b>

    STM32待機(jī)模式適合用于那些應(yīng)用場景?

    對(duì)于查看STM32低功耗模式,共有三種,其中最省電的為待機(jī)模式,但是待機(jī)模式喚醒后相當(dāng)于軟件復(fù)位了,ram及寄存器中的值都復(fù)位了,僅僅是備份域的寄存器除外,因此有個(gè)疑問,待機(jī)模式適合用于那些應(yīng)用場景
    發(fā)表于 05-07 07:46

    AG32VF-MIPI應(yīng)用場景

    的基礎(chǔ)上,集成了MIPI接口協(xié)議,提供了豐富的功能和特性,能夠滿足不同應(yīng)用場景的需求,為用戶提供更加全面、便捷、高效的數(shù)據(jù)傳輸方案。 基本參數(shù): MIPI up to 1.5Gbps LVDS up
    發(fā)表于 01-22 08:56

    《數(shù)據(jù)處理器:DPU編程入門》DPU計(jì)算入門書籍測評(píng)

    的架構(gòu)服務(wù),同時(shí)它一般不直接面向于數(shù)據(jù)存儲(chǔ),通信接口等底層應(yīng)用。也不直接架構(gòu)頂層的服務(wù)。 因此對(duì)于DPU系統(tǒng)來說,現(xiàn)在CPU仍然是GPU于DPU架構(gòu)異構(gòu)計(jì)算中必須存在的內(nèi)容。 、學(xué)習(xí)
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    AI、機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能,減輕虛擬化Hypervisor的工作負(fù)載。同時(shí),它還具備開放性集成功能,未來支持更多功能集成。NVIDIA的DPU還提供統(tǒng)一的面向各
    發(fā)表于 12-21 10:47

    淺談DPU和CPU、GPU的關(guān)系

    把CPU的一大部分算力卸載給GPU之后,人們發(fā)現(xiàn)可以把很多其他功能也外包出去,于是又有了智能網(wǎng)卡,或者叫做DPU。
    發(fā)表于 12-14 11:44 ?661次閱讀
    淺談<b class='flag-5'>DPU</b>和CPU、GPU的關(guān)系

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    : 2.00Gb/s 以太網(wǎng)或 NDR 400Gb/s InfiniBand 網(wǎng)絡(luò)連接:BlueField-3 DPU 卸載、加速和隔離軟件定義的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理功能。 16 個(gè)
    發(fā)表于 12-08 18:03

    什么是DPU?

    ,能以線速或網(wǎng)絡(luò)中的可用速度解析、處理數(shù)據(jù),并高效地將數(shù)據(jù)傳輸?shù)紾PU和CPU。 各種靈活和可編程的加速引擎,可以卸載AI、機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能。 所有這些DPU功能
    發(fā)表于 11-03 10:55

    簡述各類極管的使用場景和要點(diǎn)

    引言:極管的應(yīng)用場景和應(yīng)用方式非常多,巧妙地使用極管可以極大提高系統(tǒng)穩(wěn)定性和可靠性,延長器件使用壽命,本節(jié)在上節(jié)基礎(chǔ)上簡述各類極管的使用場景
    的頭像 發(fā)表于 11-02 18:21 ?1452次閱讀
    簡述各類<b class='flag-5'>二</b>極管的使<b class='flag-5'>用場景</b>和要點(diǎn)

    labview 和 wincc 的區(qū)別 使用場景

    labview 和 wincc 的區(qū)別 使用場景 都是上位機(jī)軟件,都可以做監(jiān)控軟件 wincc的名氣也比較大 對(duì)比的資料較少 寫這些文章的人,從自己的從事的行業(yè)出發(fā),帶有自己的思維 使用的場景 肯定
    發(fā)表于 10-27 18:01

    【書籍評(píng)測活動(dòng)NO.23】數(shù)據(jù)處理器:DPU編程入門

    ,包括 NVIDIA? BlueField? 系列 DPU 在結(jié)構(gòu)通用化、功能多樣化、應(yīng)用廣泛化和場景豐富化方面的前景展望,NVIDIA DOCA? 軟件開發(fā)環(huán)境配置,以及基于 NVI
    發(fā)表于 10-24 15:21

    SMT組裝工藝流程的應(yīng)用場景

    工藝流程的應(yīng)用場景。 01單面純貼片工藝 應(yīng)用場景: 僅在一面有需要焊接的貼片器件。 02雙面純貼片工藝 應(yīng)用場景: A/B面均為貼片元件。 03單面混裝工藝 應(yīng)用場景: A面有貼
    發(fā)表于 10-20 10:31

    SMT組裝工藝流程的應(yīng)用場景(多圖)

    工藝流程的應(yīng)用場景。 一、單面純貼片工藝 應(yīng)用場景: 僅在一面有需要焊接的貼片器件。 、雙面純貼片工藝 應(yīng)用場景: A/B面均為貼片元件。 三、單面混裝工藝 應(yīng)
    發(fā)表于 10-17 18:10