0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究I/O虛擬化及Virtio接口技術(shù)(下)

jf_78858299 ? 來源:軟硬件融合 ? 作者:Chaobowx ? 2023-04-04 17:03 ? 次閱讀

2.2 Virtqueue交互隊列

Virtio 1.1引入了Packed Virtqueue的概念,對應(yīng)的Virtio 1.0的Virtqueue被稱為Split Virtqueue。

如圖3所示,為Virtio1.0的Split Virtqueue結(jié)構(gòu)。Virtqueue由三部分組成:

  • 描述符表
  • 可用的描述符環(huán)
  • 已使用的描述符環(huán)
  • Virtio 1.0的Split Virtqueue具有一些缺點:
  • 如果是虛擬化場景軟件模擬Virtio設(shè)備的話,因為分散的數(shù)據(jù)結(jié)構(gòu),導(dǎo)致Cache利用率較低,每次請求都會有很多Cache不命中;
  • 如果是硬件實現(xiàn)的話,每次描述符需要多次設(shè)備DMA訪問。

圖片

圖3 Virtio 1.0中的Split Virtqueue

如圖4所示,Virtio 1.1引入了Packed Virtqueue的概念。整個描述符只有一個數(shù)據(jù)結(jié)構(gòu)。這樣,如果軟件實現(xiàn)Virtio設(shè)備模擬的話,可以提升描述符交互的Cache命中率。如果硬件實現(xiàn)的,可以降低設(shè)備DMA的訪問次數(shù)。

圖片

圖4 Virtio1.1的Packed Virtqueue

2.3 Virtio交互

驅(qū)動和設(shè)備的交互,符合生產(chǎn)者消費者模型的數(shù)據(jù)及通知(Notification)的交互行為。驅(qū)動把共享隊列的隊列項準(zhǔn)備好,通過寫寄存器的方式通知設(shè)備。設(shè)備收到驅(qū)動發(fā)送的通知則處理隊列項以及相應(yīng)的數(shù)據(jù)搬運工作,結(jié)束后更新隊列狀態(tài)并通知(設(shè)備通知驅(qū)動是通過中斷)驅(qū)動。驅(qū)動接收到中斷通知時候,把已經(jīng)使用的隊列項釋放,并更新隊列狀態(tài)。

一個典型的通用的驅(qū)動和設(shè)備的交互流程如圖5所示。Virtio場景的驅(qū)動和設(shè)備交互,驅(qū)動給設(shè)備的通知(Notification)稱為Kick,設(shè)備給驅(qū)動的通知稱為Interrupt(中斷)。Kick和Interrupt操作是Virtio接口的一部分,在虛擬化場景,Kick和Interrupt需要非常大的CPU切換代價。驅(qū)動希望在Kick之前產(chǎn)生盡可能多的待處理緩沖項(一個緩沖項對應(yīng)一個描述符和描述符指向的數(shù)據(jù)塊);同樣的,設(shè)備希望處理盡可能多的緩沖項然后再發(fā)送一個中斷。通過盡量處理更多的緩沖項的方式,來攤薄通知的代價。

這種策略是一種理想狀態(tài),因為大多數(shù)時候驅(qū)動并不知道下一組緩沖項何時帶來,因此不得不每一組緩沖項準(zhǔn)備好之后就必須要Kick設(shè)備。同樣的,設(shè)備在處理完相應(yīng)的緩沖項之后,就盡快的發(fā)送中斷給驅(qū)動,以達(dá)到盡可能小的延遲。

圖片

圖5 Virtio驅(qū)動和設(shè)備交互示意圖

如圖6所示,在設(shè)備模擬的虛擬化場景下,驅(qū)動可以暫時禁用中斷,設(shè)備也可以暫時禁用Kick。通過這樣的機制,可以最大限度的減少通知的代價,并且不影響性能和延遲。Virtio 1.1支持兩種通知抑制機制,因此共有三種模式:

  • 使能通知模式:完全無抑制,使能通知;
  • 禁用通知模式:如圖6所示,可以完全禁止對方發(fā)通知給自己;
  • 使能特定的描述符通知模式:告知對方一個特定的描述符,當(dāng)對方順序處理到此描述符處理完成時產(chǎn)生通知。

圖片

圖6 通過前后端禁用抑制通知的Virtio驅(qū)動和設(shè)備交互

2.4 總結(jié)

如圖7,Virtio基于分層的設(shè)計思想,定義了三層Virtio設(shè)備架構(gòu):

  • 最下層的總線接口。PCI是最常用的Virtio場景使用的總線,但Virtio協(xié)議不僅僅支持PCI,也支持MMIO和Channel IO等。
  • 通用的Virtio交互接口。包括Virtqueue、功能特征位、配置空間等。Virtio交互接口是Virtio最核心的功能,通過Virtio交互接口實現(xiàn)了不同類型設(shè)備的標(biāo)準(zhǔn)化。
  • 上層的特定設(shè)備接口。在Virtio協(xié)議里,定義網(wǎng)絡(luò)、塊、控制臺、SCSIGPU等各種不同類型的設(shè)備。

圖片

圖7 分層的Virtio框架圖

Virtio的優(yōu)點體現(xiàn)在:

  • Virtio實現(xiàn)了盡可能多的設(shè)計共享。這樣,在開發(fā)的時候就可以復(fù)用很多軟件和硬件資源,達(dá)到快速開發(fā)的目的。
  • Virtio實現(xiàn)了接口的標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化體現(xiàn)在兩個方面:
  • (1)一個是通用的Virtio交互接口,統(tǒng)一了不同的設(shè)備類型軟硬件交互;
  • (2)另一個是基于Virtio的Virtio-net、Virtio-block等廣泛應(yīng)用于云計算虛擬化場景,Virtio已經(jīng)成為事實上的標(biāo)準(zhǔn)I/O接口。

而Virtio的缺點,則同樣因為Virtio實現(xiàn)了接口的標(biāo)準(zhǔn)化,而忽略了不同設(shè)備類型數(shù)據(jù)傳輸?shù)奶攸c。因此,在一些大數(shù)據(jù)量傳輸?shù)膱鼍?,效率比較低下。如果是在類似HPC這樣的性能和延遲非常敏感的場景,Virtio就不是一個很好的選擇。

**03 **虛擬化卸載

虛擬化卸載指的是計算機虛擬化中消耗CPU資源較多的接口設(shè)備模擬、熱遷移、虛擬化管理等任務(wù)的卸載。

a. 接口設(shè)備的卸載

前面我們介紹了網(wǎng)絡(luò)、遠(yuǎn)程存儲等IO工作任務(wù)的卸載,而虛擬化卸載主要指的是跟IO相關(guān)的接口設(shè)備的卸載,例如網(wǎng)絡(luò)、存儲等接口設(shè)備的卸載。IO接口設(shè)備的卸載本身上也是IO硬件虛擬化的過程,比如我們通過VT-d技術(shù)實現(xiàn)從VM中pass though訪問硬件設(shè)備,某種程度上也可以認(rèn)為是把運行在Hypervisor中的模擬設(shè)備 “卸載”到了硬件。因此,IO接口設(shè)備的卸載本質(zhì)上和IO設(shè)備硬件虛擬化是一件事情。

如圖8,為了實現(xiàn)設(shè)備接口的標(biāo)準(zhǔn)化、加速IO處理的性能以及潛在的充分利用現(xiàn)有的虛擬化生態(tài)(例如更好的支持設(shè)備熱遷移)等原因,阿里云在神龍芯片里實現(xiàn)了硬件的Virtio接口設(shè)備,通過Virtio接口設(shè)備支持Virtio-net網(wǎng)絡(luò)驅(qū)動和Virtio-blk存儲驅(qū)動等,實現(xiàn)了類虛擬化IO設(shè)備Virtio的硬件“卸載”。

圖片

圖8 阿里云神龍芯片網(wǎng)絡(luò)和存儲接口示意圖

AWS的NITRO系統(tǒng)支持網(wǎng)絡(luò)、本地存儲和遠(yuǎn)程存儲,NITRO實現(xiàn)了網(wǎng)絡(luò)接口設(shè)備ENA/EFA(AWS自定義接口)的硬件“卸載”以及存儲接口設(shè)備NVMe(遠(yuǎn)程存儲EBS使用的是NVMe接口,本地存儲也是NVMe接口)的卸載。

b. 接口設(shè)備卸載后的遷移問題

當(dāng)把設(shè)備“卸載”到硬件,讓VM直接訪問硬件設(shè)備,這使得VM的設(shè)備熱遷移變的非常有挑戰(zhàn)。vDPA(vhost Data Path Acceleration,vhost數(shù)據(jù)路徑加速,其中vhost是Virtio后端設(shè)備模擬的輪詢方式實現(xiàn))實現(xiàn)了一種折中的解決方案,如圖9所示,vDPA把Virtio分為了控制面和數(shù)據(jù)面:

  • 控制面。vDPA控制面依然是通過要經(jīng)過Hypervisor的處理,用于設(shè)備和VM之間的配置更改和功能協(xié)商,用于建立和終止數(shù)據(jù)面。
  • 數(shù)據(jù)面。vDPA數(shù)據(jù)面包括共享隊列以及相應(yīng)的通知機制,用于在設(shè)備和VM之間傳輸實際的數(shù)據(jù)。

圖片

圖9 vDPA框架示意圖

使用vDPA一個重要原因是,在熱遷移的時候可以很方便的把Virtio數(shù)據(jù)面的處理切換回傳統(tǒng)的Virtio/Vhost后端設(shè)備模擬。這樣,可以充分利用現(xiàn)有的基于KVM/Qemu對Virtio設(shè)備遷移的解決方案來完成設(shè)備的遷移。

c. 虛擬化管理的卸載

從軟件虛擬化進(jìn)化到硬件虛擬化的過程,本身就可以看作是一個硬件加速以及硬件卸載的過程。我們逐步的剝離了Hypervisor的功能,比如通過VT-x技術(shù)“卸載”了Hypervisor的CPU/內(nèi)存等的軟件模擬,以及通過VT-d以及vDPA等技術(shù)“卸載”了設(shè)備軟件模擬。這些剝離,使得Hypervisor越來越輕量,整個系統(tǒng)的虛擬化開銷也越來越少。進(jìn)一步的,我們可以把虛擬化的管理(例如Linux平臺主流的管理程序Libvirt)卸載到硬件中的嵌入式軟件運行。

如圖10, 我們通過橋接的方式,實現(xiàn)主機軟件和硬件中嵌入式軟件通信機制。把虛擬化管理等軟件任務(wù)從主機卸載到嵌入式系統(tǒng)(依然有很小一部分任務(wù)無法卸載,如虛擬機資源分配、vCPU調(diào)度等)。這樣,可以把幾乎100%的主機資源提供給用戶,使用戶虛擬機得到近乎物理機的性能。

圖片

圖10 虛擬化管理卸載圖

通過虛擬化管理卸載到硬件中的嵌入式CPU軟件,我們可以做到物理上的業(yè)務(wù)和管理分離,整個業(yè)務(wù)主機跟云計算管理網(wǎng)絡(luò)安全的隔離,只能通過特定的接口訪問到Lite Hypervisor,除此之外,不能訪問主機的任何資源。這樣,即使有潛在的運維操作失誤,也無法對業(yè)務(wù)主機造成影響。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    8257

    瀏覽量

    149950
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    343

    瀏覽量

    24044
  • i/o
    i/o
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    4554
收藏 人收藏

    評論

    相關(guān)推薦

    LabVIEW的I/O接口設(shè)備驅(qū)動

    虛擬儀器系統(tǒng)的硬件平臺由i/o接口設(shè)備和計算機構(gòu)成,為了能使計算機能夠?qū)?b class='flag-5'>i/o
    發(fā)表于 11-18 11:04 ?1.2w次閱讀
    LabVIEW的<b class='flag-5'>I</b>/<b class='flag-5'>O</b><b class='flag-5'>接口</b>設(shè)備驅(qū)動

    virtio I/O通信流程及設(shè)備框架的實現(xiàn)

    virtio 是一種通用的半虛擬I/O 通信協(xié)議,提供了一套前后端 I/
    的頭像 發(fā)表于 03-10 13:37 ?6068次閱讀

    《微機原理與接口技術(shù)》教學(xué)大綱

    微型計算機原理及接口技術(shù),包括CPU的工作原理與時序,IO端口的地址譯碼,CPU和外設(shè)之間的數(shù)據(jù)傳送方式,中斷控制器及中斷技術(shù)應(yīng)用,DMA控制器及應(yīng)用,并行
    發(fā)表于 10-11 09:15

    淺析單片機原理及接口技術(shù)

    PPT內(nèi)容這是單片機原理與接口技術(shù)課件ppt,包括了微型計算機基礎(chǔ),MCS-51單片機結(jié)構(gòu)與時序,習(xí)題課,MCS-51與存儲器連接示例,匯編語言程序設(shè)計,半導(dǎo)體存儲器,中斷系統(tǒng),并行I/O接口
    發(fā)表于 09-10 07:27

    微機接口技術(shù)實用教程

    微機接口技術(shù)實用教程1微機接口技術(shù)實用教程第1章 微型計算機接口技術(shù)基礎(chǔ) 第1章 微型計算機接口技術(shù)基礎(chǔ) 1.1 接口技術(shù)概述 輸入/輸出(
    發(fā)表于 09-13 08:19

    微機原理及接口技術(shù)課件(教學(xué))

    微機原理及接口技術(shù)課件:微機:IBM PC系列機原理:8088匯編語言程序設(shè)計接口:半導(dǎo)體存儲器及其接口I/O
    發(fā)表于 12-06 22:24 ?462次下載
    微機原理及<b class='flag-5'>接口技術(shù)</b>課件(教學(xué))

    微機原理與接口技術(shù)精品課程(課件)

    微機原理與接口技術(shù)精品課程(課件):微機:IBM PC系列機原理:8088匯編語言程序設(shè)計接口:半導(dǎo)體存儲器及其接口 I/O
    發(fā)表于 12-06 22:26 ?170次下載
    微機原理與<b class='flag-5'>接口技術(shù)</b>精品課程(課件)

    單片機與接口技術(shù)實驗教程

    單片機與接口技術(shù)實驗教程 實驗一、P1口實驗……………………………………………… 3實驗二、簡單I/O口擴展實驗………………………………… 5實驗三
    發(fā)表于 04-14 14:31 ?39次下載

    輸入輸出設(shè)備I/O設(shè)備總結(jié)

    I/O設(shè)備又叫輸入輸出設(shè)備。對于I/O bus 包含數(shù)據(jù)總線、控制總線、地址總線;每一個I/O設(shè)
    發(fā)表于 11-24 09:28 ?3475次閱讀
    輸入輸出設(shè)備<b class='flag-5'>I</b>/<b class='flag-5'>O</b>設(shè)備總結(jié)

    系統(tǒng)虛擬技術(shù)virtio總體設(shè)計思想

    ,主要有計算資源,存儲資源和網(wǎng)絡(luò)資源。所以,系統(tǒng)虛擬技術(shù)又可以細(xì)分為計算虛擬,存儲虛擬
    的頭像 發(fā)表于 05-07 15:40 ?4677次閱讀
    系統(tǒng)<b class='flag-5'>虛擬</b><b class='flag-5'>化</b><b class='flag-5'>技術(shù)</b><b class='flag-5'>virtio</b>總體設(shè)計思想

    I/O軟件模擬虛擬和類虛擬

    I/O虛擬是SmartNIC/DPU/IPU中最核心的部分,AWS NITRO就是從I/O硬件
    的頭像 發(fā)表于 10-13 11:09 ?2495次閱讀

    I/O虛擬Virtio接口介紹

    I/O虛擬是計算機虛擬最復(fù)雜的部分,因為涉及到CPU、操作系統(tǒng)、Hypervisor以及
    的頭像 發(fā)表于 10-26 17:21 ?3678次閱讀

    探究I/O虛擬Virtio接口技術(shù)(上)

    I/O虛擬是SmartNIC/DPU/IPU中最核心的部分,AWS NITRO就是從I/O硬件
    的頭像 發(fā)表于 04-04 16:54 ?3628次閱讀
    <b class='flag-5'>探究</b><b class='flag-5'>I</b>/<b class='flag-5'>O</b><b class='flag-5'>虛擬</b><b class='flag-5'>化</b>及<b class='flag-5'>Virtio</b><b class='flag-5'>接口技術(shù)</b>(上)

    VirtIO Networking虛擬網(wǎng)絡(luò)設(shè)備實現(xiàn)架構(gòu)

    VirtIO 由 Rusty Russell 開發(fā),最初是為了支持自己開發(fā)的 lguest Hypervisor,其設(shè)計目標(biāo)是在虛擬環(huán)境提供與物理設(shè)備相近的
    的頭像 發(fā)表于 05-08 10:48 ?990次閱讀
    <b class='flag-5'>VirtIO</b> Networking<b class='flag-5'>虛擬</b>網(wǎng)絡(luò)設(shè)備實現(xiàn)架構(gòu)

    panabit加載virtio網(wǎng)卡驅(qū)動

    引言:Panabit網(wǎng)絡(luò)流量管理系統(tǒng)是一款強大的企業(yè)級網(wǎng)絡(luò)管理軟件,它提供了豐富的功能和靈活的配置選項。而virtio網(wǎng)卡作為一種高性能的虛擬網(wǎng)絡(luò)設(shè)備,被廣泛應(yīng)用于各種虛擬平臺。本文
    的頭像 發(fā)表于 11-17 11:13 ?919次閱讀