0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于VFIO的詳細(xì)研究解析

Linux閱碼場 ? 來源:博客園 ? 作者:EwanHai ? 2021-05-02 11:20 ? 次閱讀

主要研究VFIO在虛擬化中的應(yīng)用,但VFIO的應(yīng)用不止于虛擬化。

VFIO的全稱是Virtual Function IO,但這個(gè)名字并不能反應(yīng)它的特點(diǎn),以下兩個(gè)假名字更能反應(yīng)VFIO的特點(diǎn):

Very Fast IO

由于VFIO是將設(shè)備直接透傳給虛擬機(jī),所以Guest中與該設(shè)備相關(guān)的IO性能會大幅提高,接近native性能。

Versatile Framework for userspace IO

這個(gè)名字反映了VFIO的功能,即能夠?qū)evice安全地映射到用戶空間,使用戶能夠?qū)evice進(jìn)行操作。

研究目的

研究利用-device vfio-pci的方式將PCI透傳到虛擬機(jī)中后,在虛擬機(jī)中訪問PCI設(shè)備的配置空間,MMIO寄存器,IO Port的流程是怎樣的。

VFIO原理

VFIO把設(shè)備通過IOMMU映射的DMA物理內(nèi)存地址映射到用戶態(tài)中,讓用戶態(tài)程序可以自行操縱數(shù)據(jù)的傳輸,還可以自行注冊中斷處理函數(shù),從而在用戶態(tài)下實(shí)現(xiàn)設(shè)備的驅(qū)動程序。

因此VFIO的基礎(chǔ)是IOMMU.

IOMMU

基礎(chǔ)功能

地址翻譯

IOMMU可以將能直接訪問memory的IO總線(DMA–capable)連接到RAM中。

與傳統(tǒng)的MMU功能類似,MMU能將CPU使用的虛擬地址轉(zhuǎn)化為物理地址,而IOMMU能將device使用的虛擬地址(也稱為設(shè)備地址或者IO地址)轉(zhuǎn)化為物理地址。

如果沒有IOMMU,DMA也能直接訪問RAM中的內(nèi)容,但是讓DMA沒有限制地訪問RAM是一件很危險(xiǎn)的事情,而IOMMU能夠?qū)@個(gè)過程加以限制,當(dāng)DMA訪問的地址合法時(shí),IOMMU才返回正確的數(shù)據(jù)。

硬件中斷重映射

除了翻譯地址的功能,IOMMU還能對硬件中斷進(jìn)行重映射,達(dá)到屏蔽部分中斷,或自定義中斷處理函數(shù)的目的。

設(shè)備隔離

基于地址翻譯和硬件中斷重映射兩大功能,IOMMU就具有了隔離設(shè)備的能力,這提高了設(shè)備訪問RAM時(shí)和設(shè)備發(fā)出中斷時(shí)的安全性。

除了將單個(gè)設(shè)備隔離的功能外,IOMMU還能隔離一組設(shè)備,如隔離PCI橋上的幾個(gè)設(shè)備,所以IOMMU還有一個(gè)概念,叫做IOMMU_GROUP, 代表一組被隔離的設(shè)備的集合。

通過把host的device和對應(yīng)driver解綁,然后綁定在VFIO的driver上,就會在/dev/vfio/目錄下出現(xiàn)一個(gè)group,這個(gè)group就是IOMMU_GROUP號,如果需要在該group上使用VFIO,需要將該group下的所有device與其對應(yīng)的驅(qū)動解綁。

VFIO Container

在IOMMU_GROUP的基礎(chǔ)上,VFIO封裝了一層Container Class,Container的作用是,當(dāng)我們想在不同的IOMMU_GROUP之間共享TLB和page tables(用于地址翻譯的頁表)時(shí),就將這些group放到同一個(gè)container中,因此Container可以看做是IOMMU_GROUP的集合。

虛擬化中VFIO的應(yīng)用

這里演示一個(gè)將網(wǎng)卡設(shè)備利用VFIO透傳到虛擬機(jī)中的例子。需要注意的是,利用VFIO將PCI設(shè)備透傳到虛擬機(jī)之后,Host將無法使用該設(shè)備。

虛擬機(jī)默認(rèn)網(wǎng)卡

首先利用默認(rèn)qemu選項(xiàng)啟動虛擬機(jī)后,查看lspci的輸出,看看虛擬機(jī)默認(rèn)使用的網(wǎng)卡是什么?

11c76f90-9e23-11eb-8b86-12bb97331649.png

可以看到虛擬機(jī)默認(rèn)的網(wǎng)卡是Intel的82540EM,是由Qemu-kvm軟件模擬出來的一款網(wǎng)卡。

將Host的PCI網(wǎng)卡透傳到虛擬機(jī)

首先在Host上使用lspci查看擁有的PCI網(wǎng)卡型號,可以看到Realtek的一款網(wǎng)卡,該網(wǎng)卡的PCI標(biāo)記為06:00.0.

11d31ac0-9e23-11eb-8b86-12bb97331649.png

要使用VFIO,必須在Linux啟動時(shí)添加啟動項(xiàng)intel_iommu=on,因?yàn)閂FIO的底層依賴IOMMU.

加載VFIO-PCI module

sudo modprobe vfio-pci

如果加載成功,可以在dmesg中看到相關(guān)log.

11ff38da-9e23-11eb-8b86-12bb97331649.png

查看網(wǎng)卡所在的IOMMU Group

$ readlink /sys/bus/pci/devices/000000.0/iommu_group.。/.。/.。/.。/kernel/iommu_groups/3

可以看到該Realtek網(wǎng)卡位于iommu_group的group3.

查看設(shè)備所在iommu_group的所有設(shè)備

$ ls /sys/bus/pci/devices/000000.0/iommu_group/devices/000005.0 000005.1 000000.0

可以看到在iommu_group3中,除了該Realtek網(wǎng)卡,還有2個(gè)設(shè)備。

將設(shè)備與對應(yīng)的驅(qū)動解綁

為了將設(shè)備透傳到虛擬機(jī)中,需要將設(shè)備與其對應(yīng)的驅(qū)動解綁,這樣該設(shè)備就可以使用VFIO的驅(qū)動了。注意,不僅要將要透傳的設(shè)備解綁,還要將與設(shè)備同iommu_group的設(shè)備都解綁,才能透傳成功。

$ echo 000000.0 | sudo tee /sys/bus/pci/devices/000000.0/driver/unbind000000.0$ echo 000005.0 | sudo tee /sys/bus/pci/devices/000005.0/driver/unbind000005.0 $ echo 000005.1 sudo tee /sys/bus/pci/devices/000005.1/driver/unbind000005.1

查看設(shè)備的Vendor和DeviceID

$ lspci -n -s 06:00.0 06:00.0 0200: 10ec:8168 (rev 15)

可以看到該Realtek網(wǎng)卡的Vendor為10ec,DeviceID為8168.

將設(shè)備綁定到vfio-pci module

$ echo 10ec 8168 | sudo tee /sys/bus/pci/drivers/vfio-pci/new_id10ec 8168

可以通過ls /dev/vfio查看是否綁定成功,如果綁定成功,/dev/vfio目錄下會出現(xiàn)該device所屬的iommu_group號。

121b8a6c-9e23-11eb-8b86-12bb97331649.png

這里的3就是我們要透傳的Realtek網(wǎng)卡所在的iommu_group號。

啟動虛擬機(jī)

$ sudo x86_64-softmmu/qemu-system-x86_64 -m 4096 -smp 4 -hda ~/ewan/Workspace/img/Ubuntu18.04_loop.img-enable-kvm -cpu host -device vfio-pci,host=06:00.0

這里我使用的是從源碼編譯的qemu,但是從apt-get安裝的的qemu也是可以的。

進(jìn)入guest之后運(yùn)行l(wèi)spci,可以看到相比之前的PCI設(shè)備,多了一個(gè)Realtek網(wǎng)卡,這個(gè)網(wǎng)卡和host上的信息一模一樣,證明將網(wǎng)卡透傳到Guest成功!。

1224b880-9e23-11eb-8b86-12bb97331649.png

編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • dma
    dma
    +關(guān)注

    關(guān)注

    3

    文章

    552

    瀏覽量

    99931
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    888

    瀏覽量

    27813
  • guest
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    3206

原文標(biāo)題:VFIO(Virtual Function IO)研究

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    自動售貨機(jī)MDB協(xié)議中文解析(七)MDB-RS232控制紙幣器的詳細(xì)流程和解析

    自動售貨機(jī)MDB協(xié)議中文解析(七)MDB-RS232控制紙幣器的詳細(xì)流程和解析
    的頭像 發(fā)表于 09-09 10:04 ?199次閱讀

    深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu)解析與優(yōu)化策略

    堆疊多個(gè)隱藏層,逐步提取和轉(zhuǎn)化輸入數(shù)據(jù)的特征,最終實(shí)現(xiàn)復(fù)雜的預(yù)測和分類任務(wù)。本文將對DNN的架構(gòu)進(jìn)行詳細(xì)解析,并探討其優(yōu)化策略,以期為相關(guān)研究和應(yīng)用提供參考。
    的頭像 發(fā)表于 07-09 11:00 ?693次閱讀

    頻率特性測試儀的詳細(xì)解析

    將對頻率特性測試儀進(jìn)行全面詳細(xì)解析,包括其定義、工作原理、應(yīng)用領(lǐng)域、類型以及特點(diǎn)等方面,以期為讀者提供全面的了解和認(rèn)識。
    的頭像 發(fā)表于 05-21 17:59 ?902次閱讀

    波形發(fā)生器的詳細(xì)解析

    在電子工程、通信、教育與研究等多個(gè)領(lǐng)域中,波形發(fā)生器都扮演著不可或缺的角色。它作為一種重要的電子測試設(shè)備,可以產(chǎn)生各種類型、頻率、幅度和相位的電子信號,為各種電子設(shè)備和系統(tǒng)的測試、測量、校準(zhǔn)和研究
    的頭像 發(fā)表于 05-15 14:39 ?860次閱讀

    蓄電池內(nèi)阻測試儀的詳細(xì)解析

    設(shè)備,能夠快速準(zhǔn)確地測量蓄電池的健康狀態(tài)和荷電狀態(tài),為蓄電池的維護(hù)和管理提供了有力的支持。本文將對蓄電池內(nèi)阻測試儀的原理、功能、使用方法、應(yīng)用場景以及優(yōu)缺點(diǎn)進(jìn)行詳細(xì)解析。
    的頭像 發(fā)表于 05-14 17:15 ?804次閱讀

    求助,關(guān)于串口數(shù)據(jù)解析疑問求解

    現(xiàn)在手上有一個(gè)串口模塊要開發(fā),比較復(fù)雜, 功能:接收各種類型不定長度的 字符串,然后解析做出反饋 字符串基本規(guī)格: 單條命令 : CMD(X,Y,\'ABC或者中文字符不定長\',W
    發(fā)表于 04-29 06:34

    XML在HarmonyOS中的生成,解析與轉(zhuǎn)換(下)

    一、XML 解析 對于以 XML 作為載體傳遞的數(shù)據(jù),實(shí)際使用中需要對相關(guān)的節(jié)點(diǎn)進(jìn)行解析,一般包括解析 XML 標(biāo)簽和標(biāo)簽值、解析 XML 屬性和屬性值、
    的頭像 發(fā)表于 02-18 10:07 ?609次閱讀

    詳細(xì)解析二相電機(jī)反轉(zhuǎn)的改變方法

    詳細(xì)解析二相電機(jī)反轉(zhuǎn)的改變方法? 二相電機(jī)反轉(zhuǎn)是指通過改變電機(jī)的工作方式和接線方式來改變電機(jī)的旋轉(zhuǎn)方向。以下是對二相電機(jī)反轉(zhuǎn)的改變方法的詳細(xì)解析。 首先,要了解二相電機(jī)的工作原理。二相
    的頭像 發(fā)表于 01-23 14:45 ?2047次閱讀

    不同頻段的劃分及特征解析

    進(jìn)行的。下面將詳細(xì)解析幾個(gè)常見的頻段劃分及其特征。 一、無線電頻段劃分 1. VHF(甚高頻):頻率范圍從30 MHz到300 MHz。其中,F(xiàn)M廣播電臺的頻率范圍是88 MHz到108 MHz。VHF頻段在傳輸中具有較低的傳輸損耗和較好的穿透能力,適合在城市
    的頭像 發(fā)表于 11-27 16:19 ?1.1w次閱讀

    解析直流偏壓現(xiàn)象

    解析直流偏壓現(xiàn)象
    的頭像 發(fā)表于 11-24 17:54 ?798次閱讀
    <b class='flag-5'>解析</b>直流偏壓現(xiàn)象

    關(guān)于TCP協(xié)議總結(jié)的硬核干貨

    本文給出TCP報(bào)文格式的詳細(xì)說明,介紹網(wǎng)絡(luò)數(shù)據(jù)包傳遞中如何進(jìn)行地址解析、建立TCP連接的三次握手過程以及斷開TCP連接的四次揮手過程。
    發(fā)表于 11-17 09:26 ?396次閱讀
    <b class='flag-5'>關(guān)于</b>TCP協(xié)議總結(jié)的硬核干貨

    《Android Runtime源碼解析》+深入體會第六章ART的執(zhí)行(4)

    、RISC-V等開源社區(qū),主要研究內(nèi)容為Clang/LLVM、JVM等。 在深入閱讀《Android Runtime源碼解析》這本書之后,我對Android Runtime的內(nèi)部機(jī)制有了更深入的理解。這本書不僅
    發(fā)表于 11-17 01:33

    TCP協(xié)議詳細(xì)解析

    TCP是TCP/IP協(xié)議族中一個(gè)最核心的協(xié)議,它向下使用網(wǎng)絡(luò)層IP協(xié)議,向上為應(yīng)用層HTTP、FTP、SMTP、POP3、SSH、Telnet等協(xié)議提供支持。本文給出TCP報(bào)文格式的詳細(xì)說明,介紹網(wǎng)絡(luò)數(shù)據(jù)包傳遞中如何進(jìn)行地址解析、建立TCP連接的三次握手過程以及斷開TCP
    的頭像 發(fā)表于 11-03 09:14 ?3581次閱讀
    TCP協(xié)議<b class='flag-5'>詳細(xì)</b><b class='flag-5'>解析</b>

    詳細(xì)解析電動車輛技術(shù)問題

    電子發(fā)燒友網(wǎng)站提供《詳細(xì)解析電動車輛技術(shù)問題.pdf》資料免費(fèi)下載
    發(fā)表于 11-02 09:44 ?2次下載
    <b class='flag-5'>詳細(xì)</b><b class='flag-5'>解析</b>電動車輛技術(shù)問題

    C語言深度解析

    C語言深度解析,本資料來源于網(wǎng)絡(luò),對C語言的學(xué)習(xí)有很大的幫助,有著較為深刻的解析,可能會對讀者有一定的幫助。
    發(fā)表于 09-28 07:00