0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PCIe是什么樣的一個體系架構(gòu)?

Q4MP_gh_c472c21 ? 來源:人人都是極客 ? 作者:人人都是極客 ? 2021-01-12 16:50 ? 次閱讀

硬盤是大家都很熟悉的設(shè)備,一路走來,從HDD到SSD,從SATA到NVMe,作為NVMe SSD的前端接口,PCIe再次進入我們的視野。作為x86體系關(guān)鍵的一環(huán),PCIe標準歷經(jīng)PCI,PCI-X和PCIe,走過近30年時光。其中Host發(fā)現(xiàn)與查找設(shè)備的方式卻一脈沿襲,今天我們先來聊一聊PCIe設(shè)備在一個系統(tǒng)中是如何發(fā)現(xiàn)與訪問的。

首先我們來看一下在x86系統(tǒng)中,PCIe是什么樣的一個體系架構(gòu)。下圖是一個PCIe的拓撲結(jié)構(gòu)示例,PCIe協(xié)議支持256個Bus, 每條Bus最多支持32個Device,每個Device最多支持8個Function,所以由BDF(Bus,device,function)構(gòu)成了每個PCIe設(shè)備節(jié)點的身份證號。

04641218-528d-11eb-8b86-12bb97331649.jpg

PCIe體系架構(gòu)一般由root complex,switch,endpoint等類型的PCIe設(shè)備組成,在root complex和switch中通常會有一些embeded endpoint(這種設(shè)備對外不出PCIe接口)。這么多的設(shè)備,CPU啟動后要怎么去找到并認出它們呢? Host對PCIe設(shè)備掃描是采用了深度優(yōu)先算法,其過程簡要來說是對每一個可能的分支路徑深入到不能再深入為止,而且每個節(jié)點只能訪問一次。我們一般稱這個過程為PCIe設(shè)備枚舉。枚舉過程中host通過配置讀事物包來獲取下游設(shè)備的信息,通過配置寫事物包對下游設(shè)備進行設(shè)置。 第一步,PCI Host主橋掃描Bus 0上的設(shè)備(在一個處理器系統(tǒng)中,一般將Root complex中與Host Bridge相連接的PCI總線命名為PCI Bus 0),系統(tǒng)首先會忽略Bus 0上的embedded EP等不會掛接PCI橋的設(shè)備,主橋發(fā)現(xiàn)Bridge 1后,將Bridge1 下面的PCI Bus定為 Bus 1,系統(tǒng)將初始化Bridge 1的配置空間,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成0和1,以表明Bridge1 的上游總線是0,下游總線是1,由于還無法確定Bridge1下掛載設(shè)備的具體情況,系統(tǒng)先暫時將Subordinate Bus Number設(shè)為0xFF。

0484df70-528d-11eb-8b86-12bb97331649.jpg

第二步,系統(tǒng)開始掃描Bus 1,將會發(fā)現(xiàn)Bridge 3,并發(fā)現(xiàn)這是一個switch設(shè)備。系統(tǒng)將Bridge 3下面的PCI Bus定為Bus 2,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成1和2,和上一步一樣暫時把Bridge 3 的Subordinate Bus Number設(shè)為0xFF。

04b89c52-528d-11eb-8b86-12bb97331649.jpg

第三步,系統(tǒng)繼續(xù)掃描Bus 2,將會發(fā)現(xiàn)Bridge 4。繼續(xù)掃描,系統(tǒng)會發(fā)現(xiàn)Bridge下面掛載的NVMe SSD設(shè)備,系統(tǒng)將Bridge 4下面的PCI Bus定為Bus 3,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成2和3,因為Bus3下面掛的是端點設(shè)備(葉子節(jié)點),下面不會再有下游總線了,因此Bridge 4的Subordinate Bus Number的值可以確定為3。

04e2c1bc-528d-11eb-8b86-12bb97331649.jpg

第四步,完成Bus 3的掃描后,系統(tǒng)返回到Bus 2繼續(xù)掃描,會發(fā)現(xiàn)Bridge 5。繼續(xù)掃描,系統(tǒng)會發(fā)現(xiàn)下面掛載的NIC設(shè)備,系統(tǒng)將Bridge 5下面的PCI Bus設(shè)置為Bus 4,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成2和4,因為NIC同樣是端點設(shè)備,Bridge 5的Subordinate Bus Number的值可以確定為4。

05067904-528d-11eb-8b86-12bb97331649.jpg

第五步,除了Bridge 4和Bridge 5以外,Bus2下面沒有其他設(shè)備了,因此返回到Bridge 3,Bus 4是找到的掛載在這個Bridge下的最后一個bus號,因此將Bridge 3的Subordinate Bus Number設(shè)置為4。Bridge 3的下游設(shè)備都已經(jīng)掃描完畢,繼續(xù)向上返回到Bridge 1,同樣將Bridge 1的Subordinate Bus Number設(shè)置為4。

0546e20a-528d-11eb-8b86-12bb97331649.jpg

第六步,系統(tǒng)返回到Bus0繼續(xù)掃描,會發(fā)現(xiàn)Bridge 2,系統(tǒng)將Bridge 2下面的PCI Bus定為Bus 5。并將Bridge 2的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成0和5, Graphics card也是端點設(shè)備,因此Bridge 2 的Subordinate Bus Number的值可以確定為5。 至此,掛在PCIe總線上的所有設(shè)備都被掃描到,枚舉過程結(jié)束,Host通過這一過程獲得了一個完整的PCIe設(shè)備拓撲結(jié)構(gòu)。

05942f9c-528d-11eb-8b86-12bb97331649.jpg

系統(tǒng)上電以后,host會自動完成上述的設(shè)備枚舉過程。除一些專有系統(tǒng)外,普通系統(tǒng)只會在開機階段進行進行設(shè)備的掃描,啟動成功后(枚舉過程結(jié)束),即使插入一個PCIe設(shè)備,系統(tǒng)也不會再去識別它。 在linux操作系統(tǒng)中,我們可以通過lspci –v -t命令來查詢系統(tǒng)上電階段掃描到的PCIe設(shè)備,執(zhí)行結(jié)果會以一個樹的形式列出系統(tǒng)中所有的pcie設(shè)備。如下圖所示,其中黃色方框中的PCIe設(shè)備是北京憶芯科技公司(Bejing Starblaze Technology Co., LTD.)推出的STAR1000系列NVMe SSD主控芯片,圖中顯示的9d32是Starblaze在PCI-SIG組織的注冊碼,1000是設(shè)備系列號。

05d2894a-528d-11eb-8b86-12bb97331649.png

STAR1000設(shè)備的BDF也可以從上圖中找出,其中bus是0x3C,device是0x00,function是0x0,BDF表示為3C:00.0,與之對應(yīng)的上游端口是00:1d.0。 我們可以通過“l(fā)spci –xxx –s 3C:00.0”命令來列出該設(shè)備的PCIe詳細信息(技術(shù)發(fā)燒友或數(shù)字控請關(guān)注該部分)。這些內(nèi)容存儲在PCIe配置空間,它們描述的是PCIe本身的特性。如下圖所示(低位地址0x00在最左邊),可以看到這是一個非易失性存儲控制器,0x00起始地址是PCIe的Vendor ID和Device ID。Class code 0x010802表示這是一個NVMe存儲設(shè)備。0x40是第一組capability的指針,如果你需要查看PCIe的特性,就需要從這個位置開始去查詢,在每組特征的頭字段都會給出下一組特性的起始地址。從0x40地址開始依次是power management,MSI中斷,鏈路控制與狀態(tài),MSI-X中斷等特性組。這兒特別列出了鏈路特征中的一個0x43字段,表示STAR1000設(shè)備是一個x4lane的鏈接,支持PCIe Gen3速率(8Gbps)。

05f95cc8-528d-11eb-8b86-12bb97331649.png

當然也可以使用lspci –vvv –s 3C:00.0命令來查看設(shè)備特性,初學者看到下面的列表也就一目了然了。

064affd8-528d-11eb-8b86-12bb97331649.jpg

Host在枚舉設(shè)備的同時也會對設(shè)備進行配置,每個PCIe設(shè)備都會指定一段CPU memory訪問空間,從上面的圖中我們可以看到這個設(shè)備支持兩段訪問空間,一段的大小是1M byte,另一段的大小是256K byte,系統(tǒng)會分別指定它們的基地址。基地址配置完成以后,Host就可以通過地址來對PCIe memory空間進行訪問了。 PCIe memory空間關(guān)聯(lián)的是PCIe設(shè)備物理功能,對于STAR1000系列芯片而言,物理功能是NVMe,memory中存放的是NMVe的控制與狀態(tài)信息,對于NMVe的控制以及工作狀態(tài)的獲取,都需要通過memory訪問來實現(xiàn)。 下面以NVMe命令下發(fā)為例簡單描述PCIe設(shè)備的memory訪問。NVMe命令下發(fā)的基本操作是1)Host寫doorbell寄存器,此時使用PCIe memory寫請求。如下圖所示,host發(fā)出一個memory write(MWr)請求,該請求經(jīng)過switch到達要訪問的NVMe SSD設(shè)備。

06816942-528d-11eb-8b86-12bb97331649.jpg

這個請求會被端點設(shè)備接收并執(zhí)行2)NVMe讀取命令操作。如下圖所示,此時NVMe SSD作為請求者,發(fā)出一個memory read(MRd)請求,該請求經(jīng)過Switch到達Host,Host作為完成者會返回一個完成事物包(CplD),將訪問結(jié)果返回給NVMe SSD。

06a85944-528d-11eb-8b86-12bb97331649.jpg

這樣,一個NVMe的命令下發(fā)過程就完成了。同樣,NVMe的其他操作比如各種隊列操作,命令與完成,數(shù)據(jù)傳輸都是通過PCIe memory訪問的方式進行的,此處不再詳述。 通過上面的描述,相信能夠幫助大家了解PCIe的設(shè)備枚舉和memory空間訪問。以后會繼續(xù)與大家探討PCIe的其他內(nèi)容,比如PCIe的協(xié)議分層,鏈路建立,功耗管理等等。目前PCIe協(xié)議還正在不斷的快速演進中,2017年發(fā)布的PCIe Gen4標準,每條Serdes支持的速率已經(jīng)達到16Gbps,Gen5也在加速制定中,其速率會再翻一倍達到32Gbps。Starblaze會緊跟技術(shù)的發(fā)展趨勢,提供速率更高,性能更好更穩(wěn)定的NVMe SSD系列產(chǎn)品。

原文標題:原來PCIe這么簡單,一定要看!

文章出處:【微信公眾號:嵌入式ARM】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 硬盤
    +關(guān)注

    關(guān)注

    3

    文章

    1284

    瀏覽量

    57199
  • PCIe
    +關(guān)注

    關(guān)注

    15

    文章

    1200

    瀏覽量

    82354

原文標題:原來PCIe這么簡單,一定要看!

文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    想設(shè)計10Hz~10MHz的峰值檢波電路,請問這個架構(gòu)可以達到我頻率范圍的要求嗎?

    我想設(shè)計10Hz~10MHz的峰值檢波電路,請問這個架構(gòu)可以達到我頻率范圍的要求嗎?如果可以,器件的選型應(yīng)該是怎樣的,如果不可以,什么樣
    發(fā)表于 09-19 06:44

    代碼整潔之道-大師眼中的整潔代碼是什么樣

    幾個月前寫了篇文章“如何寫出難以維護的代碼”,從中能大概了解到不好維護的代碼是什么樣,有哪些壞味道,那肯定有人會反問,難以維護的代碼見的太多了,也知道長什么樣,但是對于好維護的代碼是什么樣
    的頭像 發(fā)表于 09-09 16:30 ?265次閱讀
    代碼整潔之道-大師眼中的整潔代碼是<b class='flag-5'>什么樣</b>

    發(fā)干貨,篇文章教會你如何利用PCIe擴展SSD硬盤存儲

    在當今高性能計算機體系架構(gòu)中,PCIe(PeripheralComponentInterconnectExpress)通道扮演著數(shù)據(jù)高速傳輸?shù)暮诵慕巧云渥吭降膫鬏斔俣?、極低的延遲特性以及強大的可
    的頭像 發(fā)表于 08-02 16:02 ?652次閱讀
    來<b class='flag-5'>一</b>發(fā)干貨,<b class='flag-5'>一</b>篇文章教會你如何利用<b class='flag-5'>PCIe</b>擴展SSD硬盤存儲

    pcie4.0插在3.0的主板上會怎么

    到現(xiàn)在的 PCIe 4.0。隨著新PCIe 4.0 插槽的推出,許多用戶可能會面臨問題:如果將
    的頭像 發(fā)表于 07-10 10:16 ?2742次閱讀

    pcie4.0和pcie3.0接口兼容嗎

    PCIe 4.0和PCIe 3.0接口在多個方面實現(xiàn)了兼容性,PCIe 4.0和PCIe 3.0接口兼容性問題是
    的頭像 發(fā)表于 07-10 10:12 ?5870次閱讀

    FPGA的PCIE接口應(yīng)用需要注意哪些問題

    FPGA上的PCIe接口應(yīng)用是復(fù)雜的任務(wù),需要考慮多個方面的問題以確保系統(tǒng)的穩(wěn)定性和性能。以下是在FPGA的PCIe接口應(yīng)用中需要注意的關(guān)鍵問題: 硬件資源和內(nèi)部
    發(fā)表于 05-27 16:17

    FPGA能實現(xiàn)什么樣的算法?

    FPGA功能如此強大,請問用FPGA能實現(xiàn)或者比較適合實現(xiàn)什么樣的算法?
    發(fā)表于 05-26 20:18

    什么樣的PLC可以直接驅(qū)動接觸器?什么樣的PLC不可以直接驅(qū)動?

    什么樣的PLC可以直接驅(qū)動接觸器?什么樣的PLC不可以直接驅(qū)動? PLC(可編程邏輯控制器)是種用于自動化控制系統(tǒng)的電子設(shè)備,用于監(jiān)控和控制多種工業(yè)過程。其中
    的頭像 發(fā)表于 02-18 14:11 ?1190次閱讀

    【RISC-V開放架構(gòu)設(shè)計之道|閱讀體驗】學習處理器體系架構(gòu)本好書

    感謝電子發(fā)燒友論壇和電子工業(yè)出版社提供的試讀機會。 《RISC-V開放架構(gòu)設(shè)計之道》由RISC-V架構(gòu)的作者、著名的計算機體系架構(gòu)專家David Patterson親自主筆撰寫。Dav
    發(fā)表于 01-23 20:08

    ADIS16375的陀螺儀輸出角度是什么樣的角度?

    想知道ADIS16375這款I(lǐng)MU的輸出角度是什么樣的角度?是不是姿態(tài)角?其參考坐標系是什么?輸出角的實時精度是多少?ADIS16365、ADIS16334、ADIS16445、ADIS16485這四款I(lǐng)MU能夠輸出角度嗎?若果能,分別是
    發(fā)表于 12-29 06:17

    AD7779?DRDY引腳輸出應(yīng)該是什么樣的波形?

    AD7779DRDY 引腳輸出應(yīng)該是什么樣的波形,我測出來的是連續(xù)十五脈沖,后面是很長
    發(fā)表于 12-11 06:13

    智能汽車CAN FD總線需要什么樣的降噪對策?

    智能汽車CAN FD總線需要什么樣的降噪對策?
    的頭像 發(fā)表于 11-30 09:37 ?569次閱讀
    智能汽車CAN FD總線需要<b class='flag-5'>什么樣</b>的降噪對策?

    SigmaStudio 3.9開發(fā)ADAU1701時里面的adi algorithms里有automatic EQ是什么樣功能的EQ?

    SigmaStudio 3.9 開發(fā)ADAU1701時里面的adi algorithms里有automatic EQ是什么樣功能的EQ?般用來做什么?還有加入此EQ后編譯過不了,提示錯誤和請聯(lián)系A(chǔ)DI,是什么原因?還沒開放嗎
    發(fā)表于 11-30 06:36

    Xilinx PCIE core管腳分配錯誤的解決方案

    最近弄PCIE,遇到問題,以前我們總認為:Xilinx的PCIE core的管腳是固定的,即指定了PCIE core的位置,對應(yīng)的管腳也
    的頭像 發(fā)表于 11-17 17:02 ?3780次閱讀
    Xilinx <b class='flag-5'>PCIE</b> core管腳分配錯誤的解決方案

    體驗紫光PCIE之使用WinDriver驅(qū)動紫光PCIE

    開始和主機怎么交互起來都是問題。入門PCIE協(xié)議,會發(fā)現(xiàn)繁多也難懂——PCIE體系龐大足
    發(fā)表于 11-17 14:35