PCIe 枚舉

原創

2020-06-12 23:58

轉載：

https://www.sohu.com/a/300238384_505795

硬盤是大家都很熟悉的設備，一路走來，從HDD到SSD，從SATA到NVMe，作爲NVMe SSD的前端接口，PCIe再次進入我們的視野。作爲x86體系關鍵的一環，PCIe標準歷經PCI，PCI-X和PCIe，走過近30年時光。其中Host發現與查找設備的方式卻一脈沿襲，今天我們先來聊一聊PCIe設備在一個系統中是如何發現與訪問的。

首先我們來看一下在x86系統中，PCIe是什麼樣的一個體系架構。下圖是一個PCIe的拓撲結構示例,PCIe協議支持256個Bus, 每條Bus最多支持32個Device，每個Device最多支持8個Function，所以由BDF（Bus，device，function）構成了每個PCIe設備節點的身份證號。

PCIe體系架構一般由root complex，switch，endpoint等類型的PCIe設備組成，在root complex和switch中通常會有一些embeded endpoint(這種設備對外不出PCIe接口)。這麼多的設備，CPU啓動後要怎麼去找到並認出它們呢? Host對PCIe設備掃描是採用了深度優先算法，其過程簡要來說是對每一個可能的分支路徑深入到不能再深入爲止，而且每個節點只能訪問一次。我們一般稱這個過程爲PCIe設備枚舉。枚舉過程中host通過配置讀事物包來獲取下游設備的信息，通過配置寫事物包對下游設備進行設置。

第一步，PCI Host主橋掃描Bus 0上的設備（在一個處理器系統中，一般將Root complex中與Host Bridge相連接的PCI總線命名爲PCI Bus 0），系統首先會忽略Bus 0上的embedded EP等不會掛接PCI橋的設備，主橋發現Bridge 1後，將Bridge1 下面的PCI Bus定爲 Bus 1，系統將初始化Bridge 1的配置空間，並將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設置成0和1，以表明Bridge1 的上游總線是0，下游總線是1，由於還無法確定Bridge1下掛載設備的具體情況，系統先暫時將Subordinate Bus Number設爲0xFF。

第二步，系統開始掃描Bus 1，將會發現Bridge 3，並發現這是一個switch設備。系統將Bridge 3下面的PCI Bus定爲Bus 2，並將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設置成1和2，和上一步一樣暫時把Bridge 3 的Subordinate Bus Number設爲0xFF。

第三步，系統繼續掃描Bus 2，將會發現Bridge 4。繼續掃描，系統會發現Bridge下面掛載的NVMe SSD設備，系統將Bridge 4下面的PCI Bus定爲Bus 3，並將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設置成2和3，因爲Bus3下面掛的是端點設備（葉子節點），下面不會再有下游總線了，因此Bridge 4的Subordinate Bus Number的值可以確定爲3。

第四步，完成Bus 3的掃描後，系統返回到Bus 2繼續掃描，會發現Bridge 5。繼續掃描，系統會發現下面掛載的NIC設備，系統將Bridge 5下面的PCI Bus設置爲Bus 4，並將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設置成2和4，因爲NIC同樣是端點設備，Bridge 5的Subordinate Bus Number的值可以確定爲4。

第五步，除了Bridge 4和Bridge 5以外，Bus2下面沒有其他設備了，因此返回到Bridge 3，Bus 4是找到的掛載在這個Bridge下的最後一個bus號，因此將Bridge 3的Subordinate Bus Number設置爲4。Bridge 3的下游設備都已經掃描完畢，繼續向上返回到Bridge 1，同樣將Bridge 1的Subordinate Bus Number設置爲4。

第六步，系統返回到Bus0繼續掃描，會發現Bridge 2，系統將Bridge 2下面的PCI Bus定爲Bus 5。並將Bridge 2的Primary Bus Number 和 Secondary Bus Number寄存器分別設置成0和5， Graphics card也是端點設備，因此Bridge 2 的Subordinate Bus Number的值可以確定爲5。

至此，掛在PCIe總線上的所有設備都被掃描到，枚舉過程結束，Host通過這一過程獲得了一個完整的PCIe設備拓撲結構。

系統上電以後，host會自動完成上述的設備枚舉過程。除一些專有系統外，普通系統只會在開機階段進行進行設備的掃描，啓動成功後（枚舉過程結束），即使插入一個PCIe設備，系統也不會再去識別它。

在linux操作系統中，我們可以通過lspci –v -t命令來查詢系統上電階段掃描到的PCIe設備，執行結果會以一個樹的形式列出系統中所有的pcie設備。如下圖所示，其中黃色方框中的PCIe設備是北京憶芯科技公司（Bejing Starblaze Technology Co., LTD.）推出的STAR1000系列NVMe SSD主控芯片，圖中顯示的9d32是Starblaze在PCI-SIG組織的註冊碼，1000是設備系列號。

STAR1000設備的BDF也可以從上圖中找出，其中bus是0x3C，device是0x00，function是0x0，BDF表示爲3C:00.0，與之對應的上游端口是00:1d.0。

我們可以通過“lspci –xxx –s 3C:00.0”命令來列出該設備的PCIe詳細信息(技術發燒友或數字控請關注該部分)。這些內容存儲在PCIe配置空間，它們描述的是PCIe本身的特性。如下圖所示(低位地址0x00在最左邊)，可以看到這是一個非易失性存儲控制器，0x00起始地址是PCIe的Vendor ID和Device ID。Class code 0x010802表示這是一個NVMe存儲設備。0x40是第一組capability的指針，如果你需要查看PCIe的特性，就需要從這個位置開始去查詢，在每組特徵的頭字段都會給出下一組特性的起始地址。從0x40地址開始依次是power management，MSI中斷，鏈路控制與狀態，MSI-X中斷等特性組。這兒特別列出了鏈路特徵中的一個0x43字段，表示STAR1000設備是一個x4lane的鏈接，支持PCIe Gen3速率（8Gbps）。

當然也可以使用lspci –vvv –s 3C:00.0命令來查看設備特性，初學者看到下面的列表也就一目瞭然了。

Host在枚舉設備的同時也會對設備進行配置，每個PCIe設備都會指定一段CPU memory訪問空間，從上面的圖中我們可以看到這個設備支持兩段訪問空間，一段的大小是1M byte，另一段的大小是256K byte，系統會分別指定它們的基地址。基地址配置完成以後，Host就可以通過地址來對PCIe memory空間進行訪問了。

PCIe memory空間關聯的是PCIe設備物理功能，對於STAR1000系列芯片而言，物理功能是NVMe，memory中存放的是NMVe的控制與狀態信息，對於NMVe的控制以及工作狀態的獲取，都需要通過memory訪問來實現。

下面以NVMe命令下發爲例簡單描述PCIe設備的memory訪問。NVMe命令下發的基本操作是1）Host寫doorbell寄存器，此時使用PCIe memory寫請求。如下圖所示，host發出一個memory write(MWr)請求，該請求經過switch到達要訪問的NVMe SSD設備。

這個請求會被端點設備接收並執行2)NVMe讀取命令操作。如下圖所示，此時NVMe SSD作爲請求者，發出一個memory read(MRd)請求，該請求經過Switch到達Host，Host作爲完成者會返回一個完成事物包(CplD)，將訪問結果返回給NVMe SSD。

這樣，一個NVMe的命令下發過程就完成了。同樣，NVMe的其他操作比如各種隊列操作，命令與完成，數據傳輸都是通過PCIe memory訪問的方式進行的，此處不再詳述。

通過上面的描述，相信能夠幫助大家瞭解PCIe的設備枚舉和memory空間訪問。以後會繼續與大家探討PCIe的其他內容，比如PCIe的協議分層，鏈路建立，功耗管理等等。目前PCIe協議還正在不斷的快速演進中，2017年發佈的PCIe Gen4標準，每條Serdes支持的速率已經達到16Gbps，Gen5也在加速制定中，其速率會再翻一倍達到32Gbps。Starblaze會緊跟技術的發展趨勢，提供速率更高，性能更好更穩定的NVMe SSD系列產品。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

迅爲3A5000_7A2000開發板龍芯自主指令系統支持PCIE3.0、USB3.0、SATA3.0、HDMI、VGA等

性能強採用全國產龍芯3A5000處理器，基於龍芯自主指令系統 (LoongArch)的LA464微結構，並進一步提升頻率，降低功耗，優化性能。橋片採用龍芯 7A2000，支持PCIE

2024-02-18 23:26:38

iTOP-3A5000開發板支持PCIE 3.0、USB 3.0和 SATA 3.0.顯示接口2 路、HDMI 和1路VGA等

性能強採用全國產龍芯3A5000處理器，基於龍芯自主指令系統 (LoongArch)的LA464微結構，並進一步提升頻率，降低功耗，優化性能。橋片採用龍芯 7A2000，支持PCIE

2024-02-03 12:07:46

vxworks的pci設備驅動調試

開發環境：風河workbench3.2 —vxworks6.8 ，目標板：飛思卡爾powerpc mpc8536 NI PXIe機箱。問題描述：目標板由NI公司的PXIE機箱供電，並插入零槽作爲主控制器，現在實驗室有自

2020-06-27 17:53:02

PCIE測試

PCIE測試 SWITCH 由於PCIe總線使用端到端的連接方式，一條PCIe鏈路只能連接一個設備。當一個PCIe鏈路需要掛接多個EP時，需要使用Switch進行擴展。一個標準的Switch具有一個上游端口和多個下游端口。上

2020-06-16 14:16:10

小組內部培訓-關於PCIe P2P傳輸軟件設計

培訓過程記錄， | DDR(eg. 2GB) | | DDR(eg. 8GB) | | | ||||||||||||||||||||

黑客三遍猪

2020-06-13 09:39:46

9361-16i RAID卡在某個pcie slot識別不到問題分析

硬件技术交流

2020-04-28 09:14:39

接PCIe開發項目

2020-03-08 21:17:30

PCIe系列專題之二：2.0 Transaction layer事務層概述

2020-02-24 20:03:01

PCIe系列專題之一：PCIe技術概述

2020-02-24 20:03:01

基於I.MX6Q PCIE的千兆以太網（intel I210）的擴展設計

2020-02-23 16:08:12

pcie總線帶寬

2020-02-22 10:35:26

【52】Nvme暴力熱插拔對系統的要求

2020-02-22 06:01:21

PCIe學習筆記之Max payload size

本文基於linux 5.7.0, 平臺是arm64 1. 概述 1.1 什麼是max payload size 我們都知道，PCIe設備是以TLP的形式發送報文的，而max payload size(簡稱mps)決定了pcie設備

2020-07-07 23:55:35

PCIe學習筆記之MSI/MSI-x中斷及代碼分析

本文基於linux 5.7.0, 平臺是arm64 1. MSI/MSI-X概述 PCIe有三種中斷,分別爲INTx中斷，MSI中斷，MSI-X中斷，其中INTx是可選的，MSI/MSI-X是必須實現的。 1.1 什麼是MSI中斷

2020-07-07 23:55:35

ZYNQ PCIe EP實現DMA+Linux交互，非常簡潔的程序

ZYNQ PCIe-DMA源碼例程 PS-PL交互 linux/裸機 verilog C/C++ZYNQ PCIe-DMA的實現過程一、概述二、基礎知識三、系統總框架四、工作原理與工作模式五、接口時序六、資源使用情況七、PS-P

2020-07-04 16:48:04

24小時熱門文章

最新文章

最新評論文章