我在數(shù)字邏輯設計方面并沒有經(jīng)驗。也就是說,直到最近我才決定嘗試設計自己的 CPU,并在 FPGA 上運行!如果你也是一名軟件工程師,并對硬件設計有興趣,那么我希望這一系列關于我所學到的知識的文章能夠?qū)δ阌兴鶐椭⒆屇愀械接腥?。本系列文章的第一部分中,將回答以下問題:
什么是數(shù)字邏輯設計?
如何開始,我應該使用什么工具?
我將在以后的系列文章中詳細討論我的 CPU 設計和 RISC-V 架構(gòu),并將回答以下問題:
數(shù)字邏輯設計與軟件設計有什么本質(zhì)區(qū)別?
數(shù)字邏輯設計和軟件設計有什么相似之處?
你可以在這里(https://github.com/lochsh/riscy-boi/tree/47e94dc6e9665f73c871add002c34d1516fd5106)看到我寫這篇文章時的 CPU 的代碼,或者在這里(https://github.com/lochsh/riscy-boi)查看最新的版本。
什么是數(shù)字邏輯設計?
數(shù)字邏輯設計就是設計一個邏輯電路,對二進制數(shù)值進行運算。基本元件是邏輯門:例如,與門一樣,有兩個輸入和一個輸出。它的輸出為 1 或 iff,兩個輸入均為 1。
我們所設計的同步電路,一般都是利用觸發(fā)器來儲存狀態(tài),使電路運行與共時鐘同步。觸發(fā)器由邏輯門組成。
模擬電路設計包括構(gòu)成邏輯門的電子元件,例如晶體管和二極管。這種抽象通常是用于直接處理來自模擬傳感器的信號的應用,例如無線電接收器。在設計 CPU 時,這種抽象水平是行不通的:現(xiàn)代的 CPU 有幾十億個晶體管!
相反,我們使用的工具可以將數(shù)字邏輯設計轉(zhuǎn)化為不同的有用格式:FPGA 的配置(見下文);模擬;晶片布局。
FPGA 是什么,為什么要用 FPGA?
上文中我們指出,不管我們是創(chuàng)建自定義 ASIC 芯片還是配置 FPGA,都可以使用相同的數(shù)字邏輯設計工具。現(xiàn)場可編程門陣列(Field-Programmable Gate Array,F(xiàn)PGA)是一種集成集成電路,其中包含了可編程邏輯塊陣列。你可以把它想象成一個大型的邏輯門陣列,可以通過多種方式連接起來。
定制一款芯片動輒需要幾百萬美元,當然,一旦芯片被生產(chǎn)出來,就無法對它進行更改。所以 FPGA 通常用于下列情況:
由于缺乏資金,無法負擔制作定制 ASIC 的費用(例如,如果你只是像我這樣的黑客,而不是 ARM 或英特爾)。
無法負擔制作定制 ASIC 的費用,因為產(chǎn)量太低,不值得一次性支付高昂的費用 (例如,如果你正在使用定制的數(shù)據(jù)采集硬件生產(chǎn)少量的 MRI 機器)。
需要靈活性。
缺點是什么?那就是 FPGA 的單芯片成本要高得多,并且由于它能夠以非常靈活的方式將邏輯塊連接在一起,因此速度通常要慢得多。與此相反,定制的設計可以減少晶體管的數(shù)量,而無需考慮靈活性。
在我看來,比較 ASIC 的定制設計過程和 FPGA 的設計過程是很有幫助的:
邏輯設計:就像做 FPGA 一樣,ASIC 的邏輯設計也是用硬件描述語言來完成的。
驗證:FPGA 設計可能會被驗證,但是可以期待 ASIC!設計的過程更嚴格了。畢竟,設計一旦制造出來就不能更改!驗證通常包括設計部分的正式驗證。
合成:這將創(chuàng)建一個網(wǎng)表,一個邏輯塊及其連接的列表。連接被稱為網(wǎng),而塊被稱為單元。對于 FPGA 和 ASIC 來說,單元是特定于廠商的。
布局布線(Placement and routing,P&R):對于 FPGA 來說,它涉及到將網(wǎng)表中描述的邏輯塊映射到 FPGA 中的實際塊。由此產(chǎn)生的二進制通常稱為比特流。對于 ASIC 來說,這涉及到?jīng)Q定在晶片上何處放置單元,以及如何將它們連接起來。這兩種應用通常都要使用自動優(yōu)化工具。
我需要什么工具? 硬件描述語言:我使用的是 nMigen
你可能聽說過 Verilog 或 VHDL:這兩種流行的硬件描述語言(hardware description language,HDL)。這里我所說的“流行”,是指廣泛使用,而非廣受歡迎。
我不會假裝對這些工具很了解。我只知道那些比我更聰明的人,有著豐富的邏輯設計經(jīng)驗,卻對這些工具恨之入骨。由于 Verilog 和其他類似工具存在的問題,人們嘗試著開發(fā)出更有用、更友好的替代方法。nMigen(https://github.com/nmigen/nmigen )就是在 Python 中創(chuàng)建一 門領域?qū)S谜Z言的項目。用它自己的話就是:
雖然用 Verilog 和 VHDL 進行硬件設計比輸入原理圖的速度要快,但是由于一些原因,硬件設計還是很枯燥,而且效率也不高。對目前邏輯設計中占有重要地位的同步電路而言,事件驅(qū)動模型引入了不必要的問題,并引入了人工編碼。逆直覺的算術(shù)規(guī)則導致了更陡峭的學習曲線,并為設計上的微小缺陷提供了溫床。最后,通過“generate”語句來支持邏輯過程生成(元編程)非常有限,并且限制了代碼的通用、重用和組織方式。
針對這些問題,我們開發(fā)了 nMigen FHDL,該庫取代了事件驅(qū)動范例,它采用了組合語句和同步語句的概念,并采用了算術(shù)規(guī)則,使整型始終像數(shù)學整型一樣,最重要的是允許 Python 程序構(gòu)建所設計的邏輯。這一點使硬件設計人員能夠充分利用 Python 語言的豐富內(nèi)容:面向?qū)ο缶幊?、函?shù)參數(shù)、生成器、操作符重載、庫等,構(gòu)建組織良好、可重用的優(yōu)雅設計。
假如你和我一樣,從未使用過 Verilog,那么這些對你來說不僅僅是抽象的含義。但是聽起來確實很有前景,而且我可以證明,在沒有 Verilog 障礙的情況下,從邏輯設計開始就非常簡單。如果你對 Python 非常熟悉,我將推薦它!
我能想到的唯一缺點是,nMigen 仍然處于開發(fā)階段,特別是文檔還不完整。但你可以通過 chat.freenode.net 的 #nmigen 頻道找到有用的社區(qū)。
用于檢查模擬的波形顯示器:我使用的是 GTKWave
nMigen 提供了模擬工具。我將它用于用 pytest 編寫的測試。為了幫助調(diào)試,我記錄了這些測試中的信號,并在波形顯示器中觀察它們。
FPGA 開發(fā)板:我使用的是 myStorm BlackIce II
你不必使用 FPGA 開發(fā)板來創(chuàng)建自己的 CPU。在模擬中,你可以做任何事情。對于我來說,工作中使用板子的樂趣就是能閃爍 LED,看著自己的設計運行。
當然,如果你要創(chuàng)建的東西比我的最基本的 CPU 更有用,那么你可能需要一些硬件來運行它,而這并非“可選”選項!
開始使用 nMigen
在 nMigen 系統(tǒng)中,我并沒有立刻嘗試設計一個 CPU,而是首先制作一個算術(shù)邏輯單元(Arithmetic Logic Unit ,ALU)。在我見過的所有 CPU 設計中, ALU 是一個關鍵部件:它執(zhí)行算術(shù)運算。
為什么要從這里開始呢?我知道我的 CPU 需要一個 ALU;我知道我能做一個簡單的 ALU;我知道當開始一個新的項目時,做事情的感覺是一種重要的動力!
我的設計看起來像這樣:
"""Arithmetic Logic Unit"""import enum import nmigen as nm class ALUOp(enum.IntEnum): """Operations for the ALU""" ADD = 0 SUB = 1 class ALU(nm.Elaboratable): """ Arithmetic Logic Unit * op (in): the opcode * a (in): the first operand * b (in): the second operand * o (out): the output """ def __init__(self, width): """ Initialiser Args: width (int): data width """ self.op = nm.Signal() self.a = nm.Signal(width) self.b = nm.Signal(width) self.o = nm.Signal(width) def elaborate(self, _): m = nm.Module() with m.Switch(self.op): with m.Case(ALUOp.ADD): m.d.comb += self.o.eq(self.a + self.b) with m.Case(ALUOp.SUB): m.d.comb += self.o.eq(self.a - self.b) return m
正如你所看到的,我們已經(jīng)創(chuàng)建了大量的 nMigen Signal 實例,以很好地表示定義 ALU 接口的信號!但這個復雜的方法是什么呢?這個 elaborate 方法又是什么呢?我的理解是,“elaboration”是合成網(wǎng)表的第一步的名稱(見上文)。在上面的 nMigen 代碼中,我們的想法是,已經(jīng)創(chuàng)建了一些可闡述的結(jié)構(gòu)(通過繼承 nm.Elaboratable),也就是用來描述想要合成的數(shù)字邏輯的東西。這個 elaborate 方法描述了數(shù)字邏輯。它必須返回一個 nMigen 模塊。
下面讓我們進一步了解一下 elaborate 的方法的內(nèi)容。Switch 將創(chuàng)造某種形式的合成設計決策邏輯。但什么是 m.d.comb 呢?nMigen 提出了同步(m.d.sync)和組合(m.d.comb)控制域的概念。來自 nMigen 文檔(https://nmigen.info/nmigen/latest/lang.html#lang-domains ):
控制域是指在相同條件下改變其值的一組命名信號。
所有的設計都有一個預定義的組合域,其中包含所有的信號,當用來計算這些信號的任何值發(fā)生變化時,這些信號也隨之發(fā)生變化。名稱 comb 是為組合域保留的。
一種設計還可以有任意數(shù)量的用戶定義的同步域,也稱為時鐘域,其中包含的信號在域的時鐘信號出現(xiàn)特定邊緣時會發(fā)生變化,或者,對于具有異步復位功能的域,域的復位信號會發(fā)生變化。大多數(shù)模塊只使用一個同步域。
在組合域和同步域中,信號的賦值的行為各不相同。總的來說,同步域中的信號包含了設計的狀態(tài),而組合域中的信號并不能形成反饋回路或維持狀態(tài)。
下面以移位寄存器為例,說明要設計的邏輯。假定移位寄存器有 8 位,每個時鐘周期,該位值都會有一個移位(最左邊的值來自輸入信號)。這必然是同步的:不能通過簡單地將位連接在一起來創(chuàng)建這個功能,而在 nMigen 中,將位分配到組合域中將代表此功能。
我將在這個系列博客的下一部分詳細討論我的 CPU 設計?,F(xiàn)在的情況是,我試圖在每個周期中只停用一個指令,而不使用流水線——這很不尋常,但是我希望這樣做可以簡化 CPU 的各個方面。其結(jié)果是,大多數(shù)邏輯是組合的,而非同步的,因為我?guī)缀鯖]有在時鐘周期之間維持這種狀態(tài)?,F(xiàn)在,我的寄存器文件設計有問題,為了解決這個問題,我可能需要重新考慮我的“無流水線”想法。
編寫測試
對于 Python 測試,我喜歡使用 pytest,當然你也可以使用任何能吸引你的框架。以下是我在上面測試的 ALU 代碼:
"""ALU tests""" import nmigen.sim import pytest from riscy_boi import alu @pytest.mark.parametrize( "op, a, b, o", [ (alu.ALUOp.ADD, 1, 1, 2), (alu.ALUOp.ADD, 1, 2, 3), (alu.ALUOp.ADD, 2, 1, 3), (alu.ALUOp.ADD, 258, 203, 461), (alu.ALUOp.ADD, 5, 0, 5), (alu.ALUOp.ADD, 0, 5, 5), (alu.ALUOp.ADD, 2**32 - 1, 1, 0), (alu.ALUOp.SUB, 1, 1, 0), (alu.ALUOp.SUB, 4942, 0, 4942), (alu.ALUOp.SUB, 1, 2, 2**32 - 1)]) def test_alu(comb_sim, op, a, b, o): alu_inst = alu.ALU(32) def testbench(): yield alu_inst.op.eq(op) yield alu_inst.a.eq(a) yield alu_inst.b.eq(b) yield nmigen.sim.Settle() assert (yield alu_inst.o) == o comb_sim(alu_inst, testbench)
以及我的 conftest.py:
"""Test configuration""" import os import shutil import nmigen.sim import pytest VCD_TOP_DIR = os.path.join( os.path.dirname(os.path.realpath(__file__)), "tests", "vcd") def vcd_path(node): directory = os.path.join(VCD_TOP_DIR, node.fspath.basename.split(".")[0]) os.makedirs(directory, exist_ok=True) return os.path.join(directory, node.name + ".vcd") @pytest.fixture(scope="session", autouse=True) def clear_vcd_directory(): shutil.rmtree(VCD_TOP_DIR, ignore_errors=True) @pytest.fixture def comb_sim(request): def run(fragment, process): sim = nmigen.sim.Simulator(fragment) sim.add_process(process) with sim.write_vcd(vcd_path(request.node)): sim.run_until(100e-6) return run @pytest.fixture def sync_sim(request): def run(fragment, process): sim = nmigen.sim.Simulator(fragment) sim.add_sync_process(process) sim.add_clock(1 / 10e6) with sim.write_vcd(vcd_path(request.node)): sim.run() return run
每次測試都會生成一個 vcd 文件,我可以通過 GTKWave 等波形顯示器來查看,以便調(diào)試。你會注意到,組合模擬固定運行的時間段是任意小的,而同步模擬功能運行的時間段是確定的時鐘周期數(shù)。
一個信號產(chǎn)生于一個測試函數(shù),它將從模擬器請求它的當前值。對于組合邏輯,我們生成 nnmigen.sim.Settle() ,要求完成模擬。
對于同步邏輯,還可以開始新的時鐘周期,而不需要參數(shù)。
設計一個 CPU
在熟悉了 nMigen 之后,我開始嘗試繪制一個框圖來顯示我的 CPU。在本系列博客的下一部分中,我將對這個問題進行更詳細的討論,但我將簡單地說,我先繪制出一個指令所需要的邏輯,然后繪制出另一個指令的邏輯,然后找到如何將它們結(jié)合起來的方法。這里有第一個混亂的草圖:
在弄清楚不同元件的接口要求是什么時,這個框圖步驟非常有價值,但是在開始使用 nMigen 和在這個過程中學習數(shù)字邏輯設計之前,我不想這么做。修改后的框圖如下所示:
請關注本系列博客的下一部分,我將深入研究 RISC-V 和 CPU 設計。我想用第三部分來重新設計我的設計,使其適用于我要實現(xiàn)的全部指令集(RV32I)上工作
-
cpu
+關注
關注
68文章
10805瀏覽量
210847 -
觸發(fā)器
+關注
關注
14文章
1995瀏覽量
61012 -
數(shù)字邏輯
+關注
關注
0文章
72瀏覽量
16627
發(fā)布評論請先 登錄
相關推薦
評論