在系統(tǒng)性能與編程簡易性之間的權衡折中是通用操作系統(tǒng)與實時操作系統(tǒng)之間的主要區(qū)分點之一。
GPOS(通用操作系統(tǒng))傾向于提供較高程度的資源抽象,這不僅可通過支持軟件模塊與資源隔離來提高應用的便攜性、簡化開發(fā)流程,同時還能增強系統(tǒng)的穩(wěn)健性,這使 GPOS 成為諸如網絡、用戶界面以及顯示管理等通用系統(tǒng)組件的理想選擇。
然而,該抽象需要以系統(tǒng)資源的精細粒度控制作為代價,以滿足信號處理代碼等高強度算法的計算性能要求。對于實現(xiàn)這種高級別的控制,開發(fā)人員通常需要采用實時操作系統(tǒng) (RTOS)。
從嵌入式信號處理角度上講,我們通常要考慮兩種類型的操作系統(tǒng),即通用操作系統(tǒng) Linux 與實時操作系統(tǒng) DSP(數字信號處理器)/BIOS(基本輸入輸出系統(tǒng))。Linux 可支持更高水平的抽象技術,而 DSP/BIOS 則可提供更精細的控制。
為了充分發(fā)揮這兩種操作系統(tǒng)的優(yōu)勢,開發(fā)人員可采用系統(tǒng)虛擬機,這就使編程人員可在同一 DSP 處理器上同時運行 Linux 與 DSP/BIOS 系統(tǒng)。
然而,我們要提出一個重要的問題:為什么不使用分別運行 Linux 與 DSP/BIOS 系統(tǒng)的 CPU+DSP 組合器件呢?畢竟,CPU 在運行用戶接口控制代碼等方面具有更高的效率。此外,不同的內核可避免虛擬化帶來的開銷。不過,在同一顆芯片上集成所有功能還是很有吸引力的,原因如下:
其一,當今高性能 DSP 比前代 DSP 要強大得多,這樣可減少控制處理周期數。其二,大多數高性能 DSP 的通用性能均比前代產品更強,從而可實現(xiàn)更高效的控制代碼處理工作。
如果所有功能都可集成在 DSP 上,那么其優(yōu)勢將更加出眾。更少的芯片數量可實現(xiàn)更低的成本與更小的占用空間。此外,由于不再需要在耗費大量電力的處理器間數據傳輸,因此還可降低能耗。
進度安排
操作系統(tǒng)最常見也是最有利的一個特性就是能同時執(zhí)行多個任務或多個線程。操作系統(tǒng)通過時間表管理內核處理,以連續(xù)執(zhí)行相關任務。
以往,嵌入式編程人員在使用 Linux 時會擔心實時性能較低的問題。不過,對 Linux 內核的最新增強顯著提高了其對系統(tǒng)事件的響應能力,從而使其可滿足各種企業(yè)與個人以及嵌入式產品的需求。
Linux 可實現(xiàn)線程的時間切片以及優(yōu)先次序的時間安排。時間切片技術是指在所有線程之間共享處理工作周期,以確保無封鎖線程。這種方法通常適用于用戶接口功能,以確保在系統(tǒng)超載、響應較慢的情況下也不至于完全丟失用戶功能。
與此形成對比的是,優(yōu)先次序線程時間安排技術則可確保系統(tǒng)中最高優(yōu)先級線程的執(zhí)行,直至該線程放棄控制為止,這時下一個最高優(yōu)先級的線程即開始執(zhí)行。
Linux 內核在每次從內核到用戶模式的轉換時都會對可用線程的優(yōu)先級進行重新評估,這就意味著內核最新評估的任何事件(如驅動程序上數據的可用性)都能立即觸發(fā)新線程(調度器的時延響應時間內)的轉換。由于確定了基于優(yōu)先級的線程,其通常用于必須滿足實時要求的信號處理應用。
在推出 Linux 內核 2.6 版本之前,制約實時性能的主要因素是 Linux 內核會禁用中斷,且禁用時間有時會長達數百毫秒。
就此而言,我們可以提高內核實施的效率。因為在禁用中斷時,代碼的某些部分無需重新進入,而這會增加中斷響應的時延。
目前的 2.6 版本提供了構建選項,可在整個內核代碼中以更高的頻率插入中斷再啟用指令。Linux 社區(qū)通常將該特性稱作先占內核 (preempt kernel),盡管這會讓內核性能略有下降,但卻能夠顯著提高實時性能。對于眾多系統(tǒng)任務而言,在先占性 Linux 2.6 內核與實時線程結合使用時,將能提供足夠的性能來滿足實時需求。
例如,德州儀器 (TI) 的 DSP/BIOS 以軟件中斷和任務的形式僅支持優(yōu)先級調度。與 Linux 調度器一樣,軟件中斷和任務都屬于先占型的。但是,DSP/BIOS 也為應用編程人員提供了直接存取硬件中斷的條件,該資源僅適用于 Linux 內核模式。
直接存取硬件中斷使應用編程人員可在理論上實現(xiàn)底層硬件所支持的最短時延響應。對控制環(huán)路等需要絕對最低時延的應用而言,這種精細粒度的硬件中斷控制機制通常是一種非常重要的特性。
受保護的資源訪問
Linux 與大多數通用操作系統(tǒng)的一個基本屬性就是用戶空間程序與所用的底層系統(tǒng)資源相分離。僅在工作處于監(jiān)控(如內核)模式下時才允許直接訪問存儲器和設備外設。
如果用戶程序希望訪問系統(tǒng)資源,那么它必須通過稱作驅動器的內核模塊從內核發(fā)出請求。該應用位于用戶存儲器空間,并將通過虛擬文件訪問驅動程序。然后,虛擬文件將應用的請求轉至驅動器執(zhí)行的內核存儲器空間。
Linux 可提供特性極為豐富的驅動器模型,其中包括標準流媒體外設、模塊存儲設備以及文件系統(tǒng),甚至還包括網絡與基于網絡的文件系統(tǒng)。
驅動器與用戶空間應用的分離可實現(xiàn)高度的穩(wěn)健性。此外,通用驅動器接口上的抽象水平使其便于將數據流傳輸給串行端口、閃存文件系統(tǒng)或網絡共享文件夾,且僅需對底層應用代碼稍作更改。
然而,實現(xiàn)這種靈活性需要付出代價。應用與物理資源的嚴格分離會加大開銷。如果用戶空間程序要訪問設備外設,則內核模式必須進行環(huán)境交換才能處理該請求。
由于數據是成塊訪問,而非逐個樣本 (sample-by-sample) 訪問,因此通常來說這不會造成太大的局限性。這樣,內核模式下每次塊訪問僅需進行一次環(huán)境交換即可。
但是,在某些情況下,應用代碼需與物理硬件嚴格匹配。如果使用 DSP 等對數據吞吐量要求較高且不能容忍停頓的高性能處理器時,通常就會出現(xiàn)此類情況。這時,內核空間的物理資源與用戶空間的應用相分離的做法就可能會嚴重影響系統(tǒng)性能。
應用與硬件的匹配
我們不妨使用 TMS320DM643x 處理器架構來研究在執(zhí)行塊視頻處理時會遇到的典型情況,該架構采用一個 600 MHz / 4800 MIPS DSP 處理內核以及諸如功能豐富的視頻端口子系統(tǒng)等各種多媒體外設。這種硬件通常用于將輸入視頻流進行 H.264 格式壓縮。
為了充分發(fā)揮 DSP 內核的處理能力,處理的數據應從周期操作內部存儲器讀取,而不是從速度較慢的外部存儲器讀取。盡管在技術上可以讓具有足夠快的片上存儲器的處理器存儲一個或多個完整的視頻幀,但這種技術對大多數目標市場來說成本太高。因此,采用可提供 80kB 的單周期操作片上數據存儲器的處理器取而代之。
80kB 雖然小,不能存儲完整的視頻幀,但 TI 通過
DSP通過直接存儲器存取(DMA)控制器為該存儲器提供數據,這種控制器還可用于內外部存儲器之間高效傳輸數據子塊,而不會占用處理器內核的周期操作(見圖 1)。
從整體系統(tǒng)的角度來說,這種方法可提供幾乎相當于具有整個視頻緩沖器的芯片所提供的性能,但成本卻非常低。不過,為了實現(xiàn)這樣的高性能,就需要應用、操作系統(tǒng)以及底層存儲器與 DMA 硬件之間的緊密配合。
首先,應用必須能夠區(qū)別快速內部存儲器與大容量外部存儲器。其次,應用必須能夠執(zhí)行許多時間精確的小型 DMA 操作。由于訪問 DMA 時發(fā)生的所有時延在 DMA 訪問每個視頻幀時都會放大數百倍乃至數千倍,因而在 Linux 驅動程序模型內高效實現(xiàn) DMA 操作雖非不可能,但也極為困難。
這種方法的實際實施可通過 DSP/BIOS 完成,并提供原生 API 來實現(xiàn)應用對內外部存儲器的請求,同時也使應用可直接訪問 DMA 寄存器,不會產生環(huán)境交換損失。
兩種操作系統(tǒng)的優(yōu)勢結合
盡管眾多多媒體應用的大部分處理器周期操作都用來進行信號處理,但能滿足消費需求的產品同時還必須執(zhí)行許多更高級的功能,如用戶界面、顯示功能、網絡以及文件處理等。
由于上述特性對時間要求不高,因此無需精確控制 DSP/BIOS。這時,Linux驅動程序模型所提供的資源提取功能就可更好地提高靈活性,縮短開發(fā)時間,更不用說可獲得 Linux 社區(qū)豐富的開源應用代碼支持了。
可使 Linux 與 DSP BIOS 操作系統(tǒng)同時運行在同一設備上的解決方案,就是需要使用虛擬程序 (virtualizer) 為系統(tǒng)開發(fā)或集成人員提供這兩種操作系統(tǒng)的優(yōu)勢(見圖 2)。
虛擬程序作為快速、可預測的交換機可在 Linux 與 DSP/BIOS 操作系統(tǒng)之間實現(xiàn) DSP 資源。當接收到中斷時對 DSP/BIOS 操作系統(tǒng)環(huán)境做出推測性交換,能夠確保 DSP/BIOS 線程的最佳性能。
如果新到達的中斷對應于 DSP/BIOS 環(huán)境中已識別的事件,那么將在已經加載且準備運行的 DSP/BIOS 環(huán)境中對其進行處理。
在虛擬程序支持 DSP/BIOS 的同時,應用可直接訪問所需的系統(tǒng)資源,且不會影響(掛起)Linux 環(huán)境中保持的用戶與內核空間。
一旦應用完成 DSP/BIOS 環(huán)境下的高性能信號處理計算,虛擬機就將強制轉回到 Linux環(huán)境,以便訪問該環(huán)境下的更高級特性。
在虛擬程序的調節(jié)下,操作系統(tǒng)之間的交換時間不到 10ms,這使編程人員能達到實時性能要求,相對于只包含 DSP/BIOS 的原生系統(tǒng)而言,性能上也沒什么損失。該解決方案對典型多媒體設備的處理資源占用僅約 1.5%。
雙操作系統(tǒng)的更多優(yōu)勢
DSP/BIOS 操作系統(tǒng)對基于 Linux 的產品進行擴展的最明顯優(yōu)勢之一是 :無需移植就可使用成百上千種第三方的相關算法。由于符合 xDAIS 標準,因此可確保第三方算法無縫集成于 DSP/BIOS 環(huán)境中。
DSP/BIOS 操作系統(tǒng)對基于 Linux 的系統(tǒng)進行擴展的另一個優(yōu)勢是:在 DSP/BIOS 環(huán)境下執(zhí)行應用不受 Linux 內核 GNU 通用公共許可證 (GPL) 的限制。
在實施基于 Linux 的解決方案時,我們有時不是很清楚開發(fā)商推出的獨特軟件知識產權在許可證方面到底有哪些具體要求。通過在 DSP/BIOS 而非 Linux 操作環(huán)境下執(zhí)行 IP,可以避免這方面的法律問題。
使用本文介紹的技術,Linux 與 DSP BIOS 可同時運行在統(tǒng)一的 DSP 內核上,這既能夠提供 Linux 解決方案的全部功能,又可確保 DSP/BIOS 環(huán)境下的高精度與硬件控制。
編程人員可充分利用適用于 Linux 的應用代碼與適用于 DSP/BIOS的信號處理代碼,無需針對不同環(huán)境進行移植。
對要在實時嵌入式應用中采用 Linux 特性的設計人員而言,通過虛擬程序升級、同時獲得 DSP BIOS 工具套件,將大幅提高信號處理性能,并可顯著節(jié)省系統(tǒng)資源的成本。
評論
查看更多