1 嵌入式系統(tǒng)中對內(nèi)存分配的要求
①快速性。
嵌入式系統(tǒng)中對實時性的保證,要求內(nèi)存分配過程要盡可能地快。因此在嵌入式系統(tǒng)中,不可能采用通用操作系統(tǒng)中復雜而完善的內(nèi)存分配策略,一般都采用簡單、快速的內(nèi)存分配方案。當然,對實性要求的程序不同,分配方案也有所不同。例如,VxWorks采用簡單的最先匹配如立即聚合方法;VRTX中采用多個固定尺寸的binning方案。
②可靠性。
也就是內(nèi)存分配的請求必須得到滿足,如果分配失敗可能會帶來災難性的后果。嵌入式系統(tǒng)應用的環(huán)境千變?nèi)f化,其中有一些是對可靠性要求極高的。比如,汽車的自動駕駛系統(tǒng)中,系統(tǒng)檢測到即將撞車,如果因為內(nèi)存分配失敗而不能相應的操作,就會發(fā)生車毀人亡的事故,這是不能容忍的。
③高效性。
內(nèi)存分配要盡可能地少浪費。不可能為了保證滿足所有的內(nèi)存分配請求而將內(nèi)存配置得無限大。一方面,嵌入式系統(tǒng)對成本的要求使得內(nèi)存在其中只是一種很有限的資源;另一方面,即使不考慮成本的因素,系統(tǒng)有限的空間和有限的板面積決定了可配置的內(nèi)存容量是很限的。
2 靜態(tài)分配與動態(tài)分配
究竟應用使用靜態(tài)分配還是動態(tài)分配,一直是嵌入式系統(tǒng)設計中一個爭論不休的總是。當然,最合適的答案是對于不同的系統(tǒng)采用不同的方案。如果是系統(tǒng)對于實時性和可靠性的要求極高(硬實時系統(tǒng)),不能容忍一點延時或者一次分配失敗,當然需要采用靜態(tài)分配方案,也就是在程序編譯時所需要的內(nèi)存都已經(jīng)分配好了。例如,火星探測器上面的嵌入式系統(tǒng)就必須采用靜態(tài)分配的方案。
另外,WindRiver公司的一款專門用于汽車電子和工業(yè)自動化領(lǐng)域的實時操作系統(tǒng) OSEKWorks中就不支持內(nèi)存的動態(tài)分配。在這樣的應用場合,成本不支持內(nèi)存的動態(tài)分配。在這樣的應用場合,成本不是優(yōu)先考慮的對象,實時性和可靠性才是必須保證的。當然,采用靜態(tài)分配一個不可避免的總是就是系統(tǒng)失去了靈活性,必須在設計階段就預先知道所需要的內(nèi)存并對之作出分配;必須在設計階段就預先考慮到所有可能的情況,因為一旦出現(xiàn)沒有考慮到的情況,系統(tǒng)就無法處理。
這樣的分配方案必須導致很大的浪費,因為內(nèi)存分配必須按照最壞情況進行最大的配置,而實際上在運行中可能使用的只是其中的一小部分;而且在硬件平臺不變的情況下,不可能靈活地為系統(tǒng)添加功能,從而使得系統(tǒng)的升級變得困難。 大多數(shù)的系統(tǒng)是硬實時系統(tǒng)和軟實時系統(tǒng)的綜合。也就是說,系統(tǒng)中的一部分任務有嚴格的時限要求,而另一部分只是要求完成得越快越好。
按照RMS(Rate Monotoin Scheduling)理論,這樣的系統(tǒng)必須采用搶先式任務調(diào)度;而在這樣的系統(tǒng)中,就可以采用動態(tài)內(nèi)存分配來滿足那一部分可靠性和實時性要求不那么高的任務。采用動態(tài)內(nèi)存分配的好處就是給設計者很大的靈活性,可以方便地將原來運行于非嵌入式操作系統(tǒng)的程序移植到嵌入式系統(tǒng)中,比如,許多嵌入式系統(tǒng)中使用的網(wǎng)絡協(xié)議棧。如果必須采用靜態(tài)內(nèi)存分配,移植這樣的協(xié)議棧就會困難得多。另外,采用動態(tài)內(nèi)存分配可以使設計者在不改變基本的硬件平臺的情況下,比較靈活地調(diào)整系統(tǒng)的功能,在系統(tǒng)中各個功能之間作出權(quán)衡。例如,可以在支持的VLAN數(shù)和支持的路由條目數(shù)之間作出調(diào)整,或者不同的版本支持不同的協(xié)議。
說到底,動態(tài)內(nèi)存分配給了嵌入式系統(tǒng)的程序設計者在比較少的限制和較大的自由。因此,大多數(shù)實時操作系統(tǒng)提供了動態(tài)內(nèi)存分配接口,例如malloc和free 函數(shù)。
3 RTOS提供的內(nèi)存分配接口
不同的RTOS由于其不同的定位,采用不同的內(nèi)存分配策略。例如VRTX中,采用類似于GNU C中由Doug Lea開發(fā)的內(nèi)存分配方案,即Binning算法,系統(tǒng)內(nèi)存被分成了一些固定尺寸的內(nèi)存塊的算法,系統(tǒng)內(nèi)存被分成了一些固定尺寸的內(nèi)存塊的集合。這種方法的優(yōu)點是查找速度快而且不會產(chǎn)生內(nèi)存碎片。但是,它的缺點也很明顯,就是容易造成浪費,因為內(nèi)存塊的尺寸只有有限個,分配時只能取較大的內(nèi)存塊來滿足一個較小的需求,累積起來,浪費就很大了;而且操作系統(tǒng)管理這樣一個內(nèi)存分配表也是一個很大的負擔。
下面詳細介紹一下我們常用的RTOS——美國風河公司(WindRiver)的VxWorks中采用的內(nèi)存分配策略。
VxWorks的前身就是VRTX,據(jù)說VxWorks的名稱來自make vrtx work。 VxWorks的內(nèi)存管理函數(shù)存在于2個庫中;memPartLib(緊湊的內(nèi)存分區(qū)管理器)和memLib(完整的內(nèi)存分區(qū)管理器)。前者 (memPartLib)提供的工具用于從內(nèi)存分區(qū)中分配內(nèi)存塊。該庫包含兩類程序,一類是通用工具創(chuàng)建和管理內(nèi)存分區(qū)并從這些分區(qū)中分配和管理內(nèi)存塊; 另一類是標準的malloc/free程序提供與內(nèi)存分區(qū)的接口。系統(tǒng)內(nèi)存分區(qū)(其ID為memSysPartId是一個全局變量)在內(nèi)核初始化時由 usrRoot調(diào)用memInit創(chuàng)建。其開始地址為RAM中緊接著VxWorks的BSS段之后,大小為所有空閑內(nèi)存,如圖1所示。
當創(chuàng)建其它分區(qū)時,一般需要先調(diào)用malloc從系統(tǒng)內(nèi)存分區(qū)中分配一段內(nèi)存才能創(chuàng)建。內(nèi)存分區(qū)的結(jié)構(gòu)定義為mem_part,包含1個對象標記,1個雙向鏈表管理空閑塊,1個信號量保護該分區(qū)及一些統(tǒng)計信息,如總尺寸、最大塊尺寸、調(diào)試選項、已分配的塊數(shù)、已分配的尺寸等。其語句如下: typedef struct mem_part { OBJ_CORE objCore; /*對象標志*/ DL-LIST freeList; /*空閑鏈表*/ SEMAPHORE sem; /*保護分區(qū)的信號量*/ Unsigned totalWords; /*分區(qū)中字(WORD)數(shù)*/ Unsigned minBlockWords; /*以字為單位的最小塊尺寸*/ Unsigned options; /*選項,用于調(diào)試或統(tǒng)計*/ /*分配統(tǒng)計*/ unsigned curBlocksAllocated; /*當前分配的塊數(shù)*/ unsigned curWorkdAllocated; /*當前分配的字數(shù)*/ unsigned cumBlockAllocated; /*累積分配的塊數(shù)*/ unsigned cumWordsAllocated; /*累積分配的字數(shù)*/ }PARTITION; 一般系統(tǒng)中只有1個內(nèi)存分區(qū),即系統(tǒng)分區(qū),所有任務所需要的內(nèi)存直接調(diào)用malloc從其中分配。
分配采用 First-Fit算法(注意這種算法容易導致大量碎片),通過free釋放的內(nèi)存將被聚合以形成更大的空閑塊。這就是VxWorks的內(nèi)存分配機理。分配時可以要求一定的對齊格式。注意,不同的 CPU架構(gòu)有不同的對齊要求。為了優(yōu)化性能,malloc返回的指針是經(jīng)過對齊的,為此的開銷隨構(gòu)不同而不同。例如,68K為4字節(jié)對齊,開銷8字節(jié);SPARC為8字節(jié)對齊,開銷12字節(jié);MIPS為16字節(jié)對齊,開銷12字節(jié);I960為16字節(jié)對齊,開銷16字節(jié)。
MemLib庫中提供了增強的內(nèi)存分區(qū)管理工具,并且增加了一些接口,而且可以設置調(diào)試選項??梢詸z測2類錯誤:
①嘗試分配太大的內(nèi)存;
②釋放內(nèi)存時發(fā)現(xiàn)壞塊。
有4種錯誤處理選項,當發(fā)生錯誤時記錄消息或掛起任務。 但是,使用動態(tài)內(nèi)存分配malloc/free時要注意到以下幾方面的限制。
①因為系統(tǒng)內(nèi)存分區(qū)是一種臨界資源,由信號量保護,使用malloc會導致當前調(diào)用掛起,因此它不能用于中斷服務程序;
②因為進行內(nèi)存分配需要執(zhí)行查找算法,其執(zhí)行時間與系統(tǒng)當前的內(nèi)存使用情況相關(guān),是不確定的,因此對于有規(guī)定時限的操作它是不適宜的;
③由于采用簡單的最先匹配算法,容易導致系統(tǒng)中存在大量的內(nèi)存碎片,降低內(nèi)存使用效率和系統(tǒng)性能。 針對這種情況,一般在系統(tǒng)設計時采用靜態(tài)分配與動態(tài)分配相結(jié)合的方法。也就是對于重要的應用,在系統(tǒng)初始化時分配好所需要的內(nèi)存。在系統(tǒng)運行過程中不再進行內(nèi)存的分配/釋放,這樣就避免了因內(nèi)存的分配釋放帶來的總是。而且在系統(tǒng)初始化,因為沒有內(nèi)存碎片,對于大的內(nèi)存塊的需求容易滿足。對于其它的應用,在運行時進行動態(tài)內(nèi)存分配。尤其是某些應用所要求的大量固定尺寸的小內(nèi)存塊,這時就可以采用一次分配多次使用的內(nèi)存分配方案。下面詳細介紹這種內(nèi)存分配方案及其應用場合。
4 一次分配多次使用的內(nèi)存分配方案
在嵌入式系統(tǒng)設計中,經(jīng)常有一些類似于內(nèi)存數(shù)據(jù)庫的應用。這些應用的特點是在內(nèi)存中管理一些樹,比如以太網(wǎng)交換機中的MAC地址表、VLAN表等,或者路由器中的路由表。這些樹是由許多相同尺寸的節(jié)點組成的。這樣,就可以每次分配一個大的緩沖池,比如包含多個內(nèi)存單元的數(shù)組,每個內(nèi)存單元用于1個節(jié)點。我們用一個空閑鏈表來管理該數(shù)組中的空閑內(nèi)存單元。每次程序需要分配內(nèi)存以創(chuàng)建1個新的節(jié)點時,就從空閑鏈表中取1個單元給調(diào)用者。程序刪除節(jié)點并釋放內(nèi)存時,將釋放的內(nèi)存單元返還給空閑鏈表。如果鏈表中的空閑內(nèi)存單元取空了,就再次調(diào)用malloc從系統(tǒng)內(nèi)存中分配一個大的內(nèi)存塊作為新的緩沖池。
采用這樣一種方案主要有如下優(yōu)點:
①減少了malloc/free的調(diào)用次數(shù),從而降低了風險,減少了碎片;
②因為從緩沖池中取一個內(nèi)存單元是時間確定的(當然,如果緩沖池耗盡從而需要重新調(diào)用malloc分配除外),因此它可以用于嚴格時限的場合從而保證實時性;
③它給用戶以自由來添加一些用于內(nèi)存分配和釋放的調(diào)試函數(shù)以及一些統(tǒng)計功能,更好地監(jiān)測系統(tǒng)中內(nèi)存的使用情況。
這種方案必然涉及到一個緩沖池的結(jié)構(gòu)。
一般緩沖池的結(jié)構(gòu)由以下幾部分組成:單元尺寸、塊尺寸(或者單元數(shù)目)、緩沖池指針、空閑鏈表、用于統(tǒng)計和調(diào)試的參數(shù)等。對緩沖池的操作包括創(chuàng)建緩沖池、釋放緩沖池、從緩沖池中分配1個內(nèi)存單元、釋放內(nèi)存單元回緩沖池等。下面舉2個例子說明一下該方案的具體使用情況。
4.1 Intel交換機驅(qū)動程序中內(nèi)存分配
4.1 Intel交換機驅(qū)動程序中內(nèi)存分配
在以Intel的交換芯片為基礎的交換機方案中,因為采用的是軟件地址學習的方式,需要在內(nèi)存中維護許多數(shù)據(jù),如MAC地址表的軟拷貝、VLAN表、靜態(tài)單播地址表、組播地址表等。這些表都是由一些樹組成,每個樹由一些固定尺寸的節(jié)點組成。一般每個節(jié)點幾十個字節(jié),每棵樹的節(jié)點數(shù)是可增長的,少則幾十,最多可到16K個節(jié)點。
因此,很適合于采用該方案,具體的實現(xiàn)如下:
(1)緩沖池結(jié)構(gòu) BlockMemMgr typedef struct{ MemSize data_cell_size; /*數(shù)據(jù)單元的尺寸*/ MemSize block_size; /*塊尺寸*/ /*下面的變量為預定義的每個管理器最多包含的塊數(shù),如64 MAX_BLOCKS_OF_MEM_SIZE*/ Unsigned short blocks_being_used;/*已使用的塊數(shù)*/ Void mem_ptr[PAX_BLOCKS_OF_MEM_SIZE]; /*塊數(shù)組*/ SLList free_data_cells_list; /*空閑鏈表*/ }BlockMemMgr; 結(jié)構(gòu)中的參數(shù)包括:單元尺寸、塊尺寸、已用塊數(shù)、所有塊的地址、空閑鏈表(單向鏈表)。
(2)緩沖池的管理函數(shù)
◆block_mem_create:創(chuàng)建塊內(nèi)存管理器,參數(shù)包括內(nèi)存指針(如為NULL,表示自己分配)、塊尺寸、單元尺寸、返回管理器指針。 過程如下:
①檢驗參數(shù)合法性。
②單元尺寸4字節(jié)對齊,計算每個塊中的單元數(shù)。對內(nèi)存指針進行4字節(jié)對齊或者分配內(nèi)存指針。
③初始化結(jié)構(gòu)BlockMemMgr,包括單元尺寸和塊尺寸。設置第1個內(nèi)存塊的指針。如果內(nèi)存是外來的,設置塊已用標志(已用為0),表示不能增加塊;否則,已用塊數(shù)設為1。
④創(chuàng)建空閑鏈表,將塊內(nèi)所有單元添加到鏈表中,最后一個單元處于鏈表的最前面。
⑤返回BlockMemMgr。
◆block_mem_destroy:解構(gòu)一個塊內(nèi)存管理器,釋放它所分配的所有內(nèi)存,調(diào)用者負責外部內(nèi)存的釋放。參數(shù)為BlockMemMgr。返回成功失敗標志。
①參數(shù)合法性檢測。
②刪除單向鏈表(設鏈表指針為NULL)。
③如果塊是動態(tài)分配的,釋放它們。 ④釋放結(jié)構(gòu)BlockMemMgr。
◆block_malloc:從塊內(nèi)存管理器中分配1個單元
◆block_malloc:從塊內(nèi)存管理器中分配1個單元。參數(shù)為BlockMemMgr,返回數(shù)據(jù)單元指針。
①參數(shù)合法性檢測。
②判斷空閑鏈表是否為空(是否為NULL)。如果為空,判斷是否可以動態(tài)分配塊,如果不能,返回失敗;如果可以動態(tài)分配塊,則分配1個塊,執(zhí)行與 block_mem_create一樣的操作。
③從空閑鏈表中分配第1個單元,返回其指針。 注意這里有一個小技巧,即數(shù)據(jù)單元在空閑時其中存放空閑鏈表的節(jié)點信息,而分配后則存放數(shù)據(jù)內(nèi)容。
◆block_free:釋放1個數(shù)據(jù)單元,返回塊內(nèi)存管理器。小心不要對1個單元釋放2次。參數(shù)為BlockMemMgr和單元指針。 ①參數(shù)合法性檢測。 ②地址比較,判斷數(shù)據(jù)單元屬于哪個塊。 ③判斷數(shù)據(jù)單元的內(nèi)容是否為空閑鏈表節(jié)點信息(也就是塊內(nèi)某單元的地址),從而確定是否為2次釋放。 ④將該數(shù)據(jù)單元插入到空閑鏈表的前面。 ⑤引用該單元的指針設為NULL。 內(nèi)存管理代碼遵守如下約定:①管理的內(nèi)存是實際可寫的內(nèi)存;②分配內(nèi)存是4字節(jié)或32位對齊;③block_malloc、block_free在中斷級調(diào)用是部分安全的,除非BLOCK中已經(jīng)沒有空閑CELL,需要重新調(diào)用malloc分配新的BLOCK(而malloc和free就不是安全的,因為其中使用了信號量和搜索算法,容易引起中斷服務程序阻塞)。當然,block_mem_create和block_mem_destroy必須在進程級調(diào)用。
4.2 TMS中的內(nèi)存分配
TMS是WindRiver公司為可管理式交換機推出的開發(fā)包。它用用IDB來管理各種協(xié)議的數(shù)據(jù),比如STP和GVRP等。為了支持IDB,它建立了自己的緩沖池管理方案,程序在 bufPoolLib.c中。該程序包含用于緩沖池管理的函數(shù),這些函數(shù)允許從1個池中分配固定數(shù)目和大小的緩沖區(qū)。通過預先分配一定數(shù)目固定大小的緩沖區(qū),避免了反復的小的內(nèi)存塊分配/釋放相關(guān)聯(lián)的內(nèi)存碎片和浪費。既然它從1個單一的塊中分配緩沖池,也比對每一個緩沖區(qū)執(zhí)行1 次分配有更高的空間效率。模塊對每個緩沖區(qū)加上1個標記(MAGIC),釋放時會檢查標記。模塊給用戶提供分配和釋放操作定義回調(diào)函數(shù)的能力。這樣可以做到自動的對象創(chuàng)建和解構(gòu),同時允許由多個緩沖池分配的成員組成的對象做為1個單一的實體刪除。這類似于C++中自動的對象構(gòu)建和解構(gòu),不過是用C語言并且沒有堆棧分配的負擔。模塊既允許從堆棧中分配緩沖池(通過calloc),也可以在用戶分配的空間中創(chuàng)建它們。模塊用1個單向鏈表來維護未分配的緩沖區(qū),但不跟蹤已分配的緩沖區(qū)。模塊并不是任務安全的,用戶需要用信號時來保護緩沖池。
(1)緩沖池結(jié)構(gòu) typedef struct { ulong_t magic; /*用于一致性檢測的特殊標記*/ Boolean localAlloc; /*內(nèi)存是否在創(chuàng)建緩沖區(qū)時分配*/ SL_LIST freeList; /*空閑鏈表*/ Void store; /*緩沖區(qū)指向的內(nèi)存指針*/ STATUS(*createFn)(void*,ulong_t argl); /*創(chuàng)建緩沖區(qū)時的回調(diào)函數(shù)指針*/ STATUS(*destroyFn)(void*,ulong_targl);/*釋放緩沖區(qū)時的回調(diào)函數(shù)指針*/ Ulong_t argVal;/*回調(diào)函數(shù)的參數(shù)*/ } buf_pool_t; 結(jié)構(gòu)中的參數(shù)包括檢查標記MAGIC、是否本地分配、空閑鏈表、內(nèi)存指針、創(chuàng)建緩沖池的回調(diào)函數(shù)指針、釋放時的回調(diào)函數(shù)指針、回調(diào)函數(shù)參數(shù)。
(2)相關(guān)函數(shù)
◆BufPoolInitializeStorage:分配和初始化存儲區(qū)。參數(shù)包括存儲區(qū)地址(如為NULL,則本地分配)、緩沖區(qū)大小、緩沖區(qū)個數(shù)。
①根據(jù)緩沖區(qū)大小和個數(shù)獲得所需的內(nèi)存大小。
②如果指針為NULL,則調(diào)用calloc分配內(nèi)存。設置本地分配標志。
③初始化內(nèi)存為0。
④初始化指針。分配的內(nèi)存塊最前面為緩沖池結(jié)構(gòu)buf_pool_t。實際的存儲區(qū)緊隨其后。Buf_pool_t包含參數(shù)檢查標記、是否本地分配、存儲區(qū)地址、分配時回調(diào)函數(shù)、釋放時回調(diào)函數(shù)、回調(diào)函數(shù)變量。此時只設置存儲區(qū)指針。
◆BufPoolCreate:創(chuàng)建緩沖池。參數(shù)為內(nèi)存制止。緩沖區(qū)尺寸和個數(shù),創(chuàng)建時回調(diào)函數(shù)、釋放時回調(diào)函數(shù)、回調(diào)函數(shù)參數(shù)。
①尺寸對齊。
②調(diào)用bufPoolInitializeStorage初始化內(nèi)存區(qū)和buf_pool_t結(jié)構(gòu)。
③用傳入?yún)?shù)填充buf_pool_t結(jié)構(gòu)。 ④將緩沖區(qū)添加到空閑鏈表中,最后的緩沖區(qū)在最前面。
◆BufPoolDestroy:刪除緩沖池。參數(shù)為buf_pool_t指針。
①檢查緩沖池結(jié)構(gòu)中的MAGIC字段是否被個性。
②如果是本地分配的則翻放內(nèi)存區(qū)。
◆BufPoolAlloc:從緩沖池中分配一個緩沖區(qū),參數(shù)為緩沖池結(jié)構(gòu)指針。如果存在空閑緩沖區(qū),則從空閑鏈表中除并提供給調(diào)用者,執(zhí)行創(chuàng)建時回調(diào)函數(shù)。如果回調(diào)函數(shù)返回錯誤,則將緩沖區(qū)返還給空閑鏈表。
①檢查緩沖池結(jié)構(gòu)中的MAGIC標記是否完好。
②從空閑鏈表中取出頭一個節(jié)點。
③如果節(jié)點不為空,清空節(jié)點,以其地址為參數(shù)調(diào)用回調(diào)函數(shù)。
④如果回調(diào)函數(shù)返回錯誤,則將節(jié)點還給空閑鏈表。 ⑤返回得到空閑緩沖區(qū)地址。
◆BufPoolFree:將緩沖區(qū)返回給緩沖池。如果定義了回調(diào)函數(shù),將在歸還緩沖之間調(diào)用回調(diào)函數(shù)。參數(shù)為緩沖池結(jié)構(gòu)和緩沖區(qū)指針。
①緩沖池MAGIC標記是否完好。
②如果定義回調(diào)函數(shù)、調(diào)用之。如果返回錯誤,則設置錯誤號。
③將緩沖區(qū)添加到空閑鏈表中頭部。
注意該函數(shù)有2點:
①回調(diào)函數(shù)返回錯誤,照樣歸還緩沖區(qū)。
②沒有檢查緩沖區(qū)是否二次釋放,這一點與Intel的驅(qū)動程序不同。 另外,TMS的緩沖池沒有BLOCK要領(lǐng),不需要判斷哪個CELL屬于哪個BLOCK,簡化 了操作。
5 小結(jié)
許多嵌入式應用在RTOS提供的malloc/free的基礎上編寫自己的內(nèi)存管理方案。編寫這樣的內(nèi)存管理方案,目的無非有兩個:一是減少對 malloc/free的依賴,從而避免由之帶來的內(nèi)存碎片、時間不確定等總是;另一個是增強程序的查錯能力,送還內(nèi)存使用錯誤。對于在嵌入式系統(tǒng)中廣泛存在的數(shù)據(jù)庫類型的內(nèi)存需求,即分配多個固定尺寸的內(nèi)存單元的要求,“一閃分配,多次使用”的方案無疑是一種很好的解決之道。文中介紹的2個例子很好地體現(xiàn)了它的優(yōu)越性。
評論
查看更多