前言
最近在開發(fā)調(diào)試基于RT-Thread 的驅(qū)動時(shí),遇到一個(gè)比較奇怪的死機(jī)問題,后來經(jīng)過一步步排查,終于發(fā)現(xiàn)是驅(qū)動的鏈表節(jié)點(diǎn)沒有初始化造成的死機(jī)
問題分析
RT-Thread 的驅(qū)動開發(fā)完成后,通過編寫串口 shell 測試命令,運(yùn)行命令后,觸發(fā)死機(jī)
由于當(dāng)前缺少單步的調(diào)試方法,只能通過增加LOG與打開關(guān)閉部分軟件功能,一步步縮小范圍
在函數(shù)調(diào)用的入口,把某些關(guān)鍵的函數(shù)調(diào)用分別注釋掉驗(yàn)證,這樣逐步驗(yàn)證下來,最終縮小到一個(gè)函數(shù),調(diào)用這個(gè)函數(shù)就觸發(fā)死機(jī)。
用到的軟件調(diào)試方法
(1)增加LOG,確認(rèn)代碼能執(zhí)行到哪些函數(shù),能執(zhí)行到哪些行
(2)通過 #if 0 A_CODE #else B_CODE #endif 條件編譯的調(diào)試方法,大塊注釋部分代碼,確認(rèn)代碼執(zhí)行的路徑,縮小排查方向,確認(rèn)是執(zhí)行到哪個(gè)函數(shù)或模塊造成死機(jī)的
(3)通過對比代碼來確認(rèn)問題,比如軟件正常工作過,后來改動死機(jī)了,大概率說明是改動造成的,所以可以通過 git BCompare.exe 等代碼管理與比對工具,代碼回溯,兩份新舊代碼對比分析,逐步把排查范圍縮小,從代碼層面分析可能造成死機(jī)的原因
問題分析
軟件調(diào)試有時(shí)候比較的簡單,有時(shí)候會比較的復(fù)雜,由于這個(gè)驅(qū)動移植來自其他系統(tǒng)的,數(shù)據(jù)結(jié)構(gòu)里面的成員比較的多,所以初步通過代碼對比工具如 BCompare 進(jìn)行代碼對比,發(fā)現(xiàn)了一點(diǎn)端倪:由于RT-Thread 暫時(shí)不支持 hash list(哈希鏈表),我把 hash list的功能實(shí)現(xiàn) 改為了 RT-Thread 的 list 替代,struct rt_list_node。
對比了軟件的其他改動點(diǎn),雖然改動部分較大,但軟件工作流程差不多,初步排查代碼沒有實(shí)質(zhì)性的差異
通過進(jìn)一步的排查并縮小范圍,終于發(fā)現(xiàn)了問題點(diǎn):這個(gè)函數(shù)在 插入鏈表 的操作部分死機(jī)了!
通過代碼繼續(xù)網(wǎng)上找,發(fā)現(xiàn)這個(gè)包含 RT-Thread list 的數(shù)據(jù)節(jié)點(diǎn),是通過 rt_malloc 申請的,并且沒有看到成員 list 使用 rt_list_init 初始化鏈表的操作
所以馬上確認(rèn)了問題: 鏈表的節(jié)點(diǎn)沒有初始化造成的,通過增加 list 初始化,本以為立即解決了問題,但是竟然依舊死機(jī)!
意外的BUG發(fā)現(xiàn):數(shù)據(jù)節(jié)點(diǎn)的鏈表的頭,也就是 鏈表 head 也沒有初始化,解決方法同上,需要初始化 鏈表的頭:使用 rt_list_init,這樣問題得到解決
移植的代碼之前使用的 hashlist,聲明時(shí)即初始化了,不需要顯示的初始化,而RT-Thread list,必須初始化,否則把鏈表節(jié)點(diǎn)插入 鏈表頭部的時(shí)候,就會出現(xiàn) 野指針或空指針 訪問成員的問題,肯定會出問題。
解決方法就是 增加鏈表初始化操作
問題回顧
由于先前移植的樣板驅(qū)動使用的是 hash list,造成移植后沒有初始化數(shù)據(jù)結(jié)構(gòu)的鏈表節(jié)點(diǎn),觸發(fā)了死機(jī)。所以驅(qū)動移植時(shí),遇到鏈表時(shí),一定要注意 鏈表頭與鏈表節(jié)點(diǎn)的 鏈表初始化問題
另一個(gè)注意點(diǎn):操作空指針的成員,異常信息里面,可能會提示 異常出在一個(gè) 較小的 內(nèi)存地址上。所以遇到死機(jī),并且發(fā)現(xiàn)死機(jī)的 內(nèi)存地址很小,可以往 空指針方向排查
RT-Thread 雙向循環(huán)鏈表的操作,由于使用的是【宏定義】,也就是鏈表操作函數(shù)本身沒有判空的操作,用戶需要有鏈表指針判空的操作。
訪問一個(gè)空指針的結(jié)構(gòu)體成員,肯定會觸發(fā)內(nèi)存異常死機(jī)。 如 buffer->list 中的 list 為 RT_NULL,那么訪問 buffer->list->next 時(shí)候,list 中的 next 成員地址就是非法的內(nèi)存地址(小地址),就會出現(xiàn)異常死機(jī)
小結(jié)
鏈表操作需要謹(jǐn)慎,不只是要把 鏈表頭 申請為 全局的,而且每個(gè)鏈表的節(jié)點(diǎn),都是需要全局的。
注意鏈表節(jié)點(diǎn)會嵌入到一個(gè)復(fù)雜的數(shù)據(jù)結(jié)構(gòu)里面,并且使用動態(tài)內(nèi)存申請的方式 創(chuàng)建,這是一定要注意不要漏下 鏈表成員的初始化。
-
驅(qū)動器
+關(guān)注
關(guān)注
52文章
8099瀏覽量
145817 -
Shell
+關(guān)注
關(guān)注
1文章
363瀏覽量
23259 -
RT-Thread
+關(guān)注
關(guān)注
31文章
1261瀏覽量
39839
發(fā)布評論請先 登錄
相關(guān)推薦
評論