1.引言
嵌入式微處理器應(yīng)用系統(tǒng)是一種面向應(yīng)用、功能定制、資源受限、響應(yīng)要求高、性能穩(wěn)定、無自舉開發(fā)能力,由硬件和軟件兩部分構(gòu)成的專用計(jì)算機(jī)系統(tǒng),其在日常生活中、工業(yè)生產(chǎn)中、國防領(lǐng)域中都得到了廣泛的應(yīng)用。但是嵌入式微處理器系統(tǒng)往往工作環(huán)境比較復(fù)雜,一般情況下都存在自然因素或人為因素產(chǎn)生的電磁干擾,各種干擾通過一定的途徑進(jìn)入系統(tǒng)或測量通道,對系統(tǒng)產(chǎn)生一定的干擾,而且隨著系統(tǒng)軟件規(guī)模的增加,系統(tǒng)運(yùn)行不穩(wěn)定的現(xiàn)象愈來愈嚴(yán)重,因此,可靠性已成為衡量嵌入式微處理器系統(tǒng)性能優(yōu)劣的一個(gè)重要因素。
在某系統(tǒng)工程設(shè)計(jì)中,由于需要測量和監(jiān)控的數(shù)據(jù)點(diǎn)數(shù)量眾多,對此,我們大量采用了微處理器分機(jī)監(jiān)控電路進(jìn)行數(shù)據(jù)的采集和數(shù)據(jù)通信。本文主要對如何提高系統(tǒng)的可靠性進(jìn)行了分析論證,并在此基礎(chǔ)上闡述了提高各分機(jī)工作穩(wěn)定性所采取的具體措施。
2.系統(tǒng)組成與工作要求
系統(tǒng)的監(jiān)測點(diǎn)分散在直徑約一千米的近似圓形范圍內(nèi),呈放射狀。監(jiān)測點(diǎn)總共劃分為16組,每組378個(gè)子節(jié)點(diǎn),總數(shù)量有六千多個(gè),主站監(jiān)控通過通信網(wǎng)絡(luò)對所有子節(jié)點(diǎn)進(jìn)行統(tǒng)一管理,系統(tǒng)結(jié)構(gòu)見圖1.
每個(gè)子節(jié)點(diǎn)需要進(jìn)行7路模擬電壓的采集計(jì)算、1路模擬電壓控制輸出、3路開關(guān)量的控制。主站監(jiān)控每3秒完成一次對所有子節(jié)點(diǎn)的巡檢,收集所有的測量數(shù)據(jù)和發(fā)送控制參量。
由于監(jiān)測點(diǎn)存在強(qiáng)微波能量輻射,并且工作區(qū)域位于我國西北地區(qū),晝夜環(huán)境溫差較大。同時(shí),系統(tǒng)要求除去每月一天的停機(jī)維護(hù)外,其余時(shí)間均正常加電工作,子節(jié)點(diǎn)監(jiān)控電路允許有3%的失效率。
這些外在的環(huán)境因素和工作時(shí)長對系統(tǒng)的工作穩(wěn)定性提出了非常嚴(yán)格的要求,這也使得系統(tǒng)的關(guān)鍵部分-微處理器電路的可靠性面臨著極為嚴(yán)峻的考驗(yàn)。因此,在系統(tǒng)的初期研制開發(fā)的過程中,必須重視可靠性分析和設(shè)計(jì),否則整個(gè)系統(tǒng)將無法正常工作,不能實(shí)現(xiàn)目標(biāo)設(shè)計(jì)功能。
3.系統(tǒng)可靠性分析與設(shè)計(jì)
從功能上劃分來看,系統(tǒng)由子節(jié)點(diǎn)分機(jī)監(jiān)控電路、通信網(wǎng)絡(luò)、電源供給網(wǎng)絡(luò)、主站監(jiān)控四部分組成,從對系統(tǒng)任務(wù)功能的影響來看,它們均與系統(tǒng)功能直接相關(guān)。它們的任一部分失效,就會導(dǎo)致整個(gè)系統(tǒng)失效,因此稱它們?yōu)橄到y(tǒng)的主要分機(jī)。針對系統(tǒng)工作的地理位置、外在電磁環(huán)境特點(diǎn)、目前現(xiàn)有商業(yè)技術(shù)的成熟度,以及系統(tǒng)的總體性能要求,系統(tǒng)的可靠性模型建立為串聯(lián)模型,可靠性指標(biāo)的分配采用綜合因子評定法確定加權(quán)因子,為使系統(tǒng)分配的可靠性指標(biāo)合理可行,我們主要考慮了各分機(jī)系統(tǒng)的重要因子、復(fù)雜因子、維修因子、技術(shù)成熟因子、環(huán)境因子、元器件質(zhì)量因子、軟件應(yīng)用程度因子等因素。根據(jù)這七個(gè)主要影響可靠性的因素,利用可靠性分析軟件IETM反復(fù)進(jìn)行MTBF參數(shù)的計(jì)算與分配,最終獲得了一個(gè)最佳平衡點(diǎn)數(shù)據(jù)。
系統(tǒng)的靠性設(shè)計(jì)遵循以下設(shè)計(jì)準(zhǔn)則:
a.簡化設(shè)計(jì):盡量簡化系統(tǒng)配置,減少硬件和軟件的數(shù)量和規(guī)模。
b.繼承性和優(yōu)化設(shè)計(jì):最大限度并合理地采用已經(jīng)驗(yàn)證或成熟的硬件、軟件技術(shù);支持對提高產(chǎn)品可靠性有利的技術(shù)進(jìn)步,但新技術(shù)必須經(jīng)過驗(yàn)證。
c.元器件選用:選用滿足工程質(zhì)量等級的元器件,努力減少器件型號、規(guī)格和生產(chǎn)廠,進(jìn)行老煉篩選。
d.冗余和容錯(cuò)設(shè)計(jì):采用充分、合理的硬件和軟件的冗余和容錯(cuò)設(shè)計(jì);盡力消除單點(diǎn)故障;對技術(shù)上確難消除的單點(diǎn)故障必須通過設(shè)計(jì)降低其失效率,使之達(dá)到可接受的程度。
e.耐環(huán)境設(shè)計(jì):實(shí)施硬件的環(huán)境影響分析和環(huán)境防護(hù)設(shè)計(jì)。
f.余量和降額設(shè)計(jì):按標(biāo)準(zhǔn)和規(guī)范的要求開展非電子產(chǎn)品的安全裕度設(shè)計(jì),元器件降額使用,電路容差的分析和設(shè)計(jì)。
g.采用有效的設(shè)計(jì)技術(shù)和方法,提高軟件程序的健壯性,選擇易于編寫、校正和修改的程序結(jié)構(gòu),采用模塊化程序設(shè)計(jì)方法。
4.系統(tǒng)的硬件/軟件抗干擾設(shè)計(jì)
作為系統(tǒng)的關(guān)鍵主體部分-微處理器電路,其抗干擾設(shè)計(jì)是一項(xiàng)綜合性設(shè)計(jì),采取硬件措施雖然可有效提高監(jiān)控控制系統(tǒng)的抗干擾能力,但過多的硬件本身就降低了系統(tǒng)的可靠性,尤其是有源器件。因而電路的設(shè)計(jì)要“軟”、“硬”兼施,提高系統(tǒng)的防護(hù)和容錯(cuò)能力,從而提高分機(jī)監(jiān)控系統(tǒng)的可靠性。
4.1 硬件方面
按照設(shè)計(jì)要求和目的,主要從以下幾個(gè)方面來提高系統(tǒng)硬件的可靠性。
1)元器件的選用上:一是根據(jù)整機(jī)的具體布局、及整機(jī)在最高溫度下元器件工作的正常性,來考慮選用合適的元器件。
二是系統(tǒng)一定要采用質(zhì)量高、性能穩(wěn)定、應(yīng)用成熟的元器件。三是結(jié)合系統(tǒng)的使用年限、所處位置、頻率范圍、所處的干擾脈沖強(qiáng)弱等因素等,選擇在性能、可靠性較高,具有特殊要求的元器件。四是在選擇CPU和外圍器件尤其是速度較慢的外設(shè)芯片時(shí),要考慮兩者的速度匹配問題及元器件的品級(如民用級、工業(yè)級還是軍品級),在軟件編程時(shí)應(yīng)特別注意速度匹配問題。
2)印制板設(shè)計(jì)上:從減小輻射干擾的角度出發(fā),選用多層板。內(nèi)層分別做電源層、接地層。對信號形成均勻的接地面,加大信號線和接地面間的分布電容,抑制其向空間輻射的內(nèi)力,供電層和地層最好緊鄰,以增大電源與地之間的分布電容。電源線、地線、印制板走線對高頻信號應(yīng)保持低阻抗。
3 )設(shè)計(jì)良好的接地系統(tǒng)。接地不良時(shí),將形成明顯的干擾。防止地線干擾主要三種形式:一是堅(jiān)持一點(diǎn)接和多點(diǎn)接地的應(yīng)用原則。在低頻電路中,電線和元器件之間的電感干擾并不多,多采用一點(diǎn)接地;在高頻電路中,布線和元器間的電感干擾以及分布電容會造成各地線之間的偶合,應(yīng)采用多點(diǎn)接地。二是采用數(shù)字地與模擬地的連接原則。芯片數(shù)字邏輯接地端和模擬信號的接地端應(yīng)分別接地,在一個(gè)芯片上有兩種不同的接地端也應(yīng)分別接地,然后匯總。
4)電源的抗干擾措施。電源在向系統(tǒng)供電時(shí),也將其噪聲耦合到系統(tǒng)電源上。
為了抑制電網(wǎng)電壓的波動,可在交流電源輸入端加上電源濾波器,讓電源頻率附近的頻率成分通過而使高于此頻率的成分很大衰減,防止由于干擾所產(chǎn)生的電容效應(yīng)進(jìn)入到系統(tǒng)內(nèi)部。二是系統(tǒng)內(nèi)部通常需要不同的幾種直流電源,為減少公共阻抗的相互偶合和單個(gè)電路故障的有效保護(hù),應(yīng)采用高質(zhì)量的集成穩(wěn)壓電路進(jìn)行單獨(dú)供電。此外,還應(yīng)當(dāng)采用直流開關(guān)電流,保證獨(dú)立電壓輸出,對直流電流起著較好的初、次級隔離作用。
4.2 軟件方面
1)開機(jī)自檢技術(shù)
系統(tǒng)在加電在開啟后,首先應(yīng)對系統(tǒng)內(nèi)部的軟件逐一的進(jìn)行狀態(tài)檢測,如內(nèi)部RAM,SFR及EPROM,I/O芯片等進(jìn)行故障檢查和診斷,并能給出故障部位,當(dāng)各項(xiàng)檢查正常后,程序才可以繼續(xù)執(zhí)行。設(shè)置自檢程序是提高測控系統(tǒng)可靠性的有效方法之一。
2)指令冗余技術(shù)
當(dāng)系統(tǒng)受到干擾出現(xiàn)錯(cuò)誤時(shí),程序會在地址空間內(nèi)出錯(cuò),破壞程序計(jì)數(shù)器PC的狀態(tài)。程序若“跑飛”到三字節(jié)指令,出錯(cuò)率將會更大。所以,應(yīng)采用指令冗余技術(shù),即在系統(tǒng)內(nèi)的關(guān)鍵地方人為插入一些單字節(jié)的空操作指令,通常是在雙字節(jié)指令和三字節(jié)指令后插入兩個(gè)字節(jié)上的NOP空指令。插入后,即使“亂飛”程序飛到操作數(shù)上,由于空操作指令NOP的存在,也根本地避免了后面的指令被當(dāng)作操作數(shù)執(zhí)行,程序?qū)詣拥丶{入到正軌上來。
此外,對程序流向起重要作用的指令如RET,RETI,LCALL,LJMP,JC等,在其之前插入兩條NOP指令也可將出錯(cuò)程序納入正軌。
3)軟件陷阱技術(shù)
如果“跑飛”程序進(jìn)入到非程序區(qū),那么,上文所述的指令冗余技術(shù)便起不到任何作用,此時(shí),可通過設(shè)置軟件陷阱來攔截“跑飛”程序并將其引向指定位置,再進(jìn)行處理。軟件陷阱通常裝在下面四種地方:一是未使用的中斷向量區(qū);二是未使用的大片ROM區(qū);三是表格,為了不破壞其連續(xù)性,一般把軟件陷阱安排在表格的最后;四是程序區(qū),軟件陷阱一般安排在程序的斷點(diǎn)處,如LJMP,RET等。
4)軟件“看門狗”技術(shù)
如果失控的程序進(jìn)行死循環(huán),通常使用“看門狗”技術(shù)使其脫離死循環(huán)。系統(tǒng)通過不間接地檢測程序循環(huán)運(yùn)行時(shí)間,若發(fā)現(xiàn)程序循環(huán)運(yùn)行超過最大的循環(huán)運(yùn)行時(shí)間,則會認(rèn)定系統(tǒng)陷入“死循環(huán)”.“看門狗”技術(shù)可使程序返回到程序的入口地址,使系統(tǒng)重新納入到正常運(yùn)行軌道,它可由軟件實(shí)現(xiàn),也可由硬件實(shí)現(xiàn)。任務(wù)切分的時(shí)候應(yīng)充分考慮到任務(wù)的執(zhí)行最大時(shí)間應(yīng)該小于看門狗結(jié)束時(shí)間。
5)采用μC/OS-II嵌入式操作系統(tǒng)
μC/OS-II自1992年發(fā)布以來,已經(jīng)被移植到幾乎所有嵌入式應(yīng)用類CPU上,該操作系統(tǒng)是經(jīng)過很多實(shí)際應(yīng)用驗(yàn)證并改進(jìn)的,其內(nèi)核穩(wěn)定可靠,因此,只要分機(jī)處理器硬件不出現(xiàn)故障,則操作系統(tǒng)程序就可以保證正常運(yùn)行,其它子任務(wù)程序在操作系統(tǒng)的統(tǒng)一調(diào)度下,也可以實(shí)現(xiàn)穩(wěn)定的運(yùn)行。因此相比沒有操作系統(tǒng)的單循環(huán)式的前后臺程序,采用了嵌入式操作系統(tǒng)的分機(jī)監(jiān)控,其軟件程序的穩(wěn)定性有著質(zhì)的改變。
5.系統(tǒng)通信方式與構(gòu)成
通信網(wǎng)絡(luò)負(fù)責(zé)子節(jié)點(diǎn)與主站監(jiān)控之間的數(shù)據(jù)交互,如果通信網(wǎng)絡(luò)不能正常的工作,即使分機(jī)監(jiān)控可靠性再高,系統(tǒng)也無法實(shí)現(xiàn)既定功能。面對數(shù)量眾多的測量節(jié)點(diǎn),如果采用常規(guī)的點(diǎn)對點(diǎn)式通信進(jìn)行數(shù)據(jù)傳輸,將導(dǎo)致大量的硬件接口在主站監(jiān)控點(diǎn)集中匯總,其規(guī)模是非常龐大且復(fù)雜的,這將大大降低系統(tǒng)工作可靠性,也增加了后續(xù)維護(hù)工作的難度。針對分機(jī)監(jiān)控系統(tǒng)特點(diǎn),這里采用現(xiàn)場總線(CAN)通信網(wǎng)絡(luò)。其特點(diǎn)是可以在一對傳輸線上掛接多個(gè)通信節(jié)點(diǎn),可大大減少硬件接口的數(shù)量,降低通信網(wǎng)絡(luò)的硬件結(jié)構(gòu)復(fù)雜程度是本系統(tǒng)的最佳應(yīng)用方案,見圖2.
主站與各節(jié)點(diǎn)之間通過31個(gè)以太網(wǎng)-CAN轉(zhuǎn)換模塊進(jìn)行數(shù)據(jù)通信,每個(gè)模塊有2組CAN總線,可掛接200個(gè)分機(jī)監(jiān)控子節(jié)點(diǎn)。為了保證傳輸數(shù)據(jù)不會被干擾,信號傳輸介質(zhì)全部采用光纖,子節(jié)點(diǎn)以及以太網(wǎng)-CAN轉(zhuǎn)換模塊首先通過電光轉(zhuǎn)換器件把電信號轉(zhuǎn)為光信號,再通過光纜進(jìn)行長距離傳輸。由于光纖采用非金屬介質(zhì)材料,它不會與其它信號產(chǎn)生感應(yīng)耦合,使光纖對外部電磁干擾有完全的免疫力,可實(shí)現(xiàn)高可靠性通信。同時(shí),因?yàn)楣庑盘柋煌晟频叵拗圃诠饫w結(jié)構(gòu)中,任何泄漏的輻射都被外包材料所吸收,故能提供高度的數(shù)據(jù)保密性。
6.結(jié)束語
綜上所述,微處理器應(yīng)用系統(tǒng)的可靠性在很大程度上都取系統(tǒng)內(nèi)的抗干擾技術(shù)應(yīng)用。其可靠性設(shè)計(jì)是一個(gè)綜合性、經(jīng)驗(yàn)性較強(qiáng)的問題,是應(yīng)用系統(tǒng)能否成功應(yīng)用的關(guān)鍵。嚴(yán)格意義上來說,系統(tǒng)的硬件抗干擾是主動的,而軟件抗干擾只是一個(gè)補(bǔ)充。可見,只有結(jié)合微處理器系統(tǒng)實(shí)際特點(diǎn),分析干擾源,采用硬件與軟件相結(jié)合的方法,不斷地完善系統(tǒng)監(jiān)控程序,才能夠在保證微處理器的有效性、控制精度、控制功能的基礎(chǔ)上,大力提高系統(tǒng)的抗干擾性能,確保應(yīng)用系統(tǒng)的可靠運(yùn)行。
-
嵌入式
+關(guān)注
關(guān)注
5060文章
18980瀏覽量
302254 -
監(jiān)控
+關(guān)注
關(guān)注
6文章
2162瀏覽量
55050 -
微處理器
+關(guān)注
關(guān)注
11文章
2246瀏覽量
82274
發(fā)布評論請先 登錄
相關(guān)推薦
評論