容錯(cuò)控制的研究雖然面臨著空前的挑戰(zhàn),但近些年來(lái),相關(guān)研究領(lǐng)域,如魯棒控制理論,模糊控制,神經(jīng)網(wǎng)絡(luò)控制研究的不斷深入和發(fā)展,也給容錯(cuò)控制的研究帶來(lái)了良好的機(jī)遇,提供了充分的條件。
而計(jì)算機(jī)控制技術(shù)、人工智能等技術(shù)的飛速發(fā)展,使得容錯(cuò)控制技術(shù)在實(shí)際工程中應(yīng)用的可能性變得越來(lái)越大。
容錯(cuò)概念的由來(lái)
所謂容錯(cuò):就是容許錯(cuò)誤,是指設(shè)備的一個(gè)或多個(gè)關(guān)鍵部分發(fā)生故障時(shí),能夠自動(dòng)地進(jìn)行檢測(cè)與診斷,并采取相應(yīng)措施,保證設(shè)備維持其規(guī)定功能,或犧牲性能來(lái)保證設(shè)備在可接受范圍內(nèi)繼續(xù)工作。
錯(cuò)誤一般分為兩類:第一類是先天性的固有錯(cuò),如元器件生產(chǎn)過(guò)程中造成的錯(cuò)、線路與程序在設(shè)計(jì)過(guò)程中產(chǎn)生的錯(cuò)。這一類的錯(cuò)誤需對(duì)其拆除、更換或修正,是不能容忍的。第二類是后天性的錯(cuò),它是由于設(shè)備在運(yùn)行中產(chǎn)生了缺陷所導(dǎo)致的故障。這種故障有瞬時(shí)性、間歇性和永久性的區(qū)別。
容錯(cuò)技術(shù)是提高系統(tǒng)可靠性的重要途徑。常采用的容錯(cuò)方法有硬件容錯(cuò)、軟件容錯(cuò)、信息容錯(cuò)和時(shí)間容錯(cuò)。
提高系統(tǒng)的可靠性一般有兩種辦法:1、采用縝密的設(shè)計(jì)和質(zhì)量控制方法來(lái)盡量減少故障出現(xiàn)的概率。2、以冗余資源為代價(jià)來(lái)?yè)Q取可靠性。
利用前一種方法來(lái)提高系統(tǒng)的可靠性是有限的,要想進(jìn)一步的提高必須采用容錯(cuò)技術(shù)。
容錯(cuò)控制技術(shù)在國(guó)外發(fā)展的比較早,是計(jì)算機(jī)奠基人之一,美籍匈牙利數(shù)學(xué)家馮?諾依曼提出的。隨著八十年代微型計(jì)算機(jī)的迅速發(fā)展和廣泛應(yīng)用,容錯(cuò)技術(shù)也得到了飛速的發(fā)展,容錯(cuò)技術(shù)被應(yīng)用到各個(gè)環(huán)境中。
我國(guó)的容錯(cuò)技術(shù)現(xiàn)在發(fā)展的也很迅速,一些重要的工作場(chǎng)合如航天、電廠等現(xiàn)在都采用了容錯(cuò)技術(shù)。
1、 智能容錯(cuò)的定義
智能容錯(cuò)IFT(Intelligent Fault-Tolerance):就是設(shè)備在運(yùn)行過(guò)程中一個(gè)或多個(gè)關(guān)鍵部件發(fā)生故障或即將發(fā)生故障之前,利用人工智能理論和方法,通過(guò)采取有效措施,對(duì)故障自動(dòng)進(jìn)行補(bǔ)償、抑制、消除、修復(fù),以保證設(shè)備繼續(xù)安全、高效、可靠運(yùn)行,或以犧牲性能損失為代價(jià),保證設(shè)備在規(guī)定的時(shí)間內(nèi)完成其預(yù)定功能。
硬件智能容錯(cuò) HIFT (Hardware Intelligent Fault Tolerant) 主要采用硬件冗余技術(shù)。其基本思想是對(duì)設(shè)備的關(guān)鍵部件配備多重相似或相同部件,一旦檢測(cè)和診斷出設(shè)備發(fā)生故障就可以立刻切換到備份部件,以達(dá)到故障容錯(cuò)的目的。
二冗余結(jié)構(gòu)原理圖
2、硬件智能容錯(cuò)方式的分類
硬件智能容錯(cuò)按其工作方式可以分為:靜態(tài)冗余、動(dòng)態(tài)冗余和混合冗余。
靜態(tài)冗余容錯(cuò)是通過(guò)表決和比較屏蔽系統(tǒng)中出現(xiàn)的故障,如圖
三模冗余(靜態(tài)冗余)TMR系統(tǒng)結(jié)構(gòu)圖
靜態(tài)冗余容錯(cuò)的主要特點(diǎn)是:
(1)由于故障被屏蔽,所以不需要識(shí)別故障;
(2)容易與無(wú)冗余系統(tǒng)進(jìn)行轉(zhuǎn)換;
(3)所有模件都消耗能量。
動(dòng)態(tài)冗余的主要方式是多重模塊相繼運(yùn)行來(lái)維持設(shè)備正常工作。當(dāng)檢測(cè)到工作模塊出現(xiàn)故障時(shí),一個(gè)備用模塊立即接替故障模塊并投入工作。
動(dòng)態(tài)冗余容錯(cuò)控制的主要特點(diǎn)是:
(1)僅有一個(gè)模件消耗能量;
(2)模件數(shù)目可隨任務(wù)而改變,不會(huì)影響系統(tǒng)工作;
(3)轉(zhuǎn)換裝置和檢測(cè)裝置中任一故障都會(huì)導(dǎo)致系統(tǒng)失效。
動(dòng)態(tài)冗余容錯(cuò)控制結(jié)構(gòu)圖
混合冗余兼動(dòng)態(tài)冗余和靜態(tài)冗余之所長(zhǎng),通常用H(n,k)來(lái)表示,如下圖所示。圖中的V為表決器,n表示模塊的總數(shù),k代表以表決方式實(shí)現(xiàn)靜態(tài)冗余的模塊數(shù),而其余N-K個(gè)模塊則作為表決系統(tǒng)中模塊的備份。當(dāng)參與表決的k個(gè)模塊中(通常k>=3)有一個(gè)模塊出現(xiàn)故障時(shí),備份就替代該模塊參與表決,維持靜態(tài)冗余系統(tǒng)的完整。當(dāng)所有備份都被替換完后,系統(tǒng)就成為一般的表決系統(tǒng)。
如在硬件構(gòu)成的邏輯系統(tǒng)中表決器是由開關(guān)電路實(shí)現(xiàn)的,而軟件中表決需要通過(guò)軟件斷言SA(Software Assertions)來(lái)實(shí)現(xiàn)。軟件斷言就是當(dāng)軟件在宿主系統(tǒng)中運(yùn)行時(shí),對(duì)其進(jìn)程或功能的正確與否做出判斷的條件。
H(n,k)系統(tǒng)結(jié)構(gòu)
3、智能容錯(cuò)的實(shí)現(xiàn)方法
智能容錯(cuò)的實(shí)現(xiàn)方法分為:(1)故障信號(hào)檢測(cè);(2)故障特征識(shí)別;(3)故障狀態(tài)預(yù)測(cè);(4)故障維修決策;(5)故障容錯(cuò)控制。
故障容錯(cuò)的目的在于針對(duì)不同的故障源和故障特征,采取相應(yīng)的容錯(cuò)處理措施,對(duì)故障進(jìn)行補(bǔ)償、消除或自動(dòng)修復(fù),以保證設(shè)備繼續(xù)安全可靠運(yùn)行,或以犧牲性能損失為代價(jià),保證設(shè)備在規(guī)定時(shí)間內(nèi)完成其基本功能。
故障容錯(cuò)控制過(guò)程框圖
冗余技術(shù)
高可靠性是過(guò)程控制系統(tǒng)的第一要求。為了達(dá)到高可靠性和低失效率相統(tǒng)一的目的,我們通常會(huì)在控制系統(tǒng)的設(shè)計(jì)和應(yīng)用中采用冗余技術(shù)。合理的冗余設(shè)計(jì)將大大提高系統(tǒng)的可靠性,但是同時(shí)也增加了系統(tǒng)的復(fù)雜度和設(shè)計(jì)的難度,如何合理而有效的進(jìn)行控制系統(tǒng)冗余設(shè)計(jì),是值得研究的課題。
1、冗余技術(shù)概念
冗余技術(shù)就是增加多余的設(shè)備,以保證系統(tǒng)更加可靠、安全地工作。
冗余的分類方法多種多樣,按照在系統(tǒng)中所處的位置,冗余可分為元件級(jí)、部件級(jí)和系統(tǒng)級(jí);按照冗余的程度可分為1:1冗余、1:2冗余、1:n冗余等多種。
在當(dāng)前元器件可靠性不斷提高的情況下,和其它形式的冗余方式相比,1:1的部件級(jí)熱冗余是一種有效而又相對(duì)簡(jiǎn)單、配置靈活的冗余技術(shù)實(shí)現(xiàn)方式,如I/O卡件冗余、電源冗余、主控制器冗余等。
因此,目前國(guó)內(nèi)外主流的過(guò)程控制系統(tǒng)中大多采用了這種方式。當(dāng)然,在某些局部設(shè)計(jì)中也有采用元件級(jí)或多種冗余方式組合的成功范例。
2、控制系統(tǒng)冗余的關(guān)鍵技術(shù)
冗余是一種高級(jí)的可靠性設(shè)計(jì)技術(shù)。1:1熱冗余也就是所謂的雙重化,是其中一種有效的冗余方式,但它并不是兩個(gè)部件簡(jiǎn)單的并聯(lián)運(yùn)行,而是需要硬件、軟件、通訊等協(xié)同工作來(lái)實(shí)現(xiàn)。將互為冗余的兩個(gè)部件構(gòu)成一個(gè)有機(jī)的整體,通常包括以下多個(gè)技術(shù)要點(diǎn):
1)信息同步技術(shù)
它是工作、備用部件之間實(shí)現(xiàn)無(wú)擾動(dòng)(Bumpless)切換技術(shù)的前提,只有按控制實(shí)時(shí)性要求進(jìn)行高速有效的信息同步,保證工作、備用部件步調(diào)一致地工作,才能實(shí)現(xiàn)冗余部件之間的無(wú)擾動(dòng)切換。
在熱備用工作方式下,其中一塊處于工作狀態(tài)(工作卡),實(shí)現(xiàn)系統(tǒng)的數(shù)據(jù)采集、運(yùn)算、控制輸出、網(wǎng)絡(luò)通訊等功能;而另一塊處于備用狀態(tài)(備用卡),它實(shí)時(shí)跟蹤工作卡的內(nèi)部控制狀態(tài)(即狀態(tài)同步)。工作/備用卡件之間的正/負(fù)邏輯是互斥的,即一個(gè)為工作卡,另一個(gè)必定是備用卡;而且它們之間有冗余控制電路(又稱工作/備用控制電路)和信息通訊電路,以協(xié)調(diào)兩塊卡件同時(shí)而且有序地運(yùn)行,保證對(duì)外輸入輸出特性的同一性,即對(duì)于用戶使用而言,可以認(rèn)為只有一個(gè)部件。一般在設(shè)計(jì)中,工作、備用部件之間通過(guò)高速的冗余通訊通道(串行或并行)實(shí)現(xiàn)運(yùn)行狀態(tài)互檢和控制狀態(tài)的同步(如組態(tài)信息、輸出閥位、控制參數(shù)等)。
2)故障檢測(cè)技術(shù)
為了保證系統(tǒng)在出現(xiàn)故障時(shí)及時(shí)將冗余部分投入工作,必須有高精確的在線故障檢測(cè)技術(shù),實(shí)現(xiàn)故障發(fā)現(xiàn)、故障定位、故障隔離和故障報(bào)警。故障檢測(cè)包括電源、微處理器、數(shù)據(jù)通訊鏈路、數(shù)據(jù)總線及I/O狀態(tài)等。其中故障診斷包括故障自診斷和故障互檢(工作、備用卡件之間的相互檢查)
3)故障仲裁技術(shù)和切換技術(shù)
精確及時(shí)地發(fā)現(xiàn)故障后,還需要及時(shí)確定故障的部位、分析故障的嚴(yán)重性,依賴前文提到的冗余控制電路,對(duì)工作、備用故障狀態(tài)進(jìn)行分析、比較和仲裁,以判定是否需要進(jìn)行工作/備用之間的狀態(tài)切換。控制權(quán)切換到冗余備用部件還必須保證快速、安全、無(wú)擾動(dòng)。當(dāng)處于工作狀態(tài)的部件出現(xiàn)故障(斷電、復(fù)位、軟件故障、硬件故障等)或者工作部件的故障較備用部件嚴(yán)重時(shí),備用部件必須快速地?zé)o擾動(dòng)地接替工作部件的所有控制任務(wù),對(duì)現(xiàn)場(chǎng)控制不造成任何影響。同時(shí)要求切換時(shí)間應(yīng)為毫秒級(jí),甚至是微秒級(jí),這樣就不會(huì)因?yàn)樵摬考墓收隙斐赏獠靠刂茖?duì)象的失控或檢測(cè)信息失效等等。另外,還需要盡快通過(guò)網(wǎng)絡(luò)通訊或就地LED顯示進(jìn)行報(bào)警,通知用戶出現(xiàn)故障的部件和故障情況,以便進(jìn)行及時(shí)維護(hù)。
4)熱插拔技術(shù)
為了保證容錯(cuò)系統(tǒng)具有高可靠性,必須盡量減少系統(tǒng)的平均修復(fù)時(shí)間MTBR。要做到這一點(diǎn),在設(shè)計(jì)上應(yīng)努力提高單元的獨(dú)立性、可修復(fù)性、故障可維護(hù)性。實(shí)現(xiàn)故障部件的在線維護(hù)和更換也是冗余技術(shù)的重要組成部分,它是實(shí)現(xiàn)控制系統(tǒng)故障部件快速修復(fù)技術(shù)的關(guān)鍵。部件的熱插拔功能可以在不中斷系統(tǒng)正常控制功能的情況下增加或更換組件,使系統(tǒng)平穩(wěn)地運(yùn)行。
5)故障隔離技術(shù)
冗余設(shè)計(jì)時(shí),必須考慮工作、備用部件之間的故障應(yīng)該做到盡可能互不影響或影響的概率相當(dāng)?。?.01%),即可認(rèn)為故障是隔離的。這樣可以保證:處于備用狀態(tài)的部件發(fā)生故障時(shí),不會(huì)影響冗余工作部件或其他關(guān)聯(lián)部件的正常運(yùn)行,保證冗余的有效性。
隨著工業(yè)自動(dòng)化的飛速發(fā)展,工業(yè)部門對(duì)生產(chǎn)設(shè)備及控制系統(tǒng)的可靠性也提出了越來(lái)越高的要求。冗余技術(shù)提高了控制系統(tǒng)可靠性,滿足了特殊工業(yè)部門的應(yīng)用需求。
審核編輯:湯梓紅
-
控制系統(tǒng)
+關(guān)注
關(guān)注
41文章
6509瀏覽量
110381 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7360瀏覽量
87632 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237073 -
冗余技術(shù)
+關(guān)注
關(guān)注
0文章
15瀏覽量
11098
原文標(biāo)題:容錯(cuò)控制的冗余技術(shù)
文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論