資料介紹
本文針對快速、多變量、強非線性的復(fù)雜系統(tǒng)的控制問題,在強化學(xué)習(xí)方式的基礎(chǔ)上,提出一種新的自適應(yīng)控制方法。該方法在沒有先驗知識的條件下,基于遞歸神經(jīng)網(wǎng)絡(luò)并結(jié)合強化學(xué)習(xí)的自調(diào)節(jié)能力,通過自身神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí),有效控制不穩(wěn)定的非線性系統(tǒng)。本文以一級倒立擺系統(tǒng)為實驗對象,仿真實驗結(jié)果表明:所提出的控制方法具有非常好的控制效果和穩(wěn)定精度,抗干擾能力強。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學(xué)習(xí)方式融入控制
策略,用來解決復(fù)雜非線性系統(tǒng)的控制問題。強化學(xué)習(xí)(Reinforcement Learning)是一種試探學(xué)習(xí)方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學(xué)習(xí)如何執(zhí)行恰當(dāng)?shù)膭幼?。近年來,強化學(xué)習(xí)在算法和應(yīng)用上已取得了大量的研究成果,如用靜態(tài)神經(jīng)網(wǎng)絡(luò)控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網(wǎng)
絡(luò),是真正的動態(tài)網(wǎng)絡(luò)系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領(lǐng)域。本文在強化學(xué)習(xí)方式的基礎(chǔ)上,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。該控制方法采用的強化學(xué)習(xí)學(xué)習(xí)方式基于“動作網(wǎng)絡(luò)/評價網(wǎng)絡(luò)”的框架結(jié)構(gòu)。其中,動作網(wǎng)絡(luò)部分由BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網(wǎng)絡(luò)部由遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當(dāng)前的控制效果,產(chǎn)生“獎勵/懲罰”值作為反饋,以進行自適應(yīng)學(xué)習(xí)。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學(xué)習(xí)方式融入控制
策略,用來解決復(fù)雜非線性系統(tǒng)的控制問題。強化學(xué)習(xí)(Reinforcement Learning)是一種試探學(xué)習(xí)方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學(xué)習(xí)如何執(zhí)行恰當(dāng)?shù)膭幼?。近年來,強化學(xué)習(xí)在算法和應(yīng)用上已取得了大量的研究成果,如用靜態(tài)神經(jīng)網(wǎng)絡(luò)控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網(wǎng)
絡(luò),是真正的動態(tài)網(wǎng)絡(luò)系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領(lǐng)域。本文在強化學(xué)習(xí)方式的基礎(chǔ)上,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。該控制方法采用的強化學(xué)習(xí)學(xué)習(xí)方式基于“動作網(wǎng)絡(luò)/評價網(wǎng)絡(luò)”的框架結(jié)構(gòu)。其中,動作網(wǎng)絡(luò)部分由BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網(wǎng)絡(luò)部由遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當(dāng)前的控制效果,產(chǎn)生“獎勵/懲罰”值作為反饋,以進行自適應(yīng)學(xué)習(xí)。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制及其發(fā)展應(yīng)用 11次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類方法研究對比 48次下載
- 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的PID控制移相方法 11次下載
- 一種改進的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索方法 3次下載
- 一種新型的自適應(yīng)神經(jīng)網(wǎng)絡(luò)遙感場景分類模型 5次下載
- 基于擴展反向傳播神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法 0次下載
- 基于自適應(yīng)果蠅算法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練 0次下載
- 基于神經(jīng)網(wǎng)絡(luò)自適應(yīng)諧波電流抑制方法 14次下載
- 加工過程的神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制
- 一種基于自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的VSLMS算法及應(yīng)用
- 半主動懸架神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制研究
- 基于神經(jīng)網(wǎng)絡(luò)的拉絲機恒張力自適應(yīng)控制
- 基于神經(jīng)網(wǎng)絡(luò)PID控制的交流伺服系統(tǒng)
- 一種基于PID神經(jīng)網(wǎng)絡(luò)的解耦控制方法的研究
- 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)研究
- 遞歸神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu) 295次閱讀
- 遞歸神經(jīng)網(wǎng)絡(luò)的實現(xiàn)方法 186次閱讀
- 神經(jīng)網(wǎng)絡(luò)預(yù)測模型的構(gòu)建方法 375次閱讀
- 人工神經(jīng)網(wǎng)絡(luò)的工作原理和基本特征 314次閱讀
- 電機控制系統(tǒng)的神經(jīng)網(wǎng)絡(luò)優(yōu)化策略 380次閱讀
- 基于單個自適應(yīng)神經(jīng)元的非模型直接控制方法在汽車懸架系統(tǒng)中的應(yīng)用 1845次閱讀
- 基于神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)實現(xiàn)混合動力汽車電子差速控制系統(tǒng)的設(shè)計 3527次閱讀
- 一種新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):膠囊網(wǎng)絡(luò) 5679次閱讀
- 一種基于FPGA的神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)方案詳解 1.3w次閱讀
- 一種遞歸神經(jīng)網(wǎng)絡(luò)在FPGA平臺上的實現(xiàn)方案詳解 2119次閱讀
- BP神經(jīng)網(wǎng)絡(luò)概述 4.4w次閱讀
- 什么是神經(jīng)網(wǎng)絡(luò)?學(xué)習(xí)人工智能必會的八大神經(jīng)網(wǎng)絡(luò)盤點 2.5w次閱讀
- 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的交通燈控制系統(tǒng)的設(shè)計 2984次閱讀
- 基于FPGA的神經(jīng)網(wǎng)絡(luò)算法的設(shè)計 5524次閱讀
- 一種基于模糊神經(jīng)網(wǎng)絡(luò)的機器人控制技術(shù) 1863次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關(guān)電源設(shè)計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風(fēng)扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關(guān)電源設(shè)計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多