資料介紹
本文針對快速、多變量、強非線性的復雜系統(tǒng)的控制問題,在強化學習方式的基礎上,提出一種新的自適應控制方法。該方法在沒有先驗知識的條件下,基于遞歸神經網(wǎng)絡并結合強化學習的自調節(jié)能力,通過自身神經網(wǎng)絡的在線學習,有效控制不穩(wěn)定的非線性系統(tǒng)。本文以一級倒立擺系統(tǒng)為實驗對象,仿真實驗結果表明:所提出的控制方法具有非常好的控制效果和穩(wěn)定精度,抗干擾能力強。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學習方式融入控制
策略,用來解決復雜非線性系統(tǒng)的控制問題。強化學習(Reinforcement Learning)是一種試探學習方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學習如何執(zhí)行恰當?shù)膭幼?。近年來,強化學習在算法和應用上已取得了大量的研究成果,如用靜態(tài)神經網(wǎng)絡控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經網(wǎng)絡(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網(wǎng)
絡,是真正的動態(tài)網(wǎng)絡系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領域。本文在強化學習方式的基礎上,提出一種基于遞歸神經網(wǎng)絡的自適應控制方法。該控制方法采用的強化學習學習方式基于“動作網(wǎng)絡/評價網(wǎng)絡”的框架結構。其中,動作網(wǎng)絡部分由BP 神經網(wǎng)絡構成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網(wǎng)絡部由遞歸神經網(wǎng)絡構成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當前的控制效果,產生“獎勵/懲罰”值作為反饋,以進行自適應學習。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學習方式融入控制
策略,用來解決復雜非線性系統(tǒng)的控制問題。強化學習(Reinforcement Learning)是一種試探學習方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學習如何執(zhí)行恰當?shù)膭幼?。近年來,強化學習在算法和應用上已取得了大量的研究成果,如用靜態(tài)神經網(wǎng)絡控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經網(wǎng)絡(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網(wǎng)
絡,是真正的動態(tài)網(wǎng)絡系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領域。本文在強化學習方式的基礎上,提出一種基于遞歸神經網(wǎng)絡的自適應控制方法。該控制方法采用的強化學習學習方式基于“動作網(wǎng)絡/評價網(wǎng)絡”的框架結構。其中,動作網(wǎng)絡部分由BP 神經網(wǎng)絡構成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網(wǎng)絡部由遞歸神經網(wǎng)絡構成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當前的控制效果,產生“獎勵/懲罰”值作為反饋,以進行自適應學習。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 神經網(wǎng)絡自適應控制及其發(fā)展應用 11次下載
- 基于不同神經網(wǎng)絡的文本分類方法研究對比 49次下載
- 基于自適應神經網(wǎng)絡的PID控制移相方法 11次下載
- 一種改進的深度神經網(wǎng)絡結構搜索方法 3次下載
- 一種新型的自適應神經網(wǎng)絡遙感場景分類模型 5次下載
- 基于擴展反向傳播神經網(wǎng)絡的自適應控制方法 0次下載
- 基于自適應果蠅算法的神經網(wǎng)絡結構訓練 0次下載
- 基于神經網(wǎng)絡自適應諧波電流抑制方法 14次下載
- 加工過程的神經網(wǎng)絡模型參考自適應控制
- 一種基于自適應模糊神經網(wǎng)絡的VSLMS算法及應用
- 半主動懸架神經網(wǎng)絡自適應控制研究
- 基于神經網(wǎng)絡的拉絲機恒張力自適應控制
- 基于神經網(wǎng)絡PID控制的交流伺服系統(tǒng)
- 一種基于PID神經網(wǎng)絡的解耦控制方法的研究
- 自適應模糊神經網(wǎng)絡研究
- 遞歸神經網(wǎng)絡和循環(huán)神經網(wǎng)絡的模型結構 701次閱讀
- 遞歸神經網(wǎng)絡的實現(xiàn)方法 357次閱讀
- 神經網(wǎng)絡預測模型的構建方法 744次閱讀
- 人工神經網(wǎng)絡的工作原理和基本特征 1723次閱讀
- 電機控制系統(tǒng)的神經網(wǎng)絡優(yōu)化策略 724次閱讀
- 基于單個自適應神經元的非模型直接控制方法在汽車懸架系統(tǒng)中的應用 2020次閱讀
- 基于神經網(wǎng)絡模型參考自適應實現(xiàn)混合動力汽車電子差速控制系統(tǒng)的設計 3739次閱讀
- 一種新型神經網(wǎng)絡結構:膠囊網(wǎng)絡 5904次閱讀
- 一種基于FPGA的神經網(wǎng)絡硬件實現(xiàn)方案詳解 1.3w次閱讀
- 一種遞歸神經網(wǎng)絡在FPGA平臺上的實現(xiàn)方案詳解 2210次閱讀
- BP神經網(wǎng)絡概述 4.4w次閱讀
- 什么是神經網(wǎng)絡?學習人工智能必會的八大神經網(wǎng)絡盤點 2.5w次閱讀
- 自適應模糊神經網(wǎng)絡的交通燈控制系統(tǒng)的設計 3174次閱讀
- 基于FPGA的神經網(wǎng)絡算法的設計 5650次閱讀
- 一種基于模糊神經網(wǎng)絡的機器人控制技術 1943次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論