Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Điều khiển tối ưu thích ứng phân tán cho các hệ thống phi tuyến với kết nối tương thích
Tóm tắt
Trong bài báo này, chúng tôi điều tra về việc ổn định phản hồi phân tán và tối ưu hóa dựa trên lập trình động thích ứng (ADP) cho các hệ thống phi tuyến với các kết nối tương thích. Đạo luật điều khiển phân tán của hệ thống tổng thể được thiết kế bằng cách tích hợp tất cả các bộ điều khiển của các hệ thống con tách biệt, và nó thỏa mãn tính tối ưu dựa trên các luật điều khiển tối ưu của tất cả các hệ thống con. Để giải quyết các vấn đề điều khiển tối ưu của các hệ thống con tách biệt này, thuật toán lặp chính sách được sử dụng để xấp xỉ giải các phương trình Hamilton–Jacobi–Bellman trong khuôn khổ ADP với việc thực hiện mạng nơ-ron, trong đó một tập hợp các mạng nơ-ron phê bình được cấu trúc để ước lượng các hàm chi phí tối ưu, và các luật điều khiển tối ưu xấp xỉ có thể được thu được sau quá trình học của các mạng nơ-ron phê bình. Các lỗi ước lượng trọng số của các mạng phê bình và tính ổn định của tất cả các hệ thống con tách biệt được chứng minh dựa trên lý thuyết Lyapunov. Cuối cùng, hiệu suất của chiến lược điều khiển tối ưu phân tán được đề xuất được xác minh bằng các kết quả mô phỏng.
Từ khóa
#điều khiển phân tán #ổn định phản hồi #lập trình động thích ứng #hệ thống phi tuyến #kết nối tương thíchTài liệu tham khảo
Abu-Khalaf M, Lewis FL (2005) Nearly optimal control laws for nonlinear systems with saturating actuators using a neural network HJB approach. Automatica 41:779–791
Bakule L (2008) Decentralized control: an overview. Ann Rev Control 32:87–98
Beard RW, Saridis GN, Wen JT (1997) Galerkin approximations of the generalized Hamilton-Jacobi-Bellman equation. Automatica 33:2159–2177
Gu B, Sheng VS, Tay KY, Romano W, Li S (2015a) Incremental support vector learning for ordinal regression. IEEE Trans Neural Netw Learn Syst 26:1403–1416
Gu B, Sheng VS, Wang Z, Ho D, Osman S, Li S (2015b) Incremental learning for \(\nu \)-support vector regression. Neural Netw 67:140–150
Hou ZG, Gupta MM, Nikiforuk PN, Tan M, Cheng L (2007) A recurrent neural network for hierarchical control of interconnected dynamic systems. IEEE Trans Neural Netw 18:466–481
Jiang Y, Jiang ZP (2015) Global adaptive dynamic programming for continuous-time nonlinear systems. IEEE Trans Autom Control 60:2917–2929
Lewis FL, Vrabie D, Vamvoudakis KG (2012) Reinforcement learning and feedback control: using natural decision methods to design optimal adaptive controllers. IEEE Control Syst Mag 32:76–105
Liu D, Li H, Wang D (2013) Data-based self-learning optimal control: research progress and prospects. Acta Autom Sin 39:1858–1870
Liu D, Wang D, Li H (2014) Decentralized stabilization for a class of continuous-time nonlinear interconnected systems using online learning optimal control approach. IEEE Trans Neural Netw Learn Syst 25:418–428
Luo B, Wu HN, Huang T, Liu D (2014) Data-based approximate policy iteration for affine nonlinear continuous-time optimal control design. Automatica 50:3281–3290
Mehraeen S, Jagannathan S (2011) Decentralized optimal control of a class of interconnected nonlinear discrete-time systems by using online Hamilton-Jacobi-Bellman formulation. IEEE Trans Neural Netw 22:1757–1769
Modares H, Lewis FL, Naghibi-Sistani MB (2013) Adaptive optimal control of unknown constrained-input systems using policy iteration and neural networks. IEEE Trans Neural Netw Learn Syst 24:1513–1525
Mu C, Ni Z, Sun C, He H (2016) Data-driven tracking control with adaptive dynamic programming for a class of continuous-time nonlinear systems. IEEE Trans Cybern. doi:10.1109/TCYB.2016.2548941 (in press)
Mu C, Ni Z, Sun C, He H (2017a) Air-breathing hypersonic vehicle track ing control based on adaptive dynamic programming. IEEE Trans Neural Netw Learn Syst 28(3):584–598
Mu C, Wang D, He H (2017b) Novel iterative neural dynamic programming for data-based approximate optimal control design. Automatica. doi:10.1016/j.automatica.2017.03.022 (in press)
Na J, Herrmann G (2014) Online adaptive approximate optimal tracking control with simplified dual approximation structure for continuous time unknown nonlinear systems. IEEE/CAA J Autom Sin 1:412–422
Ni Z, He H (2013) Heuristic dynamic programming with internal goal representation. Soft Comput 17:2101–2108
Panagi P, Polycarpou MM (2011) Decentralized fault tolerant control of a class of interconnected nonlinear systems. IEEE Trans Autom Control 56:178–184
Prokhorov DV, Wunsch DC (1997) Adaptive critic designs. IEEE Trans Neural Netw 8:997–1007
Rice JK, Verhaegen M (2009) Distributed control: a sequentially semi-separable approach for spatially heterogeneous linear systems. IEEE Trans Autom Control 54:1270–1283
Saberi A (1998) On optimality of decentralized control for a class of nonlinear interconnected systems. Automatica 24:101–104
Siljak DD (2012) Decentralized control of complex systems. Academic Press, Boston
Sutton RS, Barto AG (1998) Reinforcement learning—an introduction. MIT Press, Cambridge
Vamvoudakis KG, Lewis FL (2010) Online actor-critic algorithm to solve the continuous-time infinite horizon optimal control problem. Automatica 46(5):878–888
Wang FY, Zhang H, Liu D (2009) Adaptive dynamic programming: an introduction. IEEE Comput Intell Mag 4:39–47
Wang D, Liu D, Wei Q, Zhao D, Jin N (2012) Optimal control of unknown nonaffine nonlinear discrete-time systems based on adaptive dynamic programming. Automatica 48:1825–1832
Wang D, Liu D, Li H (2014a) Policy iteration algorithm for online design of robust control for a class of continuous-time nonlinear systems. IEEE Trans Autom Sci Eng 11:627–632
Wang D, Liu D, Li H, Ma H (2014b) Neural-network-based robust optimal control design for a class of uncertain nonlinear systems via adaptive dynamic programming. Inf Sci 282:167–179
Wang D, Liu D, Li H, Ma H, Li C (2016a) A neural-network-based online optimal control approach for nonlinear robust decentralized stabilization. Soft Comput 20:707–716
Wang D, Liu D, Ma H, Mu C (2016b) Decentralized guaranteed cost control of interconnected systems with uncertainties: a learning-based optimal control strategy. Neurocomputing 214:297–306
Wang D, Mu C, Liu D (2017) Data-driven nonlinear near-optimal regulation based on iterative neural dynamic programming. Acta Autom Sin 43:354–363
Werbos PJ (2008) ADP: the key direction for future research in intelligent control and understanding brain intelligence. IEEE Trans Syst Man Cybern B Cybern 38:898–900
Yang X, Liu D, Ma H, Xu Y (2016) Online approximate solution of HJI equation for unknown constrained-input nonlinear continuous-time systems. Inf Sci 328:435–454
Zhang H, Luo Y, Liu D (2009) Neural-network-based near-optimal control for a class of discrete-time affine nonlinear systems with control constraints. IEEE Trans Neural Netw 20:1490–1503
Zhao D, Zhu Y (2015) MEC-A near-optimal online reinforcement learning algorithm for continuous deterministic systems. IEEE Trans Neural Netw Learn Syst 26:346–356
