Texas Tech University|基于強(qiáng)化學(xué)習(xí)的PID控制的保穩(wěn)自動(dòng)調(diào)參
Stability-preserving automatic tuning of PID control with reinforcement learning
Ayub I. Lakhani, Myisha A. Chowdhury, Qiugang Lu
Department of Chemical Engineering, Texas Tech University, Lubbock, TX 79409, USA.
原文鏈接:https://comengsys.com/article/view/4601
PID控制由于其設(shè)計(jì)簡(jiǎn)單有效,并且控制范圍廣泛,一直是過(guò)程工業(yè)中的主要控制策略。然而,大多數(shù)傳統(tǒng)的PID調(diào)參方法依賴于對(duì)復(fù)雜過(guò)程的反復(fù)試驗(yàn),并且對(duì)這些復(fù)雜過(guò)程的了解有限,因而可能無(wú)法得到最佳的PID參數(shù)。
本文亮點(diǎn):
提出了一種基于強(qiáng)化學(xué)習(xí)(RL)的確定性策略梯度方法的自動(dòng)PID調(diào)參框架,以實(shí)現(xiàn)無(wú)需用戶的PID自動(dòng)調(diào)參,這對(duì)于復(fù)雜動(dòng)態(tài)系統(tǒng)的PID設(shè)計(jì)尤為重要。
提出了一種新穎的可以保持閉環(huán)穩(wěn)定的PID自動(dòng)調(diào)參框架,該框架在每個(gè)完整的階躍測(cè)試后更新RL代理參數(shù)一次,這可以幫助消除不穩(wěn)定性。大多數(shù)現(xiàn)有工作采用逐樣本RL更新策略,由此引發(fā)的PID參數(shù)快速切換將很容易導(dǎo)致閉環(huán)不穩(wěn)定。
與現(xiàn)有研究不同,本方法考慮了整個(gè)RL的調(diào)整過(guò)程的閉環(huán)穩(wěn)定性,這對(duì)于確保實(shí)際應(yīng)用的安全性尤為重要。
提供了詳細(xì)的算法來(lái)演示具體實(shí)施所提方法的步驟。
提供了一個(gè)復(fù)雜的二階時(shí)滯模型的示例,以驗(yàn)證所提出的基于RL的穩(wěn)定性保持PID自動(dòng)調(diào)參方法的有效性。
Author's Talk


Complex Engineering Systems (Online ISSN: 2770-6249, https://comengsys.com/)是OAE出版公司于2021年4月創(chuàng)辦的一本金色開(kāi)放獲取,嚴(yán)格同行評(píng)議的國(guó)際學(xué)術(shù)期刊,主編由意大利米蘭理工大學(xué)Hamid Reza Karimi教授擔(dān)任。我們誠(chéng)摯地歡迎中國(guó)該領(lǐng)域的專家關(guān)注期刊并投稿,我們將為您的文章出版提供科學(xué)、規(guī)范、高效的服務(wù)!?