Kontrol loop-tutup
9.3 Kontrol loop-tutup
Hasil-hasil kajian pada bagian ini akan sering digunakan pada kajian yang berikutnya dikarenakan bermanfaat untuk menyelesaikan masalah sistem linier yang berkaitan dengan
206 Linier Quadratic Regulator (LQR).. kontrol umpan-balik. Hal ini beda dengan kontrol loop-tutup yang dibahas pada bagian
sebelumnya. Keuntungan dari umpan balik diantaranya adalah mereduksi sensitifitas, meregulasi sendiri, tegar terhadap gangguan dll.
Ditinjau lagi sistem linier berbentuk
˙x(t) = Ax(t) + Bu(t), x(t) n , u(t) ,A ×n n ∈R ×p ∈R ∈R ,B ∈R , (9.17) dengan keadaan awal x(t 0 ) = x0. Sekarang sebagai keadaan akhir x(t 1 ) hanya dibutuhkan
mendekati nol pada saat waktu akhir yang ditentukan uaitu t 1 . Jadi dalam hal ini keadaan akhir bebas dan diingini untuk memilih pengontrol u(t) yang memenuhi ( 9.17 ) serta mem- inimumkan indek perilaku berbentuk:
[x (t)Qx(t) + u (t)Ru(t)] dt. (9.18)
Matriks bobot kontrol R, matriks bobot keadaan Q dan matriks bobot keadaan akhir P (t 1 ) adalah matriks-matriks simetri dipilih oleh pendisain yang bergantung pada tujuan pengontrolan sebagaimana yang akan terlihat. Seperti hal sebelumnya, bila elemen-elemen dari matriks P (t 1 ) dipilih besar, maka nilai keadaan akhir x(t 1 ) harus lebih kecil untuk mempertahankan nilai indeks perilaku kecil.
Diasumsikan bahwa matriks-matriks Q dan P adalah semidefinit-positip. Jadi, masing- masing Q dan P mempunyai nilai karakteristik taknegatif dengan demikian masing-masing x ′ Qx dan x ′ P x adalah tak-negatif untuk semua x(t). Begitu juga diasumsikan bahwa matriks R adalah definit positip, yaitu R mempunyai nilai karakteristik positip, sehingga u ′ Ru > 0 untuk semua u(t) 6= 0. Dalam hal ini J adalah selalu terbatas kebawah dengan
batas bawah nol. Karena bentuk kuadrat dari keadaan dan kontrol muncul di ( 9.18 ), dicoba untuk meminimumkan enerji secara umum (dalam hal ini misalnya ditinjau bila beberapa komponen keadaan adalah kecepatan atau voltage atau arus listrik).
Karena digunakan suatu indeks perilaku kuadrat untuk mengatur keadaan dari sistem ke nol, tetapi tanpa membutuhkan sebarang nilai keadaan akhir yang tetap, dinamakan hal ini adalah masalah LQR keadaan akhir bebas.
Untuk menyelesaikan masalah LQR, dibentuk Hamiltonian yang diberikan sebagai berikut
H= x ′ (t)Qx(t) + u ′ (t)Ru(t) + λ ′ (t) [Ax(t) + Bu(t)] ,
dengan λ(t) ∈ R n adalah suatu pengali yang takdiketahui. Dari Hamiltonian ini diperoleh persamaan keadaan dan ko-keadaan
˙x(t) = Ax(t) + Bu
(9.21) dan kondisi stasioner:
˙λ(t) = −Qx(t) − A ′ λ(t),
∂H
= Ru(t) + B ′ λ.
∂u
Kontrol loop-tutup.. 207 Dari persamaan stasioner ini diperoleh kontrol optimal:
u(t) =
−R −1 B ′ λ(t).
Substitusikan persamaan ( 9.23 ) kedalam persamaan ( 9.20 ), didapat:
(9.24) Bila hasil ini digabungkan dengan persamaan ko-keadaan kedalam persamaan sistem Hamil-
˙x(t) = Ax(t)
− BR −1 B ′ λ(t).
tonian homogin, diperoleh:
dengan kondisi batas x(0) = x0 dan λ(0) = 0. Matriks koefisien dari persamaan ( 9.25 ) dinamakan matriks Hamiltonian. Nilai karakteristik dan vektor karakteristik dari matriks ini sangat penting didalam penganalisaan LQR invarian-waktu.
Keadaan awal x(t 0 ) diketahui bernilai x0. Waktu akhir t 1 adalah tetap, sedangkan keadaan akhir x(t 1 ) bebas. Disamping itu persamaan ( 9.25 ) adalah linier dan x(t) serta λ(t) secara linier bergantung pada x0, dengan demikian λ(t) secara linier bergantung pada x(t). Oleh karenanya dicoba penyelesaian λ(t) mempunyai bentuk:
(9.26) dengan P (t) adalah matriks n × n belum diketahui.
λ(t) = P (t)x(t),
Untuk memperoleh matriks P (t), didifferensialkan persamaan ko-keadaan ( 9.26 ) dan
dengan menggunakan persamaan keadaan ( 9.24 ) diperoleh:
Gabungkan persamaan ( 9.21 ) dan ( 9.27 ), diperoleh:
P x = (A −˙ ′ P+PA+Q
−1 B − P BR ′ P )x.
(9.28) Karena persamaan ( 9.28 ) berlaku untuk setiap x(t) dengan t < t 1 , diperoleh:
(9.29) Persamaan ( 9.29 ) dinamakan persamaan Riccati yang merupakan persamaan linier dalam
P = (A −˙ ′ P+PA+Q
− P BR −1 B ′ P ).
P (t). Matriks P (t) bisa diperoleh dengan menyelesaian persamaan Riccati. Dalam hal ini kontrol optimal u(t) diberikan oleh:
(9.30) Dari sini didefinisikan matriks gain Kalman K(t) sebagai berikut:
u(t) =
−R −1 B ′ P (t)x(t).
K(t) = R −1 B ′ P (t),
208 Linier Quadratic Regulator (LQR).. sehingga diperoleh hukum kontrol umpanbalik-keadaan:
(9.32) Berikut ini dihitung biaya optimal dengan menggunakan pengontrol ini. Pertama diberikan
u(t) = −K(t)x(t).
dulu persamaan berbentuk:
[x ′
P x] = x ′ (t
1 )P (t 1 )x(t 1 ) − x (t 0 )P (t 0 )x(t 0 ) (9.33)
P x] − x ′ (t 1 )P (t 1 )x(t 1 )+ x ′ (t 0 )P (t 0 )x(t 0 ) = 0. (9.34)
2 dt
Tambahkan persamaan ( 9.34 ) kedalam persamaan ( 9.18 ), didapat:
Z 1 1 J(t
0 )= x (t 0 )P (t 0 )x(t 0 )+
x Qx + u Ru + ˙x Px+x Px+x ˙ P ˙x dt. (9.35)
Selajutnya dengan menggunakan persamaan ( 9.30 ), ( 9.24 ) dan persamaan ( 9.26 ) didapat:
R 1 x ′ Qx + u ′ Ru + ˙x ′ Px+x ′ Px+x ˙ ′ P ˙x dt
x ′ Qx + x ′ P BR −1 B ′ P x + ˙x ′ Px+x ′ Px+x ˙ ′ P ˙x dt
x ′ Qx + x ′ P BR −1 B ′ P x + ˙x ′ Px+x ′ Px+x ˙ ′ P [Ax
− BR −1 B ′ P x] dt
x ′ Qx + ˙x ′ Px+x ′ Px+x ˙ ′ P Ax dt
x ′ Qx + [x ′ A ′
′ P BR −1 B ′ ]P x + x ′ Px+x ˙ −x ′ P Ax dt
x ′ Qx + [x ′ A ′
′ P BR −x −1 B ′ ]P x + x ′ Px+x ˙ ′ P Ax dt
R t 1 = x ′ P+PA+A ′ Px ′
− P BR −1 B ′ P xdt
= 0. Langkah akhir perhitungan yang telah dilakukan menggunakan persamaan Riccati sehingga
diperoleh hasil integaralnya bernilai nol. Dengan demikian nilai optimal dari biaya menjadi:
J(t
0 )= x (t 0 )P (t 0 )x(t 0 ).
Kontrol loop-tutup.. 209 Berikut ini diberikan ringkasan apa yang telah diuraikan berkaitan dengan LQR loop-
tutup, setelah itu didiskusikan apa saja yang telah dibahas. Model Sistem:
˙x = Ax + Bu, t ≥t 0 , dengan keadaan awal x(t 0 ) = x0 diberikan.
Indeks perilaku:
J(t 0 )= x ′ (t
1 )P (t 1 )x(t
Kontrol umpanbalik optimal: Persamaan Riccati: −˙ P (t) = A ′ P+PA
1 dan P (t 1 ) diberikan. Gain Kalman:
− P BR ′ B P + Q, dengan t ≤t
K(t) = R −1 B ′ P (t).
Umpanbalik varian waktu:
u(t) = −K(t)x(t).
Biaya Optimal:
1 J(t 0 )= x ′ (t 0 )P (t 0 )x(t 0 ).
Ringkasan LQR optimal yang telah diberikan adalah suatu kontrol sistem umpanbalik. Selajutnya didiskusikan beberapa hal yang berkaitan dengan hukum kontrol yang telah diturunkan.
Masalah LQR optimal ditentukan dengan meyelesaikan terlebih dahulu persamaan Ric- cati untuk suatu matriks pembantu P (t) menggunakan nilai kondisi akhir dari P (t 1 ) yang dipilih untuk mengoptimalkan Indeks Perilaku. Maka gain umpanbalik optimal diberikan oleh gail Kalman K(t). Bahkan bila sistem (A, B) adalah invarian-waktu, kontrol opti- mal u(t) adalah umpanbalik keadaan varian-waktu. Hal ini adalah suatu alasan mengapa Kontroler LQ optimal tidak ditentukan dengan menggunakan cara domain-frekuensi.
210 Linier Quadratic Regulator (LQR).. Kontrol umpanbalik atau loop-tutup dalam kajian ini lebih bermanfaat dalam dunia
praktis dari pada kontrol loop-buka, sebab ia robust terhadap ketidakpastian dalam pa- rameter plan begitu juga terhadap banyak gangguan. Bahkan bila sistem model tidak mendiskripsikan plan eksak, LQR akan memberikan perilaku yang diharapkan bila bila diskripnya mendekati. Kajian lain dari LQR yang penting adalah jaminan sifat-sifat kete- garan (robustness).
Kedaan awal dari plan diketahui. Maka dari itu, uraian dalam ringkasan menunjukkan bisa dihitung biaya optimal sebelum digunakan kontrol terhadap plan. Bila kontrol ini terlalu besar, dapat pilih matriks bobot Q, R dan P (t) yang lain dan mencoba disain yang lainnya.
Catatan bahwa dalam bentuk gain Kalman, persamaan Riccati bisa ditulis sebagai:
(9.37) Dalam bentuk matriks plan loop-titup, persamaan Riccati bisa ditulis sebagai bentuk for-
−˙ P=A ′ P+PA
−K ′ RK + Q.
mula Joseph terstabilkan:
(9.38) Berbeda dengan kontroler keadaan-akhir-tetap pada pembahasan sebelummya, keterkon-
trolan dari plan tidak dibutuhkan dalam masalah LQR. Berkaitan dengan apakah sifat keterkontrolan ini dipenuhi, LQR akan memberikan hasil yang terbaik untuk memini- mumkan indeks perilaku. Hal ini akan dibahas pada pembahasan berikutnya, yaitu keterkon- trolan dari plan akan memberikan sifat-sifat yang baik bagi sistem loop tutup terutama
bila waktu akhir t 1 menuju takhingga.
Penting juga dicatat uraian yang telah dibahas bergantung pada fakta bahwa sistem dan matriks bobot indeks perilaku adalah konstan. Namum demikian, persamaan-persamaan yang muncul dalam ringkasan juga akan berlaku bila kasus A(t), B(t), Q(t) dan R(t) adalah varian-waktu.
Contoh 59 LQR Motor DC menggunakan model skalar. Dalam Contoh 58 dibahas kontrol optimal loop-buka untuk motor DC dengan menga-
sumsikan model skalar
(9.39) dengan x(t) adalah kecepatan motor. Disini akan didapatkan kontrol umpanbalik optimal
˙x = −ax + bu,
yang meminimumkan indeks perilaku:
J= p 1 x (t 1 )+
(qx + ru )dt
Kontrol loop-tutup.. 211
untuk waktu akhir t 1 dan bobot p 1 , q, r tertentu.
Sebagaimana rangkuman dalam ringkasan, persamaan Riccatinya adalah:
− ˙p(t) = −2ap − p + q, t ≤t 1 (9.41)
r dengan kondisi akhir p(t 1 )=p 1 . Gain Kalmannya adalah:
b k= p
dan kontrol umpan balik optimalnya dalah:
(9.43) Untuk memperoleh p(t) digunakan pemisahan variabel, diperoleh:
u= −kx.
(b 2 /r)p 2
+ 2ap −q
p (t)
bila masing-masing ruas persamaan ( 9.44 ) diintegral diperoleh: σ 1 +σ 2
p(t) = σ 2 +
2β(t
[(p 1 +σ 1 )/(p 1 −σ 2 )]e 1 −t)−1
(9.47) Terlihat bawha, untuk khasus skalar kontrol optimal LQ suatu umpanbalik varian-
(β + a), σ 2 =
(β − a).
waktu dengan bentuk yang rumit diberikan oleh persamaan ( 9.42 ) dan ( 9.45 ). Apapun hal ini, untuk tujuaan implementasi hanyalah perlu menghitung gain Kalman K(t) dan menyimpannya didalam memori komputer untuk digunakan dalam plan.
Hasil yang didapat menarik untuk dikaji perilaku keadaan-steadi dari kontrol optimal bila interval kontrol [0, t 1 ] menjadi besar. Bila interval ini menjadi besar, nilai keadaan steadi matriks s ∞ dari matriks s(t) diberikan oleh:
dengan "rasio keeffektifan kontrol" diberikan oleh
212 Linier Quadratic Regulator (LQR).. Sedangkan plan loop-tutup keadaan steadinya adalah:
Selanjutnya perhatikan bahwa kalau rasio q/r meningkat, sistem loop-tutup menjadi lebih stabil. Sehingga, peningkatan bobot keadaan q atau suatu penurunan dalam bobot kontrol r akan mempercepat respon optimal loop-tutup. Hal ini disebabkan kalau nilai q/r meningkat, bobot indeks perilaku x(t) menjadi lebih mengecil. Bila nilai t besar akan lebih mempercepat menuju nol serta bobot u(t) lebih mengecil, hal ini akan menjamin x(t) bernilai kecil.