Keadaan-steadi dan kontrol suboptimal
9.4 Keadaan-steadi dan kontrol suboptimal
Tealah kaji bahwa untuk plan invarian-waktu kontrol optimal LQ adalah suatu umpanbalik- keadaan varian-waktu. Umpanbalik yang demikian ini sulit diimplemtasi karena mem- butuhkan tempat penyimpanan didalam memori komputer untuk gain-gain yang varian- waktu. Dalam bagian ini akan diberikan suatu alternatif skema kontrol gain Kalman varian-waktu K(t) diganti dengan suatu nilai konstan untuk keadaan-stedi (bila t → ∞). Didalam banyak aplikasi penggunaan gain umpanbalik-keadaan steadi ini adalah memadai.
Kontrol Keadaan-Steadi. Misalkan plan yang akan dikntrol mempunyai bentuk linier:
˙x = Ax + Bu,
dengan x ∈ R m dan masukan kontrol u(t) ∈ R . Dalam bagian ini diasumsikan plan adalah invarian-waktu.
Selanjutnya diinginkan memilih pengontrol yang meminimumkan indeks perilaku kuadrat:
dengan Q ≥ 0 dan R > 0. Karena interval integrasi takhingga, dinamakan hal ini indeks perilaku horizon takhingga. Sekarang tujuannya adalah berkaitan dengan suatu interval
kontrol berbentuk [0, ∞).
Hukum kontrol yang diperoleh sebelumnya tetap bisa dipakai, hanya saja sekarang perlu persamaan Riccati diintegral pada suatu interval takhingga. Misalkan bahwa persamaan
Keadaan-steadi dan kontrol suboptimal.. 213 Riccati mempunyai suatu penyelesaian limit sedemikian hingga ˙ P menuju nol untuk nilai
(t 1 − t) besar, dalam hal ini diperoleh:
(9.54) Persamaan ( 9.54 ) dinamakan persamaan aljabar Riccati. Penyelesaian limit P ∞ dari per-
0=A ′ P + SA
− P BR −1 B ′ P + Q.
samaan differensial Riccati bila ada, adalah penyelesaian dari persamaan aljabar Riccati. Kebalikannya tidak benar, yaitu penyelesaian definit positip dari persamaan aljabar Ric- cati mungkin bukan limit penyelesaian persamaan Riccati. Lagi pula, persamaan aljabar Riccati bisa mempunyai penyelesaian yang tidak simetri dan sekedar persamaan kuadrat skalar yang bisa mempunyai penyelesaian real atau kompleks.
Bila limit penyelesaian P ∞ dari persamaan Riccati ada, maka gain Kalman adalah matriks konstan yang diberikan oleh:
(9.55) Jadi, kontrol optimal keadaan-steadi adalah umpanbalik-keadaan konstan yang diberikan
K ∞ =R −1 B ′ P ∞ .
oleh:
(9.56) Dalam hal ini biaya optimal diberikan oleh:
u(t) = −K ∞ x(t).
(9.57) Sedangkan plan loop-tutupnya diberikan oleh:
J=x ′ (0)P ∞ x(0).
(9.58) Kemanfaatan dari kontrol sederhana ini menggunakan suatu umpanbalik konstan adalah
˙x = (A − BK ∞ )x = A c x.
jelas. Oleh karena itu diturunkan beberapa pertanyaan untuk menentukan kegunaan dari skema yang dikemukan sebagai berikut:
1. Bilamana ada penyelesaian limit P ∞ terbatas dari persamaan Riccati untuk semua
pilihan bobot keadaan akhir P (t 1 )?
2. Umumnya P ∞ bergantung pada P (t 1 ). Apapun hal ini, formulasi baru yang telah diuraikan tidak mengandung P (t 1 ). Jadi, bilamana ada suatu penyelesaian P ∞ yang
tidak tergantung pada pilihan dari P (t 1 )?
3. Bilamana plan loop-tutup A c stabil asimptotik?
Jawaban dari pertanyaan yang diajukan ini secara mendasar sangat penting bagi teori LQ yang disajikan dalam dua teorema berikut.
Teorema 23 Misalkan (A, B) dapat distabilkan. Maka untuk setiap P (t 1 ) ada suatu limit penyelesaian P ∞ terbatas dari persamaan Riccati. Lagipula, P ∞ adalah suatu penyelesaian dari persamaan aljabar Riccati yang semi-definit positip.
214 Linier Quadratic Regulator (LQR)..
Teorema 24 Misalkan (A, C) dapat diamati dengan C memenuhi Q = C ′
C. Maka (A, B) dapat distabilkan bila dan hanya bila:
1. Ada tunggal penyelesaian limit definit-positif simetri P ∞ dari persamaan Riccati. Lagi pula, P ∞ adalah penyelesaian tunggal definit-positip dari persamaan aljabar Riccati.
2. Plan loop-tutup A c stabil asimptotik.
Hasil-hasil dari dua teorema ini tidak dapat ditekankan secara berlebihan. Hasil- hasil ini berati bahwa sepanjang sistem dan indeks perilaku memenuhi hal pokok tertentu keadaan steadi LQR akan menberikan gain yang menstabilkan sistem. Hal ini adalah su- atu sifat yang sungguh baik sekali, mengingat kesulitan yang dijumpai pada teknik kontrol klasik dalam banyak-masukan.
Sebagaimana dapat dilihat dengan membandingkan dua teorema diatas, keteramatan dari (A, C) sangat memperkuat hasil. Sifat ini, secara kasarnya berarti bahwa semua bentuk plan sebaiknya dibobot dalam indeks perilaku. Bila J terbatas, maka x ′ Qx + u ′ Ru akan mengecil dengan bertambahnya waktu. Lagi pula, bila semua keadaan dapat diamati dalam indeks perilaku, hal ini akan menjamin bahwa x(t) akan cenderung mengecil dengan bertambahnya waktu, dengan demikian kestabilan loop-tutup dijamin.
Pole-pole loop-tutup akan bergantung pada pilihan dari pendisainan matriks-matriks Q dan R, apapun hal ini pole-pole akan selalu stabil sepanjang memilih R > dan Q ≥0 dengan (A, C) dapat diamati, dimana Q = C ′
C. Jadi elemen-elemen dari Q dan R bervari- asi selama dalam prosedur interaktif menggunakan bantuan komputer dalam pendisainan untuk memperoleh perilaku loop-tutup yang sesuai. Yaitu, gain optimal K diperoleh untuk nilai-nilai Q dan R diberikan dan respon loop tutup diperoleh lewat simulasi. Bila respon ini tidak sesuai, nilai-nila baru untuk Q dan R dipilih dan pendisanan dulang lagi. Salah satu perangkat lunak untuk memperoleh matriks K adalah MATLAB.
Contoh berikut akan mengilustrasikan kebergantungan dari pole-pole loop-tutup pada Q dan R. Aktualnya, pasangan (A, C) dapat diamati tidak diperlukan untuk menjamin suatu sis- tem loop-tutup stabil. Semua yang dipersyaratkan adalah kondisi lewah dari keteramatan dimana hal ini berkaitan dengan keteramatan dari bentuk takstabil A.
Contoh 60 Keadaan steadi disain LQ untuk sistem-sistem yang memenuhi hu- kum Newton.
Diberikan sistem
˙x(t) =
x(t) +
u(t) = Ax + Bu,
Keadaan-steadi dan kontrol suboptimal.. 215 dimana keadaan x = (p v) ′ dengan p(t) adalah posisi dan v(t) adalah kecepatan dan
kontrol u(t) adalah percepatan. Dalam contoh ini diingini mengilustrasikan disain LQ keadaan steadi masalah regulator dari sistem, jadi dicari suatu kontrol loop-tutup.
Untuk mengatur keadaan ke nol, tentukan indeks perilaku:
Catatan bahwa tidak ada gunanya meliput suatu bobot kontrol r secara terpisah sebab hanya rasio q 2 p /r dan q v /r yang penting dalam J.
Dalam contoh ini, diinginkan untuk menentukan beberapa hasil analitik guna melihat pengaruh parameter-parameter q p dan q v dalam pendisainan.
a. Gain Kalman Keadaan-Steadi. Catatan bahwa matriks C yang memenuhi Q = C ′
C adalah:
C=
dengan (A, C) dapat diamati dan (A, B) dapat dikontrol. Dengan demikian Teorema
24 menjamin bahwa persamaaan aljabar Riccati mempunyai penyelesaian tunggal definit- positip dan gain Kalman keadaan-steadi akan menstabilkan sistem. Selajutnya akan di- tentukan gain stabil K. Karena penyelesaian persamaan aljabar Riccati P adalah simetri, maka diasumsikan sebagai berikut:
P=
Substitusikan A, B, Q dan R = I kedalam persamaan aljabar Riccati dan sederhanakan diperoleh persamaan berikut:
2 0= 2 −p
2 +q p
(9.62) 0=p 1 −p 2 p 3 (9.63)
0 = 2p 2
2 −s 3 +q v .
(9.64) Hal ini mudah diselesaikan dengan urutan ( 9.62 ), ( 9.64 ) dan ( 9.63 ), didapat:
p 2 =q p
p 3 = pq v + 2q p
p 1 =q p pq v + 2q p .
216 Linier Quadratic Regulator (LQR).. Hasil yang diperoleh dipilih supaya P definit-positif.
Gain Kalman diberikan oleh:
K=R −1 B ′ P = (p 2 p 3 ) = (q p pq v + 2q p ).
b. Analisa Plan loop-tutup. Plan loop-tutup diberikan oleh:
A c =A − BK =
−q p − pq v + 2q p . Polinomial karakteristik dari A c adalah:
(9.70) Dalam hal ini frekuensi natural dan rasio damping masing-masing diberikan oleh:
s(λ) = λ 2 + pq
Pengaruh dari pendisainan parameter pada ω dan ξ sekarang terlihat jelas, dengan demikian bobot q p dan q v dapat dipilih sesuai dengan perilaku yang diinginkan. Lagipula terlihat bahwa kehebatan dari disain LQ modern jelas yaitu plan loop-tutup stabil untuk sebarang pilihan q p dan q v yang dapat diterima. Suatu pendekatan takdibuat-buat ter- hadap pendisainan adalah mencakup langsung pilihan elemen-elemen dari matriks gain K. Bagaimanapun, kestabilan tidak dijamin untuk semua pilihan nilai-nilai K. Dilain pihak, tidak jadi masalah bobot apapun yang dipilih dalam indeks perilaku, sepanjang (A, C)
dapat diamati dan Q ≥ 0, sistem loop-tutup dijamin stabil oleh Teorema 24 . Kestabilan dari loop-tutup dijamin walaupun plan dibidang kompleks dengan banyak
masukan dan banyak keluaran, sedangkan teknik klasik untuk masalah masukan/keluaran tunggal tidak mudah bisa diterapkan. Tentunya hasil-hasil yang telah dicapai ini sunguh berdaya guna.
√ Catatan bahwa, bila bobob kecepatan q v nol, maka damping rasion bernilai 1/ 2.
Dilain pihak, q p = 0 tidak diijinkan sebab (A, C) tidak dapat diamati.
Contoh 61 Kontrol Horizon mundur-Suatu cara mudah menstabilkan suatu sis- tem
Diinginkan mengarakan sistem berbentuk:
˙x = Ax + Bu
Keadaan-steadi dan kontrol suboptimal.. 217 dari suatu keadaan awal x(t) yang diberikan pada saat waktu t keadaan akhir nol pada
saat waktu t + t 1 dengan t 1 tetap, yaitu:
(9.74) Untuk memperoleh tujuan pengontrolan ini dipilih u(t) yang meminimumkan perilaku
(x Qx + u Ru)dt, (9.75)
dengan P 1 = ∞, Q ≥ 0, R > 0. Kontrol u(t) yang diperlukan diberikan oleh gain umpanbalik dalam rangkuman ringkas-
an pada pembahasan LQR loop-tutup. Untuk mendapatkannya, bentuk berikut
P (t) = A ′ P+PA
−˙ −1 − P BR B ′ P+Q
(9.76) harus diintegral secara mundur dari t + t 1 ke t menggunakan P 1 = ∞. Perluh diperhatikan
bahwa interval integrasi mempunyai panjang konstan sebesar t 1 untuk semua t, oleh karena itu matriks P (t) berukuran n×n yang dibutuhkan untuk menentukan gain Kalman adalah
sama untuk semua t, hal ini akan memberikan suatu gain umpanbalik konstan. Untuk menghindari ketakhinggaan dari kondisi akhir pada ( 9.76 ) didefinisikan S = P −1
dan menggunakan ˙S −1 =
−1 SS ˙ −S −1 untuk memperoleh:
1 , S(t 1 ) = 0. (9.77) Telah dihapus pergeseran konstan dari t didalam interval integrasi.
S = AS + SA ˙ ′
− BR −1 B ′ + SQS, t ≤t
Selajutnya diperoleh umpanbalik konstan kontrol optimal:
(9.78) dengan
u= −Kx
(9.79) Jadi diperoleh suatu hukum umpanbalik keadaan konstan.
K=R −1 B ′ S −1 (0).
Bisa dittunjukkan bahwa selama (A, B) dapat dikontrol hukum kontrol ( 9.78 ) dan ( 9.79 ) akan menstabilkan sistem.
Kontrol Suboptimal Telah dilihat bahwa bila masalah LQ horizon takhingga mempunyai suatu penyelesaian
keadaan steadi yaitu bila (A, B) dapat distabilkan dan (A, C) dapat diamati. Maka, per- samaan aljabar Riccati ( 9.54 ) mempunyai suatu penyelesaian tunggal definit-positip yang
218 Linier Quadratic Regulator (LQR).. menghasilkan gain Kalman K∞ diberikan oleh ( 9.55 ). Gain keadaan-steadi ini selalu men-
stabilkan plan. Pada kajian berikut ini walaupun interval kontrol [0, t 1 ] tidak takhingga tetap bisa
diputuskan untuk menggunakan gain Kalman K ∞ sebagai ganti dari gain optimal varian waktu K(t). Pada suatu interval hingga [0, t 1 ] gain kostan K ∞ adalah suboptimal, tetapi ketidak harusan mengimplementasikan suatu gain varian-waktu dapat lebih mengejar hi- langnya keoptimalan. Disamping itu bila t 1 menjadi besar K(t) mendekati K ∞ oleh karena itu keputusan menggunakan gain keadaan-steadi akan lebih bermakna.
Kegunaan dari gain keadaan-steadi K ∞ pada suatu interval kontrol hingga adalah men- jadi suatu strategi kontrol suboptimal. Lagipula, untuk implementasi gain umpanbalik kon- stan, kontroler suboptimal ini mempunyai keuntungan penting lainnya yaitu perhitungan untuk menyelesaikan persamaan aljabar Riccati menjadi effisien.
Berikut ini akan diketahui bagaimana bila digunakan bukan gain optimal yang dikaitkan dengan indeks perilaku.
Misalkan, digunakan hukum umpan balik
(9.80) dimana F adalah sebarang gain umpanbalik tetap yang menghasilkan suatu sistem loop-
u= −F x
tutup stabil
˙x = (A − BF )x.
Dengan menggunakan ( 9.80 ) indeks perilaku diberikan oleh: Z t 1
J=
(t 1 )P (t 1 )x(t 1 )+
x ′ [Q + F ′ RF ] xdt.
Selanjutnya bila ada matriks P sedemikian hingga
maka diperoleh:
J= x ′ (t 0 )P (t 0 )x(t 0 ).
Differensialkan bagian kiri dari ( 9.83 ) dan gunakan ( 9.81 kemudian hapus trayektori keadaan (sebab persamaan berlaku untuk semua x(t 0 )), diperoleh:
(9.85) Jadi, untuk setiap gain umpanbalik tidak peduli optimal atau tidak dapat ditentukan nilai
−˙ ′ P (t) = (A − BF ) P + P (A − BF ) + Q + F RF.
J sebagai berikut. Pertama, selesaikan ( 9.85 ) secara mundur dalam waktu dengan meng- gunakan bobot akhir P (t 1 ) yang disediakan. Maka biaya yang dikaitkan dengan meng- gunakan F diberikan oleh ( 9.84 ). Nilai ini bisa dibandingkan dengan biaya optimal yang
Keadaan-steadi dan kontrol suboptimal.. 219 diperoleh menggunakan gain Kalman dengan menyelesaikan persamaan Riccati. Dalam hal
ini dapat diputuskan apakah menggunakan suboptimal F ataukah gain Kalman optimal varian-waktu.
Perlu diketahui jelas bahwa persamaan ( 9.85 ) adalah suatu persamaan Lyapunov linier dalam P karena F adalah suatu gain tetap.
Bila diputuskan untuk menggunakan kontrol keadaan-steadi pada suatu interval kontrol
hingga, F = K ∞ dapat dipilih kemudian hitung ( 9.84 ) untuk melihat apa yang berkurang sebagai akibat penyederhanaan dari penggunaan suatu gain konstan.
Contoh 62 Kontrol suboptimal motor DC menggunakan suatu model skalar Dikaji ulang plan dari model skalar motor DC yang diberikan dalam Contoh 58 dan 59 ,
yaitu:
(9.86) dengan biaya
Kontrol optimal adalah suatu umpanbalik varian-waktu
(9.88) dimana
−K ∗ (t)x,
b (t) = p ∗ (t)
dan p ∗ (t) memenuhi persamaan Riccati
− ˙p(t) = −2ap − p + q.
Persamaan ini bisa diselesaikan secara analitik untuk memperoleh penyelesaian p ∗ (t) diberikan oleh ( 9.45 ) dalam Contoh 59 . Nilai optimal dari biaya pada setiap interval [t, t 1 ] adalah:
1 J ∗ (t) = p ∗ (t)x(t).
2 Misalnya tidak diinginkan berhadapan dengan masalah penyimpanan barisan gain op-
timal varian-waktu K ∗ (t). Sebagai penggantinya, misalkan dicoba menggunakan nilai gain
keadaan-steadi (lihat Contoh 59 ), yaitu:
K ∞ = P ∞ = ( p1 + γ − 1)
220 Linier Quadratic Regulator (LQR).. dengan
sedangkan hukum umpanbalik konstan diberikan oleh
u= −K ∞ x.
(9.94) Untuk melihat hasil penggunaan umpanbalik sederhana ini, diselesaiakan ( 9.85 ). Per-
samaan ini adalah:
− ˙p(t) = 2a 2
c p+K ∞ r + q,
dengan matriks loop-tutup a c adalah:
a c = −a − bK ∞ = −a p1 + γ.
(9.96) Perhatikan bahwa a c selalu stabil disebabkan a > 0. Penyelesaian persamaan ( 9.95 )
diberikan oleh:
p(t) = e 1 p(t ∞ +q 2a c (t
Sketsa gambar dari penyelesaian p ∗ (t) dan p(t) yang diberikan oleh persamaan ( 9.97 ) dis- ajikan dalam Gambar 9.1 dengan a = 4, b = 2, r = 1, q = 10, p(t 1 ) = 10. Catatan, nilai suboptimal p(t) yang diberikan oleh ( 9.97 ) adalah batas bawah dari p(t), jadi biaya suboptimal:
J(t) = p(t)x (t)
2 selalu lebih besar atau sama dengan J ∗ (t) optimal dalam ( 9.91 ).
Gambar 9.1: Kurva suboptimal.
Catatan penyelesaian limit dari p(∞) dan p ∗ ( ∞) keduanya diberikan oleh:
ar
p( ∞) =
( p1 + γ − 1),
Keadaan-steadi dan kontrol suboptimal.. 221 sehingga indeks perilakunya adalah:
pada interval takhingga [0, ∞) biaya optimal mempunyai nilai yang sama baik digunakan umpanbalik optimal dalam ( 9.89 ) ataupun dalam ( 9.92 ). Ini berarti bahwa sepanjang inter-
val kontrol [t 0 ,t 1 ] menjadi lebih besar hal ini membuat semakin berati untuk menggunakan
umpanbalik konstan K ∞ . Hal ini juga tampak pada Gambar 9.1 .
Disain struktureigen LQR Disini didiskusikan suatu pendekatan lain terhadap disain kontrol keadaan-steadi dengan
tidak meyelesaiakan persamaan aljabar Riccati ( 9.54 ). Misalkan (A, B) dapat-distabilkan dan (A, C) dapat-diamati dengan demikian kondisi Teorema 24 dipenuhi. Diinginkan un- tuk menunjukkan bahwa sebagai pengganti dari menyelesaikan persamaan aljabar Riccati ( 9.54 )untuk P ∞ dan kemudian menggunakan ( 9.55 ) untuk mendapatkan gain keadaan- steadi K ∞ , dapat ditentukan P ∞ ,K ∞ dan pole-pole loop-tutup secara langsung dari ma- triks H dalam sistem Hamiltonian:
Faktanya akan ditunjukkan bahwa pole-pole dari sistem loop-tutup optimal
(9.102) dengan K ∞ gain Kalman keadaan-steadi adalah tepat sama dengan nilaieigen stabil dari
˙x = (A − BK ∞ )x ≡A c x,
H Berikut ini diturunkan sifat khusus dari H. Misalkan
Maka mudah ditunjukkan bahwa
H = JH ′ J.
Bila µ adalah suatu nilaieigen dari H dengan vektoreigen v, maka
Hv = µv,
dan karena J −1 = −J, maka dari
JH ′ Jv = µv
222 Linier Quadratic Regulator (LQR).. diperoleh
H ′ Jv = −µJv.
Jadi
(Jv) ′ H=
−µ(Jv) ′
terlihat bahwa −µ adalah nilaieigen dari H dengan vektoreigen kiri Jv. Ini berarti bahwa
H mempunyai sebanyak n nilaieigen stabil serta sebanyak n nilaieigen takstabil yang meru- pakan pencerminan pada titik pusat dalam bidang kompleks.
Bentuk ( 9.101 ) dan ( 9.102 ) adalah cara ekivalen untuk mengkarakterisasi kedinamikan loop-tutup dalam pengaruh kontrol optimal pada interval waktu takhingga [0, ∞). Teo- rema 24 menjamin kestabilan ( 9.102 ). Oleh karena itu dapat ditunjukkan bahwa nilaieigen
dari sistem loop-tutup optimal adalah tidak lain dari pada n nilaieigen stabil dari H. Untuk membuktikan hal ini, misalkan µ i adalah suatu nilaieigen dari sistem loop-tutup optimal. Maka bila hanya mode µ i yang berperan dan karena λ(t) dan u(t) adalah linier dalam x(t), maka didapat:
µ i x(t) = X t
i e (9.104)
µ i u(t) = U t
i e (9.105)
i e (9.106) dengan vektor-vektor X i ,U i dan Λ i tidak nol. Gunakan ini dalam ˙x = Ax + Bu, didapat:
µ i λ(t) = Λ t
(9.108) terlihat bahwa µ i adalah suatu nilaieigen dari sistem loop-tutup dengan vektoreigen X i .
(µ i − (A − BK ∞ ))X i =0
Selanjutnya, ditinjau sistem Hamiltonian ( 9.101 ). Dari persamaan ( 9.104 ) dan ( 9.106 ) diperoleh:
=H
Terlihat bahwa, µ i juga suatu nilaieigen dari H dengan vektoreigen (X ′ i Λ ′ i ) ′ . Teorema 24 mengatakan bahwa sistem loop-tutup adalah stabil, jadi nilaieigen dari
loop-tutup optimal adalah n nilaieigen stabil dari H. Gain umpanbalik optimal bisa ditentukan dari struktureigen H. Untuk melihat hal
ini, misalkan bahwa nilaieigen-nilaieigen dari loop-tutup optimal adalah sederhana. Maka ( 9.23 ) menunjukkan bahwa untuk setiap i berlaku
−R ′ B Λ i .
Keadaan-steadi dan kontrol suboptimal.. 223 Gabung hasil ini dengan ( 9.107 ) didapat:
K X i =R −1 B ∞ ′ Λ i .
Misalkan X adalah matriks n × n dengan kolom-kolomnya dalah X i dan Λ adalah matriks n × n dengan kolom-kolomnya adalah Λ i , maka diperoleh
(9.109) Hasil ini memberikan gain Kalman keadaan-steadi dalam bentuk struktureigen dari H.
K ∞ =R −1 B ′ ΛX −1 .
Bila µ i kompleks, maka gain yang diperoleh lewat cara ini juga kompleks, jadi tidak bisa diimplementasi. Dalam kejadian ini kompleks konjugate dari µ i yaitu µ ∗ i juga nilaieigen dan menurut ( 9.109 ) gain harus memenuhi
K ∞ (X i X i ∗ )=R −1 B ′ (Λ i Λ ∗ i ).
Jika kedua ruas dikalikan dengan L, didapat
2 √ 2 dengan j = −1. Jadi diperoleh:
(9.110) dimana Re(.) dan Im(.) masing-masing menyatakan bagian real dan imajiner dari suatu
K ∞ Re(X i ) Im(X i )
−1 B ′ Re(Λ i ) Im(Λ i )
bilangan kompleks. Jadi, bila µ i kompleks adalah perluh untuk menggunakan bagian real dan imajiner dari vektor-vektor X i dan Λ i dalam persamaan ( 9.109 ) sebagai pengganti vektor-vektor kompleks itu sendiri. Jadi hal ini akan memberikan suatu gain K ∞ real.
Telah ditunjukkan bahwa pole-pole sisteme loop-tutup optimal ( 9.102 ) adalah n pole stabil dari sistem Hamiltonian ( 9.101 ). Lagipula vektoreigen yang berkaitan dengan ni- laieigen µ i dari plan loop-tutup diberikan oleh X i yang merupakan separuh dari vektoreigen
H. Tambahanpula, sebagai pengganti menyelesaikan persamaan aljabar Riccati untuk P ∞
dan kemudian menyelesaikan ( 9.55 ), gain umpanbalik optimal keadaan-steadi dapat diten- tukan dengan cara mendapatkan nilaieigen stabil µ i dari matriks Hamiltonian H dengan vektoreigen yang terkait diberikan oleh (X i ′ Λ ′ i ) ′ , selanjutnya menghitung K ∞ menggu- nakan ( 9.109 ).
Dari ( 9.109 ) dan ( 9.55 ) jelas bahwa bahwa penyelesaian aljabar Riccati dengan struk- tureigen dari H diberikan oleh
P ∞ = ΛX −1 .
224 Linier Quadratic Regulator (LQR).. Bila suatu pole-loop tutup µ i adalah kompleks, maka dalam ( 9.109 ) dan ( 9.111 ) bagian
real dan bagian imajiner dari vektor-vektor yang terkait yaitu Λ i dan X i harus digunakan untuk memperoleh K ∞ real dan P ∞ . Bila nilaieigen dari loop-tutup optimal tidak seder- hana, maka perlu menggunakan vektoreigen tergeneralisasi dalam penghitungan K ∞ dan P ∞ .
Perlu dicatat bahwa bila matriks bobot-keadaan Q adalah nol, maka
Dalam kasus ini, nilaieigen dari H adalah pole-pole dari A dan pole-pole dari −A. Jadi untuk memperoleh nilai eigen keadaan-steadi optimal hanya dibutuhkan pole-pole stabil dari A bersama-sama dengan pole-pole takstabil dari negatif A. Ini juga adalah pole-pole loop-tutup optimal dalam limit bila matriks bobot-kontrol R menuju takhingga.
Contoh 63 Disain struktureigen LQR untuk sistem yang memenuhi hukum Newton
Dalam Contoh 60 persamaan aljabar Riccati diselrsaikan untuk memperoleh gain Kalman keadaan-steadi untuk sistem yang memenuhi hukum Newton:
′ dengan p(t) posisi, v(t) kecepatan dan kontrol u(t) adalah suatu masukan percepatan. Dalam contoh ini diinginkan untuk mengilustrasikan disain
struktureigen LQ sistem yang memenuhi hukum Newton ini. Misalkan indeks perilakunya adalah
Dalam hal ini matriks Hamiltoniannya adalah
H=
−q p
0 −q v −1 0
Keadaan-steadi dan kontrol suboptimal.. 225 sedangkan persamaan karakteristik dari H diberikan oleh
(9.116) Karena polinomial ini genap, maka bila s adalah suatu akar dari polinomial tsb., maka −s
4 2 det(sI 2 − H) = s −q
v s +q p = 0.
juga akar dari polinomial. Selanjutnya misalakn ¯s = s 2 , sehingga diperoleh
(9.117) Asumsikan bahwa q p >q v /2, hal ini memberikan suatu pasangan akar-akar kompleks
2 s 2 ¯ −q
v s+q ¯ p = 0.
takstabil ¯s 1 dan ¯s 2 dengan frekuensi dan damping rasio masing-masing diberikan oleh
Pole-pole dari sistem Hamiltonian adalah ± ¯ s 1 dan ± ¯ s 2 atau
maka dari itu terlihat bahwa sistem Hamiltonian mempunyai empat pole yang terkait dengan dua pasang kompleks dengan frekuensi natural dan rasio damping masing-masing adalah
(9.123) Telah ditunjukkan bahwa pole-pole loop-tutup tidak lain adalah pole-pole stabil dari H,
ω n = √q p ,ξ= ± 1+q v /2q p .
jadi pole-pole ini berkaitan dengan pasangan kompleks stabil yang diberikan dalam ( 9.123 ) (yaitu, damping rasion positif). Hasil ini sesuai dengan yang dibahas dalam Contoh 60 . Sekarang kelihatan jelas bagaimana memilih bobot dalam indeks perilaku yang mempen- garuhi perilaku loop-tutup. Catatan, bila tidak digunakan bobot kecepatan rasio damping menjadi bernilai 1 √
Untuk menentukan gain umpanbalik optimal didapatkan vektoreigen H dan gunakan ( 9.109 ). Karena plan adalah masukan-keluaran tunggal, maka digunakan suatu cara seder- hana untuk pole-pole loop-tutup yang dikenal sebagai formula Ackerman. Diperoleh
K=e h ′
n U −1 n △ (A),
226 Linier Quadratic Regulator (LQR).. dimana e ′
n adalah baris terakhir matriks satuan berukuran n × n, △ (s) adalah polinomial loop-tutup yang diharapkan dan U n adalah matriks keterkontrolan yang diberikan oleh
Polinomial loop-tutup yang diharapkan adalah
0 2 dengan ξ dan ω 0 n diberikan oleh ( 9.123 ). Substitusikan A , A dan A sebagai ganti s ,s dan s 2 dalam persamaan ( 9.126 ) diperoleh
Oleh karena itu gain optimal K diberikan oleh
hasil yang diperoleh ini tepat sama dengan apa yang didapat dalam Contoh 60 .