Program Dinamik dan Prinsip Maksimum

Kendali ∗ disebut kendali optimal dan ∗ disebut dengan trayektori optimal dengan persamaan kondisi di mana = ∗ . Nilai optimal dari fungsi tujuan dinotasikan dengan � ∗ atau � ∗ . Masalah kendali optimal . disebut dengan persamaan Bolza. Apabila ≡ maka disebut dengan persamaan Lagrange. Apabila diketahui ≡ maka disebut dengan persamaan Mayer. Selain itu, akan disebut persamaan Mayer linier ketika ≡ dan linier, sehingga menjadi, { ma� ∈� {� = } terhadap ̇ = , , , = . dengan = , , … , adalah vektor baris dengan dimensi-n yang elemen- elemennya adalah konstanta-konstanta yang diberikan.

E. Program Dinamik dan Prinsip Maksimum

Sebelum sampai ke dalam Prinsip Maksimum, berikut ini akan dijelaskan terlebih dahulu Persamaan Hamilton-Jacobi-Bellman dan Derivasi Persamaan Adjoin. E.1. Persamaan Hamilton-Jacobi-Bellman Misalkan , : × → adalah nilai maksimum dari fungsi tujuan dari masalah kendali optimal dengan waktu awal pada kondisi . Dengan begitu, , = ma� ∈� ∫ , , + , , . dengan , = , , , = . Diasumsikan nilai dari fungsi , ada untuk semua dan pada interval yang relevan. Selanjutnya, digunakan optimisasi untuk menderivatifkan kondisi pada fungsi , . Pertama, batas integral pada fungsi tujuan � menjadi sampai + ; kedua, nilai fungsi + , + pada waktu + . Kendali � harus dipilih agar terdapat di dalam � � , � [ , + ], dan memaksimalkan integralnya. Agar mempermudah memahami maksud dari kalimat di atas, berikut ini akan diperlihatkan langkah-langkah untuk mendapatkan bentuk , yang baru. , = ma� ∈� {∫ , , +� + ∫ , , + , +� } = ma� ∈� ∫ , , +� + ma� ∈� ∫ , , + , +� sehingga didapatkan persamaan sebagai berikut , = ma� ∈� ∫ , , +� + + , + . dengan adalah kenaikan atau penambahan waktu yang sangat kecil. Hal ini digunakan untuk membandingkan persamaan . dengan persamaan . . PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Karena adalah fungsi kontinu, integral dari persamaan . dapat diaproksimasikan , , , sehingga dapat ditulis menjadi , = ma� ∈� { , , + [ + , + ]} + . dengan disebut “little-o” yang menunjukkan koleksi dari suku-suku di dalam dengan order tinggi. Fungsi : → dikatakan order dari jika lim ‖� ‖→ � ‖� ‖ = . Diasumsikan bahwa fungsi merupakan fungsi yang bisa diturunkan dan kontinu continously differentiable. Maka kita bisa menderetkan Taylor fungsi terhadap , sehingga didapatkan hasil sebagai berikut: [ + , + ] = , + [ � , ̇ + , ] + , . dengan � dan merupakan turunan parsial dari , terhadap dan , serta ̇ yang diperoleh dari = + − = + − lim � → = lim � → + − = ̇ kemudian mensubstitusikan ̇ pada persamaan . ke dalam persamaan . , sehingga didapatkan: , = ma� ∈� { , , + , + � , , , + , } + . . PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Dengan menghilangkan , pada kedua ruas dan diikuti membagi kedua ruas dengan didapatkan = ma� ∈� { , , + � , , , + , } + . . Misalkan → maka persamaan di atas berubah menjadi = ma� ∈� { , , + � , , , + , } . dengan batas , = ∈� ∫ , , + , , = ∈� ∫ , , + , , = ∈� + , , = , . . Perlu diingat bahwa vektor � , dapat diinterpretasikan sebagai kontribusi marginal dari variabel kondisi untuk memaksimalkan fungsi tujuannya. Disimbolkan vektor marginal sepanjang lintasan ∗ dengan vektor baris adjoin sebagai berikut: = � ∗ , ≔ � , | �=� ∗ . . dengan dapat diinterpretasikan sebagai perubahan kecil fungsi tujuannya sebesar ∗ pada waktu . Selanjutnya akan diberikan bentuk fungsi Hamiltonian, yaitu: [ , , � , ] = , , + , , . atau dapat disederhanakan menjadi, [ , , , ] = , , + , , . . Persamaan . dapat dituliskan kembali menjadi, = ma� ∈� [ , , � , + ], . yang disebut dengan persamaan Hamilton-Jacobi-Bellman atau persamaan HJB. Hamiltonian memaksimalkan kondisi dari prinsip maksimum dapat dihitung dari persamaan . dan . dengan memastikan bahwa, jika ∗ dan ∗ merupakan nilai yang paling optimal dari variabel kondisi dan kendali serta adalah nilai dari variabel adjoin pada waktu yang bersesuaian, maka kendali optimal ∗ harus memenuhi persamaan . untuk semua ∈ � , [ ∗ , ∗ , , ] + ∗ , [ ∗ , , , ] + ∗ , . Dengan menghilangkan pada kedua ruas, maka didapatkan [ ∗ , ∗ , , ] [ ∗ , , , ] . untuk semua ∈ � . Untuk sampai pada prinsip maksimum, ada aspek yang lain yang digunakan untuk menghitung prinsip maksimum, yaitu derivasi persamaan adjoin.

F. Derivasi Persamaan Adjoin