Terminasi
………………………………………………………12 Proses menemukan kemungkinan nilai peluang paling besar dari suatu observasi yang
berakhir pada saat t = T
Backtracking
sehingga ,
…….13 Membaca decoding path sekuens terbaik dari vektor
2.6 Hidden Semi Markov Model
Hidden Semi Markov Model HSMM adalah bentuk perluasan dari Hidden Markov Model HMM yang mempertimbangkan durasi suatu observas
terhadap state yang dimiliki. Pada HSMM, panjang durasi D pada suatu state secara eksplisit dinyatakan sehingga dinamakan juga dengan HMM dengan durasi
variabel Yu 2009. State durasi atau D merupakan varibel acak yang memiliki nilai integer D = {1, 2, 3… D}. Peluang panjang durasi Pd adalah peluang
panjang durasi suatu state dengan panjang tertentu. Bentuk umum dari Hidden Semi Markov Model seperti yang dilihat pada Gambar 6 Yu 2009
Gambar 6. Bentuk umum HSMM Yu 2009 Pada HSMM terlihat bahwa suatu state dapat membangitkan lebih dari
satu observasi atau bahkan sejumlah sekuens observasi. Sepanjang observasi T, setiap state pada HSMM akan memiliki panjang durasi state dengan nilai tertentu.
Pada prediksi struktu protein sekunder observasi ini merupakan sekuens dari asam amino yang membentuk protein sedangkan state adalah struktur protein yang akan
diidentifikasi atau diprediksi. Berikut ini adalah tahap algoritme pada HSMM Yu dan Kobayashi 2006
Proses Forward
……………….…………...……..16
Proses Backward
Penentuan State Optimal
Estimasi Parameter
III METODE PENELITIAN
3.1 Kerangka Pemikiran
Protein merupakan aktor utama pada makhluk hidup yang memiliki berbagai fungsi yang sangat penting. Protein terbentuk dari asam amino
pembentuknya dengan karakteristik yang berbeda. Struktur protein dapat dilihat secara hierarki sebagai struktur primer, sekunder dan tersier Polanski dan
Kimmel 2007. Prediksi struktur sekunder protein memiliki peranan yang penting sebelum protein tersebut mengalami pelipatan. Di antara model yang digunakan
untuk melakukan prediksi struktur protein ini adalah Hidden Markov Model HMM.
Umumnya proses pelatihan untuk membuat model pada HMMs dapat dilakukan dengan Algoritme Baum-Welch. Proses pelatihan ini tidak
mempertimbangkan durasi state atau panjang segmen dari setiap struktur baik alpha-helix H, betha-sheet B atau coil C. Aydin et al. 2006 melakukan
penelitian untuk memprediksi struktur sekunder protein dengan mempertimbangkan panjang durasi state atau panjang segmen tiap struktur protein
tersebut yang dikenal dengan Hidden Semi Markov Model HSMM. Namun demikian, pada penelitian tersebut panjang segmen ditetapkan dengan nilai
tertentu dan bagaimana menentukan nilainya tidak disebutkan. Padahal panjang segmen struktur bisa diperoleh secara empiris dari data latih yang digunakan.
Di sisi lain, Hidden Semi Markov Model HSMM yang pertama kali diperkenalkan oleh Ferguson memiliki kompleksitas sebesar OMD
2
+M
2
T dengan M adalah Matriks transisi, T adalah sekuens observasi dan D adalah
panjang durasi state Yu dan Kobayashi 2003. Algoritme ini kemudian diefisienkan sehingga kompleksitasnya menjadi OMD+M
2
T dan kebutuhan alokasi memori memiliki kompleksitas OMT Yu dan Kobayashi 2003.
Penelitian ini mengusulkan untuk membuat model dengan menggunakan Hidden Semi Markov Model HSMM yang telah diefisienkan kompleksitasnya
dan dibandingkan dengan akurasi Hidden Markov Model HMM standar. Model HSMM pada penelitian ini menggunakan distribusi panjang durasi state baik
secara empiris maupun teoritis. Penelitian ini juga akan melihat pengaruh distribusi panjang durasi state terdapat nilai akurasi prediksi struktur sekunder
protein. Diagram alur penelitian ini secara umum dapat dilihat pada Gambar 7.
Gambar 7. Diagram alur penelitian prediksi struktur sekunder protein
3.2 Studi Pustaka
Studi pustaka dilakukan untuk mencari riset-riset terbaru yang terkait dengan penelitian yang akan dilakukan. Dari riset yang telah dilakukan tersebut,
penggunaan Hidden Markov Model HMM memang telah banyak digunakan
perumusan masalah pendefinisian
metode penelitian pengambilan data
data latih
data uji
data latih tanpa panjang
durasi state data latih
dengan beberapa panjang durasi state
Pelatihan Pelatihan
pengujian
perhitungan dan perbandingan
akurasi dokumentasi
selesai Model
HMM Model
HSMM tahap pelatihan
tahap pengujian mulai