Algoritme Viterbi Hidden Semi Markov Model

Terminasi ………………………………………………………12 Proses menemukan kemungkinan nilai peluang paling besar dari suatu observasi yang berakhir pada saat t = T Backtracking sehingga , …….13 Membaca decoding path sekuens terbaik dari vektor

2.6 Hidden Semi Markov Model

Hidden Semi Markov Model HSMM adalah bentuk perluasan dari Hidden Markov Model HMM yang mempertimbangkan durasi suatu observas terhadap state yang dimiliki. Pada HSMM, panjang durasi D pada suatu state secara eksplisit dinyatakan sehingga dinamakan juga dengan HMM dengan durasi variabel Yu 2009. State durasi atau D merupakan varibel acak yang memiliki nilai integer D = {1, 2, 3… D}. Peluang panjang durasi Pd adalah peluang panjang durasi suatu state dengan panjang tertentu. Bentuk umum dari Hidden Semi Markov Model seperti yang dilihat pada Gambar 6 Yu 2009 Gambar 6. Bentuk umum HSMM Yu 2009 Pada HSMM terlihat bahwa suatu state dapat membangitkan lebih dari satu observasi atau bahkan sejumlah sekuens observasi. Sepanjang observasi T, setiap state pada HSMM akan memiliki panjang durasi state dengan nilai tertentu. Pada prediksi struktu protein sekunder observasi ini merupakan sekuens dari asam amino yang membentuk protein sedangkan state adalah struktur protein yang akan diidentifikasi atau diprediksi. Berikut ini adalah tahap algoritme pada HSMM Yu dan Kobayashi 2006 Proses Forward ……………….…………...……..16 Proses Backward Penentuan State Optimal Estimasi Parameter III METODE PENELITIAN

3.1 Kerangka Pemikiran

Protein merupakan aktor utama pada makhluk hidup yang memiliki berbagai fungsi yang sangat penting. Protein terbentuk dari asam amino pembentuknya dengan karakteristik yang berbeda. Struktur protein dapat dilihat secara hierarki sebagai struktur primer, sekunder dan tersier Polanski dan Kimmel 2007. Prediksi struktur sekunder protein memiliki peranan yang penting sebelum protein tersebut mengalami pelipatan. Di antara model yang digunakan untuk melakukan prediksi struktur protein ini adalah Hidden Markov Model HMM. Umumnya proses pelatihan untuk membuat model pada HMMs dapat dilakukan dengan Algoritme Baum-Welch. Proses pelatihan ini tidak mempertimbangkan durasi state atau panjang segmen dari setiap struktur baik alpha-helix H, betha-sheet B atau coil C. Aydin et al. 2006 melakukan penelitian untuk memprediksi struktur sekunder protein dengan mempertimbangkan panjang durasi state atau panjang segmen tiap struktur protein tersebut yang dikenal dengan Hidden Semi Markov Model HSMM. Namun demikian, pada penelitian tersebut panjang segmen ditetapkan dengan nilai tertentu dan bagaimana menentukan nilainya tidak disebutkan. Padahal panjang segmen struktur bisa diperoleh secara empiris dari data latih yang digunakan. Di sisi lain, Hidden Semi Markov Model HSMM yang pertama kali diperkenalkan oleh Ferguson memiliki kompleksitas sebesar OMD 2 +M 2 T dengan M adalah Matriks transisi, T adalah sekuens observasi dan D adalah panjang durasi state Yu dan Kobayashi 2003. Algoritme ini kemudian diefisienkan sehingga kompleksitasnya menjadi OMD+M 2 T dan kebutuhan alokasi memori memiliki kompleksitas OMT Yu dan Kobayashi 2003. Penelitian ini mengusulkan untuk membuat model dengan menggunakan Hidden Semi Markov Model HSMM yang telah diefisienkan kompleksitasnya dan dibandingkan dengan akurasi Hidden Markov Model HMM standar. Model HSMM pada penelitian ini menggunakan distribusi panjang durasi state baik secara empiris maupun teoritis. Penelitian ini juga akan melihat pengaruh distribusi panjang durasi state terdapat nilai akurasi prediksi struktur sekunder protein. Diagram alur penelitian ini secara umum dapat dilihat pada Gambar 7. Gambar 7. Diagram alur penelitian prediksi struktur sekunder protein

3.2 Studi Pustaka

Studi pustaka dilakukan untuk mencari riset-riset terbaru yang terkait dengan penelitian yang akan dilakukan. Dari riset yang telah dilakukan tersebut, penggunaan Hidden Markov Model HMM memang telah banyak digunakan perumusan masalah pendefinisian metode penelitian pengambilan data data latih data uji data latih tanpa panjang durasi state data latih dengan beberapa panjang durasi state Pelatihan Pelatihan pengujian perhitungan dan perbandingan akurasi dokumentasi selesai Model HMM Model HSMM tahap pelatihan tahap pengujian mulai