Pengujian skenario 7 dengan panjang durasi state menggunakan Pengujian skenario 8 dengan panjang durasi state menggunakan

Gambar 18. Perbandingan akurasi prediksi struktur sekunder protein total pada skenario 7 model HSMM dan HMM standar

4.2.8 Pengujian skenario 8 dengan panjang durasi state menggunakan

distribusi fungsi kepekatan peluang normal dengan rataan geometrik Pada skenario 8, nilai peluang dari panjang durasi state menggunakan distribusi peluang normal, akan tetapi rataan panjang segmen yang digunakan dihitung dengan rataan geometrik. Hal ini disebabkan karena panjang segmen yang diperoleh dari data latih memang tidak menyebar secara merata. Hasil prediksi pada pengujian dari model HSMM pada skenario 8 dapat dilihat pada grafik Gambar 19. Gambar 19. Perbandingan akurasi prediksi struktur sekunder protein total pada skenario 8 model HSMM dan HMM standar Hasil prediksi dengan model HSMM dengan distribusi teoritis dengan fungsi kepekatan peluang normal adalah 61,7. Hasil ini relatif kecil diantara skenario yang digunakan dalam proses prediksi struktur sekunder protein .

4.3 Perbandingan akurasi Hidden Semi Markov Model HSMM

Secara umum, dari seluruh skenario pengujian yang dilakukan, terlihat bahwa model yang dihasilkan dengan menggunakan Hidden Semi Markov Model dapat menambah tingkat akurasi bila dibandingkan dengan Hidden Markov Model Standar. Namun demikian, rataan tingkat akurasi yang dihasilkan dari tujuh skenario pengujian tersebut masih relatif rendah. Perbandingan akurasi tertinggi setiap skenario pengujian dapat dilihat pada Tabel 4 berikut: Tabel 4. Perbandingan akurasi tertinggi setiap skenario pengujian Skenario 1 2 3 4 5 6 7 8 Akurasi tertinggi 64,4 64,1 63,8 63,8 63,4 63,3 64 61,7 Pada Tabel 3 terlihat bahwa akurasi yang paling tinggi berada pada skenario 1. Pada skenario tersebut panjang durasi state yang digunakan adalah distribusi empiris dengan presentase 100 distribusi panjang segmen alpha, betha dan coil. Hal ini beralasan karena dengan mengambil 100 panjang durasi ini informasi dari setiap segmen terwakili. Gambar 20. Perbandingan akurasi setiap skenario model HSMM

4.4 Analisis Error Identifikasi Struktur Sekunder Protein

Analisis error dilakukan untuk mengetahui bagaimana akurasi dari setiap segmen kelasstruktur yang dihasilkan dan mengetahui distribusi kelas yang salah diprediksi. Akurasi setiap segmen kelasstruktur yang dihasilkan pada proses identifikasi struktur sekunder protein dibuat dalam bentuk matriks konfusi. Matriks konfusi memperlihatkan persentasi struktur alpha-helix H , betha-sheet B dan coil C yang dikenali sesuai dengan kelasnya.

4.4.1 Matriks Konfusi Skenario 1

Matriks konfusi hasil pengujian skenario 1 memperlihatkan persentasi akurasi setiap kelas baik H, B maupun C dengan Hidden Semi Markov Model HSMM. Pada skenario ini durasi state yang digunakan adalah distribusi empiris dengan menggunakan 100 panjang maksimum durasi setiap state. Hasil Matriks konfusi dapat dilihat pada Tabel 5. Tabel 5. Matriks konfusi pengujian skenario 1 kelas hasil prediksi akurasi prediksi H B C k el as as al H 4401 295 1357 72, 7 B 978 1040 816 36,7 C 1495 417 3241 62,9 Berdasar hasil prediksi dari Matriks konfusi, terlihat bahwa dari 6053 residu asam amino yang memiliki struktur alpha-helix, ternyata 4401 residu yang terprediksi dengan benar, sedangkan sisanya terprediksi di kelas betha-sheet B sebanyak 295 residu dan coil sebanyak 1357 residu. Adapun struktur betha-sheet B dan coil C masing-masing diprediksi sesuai dengan kelasnya sebanyak 1040 residu dan 3241 residu. Akurasi prediksi setiap segmen struktur dapat dilihat pada grafik Gambar 21. Hasil akurasi prediksi pada Gambar 21 memperlihatkan bahwa akurasi struktur alpha-helix H relatif lebih tinggi dibandingkan dengan akurasi struktur betha-sheet B dan coil dengan nilai 72, 7. Adapun akurasi betha-sheet B dan coil C masing-masing sebesar 36,6 dan 62,9.