Hasil prediksi dengan model HSMM dengan distribusi teoritis dengan fungsi kepekatan peluang normal adalah 61,7. Hasil ini relatif kecil diantara
skenario yang digunakan dalam proses prediksi struktur sekunder protein .
4.3 Perbandingan akurasi Hidden Semi Markov Model HSMM
Secara umum, dari seluruh skenario pengujian yang dilakukan, terlihat bahwa model yang dihasilkan dengan menggunakan Hidden Semi Markov Model
dapat menambah tingkat akurasi bila dibandingkan dengan Hidden Markov Model Standar. Namun demikian, rataan tingkat akurasi yang dihasilkan dari
tujuh skenario pengujian tersebut masih relatif rendah. Perbandingan akurasi tertinggi setiap skenario pengujian dapat dilihat pada Tabel 4 berikut:
Tabel 4. Perbandingan akurasi tertinggi setiap skenario pengujian
Skenario 1 2 3 4 5 6 7 8
Akurasi tertinggi 64,4 64,1 63,8 63,8 63,4 63,3 64 61,7
Pada Tabel 3 terlihat bahwa akurasi yang paling tinggi berada pada skenario 1. Pada skenario tersebut panjang durasi state yang digunakan adalah
distribusi empiris dengan presentase 100 distribusi panjang segmen alpha, betha dan coil. Hal ini beralasan karena dengan mengambil 100 panjang durasi ini
informasi dari setiap segmen terwakili.
Gambar 20. Perbandingan akurasi setiap skenario model HSMM
4.4 Analisis Error Identifikasi Struktur Sekunder Protein
Analisis error dilakukan untuk mengetahui bagaimana akurasi dari setiap segmen kelasstruktur yang dihasilkan dan mengetahui distribusi kelas yang salah
diprediksi. Akurasi setiap segmen kelasstruktur yang dihasilkan pada proses identifikasi struktur sekunder protein dibuat dalam bentuk matriks konfusi.
Matriks konfusi memperlihatkan persentasi struktur alpha-helix H , betha-sheet B dan coil C yang dikenali sesuai dengan kelasnya.
4.4.1 Matriks Konfusi Skenario 1
Matriks konfusi hasil pengujian skenario 1 memperlihatkan persentasi akurasi setiap kelas baik H, B maupun C dengan Hidden Semi Markov
Model HSMM. Pada skenario ini durasi state yang digunakan adalah distribusi empiris dengan menggunakan 100 panjang maksimum durasi setiap state.
Hasil Matriks konfusi dapat dilihat pada Tabel 5. Tabel 5. Matriks konfusi pengujian skenario 1
kelas hasil prediksi akurasi
prediksi H B C
k el
as as al
H 4401 295 1357 72, 7
B 978 1040
816 36,7
C 1495 417 3241 62,9
Berdasar hasil prediksi dari Matriks konfusi, terlihat bahwa dari 6053 residu asam amino yang memiliki struktur alpha-helix, ternyata 4401 residu yang terprediksi
dengan benar, sedangkan sisanya terprediksi di kelas betha-sheet B sebanyak 295 residu dan coil sebanyak 1357 residu. Adapun struktur betha-sheet B dan
coil C masing-masing diprediksi sesuai dengan kelasnya sebanyak 1040 residu dan 3241 residu. Akurasi prediksi setiap segmen struktur dapat dilihat pada grafik
Gambar 21. Hasil akurasi prediksi pada Gambar 21 memperlihatkan bahwa akurasi
struktur alpha-helix H relatif lebih tinggi dibandingkan dengan akurasi struktur betha-sheet B dan coil dengan nilai 72, 7. Adapun akurasi betha-sheet B dan
coil C masing-masing sebesar 36,6 dan 62,9.