Matriks Konfusi Hidden Markov Model HMM Standar

4.7 Perbandingan Akurasi Prediksi HSMM dan HMM Standar

Perbandingan akurasi HSMM dan HMM dilakukan untuk menunjukkan keunggulan HSMM dibandingkan HMM standar. Dapat dilihat Gambar 32 bahwa meskipun pada prediksi alpha-helix H akurasi HMM jauh lebih tinggi, namun tidak diikuti oleh akurasi struktur lainnya. Dengan demikian, secara rata- rata akurasi prediksi struktur sekunder protein dengan HSMM manghasilkan akurasi sebesar 56,9 sedangkan HMM standar menghasilkan akurasi sebesar 35,3. Gambar 32. Perbandingan Akurasi prediksi struktur sekunder protein model HSMM dan HMM sSandar

4.8 Pengaruh Distribusi Empiris Durasi State Terhadap Akurasi HSMM

Pada proses pelatihan model HSMM dilakukan dengan mempertimbangkan distribusi durasi state yang digunakan baik secara empiris maupun teoritis. Secara keseluruhan rata-rata akurasi struktur alpha-helix H dengan distribusi empiris paling tinggi dibandingkan dengan betha-sheet B dan coil C. Rata-rata akurasi struktur H dari skenario satu sampai delapan adalah 71,2, struktur B 37,1 dan struktur C 64,0. Terlihat bahwa akurasi struktur betha-sheet B paling rendah. Rendahnya nilai akurasi ini diduga disebabkan oleh terjadinya perbedaan distribusi antara data latih dan data uji. Oleh karena itu distribusi empiris dari data latih dan data uji dikaji untuk dilihat sejauh mana perbedaannya. Gambar 33 memperihatkan distribusi empiris antara data latih dan data uji. Gambar 33. Visualiasi distribusi empiris struktur alpha-helix H pada data latih dan data uji Pada Gambar 33 terlihat bahwa distribusi struktur alpha-helix H pada data latih dan data uji hampir memiliki pola yang sama. Hal ini terlihat dari gambar pola data latih dan data uji yang saling berhimpit dengan selisih durasi 0.006. Hal yang sama juga dilakukan terhadap distribusi struktur betha-sheet B dan coil C. Perbandingan distribusi struktur betha-sheet B terlihat pada Gambar 34. Gambar 34. Visualiasi distribusi empiris struktur betha-sheet B pada data latih dan data uji Pada visualisasi Gambar 34 terlihat bahwa antara data latih dan data uji memiliki distribusi yang tidak sesuai. Ini terlihat dari garis data uji dan data latih yang memiliki tidak berhimpit sehingga terdapat selisih distribusi antara data latih