Perbandingan Akurasi Prediksi HSMM dan HMM Standar Pengaruh Distribusi Empiris Durasi State Terhadap Akurasi HSMM

Gambar 33. Visualiasi distribusi empiris struktur alpha-helix H pada data latih dan data uji Pada Gambar 33 terlihat bahwa distribusi struktur alpha-helix H pada data latih dan data uji hampir memiliki pola yang sama. Hal ini terlihat dari gambar pola data latih dan data uji yang saling berhimpit dengan selisih durasi 0.006. Hal yang sama juga dilakukan terhadap distribusi struktur betha-sheet B dan coil C. Perbandingan distribusi struktur betha-sheet B terlihat pada Gambar 34. Gambar 34. Visualiasi distribusi empiris struktur betha-sheet B pada data latih dan data uji Pada visualisasi Gambar 34 terlihat bahwa antara data latih dan data uji memiliki distribusi yang tidak sesuai. Ini terlihat dari garis data uji dan data latih yang memiliki tidak berhimpit sehingga terdapat selisih distribusi antara data latih dan data uji yang lebih besar dibandingkan dengan selisih distribusi alpha-helix H. Selisih distribusi panjang state antara data latih dan data uji adalah 0.016. Visualisasi distribusi struktur coil Gambar 35 memperlihatkan pola distribusi data latih dan data uji yang digunakan. Hasil visualisasi menunjukkan bahwa struktur coil C memliki distribusi yang hampir sama dengan selisih 0.006. Gambar 35. Visualiasi distribusi empiris struktur coil Cpada data latih dan data uji Berdasarkan ketiga gambar visualiasi di atas, diketahui bahwa selisih ditribusi empiris data latih dan data uji struktur alpha-helix H sebesar 0.006, selisih distribusi betha-sheet B sebesar 0.016 dan selisih distribusi coil C sebesar 0.006. Selisih paling tinggi terdapat pada distribusi betha-sheet B yaitu 0.016. Grafik perbandingan selisih distribusi dapat dilihat pada Gambar 36. Selisih distribusi dilakukan dengan persamaan .......................................................................................... 29 : error signal error distributions : data pelatihan : data pengujian Gambar 36. Selisih distribusi durasi state empiris antara data pelatihan dan data pengujian untuk model HSMM Perbedaan distribusi juga dilakukan dengan menghitung persentase root mean square deviation RMSD. RMSD dapat dilihat pada persamaan 30. .................................................... 30 : data pelatihan : data pengujian N : panjang durasi Gambar 37. Selisih distribusi durasi state empiris antara data pelatihan dan data pengujian untuk model HSMM dengan RMSD Berdasar selisih distribusi pada data latih dan data uji yang digunakan Gambar 36 dan Gambar 37, dapat ditunjukkan bahwa struktur betha-sheet B memiliki selisih distribusi durasi yang paling tinggi dibandingkan dengan hasil prediksi alpha-helix H dan coil C. Besarnya selisih distribusi durasi pada struktur betha-sheet B diduga menyebabkan akurasi prediksi pada struktur betha-sheet B dengan HSMM menjadi yang paling rendah.

4.9 Perbandingan Distribusi Teoritis dan Empiris pada Data Pelatihan

Penggunaan distribusi secara teoritis dan empiris akan memperlihatkan bagaimana sebaran data yang digunakan pada proses pelatihan. Penggunaan distribusi secara teoritis mengasumsikan data latih dengan distribusi tertentu, sedangkan distribusi empiris mampu merepresentasikan data latih yang sebenarnya. Secara visual, perbandingan distribusi struktur alpha-helix H dapat dilihat pada Gambar 38. Apabila dibandingkan selisih distribusi tersebut sebesar 0.01. Gambar 38. Visualiasi perbandingan distribusi teoritis dan empiris struktur alpha- helix H pada data latih Perbandingan distribusi teoritis dan empiris data latih untuk struktur betha-sheet B juga dilakukan. Selisih distribusi struktur betha-sheet yang didapatkan sebesar 0.0284. Grafik perbandingan distribusi struktur betha-sheet B dapat dilihat pada Gambar 39. Gambar 39. Visualiasi perbandingan distribusi teoritis dan empiris struktur betha- sheet B pada data latih Hal yang sama juga dilakukan pada struktur coil C. Perbandingan distribusi teoritis pada data latih dan data uji secara visual dapat dilihat pada Gambar 40. Selisih distribusi struktur coil C yang dihasilkan sebesar 0.01. Gambar 40. Visualiasi perbandingan distribusi teoritis dan empiris struktur coil C pada data latih Ketiga perbandingan selisih distribusi di atas menunjukkan bahwa selisih distribusi yang besar akan memberikan hasil akurasi struktur protein yang relatif rendah. Perbandingan selisih distribusi teoritis dan empiris data latih dapat dilihat pada Gambar 41.