Pengujian skenario 7 dengan panjang durasi state menggunakan

4.4 Analisis Error Identifikasi Struktur Sekunder Protein

Analisis error dilakukan untuk mengetahui bagaimana akurasi dari setiap segmen kelasstruktur yang dihasilkan dan mengetahui distribusi kelas yang salah diprediksi. Akurasi setiap segmen kelasstruktur yang dihasilkan pada proses identifikasi struktur sekunder protein dibuat dalam bentuk matriks konfusi. Matriks konfusi memperlihatkan persentasi struktur alpha-helix H , betha-sheet B dan coil C yang dikenali sesuai dengan kelasnya.

4.4.1 Matriks Konfusi Skenario 1

Matriks konfusi hasil pengujian skenario 1 memperlihatkan persentasi akurasi setiap kelas baik H, B maupun C dengan Hidden Semi Markov Model HSMM. Pada skenario ini durasi state yang digunakan adalah distribusi empiris dengan menggunakan 100 panjang maksimum durasi setiap state. Hasil Matriks konfusi dapat dilihat pada Tabel 5. Tabel 5. Matriks konfusi pengujian skenario 1 kelas hasil prediksi akurasi prediksi H B C k el as as al H 4401 295 1357 72, 7 B 978 1040 816 36,7 C 1495 417 3241 62,9 Berdasar hasil prediksi dari Matriks konfusi, terlihat bahwa dari 6053 residu asam amino yang memiliki struktur alpha-helix, ternyata 4401 residu yang terprediksi dengan benar, sedangkan sisanya terprediksi di kelas betha-sheet B sebanyak 295 residu dan coil sebanyak 1357 residu. Adapun struktur betha-sheet B dan coil C masing-masing diprediksi sesuai dengan kelasnya sebanyak 1040 residu dan 3241 residu. Akurasi prediksi setiap segmen struktur dapat dilihat pada grafik Gambar 21. Hasil akurasi prediksi pada Gambar 21 memperlihatkan bahwa akurasi struktur alpha-helix H relatif lebih tinggi dibandingkan dengan akurasi struktur betha-sheet B dan coil dengan nilai 72, 7. Adapun akurasi betha-sheet B dan coil C masing-masing sebesar 36,6 dan 62,9. Gambar 21. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha- helix, betha-sheet dan coil model HSMM skenario 1

4.4.2 Matriks Konfusi Skenario 2

Prediksi tiap segmen struktur alpha-helix H, betha-sheet B dan coil C pada skenario 2 ini menggunakan 90 panjang durasi state. Matriks konfusi pada pengujian skenario 2 dapat dilihat pada Tabel 6 untuk menggambarkan sebaran hasil identifikasi struktur sekunder protein baik alpha-helix H, betha-sheet B maupun coil C. Tabel 6. Matriks konfusi pengujian skenario 2 kelas hasil prediksi akurasi prediksi H B C kela s asal H 4396 295 1362 72,6 B 973 1043 818 36,6 C 1491 420 3242 62,9 Pada pengujian dengan 90 durasi state, terlihat bahwa dari sebanyak 4396 residu asam amino yang memiliki struktur alpha-helix H, mampu diprediksi sesuai dengan strukturnya. Adapun struktur betha-sheet B dan coil masing- masing diprediksi dengan benar sebanyak 1043 residu dan 3242 residu. Hasil akurasi prediksi Gambar 22 memperlihatkan bahwa akurasi struktur alpha-helix H relatif lebih tinggi dibandingkan dengan akurasi struktur