Analisa Hasil Akurasi Klasifikasi

BAB IV ANALISA HASIL DAN IMPLEMENTASI SISTEM Pada bab ini akan dibahas berbagai hal yang berkaitan dengan implementasi dari sistem dan hasil yang telah didapat dari beberapa pengujian yang dilakukan, serta analisa dari hasil penghujian.

4.1. Analisa Hasil Akurasi Klasifikasi

Berdasarkan hasil dari pengujian yang telah dilakukan dengan menggunakan Naive Bayesian Clasifier dan juga menggunakan k-fold validation , akan diperoleh hasil pada tabel di bawah ini dengan ketentuan pengaruh besar kecilnya nilai k untuk penentuan interval EWD. Berikut merupakan hasil akurasi dari klasifikasi yang telah dilakukan : Tabel 4. 1 Hasil Percobaan Klasifikasi Banyak Fold Akurasi Perbagia n Data Grafik akurasi fold Akurasi Akhir 3 0.6854 0.8000 0.7024 = . ∗ = . ∗ = . 5 0.6852 0.8491 0.8824 0.8627 0.6531 = . ∗ = . ∗ = . 0,65 0,7 0,75 0,8 1 2 3 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1 2 3 4 5 7 0.6410 0.9211 0.8378 0.8889 0.8611 0.8611 0.8611 = . ∗ = . ∗ = . 9 0.5806 0.9000 0.8667 0.9000 0.8621 0.8214 0.8571 0.8462 0.8077 = . ∗ = . ∗ = . Dari hasil percobaan tersebut, ditemukan dan dapat diketahui bahwa hasil akurasi terbaik terdapat pada pembagian data dengan 7 fold yaitu dengan persentase sebesar 83.89.. Hasil akurasi yang hampir sama adalah pada pembagian 9 fold . Nilai akurasi di atas menjadi sangat bervariatif karena peranan dari pembagian diskretisasi oleh EWD, juga dibentuk karena besarkecilnya nilai k dari EWD-nya. Gambar 4. 1 Grafik Perbandingan Akurasi 0,64 0,69 0,74 0,79 0,84 0,89 0,94 1 2 3 4 5 6 7 0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1 2 3 4 5 6 7 8 9 72,93 78,65 83,89 82,69 72 74 76 78 80 82 84 86 3 5 7 9 P e rs e n ta se fold Perbandingan Persentase Akurasi Gambar 4.1 merupakan grafik perbandingan rata-rata akurasi. Percobaan dilakukan berdasarkan nilai hasil diskretisasi menggunakan EWD. Hasil diskretisasi akan dilakukan empat kali percobaan yang terdapat pada setiap fold . Hasil dari akurasi di tiap fold akan dirata-rata untuk mencari nilai akurasi yang paling besarmaksimal dari percobaan berdasarkan hasil klasifikasinya. Berdasarkan hasil beberapa percobaan yang telah dilakukan rata-rata terbesar terdapat pada hasil dengan nilai fold ke 7. Hal ini terjadi karena pembagian data pada fold ke 7 lebih banyak data yang masuk dalam kategori klasifikasi benar secara pembagianpersebaran data, nilai errornya lebih sedikit dibanding dengan nilai fold lainnya. Hasil klasifikasi dari data diabetes ini sangat berpengaruh dari bagaimana pengolahan data sebelum klasifikasinya preprosesing . Dengan melakukan diskretisasi terhadap data kontinu, tentu saja akan mendapatkan perhitungan atau menjalankan proses mining dengan lebih mudah dan hasil klasifikasi lebih jitu.

4.2. Kelebihan dan Kekurangan Sistem