BAB IV
ANALISA HASIL DAN IMPLEMENTASI SISTEM
Pada bab ini akan dibahas berbagai hal yang berkaitan dengan implementasi dari sistem dan hasil yang telah didapat dari beberapa pengujian yang dilakukan,
serta analisa dari hasil penghujian.
4.1. Analisa Hasil Akurasi Klasifikasi
Berdasarkan hasil dari pengujian yang telah dilakukan dengan menggunakan
Naive Bayesian Clasifier
dan juga menggunakan
k-fold validation
, akan diperoleh hasil pada tabel di bawah ini dengan ketentuan pengaruh besar kecilnya nilai
k
untuk penentuan interval EWD. Berikut merupakan hasil akurasi dari klasifikasi yang telah dilakukan :
Tabel 4. 1 Hasil Percobaan Klasifikasi
Banyak Fold
Akurasi Perbagia
n Data Grafik akurasi fold
Akurasi Akhir
3 0.6854
0.8000 0.7024
=
.
∗
= . ∗
= .
5 0.6852
0.8491 0.8824
0.8627 0.6531
=
.
∗
= . ∗
= .
0,65 0,7
0,75 0,8
1 2
3
0,65 0,7
0,75 0,8
0,85 0,9
0,95
1 2
3 4
5
7 0.6410
0.9211 0.8378
0.8889 0.8611
0.8611 0.8611
=
.
∗
= . ∗
= .
9 0.5806
0.9000 0.8667
0.9000 0.8621
0.8214 0.8571
0.8462 0.8077
=
.
∗
= . ∗
= .
Dari hasil percobaan tersebut, ditemukan dan dapat diketahui bahwa hasil akurasi terbaik terdapat pada pembagian data dengan 7
fold
yaitu dengan persentase sebesar 83.89.. Hasil akurasi yang hampir sama
adalah pada pembagian 9
fold
. Nilai akurasi di atas menjadi sangat bervariatif karena peranan dari pembagian diskretisasi oleh EWD, juga
dibentuk karena besarkecilnya nilai
k
dari EWD-nya.
Gambar 4. 1 Grafik Perbandingan Akurasi
0,64 0,69
0,74 0,79
0,84 0,89
0,94
1 2
3 4
5 6
7
0,55 0,6
0,65 0,7
0,75 0,8
0,85 0,9
0,95
1 2
3 4
5 6
7 8
9
72,93 78,65
83,89 82,69
72 74
76 78
80 82
84 86
3 5
7 9
P e
rs e
n ta
se
fold
Perbandingan Persentase Akurasi
Gambar 4.1 merupakan grafik perbandingan rata-rata akurasi. Percobaan dilakukan berdasarkan nilai hasil diskretisasi menggunakan
EWD. Hasil diskretisasi akan dilakukan empat kali percobaan yang terdapat pada setiap
fold
. Hasil dari akurasi di tiap
fold
akan dirata-rata untuk mencari nilai akurasi yang paling besarmaksimal dari percobaan
berdasarkan hasil klasifikasinya. Berdasarkan hasil beberapa percobaan yang telah dilakukan rata-rata terbesar terdapat pada hasil dengan nilai
fold
ke 7. Hal ini terjadi karena pembagian data pada
fold
ke 7 lebih banyak data
yang masuk
dalam kategori
klasifikasi benar
secara pembagianpersebaran data, nilai errornya lebih sedikit dibanding dengan
nilai
fold
lainnya. Hasil klasifikasi dari data diabetes ini sangat berpengaruh dari
bagaimana pengolahan data sebelum klasifikasinya
preprosesing
. Dengan melakukan diskretisasi terhadap data kontinu, tentu saja akan
mendapatkan perhitungan atau menjalankan proses
mining
dengan lebih mudah dan hasil klasifikasi lebih jitu.
4.2. Kelebihan dan Kekurangan Sistem