Data Set BreastCancer recurrence-events

BAB 4 HASIL DAN PEMBAHASAN

Pada bagian ini, penulis menyajikan hasil dan pembahasan penelitian mengenai analisis akurasi algoritma klasifikasi pohon keputusan dan k-NN terhadap 5 data sets, yaitu BreastCancer, Car, Diabetes, Ionosphere, dan Iris berdasarkan confusion matrix. Penulis juga melakukan perbandingan terhadap kedua macam teknik klasifikasi tersebut melalui pengukuran performance dari sudut pandang akurasi Precision, Recall, F-measure, dan Success Rate.

4.1. Data Set BreastCancer

Data Set BreastCancer terdiri dari 286 instances, 10 atributtes, dan 2 classes no-recurrence-events dan recurrence-events. Gambar 4.1 berikut ini menunjukkan hasil perhitungan akurasi algoritma pohon keputusan terhadap data set BreastCancer. Gambar 4.1. Perhitungan Akurasi Pohon Keputusan terhadap BreastCancer.arff Universita Sumatera Utara 47 Pada Gambar 4.1, terlihat confusion matrix dan table of confusion dari pengujian pohon keputusan dengan metode 10-fold cross validation. Berdasarkan gambar tersebut, dapat dijelaskan bahwa dari total 286 data, sebanyak 216 data 75.52 dapat diklasifikasikan dengan benar, sedangkan 70 data 24.48 salah diklasifikasikan. Dengan menggunakan persamaan 2.6, 2.7, 2.8, 2.9, dan 2.10, dihitung nilai precision, recall, dan F-measure. Tabel 4.1 menunjukkan hasil pengukuran akurasi algoritma pohon keputusan pada BreastCancer.arff. Tabel 4.1. Nilai Akurasi Pohon Keputusan terhadap BreastCancer.arff Class Precision Recall F-measure Success Rate no-recurrence-events 0.757 0.960 0.846

75.52 recurrence-events

0.742 0.271 0.397 Weighted Average 0.752 0.755 0.713 Gambar 4.2 berikut ini menunjukkan hasil perhitungan akurasi algoritma k-NN terhadap data set BreastCancer. Gambar 4.2. Perhitungan Akurasi k-NN terhadap BreastCancer.arff Universita Sumatera Utara 48 Pada Gambar 4.2, terlihat confusion matrix dan table of confusion dari pengujian k-NN dengan metode 10-fold cross validation. Berdasarkan gambar tersebut, dapat dijelaskan bahwa dari total 286 data, sebanyak 207 data 72.38 dapat diklasifikasikan dengan benar, sedangkan 79 data 27.62 salah diklasifikasikan. Dengan menggunakan persamaan 2.6, 2.7, 2.8, 2.9, dan 2.10, dihitung nilai precision, recall, dan F-measure. Tabel 4.2 menunjukkan hasil pengukuran akurasi algoritma pohon keputusan pada BreastCancer.arff. Tabel 4.2. Nilai Akurasi k-NN terhadap BreastCancer.arff Class Precision Recall F-measure Success Rate no-recurrence-events 0.756