42
Bahasa .NET meliputi Visual Basic, Visual C++, Visual C, dan F. Pada penelitian ini, penulis mendesain user interface dan membangun kode
pemrograman C untuk memperoleh nilai akurasi berdasarkan confusion matrix yang diperoleh dari WEKA versi 3.7.8. Pada penelitian ini, penulis
membuat aplikasi menggunakan Visual C dengan nama Confusion Matrix for Accuracy, untuk menganalisis confusion matrix dan melakukan
perhitungan akurasi yang terdiri dari precision, recall, F-measure, dan success rate.
3.4.1. Aplikasi Training Sets dan Testing Sets
WEKA merupakan aplikasi open source berbasis java yang memiliki dua macam interface, berupa Simple Command Line Interface CLI dan Graphical User Interface
GUI dengan 3 pilihan, yaitu Explorer, Experimenter, dan Knowledge Flow. Gambar 3.5 berikut menunjukkan tampilan WEKA 3.7.8.
Gambar 3.5. Interface WEKA 3.7.8
Untuk memperoleh confusion matrix, penulis menggunakan menu Explorer pada WEKA GUI Chooser dan melalui dua tahapan, yaitu Preprocess dan Classify.
Tahapan Preprocess bertujuan untuk memilih data set .arff attribute relation file
format yang digunakan dalam penelitian, misalnya diabetes.arff. Gambar 3.6 menunjukkan tahapan Preprocess pada diabetes.arff. Pada tampilan menu
Universita Sumatera Utara
43
Preprocess, juga terlihat detail atribut dan banyaknya kelas setelah file diabetes.arff dipilih. Jika dipilih atribut kelas, maka menampilkan detail atribut kelas, yaitu kelas
“tested negative” sebanyak 500 instances dan kelas “tested positive” sebanyak 268 instances beserta nilai weight masing-masing kelas.
Gambar 3.6. Tahapan Preprocess Langkah berikutnya adalah tahapan Classify. Pada menu Classify, dilakukan
pemilihan terhadap teknik klasifikasi pohon keputusan dan k-NN. Tahapan ini juga bertujuan menghasilkan confusion matrix berdasarkan metode evaluasi 10-fold cross
validation, dimana data sets dibagi menjadi 10 subsets 9 subsets sebagai training sets dan 1 subset sebagai testing set dengan jumlah 10 kali iterasi. Adapun classifier yang
digunakan adalah J4.8 pohon keputusan dan Ibk k-NN. Gambar 3.7 menunjukkan tahapan Classify untuk menghasilkan confusion
matrix pada data set diabetes.arff menggunakan classifier pohon keputusan.
Universita Sumatera Utara
44
Gambar 3.7. Tahapan Classify
3.4.2. Aplikasi Perhitungan Akurasi
Pada tahap ini, penulis menggunakan aplikasi Confusion Matrix for Accuracy yang dibangun sendiri menggunakan Visual C versi 2010. Gambar 3.8 menunjukkan
tampilan interface aplikasi perhitungan akurasi algoritma pohon keputusan dan k-NN.
Gambar 3.8. Interface Confusion Matrix for Accuracy Confusion Matrix
Universita Sumatera Utara
45
Pada Gambar 3.8 terdapat pilihan [1] TEKNIK KLASIFIKASI dan [2] DATA SETS. Teknik Klasifikasi yang dapat dipilih adalah Decision Tree Pohon Keputusan
dan k-NN. Untuk data sets, terdapat 5 pilihan berupa BreastCancer, Car, Diabetes, Ionosphere, dan Iris.
Tombol “Tampilkan” digunakan untuk menampilkan confusion matrix
dan tombol “Kalkulasi” digunakan untuk melakukan perhitungan precision, recall, F-measure, dan success rate
. Tombol “Detail” digunakan untuk menampilkan dan menyembunyikan table of confusion untuk setiap kelas yang ada, berdasarkan
confusion matrix yang diperoleh.
Universita Sumatera Utara
BAB 4 HASIL DAN PEMBAHASAN
Pada bagian ini, penulis menyajikan hasil dan pembahasan penelitian mengenai analisis akurasi algoritma klasifikasi pohon keputusan dan k-NN terhadap 5 data sets,
yaitu BreastCancer, Car, Diabetes, Ionosphere, dan Iris berdasarkan confusion matrix. Penulis juga melakukan perbandingan terhadap kedua macam teknik
klasifikasi tersebut melalui pengukuran performance dari sudut pandang akurasi Precision, Recall, F-measure, dan Success Rate.
4.1. Data Set BreastCancer