Aplikasi Training Sets dan Testing Sets Aplikasi Perhitungan Akurasi

42 Bahasa .NET meliputi Visual Basic, Visual C++, Visual C, dan F. Pada penelitian ini, penulis mendesain user interface dan membangun kode pemrograman C untuk memperoleh nilai akurasi berdasarkan confusion matrix yang diperoleh dari WEKA versi 3.7.8. Pada penelitian ini, penulis membuat aplikasi menggunakan Visual C dengan nama Confusion Matrix for Accuracy, untuk menganalisis confusion matrix dan melakukan perhitungan akurasi yang terdiri dari precision, recall, F-measure, dan success rate.

3.4.1. Aplikasi Training Sets dan Testing Sets

WEKA merupakan aplikasi open source berbasis java yang memiliki dua macam interface, berupa Simple Command Line Interface CLI dan Graphical User Interface GUI dengan 3 pilihan, yaitu Explorer, Experimenter, dan Knowledge Flow. Gambar 3.5 berikut menunjukkan tampilan WEKA 3.7.8. Gambar 3.5. Interface WEKA 3.7.8 Untuk memperoleh confusion matrix, penulis menggunakan menu Explorer pada WEKA GUI Chooser dan melalui dua tahapan, yaitu Preprocess dan Classify. Tahapan Preprocess bertujuan untuk memilih data set .arff attribute relation file format yang digunakan dalam penelitian, misalnya diabetes.arff. Gambar 3.6 menunjukkan tahapan Preprocess pada diabetes.arff. Pada tampilan menu Universita Sumatera Utara 43 Preprocess, juga terlihat detail atribut dan banyaknya kelas setelah file diabetes.arff dipilih. Jika dipilih atribut kelas, maka menampilkan detail atribut kelas, yaitu kelas “tested negative” sebanyak 500 instances dan kelas “tested positive” sebanyak 268 instances beserta nilai weight masing-masing kelas. Gambar 3.6. Tahapan Preprocess Langkah berikutnya adalah tahapan Classify. Pada menu Classify, dilakukan pemilihan terhadap teknik klasifikasi pohon keputusan dan k-NN. Tahapan ini juga bertujuan menghasilkan confusion matrix berdasarkan metode evaluasi 10-fold cross validation, dimana data sets dibagi menjadi 10 subsets 9 subsets sebagai training sets dan 1 subset sebagai testing set dengan jumlah 10 kali iterasi. Adapun classifier yang digunakan adalah J4.8 pohon keputusan dan Ibk k-NN. Gambar 3.7 menunjukkan tahapan Classify untuk menghasilkan confusion matrix pada data set diabetes.arff menggunakan classifier pohon keputusan. Universita Sumatera Utara 44 Gambar 3.7. Tahapan Classify

3.4.2. Aplikasi Perhitungan Akurasi

Pada tahap ini, penulis menggunakan aplikasi Confusion Matrix for Accuracy yang dibangun sendiri menggunakan Visual C versi 2010. Gambar 3.8 menunjukkan tampilan interface aplikasi perhitungan akurasi algoritma pohon keputusan dan k-NN. Gambar 3.8. Interface Confusion Matrix for Accuracy Confusion Matrix Universita Sumatera Utara 45 Pada Gambar 3.8 terdapat pilihan [1] TEKNIK KLASIFIKASI dan [2] DATA SETS. Teknik Klasifikasi yang dapat dipilih adalah Decision Tree Pohon Keputusan dan k-NN. Untuk data sets, terdapat 5 pilihan berupa BreastCancer, Car, Diabetes, Ionosphere, dan Iris. Tombol “Tampilkan” digunakan untuk menampilkan confusion matrix dan tombol “Kalkulasi” digunakan untuk melakukan perhitungan precision, recall, F-measure, dan success rate . Tombol “Detail” digunakan untuk menampilkan dan menyembunyikan table of confusion untuk setiap kelas yang ada, berdasarkan confusion matrix yang diperoleh. Universita Sumatera Utara

BAB 4 HASIL DAN PEMBAHASAN

Pada bagian ini, penulis menyajikan hasil dan pembahasan penelitian mengenai analisis akurasi algoritma klasifikasi pohon keputusan dan k-NN terhadap 5 data sets, yaitu BreastCancer, Car, Diabetes, Ionosphere, dan Iris berdasarkan confusion matrix. Penulis juga melakukan perbandingan terhadap kedua macam teknik klasifikasi tersebut melalui pengukuran performance dari sudut pandang akurasi Precision, Recall, F-measure, dan Success Rate.

4.1. Data Set BreastCancer