Pohon Keputusan k-Nearest Neighbor k-NN

34 Tabel 3.5. Informasi Atribut Data Set Iris No. Atribut Nilai 1 Sepal-length cm 4.3 – 7.9 2 Sepal-width cm 2.0 – 4.4 3 Petal-length cm 1.0 – 6.9 4 Petal-width cm 0.1 – 2.5 5 Class Iris-setosa, Iris-versicolor, Iris-virginica

3.3. Analisis Sistem

3.3.1. Pohon Keputusan

Dalam memperoleh model dengan algoritma pohon keputusan, digunakan langkah- langkah sebagai berikut. 1. Pemilihan salah satu data set penelitian. 2. Pemilihan classifier dengan menggunakan algoritma pohon keputusan C4.5 J4.8 pada WEKA. 3. Melakukan pelatihan dan pengujianevaluasi terhadap model pohon keputusan dengan metode 10-fold cross validation pada WEKA. 4. Memperoleh confusion matrix. 5. Mengubah confusion matrix ke dalam table of confusion matriks 2 x 2 untuk setiap kelas yang ada. 6. Menghitung akurasi dalam bentuk penilaian precision, recall, F-measure, dan success rate dengan persamaan 2.6, 2.7, 2.8, 2.9, dan 2.10 untuk setiap kelas berdasarkan table of confusion. 7. Menghitung weighted average dari precision, recall, F-measure, dan success rate untuk setiap data set penelitian. Adapun langkah-langkah pengukuran akurasi dengan algoritma pohon keputusan digambarkan dalam bentuk diagram alir pada Gambar 3.1 berikut ini. Misalnya, data set yang digunakan adalah diabetes.arff. Universita Sumatera Utara 35 Gambar 3.1. Diagram Alir Perhitungan Akurasi Pohon Keputusan pada Diabetes.arff MULAI DIABETES.ARFF SELESAI CONFUSION MATRIX PERHITUNGAN AKURASI DENGAN PERSAMAAN 2.6, 2.7, 2.8, 2.9, DAN 2.10 PER KELAS PEMROSESAN PADA WEKA 3.7.8  PEMILIHAN CLASSIFIER POHON KEPUTUSAN  PELATIHAN TRAINING DATA SETS UNTUK MEMPEROLEH MODEL  PENGUJIAN MODEL DENGAN METODE 10-FOLD CROSS VALIDATION KONVERSI CONFUSION MATRIX BERDASARKAN JUMLAH KELAS TABLE OF CONFUSION PRECISION, RECALL, F-MEASURE, SUCCESS RATE PERHITUNGAN WEIGHTED AVERAGE AKURASI WEIGHTED AVERAGE Universita Sumatera Utara 36

3.3.2. k-Nearest Neighbor k-NN

Dalam memperoleh model dengan algoritma k-NN, digunakan langkah-langkah sebagai berikut. 1. Pemilihan salah satu data sets penelitian. 2. Pemilihan classifier dengan menggunakan algoritma k-NN IBk pada WEKA dengan prinsip Nearest Neighbor. 3. Melakukan pelatihan dan pengujianevaluasi model dengan metode 10-fold cross validation pada WEKA. 4. Memperoleh confusion matrix. 5. Mengubah confusion matrix ke dalam table of confusion matriks 2 x 2 untuk setiap kelas yang ada. 6. Menghitung akurasi dalam bentuk penilaian precision, recall, F-measure, dan success rate dengan persamaan 2.6, 2.7, 2.8, 2.9, dan 2.10 untuk setiap kelas berdasarkan table of confusion. 7. Menghitung weighted average dari precision, recall, F-measure, dan success rate untuk setiap data set penelitian. Adapun langkah-langkah pengukuran akurasi dengan algoritma k-NN digambarkan dalam bentuk diagram alir pada Gambar 3.2 berikut ini. Misalnya, data set yang digunakan adalah diabetes.arff. Universita Sumatera Utara 37 Gambar 3.2. Diagram Alir Perhitungan Akurasi k-NN pada Diabetes.arff MULAI DIABETES.ARFF SELESAI CONFUSION MATRIX PERHITUNGAN AKURASI DENGAN PERSAMAAN 2.6, 2.7, 2.8, 2.9, DAN 2.10 PER KELAS PEMROSESAN PADA WEKA 3.7.8  PEMILIHAN CLASSIFIER k-NN  PELATIHAN TRAINING DATA SETS UNTUK MEMPEROLEH MODEL  PENGUJIAN MODEL DENGAN METODE 10-FOLD CROSS VALIDATION KONVERSI CONFUSION MATRIX BERDASARKAN JUMLAH KELAS TABLE OF CONFUSION PRECISION, RECALL, F-MEASURE, SUCCESS RATE PERHITUNGAN WEIGHTED AVERAGE AKURASI WEIGHTED AVERAGE Universita Sumatera Utara 38

3.3.3. Metode 10-fold Cross Validation