34
Tabel 3.5. Informasi Atribut Data Set Iris No.
Atribut Nilai
1 Sepal-length cm
4.3 – 7.9
2 Sepal-width cm
2.0 – 4.4
3 Petal-length cm
1.0 – 6.9
4 Petal-width cm
0.1 – 2.5
5 Class
Iris-setosa, Iris-versicolor, Iris-virginica
3.3. Analisis Sistem
3.3.1. Pohon Keputusan
Dalam memperoleh model dengan algoritma pohon keputusan, digunakan langkah- langkah sebagai berikut.
1. Pemilihan salah satu data set penelitian.
2. Pemilihan classifier dengan menggunakan algoritma pohon keputusan C4.5
J4.8 pada WEKA. 3.
Melakukan pelatihan dan pengujianevaluasi terhadap model pohon keputusan dengan metode 10-fold cross validation pada WEKA.
4. Memperoleh confusion matrix.
5. Mengubah confusion matrix ke dalam table of confusion matriks 2 x 2 untuk
setiap kelas yang ada. 6.
Menghitung akurasi dalam bentuk penilaian precision, recall, F-measure, dan success rate dengan persamaan 2.6, 2.7, 2.8, 2.9, dan 2.10 untuk setiap
kelas berdasarkan table of confusion. 7.
Menghitung weighted average dari precision, recall, F-measure, dan success rate untuk setiap data set penelitian.
Adapun langkah-langkah pengukuran akurasi dengan algoritma pohon keputusan digambarkan dalam bentuk diagram alir pada Gambar 3.1 berikut ini.
Misalnya, data set yang digunakan adalah diabetes.arff.
Universita Sumatera Utara
35
Gambar 3.1. Diagram Alir Perhitungan Akurasi Pohon Keputusan pada Diabetes.arff
MULAI
DIABETES.ARFF
SELESAI CONFUSION MATRIX
PERHITUNGAN AKURASI DENGAN PERSAMAAN 2.6, 2.7, 2.8, 2.9, DAN 2.10 PER KELAS
PEMROSESAN PADA WEKA 3.7.8 PEMILIHAN CLASSIFIER POHON
KEPUTUSAN PELATIHAN TRAINING DATA SETS
UNTUK MEMPEROLEH MODEL PENGUJIAN MODEL DENGAN METODE
10-FOLD CROSS VALIDATION
KONVERSI CONFUSION MATRIX BERDASARKAN JUMLAH KELAS
TABLE OF CONFUSION
PRECISION, RECALL, F-MEASURE, SUCCESS RATE
PERHITUNGAN WEIGHTED AVERAGE AKURASI
WEIGHTED AVERAGE
Universita Sumatera Utara
36
3.3.2. k-Nearest Neighbor k-NN
Dalam memperoleh model dengan algoritma k-NN, digunakan langkah-langkah sebagai berikut.
1. Pemilihan salah satu data sets penelitian.
2. Pemilihan classifier dengan menggunakan algoritma k-NN IBk pada WEKA
dengan prinsip Nearest Neighbor. 3.
Melakukan pelatihan dan pengujianevaluasi model dengan metode 10-fold cross validation pada WEKA.
4. Memperoleh confusion matrix.
5. Mengubah confusion matrix ke dalam table of confusion matriks 2 x 2 untuk
setiap kelas yang ada. 6.
Menghitung akurasi dalam bentuk penilaian precision, recall, F-measure, dan success rate dengan persamaan 2.6, 2.7, 2.8, 2.9, dan 2.10 untuk setiap
kelas berdasarkan table of confusion. 7.
Menghitung weighted average dari precision, recall, F-measure, dan success rate untuk setiap data set penelitian.
Adapun langkah-langkah pengukuran akurasi dengan algoritma k-NN digambarkan dalam bentuk diagram alir pada Gambar 3.2 berikut ini. Misalnya, data
set yang digunakan adalah diabetes.arff.
Universita Sumatera Utara
37
Gambar 3.2. Diagram Alir Perhitungan Akurasi k-NN pada Diabetes.arff
MULAI
DIABETES.ARFF
SELESAI CONFUSION MATRIX
PERHITUNGAN AKURASI DENGAN PERSAMAAN 2.6, 2.7, 2.8, 2.9, DAN 2.10 PER KELAS
PEMROSESAN PADA WEKA 3.7.8 PEMILIHAN CLASSIFIER k-NN
PELATIHAN TRAINING DATA SETS UNTUK MEMPEROLEH MODEL
PENGUJIAN MODEL DENGAN METODE 10-FOLD CROSS VALIDATION
KONVERSI CONFUSION MATRIX BERDASARKAN JUMLAH KELAS
TABLE OF CONFUSION
PRECISION, RECALL, F-MEASURE, SUCCESS RATE
PERHITUNGAN WEIGHTED AVERAGE AKURASI
WEIGHTED AVERAGE
Universita Sumatera Utara
38
3.3.3. Metode 10-fold Cross Validation