2.5 K-Fold Cross Validation
K-Fold Cross Validation adalah metode yang digunakan dalam proses pengujian klasifikasi data. Data dibagi menjadi k bagian kemudian bagian
satu dan bagian yang lain ditukar-tukar sebanyak k Tan, Steinbach, Kumar, 2006.
Sebagai contoh data dibagi menjadi 2 bagian dengan jumlah yang sama. Pertama data bagian 1 digunakan sebagai data pelatihan dan data bagian 2
digunakan sebagai data pengujian. Kedua data bagian 2 digunakan sebagai data pelatihan dan data bagian 1 digunakan sebagai data pengujian. Contoh
ini disebut sebagai 2-Fold Cross Validation. K-Fold Cross Validation menjadikan data pelatihan dan pengujian tidak
sama. Data pelatihan tidak digunakan sebagai data pengujian.
2.6 Confusion Matrix
Data pelatihan dan pengujian merupakan data yang berbeda sehingga klasifikasi dapat diuji dengan benar. Akurasi dari klasifikasi dihitung dari
jumlah data yang dikenali sesuai dengan target kelasnya. Perhitungan akurasi klasifikasi data dihitung menggunakan tabel yang bernama Confusion Matrix
Tan, Steinbach, Kumar, 2006. Pada tabel 2.1 merupakan Confusion Matrix untuk klasifikasi 2 kelas.
Tabel 2.1 Confusion Matrix 2 kelas Tan, Steinbach, Kumar, 2006. Hasil pengujian
1 Target
kelas 1
F11 F10
F01 F00
Fij adalah jumlah data yang dikenali sebagai kelas j dengan target kelas i. Dari Tabel 2.1 didapat persamaan-persamaan untuk menghitung akurasi
dan tingkat kesalahan suatu klasifikasi: 1.
Persamaan untuk menghitung akurasi keseluruhan klasifikasi =
ℎ
ℎ
=
� +� � +� +� +�
2.28 2.
Persamaan untuk menghitung error keseluruhan klasifikasi =
ℎ
ℎ
=
� +� � +� +� +�
2.29 3.
Persamaan untuk menghitung akurasi klasifikasi kelas 1 =
ℎ
ℎ
=
� � +�
2.30 4.
Persamaan untuk menghitung error klasifikasi kelas 1 =
ℎ
ℎ
=
� � +�
2.31 5.
Persamaan untuk menghitung akurasi klasifikasi kelas 0 =
ℎ
ℎ
=
� � +�
2.32 6.
Persamaan untuk menghitung error klasifikasi kelas 0 =
ℎ
ℎ
=
� � +�
2.33
24
3. BAB III