K-Fold Cross Validation Confusion Matrix

2.5 K-Fold Cross Validation

K-Fold Cross Validation adalah metode yang digunakan dalam proses pengujian klasifikasi data. Data dibagi menjadi k bagian kemudian bagian satu dan bagian yang lain ditukar-tukar sebanyak k Tan, Steinbach, Kumar, 2006. Sebagai contoh data dibagi menjadi 2 bagian dengan jumlah yang sama. Pertama data bagian 1 digunakan sebagai data pelatihan dan data bagian 2 digunakan sebagai data pengujian. Kedua data bagian 2 digunakan sebagai data pelatihan dan data bagian 1 digunakan sebagai data pengujian. Contoh ini disebut sebagai 2-Fold Cross Validation. K-Fold Cross Validation menjadikan data pelatihan dan pengujian tidak sama. Data pelatihan tidak digunakan sebagai data pengujian.

2.6 Confusion Matrix

Data pelatihan dan pengujian merupakan data yang berbeda sehingga klasifikasi dapat diuji dengan benar. Akurasi dari klasifikasi dihitung dari jumlah data yang dikenali sesuai dengan target kelasnya. Perhitungan akurasi klasifikasi data dihitung menggunakan tabel yang bernama Confusion Matrix Tan, Steinbach, Kumar, 2006. Pada tabel 2.1 merupakan Confusion Matrix untuk klasifikasi 2 kelas. Tabel 2.1 Confusion Matrix 2 kelas Tan, Steinbach, Kumar, 2006. Hasil pengujian 1 Target kelas 1 F11 F10 F01 F00 Fij adalah jumlah data yang dikenali sebagai kelas j dengan target kelas i. Dari Tabel 2.1 didapat persamaan-persamaan untuk menghitung akurasi dan tingkat kesalahan suatu klasifikasi: 1. Persamaan untuk menghitung akurasi keseluruhan klasifikasi = ⁡ ℎ⁡ ⁡ ⁡ ⁡ ℎ⁡ ⁡ = ⁡ � +� � +� +� +� 2.28 2. Persamaan untuk menghitung error keseluruhan klasifikasi = ⁡ ℎ⁡ ⁡ ⁡ ⁡ ⁡ ℎ⁡ ⁡ = ⁡ � +� � +� +� +� 2.29 3. Persamaan untuk menghitung akurasi klasifikasi kelas 1 = ⁡ ℎ⁡ ⁡ ⁡ ⁡ ⁡ ℎ⁡ ⁡ ⁡ ⁡ = ⁡ � � +� 2.30 4. Persamaan untuk menghitung error klasifikasi kelas 1 = ⁡ ℎ⁡ ⁡ ⁡ ⁡ ⁡ ⁡ ℎ⁡ ⁡ ⁡ ⁡ = ⁡ � � +� 2.31 5. Persamaan untuk menghitung akurasi klasifikasi kelas 0 = ⁡ ℎ⁡ ⁡ ⁡ ⁡ ⁡ ℎ⁡ ⁡ ⁡ ⁡ = ⁡ � � +� 2.32 6. Persamaan untuk menghitung error klasifikasi kelas 0 = ⁡ ℎ⁡ ⁡ ⁡ ⁡ ⁡ ⁡ ℎ⁡ ⁡ ⁡ ⁡ = ⁡ � � +� 2.33 24

3. BAB III