Proses Klasifikasi Citra K-Fold Cross Validation

pada persamaan 9 dan 10 memiliki ciri yang sama Yambor 2000. Selanjutnya dihitung nilai eigen pada persamaan 2 seperti yang dilakukan pada sistem berbasis fitur sampai dengan pengujian data wajah 5.

2.4 Proses Klasifikasi Citra

Algoritma k-NN adalah sebuah metode yang digunakan untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut atau algoritma based-learning instant yang dapat menormalisasikan suatu data set Hinneburg et al. 2000. Pada penelitian ini k- NN dipakai karena algoritma k-NN memberikan hasil yang mendekati optimal. Ada dua fase dalam algoritma k-NN yaitu fase pembelajaran dan fase klasifikasi. Data pembelajaran merupakan data jarak garis wajah yang diproyeksikan ke ruangan berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur suatu data. Pada fase pembelajaran, algoritma ini melakukan penyimpanan vektor-vektor fitur dan klasifikasi data jarak garis wajah. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk data test yang klasifikasinya tidak diketahui. Jarak dari vektor yang baru ini terhadap seluruh vektor data pembelajaran dihitung. Sejumlah k buah yang paling dekat yang diambil. k-NN akan menentukan hasil klasifikasi dengan melihat jumlah kemunculan dari kelas dalam k-NN yang dipilih. Kelas yang paling banyak muncul akan menjadi kelas hasil klasifikasi. Algoritma ini dapat dihitung dengan persamaan 11. 11 Pada data wajah berbasis fitur yang telah diurutkan dari kecil ke besar kemudian ditentukan k yang ke-5, k yang ke-10 dan k yang ke-20 dalam pengklasifikasian tersebut. Jarak terdekat dan yang paling sering muncul adalah kelas hasil klasifikasi. Hal yang sama juga dilakukan pada data wajah berbasis citra.

2.5 K-Fold Cross Validation

Ada beberapa teknik untuk mengestimasi tingkat kesalahan yang telah dikembangkan pada bidang pengenalan pola, salah satunya adalah k-fold cross validation. Cara kerjanya adalah melakukan pengelompokkan antara data latih dan data uji yang saling asing atau terpisah dan tidak ada irisan, kemudian dilakukan proses pengujian yang diulang sebanyak k kali. Hasil pengujian itu kemudian dirata-ratakan untuk menghasilkan sebuah nilai Fauzie 2010. Langkah-langkah teknik k-fold cross validation Pratiwi 2010 adalah sebagai berikut: 1. Membagi data yang ada menjadi k kelompok 2. Untuk setiap k, buat sejumlah T himpunan data yang memuat semua data latih kecuali yang berada di kelompok ke-k. 3. Kerjakan algoritma yang dimiliki dengan sejumlah T data latih. 4. Uji algoritma ini dengan menggunakan data pada kelompok ‘k’ sebagai data uji. 5. Lakukan pencatatan hasil algoritma. K-fold cross validation sangat tepat dan berguna ketika menentukan nilai yang tepat untuk k. Teknik ini tidak membutuhkan waktu banyak untuk membuat data uji yang ada. Keuntungan teknik k-fold cross validation adalah bahwa semua elemen pada basis data digunakan untuk pelatihan sekaligus pengujian Pratiwi 2010.

2.6 Salt and pepper Noise