Preprocessing Proses Pengolahan Data

Gambar 4.2 Data Awal II Data mentah ini belum bisa diolah kedalam sistem karena ukuran dan tidak fokusnya citra terhadap wajah. Data mentah ini harus diproses dalam tahap preprocessing.

4.1.1.1 Preprocessing

Tahap awal sebelum data masuk ke pengolahan data mining data masih bisa dikatakan sebagai data mentah yang harus melelaui proses preprocessing. Tahap preprocessing yang harus dilalui adalah: 1. Cropping dan Resize Gambar 4.3 Cropping dan Resize Proses pemotongan dan pengecilan citra menggunakan Adobe Photoshop CS 5 Version 12.0 64x bits. Proses ini bertujuan mefokuskan citra pada wajah dan memperkecil ukuran citra yang awalnya berukuran 3456 x 5184 pixel bisa dilihat pada gambar 4.3 menjadi 150x150 pixel pada gambar 4.4 dan gambar 4.5. Gambar 4.4 Data I Gambar 4.5 Data II 2. Grayscaling Proses awal preprocessing adalah grayscaling keabu-abuan. Data citra yang berjumlah 200 citra wajah dirubah menjadi citra keabu-abuan dan disimpan kedalam matriks S. Setiap baris matriks tersimpan satu orang yang mempunyai citra wajah 10 citra. Proses ini berulang hingga 20 kali sesuai dengan jumlah orang, sehingga data citra wajah yang berjumlah 200 ini bisa masuk ke proses berikutnya yaitu eigenface. 3. Eigenface Data yang sudah menjadi grayscale memasuki proses kedua dari reprocessing yaitu eigenface. Pada proses ini citra wajah diubah menjadi citra eigenface. Hasil eigenface disimpan ke dalam matriks u yang di dalam setiap kolom tersimpan satu citra wajah yang sudah berbentuk citra eigenface, setiap proses eigenface menyimpan satu set data satu orang di dalam matriks u yang panjang kolomnya sepanjang 22500. Panjang kolom ini bisa dipotong sesuai dengan keinginan pengguna. Setelah dipotong hasil pemotongan data ini disimpan kedalam matriks hasileigface yang menampung 200 citra wajah eigenface yang telah dipotong.

4.1.1.2 Proses

Pada proses ini adalah memproses data citra wajah menggunakan klasifikasi naïve bayes. Sebelum masuk inti proses naïve bayes data dipisah terlebih dahulu menjadi data training dan data testing. Hasil dari pemisahan ini disimpan kedalam 2 matriks yaitu trainingsmuaorang dan testingsemuaorang, trainingsmuaorang untuk menyimpan data citra wajah training dan testingsemuaorang untuk menyimpan data citra wajah testing. Perhitungan naïve bayesian menggunakan fungsi matlab yaitu naivebayes.fit dan predict, trainingsemuaorang diproses menggunakan naivebayes.fit kemudian testingsemuaorang diproses menggunakan predict. Fungsi model = naivebayes.fittrainingsemuaorang adalah fungsi matlab yang digunakan untuk mengolah data training sedangkan fungsi model.predicttestingsemuaorang untuk mengolah data testing.

4.1.1.3 Output