Gambar 4.2 Data Awal II Data mentah ini belum bisa diolah kedalam sistem karena ukuran dan
tidak fokusnya citra terhadap wajah. Data mentah ini harus diproses dalam tahap preprocessing.
4.1.1.1 Preprocessing
Tahap awal sebelum data masuk ke pengolahan data mining data masih bisa dikatakan sebagai data mentah yang harus melelaui proses preprocessing.
Tahap preprocessing yang harus dilalui adalah: 1.
Cropping dan Resize
Gambar 4.3 Cropping dan Resize
Proses pemotongan dan pengecilan citra menggunakan Adobe Photoshop
CS 5 Version 12.0 64x bits. Proses ini bertujuan mefokuskan citra pada wajah dan memperkecil ukuran citra yang awalnya berukuran 3456 x 5184 pixel bisa
dilihat pada gambar 4.3 menjadi 150x150 pixel pada gambar 4.4 dan gambar 4.5.
Gambar 4.4 Data I
Gambar 4.5 Data II
2. Grayscaling
Proses awal preprocessing adalah grayscaling keabu-abuan. Data citra yang berjumlah 200 citra wajah dirubah menjadi citra keabu-abuan dan disimpan
kedalam matriks S. Setiap baris matriks tersimpan satu orang yang mempunyai citra wajah 10 citra. Proses ini berulang hingga 20 kali sesuai dengan jumlah
orang, sehingga data citra wajah yang berjumlah 200 ini bisa masuk ke proses berikutnya yaitu eigenface.
3. Eigenface
Data yang sudah menjadi grayscale memasuki proses kedua dari reprocessing yaitu eigenface. Pada proses ini citra wajah diubah menjadi citra
eigenface. Hasil eigenface disimpan ke dalam matriks u yang di dalam setiap kolom tersimpan satu citra wajah yang sudah berbentuk citra eigenface, setiap
proses eigenface menyimpan satu set data satu orang di dalam matriks u yang panjang kolomnya sepanjang 22500. Panjang kolom ini bisa dipotong sesuai
dengan keinginan pengguna. Setelah dipotong hasil pemotongan data ini disimpan kedalam matriks hasileigface yang menampung 200 citra wajah eigenface yang
telah dipotong.
4.1.1.2 Proses
Pada proses ini adalah memproses data citra wajah menggunakan klasifikasi naïve bayes. Sebelum masuk inti proses naïve bayes data dipisah
terlebih dahulu menjadi data training dan data testing. Hasil dari pemisahan ini disimpan kedalam 2 matriks yaitu trainingsmuaorang dan testingsemuaorang,
trainingsmuaorang untuk menyimpan data citra wajah training dan
testingsemuaorang untuk menyimpan data citra wajah testing. Perhitungan naïve bayesian menggunakan fungsi matlab yaitu naivebayes.fit dan predict,
trainingsemuaorang diproses
menggunakan naivebayes.fit
kemudian testingsemuaorang
diproses menggunakan
predict. Fungsi
model =
naivebayes.fittrainingsemuaorang adalah fungsi matlab yang digunakan untuk mengolah data training sedangkan fungsi model.predicttestingsemuaorang
untuk mengolah data testing.
4.1.1.3 Output