mampu membantu pengembang perangkat lunak untuk mendalami metode tersebut sehingga dapat mengurangi permasalahan yang sudah disebutkan diatas.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah disebutkan sebelumnya, maka dapat dirumuskan permasalahan, yaitu:
1. Bagaimana metode eigenface dapat mengekstrasi ciri citra wajah?
2. Berapa akurasi pengenalan wajah menggunakan klasifikasi naive bayesian
dalam mengenali wajah?
1.3 Tujuan
Adapun tujuan dari penelitian ini, antara lain : 1. Menerapkan metode eigenface untuk mengektraksi ciri citra wajah dengan
baik. 2. Mengetahui akurasi pengenalan wajah menggunakan klasifikasi naive
bayesian.
1.4 Batasan Masalah
1. Citra digital hanya dapat menggunakan tampilan background polos
sehingga tidak ada obyek-obyek dibelakangnya. 2.
Sistem hanya berbentuk prototype yang dibuat menggunakan MATLAB. 3.
Data sebanyak 200 citra wajah dari 20 orang dimana setiap orang memiliki 10 citra wajah dengan berbagai ekspresi.
4. Data citra wajah berukuran 150x150 pixels. Proses resize dan cropping
dilakukan diluar sistem.
2 BAB II
Landasan Teori
Landasan teori digunakan untuk menjelaskan teori yang akan digunakan pada penelitian ini, diantaranya pengertian wajah, eigenface, naive bayesian dan
Principal Component Analysis PCA.
2.1 Pengenalan Wajah
Wajah atau muka adalah bagian depan dari kepala manusia meliputi wilayah dari dahi hingga dagu, termasuk rambut, alis, mata, hidung, pipi, mulut,
bibir, gigi, kulit, dan dagu Sugiono, 2008. Elemen-elemen itulah yang menjadi pembeda antara wajah satu dengan yang lain. Selain elemen fisik ada faktor-faktor
lain yang mempengaruhi wajah yaitu: syaraf dan pembuluh darah, trauma fisik dan hasil pembedahan, ekspresi karena pembuluh, air mata dan keringat,
kesakitan dan kelelahan, gender, ras, pertumbuhan dan usia. Oleh karena itu tidak ada satu wajahpun yang serupa mutlak, bahkan pada manusia kembar identik
sekalipun karena wajah terutama digunakan untuk ekspresi wajah, penampilan serta identitas Sitorus dkk, 2006.
2.1.1 Pengertian Pengenalan Wajah
Pengenalan wajah adalah suatu teknologi yang disebut biometrik yang sudah lama digunakan. Teknologi biometrik pada wajah ini sudah banyak
digunakan pada isntansi-instansi pemerintah maupun swasta seperti perkantoran swasta maupun negeri, kepolisian, kemiliteran, dan perumahan. Teknologi
biometrik itu diaplikasikan pada sistem absesnsi, sistem pembuatan SIM Surat
Izin Mengemudi, sistem keamanan rumah,dan sistem pengamanan komputer pribadi.
Pada pengenalan wajah langkah yang dikerjakan adalah melakukan pengenalan wajah secara mandiri atau otomatis yang lalu akan disimpan pada
suatau basis data tertententu.
2.1.2 Tahapan Pengenalan Wajah
Dalam melakukan pengenalan wajah face recognition, ada beberapa tahapan proses yang harus dilalui, seperti :
Gambar 2.1 PengenalanWajah Zhao dan Chellapa, 2006 Deteksi wajah face detection merupakan proses awal yang harus
dilakukan pada citra input untuk mendeteksi adanya citra wajah di dalam citra masukan. Namun, berdasarkan Gambar 2.1 tahap-tahap proses pengenalan wajah
dikelompokkan menjadi 2 bagian, yaitu proses ekstraksi ciri dan proses pengenalan wajah Zhao dan Chellapa, 2006. Proses deteksi wajah akan
dilakukan bersama dalam proses ekstraksi ciri. Hal ini dikarenakan dalam proses deteksi wajah diperlukan ekstraksi ciri di dalam citra masukan yang akan
mendeteksi apakah citra masukan merupakan citra yang mengandung ciri wajah.
Citra Input Deteksi
Wajah Ektrak Ciri
Pengenalan Wajah
Vertifikasi
Bersamaan
2.1.3 Ekstrasi Ciri
Secara umum, Zhao dan Chellapa 2006 menjelaskan ada dua macam ciri feature pada wajah, yaitu holistic features dan facial feature. Facial feature
contoh cirinya adalah warna dan bentuk, besar dan letak hidung, mulut, mata, telinga, dan lain-lain. Sedangkan pada holistic features setiap cirinya adalah
merupakan suatu karakteristik dari seluruh wajah. Wajah dianggap sebagai kesatuan yang utuh. Untuk melakukan ekstrak ciri pada wajah, Zhao dan
Chellapa, 2006 membedakan teknik pengenalan wajah menjadi tiga metode, sebagai berikut:
a Holistic methods
Metode ini digunakan untuk menyelesaikan kasus holistic features yaitu mencari informasi secara keseluruhan pada wajah.
b Features-based
Metode ini digunakan untuk menyelesaikan kasus facial features yaitu mencari informasi berdasarkan ciri yang ada pada wajah seperti
hidung, mata, telinga, dan lain-lain. c
Hybrid methods Metode ini merupakan penggabungan dari metode holistic methods
dan features-based.
2.2 Metode Eigenface
Kata eigenface sebenarnya berasal dari bahasa jerman yaitu “eigenwert”
dimana “eigen” artinya karakteristik dan “wert” artinya nilai. Eigenface adalah salah satu algoritma pengenalan pola wajah yang berdasarkan pada Principle
Component Analysis PCA yang dikembangkan di MIT. Banyak penulis lebih menyukai istilah eigen image. Teknik ini telah digunakan pada pengenalan tulisan
tangan, pembacaan bibir, pengenalan suara dan pencitraan medis. Menurut layman Al Fatta, 2009 Eigenface adalah sekumpulan unsur wajah yang telah
dibuat standar yang diambil dari analisis statistik dari banyak gambar wajah. Algoritma eigenface secara keseluruhan cukup sederhana. Training image
direpresentasikan dalam sebuah vector flat gabungan vektor dan digabung bersama-sama menjadi sebuah matriks tunggal. Eigenface dari masing-masing
citra kemudian diekstraksi dan disimpan dalam file temporary atau database. Test image yang masuk didefinisikan juga nilai eigenfaces-nya dan dibandingkan
dengan eigenfaces dari image database atau file temporary Prasetyo dan Rahmatun, 2008.
Cara perhitungannya dilakukan dengan cara: 1.
Pencarian matriks A berukuran N x N dapat dihitung dengan : . = � .
2.1 λ dinamakan eigenvalue dari matriks A, sedangkan x merupakan
eigenvector yang sama dengan scalar λ. 2.
Pencarian determinan dari matriks A dengan rumus : | − �| =
2.2 3.
Setelah nilai eigenvalue � ditemukan langkah selanjutnya adalah mencari eigenvektor dengan menggunakan rumus :
− �� . = 2.3
2.2.1 Principal Component Analysis PCA
Principal Component Analysis PCA adalah sebuah transformasi linier yang biasa digunakan untuk mereduksi data. Principal Component Analysis
PCA adalah sebuah teknik statistika yang berguna pada bidang pengenalan, klasifikasi dan mereduksi data citra. PCA juga merupakan teknik yang umum
digunakan. Karena Principal Component Analysis PCA sangat ampuh untuk mereduksi data baik seperti teks, citra, dan sinyal.
2.2.2 Proses Principal Component Analysis PCA Eigenface
Proses perhitungan PCA dapat dilakukan dengan langkah-langkah sebagai berikut Fatta, 2009
1. Mengambil satu set training citra wajah M. Misalkan M berjumlah 10 buah citra wajah.
2. Inisialisasi untuk tiap citra wajah dari set training. r adalah sebuah vektor
× berdasarkan matriks dari citra wajah yang berukuran NxN. 3. Menghitung rata-rata vektor citra wajah
=
�
∑
� �
�=
2.4 4. Melakukan normalisasi ukuran citra dengan melakukan pengurangan
vektor citra wajah dengan nilai rata-rata tersebut. =
�
− 2.5
5. Menghitung matriks kovarian
=
�
∑
� � �
=
�
�
� �=
2.6 Dimana
= [ … .
�
] � 2.7
6. Dikarenakan ukuran matriks terlalu besar, maka pencarian matriks kovarian menjadi :
=
�
2.8 7. Menghitung eigenvalue λ dan eigenvector x dari matriks kovarian
=
�
2.9
8. Menghitung eigenvector sebanyak M dari matriks kovarian =
�
2.10 dengan persamaan :
�
= .
�
2.11 9. Melakukan normalisasi terhadap u.
10. Mengumpulkan eigenvector sebanyak K.
2.2.3 Contoh Perhitungan Eigenface
1. Terdapat 3 buah image yang masing-masing mempunyai 2x2 matriks.
Image1 = [
][ ]
Image1 = [
][ ]
Image1 = [
][ ]
2. Lalu ditransformasikan ke matriks
× �
S = [
]
3. Mencari rata-rata vector
+ + =
= . + +
= = .
+ + =
= + +
= = .
Sehingga didapatkan :
= | .
. .
|
4. Mengurangi vector citra wajah dengan nilai Y
[ ] − | .
. .
| = [ − .
− . −
− . ]
[ ] − | .
. .
| = [ − .
. .
]
[ ] − | .
. .
| = [ .
. −
. ]
5. Selanjutnya, , ,
digabungkan menjadi satu matriks A
= [ − .
− . −
− . − .
. .
. .
− .
]
6. Menghitung kovarian menggunakan rumus
�
= [ − .
− . .
− . .
. −
− − .
. .
] ×
[ − .
− . −
− . − .
. .
. .
− .
]
= [ .
− − .
− .
− . − .
− . ]
7. Menghitung eigenvalue dan eigenvector dari korvarian matriks . Untuk
mempermudahkan perhitungan maka angka dirubah = [
− −
− ]
[ − �
− −
− � −
−� ] =
− � ∗ { − � −� − − } −
∗ { − −� − −
− } + ∗ { −
− − � − } =
− � {− � + � + } − + −� + =
− � { � − � + } + = − � { � − � + } =
− � � − � −
� = � = � = 8.
Eigenvalue � , � , � yang didapat dari matriks
digunakan untuk menghitung eigenvektor
Untuk � =
[ −
− −
− −
− ] [ ] =
[− −
− −
] [ ] =
Diperolehlah persamaan: − +
= − +
= − +
= Langkah selanjutnya dilakukan proses eliminasi sehingga diperoleh,
[ ] = [ ]
Eigenvektornya adalah [ ]
Untuk � =
[ −
− −
− −
− ] [ ] =
[− −
− −
] [ ] =
Diperolehlah persamaan: −
= − +
− = − +
− = Langkah selanjutnya dilakukan proses eliminasi sehingga diperoleh,
[ ] = [ −
]
Eigenvektornya adalah [
− ]
Untuk � =
[ −
− −
− −
− ] [ ] =
[− −
− −
] [ ] =
Diperolehlah persamaan: − =
− + − = − +
− =
Langkah selanjutnya dilakukan proses eliminasi sehingga diperoleh,
[ ] = [ ]
Eigenvektornya adalah [ ]
9. Menghitung eigenvektor sebanyak M dari matriks .
�
= .
�
= [ − .
− . −
− . − .
. .
. .
− .
] × [ ] = [ −
− −
− ]
= [ − .
− . −
− . − .
. .
. .
− .
] × [ −
] = [ ]
= [ − .
− . −
− . − .
. .
. .
− .
] × [ ] = [ − .
. .
]
10. Setelah itu eigenvalue diurutkan dari yang paling kecil sampai yang
paling besar. Tabel 2.1 Hasil eigen value dan eigen vektor
Eigenvalue Eigenvektor
λ=3 -1.3333
0.6667 3
0.3333
λ=2 -8
-6 -1
-1 λ=1
8 6
1 1
11. Memproyeksikan
�
kedalam eigenspace
=
[− . .
. ] × [
− . − .
− − .
] = − .
[− . .
. ] × [
− . .
. ] =
.
[− . .
. ] × [
. .
− .
] = − .
=
[− −
− − ] × [
− . − .
− − .
] = .
[− −
− − ] × [
− . .
. ] = .
[− −
− − ] × [
. .
− .
] = − .
=
[ − ] × [
− . − .
− − .
] = − .
[ − ] × [
− . .
. ] = − .
[ − ] × [
. .
− .
] = .
12. Memasukkan nilai
�
kedalam sebuah vector � = [
− . .
− . .
. − .
− . − .
. ]
13. Langkah selanjutnya dari matriks omega ini di cari mean µ dan standar
deviasi σ.
14. � = [
− . .
− . .
. − .
− . − .
. ]
2.3 Naive Bayesian
Bayesian filter atau Naive Bayes Classifier merupakan metode terbaru untuk mengklasifikasikan dokumen. Algoritma ini adalah metode probabilitas dan
dikemukakan oleh ilmuwan Inggris bernama Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman sebelumnya. Dasar dari
teorema Naive Bayes digunakan dalam pemrograman adalah rumus Naive Bayes sebagai berikut ini:
│ = │ ∗
2.12 P A|B = Probabilitas yang dihitung Posterior dari peristiwa A karena
adanya informasi yang dikandung dalam peristiwa B. P B|A = Probabilitas yang dihitung Posterior dari peristiwa B karena
adanya informasi yang dikandung dalam peristiwa A. P A = Probabilitas tak bersyarat atau disebut probabilitas awal Prior
dari peristiwa A. P B = Probabilitas tak bersyarat atau disebut probabilitas awal Prior
dari peristiwa B.
2.3.1 Klasifikasi Naive Bayesian
Jika X adalah vektor masukkan yang berisi fitur dan Y adalah label kelas, Naïve Bayes dituliskan dengan P X|Y. Notasi tersebut berarti probabilitas label
kelas Y didapatkan setelah fitur-fitur X diamati. Notasi ini disebut juga probabilitas akhir posterior probability untuk Y, sedangkan P Y disebut
probabilitas awal prior probability Y.
Selama proses pelatihan harus dilakukan pembelajaran probabilitas akhir P Y|X pada model untuk setiap kombinasi X dan Y bedasarkan informasi yang
didapat dari data latih. Dengan membangun model terse but, suatu data uji X’
dapat diklasifikasikan dengan mencari nilai Y’ dengan memaksimalkan nilai PX’|Y’.
Yang lalu didapatkan rumus Naïve Bayes untuk klasifikasi sebagai berikut:
| =
� ∏
� �|
� �=1
�
2.13 PY|X adalah probabilitas data dengan vektor X pada kelas Y. PY
adalah probabilitas awal kelas Y. ∏
�
|
� �=
adalah probabilitas independen kelas Y dari semua fitur dalam vektor X. Nilai PX selalu tetap sehingga dalam
perhitungan prediksi
selanjutnya tinggal
menghitung bagian
∏
�
|
� �=
dengan memilih yang terbesar sebagai kelas yagg dipilih sebagai hasil prediksi. Sementara probabilitas independen
∏
�
|
� �=
tersebut merupakan pengaruh semua fitur dari data terhadap setiap kelas Y.
Naive bayesian memiliki bentuk peluang kelas bersyarat untuk atribut kontinyu. Distribusi dikarakterisasi dengan dua parameter yaitu mean,
, dan varian,
2
. Untuk tiap kelas
j
y , peluang kelas bersyarat untuk atribut
i
X adalah
ij ij
i
x ij
j i
i
y Y
x X
P
2 2
2
exp 2
1
2.14
Parameter
ij
dapat diestimasi berdasarkan sampel mean
i
X
x untuk seluruh
training record yang dimiliki kelas
j
y . Dengan cara sama,
ij 2
dapat diestimasi dari sampel varian
2
s training record tersebut.
2.3.2 Contoh Perhitungan Naive Bayesian
Terdapat data sebagai berikut: Tabel 2.2 Tabel IPK
IPK
Tidak
Lulus
2
3.5
3
3.25
2
2.75
2.5
3.5
1.6
4
2.5
3.75
2.3
2.25
3.25
3.8
Jika terdapat IPK 3.5 nilai tersebut dikategorikan lulus atau tidak. Langkah pertama adalah menentukan rata-rata dan standar deviasi untuk masing-masing
kelas.
Tabel 2.3 Hasil IPK IPK
Tidak Lulus
2 3.5
3 3.25
2 2.75
2.5 3.5
1.6 4
2.5 3.75
2.3 2.25
3.25 3.8
Mean 2.39375
3.35 Standar Deviasi
0.544083 0.586759
Kemudian nilai mean dan standar deviasi dimasukkan kedalam rumus naive bayesian bersarat pada rumus 2.14. Setelah itu dihasilkan nilai sebagai
berikut: Tabel 2.4 Hasil Uji IPK
gIPK= . 5,m,σ|Tidak
0.73342325 0.289865
0.212593567 gIPK= . 5,m,σ|Lulus
0.680081055 0.985582
0.670275732
Dihasilkan nilai IPK 3,25 mirip dengan data training lulus jadi dapat disimpulkan bahwa jika IPK 3,25 kemungkinan besar lulus.
2.4 Confusion Matrix
Fungsi confusion matrix adalah mebghitung seberapa tepat dan lengkap klasifikasi terhadap suatu kelas data. Isi dari confusion matrix adalah informasi
hasil actual dan prediksi yang dihasilkan oleh pengklasifikasian. Tabel 2.5 Confusion Matrix
Prediksi negatif
positif Asli
negatif
A B
positif
C D
A adalah jumlah nilai prediksi benar ketika contoh negatif. B adalah jumlah nilai prediksi salah ketika contoh positif.
C adalah jumlah nilai prediksi salah ketika contoh negatif. D adalah jumlah nilai prediksi benar ketika contoh positif.
Akurasi adalah hasil dari penjumlahan nilai diagonal dibagi dengan jumlah total keseluruhan data dan selajutnya dikalikan 100.
=
+ + + +
× 2.14
Contoh perhitungan akurasi dapat dicontohkan sebagai berikut:
Tabel 2.6 Contoh Confusion Matrix
1 1
1 1
1 1
2 2
2 1
1 2
1 1
6 6
6
= ×
=
3 BAB III
METODOLOGI
Berdasarkan pada landasan teori yang telah disampaikan pada bab kedua di atas, pada bab ini dibahas metodologi yang akan digunakan pada penelitian ini.
Bab ini berisi tentang blok diagram, data, tatap muka pengguna dan contoh perhitungan.
3.1 Metode Pengumpulan Data
Mengambil 200 citra wajah mahasiswa Universitas Sanata Dharma Program Studi Teknik Informatika angkatan 2011 dikarenakan data sangat mudah
untuk didapat dan data yang dihasilkan adalah data yang nyata.
3.2 Teknik Analisis Data