Batasan Masalah Confusion Matrix Metode Pengumpulan Data

mampu membantu pengembang perangkat lunak untuk mendalami metode tersebut sehingga dapat mengurangi permasalahan yang sudah disebutkan diatas.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah disebutkan sebelumnya, maka dapat dirumuskan permasalahan, yaitu: 1. Bagaimana metode eigenface dapat mengekstrasi ciri citra wajah? 2. Berapa akurasi pengenalan wajah menggunakan klasifikasi naive bayesian dalam mengenali wajah?

1.3 Tujuan

Adapun tujuan dari penelitian ini, antara lain : 1. Menerapkan metode eigenface untuk mengektraksi ciri citra wajah dengan baik. 2. Mengetahui akurasi pengenalan wajah menggunakan klasifikasi naive bayesian.

1.4 Batasan Masalah

1. Citra digital hanya dapat menggunakan tampilan background polos sehingga tidak ada obyek-obyek dibelakangnya. 2. Sistem hanya berbentuk prototype yang dibuat menggunakan MATLAB. 3. Data sebanyak 200 citra wajah dari 20 orang dimana setiap orang memiliki 10 citra wajah dengan berbagai ekspresi. 4. Data citra wajah berukuran 150x150 pixels. Proses resize dan cropping dilakukan diluar sistem. 2 BAB II Landasan Teori Landasan teori digunakan untuk menjelaskan teori yang akan digunakan pada penelitian ini, diantaranya pengertian wajah, eigenface, naive bayesian dan Principal Component Analysis PCA.

2.1 Pengenalan Wajah

Wajah atau muka adalah bagian depan dari kepala manusia meliputi wilayah dari dahi hingga dagu, termasuk rambut, alis, mata, hidung, pipi, mulut, bibir, gigi, kulit, dan dagu Sugiono, 2008. Elemen-elemen itulah yang menjadi pembeda antara wajah satu dengan yang lain. Selain elemen fisik ada faktor-faktor lain yang mempengaruhi wajah yaitu: syaraf dan pembuluh darah, trauma fisik dan hasil pembedahan, ekspresi karena pembuluh, air mata dan keringat, kesakitan dan kelelahan, gender, ras, pertumbuhan dan usia. Oleh karena itu tidak ada satu wajahpun yang serupa mutlak, bahkan pada manusia kembar identik sekalipun karena wajah terutama digunakan untuk ekspresi wajah, penampilan serta identitas Sitorus dkk, 2006.

2.1.1 Pengertian Pengenalan Wajah

Pengenalan wajah adalah suatu teknologi yang disebut biometrik yang sudah lama digunakan. Teknologi biometrik pada wajah ini sudah banyak digunakan pada isntansi-instansi pemerintah maupun swasta seperti perkantoran swasta maupun negeri, kepolisian, kemiliteran, dan perumahan. Teknologi biometrik itu diaplikasikan pada sistem absesnsi, sistem pembuatan SIM Surat Izin Mengemudi, sistem keamanan rumah,dan sistem pengamanan komputer pribadi. Pada pengenalan wajah langkah yang dikerjakan adalah melakukan pengenalan wajah secara mandiri atau otomatis yang lalu akan disimpan pada suatau basis data tertententu.

2.1.2 Tahapan Pengenalan Wajah

Dalam melakukan pengenalan wajah face recognition, ada beberapa tahapan proses yang harus dilalui, seperti : Gambar 2.1 PengenalanWajah Zhao dan Chellapa, 2006 Deteksi wajah face detection merupakan proses awal yang harus dilakukan pada citra input untuk mendeteksi adanya citra wajah di dalam citra masukan. Namun, berdasarkan Gambar 2.1 tahap-tahap proses pengenalan wajah dikelompokkan menjadi 2 bagian, yaitu proses ekstraksi ciri dan proses pengenalan wajah Zhao dan Chellapa, 2006. Proses deteksi wajah akan dilakukan bersama dalam proses ekstraksi ciri. Hal ini dikarenakan dalam proses deteksi wajah diperlukan ekstraksi ciri di dalam citra masukan yang akan mendeteksi apakah citra masukan merupakan citra yang mengandung ciri wajah. Citra Input Deteksi Wajah Ektrak Ciri Pengenalan Wajah Vertifikasi Bersamaan

2.1.3 Ekstrasi Ciri

Secara umum, Zhao dan Chellapa 2006 menjelaskan ada dua macam ciri feature pada wajah, yaitu holistic features dan facial feature. Facial feature contoh cirinya adalah warna dan bentuk, besar dan letak hidung, mulut, mata, telinga, dan lain-lain. Sedangkan pada holistic features setiap cirinya adalah merupakan suatu karakteristik dari seluruh wajah. Wajah dianggap sebagai kesatuan yang utuh. Untuk melakukan ekstrak ciri pada wajah, Zhao dan Chellapa, 2006 membedakan teknik pengenalan wajah menjadi tiga metode, sebagai berikut: a Holistic methods Metode ini digunakan untuk menyelesaikan kasus holistic features yaitu mencari informasi secara keseluruhan pada wajah. b Features-based Metode ini digunakan untuk menyelesaikan kasus facial features yaitu mencari informasi berdasarkan ciri yang ada pada wajah seperti hidung, mata, telinga, dan lain-lain. c Hybrid methods Metode ini merupakan penggabungan dari metode holistic methods dan features-based.

2.2 Metode Eigenface

Kata eigenface sebenarnya berasal dari bahasa jerman yaitu “eigenwert” dimana “eigen” artinya karakteristik dan “wert” artinya nilai. Eigenface adalah salah satu algoritma pengenalan pola wajah yang berdasarkan pada Principle Component Analysis PCA yang dikembangkan di MIT. Banyak penulis lebih menyukai istilah eigen image. Teknik ini telah digunakan pada pengenalan tulisan tangan, pembacaan bibir, pengenalan suara dan pencitraan medis. Menurut layman Al Fatta, 2009 Eigenface adalah sekumpulan unsur wajah yang telah dibuat standar yang diambil dari analisis statistik dari banyak gambar wajah. Algoritma eigenface secara keseluruhan cukup sederhana. Training image direpresentasikan dalam sebuah vector flat gabungan vektor dan digabung bersama-sama menjadi sebuah matriks tunggal. Eigenface dari masing-masing citra kemudian diekstraksi dan disimpan dalam file temporary atau database. Test image yang masuk didefinisikan juga nilai eigenfaces-nya dan dibandingkan dengan eigenfaces dari image database atau file temporary Prasetyo dan Rahmatun, 2008. Cara perhitungannya dilakukan dengan cara: 1. Pencarian matriks A berukuran N x N dapat dihitung dengan : . = � . 2.1 λ dinamakan eigenvalue dari matriks A, sedangkan x merupakan eigenvector yang sama dengan scalar λ. 2. Pencarian determinan dari matriks A dengan rumus : | − �| = 2.2 3. Setelah nilai eigenvalue � ditemukan langkah selanjutnya adalah mencari eigenvektor dengan menggunakan rumus : − �� . = 2.3

2.2.1 Principal Component Analysis PCA

Principal Component Analysis PCA adalah sebuah transformasi linier yang biasa digunakan untuk mereduksi data. Principal Component Analysis PCA adalah sebuah teknik statistika yang berguna pada bidang pengenalan, klasifikasi dan mereduksi data citra. PCA juga merupakan teknik yang umum digunakan. Karena Principal Component Analysis PCA sangat ampuh untuk mereduksi data baik seperti teks, citra, dan sinyal.

2.2.2 Proses Principal Component Analysis PCA Eigenface

Proses perhitungan PCA dapat dilakukan dengan langkah-langkah sebagai berikut Fatta, 2009 1. Mengambil satu set training citra wajah M. Misalkan M berjumlah 10 buah citra wajah. 2. Inisialisasi untuk tiap citra wajah dari set training. r adalah sebuah vektor × berdasarkan matriks dari citra wajah yang berukuran NxN. 3. Menghitung rata-rata vektor citra wajah = � ∑ � � �= 2.4 4. Melakukan normalisasi ukuran citra dengan melakukan pengurangan vektor citra wajah dengan nilai rata-rata tersebut. = � − 2.5 5. Menghitung matriks kovarian = � ∑ � � � = � � � �= 2.6 Dimana = [ … . � ] � 2.7 6. Dikarenakan ukuran matriks terlalu besar, maka pencarian matriks kovarian menjadi : = � 2.8 7. Menghitung eigenvalue λ dan eigenvector x dari matriks kovarian = � 2.9 8. Menghitung eigenvector sebanyak M dari matriks kovarian = � 2.10 dengan persamaan : � = . � 2.11 9. Melakukan normalisasi terhadap u. 10. Mengumpulkan eigenvector sebanyak K.

2.2.3 Contoh Perhitungan Eigenface

1. Terdapat 3 buah image yang masing-masing mempunyai 2x2 matriks. Image1 = [ ][ ] Image1 = [ ][ ] Image1 = [ ][ ] 2. Lalu ditransformasikan ke matriks × � S = [ ] 3. Mencari rata-rata vector + + = = . + + = = . + + = = + + = = . Sehingga didapatkan : = | . . . | 4. Mengurangi vector citra wajah dengan nilai Y [ ] − | . . . | = [ − . − . − − . ] [ ] − | . . . | = [ − . . . ] [ ] − | . . . | = [ . . − . ] 5. Selanjutnya, , , digabungkan menjadi satu matriks A = [ − . − . − − . − . . . . . − . ] 6. Menghitung kovarian menggunakan rumus � = [ − . − . . − . . . − − − . . . ] × [ − . − . − − . − . . . . . − . ] = [ . − − . − . − . − . − . ] 7. Menghitung eigenvalue dan eigenvector dari korvarian matriks . Untuk mempermudahkan perhitungan maka angka dirubah = [ − − − ] [ − � − − − � − −� ] = − � ∗ { − � −� − − } − ∗ { − −� − − − } + ∗ { − − − � − } = − � {− � + � + } − + −� + = − � { � − � + } + = − � { � − � + } = − � � − � − � = � = � = 8. Eigenvalue � , � , � yang didapat dari matriks digunakan untuk menghitung eigenvektor  Untuk � = [ − − − − − − ] [ ] = [− − − − ] [ ] = Diperolehlah persamaan: − + = − + = − + = Langkah selanjutnya dilakukan proses eliminasi sehingga diperoleh, [ ] = [ ] Eigenvektornya adalah [ ]  Untuk � = [ − − − − − − ] [ ] = [− − − − ] [ ] = Diperolehlah persamaan: − = − + − = − + − = Langkah selanjutnya dilakukan proses eliminasi sehingga diperoleh, [ ] = [ − ] Eigenvektornya adalah [ − ]  Untuk � = [ − − − − − − ] [ ] = [− − − − ] [ ] = Diperolehlah persamaan: − = − + − = − + − = Langkah selanjutnya dilakukan proses eliminasi sehingga diperoleh, [ ] = [ ] Eigenvektornya adalah [ ] 9. Menghitung eigenvektor sebanyak M dari matriks . � = . � = [ − . − . − − . − . . . . . − . ] × [ ] = [ − − − − ] = [ − . − . − − . − . . . . . − . ] × [ − ] = [ ] = [ − . − . − − . − . . . . . − . ] × [ ] = [ − . . . ] 10. Setelah itu eigenvalue diurutkan dari yang paling kecil sampai yang paling besar. Tabel 2.1 Hasil eigen value dan eigen vektor Eigenvalue Eigenvektor λ=3 -1.3333 0.6667 3 0.3333 λ=2 -8 -6 -1 -1 λ=1 8 6 1 1 11. Memproyeksikan � kedalam eigenspace = [− . . . ] × [ − . − . − − . ] = − . [− . . . ] × [ − . . . ] = . [− . . . ] × [ . . − . ] = − . = [− − − − ] × [ − . − . − − . ] = . [− − − − ] × [ − . . . ] = . [− − − − ] × [ . . − . ] = − . = [ − ] × [ − . − . − − . ] = − . [ − ] × [ − . . . ] = − . [ − ] × [ . . − . ] = . 12. Memasukkan nilai � kedalam sebuah vector � = [ − . . − . . . − . − . − . . ] 13. Langkah selanjutnya dari matriks omega ini di cari mean µ dan standar deviasi σ. 14. � = [ − . . − . . . − . − . − . . ]

2.3 Naive Bayesian

Bayesian filter atau Naive Bayes Classifier merupakan metode terbaru untuk mengklasifikasikan dokumen. Algoritma ini adalah metode probabilitas dan dikemukakan oleh ilmuwan Inggris bernama Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman sebelumnya. Dasar dari teorema Naive Bayes digunakan dalam pemrograman adalah rumus Naive Bayes sebagai berikut ini: │ = │ ∗ 2.12  P A|B = Probabilitas yang dihitung Posterior dari peristiwa A karena adanya informasi yang dikandung dalam peristiwa B.  P B|A = Probabilitas yang dihitung Posterior dari peristiwa B karena adanya informasi yang dikandung dalam peristiwa A.  P A = Probabilitas tak bersyarat atau disebut probabilitas awal Prior dari peristiwa A.  P B = Probabilitas tak bersyarat atau disebut probabilitas awal Prior dari peristiwa B.

2.3.1 Klasifikasi Naive Bayesian

Jika X adalah vektor masukkan yang berisi fitur dan Y adalah label kelas, Naïve Bayes dituliskan dengan P X|Y. Notasi tersebut berarti probabilitas label kelas Y didapatkan setelah fitur-fitur X diamati. Notasi ini disebut juga probabilitas akhir posterior probability untuk Y, sedangkan P Y disebut probabilitas awal prior probability Y. Selama proses pelatihan harus dilakukan pembelajaran probabilitas akhir P Y|X pada model untuk setiap kombinasi X dan Y bedasarkan informasi yang didapat dari data latih. Dengan membangun model terse but, suatu data uji X’ dapat diklasifikasikan dengan mencari nilai Y’ dengan memaksimalkan nilai PX’|Y’. Yang lalu didapatkan rumus Naïve Bayes untuk klasifikasi sebagai berikut: | = � ∏ � �| � �=1 � 2.13 PY|X adalah probabilitas data dengan vektor X pada kelas Y. PY adalah probabilitas awal kelas Y. ∏ � | � �= adalah probabilitas independen kelas Y dari semua fitur dalam vektor X. Nilai PX selalu tetap sehingga dalam perhitungan prediksi selanjutnya tinggal menghitung bagian ∏ � | � �= dengan memilih yang terbesar sebagai kelas yagg dipilih sebagai hasil prediksi. Sementara probabilitas independen ∏ � | � �= tersebut merupakan pengaruh semua fitur dari data terhadap setiap kelas Y. Naive bayesian memiliki bentuk peluang kelas bersyarat untuk atribut kontinyu. Distribusi dikarakterisasi dengan dua parameter yaitu mean,  , dan varian, 2  . Untuk tiap kelas j y , peluang kelas bersyarat untuk atribut i X adalah     ij ij i x ij j i i y Y x X P 2 2 2 exp 2 1          2.14 Parameter ij  dapat diestimasi berdasarkan sampel mean i X   x untuk seluruh training record yang dimiliki kelas j y . Dengan cara sama, ij 2  dapat diestimasi dari sampel varian   2 s training record tersebut.

2.3.2 Contoh Perhitungan Naive Bayesian

Terdapat data sebagai berikut: Tabel 2.2 Tabel IPK IPK Tidak Lulus 2 3.5 3 3.25 2 2.75 2.5 3.5 1.6 4 2.5 3.75 2.3 2.25 3.25 3.8 Jika terdapat IPK 3.5 nilai tersebut dikategorikan lulus atau tidak. Langkah pertama adalah menentukan rata-rata dan standar deviasi untuk masing-masing kelas. Tabel 2.3 Hasil IPK IPK Tidak Lulus 2 3.5 3 3.25 2 2.75 2.5 3.5 1.6 4 2.5 3.75 2.3 2.25 3.25 3.8 Mean 2.39375 3.35 Standar Deviasi 0.544083 0.586759 Kemudian nilai mean dan standar deviasi dimasukkan kedalam rumus naive bayesian bersarat pada rumus 2.14. Setelah itu dihasilkan nilai sebagai berikut: Tabel 2.4 Hasil Uji IPK gIPK= . 5,m,σ|Tidak 0.73342325 0.289865 0.212593567 gIPK= . 5,m,σ|Lulus 0.680081055 0.985582 0.670275732 Dihasilkan nilai IPK 3,25 mirip dengan data training lulus jadi dapat disimpulkan bahwa jika IPK 3,25 kemungkinan besar lulus.

2.4 Confusion Matrix

Fungsi confusion matrix adalah mebghitung seberapa tepat dan lengkap klasifikasi terhadap suatu kelas data. Isi dari confusion matrix adalah informasi hasil actual dan prediksi yang dihasilkan oleh pengklasifikasian. Tabel 2.5 Confusion Matrix Prediksi negatif positif Asli negatif A B positif C D  A adalah jumlah nilai prediksi benar ketika contoh negatif.  B adalah jumlah nilai prediksi salah ketika contoh positif.  C adalah jumlah nilai prediksi salah ketika contoh negatif.  D adalah jumlah nilai prediksi benar ketika contoh positif. Akurasi adalah hasil dari penjumlahan nilai diagonal dibagi dengan jumlah total keseluruhan data dan selajutnya dikalikan 100. = + + + + × 2.14 Contoh perhitungan akurasi dapat dicontohkan sebagai berikut: Tabel 2.6 Contoh Confusion Matrix 1 1 1 1 1 1 2 2 2 1 1 2 1 1 6 6 6 = × = 3 BAB III METODOLOGI Berdasarkan pada landasan teori yang telah disampaikan pada bab kedua di atas, pada bab ini dibahas metodologi yang akan digunakan pada penelitian ini. Bab ini berisi tentang blok diagram, data, tatap muka pengguna dan contoh perhitungan.

3.1 Metode Pengumpulan Data

Mengambil 200 citra wajah mahasiswa Universitas Sanata Dharma Program Studi Teknik Informatika angkatan 2011 dikarenakan data sangat mudah untuk didapat dan data yang dihasilkan adalah data yang nyata.

3.2 Teknik Analisis Data