Perbandingan SOM dan LVQ pada Identifikasi Citra Wajah dengan Wavelet sebagai Ekstraksi Ciri

PERBANDINGAN SOM DAN LVQ PADA IDENTIFIKASI
CITRA WAJAH DENGAN WAVELET SEBAGAI
EKSTRAKSI CIRI

SYEIVA NURUL DESYLVIA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Perbandingan SOM
dan LVQ pada Identifikasi Citra Wajah dengan Wavelet sebagai Ekstraksi Ciri
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Desember 2013
Syeiva Nurul Desylvia
NIM G64114005

ABSTRAK
SYEIVA NURUL DESYLVIA. Perbandingan SOM dan LVQ pada Identifikasi
Citra Wajah dengan Wavelet sebagai Ekstraksi Ciri. Dibimbing oleh AGUS
BUONO.
Pengenalan wajah merupakan salah satu topik penelitian menantang di
bidang ilmu komputer karena wajah manusia sulit dimodelkan. Penelitian ini
mengajukan metode SOM dan LVQ sebagai pengenal wajah tampak depan.
Tujuan penelitian ini adalah membandingkan LVQ dan SOM berdasarkan akurasi
identifikasi. Citra sebanyak 400 dari 20 individu berbeda yang masing-masing
berukuran 180 x 200 pixels digunakan sebagai data percobaan. Sumber data dari
University of Essex, UK. Coefficient approximation pada Haar Wavelet level 6
digunakan sebagai ciri yang akan diklasifikasi dan dikluster. K-fold cross
validation dengan fold 10 digunakan untuk membagi data latih dengan data uji.
Percobaan terbagi menjadi 3 set, yaitu percobaan menggunakan model SOM,

LVQ, dan LVQ inisialisasi SOM. Akurasi tertinggi yang dihasilkan SOM sebesar
97.8947% dan akurasi tertinggi yang dihasilkan LVQ dan LVQ inisialisasi SOM
sebesar 100%. Berdasarkan hasil akurasi, LVQ terbukti lebih baik dari pada SOM
dalam hal pengenalan wajah tampak depan. Penelitian ini perlu dikembangkan
agar model dapat mengenali wajah dengan berbagai pose dan ekspresi yang
berubah-ubah.
Kata kunci: Haar Wavelet, K-fold cross validation, Learning Vector Quantization
(LVQ), pengenalan wajah, Self Organizing Map (SOM)

ABSTRACT
SYEIVA NURUL DESYLVIA. Comparison of SOM and LVQ for Facial Image
Identification with Wavelet as Feature Extraction. Supervised by AGUS BUONO.
Face recognition is one of challenging research topics in computer science
because human face is difficult to be modelled. In this research, SOM and LVQ
are proposed for frontal face recognition. The purpose is to compare LVQ and
SOM based on identification accuracy. Training uses 400 images from 20
different individuals, and the dimension is 180 x 200 pixels. The data are retrieved
from University of Essex, UK. Coefficient approximation at Haar wavelet level 6
is used as feature for classification and clustering process. K-fold cross validation
with 10-fold is used to divide training and testing data. The experiment is divided

into 3 sets, i.e., the experiment using SOM, LVQ, and LVQ initialized by SOM.
The highest accuracy achieved by SOM is 97.8974%, while both LVQ and LVQ
initialized by SOM achieve 100% accuracy. Based on the accuracy, LVQ proves
to be better than SOM for frontal face recognition. This research needs to be
improved in order to recognize various poses and changing expressions.
Keywords: frontal face recognition, Haar wavelet, K-fold cross validation,
Learning Vector Quantization (LVQ), Self Organizing Map (SOM)

PERBANDINGAN SOM DAN LVQ PADA IDENTIFIKASI
CITRA WAJAH DENGAN WAVELET SEBAGAI
EKSTRAKSI CIRI

SYEIVA NURUL DESYLVIA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer


DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

Penguji: 1
2

Aziz Kustiyo, SSi MKom
Endang Purnama Giri, SKom MKom

Judul Skripsi : Perbandingan SOM dan LVQ pada Identifikasi Citra Wajah dengan
Wavelet sebagai Ekstraksi Ciri
Nama
: Syeiva Nurul Desylvia
NIM
: G64114005

Disetujui oleh


Dr Ir Agus Buono, MSi MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

Judul Skripsi: Perbandingan SOM dan LVQ pada Identifikasi Citra Wajah dengan
ama

1M

Wavelet sebagai Ekstraksi Ciri
: Syeiva Nurul Desylvia
: G64114005


Disetujui oleh

Dr Ir tr-..:"'''-'U'uono MSi MKom
Pembimbing

Tanggal Lulus:

1 8 JAN 2014

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga skripsi ini berhasil diselesaikan. Tema yang dipilih
dalam penelitian yang dilaksanakan sejak bulan April 2013 ini ialah pengenalan
wajah, dengan judul Perbandingan SOM dan LVQ pada Identifikasi Citra Wajah
dengan Wavelet sebagai Ekstraksi Ciri.
Terima kasih penulis ucapkan kepada:
1
Bapak Dr Ir Agus Buono, MSi MKom selaku pembimbing.
2
Bapak Aziz Kustiyo, SSi MKom dan Bapak Endang Purnama Giri, SKom

MKom selaku penguji.
3
Bapak Ahmad Ridha, SKom MS dan Bapak Auzi Asfarian, SKomp atas
pengecekan dan saran terkait abstrak dan penulisan skripsi.
4
Ayah, ibu, adik, serta seluruh keluarga, atas segala doa dan kasih sayangnya.
5
Teman-teman satu bimbingan dan teman-teman Alih Jenis Ilmu Komputer
IPB angkatan 6.
Semoga karya ilmiah ini bermanfaat.

Bogor, Desember 2013
Syeiva Nurul Desylvia

DAFTAR ISI
DAFTAR TABEL

viii

DAFTAR GAMBAR


viii

DAFTAR LAMPIRAN

viii

PENDAHULUAN

1

Latar Belakang

1

Perumusan Masalah

2

Tujuan Penelitian


2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

METODE

2

Lingkungan Pengembangan

3

Kerangka Pemikiran


5

Studi Pustaka

5

Pengumpulan Data

5

Praproses

5

Pembagian Data

6

Pelatihan dan Pengujian


6

Evaluasi

9

HASIL DAN PEMBAHASAN

10

Praproses

10

Pembagian Data

10

Pelatihan dan Pengujian

11

Evaluasi

11

KESIMPULAN DAN SARAN

12

Kesimpulan

12

Saran

13

DAFTAR PUSTAKA

13

RIWAYAT HIDUP

20

DAFTAR TABEL
1 Simbol yang digunakan pada algoritme LVQ
2 Parameter percobaan

10
11

DAFTAR GAMBAR
1
2
3
4
5
6

Tahapan penelitian
Metode penelitian secara lebih mendetail
Ilustrasi K-fold cross validation
Topologi SOM dan LVQ (Fausett 1994)
Ilustrasi ketetanggaan SOM di bidang hexagonal (Yang et al. 2012)
Ilustrasi cara kerja LVQ. (a) bobot mendekati X (data), (b) bobot
menjauhi X (data)
7 Persentase hasil percobaan

3
4
7
8
8
9
12

DAFTAR LAMPIRAN
1
2
3
4
5

Beberapa data yang digunakan pada penelitian
Contoh perhitungan LVQ (Fausset 1994)
Hasil percobaan
Sebagian data kelas 17 dan kelas 19
Tabel kesalahan SOM

14
15
17
18
19

1

PENDAHULUAN
Latar Belakang
Pengenalan wajah merupakan salah satu penelitian canggih di bidang
komputer dan sangat menantang untuk dikembangkan menggunakan komputer
karena wajah manusia sulit dimodelkan. Hal ini disebabkan wajah manusia
tergantung dari kondisi usia, pencahayaan, lokasi, orientasi, pose, ekspresi wajah,
dan faktor lainnya. Di sisi lain, pengenalan wajah merupakan salah satu teknik
biometric yang masih berkembang karena aplikasinya yang banyak digunakan,
seperti image tagging dan surveillance camera. Perkembangan penelitian pada
bidang pengenalan wajah ini memicu banyak metode baru atau perbaikan metode
lama yang diajukan peneliti.
Salah satu penelitian pada bidang pengenalan wajah, yaitu Face Recognition
with Learning-based Descriptor (Cao et al. 2010) yang menggunakan teknik
learning-based encoding method berdasarkan unsupervised learning pada data
latih dikombinasikan dengan Principal Component Analysis (PCA). Selain itu,
pose adaptive matching method diajukan juga untuk menangani variasi pose pada
dunia nyata. Akurasi terbaik didapatkan pada data Labeled Face in The Wild
(LFW) sebesar 84.45%.
Penelitian lainnya adalah Bypassing Synthesis: PLS for Face Recognition
with Pose, Low-Resolution and Sketch (Sharma dan Jacobs 2011) yang
menggunakan Partial Least Squares (PLS) untuk penyeleksian fitur pada CMU
PIE data set. Akurasi yang didapatkan sebesar 90.12%.
Penelitian selanjutnya ialah Hierarchical Ensemble of Global and Local
Classifiers for Face Recognition (Su et al. 2009) yang memadukan ekstraksi ciri
global menggunakan Fourier Transform dan ekstraksi ciri local menggunakan
Gabor Wavelet. Fisher’s Linear Discriminant (FLD) diaplikasikan secara terpisah
pada Fourier features dan Gabor features. Data yang digunakan pada penelitian
adalah FERET dan Face Recognition Grand Challenge (FRGC) versi 2.0. Akurasi
tertinggi sebesar 99.9% untuk recognition rate didapatkan dari pengujian
menggunakan data FERET.
Learning Vector Quantization (LVQ) merupakan salah satu metode untuk
pengenalan wajah seperti yang dilakukan Bashyal dan Venayagamoorthy (2008)
pada penelitian Recognition of Facial Expressions Using Gabor Wavelets and
Learning Vector Quantization. Penelitian tersebut menggunakan LVQ versi 1
(LVQ1) untuk klasifikasi 7 ekspresi wajah manusia (neutral, happy, sad, surprise,
anger, disgust, fear) dengan ekstraksi fitur menggunakan Gabor Wavelet. Data
yang digunakan, yaitu Japanese Female Facial Expression (JAFFE). Akurasi
tertinggi yang dihasilkan sebesar 90.22%.
Pada penelitian Bashyal dan Venayagamoorthy (2008), LVQ1 dapat
menghasilkan akurasi yang baik untuk mengenali 7 ekspresi wajah manusia
dibandingkan dengan Multi Layer Perceptron (MLP). Akurasi yang dihasilkan
tersebut mendasari hipotesis bahwa LVQ memungkinkan untuk menghasilkan
akurasi tinggi jika digunakan sebagai classifier pada data frontal face.
Berdasarkan hipotesis tersebut, pada penelitian ini, metode LVQ diajukan
sebagai classifier pada data frontal face yang diunduh dari University of Essex,

2
UK. Self Organizing Map (SOM) diajukan juga untuk inisialisasi vektor bobot
pada LVQ. Selain itu, SOM juga akan dibandingkan dengan LVQ terkait hasil
akurasi yang dihasilkan.
Untuk ekstraksi ciri pada setiap citra wajah, Haar Wavelet diajukan karena
menghasilkan akurasi yang baik, yaitu 98.1% dibandingkan akurasi yang
dihasilkan Principal Component Analysis (PCA) sebesar 91.2% pada penelitian
Gumus et al. (2010) yang berjudul Evaluation of Face Recognition Techniques
Using PCA, Wavelets, and SVM. Pada penelitian tersebut, kombinasi Haar
Wavelet level 4 dan Support Vector Machine (SVM) menghasilkan akurasi yang
lebih tinggi 6.9% dibandingkan kombinasi PCA dan SVM pada data ORL.

Perumusan Masalah
Perumusan masalah dalam penelitian ini adalah bagaimana memodelkan
sistem pengenalan wajah tampak depan menggunakan jaringan syaraf tiruan SOM
dan LVQ.

Tujuan Penelitian
1
2

Tujuan dari penelitian ini adalah:
Memodelkan SOM dan LVQ untuk mengenali wajah tampak depan dari
setiap orang yang berbeda.
Menghasilkan akurasi perbandingan 3 model percobaan (SOM, LVQ, LVQ
inisialisasi SOM) menggunakan data wajah tampak depan.

Manfaat Penelitian
Penelitian ini diharapkan dapat menghasilkan model pengenalan wajah yang
menggunakan jaringan syaraf tiruan SOM dan LVQ agar dapat membantu peran
manusia dalam hal mengenali wajah pada sistem online maupun offline.

Ruang Lingkup Penelitian
1
2

Ruang lingkup pada penelitian ini antara lain:
Pose wajah yang digunakan adalah tampak depan / frontal face.
Tidak ada perubahan gaya rambut, penggunaan kacamata, atau janggut pada
setiap individu.

METODE
Penelitian ini terbagi menjadi beberapa tahapan proses. Gambar 1
menunjukan tahapan proses tersebut dan Gambar 2 menunjukan tahapan
penelitian secara lebih detail.

3
Mulai

Studi Pustaka

Pengumpulan
Data (400 citra,
20 individu)

Praproses

Data
Latih

Pembagian
Data (k-fold
cross
validation)

Data Uji

Pelatihan dan Pengujian
SOM, LVQ,
LVQ
Inisialisasi
SOM

Evaluasi

Selesai

Gambar 1 Tahapan penelitian
Lingkungan Pengembangan
Penelitian ini diimplementasikan menggunakan spesifikasi perangkat keras
dan lunak sebagai berikut:
1
Perangkat Keras
Spesifikasi perangkat keras yang digunakan adalah:
o
Intel ® Core™ i3 CPU 1.33 GHz.
o
Memori 2 GB.
o
Harddisk 360 GB.
o
Keyboard dan mouse.
o
Monitor.
2
Perangkat Lunak
o
Sistem operasi Windows 8.1 Pro 32 bit.
o
Matlab 7.7.0 (R2008b).

4
Mulai

20 Matriks
Bobot (180 x
200) uint8
RGB

380 Citra
Wajah (180
x 200) uint8
RGB

Praproses
Konversi
RGB Menjadi
Grayscale

Histogram
Equalization

Konversi Tipe
Data Menjadi
Double
Ekstraksi Ciri
Haar Wavelet
Level 6

Citra Wajah
(4 x 3)
Double
Grayscale
Penggabungan
Data

Matriks
Data bobot
(20 x 12)

Matriks Data
Citra Wajah
(380 x 12)
Pembagian Data
10 Matriks
Data Latih
(342 x 12)

10-fold
Cross
Validation

10 Matriks
Data Uji
(38 x 12)

Pengujian
SOM, LVQ,
LVQ
Inisialisasi
SOM

Akurasi

Selesai

Gambar 2 Metode penelitian secara lebih mendetail

5
Kerangka Pemikiran
Penelitian ini dikembangkan dengan metode yang dibagi menjadi beberapa
tahap, yaitu studi pustaka, pengumpulan data, praproses, pembagian data (K-fold
cross validation), pelatihan dan pengujian, dan evaluasi.

Studi Pustaka
Pada tahap ini, kegiatan yang dilakukan adalah mempelajari dan
mengumpulkan pustaka yang berkaitan dengan penelitian. Hal-hal yang dipelajari,
yaitu penggunaan dan teori Haar Wavelet, Self Organizing Map, dan Learning
Vector Quantization. Selain itu, metode yang terkait pengenalan wajah juga
dipelajari dan dilakukan analisis jika metode tersebut bisa diterapkan pada
penelitian ini atau tidak. Buku dan paper penelitian merupakan sumber utama
pada tahap ini.

Pengumpulan Data
Data pada penelitian ini diunduh dari University of Essex, UK. Individu
yang digunakan sebanyak 20 individu (10 wanita dan 10 pria) dengan masingmasing 20 citra wajah tampak depan. Total data sebanyak 400. Beberapa individu
menggunakan kacamata dan berjanggut untuk keseluruhan data pada kelas
tersebut (20 citra). Usia setiap individu umumnya berkisar 18 sampai dengan 20
tahun, akan tetapi ada beberapa individu yang berusia lebih tua. Dimensi setiap
citra adalah 180 x 200 pixels dengan format 24 bit color JPEG. Lampiran 1
menyajikan perwakilan data dari setiap kelas yang digunakan.

Praproses
Pada tahap ini, citra yang pada mulanya 24 bit RGB diubah menjadi
grayscale. Citra yang direpresentasikan dalam model warna RGB terdiri atas 3
komponen citra yang masing-masing mewakili warna primer. Warna primer
tersebut, yaitu Red, Green, dan Blue (RGB). Model ini berdasarkan sistem
koordinat Cartesian. Banyaknya bits yang digunakan untuk merepresentasikan
setiap pixel dalam ruang RGB disebut pixel depth (Gonzalez dan Woods 2007).
Langkah berikutnya, yaitu Histogram Equalization. Pada langkah ini, citra
baru dihasilkan dengan cara memetakan setiap pixel pada citra masukan dengan
intensitas r ke dalam pixel dengan level s yang sesuai. Persamaan yang
digunakan pada Histogram Equalization ialah
n
r
r
MN adalah jumlah pixel di dalam citra, n adalah jumlah pixel yang memiliki
intensitas r , dan L adalah jumlah level intensitas pada citra (256 untuk citra 8
bit). Pemetaan
terhadap r umumnya disebut histogram. Bentuk diskret
dari persamaan sebelumnya, yaitu

6
s

r

L

L

∑ r (r )

∑n

L

r atau the transformation (mapping) pada persamaan tersebut adalah
Histogram Equalization atau Histogram Linearization Transformation (Gonzalez
dan Woods 2007).
Setelah citra diubah ke grayscale dan dilakukan teknik Histogram
Equalization, Haar Wavelet digunakan untuk ekstraksi ciri dan reduksi dimensi
untuk setiap citra. Wavelet yang digunakan untuk ekstraksi ciri dan reduksi
dimensi pada citra terdiri atas beberapa konsep pendukung. Konsep-konsep
tersebut disebut multiresolution analysis. Konsep pertama, yaitu image pyramid.
Suatu image pyramid adalah koleksi resolusi citra yang menurun tersusun dalam
bentuk seperti piramida. Semakin tinggi suatu image pyramid, ukuran dan resolusi
citra menurun. Perkiraan citra dengan resolusi rendah disebut apex, sedangkan
level dasar dari piramida merupakan representasi resolusi tinggi dari citra yang
akan diproses. Level dasar J berukuran
atau N x N, dalam hal ini
lo
,
level apex 0 berukuran 1 x 1 dan level umum j berukuran
(
).
Konsep berikutnya, yaitu subband coding. Di dalam subband coding,
dekomposisi dilakukan pada citra sehingga menghasilkan suatu kumpulan
bandlimited component yang disebut subband. Subband yang dihasilkan adalah
perkiraan (approximation), horizontal detail, vertical detail, dan diagonal detail.
Ukuran dari setiap subband 2 kali lebih kecil ketimbang ukuran citra yang
sebenarnya (citra masukan yang digunakan untuk proses). Konsep terakhir adalah
Haar transform. Haar transform dapat diekspresikan menggunakan persamaan
F adalah matriks citra N x N, H adalah matriks N x N Haar transform.
Berdasarkan Haar basis function, matriks Haar adalah
].
Kombinasi dari ketiga konsep tersebut (image pyramid, subband coding,
dan Haar transform) disebut discrete wavelet transform (Gonzalez dan Woods
2007).


[

Pembagian Data
Untuk pembagian data uji dan data latih, digunakan metode K-fold cross
validation. Pada metode ini, sample data dibagi menjadi beberapa subsample. Saat
proses pelatihan, setiap subsample dijadikan data uji dan k-1 subsample lainnya
dijadikan data latih. Proses ini berjalan sebanyak k iterasi. Pada penelitian ini, k
yang digunakan sebesar 10 (10-fold). Gambar 3 menampilkan ilustrasi
penggunakan K-fold dengan 5 fold.

Pelatihan dan Pengujian
Pada tahap ini, jaringan syaraf tiruan Self Organizing Map (SOM) dan
Learning Vector Quantization (LVQ) digunakan untuk pelatihan dan pengujian.

7
Percobaan

Data

1

Data Uji

Data Latih

2

3

4

5

Gambar 3 Ilustrasi K-fold cross validation
jumlah neuron input yang digunakan sama dengan jumlah field matriks data yang
dihasilkan dari tahap praproses dan jumlah neuron output sama dengan jumlah
individu yang digunakan.
Pada mulanya, SOM dikembangkan untuk visualisasi relasi nonlinear pada
data multi dimensi (Kohonen 2001). Ide dasar dari algoritme SOM adalah setiap
input data item akan memilih model yang paling sesuai dengan item tersebut dan
ketetanggaan unit-unit cluster akan dimodifikasi untuk menghasilkan tingkat
kecocokan yang lebih baik. SOM membangun model sehingga model yang lebih
mirip akan diasosiasikan dengan nodes yang lebih dekat, sedangkan model yang
kurang mirip akan dijauhkan secara bertahap (Kohonen 2013).
Selama proses self organizing, unit cluster yang vektor bobotnya paling
dekat dengan vektor masukan (biasanya menggunakan fungsi jarak Euclidean)
dipilih sebagai pemenang (winner). Unit pemenang (winner unit) dan unit
tetangganya (unit tetangga secara bentuk topologi) membarui bobot mereka.
Vektor bobot dari unit tetangga secara umum tidak dekat dengan vektor masukan.
Arsitektur SOM ditunjukan pada Gambar 4 dan ketetanggaan SOM di bidang
hexagonal ditampilkan pada Gambar 5.
Berikut algoritme SOM:
1
Tentukan bobot wi . Tentukan parameter topologi tetangga. Tentukan
parameter learning rate.
2
Selama kondisi berhenti belum terpenuhi, lakukan langkah 3 - 9.
3
Untuk setiap vektor masukan x, lakukan langkah 4 - 6.
4
Untuk setiap j, lakukan perhitungan:
∑ wi

i

i

5
6

7
8
9

Temukan indeks J sehingga D(J) bernilai minimum.
Untuk semua unit j di dalam topologi tetangga J yang sudah ditentukan dan
untuk semua i:
[ i wi l ]
wi new wi l
Update learning rate.
Kurangi radius topologi tetangga pada waktu yang spesifik.
Cek kondisi berhenti (Fausett 1994).

8

Gambar 4 Topologi SOM dan LVQ (Fausett 1994)

Gambar 5 Ilustrasi ketetanggaan SOM di bidang hexagonal (Yang et al. 2012)
Salah satu cara paling sederhana untuk inisialisasi vektor bobot pada SOM
adalah dengan menggunakan random vector. Pada aplikasinya, inisialisasi
menggunakan random vector akan memperlambat konvergensi algoritme
dibandingkan dengan inisialisasi yang sudah melalui metode tertentu, misalkan
linear initialization (Kohonen 2013). Pada penelitian ini, perwakilan data dari
setiap class akan digunakan sebagai inisialisasi bobot pada SOM.
LVQ pada mulanya dikembangkan untuk statistical pattern recognition
terutama pada data stochastic berdimensi tinggi dengan noise yang banyak
(Kohonen 2001). Setiap unit keluaran pada LVQ merepresentasikan class atau
kategori. Vektor bobot yang merepresentasikan setiap class sering kali disebut
vektor reference atau codebook. Arsitektur LVQ pada dasarnya sama dengan
SOM (ditunjukan pada Gambar 4) namun tidak ada struktur topologi ketetanggan
pada unit keluaran dan setiap unit keluaran mewakili jumlah class yang ada.
Algoritme LVQ, yaitu:
1
Tentukan vektor referensi. Tentukan learning rate,
.
2
Selama kondisi berhenti belum terpenuhi, lakukan langkah 3-6.
3
Untuk setiap vektor masukan x, lakukan langkah 4-5.
4
Temukan J sehingga ‖ -w ‖ bernilai minimum.
5
Update nilai w sesuai ketentuan berikut:
Jika T = ,

9

W(old)

)
new
W(

(
=W
X

)
old

(X


d
(ol
-W

W(

))
old

)

)
new
(
W

=

)old
(
W

α(X

d))
(ol
W
-

W(old)

X

X

d
(ol
-W

)

X

(a)

(b)

Gambar 6 Ilustrasi cara kerja LVQ. (a) bobot mendekati X (data), (b) bobot
menjauhi X (data)
[ -w l ]
w new w l
Jika T ≠ ,
[ w l ]
w new w l
6
Kurangi learning rate.
7
Cek kondisi berhenti (Fausett 1994).
Simbol yang digunakan ditampilkan pada Tabel 1 dan Lampiran 2
menunjukkan contoh perhitungan LVQ.
Cara kerja LVQ secara sederhana, yaitu membarui bobot agar lebih
mendekati x jika target sama dengan kelas. Jika target tidak sama dengan kelas,
bobot yang baru dijauhkan dari x. Hal ini diilustasikan pada Gambar 6.
Dalam penggunaannya, SOM dan LVQ sering kali dikombinasikan.
Misalnya, pada tahap awal, SOM dimodelkan untuk proses unsupervised learning
agar alokasi neuron terhadap permasalahan menjadi optimal, kemudian raw input
data (tanpa identifikasi atau verifikasi manual untuk menentukan kelasnya) dapat
digunakan untuk pelatihan. Setelah itu, vektor codebook dari berbagai cluster atau
class dapat dilatih kembali menggunakan LVQ atau supervised training lainnya
(Kohonen 2001).

Evaluasi
Evaluasi merupakan tahap terakhir pada metode untuk menentukan jika
proses pengenalan sudah tepat atau belum. Hasil dari tahap ini, yaitu akurasi yang
didapat dengan cara,


Akurasi tersebut akan dirata-ratakan untuk setiap fold ke-i (i

10
Tabel 1 Simbol yang digunakan pada algoritme LVQ
Simbol
x
T
w
‖ w‖

Makna
Vektor masukan (training vector), x1
xi
x.
Kategori yang benar atau class untuk vektor masukan.
Vektor bobot untuk unit keluaran ke-j (w
wi
w
Kategori atau class yang direpresentasikan oleh unit keluaran
ke-j.
Jarak Euclidean di antara vektor masukan dan vektor bobot
untuk unit keluaran ke-j.

HASIL DAN PEMBAHASAN
Praproses

Setiap data wajah diubah formatnya dari RGB menjadi grayscale agar
memudahkan proses ekstraksi ciri. Kemudian, histogram equalization dilakukan
pada data untuk meratakan tingkat intensitas warna yang dilanjutkan dengan
mengubah tipe data menjadi double. Perubahan tipe ini dikarenakan tipe double
lebih mudah untuk komputasi.
Langkah selanjutnya, yaitu ekstraksi ciri menggunakan Haar Wavelet. Pada
penelitian ini, digunakan level dekomposisi sebesar 6 yang akan menghasilkan
citra hasil dekomposisi dengan dimensi 4 x 3 (12 fitur penciri) dari dimensi awal
sebesar 180 x 200. Proses ini dilakukan untuk semua data. Hasil dari proses ini,
yaitu matriks data sebesar 380 x 12, matriks bobot sebesar 20 x 12, dan matriks
class sebesar 380 x 1, sedangkan 20 citra sisanya (1 citra untuk setiap kelas)
digunakan untuk inisialisasi bobot SOM.

Pembagian Data
Setelah proses ekstraksi ciri, proses pembagian data dilakukan
menggunakan metode k-fold cross validation. Data class digunakan sebagai
masukan pada fungsi k-fold cross validation untuk diambil indeks datanya.
Selanjutnya, data matriks wajah dipisahkan untuk data latih dan data uji
berdasarkan indeks tersebut. Proses ini dilakukan sebanyak jumlah fold yang
dalam penelitian ini sebanyak 10-fold. Hasil tahap pembagian data ini, yaitu 10
matriks data latih yang masing-masing berukuran 342 x 12 dan 10 matriks data uji
yang masing-masing berukuran 38 x 12.
Data yang digunakan untuk inisialisasi bobot SOM dipisahkan dari data
pelatihan, kemudian tahap praproses dilakukan seperti pada data utama. Matriks
bobot digabungkan secara terpisah dari matriks data. Data class dipisahkan
menjadi class data latih dan class data uji untuk proses pengujian. Data class
tersebut dipisahkan sesuai dengan data latih dan data uji yang dihasilkan pada
setiap fold. Class data latih digunakan untuk pelatihan menggunakan SOM dan
LVQ. Class data uji digunakan untuk komputasi akurasi.

11
Tabel 2 Parameter percobaan
SOM

LVQ

Neuron Input
Neuron Output
Vektor Masukan
Epoch
Learning Rate
Penurunan Learning Rate

12
20
342
150
0.6
0.973

Neuron Input
Neuron Output
Vektor Masukan
Epoch
Learning Rate
Penurunan Learning Rate

12
20
342
150
0.3
0.977

Pelatihan dan Pengujian
Pada penelitian ini ada 3 model yang akan dibandingkan, yaitu model SOM,
LVQ, dan LVQ inisialisasi SOM. Percobaan diulang sebanyak 3 kali karena
fungsi k-fold yang digunakan menghasilkan indeks data secara acak. Ulangan ini
dilakukan untuk menguji jika akurasi yang dihasilkan sudah stabil atau belum.
Data yang digunakan untuk proses pelatihan dan pengujian merupakan data hasil
k-fold cross validation. Pada tahap ini, pemanggilan SOM dan LVQ dilakukan
sebanyak k kali sesuai jumlah fold (10 kali pada penelitian ini). Hasil dari SOM
dan LVQ dibandingkan dengan setiap class pada data uji untuk perhitungan
akurasi. Parameter yang perlu diperhatikan pada SOM dan LVQ adalah jumlah
neuron input, jumlah neuron output, jumlah vektor masukan, jumlah epoch, nilai
learning rate, dan nilai penurunan learning rate. Jumlah neuron input disesuaikan
dengan jumlah fitur penciri yang dihasilkan oleh Haar Wavelet, yaitu 12 penciri.
Neuron output ditentukan berdasarkan jumlah kelas yang digunakan, yaitu 20
kelas.
Pada penelitian ini, learning rate ditentukan akan berakhir pada nilai 0.01
untuk setiap nilai epoch yang ditetapkan. Penurunan learning rate dihitung
menggunakan prinsip deret geometri agar bernilai 0.01 pada iterasi epoch terakhir.
Learning rate sebagai suku pertama deret geometri dan 0.01 sebagai suku terakhir,
sedangkan penurunan learning rate sebagai rasio. Rasio inilah yang perlu
didapatkan menggunakan rumus deret geometri. Perbandingan nilai parameter
SOM dan LVQ ditunjukan pada Tabel 1.
Lampiran 3 menyajikan hasil pengujian menggunakan SOM, LVQ, dan
LVQ inisialisasi SOM dan Gambar 7 menampilkan grafik persentase rata-rata
akurasi yang dihasilkan.

Evaluasi
Dari hasil pengujian, dapat diamati bahwa hasil akurasi menggunakan LVQ
lebih baik dari pada SOM. Pada kolom akurasi SOM, rata-rata akurasi tertinggi
sebesar 97.8% di ulangan ke-3. Pada kolom akurasi LVQ, rata-rata akurasi
tertinggi sebesar 100.0% di ulangan ke-2 dan ke-3. Hasil pengujian LVQ
inisialisasi SOM sama dengan hasil pengujian menggunakan LVQ. Hal ini berarti
inisialisasi SOM pada percobaan ini tidak mempengaruhi LVQ karena
permasalahan yang dihadapi cukup sederhana.
Untuk ulangan pertama, fold ke-2 menghasilkan akurasi yang sama pada 3
set percobaan, yaitu 97.3%. Hal ini menarik diamati karena baik LVQ maupun

12
99.7

Rata-rata Akurasi (%)

100

99.7

100

100

100

100

99
97.8

98
97
96

96.3
95.2

95
94
93
92
91

Ulangan 1
SOM

Ulangan 2
LVQ

Ulangan 3

LVQ Inisialisasi SOM

Gambar 7 Persentase hasil percobaan
LVQ inisialisasi SOM tidak dapat memperbaiki kesalahan klasifikasi atau
clustering yang diujikan sebelumnya. Citra wajah yang membuat kesalahan
tersebut, yaitu citra ke-3 pada kelas 19. Saat pengujian citra ini selalu terdeteksi
sebagai citra kelas 17. Data kelas 17, yaitu wanita berambut panjang, dahi cukup
lebar, dan berkacamata, sedangkan data kelas 19 adalah wanita berambut panjang,
dahi cukup lebar namun tidak berkacamata. Beberapa citra kelas 17 dan kelas 19
ditunjukkan pada Lampiran 4.
Individu kelas 17 dan kelas 19 pada data yang digunakan mirip satu sama
lain. LVQ dan LVQ inisialisasi SOM hanya tertukar 1 kali antara kelas 17 dan
kelas 19, sedangkan SOM tertukar beberapa kali. Kesalahan clustering SOM
ditunjukkan pada Lampiran 5.

KESIMPULAN DAN SARAN
Kesimpulan
Penelitian ini telah berhasil mengenali wajah tampak depan menggunakan
SOM dan LVQ. Dari perbandingan 3 set percobaan, percobaan menggunakan
LVQ dan LVQ inisialisasi SOM menghasilkan rata-rata akurasi tertinggi, yaitu
100.0% pada ulangan ke-2 dan ke-3, sedangkan rata-rata akurasi tertinggi yang
dihasilkan SOM sebesar 97.8% pada ulangan ke-3. SOM tidak mempu
membedakan kedua individu yang mirip sebaik LVQ dan LVQ inisialisasi SOM
karena SOM lebih sering tertukar antara individu yang mirip.
Berdasarkan hasil percobaan ini, model LVQ lebih baik dari pada SOM
dalam hal mengenali individu dan membedakan individu yang mirip. Hal ini
karena LVQ mendekatkan vektor bobot dengan jarak minimum pada data jika
target sama dengan kelas dan menjauhkannya jika sebaliknya, sedangkan SOM
hanya membarui bobot saja tanpa menjauhkan atau mendekatkan bobot pada data.

13
Saran
1
2

3

Saran untuk pengembangan selanjutnya, yaitu:
Menggunakan ekstraksi fitur yang lebih peka terhadap data individu yang
mirip terutama untuk model SOM.
Menambah fitur crop pada wajah sehingga bagian citra lain selain bagian
wajah tidak ikut diekstraksi ciri. Hal ini memungkinkan peningkatan akurasi
untuk membedakan citra yang mirip pada kelas yang berbeda.
Model LVQ dan LVQ inisialisasi SOM yang digunakan pada penelitian ini
sudah menghasilkan akurasi yang baik untuk mengenali wajah tampak
depan akan tetapi perlu dicobakan pada data dengan berbagai pose dan
ekspresi, juga data yang terdistorsi noise.

DAFTAR PUSTAKA
Bashyal S, Venayagamoorthy GK. 2008. Recognition of facial expressions using
Gabor Wavelets and Learning Vector Quantization. Eng Appl Artif Intel.
21(7):1056-1064.doi: 10.1016/j.engappai.2007.11.010.
Cao Z, Yin Q, Tang X, Sun J. 2010. Face recognition with learning based
descriptor. Di dalam: The Twenty Third IEEE Conference on Computer Vision
and Pattern Recognition; 2010 Jun 13-18; San Francisco, United States. Los
Alamitos (US): IEEE Computer Society. hlm 2707-2714.
Fausett L. 1994. Fundamentals of Neural Networks: Architectures, Algorithms,
and Applications. New Jersey (US): Prentice Hall.
Gonzalez RC, Woods RE. 2007. Digital Image Procesing. Ed ke-3. New Jersey
(US): Prentice Hall.
Gumus E, Kilic N, Sertbas A, Ucan ON. 2010. Evaluation of face recognition
techniques using PCA, wavelets and SVM. Expert Syst Appl. 37(2010):64046408.doi:10.1016/j.eswa.2010.02.079.
Kohonen T. 2001. Self-Organizing Maps. Ed ke-3. Berlin (DE): Springer.
Kohonen T. 2013. Essentials of the self-organizing map. Neural Networks.
37(2013):52-65.doi:10.1016/j.neunet.2012.09.018.
Sharma A, Jacobs DW. 2011. Bypassing synthesis PLS for face recognition with
pose, low resolution and sketch. Di dalam: IEEE Computer Vision and Pattern
Recognition (CVPR) 2011; 2011 Jun 21-23; Colorado, United States. Los
Alamitos (US): IEEE Computer Society. hlm 593-600.
Su Y, Shan S, Chen X, Gao W. 2009. Hierarchical ensemble of global and local
classifiers for face recognition. IEEE T Image Process. 18(8):18851896.doi:10.1109/TIP.2009.202173.
Yang L, Ouyang Z, Shi Y. A modified clustering method based on self-organizing
maps and its applications. Procedia Computer Science. 9(2012):1371-1379.doi:
10.1016/j.procs.2012.04.151.

14

Lampiran 1 Beberapa data yang digunakan pada penelitian

15
Lampiran 2 Contoh perhitungan LVQ (Fausset 1994)
Pada contoh ini, digunakan
merepresentasikan dua kelas, 1 dan 2:
Vektor

2

referensi

vektor.

Vektor

berikut

Kelas
1
2
2
1
2

Untuk inisialisasi vektor referensi, digunakan 2 baris pertama pada vektor
yang masing-masing mewakili kelas 1 dan 2. Sehingga, unit keluaran pertama
merepresentasikan kelas 1 dan unit keluaran kedua untuk kelas 2 (secara simbolis
= 1 dan
= 2). Vektor yang digunakan untuk pelatihan, yaitu (0,0,1,1),
(1,0,0,0), dan (0,1,1,0).
Perhitungan hanya dilakukan 1 iterasi (1 epoch) saja, yaitu:
1
Inisialisasi bobot:
w1 = (1,1,0,0)
w2 = (0,0,0,1)
2

Inisialisasi learning rate: = 0.1
Untuk input vektor x = (0,0,1,1) dan T = 2 lakukan:
o
Perhitungan jarak terdekat yang dalam contoh ini menggunakan jarak
Euclidean.
d1 = √ -

-

-



-



-

Karena x lebih dekat ke w2, J = 2 dan
= 2. Target sama dengan
kelas.
o
Update w2 sebagai berikut:
w2 = (0,0,0,1) + 0.1[ (0,0,1,1) - (0,0,0,1) ] = (0,0,0.1,1)
Untuk input vektor x = (1,0,0,0) dan T = 1 lakukan:
o
Perhitungan jarak terdekat menggunakan jarak Euclidean.

o

3

d2 = √ -

-

d1 = √ -

o
o

d2 = √ -

-

-

-





Karena x lebih dekat ke w1, J = 1 dan
kelas.
Update w1 sebagai berikut:

= 1. Target sama dengan

16

4

w1 = (1,1,0,0) + 0.1[ (1,0,0,0) - (1,1,0,0) ] = (1,0.9,0,0)
Untuk input vektor x = (0,1,1,0) dan T = 2 lakukan:
o
Perhitungan jarak terdekat menggunakan jarak Euclidean.
d1 = √ o
o

d2 = √ -

-

-

-





Karena x lebih dekat ke w1, J = 1 dan
= 1. T = 2 namun
= 1.
Target tidak sama dengan kelas.
Update w1 sebagai berikut:
w1 = (1,0.9,0,0) - 0.1[ (0,1,1,0) - (1,0.9,0,0) ] = (1.1,0.89,-0.1,0)

Bobot setelah 1 iterasi adalah:
w1 = (1.1,0.89,-0.1,0)
w2 = (0,0,0.1,1)

17
Lampiran 3 Hasil percobaan
Ulangan

Iterasi /
Fold

1

1
2
3
4
5
6
7
8
9
10

Rata - rata

2

1
2
3
4
5
6
7
8
9
10

Rata - rata

3

Rata - rata

1
2
3
4
5
6
7
8
9
10

Akurasi
SOM
89.4737%
97.3684%
94.7368%
100.0000%
100.0000%
89.4737%
92.1053%
100.0000%
100.0000%
89.4737%
95.2632%
94.7368%
100.0000%
97.3684%
89.4737%
92.1053%
100.0000%
100.0000%
100.0000%
100.0000%
89.4737%
96.3158%
100.0000%
100.0000%
92.1053%
97.3684%
100.0000%
94.7368%
100.0000%
100.0000%
94.7368%
100.0000%
97.8947%

Akurasi
LVQ
100.0000%
97.3684%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
99.7368%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%

Akurasi LVQ
Inisialisasi SOM
100.0000%
97.3684%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
99.7368%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%
100.0000%

18
Lampiran 4 Sebagian data kelas 17 dan kelas 19

19
Lampiran 5 Tabel kesalahan SOM
Ulangan Fold ID File Kelas Seharusnya Kelas yang dikenali
8
17
19
18
17
19
1
13
19
17
19
19
17
2
3
19
17
9
17
19
3
7
19
17
1
17
19
4
17
19
1
6
10
19
17
18
19
17
10
17
19
7
11
17
19
6
19
17
6
17
19
16
17
19
10
12
19
17
14
19
17
9
17
19
1
15
19
17
3
10
19
17
1
17
19
17
17
19
4
1
19
17
12
19
17
2
15
17
19
5
11
19
17
18
19
17
4
17
19
6
17
19
10
3
19
17
7
19
17
13
17
19
3
17
17
19
12
19
17
4
11
17
19
3
14
19
17
6
19
19
17
9
17
19
9
16
19
17

20

RIWAYAT HIDUP
Penulis dilahirkan di Sumedang pada tanggal 2 Desember 1989 dari
pasangan Mohamad Yunus dan Neni Wartini. Penulis merupakan anak pertama
dari 2 bersaudara.
Tahun 2007 penulis lulus dari SMA Negeri 3 Sukabumi dan pada tahun
yang sama penulis masuk Institut Pertanian Bogor (IPB) Program Diploma pada
Program Keahlian Teknik Komputer. Tahun 2009 penulis mengikuti lomba
Ganesha Line Follower Robot (Galelobot) 2009 di Institut Teknologi Bandung.
Penulis lulus pada tahun 2010 dan bekerja selama 10 bulan di PT Pusat Media
Indonesia.
Pada tahun 2011, penulis melanjutkan studi ke Program S1 Ilmu Komputer
Alih Jenis, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Institut Pertanian Bogor. Tahun 2013 penulis mengikuti
lomba Pagelaran Mahasiswa Nasional Bidang Teknologi Informasti (Gemastik) 6
bidang data mining di Institut Teknologi Bandung dan masuk kategori 6 besar.