Temu Kembali Citra Wajah berdasarkan Pengukuran Kemiripan Fitur dengan Menggunakan Jaringan Bayesian
TEMU KEMBALI CITRA WAJAH BERDASARKAN
PENGUKURAN KEMIRIPAN FITUR DENGAN
MENGGUNAKAN JARINGAN BAYESIAN
TESIS
HENDRIK SIAGIAN
107038003
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika
HENDRIK SIAGIAN 107038003 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
PENGESAHAN Judul : TEMU KEMBALI CITRA WAJAH BERDASARKAN
PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN Kategori : TESIS Nama : HENDRIK SIAGIAN Nomor Induk Mahasiswa : 107038003 Program Studi : S2 TEKNIK INFORMATIKA Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Prof. Dr. Muhammad Zarlis Dr. Poltak Sihombing, M.Kom Diketahui/disetujui oleh Program Studi S2 Teknik Informatika Ketua, Prof. Dr. Muhammad Zarlis NIP: 19570701 198601 1 003
PERNYATAAN
TEMU KEMBALI CITRA WAJAH BERDASARKAN
PENGUKURAN KEMIRIPAN FITUR DENGAN
MENGGUNAKAN JARINGAN BAYESIAN
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 28 Agustus 2013 Hendrik Siagian NIM. 107038003
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini : Nama : Hendrik Siagian NIM : 107038003 Program Studi : S2 Teknik Informatika Jenis Karya Ilmiah : Tesis
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royati Non-Eksklusif (Non-Exclusive Royalty
Free Right ) atas tesis saya yang berjudul:
TEMU KEMBALI CITRA WAJAH BERDASARKAN
PENGUKURAN KEMIRIPAN FITUR DENGAN
MENGGUNAKAN JARINGAN BAYESIAN
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non- Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikan pernyataan ini dibuat dengan sebenarnya.
Medan, 28 Agustus 2013 Hendrik Siagian
NIM. 107038003 Telah diuji pada Tanggal : 28 Agustus 2013 PANITIA PENGUJI TESIS Ketua : Dr. Poltak Sihombing, M.Kom Anggota : 1. Prof. Dr. Muhammad Zarlis
2. Prof. Dr. Opim Salim Sitompul 3. Dr. Erna Budhiarti Nababan, M.I.T.
4. Prof. Dr. Herman Mawengkang
RIWAYAT HIDUP
DATA PRIBADINama lengkap berikut gelar : Ir. Hendrik Siagian Tempat dan Tanggal Lahir : Balige, 28 Juli 1966 Alamat Rumah : Jalan Karya Amal No. 10 A
Kelurahan Pangkalan Masyhur - Medan Telepon/Faks/HP : 081 265 488 48 e-mail : Instansi Tempat Bekerja : Universitas Prima Medan Alamat Kantor : Jalan Sekip Simpang Sikambing – Medan Telepon : 061-4578870, 061-4578890
DATA PENDIDIKAN
SD : SD Negeri No. 173524 Balige TAMAT : 1977 SLTP : SMP Negeri 2 Balige TAMAT : 1981 SLTA : SMA Negeri 1 Balige TAMAT : 1984 S1 : Teknik Elektro USU - Medan TAMAT : 1992 S2 : Teknik Informatika USU Medan TAMAT : 2013
UCAPAN TERIMA KASIH
Puji syukur kehadirat Allah Yang Maha Kuasa, atas segala limpahan rahmat dan karunia-Nya, penulis dapat menyelesaikan tesis ini dengan baik. Tesis dengan judul “Temu Kembali Citra Wajah berdasarkan Pengukuran Kemiripan Fitur
dengan Menggunakan Jaringan Bayesian” diajukan untuk melengkapi tugas dan
memenuhi syarat memperoleh ijazah Magister Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatra Utara Medan.
Dengan selesainya penulisan tesis ini, penulis mengucapkan terima kasih kepada:
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada saya untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2)
2. Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara sekaligus Ketua Program Studi Magister (S2) Teknik Informatika, Bapak Prof. Dr. Muhammad Zarlis dan sekretaris Program Studi Magister (S2) Teknik Informatika Bapak M. Andri Budiman, S.T, M.Comp.Sc., M.E.M. beserta seluruh staff pengajar pada Program Studi Magister (S2) Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatra Utara Medan 3. Pembimbing utama Bapak Dr. Poltak Sihombing, M.Kom. dan pembimbing kedua
Bapak Prof. Dr. Muhammad Zarlis atas kesediaan dan penuh kesabaran membimbing saya hingga selesainya tesis ini dengan baik
4. Pembanding tesis, Bapak Prof. Dr. Opim Salim Sitompul, Ibu Dr. Erna Budhiarti Nababan, M.I.T. dan Bapak Prof. Dr. Herman Mawengkang yang telah memberikan saran dan masukan serta arahan yang baik demi penyelesaian tesis ini
5. Staff Pegawai dan Administrasi pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fakultas Ilmu Komputer Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan terbaik kapada penulis selama mengikuti perkuliahan hingga saat ini
6. Istri tercinta Ir., Dra. Ellen Tampubolon MSi., dan seluruh keluarga besar penulis yang tidak dapat disebutkan satu persatu, atas perhatian dan segala pengorbanannya, baik moril maupun materil
7. Rekan mahasiswa/i angkatan kedua tahun 2010 pada Program Studi S2 Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatra Utara yang telah banyak membantu penulis berupa dorongan semangat selama mengikuti perkuliahan
8. Seluruh pihak yang tidak dapat penulis sebutkan satu persatu, atas segala bantuan dan doa yang diberikan.
Dengan segala kekurangan dan kerendahan hati, sekali lagi penulis mengucapkan terimakasih. Semoga kiranya Allah Yang Maha Kuasa membalas segala bantuan dan kebaikan yang telah diberikan kepada penulis.
Medan, 28 Agustus 2013 NIM:107038003 Hendrik Siagian
ABSTRAK
Dalam penelitian ini, karakteristik citra wajah dinyatakan melalui tiga buah fitur citra yang diekstrak secara langsung dari citra wajah kunci yaitu fitur warna, fitur bentuk dan fitur tekstur. Fitur warna diekstraksi dengan menggunakan histogram warna HSI
(hue, saturation, intensity ); fitur bentuk diekstraksi dengan menggunakan operator
Sobel dan disusun dalam edge direction histogram; fitur tekstur diekstraksi dengan
menggunakan co-occurence matrix. Karakteristik citra query dan citra-citra yang ada di dalam database dapat dianggap sebagai node-node yang saling berhubungan dan membentuk sebuah jaringan Bayesian. Jaringan Bayesian merupakan struktur grafik yang menggambarkan peluang relasi diantara variabel-variabel dalam jumlah yang besar dan dapat menarik peluang inferensi atas variabel-variable tersebut. Link antara dua variabel atau node akan merepresentasikan peluang kejadian dari derajat kemiripan citra query dengan setiap citra dalam database dapat diukur dengan cara membandingkan karakteristik citra query dengan karakteristik citra-citra dalam
database. Evaluasi terhadap precision hasil temu kembali citra wajah untuk setiap
recall memperlihatkan kinerja jaringan Bayesian sangat baik.Kata Kunci : Temu Kembali Citra Wajah, Ekstraksi Fitur, Jaringan Bayesian
FACE IMAGE RETRIEVAL BASED ON
FEATURE SIMILARITY MEASUREMENT
USING BAYESIAN NETWORK
ABSTRACT
In this study, the characteristics of the face image is expressed through three image features extracted directly from the key facial image color features, shape features and texture features. Color feature extracted by using color histograms HSI (hue, saturation, intensity); shape features extracted by using Sobel operator and arranged in edge direction histogram; texture features extracted by using co-occurence matrix. Characteristics of the query image and the images in the database can be considered as the nodes that are interconnected and form a Bayesian network. Bayesian network is a graph illustrating the structure of relationships among chance variables in a large number of exciting opportunities and inference on the set of variables. Link between two variables or nodes will represent opportunities occurrence of the degree of similarity with the query image of each image in the database, can be measured by comparing the query image characteristics with the characteristics of the images in the database. The evaluation of the results of image retrieval precision for each recall faces show very good performance of Bayesian network. Keywords: Face Image Retrieval, Feature Extraction, Bayesian Network
DAFTAR ISI
Halaman PENGESAHAN ii
BAB 1 PENDAHULUAN
2.7 Recall dan Precision
16
2.4.4. Pendeteksian Tepi
16
2.4.5. Tekstur
18
2.4.6. Co-ocurence Matrix
19
2.5 Cosine Similarity
21
2.6 Formula Bayes
22
22
2.8 Riset-riset Terkait
23
15
26
2.9 Persamaan dengan Riset-riset Lain
28
2.10 Perbedaan dengan Riset-riset Lain
28
2.11 Kontribusi Riset
28 BAB 3 METODOLOGI PENELITIAN
30
3.1 Pelaksanaan Penelitian
30
3.2 Blok Diagram Proses
31
2.4.3. Histogram Warna Konvensional
2.4.2. Operasi Ambang Batas (Thresholding)
PERNYATAAN ORISINALITAS iii
1.3 Batasan Masalah
PERNYATAAN PERSETUJUAN PUBLIKASI iv PANITIA PENGUJI TESIS v
RIWAYAT HIDUP vi
UCAPAN TERIMA KASIH vii
ABSTRAK ix
ABSTRACT x
DAFTAR ISI xi
DAFTAR TABEL xiii
DAFTAR GAMBAR xiv
1
1.1 Latar Belakang
1
1.2 Rumusan Masalah
3
3
11
1.4 Tujuan Penelitian
4
1.5 Manfaat Penelitian
4 BAB 2 TINJAUAN PUSTAKA
5
2.1 Information Retrieval
5
2.2 Image Retrieval Method
6
2.3 Citra Digital
6
2.4 Pengolahan Citra Digital
8
2.4.1. Ruang Warna (Color Space)
2.6.1 Bayesian Network
3.3
33 Proses Ekstraksi Fitur Citra
3.3.1
34 Ekstraksi Fitur Warna
3.3.2
34 Ekstraksi Fitur Bentuk
3.3.3
35 Ekstraksi Fitur Textur
3.3.4
36 Model Jaringan Bayesian
3.3.5
37 Evaluasi Hasil Temu-Kembali
3.4
37 Perancangan Sistem
3.4.1
38 Folder Sistem
3.4.2
38 Perancangan Antar-Muka Pemakai
BAB 4 HASIL DAN PEMBAHASAN
41
4.1
41 Pendahuluan
4.2
42 Data Citra
4.3
43 Aplikasi Face Image Retrieval
4.3.1
44 Menampilkan File Citra Wajah Query
4.3.2
45 Melaksanakan Proses Pencarian
4.3.3
46 Melihat Hasil Pencarian
4.3.4
47 Melihat Citra Sumber Wajah
4.4
47 Pembahasan
4.4.1
47 Pembangunan Indeks Fitur
4.4.2
47 Ekstraksi Fitur Warna
4.4.3
57 Ekstraksi Fitur Bentuk
4.4.4
62 Ekstraksi Fitur Tekstur
4.4.5
67 Pengukuran Kemiripan Fitur
4.5
79 Analisis Hasil
BAB 5 KESIMPULAN DAN SARAN
78
5.1
78 Kesimpulan
5.2
78 Saran DAFTAR PUSTAKA
80 LAMPIRAN KODE PROGRAM
82
DAFTAR TABEL
Halaman
Tabel 2.1 Recall dan Precision25 Tabel 4.1 Relasi File Citra Wajah dengan Citra Sumber
42 Tabel 4.2 Kuantisasi Ruang Warna dari Histogram HSI-162 bin
49 Tabel 4.3 Warna HSI dari Citra Wajah
54 Tabel 4.4 Histogram HSI-162 bin dari Citra Wajah
55 Tabel 4.5 Vektor Fitur Warna Citra Wajah
56 Tabel 4.6 Kuantisasi Sudut Tepi ( θ)
61 Tabel 4.7 Vektor Fitur Bentuk Citra Wajah
62 Tabel 4.8 Vektor Fitur Tekstur Citra Wajah
66 Tabel 4.9 Ranking Citra Hasil Temu Kembali
76 Tabel 4.10 Nilai Recall dan Precision dari Pengukuran Fitur
77
DAFTAR GAMBAR
57 Gambar 4.15 Matriks Hasil Deteksi Tepi
47 Gambar 4.7 Contoh Citra Wajah
50 Gambar 4.8 Data Warna Merah (Red)
51 Gambar 4.9 Data Warna Hijau (Green)
51 Gambar 4.10 Data Warna Biru (Blue)
51 Gambar 4.11 Data Warna H (hue)
52 Gambar 4.12 Data Warna S (saturation)
52 Gambar 4.13 Data Warna I (intensity)
53 Gambar 4.14 Data Warna Grayscale
59 Gambar 4.16 Matriks Gradien Arah Horizontal (gx)
46 Gambar 4.5 Hasil Temu-Kembali dengan Ranking
59 Gambar 4.17 Matriks Gradien Arah Vertikal (gy)
60 Gambar 4.18 Edge Direction
60 Gambar 4.19 Matrik Co-occurence Sudut 0
Gambar 4.20 Matrik Co-occurence Sudut 4564 Gambar 4.21 Matrik Co-occurence Sudut 90
65 Gambar 4.22 Matrik Co-occurence Sudut 135
65 Gambar 4.23 Jaringan Bayesian Pengukuran Fitur Citra
67
66 Gambar 4.24 Citra Query face000F.bmp
46 Gambar 4.6 Citra Sumber Wajah
45 Gambar 4.4 Pilihan Pengukuran yang Tersedia
Halaman
26 Gambar 3.1 Blok Diagram Proses Pencuplikan Citra Wajah
Gambar 2.1 Interaksi User dengan Retrieval System5 Gambar 2.2 Tahap-tahap Dasar Pengolahan Citra Digital
8 Gambar 2.3 Kedudukan dan Panjang Gelombang dari Cahaya Tampak
12 Gambar 2.4 Representasi Ruang Warna HSI (Hue, Saturation, Intensity)
14 Gambar 2.5 Matrik Konvolusi Pendeteksi Tepi Sobel
17 Gambar 2.6 Penyusunan Matriks co-occurence
20 Gambar 2.7 Model Umum Bayesian Network untuk CBIR
23 Gambar 2.8 Diagram Himpunan Dokumen
24 Gambar 2.9 Grafik Recall – Precision
32 Gambar 3.2 Blok Diagram Proses Pembangunan Indeks Fitur
44 Gambar 4.3 Citra Wajah Query
32 Gambar 3.3 Blok Diagram Proses Temu-Kembali Citra Wajah
33 Gambar 3.4 Model Jaringan Bayesian
37 Gambar 3.5 Struktur Folder Sistim Face Image Retrieval (FIR)
38 Gambar 3.6 Rancangan Menu
39 Gambar 3.7 Rancangan Jendela Utama
39 Gambar 3.8 Rancangan Jendela Hasil Temu-Kembali
40 Gambar 3.9 Rancangan Antarmuka Citra Sumber Wajah
40 Gambar 4.1 Jendela Utama Aplikasi Face Image Retrieval
43 Gambar 4.2 Kotak Dialog Open File
72
Gambar 4.25 Citra Relevan dengan Citra Query73 Gambar 4.26 Hasil Temu Kembali dengan Pengukuran Fitur Warna (Color)
74 Gambar 4.27 Hasil Temu Kembali dengan Pengukuran Fitur Bentuk (Shape)
74 Gambar 4.28 Hasil Temu Kembali dengan Pengukuran Fitur Tekstur (Texture)
75 Gambar 4.29 Hasil Temu Kembali dengan Pengukuran Fitur Gabungan
75 Gambar 4.30 Grafik Recall – Precision
77