Temu Kembali Citra Wajah berdasarkan Pengukuran Kemiripan Fitur dengan Menggunakan Jaringan Bayesian

(1)

TEMU KEMBALI CITRA WAJAH BERDASARKAN

PENGUKURAN KEMIRIPAN FITUR DENGAN

MENGGUNAKAN JARINGAN BAYESIAN

TESIS

HENDRIK SIAGIAN

107038003

PROGRAM STUDI S2 TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013


(2)

TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN

MENGGUNAKAN JARINGAN BAYESIAN

TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika

HENDRIK SIAGIAN 107038003

PROGRAM STUDI S2 TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2013


(3)

PENGESAHAN

Judul : TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN

Kategori : TESIS

Nama : HENDRIK SIAGIAN

Nomor Induk Mahasiswa : 107038003

Program Studi : S2 TEKNIK INFORMATIKA

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Prof. Dr. Muhammad Zarlis Dr. Poltak Sihombing, M.Kom

Diketahui/disetujui oleh

Program Studi S2 Teknik Informatika Ketua,

NIP: 19570701 198601 1 003 Prof. Dr. Muhammad Zarlis


(4)

PERNYATAAN

TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN

MENGGUNAKAN JARINGAN BAYESIAN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 28 Agustus 2013

NIM. 107038003 Hendrik Siagian


(5)

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini :

Nama : Hendrik Siagian

NIM : 107038003

Program Studi : S2 Teknik Informatika Jenis Karya Ilmiah : Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royati Non-Eksklusif (Non-Exclusive Royalty Free Right) atas tesis saya yang berjudul:

TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN

MENGGUNAKAN JARINGAN BAYESIAN

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.

Demikan pernyataan ini dibuat dengan sebenarnya.

Medan, 28 Agustus 2013

NIM. 107038003 Hendrik Siagian


(6)

Telah diuji pada

Tanggal : 28 Agustus 2013

PANITIA PENGUJI TESIS

Ketua : Dr. Poltak Sihombing, M.Kom Anggota : 1. Prof. Dr. Muhammad Zarlis

2. Prof. Dr. Opim Salim Sitompul 3. Dr. Erna Budhiarti Nababan, M.I.T. 4. Prof. Dr. Herman Mawengkang


(7)

RIWAYAT HIDUP

DATA PRIBADI

Nama lengkap berikut gelar : Ir. Hendrik Siagian Tempat dan Tanggal Lahir : Balige, 28 Juli 1966

Alamat Rumah : Jalan Karya Amal No. 10 A

Kelurahan Pangkalan Masyhur - Medan Telepon/Faks/HP : 081 265 488 48

e-mail :

Instansi Tempat Bekerja : Universitas Prima Medan

Alamat Kantor : Jalan Sekip Simpang Sikambing – Medan Telepon : 061-4578870, 061-4578890

DATA PENDIDIKAN

SD : SD Negeri No. 173524 Balige TAMAT : 1977 SLTP : SMP Negeri 2 Balige TAMAT : 1981 SLTA : SMA Negeri 1 Balige TAMAT : 1984 S1 : Teknik Elektro USU - Medan TAMAT : 1992 S2 : Teknik Informatika USU Medan TAMAT : 2013


(8)

UCAPAN TERIMA KASIH

Puji syukur kehadirat Allah Yang Maha Kuasa, atas segala limpahan rahmat dan karunia-Nya, penulis dapat menyelesaikan tesis ini dengan baik. Tesis dengan judul “Temu Kembali Citra Wajah berdasarkan Pengukuran Kemiripan Fitur dengan Menggunakan Jaringan Bayesian” diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatra Utara Medan.

Dengan selesainya penulisan tesis ini, penulis mengucapkan terima kasih kepada:

1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada saya untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2)

2. Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara sekaligus Ketua Program Studi Magister (S2) Teknik Informatika, Bapak Prof. Dr. Muhammad Zarlis dan sekretaris Program Studi Magister (S2) Teknik Informatika Bapak M. Andri Budiman, S.T, M.Comp.Sc., M.E.M. beserta seluruh staff pengajar pada Program Studi Magister (S2) Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatra Utara Medan 3. Pembimbing utama Bapak Dr. Poltak Sihombing, M.Kom. dan pembimbing kedua

Bapak Prof. Dr. Muhammad Zarlis atas kesediaan dan penuh kesabaran membimbing saya hingga selesainya tesis ini dengan baik

4. Pembanding tesis, Bapak Prof. Dr. Opim Salim Sitompul, Ibu Dr. Erna Budhiarti Nababan, M.I.T. dan Bapak Prof. Dr. Herman Mawengkang yang telah memberikan saran dan masukan serta arahan yang baik demi penyelesaian tesis ini 5. Staff Pegawai dan Administrasi pada Program Studi Magister (S2) Teknik

Informatika Program Pascasarjana Fakultas Ilmu Komputer Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan terbaik kapada penulis selama mengikuti perkuliahan hingga saat ini

6. Istri tercinta Ir., Dra. Ellen Tampubolon MSi., dan seluruh keluarga besar penulis yang tidak dapat disebutkan satu persatu, atas perhatian dan segala pengorbanannya, baik moril maupun materil


(9)

7. Rekan mahasiswa/i angkatan kedua tahun 2010 pada Program Studi S2 Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatra Utara yang telah banyak membantu penulis berupa dorongan semangat selama mengikuti perkuliahan

8. Seluruh pihak yang tidak dapat penulis sebutkan satu persatu, atas segala bantuan dan doa yang diberikan.

Dengan segala kekurangan dan kerendahan hati, sekali lagi penulis mengucapkan terimakasih. Semoga kiranya Allah Yang Maha Kuasa membalas segala bantuan dan kebaikan yang telah diberikan kepada penulis.

Medan, 28 Agustus 2013

NIM:107038003 Hendrik Siagian


(10)

ABSTRAK

Dalam penelitian ini, karakteristik citra wajah dinyatakan melalui tiga buah fitur citra yang diekstrak secara langsung dari citra wajah kunci yaitu fitur warna, fitur bentuk dan fitur tekstur. Fitur warna diekstraksi dengan menggunakan histogram warna HSI (hue, saturation, intensity); fitur bentuk diekstraksi dengan menggunakan operator Sobel dan disusun dalam edge direction histogram; fitur tekstur diekstraksi dengan menggunakan co-occurence matrix. Karakteristik citra query dan citra-citra yang ada di dalam database dapat dianggap sebagai node-node yang saling berhubungan dan membentuk sebuah jaringan Bayesian. Jaringan Bayesian merupakan struktur grafik yang menggambarkan peluang relasi diantara variabel-variabel dalam jumlah yang besar dan dapat menarik peluang inferensi atas variabel-variable tersebut. Link antara dua variabel atau node akan merepresentasikan peluang kejadian dari derajat kemiripan citra query dengan setiap citra dalam database dapat diukur dengan cara membandingkan karakteristik citra query dengan karakteristik citra-citra dalam database. Evaluasi terhadap precision hasil temu kembali citra wajah untuk setiap recall memperlihatkan kinerja jaringan Bayesian sangat baik.


(11)

FACE IMAGE RETRIEVAL BASED ON

FEATURE SIMILARITY MEASUREMENT

USING BAYESIAN

NETWORK

ABSTRACT

In this study, the characteristics of the face image is expressed through three image features extracted directly from the key facial image color features, shape features and texture features. Color feature extracted by using color histograms HSI (hue, saturation, intensity); shape features extracted by using Sobel operator and arranged in edge direction histogram; texture features extracted by using co-occurence matrix. Characteristics of the query image and the images in the database can be considered as the nodes that are interconnected and form a Bayesian network. Bayesian network is a graph illustrating the structure of relationships among chance variables in a large number of exciting opportunities and inference on the set of variables. Link between two variables or nodes will represent opportunities occurrence of the degree of similarity with the query image of each image in the database, can be measured by comparing the query image characteristics with the characteristics of the images in the database. The evaluation of the results of image retrieval precision for each recall faces show very good performance of Bayesian network.


(12)

DAFTAR ISI

Halaman

PENGESAHAN ii

PERNYATAAN ORISINALITAS iii

PERNYATAAN PERSETUJUAN PUBLIKASI iv

PANITIA PENGUJI TESIS v

RIWAYAT HIDUP vi

UCAPAN TERIMA KASIH vii

ABSTRAK ix

ABSTRACT x

DAFTAR ISI xi

DAFTAR TABEL xiii

DAFTAR GAMBAR xiv

BAB 1 PENDAHULUAN 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 4

1.5 Manfaat Penelitian 4

BAB 2 TINJAUAN PUSTAKA 5

2.1 Information Retrieval 5

2.2 Image Retrieval Method 6

2.3 Citra Digital 6

2.4 Pengolahan Citra Digital 8

2.4.1. Ruang Warna (Color Space) 11 2.4.2. Operasi Ambang Batas (Thresholding) 15 2.4.3. Histogram Warna Konvensional 16

2.4.4. Pendeteksian Tepi 16

2.4.5. Tekstur 18

2.4.6. Co-ocurence Matrix 19

2.5 Cosine Similarity 21

2.6 Formula Bayes 22

2.6.1 Bayesian Network 22

2.7 Recall dan Precision 23

2.8 Riset-riset Terkait 26

2.9 Persamaan dengan Riset-riset Lain 28 2.10 Perbedaan dengan Riset-riset Lain 28

2.11 Kontribusi Riset 28

BAB 3 METODOLOGI PENELITIAN 30


(13)

3.3 Proses Ekstraksi Fitur Citra 33

3.3.1 Ekstraksi Fitur Warna 34

3.3.2 Ekstraksi Fitur Bentuk 34

3.3.3 Ekstraksi Fitur Textur 35

3.3.4 Model Jaringan Bayesian 36

3.3.5 Evaluasi Hasil Temu-Kembali 37

3.4 Perancangan Sistem 37

3.4.1 Folder Sistem 38

3.4.2 Perancangan Antar-Muka Pemakai 38

BAB 4 HASIL DAN PEMBAHASAN 41

4.1 Pendahuluan 41

4.2 Data Citra 42

4.3 Aplikasi Face Image Retrieval 43

4.3.1 Menampilkan File Citra Wajah Query 44 4.3.2 Melaksanakan Proses Pencarian 45

4.3.3 Melihat Hasil Pencarian 46

4.3.4 Melihat Citra Sumber Wajah 47

4.4 Pembahasan 47

4.4.1 Pembangunan Indeks Fitur 47

4.4.2 Ekstraksi Fitur Warna 47

4.4.3 Ekstraksi Fitur Bentuk 57

4.4.4 Ekstraksi Fitur Tekstur 62

4.4.5 Pengukuran Kemiripan Fitur 67

4.5 Analisis Hasil 79

BAB 5 KESIMPULAN DAN SARAN 78

5.1 Kesimpulan 78

5.2 Saran 78

DAFTAR PUSTAKA 80


(14)

DAFTAR TABEL

Halaman

Tabel 2.1 Recall dan Precision 25

Tabel 4.1 Relasi File Citra Wajah dengan Citra Sumber 42 Tabel 4.2 Kuantisasi Ruang Warna dari Histogram HSI-162 bin 49

Tabel 4.3 Warna HSI dari Citra Wajah 54

Tabel 4.4 Histogram HSI-162bin dari Citra Wajah 55 Tabel 4.5 Vektor Fitur Warna Citra Wajah 56

Tabel 4.6 Kuantisasi Sudut Tepi (θ) 61

Tabel 4.7 Vektor Fitur Bentuk Citra Wajah 62 Tabel 4.8 Vektor Fitur Tekstur Citra Wajah 66 Tabel 4.9 Ranking Citra Hasil Temu Kembali 76 Tabel 4.10 Nilai Recall dan Precision dari Pengukuran Fitur 77


(15)

DAFTAR GAMBAR

Halaman Gambar 2.1 Interaksi User dengan Retrieval System 5 Gambar 2.2 Tahap-tahap Dasar Pengolahan Citra Digital 8 Gambar 2.3 Kedudukan dan Panjang Gelombang dari Cahaya Tampak 12 Gambar 2.4 Representasi Ruang Warna HSI (Hue, Saturation, Intensity) 14 Gambar 2.5 Matrik Konvolusi Pendeteksi Tepi Sobel 17 Gambar 2.6 Penyusunan Matriks co-occurence 20 Gambar 2.7 Model Umum Bayesian Network untuk CBIR 23

Gambar 2.8 Diagram Himpunan Dokumen 24

Gambar 2.9 Grafik Recall Precision 26

Gambar 3.1 Blok Diagram Proses Pencuplikan Citra Wajah 32 Gambar 3.2 Blok Diagram Proses Pembangunan Indeks Fitur 32 Gambar 3.3 Blok Diagram Proses Temu-Kembali Citra Wajah 33

Gambar 3.4 Model Jaringan Bayesian 37

Gambar 3.5 Struktur Folder Sistim Face Image Retrieval (FIR) 38

Gambar 3.6 Rancangan Menu 39

Gambar 3.7 Rancangan Jendela Utama 39

Gambar 3.8 Rancangan Jendela Hasil Temu-Kembali 40 Gambar 3.9 Rancangan Antarmuka Citra Sumber Wajah 40 Gambar 4.1 Jendela Utama Aplikasi Face Image Retrieval 43

Gambar 4.2 Kotak Dialog Open File 44

Gambar 4.3 Citra Wajah Query 45

Gambar 4.4 Pilihan Pengukuran yang Tersedia 46 Gambar 4.5 Hasil Temu-Kembali dengan Ranking 46

Gambar 4.6 Citra Sumber Wajah 47

Gambar 4.7 Contoh Citra Wajah 50

Gambar 4.8 Data Warna Merah (Red) 51

Gambar 4.9 Data Warna Hijau (Green) 51

Gambar 4.10 Data Warna Biru (Blue) 51

Gambar 4.11 Data Warna H (hue) 52

Gambar 4.12 Data Warna S (saturation) 52

Gambar 4.13 Data Warna I (intensity) 53

Gambar 4.14 Data Warna Grayscale 57

Gambar 4.15 Matriks Hasil Deteksi Tepi 59

Gambar 4.16 Matriks Gradien Arah Horizontal (gx) 59 Gambar 4.17 Matriks Gradien Arah Vertikal (gy) 60

Gambar 4.18 Edge Direction 60

Gambar 4.19 Matrik Co-occurence Sudut 00 Gambar 4.20 Matrik Co-occurence Sudut 45

64 0

Gambar 4.21 Matrik Co-occurence Sudut 90

65 0

Gambar 4.22 Matrik Co-occurence Sudut 135

65 0

Gambar 4.23 Jaringan Bayesian Pengukuran Fitur Citra 67 66


(16)

Gambar 4.25 Citra Relevan dengan Citra Query 73 Gambar 4.26 Hasil Temu Kembali dengan Pengukuran Fitur Warna (Color) 74 Gambar 4.27 Hasil Temu Kembali dengan Pengukuran Fitur Bentuk (Shape) 74 Gambar 4.28 Hasil Temu Kembali dengan Pengukuran Fitur Tekstur (Texture) 75 Gambar 4.29 Hasil Temu Kembali dengan Pengukuran Fitur Gabungan 75


(17)

ABSTRAK

Dalam penelitian ini, karakteristik citra wajah dinyatakan melalui tiga buah fitur citra yang diekstrak secara langsung dari citra wajah kunci yaitu fitur warna, fitur bentuk dan fitur tekstur. Fitur warna diekstraksi dengan menggunakan histogram warna HSI (hue, saturation, intensity); fitur bentuk diekstraksi dengan menggunakan operator Sobel dan disusun dalam edge direction histogram; fitur tekstur diekstraksi dengan menggunakan co-occurence matrix. Karakteristik citra query dan citra-citra yang ada di dalam database dapat dianggap sebagai node-node yang saling berhubungan dan membentuk sebuah jaringan Bayesian. Jaringan Bayesian merupakan struktur grafik yang menggambarkan peluang relasi diantara variabel-variabel dalam jumlah yang besar dan dapat menarik peluang inferensi atas variabel-variable tersebut. Link antara dua variabel atau node akan merepresentasikan peluang kejadian dari derajat kemiripan citra query dengan setiap citra dalam database dapat diukur dengan cara membandingkan karakteristik citra query dengan karakteristik citra-citra dalam database. Evaluasi terhadap precision hasil temu kembali citra wajah untuk setiap recall memperlihatkan kinerja jaringan Bayesian sangat baik.


(18)

FACE IMAGE RETRIEVAL BASED ON

FEATURE SIMILARITY MEASUREMENT

USING BAYESIAN

NETWORK

ABSTRACT

In this study, the characteristics of the face image is expressed through three image features extracted directly from the key facial image color features, shape features and texture features. Color feature extracted by using color histograms HSI (hue, saturation, intensity); shape features extracted by using Sobel operator and arranged in edge direction histogram; texture features extracted by using co-occurence matrix. Characteristics of the query image and the images in the database can be considered as the nodes that are interconnected and form a Bayesian network. Bayesian network is a graph illustrating the structure of relationships among chance variables in a large number of exciting opportunities and inference on the set of variables. Link between two variables or nodes will represent opportunities occurrence of the degree of similarity with the query image of each image in the database, can be measured by comparing the query image characteristics with the characteristics of the images in the database. The evaluation of the results of image retrieval precision for each recall faces show very good performance of Bayesian network.


(19)

BAB 1

PENDAHULUAN

1.1. Latar Belakang

Citra digital dapat menyampaikan sejumlah informasi tersirat yang dapat diinterpretasikan oleh pengamat secara langsung. Untuk memanfaatkan citra digital sebagai sumber informasi, maka diperlukan database citra digital (digital image database). Database citra digital berfungsi untuk menampung sejumlah citra yang mengandung informasi yang diperlukan. Di dalam penelitian ini, selanjutnya kata citra menyatakan citra digital statis kecuali disebutkan secara lengkap.

Seiring dengan kemajuan teknologi kamera saat ini, pembentukan database citra untuk kebutuhan tertentu semakin mudah dilakukan. Namun di sisi lain, dengan ketersediaan citra dalam jumlah besar akan memerlukan metode pencarian yang efisien untuk menemukan kembali citra query dari database citra. Beberapa metode pencarian untuk menemukan kembali citra telah dikembangkan. Secara umum, metode temu-kembali citra (image retrieval method) dapat diklasifikasikan menjadi dua kategori: metode berbasis-konsep (concept-based method) dan metode berbasis-kandungan (content-based method). Metode berbasis-konsep menggambarkan isi citra dengan teks dan field terstruktur. Deskriptor yang digunakan adalah himpunan kata kunci dari fitur citra yang menjelaskan warna, bentuk dan lain-lain. Metode berbasis-kandungan menggunakan fitur yang secara otomatis diambil dari dalam citra seperti tekstur, warna, bentuk dan kendala spasial untuk menjelaskan citra (Li et al, 2005).

Beberapa sistem temu-kembali citra berbasis-kandungan (content-based image retrieval, disingkat dengan CBIR) yang telah diusulkan antara lain QBIC, Photobook, PicToSeek (Li et al, 2005 dan Gopal dan Prasad, 2008), VisualSeek (Gopal dan Prasad, 2008). QBIC mendukung query berdasarkan sketsa, bentuk, warna dan tekstur. Photobook memanfaatkan representasi tekstur periodik dua dimensi dengan


(20)

menggunakan fungsi autokorelasi dan tekstur acak dengan model multiresolution simultaneous autoregressive. PicToSeek menggunakan fitur warna dan bentuk yang secara kasar invarian untuk rotasi, illumination dan prespektif (Li et al, 2005).

Keberhasilan sistem temu-kembali citra berbasis-kandungan sangat tergantung pada kemampuan menemukan fitur citra yang efektif mewakili sebuah citra, bagaimana cara mengukur fitur dan menentukan struktur data yang digunakan untuk menyimpan fitur sehingga mempermudah proses pencariannya kembali. Berbagai penelitian temu-kembali citra berbasis-kandungan dikembangkan dengan menggunakan fitur-fitur tertentu, metode pengukuran dan sistem klasifikasi citra yang bervariasi serta menerapkan kombinasi dari teknik-teknik komputasi untuk menyimpulkan hasilnya.

Li et al (2005) berdasarkan fitur bentuk memperkenalkan compound image descriptor yang diproses dengan menggunakan transformasi Fourier 2D. Ravi dan Wilson (2010) menggunakan fitur warna dengan ruang warna YCrCb dalam risetnya untuk mengenali jenis kelamin berdasarkan citra wajah. Jayech dan Mahjoub (2010) menggunakan Gaussian Mixture Model untuk mendeskripsikan fitur warna serta menggunakan Gray Level Co-occurence Matrix untuk mendeskripsikan fitur tekstur. Klasifikasi citra ditentukan dengan menggunakan Naive Bayesian, Tree Augmented Naive Bayser dan Forest Augmented Bayes. Sivabalakhrisnan dan Manjula (2010) menggunakan fitur warna dengan ruang warna HSV untuk mengekstraksi suatu objek dari latar-belakangnya. Iqbal dan Aggarwal (2002) menggunakan analisis warna dan tekstur. Ruang warna yang digunakan adalah CIE LAB dan ekstraksi tekstur menggunakan filter Gabor. Pengukuran kemiripan citra dihitung dengan jarak Euclidean.

Dengan mempertimbangkan gagasan-gagasan yang disampaikan oleh peneliti-peneliti sebelumnya, peneliti-penelitian ini menggunakan tiga buah fitur citra, yakni fitur warna (color feature), fitur bentuk (shape feature) dan fitur tekstur (texture feature). Pengukuran kemiripan fitur dihitung dengan menggunakan cosine similarity dan hasil temu-kembali ditentukan dengan menggunakan jaringan bayesian (bayesian network). Citra yang diamati adalah citra wajah manusia tampak depan.

Penelitian ini diberi judul “Temu Kembali Citra Wajah Berdasarkan Pengukuran Kemiripan Fitur dengan Menggunakan Jaringan Bayesian”. Model jaringan bayesian diharapkan mampu meningkatkan relevansi hasil temu kembali


(21)

citra. Dasar pemikirannya adalah jika satu fitur citra query memiliki peluang kemunculan atas setiap citra yang terdapat di dalam database, maka peluang kemiripan citra query terhadap setiap citra yang terdapat di dalam database dapat diketahui. Relevansi hasil temu-kembali citra diharapkan meningkat bila ketiga fitur, yakni fitur warna, fitur bentuk, fitur tekstur secara bersamaan diukur untuk menentukan tingkat kemiripan citra. Nilai peluang tertinggi menunjukkan citra dari database yang paling mirip dengan citra query.

Sistem yang diajukan dalam penelitian ini diharapkan dapat digunakan dan dikembangkan sebagai bagian dari sistem pengenalan diri untuk mengetahui hubungan-kebersamaan seseorang dengan orang lain melalui citra secara langsung.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan sebelumnya, maka rumusan masalah adalah tingkat relevansi temu-kembali citra belum memuaskan, akibatnya citra hasil pencarian tidak selalu sesuai dengan citra query.

1.3. Batasan Masalah

Batasan masalah yang digunakan dalam menyelesaikan penelitian ini adalah, 1. Citra yang akan diukur adalah citra statis dengan format jpg dan bmp. 2. Fitur citra yang diukur adalah fitur warna, fitur bentuk dan fitur tekstur.

3. Fitur warna diekstraksi dalam ruang warna HSI (Hue-Saturation-Intensity) dengan menggunakan histogram warna.

4. Fitur bentuk diekstraksi menggunakan edge direction histogram. 5. Fitur tekstur diekstraksi menggunakan co-occurrence matrix.

6. Komponen tekstur yang dihitung adalah energy, inverse moment, entropy, maximum probability, contrast, correlation, homogenity.

7. Kemiripan citra diukur menggunakan model jaringan bayesian.

8. Tidak membahas proses deteksi wajah (face detection) untuk menentukan lokasi citra wajah di dalam sebuah citra sumber wajah, namum menyediakan tools agar pemakai (user) dapat menentukan sendiri lokasi wajah, khususnya dalam citra multiobjek.


(22)

1.4. Tujuan Penelitian

Menggunakan jaringan bayesian untuk mengukur kemiripan fitur di dalam temu kembali citra wajah.

1.5. Manfaat Penelitian

Adapun manfaat penelitian ini adalah sebagai berikut :

1. Memperoleh sebuah aplikasi untuk menemukan citra query wajah dari database citra dengan tingkat relevansi temu-kembali yang lebih baik

2. Mengetahui cara-cara yang dapat digunakan untuk meningkatkan relevansi temu-kembali citra wajah

3. Mengetahui hubungan-keberadaan suatu citra wajah dengan citra wajah lain dalam citra sumber yang sama atau citra sumber yang berbeda

4. Memberikan kontribusi bagi penelitian selanjutnya tentang temu-kembali berbasis kandungan-citra (content-based image retrieval (CBIR)).


(23)

BAB 2

TINJAUAN PUSTAKA

2.1 Information Retrieval

Information Retrieval (IR) atau temu-kembali informasi, berkaitan dengan representasi, penyimpanan, pengorganisasian dari, dan akses ke item-item informasi. Representasi dan pengorganisasian item-item informasi hendaklah menyediakan kemudahan akses user (pengguna) ke informasi yang diperlukan. Sayangnya, karakterisasi dari informasi yang diperlukan oleh user bukanlah masalah sederhana. Gambar 2.1 memperlihatkan interaksi user dengan retrieval system (Baeza-Yates, R. dan Ribeiro-Neto, B., 1999).

Gambar 2.1 Interaksi User dengan Retrieval System

(Sumber: Baeza-Yates, R. dan Ribeiro-Neto, B., 1999)

Berdasarkan operasi query yang dilaksanakan, maka information retrieval ini secara umum dapat dikelompokkan menjadi,

a. Text Information Retrieval, secara umum digunakan untuk menemukan kembali teks yang terkandung dalam sebuah dokumen.

Retrieval

Browsing


(24)

b. Multimedia Information Retrieval yakni sistem yang secara khusus menangani data multimedia. Sistem multimedia harus mampu menyimpan, menemukan kembali, memindahkan dan menampilkan data yang memiliki karakteristik data yang heterogen meliputi teks, citra (citra diam dan citra bergerak), grafik dan suara, sesuai dengan keinginan user.

2.2 Image Retrieval Method

Citra dapat digunakan sebagai sumber informasi. Untuk memanfaatkan citra query sebagai sumber informasi, maka diperlukan database citra. Database citra berfungsi untuk menampung informasi tentang citra. Dengan ketersediaan citra dalam jumlah besar, maka diperlukan metode pencarian yang berdaya-guna untuk menemukan kembali citra query dari database.

Beberapa metode pencarian untuk menemukan kembali citra telah dikembangkan. Secara umum, metode temu-kembali citra (image retrieval method) dapat diklasifikasikan menjadi dua kategori yakni,

a. Metode berbasis-konsep (concept-based method)

Metode berbasis-konsep menggambarkan isi citra melalui teks dan field terstruktur. Deskriptor yang digunakan adalah himpunan kata kunci dari fitur citra yang menjelaskan warna, bentuk dan lain-lain

b. Metode berbasis-kandungan (content-based method).

Metode berbasis-kandungan menggunakan fitur yang secara otomatis diekstraksi dari dalam citra seperti tekstur, warna, bentuk dan kendala spasial untuk menjelaskan citra (Li et al, 2005)

Penelitian ini termasuk ke dalam metode temu-kembali citra berbasis kandungan (content-based image retrieval (CBIR)).

2.3 Citra Digital

Citra digital (digital image) dapat didefinisikan sebagai sebuah fungsi dua-dimensi, f(x,y), dimana x dan y merupakan koordinat spasial, serta amplitudo dari f pada setiap pasangan koordinat (x,y) disebut intensitas (intensity) atau tingkat keabuan (gray level) citra pada titik tersebut. Bila (x,y) dan amplitudo f adalah terhingga (finite) atau


(25)

kuantitas diskrit (discrete quantities) maka disebut sebagai citra digital (Gonzalez et al, 2004).

Citra digital mengandung sejumlah elemen-elemen dasar. Elemen-elemen dasar citra dapat dimanipulasi dan diekploitasi lebih lanjut selama pengolahan. Elemen-elemen dasar citra terdiri dari:

1. Kecerahan (brightness)

Yang dimaksud dengan kecerahan adalah intensitas cahaya pada elemen gambar (picture element / pixel) di dalam citra. Intensitas cahaya ini bukanlah intensitas yang riil, melainkan intensitas rata-rata dari suatu area yang melingkupinya.

2. Kontras (contrast)

Kontras menyatakan sebaran terang (lightness) dan gelap (darkness) di dalam suatu citra. Citra dengan kontras rendah mengakibatkan sebagian besar komposisi citranya adalah terang atau sebagian besar gelap. Citra dengan kontras yang baik, memiliki komposisi gelap dan terang tersebar secara merata.

3. Kontur (contour)

Kontur adalah keadaan yang ditimbulkan oleh perubahan intensitas cahaya pada pixel-pixel yang bertetangga. Dengan adanya perubahan intensitas cahaya ini, mata manusia mampu mendeteksi tepi-tepi (edges) objek di dalam citra.

4. Warna (color)

Warna adalah persepsi yang dirasakan oleh sistem visual manusia terhadap panjang gelombang cahaya yang dipantulkan oleh objek. Setiap warna mempunyai panjang gelombang (λ) yang berbeda.

5. Bentuk (shape)

Bentuk adalah properti intrinsik dari objek tiga dimensi untuk sistem visual manusia. Manusia cenderung mengasosiasikan objek menurut bentuknya daripada elemen lainnya (misalnya warna).

6. Tekstur (texture)

Tekstur dicirikan sebagai distribusi spasial dari derajat keabuan di dalam sekumpulan pixel-pixel bertetangga. Dengan demikian tekstur tidak dapat didefenisikan oleh sebuah pixel saja. Sistem visual manusia pada hakekatnya tidak menerima informasi citra secara terpisah dari setiap pixel, melainkan menangkap informasi suatu citra sebagai suatu kesatuan.


(26)

2.4 Pengolahan Citra Digital

Pengolahan citra digital merupakan sebuah disiplin ilmu yang mempelajari hal-hal yang berkaitan dengan perbaikan kualitas citra (peningkatan kontras, transformasi warna, restorasi citra), transformasi citra (rotasi, translasi, skala, transformasi geometrik), melakukan pemilihan fitur citra (feature image) yang optimal untuk tujuan analisis, melakukan proses penarikan informasi atau deskripsi objek maupun pengenalan objek yang terkandung pada citra, melakukan kompresi atau reduksi data untuk tujuan penyimpanan data, transmisi data dan waktu proses data. Input pengolahan citra digital adalah citra, sedangkan outputnya adalah citra hasil pengolahan ataupun berupa atribut-atribut.

Gonzalez dan Woods (2002) menjabarkan tahap-tahap pengolahan citra seperti diperlihatkan pada Gambar 2.2. Berdasarkan diagram pada Gambar 2.2, bukan berarti semua proses harus dilakukan di dalam setiap pengolahan citra, namun tergantung pada tujuan pengolahan. Diagram tersebut juga tidak menyatakan urutan proses yang dilakukan. Diagram dimaksudkan untuk menyampaikan ide dari semua metodologi yang dapat diterapkan pada pengolahan citra untuk tujuan yang berbeda.

Gambar 2.2 Tahap-tahap Dasar Pengolahan Citra Digital

(Sumber: Gonzalez dan Woods, 2002) Image

acquisition Image enhancement

Image restoration Color image

processing

Wavelet and multiresolution

processing

Compression

Morphological processing

Segmentation

Representation & description

Object recognition Knowledge base

Problem domain


(27)

Tahap-tahap dasar pengolahan citra digital meliputi: 1. Akuisisi citra (image acquisition)

Akuisisi citra merupakan tahap awal untuk memperoleh citra digital. Tujuan akuisisi citra adalah untuk menentukan data yang diperlukan dan memilih metode perekaman citra digital. Tahap ini dimulai dari persiapan objek, persiapan peralatan, sampai pada proses pencitraan. Pencitraan adalah kegiatan transformasi dari citra tampak (foto, gambar, lukisan, patung, pemandangan, dan lain-lain) menjadi citra digital. Beberapa alat yang digunakan untuk pencitraan adalah kamera video, kamera digital, konverter analog ke digital, scanner, Photo sinar-x /sinar infra merah. Umumnya. tahap akuisisi citra melibatkan praproses (preprocessing), misalnya pengaturan skala.

2. Peningkatan kualitas citra (image enhancement)

Peningkatan kualitas citra dilakukan dengan memanipulasi parameter-parameter citra. Ide dasarnya adalah untuk menonjolkan detil-detil atau ciri-ciri khusus yang terkandung pada suatu citra. Operasi-operasi yang dilakukan meliputi

a. peningkatan kualitas citra (kontras, kecerahan) b. peningkatan tepi (edge enhancement)

c. penajaman (sharpening)

3. Pemugaran citra (image restoration)

Tujuan dari pemugaran citra adalah meningkatkan penampilan dari suatu citra, namun tidak seperti peningkatan kualitas citra yang secara subjektif. Pemugaran citra bersifat objektif, dalam arti bahwa teknik restorasi cenderung didasarkan pada matematis atau probabilistik degradasi citra. Peningkatan citra didasarkan pada preferensi subjektif manusia tentang apa yang disebut “baik” terhadap peningkatan hasil. Contoh-contoh operasi pemugaran citra adalah:

a. penghilangan kesamaran (deblurring) b. penapisan derau (noise filtering).

4. Pengolahan warna citra (color image processing).

Secara umum pengolahan warna citra digunakan untuk mempermudah ekstraksi fitur dari suatu citra. Dalam pengolahan warna citra terdapat beberapa konsep mendasar pengolahan warna dan ruang warna yang dapat digunakan. Contoh-contoh operasi pengolahan warna citra adalah:


(28)

a. konversi ruang warna citra untuk memenuhi kapasitas perangkat tampilan (display device)

b. media pemberian warna semu (pseudocoloring).

5. Wavelet dan pengolahan multiresolusi (wavelets and multiresolution processing). Wavelet merupakan dasar untuk mewakili citra dalam berbagai tingkat resolusi. Secara khusus, wavelet sangat mendukung untuk proses kompresi data citra. 6. Kompresi (compression)

Kompresi berhubungan dengan teknik untuk mengurangi kapasitas penyimpanan maupun bandwidth yang diperlukan untuk mengirimkan citra ke tempat lain. 7. Pengolahan morfologi (morphological processing)

Pengolahan morfologi bertujuan untuk menggali besaran-besaran komponen citra yang berguna untuk mendeskripsikan objek-objek yang terdapat di dalam sebuah citra. Proses segmentasi kadangkala diperlukan dalam proses ini. Contoh-contoh operasi pengolahan morfologi adalah:

a. pendeteksian tepi (edge detection) b. ekstraksi batas (boundary extraction) c. ekstraksi fitur (feature extraction) d. analisis citra (image analysis)

e. rekonstruksi citra (image reconstruction) 8. Segmentasi (segmentation)

Operasi ini bertujuan untuk memecah suatu citra ke dalam bagian-bagian penyusunnya dengan menggunakan suatu kriteria tertentu. Operasi segmentasi berkaitan erat dengan pengenalan pola. Dalam operasi segmentasi, sebuah citra dipartisi menjadi bagian-bagian pokok yang mengandung informasi penting. Secara umum, segmentasi otomatis merupakan pekerjaan yang paling sulit dilakukan di dalam pengolahan citra. Misalnya, memisahkan suatu objek dari latar-belakangnya.

9. Representasi dan deskripsi (representation and description)

Representasi dan deskripsi biasanya mengikuti output dari tahap segmentasi yang merumuskan bentuk data yang cocok untuk pemrosesan komputer. Dalam proses ini harus ditetapkan apakah data merepresentasikan batas suatu wilayah, atau karakteristik lainnya seperti sudut, fitur atau atribut-atribut lainnya. Tahap


(29)

representasi dan deskripsi ini bertujuan untuk mengubah data mentah menjadi bentuk yang sesuai untuk pengolahan komputer.

10.Pengenalan objek (object recognition)

Pengenalan objek adalah proses untuk menyimpulkan kandungan dari suatu citra dan memberikan label objek (misalnya, “kenderaan”). Pengenalan objek juga memberi arti atau makna kepada kelompok objek-objek yang dikenali. Selanjutnya output dari tahap ini diperlukan dalam komputer visi (vision computer).

11.Basis pengetahuan (knowledge base).

Basis pengetahuan merupakan database pengetahuan yang berguna untuk memandu operasi dari masing-masing tahap proses dan mengendalikan interaksi antara tahap-tahap proses tersebut. Basis pengetahuan juga berfungsi sebagai referensi pada proses pencocokan template (template matching) atau pengenalan pola.

2.4.1 Ruang warna (color space)

Warna yang diterima oleh mata dari sebuah objek ditentukan oleh warna cahaya yang dipantulkan oleh objek tersebut. Sebagai contoh, suatu objek berwarna hijau karena objek tersebut memantulkan sinar hijau dengan panjang gelombang 450 sampai 490 nanometer (nm). Kedudukan dan panjang gelombang cahaya tampak diperlihatkan pada Gambar 2.3 (Bovik, 2009).

Bovik (2009) menyampaikan bahwa munculnya suatu warna dalam kehidupan sehari-hari maupun dalam pengolahan citra tergantung pada 3 faktor yaitu:

1. Sifat pantulan spektrum (spectral reflectance) dari suatu permukaan. Sifat ini menentukan bagaimana suatu permukaan memantulkan gelombang cahaya sehingga menampakkan suatu warna.

2. Kandungan spektrum (spectral content) dari cahaya yang menyinari permukaan. Pada dasarnya suatu gelombang cahaya, mengandung berbagai warna.

3. Respon spektrum (spectral response) dari sensor yang terdapat pada peralatan sistem visual. Respon spektrum akan menentukan kepekaan mata pada sistem visual manusia atau kepekaan kamera pada sistem visual buatan.


(30)

Sinar Kosmis Sinar Gamma Sinar X

UV Cahaya Tampak

Infra Merah

Gelombang Mikro

TV Radio Tenaga Listrik Ultra Violet Cahaya Tampak Infra Merah

300 400 500 600 700 1000 1500

Panjang gelombang (nm)

Gambar 2.3 Kedudukan dan Panjang Gelombang dari Cahaya Tampak (Sumber: Bovik. A. 2009)

Cahaya matahari yang terlihat berwarna putih oleh mata manusia, sebenarnya terdiri dari beberapa gelombang cahaya tampak. Bila cahaya matahari dilewatkan pada sebuah prisma yang terbuat dari kaca tembus cahaya maka akan terjadi pemisahan gelombang sesuai dengan panjangnya masing-masing. Cahaya yang meninggalkan prisma akan terurai menjadi warna ungu, biru, hijau, kuning, jingga dan merah.

Gonzales et al (2004) menyampaikan beberapa model warna yang dikenal di dalam pengolahan citra, yakni NTSC, YIQ, RGB, YCbCr, HSV, CMY, CMYK, HSI. Ruang warna NTSC digunakan dalam Televisi. Keuntungan format ini adalah informasi tingkat keabuan dipisahkan dari data warna, sehingga sinyal yang sama dapat digunakan untuk televisi monokrom dan berwarna. Dalam format NTSC, data citra terdiri dari tiga komponen yakni luminance (Y), hue (I) dan saturation (Q). Model warna RGB digunakan pada monitor yang terdiri dari warna merah (red), hijau (green) dan biru (blue). Ketiga warna ini disebut sebagai warna primer.

Komponen YIQ dapat diperoleh dari komponen RGB dengan menggunakan transformasi pada Persamaan 2.1. Sebaliknya komponen RGB dapat diperoleh dari komponen YIQ dengan menggunakan transformasi pada Persamaan 2.2. (Gonzalez et al, 2004).

                    − − − =           B G R Q I Y 321 , 0 523 , 0 211 , 0 322 , 0 274 , 0 596 , 0 114 , 0 587 , 0 299 , 0 (2.1)                     − − − =           Q I Y B G R 703 , 1 106 , 1 000 , 1 647 , 0 272 , 0 000 , 1 621 , 0 956 , 0 000 , 1 (2.2)


(31)

Ruang warna YCbCr digunakan secara luas di dalam video digital. Dalam format ini, informasi luminance direpresentasikan dengan komponen Y dan informasi warna disimpan sebagai komponen color-difference, Cb dan Cr. Komponen Cb merupakan perbedaan antara komponen biru dengan sebuah nilai referensi. Komponen Cr merupakan perbedaan komponen merah dengan sebuah nilai referensi. Transformasi RGB ke YCbCr dapat dilakukan dengan menggunakan Persamaan 2.3 (Gonzalez et al, 2004).

                    − − − − +           =           B G R C C Y r b 214 , 18 786 , 93 000 , 112 000 . 112 203 , 74 797 , 37 966 , 24 553 , 128 481 , 65 128 128 16 (2.3)

Ruang warna HSI (hue, saturation, intensity) merupakan ruang warna yang komponen-komponennya berkontribusi langsung pada persepsi visual manusia. Representasi ruang warna HSI diperlihatkan pada Gambar 2.4. Hue adalah atribut yang menyatakan kemurnian warna (misalnya murni merah, hijau atau kuning) dengan cara menentukan tingkat kemerahan, kehijauan, atau kekuningan. Saturation memberikan ukuran sejauh mana warna murni diencerkan dengan cahaya putih atau persentase warna putih yang ditambahkan ke warna murni. Intensity menggambarkan sensasi warna yang dirasakan atau menyatakan tingkat keabuan. Ruang warna HSI cukup ideal digunakan untuk mengembangkan algoritma pengolahan citra berdasarkan deskripsi warna. Transformasi RGB menjadi HSI dapat dilakukan dengan menggunakan Persamaan 2.4 sampai 2.7 (Gonzalez et al, 2004 dan Russ, 2011).


(32)

Gambar 2.4 Representasi Ruang Warna HSI (Hue, Saturation, Intensity) (Sumber: Russ, 2011)

Tingkat keabuan ditentukan sepanjang pusat sumbu. Jarak dari pusat sumbu menyatakan saturation, sementara sudut menyatakan nilai hue.

   > − ≤ = G B G B H , 360 , θ θ (2.4) ) )( ( ) ( )] ( ) [( 2 1 cos 2 1 B G B R G R B R G R − − + − − + − = − θ (2.5) )] , , [min( 3

1 R G B

B G R S + + − = (2.6) ) ( 3 1 B G R

I = + + (2.7)

Dimana, H menyatakan nilai hue, S menyatkan saturation, I menyatakan Intensity, R menyatkan nilai warna merah, G menyatakan nilai warna hijau, B menyatakan nilai warna biru.


(33)

Untuk menyederhakan proses pengolahan citra berwarna, dalam hal tertentu citra warna RGB terlebih dahulu dikonversikan ke citra gray (abu-abu). Konversi citra RGB ke citra gray dapat dilakukan dengan menggunakan Persamaan (2.8).

) 114 , 0 587 , 0 299 ,

0 R G B

Gray= × + × + × (2.8)

Dimana, Gray menyatakan nilai warna gray(abu-abu), R (red), G(green) dan B (blue). 2.4.2 Operasi ambang batas (thresholding)

Tujuan dari operasi ambang batas (thresholding) adalah untuk mentransformasikan atau memetakan nilai yang memenuhi syarat ambang batas ke suatu nilai yang dikehendaki; disesuaikan dengan kebutuhan. Operasi ambang batas sering digunakan untuk mengatur jumlah derajat keabuan yang ada pada citra berdasarkan intensitas tingkat keabuan (grayscale). Secara matematis operasi ambang batas dapat dituliskan seperti Persamaan 2.9.

       < ≤ < ≤ < =

i n

n n i i o T f T N T f T N T f N f 1 2 1 2 1 1 , ,   (2.9)

Dimana fo adalah nilai output (hasil transformasi); fi adalah nilai input yang akan

ditransformasikan; N1, N2,...,Nn adalah nilai yang dikehendaki; T1,T2,...,Tn

Dengan menggunakan operasi ambang batas, suatu citra yang memiliki tingkat keabuan 255 dapat ditransformasikan menjadi citra biner (citra yang memiliki 2 warna saja yaitu hitam dan putih). Fungsi transformasi yang digunakan adalah Persamaan 2.10.

adalah nilai ambang batas yang disyaratkan.

   ≥ < = 128 ) , ( , 255 128 ) , ( , 0 ) , ( y x f y x f y x f i i o (2.10)


(34)

2.4.3 Histogram warna konvensional

Secara umum histogram menyatakan frekewensi kemunculan atau peluang keberadaan parameter dalam domain. Histogram warna menyatakan frekwensi kemunculan atau peluang setiap warna pixel di dalam sebuah citra. Untuk mengurangi waktu komputasi dan menghemat tempat penyimpanan, histogram warna menggunakan kuantisasi warna. Selain itu, kuantisasi warna juga dapat mengeliminasi komponen warna yang dapat dianggap sebagai noise. Banyaknya komponen kuantisasi (bin) dapat ditetapkan sesuai dengan kebutuhan pembuatan histogram. Operasi ambang batas sangat membantu dalam penghitungan frekwensi masing-masing bin. Peluang setiap bin dari histogram warna dapat ditentukan dengan Persamaan 2.11 dan 2.12.

= = N j j i i P N h 1 | 1 (2.11)    − = selainnya i bin ke s dikuantisa j ke piksel jika Pi j

, 0

, 1

| (2.12)

dimana hi menyatakan nilai histogram bin ke-i, N menyatakan jumlah pixel dari citra, Pi|j menyatakan peluang pixel ke-j dimasukkan ke bin-i. Histogram warna seperti ini

dikenal dengan conventional color histogram (CCH) (Nixon dan Aguado, 2002). 2.4.4 Pendeteksian tepi

Tepi (edge) adalah perubahan nilai intensitas derajat keabuan yang mendadak (besar) dalam jarak yang singkat. Perbedaan intensitas inilah yang menampakkan rincian atau batas objek pada citra. Tepi biasanya terdapat pada batas antara dua daerah berbeda pada suatu citra. Tepi dapat diorientasikan dengan suatu arah dan arah ini berbeda-beda bergantung pada perubahan intensitas.

Pendeteksian tepi (edge detection) adalah operasi yang dijalankan untuk mendeteksi garis tepi (edge), yakni garis yang membatasi dua wilayah citra homogen berdasarkan tingkat kecerahan yang berbeda. Pendeteksian tepi merupakan salah satu langkah untuk meliput informasi di dalam citra. Tepi menampilkan batas-batas objek, oleh karena itu tepi berguna dalam proses segmentasi dan indentifikasi objek di dalam


(35)

Tujuan operasi pendeteksian tepi adalah untuk memperjelas garis batas suatu objek dari latar-belakang di dalam citra. Karena tepi termasuk ke dalam komponen berfrekuensi tinggi, maka pendeteksian tepi dapat dilakukan dengan penapis lolos tinggi (high pass filter). Beberapa operator pendeteksi tepi yang umum digunakan, antara lain Sobel, Prewitt, Roberts, Laplacian of a Gaussian (LoG), Zero Crossings dan Canny (Gonzalez et al, 2004).

Pendeteksi tepi Sobel (Sobel edge detector) merupakan salah satu metode pendeteksi tepi yang umum digunakan. Pendeteksi tepi Sobel menggunakan dua buah matriks konvolusi berukuran 3 x 3. Matrik konvolusi pada pixel-pixel tetangga berukuran 3 x 3, yang diperlihatkan pada Gambar 2.5.a. Matriks konvolusi pertama digunakan untuk mengestimasi gradient pada arah sumbu x, diperlihatkan pada Gambar 2.5.b. Matrik konvolusi kedua digunakan untuk menentukan gradient pada arah sumbu y, diperlihatkan pada Gambar 2.5.c (Gonzalez et al, 2004).

Hasil operasi konvolusi dalam arah sumbu x terhadap citra I dinyatakan dengan Gx, dan hasil operasi konvolusi dalam arah sumbu y terhadap citra I

dinyatakan dengan dinyatakan dengan Gy. Sehingga dengan menggunakan matrik konvolusi maka nilai Gx dan Gy

z

berturut turut dapat dihitung dengan Persamaan 2.13 dan 2.14. Magnitudo (edge strength) dari gradien dapat dihitung dengan Persamaan 2.15 atau 2.16. Sebuah pixel akan dianggap sebagai tepi (bernilai satu) jika nilai magnitudonya lebih besar dari nilai ambang (threshold) yang ditetapkan. Arah tepi (edge direction) dapat dihitung menggunakan Persamaan 2.17. Setelah nilai edge direction diperoleh, langkah selanjutnya adalah menentukan pixel pixel citra yang merupakan garis (edge). Sebuah pixel akan dianggap sebagai edge jika nilai magnitudonya lebih besar dari nilai threshold yang ditetapkan (Gonzalez et al, 2004).

z

1 2 z3 -1 -2 -1 -1 0 1 z4 z5 z6 0 0 0 -2 0 2 z7 z8 z9 1 2 1 -1 0 1

a. b. c.

Gambar 2.5. Matrik Konvolusi Pendeteksi Tepi Sobel

a. Matrik citra tetangga

b. Matrik konvolusi arah sumbu x c. Matrik konvolusi arah sumbu y

) 2

( ) 2

(z7 z8 z9 z1 z2 z3

Gx= + + − + + (2.13)

) 2

( ) 2

(z3 z6 z9 z1 z4 z3


(36)

y

x G

G

G = + (2.15)

2 2

y

x G

G

G= + (2.16)

) / (

tan−1 Gy Gx

=

θ (2.17)

2.4.5 Tekstur

Kebanyakan citra mengandung daerah yang ditandai bukan oleh karena nilai unik dari kecerahan atau warna, tetapi oleh pola nilai kecerahan yang sering disebut tekstur. Hal ini terjadi karena adanya variasi lokal dari kecerahan (atau kadang-kadang warna) dari satu pixel ke pixel berikutnya dalam suatu wilayah kecil. Jika kecerahan ditafsirkan sebagai elevasi dalam sebuah representasi dari citra permukaan, maka tekstur adalah ukuran kekasaran permukaan (Russ, 2011)

Tekstur merupakan sifat-sifat atau karakteristik yang dimiliki oleh suatu daerah yang cukup besar sehingga secara alami sifat-sifat tadi berulang dalam daerah tersebut. Daerah yang kecil bila dibandingkan dengan elemen-elemen tekstur yang ada di dalamnya, tidak dapat menunjukkan tekstur itu sendiri. Hal ini menimbulkan masalah tersendiri pada skala (jauh atau dekatnya jarak suatu objek dari kamera saat diambil) yang digunakan untuk mengekstrak sifat-sifat yang berhubungan dengan suatu daerah.

.

Tekstur merupakan sifat penting dari gambar. Berbagai representasi tekstur terus diteliti dalam pengenalan pola dan komputer visi. Pada dasarnya, metode representasi tekstur dapat diklasifikasikan menjadi dua kategori, yakni struktural dan statistik. Metode struktural, meliputi operator morfologi dan grafik adjacency, yang mendesrikpsikan tekstur dengan mengidentifikasi struktural primitif dan aturan penempatannya. Metode ini cenderung efektif bila diterapkan pada tekstur yang sangat teratur. Metode statistik, meliputi daya spektrum Fourier, matriks co-occurence, shift-invariant principal component analysis (SPCA), fitur Tamur, Wold decompotition, Markov random field, fractal model, dan teknik multi-resolution filtering seperti halnya Gabor dan transformasi wavelet, tekstur dikarakteristikkan melalui distribusi statistik dari intensitas

Sesungguhnya, tekstur yang sama bila dilihat dengan dua skala yang berbeda akan terlihat seperti dua tekstur yang berbeda, bila perbedaan skalanya cukup besar. Dengan skala yang semakin kecil atau rapat (jarak objek dengan kamera sangat jauh


(37)

ketika pengambilan citra), akan semakin susah untuk mendapatkan tekstur dari permukaan objek. Sehingga tekstur citra menjadi lemah, sehingga terlihat samar.

Tinku dan Ray (2005) menyatakan syarat terbentuknya tekstur yaitu,

1. Terdapat pola-pola primitif yang terbentuk dari satu atau lebih pixel. Pola primitif ini dapat berupa titik, garis lurus, garis lengkung, luasan, dan lain-lain yang merupakan elemen dasar dari sebuah bentuk.

2. Pola-pola primitif muncul berulang-berulang dengan interval jarak dan arah tertentu sehingga dapat diprediksi atau ditemukan karakteristik pengulangannya

Penelitian ini menggunakan metode berbasis statistika untuk mengekstraksi ciri tekstur. Metode berbasis statistika menganalisis distribusi spasial dari tingkat keabuan dengan menghitung ciri lokal pada setiap pixel. Beberapa perhitungan statistika dari distribusi ciri lokal tersebut dan dapat dianalisa dengan bantuan co-occurrencematrix, seperti yang akan digunakan pada penelitian ini.

2.4.6. Co-occurence matrix

Matriks co-occurence (co-occurence matrix) adalah suatu matriks yang menggambarkan frekuensi kemunculan pasangan dua pixel dari setiap tingkat keabuan dalam jarak dan arah tertentu dalam citra (Candan dan Sapino, 2010). Matriks co-occurence p(i1,i2) didefinisikan dengan dua langkah. Langkah pertama adalah menentukan lebih dulu jarak antara dua titik dalam arah vertikal dan horizontal (vektor d=(dx,dy)), dimana besaran dx dan dy dinyatakan dalam pixel sebagai unit terkecil dalam citra. Langkah kedua adalah menghitung frekwensi kemunculan pasangan pixel-pixel yang mempunyai nilai intensitas i1 dan i2dan berjarak d pixel. Frekwensi kemunculan setiap pasangan tingkat keabuan diletakkan pada matriks sesuai dengan koordinatnya. Dimana absis untuk nilai intensitas i1 dan ordinat untuk nilai intensitas i2. Misalnya, tingkat keabuan citra berukuran 5 x 5 mempunyai intensitas 0,1 dan 2 seperti pada Gambar 2.6.a. Karena hanya ada tiga nilai intensitas (0,1 dan 2), maka matriks p(i1,i2) akan berukuran 3 x 3. Bila jarak antar titik ditentukan d=(1,1), yang berarti satu pixel ke kanan dan satu pixel ke bawah, maka pasangan pixel yang harus dihitung adalah yang berjarak satu pixel dengan arah sudut 1350 dari sumbu tegak. Dalam citra berukuran 5 x 5 ada 16 pasangan yang memenuhi syarat ini..


(38)

Kemudian pasangan pixel, dimana pixel pertama mempunyai nilai intensitas i1 dan pasangannya yang berjarak d mempunyai nilai intensitas i2, dihitung dan dimasukkan ke dalam kolom ke-i1 dan baris ke-i2pada matriks p(i1,i2). Pada Gambar 2.6.a, terdapat tiga pasangan pixel yang mempunyai pasangan intensitas (2,1) dan terpisah dengan jarak d=(1,1) seperti ditetapkan semula, maka nilai koordinat yang bersangkutan pada matriks p(i1,i2) adalah 3. Matriks co-occurence yang sudah lengkap diisi terlihat pada Gambar 2.6.b.

i1

2 1 2 0 1 0 1 2 0 2 1 1 2 i 1 1

x 0 2 2 0 0 1 2 2 0 i2 16 2 1 3 1 i2

1 2 2 0 1 2 2 2 2 2 0 1 0 1

(a) (b)

Gambar 2.6. Penyusunan Matrik Co-occurence (a) Citra berukuran 5x5 dengan intensitas 0,1,2 (b) Matriks intensitas co-occurence untuk d=(1,1)

Setiap elemen matriks p(i1,i2) perlu dinormalisasi dengan cara membaginya dengan jumlah total dari pasangan pixel. Pada contoh yang sama, tiap elemen dibagi dengan bilangan 16 karena jumlah tiap pasangan intensitas dalam Gambar 2.6.a adalah 16. Nilai-nilai elemen matriks setelah di normalisasi kemudian dapat diperlakukan sebagai fungsi probabilitas dengan rentang nilai 0 sampai 1.

Matriks co-occurence mengandung informasi distribusi dari pasangan pixel dengan dua buah tingkat keabuan. Beberapa fitur citra yang dapat diekstrasi dari matriks co-occurence adalah:

a. Entropi (entropy) yiatu fitur untuk mengukur keteracakan dari distribusi intensitas, dinyatakan dengan Persamaan 2.18.

b. Energi (energy) yaitu fitur untuk mengukur konsentrasi pasangan intensitas pada matriks co-occurence, dinyatakan dengan Persamaan 2.19.

c. Kontras (contrast) yaitu fitur untuk mengukur kekuatan perbedaan intensitas dalam citra, dinyatakan dengan Persamaan 2.20.


(39)

d. Homogenitas (homogenity) yaitu fitur untuk mengukur ke-homogen-an variasi intensitas dalam citra, dinyatakan dengan Persamaan 2.21.

e. Inverse moment, yaitu fitur untuk pengukuran kuantitatif himpunan intensitas pixel dari suatu bentuk, dinyatakan dengan Persamaan 2.22.

f. Maximum probabilty, yaitu fitur untuk menghitung nilai probabilitas maksimum pasangan intensitas, dinyatakan dengan Persamaan 2.23.

g. Korelasi (correlation), yaitu fitur yang mengukur kekuatan dan arah hubungan linier dari pasangan intensitas, dinyatakan dengan Persamaan 2.24.

∑∑

= = − = N i N j j i p log j i p Entropy 1 1 )) , ( ( ) , ( (2.18)

∑∑

= = = N i N j j i p Energy 1 1 2 ) , ( (2.19)

(

)

∑∑

= = − = N i N j j i p j i Contrast 1 1 2 ) , ( (2.20)

∑∑

= = + − = N i N

j i j

j i p Homogenity

1 11

) , ( (2.21)

∑∑

= ≠= − = N i N j i

j i j

j i p Moment Inverse 1 1 2 ) , ( (2.22) )) , ( (p i j max y

probabilit

Maximum = (2.23)

∑∑

= = − − = N i N

j i j

j

i j p i j

i n Correlatio 1 1 ) , ( ) )( ( σ σ µ µ (2.24) Dimana p(i,j) adalah elemen kolom ke-i, baris ke-j dari matriks co-occurrence yang telah dinormalisasi. µi adalah nilai rata-rata kolom ke-i dan µj adalah nilai rata-rata

baris ke-j pada matriks p. σi adalah standard deviasi kolom ke-i dan σj adalah

standard deviasi baris ke-j pada p.

2.5 Cosine Similarity

Cosine similarity digunakan untuk mengukur kemiripan dua buah vektor (vektor A dan vektor B) dengan menggunakan cosinus sudut diantara kedua vektor. Persamaan 2.25, memperlihatkan rumus cosine similarity.


(40)

( )

( )

( )

= = = × × = ⋅ = Θ = n i i n i i n i i i B A B A B A B A Similarity 1 2 1 2 1 cos (2.25)

Dimana A dan B adalah vektor yang memiliki n elemen. Nilai kemiripan yang dihasilkan adalah -1 yang berarti vektor A dan B adalah serupa dan berlawanan arah. Nilai 1 berarti verktor A dan B tepat sama, 0 berarti tidak mirip sama sekali dan selainnya menyatakan tingkat kemiripan vektor A dan vektor B.

2.6 Formula Bayes

Formula Bayes digunakan untuk menghitung peluang bersyarat yaitu peluang suatu kejadian setelah kejadian lain terjadi (Neapolitan, 2004). Persamaan 2.26 memperlihatkan formula Bayes.

) ( ) ( ) | ( B P B A P B A

P = ∧ (2.26)

Dengan bentuk lain Formula Bayes pada Persamaan 2.26 juga dapat ditulis seperti Persamaan 2.27. ) ( ) ( ) | ( ) | ( B P A P A B P B A

P = (2.27)

P(A|B) disebut juga posteriorprobability adalah peluang A terjadi setelah B terjadi. P(A∧B) adalah peluang A dan B terjadi bersamaan.

P(B|A) disebut likehood adalah peluang B terjadi setelah A terjadi. P(A) disebut juga prior adalah peluang kejadian A.

P(B) adalah peluang kejadian B dan P(B) ≠ 0 2.6.1 Bayesian network

Bayesian network adalah sebuah graf berarah tanpa siklus (directed acyclic graph) yang digunakan sebagai representasi grafis pengambilan keputusan (reasoning) dalam wilayah yang tidak pasti. Simbol-simbol jaringan bayesian yang terdiri dari (Neapolitan, 2004):


(41)

1. Satu set node, setiap node merepresentasikan setiap variabel yang ada di sistem 2. Link antara dua node yang merepresentasikan hubungan sebab dari satu node ke

node lain.

3. Distribusi bersyarat.

Hubungan antara n variabel dapat dibangun dengan bantuan pakar, dari data observasi atau dari gabungan keduanya. Jika diberikan n variabel dan satu set data observasi, maka semua hubungan (relationship) yang mungkin harus ditentukan. Telah dibangun sebuah model bayesian network yang digunakan untuk CBIR (Content Based Image Retrieval) seperti pada Gambar 2.7.

Gambar 2.7. Model Umum Bayesian Network untuk CBIR

Pada Gambar 2.7, C1..Cn merupakan karakteristik citra, sedangkan I1..Ij

adalah citra-citra yang terdapat di dalam database. Garis berarah menunjukkan peluang sebuah citra Ij memiliki karakteristik Ci. Nilai peluang kemiripan antara citra query (Q) dan citra (I) di database dapat dihitung menggunakan formula Bayes pada Persamaan 2.28.

) (

) (

) | (

Q P

Q I P Q I

P j j

= (2.28)

2.7 Recall Dan Precision

Recall dan precision merupakan parameter yang digunakan untuk mengukur keefektifan algoritma temu kembali informasi (Information Retrieval). Misalkan sebuah informasi query Q yang akan dicari dari kumpulan dokumen (Collection

C1 C2 Cj Cn

I1 I2 Ij In

Citra

Basis Data


(42)

Docs). Himpunan R menyatakan dokumen-dokumen yang relevan (Relevant Docs) dengan query. |R| adalah jumlah elemen himpunan dokumen yang relevan. Anggaplah sebuah algoritma pencarian diterapkan dan menghasilkan himpunan dokumen jawaban (Answer Set), A. Dokumen-dokumen di dalam himpunan A diurutkan berdasarkan derajat relevansinya dengan query. Ranking yang dihasilkan dimulai dari derajat relevansi tertinggi. |A| adalah jumlah elemen dari himpunan jawaban A. |Ra| adalah jumlah dokumen yang merupakan irisan himpunan R dan himpunan A. Hubungan antara himpunan-himpunan ini diperlihatkan pada Gambar 2.8 (Baeza-Yates, R. dan Ribeiro-Neto, B., 1999).

Gambar 2.8 Diagram Himpunan Dokumen (Sumber: Baeza-Yates, R. dan Ribeiro-Neto, B., 1999)

Recall menyatakan proporsi dari dokumen relevan (himpunan R) yang diterima sebagai hasil temu kembali, dapat ditentukan dengan Persamaan 2.29. Sementara itu, precision menyatakan proporsi dari dokumen himpunan jawaban A yang relevan, dapat ditentukan dengan Persamaan 2.30.

R Ra

Recall= (2.29)

A Ra recision

P = (2.30)

Anggaplah himpunan dokumen-dokumen yang relevan dengan informasi Q telah diketahui sebelumnya, yakni Rq={d3, d5, d9, d25, d39, d44, d56, d71, d89, d123}; dalam hal ini terdapat sepuluh dokumen yang relevan. Setelah penerapan

Relevant Docs |R|

Answer Set |A|

Collection Docs Relevant Docs


(43)

algoritma pencarian, diperoleh himpunan dokumen jawaban A yang telah diranking dengan hasil sebagai berikut.

Ranking himpunan jawaban A untuk query Q: 1. d123• 6. d9• 11. d38 2. d84 7. d5 12. d48 3. d56• 8. d129 13. d250 4. d6 9. d187 14. d113 5. d8 10. d25• 15. d3•

Dokumen-dokumen yang relevan dengan query q ditandai dengan sebuah bullet setelah nomor dokumen. Dengan memperhatikan ranking ini, mulai dari dokumen paling atas, dapat dijelaskan sebagai berikut. Pertama, dokumen d123 dengan ranking nomor 1 adalah relevan. Selanjutnya, dokumen ini bersesuaian dengan 10% dari seluruh dokumen yang relevan di dalam himpunan Rq. Sehingga dikatakan memiliki precision 100% pada recall 10% (precision = 1/1 atau satu dari satu dokumen yang relevan; recall=1/10 atau satu dari sepuluh dokumen yang telah dilihat). Kedua, dokumen d56 dengan ranking nomor 3 adalah dokumen yang relevan berikutnya, memiliki precision 66% (dua dari tiga dokumen yang relevan) pada recall 20% (dua dari sepuluh dokumen yang telah dilihat). Nilai recall dan precision selengkapnya diperlihatkan pada Tabel 2.1. Grafik Recall dan Precision diperlihatkan pada Gambar 2.9.

Tabel 2.1 Recall dan Precision

Recall (%) Precision (%)

10 100

20 66

30 50

40 40

50 33

60 0

70 0

80 0

90 0


(44)

Gambar 2.9 Grafik Recall - Precision 2.8 Riset-Riset Terkait

Pencarian citra atau penemuan kembali citra merupakan permasalahan yang menarik untuk dibahas. Beberapa riset terkait yang telah dilakukan oleh banyak peneliti sebelumnya, berkaitan dengan temu-kembali citra berbasis-kandungan yang telah memberikan ide pada penelitian ini antara lain:

1. Li et al.(2005), dalam risetnya membangun sebuah sistem untuk temu-kembali citra berbasis-bentuk. Dalam riset ini, fitur bentuk yang kokoh dan efektif diperkenalkan yakni deskriptor citra senyawa (compound image descriptor) yang menggabungkan transformasi Fourier dan koefisien fasa serta fitur global. Riset ini lebih menekankan pada pembentukan deskriptor dengan menerapkan transformasi Fourier 2D standar.

2. Ravi dan Wilson (2010), dalam risetnya menggunakan ruang warna YCbCr untuk mendeteksi daerah kulit pada citra wajah. Citra RGB terlebih dahulu dikonversikan ke dalam ruang YCrCb. YCrCb ini kemudian dikonversikan menjadi citra grayscale. Berdasararkan tepi wajah ditentukan titik pusat dari citra foto wajah. Kemudian dengan menggunakan fitur warna kulit, bentuk wajah dan fitur wajah seperti mulut, mata dan hidung melakukan perbandingan untuk


(45)

menentukan jenis kelamin (gender). Klasifikasi dilakukan dengan menggunakan suppport vector machines.

3. Jayech dan Mahjoub (2010), dalam risetnya, mengklasifikasikan citra dengan menggunakan jaringan bayesian dalam beberapa bentuk yakni Naive Bayesian Network, Tree Augmented Naive Bayser dan Forest Augmented Bayse. Tahap awal yang dilakukan dalam klasifikasi citra adalah citra wajah terlebih dahulu dibagi dalam beberapa blok. Kemudian histogram warna dari setiap blok dihitung dengan menggunakan Gaussian Mixture Model (GMM). Deskripsi tektur menggunakan Graylevel Level Co-occurence Matrix (GLCM). Dengan menggunakan K-Means, objek kemudian dikelompokkan ke dalam k cluster. Setiap blok diberi label dan diintegrasikan ke setiap k cluster. Berdasarkan pelabelan inilah dilakukan klasifikasi dengan menggunakan jaringan bayesian.

4. Sivabalakhrisnan dan Manjula (2010), dalam risetnya menggunakan ruang warna HSV untuk mengekstraksi suatu objek bergerak dari latar-belakangnya. Citra diperoleh melalui akuisisi dan segmentasi sebuah deretan video. Langkah awal yang digunakan adalah mendeteksi dan membangun citra latar belakang. Daerah objek bergerak kemudian dipisahkan dari latar belakang yang dibangun. Riset ini mengemukakan algoritma deteksi gerak manusia berbasis wilayah.

5. Koo dan Song. (2005) dalam risetnya memanfaatkan perbedaan relatif warna a* di dalam ruang warna L*a*b* untuk mengestraksi fitur wajah. Fitur wajah yang diekstrak adalah mata, hidung, bibir dan wajah. Dengan mengetahui lokasi fitur wajah ini, peneliti menyarankan koversi daerah wajah dari citra 2D menjadi citra wajah 3D.

6. Gopal dan Prasad (2008), dalam risetnya membangun sebuah sistem temu-kembali citra berbasis-bentuk. Dalam riset ini, deskripsi bentuk dibangun dengan menggunakan deskriptor Fourier. Untuk memperkuat deskripsi bentuk ini, deskriptor Fourier diadapasi dengan freeman code, sehingga diperoleh bentuk tepi objek yang dinyatakan dalam konektivitas-8 atau neighborhood-8. Riset ini lebih menekankan pada pendefenisian fitur bentuk. Pengukuran kemiripan dilakukan dengan menghitung jarak Euclidean.

7. Iqbal dan Aggarwal (2002), mengajukan CIRES, yakni sebuah sistem perpustakaan online berbasis citra digital. Sistem ini menerapkan sistem temu-kembali citra berbasis-kandungan yang secara tradisional menggunakan analisis


(46)

warna dan tekstur. Analisis warna menggunakan ruang warna CIE LAB. Warna dipartisi hingga 2520 warna dan setiap warna diberi nama warna seperti merah muda, coklat dan lain-lain. Analisa tekstur menggunakan filter Gabor dan menyimpan vektor fitur tekstur 48- dimensi. Pengukuran kemiripan digunakan dengan menggunakan jarak Euclidean. Analisis kinerja tidak selalu mencapai tingkat yang memadai dan memuaskan pengguna.

2.9 Persamaan Dengan Riset-Riset Lain

Adapun Persamaan penelitian ini dengan penelitian yang dilakukan sebelumnya adalah menggunakan analisa fitur tekstur dengan menggunakan co-occurence matrix (Jayech dan Mahjoub, 2010).

2.10 Perbedaan Dengan Riset-Riset Lain

Dari beberapa riset yang telah dilakukan oleh peneliti sebelumnya, terdapat beberapa perbedaan dengan riset yang akan dilakukan, yaitu penelitian ini menggunakan tiga fitur yakni fitur warna dengan menggunakan ruang warna HSI, fitur bentuk dengan menerapkan operator Sobel, fitur tekstur yang dianalisa dengan menggunakan co-occurence matrix. Komponen tekstur yang diekstraksi adalah contrast, correlation, energy, homogenity, maximum probability, moment dan entropy.

Pengukuran kemiripan citra ditentukan dengan menghitung jarak dengan metode cosine similarity. Penentuan hasil temu-kembali citra dapat dilakukan dengan beberapa cara yakni berdasarkan satu fitur saja (warna, bentuk dan tekstur) atau sekaligus kombinasi dari ketiga fitur yang diterapkan dalam jaringan bayesian.

2.11 Kontribusi Riset

Penelitian ini memberikan kontribusi pemahaman, bahwa suatu citra digital mengandung banyak informasi yang masih perlu diteliti. Berdasarkan kandungannya sebuah citra dapat diidentifikasi dengan menetapkan beberapa fitur seperti warna, bentuk, tekstur, bahkan fitur yang ‘masih tersembunyi’ dan perlu dicari dan diteliti lebih lanjut.


(47)

digunakan. Untuk menetapkan fitur bentuk, diperlukan pengkajian dalam hal menentukan operator atau metode mendeskripsikan bentuk. Untuk menentukan fitur tekstur perlu dilakukan pengkajian tentang bagaimana tekstur diperoleh dan komponen-komponen apa saja yang akan dipertimbangkan dari tekstur tersebut. Setelah fitur-fitur tersebut diperoleh, perlu dipertimbangkan ukuran dan bentuk struktur data yang digunakan untuk menyimpan fitur tersebut ke dalam database, sehingga mempermudah pencariannya kembali.

Pertimbangan juga diperlukan dalam menetapkan metode yang digunakan untuk klasifikasi citra dari database sehingga diperoleh suatu sistem temu-kembali citra berbasis-kandungan yang dapat bekerja dengan baik dan efisien. Keberhasilan sistem temu-kembali citra berbasis-kandungan secara umum ditentukan oleh kemampuan untuk menentukan fitur-fitur yang membedakan suatu citra dengan citra yang lain.


(48)

BAB 3

METODOLOGI PENELITIAN

3.1. Pelaksanaan Penelitian

Tujuan dari penelitian ini adalah untuk membangun sebuah sistem temu-kembali citra wajah dengan menggunakan jaringan bayesian. Aplikasi ini diberi nama Face Image Retrieval (FIR). Dengan menggunakan jaringan bayesian ini diharapkan dapat meningkatkan relevansi hasil temu-kembali citra wajah. Sistem yang dibangun kemudian dituangkan dalam sebuah program aplikasi. Untuk mencapai tujuan ini, penelitian dilakukan dengan beberapa tahap.

Pelaksanaan penelitian meliputi empat tahap, yaitu: 1. Studi Literatur

Studi literatur dilakukan dengan mempelajari buku, jurnal, makalah maupun situs internet yang berhubungan dengan temu-kembali citra, ekstraksi fitur-fitur citra digital, pengukuran tingkat kemiripan (similarity measurement), jaringan bayesian (bayesian network).

Pada tahap pertama penelitian, yakni studi literatur tentang citra, penulis mempelajari fitur-fitur yang dapat diekstrasi dari sebuah citra digital berwarna, metode-metode yang digunakan untuk mengekstraksi fitur citra, cara pengukuran fitur dan menyatakannya menjadi sebuah data berupa vektor fitur, pengukuran tingkat kemiripan, teori bayesian, model jaringan bayesian, metode temu-kembali citra berbasis-kandungan yang bersumber dari buku pegangan (handbook) dan riset-riset yang dipublikasikan pada jurnal internasional, makalah maupun situs internet.

2. Pengumpulan Data

Data yang digunakan dalam penelitian ini adalah citra satu objek dan citra multiobjek, khususnya citra wajah tampak depan.


(1)

'--- Swap Sort

For x = 1 To nRec - 1 For y = x + 1 To nRec

If RSim(x).Sim < RSim(y).Sim Then RecSim = RSim(x)

RSim(x) = RSim(y) RSim(y) = RecSim End If

Next y Next x

'--- Simpan ulang hasil sort

Open NFile For Random As #vFile Len = pRec For n = 1 To nRec

Put #vFile, n, RSim(n) Next n

Close #vFile End Sub

6.

PROGRAM FORM VIEWOUT

'--- ' Program : Form View Out

' Menampilkan hasil temu-kembali citra wajah ' Diprogram : Hendrik Siagian

'--- Dim HScreen As Integer

Dim WScreen As Integer Dim WSpace As Integer Dim HSpace As Integer Dim WImg As Integer Dim HImg As Integer

Private Sub Form_Activate() Select Case IROption

Case 1: Me.Caption = "Searching with Color Fiture" DisplayIROut (App.Path & "\Output\IROutC.txt") Case 2: Me.Caption = "Searching with Shape Fiture" DisplayIROut (App.Path & "\Output\IROutS.txt") Case 3: Me.Caption = "Searching with Texture Fiture" DisplayIROut (App.Path & "\Output\IROutT.txt") Case 4: Me.Caption = "Searching with Bayesian Methode" DisplayIROut (App.Path & "\Output\IROutB.txt") End Select

End Sub

Private Sub Form_Resize() Dim n As Integer Dim nLeft As Integer Dim nTop As Integer

WScreen = Me.ScaleWidth HScreen = Me.ScaleHeight If WScreen < 350 Then Exit Sub If HScreen < 180 Then Exit Sub WSpace = 20

HSpace = 20

WImg = (WScreen - 12 * WSpace) / 11 HImg = (HScreen - 9 * WSpace) / 5

nLeft = WSpace nTop = HSpace For n = 0 To 8 If n = 0 Then


(2)

lblRanking(n).Top = nTop lblRanking(n).Left = nLeft lblRanking(n).Width = 1.5 * WImg lblRanking(n).Alignment = 2

lblIdFace(n).Top = lblRanking(n).Top + lblRanking(n).Height lblIdFace(n).Left = nLeft

lblIdFace(n).Width = 1.5 * WImg lblIdFace(n).Alignment = 2

imgOut(n).Top = lblIdFace(n).Top + lblIdFace(n).Height imgOut(n).Left = nLeft

imgOut(n).Width = 1.5 * WImg imgOut(n).Height = 1.5 * HImg nLeft = 4 * WSpace + 3 * WImg Else

lblRanking(n).Top = nTop + 2 * HSpace lblRanking(n).Left = nLeft

lblRanking(n).Width = WImg lblRanking(n).Alignment = 2

lblIdFace(n).Top = lblRanking(n).Top + lblRanking(n).Height lblIdFace(n).Left = nLeft

lblIdFace(n).Width = WImg lblIdFace(n).Alignment = 2

imgOut(n).Top = lblIdFace(n).Top + lblIdFace(n).Height imgOut(n).Left = nLeft

imgOut(n).Width = WImg imgOut(n).Height = HImg nLeft = nLeft + WSpace + WImg End If

Next n

nTop = imgOut(0).Top + imgOut(0).Height + HSpace nLeft = WSpace

For n = 1 To 11

lblRanking(8 + n).Top = nTop lblRanking(8 + n).Left = nLeft lblRanking(8 + n).Width = WImg lblRanking(8 + n).Alignment = 2

lblIdFace(8 + n).Top = lblRanking(8 + n).Top + lblRanking(8 + n).Height

lblIdFace(8 + n).Left = nLeft lblIdFace(8 + n).Width = WImg lblIdFace(8 + n).Alignment = 2

imgOut(8 + n).Top = lblIdFace(8 + n).Top + lblIdFace(8 + n).Height imgOut(8 + n).Left = nLeft

imgOut(8 + n).Width = WImg imgOut(8 + n).Height = HImg

lblRanking(19 + n).Top = imgOut(8 + n).Top + imgOut(8 + n).Height + HSpace

lblRanking(19 + n).Left = nLeft lblRanking(19 + n).Width = WImg lblRanking(19 + n).Alignment = 2

lblIdFace(19 + n).Top = lblRanking(19 + n).Top + lblRanking(19 + n).Height

lblIdFace(19 + n).Left = nLeft lblIdFace(19 + n).Width = WImg lblIdFace(19 + n).Alignment = 2

imgOut(19 + n).Top = lblIdFace(19 + n).Top + lblIdFace(19 + n).Height imgOut(19 + n).Left = nLeft


(3)

imgOut(19 + n).Width = WImg imgOut(19 + n).Height = HImg nLeft = nLeft + WSpace + WImg Next n

'DisplayOutputIR

End Sub

'--- 'DisplayIROut : Subprogram untuk menampilkan output 'Data Hasil pencarian dibaca dari file IROut

'sesuai dengan fitur (Color, Shape, Texture atau 'Bayesian)

'--- Private Sub DisplayIROut(NFile As String)

Dim vFile As Integer Dim RecSim As TSimilarity Dim pRec As Integer Dim nRec As Integer Dim n As Integer Dim stRank As String

pRec = Len(RecSim) nRec = FileLen(NFile)

imgOut(0).Stretch = True

imgOut(0).Picture = LoadPicture(NFileQuery) imgOut(0).Visible = True

stRank = "Image" & vbCrLf & "Query" lblRanking(0).Caption = stRank lblRanking(0).Visible = True lblIdFace(0).Caption = ""

vFile = FreeFile

Open NFile For Random As #vFile Len = pRec n = 0

Do While Not (EOF(vFile)) n = n + 1

Get #vFile, n, RecSim

stRank = n & vbCrLf & RecSim.Sim imgOut(n).Stretch = True

imgOut(n).Picture = LoadPicture(App.Path & _

"\Face\" & RecSim.Id & ".bmp") lblRanking(n).Alignment = 2

lblRanking(n).Caption = stRank lblIdFace(n).Alignment = 2 lblIdFace(n).Caption = RecSim.Id lblRanking(n).Visible = True lblIdFace(n).Visible = True imgOut(n).Visible = True If n >= 30 Then Exit Do Loop

Close #vFile End Sub

Private Sub imgOut_Click(Index As Integer) Dim stIdFace As String

If Index > 0 Then

stIdFace = lblIdFace(Index).Caption

If Not (Trim(SearchImageSource(stIdFace)) = "") Then NFImgSource = App.Path & "\Picture\" & _

SearchImageSource(stIdFace) & ".jpg" frmMain.Enabled = False


(4)

End If End If End Sub

'--- 'SearchImageSource : Fungsi untuk mencari path dan nama file 'sesuai denga IdFace

'--- Private Function SearchImageSource(sId As String) As String Dim NFile As String

Dim vFile As Integer Dim IdFace As String Dim IdSource As String

vFile = FreeFile

NFile = App.Path & "\FileLink.txt" Open NFile For Input As #vFile SearchImageSource = ""

Do While Not (EOF(vFile))

Input #vFile, IdFace, IdSource If Trim(sId) = Trim(IdFace) Then SearchImageSource = IdSource Exit Do

End If Loop

Close #vFile End Function

7.

PROGRAM FORM IMAGE SOURCE

'--- ' Program : Form Image Source ' Menampilkan citra sumber wajah ' Diprogram : Hendrik Siagian

'--- Dim stShpFace As Integer

Dim HScreen As Integer Dim WScreen As Integer Private Sub Form_Load() Me.Caption = NFImgSource

picSource.Picture = LoadPicture(NFImgSource) picSource.AutoSize = True

bmpX = picSource.Width bmpY = picSource.Height stShpFace = 0

End Sub

Private Sub Form_Resize() WScreen = Me.ScaleWidth HScreen = Me.ScaleHeight If WScreen < 350 Then Exit Sub If HScreen < 100 Then Exit Sub

picKanvas.Width = WScreen - vsbKanvas.Width - 2 picKanvas.Height = HScreen - hsbKanvas.Height - 2 vsbKanvas.Left = picKanvas.Width

vsbKanvas.Height = picKanvas.Height hsbKanvas.Width = picKanvas.Width hsbKanvas.Top = picKanvas.Height + 1 End Sub

Private Sub Form_Unload(Cancel As Integer) shpFace.Visible = False


(5)

frmMain.Enabled = True End Sub

Private Sub vsbKanvas_Change() picSource.Top = -vsbKanvas.Value End Sub

Private Sub hsbKanvas_Change() picSource.Left = -hsbKanvas.Value End Sub

'Private Sub picSource_KeyUp(KeyCode As Integer, Shift As Integer) ' If KeyCode = 67 Then

' shpFace.Left = FacePos.x1 ' shpFace.Top = FacePos.y1

' shpFace.Width = FacePos.x2 - FacePos.x1 ' shpFace.Height = FacePos.y2 - FacePos.y1 ' If stShpFace = 0 Then

' shpFace.Visible = True ' stShpFace = 1

' Else

' shpFace.Visible = False ' stShpFace = 0

' End If ' End If 'End Sub

8.

PROGRAM FORM ABOUT

'--- ' Program : Form About

' Menampilkan layar bergulung ucapan terimakasih ' Diprogram : Hendrik Siagian

'--- Dim Ucapan As String

Dim Judul As String Dim p As Integer

Private Sub Form_Load()

Judul = "Temu Kembali Citra Wajah Berdasarkan" & vbCrLf Judul = Judul & "Pengukuran Kemiripan Fitur Dengan" & vbCrLf Judul = Judul & "Menggunakan Jaringan Bayesian"

lblJudul.Caption = Judul

imgLogo.Picture = LoadPicture(App.Path & "\LogoFIKTI.jpg") imgPenulis.Picture = LoadPicture(App.Path & "\FotoPenulis.jpg") imgLogo.Visible = True

imgPenulis.Visible = False

Ucapan = "Atas selesainya penulisan tesis ini, " & vbCrLf

Ucapan = Ucapan & "penulis mengucapkan terimakasih dan penghormatan " & vbCrLf

Ucapan = Ucapan & "setinggi-tingginya kepada: " & vbCrLf & vbCrLf Ucapan = Ucapan & "KOMISI PEMBIMBING:" & vbCrLf

Ucapan = Ucapan & "1. Bapak Dr. POLTAK SIHOMBING, MKom. dan" & vbCrLf Ucapan = Ucapan & "2. Bapak Prof. DR. Muhammad Zarlis" & vbCrLf

Ucapan = Ucapan & "Atas pengarahan dan dorongan yang telah diberikan " Ucapan = Ucapan & "sehingga memberi inspirasi bagi penulis untuk membuat " Ucapan = Ucapan & "aplikasi ini." & vbCrLf & vbCrLf

Ucapan = Ucapan & "PENGUJI TESIS :" & vbCrLf

Ucapan = Ucapan & "1. Bapak Prof. Dr. Opim Salim Sitompul" & vbCrLf Ucapan = Ucapan & "2. Bapak Prof. Dr. Herman Mawengkang" & vbCrLf Ucapan = Ucapan & "3. Ibu Dr. Erna Budhiarti Nababan, MIT." & vbCrLf Ucapan = Ucapan & "TERIMAKASIH UNTUK 'BIG IDEA' yang tersembunyi dalam SARAN "


(6)

Ucapan = Ucapan & "yang diberikan." & vbCrLf & vbCrLf & vbCrLf

Ucapan = Ucapan & "Secara khusus penulis juga mengucapkan TERIMA KASIH kepada :" & vbCrLf

Ucapan = Ucapan & "Bapak M. ANDRI BUDIMAN, S.T., M.Comp.Sc., M.E.M. " & vbCrLf

Ucapan = Ucapan & "Atas Dorongan Semangat dan Solusi yang diberikan" & vbCrLf

Ucapan = Ucapan & "tidak akan pernah dilupakan. Terimakasih atas e-book nya." & vbCrLf & vbCrLf

Ucapan = Ucapan & "Terimakasih juga untuk Seluruh Dosen, Staf, Karyawan dan " & vbCrLf

Ucapan = Ucapan & "rekan-rekan mahasiwa di Fakultas Ilmu Komputer dan " & vbCrLf

Ucapan = Ucapan & "Teknologi Informasi - USU atas kerjasama yang baik." & vbCrLf & vbCrLf

Ucapan = Ucapan & "Untuk Istri Tercinta Ir. Dra. Ellen Tampubolon MSi., terimaksih " & vbCrLf

Ucapan = Ucapan & "atas kesabarannya." & vbCrLf & vbCrLf Ucapan = Ucapan & "Dari" & vbCrLf

Ucapan = Ucapan & "HENDRIK SIAGIAN" & vbCrLf Ucapan = Ucapan & "NIM: 107038003" & vbCrLf

Ucapan = Ucapan & "PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA" & vbCrLf

Ucapan = Ucapan & "FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI" & vbCrLf

Ucapan = Ucapan & "UNIVERSITAS SUMATERA UTARA " Ucapan = Ucapan & "MEDAN" & vbCrLf

Ucapan = Ucapan & "2013" & vbCrLf Ucapan = Ucapan & "---" & vbCrLf

p = 100 End Sub

Private Sub Form_Activate()

Me.Left = (Screen.Width - Me.Width) \ 2 Me.Top = (Screen.Height - Me.Height) \ 2 tmrTunda.Enabled = True

lblUcapan.Caption = Ucapan End Sub

Private Sub Form_Unload(Cancel As Integer) frmMain.Enabled = True

Unload Me End Sub

Private Sub cmdTutup_Click() frmMain.Enabled = True Unload Me

End Sub

Private Sub tmrTunda_Timer()

imgLogo.Visible = Not imgLogo.Visible imgPenulis.Visible = Not imgPenulis.Visible End Sub

Private Sub tmrGulung_Timer() p = p - 3

picUcapan.Top = p If p < -800 Then p = 100 End If End Sub