Pelabelan Otomatis Citra Menggunakan Fuzzy C Means untuk Sistem Temu Kembali Citra

(1)

PELABELAN OTOMATIS CITRA MENGGUNAKAN

FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA

MARSANI ASFI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2008


(2)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa Tesis Pelabelan Otomatis Citra Menggunakan Fuzzy C-Means untuk Sistem Temu Kembali Citra, adalah karya saya sendiri dan belum diajukan dalam bentuk apapun kepada Perguruan Tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Juli 2008

Marsani Asfi NRP. G651050014


(3)

ABSTRAK

MARSANI ASFI. Pelabelan Otomatis Citra menggunakan Fuzzy C-Means untuk Sistem Temu Kembali Citra. Dibimbing oleh Fahren Bukhari dan Yeni Herdiyeni.

Pelabelan citra secara manual memiliki kelemahan karena memerlukan waktu yang banyak dan sangat tergantung pada subjektifitas pengguna dalam mendeskripsikan citra. Oleh karena itu diperlukan pelabelan citra secara otomatis berdasarkan isi citra. Penelitian ini menggunakan Fuzzy C-Means untuk mengelompokkan informasi warna dan tekstur ke dalam beberapa region berdasarkan objek citra. Dari pengelompokkan ini diperoleh kamus kata untuk setiap citra. Dengan adanya kamus kata tersebut diharapkan dapat mempercepat proses temu kembali. Hasil penelitian menunjukkan bahwa nilai presisi temu kembali citra berdasarkan proses pelabelan ini mencapai 86.68 %.

Kata Kunci : citra, temu kembali citra, pelabelan otomatis citra, fuzzy c-means, clustering.


(4)

ABSTRACT

MARSANI ASFI. Automatic Image Labeling using Fuzzy C-Means for Image Retrieval Systems. Under the direction of Fahren Bukhari and Yeni Herdiyeni.

With the rapid development of digital photography, digital image data has increased tremendously in recent years. Consequently image retrieval has drawn the attention of many user. The need for manually image labeling, which is depends on user subjectivity and time-consuming, especially for image databases. This research propose an automatic image labeling based on image content using Fuzzy C-Means to cluster the color and texture information’s into regions. Label of image from clustering is used to retrieve image. The experiments results showed the average of precision of the proposed method is show 86.68 %.

Keyword: Image, Content Based Image Retrieval, CBIR, automatic image labeling


(5)

RINGKASAN

MARSANI ASFI. Pelabelan Otomatis Citra Menggunakan Fuzzy C Means untuk Sistem Temu Kembali Citra. Di bawah bimbingan Fahren Bukhari dan Yeni Herdiyeni.

Perkembangan internet dan banyaknya aplikasi multimedia saat ini, menyebabkan pengguna sulit untuk mendapatkan citra yang tersimpan dalam komputer. Citra memiliki subjek dan objek citra. Subjek citra merupakan persepsi umum pengguna terhadap objek-objek yang dimiliki citra. Persepsi dan intepretasi pengguna dalam mendeskripsikan citra yang sama sering terdapat perbedaan.

Pelabelan citra secara manual memiliki kelemahan karena memerlukan waktu yang banyak dan sangat tergantung pada subjektifitas pengguna dalam mendeskripsikan citra. Oleh karena itu diperlukan pelabelan citra secara otomatis berdasarkan isi citra.

Citra sumber penelitian diperoleh dari web ALIPR (http://www.alipr.com). Citra sumber berhubungan dengan kelas pemandangan, bangunan, alam. Jumlah objek yang terkandung dalam citra dapat berisi 3 (tiga), 4 (empat) atau 5 (lima) objek. Citra sumber digunakan sebagai data pelatihan dan data pengujian. Data pelatihan digunakan sebagai data untuk pembentukan basis data ciri. Basis data ciri menjadi acuan untuk proses penemuan kembali citra pada saat diujikan. Data pengujian digunakan untuk pengujian pelabelan citra, sedangkan untuk pengujian temu kembali citra menggunakan kata-kata dalam kamus kata. Pengujian dengan kamus kata terdiri dari pengujian subjek citra serta objek-objek citra.

Tahapan penelitian terdiri atas pengindeksan untuk pemilihan citra sumber, segmentasi citra, ektraksi warna dan tekstur, serta pengukuran kemiripan ciri subjek citra menggunakan Euclid. Pelabelan citra secara otomatis. Temu kembali citra untuk menentukan kueri teks sebagai masukan dan penentuan indeks yang digunakan sebagai dasar temu kembali citra. Evaluasi kinerja sistem sebagai evaluasi hasil temu kembali citra berdasarkan nilai precision dan recall.

Penelitian ini menggunakan Fuzzy C-Means untuk mengelompokkan informasi warna dan tekstur ke dalam beberapa region berdasarkan objek citra. Dari pengelompokkan ini diperoleh kamus kata untuk setiap citra. Dengan adanya kamus kata tersebut diharapkan dapat mempercepat proses temu kembali.

Hasil penelitian menunjukkan bahwa proses pelabelan otomatis citra menghasilkan pelabelan yang cukup baik. Definisi kata-kata berupa subjek dan objek citra dalam kamus kata berguna dalam proses temu kembali. Model pelabelan citra otomatis menggunakan Fuzzy C-means (FCM) dilakukan berdasarkan kata-kata yang terdefinisi dalam kamus kata. Tabel indeks citra disusun berdasarkan proses pelabelam otomatis citra dan digunakan sebagai dasar untuk proses temu kembali. Hasil penelitian juga menunjukkan bahwa nilai presisi temu kembali citra berdasarkan proses pelabelan ini mencapai 86.68 %.


(6)

© Hak cipta milik IPB, tahun 2008 Hak cipta dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber.

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah

b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin IPB.


(7)

PELABELAN OTOMATIS CITRA MENGGUNAKAN

FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA

MARSANI ASFI

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada

Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2008


(8)

Judul Tesis : Pelabelan Otomatis Citra Menggunakan Fuzzy C Means untuk Sistem Temu Kembali Citra

Nama : Marsani Asfi

NRP : G651050014

Disetujui Komisi Pembimbing

Ir. Fahren Bukhari, M.Sc Yeni Herdiyeni, S.Si, M.Kom Ketua Anggota

Diketahui

Ketua Program Studi Dekan Sekolah Pascasarjana Ilmu Komputer

Dr. Sugi Guritman Prof. Dr. Khairil Anwar A. Notodiputro, M.S.


(9)

PRAKATA

Alhamdulillahirabbil ‘alamin, Penulis panjatkan puji dan syukur ke hadirat Allah SWT yang telah memberikan rahmat, hidayah, serta karuniaNya sehingga Penulis dapat menyelesaikan tesis yang berjudul Pelabelan Otomatis Citra menggunakan Fuzzy C-Means untuk Sistem Temu Kembali Citra.

Penulis mengucapkan terima kasih kepada Bapak Ir. Fahren Bukhari, M.Sc. dan Ibu Yeni Herdiyeni S.Si, M.Kom selaku komisi pembimbing yang telah memberikan banyak masukan kepada Penulis dalam penyusunan tesis ini. Ucapan terimakasih juga Penulis sampaikan kepada Bapak Ir. Julio Adisantoso, M.Kom sebagai dosen penguji. Penulis juga ingin mengucapkan terima kasih kepada:

1. Ayah (alm) dan Ibu tercinta yang selalu mendukung kelancaran masa studi Penulis.

2. Bapak Chandra Lukita, S.E, M.M. dan Keluarga yang memberikan dukungan materi dan semangat pada saat kuliah dan penyusunan tesis ini.

3. Istri tercinta Erna Agustriani, yang mendukung, mendampingi dan selalu memberikan motivasi dan doa. Banyak yang telah kita korbankan selama ini. 4. Rekan rekan dosen dan staf di CIC serta rekan-rekan ‘ilkomp 7’ IPB : Agus

Hasim, Dwi Prasetyo, Prihastuti Harsani, Titi Ratnasari, Diah Widiastuti, Adhi Kusnadi, Roni Salambue, Husmul Beze dan Sahzam. Sukses selalu.

5. Departemen Ilmu Komputer beserta dosen dan staf yang telah banyak membantu Penulis dalam penyusunan tesis ini.

6. Kepada semua pihak yang telah membantu dalam penyusunan tesis ini yang tidak bisa disebutkan satu per satu, terima kasih.

Semoga penelitian ini dapat memberikan manfaat, Amien.

Bogor, Juli 2008 Marsani Asfi


(10)

RIWAYAT HIDUP

Penulis dilahirkan di Bangka pada tanggal 01 Maret 1976 dari ayah Aslah Tamin (alm.) dan Ibu Fatimah. Penulis merupakan putra kedua dari enam saudara. Penulis beristrikan Erna Agustriani, A.md.

Pendidikan sekolah dasar ditempuh di SDN 1 Sungailiat Bangka, menengah pertama di SMPN 1 Sungailiat Bangka. Menengah atas di SMAN 1 Sungailiat Bangka dan lulus tahun 1994, pada tahun yang sama penulis masuk Universitas Padjadjaran Bandung. Lulus dari jurusan Matematika Bidang Minat Ilmu Komputer tahun 1999. Saat ini penulis bekerja di CIC GROUP CIREBON sebagai Kepala Manajemen Mutu.


(11)

PELABELAN OTOMATIS CITRA MENGGUNAKAN

FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA

MARSANI ASFI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2008


(12)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa Tesis Pelabelan Otomatis Citra Menggunakan Fuzzy C-Means untuk Sistem Temu Kembali Citra, adalah karya saya sendiri dan belum diajukan dalam bentuk apapun kepada Perguruan Tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Juli 2008

Marsani Asfi NRP. G651050014


(13)

ABSTRAK

MARSANI ASFI. Pelabelan Otomatis Citra menggunakan Fuzzy C-Means untuk Sistem Temu Kembali Citra. Dibimbing oleh Fahren Bukhari dan Yeni Herdiyeni.

Pelabelan citra secara manual memiliki kelemahan karena memerlukan waktu yang banyak dan sangat tergantung pada subjektifitas pengguna dalam mendeskripsikan citra. Oleh karena itu diperlukan pelabelan citra secara otomatis berdasarkan isi citra. Penelitian ini menggunakan Fuzzy C-Means untuk mengelompokkan informasi warna dan tekstur ke dalam beberapa region berdasarkan objek citra. Dari pengelompokkan ini diperoleh kamus kata untuk setiap citra. Dengan adanya kamus kata tersebut diharapkan dapat mempercepat proses temu kembali. Hasil penelitian menunjukkan bahwa nilai presisi temu kembali citra berdasarkan proses pelabelan ini mencapai 86.68 %.

Kata Kunci : citra, temu kembali citra, pelabelan otomatis citra, fuzzy c-means, clustering.


(14)

ABSTRACT

MARSANI ASFI. Automatic Image Labeling using Fuzzy C-Means for Image Retrieval Systems. Under the direction of Fahren Bukhari and Yeni Herdiyeni.

With the rapid development of digital photography, digital image data has increased tremendously in recent years. Consequently image retrieval has drawn the attention of many user. The need for manually image labeling, which is depends on user subjectivity and time-consuming, especially for image databases. This research propose an automatic image labeling based on image content using Fuzzy C-Means to cluster the color and texture information’s into regions. Label of image from clustering is used to retrieve image. The experiments results showed the average of precision of the proposed method is show 86.68 %.

Keyword: Image, Content Based Image Retrieval, CBIR, automatic image labeling


(15)

RINGKASAN

MARSANI ASFI. Pelabelan Otomatis Citra Menggunakan Fuzzy C Means untuk Sistem Temu Kembali Citra. Di bawah bimbingan Fahren Bukhari dan Yeni Herdiyeni.

Perkembangan internet dan banyaknya aplikasi multimedia saat ini, menyebabkan pengguna sulit untuk mendapatkan citra yang tersimpan dalam komputer. Citra memiliki subjek dan objek citra. Subjek citra merupakan persepsi umum pengguna terhadap objek-objek yang dimiliki citra. Persepsi dan intepretasi pengguna dalam mendeskripsikan citra yang sama sering terdapat perbedaan.

Pelabelan citra secara manual memiliki kelemahan karena memerlukan waktu yang banyak dan sangat tergantung pada subjektifitas pengguna dalam mendeskripsikan citra. Oleh karena itu diperlukan pelabelan citra secara otomatis berdasarkan isi citra.

Citra sumber penelitian diperoleh dari web ALIPR (http://www.alipr.com). Citra sumber berhubungan dengan kelas pemandangan, bangunan, alam. Jumlah objek yang terkandung dalam citra dapat berisi 3 (tiga), 4 (empat) atau 5 (lima) objek. Citra sumber digunakan sebagai data pelatihan dan data pengujian. Data pelatihan digunakan sebagai data untuk pembentukan basis data ciri. Basis data ciri menjadi acuan untuk proses penemuan kembali citra pada saat diujikan. Data pengujian digunakan untuk pengujian pelabelan citra, sedangkan untuk pengujian temu kembali citra menggunakan kata-kata dalam kamus kata. Pengujian dengan kamus kata terdiri dari pengujian subjek citra serta objek-objek citra.

Tahapan penelitian terdiri atas pengindeksan untuk pemilihan citra sumber, segmentasi citra, ektraksi warna dan tekstur, serta pengukuran kemiripan ciri subjek citra menggunakan Euclid. Pelabelan citra secara otomatis. Temu kembali citra untuk menentukan kueri teks sebagai masukan dan penentuan indeks yang digunakan sebagai dasar temu kembali citra. Evaluasi kinerja sistem sebagai evaluasi hasil temu kembali citra berdasarkan nilai precision dan recall.

Penelitian ini menggunakan Fuzzy C-Means untuk mengelompokkan informasi warna dan tekstur ke dalam beberapa region berdasarkan objek citra. Dari pengelompokkan ini diperoleh kamus kata untuk setiap citra. Dengan adanya kamus kata tersebut diharapkan dapat mempercepat proses temu kembali.

Hasil penelitian menunjukkan bahwa proses pelabelan otomatis citra menghasilkan pelabelan yang cukup baik. Definisi kata-kata berupa subjek dan objek citra dalam kamus kata berguna dalam proses temu kembali. Model pelabelan citra otomatis menggunakan Fuzzy C-means (FCM) dilakukan berdasarkan kata-kata yang terdefinisi dalam kamus kata. Tabel indeks citra disusun berdasarkan proses pelabelam otomatis citra dan digunakan sebagai dasar untuk proses temu kembali. Hasil penelitian juga menunjukkan bahwa nilai presisi temu kembali citra berdasarkan proses pelabelan ini mencapai 86.68 %.


(16)

© Hak cipta milik IPB, tahun 2008 Hak cipta dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber.

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah

b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin IPB.


(17)

PELABELAN OTOMATIS CITRA MENGGUNAKAN

FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA

MARSANI ASFI

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada

Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2008


(18)

Judul Tesis : Pelabelan Otomatis Citra Menggunakan Fuzzy C Means untuk Sistem Temu Kembali Citra

Nama : Marsani Asfi

NRP : G651050014

Disetujui Komisi Pembimbing

Ir. Fahren Bukhari, M.Sc Yeni Herdiyeni, S.Si, M.Kom Ketua Anggota

Diketahui

Ketua Program Studi Dekan Sekolah Pascasarjana Ilmu Komputer

Dr. Sugi Guritman Prof. Dr. Khairil Anwar A. Notodiputro, M.S.


(19)

PRAKATA

Alhamdulillahirabbil ‘alamin, Penulis panjatkan puji dan syukur ke hadirat Allah SWT yang telah memberikan rahmat, hidayah, serta karuniaNya sehingga Penulis dapat menyelesaikan tesis yang berjudul Pelabelan Otomatis Citra menggunakan Fuzzy C-Means untuk Sistem Temu Kembali Citra.

Penulis mengucapkan terima kasih kepada Bapak Ir. Fahren Bukhari, M.Sc. dan Ibu Yeni Herdiyeni S.Si, M.Kom selaku komisi pembimbing yang telah memberikan banyak masukan kepada Penulis dalam penyusunan tesis ini. Ucapan terimakasih juga Penulis sampaikan kepada Bapak Ir. Julio Adisantoso, M.Kom sebagai dosen penguji. Penulis juga ingin mengucapkan terima kasih kepada:

1. Ayah (alm) dan Ibu tercinta yang selalu mendukung kelancaran masa studi Penulis.

2. Bapak Chandra Lukita, S.E, M.M. dan Keluarga yang memberikan dukungan materi dan semangat pada saat kuliah dan penyusunan tesis ini.

3. Istri tercinta Erna Agustriani, yang mendukung, mendampingi dan selalu memberikan motivasi dan doa. Banyak yang telah kita korbankan selama ini. 4. Rekan rekan dosen dan staf di CIC serta rekan-rekan ‘ilkomp 7’ IPB : Agus

Hasim, Dwi Prasetyo, Prihastuti Harsani, Titi Ratnasari, Diah Widiastuti, Adhi Kusnadi, Roni Salambue, Husmul Beze dan Sahzam. Sukses selalu.

5. Departemen Ilmu Komputer beserta dosen dan staf yang telah banyak membantu Penulis dalam penyusunan tesis ini.

6. Kepada semua pihak yang telah membantu dalam penyusunan tesis ini yang tidak bisa disebutkan satu per satu, terima kasih.

Semoga penelitian ini dapat memberikan manfaat, Amien.

Bogor, Juli 2008 Marsani Asfi


(20)

RIWAYAT HIDUP

Penulis dilahirkan di Bangka pada tanggal 01 Maret 1976 dari ayah Aslah Tamin (alm.) dan Ibu Fatimah. Penulis merupakan putra kedua dari enam saudara. Penulis beristrikan Erna Agustriani, A.md.

Pendidikan sekolah dasar ditempuh di SDN 1 Sungailiat Bangka, menengah pertama di SMPN 1 Sungailiat Bangka. Menengah atas di SMAN 1 Sungailiat Bangka dan lulus tahun 1994, pada tahun yang sama penulis masuk Universitas Padjadjaran Bandung. Lulus dari jurusan Matematika Bidang Minat Ilmu Komputer tahun 1999. Saat ini penulis bekerja di CIC GROUP CIREBON sebagai Kepala Manajemen Mutu.


(21)

DAFTAR ISI

Halaman

DAFTAR TABEL ... xi

DAFTAR GAMBAR... xii

DAFTAR LAMPIRAN ... xiv

I. PENDAHULUAN A. Latar Belakang ... 1

B. Tujuan Penelitian ... 3

C. Manfaat Penelitian ... 3

D. Ruang Lingkup Penelitian ... 3

II. TINJAUAN PUSTAKA A. Temu Kembali Citra ... 4

B. Segmentasi, Ekstraksi Ciri Citra dan Clustering ... 5

Normalized Cuts ... 5

Expectation-Maximation ... 7

Ekstraksi Ciri Tekstur ... 7

Transformasi Wavelet Gabor ... 8

Filter Gabor ... 9

Ekstraksi Ciri Warna ... 11

Clustering ... 12

C. Fuzzy C-Means(FCM) ... 13

D. Metodologi Pelabelan Otomatis Citra ... 16

E. Pengukuran Kinerja Sistem ... 16

III.METODOLOGI PENELITIAN A. Kerangka Pemikiran... 18

B. Alat Bantu Prnelitian ... 19

C. Tata Laksana Penelitian ... 19

Pengindeksan ... 19

Pelabelan Citra ... 23

Temu Kembali Citra ... 24


(22)

IV. PERANCANGAN DAN IMPLEMENTASI SISTEM

A. Desain Data ... 26 Citra Sumber ... 26 Kamus Kata ... 27

B. Desain Proses Sistem ... 27 Segmentasi Citra ... 28

Ekstraksi Ciri ... 28 C. Perancangan Proses Sistem ... 29 Modul Segmentasi ... 29 Modul Clustering ... 30

Modul Pelabelan Citra ... 31 Modul Temu Kembali ... 32 Modul Evaluasi ... 32

Modul Representasi Hasil ... 32 D. Desain Antar Muka ... 32 V. HASIL DAN PEMBAHASAN

A. Karakteristik Citra Masukan ... 34 B. Pengindeksan Citra ... 34 Segmentasi Warna Citra ... 34

Format Tekstur Citra ... 35 Segmentasi Region ... 36

Ekstraksi Ciri Warna ... 37 Ekstraksi Ciri Tekstur ... 38 Penggabungan Ciri Warna dan Tekstur ... 39 C. Pelabelan Citra ... 39

Labeling Capture ... 39

Labeling Coding ... 40

Labeling Reuse ... 41 D. Hasil Temu Kembali ... 43 E. Evaluasi Temu Kembali ... 44

F. Pengembangan Prototype ... 46 Antar Muka Menu Utama Sistem dan Pelabelan Citra ... 46


(23)

Antar Muka Temu Kembali Citra ... 47 VI. SIMPULAN DAN SARAN

A. Simpulan ... 48 B. Saran ... 48 DAFTAR PUSTAKA ... 50 LAMPIRAN ... 53


(24)

DAFTAR TABEL

Halaman 1

2 3 4 5 6

Enam parameter filter Gabor ... Kamus Kata... Matrik Keanggotaan ... Subjek, Jumlah, serta Objek yang terkandung pada Citra Sumber... Matrik Keanggotaan Region berdasarkan hasil clustering ... Nilai rataan precision hasil temu kembali citra ...

10 27 30 34 40 45


(25)

DAFTAR GAMBAR

Halaman 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Alur Sistem Temu Kembali Citra ………... Citra sebagai suatu graf dalam Normalized Cuts ... Grap Citra setelah di Segmentasi ... Ilustrasi Pemotongan dalam Normalized Cuts ... Contoh tekstur visual dari Album Tekstur Brodatz ... Parameter filter Gabor dalam domain frekuensi spasial ... Tahapan Segmentasi Tekstur ... Tahapan Algoritma fuzzy c-mean Clustering ... Kerangka Pemikiran Penelitian ... Tata Laksana Pengindeksan... Ekstraksi ciri warna ... Ekstraksi ciri tekstur ... Tata Laksana Pelabelan Otomatis... Tata Laksana Temu Kembali Citra ... Arsitektur Sistem Pelabelan Otomatis ... Rancangan Antar Muka Pelabelan Citra ... Rancangan Desain Antarmuka Sistem Temu Kembali ... Contoh Citra sebelum dan sesudah segmentasi menggunakan algoritma EM ... Contoh Citra RGB ke Citra Gray Scale ... Contoh Citra sebelum dan sesudah segmentasi menggunakan algoritma ... Pemisahan Region Citra kedalam 6 Region... Contoh Citra Langit ... Hasil FCH dengan FCM 30 bin ... Contoh Citra Region Rumput ... Region Rumput dengan frekuensi tertentu ... Grafik Total Cluster per Subjek ... Citra Contoh Proses Labeling Coding... Contoh Citra proses penggabungan region... Contoh Citra hasil pelabelan otomatis ...

4 5 6 6 8 9 11 15 18 19 21 23 24 24 29 33 33 35 36 36 37 37 38 38 39 40 41 42 42 xii


(26)

30 31 32 33

Hasil Temu Kembali Citra dengan kata kunci ‘awan’ dan ‘ rumput’... Grafik rataan precision dan recall ... Antar Muka Sistem dan Pelabelan Citra... Antar Muka Temu Kembali Citra...

44 45 46 47


(27)

DAFTAR LAMPIRAN

Halaman 1

2 3

Segmentasi Warna Citra Sumber ... Segmentasi Region Citra Sumber ... Warna Kuantisasi untuk 30 Bin Histogram ...

53 54 55


(28)

I. PENDAHULUAN

A. Latar Belakang

Perkembangan internet dan banyaknya aplikasi multimedia saat ini, menyebabkan pengguna sulit untuk mendapatkan citra yang tersimpan dalam komputer. Citra memiliki subjek dan objek citra. Subjek citra merupakan persepsi umum pengguna terhadap objek-objek yang dimiliki citra. Pada citra dengan subjek pemandangan, identifikasi objek yang dimiliki citra dapat berupa awan, rumput atau objek lainnya. Setelah menghubungkan satu objek dengan objek yang dimiliki citra, maka pengguna dapat melakukan penafsiran (interpretation) citra. Persepsi dan intepretasi pengguna dalam mendeskripsikan citra yang sama sering terdapat perbedaan.

Oleh karena itu, perlu dikembangkan metode pencarian citra sehingga mempermudah pencarian data. Pencarian citra dapat dilakukan berdasarkan karakteristik visual citra berupa warna, bentuk dan tekstur yang disebut

Content-Based Image Retrieval (CBIR). Pencarian berdasarkan karakteristik visual citra memiliki keuntungan dimana hasil pencarian sangat sesuai dengan persepsi pengguna terhadap citra yang dimaksud. Pencarian dengan teknik ini ternyata memiliki kekurangan yaitu membutuhkan waktu yang lama untuk pemrosesan awal. Karakteristik visual citra masukan berupa warna, tekstur ataupun bentuk harus diekstraksi terlebih dahulu. Pencarian lain dapat dilakukan menggunakan teks sebagai kata kunci pencarian. Keuntungan pencarian berbasis teks adalah waktu yang lebih singkat untuk menampilkan hasil dibandingkan pencarian berbasis citra. Kekurangan dari teknik ini adalah pemberian informasi tekstual untuk setiap citra dilakukan secara manual, untuk jumlah citra yang banyak sangat membutuhkan waktu. Kesalahan deskripsi sangat mungkin terjadi sehingga hasil pencarian tidak sesuai dengan persepsi awal pengguna.

Pelabelan otomatis citra dilakukan untuk objek-objek yang dimiliki citra. Pelabelan otomatis citra dalam beberapa penelitian pernah dilakukan diantaranya dalam penelitian Mori et.al. (1999) yang melakukan cluster citra dengan membentuk sub-sub citra (dekomposisi citra berbasis blok) dan


(29)

2

menghitung frekuensi kata untuk masing-masing cluster. Duygulu et. al.

(2002) melakukan metode translasi kumpulan-kumpulan blob yang terbentuk dari hasil segmentasi. Segmentasi otomatis dilakukan untuk mendapatkan vektor ciri, kemudian pengklasteran blob-blob yang terbentuk. Suatu citra terbentuk atas blob-blob dan kata-kata diasosiasikan dengan blob tersebut. Proses pengasosian ini menggunakan metode Expectation Maximization

sehingga diperoleh suatu label baru untuk blob tersebut.

Selanjutnya Lavrenko et. al. (2003) menggunakan metode CRM (Continuous-space Relevance Model) untuk melakukan pelabelan citra serta menggunakan algoritma smoothed KNN. Ciri-ciri citra dimodelkan menggunakan kernel-based density dan segmentasi otomatis citra dilakukan berdasarkan ciri warna, tekstur dan bentuk. Ciri-ciri kata yang digunakan dimodelkan menggunakan distribusi multinomial. Kemudian Feng et. al.

(2004) menggunakan metode CRM-rect. Penelitian Feng et. al. (2004) sama dengan penelitian Lavrenko et. al. (2003) tetapi metode CRM yang digunakan adalah dengan mendekomposisi blok-blok citra. Feng et. al. (2004) juga menggunakan MBRM (Multiple-Bernoulli Relevance Model) yaitu metode yang sama dengan CRM-rect dimana ciri-ciri kata yang digunakan dimodelkan dengan MBRM. Penelitian lain adalah dengan menerapkan hirarki teks sebagai bentuk teks ontologi, pemetaan teks ke citra dilakukan dengan kamus visualisasi yang terbentuk secara hirarki Srikanth et. al.(2005). Penelitian lain berkaitan dengan pelabelan citra yaitu pelabelan otomatis terhadap 50 (lima puluh) citra yang mengandung teks dari web Yahoo!News. Proses awal dilakukan dengan mendeteksi dan mengklasifikasi semua entitas teks berupa orang dan objek yang ada, kemudian dibandingkan dengan teks yang dominan dan terlihat secara visual Deschacht(2007).

Oleh karena itu kecepatan dalam pencarian berbasis teks serta kesesuaian hasil temu kembali pada pencarian berbasis citra saat proses temu kembali melatarbelakangi penelitian ini. Selain itu, penelitian ini dikembangkan untuk mendapatkan definisi citra yang berkaitan dengan subjek dan objek citra. Metode pelabelan yang digunakan adalah menggunakan Fuzzy C-Means (FCM). Penelitian ini diharapkan dapat menghasilkan kualitas yang


(30)

3

lebih baik dalam pencarian citra berdasarkan semantik objek (Schober et. al., 2004). Fokus penelitian ini adalah pada pelabelan citra sehingga dapat digunakan untuk dasar proses temu kembali citra.

B. Tujuan Penelitian

Penelitian ini bertujuan untuk :

1. Mendefinisikan kata-kata yang merepresentasikan subjek dan objek citra. 2. Membuat model pelabelan citra menggunakan Fuzzy C-means (FCM)

secara otomatis berdasarkan kata-kata yang telah didefinisikan. 3. Membuat tabel indeks citra berdasarkan pelabelan otomatis citra.

C. Manfaat Penelitian

Manfaat penelitian ini diharapkan mempercepat proses pencarian citra berdasarkan proses pelabelan citra.

D. Ruang Lingkup Penelitian

Ruang lingkup penelitian ini mencakup : 1. Objek penelitian adalah citra berwarna. 2. Segmentasi citra berbasis region.

3. Ekstraksi ciri berdasarkan tekstur dan warna.

4. Pelabelan citra secara otomatis berdasarkan tabel indeks citra. 5. Subjek citra terdiri dari subjek pemandangan, alam dan bangunan. 6. Kueri citra berbasis teks.


(31)

II. TINJAUAN PUSTAKA

A. Temu Kembali Citra

Temu kembali citra adalah salah satu metodologi untuk penemuan

kembali citra berdasarkan isi (content) citra. Citra memiliki informasi

karakteristik visual berupa warna, bentuk, tekstur, dan karakteristik spasial. Karakteristik visual tersebut diproses melalui ekstraksi ciri, sehingga diperoleh ciri-ciri citra. Hasil ekstraksi ciri tersebut kemudian disusun dalam vektor-vektor ciri multi dimensi. Vektor ciri dari citra disusun sebagai basis data ciri (Long et. al., 2003).

Gambar 1. Frame work Sistem Temu Kembali Citra (Hua et. al., 2008).

Alur sistem temu kembali citra pada Gambar 1 diawali dengan masukan dalam bentuk kueri masukan untuk sistem. Citra masukan yang memiliki karakteristik visual berupa warna, bentuk ataupun tekstur selanjutnya diekstraksi sehingga diperoleh data-data ciri dalam bentuk vektor ciri. Citra-citra dalam basis data yang memiliki karakteristik visual Citra-citra juga diekstraksi karakteristiknya kemudian disusun dalam vektor-vektor ciri. Kumpulan vektor-vektor ciri disimpan menjadi basis data ciri. Basis data ciri dan vektor ciri dari kueri masukan kemudian dihitung kemiripannya. Proses pengindeksan dilakukan untuk mempermudah proses temu kembali. Hasil


(32)

5

feedback, begitu juga untuk kueri masukan, karakteristik visual citra dan vektor ciri yang terbentuk (Long et. al., 2003).

B. Segmentasi, Ekstraksi Ciri Citra dan Clustering

Secara umum, segmentasi merupakan langkah awal dalam analisis citra. Segmentasi dilakukan untuk membagi citra ke dalam bagian-bagian yang memiliki kemiripan karakteristik (Gonzales & Woods, 2002).

Normalized Cuts

Metode Normalized Cuts menerapkan teori graf untuk membagi citra ke

dalam ukuran terbaik. Dalam Gambar 2 citra dalam Normalized Cuts

dipandang sebagai suatu graf yang saling berhubungan secara penuh ( Fully-connected graph). Setiap piksel merupakan node untuk graf. Hubungan menyatakan keterkaitan dalam graf antara pasangan piksel yang dinotasikan

dengan p dan q. Masing-masing edge memiliki biaya (Shi & Malik,

2000).

pq

C

Gambar 2. Citra sebagai suatu graf dalam Normalized Cuts.

Proses segmentasi citra berdasarkan graf adalah proses memecah graf-graf menjadi suatu segmen (Gambar 3). Proses tersebut dilakukan dengan


(33)

6

menghapus semua edge yang memotong di antara segmen citra atau edge-edge

yang memiliki biaya terkecil. Semua piksel yang memiliki kemiripan akan digabungkan dalam segmen yang sama (Shi & Malik, 2000).

Gambar 3. Graf Citra setelah di Segmentasi.

Proses pemotongan edge dilakukan untuk membuat graf-graf tersebut

menjadi tidak terhubung (Gambar 4). Nilai biaya pemotongan edge dinyatakan dengan persamaan (1) (Shi & Malik, 2000) :

∈ ∈

=

B q A p

q p

C B

A Cut

, ,

) ,

( (1)

Gambar 4. Ilustrasi Pemotongan dalam Normalized Cuts

Proses pemotongan graf dilakukan untuk menghasilkan segmen terbesar.

Dalam normalized cuts (Ncut) proses pemotongan ini diperbaiki dengan

menormalkan ukuran dari segmen dengan cara menggunaakan persamaan (2) (Shi & Malik, 2000) :


(34)

7 ) ( ) , ( ) ( ) , ( ) , ( B volume B A Cut A volume B A Cut B A

Ncut = + (2)

dengan volume(A) dan volume(B) adalah jumlah biaya untuk semua edge

yang ada dalam segmen A dan segmen B.

Expectation-Maximization

Expectation-Maximization (EM) adalah salah satu metode optimisasi

untuk mencari dugaan parameter maximum likelihood ketika ada data yang

hilang atau tidak lengkap. Di dalam algoritma EM, dilakukan perhitungan

dugaan kemungkinan untuk mengisi data yang tidak lengkap (E-step) dan

perhitungan dugaan parameter maximum likelihood dengan memaksimalkan

dugaan kemungkinan yang diperoleh dari E-step (M-step). Nilai parameter

yang diperoleh dari M-step digunakan kembali untuk memulai E-step

selanjutnya. Proses ini akan berulang hingga mencapai konvergensi nilai

likelihood (Belongie et. al., 1998).

Ekstraksi Ciri Tekstur

Tekstur merupakan karakteristik intrinsik dari suatu citra yang terkait dengan tingkat kekasaran (roughness), butiran (granulation), dan keteraturan (regularity) susunan struktural piksel. Aspek tekstural dari sebuah citra dapat dimanfaatkan sebagai dasar dari segmentasi, klasifikasi, maupun interpretasi citra (Gonzales & Woods, 2002).

Tekstur dicirikan sebagai distribusi dari derajat keabuan piksel-piksel yang bertetangga. Tekstur tidak dapat didefinisikan hanya melalui sebuah piksel, tapi harus dalam sekumpulan piksel. Resolusi citra yang diamati dapat ditentukan oleh tekstur citra tersebut. Apabila resolusi atau skala meningkat, tekstur yang diamati akan berubah dari tekstur halus (fine) menjadi tekstur kasar (coarse) (Gonzales & Woods, 2002).

Tekstur dapat didefinisikan sebagai fungsi dari variasi spasial intensitas piksel (nilai keabuan) dalam citra. Berdasarkan strukturnya, tekstur dapat diklasifikasikan dalam dua golongan :


(35)

8

1. Makrostruktur

Tekstur makrostruktur memiliki perulangan pola lokal secara periodik pada suatu daerah citra, biasanya terdapat pada pola-pola buatan manusia dan cenderung mudah untuk direpresentasikan secara matematis.

2. Mikrostruktur

Pada tekstur mikrostruktur, pola-pola lokal dan perulangan tidak terjadi begitu jelas, sehingga tidak mudah untuk memberikan definisi tekstur yang komprehensif.

Gambar 5 menunjukkan perbedaan tekstur makrostruktur dan mikrostruktur yang diambil dari album tekstur Brodatz (Brodatz, 1966).

Gambar 5. Contoh tekstur visual dari Album Tekstur Brodatz. Atas: makrostruktur Bawah: mikrostruktur

Transformasi Wavelet Gabor

Pendekatan umum dalam melakukan analisa citra adalah penggunaan fungsi Fourier untuk menarik ciri citra sehingga diperoleh distribusi ciri energi global sinyal sebagai fungsi terhadap frekuensi. Ciri global tidak dapat menarik karakteristik sebagian citra. Oleh karena itu diperlukan ciri lokal yang dapat dinyatakan dalam frekuensi lokal. Frekuensi lokal ini menggunakan fungsi wavelet (Daubechies, 1995).

Wavelet adalah fungsi matematika yang membagi data (sinyal) ke dalam komponen-komponen frekuensi yang berbeda. Salah satu fungsi wavelet adalah Gabor. Transformasi Wavelet menggunakan pendekatan penyaring multikanal (mutichannel filtering), dengan fungsi Gabor sebagai penyaring (filter) (Daubechies, 1995).


(36)

9

Filter Gabor

Filter Gabor merupakan salah satu filter yang mampu mensimulasikan karakteristik sistem visual manusia dalam mengisolasi frekuensi dan orientasi tertentu citra. Karakteristik ini membuat filter Gabor sesuai untuk aplikasi pengenalan tekstur dalam computer vision (Seo, 2006).

Secara spasial, sebuah fungsi Gabor merupakan sinusoida yang dimodulasi oleh fungsi Gauss. Respon impuls sebuah filter Gabor kompleks dua dimensi adalah menggunakan persamaan (3) (Seo, 2006 ):

⎪⎩ ⎪ ⎨ ⎧ ⎪⎭ ⎪ ⎬ ⎫ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + −

= (2 )

2 1 exp 2 1 ) , ( 2 2 2 2 jFx y x y x h y x y x π σ σ σ

πσ (3)

dengan σxdanσymerupakan standar deviasi fungsi Gauss x dan y.

Dalam domain frekuensi spasial, parameter-parameter filter Gabor dapat digambarkan seperti pada Gambar 6.

Gambar 6. Parameter filter Gabor dalam domain frekuensi spasial

Ada enam parameter yang harus ditetapkan dalam implementasi filter Gabor (Tabel 1). Keenam parameter tersebut adalah: F,θ,σxy,BF,danBθ. 1. Frekuensi (F) dan orientasi (θ) mendefinisikan lokasi pusat filter.

2. menyatakan konstanta lebar pita frekuensi dan jangkauan

angular filter. θ B dan BF


(37)

10

3. Variabel σ

x berkaitan dengan respon sebesar -6 dB untuk komponen

frekuensi spasial. Nilai variabel σ

x dapat dinyatakan dalam persamaan (4).

) 1 2 ( 2 ) 1 2 ( 2 ln − + = F F B B x F π

σ (4)

4. Variabel σ

y berkaitan dengan respon sebesar -6dB untuk komponen

angular. Nilai Variabel σ

y dapat dinyatakan dalam persamaan (5).

) 2 / tan( 2 2 ln θ π σ B F

y = (5)

5. Posisi (F, θ) dan lebar pita (σ

x, σy) dari filter Gabor dalam domain

frekuensi harus ditetapkan dengan cermat agar dapat menangkap informasi tekstural dengan benar. Frekuensi tengah dari filter kanal harus terletak dekat dengan frekuensi karakteristik tekstur.

6. Setelah mendapatkan ciri Gabor maka dapat dilakukan ekstraksi ciri. Salah satu ciri yang dapat dipilih adalah ciri energi, yang didefinisikan dalam persamaan (6). 2 M 1 i N 1 ) , ( 1 ) (

∑∑

= = = j n m x MN x

e (6)

Enam parameter filter Gabor beserta nilainya seperti pada tabel 1. Tabel 1. Enam parameter filter Gabor

Parameter Simbol Nilai

Frekuensi tengah (ternormalisasi) F 6 5 4 3 2 1 0 2 2 , 2 2 , 2 2 2 2 , 2 2 , 2 2 , 2 2

Lebar pita frekuensi BB

F 1 oktaf

Lebar pita angular BB

θ 30

o

atau 45o Spacing frekuensi S

F 1 oktaf

Spacing angular Sθ 30o atau 45o

Orientasi θ S

θ= 30

o

: 0o, 30o, 60o, 90o, 120o, 150o Sθ= 45o : 0o, 45o, 90o, 135o, 180o, 225o


(38)

11

Algoritma segmentasi tekstur menggunakan wavelet Gabor dilakukan melalui tahapan berikut (Seo, 2006) :

1. Mendekomposisi citra masukan menggunakan filter bank,

2. Mengekstraksi ciri, dan 3. Clustering.

Alur segmentasi tekstur terlihat seperti pada Gambar 7.

Filter Gabor

Ekstraksi Ciri

Clustering

Filter Citra

Ciri Citra

Citra Segmentasi Citra Sumber

Gambar 7. Tahapan Segmentasi Tekstur (Seo, 2006)

Ektraksi Ciri Warna

Setiap piksel mempunyai warna yang dapat dinyatakan dalam Red,

Green dan Blue (RGB). Nilai RGB ini merupakan gabungan nilai R, nilai G dan nilai B yang tidak bisa dipisahkan satu dengan lainnya. Hal ini dapat dituliskan dengan P(r,g,b).

Ekstraksi ciri warna merupakan salah satu cara untuk menentukan arti fisik suatu citra melalui proses pengindeksan warna. Proses ini bisa dilakukan dengan pendekatan histogram warna(Belongie et. al., 1998).

Histogram warna merupakan representasi peluang keberadaan setiap

warna dalam sebuah citra. Banyaknya nilai warna (bin) ditetapkan sesuai

kebutuhan pembuatan histogram. Dengan bin sejumlah n, maka histogram

warna untuk citra I yang mengandung N piksel dapat dirumuskan seperti

dengan persamaan (7).

] ,..., 2 , 1 [ )

(I h h hn


(39)

12

∑ = = N

j Pi j N

i h

1 | 1

, (7)

= selainnya ; 0 i -ke bin ke sasi terkuanti j piksel ; 1 |j i P .

Histogram warna seperti ini disebut juga conventional color histogram

(CCH) (Han & Ma, 2002).

Clustering

Proses Clustering adalah proses pengelompokan data ke dalam cluster

berdasarkan parameter tertentu sehingga objek-objek dalam sebuah cluster

memiliki tingkat kemiripan yang tinggi satu sama lain dan sangat tidak mirip dengan obyek lain pada cluster yang berbeda (Kantardzic, 2001).

Pada clustering tidak diperlukan kelas yang telah didefinisikan

sebelumnya atau kelas hasil training, sehingga clustering dapat dinyatakan sebagai bentuk pembelajaran berdasarkan observasi dan bukan berdasarkan contoh (Jiawei et. al., 2001). Proses clustering dilakukan sebagai tahapan terakhir dari segmentasi warna dan tekstur dari vektor-vektor ciri.

Clustering secara umum memiliki tahapan sebagai berikut (Jain et. al., 1999) : 1. Representasi pola

2. Pengukuran kedekatan pola (Pattern Proximity) 3. Clustering

4. Abstraksi data (jika dibutuhkan) 5. Penilaian output (jika dibutuhkan). Jarak Euclidean

Kedekatan pola diukur berdasarkan fungsi jarak antara dua ciri. Jarak digunakan untuk mengukur ketidakmiripan antara dua obyek data. Bila p dan q menyatakan piksel dengan koodinat (x,y) dan (s,t) maka jarak euclidean antara p dan q adalah seperti persamaan (8) (Gonzales & Woods, 1992).

2 2 ) ( ) ( ) ,

(p q x s y t


(40)

13

C. Fuzzy C-Means (FCM)

Fuzzy C-Mean Clustering (FCM) juga dikenal sebagai fuzzy ISODATA. Pengelompokan setiap titik data dalam sebuah cluster ditentukan oleh derajat keanggotaannya. Bezdek mengusulkan algoritma ini tahun 1973 sebagai pengembangan awal dari hard C-mean (HCM) clustering (Jang et. al., 1997).

FCM membagi sebuah koleksi ke-n dari vektor xi, dengan i = 1,2,3,...,n

ke dalam c grup fuzzy dan mencari pusat cluster pada masing-masing grup yakni fungsi biaya dari ukuran ketidakmiripan yang paling minimal.

Fuzzy c mean memiliki dua proses yakni menghitung pusat cluster dan

menandai poin untuk pusat cluster menggunakan sebuah jarak euclidean.

Proses ini dilakukan berulang hingga pusat cluster stabil. Keberadaan setiap titik data pada FCM dalam suatu cluster ditentukan oleh derajat keanggotaan antara 0 hingga 1 (Jang et. al., 1997 dan Cox, 2005).

Untuk mengakomodasi fuzzy partisi, keanggotaan matrik U harus

memiliki nilai antara 0 dan 1 (Jang et. al., 1997 dan Pedrycz, 2005).

Normalisasi penetapan hasil derajat keanggotaan dari set data menggunakan persamaan (9). n j u c i

ij 1, 1,2,3,..., 1 = ∀ =

= (9) dengan µij adalah derajat keanggotaan point data terhadap pusat-pusat cluster,

C adalah jumlah cluster C, serta n adalah jumlah data.

Fungsi objektif pada fuzzy c-mean digunakan persamaan (10).

= = = = n j ij m ij c i c i i

c J u d

c c U J 2 1 1

1,..., )

,

( (10)

dengan J adalah fungsi objektif, uij adalah derajat keanggotaan poin data

terhadap cluster-cluster dengan nilai antara 0 dan 1, c adalah jumlah cluster,

n adalah banyaknya poin data, m adalah nilai parameter fuzzy dan dij adalah


(41)

14

Jarak antar pusat cluster ke-i hingga ke ke-j dari titik data didapatkan dari persamaan dij = ||ci-xj|| ;

Nilai minimum dari pusat cluster digunakan persamaan (11) di bawah ini :

= = = n j m ij n j j m ij i u x u c 1 1 (11)

dengan ci adalah pusat cluster ke-i, n adalah banyaknya poin data, uij adalah

derajat keanggotaan poin data terhadap cluster-cluster dengan nilainya antara 0 dan 1, m adalah nilai parameter fuzzy, serta xj adalah data poin ke-j.

Untuk menghitung perubahan matrik partisi (derajat keanggotaan poin data terhadap semua cluster yang baru) digunakan persamaan (12).

= − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = c k m kj ij ij d d u 1 ) 1 /( 2 1 (12).

dengan uij adalah derajat keanggotaan poin data terhadap cluster-cluster yang

nilainya antara 0 dan 1, c adalah jumlah pusat cluster dari grup fuzzy ke-i, m adalah parameter fuzzy, dij adalah jarak euclidian antara pusat cluster ke-i

hingga ke-j dari poin data, dkj adalah jarak euclidian antara pusat cluster ke-k

hingga ke-j dari poin data.

Algoritma FCM diawali dengan menentukan derajat keanggotaan

(secara acak) setiap titik data terhadap cluster. Berdasarkan derajat

keanggotaan, kemudian ditentukan pusat cluster. Pada kondisi awal, pusat

cluster tentu saja masih belum akurat. Derajat keanggotaan selanjutnya diperbaiki berdasarkan fungsi jarak antara titik data dengan pusat cluster

(Nascimento et. al., 2003).

Dengan memperbaiki pusat cluster dan derajat keanggotaan tiap titik data secara berulang dan terus menerus maka pusat cluster akan bergeser ke titik yang tepat. Kinerja FCM tergantung pada inisialisasi pusat cluster.

Keluaran FCM adalah deretan pusat cluster dan derajat keanggotaan data


(42)

15

FCM menentukan pusat cluster ci dan keanggotaan matriks U (Jang et.

al., 1997) dengan langkah-langkah sebagai berikut :

1. Inisialisasi keanggotaan matrik U dengan nilai random antara 0 dan 1

dengan persamaan (9).

2. Menghitung c pusat cluster fuzzy ci, i = 1,2,3,...c menggunakan persamaan

(11).

3. Menghitung fungsi objektif berdasarkan persamaan (10). Berhenti jika

hasil fungsi objektifnya mencapai nilai toleransi atau hasil fungsi objektifnya setelah iterasi maksimal yang ditetapkan.

4. Menghitung matrik partisi baru menggunakan persamaan (12) dan kembali

ke langkah ke-2.

Diagram alir proses clustering data pada algoritma fuzzy c-mean dapat dilihat pada Gambar 8.

Gambar 8. Tahapan algoritma fuzzy c-mean clustering (Jiang, 2003)

dengan U adalah matrik partisi, C adalah pusat cluster, D adalah jarak antar matrik, m adalah nilai parameter fuzzifikasi, k adalah jumlah

cluster, n adalah jumlah data serta p jumlah atribut data.

Kemudian untuk nilai E-step dan M-Step dapat dihitung dengan persamaan (13) dan persamaan (14).


(43)

16

E-step : mk =

α α ik n i i ik n i U X U

= = 1 1 (13)

M-step : Uik =

= − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − 1 1 1 1

l i l

k i m x m x α (14)

dengan mk adalah pusat cluster ke-k dan Uik adalah derajat keanggotaan

poin data terhadap pusat cluster (M-step).

Dalam algoritma FCM ada beberapa hal yang perlu diperhatikan saat membangun sistem diantaranya iterasi maksimal, error terkecil yang diinginkan (ξ), pemangkat (m > 1) dan inisialisasi terhadap pusat awal

cluster (c ≥ 2).

D. Metodologi Pelabelan Otomatis Citra

Metode pelabelan otomatis mengadopsi metode pengembangan ontologi yang dikenal dengan metodologi Uschold yaitu (Benjamins et. al., 2004):

1. Mendefinisikan tujuan dan cakupan dari pelabelan otomatis;

2. Membangun pelabelan otomatis dengan langkah labeling capture yang

merupakan pengumpulan subjek-subjek/konsep citra, labeling coding

membangun model subjek/konsep dan mengintegrasikan pelabelan yang telah ada (reuse) secara visual;

3. Melakukan evaluasi melalui verifikasi dan validasi;

E. Pengukuran Kinerja Sistem

Dua parameter utama yang dapat digunakan untuk mengukur keefektifan temu kembali citra, yaitu recall dan precision. Recall adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang relevan, sedangkan precision adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang ditemukembalikan (Grossman, 2006).


(44)

17

data basis dalam relevan citra

jumlah

kembali temu

hasil relevan citra

jumlah

=

recall (15)

terambil yang

citra seluruh jumlah

terambil yang

relevan citra

jumlah =

precision (16)

Average precision adalah suatu ukuran evaluasi yang diperoleh dengan

menghitung rata-rata tingkat precision pada berbagai tingkat recall


(45)

III. METODOLOGI PENELITIAN

A. Kerangka Pemikiran

Penelitian dilakukan dalam empat tahapan utama, yaitu pengindeksan, pelabelan otomatis, temu kembali citra dan evaluasi kinerja sistem (Gambar 9).

Gambar 9. Kerangka Pemikiran Penelitian

Keempat tahapan tersebut terdiri dari beberapa proses yang saling berhubungan, yaitu :

1. Pengindeksan : pada tahapan ini dilakukan pemilihan citra sumber,

segmentasi citra, ektraksi warna dan tekstur, serta pengukuran kemiripan ciri subjek citra menggunakan Euclid.

2. Pelabelan citra : mencakup pembentukan label citra secara otomatis.


(46)

19

3. Temu kembali citra : mencakup kueri teks sebagai masukan, penentuan

indeks digunakan sebagai dasar temu kembali citra.

4. Evaluasi kinerja sistem : pengukuran hasil temu kembali citra berdasarkan nilai precision dan recall.

B. Alat Bantu Penelitian

Peralatan yang diperlukan untuk melaksanakan penelitian dibagi menjadi dua, yaitu perangkat keras dan lunak. Perangkat keras berupa satu unit komputer PC dengan spesifikasi Intel Pentium IV, RAM 512 MB, Harddisk 80 GB dan Kartu grafis serta layar monitor minimal mempunyai resolusi warna 8 bit, sedangkan perangkat lunak yang diperlukan untuk perancangan dan pengujian sistem adalah Matlab 7.1 dengan platform sistem operasi Microsoft Windows XP.

C. Tata Laksana Penelitian 1. Pengindeksan

Pengindeksan dilakukan dalam empat tahapan utama (Gambar 10), yaitu pemilihan jenis dan sumber data menjadi basis data citra, segmentasi citra, ekstraksi ciri (warna dan tekstur) serta pengukuran kemiripan. Proses pengindeksan masing-masing dijelaskan berikut ini.

Gambar 10. Tata Laksana Pengindeksan BASIS DATA

CITRA SEGMENTASI CITRA

EKSTRAKSI CIRI CITRA PENGINDEKSAN CITRA

EKSTRAKSI CIRI WARNA (HISTOGRAM)

EKSTRAKSI CIRI TEKSTUR (WAVELET GABOR)

UKURAN KEMIRIPAN

(EUCLID)

Jenis dan Sumber Data

Citra sumber merupakan data sekunder yang diambil dari situs internet yang beralamat di ALIPR (http://www.alipr.com). Sebanyak 300 citra


(47)

20

kemudian dikelompokkan dalam tiga kelas citra dengan masing-masing kelas berjumlah 40 citra dan memiliki berbagai jenis objek. Format citra adalah JPG berukuran 50×50 piksel serta merupakan citra berwarna.

Segmentasi Warna Citra

Pada tahapan segmentasi ini, setiap citra akan disegmentasi untuk mengelompokkan warna yang dikandung oleh setiap piksel dari citra ke beberapa segmen yang sudah ditentukan jumlahnya, yaitu dua, tiga, empat, dan lima. Segmen ini merupakan representasi dari warna-warna dominan citra. Setiap piksel dari citra dibangkitkan dari salah satu g segmen. Peluang sebuah piksel masuk ke dalam segmen dapat dihitung dengan persamaan (17).

(

|

)

(

|

)

. 1 l g l l x p x

p

θ π

=

=

Θ (17) Masing-masing segmen diasumsikan mempunyai distribusi normal

Gauss, sehingga peluang piksel dari segmen l dapat dihitung dapat dihitung dengan persamaan (18).

( ) ( ) ( ) . 2 1 exp ) det( ) 2 ( 1 | 1 2 1 2 ⎭ ⎬ ⎫ ⎩ ⎨

Σ

Σ = − l l T l l d

l x x

x

p μ μ

π

θ (18)

Algoritma EM mempunyai dua tahapan utama yaitu tahapan Expectation

(E-step) dan Maximization (M-step). Pada tahapan Expectation, data

X diasumsikan sebagai data yang tidak lengkap dengan missing value berupa label yang menyatakan keanggotaan tiap piksel dari X ke dalam salah satu g segmen. Pada tahapan ini yang dilakukan adalah menghitung peluang tiap piksel dari tiap segmen dan membentuk matriks Zyang akan melengkapi data

X , sehingga data yang lengkap dapat dinyatakan sebagai . Label

tiap piksel didapatkan dari segmen yang mempunyai peluang tertinggi dalam

(

X Z

Y = ,

)

Z. Nilai likelihood dari data yang lengkap dapat dihitung dengan persamaan (19).

(

| . ) | ( 1 1

∑∑

= = Θ = Θ n i g l x p Y


(48)

21

Pada tahapan Maximization, parameter untuk iterasi berikutnya

ditentukan sesuai dugaan variabel dari Z. Formulasi untuk menduga kembali parameter segmen adalah menggunakan persamaan (20),(21) dan (22).

=

+ = N

i i l t l z N 1 1 1

π (20)

= = + = N i i l N i i i l t l z x z 1 1 1

μ (21)

(

)(

)

. 1 1 1 1 1

= = + + + − − = ∑ N i i l N i T t l i t l i i l t l z x x

z μ μ

(22)

Nilai parameter yang baru dari M-step ini akan digunakan kembali untuk

E-step pada iterasi berikutnya. Proses E-step dan M-step akan terus berulang sampai didapatkan nilai likelihood yang kecil sehingga hasil perhitungan

sudah tidak terlalu banyak mengalami perubahan. Ketika nilai likelihood

hanya sedikit berubah, maka hasil dianggap konvergen. Ektraksi Ciri Warna

Proses ekstraksi warna dengan FCH dilakukan pada ruang warna RGB

untuk mempermudah pengolahan citra (Vertan & Boujemaa, 2000).

CITRA SUMBER

SEGMENTASI

WARNA

VEKTOR CIRI

WARNA HISTOGRAM

Gambar 11. Ektraksi ciri warna

Langkah pertama yang dilakukan untuk menghitung FCH adalah menghitung histogram awal (Gambar 11). Pada penelitian ini, nilai warna kuantisasi awal tersebut didasarkan pada sebaran warna citra dalam basis data yang memiliki 3 kelas citra dengan jenis dan warna yang bervariasi. Untuk


(49)

22

tiap kelas citra diambil 10 warna piksel yang muncul terbanyak sehingga dihasilkan 300 warna yang tidak sama.

Dari histogram awal dihasilkan jumlah ciri yang terlalu banyak sehingga diperlukan waktu komputasi yang besar untuk ekstraksi ciri sebuah citra. Oleh karena itu perlu dilakukan pengelompokan warna (clustering) dari

300 warna semesta tersebut ke dalam beberapa pusat cluster warna

menggunakan Fuzzy C-Means (FCM). Setiap pusat cluster FCM

merepresentasikan bin FCH. Jumlah bin FCH yang digunakan sebanyak 30. Untuk perhitungan FCH selanjutnya diperlukan matriks derajat keanggotaan, dimana nilai keanggotaannya dapat diperoleh menggunakan fungsi Cauchy, yang dihitung menggunakan persamaan (23).

α

σ

μ

) / ) , ' ( ( 1 1 ) ( ' c c d c c +

= , (23)

dimana

d(c,c) = jarak Euclid antara warna c dengan c’,

c’ = warna pada bin FCH,

c = warna semesta,

α = untuk menentukan kehalusan dari fungsi,

σ = untuk menentukan lebar dari fungsi keanggotaan.

Nilai parameter α=2 dan σ=15 diperoleh dari hasil percobaan

sebelumnya (Balqis, 2006). Perhitungan akhir FCH dengan FCM dinotasikan sebagai berikut (persamaan 24) :

=

μ

μ

c

c

c

h

c

c

h

2

(

'

)

'

(

)

*

(

)

, (24)

dimana :

2

h = fuzzy color histogram,

) (c

h = conventional color histogram,

) (

' c

c


(50)

23

Ekstraksi Ciri Tekstur

Setiap citra mempunyai tekstur yang sebenarnya unik meskipun terkadang secara sepintas terlihat sama. Untuk menentukan ciri tekstur digunakan nilai energi dari beberapa frekuensi sampling pada transformasi Fourier 2D. Proses penentuan vektor ciri tekstur pada citra dengan memanfaatkan energi pada transformasi Fourier (Gambar 12).

CITRA SUMBER

RGB ฀ Gray FFT dengan

fs1 FFT dengan

fs2 FFT dengan

fs3

SORT ENERGI

SORT ENERGI

SORT ENERGI

MERGE VEKTOR CIRI

TEKSTUR

Gambar 12. Ekstraksi ciri tekstur

Penggabungan Ciri Warna dan Tekstur

Penggabungan ciri warna dan tekstur dilakukan dengan menggunakan pembobot tertentu. Nilai pembobot tersebut menyatakan hubungan keterkaitan masing-masing vektor ciri dengan vektor ciri total. Selanjutnya untuk istilah penggabungan ciri warna dan tekstur ini disebut dengan vektor ciri.

Pengukuran Kemiripan Ciri

Vektor yang terbentuk dijadikan acuan untuk melakukan proses pencocokan pola untuk mendapatkan kesamaan ciri. Untuk menyatakan dua region citra sebagai cita yang mirip dilakukan proses perhitungan jarak Euclid antara vektor ciri dari kedua citra region tersebut.

2. Pelabelan Citra

Pelabelan citra disusun berdasarkan topik atau subjek pengetahuan citra. Topik atau subjek pengetahuan citra ditentukan berdasarkan indeks visual yang diperoleh pada saat proses pengindeksan. Tahapan pelabelan dilakukan berdasarkan metode Uschold (Gambar 13).


(51)

24

Gambar 13. Tata Laksana Pelabelan Otomatis Tahapan pelabelan citra terdiri dari (Benjamins et. al., 2004) :

1. Labeling Capture : pengumpulan pengetahuan berupa konsep-konsep citra. Hasil dari tahapan ini adalah kamus kata.

2. Labeling Coding : membangun model dari konsep-konsep yang ada dalam kamus kata. Hasil dari tahapan ini adalah kamus visual citra. 3. Labeling Reuse : Integrasi dari konsep-konsep beserta

komponen-komponennya. Hasil dari tahapan ini adalah visualisasi pelabelan citra. 3. Temu Kembali Citra

Proses temu kembali citra dilakukan melalui penentuan indeks dari

kueri yang berdasarkan teks. Proses retrieval data citra dilakukan sesuai dengan karakteristik citra terlabel dalam basis data (Gambar14).

PENENTUAN INDEKS KUERI TEKS

MASUKAN

RETRIEVAL BERDASARKAN KARAKTERISTIK INDEKS BASIS

DATA CITRA TERLABEL

CITRA HASIL RETRIEVAL KARAKTERISTIK

INDEKS

TEMU KEMBALI CITRA


(52)

25

4. Evaluasi Kinerja Sistem

Evaluasi kinerja sistem dilakukan penilaian tingkat keefektifan proses temu kembali terhadap sejumlah koleksi. Pengujian dilakukan dengan menghitung nilai recall dan precision dari proses temu kembali citra berdasarkan penilaian relevansinya. Penentuan relevansi citra hasil temu kembali dibuat berdasarkan kelas citra di dalam basis data


(53)

IV. PERANCANGAN DAN IMPLEMENTASI SISTEM

Bagian ini menguraikan proses perancangan dan implementasi sistem. Bagian utama bab ini adalah desain data, desain proses sistem serta desain antar muka sistem. Desain data berisi citra sumber dan kamus kata. Desain proses sistem berisi proses segmentasi, proses pelabelan citra, proses temu tembali dan evaluasi sistem temu kembali sedangkan disain antar muka sistem berisi rancangan antar muka sistem.

A. Desain Data

Desain data menggambarkan proses tranformasi data dalam sistem. Dalam penelitian ini data mengalami perubahan dari data citra, menjadi basis data citra, matrik representasi citra, matrik keanggotaan dan data cluster. Desain data lain adalah kumpulan kata-kata (kamus kata) yang berisi aturan-aturan yang sesuai dengan kelas citra.

1. Citra Sumber

Citra sumber penelitian diperoleh dari web ALIPR (http://www.alipr.com). Terlihat dalam Tabel 2, citra sumber yang berhubungan dengan kelas pemandangan, bangunan, alam. Jumlah objek yang terkandung dalam citra dapat berisi 3 (tiga), 4 (empat) atau 5 (lima) objek. Contoh salah satu citra dengan subjek pemandangan memiliki objek citra berupa gunung, rumah, rumput.

Citra sumber digunakan sebagai data pelatihan dan data pengujian. Data pelatihan digunakan sebagai data untuk pembentukan basis data ciri. Basis data ciri menjadi acuan untuk proses penemuan kembali citra pada saat diujikan. Data pengujian digunakan untuk pengujian pelabelan citra, sedangkan untuk pengujian temu kembali citra menggunakan kata-kata dalam kamus kata. Pengujian dengan kamus kata terdiri dari pengujian subjek citra serta objek-objek citra.


(54)

27

2. Kamus Kata

Kamus kata (Tabel 2) berisi kumpulan kata-kata yang memuat aturan-aturan tentang citra. Aturan-aturan tersebut merupakan subjek dan objek citra. Kata-kata dalam kamus kata bersumber dari kosa kata bahasa Indonesia. Kamus kata disusun berdasarkan dua hal, yaitu subjek yang merupakan topik utama citra serta objek yang dimiliki subjek citra. Terdapat beberapa objek citra untuk suatu subjek dalam satu kelas citra sumber memiliki label atau identitas yang sama.

Tabel 2. Kamus Kata Subjek

Citra

Jumlah Citra

Objek yang dimiliki

Pemandangan 100 langit(1), awan(2), rumput(3), pohon(4), matahari(5), gunung(6)

Bangunan 100 rumah(7), jalan(8), batu(9), langit(10) Alam 100 batu(11), air(12), pohon(13),awan(14),

langit(15)

Masing-masing objek pada kamus kata diberikan nomor urut yang menyatakan urutan identitas. Identitas tersebut berupa urutan objek kesatu, kedua, ketiga dan seterusnya. Pemberian id digunakan sebagai penanda objek hasil clustering. Jumlah objek yang didefinisikan untuk kamus kata adalah berjumlah 15 objek.

B. Desain Proses Sistem

Desain proses sistem berisi rancangan proses pelabelan otomatis citra untuk sistem temu kembali citra. Desain proses sistem tersebut berisi tahapan-tahapan proses, yaitu pengindeksan (segmentasi, ekstraksi ciri dan clustering), pelabelan otomatis citra dan evaluasi sistem temu kembali.


(55)

28

1. Segmentasi Citra

Citra sumber disegmentasi menggunakan metode Normalized Cuts

(Shi & Malik, 2000). Metode Normalized Cuts merupakan segmentasi berbasis region yang menghasilkan sub citra. Sub citra tersebut dinamakan dengan region. Dalam penelitian ini digunakan enam region untuk setiap citra sumber. Beberapa citra sumber kemudian di segmentasi sehingga diperoleh region-region yang bersesuaian. Pembentukan region-region ini dimaksudkan untuk mendapatkan objek citra.

Masing-masing region pada citra sumber, kemudian dilakukan pemisahan region dari citra utama. Pemisahan ini dilakukan untuk mempermudah mendapatkan ciri masing-masing region sebagai ciri objek. Pemisahan setiap region dari citra sumber dilakukan melalui pemberian tanda tertentu untuk area tertentu. Tanda yang dimaksud adalah dengan pemberian warna putih untuk area diluar target area yang dimakud.

Ukuran citra yang dihasilkan tetap sesuai dengan citra hasil praproses awal yaitu 50 x 50, tapi untuk area yang dihasilkan dalam pembentukan region ini tidak memiliki format ukuran yang standar.

2. Ektraksi Ciri

Setiap region yang telah dipisahkan, dilakukan perhitungan nilai ciri (Daubechies, 1995). Hasil perhitungan ciri akan diperoleh matrik representasi ciri suatu citra untuk setiap region. Representasi nilai ciri citra pada setiap region kemudian menjadi acuan untuk pembentukan ciri subjek citra.

Pada tahapan ekstraksi ciri warna, setiap piksel pada citra akan direpresentasikan dengan peluang atau frekuensi piksel-piksel tersebut terhadap nilai warna (bin) yang sudah ditentukan sebanyak 30. Bin

tersebut diperoleh dari FCH menggunakan FCM. Bin FCH yang digunakan pada penelitian ini dapat dilihat pada Lampiran 3, sedangkan untuk ekstraksi ciri tekstur, citra region terpilih diektraksi dengan menggunakan wavelet Gabor.


(56)

29

C. Perancangan Proses Sistem

Rancangan proses sistem menggambarkan hubungan antara elemen-elemen (modul) pada sistem yang dikembangkan. Prototipe sistem dan

interface sistem dikembangkan dengan menggunakan perangkat lunak Matlab Versi 7.1. Sistem ini terdiri dari empat modul yaitu : modul segmentasi, modul pelabelan region, modul temu kembali dan modul kinerja (Gambar 15). Keempat modul tersebut digunakan dalam pengerjaan penelitian ini.

Gambar 15 . Arsitektur Sistem Pelabelan Otomatis

1. Modul Segmentasi.

Modul segmentasi berfungsi untuk melakukan segmentasi,

penarikan ciri serta clustering citra sumber. Modul ini bekerja dengan memanfaatkan algoritma Normalized Cuts untuk segmentasi. Penarikan ciri berdasarkan warna dan tekstur serta FCM untuk clustering, hasil akhirnya akan terbentuk region-region pada citra sumber beserta matrik ciri.

Secara umum algoritma segmentasi Normalized Cuts seperti berikut (Shi & Malik, 2000) :

1. Mendefinisikan sekumpulan matrik dari citra yang akan di segmentasi 2. Menentukan bobot graf G=(V,E), lalu menghitung bobot edge dan

menyimpan informasi dalam W dan D.

3. Menghitung

(

DW

)

xDx untuk mendapatkan nilai eigen vektor dengan nilai eigen terkecil.


(57)

30

4. Menggunakan nilai eigen vektor tersebut untuk mempartisi graf menjadi 2 dengan membagi masing-masing titik menjadi NCut yang minimum.

5. Membaca nilai NCut yang dihasilkan, lalu mengulangi partisi ke langkah 2.

6. Jika NCuts untuk setiap segmen > nilai maksimum dari Ncuts yang didefinisikan maka proses dihentikan.

2. Modul Clustering

Modul ini berfungsi untuk mengelompokkan data ciri yang telah tersedia dalam bentuk matrik menjadi kelompok-kelompok berdasarkan kemiripannya. Pengelompokkan data ciri tersebut menggunakan algoritam FCM. Tingkat kemiripan tersebut ditentukan dengan mengukur jarak

euclid point data ke pusat cluster. Hasil dari modul ini adalah berupa matrik U yang merepresentasikan derajat keanggotaan data dan titik pusat cluster. Matrik keanggotaan (U) yang dihasilkan berdimensi k x n, dimana k adalah jumlah cluster dan n adalah jumlah data yang digunakan sebagai masukan. Matrik Keanggotaan hasil clustering terlihat seperti pada tabel 3. Tabel 3. Matrik Keanggotaan (U) Hasil Clustering

Jumlah

Data Cluster 1 Cluster 2 ... Cluster k

1 U11 U12 ... U1k

2 U21 U22 ... U2k

... .... ... ... ...

... ... ... ... ...

n Un1 Un2 ... Unk

Dalam proses pengelompokkan titik pusat cluster yang dihasilkan algoritma FCM akan mengalami perbaikan selama proses iterasi.


(58)

31

3. Modul Pelabelan Citra

Pada suatu citra terdapat lebih dari satu objek, maka perlu dibedakan antara sebuah objek dengan objek lain yang terdapat pada citra tersebut. Proses pelabelan menggunakan teknik rekursi. Mula-mula dideteksi lokasi sebuah titik yang merupakan bagian dari sebuah objek, lalu dengan rekursi dilakukan pengisian dengan suatu nilai (label) terhadap objek tersebut dari lokasi tersebut sampai menemui batas luarnya (menabrak titik latar). Kemudian dilanjutkan mendeteksi lokasi yang merupakan titik objek yang belum terisi oleh proses tadi atau belum diberi label (dengan kata lain merupakan bagian dari objek yang lain). Lakukan pengisian lagi dengan nilai label yang berbeda. Ulangi sampai semua titik dalam citra tersebut diperiksa.

Secara umum algoritma pelabelan citra adalah sebagai berikut : 1. Menentukan titik awal pengisian pada objek yang akan diisi. 2. Menentukan titik tersebut menjadi titik objek

2.1. Memeriksa apakah titik tetangga atasnya adalah titik latar. a. Jika ya maka lakukan hal yang sama untuk titik tersebut. b. Jika tidak maka lanjutkan.

2.2. Memeriksa apakah titik tetangga kanannya adalah titik latar. a. Jika ya maka lakukan hal yang sama untuk titik tersebut. b. Jika tidak maka lanjutkan.

2.3. Memeriksa apakah titik tetangga bawahnya adalah titik latar. a. Jika ya maka lakukan hal yang sama untuk titik tersebut. b. Jika tidak maka lanjutkan.

2.4. Memeriksa apakah titik tetangga kirinya adalah titik latar. a. Jika ya maka lakukan hal yang sama untuk titik tersebut. b. Jika tidak maka lanjutkan.

Algoritma labeling reuse untuk pemetaan id region memanfaatkan data hasil cluster. Id region kemudian dipetakan pada region citra sumber sesuai dengan data kelas yang ada. Algoritma labeling reuse sebagai berikut :


(59)

32

1. Membaca region setiap citra.

2. Memetakan setiap region yang terbaca dengan id region yang bersesuaian

3. Mengulangi langkah 1 dan 2 sampai semua region terbaca.

4. Modul Temu Kembali

Modul temu-kembali membaca dan menghasilkan output dari dan ke memori. Modul ini dikembangkan sebagai representasi hasil akhir sistem. Pada sistem ini dilakukan inputan berupa kueri teks dengan kata kunci masukan dan informasi yang ditampilkan berupa kumpulan citra yang berkaitan beserta derajat keanggotaannya.

5. Modul Evaluasi

Modul evaluasi digunakan untuk mengukur tingkat keefektifan proses temu kembali terhadap sejumlah koleksi pengujian dengan menghitung nilai recall dan precision dari proses temu kembali citra berdasarkan penilaian relevansinya. Penentuan relevansi citra hasil temu kembali dibuat berdasarkan kelas citra di dalam basis data.

6. Modul Representasi Hasil

Modul ini berfungsi untuk mentransformasikan hasil dari proses pencarian dan clustering menjadi bentuk yang lebih ramah pengguna (user friendly), dimana pengguna dapat dengan cepat mengetahui jumlah citra (beserta derajat keanggotaan) yang menjadi anggotanya.

D. Disain Antarmuka

Antarmuka sistem dirancang agar pengguna dapat dengan mudah dan cepat memperoleh informasi yang diinginkan. Antarmuka sistem dirancang sedemikian rupa sehingga dapat mengurangi beban komputer dan membuat pengguna lebih fokus terhadap hasil.


(60)

33

Desain antar muka sistem ini terdiri dari 2 bagian utama, yaitu : antar muka untuk pelabelan otomatis citra (Gambar 16) dan antar muka untuk pencarian citra berdasarkan kata kunci tekstual (Gambar 17).

Gambar 16. Antar Muka Pelabelan Citra

SEARCH

HASIL RETRIEVAL search

CITRA -2 RETRIEVAL

CITRA -3 RETRIEVAL

CITRA -4 RETRIEVAL

CITRA -5 RETRIEVAL

CITRA -6 RETRIEVAL

CITRA -7 RETRIEVAL

CITRA -8 RETRIEVAL

CITRA -9 RETRIEVAL

CITRA -10 RETRIEVAL

CITRA -11 RETRIEVAL

TEM U KEM BALI CI TRA

CITRA -1 RETRIEVAL


(61)

V. HASIL DAN PEMBAHASAN

A. Karakteristik Citra Masukan

Sebanyak 300 citra yang digunakan pada penelitian ini dikelompokkan menjadi 3 subjek : pemandangan (100 citra), bangunan (100 citra), alam (100 citra). Masing-masing subjek terdiri dari 4 sampai dengan 6 objek (Tabel 4). Tabel 4. Subjek, jumlah, serta objek citra sumber

Subjek Citra

Jumlah Citra

Objek

yang terkandung Sumber

Pemandangan 100

langit(1), awan(2), rumput(3), pohon(4), matahari(5),

gunung(6)

Bangunan 100 rumah(7), jalan(8),

batu(9), langit(10)

Alam 100

batu(11), air(12), pohon(13),awan(14), langit(15)

http://www.alipr.com

B. Pengindeksan Citra

1. Segmentasi Warna Citra

Pada tahapan segmentasi ini, setiap citra disegmentasi untuk mengelompokkan warna yang dikandung oleh setiap piksel dari citra ke beberapa segmen (cluster) yang sudah ditentukan jumlahnya, yaitu dua, tiga, empat, dan lima. Cluster ini merupakan representasi warna-warna dominan citra. Tahapan segmentasi ini bertujuan mendapatkan kelompok-kelompok warna dominan dan mengurangi jumlah warna citra asli seperti yang terlihat pada Gambar 18.


(62)

35

Gambar 18. Contoh citra sebelum dan sesudah segmentasi menggunakan algoritma EM.

Selanjutnya dilakukan pemilihan keempat hasil segmentasi tersebut secara manual untuk dijadikan masukan pada tahap ekstraksi warna. Berdasarkan Gambar 18, dapat dilihat bahwa hasil segmentasi keempat adalah hasil segmentasi yang paling baik. Hal ini dikarenakan citra hasil segmentasi tersebut paling mirip dengan citra aslinya. Hasil segmentensi yang sudah terpilih sebagai masukan pada tahap ekstraksi warna untuk seluruh citra di dalam basis data dapat dilihat pada lampiran 1

4 Cluster 3 Cluster 2 Cluster

5 Cluster

2. Format Tekstur Citra

Sedangkan untuk proses ekstraksi ciri tekstur, citra sumber

perubahan format dari format RGB ke format gray scale. Hasilnya


(63)

36

Citra RGB ke Gray

Gambar 19. Contoh citra RGB ke citra gray scale 3. Segmentasi Region

Semua citra sumber di segmentasi untuk menghasilkan

region-region yang bersesuaian dengan objek yang ada dalam citra. Jumlah

region untuk setiap citra masukan ditentukan sebanyak 6 region.

Penentuan enam region ini dilakukan berdasarkan asumsi jumlah

maksimum objek yang terkandung dalam citra.

(a) Citra Sumber

(b) Citra Hasil Segmentasi

Gambar 20. Contoh citra sebelum dan sesudah segmentasi

menggunakan algoritma Normalized Cuts

Selanjutnya citra hasil segmentasi dilakukan pemisahan region.

Pemisahan region dilakukan dengan membaca setiap piksel yang

memiliki nilai batasan (garis putih). Region yang diinginkan disimpan

dalam file dengan format JPG, sedangkan untuk region yang lain

komponen-komponen pikselnya digantikan dengan warna putih. Proses dilakukan berulang untuk region – region yang lain. Gambar 21


(64)

37

merupakan contoh citra sumber yang telah dilakukan pemisahan

region. Pemisahan region digunakan untuk pengenal objek.

Gambar 21. Contoh citra hasil pemisahan citra menjadi 6 region

Hasil pemisahan region citra menjadi masukan untuk tahap

ekstraksi ciri. Seluruh citra hasil segmentasi region dalam basis data dapat dilihat pada Lampiran 2.

4. Ekstraksi Ciri Warna

Pada tahapan ekstraksi ini, setiap piksel citra akan direpresentasikan dengan peluang atau frekuensi piksel-piksel tersebut

terhadap nilai warna (bin) yang sudah ditentukan sebanyak 30. Bin

tersebut diperoleh dari FCH menggunakan FCM. Bin FCH yang

digunakan pada penelitian ini dapat dilihat pada Lampiran 3.


(65)

38

Gambar 23. Hasil FCH dengan FCM 30 bin.

Gambar 21 adalah hasil FCH dengan FCM dari Gambar 20.

Berdasarkan Gambar 21, dapat dilihat bahwa bin 23 yang cenderung

berwarna biru merupakan warna yang paling banyak muncul.

5. Ekstraksi Ciri Tekstur

Ekstraksi ciri dilakukan untuk semua region yang terbentuk. Ciri tekstur yang digunakan adalah ciri energi dimana lebar pita frekuensi ( ) dan jarak angular (S

F

B

θ) sebesar 60°. Pemilihan lebar pita angular sebesar 60° adalah karena nilai ini dianggap mendekati karakteristik sistem visual manusia.


(66)

39

Proses filtering untuk Gambar 24, menggunakan frekuensi

3

2 2

=

F dan orientasi . Hasil filtering terlihat seperti pada Gambar

15.

0

60

=

θ

Gambar 25. Region rumput dengan frekuensi

3

2 2

=

F dan θ=600

6. Penggabungan Ciri Warna dan Tekstur

Penggabungan ciri warna dan tekstur dilakukan dengan

mengubah-ubah nilai pembobot antara masing-masing ciri dan kemudian dibandingkan sehingga diperoleh pembobot ciri optimal yang menyatakan gabungan antara dua ciri dasar yaitu ciri warna dan ciri tekstur. Pengujian dilakukan dengan mengambil beberapa kelompok citra dan mengukur perbedaan ciri dari masing-masing kelompok serta mengukur kesamaan dari masing-masing anggota kelompok (Harsono & Basuki, 2005). Nilai pembobot (a

c,at) yang dicoba adalah ac = 0.7 dan at =0.3. Nilai pembobot

ini dipilih karena berdasarkan penelitian yang dilakukan Harsono dan Basuki (2005) menyatakan bahwa pada nilai bobot tersebut sangat baik untuk penggabungan nilai ciri warna dan tekstur.

Nilai a

t yang diambil selalu lebih kecil dari ac, karena ciri tekstur

memang tidak terlalu dominan dalam penentuan ciri citra secara umum. Nilai ciri baru diperoleh dengan rumus :

Ciri baru = 0.7 * Vektor ciri warna + 0.3 * Vektor ciri tekstur

C. Pelabelan Citra 1. Labeling Capture

Proses ini berupa mengumpulkan semua subjek citra. Hasil yang peroleh dari proses ini adalah berupa kumpulan kamus kata (Tabel 4).


(67)

40

2. Labeling Coding

Setelah ciri region diperoleh dan disimpan dalam basisdata,

selanjutnya algoritma clustering dijalankan. Algoritma clustering ini membutuhkan matrik ciri region sebagai data masukan.

Matrik Keanggotaan

Hasil dari proses clustering adalah matrik keanggotaan region

terhadap cluster yang dihasilkan.

Tabel 5. Matrik Keanggotaan Region berdasarkan hasil clustering

Region C1 C2 C3 C4 C5 C6

1 0.881539 0.118309 2.02E-08 5.15E-05 7.25E-07 9.95E-05

2 3.19E-06 2.99E-07 0.921212 5.53E-08 0.078716 6.86E-05

3 1.64E-11 4.08E-09 5E-15 0.999999 5.5E-14 7.91E-13

4 1.67E-13 2.1E-14 0.999999 5E-15 3.06E-10 2.08E-12

5 0.000184 2.53E-06 7.75E-06 1.92E-07 0.068908 0.930898

- - - -

- - - -

- - - -

717 8.57E-11 1.05E-11 0.99999 2.24E-12 2.28E-07 1.16E-09

718 1.27E-05 0.056199 9.48E-10 0.943788 1.34E-08 2.94E-07

719 3.24E-06 3.04E-07 0.91941 5.61E-08 0.080517 6.98E-05

720 0.853729 4.48E-05 8.37E-08 8.15E-07 1.16E-05 0.146214

Hasil clustering menunjukkan subjek bangunan memiliki jumlah tertinggi pada cluster ke-2, sedangkan pemandangan terbanyak pada cluster ke-1 dan subjek alam terbanyak pada cluster ke-4.

Total Clus te r pe r Subje k

0 10 20 30 40 50 60 70 80

1 2 3 4 5 6

Clus te r

Tot

a

l Pemandangan

Bangunan Alam


(68)

41

Visualisasi Pelabelan

Nilai maksimum setiap cluster pada setiap citra menyatakan bahwa nilai region ini lebih mendekati cluster yang terbentuk hasil clustering. Selanjutnya nilai keanggotaan maksimun ini dipetakan secara visual terhadap citra hasil segmentasi. Gambar 27, menunjukkan visualisasi salah satu citra yang memiliki nilai keanggotaan region.

Gambar 27. Citra contoh labeling coding

Penggabungan Region

Nilai region dengan nilai 0.16107 dan 0.16739, berdasarkan hasil

clustering kemudian dikelompokkan ke dalam satu kelompok. Begitu juga untuk nilai 0.60864 dan 0.65573 juga dikelompokkan dalam satu kelompok tersendiri. Sedangkan untuk nilai 0.30412 dan 0.47258 dikelompokkan dalam satu kelompok.

Perhitungan nilai ciri baru untuk region dilakukan dengan menghitung nilai rata-rata untuk region-region yang terkelompok dalam satu kelompok.

Gambar 28, menunjukkan visualisasi hasil penggabungan region


(69)

42

Gambar 28. Contoh citra proses penggabungan region

3. Labeling Reuse

Integrasi dari konsep-konsep dalam kamus kata. Informasi yang

diperoleh adalah visualisasi pelabelan otomatis citra.

Gambar 29. Contoh citra hasil pelabelan otomatis

Gambar 29 menunjukkan proses labeling reuse nilai region yang berupa label untuk region yang ada di citra.

Proses pelabelan ini akan digunakan dalam tahapan temu kembali, sedangkan nilai ciri region akan digunakan untuk penghitungan jarak dalam proses temu kembali.


(1)

Sahin PG. 2003. Translating Images to words: A novel approach for object recognition [PhD thesis]. Turkey : The Department Of Computer Engineering, Middle East Technical University.

Schober, Jean-Pierre. Thorsten Hermes, Otthein Herzog.2004. Content-based Image Retrieval by Ontology-based Object Recognition. TZI Center for Computing Technology Universitätsallee. 21-23 28359. Bremen, Germany.

Sebe N, Lew NS, 2000. Robust Computer Vision : Theory and Application. Leiden : Leiden Institue of Advance Computer Science.

Seo N. 2006. Texture Segmentation using Gabor Filters,

http://note.sonots.com/index.php?SciSoftware%2FGaborTextureSegmenta tion.[8 November 2007].

Shi J, Malik J. 2000. Normalized cuts and image segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 22:8:888-905.

Srikanth M, Varner J, Bowden M, Moldovan D. 2005. Exploiting Ontologies for Automatic Image Annotation. ACM. 1595930345/05/0008

Vertan C, Boujemaa N. 2000. Using Fuzzy Histogram and Distance for Color Image Retrieval. http://www-rocq.inria.fr/imedia/Articles/cir2000.pdf [28 September 2007].


(2)

(3)

(4)

Lampiran 3 : Warna kuantisasi untuk 30 bin histogram

Warna R G B

1 64 68 53

2 20 23 16

3 165 174 177

4 49 45 41

5 107 112 95

6 115 137 173

7 84 120 138

8 246 247 246 9 150 141 114 10 166 153 128 11 211 214 213 12 135 155 170 13 241 242 239 14 90 156 218 15 153 128 102 16 251 252 251

17 51 72 35

18 119 125 107 19 190 197 190

20 85 97 96

21 115 128 59 22 106 101 76 23 178 201 224

24 74 76 69

25 64 88 89

26 233 235 231 27 174 188 213 28 150 156 156 29 125 133 132


(5)

VI. SIMPULAN DAN SARAN

A. Simpulan

Berdasarkan penelitian yang telah dilakukan dapat disimpulkan beberapa hal, yaitu :

1. Proses pelabelan otomatis citra menghasilkan pelabelan yang cukup baik. 2. Definisi kata-kata yang merepresentasikan subjek dan objek citra dalam

kamus kata terlihat penggunaannya dalam proses temu kembali.

3. Model pelabelan citra otomatis menggunakan Fuzzy C-means (FCM) dilakukan berdasarkan kata-kata yang terdefinisi dalam kamus kata.

4. Tabel indeks citra dalam penelitian ini disusun berdasarkan proses pelabelam otomatis citra dan digunakan sebagai dasar untuk proses temu kembali.

5. Hasil penelitian menunjukkan bahwa nilai rataan precision untuk hasil temu kembali menggunakan kueri berbasis teks mencapai 86.68%. Ini menunjukkan bahwa proses pencarian citra dalam basis data lebih baik karena pelabelan yang dilakukan berguna sebagai kata kunci pencarian.

B. Saran

Berdasarkan hasil dari penelitian yang dilakukan, dapat dikemukakan beberapa saran yang dapat dipertimbangkan untuk ditindaklanjuti, yaitu:

1. Penelitian ini dapat dikembangkan untuk pembentukan ontologi citra. 2. Berdasarkan penelitian, terdapat beberapa kesalahan klasifikasi yang dapat

menyebabkan hasil temu kembali citra menjadi kurang baik. Oleh karena itu, untuk penelitian selanjutnya dapat digunakan metode relevance feedback dalam temu kembali citra agar hasil temu kembali citra menjadi lebih baik.


(6)

49

3. Penelitian selanjutnya dapat dikembangkan sistem temu kembali citra berdasarkan ciri warna, bentuk, dan tekstur untuk melengkapi hasil temu kembali.

4. Sampai saat ini belum ada teknik segmentasi citra yang dapat melakukan segmentasi dengan baik. Oleh karena itu, disarankan untuk dapat memperbaiki hasil segmentasi sehingga ketidaksesuaian dengan objek yang diinginkan dapat diminimalisasi.