Temu Kembali Citra Segmentasi, Ekstraksi Ciri Citra dan Clustering

II. TINJAUAN PUSTAKA

A. Temu Kembali Citra

Temu kembali citra adalah salah satu metodologi untuk penemuan kembali citra berdasarkan isi content citra. Citra memiliki informasi karakteristik visual berupa warna, bentuk, tekstur, dan karakteristik spasial. Karakteristik visual tersebut diproses melalui ekstraksi ciri, sehingga diperoleh ciri-ciri citra. Hasil ekstraksi ciri tersebut kemudian disusun dalam vektor-vektor ciri multi dimensi. Vektor ciri dari citra disusun sebagai basis data ciri Long et. al., 2003. Gambar 1. Frame work Sistem Temu Kembali Citra Hua et. al., 2008. Alur sistem temu kembali citra pada Gambar 1 diawali dengan masukan dalam bentuk kueri masukan untuk sistem. Citra masukan yang memiliki karakteristik visual berupa warna, bentuk ataupun tekstur selanjutnya diekstraksi sehingga diperoleh data-data ciri dalam bentuk vektor ciri. Citra- citra dalam basis data yang memiliki karakteristik visual citra juga diekstraksi karakteristiknya kemudian disusun dalam vektor-vektor ciri. Kumpulan vektor-vektor ciri disimpan menjadi basis data ciri. Basis data ciri dan vektor ciri dari kueri masukan kemudian dihitung kemiripannya. Proses pengindeksan dilakukan untuk mempermudah proses temu kembali. Hasil temu kembali selanjutnya dapat dilakukan evaluasi melalui relevance feedback, begitu juga untuk kueri masukan, karakteristik visual citra dan vektor ciri yang terbentuk Long et. al., 2003.

B. Segmentasi, Ekstraksi Ciri Citra dan Clustering

Secara umum, segmentasi merupakan langkah awal dalam analisis citra. Segmentasi dilakukan untuk membagi citra ke dalam bagian-bagian yang memiliki kemiripan karakteristik Gonzales Woods, 2002. Normalized Cuts Metode Normalized Cuts menerapkan teori graf untuk membagi citra ke dalam ukuran terbaik. Dalam Gambar 2 citra dalam Normalized Cuts dipandang sebagai suatu graf yang saling berhubungan secara penuh Fully- connected graph . Setiap piksel merupakan node untuk graf. Hubungan menyatakan keterkaitan dalam graf antara pasangan piksel yang dinotasikan dengan p dan q. Masing-masing edge memiliki biaya Shi Malik, 2000. pq C Gambar 2. Citra sebagai suatu graf dalam Normalized Cuts. Proses segmentasi citra berdasarkan graf adalah proses memecah graf- graf menjadi suatu segmen Gambar 3. Proses tersebut dilakukan dengan menghapus semua edge yang memotong di antara segmen citra atau edge-edge yang memiliki biaya terkecil. Semua piksel yang memiliki kemiripan akan digabungkan dalam segmen yang sama Shi Malik, 2000. Gambar 3. Graf Citra setelah di Segmentasi. Proses pemotongan edge dilakukan untuk membuat graf-graf tersebut menjadi tidak terhubung Gambar 4. Nilai biaya pemotongan edge dinyatakan dengan persamaan 1 Shi Malik, 2000 : ∑ ∈ ∈ = B q A p q p C B A Cut , , , 1 Gambar 4. Ilustrasi Pemotongan dalam Normalized Cuts Proses pemotongan graf dilakukan untuk menghasilkan segmen terbesar. Dalam normalized cuts Ncut proses pemotongan ini diperbaiki dengan menormalkan ukuran dari segmen dengan cara menggunaakan persamaan 2 Shi Malik, 2000 : , , , B volume B A Cut A volume B A Cut B A Ncut + = 2 dengan volumeA dan volumeB adalah jumlah biaya untuk semua edge yang ada dalam segmen A dan segmen B. Expectation-Maximization Expectation-Maximization EM adalah salah satu metode optimisasi untuk mencari dugaan parameter maximum likelihood ketika ada data yang hilang atau tidak lengkap. Di dalam algoritma EM, dilakukan perhitungan dugaan kemungkinan untuk mengisi data yang tidak lengkap E-step dan perhitungan dugaan parameter maximum likelihood dengan memaksimalkan dugaan kemungkinan yang diperoleh dari E-step M-step. Nilai parameter yang diperoleh dari M-step digunakan kembali untuk memulai E-step selanjutnya. Proses ini akan berulang hingga mencapai konvergensi nilai likelihood Belongie et. al., 1998. Ekstraksi Ciri Tekstur Tekstur merupakan karakteristik intrinsik dari suatu citra yang terkait dengan tingkat kekasaran roughness, butiran granulation, dan keteraturan regularity susunan struktural piksel. Aspek tekstural dari sebuah citra dapat dimanfaatkan sebagai dasar dari segmentasi, klasifikasi, maupun interpretasi citra Gonzales Woods, 2002. Tekstur dicirikan sebagai distribusi dari derajat keabuan piksel-piksel yang bertetangga. Tekstur tidak dapat didefinisikan hanya melalui sebuah piksel, tapi harus dalam sekumpulan piksel. Resolusi citra yang diamati dapat ditentukan oleh tekstur citra tersebut. Apabila resolusi atau skala meningkat, tekstur yang diamati akan berubah dari tekstur halus fine menjadi tekstur kasar coarse Gonzales Woods, 2002. Tekstur dapat didefinisikan sebagai fungsi dari variasi spasial intensitas piksel nilai keabuan dalam citra. Berdasarkan strukturnya, tekstur dapat diklasifikasikan dalam dua golongan : 1. Makrostruktur Tekstur makrostruktur memiliki perulangan pola lokal secara periodik pada suatu daerah citra, biasanya terdapat pada pola-pola buatan manusia dan cenderung mudah untuk direpresentasikan secara matematis. 2. Mikrostruktur Pada tekstur mikrostruktur, pola-pola lokal dan perulangan tidak terjadi begitu jelas, sehingga tidak mudah untuk memberikan definisi tekstur yang komprehensif. Gambar 5 menunjukkan perbedaan tekstur makrostruktur dan mikrostruktur yang diambil dari album tekstur Brodatz Brodatz, 1966. Gambar 5. Contoh tekstur visual dari Album Tekstur Brodatz. Atas: makrostruktur Bawah: mikrostruktur Transformasi Wavelet Gabor Pendekatan umum dalam melakukan analisa citra adalah penggunaan fungsi Fourier untuk menarik ciri citra sehingga diperoleh distribusi ciri energi global sinyal sebagai fungsi terhadap frekuensi. Ciri global tidak dapat menarik karakteristik sebagian citra. Oleh karena itu diperlukan ciri lokal yang dapat dinyatakan dalam frekuensi lokal. Frekuensi lokal ini menggunakan fungsi wavelet Daubechies, 1995. Wavelet adalah fungsi matematika yang membagi data sinyal ke dalam komponen-komponen frekuensi yang berbeda. Salah satu fungsi wavelet adalah Gabor. Transformasi Wavelet menggunakan pendekatan penyaring multikanal mutichannel filtering, dengan fungsi Gabor sebagai penyaring filter Daubechies, 1995. Filter Gabor Filter Gabor merupakan salah satu filter yang mampu mensimulasikan karakteristik sistem visual manusia dalam mengisolasi frekuensi dan orientasi tertentu citra. Karakteristik ini membuat filter Gabor sesuai untuk aplikasi pengenalan tekstur dalam computer vision Seo, 2006. Secara spasial, sebuah fungsi Gabor merupakan sinusoida yang dimodulasi oleh fungsi Gauss. Respon impuls sebuah filter Gabor kompleks dua dimensi adalah menggunakan persamaan 3 Seo, 2006 : ⎪⎩ ⎪ ⎨ ⎧ ⎪⎭ ⎪ ⎬ ⎫ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + − = 2 2 1 exp 2 1 , 2 2 2 2 jFx y x y x h y x y x π σ σ σ πσ 3 dengan y x dan σ σ merupakan standar deviasi fungsi Gauss x dan y. Dalam domain frekuensi spasial, parameter-parameter filter Gabor dapat digambarkan seperti pada Gambar 6. Gambar 6. Parameter filter Gabor dalam domain frekuensi spasial Ada enam parameter yang harus ditetapkan dalam implementasi filter Gabor Tabel 1. Keenam parameter tersebut adalah: θ σ σ θ B B F F y x dan , , , , , . 1. Frekuensi F dan orientasi θ mendefinisikan lokasi pusat filter. 2. menyatakan konstanta lebar pita frekuensi dan jangkauan angular filter. θ B dan B F 3. Variabel σ x berkaitan dengan respon sebesar -6 dB untuk komponen frekuensi spasial. Nilai variabel σ x dapat dinyatakan dalam persamaan 4. 1 2 2 1 2 2 ln − + = F F B B x F π σ 4 4. Variabel σ y berkaitan dengan respon sebesar -6dB untuk komponen angular. Nilai Variabel σ y dapat dinyatakan dalam persamaan 5. 2 tan 2 2 ln θ π σ B F y = 5 5. Posisi F, θ dan lebar pita σ x , σ y dari filter Gabor dalam domain frekuensi harus ditetapkan dengan cermat agar dapat menangkap informasi tekstural dengan benar. Frekuensi tengah dari filter kanal harus terletak dekat dengan frekuensi karakteristik tekstur. 6. Setelah mendapatkan ciri Gabor maka dapat dilakukan ekstraksi ciri. Salah satu ciri yang dapat dipilih adalah ciri energi, yang didefinisikan dalam persamaan 6. 2 M 1 i N 1 , 1 ∑∑ = = = j n m x MN x e 6 Enam parameter filter Gabor beserta nilainya seperti pada tabel 1. Tabel 1. Enam parameter filter Gabor Parameter Simbol Nilai Frekuensi tengah ternormalisasi F 6 5 4 3 2 1 2 2 , 2 2 , 2 2 2 2 , 2 2 , 2 2 , 2 2 Lebar pita frekuensi B B F 1 oktaf Lebar pita angular B B θ 30 o atau 45 o Spacing frekuensi S F 1 oktaf Spacing angular S θ 30 o atau 45 o Orientasi θ S θ = 30 o : 0 o , 30 o , 60 o , 90 o , 120 o , 150 o S θ = 45 o : 0 o , 45 o , 90 o , 135 o , 180 o , 225 o Algoritma segmentasi tekstur menggunakan wavelet Gabor dilakukan melalui tahapan berikut Seo, 2006 : 1. Mendekomposisi citra masukan menggunakan filter bank, 2. Mengekstraksi ciri, dan 3. Clustering. Alur segmentasi tekstur terlihat seperti pada Gambar 7. Filter Gabor Ekstraksi Ciri Clustering Filter Citra Ciri Citra Citra Segmentasi Citra Sumber Gambar 7. Tahapan Segmentasi Tekstur Seo, 2006 Ektraksi Ciri Warna Setiap piksel mempunyai warna yang dapat dinyatakan dalam Red, Green dan Blue RGB. Nilai RGB ini merupakan gabungan nilai R, nilai G dan nilai B yang tidak bisa dipisahkan satu dengan lainnya. Hal ini dapat dituliskan dengan Pr,g,b. Ekstraksi ciri warna merupakan salah satu cara untuk menentukan arti fisik suatu citra melalui proses pengindeksan warna. Proses ini bisa dilakukan dengan pendekatan histogram warna Belongie et. al., 1998. Histogram warna merupakan representasi peluang keberadaan setiap warna dalam sebuah citra. Banyaknya nilai warna bin ditetapkan sesuai kebutuhan pembuatan histogram. Dengan bin sejumlah n, maka histogram warna untuk citra I yang mengandung N piksel dapat dirumuskan seperti dengan persamaan 7. ] ,..., 2 , 1 [ n h h h I H = ∑ = = N j j i P N i h 1 | 1 , 7 ⎩ ⎨ ⎧ = selainnya ; i - ke bin ke sasi terkuanti j piksel ; 1 | j i P . Histogram warna seperti ini disebut juga conventional color histogram CCH Han Ma, 2002. Clustering Proses Clustering adalah proses pengelompokan data ke dalam cluster berdasarkan parameter tertentu sehingga objek-objek dalam sebuah cluster memiliki tingkat kemiripan yang tinggi satu sama lain dan sangat tidak mirip dengan obyek lain pada cluster yang berbeda Kantardzic, 2001. Pada clustering tidak diperlukan kelas yang telah didefinisikan sebelumnya atau kelas hasil training, sehingga clustering dapat dinyatakan sebagai bentuk pembelajaran berdasarkan observasi dan bukan berdasarkan contoh Jiawei et. al., 2001. Proses clustering dilakukan sebagai tahapan terakhir dari segmentasi warna dan tekstur dari vektor-vektor ciri. Cluster ing secara umum memiliki tahapan sebagai berikut Jain et. al., 1999 : 1. Representasi pola 2. Pengukuran kedekatan pola Pattern Proximity 3. Clustering 4. Abstraksi data jika dibutuhkan 5. Penilaian output jika dibutuhkan. Jarak Euclidean Kedekatan pola diukur berdasarkan fungsi jarak antara dua ciri. Jarak digunakan untuk mengukur ketidakmiripan antara dua obyek data. Bila p dan q menyatakan piksel dengan koodinat x,y dan s,t maka jarak euclidean antara p dan q adalah seperti persamaan 8 Gonzales Woods, 1992. 2 2 , t y s x q p D E − + − = 8

C. Fuzzy C-Means FCM