Implementasi Content Based Image Retrieval Menggunakan Speeded-Up Robust Features (SURF)
6
BAB 2
LANDASAN TEORI
2.1 Citra
Citra atau image adalah suatu matriks dimana indeks baris dan kolomnya
menyatakan suatu titik pada citra tersebut dan elemen matriksnya (yang disebut
sebagai elemen gambar / pixel) menyatakan tingkat keabuan pada titik tersebut
(Sutoyo & Mulyanto, 2009).
Suatu citra dapat didefinisikan sebagai fungsi f(x, y) berukuran M baris dan N
kolom, dengan x dan y adalah koordinat spasial dan amplitudo f di titik koordinat (x,
y) dinamakan intensitas atau tingkat keabuan dari citra pada titik tersebut. Gambar
2.1 menunjukan posisi koordinat citra digital (Putra, 2010).
Koordinat asal
1
2
.
M-1
1 2
. . . . .
N–1
y
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f(x, y)
x
Sebuah Pixel
Gambar 2.1. Koordinat Citra Digital (Putra, 2010).
2.2. Jenis-jenis Citra Digital
Ada tiga jenis citra yang umum digunakan dalam pemrosesan citra, antara lain:
1. Citra Berwarna / Red, Green, Blue (RGB). Merupakan jenis citra yang
menyajikan warna dalam bentuk komponen R (merah), G (hijau), B (biru). Setiap
Universitas Sumatera Utara
7
komponen warna menggunakan delapan bit (nilainya berkisar antara 0 sampai
dengan 255). (Kadir & Susanto, 2013). Contoh gambar citra RGB dapat dilihat
pada Gambar 2.2.
Gambar 2.2. Contoh gambar citra RGB
2. Citra Berskala Keabuan (Grayscale) merupakan citra digital yang hanya memiliki
satu nilai kanal pada setiap pixelnya. Nilai tersebut digunakan untuk
menunjukkan tingkat intensitas. Warna yang dimiliki adalah warna dari hitam,
keabuan, dan putih. Tingkatan keabuan di sini merupakan warna abu dengan
berbagai tingkatan dari hitam hingga mendekati putih. Citra Grayscale memiliki
kedalaman warna 8 bit (256 kombinasi warna keabuan) (Putra, 2010).
Dalam hal ini, intensitas berkisar antara 0 sampai dengan 255. Nilai 0
menyatakan hitam dan nilai 255 menyatakan putih (Kadir & Susanto, 2013)
Contoh dari citra Grayscale dapat dilihat pada Gambar 2.3.
Gambar 2.3. Contoh gambar citra Grayscale
Universitas Sumatera Utara
8
3. Citra Biner. Citra dengan setiap piksel hanya dinyatakan dengan sebuah nilai dari
dua kemungkinan (yaitu nilai 0 dan 1). Nilai 0 menyatakan hitam dan nilai 1
menyatakan putih (Kadir & Susanto, 2013).
Contoh dari citra biner dapat dilihat pada Gambar 2.4.
Gambar 2.4. Contoh gambar citra biner
2.3. Format File Citra
Format file citra standar yang digunakan saat ini terdiri dari beberapa jenis. Formatformat ini sering digunakan dalam menyimpan citra pada sebuah file. Setiap format
file citra memiliki karakteristik masing-masing (Putra, 2010).
2.3.1 Citra Bitmap
Citra bitmap menyimpan data kode citra secara digital dan lengkap (cara
penyimpanannya per piksel). Citra bitmap dipresentasikan dalam bentuk matriks atau
dipetakan dengan menggunakan bilangan biner atau sistem bilangan lain (Sutoyo &
Mulyanto, 2009).
2.4. Pengolahan Citra
Pengolahan citra adalah proses pengolahan gambar untuk membuat kualitas yang
lebih baik. Pengolahan ini biasanya dilakukan dengan menggunakan media
elektronik seperti komputer. Pengolahan citra bertujuan memperbaiki kualitas
gambar dilihat dari aspek radiometrik (peningkatan kontras, transformasi warna,
Universitas Sumatera Utara
9
restorasi citra) dan dari aspek geometrik (rotasi, translasi, skala, transformasi
geometrik), melakukan proses penarikan informasi atau deskripsi objek atau
pengenalan objek yang terkandung pada citra dan melakukan kompresi atau reduksi
data untuk tujuan penyimpanan data, transmisi data, dan waktu proses data. (Kadir &
Susanto, 2013)
2.5. Segmentasi Citra
Segmentasi citra merupakan proses yang ditujukan untuk mendapatkan objek-objek
yang terkandung di dalam citra ke dalam beberapa daerah dengan setiap objek atau
daerah memiliki kemiripan atribut. Segmentasi juga biasa dilakukan sebagai langkah
awal untuk melaksanakan klasifikasi objek. Setelah segmentasi citra dilaksanakan,
fitur yang terdapat pada objek diambil. Sebagai contoh, fitur objek dapat berupa
perbandingan lebar dan panjang objek, warna rata-rata objek, maupun tekstur pada
objek. (Kadir & Susanto, 2013).
2.6. Representasi Bentuk
Fitur suatu objek merupakan karakteristik yang melekat pada objek. Fitur bentuk
merupakan suatu fitur yang diperoleh melalui bentuk objek dan dapat dinyatakan
melalui kontur, area dan transformasi. Fitur bentuk biasa digunakan sebagai salah
satu fitur pada kepentingan identifikasi objek. (Kadir, dkk., 2011)
2.7. Ekstraksi Fitur
Bentuk menurut D.G. Kendall (Stegmann dan Gomez, 2002) adalah informasi
geometris yang tetap ketika efek lokasi, skala, pemutaran dilakukan terhadap sebuah
objek. Deskriptor adalah seperangkat parameter yang mewakili karakteristik tertentu
objek, yang dapat digunakan untuk menyatakan fitur objek. Adapun fitur dinyatakan
dengan susunan bilangan yang dapat dipakai untuk mengidentifikasi suatu objek.
Fitur suatu objek mempunyai peran penting untuk berbagai aplikasi seperti pencarian
citra, penyederhanaan bentuk, pengenalan dan klasifikasi objek.
Universitas Sumatera Utara
10
2.7.1 Fitur Tekstur
Selain melibatkan fitur bentuk, tekstur banyak digunakan sebagai fitur untuk temu
kembali citra. Hal ini disebabkan beberapa objek mempunyai pola-pola tertentu,
yang bagi manusia mudah untuk dibedakan. Dalam praktik, tekstur digunakan untuk
berbagai kepentingun.
Umumnya, aplikasi tekstur dapat dibagi menjadi dua kategori. Pertama
adalah untuk kepentingan segmentasi. Pada proses ini, tekstur dipakai untuk
melakukan pemisahan antara satu objek dengan objek lain. Kedua adalah untuk
klasifikasi tekstur sebagai klasifikasi objek. Tekstur adalah hubungan mutual antara
nilai intensitas piksel-piksel yang bertetangga yang berulang di suatu area yang lebih
luas daripada jarak hubungan tersebut (Tuceryan & Jain, 1998).
2.8. Information Retrieval
Definisi information retrieval (IR) adalah bagaimana menemukan suatu dokumen
dari dokumen-dokumen tidak terstruktur yang memberikan informasi yang
dibutuhkan dari koleksi dokumen yang sangat besar yang tersimpan dalam komputer.
(Manning, 2008).
Tujuan dari sistem IR ini adalah memenuhi kebutuhan informasi pengguna
dengan mendapatkan semua dokumen yang relevan dengan kebutuhan pengguna dan
pada waktu yang sama mendapatkan sedikit mungkin dokumen yang tak relevan
(Pardede, 2013). Berdasarkan konten dokumen yang dicari, information retrieval
terbagi atas 4 bagian, yaitu text retrieval, image retrieval, video retrieval dan audio
retrieval.
2.8.1. Image Retrieval
Image Retrieval adalah sistem pencarian informasi berbasis konten gambar ataupun
berformat citra. Teknik image retrieval yang pertama, yaitu tekstual, merupakan
teknik yang sangat sederhana, yaitu berdasarkan kata kunci yang diberikan untuk tiap
citra. Permasalahan dengan teknik ini adalah lamanya waktu pencarian dan adanya
ketergantungan terhadap manusia yang sangat tinggi untuk mendeskripsikan suatu
citra. Hal ini menyebabkan terjadinya pendeskripsian yang tidak konsisten. Teknik
Universitas Sumatera Utara
11
image retrieval yang kedua, berdasarkan isi, adalah teknik yang mengindekskan
suatu citra berdasarkan isinya seperti warna, sisi, bentuk, tekstur, informasi spasial,
features dan sebagainya. Teknik ini sering disebut dengan Content Based Image
Retrieval (CBIR). (Utami, 2011).
2.9. Content Based Image Retrieval (CBIR)
Temu kembali citra atau istilah yang lebih spesifik lagi disebut content based image
retrieval (CBIR), merupakan proses untuk mendapatkan sejumlah citra berdasarkan
masukan satu citra. Istilah tersebut dikemukakan pertama kali oleh Kato pada tahun
1992 (Zhang, 2002). Image retrieval atau image querying adalah aplikasi pengolahan
citra yang dapat membantu pengguna mengambil atau mencari dengan cepat suatu
citra pada suatu database citra berdasarkan query atau permintaan pengguna. (Putra,
2010).
Pada CBIR, ciri-ciri visual citra dalam basis data diekstraksi dan kemudian
dideskripsikan sebagai vektor ciri multidimensional. Vektor yang diperoleh dari citra
query akan dibandingkan kesamaannya dengan nilai vektor yang terdapat dalam
basis data
(Devireddy, 2009). Tahap awal dalam sistem pemanggilan citra
berdasarkan konten adalah melakukan proses ekstraksi dan deskripsi pada citra
dalam database sehingga menghasilkan vektor fitur. Setelah itu dilakukan proses
ekstraksi dan deskripsi pada citra query yang dimasukkan oleh user Kemudian
dilakukan Similarity Comparison antara citra query dengan citra dalam database.
Jarak kesamaan antara citra query dengan citra dalam database akan diurutkan dan
di tampilkan sebagai output (Long, et al. 2003).
Gambar 2.5. Diagram Sistem Content Based Image Retrieval (Long, et al. 2003)
Universitas Sumatera Utara
12
2.10. Algoritma Speeded-Up Robust Features (SURF)
Algoritma SURF (Bay H., dkk, 2006) bertujuan untuk mendeteksi fitur lokal suatu
citra dengan handal dan cepat. Algoritma ini sebagian terinspirasi oleh algoritma
SIFT (Scale-invariant feature transform), terutama pada tahap scale space
representation (Lowe DG, 1999).
SURF merupakan sebuah algoritma yang cepat dan akurat untuk proses mendeteksi
descriptor lokal pada citra. Descriptor adalah sebuah ciri-ciri dari suatu citra
berdasarkan aturan tertentu dari suatu algoritma. Algoritma SURF dikembangkan
oleh Herbert bay dkk pada tahun 2006. Secara umum, algoritma
SURF terdiri dari 3 bagian utama yaitu :
1. Detector Interest Point / KeyPoint
Image yang dimasukkan akan diubah menjadi integral image dengan persamaan :
∑
≤
,
= ∑
=
≤
∑
,
=
.............................
Setelah diperoleh integral image maka komputasi dilakukan dengan menggunakan
persamaan Fast-Hessian Detector :
�
�, � = [
�
�, �
�, �
�
�
�, �
].........................
�, �
Di dalam algoritma SURF, digunakan turunan kedua Gaussian dalam pembuatan
determinan dari Hessian sehingga diperoleh Hessian Matrix yang baru, hal ini
dilakukan menggunakan persamaan :
�
�
= � �
− .9� . . . . . . . . . . . . . . . . . . . . . . . . .
Universitas Sumatera Utara
13
2. Pembuatan SURF Descriptor.
Langkah selanjutnya adalah menghitung nilai dari semua interest/keypoint yang telah
dilakukan pada tahap pertama.
Metode Haar Wavelet digunakan pada tahap ini untuk memperoleh nilai dimenso
dari vektor, menggunakan persamaan :
� =
∑
,∑
,
∑|
|,
∑|
| ......................
3. Setelah dipilih citra yang akan dicari, dan proses SURF detector & descriptor
telah berhasil memperoleh fitur dari seluruh citra koleksi, maka dilakukan proses
image matching / similiarity comparison. Dicari dan ditampilkan citra yang memiliki
kemiripan fitur dengan citra yang dicari dengan cara melakukan perhitungan jarak
antara dua citra.
2.11. Perhitungan Jarak Antara Dua Citra
Jarak merupakan pendekatan yang umum dipakai untuk mewujudkan pencarian citra.
Fungsinya adalah untuk menentukan kesamaan atau ketidaksamaan dua vektor fitur.
Tingkat kesamaan dinyatakan dengan suatu skor atau ranking. Semakin kecil nilai
ranking, semakin dekat kesamaan kedua vektor tersebut. Contoh metode untuk
mengukur jarak antara dua citra adalah dengan Euclidean Distance. Untuk
mempercepat proses, fitur untuk semua citra referensi dapat dihitung terlebih dahulu
melalui suatu skrip dan kemudian disimpan di dalam suatu database. Dengan
demikian, pembandingan fitur dilakukan secara langsung, tanpa perlu menyiapkan
perolehan fitur.
2.11.1. Euclidean Distance
Metode yang paling sering digunakan untuk menghitung kesamaan dua vektor salah
satunya adalah Euclidean Distance.
Universitas Sumatera Utara
14
Adapun persamaan metode ini adalah sebagai berikut :
,
= √∑
−
=
...................................
Keterangan :
A
: Vektor A
B
: Vektor B
d(A,B)
: Jarak Euclidean antara vektor A dan vektor B.
n
: Jumlah elemen vektor
j
: Indeks elemen vektor
H
: Elemen vektor
2.12. Efektifitas Information Retrieval System
Lancaster (1980) menyatakan efektivitas dari suatu sistem temu kembali informasi
adalah kemampuan dari sistem itu untuk memangil berbagai dokumen dari suatu
basis data sesuai dengan permintaan pengguna. Ada dua parameter dasar yang
digunakan dalam mengukur kemampuan suatu sistem temu kembali informasi yaitu
rasio atau perbandingan dari perolehan (recall) dan ketepatan (precision).
Ukuran efetivitas pencarian pada dokumen yang ditampilkan oleh sistem
temu balik dapat ditentukan oleh precision dan recall. Precision adalah rasio jumlah
dokumen relevan yang ditemukan dengan total jumlah yang ditemukan oleh aplikasi.
Precision mengindikasikan kualitas himpunan jawaban, tetapi tidak memandang total
jumlah dokumen yang relevan dalam kumpulan dokumen.
�
� � =
=
|{�
|{�
�
�
}∩{
|{
|{
�
}∩{
}|
}|
}|
}|
...........
...............
Universitas Sumatera Utara
15
Keterangan :
Precision
: Nilai Precision atau nilai ketepatan
Recall
: Nilai Recall atau nilai rasio perbandingan dari perolehan
Relevan Documents
: Jumlah dokumen yang relevan
Documents Retrieved : Jumlah dokumen yang sesuai dan ditemukan kembali
2.13. Penelitian Sebelumnya
Tabel 2.1 Penelitian Sebelumnya Terkait CBIR dan SURF
No
1
Nama
Setiawan, A. E.
Judul
Hasil Penelitian
Perbandingan Content
Proses temu kembali
Based Image Retrieval
menggunakan fitur tekstur
dengan fitur warna
diekstraksi dengan metode Grey
menggunakan metode
Level Co-Occurrence Matrices
Colour Histogram dan
lebih cepat dibandingkan proses
fitur tekstur
temu kembali menggunakan
menggunakan metode
fitur warna yang diekstraksi
Grey Level Co-
dengan metode Colour
Occurrence matrices
Histogram
Pengenalan gambar
Pengenalan Gambar
2
Tania, K.D.
Menggunakan
Sebagian Data Gambar
menggunakan sebagian
data gambar sebagai data query
gambar dengan metode SURF
menghasilkan tingkat
pengenalan 90%.
Ekstraksi Titik - Titik
Fitur Pada Citra
3
Ulum, M. F.
Menggunakan
Menggunakan
Speeded-Up Robust
Features (SURF)
Image yang bisa diuji coba pada
algoritma SURF adalah image
yang
berformat
grayscale
sedangkan untuk
image
warna
tidak
bisa
dilakukan. Dan dari beberapa
hasil uji coba ternyata setiap
Universitas Sumatera Utara
16
rotasi image mempunya titik –
titik berbeda dengan image yang
lainnya
Jumlah
piksel
berbeda-beda
4
Utami, A. S.
dalam
sesuai
citra
dengan
Perancangan Perangkat
ukuran citra, sehingga perlu
Lunak Sistem Temu
proses normalisasi agar invarian
Balik Citra
terhadap ukuran citra. Hasil
Menggunakan Jarak
temu-balik
diranking
Histogram Dengan
disimpan
dalam
Model Warna YIQ
berdasarkan nilai jarak antar
dan
indeks
citra untuk mempercepat proses
pencarian.
Universitas Sumatera Utara
BAB 2
LANDASAN TEORI
2.1 Citra
Citra atau image adalah suatu matriks dimana indeks baris dan kolomnya
menyatakan suatu titik pada citra tersebut dan elemen matriksnya (yang disebut
sebagai elemen gambar / pixel) menyatakan tingkat keabuan pada titik tersebut
(Sutoyo & Mulyanto, 2009).
Suatu citra dapat didefinisikan sebagai fungsi f(x, y) berukuran M baris dan N
kolom, dengan x dan y adalah koordinat spasial dan amplitudo f di titik koordinat (x,
y) dinamakan intensitas atau tingkat keabuan dari citra pada titik tersebut. Gambar
2.1 menunjukan posisi koordinat citra digital (Putra, 2010).
Koordinat asal
1
2
.
M-1
1 2
. . . . .
N–1
y
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
f(x, y)
x
Sebuah Pixel
Gambar 2.1. Koordinat Citra Digital (Putra, 2010).
2.2. Jenis-jenis Citra Digital
Ada tiga jenis citra yang umum digunakan dalam pemrosesan citra, antara lain:
1. Citra Berwarna / Red, Green, Blue (RGB). Merupakan jenis citra yang
menyajikan warna dalam bentuk komponen R (merah), G (hijau), B (biru). Setiap
Universitas Sumatera Utara
7
komponen warna menggunakan delapan bit (nilainya berkisar antara 0 sampai
dengan 255). (Kadir & Susanto, 2013). Contoh gambar citra RGB dapat dilihat
pada Gambar 2.2.
Gambar 2.2. Contoh gambar citra RGB
2. Citra Berskala Keabuan (Grayscale) merupakan citra digital yang hanya memiliki
satu nilai kanal pada setiap pixelnya. Nilai tersebut digunakan untuk
menunjukkan tingkat intensitas. Warna yang dimiliki adalah warna dari hitam,
keabuan, dan putih. Tingkatan keabuan di sini merupakan warna abu dengan
berbagai tingkatan dari hitam hingga mendekati putih. Citra Grayscale memiliki
kedalaman warna 8 bit (256 kombinasi warna keabuan) (Putra, 2010).
Dalam hal ini, intensitas berkisar antara 0 sampai dengan 255. Nilai 0
menyatakan hitam dan nilai 255 menyatakan putih (Kadir & Susanto, 2013)
Contoh dari citra Grayscale dapat dilihat pada Gambar 2.3.
Gambar 2.3. Contoh gambar citra Grayscale
Universitas Sumatera Utara
8
3. Citra Biner. Citra dengan setiap piksel hanya dinyatakan dengan sebuah nilai dari
dua kemungkinan (yaitu nilai 0 dan 1). Nilai 0 menyatakan hitam dan nilai 1
menyatakan putih (Kadir & Susanto, 2013).
Contoh dari citra biner dapat dilihat pada Gambar 2.4.
Gambar 2.4. Contoh gambar citra biner
2.3. Format File Citra
Format file citra standar yang digunakan saat ini terdiri dari beberapa jenis. Formatformat ini sering digunakan dalam menyimpan citra pada sebuah file. Setiap format
file citra memiliki karakteristik masing-masing (Putra, 2010).
2.3.1 Citra Bitmap
Citra bitmap menyimpan data kode citra secara digital dan lengkap (cara
penyimpanannya per piksel). Citra bitmap dipresentasikan dalam bentuk matriks atau
dipetakan dengan menggunakan bilangan biner atau sistem bilangan lain (Sutoyo &
Mulyanto, 2009).
2.4. Pengolahan Citra
Pengolahan citra adalah proses pengolahan gambar untuk membuat kualitas yang
lebih baik. Pengolahan ini biasanya dilakukan dengan menggunakan media
elektronik seperti komputer. Pengolahan citra bertujuan memperbaiki kualitas
gambar dilihat dari aspek radiometrik (peningkatan kontras, transformasi warna,
Universitas Sumatera Utara
9
restorasi citra) dan dari aspek geometrik (rotasi, translasi, skala, transformasi
geometrik), melakukan proses penarikan informasi atau deskripsi objek atau
pengenalan objek yang terkandung pada citra dan melakukan kompresi atau reduksi
data untuk tujuan penyimpanan data, transmisi data, dan waktu proses data. (Kadir &
Susanto, 2013)
2.5. Segmentasi Citra
Segmentasi citra merupakan proses yang ditujukan untuk mendapatkan objek-objek
yang terkandung di dalam citra ke dalam beberapa daerah dengan setiap objek atau
daerah memiliki kemiripan atribut. Segmentasi juga biasa dilakukan sebagai langkah
awal untuk melaksanakan klasifikasi objek. Setelah segmentasi citra dilaksanakan,
fitur yang terdapat pada objek diambil. Sebagai contoh, fitur objek dapat berupa
perbandingan lebar dan panjang objek, warna rata-rata objek, maupun tekstur pada
objek. (Kadir & Susanto, 2013).
2.6. Representasi Bentuk
Fitur suatu objek merupakan karakteristik yang melekat pada objek. Fitur bentuk
merupakan suatu fitur yang diperoleh melalui bentuk objek dan dapat dinyatakan
melalui kontur, area dan transformasi. Fitur bentuk biasa digunakan sebagai salah
satu fitur pada kepentingan identifikasi objek. (Kadir, dkk., 2011)
2.7. Ekstraksi Fitur
Bentuk menurut D.G. Kendall (Stegmann dan Gomez, 2002) adalah informasi
geometris yang tetap ketika efek lokasi, skala, pemutaran dilakukan terhadap sebuah
objek. Deskriptor adalah seperangkat parameter yang mewakili karakteristik tertentu
objek, yang dapat digunakan untuk menyatakan fitur objek. Adapun fitur dinyatakan
dengan susunan bilangan yang dapat dipakai untuk mengidentifikasi suatu objek.
Fitur suatu objek mempunyai peran penting untuk berbagai aplikasi seperti pencarian
citra, penyederhanaan bentuk, pengenalan dan klasifikasi objek.
Universitas Sumatera Utara
10
2.7.1 Fitur Tekstur
Selain melibatkan fitur bentuk, tekstur banyak digunakan sebagai fitur untuk temu
kembali citra. Hal ini disebabkan beberapa objek mempunyai pola-pola tertentu,
yang bagi manusia mudah untuk dibedakan. Dalam praktik, tekstur digunakan untuk
berbagai kepentingun.
Umumnya, aplikasi tekstur dapat dibagi menjadi dua kategori. Pertama
adalah untuk kepentingan segmentasi. Pada proses ini, tekstur dipakai untuk
melakukan pemisahan antara satu objek dengan objek lain. Kedua adalah untuk
klasifikasi tekstur sebagai klasifikasi objek. Tekstur adalah hubungan mutual antara
nilai intensitas piksel-piksel yang bertetangga yang berulang di suatu area yang lebih
luas daripada jarak hubungan tersebut (Tuceryan & Jain, 1998).
2.8. Information Retrieval
Definisi information retrieval (IR) adalah bagaimana menemukan suatu dokumen
dari dokumen-dokumen tidak terstruktur yang memberikan informasi yang
dibutuhkan dari koleksi dokumen yang sangat besar yang tersimpan dalam komputer.
(Manning, 2008).
Tujuan dari sistem IR ini adalah memenuhi kebutuhan informasi pengguna
dengan mendapatkan semua dokumen yang relevan dengan kebutuhan pengguna dan
pada waktu yang sama mendapatkan sedikit mungkin dokumen yang tak relevan
(Pardede, 2013). Berdasarkan konten dokumen yang dicari, information retrieval
terbagi atas 4 bagian, yaitu text retrieval, image retrieval, video retrieval dan audio
retrieval.
2.8.1. Image Retrieval
Image Retrieval adalah sistem pencarian informasi berbasis konten gambar ataupun
berformat citra. Teknik image retrieval yang pertama, yaitu tekstual, merupakan
teknik yang sangat sederhana, yaitu berdasarkan kata kunci yang diberikan untuk tiap
citra. Permasalahan dengan teknik ini adalah lamanya waktu pencarian dan adanya
ketergantungan terhadap manusia yang sangat tinggi untuk mendeskripsikan suatu
citra. Hal ini menyebabkan terjadinya pendeskripsian yang tidak konsisten. Teknik
Universitas Sumatera Utara
11
image retrieval yang kedua, berdasarkan isi, adalah teknik yang mengindekskan
suatu citra berdasarkan isinya seperti warna, sisi, bentuk, tekstur, informasi spasial,
features dan sebagainya. Teknik ini sering disebut dengan Content Based Image
Retrieval (CBIR). (Utami, 2011).
2.9. Content Based Image Retrieval (CBIR)
Temu kembali citra atau istilah yang lebih spesifik lagi disebut content based image
retrieval (CBIR), merupakan proses untuk mendapatkan sejumlah citra berdasarkan
masukan satu citra. Istilah tersebut dikemukakan pertama kali oleh Kato pada tahun
1992 (Zhang, 2002). Image retrieval atau image querying adalah aplikasi pengolahan
citra yang dapat membantu pengguna mengambil atau mencari dengan cepat suatu
citra pada suatu database citra berdasarkan query atau permintaan pengguna. (Putra,
2010).
Pada CBIR, ciri-ciri visual citra dalam basis data diekstraksi dan kemudian
dideskripsikan sebagai vektor ciri multidimensional. Vektor yang diperoleh dari citra
query akan dibandingkan kesamaannya dengan nilai vektor yang terdapat dalam
basis data
(Devireddy, 2009). Tahap awal dalam sistem pemanggilan citra
berdasarkan konten adalah melakukan proses ekstraksi dan deskripsi pada citra
dalam database sehingga menghasilkan vektor fitur. Setelah itu dilakukan proses
ekstraksi dan deskripsi pada citra query yang dimasukkan oleh user Kemudian
dilakukan Similarity Comparison antara citra query dengan citra dalam database.
Jarak kesamaan antara citra query dengan citra dalam database akan diurutkan dan
di tampilkan sebagai output (Long, et al. 2003).
Gambar 2.5. Diagram Sistem Content Based Image Retrieval (Long, et al. 2003)
Universitas Sumatera Utara
12
2.10. Algoritma Speeded-Up Robust Features (SURF)
Algoritma SURF (Bay H., dkk, 2006) bertujuan untuk mendeteksi fitur lokal suatu
citra dengan handal dan cepat. Algoritma ini sebagian terinspirasi oleh algoritma
SIFT (Scale-invariant feature transform), terutama pada tahap scale space
representation (Lowe DG, 1999).
SURF merupakan sebuah algoritma yang cepat dan akurat untuk proses mendeteksi
descriptor lokal pada citra. Descriptor adalah sebuah ciri-ciri dari suatu citra
berdasarkan aturan tertentu dari suatu algoritma. Algoritma SURF dikembangkan
oleh Herbert bay dkk pada tahun 2006. Secara umum, algoritma
SURF terdiri dari 3 bagian utama yaitu :
1. Detector Interest Point / KeyPoint
Image yang dimasukkan akan diubah menjadi integral image dengan persamaan :
∑
≤
,
= ∑
=
≤
∑
,
=
.............................
Setelah diperoleh integral image maka komputasi dilakukan dengan menggunakan
persamaan Fast-Hessian Detector :
�
�, � = [
�
�, �
�, �
�
�
�, �
].........................
�, �
Di dalam algoritma SURF, digunakan turunan kedua Gaussian dalam pembuatan
determinan dari Hessian sehingga diperoleh Hessian Matrix yang baru, hal ini
dilakukan menggunakan persamaan :
�
�
= � �
− .9� . . . . . . . . . . . . . . . . . . . . . . . . .
Universitas Sumatera Utara
13
2. Pembuatan SURF Descriptor.
Langkah selanjutnya adalah menghitung nilai dari semua interest/keypoint yang telah
dilakukan pada tahap pertama.
Metode Haar Wavelet digunakan pada tahap ini untuk memperoleh nilai dimenso
dari vektor, menggunakan persamaan :
� =
∑
,∑
,
∑|
|,
∑|
| ......................
3. Setelah dipilih citra yang akan dicari, dan proses SURF detector & descriptor
telah berhasil memperoleh fitur dari seluruh citra koleksi, maka dilakukan proses
image matching / similiarity comparison. Dicari dan ditampilkan citra yang memiliki
kemiripan fitur dengan citra yang dicari dengan cara melakukan perhitungan jarak
antara dua citra.
2.11. Perhitungan Jarak Antara Dua Citra
Jarak merupakan pendekatan yang umum dipakai untuk mewujudkan pencarian citra.
Fungsinya adalah untuk menentukan kesamaan atau ketidaksamaan dua vektor fitur.
Tingkat kesamaan dinyatakan dengan suatu skor atau ranking. Semakin kecil nilai
ranking, semakin dekat kesamaan kedua vektor tersebut. Contoh metode untuk
mengukur jarak antara dua citra adalah dengan Euclidean Distance. Untuk
mempercepat proses, fitur untuk semua citra referensi dapat dihitung terlebih dahulu
melalui suatu skrip dan kemudian disimpan di dalam suatu database. Dengan
demikian, pembandingan fitur dilakukan secara langsung, tanpa perlu menyiapkan
perolehan fitur.
2.11.1. Euclidean Distance
Metode yang paling sering digunakan untuk menghitung kesamaan dua vektor salah
satunya adalah Euclidean Distance.
Universitas Sumatera Utara
14
Adapun persamaan metode ini adalah sebagai berikut :
,
= √∑
−
=
...................................
Keterangan :
A
: Vektor A
B
: Vektor B
d(A,B)
: Jarak Euclidean antara vektor A dan vektor B.
n
: Jumlah elemen vektor
j
: Indeks elemen vektor
H
: Elemen vektor
2.12. Efektifitas Information Retrieval System
Lancaster (1980) menyatakan efektivitas dari suatu sistem temu kembali informasi
adalah kemampuan dari sistem itu untuk memangil berbagai dokumen dari suatu
basis data sesuai dengan permintaan pengguna. Ada dua parameter dasar yang
digunakan dalam mengukur kemampuan suatu sistem temu kembali informasi yaitu
rasio atau perbandingan dari perolehan (recall) dan ketepatan (precision).
Ukuran efetivitas pencarian pada dokumen yang ditampilkan oleh sistem
temu balik dapat ditentukan oleh precision dan recall. Precision adalah rasio jumlah
dokumen relevan yang ditemukan dengan total jumlah yang ditemukan oleh aplikasi.
Precision mengindikasikan kualitas himpunan jawaban, tetapi tidak memandang total
jumlah dokumen yang relevan dalam kumpulan dokumen.
�
� � =
=
|{�
|{�
�
�
}∩{
|{
|{
�
}∩{
}|
}|
}|
}|
...........
...............
Universitas Sumatera Utara
15
Keterangan :
Precision
: Nilai Precision atau nilai ketepatan
Recall
: Nilai Recall atau nilai rasio perbandingan dari perolehan
Relevan Documents
: Jumlah dokumen yang relevan
Documents Retrieved : Jumlah dokumen yang sesuai dan ditemukan kembali
2.13. Penelitian Sebelumnya
Tabel 2.1 Penelitian Sebelumnya Terkait CBIR dan SURF
No
1
Nama
Setiawan, A. E.
Judul
Hasil Penelitian
Perbandingan Content
Proses temu kembali
Based Image Retrieval
menggunakan fitur tekstur
dengan fitur warna
diekstraksi dengan metode Grey
menggunakan metode
Level Co-Occurrence Matrices
Colour Histogram dan
lebih cepat dibandingkan proses
fitur tekstur
temu kembali menggunakan
menggunakan metode
fitur warna yang diekstraksi
Grey Level Co-
dengan metode Colour
Occurrence matrices
Histogram
Pengenalan gambar
Pengenalan Gambar
2
Tania, K.D.
Menggunakan
Sebagian Data Gambar
menggunakan sebagian
data gambar sebagai data query
gambar dengan metode SURF
menghasilkan tingkat
pengenalan 90%.
Ekstraksi Titik - Titik
Fitur Pada Citra
3
Ulum, M. F.
Menggunakan
Menggunakan
Speeded-Up Robust
Features (SURF)
Image yang bisa diuji coba pada
algoritma SURF adalah image
yang
berformat
grayscale
sedangkan untuk
image
warna
tidak
bisa
dilakukan. Dan dari beberapa
hasil uji coba ternyata setiap
Universitas Sumatera Utara
16
rotasi image mempunya titik –
titik berbeda dengan image yang
lainnya
Jumlah
piksel
berbeda-beda
4
Utami, A. S.
dalam
sesuai
citra
dengan
Perancangan Perangkat
ukuran citra, sehingga perlu
Lunak Sistem Temu
proses normalisasi agar invarian
Balik Citra
terhadap ukuran citra. Hasil
Menggunakan Jarak
temu-balik
diranking
Histogram Dengan
disimpan
dalam
Model Warna YIQ
berdasarkan nilai jarak antar
dan
indeks
citra untuk mempercepat proses
pencarian.
Universitas Sumatera Utara