Metode Support Vector Machine untuk Klasifikasi pada Sistem Temu Kembali Citra

METODE SUPPORT VECTOR MACHINE
UNTUK KLASIFIKASI PADA SISTEM TEMU KEMBALI CITRA

VITA YULIA NOORNIAWATI
G64103034

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

METODE SUPPORT VECTOR MACHINE
UNTUK KLASIFIKASI PADA SISTEM TEMU KEMBALI CITRA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh:
VITA YULIA NOORNIAWATI

G64103034

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

ABSTRAK

VITA YULIA NOORNIAWATI. Metode Support Vector Machine untuk Klasifikasi pada Sistem
Temu Kembali Citra. Dibimbing oleh YENI HERDIYENI dan AGUS BUONO.
Citra memiliki bentuk, tekstur dan warna yang sangat beragam. Hal ini menyebabkan sulitnya
dilakukan pencarian citra. Klasifikasi citra merupakan salah satu tahap yang paling penting pada
temu kembali berbasis citra. Penelitian ini mengimplementasikan metode Support Vector Machine
(SVM) dengan algoritma optimisasi Sequential Minimal Optimization (SMO) untuk tahap
klasifikasi pada sistem temu kembali citra berdasarkan ciri warna. Penelitian juga membandingkan
kinerja SVM dengan pendekatan jarak Euclidean pada sistem temu kembali citra.
Data yang digunakan diambil dari basis data Caltech dan www.flowers.vg sebanyak 300 citra
untuk berbagai macam objek. Format citra adalah JPEG berukuran 50×50 piksel. Seluruh citra di
dalam basis data disegmentasi menggunakan algoritma Expectation-Maximization (EM) dan

diekstraksi menggunakan metode Fuzzy Color Histogram (FCH) untuk membentuk indeks warna
citra di dalam basis data. Kemudian indeks warna citra ini dilatih menggunakan algoritma
optimisasi SMO untuk membentuk model klasifikasi SVM. Model klasifikasi ini digunakan untuk
mengklasifikasikan citra. Dari hasil klasifikasi, diambil citra di dalam basis data yang memiliki
kelas yang sama dengan citra kueri dan citra dari kelas lain yang memiliki tingkat kemiripan yang
tinggi dengan citra kueri sebagai citra hasil temu kembali.
Evaluasi terhadap hasil temu kembali dilakukan menggunakan rataan precision untuk setiap
tingkat recall. Berdasarkan penelitian ini, temu kembali citra menggunakan metode klasifikasi
SVM memiliki hasil temu kembali dengan rataan precision mencapai 76.76%, sedangkan pada
temu kembali citra yang hanya berdasarkan jarak Euclidean antar citra memiliki rataan precision
50.91%.
Kata Kunci: content-based image retrieval, expectation-maximization, fuzzy color histogram,
support vector machine, sequential minimal optimization.

Judul
Nama
NRP

: Metode Support Vector Machine untuk Klasifikasi pada Sistem Temu
Kembali Citra

: Vita Yulia Noorniawati
: G64103034

Menyetujui:
Pembimbing I

Yeni Herdiyeni, S.Si., M.Kom.
NIP 132 282 665

Pembimbing II

Ir. Agus Buono, M.Si., M.Kom.
NIP 132 045 532

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131 473 999


Tanggal Lulus:

RIWAYAT HIDUP
Penulis dilahirkan di Sukoharjo pada tanggal 7 Juli 1984 dari ayah Sutarno dan ibu
Sudarmi. Penulis merupakan putri keempat dari empat bersaudara. Tahun 2003 penulis lulus dari
SMU Negeri 6 Surakarta dan pada tahun yang sama diterima sebagai mahasiswa Departemen Ilmu
Komputer IPB melalui jalur USMI (Undangan Seleksi Masuk IPB). Penulis memilih Program
Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan
Alam. Pada bulan Juli sampai Agustus 2006, penulis melakukan Praktik Kerja Lapangan di The
Southeast Asian Regional Centre For Tropical Biology Seameo Biotrop.

PRAKATA
Alhamdulillahirabbil ‘alamin, puji syukur penulis panjatkan kepada Allah Subhanahu wa
ta’ala atas segala curahan rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan skripsi
metode Support Vector Machine untuk klasifikasi pada sistem temu kembali citra ini. Shalawat
serta salam juga penulis sampaikan kepada junjungan kita Nabi Muhammad Shalallahu ‘alaihi
wasallam beserta seluruh keluarga, sahabat dan umatnya hingga akhir zaman.
Penulis mengucapkan terima kasih kepada Ibu Yeni Herdiyeni, S.Si., M.Kom. dan Bapak Ir.
Agus Buono, M.Si., M.Kom. selaku pembimbing I dan pembimbing II yang telah banyak memberi

saran, masukan dan ide-ide kepada penulis serta semangat untuk selalu berusaha yang terbaik.
Penulis juga mengucapkan terima kasih kepada Bapak Irman Hermadi, S.Kom., M.S. selaku
penguji yang telah memberi saran dan masukan. Selanjutnya, penulis ingin mengucapkan terima
kasih kepada:
1 Ibu, Bapak, Mas Heru, Mbak Danik, Mas Yelly, dan Mas Rudhy, serta seluruh saudara di Solo
yang senantiasa memberikan dukungan, doa dan kasih sayang. Untuk Bapak semoga cepat
sembuh dan kembali ceria seperti dulu.
2 Fadlul Fadkur Rahman atas semuanya yang tidak bisa dijabarkan, tak lupa juga Nia ucapkan
selamat atas kelulusannya, dan semoga tetap semangat dan ceria dalam menjalani hari-hari
kerjanya di tanah rantau.
3 Yulia atas kerjasamanya dalam menyelesaikan tugas akhir ini, karena tanpa hasil
segmentasimu, mungkin aku masih menjadi mahasiswi sejati.
4 Citha, Ghibta, Nacha dan rekan-rekan di Laboratorium Computational Intelligence (CI) atas
semangat kekeluargaan serta bantuannya dalam menyelesaikan penelitian ini.
5 Meynar, Nanik, Dina dan penghuni wisma RZ lainnya yang telah banyak membantu dan
memotivasi penulis melalui kebersamaan dan dukungan untuk terus berusaha yang terbaik.
6 Departemen Ilmu Komputer, dosen dan staf yang telah banyak membantu penulis pada masa
perkuliahan dan penelitian.
7 Ratih, Yayan, Sofi, Aristi, dan seluruh rekan Ilkomerz 40 yang banyak membantu penulis baik
secara teknis maupun non-teknis pada masa perkuliahan hingga akhir penyusunan makalah

skripsi ini.
Penulis menyadari bahwa masih banyak kekurangan dalam penelitian ini. Oleh karena itu,
penulis sangat mengharapkan kritik dan saran untuk perbaikan di masa mendatang. Penulis
berharap hasil dari penelitian ini dapat bermanfaat dan dapat menjadi acuan bagi penelitian
berikutnya.

Bogor, Agustus 2007

Vita Yulia Noorniawati

DAFTAR ISI
Halaman
DAFTAR TABEL .............................................................................................................................. .vi
DAFTAR GAMBAR .......................................................................................................................... vi
DAFTAR LAMPIRAN ....................................................................................................................... vi
PENDAHULUAN ................................................................................................................................ 1
Latar Belakang ................................................................................................................................ 1
Tujuan.......... .................................................................................................................................... 1
Ruang Lingkup ................................................................................................................................ 1
TINJAUAN PUSTAKA....................................................................................................................... 1

Content-Based Image Retrieval ...................................................................................................... 1
Expectation-Maximization .............................................................................................................. 1
Ektraksi Ciri Warna ......................................................................................................................... 1
Fuzzy Color Histogram ................................................................................................................... 2
Fuzzy C-Means ................................................................................................................................ 2
Fungsi Cauchy ................................................................................................................................. 2
K-Fold Cross Validation ................................................................................................................. 2
Support Vector Machine ................................................................................................................. 3
Sequential Minimal Optimization ................................................................................................... 4
Recall dan Precision........................................................................................................................ 5
METODE PENELITIAN ..................................................................................................................... 5
Data Penelitian ................................................................................................................................ 5
Segmentasi Warna dengan EM ....................................................................................................... 5
Ekstraksi Ciri Warna dengan FCH ................................................................................................. 6
Data Latih dan Data Uji ................................................................................................................. 6
Pelatihan dengan SVM .................................................................................................................... 6
Pengujian dengan SVM................................................................................................................... 6
Hasil Temu Kembali ....................................................................................................................... 7
Evaluasi Hasil Temu Kembali ........................................................................................................ 7
Perangkat Lunak dan Perangkat Keras yang Digunakan ............................................................... 7

HASIL DAN PEMBAHASAN............................................................................................................ 7
Segmentasi Citra.............................................................................................................................. 7
Ekstraksi ciri warna ......................................................................................................................... 8
Data Uji dan Data Latih .................................................................................................................. 8
Klasifikasi...... .................................................................................................................................. 8
Hasil Temu Kembali ....................................................................................................................... 9
Evaluasi Hasil Temu Kembali ...................................................................................................... 10
KESIMPULAN DAN SARAN.......................................................................................................... 11
Kesimpulan..... ............................................................................................................................... 11
Saran ........................ ..................................................................................................................... 11
DAFTAR PUSTAKA ........................................................................................................................ 11
LAMPIRAN ....................................................................................................................................... 13

DAFTAR TABEL
Halaman
1 Rataan akurasi hasil proses pengujian untuk setiap pasangan C dan σ............................................ 8
2 Hasil proses pengujian dengan C = 26 dan σ = 2-1 ............................................................................ 9
3 Nilai rataan precision hasil temu kembali citra .............................................................................. 11

DAFTAR GAMBAR

Halaman
1 Data terpisah secara linier. .............................................................................................................. 3
r
2 Fungsi Φ( x ) memetakan data ke ruang vektor berdimensi lebih tinggi........................................ 3
4 Contoh citra sebelum dan sesudah segmentasi menggunakan algoritma EM. .............................. 7
5 Gambar wajah.................................................................................................................................. 8
6 Hasil FCH dengan FCM 25 bin. ..................................................................................................... 8
7 Contoh hasil temu kembali tanpa menggunakan SVM. ................................................................. 9
8 Contoh hasil temu kembali menggunakan SVM. ........................................................................... 9
9 Contoh hasil temu kembali citra menggunakan SVM.................................................................. 10
10 Grafik rataan precision hasil temu kembali citra menggunakan SVM dan tanpa
menggunakan SVM……………………………….………......………………………………………….............11

DAFTAR LAMPIRAN
Halaman
1 Seluruh citra dalam basis data setelah melalui proses segmentasi................................................. 14
2 Warna kuantisasi untuk 25 bin histogram ...................................................................................... 17
3 Hasil klasifikasi SVM ..................................................................................................................... 18
4 Citra kueri yang diujicobakan pada proses temu kembali citra ..................................................... 21
5 Contoh hasil temu kembali citra berdasarkan ciri warna menggunakan SVM............................. 22

6 Nilai recall-precision hasil temu kembali citra menggunakan SVM untuk setiap citra kueri……26
7 Nilai recall-precision hasil temu kembali citra tanpa menggunakan SVM untuk setiap citra
kueri............................................................................................................................................ ................ .27

1

PENDAHULUAN
Latar Belakang
Seiring dengan banyaknya aplikasi
multimedia dan perkembangan internet,
jumlah citra pun meningkat secara tajam. Para
pengguna sangat mudah untuk mengakses
ratusan bahkan ribuan citra, akan tetapi
seringkali tidak mudah mendapatkan citracitra yang sesuai dengan yang dibutuhkan
pengguna.
Oleh
karena
itu,
perlu
dikembangkan metode pencarian citra untuk

mempermudah pencarian data. Pencarian citra
dapat dilakukan berdasarkan isi citra atau
sering disebut Content-Based Image Retrieval
(CBIR). CBIR ini mencari citra dengan
mencocokkan isinya yang berupa tekstur,
bentuk, atau warna. Salah satu metode
pencarian citra yang banyak dikembangkan
adalah berdasarkan warna citra.
Pada sistem temu kembali citra yang
hanya berdasarkan jarak Euclidean antar citra,
citra yang ditemukembalikan adalah citra di
dalam basis data yang mempunyai tingkat
kemiripan yang tinggi dengan citra kueri.
Banyak
kemungkinan
citra
yang
ditemukembalikan adalah citra yang bukan
dari jenisnya sendiri. Hal ini dapat
menyebabkan tingkat keefektifan hasil temu
kembali citra menjadi kurang baik. Oleh
karena itu, diperlukan sebuah model
klasifikasi untuk memperbaiki tingkat
keefektifan hasil temu kembali citra. Model
klasifikasi tersebut dapat dibangun melalui
proses pelatihan, dan digunakan untuk
mengklasifikasikan
citra.
Citra
yang
ditemukembalikan pada sistem temu kembali
menggunakan model klasifikasi adalah citra
hasil klasifikasi di dalam basis data yang
terdapat dalam kelas citra yang sama dengan
citra kueri dan citra dari kelas lain yang
memiliki tingkat kemiripan yang tinggi
dengan citra kueri.
Platt (1998) telah menggunakan algoritma
Sequential Minimal Optimization (SMO)
untuk proses pelatihan dalam metode Support
Vector Machine (SVM) dengan waktu
komputasi yang lebih cepat. Zhang et al.
(2001) telah menggunakan metode SVM
untuk klasifikasi pada sistem temu kembali
citra berdasarkan ciri warna. Berdasarkan
hasil penelitian Gosselin dan Cord (2004),
metode SVM memberikan hasil klasifikasi
yang lebih baik dibandingkan dengan metode
klasifikasi Bayes dan k-Nearest Neighbors
(kNN). Oleh karena itu, pada penelitian ini

dikembangkan sebuah sistem temu kembali
citra berdasarkan ciri warna menggunakan
metode klasifikasi SVM dengan algoritma
optimisasi SMO.
Tujuan Penelitian
Tujuan
penelitian
ini
adalah
mengimplementasikan dan menganalisis
kinerja metode SVM dengan algoritma
optimisasi SMO dalam tahap klasifikasi citra
dan pada sistem temu kembali citra
berdasarkan ciri warna.
Ruang Lingkup
Ruang lingkup penelitian ini difokuskan
pada metode klasifikasi menggunakan SVM.
TINJAUAN PUSTAKA
Content-Based Image Retrieval
Content-Based Image Retrieval (CBIR)
merupakan suatu pendekatan untuk masalah
temu kembali citra yang didasarkan pada ciri
yang terkandung di dalam citra seperti warna,
bentuk atau tekstur dari citra (Han & Ma
2002).
Expectation-Maximization
Expectation-Maximization (EM) adalah
salah satu metode optimisasi untuk mencari
dugaan parameter maximum likelihood ketika
ada data yang hilang atau tidak lengkap. Di
dalam algoritma EM, dilakukan perhitungan
dugaan kemungkinan untuk mengisi data yang
tidak lengkap (E-step) dan perhitungan
dugaan parameter maximum likelihood dengan
memaksimalkan dugaan kemungkinan yang
diperoleh dari E-step (M-step). Nilai
parameter yang diperoleh dari M-step
digunakan kembali untuk memulai E-step
selanjutnya. Proses ini akan berulang hingga
mencapai konvergensi nilai likelihood
(Belongie et al. 1998).
Ektraksi Ciri Warna
Ekstraksi ciri warna merupakan salah satu
bagian dari CBIR untuk menentukan arti fisik
suatu citra melalui proses pengindeksan
warna. Proses ini bisa dilakukan dengan
pendekatan histogram warna (Belongie et al.
1998).
Histogram warna merupakan representasi
peluang keberadaan setiap warna dalam
sebuah citra. Banyaknya nilai warna (bin)
ditetapkan sesuai kebutuhan pembuatan
histogram. Dengan bin sejumlah n, maka
histogram warna untuk citra I yang

2

mengandung N piksel dapat dirumuskan
seperti H ( I ) = [ h1 , h2 ,..., hn ] dengan

i =1,2,...,c.

1

u ik =

⎛ x −u
⎜ k
i


j =1 ⎜ x − u
j
⎝ k
c

hi =

1 N
∑ P ,
N j =1 i| j

⎧1; piksel j terkuantisasi ke bin ke - i
.
Pi| j = ⎨
⎩0; selainnya
Histogram warna seperti ini disebut juga
conventional color histogram (CCH) (Han &
Ma 2002).
Fuzzy Color Histogram
Fuzzy Color Histogram (FCH) adalah
salah satu metode yang merepresentasikan
informasi warna dalam citra digital ke dalam
bentuk histogram. Di dalam FCH, setiap
warna direpresentasikan dengan himpunan
fuzzy (fuzzy set). Hubungan antar warna
dimodelkan dengan fungsi keanggotaan
(membership function) terhadap fuzzy set.
Fuzzy set F pada ruang ciri Rn didefinisikan
oleh ηF : Rn → [0,1] yang biasa disebut
membership function. Untuk tiap vektor ciri
n
f ∈ ℜ , nilai dari η F ( f ) disebut derajat
keanggotaan dari f terhadap fuzzy set F
(derajat keanggotaan F). Nilai dari η F ( f )
yang mendekati 1 lebih representatif terhadap
vektor ciri f dan terhadap fuzzy set f (Zhang R
& Zhang Z 2004).
Fuzzy C-Means
Fuzzy C-Means (FCM) adalah suatu teknik
pengelompokan data (clustering) tanpa proses
pelatihan
(unsupervised
learning).
Algoritma FCM adalah sebagai berikut (Han
& Ma 2002):
1

Masukkan jumlah cluster c, konstanta
pembobot m, dan toleransi nilai error e.

2

Inisialisasi

pusat

cluster

ui

untuk

1≤ i ≤ c.

3

Data input X = {x1 , x 2 ,..., x n }.

4

Menghitung c pusat cluster {u i(l ) } dengan
n

v

(l )
i

=

∑ (u
k =1

∑ (u
k =1

5

ik

) m xk
ik

, untuk 1 ≤ i ≤ c .

)m

Perbaharui nilai keanggotaan U (l ) dengan

6

Jika U

(l )

−U

2

2
A
2
A

(l −1)

k = 1,2,...,n.

⎞ m −1




> e maka l = l + 1

dan kembali ke tahap 4. Jika tidak maka
berhenti.
Hasil FCM adalah sejumlah pusat cluster
dengan derajat keanggotaan setiap titik data
terhadap cluster tersebut yang digambarkan
sebagai matrik U = [u ik ] n×n' .
Fungsi Cauchy

Beberapa fungsi keanggotaan adalah
fungsi Cauchy, Cone, dan Trapezoidal.
Berdasarkan hasil penelitian Zhang R dan
Zhang Z (2004), fungsi Cauchy lebih baik
daripada fungsi keanggotaan yang lain. Fungsi
n
Cauchy C : R → [0,1] didefinisikan sebagai
berikut:
r
v ∈ R,
1
r
C(x) =
, d , α ∈ R,
α,
r r
1+ x − v / d
d > 0, α ≥ 0

(

)

r
v adalah titik tengah dari lokasi fuzzy set, d

merepresentasikan lebar dari fungsi dan α
merepresentasikan
tingkat
fuzziness
(kekaburan).
K-Fold Cross Validation

K-Fold Cross Validation dilakukan untuk
membagi data pelatihan dan data pengujian.
K-Fold Cross Validation membagi data
contoh secara acak ke dalam K subset yang
saling bebas. Satu subset sebagai data
pengujian dan K-1 subset sebagai data
pelatihan. Proses cross-validation akan
diulang sampai K kali (Fu 1994).
Pada metode tersebut, data awal dibagi
menjadi k subset yang saling bebas secara
acak, yaitu S1,S2,…,Sk, dengan ukuran setiap
subset kira-kira sama. Pelatihan dan pengujian
dilakukan sebanyak k kali. Pada proses ke-i,
subset Si diperlakukan sebagai data pengujian
dan subset lainnya diperlakukan sebagai data
pelatihan. Pada proses pertama S2,...,Sk
menjadi data pelatihan dan S1 menjadi data
pengujian, pada proses kedua S1,S3,...,Sk
menjadi data pelatihan dan S2 menjadi data
pengujian, dan seterusnya.

3

l

Support Vector Machine

Support Vector Machine (SVM) adalah
salah satu teknik klasifikasi data dengan
proses pelatihan (supervised learning). Salah
satu ciri dari metode klasifikasi SVM adalah
menemukan garis pemisah (hyperplane)
terbaik sehingga diperoleh ukuran margin
yang maksimal. Titik yang terdekat dengan
hyperplane disebut support vector. Margin
adalah dua kali jarak antara hyperplane
dengan support vector. Ilustrasi SVM untuk
data yang terpisahkan secara linier dapat
dilihat pada Gambar 1.

dengan 0 ≤ α i ≤ C , (i = 1,2,..., l ) , ∑ α y = 0 , dan
i i
i =1

αi adalah lagrange multiplier. Data yang
berkorelasi dengan α i yang positif disebut
sebagai support vector. Support vector inilah
yang akan digunakan untuk menghitung bobot
NSV
w = ∑ αi yi xi dan bias b = w. xi − yi untuk
i =1

i=1,2,...,NSV. Selanjutnya, kelas dari data
input x dapat ditentukan dengan persamaan
(1).

Hyperplane optimal
Ciri 1
Class 1 y=1

Support

Class 2 y=-1

t

w

margin

Gambar 2 Fungsi Φ ( xr ) memetakan data ke
ruang vektor berdimensi lebih
tinggi.

w x-b 1

w.x-b=0
w.x-b 1

Ciri 2

Gambar 1 Data terpisah secara linier.
Diberikan data latih (x1, y1), (x2, y2),...,(xn, yn ) ,
di mana x ∈ ℜn, y ∈{+1−
, 1} . Jika data terpisah
secara linier seperti pada Gambar 1, maka
akan berlaku fungsi diskriminan linier:
(1)
u = w.x − b ,
dengan
w = vektor bobot yang tegak lurus terhadap
hyperplane,
x = data yang diklasifikasi,
b = bias.
Hyperplane adalah garis u=0. Margin antara
dua kelas adalah m = 2 . Margin dapat
w 2

dimaksimalkan
menggunakan
optimisasi Lagrangian seperti

fungsi
berikut:

Jika data terpisah secara tidak linier, SVM
dimodifikasi dengan memasukkan fungsi
r
Φ ( x ) . Dalam SVM yang tidak linier, pertamatama data dipetakan oleh fungsi Φ( xr ) ke
ruang vektor baru yang berdimensi lebih
tinggi, seperti pada Gambar 2. Selanjutnya di
ruang vektor yang baru itu, SVM mencari
hyperplane yang memisahkan kedua kelas
secara linier. Pencarian ini hanya bergantung
pada dot product dari data yang sudah
dipetakan pada ruang baru yang berdimensi
lebih tinggi, yaitu Φ (xr i ).Φ xr j . Karena
r
umumnya transformasi Φ( x ) ini tidak
diketahui dan sangat sulit untuk dipahami,
maka perhitungan dot product dapat
digantikan dengan fungsi Kernel yang
dirumuskan sebagai berikut:

( )

r r
r
r
K ( x i , x j ) = Φ ( x i ). Φ ( x j ),

1 r2 l
r
r r
L(w, b, α ) = w − ∑ αi yi xi , w + b − 1
i =1
2

sehingga persamaan (3) menjadi seperti
berikut:

Dengan

l
1 l l
r r
L = ∑ α i − ∑ ∑ α i α j y i y j K ( xi .x j )
i =1
2 i =1j =1

( ((

∂L

memperhatikan

l
= w − ∑ αi yi xi = 0
i=1
∂w

dan

) )) (2).

sifat

gradien:

∂L

l
= ∑ αi yi = 0 ,
∂b i=1

persamaan (2) dapat dimodifikasi sebagai
maksimalisasi L yang hanya mengandung αi,
sebagaimana persamaan (3).
l
1 l l
r r
L = ∑ α i − ∑ ∑ α i α j yi y j ( xi .x j ) (3)
i=1
2 i=1j =1

(4)

dan persamaan (1) menjadi seperti berikut:

(

)

NSV
r r
u = ∑ α i y i K xi , x − b
i =1

(5),

NSV adalah data pelatihan yang termasuk
support vector. Fungsi Kernel yang sering

4

- Ambil α yang memberikan nilai |E1-E2|
terbesar sebagai α2. E1 dan E2
merupakan error cache untuk α1 dan α2 .

digunakan untuk SVM adalah fungsi Kernel
Gaussian RBF (Mak 2000):

⎛ r r 2⎞
⎜ xi − x j ⎟
r r
K ( xi , x j ) = exp⎜ −
⎟.
2






- Jika dua data identik, maka buang α2 ini
dan ke tahap 4. Selainnya, hitung nilai L
dan H untuk α2 :
⎧⎪max (0,α 2 − α1), jika y1 = y2
L=⎨
⎪⎩max (0,α 2 + α1 − C ), jika y1 ≠ y2

Sequential Minimal Optimization

Sequential Minimal Optimization (SMO)
adalah algoritma untuk proses pelatihan SVM
yang dapat memberikan solusi pada masalah
optimisasi. Pada dasarnya penggunaan SVM
hanya terbatas pada masalah yang kecil
karena algoritma pelatihan SVM cenderung
lambat,
kompleks,
dan
sulit
untuk
diimplementasikan.
Berdasarkan
hasil
penelitian sebelumnya, algoritma SMO lebih
sederhana, lebih mudah diimplementasikan,
dan lebih cepat waktu komputasinya daripada
algoritma Chunking (Platt 1998 ).

⎧⎪min (C, C + α2 − α1), jika y1 = y2 .
H =⎨
⎪⎩min (C,α2 + α1), jika y1 ≠ y2

- Jika L=H, maka perkembangan
optimisasi tidak dapat dibuat, buang α2
ini dan ke tahap 4. Selainnya, hitung
nilai η :
r

4

- Jika α1 diperoleh maka ke tahap 3.

- Cari α2 dari data yang tidak terdapat
pada batas.

r

- Lakukan iterasi pada data yang tidak
terdapat pada batas sampai diperoleh α2
yang dapat membuat perkembangan
optimisasi di tahap 3.

- Jika α2 tidak diperoleh setelah dua iterasi
tersebut, maka lewati nilai α1 yang
diperoleh dan kembali ke tahap 2 untuk
mencari α1 baru yang melanggar sifat
gradien.

- Jika iterasi pada seluruh data latih
selesai, maka lakukan iterasi pada data
yang tidak terdapat pada batas.

3

r

- Jika tidak diperoleh, maka lakukan
iterasi pada seluruh data latih sampai
diperoleh α2 yang dapat membuat
perkembangan optimisasi di tahap 3.

- Lakukan iterasi pada seluruh data latih,
cari α1 yang melanggar sifat gradien.

- Lakukan iterasi pada seluruh data latih
dan pada data yang tidak terdapat pada
batas secara bergantian untuk mencari
α1 yang melanggar sifat gradien sampai
seluruh α memenuhi sifat gradien.

r

- Jika α baru − α lama lebih kecil dari nilai
2
2
perubahan terkecil α ( ε ), maka buang
nilai α2 ini dan ke tahap 4. Selainnya ke
tahap 5.

- Inisialisasi nilai lagrange multiplier
α dan bias b.
2

r

- Jika nilai η negatif, maka hitung nilai
α2 yang baru. Selainnya, hitung fungsi
objektif pada titik L dan H dan gunakan
nilai α2 yang memberikan fungsi objektif
paling tinggi sebagai nilai α2 yang baru.

Algoritma SMO adalah sebagai berikut
(Platt 1998):
- Masukkan data latih (x1, y1), (x2, y2),...,(xn, yn) ,
nilai parameter SMO C, dan nilai
parameter kernel σ .

r

η = 2 K ( x1 , x 2 ) − K ( x1 , x1 ) − K ( x 2 , x 2 ) .

SMO memilih menyelesaikan masalah
optimisasi pada persamaan (4) seminimal
mungkin untuk setiap tahapnya. Pada setiap
tahap, SMO memilih dua lagrange multipliers
αi untuk dioptimisasi bersama-sama, mencari
nilai yang paling optimal untuk lagrange
multiplier tersebut, dan memperbaharui SVM
dengan nilai optimal yang baru.

1

,

5

- Hitung nilai α2 yang baru.
- Perbaharui nilai b dan error cache.
- Simpan nilai α1 dan α2 yang baru.
- Kembali ke tahap 2.

5

Recall dan Precision

Data Penelitian

Dua parameter utama yang dapat
digunakan untuk mengukur keefektifan temu
kembali citra, yaitu recall dan precision.
Recall adalah perbandingan jumlah materi
relevan yang ditemukembalikan terhadap
jumlah materi yang relevan, sedangkan
precision adalah perbandingan jumlah materi
relevan yang ditemukembalikan terhadap
jumlah materi yang ditemukembalikan
(Grossman 2006).

Data yang digunakan diambil dari basis
data Caltech dan www.flowers.vg sebanyak
300 citra untuk berbagai macam objek.
Format citra adalah JPEG berukuran 50×50
piksel.

recall =

jumlah citra relevan hasil temu kembali
jumlah citra relevan dalam basis data

precision =

jumlah citra relevan yang terambil
jumlah seluruh citra yang terambil

Average precision adalah suatu ukuran
evaluasi yang diperoleh dengan menghitung
rata-rata tingkat precision pada berbagai
tingkat recall (Grossman 2006).
METODE PENELITIAN

Metode penelitian ini dapat dilihat pada
Gambar 3.

Segmentasi Warna dengan EM

Pada tahapan segmentasi ini, setiap citra
akan disegmentasi untuk mengelompokkan
warna yang dikandung oleh setiap piksel dari
citra ke beberapa segmen yang sudah
ditentukan jumlahnya, yaitu dua, tiga, empat,
dan lima. Segmen ini merupakan representasi
dari warna-warna dominan citra. Setiap piksel
dari citra dibangkitkan dari salah satu G
segmen. Peluang sebuah piksel masuk ke
dalam segmen adalah sebagai berikut:
g
p( x | Θ ) = ∑ p x | θ l π l .
l =1

(

)

Masing-masing
segmen
diasumsikan
mempunyai distribusi normal Gauss, sehingga
peluang piksel dari segmen l dapat dihitung
dengan formulasi sebagai berikut:

(

)

p x | θl =

1

⎧ 1
T −1
exp⎨− ( x − μl ) Σl ( x − μl )⎬.
1
d

⎩ 2
(2π ) 2 det(Σl ) 2

Algoritma EM mempunyai dua tahapan
utama yaitu tahapan Expectation (E-step) dan
Maximization (M-step). Pada tahapan
Expectation, data X diasumsikan sebagai data
yang tidak lengkap dengan missing value
berupa label yang menyatakan keanggotaan
tiap piksel dari X ke dalam salah satu G
segmen. Yang dilakukan pada tahapan ini
adalah menghitung peluang tiap piksel dari
tiap segmen dan membentuk matriks Z yang
akan melengkapi data X , sehingga data yang
lengkap
dapat
dinyatakan
sebagai
Y = ( X , Z ) . Label tiap piksel didapatkan dari
segmen yang mempunyai peluang tertinggi
dalam Z . Nilai likelihood dari data yang
lengkap adalah
n g
p (Y | Θ) = ∑ ∑ p ( x | Θ ).
i =1l =1

Gambar 3 Metodologi Penelitian.

Pada tahapan Maximization, parameter
untuk iterasi berikutnya ditentukan sesuai
dugaan variabel dari Z . Formulasi untuk
menduga kembali parameter segmen adalah
sebagai berikut:
1 N i
t +1
πl =
∑z ,
N i =1 l

6

N i
∑ zl xi
t +1
,
μl
= i =1
N i
∑ z
i =1 l

(

)(

)

N i
t +1 T
t +1
xi − μ l
∑ z l xi − μ l
t +1 i =1
.
∑l =
N i
∑z
i =1 l

Nilai parameter yang baru dari M-step ini
akan digunakan kembali untuk E-step pada
iterasi berikutnya. Proses E-step dan M-step
akan terus berulang sampai didapatkan nilai
likelihood yang kecil sehingga hasil
perhitungan sudah tidak terlalu banyak
mengalami perubahan. Ketika nilai likelihood
hanya sedikit berubah, maka hasil dianggap
konvergen.
Ekstraksi Ciri Warna dengan FCH

Proses ekstraksi warna dengan FCH tidak
terlalu beragam hasilnya pada perbedaan
ruang warna (RGB, HSV, Lab) (Vertan &
Boujemaa 2000). Oleh karena itu, pengolahan
citra pada penelitian ini dilakukan pada ruang
warna RGB untuk mempermudah pengolahan
citra.
Langkah pertama yang dilakukan untuk
menghitung
FCH
adalah
menghitung
histogram awal. Pada penelitian ini, nilai
warna kuantisasi awal tersebut didasarkan
pada sebaran warna citra dalam basis data
yang memiliki 10 kelas citra dengan jenis dan
warna yang bervariasi. Untuk tiap kelas citra
diambil 10 warna piksel yang muncul
terbanyak sehingga dihasilkan 100 warna
semesta tanpa ada warna yang sama.
Dari histogram awal dihasilkan jumlah ciri
yang terlalu banyak sehingga diperlukan
waktu komputasi yang besar untuk ekstraksi
ciri sebuah citra. Oleh karena itu perlu
dilakukan pengelompokan warna (clustering)
dari 100 warna semesta tersebut ke dalam
beberapa pusat cluster warna menggunakan
Fuzzy C-Means (FCM). Setiap pusat cluster
FCM merepresentasikan bin FCH. Jumlah bin
FCH yang digunakan sebanyak 25.
Untuk perhitungan FCH selanjutnya
diperlukan matriks derajat keanggotaan,
dimana nilai keanggotaannya dapat diperoleh
menggunakan fungsi Cauchy:
μ c ' (c ) =

1
1 + ( d (c ' , c ) / σ )

α

, dengan

d(c’,c) = jarak Euclid antara warna c dengan
c’,
c’
= warna pada bin FCH,
c
= warna semesta,
α
= untuk menentukan kehalusan dari
fungsi,
σ
= untuk menentukan lebar dari fungsi
keanggotaan.
Nilai parameter α = 2 dan σ = 15 diperoleh
dari hasil percobaan sebelumnya (Balqis
2006).
Perhitungan akhir FCH dengan FCM
dinotasikan sebagai berikut:
h2 (c' ) = ∑ μ c ' (c) * h(c) , dengan
c∈μ

h2
h(c )
μ c ' (c )

= fuzzy color histogram,
= conventional color histogram,
= nilai keanggotaan dari warna c ke
warna c’.

Data Latih dan Data Uji

Sesuai dengan metode 10-fold cross
validation, seluruh data hasil ekstraksi ciri
warna yang terdapat di dalam basis data
dibagi menjadi 10 subset, yaitu S1,S3,...,S10.
Masing-masing subset memiliki ukuran yang
sama. Pembagian data dilakukan secara acak
dengan
mempertahankan
perbandingan
jumlah citra setiap kelas. Pada proses pertama
S2,...,S10 menjadi data pelatihan dan S1
menjadi data pengujian, pada proses kedua
S1,S3,...,S10 menjadi data pelatihan dan S2
menjadi data pengujian, dan seterusnya.
Pelatihan dengan SVM

Pada proses pelatihan SVM digunakan
algoritma SMO dengan fungsi Kernel
Gaussian RBF untuk membangun model
klasifikasi. Di dalam algoritma SMO
diperlukan nilai konstanta C dan nilai
parameter kernel σ. Oleh karena itu perlu
dilakukan proses pelatihan untuk setiap
pasangan nilai C (20,21,...,29) dan σ (2-2,2-1,
dan 20) untuk mendapatkan model klasifikasi
terbaik. Data yang dimasukkan pada proses
pelatihan ini adalah data citra pelatihan yang
sudah ditentukan sebelumnya. Karena SVM
bersifat supervised learning, maka setiap citra
mengandung vektor ciri citra dan label kelas.
Pengujian dengan SVM

Proses pengujian dilakukan dengan
memprediksi terlebih dahulu data pengujian
dengan persamaan (5). Persamaan (5) tersebut
juga menggunakan fungsi Kernel Gaussian
RBF, dengan nilai parameter kernel σ sama

7

dengan nilai σ yang digunakan pada tahap
pelatihan sebelumnya. Selanjutnya dilakukan
perhitungan tingkat akurasi SVM terhadap
citra yang telah diprediksi secara benar dan
tidak benar oleh model klasifikasi. Proses
pengujian dilakukan berdasarkan metode 10fold cross validation. Model klasifikasi
dikatakan terbaik jika mencapai nilai akurasi
yang paling tinggi ketika diaplikasikan ke data
uji dengan nilai C dan σ terbaik. Model
klasifikasi inilah yang akan digunakan untuk
menentukan hasil klasifikasi akhir.
Hasil Temu Kembali

Dari hasil klasifikasi akhir, diambil citra di
dalam basis data yang memiliki kelas yang
sama dengan citra kueri dan citra dari kelas
lain yang memiliki tingkat kemiripan yang
tinggi dengan citra kueri sebagai citra hasil
temu kembali. Pengukuran tingkat kemiripan
citra kueri terhadap citra dari kelas lain
menggunakan perhitungan jarak Euclidean.
Jarak Euclidean antara citra a dan b
dirumuskan dengan formula:
d a ,b =

[

HASIL DAN PEMBAHASAN

Penelitian ini menekankan pada penerapan
metode SVM untuk mengklasifikasikan citra
berdasarkan ciri warna citra. Citra yang
digunakan sebanyak 300 dengan format JPG
yang kemudian distandarkan ke dalam ukuran
50×50 piksel. Terdapat 10 kelas citra yang
berbeda yang digunakan dalam penelitian ini
yaitu buaya, bonsai, macan, pesawat, kapal,
wajah, bunga, kura-kura, gentong, dan budha.
Segmentasi Citra

Pada tahapan segmentasi ini, setiap citra
akan disegmentasi untuk mengelompokkan
warna yang dikandung oleh setiap piksel dari
citra ke beberapa segmen (cluster) yang sudah
ditentukan jumlahnya, yaitu dua, tiga, empat,
dan lima. Cluster ini merupakan representasi
dari warna-warna dominan citra. Tahapan
segmentasi ini bertujuan mendapatkan
kelompok-kelompok warna dominan dan
mengurangi jumlah warna citra asli seperti
yang terlihat pada Gambar 4.

]

1) dua cluster

B
2
∑ fcha (i ) − fchb (i ) ,
i =1

dengan
fch = hasil ekstraksi ciri warna dengan
menggunakan FCH,
B
= jumlah bin pada histogram warna.

2) tiga cluster

Evaluasi Hasil Temu Kembali

Pada tahap evaluasi dilakukan penilaian
tingkat keefektifan proses temu kembali
terhadap sejumlah koleksi pengujian. Evaluasi
menggunakan nilai recall dan precision dari
hasil temu kembali citra berdasarkan penilaian
relevansinya. Recall adalah perbandingan
jumlah citra relevan yang terambil terhadap
jumlah citra relevan di dalam basis data,
sedangkan precision adalah perbandingan
jumlah citra relevan yang terambil terhadap
jumlah seluruh citra yang terambil.
Perangkat Lunak dan Perangkat Keras
yang Digunakan

Perangkat lunak yang digunakan pada
penelitian ini adalah Matlab 7.0.1 dan sistem
operasi Windows XP Professional SP 1,
sedangkan spesifikasi perangkat keras yang
mendukung
adalah
komputer
dengan
processor Pentium IV 1.8 GHz dan memori
512 MB.

citra asli

3) empat cluster

4) lima cluster

Gambar 4 Contoh citra sebelum dan sesudah
segmentasi
menggunakan
algoritma EM.
Selanjutnya dilakukan pemilihan keempat
hasil segmentasi tersebut secara manual untuk
dijadikan masukan pada tahap ekstraksi
warna. Berdasarkan Gambar 4, dapat dilihat
bahwa hasil segmentasi keempat adalah hasil
segmentasi yang paling baik. Hal ini
dikarenakan citra hasil segmentasi tersebut
paling mirip dengan citra aslinya. Hasil

8

segmentensi yang sudah terpilih sebagai
masukan pada tahap ekstraksi warna untuk
seluruh citra di dalam basis data dapat dilihat
pada Lampiran 1.
Ekstraksi ciri warna

Pada tahapan ekstraksi ini, setiap piksel
pada citra akan direpresentasikan dengan
peluang atau frekuensi piksel-piksel tersebut
terhadap nilai warna (bin) yang sudah
ditentukan sebanyak 25. Bin tersebut
diperoleh dari FCH menggunakan FCM. Bin
FCH yang digunakan pada penelitian ini dapat
dilihat pada Lampiran 2.

Gambar 5 Gambar wajah.

beberapa nilai C dan σ untuk dicari yang
terbaik, yaitu untuk nilai C (20,21,...,29) dan σ
(2-2,2-1, dan 20).
Di dalam metode 10-fold cross validation,
dilakukan proses pelatihan dan proses
pengujian terhadap data latih dan data uji.
Proses pelatihan dan pengujian ini bertujuan
membangun
model
klasifikasi
dan
menghitung tingkat akurasi SVM dalam
memprediksi citra uji. Model klasifikasi
dikatakan terbaik jika mencapai nilai akurasi
yang paling tinggi ketika diaplikasikan ke data
uji dengan nilai C dan σ terbaik. Nilai C dan σ
dikatakan terbaik jika mencapai rataan akurasi
yang paling tinggi ketika digunakan dalam
klasifikasi SVM.
Akurasi adalah perbandingan jumlah citra
yang telah diprediksi benar terhadap jumlah
data uji. Rataan akurasi adalah nilai rata-rata
dari akurasi di setiap pasangan nilai C dan σ.
Rataan akurasi hasil proses pengujian untuk
setiap pasangan nilai parameter C (20,21,...,29)
dan σ (2-2,2-1, dan 20) dapat dilihat pada Tabel
1.
Tabel 1 Rataan akurasi hasil proses pengujian
untuk setiap pasangan C dan σ
σ
C

Gambar 6 Hasil FCH dengan FCM 25 bin.
Gambar 6 adalah hasil FCH dengan FCM
dari Gambar 5. Berdasarkan Gambar 6, dapat
dilihat bahwa bin 4 yang cenderung berwarna
hijau merupakan warna yang paling banyak
muncul.
Data Uji dan Data Latih

Seluruh data citra hasil ekstraksi ciri
warna di dalam basis data sebanyak 300 citra,
dibagi secara acak ke dalam 10 subset. Setiap
subset memiliki jumlah citra yang sama, yaitu
30 citra. Subset-subset tersebut akan
digunakan sebagai data latih dan data uji
sesuai dengan metode validasi silang, yaitu
metode 10-fold cross validation.
Klasifikasi

Di dalam proses pelatihan SVM yang
menggunakan algoritma SMO dan fungsi
Kernel Gaussian RBF diperlukan parameter C
dan σ. Sedangkan di dalam proses pengujian
SVM yang menggunakan fungsi Kernel
Gaussian RBF juga diperlukan parameter σ.
Untuk memilih nilai parameter C dan σ
terbaik digunakan metode 10-fold cross
validation. Pada penelitian ini, dicobakan

20
21
22
23
24
25
26
27
28
29

2-2
53.67%
54.33%
53.67%
54%
51%
51%
51.33%
52.33%
52.33%
52.33%

2-1

20

52%
52.66%
53.67%
53%
53.33%
53.67%
55.67%
53.70%
51.67%
51.67%

51.33%
51.33%
52%
53%
53%
52.03%
54%
55.33%
52.50%
54.67%

Berdasarkan Tabel 1, dapat dilihat bahwa
untuk pasangan nilai parameter C = 26 dan σ =
2-1 dihasilkan rataan akurasi yang paling
tinggi, yaitu 55.67%. Hal itu menunjukkan
bahwa nilai C = 26 dan σ = 2-1 merupakan
pasangan nilai C dan σ terbaik. Rincian
akurasi untuk setiap tahap pengujian dengan
menggunakan C = 26 dan σ = 2-1 dapat dilihat
pada Tabel 2.
Berdasarkan Tabel 2, dapat dilihat bahwa
proses pengujian ke-10 memiliki akurasi yang
paling tinggi, yaitu 86.67%. Hal itu
menunjukkan bahwa model klasifikasi SVM
terbaik telah terbentuk dari proses pelatihan
ke-10 dengan C = 26 dan σ = 2-1. Model

9

klasifikasi ini mengandung bias (b), 240 buah
citra dari data latih ke-10 yang terpilih sebagai
support vector, dan α i yi , (i = 1,2,...,240) .
Citra yang termasuk support vector ini
memiliki nilai lagrange multiplier 0 ≤ α ≤ C .
Tabel 2 Hasil proses pengujian dengan C = 26
dan σ = 2-1
Pengujian
1
2
3
4
5
6
7
8
9
10
Rataan

Akurasi
43.33%
56.67%
56.67%
63.33%
53.33%
40%
53.33%
46.67%
56.67%
86.67%
55.67%

Model klasifikasi terbaik digunakan untuk
menentukan hasil klasifikasi akhir dengan
menghitung nilai fungsi diskriminan seperti
pada persamaan (5). Dalam perhitungan nilai
fungsi diskriminan tersebut tidak digunakan
seluruh citra di dalam basis data, akan tetapi
hanya digunakan citra di dalam basis data
yang termasuk support vector. Hasil
klasifikasi akhir untuk seluruh citra di dalam
basis data dapat dilihat pada Lampiran 3.

Citra yang relevan di dalam basis data yang
ditemukembalikan sampai 30 citra teratas
hanya sebanyak 10 dari 30 citra yang relevan
di dalam basis data. Terdapat beberapa citra
yang ditemukembalikan memiliki warna
berbeda sekali dengan warna citra kueri, yaitu
citra pada peringkat 4, 5, 8, 10, 11, 12, 14, 18,
22, 23, 26, 27, 28, dan 30. Citra-citra tersebut
cenderung berwarna biru, berbeda sekali
dengan warna citra kueri yang cenderung
berwarna hijau kekuningan. Hal ini
dikarenakan sistem tidak mengenal kelas citra
dan sistem hanya menemukembalikan citra di
dalam basis data yang mempunyai tingkat
kemiripan yang tinggi dengan citra kueri.
Kekurangan sistem ini diperbaiki oleh temu
kembali citra menggunakan SVM yang dapat
dilihat pada Gambar 8.

Gambar 7 Contoh hasil temu kembali tanpa
menggunakan SVM.

Hasil Temu Kembali

Pada penelitian ini, temu kembali citra
diujicobakan ke dua metode yang berbeda
untuk melihat perbedaan tingkat keefektifan
hasil temu kembali citra. Dua metode ini
adalah temu kembali citra tanpa menggunakan
SVM dan temu kembali citra menggunakan
SVM. Citra di dalam basis data yang
digunakan sebagai citra kueri adalah citra
yang termasuk data uji ke-10 (Lampiran 4).
Hal ini dikarenakan hasil proses pengujian
yang paling baik dicapai saat model
klasifikasi diaplikasikan terhadap data uji ke10.
Hasil temu kembali citra tanpa
menggunakan SVM hanya didasarkan pada
kemiripan
ciri
warna
menggunakan
perhitungan jarak Euclidean. Contoh hasil
temu kembali tanpa menggunakan SVM dapat
dilihat pada Gambar 7.
Gambar 7 memperlihatkaan bahwa citra
hasil temu kembali tidak sepenuhnya berasal
dari jenis citra yang sama dengan citra kueri.

Gambar 8 Contoh hasil temu kembali
menggunakan SVM.
Berdasarkan Gambar 8, dapat dilihat
bahwa citra hasil temu kembali sudah terlihat
sangat baik meskipun masih ada satu citra
lainnya yang relevan di dalam basis data tidak
ditemukembalikan sampai 30 citra teratas.
Masih
terdapat
satu
citra
yang
ditemukembalikan dari jenis yang berbeda
dengan citra kueri, yaitu citra pada peringkat

10

21. Citra tersebut tidak sejenis dengan citra
kueri, akan tetapi memiliki warna yang
cenderung sama dengan citra kueri. Hasil
temu kembali citra yang sangat baik ini
dikarenakan sistem mengenal kelas citra dan
melakukan prediksi baik terhadap citra kueri
maupun terhadap seluruh citra di dalam basis
data sehingga diperoleh kelas yang baru untuk
setiap citra. Citra yang ditemukembalikan
adalah citra hasil klasifikasi di dalam basis
data yang terdapat dalam kelas citra yang
sama dengan citra kueri dan citra dari kelas
lain yang memiliki tingkat kemiripan yang
tinggi dengan citra kueri. Hasil temu kembali
menggunakan SVM yang baik ini juga
dipengaruhi oleh model klasifikasi yang
terbaik. Pada tahap klasifikasi sebelumnya,
telah dipilih model klasifikasi terbaik yang
mencapai nilai akurasi 86.67% setelah
diaplikasikan terhadap data uji ke-10. Nilai
akurasi SVM yang baik ini, menyebabkan
hasil temu kembali citra juga baik.

Gambar 9 Contoh hasil temu kembali citra
menggunakan SVM.
Gambar 9 adalah contoh hasil temu
kembali menggunakan SVM. Berdasarkan
Gambar 9, dapat dilihat bahwa warna citra
yang ditemukembalikan cenderung mirip
dengan warna pada citra kueri, meskipun
hanya dua citra yang relevan di dalam basis
data yang ditemukembalikan sampai 30 citra
teratas. Hal ini disebabkan hasil perhitungan
fungsi
diskriminan
dengan
SVM
menunjukkan bahwa indeks warna citra kueri
masuk ke kelas citra lain, yaitu citra buaya.
Kesalahan klasifikasi ini menyebabkan hasil
temu kembali citra menjadi kurang baik. Oleh
karena itu, untuk penelitian selanjutnya dapat
digunakan metode relevance feedback dalam
temu kembali citra agar hasil temu kembali
citra menjadi lebih baik. Dalam penggunaan
metode relevance feedback, model klasifikasi
SVM dapat dibentuk dari citra yang relevan
dan yang tidak relevan dengan citra kueri

yang merupakan
hasil penandaan oleh
pengguna. Dengan model klasifikasi tersebut,
sistem dapat menemukembalikan
lebih
banyak citra di dalam basis data yang relevan
dengan citra kueri. Contoh hasil temu kembali
citra berdasarkan ciri warna menggunakan
SVM untuk setiap kelas citra dapat dilihat
pada Lampiran 5.
Evaluasi Hasil Temu Kembali

Pada tahap evaluasi dilakukan penilaian
tingkat keefektifan dalam proses temu
kembali terhadap sejumlah koleksi pengujian
dengan menghitung nilai recall dan precision
dari proses temu kembali citra berdasarkan
penilaian relevansinya. Penentuan relevansi
citra hasil temu kembali dibuat berdasarkan
kelas citra di dalam basis data, di mana
terdapat 10 kelas citra yang berbeda, yaitu:
1
2
3
4
5
6
7
8
9
10

Buaya,
Bonsai,
Macan,
Pesawat,
Kapal,
Wajah,
Bunga,
Kura-kura,
Genthong,
Budha.

Di dalam basis data terdapat 300 citra dari
10 kelas citra dengan 30 citra untuk setiap
kelas citra. Dengan demikian untuk setiap
kueri citra terdapat 30 citra relevan di dalam
basis data yang penilaian relevansinya
didasarkan atas kesamaan kelas citra.
Penilaian relevansi tersebut kemudian
digunakan sebagai acuan pada saat melakukan
evaluasi terhadap hasil temu kembali untuk
setiap citra kueri.
Nilai recall yang digunakan adalah
0,0.1,0.2,...,1. Nilai ini menunjukkan jumlah
bagian citra dari seluruh citra terambil untuk
perhitungan nilai precision. Misalkan untuk
nilai recall 0.1 berarti jumlah citra yang
digunakan untuk perhitungan nilai precision
adalah 10% dari seluruh citra yang terambil.
Nilai precision untuk nilai recall 0.1 adalah
perbandingan banyaknya citra relevan yang
terambil dari seluruh citra dengan jumlah
tersebut. Nilai rataan precision hasil temu
kembali citra dapat dilihat pada Tabel 3. Nilai
recall-precision hasil temu kembali citra
menggunakan SVM untuk setiap citra kueri
dapat dilihat pada Lampiran 6. Nilai recall-

11

precision hasil temu kembali citra tanpa
menggunakan SVM untuk setiap citra kueri
dapat dilihat pada Lampiran 7.
Tabel 3 Nilai rataan precision hasil temu
kembali citra
Dengan
SVM
100%
80%
72.78%
72.59%
72.22%
73.33%
73.52%
74.29%
74.72%
74.94%
76%
76.76%

Rataan Precision (%)

Recall
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Rataan

Tanpa
SVM
100%
74.44%
56.67%
50.37%
46.67%
43.11%
41.3%
40.16%
37.78%
35.56%
34%
50.91%

menggunakan SVM, dapat dilihat bahwa nilai
rataan precision cenderung selalu mengalami
penurunan pada setiap nilai recall. Hal ini
dikarenakan banyak kueri citra yang
menemukan sedikit citra yang relevan di
dalam basis data.
KESIMPULAN DAN SARAN
Kesimpulan

Hasil penelitian menunjukkan bahwa
metode SVM telah memberikan hasil temu
kembali citra yang lebih baik daripada hasil
temu kembali citra tanpa menggunakan
metode SVM. Dengan metode 10-fold cross
validation, didapatkan model klasifikasi
terbaik dan citra kueri dari proses pelatihan
dan pengujian ke-10, dengan akurasi SVM
sebesar 86.67%. Nilai rataan precision untuk
hasil temu kembali menggunakan SVM
mencapai 76.76%, sedangkan nilai rataan
precision untuk hasil temu kembali tanpa
menggunakan SVM mencapai 50.91%.

100
90
80
70
60
50
40
30
20
10
0

Saran

0

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

1

Recall
dengan SVM

tanpa SVM

Gambar 10 Grafik rataan precision hasil temu
kembali citra menggunakan SVM
dan tanpa menggunakan SVM.
Berdasarkan Gambar 10, dapat dilihat
bahwa nilai rataan precision temu kembali
citra menggunakan SVM cenderung lebih
besar daripada nilai rataan precision temu
kembali citra tanpa menggunakan SVM pada
setiap nilai recall lebih dari nol. Hal ini
menunjukkan bahwa tingkat keefektifan hasil
temu kembali citra menggunakan SVM
cenderung selalu lebih tinggi daripada hasil
temu kembali citra tanpa menggunakan SVM.
Untuk temu kembali citra menggunakan SVM,
dapat dilihat bahwa nilai rataan precision
mengalami penurunan pada nilai recall 0.1,
sedangkan pada nilai recall lainnya cenderung
stabil. Hal ini dikarenakan pada peringkat
recall 0.1 banyak kueri citra yang tidak
menemukan citra yang relevan di dalam basis
data. Untuk temu kembali citra tanpa

Pada sistem temu kembali citra
berdasarkan isi citra, pencarian citra dilakukan
dengan mencocokkan isinya yang berupa
warna, bentuk, ataupun tekstur. Berdasarkan
penelitian, untuk memperbaiki hasil temu
kembali