Identifikasi Plat Nomor Menggunakan Fitur Zoning dengan Klasifikasi Support Vector Machine

IDENTIFIKASI PLAT NOMOR MENGGUNAKAN FITUR ZONING
DENGAN KLASIFIKASI SUPPORT VECTOR MACHINE

INTAN AYU OCTAVIA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Plat Nomor
Menggunakan Fitur Zoning dengan Klasifikasi Support Vector Machine adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, November 2013
Intan Ayu Octavia
NIM G64104059

ABSTRAK
INTAN AYU OCTAVIA. Identifikasi Plat Nomor Menggunakan Fitur Zoning
dengan Klasifikasi Support Vector Machine. Dibimbing oleh MUSHTHOFA.
Pendeteksian identifikasi kendaraan merupakan salah satu permasalahan
yang cukup penting dengan semakin bertambahnya jumlah kendaraan. Oleh
karena itu, diperlukan sebuah metode berbasis teknologi komputer yang mampu
mengidentifikasi kendaraan berdasarkan nomor platnya secara cepat dan akurat.
Beberapa penelitian sebelumnya telah menerapkan metode ekstraksi fitur image
centroid and zone (ICZ) dan beberapa jenis model klasifikasi untuk mengenali
plat nomor kendaraan. Pada penelitian ini, metode ekstraksi fitur ICZ dan metode
klasifikasi dengan support vector machine (SVM) akan digunakan untuk
pengenalan plat nomor. Jenis SVM yang digunakan adalah multi class SVM one
against all menggunakan kernel linear, polynomial, dan RBF. Pengujian
dilakukan dua kali, yaitu: pada masing-masing karakter serta pada keseluruhan
plat (dengan atau tanpa toleransi kesalahan). Dari ketiga kernel tersebut kernel

yang menghasilkan akurasi terbaik adalah kernel polynomial dengan nilai C sama
dengan 0.125 dan d sama dengan 2 adalah 95.44% sedangkan akurasi yang
dihasilkan pada pengujian plat tanpa toleransi kesalahan adalah 81.54% dan
pengujian plat dengan toleransi kesalahan sama dengan 1 adalah 90.77%.
Kata kunci: identifikasi plat nomor, image centroid and zone (ICZ), kernel, multi
class SVM one against all

ABSTRACT
INTAN AYU OCTAVIA. License Plate Identification Using Zoning Feature with
Support Vector Machine Classification. Supervised by MUSHTHOFA.
Vehicle identification detection is one of the significant problems with the
increasing number of vehicles. Therefore, a computer-based method is needed that
can identify the vehicle based on license plate numbers quickly and accurately.
Previous research have applied the image centroid and zone (ICZ) feature
extraction method to identify vehicle license plates. In this research, ICZ and
support vector machine (SVM) will be used for license plate identification. SVM
which is used is the multi class SVM one against all using linear kernel, the
polynomial, and RBF. The testing is performanced twice, on each character and
on the overall plate (with or without fault tolerance). From the three kernels, the
kernel which produces the best accuracy is the polynomial kernel with a value of

C equals to 0.125 and d equals to 2 with on accuracy of 95.44%, while the
accuracy produced at plate testing without fault tolerance is 81.54% and testing
with fault tolerance equal to 1 is 90.77%.
Keywords: image centroid and zone (ICZ), kernel, multi class SVM one against
all, number plate identification

IDENTIFIKASI PLAT NOMOR MENGGUNAKAN FITUR ZONING
DENGAN KLASIFIKASI SUPPORT VECTOR MACHINE

INTAN AYU OCTAVIA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR

BOGOR
2013

Penguji:
1 Dr Ir Agus Buono, MSi MKom
2 M. Asyhar Agmalaro, SSi MKom

Judul Skripsi: Identifikasi Plat Nomor Menggunakan Fitur Zoning dengan
Klasifikasi Support Vector Machine
Nama
: Intan Ayu Octavia
NIM
: G64104059

Disetujui oleh

Mushthofa, SKom MSc
Pembimbing

Diketahui oleh


Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala curahan rahmat, taufik, hidayah, dan karunia-Nya, sehingga penulis dapat
menyelesaikan karya ilmiah dengan judul Identifikasi Plat Nomor Menggunakan
Fitur Zoning dengan Klasifikasi Support Vector Machine.
Penulis menyadari dalam penyusunan karya ilmiah telah banyak
mendapatkan bantuan, dukungan, serta saran dari berbagai pihak. Oleh karena itu,
penulis ingin mengucapkan terima kasih kepada pihak yang telah membantu,
yaitu:
1 Orang tua tercinta Bapak H Anwar Firmansyah dan Ibu Hj Erna Nelly, kakak
penulis Johs Verlian Guntur Firmansyah atas segala do’a, cinta, restu, kasih
sayang, dukungan, nasehat, serta perhatian yang telah diberikan kepada
penulis.
2 Bapak Mushthofa, SKom MSc selaku dosen pembimbing tugas akhir yang

telah memberikan ilmu, kesabaran, dan dukungan dalam penyelesaian tugas
akhir.
3 Bapak Dr Ir Agus Buono, MSi MKom dan Bapak Muhammad Asyhar
Agmalaro, SSi MKom selaku dosen penguji yang telah memberikan saran dan
seluruh dosen dan staf Departemen Ilmu Komputer FMIPA IPB.
4 Aditya Riansyah Lesmana, SKom yang telah memberikan data dan informasi
yang dibutuhkan penulis dalam penyusunan karya ilmiah.
5 Angga Nugraha, Lina Herlina, Diah Daru Asih, Septy Kurniawati, Simi
Haslinda, Asterika Prawesthi, dan Rahmi Juwita Sukma yang selalu
memberikan dukungan dan semangat kepada penulis.
6 Rekan-rekan satu bimbingan, Rizkina, Putri, dan Hafhara atas bantuan dan
kerjasamanya selama bimbingan.
7 Teman-teman Ilkomerz Angkatan 5 atas kebersamaannya.
8 Seluruh pihak baik yang turut membantu secara langsung maupun tidak
langsung dalam penyusunan tugas akhir.
Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat
banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan
kemampuan penulis. Oleh karena itu, penulis mengharapkan adanya masukan
berupa saran dan kritik yang bersifat membangun dari pembaca demi
kesempurnaan tugas akhir ini.

Akhir kata penulis ucapkan terima kasih atas semua bantuan dan
kerjasamanya. Semoga karya ilmiah ini dapat bermanfaat bagi pembaca.

Bogor, November 2013
Intan Ayu Octavia

DAFTAR ISI
DAFTAR TABEL

vii

DAFTAR GAMBAR

vii

DAFTAR LAMPIRAN

viii

PENDAHULUAN


1

Latar Belakang

1

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup

2

TINJAUAN PUSTAKA


3

Edge Detection

3

Canny’s Edge Detection

3

Image Segmentation

4

Zone Based Feature Extraction

4

K-Fold Cross Validation


4

Support Vector Machine

4

Soft Margin

6

Multi Class SVM

8

METODE

8

Pengumpulan Data


9

Praproses citra

9

Restorasi dan Perbaikan Citra

9

Deteksi Tepi

10

Segmentasi Citra

10

Ekstrasi Ciri

10

Image Centroid and Zone

10

Data Latih dan Data Uji

12

Pelatihan pada SVM

13

Pengujian pada SVM

13

Klasifikasi Citra

16

Evaluasi dan Analisis Hasil

16

Lingkungan Pengembangan Sistem
HASIL DAN PEMBAHASAN

16
17

Pengumpulan Data

17

Praproses Citra

17

Deteksi Tepi

18

Segmentasi Citra

19

Normalisasi Citra

19

Ekstraksi Ciri

20

Klasifikasi Citra

22

Pengujian Per Karakter

22

Kernel Linear

23

Kernel Polynomial

24

Kernel RBF

25

Pengujian Pada Plat

27

SIMPULAN DAN SARAN

29

Simpulan

29

Saran

30

DAFTAR PUSTAKA

30

LAMPIRAN

32

RIWAYAT HIDUP

40

DAFTAR TABEL
1
2
3
4
5
6
7
8
9

Pembagian subset
Nilai kepercayaan data pada SVM
Nilai pengujian per karakter
Akurasi pada kernel linear
Akurasi terbaik kernel polynomial pada setiap nilai d
Akurasi terbaik pada RBF untuk masing-masing σ
Persentase akurasi pengujian karakter dengan kernel
Akurasi toleransi kesalahan pada plat nomor
Contoh kesalahan pada plat nomor

13
15
23
24
25
26
27
28
28

DAFTAR GAMBAR
1 Ilustrasi linearly separable data (Wang et al. 2009)
2 Soft margin hyperplane (Wang et al. 2009)
3 Fungsi � memetakan data ke ruang vektor yang berdimensi lebih
tinggi (Gisler 2008)
4 Skema metode penelitian
5 Plat nomor kendaraan
6 Contoh citra dalam perhitungan ekstraksi ciri ICZ
7 Contoh citra dengan pembagian zona
8 Ilustrasi SVM
9 Ilustrasi SVM 1
10 Ilustrasi SVM 2
11 Ilustrasi SVM 3
12 Ilustrasi SVM 4
13 Contoh data karakter
14 Gambar hasil praproses citra
15 Hasil deteksi tepi dengan metode deteksi tepi Canny
16 Labelling pada angka nol
17 Proses segmentasi pada plat
18 Normalisasi pada karakter
19 Ilustrasi pembagian zona pada ekstraksi fitur
20 Pola ekstraksi fitur pada huruf P
21 Pola ekstraksi fitur pada huruf I
22 Hasil dari citra dengan praproses yang baik (kanan) dan praproses
yang kurang baik (kiri)
23 Grafik akurasi kernel polynomial
24 Grafik akurasi pada kernel RBF
25 Akurasi rata-rata pda setiap kernel
26 Grafik akurasi toleransi kesalahan
27 Plat nomor yang gagal teridentifikasi

5
6
7
8
9
11
12
13
14
14
14
15
17
18
18
19
19
20
20
21
21
21
25
26
27
28
29

DAFTAR LAMPIRAN
1
2
3
4
5

Pengujian karakter pada SVM
Akurasi SVM pada kernel polynomial
Akurasi SVM pada kernel RBF
Hasil deteksi karakter pada 25 zona menggunakan kernel polynomial
Akurasi pada plat nomor kendaraan

32
34
35
37
38

1

PENDAHULUAN
Latar Belakang
Seiring dengan perkembangan produksi kendaraan yang semakin cepat.
Indonesia merupakan target distribusi terbesar bagi kendaraan bermotor. Pada
kendaraan tersebut terdapat nomor polisi yang tertera pada plat yang merupakan
identitas unik yang terdiri dari huruf dan angka. Plat tersebut merepresentasikan
data kendaraan dan pemiliknya yang saat ini masih dilakukan secara manual.
Oleh karena itu, diperlukan suatu mekanisme untuk melakukan pengenalan
plat kendaraan secara cepat dan tepat. Salah satunya optical character recognition
(OCR) yang mengidentifikasi karakter dari input berupa citra. Input tersebut akan
diproses secara digital sehingga dapat dilakukan tahap pengenalan menggunakan
beberapa metode yang ada. Terkait dengan metode ini, pengambilan citra dari
sebuah plat dapat dilakukan dengan menggunakan peralatan optikal (kamera,
CCTV). Selanjutnya dilakukan identifikasi dari setiap karakter yang ada. Dalam
mengimplementasikan mekanisme tersebut perlu dilakukan beberapa tahap
pemrosesan digital.
Selama beberapa tahun terakhir telah dilakukan banyak penelitian mengenai
hal ini dan masih terus dikembangkan untuk mencari metode terbaik dalam
memecahkan permasalahan tersebut. Setiawan (2008) melakukan penelitian untuk
pendeteksian plat nomor menggunakan metode feature reduction principle
component analysis (PCA) dan Euclidean distance. Dari penelitian tersebut
didapatkan rata-rata akurasi sebesar 84.30%. Lim et al. (2009) juga menggunakan
PCA untuk feature reduction namun pada tahap klasifikasinya menggunakan
metode k-nearest neighbor (K-NN). Pada penelitian tersebut mencapai tingkat
keberhasilan sebesar 82%. Selain itu, Wahyono (2009) mencoba menggunakan
jaringan syaraf tiruan learning vector quantization sebagai metode klasifikasi dan
ekstrasi fitur berdasarkan blok. Walaupun pada penelitian tersebut masih banyak
kesalahan pada metode ekstrasi fitur, namun tingkat keberhasilan yang didapat
masih cukup besar yaitu 78%. Pada tahun 2012 penelitian yang dilakukan
Lesmana mengenai identifikasi karakter pada plat nomor kendaraan menggunakan
image centroid and zone (ICZ) sebagai ekstraksi ciri dan metode klasifikasi
backpropagation menghasilkan akurasi 69.50%, ekstraksi ciri yang digunakan
mengacu pada penelitian yang telah dilakukan oleh Rajashekararadhya (2008).
Pada tahun 2013 Pramesti melanjutkan penelitian yang dilakukan oleh Lesmana
(2012) mengenai identifikasi plat nomor kendaraan menggunakan ekstraksi fitur
ICZ dan ZCZ menggunakan metode klasifikasi K-NN dan menghasilkan akurasi
83.08%. Penelitian dengan menggunakan metode backpropagation menghasilkan
akurasi yang kecil. Anisah (2012) telah melakukan penelitian mengenai
pengenalan iris mata dengan support vector machine (SVM) menggunakan
ekstraksi ciri log-gabor filter dan menghasilkan akurasi 95.55% untuk data set
mata kiri dan 93.33% untuk data set mata kanan. Sebagai salah satu solusi untuk
masalah tersebut, akan dicoba dengan metode klasifikasi SVM.
SVM menurut Cortes dan Vapnik (1995) merupakan model supervised
learning dengan algoritma terkait yang menganalisis data dan mengenali pola,
yang digunakan untuk klasifikasi dan analisis regresi. SVM merupakan teknik

2
pengklasifikasi yang sangat baik dalam menangani data set berdimensi tinggi.
SVM sudah diterapkan pada berbagai bidang. Byun dan Lee (2003) telah
melakukan survei yang menyatakan bahwa SVM menunjukkan kinerja yang baik
pada banyak kehidupan nyata, namun baiknya kinerja SVM dari segi eksekusi
tidak dicantumkan.
Oleh karena itu, berdasarkan hal tersebut klasifikasi menggunakan SVM
lebih baik daripada klasifikasi jaringan syaraf tiruan backpropagation. Hal
tersebut dapat terlihat karena akurasi yang dihasilkan dengan klasifikasi SVM
lebih tinggi daripada akurasi dengan metode klasifikasi backpropagation.
Sehingga diharapkan penelitian dengan SVM akan menghasilkan akurasi yang
lebih baik.

Tujuan Penelitian
Tujuan dilakukannya penelitian ini adalah:
1 Menerapkan metode ICZ untuk melakukan ekstraksi ciri pada citra plat nomor
kendaraan dengan metode klasifikasi SVM.
2 Menguji tingkat akurasi dari metode yang digunakan dan membandingkan
akurasi pada klasifikasi K-NN dan backpropagation yang menggunakan
ekstraksi ciri ICZ.

Manfaat Penelitian
Manfaat dari dilakukannya penelitian ini diharapkan dapat menjadi sebuah
konsep dasar dalam mengembangkan sistem pengenalan plat kendaraan secara
otomatis. Dengan itu pada akhirnya dapat menjadi solusi permasalahan pencatatan
data kendaraan, khusunya di Indonesia.

Ruang Lingkup
Ruang lingkup dari penelitian ini terbatas pada beberapa hal, yaitu:
1 Plat nomor yang dikenali hanya plat nomor dengan format standar (bukan
format TNI/POLRI).
2 Data yang diolah berasal dari citra dengan format JPEG.
3 Karakter yang dikenali adalah huruf alphabet kapital (A sampai Z) dan angka
(0 sampai 9).
4 Pemotretan plat dilakukan dari depan atau belakang kendaraan secara
berhadapan lurus.
5 Hanya bagian plat nomor yang akan digunakan sebagai data yang diteliti.
6 Metode klasifikasi yang digunakan adalah multi class SVM one against all.

3

TINJAUAN PUSTAKA
Edge Detection
Deteksi tepi menurut Acharya dan Ray (2005) pada dasarnya adalah
mendeteksi perubahan lokal yang signifikan berdasarkan tingkat intensitas pada
gambar. Perubahan tingkat intensitas diukur dengan gradien gambar. Bahwa f
(x,y) adalah fungsi dua dimensi, gradiennya adalah sebuah vektor.




=

Besarnya gradien dapat dihitung dalam beberapa cara:

,
= �2 + �2




Arah gradiennya adalah:
−1
� , =
� /�

,

,

= � + �

= max � , �

di mana sudut θ diukur terhadap sumbu X.

Canny’s Edge Detection
Detektor tepi Canny (Acharya dan Ray 2005) adalah detektor yang
memastikan ketebalan noise yang baik dan pada saat yang sama mendeteksi titik
tepi yang benar dengan kesalahan minimal. Deteksi tepi Canny telah
mengoptimalkan proses deteksi tepi dengan memaksimalkan rasio signal-to-noise
dari gradien. Sebuah faktor lokalisasi tepi, yang menjamin bahwa tepi yang
terdeteksi dilokalisir seakurat mungkin. Ada beberapa proses penting yang
dilakukan dalam deteksi tepi Canny, yaitu:
1 Non-maxima suppression, detektor tepi Canny menghasilkan tepi tebal yang
lebih lebar dari pixel. Pengoperasian non-maxima suppression menipiskan luas
daerah gradiennya. Dalam salah satu tekniknya, besarnya tepi dari dua pixel
tepi tetangga, tegak lurus terhadap arah tepi yang diperhitungkan dan besarnya
tepi yang lebih rendah dibuang.
2 Double thresholding, gambar/citra gradien diperoleh setelah non-maxima
suppression yang mungkin masih mengandung titik-titik tepi yang salah. Untuk
menghilangkan titik tepi yang salah, sebuah ambang batas yang sesuai dipilih
sedemikian rupa sehingga semua titik tepi yang besarnya lebih besar dari
ambang batas dapat dipertahankan sebagai titik tepi yang benar, sementara
yang lainnya akan dihapus sebagai titik tepi yang salah.
3 Edge threshold selection, deteksi tepi didasarkan pada membandingkan gradien
tepi dengan ambang batas. Nilai ambang batas ini dapat dipilih cukup rendah
hanya ketika tidak ada noise pada gambar, sehingga semua tepi yang benar
dapat dideteksi tanpa terlewatkan. Dalam gambar yang terdapat noise,

4
pemilihan ambang batas menjadi masalah pada optimasi rasio kemungkinan
maksimum berdasarkan teori keputusan Bayes.

Image Segmentation
Segmentasi citra adalah proses untuk meminimalkan kesalahan klasifikasi
dan mengurangi ketidakpastian statistik. Hal ini telah mengakibatkan
pengembangan beberapa algoritma berdasarkan sifat lokal dan global pixel dalam
gambar. Teknik thresholding adalah teknik yang sederhana menurut Gonzalez et
al. (2003).

Zone Based Feature Extraction
Metode ekstraksi fitur berbasis zona memberikan hasil yang baik bahkan
ketika langkah sebelum proses tertentu dimulai seperti filtering, smoothing, dan
menghapus zona yang tidak dianggap. Pada bagian ini, akan dijelaskan konsep
metode ekstraksi, ciri yang digunakan untuk mengekstraksi fitur untuk klasifikasi
yang efisien dan pengenalan. Tahapan yang harus dilakukan untuk ekstraksi fitur
ini (Rajashekararadhya 2008), yaitu:
1 Hitung centroid dari citra.
2 Bagi ke dalam n buah zona yang sama besar proporsinya.
3 Hitung jarak antara titik centroid dengan koordinat pixel yang memiliki nilai.
4 Ulangi langkah 3 untuk pixel yang ada di semua zona.
5 Hitung rata-rata dari jarak yang telah didapat pada langkah 3.
6 Ulangi langkah 5 hingga didapat masing-masing rata-rata jarak dari setiap
zona.
7 Akhirnya n buah fitur akan didapat untuk melakukan klasifikasi dan
pengenalan.

K-Fold Cross Validation
Cross validation kadang-kadang disebut sebagai rotation estimation.
Dataset V dibagi menjadi k subset (fold) yang saling bebas secara acak, yaitu: D1,
D2,..., Dk dengan ukuran yang sama. Pelatihan dan pengujian dilakukan sebanyak
k kali, setiap kali iterasi ke-t (t = 1, 2, ..., k) dilatih pada D/Dt dan diuji pada Dt.
Perkiraan akurasi pada cross validation dengan membagi jumlah keseluruhan
klasifikasi yang benar dengan seluruh instances pada dataset (Kohavi 1995).

Support Vector Machine
SVM adalah suatu sistem pembelajaran yang menggunakan ruang hipotesis
dari suatu fungsi linear dalam suatu ruang dimensi berfitur tinggi. SVM bertujuan
menemukan fungsi pemisah (classifier/hyperplane) terbaik untuk memisahkan
dua buah kelas pada input space. Hyperplane terbaik antara dua kelas dapat
ditemukan dengan mengukur margin hyperplane yang diperoleh dari mengukur

5
margin yang maksimal antara ruang input non-linear dengan ruang ciri
menggunakan kaidah kernel (Cortes dan Vapnik 1995). Prinsip kerja SVM ialah
linear classifier, tetapi dapat bekerja juga pada problem non-linear dengan
memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi.
Misalkan data dinotasikan sebagai xi ∊ ℜn, untuk label kelas dari data xi
dinotasikan y ∊ {+1,-1} dengan i = 1,2,…,l dengan l adalah banyak data.
Pemisahan data secara linear pada metode SVM dapat dilihat pada Gambar 1.

Gambar 1 Ilustrasi linearly separable data (Wang et al. 2009)
Margin adalah jarak antara hyperplane dan pattern terdekat dari masingmasing kelas. Pattern yang paling dekat disebut support vector. Nilai margin
1
antara dua kelas adalah =
. Dengan w adalah vector bobot yang tegak lurus
|

|

terhadap hyperplane (bidang normal). Hal tersebut dapat dirumuskan sebagai
Quadratic Margin yaitu mencari titik minimal dapat dilihat pada Persamaan 1,
dengan memperhatikan Persamaan 2.
min �
.

=
+

1
2

(1)

2

− 1 ≥ 0, ∀

(2)

Problem ini dapat diselesaikan dengan menggunakan fungsi Lagrange
Multiplier berikut:

, ,

=

1
|
2

|2 −

( ( .
=1

+

− 1))

( = 1,2, . . , )

(3)

Nilai a yang dihasilkan digunakan untuk mencari w. Data yang memiliki
nilai a1≥0 merupakan support vector, sedangkan sisanya memiliki nilai ai = 0.
Nilai optimal dari Persamaan 3 dapat dihitung dengan meminimalkan L terhadap
w dan b, dan memaksimalkan L dengan . Persamaan 3 dapat dimodifikasi
sebagai maksimalisasi problem yang hanya mengandung ai dapat dilihat pada
Persamaan 4.

6
1

2

=1

(4)
, =1

Perhitungan diatas menghasilkan
yang kebanyakan bernilai positif. Data
yang berkorelasi dengan yang positif disebut sebagai support vector.

Soft Margin
Berdasarkan fungsi-fungsi diatas dapat memisahkan kelas secara sempurna
dengan menggunakan hyperplane. Terkadang dua buah kelas tidak dapat terpisah
secara sempurna. Sehinggan Persamaan 2 tidak dapat terpenuhi dan optimasi tidak
dapat dilakukan. Dalam penyelesaian masalah ini SVM menyediakan teknik
softmargin yang akan memodifikasi Persamaan 2 dengan memasukan slack
variable (�>0) sehingga persamaan nya adalah
.

≥ 1 − � ,� > 0

+

(5)

Dan Persamaan 1 diubah menjadi Persamaan 6 dan ilusrasi terdapat pada
Gambar 2:
min �

,� =

1
2

2

+ �

=1



(6)

Gambar 2 Soft margin hyperplane (Wang et al. 2009)
Parameter C digunakan untuk mengontrol trade off antara margin dan error
klasifikasi � dan rentang nilai yang digunakan adalah 2-4, 2-3, 2-2, 2-1, 20, 21, 22, 23,
dan 24. Nilai C yang besar berarti akan memberikan penalti yang lebih besar
terhadap error klasifikasi. Setelah nilai ai ditemukan, kelas dari data pengujian x
dapat ditentukan berdasarka nilai fungsi keputusan:
=

+
=1

7
dengan,
= support vector
ns = jumlah support vector
= data yang akan diklasifikasikan.
Pencarian bidang pemisah terbaik dengan penambahan variable � disebut
soft margin hyperplane. Dengan demikian dual problem yang dihasilkan pada
non-linear problem sama dengan dual problem yang dihasilkan dengan linear
problem. Hanya saja rentang ai antara 0 ≥ ai ≥ C.
Cara lain pada data yang tidak dapat dipisahkan secara linear ialah
memodifikasi SVM dengan memasukan fungsi �(x). Pencarian ini hanya
bergantung pada dot product dari data yang sudah dipetakan pada ruang baru yang
berdimensi lebih tinggi yaitu �( ) �( ). Ilustrasi terdapat pada Gambar 3.

Input

Feature

space

space

Gambar 3 Fungsi � memetakan data ke ruang vektor yang berdimensi lebih
tinggi (Gisler 2008)
Perhitungan dot product dapat digantikan dengan fungsi kernel yang
dirumuskan sebagai berikut:
K(xi, xd)= �(xi) . �(xd)

Dengan demikian, fungsi yang dihasilkan adalah:
=



,

+

=1

Menurut Byun dan Lee (2003), fungsi kernel yang umum digunakan ialah
sebagai berikut:
1 Kernel linear
K(xi,x)= x
2 Kernel polynomial
K(xi,x)=( x+1)d
3 Kernel radian basis function (RBF)
K(xi,x)=exp −

| − |2
2� 2

8
Multi Class SVM
Pada SVM, terdapat metode untuk mengklasifikasikan data yang memiliki
lebih dari dua kelas, yaitu: metode one against one dan one against all. Pada
metode one against all, dibangun k buah model SVM (k adalah jumlah kelas).
Setiap model klasifikasi ke-i dilatih dengan menggunakan keseluruhan data.
Untuk mencari solusi permasalahan, Persamaan 7 digunakan (Hsu dan Lin 2002).
1
(
� 2
Φ

s.t
Φ

+



)

+

+

≥ 1−� →

≥ −1 + � →

= ,

≠ ,� ≥ 0

(7)

METODE
Untuk dapat melakukan penelitian yang baik, maka diperlukan sebuah
metode penelitian yang baik dan terencana pula. Pada penelitian ini akan
dilakukan identifikasi karakter pada plat nomor kendaraan bermotor. Skema
metode penelitian ini dapat dilihat pada Gambar 4.

Gambar 4 Skema metode penelitian

9
Pengumpulan Data
Data yang digunakan pada penelitian ini berupa data yang telah digunakan
pada penelitian Lesmana (2012). Citra yang diambil pada penelitian tersebut
menggunakan kamera handphone dengan resolusi sebesar 5 MP. Citra yang
dikumpulkan harus memperhatikan jumlah kemunculan masing-masing karakter,
dimana sebaran frekuensinya merata untuk setiap kaarkter. Hal tersebut dilakukan
agar data latih yang dimiliki dapat lebih akurat untuk setiap karakter yang ada.
Selain itu perlu diperhatikan juga bahwa semua citra yang dikumpulkan
harus memiliki resolusi yang sama. Kamera yang digunakan memiliki resolusi 5
MP dan akan menghasilkan citra dengan resolusi yang cukup besar, maka perlu
diubah terlebih dahulu ke resolusi yang lebih kecil yang dilakukan secara manual
dengan tetap memperhatikan kualitas citra. Dengan demikian pemrosesan citra
yang akan dilakukan dapat lebih cepat. Berikut contoh citra yang digunakan dapat
dilihat pada Gambar 5.

Gambar 5 Plat nomor kendaraan

Praproses citra
Para proses citra dilakukan untuk meningkatkan kualitas pola pada citra.
Data yang didapat dari proses pengumpulan data merupakan citra dengan format
warna RGB. Dalam proses identifikasi karakter pada plat nomor tidak perlu
memperhatikan perbedaan warna RGB. Oleh karena itu, akan lebih efisien jika
diubah ke dalam format grayscale. Proses konversi dalam format grayscale dapat
menggunakan rumus:
Pixel = (0.2989 × R) + (0.5870 × G) + (0.1140 × B)
Dengan R, G, dan B merupakan intensitas dari masing-masing warna merah,
hijau, dan biru pada citra. Dengan mengkonversi format warna ke grayscale tentu
saja dapat mempercepat komputasi pada tahap berikutnya.

Restorasi dan Perbaikan Citra
Pada dasarnya citra yang diambil menggunakan sebuah kamera terkadang
memiliki noise yang dapat mengurangi kualitas citra dan menghilangkan
informasi yang diperlukan dalam proses pengenalan karakter. Oleh karena itu,
perlu dilakukan restorasi menggunakan filter yang ada, salah satunya adalah
median filter yang cukup efisien dalam merestorasi citra dengan noise bertipe salt
& pepper. Untuk lebih meningkatkan kualitas citra juga dapat dilakukan proses
sharpening atau smoothing sesuai dengan kebutuhannya.

10
Deteksi Tepi
Citra yang ada akan dikurangi noise-nya yang terdeteksi oleh filter yang
digunakan. Setiap objek yang ada pada citra akan dideteksi menggunakan
algoritma Canny. Algoritma ini dipilih karena cukup baik dalam mendeteksi tepi.
Selain memiliki kemampuan untuk meletakkan dan menandai semua tepi yang
ada sesuai dengan pemilihan parameter-parameter konvolusi yang dilakukan,
algortima Canny juga memberikan fleksibilitas yang sangat tinggi dalam hal
menentukan tingkat deteksi ketebalan tepi sesuai dengan yang diinginkan.

Segmentasi Citra
Dalam identifikasi karakter pada plat nomor perlu dilakukan segmentasi
citra untuk mengeliminasi objek yang tidak diperlukan dan memilih mana objek
yang merupakan karakter dan mana yang bukan. Hal tersebut dilakukan dengan
segmentasi citra berdasarkan area. Objek yang memiliki pixel-pixel yang
terhubung akan dianggap menjadi satu area. Masing-masing area tersebut akan
diberi label untuk kemudian dihitung luas areanya satu per satu. Untuk
mendeteksi apakah suatu pixel terhubung dengan pixel tetangganya menggunakan
metode 8connected. Selanjutnya akan ditentukan suatu batas yang menjadi acuan
untuk menduga apakah objek tersebut merupakan karakter atau bukan berdasarkan
luas areanya.

Ekstrasi Ciri
Tahapan ini dilakukan untuk mendapatkan fitur yang menjadi ciri dari setiap
karakter pada plat nomor. Fitur tersebut nantinya akan menjadi acuan dalam
proses klasifikasi dan pengenalan pola. Dalam penelitian ini pendekatan yang
digunakan adalah ekstrasi fitur berbasis area yaitu ICZ.

Image Centroid and Zone
Pendekatan menggunakan ICZ ini merupakan metode yang cukup sederhana
dalam implementasinya. Sebelum dilakukan tahapan pada metode ini perlu
dipastikan bahwa setiap karakter yang ada memiliki dimensi yang sama besar.
Contoh ilustrasi gambar dengan ukuran 9×9 pixel terdapat pada Gambar 6.
Langkah pertama yang dilakukan adalah menghitung nilai centroid dengan rumus
sebagai berikut:
=

1 . �1

+ 2 . �2 + ⋯ +
�1 + �2 + ⋯ + �

.�

=

1 . �1

.�

+ 2 . �2 + ⋯ +
�1 + �2 + ⋯ + �

11
dengan,



= centroid koordinat x
= centroid koordinat y
= koordinat x dari pixel ke-n
= koordinat y dari pixel ke-n
= nilai pixel ke-n

Ilustrasi perhitunganya dapat dilihat sebagai berikut:
1. 1 + 2. 1 + 3. 1 + 4. 1 + 5. 1 + 6. 1 + 7. 1 + 8. 1 + 9. 1 + ⋯ +
1+ 2+3+ 4+5+6+7+8+9+⋯+ �

.�

1. 1 + 2. 1 + 3. 1 + 4. 1 + 5. 1 + 6. 1 + 7. 1 + 8. 1 + 9. 1 + ⋯ +
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + ⋯+ �
125
=4
=

.�

=
=

150
32

= 4.69

=

32

Gambar 6 Contoh citra dalam perhitungan ekstraksi ciri ICZ
sama dengan
Maka dari perhitungan yang telah dilakukan menghasilkan
5 dari pembulatan nilai 4.69 dan
sama dengan 4 sehingga nilai centroid nya
adalah (5,4). Setelah didapat centroid dari citra, kemudian bagi citra input akan
dibagi menjadi tiga area yang sama besar, yaitu: zona atas, zona tengah, dan zona
bawah dan setiap zona berukuran 9×3 pixel, untuk ilustrasi dapat dilihat pada
Gambar 7. Selanjutnya dicari jarak antara centroid dengan koordinat pixel yang
memiliki nilai 1 (warna putih). Jarak akan dihitung menggunakan metode
Euclidean dua dimensi. Berikut ini rumus jarak menggunakan Euclidean dengan
P = ( � , � ) dan C = ( , ).
d
P
C




d �, �

(





= jarak antara dua titik
= koordinat titik berat
= koordinat pixel
= koordinat x titik berat
= koordinat y titik berat
= koordinat x pixel
= koordinat y pixel

)2 + (





)2

12

Gambar 7 Contoh citra dengan pembagian zona
Perhitungan zona atas dapat dilihat pada ilustrasi Gambar 7 sehingga
perhitungannya sebagai berikut:
(1,1) → jarak = 1 − 5 2 + 1 − 4 2 = 5
(2,1) → jarak = 2 − 5 2 + 1 − 4 2 = 4.24
(3,1) → jarak = 3 − 5 2 + 1 − 4 2 = 3.61
(4,1) → jarak = 4 − 5 2 + 1 − 4 2 = 3.16
(5,1) → jarak = 5 − 5 2 + 1 − 4 2 = 3.00
(6,1) → jarak = 6 − 5 2 + 1 − 4 2 = 3.16
(7,1) → jarak = 7 − 5 2 + 1 − 4 2 = 3.61
(8,1) → jarak = 8 − 5 2 + 1 − 4 2 = 4.24
(9,1) → jarak = 9 − 5 2 + 1 − 4 2 = 5.00
(1,2) → jarak = 1 − 5 2 + 2 − 4 2 = 4.47
(9,2) → jarak = 9 − 5 2 + 2 − 4 2 = 4.47
(1,3) → jarak = 1 − 5 2 + 3 − 4 2 = 4.12
(9,3) → jarak = 9 − 5 2 + 3 − 4 2 = 4.12

Setelah semua jarak setiap pixel ke centroid pada zona atas didapat maka
dilakukan perhitungan rata-rata jarak sebagai berikut:
1
(
1,1 +
2,1 +
3,1 + … +
9,3 )
13
Maka hasil perhitungan rata-rata jarak pada zona atas adalah 4.02. Proses
tersebut akan dilakukan pada zona tengah dan zona bawah dan rata-rata jarak pada
zona tengah dan bawah adalah 2.45 dan 5.34. Rata-rata tersebutlah yang akan
dijadikan sebagai data klasifikasi. Sehingga ekstraksi ciri yang didapat adalah
[4.02 2.45 5.34].
Rataan jarak1 =

Data Latih dan Data Uji
Data diuji dengan mengunakan metode pengujian k-fold cross validation.
Seluruh data citra yang ada akan dibagi menjadi lima subset, yaitu: fold 1, fold 2,
fold 3, fold 4, dan fold 5. Hal tersebut dilakukan dengan tujuan untuk mencari
akurasi. Pelatihan dilakukan secara berulang. Pada setiap pengulangan empat fold
akan dijadikan data latih dan satu fold akan dijadikan data uji. Proses ini

13
dilakukan sebanyak lima kali, sampai semua fold pernah berperan sebagai data
latih dan data uji. Dalam setiap pengulangan nilai akurasi akan dihitung sehingga
akurasi terakhir adalah rata-rata nilai akurasi 5 kali pengulangan yang dilakukan.
Pembagian subset dapat dilihat pada Tabel 1.

Subset
Fold 1
Fold 2
Fold 3
Fold 4
Fold 5

Tabel 1 Pembagian subset
Data latih (indeks)
11 – 50
1 – 10, 21 – 50
1 – 20, 31 – 50
1 – 30, 41 – 50
1 – 40

Data uji (indeks)
1 – 10
11 – 20
21 – 30
31 – 40
41 – 50

Pelatihan pada SVM
Pelatihan data dilakukan dengan menggunakan 3 kemungkinan kernel,
yaitu:
1 Kernel linear.
2 Kernel polynomial, membutuhkan parameter d.
3 Kernel RBF, membutuhkan parameter σ.
Masing-masing kernel dicoba dengan nilai parameter fungsi kernel, hal ini
dilakukan pada fungsi kernel polynomial dan kernel RBf terkecuali kernel linear.
Sehingga didapat beberapa model SVM yang masing-masing akan diuji dan akan
dihasilkan nilai output dari masing-masing model klasifikasi yang dapat
menentukan kelas untuk data uji tersebut.

Pengujian pada SVM
Pengujian akan dilakukan pada semua model yang telah ditentukan pada
proses pelatihan. Setelah itu dibandingkan kinerja dari masing-masing model
tersebut. Kemudian dicari nilai kepercayaannya. Nilai kepercayaan ini akan
digunakan pada penentuan kelas dengan metode one against all.
Pada metode SVM, dilakukan proses mencari jarak antara data dengan
hyperplane. Jarak yang dimaksud dilambangkan oleh x dan y ilustrasi dapat dilihat
pada Gambar 8. Variabel x adalah jarak antara data pada kelas B dan hyperplane,
sedangkan y adalah jarak antara data pada kelas A dan hyperplane. Nilai jarak
tersebut disesuaikan dengan tanda dari masing-masing kelas.

Gambar 8 Ilustrasi SVM

14
Pada SVM klasifikasi dua buah kelas memperhatikan tanda positif atau
negatif pada masing-masing kelas tanpa memperhatikan jarak antara data dengan
hyperplane. Pada metode one against all melakukan perhitungan jarak antara data
dengan hyperplane.

Gambar 9 Ilustrasi SVM 1
Sebagai ilustrasi kasus one against all dapat dilihat pada Gambar 9, Gambar
10, Gambar 11, dan Gambar 12. Pada SVM ini akan dilakukan pengujian terhadap
empat buah data, yaitu: A, B, C, dan D. Data tersebut diklasifikasikan menjadi
empat kelas (kelas 1, kelas 2, kelas 3, dan kelas 4). Pada metode one against all
jika data akan diklasifikasikan menjadi empat kelas, maka jumlah SVM pun
menjadi empat. SVM yang terbentuk akan sebanyak kelas yang ada. Gambar 9
merupakan ilustrasi SVM 1 yang membagi kelas menjadi kelas 1 dan kelas bukan
1. Gambar 10 adalah ilustrasi SVM 2 yang membagi kelas menjadi kelas 2 dan
kelas bukan 2. Gambar 11 merupakan ilustrasi SVM 3 yang membagi kelas
menjadi kelas 3 dan kelas bukan 3. Gambar 12 merupakan ilustrasi SVM 4 yang
membagi kelas menjadi kelas 4 dan kelas bukan 4.

Gambar 10 Ilustrasi SVM 2

Gambar 11 Ilustrasi SVM 3

15

Gambar 12 Ilustrasi SVM 4
Tabel 2 Nilai kepercayaan data pada SVM
SVM
A
B
C
D
SVM 1
+7
+2
-2
-5
SVM 2
-2
-3
-4
+5
SVM 3
+6
-1
-7
-4
SVM 4
-2
-5
+3
+6
Hasil
Kelas 1 Kelas 4 Kelas 2 Kelas 3
Hasil dari klasifikasi data A, B, C, dan D dapat dilihat pada Tabel 2. Hasil
tersebut diperoleh dari kondisi berikut:
 Jika semua kelas pada masing-masing SVM menerima data (tanda yang
dimiliki data sesuai dengan tanda yang dimiliki kelas) maka absolutkan nilai
dari data lalu pilih nilai kepercayaan yang terbesar.
 Jika hanya satu kelas yang menerima data (hanya ada satu data yang tandanya
sesuai dengan tanda yang dimiliki kelas) kemudian akan diklasifikasikan ke
kelas yang menerima data tersebut.
 Jika data tidak diterima dikelas manapun (tanda yang dimilik data tidak ada
yang sesuai dengan tanda yang dimiliki kelas) kemudian absolutkan nilai dari
data dan cari nilai kepercayaan yang terkecil karena nilai yang didapat adalah
nilai penolakan yang terkecil.
Dari ketiga kondisi tersebut, dapat diketahui bahwa:
 A diklasifikasi ke dalam kelas 1. Semua SVM (keempat SVM) menerima nilai
yang ada, yaitu: pada SVM 1 adalah +7 (nilai dari kelas 1 adalah positif), pada
SVM 2 adalah -2 (nilai dari kelas 2 adalah negatif), SVM 3 adalah +6 (nilai
dari kelas 3 adalah positif), dan SVM 4 adalah -2 (nilai dari kelas 4 adalah
negatif). Absolutkan semua nilai kemudian cari nilai kepercayaan yang
terbesar. Hasil yang didapat adalah nilai 7. Nilai tersebut merupakan milik
SVM 1 yang menyatakan bahwa nilai tersebut diklasifikasikan ke dalam kelas
1.
 B diklasifikan ke dalam kelas 4. Tiga SVM menerima nilai yang ada, yaitu:
pada SVM 1 adalah +2 (nilai dari kelas A adalah positif), SVM 2 adalah -3
(nilai dari kelas 2 adalah negatif), dan pada SVM 4 adalah -5 (nilai dari kelas 4
adalah negatif) sedangkan pada SVM 3 adalah -1 tidak sesuai dengan nilai dari
kelas 3 yang positif . Absolutkan ketiga nilai yang sesuai dengan kelas lalu cari
nilai kepercayaan terbesar. Hasil yang didapat adalah 5. Nilai tersebut dimiliki
oleh SVM 4 dan menyatakan nilai tersebut diklasifikasikan ke dalam kelas 4.

16
 C diklasifikasikan ke dalam kelas 2 karena hanya satu SVM yang menerima
nilai tersebut yaitu SVM 2. Nilai kepercayaan SVM 2 adalah -4 (nilai dari
kelas 2 adalah negatif) sedangkan pada SVM 1 nilai kepercayaan yang didapat
adalah -2 (nilai dari kelas 1 adalah positif), SVM 3 nilai kepercayaan yang
didapat adalah -7 (nilai dari kelas 3 adalah positif), dan pada SVM 4 nilai
kepercayaan yang didapat adalah +3 (nilai dari kelas 4 adalah negatif). Oleh
karena itu, nilai kepercayaan tersebut masuk ke dalam kelas 2.
 D diklasifikasikan ke dalam kelas 3 karena tidak ada SVM yang menerima
nilai tersebut. SVM 1 memperoleh nilai kepercayaan -5 (nilai dari kelas 1
adalah positif), SVM 2 nilai kepercayaan yang diperoleh adalah +5 (nilai dari
kelas 2 adalah negatif), nilai kepercayaan SVM 3 adalah -4 (nilai dari kelas 3
adalah positif), dan SVM 4 nilai kepercayaan yang diperoleh adalah +6 (nilai
dari kelas 4 adalah negatif). Sehingga dari keempat nilai yang ada dicari nilai
kepercayaan yang terkecil karena nilai tersebut merupakan nilai penolakan
yang terkecil.

Klasifikasi Citra
Pada klasifikasi karakter dalam plat nomor diperlukan suatu struktur SVM
dengan output sebanyak 36 (26 huruf dan 10 angka). Input yang diperlukan akan
bergantung pada banyaknya elemen vektor yang dihasilkan pada tahap ekstrasi
ciri di atas. Dalam melakukan pelatihan dan pengujian data, karakter akan diambil
satu per satu dari kumpulan citra plat yang ada. Setiap karakter yang akan dilatih
harus dipastikan memiliki luas area (dimensi) yang sama satu sama lain.

Evaluasi dan Analisis Hasil
Tahap ini merupakan tahap terakhir untuk mengevaluasi kekurangan dan
kelebihan dari metode yang digunakan. Hal tersebut dilihat dari perbandingan
hasil klasifikasi citra dengan nomor polisi aslinya. Hasil yang tidak sesuai maupun
sesuai dicatat untuk menentukan seberapa besar akurasi dari metode ini. Untuk
menghitung akurasi dapat menggunakan rumus sebagai berikut:
=

N





× 100%

: jumlah citra yang berhasil terdekteksi
: jumlah data yang ada.

Lingkungan Pengembangan Sistem
Proses pengerjaan penelitian ini menggunakan perangkat keras dan
perangkat lunak dengan spesifikasi sebagai berikut:
Perangkat keras berupa notebook:
 Processor Intel Pentium Core 2 Duo @1.99GHz.

17
 RAM kapasitas 2 GB.
 Harddisk kapasitas 250 GB.
 Monitor dengan resolusi 1 280×800 pixel.
Perangkat lunak berupa:
 Sistem operasi Microsoft Windows 7.
 Aplikasi pemrograman Matlab R2008b.

HASIL DAN PEMBAHASAN
Pengumpulan Data
Penelitian ini menggunakan data berupa citra. Citra diambil dari pemotretan
100 unit, sehingga dihasilkan 100 buah citra plat yang unik. Pemotretan dilakukan
di halaman parkir kampus IPB Baranang Siang Bogor. Dari 100 buah citra
kemudian diambil potongan karakter. Setiap karakter diambil secara unik dan
acak sebanyak 50 buah. Karakter sendiri dapat berupa angka (0–9) dan huruf (A–
Z) jika dijumlahkan menjadi 36 karakter sehingga karakter yang digunakan dalam
penelitian ini adalah 1 800 karakter yang nantinya akan digunakan sebagai data
latih dan data uji. Selain itu citra plat nomor yang ada dapat digunakan sebagai
data uji plat. Contoh data karakter yang telah dipotong dapat dilihat pada Gambar
13.

Gambar 13 Contoh data karakter

Praproses Citra
Citra yang telah didapatkan dari hasil pemotretan tidak selalu memiliki
kualitas baik terkadang mengandung noise, hal ini dapat menyulitkan dalam
proses deteksi citra sehingga dapat berpegaruh pada akurasi. Selain itu terdapat
informasi yang tidak dibutuhkan dari citra yang dapat memperlambat proses
pendeteksian. Oleh karena itu, perlu adanya proses yang harus dilakukan sehingga
citra yang didapatkan memiliki kualitas yang baik untuk diproses lebih lanjut.
Awalnya citra yang didapat dengan model RGB. Model warna ini terlalu
kompleks karena terdiri dari tiga layer, yaitu: red, green, dan blue. Untuk
mempermudah dalam proses pendeteksian model tersebut dikonversi menjadi

18
model warna grayscale. Konversi model dilakukan dengan cara menghilangkan
informasi hue dan saturation dan mempertahankan informasi luminance.
Tahapan selanjutnya adalah menghilangkan noise pada citra dengan
menggunakan metode median filter. Metode ini sering digunakan untuk
menghilang noise berupa salt & pepper. Salt & pepper dapat dilihat seperti bintik
putih atau hitam yang terdapat pada pixel gambar. Median filter yang digunakan
adalah dua dimensi dengan batas matriks 3×3. Cara kerja median filter adalah
membaca nilai pixel yang akan diproses beserta pixel-pixel tetangganya, urutkan
nilai-nilai pixel dari yang paling kecil hingga yang paling besar, dan pilih nilai
pada bagian tengah untuk nilai yang baru bagi pixel (x,y). Banyaknya pixel yang
dibandingkan tergantung dari batas matriks yang ditentukan. Ilustrasi praproses
citra dapat dilihat pada Gambar 14.

Gambar 14 Gambar hasil praproses citra

Deteksi Tepi
Proses deteksi tepi yang dilakukan menggunakan metode deteksi tepi Canny
dengan threshold 0.5. Nilai ini digunakan karena mendeteksi tepi secara benar
sehingga menghasilkan deteksi tepi pada plat dengan hasil yang baik. Nilai
threshold mempengaruhi seberapa dalam deteksi tepi yang akan dilakukan. Hal ini
merupakan salah satu kelebihan metode ini. Pada proses ini dapat menghasilkan
citra biner yang merepresentasikan garis tepi dari setiap objek pada citra. Garis
tepi ini yang digunakan untuk memisahkan karakter yang diperlukan dengan
objek lainnya. Hal ini dapat mempercepat pengolahan citra agar lebih efisien.
Citra hasil deteksi tepi menggunakan metode deteksi tepi Canny pada plat dapat
dilihat pada Gambar 15.
Deteksi tepi Canny

Gambar 15 Hasil deteksi tepi dengan metode deteksi tepi Canny

19
Segmentasi Citra
Pada proses ini dilakukan segmentasi citra untuk memisahkan informasi
yang akan diproses pada tahap selanjutnya. Informasi yang dimaksud adalah
pixel-pixel pada karakter angka dan huruf. Informasi yang didapat akan
dipisahkan antara pixel yang mewakili huruf, karakter atau bukan keduanya.
Tahapan yang harus dilakukan adalah melakukan labelling dengan cara
mengelompokan pixel yang terhubung langsung dan memperhatikan 8 pixel
tetangganya. Setiap pixel yang terhubung akan dikelompokan dan diberi label.
Sehingga dapat diketahui panjang dan lebar area untuk setiap label. Variabel
tersebut akan dijadikan parameter untuk menentukan pixel yang mewakili huruf
dan angka. Panjang dan lebar area label dapat diukur sebagai berikut: jika 105
pixel < P < 140 pixel dan 20 pixel < L < 100 pixel maka label merupakan karakter
selainnya bukan karakter.
Label yang memenuhi syarat akan dianggap huruf atau angka. Pada
beberapa kasus label yang harusnya menjadi satu karakter tetapi komputer tidak
membaca label tersebut sebagai karakter yang utuh, misalnya angka 0 (nol) yang
diwakili oleh dua buah elips yang berukuran besar dan didalamnya elips yang
berukuran lebih kecil. Karena algoritma labelling mengecek pixel yang saling
berhubungan. Sedangkan angka 0 terdiri dari dua buah elips yang terpisah dan
memiliki jarak sehingga menjadi dua buah label yang berbeda. Untuk lebih
jelasnya dapat dilihat pada Gambar 16.

Gambar 16 Labelling pada angka nol
Kondisi ini berlaku untuk setiap angka ataupun huruf yang memiliki kondisi
seperti angka 0. Untuk mengatasi kondisi seperti ini, maka akan dilakukan
pengecekan pada setiap label. Jika salah satu label berada pada area label lainya,
maka label tersebut dianggap satu. Pada tahap ini sudah terkumpul label-label
yang mewakili karakter pada suatu plat dapat dilihat pada Gambar 17.
image segmentation

Gambar 17 Proses segmentasi pada plat

Normalisasi Citra
Pada hasil segmentasi sebelumnya telah didapatkan karakter-karakter yang
telah terpotong dari suatu plat, didapatkan ukuran area yang berbeda pada setiap
karakter. Hal ini dapat mempersulit dalam proses ekstraksi ciri. Oleh karena itu,
ukuran area setiap karakter akan dilakukan normalisasi menjadi 150×150 pixel.
Setiap karakter akan dirubah menjadi ukuran tersebut walaupun hal ini

20
menyebabkan bentuk karakter akan menjadi tidak proporsional. Normalisasi
sendiri dilakukan untuk semua karakter yang ada dan tidak akan mempengaruhi
informasi yang diperlukan pada proses ekstraksi ciri. Untuk lebih jelasnya bentuk
normalisasi dapat dilihat pada Gambar 18.

Gambar 18 Normalisasi pada karakter

Ekstraksi Ciri
Dalam penelitian ini ekstraksi ciri yan digunakan adalah image centroid and
zone (ICZ). Tahapan pertama dalam ekstraksi ciri yang harus dilakukan adalah
mencari nilai centroid dari setiap karakter yang telah melewati proses segmentasi.
Centroid pada setiap karakter tidak selalu sama, hal ini dikarenakan jumlah pixel
yang berbeda pada setiap karakter. Selanjutnya karakter akan dibagi menjadi n
zona bagian yang sama. Nilai n pada penelitian ini 25 karena pada zona ini
menghasilkan akurasi terbaik dari beberapa zona, yaitu: 5, 10, 14, 15, 20, dan 25.
Pembagian zona dengan kelipatan 5 untuk mempermudah dalam melakukan
pengujian. Pada setiap pembagian zona, jumlah baris selalu lebih banyak daripada
jumlah kolom atau jumlah baris sama dengan jumlah kolom. Setiap citra akan
dibagi kedalam jumlah zona yang sama. Ilustrasi dari jumlah zona untuk n yang
digunakan dapat dilihat pada Gambar 19.

5 Zona

10 Zona 14 Zona

15 Zona 20 Zona 25 Zona
Gambar 19 Ilustrasi pembagian zona pada ekstraksi fitur
Tahapan berikutnya yang harus dilakukan adalah menghitung jarak antara
centroid pada citra dengan masing-masing pixel yang berwarna putih (bernilai 1)
yang berada pada zona yang telah dipilih dengan menggunakan jarak Euclidean
dan dihitung jarak rata-rata pada setiap zona. Nilai rata-rata ini adalah ciri yang
merepresentasikan bentuk dari setiap karakter. Setelah dilakukan pada semua
karakter, nilai rata-rata yang didapat berbeda pada setiap karakter sehingga
menghasilkan pola yang berbeda pula. Pola dapat dijadikan pertimbangan pada
proses klasifikasi. Setiap pola merepresentasikan ekstraksi ciri pada setiap
karakter. Pada penelitian ini dicari zona yang efisien karena akan berpengaruh
pada proses pendeteksian plat nomor.

21
Gambar 20 merupakan pola ekstraksi fitur 25 zona pada huruf P dengan
menggunakan 50 citra. Pada Gambar 20 dapat dilihat bahwa tidak semua karakter
P memiliki pola yang sama, tetapi pola yang terbentuk memiliki kemiripan pada
karakter yang sama. Hal ini terjadi akibat metode ICZ menghitung nilai rata-rata
jarak pada setiap zona berdasarkan hasil praproses yang dilakukan pada citra.
Hasil praproses pada citra tidak selalu merepresentasikan bentuk aslinya dengan
baik sehingga berpengaruh pada proses ekstraksi fitur dan akibat ini pola yag
terbentuk tidak semua sama untuk suatu karakter. Pada Gambar 20 pola untuk
ekstraksi fitur pada huruf P dan Gambar 21 pola untuk ekstraksi fitur pada huruf I.
Pada Gambar 20 terlihat pola yang dihasilkan lebih baik dan hampir semua huruf
P memiliki pola yang sama sedangkan pada Gambar 21 dapat dilihat pola yang
dihasilkan oleh huruf I kurang baik sehingga pola yang dihasilkan untuk huruf I
memiliki bentuk yang beragam. Hal ini pun berpengaruh pada akurasi yang
dihasilkan oleh masing-masing karakter dengan pengujian 50 citra untuk masingmasing karakter. Pada karakter P menghasilkan akurasi 100 % sedangkan pada
huruf I menghasilkan akurasi 86 %.
Gambar 22 (kanan) adalah hasil dari praproses citra yang kurang baik dan
Gambar 22 (kiri) merupakan hasil dari praproses citra yang baik.

Gambar 20 Pola ekstraksi fitur
pada huruf P

Gambar 21 Pola ekstraksi fitur pada
huruf I

Gambar 22 Hasil dari citra dengan praproses yang tidak baik (kanan) dan
praproses yang baik (kiri)
Jika semakin mirip pola pada 50 karakter yang sama maka akan
memperkuat ciri dari karakter tersebut sehingga dapat mempermudah dalam
proses pendeteksian plat karena karakter tersebut mudah dikenali. Proses
pembagian zona berpengaruh pada banyaknya pixel yang dihitung pada masingmasing zona. Semakin sedikit zona dibagi maka jumlah pixel pada setiap zona
akan semakin banyak. Oleh karena itu, pembagian zona dan jumlah pixel
berbanding terbalik.

22
Klasifikasi Citra
Pada tahap ini dilakukan proses pembagian data latih dan data uji pada
semua citra karakter karena akan dilakukan proses pelatihan dan pengujian.
Jumlah karakter yang digunakan adalah 36 karakter yang terdiri dari angka dan
huruf dan masing-masing karakter terdiri dari 50 citra sehingga jumlah seluruh
citra adalah 1800 citra. Pembagian jumlah data latih adalah 40 citra dan data uji
adalah 10 citra untuk masing-masing karakter.
Metode yang digunakan dalam menentukan data uji dan data latih
menggunakan k-fold cross validation dengn k yang bernilai 5. Sehingga didapat 5
subset atau variasi pada data latih dan data uji. Pemilihan subset ini berdasarkan
persentase data yang diinginkan, yaitu: 80% untuk data latih dan 20% untuk data
uji. Matriks yang terbentuk untuk data latih adalah n×1 440 dan data uji n×360.
Huruf n mewakili jumlah zona yang telah ditentukan pada tahap ekstraksi ciri, 1
440 adalah banyaknya sampel karakter data latih, dan 360 banyaknya sampel
karakter data uji. Jumlah kelas dari penelitian ini adalah 36 kelas sesuai dengan
jumlah karakter yang digunakan.
Klasifikasi yang digunakan adalah suport vector machine (SVM) dengan 3
kernel, yaitu:
1 Kernel linear
2 Kernel polynomial dengan d ( 2 dan 3 )
3 Kernel radian basis function (RBF) dengan σ ( 25, 26 , 27 dan 28 )

Pengujian Per Karakter
Setelah proses ekstraksi fitur, dilakukan pengujian dan pelatihan dengan
menggunakan klasifikasi SVM. SVM hanya dapat melakukan klasifikasi dua
kelas. Oleh karena itu, kita harus memodifikasi fungsi SVM agar dapat melakukan
klasifikasi untuk banyak kelas, fungsi yang digunakan adalah multi class SVM
dengan metode one against all. Pada teknik ini dapat dibuat SVM sebanyak kelas
yang ada yaitu 36 buah. Setiap SVM mewakili setiap kelas, contoh SVM 1
mewakili kelas “nol” sehingga SVM ini hanya dapat mengenali citra karakter
“nol” dan “bukan nol”.
Pemodelan SVM dibangun dengan 3 fungsi kernel, yaitu: kernel linear
(polynomial berderajat 1), kernel polynomial berderajat 2