pixel
objek secara vertikal untuk memperoleh informasi tentang
pixel
garis yang memiliki kelompok
pixel
tertentu yang merupakan representasi dari suatu objek karakter. Persamaan dari
vertical projection
dapat ditulis sebagai berikut: �
�
[ ] = ∑ [ , ]
=
2.3 Dengan:
P
v
= vektor
P
v
pada baris ke-
i S
= citra masukan berupa citra biner
R,C
= ukuran baris dan kolom citra Hasil dari
vertical projection
yaitu menemukan
line image
suatu objek sehingga langkah selanjutnya adalah segmentasi karakter.
Segmentasi karakter dilakukan untuk memperoleh setiap objek karakter yang terkandung dalam citra. Proses yang dikerjakan untuk melakukan
segmentasi karakter adalah menerapkan
horizontal projection
untuk mendapatkan informasi posisi
pixel
yang memungkinkan kita potong untuk memperoleh karakter tersebut. Persamaan
horizontal projection
adalah sebagai berikut: �
ℎ
[ ] = ∑ [ , ]
� =
2.4
Dengan:
P
h
= vektor
P
h
pada kolom ke-
j S
= citra masukan berupa citra biner
R,C
= ukuran baris dan kolom citra Langkah pertama adalah melakukan
vertical projection
yaitu memproyeksikan
pixel
objek secara vertikal untuk memperoleh informasi tentang
pixel
garis yang memiliki kelompok
pixel
tertentu. Kelompok
pixel
inilah yang merupakan representasi dari suatu objek
karakter. Persamaan dari
vertical projection
dapat dilihat pada persamaan 2.3. Misalnya kita memiliki sebuah citra biner aksara Jawa
pa
dan
ra
dalam satu bagian.
Gambar 2.10 Citra Biner “Para”
Gambar 2.10 merupakan contoh representasi citra aksara
pa
dan
ra
. Dengan melakukan
vertical projection
pada Gambar 2.10 maka kita akan menjumlahkan nilai setiap pixel pada semua baris di setiap
kolomnya untuk mengetahui letak garis pada masing-masing aksara. Pada citra biner, komponen yang berwarna hitam mempunyai nilai
pixel
0 dan komponen putih mempunyai nilai
pixel
1, sehingga dapat kita peroleh matriks proyeksi vertikalnya adalah
[ 0 5 1 5 1 5 1 5 0 1 1 6 1 1 5 0 ]. Dengan hasil yang diperoleh dapat disimpulkan bahwa jika nilai
pada matriks sama dengan 0 berarti pada kolom tersebut tidak terdapat objek, sebaliknya jika nilai pada matrik lebih dari 0 maka menandakan
pada kolom tersebut terdapat objek. Dengan kata lain, dapat kita katakan bahwa pada citra tersebut terdapat 2 objek, yaitu objek pertama
terletak pada kolom ke-2 sampai ke-8 sedangkan objek kedua terletak pada kolom ke-10 sampai ke-15.
Setelah melakukan proyeksi secara vertikal lalu dilanjutkan dengan proyeksi horizontal. Proyeksi horizontal
horizontal projection
dilakukan untuk mengetahui batas atas dan batas bawah pada objek agar secara tepat dapat dipisahkan atau dipotong. Persamaan dari
horizontal projection
dapat dilihat pada persamaan 2.4. Prinsip kerja dari
horizontal projection
adalah menjumlahkan
pixel
masing-masing baris untuk semua kolom pada baris tersebut. Berdasarkan Gambar 2.10
dapat kita peroleh matriks proyeksi horizontalnya adalah [ 0 6 7 6 6 6
7 0 ]. Berdasarkan hasil dari matriks tersebut dapat disimpulkan bahwa batas paling atas pada objek tersebut berada pada baris ke-2 dan batas
paling bawah berada pada baris ke-7. Secara visual, hasil dari
projection profile vertical
dan
horizontal projection
dapat dinyatakan sebagai berikut:
Gambar 2.11
Projection Profile
dari Citra Aksara
Pa
dan
Ra
Gambar 2.11 adalah representasi citra hasil
projection profile
terhadap Gambar 2.10. Gambar sebelah kiri adalah aksara
pa
dan sebelah kanan adalah aksara
ra
yang telah tersegmentasi dengan baik. Dengan
projection profile
maka kita dapat memisahkan masing-masing aksara yang menyusun sebuah kata pada citra nama jalan.
2.5.5
Resizing Resizing
atau mengubah ukuran citra merupakan sebuah cara untuk mengubah dimensi citra dengan ukuran tertentu sehingga
informasi
pixel
dari citra tersebut juga berubah. Sebagai contoh, ketika ukuran citra diperkecil maka informasi
pixel
yang tidak dibutuhkan akan dihilangkan sedangkan ketika ukuran citra diperbesar maka akan
ditambahkan informasi
pixel
baru untuk memperoleh ukuran citra yang lebih besar.
2.6 ICZ-ZCZ
ICZ merupakan kependekan dari
Image Centroid and Zone
. Ekstraksi ciri ICZ pada dasarnya bekerja dengan mencari titik
centroid
dari citra kemudian citra dibagi menjadi
n
zona yang sama. Jika citra sudah dibagi kedalam
n
zona kemudian menghitung jarak antara masing-masing
pixel
yang ada disetiap zona dengan titik
centroid
-nya. Total nilai jarak yang ada disetiap
zona merupakan nilai rerata dari jarak semua
pixel
di zona tersebut. Hasil dari ekstraksi ciri ICZ akan menghasilkan
n
fitur dari objek tersebut. ZCZ merupakan kependekan dari
Zone Centroid and Zone
. Ekstraksi ciri ZCZ bekerja dengan membagi citra menjadi
n
zona kemudian masing- masing zona dihitung titik
centroid
-nya masing-masing. Setelah didapatkan titik
centroid
kemudian menghitung jarak semua pixel di zona tersebut dengan titik
centroid
. Total nilai jarak yang diperoleh di tiap zona merupakan rerata semua jarak yang dihasilkan. Langkah tersebut diulang sebanyak
n
zona yang ada sehingga hasil dari ekstraksi ciri ZCZ menghasilkan
n
fitur. Perbedaan yang mendasar dari ekstraksi ciri ICZ dan ZCZ adalah
penghitungan
centroid
dan pembagian zona yang dilakukan. ICZ bekerja dengan mencari titik
centroid-
nya terlebih dahulu kemudian citra dibagi kedalam
n
zona yang sama sehingga akan didapatkan satu titik
centroid
sedangkan ZCZ membagi
n
zona citra kemudian masing-masing zona dicari titik
centroid
-nya sehingga didapatkan
centroid
sebanyak jumlah zona yang ada. ICZ-ZCZ merupakan gabungan dari kedua ekstraksi ciri tersebut
sehingga hasil dari ekstraksi cirinya akan diperoleh sebanyak
2n
fitur. Rumus yang digunakan untuk mencari titik
centroid
dapat dinyatakan sebagai berikut:
�
= ∑
.
� =
∑
� =
2.5
�
= ∑
.
� =
∑
� =
2.6 Dengan:
x
c
=
centroid
pada koordinat
x y
c
=
centroid
pada koordinat
y x
i
= koordinat titik
x
ke-
i y
i
= koordinat titik
y
ke-
i p
i
= nilai
pixel
pada titik ke-
i
Dalam penghitungan jarak antara
centroid
dengan nilai pixel yang ada di dalam zona menggunakan perhitungan jarak
Euclidean distance
dengan rumus seperti pada persamaan 2.7.
Misalkan terpadat sebuah citra aksara
pa
seperti Gambar 2.11. Pinsip kerja dari ekstraksi ciri menggunakan ICZ adalah sebagai berikut. Langkah
pertama adalah mencari titik
centroid
-nya. Citra masukkan untuk proses ektraksi ciri adalah citra biner, sehingga objek dari citra memiliki representasi
nilai 1, atau bagian yang berwarna putih. Dengan demikian nilai
x
i
dan
y
i
adalah 1 sedangkan untuk nilai
p
i
tergantung dari sumbu mana yang akan kita cari, jika sumbu
x
maka nilai
p
i
merupakan nilai koordinat objek pada sumbu
x
sedangkan jika sumbu
y
maka nilai
p
i
merupakan nilai koordinat objek pada sumbu
y.
Berdasarkan persamaan 2.5 dan 2.6 ketika suatu bilangan dikalikan 1 akan menghasilan bilangan itu sendiri maka secara sederhana kita cukup
menjumlahkan nilai koordinat pada masing-masing sumbu untuk seriap
pixel
objeknya. Titik centroid untuk
�
dan
�
dapat dihitung dengan:
�
=
+ + + + + + + + + + + + + + + + + + + + + +
= =
�
=
+ + + + + + + + + + + + + + + + + + + + + +
= = .
Dengan hasil yang diperoleh maka pusat massa
centroid
objek tersebut berada di titik 4, 3.82. Setelah titik
centroid
diperoleh maka objek tersebut kita bagi menjadi beberapa zona. Untuk mempermudah perhitungan kita bagi
menjadi 3 zona secara horizontal. Jika citra sudah dibagi kedalam 3 zona
kemudian menghitung jarak antara masing-masing
pixel
yang ada disetiap zona terhadap titik
centroid
-nya. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua
pixel
di zona tersebut. Hasil dari ekstraksi ciri ICZ akan menghasilkan 3
fitur dari objek tersebut, sesuai dengan jumlah pembagian zona yang diberikan. Adapun persamaan yang
digunakan untuk menghitung nilai jarak adalah menggunakan
euclidean distance
seperti pada persamaan 2.7.
Gambar 2.12 Pembagian Zona dan Perhitungan Jarak ICZ Gambar 2.12 merupakan representasi pembagian zona menggunakan ICZ
yang dibagi menjadi 3 zona sama besar secara horizontal pada citra aksara
pa
. Perhitungan untuk fitur pada zona 1 adalah sebagai berikut:
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= . + . + . + . + . + .
= .
Berdasarkan hasil perhitungan diatas maka ciri atau fitur dari zona 1 adalah 3.01. Cara yang sama juga berlaku untuk mencari nilai ciri atau fitur pada
zona 2 dan zona 3 sehingga diperoleh fitur zona ke 2 adalah 2.11 serta zona 3 adalah 2.66. Jika digabung akan menghasilkan 3 fitur, yaitu
[ 3.01 2.11 2.66 ]. Setelah semua ciri yang dihitung menggunakan metode ICZ diperoleh
maka dilanjutkan dengan mengekstrak ciri objek menggunakan metode ZCZ. Prinsip kerja dari ekstraksi ciri menggunakan ZCZ adalah sebagai
berikut. Langkah pertama adalah membagi kedalam beberapa zona, sama dengan langkah sebelumnya, yaitu membagi ke dalam 3 zona secara
horizontal kemudian mencari titik
centroid
untuk setiap zona yang ada. Setelah didapatkan titik
centroid
-nya, lalu menghitung jarak antara masing- masing
pixel
yang ada disetiap zona terhadap titik
centroid
-nya menggunakan
euclidean distance
. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua
pixel
di zona tersebut. Hasil dari ekstraksi ciri ZCZ akan menghasilkan 3
fitur dari objek tersebut, sesuai dengan jumlah pembagian zona yang diberikan.
Adapun titik
centroid x
c
dan
y
c
pada zona 1 adalah sebagai berikut:
�
= + + + + +
= =
�
= + + + + +
= = .
Dengan demikian maka titik
centroid
pada zona 1 adalah 4, 1.67. Proses yang sama juga dilakukan untuk mencari titik centroid pada zona 2 dan zona
3, yang masing-masing titik
centroid
-nya adalah 4, 1.50 dan 4, 1.56.
Gambar 2.13 Pembagian Zona dan Perhitungan Jarak ZCZ Gambar 2.13 merupakan representasi pembagian zona menggunakan ZCZ
yang dibagi menjadi 3 zona sama besar secara horizontal pada citra aksara
pa
. Perhitungan untuk fitur pada zona 1 adalah sebagai berikut:
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= √ − +
− . = .
= . + . + . + . + . + .
= .
Berdasarkan hasil perhitungan diatas maka ciri atau fitur dari zona 1 adalah 2.06. Cara yang sama juga berlaku untuk mencari nilai ciri atau fitur pada
zona 2 dan zona 3 sehingga diperoleh fitur zona ke 2 adalah 2.08 serta zona 3 adalah 1.90. Jika digabung akan menghasilkan 3 fitur, yaitu
[ 3.01 2.11 2.66 ]. Setelah didapatkan masing-masing 3 fitur menggunakan metode ICZ
dan ZCZ lalu fitur tersebut digabungkan sehingga menjadi 6 fitur yang merepresentasikan citra tersebut sehingga dapat ditulis
[ 3.01 2.11 2.66 2.06 2.08 1.90 ].
2.7
Template Matching
Model klasifikasi yang digunakan dalam penelitian ini adalah menggunakan
template matching
. Pendekatan
template matching
dipilih karena paling mudah untuk diterapkan dan sesuai dengan karakteristik data
yang akan dikenali. Prinsip pendekatan
template matching
untuk klasifikasi adalah mengukur kedekatan atau kesamaan
similarity
antar objek atau
entities
yang diperbandingkan. Objek yang diperbandingkan adalah data uji yang akan dikenali dengan
database template
yang sudah disimpan. Ketika suatu objek baru yang ingin dikenali dibandingkan dengan
database template
kemudian diperoleh nilai kesamaan yang relatif besar maka secara langsung objek baru tersebut dapat diklasifikasikan atau dikenali sesuai dengan
template
pembandingnya. Secara umum rumus yang biasa digunakan untuk mengukur jarak antar 2 objek adalah menggunakan
euclidean distance
. Adapun rumus
euclidean distance
dapat ditulis sebagai berikut:
, = √∑
−
� =
2.7
Dengan:
dx,y
= jarak antara vektor objek
x
dan
y n
= jumlah dimensi objek
x
k
, y
k
= nilai vektor objek
x
dan
y
ke-
k