3.2 Akuisisi Data
Data sampel yang digunakan dalam penelitian ini adalah citra huruf hijaiyah tulisan tangan yang dibubuhkan pada kertas putih menggunakan dengan tinta pena warna
hitam. Setelah pengambilan data, data tersebut di scan dan disimpan dalam file .bmp. Data sampel dikumpulkan sebanyak 240 pola tulisan tangan berbentuk huruf hijaiyah
dari 10 orang, yang setiap orangnya terdiri dari 7 pola huruf hijaiyah. Setiap huruf tulisan tangan disimpan pada file citra yang berbeda. Setiap citra disimpan dengan
ukuran awal 700x700 piksel , yang nanti akan diolah kembali menjadi ukuran 70x70. Total seluruh data sampel adalah 240 pola huruf hijaiyah tulisan tangan. Dari
total data tersebut, dibagi penggunaannya untuk data pelatihan training dan data pengujian testing. Banyaknya data training adalah 210 huruf hijaiyah tulisan tangan
dan data testing sebanyak 30 huruf hijaiyah tulisan tangan. Data sampel yang digunakan pada penelitian ini dapat dilihat pada lampiran A.
3.3 Pre-processing
Tahapan proses pengolahan citra dapat dilihat pada gambar 3.2.
Gambar 3.2 Tahapan pre-processing
Pengolahan citra dimulai dengan mengubah citra kedalam citra biner dengan proses thresholding , tahap selanjutnya adalah pemotongan cropping disertai dengan
normalisasi citra menjadi ukuran yang seragam yaitu ukuran 70x70 piksel. Citra yang telah dinormalisasi kemudian akan masuk ketahapan pengurusan objek thinning
Pembentukan Citra biner thresholding Pemotongan cropping citra
Normalisasi Resolusi citra normalization Pengurusan objek citra thinning
Pre-processing
Universitas Sumatera Utara
untuk mendapatkan kerangka dari objek huruf. Citra hasil thinning yang kemudian digunakan untuk tahap ekstraksi fitur.
3.3.1. Pembentukan Citra Biner Threshold Pada tahap ini citra huruf hijaiyah akan diubah menjadi citra biner ,dimana citra biner
merupakan citra yang hanya memiliki dua nilai warna, yaitu 0 hitam dan 254 putih. Nilai threshold yang ditentukan akan menjadi batasan. Pada penelitian ini nilai
threshold yang digunakan adalah 127. Nilai yang lebih kecil dari threshold diubah menjadi nilai 0 dan nilai yang lebih besar dari threshold diubah menjadi 255. Pada
gambar 3.3 merupakan contoh citra huruf hijaiyah hasil thresholding.
Gambar 3.3 Citra hasil thresholding
3.3.2. Pemotongan Citra Cropping Pemrosesan citra selanjutnya adalah pemotongan citra crop dengan menghilangkan
area putih yang tidak berisi objek huruf. Citra hasil threshold dipotong sesuai dengan batasan objek huruf tulisan tangan yaitu pemotongan secara horizontal dan
pemotongan secara vertikal .Hal ini dilakukan untuk membantu proses pengurusan objek thinning.
Pemotongan citra secara horizontal dimulai dengan menghitung jumlah piksel berwarna putih setiap kolom yang dimiliki oleh citra. Pada sistem yang dibangun
,untuk menentukan bagian awal pemotongan, pemeriksaan kolom dimulai dari citra bagian kiri. Kolom pertama memiliki piksel putih kurang dari 90 akan dijadikan
bagian awal pemotongan. Untuk menentukan bagian akhir pemotongan dilakukan pemeriksaan pada bagian kanan citra. Kolom pertama yang memiliki putih kurang
dari 90 akan dijadikan bagian akhir pemotongan.
Universitas Sumatera Utara
Proses pemotongan citra secara vertikal hampir sama dengan pemotongan horizontal hanya saja pemotongan citra secara vertikal dimulai dengan menghitung
putih pada setiap baris yang dimiliki oleh citra. Penentuan bagian awal pemotongan dengan cara memeriksa baris pada bagian atas citra. Baris pertama yang memiliki
piksel warna putih kurang dari 90 akan dijadikan awal pemotongan dan untuk bagian akhir pemotongan diperiksa pada baris dimulai dari bagian bawah citra dengan
batasan nilai yang sama. Citra biner yang dipotong dapat dilihat pada gambar 3.4.
Gambar 3.4 Citra hasil cropping
3.3.3. Normalisasi Resolusi Citra Normalization Citra yang telah di crop memiliki ukuran yang berbeda-beda sehingga belum bisa
digunakan sebagai inputan standart untu di ekstraksi. Sebagai contoh ukuran citra huruf dzo hasil pemotongan pada tahap sebelumnya adalah 78x80. Citra tersebut akan
melalui tahapan normalisasi resolusi normalization terlebih dahulu dengan menggunakan ukuran citra 70x70 pixel. Citra hasil normalisasi dapat dilihat pada
Gambar 3.5.
Gambar 3.5 Citra hasil normalisasi
3.3.4. Pengurusan Objek Citra Thinning Proses selanjutnya yaitu pengurusan objek citra dimana objek huruf hijaiyah tulisan
tangan yang terdapat pada citra akan di kuruskan thinning hingga ketebalan hanya 1 pixel tetapi tidak merubah informasi dan karakteristik penting dari objek tersebut.
Universitas Sumatera Utara
Melalui proses pengurusan ini akan didpat kerangka dari objek tuisan tangan huruf hijaiyah. Peneliti menggunakan algortima Zhang-Shuen untuk proses thinning citra.
Algoritma Zhang-Shuen ini menggunakan metode parealel dimana nilai baru bagi tiap-tiap piksel dihasilkan dari nilai piksel pada iterasi sebelumnya. Tahapan dari
proses ini dapat dilihat pada sub bab 2.3.4 mengenai thinning . Citra hasil thinning merupakan hasil akhir dari tahapan pre-processing citra dan citra ini dapat digunakan
pada tahap ekstraksi fitur. Hasil pengurusan objek citra dapat dilihat pada gambar 3.6.
Gambar 3.6 Citra hasil thinning 3.4 Ekstraksi Ciri Feature Extraction
Setelah citra hasil thinning didapat, tahap selanjutnya adalah tahapan ekstraksi ciri, pada penelitian ini penulis menggunakan metode ekstraksi ciri zonning. Metode ini
memiliki beberapa variasi algoritma, dan pada penelitian ini menggunakan variasi algoritma Image Centroid and Zone ICZ , dan Zone Centroid and Zone ZCZ .
Gambar 3.7 merupakan citra ilustrasi huruf “S” berukuran 5x9 pixel yang akan melalui tahap ekstraksi ciri menggunakan algoritma ICZ dan algoritma ZCZ .
Gambar 3.7 Citra ilustrasi untuk algoritma ICZ dan ZCZ
Universitas Sumatera Utara
Dengan menggunakan algoritma Image Centroid and Zone, pertama yang harus dihitung adalah centroid pusat dari citra. Centroid dari citra dinyatakan dengan nilai
koordinat titik , . Cara menghitung centroid citra yaitu pada persamaan 3.1
.................3.1 Dengan fx,y adalah nilai piksel dari citra pada posisi tertentu. Hasil perhitungan
yaitu nilai = 3 dan
= 5 sehingga didapatkan nilai centroid citra yaitu 3,5. Setelah nilai centroid didapat, selanjutnya citra dibagi menjadi n zona yang sama,
misalkan menjadi 3 zona, yaitu zona atas, zona tengah dan zona bawah, dengan masing-masing zona berukuran 5x3 pixel Kemudian, dihitung jarak antara centroid
dan setiap piksel yang ada dalam zona, dalam hal ini piksel yang digunakan adalah piksel non-background. Jarak tersebut dapat diperoleh menggunakan rumus jarak
Euclid sebagai berikut : Jarak =
√ − + −
............. 3.2
Gambar 3.8 Perhitungan jarak pikel non-background dengan image centroid zona 1
Untuk zona 1 zona atas, perhitungan jarak, yang di visualisasikan pada gambar 3.8 dilakukan dengan perhitungan sebagai berikut :
Universitas Sumatera Utara
1,3 Jarak =
√ − + −
= 2.83 2,2
Jarak = √ −
+ − = 3.16
3,1 Jarak =
√ − + −
= 4 4,2
Jarak = √ −
+ − = 3.16
5,3 Jarak =
√ − + −
= 2.83 Setelah hasil jarak centroid-pixel untuk masing-masing pixel didapat,
selanjutnya hitung rata-rata jarak dengan persamaan :
.... 3.3 Hasil jarak rata-rata centroid-pixel untuk zona 1 adalah 3,196. Dengan cara
yang sama, jarak centroid-pixel dihitung untuk setiap pixel pada zona 2 tengah dan 3 bawah, kemudian dihitung rata-ratanya sehingga jarak rata-rata centroid-pixel yang
didapat untuk zona 2 dan 3 berturut-turut ialah 0,94 dan 3,196. Ekstraksi ciri dengan menggunakan algoritma Zone Centroid and Zone,
pertama sekali citra akan langsung dibagi menjadi n zona yang sama, sama hal nya dengan ICZ , maka zona dibagi menjadi 3 zona yaitu zona atas , zona tengah , dan
zona bawah. Kemudian zone centroid masing-masing zona dihitung dengan menggunakan persamaan 3.1 . Didapatlah hasil perhitungan zone centroid sebagai
berikut : Zona 1 atas :
= 3 , = 2.2 Zona 2 tengah :
= 3 , = 5 Zona 3 bawah :
= 3 , = 7.8
Kemudian, untuk masing-masing zona , jarak antara centroid masing-masing zona dan setiap piksel non-background yang ada di dalam zona di cari menggunakan
rumus jarak Euclid persamaan 3.2.
Universitas Sumatera Utara
Gambar 3.9 Perhitungan jarak pikel non-background dengan image centroid zona 1
Untuk zona 1 atas, perhitungan jarak yang di visualisasikan pada gambar 3.9 dilakukan perhitungan sebagai berikut :
1,3 Jarak =
√ − + − .
= 2.15 2,2
Jarak = √ −
+ − . = 1.02
3,1 Jarak =
√ − + − .
= 1.2 4,2
Jarak = √ −
+ − . = 1.02
5,3 Jarak =
√ − + − .
= 2.15 Setelah hasil jarak centroid-pixel untuk masing-masing pixel non-background
pada zona 1 didapat, selanjutnya hitung rata-rata jarak dengan persamaan 3.3. Hasil perhitungan rata-rata jarak di dapat untuk setiap piksel zona 2 tengah dan zona 3
bawah berturut-turut ialah 0.94 dan 1.508 Dengan demikian, ketiga nilai dari masing-masing algoritma ini tersimpan
dalam format .data yang kemudian akan digunakan dalam pelatihan danatau pengujian Support Vector Machine SVM.
3.5 Klasifikasi