Pengenalan Aksara Sunda Menggunakan Ekstraksi Ciri Zoning dan Klasifikasi Support Vector Machine

(1)

PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI

CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE

ISNAN MULIA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2012


(2)

PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI

CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE

ISNAN MULIA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2012

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada


(3)

ABSTRACT

ISNA N MULIA. Sundanese Script Recognition Using Zoning Feature Extraction and Support Vector Machine Classification. Superv ised by MUSHTHOFA.

This research aims to determine the most effective feature extraction method used in Sundanese script recognition. The data used in this research are generated in the form of image files, each of which contains a Sundanese character. Feature extraction method used is the variations of zoning method: Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), and combination of ICZ and ZCZ. The nu mber of zones used are 4, 6, 8, and 12 zones. Support Vector Machine is used as classifier, with linear, quadratic, polyno mial, and RBF kernel. A mong the feature extraction methods used, the hybrid feature extraction method ICZ and ZCZ obtain s maximu m accuracy for all the number of zones used. On the other side, the feature extraction method using 12 zones obtains the maximu m accuracy fo r all the feature extraction methods used. From th is result, it can be concluded that the most effective feature extraction method used in Sundanese script recognition is the hybrid method ICZ & ZCZ with 12 zones.

Keywords: pattern recognition, Sundanese script, support vector machine, zoning, image centroid and zone (ICZ), zone centroid and zone (ZCZ)


(4)

Penguji:

1. Aziz Kustiyo, S.Si, M.Ko m 2. Dr. Yen i Herdiyeni, S.Si, M.Ko m


(5)

Judul Skripsi : Pengenalan Aksara Sunda Menggunakan Ekstraksi Ciri Zoning dan Klasifikasi Support Vector Machine

Nama : Isnan Mulia

NRP : G64080006

Menyetujui, Pembimb ing

Mushthofa, S.Ko m, M.Sc NIP. 19820325 200912 1 003

Mengetahui,

Ketua Departemen Ilmu Ko mputer

Dr. Ir. Agus Buono, M.Si, M.Ko m NIP. 19660702 199302 1 001


(6)

KATA PENGAN TAR

Puji dan syukur penulis panjatkan ke hadirat A llah subhanahu wata’ala, yang telah memberikan nikmat yang begitu banyak, sehingga penulis dapat menyelesaikan penelitian dan tulisan ini. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu ‘alaihi wasallam, keluarganya, sahabatnya, serta umatnya hingga akhir zaman. Tulisan ini merupakan hasil penelitian yang penulis lakukan sejak Desember 2011 hingga Mei 2012. Tulisan ini mengambil topik pengenalan pola, dan bertujuan membangun model pengenalan pola karakter aksara Sunda.

Tak lupa penulis mengucapkan terima kasih kepada seluruh pihak yang telah berperan dalam penelitian ini, yaitu:

1 Ayahanda Muanas, Ibunda Tri Marlina, serta Adik Mulianto Raharjo atas kasih sayang, doa, semangat, dan dorongan kepada penulis agar dapat segera menyelesaikan penelitian in i. 2 Bapak Mushthofa, S.Ko m, M.Sc, selaku dosen pembimb ing, yang telah memberikan banyak

ide, masukan, dan dukungan kepada penulis.

3 Bapak A ziz Kustiyo, S.Si, M.Ko m dan Ibu Dr. Yeni Herd iyeni, S.Si, M.Ko m, yang telah bersedia menjad i penguji.

4 Rekan -rekan seperjuangan Ilko merz 45 atas segala dukungan, bantuan, dan kebersamaannya. Semoga kesuksesan senantiasa menyertai kita semua.

5 Muhammad Abrar Istiadi, Alif Kurn iawan, Abdul Qifli Sangadji, Arief Hidayatulloh, Annisa Anastasia, Ariel Febrila Niswar, Sri Rahayu, dan sahabat lainnya.

6 Rekan satu bimbingan, Dony Satria, semoga diberikan kelancaran dalam penelitiannya. 7 Pihak-pihak lain yang tidak dapat penulis sebutkan satu persatu.

Penulis berharap penelitian dan tulisan in i dapat memberikan manfaat untuk kemajuan masyarakat Indonesia pada umu mnya dan masyarakat Sunda pada khususnya.

Bogor, Agustus 2012


(7)

RIWAYAT HIDUP

Penulis dilahirkan di Bogor, Jawa Barat, pada tanggal 7 Januari 1991. Penulis merupakan anak pertama dari pasangan Muanas dan Tri Marlina. Penulis mengenyam pendidikan di SDN Sasana Wiyata I Kabupaten Bogor pada tahun 1996-2002, d ilan jutkan dengan SMP Negeri 1 Kota Bogor pada tahun 2002-2005, dan SMA Negeri 1 Kota Bogor pada tahun 2005-2008. Pada tahun 2008, penulis diterima di Departemen Ilmu Ko mputer Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB.

Selama aktif men jadi mahasiswa, penulis menjadi salah satu pengurus Himpunan Mahasiswa Ilmu Ko mputer (Himalko m) pada tahun 2010 sampai tahun 2012. Penulis juga men jadi asisten praktiku m untuk beberapa mata ku liah, yaitu Algoritme dan Pemrograman (2010), Organisasi Ko mputer (2011 dan 2012), Stru ktur Data (2011 dan 2012), dan Metode Kuantitatif (2011). Selain itu, penulis melaksanakan Praktik Kerja Lapangan di Direktorat Jenderal Hortikultura Kementerian Pertanian pada tahun 2011.


(8)

v

DAFTAR ISI

Hal aman

DAFTAR TABEL ... vi

DAFTAR GAMBAR ... vi

DAFTAR LAMPIRAN ... vi

PENDAHULUAN Latar Belakang ... 1

Tujuan ... 1

Ruang Lingkup ... 1

TINJA UAN PUSTAKA Digital Image (Citra Digital) ... 1

Ekstraksi Ciri ... 2

Metode Ekstraksi Ciri Zoning ... 2

K-fold Cross-validation ... 3

Support Vector Machine ... 3

METODE PENELITIA N Pengumpulan Data ... 4

Praproses Data ... 4

Ekstraksi Ciri ... 4

K-fold Cross-validation ... 6

Pelatihan Support Vector Machine ... 6

Pengujian Support Vector Machine ... 6

Analisis ... 6

Lingkungan Penelitian ... 6

HASIL DA N PEMBAHASA N Pengumpulan Data ... 6

Praproses Data ... 7

Ekstraksi Ciri ... 7

Klasifikasi Support Vector Machine ... 8

Analisis ... 8

SIMPULAN DAN SA RAN Simpu lan ... 9

Saran ... 10

DAFTAR PUSTA KA ... 10


(9)

vi

DAFTAR TABEL

Halaman

1 Pengelo mpokan beberapa variasi metode ekstraksi ciri zoning ... 2

2 Daftar ukuran data hasil ekstraksi ciri ... 7

3 Hasil aku rasi rata-rata berdasarkan metode ekstraksi ciri dan ju mlah zona yang digunakan ... 8

DAFTAR GAMBAR

Halaman

1 Keadaan linearly separable ... 3

2 Tahapan penelitian ... 4

3 Variasi untuk karakter "ka" ... 4

4 Contoh citra untuk algoritme ICZ dan ZCZ ... 5

5 Perhitungan jarak pixel non-background dengan image centroid untuk zona 1 ... 5

6 Perhitungan jarak pixel non-background dengan zone centroid untuk zona 1 ... 5

7 Contoh citra hasil pembangkitan data ... 7

8 (a) Citra sebelu m dilakukan praproses, (b) citra setelah dilakukan binerisasi dan pemotongan, serta (c) citra setelah dilakukan binerisasi, pemotongan, dan pengubahan ukuran ... 7

9 Hasil akurasi rata-rata berdasarkan (a) metode ekstraksi ciri, dan (b) ju mlah zona yang digunakan ... 8

10 Hasil akurasi berdasarkan jenis k ernel. ... 9

DAFTAR LAMPIRAN

Halaman 1 Contoh karakter aksara Sunda yang digunakan ... 12

2 Contoh citra asli, citra hasil praproses, dan data hasil ekstraksi ciri menggunakan algoritme ICZ dan ZCZ untuk citra angka ... 13

3 Hasil aku rasi keseluruhan untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dengan ju mlah zona 12 berdasarkan jenis k ernel yang digunakan ... 16


(10)

PENDAHULUAN

Latar Belakang

Pengenalan pola (pattern recognition) merupakan salah satu perkembangan dari kecerdasan buatan (artificial intelligence). Dengan pengenalan pola, ko mputer dapat mengenali pola-pola karakter yang dikenali oleh manusia untuk kemudian d iproses oleh ko mputer. Pengenalan pola dapat digunakan untuk mengenali tulisan tercetak maupun tulisan tangan, baik tulisan dengan aksara Latin mau-pun aksara non-Latin, seperti yang dilakukan oleh Rajashekararadhya dan Ranjan (2008). Salah satu contoh tulisan dengan aksara non-Latin ialah tulisan menggunakan aksara Sunda.

Aksara Sunda merupakan salah satu aksara daerah Indonesia. Aksara ini sudah digunakan oleh masyarakat Sunda sejak lima abad yang lalu. Sejak dikeluarkannya Surat Keterangan Gubernur Jawa Barat No mor 434/Sk.614-Dis.Pk/99 tentang pembakuan aksara Sunda, aksara Sunda seolah-olah dihidupkan kembali dalam keh idupan masyarakat Sunda di Jawa Barat (Baidillah et al. 2008). Bah kan, sejak April 2008, aksara Sunda sudah resmi masuk ke dalam Un icode, dan masuk ke dalam daftar karakter Un icode versi 5.1 (Unicode 2008). Salah satu cara untuk memasyarakatkan aksara Sunda ialah dengan mengajarkannya kepada siswa melalui buku pelajaran bahasa Sunda. Selain itu, aksara Sunda dapat juga digunakan dalam penulisan papan nama jalan, seperti yang terdapat pada papan nama jalan di beberapa kota di Jawa Barat.

Tulisan dengan aksara Sunda, baik yang terdapat pada papan nama jalan maupun buku bacaan, menimbu lkan masalah tersendiri bagi beberapa orang dalam memahaminya, terlebih bagi orang yang sama sekali belu m pernah mengenal aksara Sunda. Hal ini disebabkan oleh bentuk karakter pada aksara Sunda yang sangat berbeda dengan karakter pada aksara Latin. Selain itu, terdapat karakter tambahan untuk menyatakan suku kata tertentu. Karenanya, untuk mempermudah pengenalan aksara Sunda, diperlukan sebuah sistem ko mputer yang dapat membaca dan mengenali tu lisan dengan aksara Sunda.

Penelitian mengenai pengenalan aksara Sunda belum banyak dilaku kan. Salah satu penelitian mengenai hal ini yaitu penelitian yang dilakukan oleh Mubarok (2010). Dalam penelitian tersebut, dilakukan pengenalan guratan tulisan tangan aksara Sunda secara online (karakter masukan diproses secara

lang-sung) menggunakan sebuah aplikasi desk top dengan mouse sebagai media pemasukan data. Kemudian data masukan diolah dan dikenali menggunakan Kohonen Neural Network. Pene-litian tersebut mendapatkan akurasi rata-rata untuk guratan normal sebesar 75.36%, sedang-kan guratan ber-noise menghasilsedang-kan akurasi rata-rata sebesar 75.36%.

Penelitian ini akan membuat model penge-nalan aksara Sunda menggunakan ekstraksi ciri Zoning dan klasifikasi Support Vector Machine. Data yang digunakan adalah citra aksara Sunda tercetak. Variasi metode ekstraksi ciri yang digunakan adalah metode yang diajukan oleh Rajashekararadhya dan Ranjan (2008), yaitu Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), dan gabungan ICZ dan ZCZ. Dalam penelitiannya, Rajashekararadhya dan Ranjan memperoleh ting kat pengenalan rata-rata karakter angka Kannada, Telugu, Tamil, dan Malayalam yang ditulis tangan di atas 90% dengan metode ekstraksi ciri gabungan ICZ dan ZCZ untuk hasil klasifikasi menggunakan Jaringan Saraf Tiruan dan KNN.

Tujuan

Tujuan dari penelitian ini ialah menentukan metode ekstraksi ciri yang paling efektif di antara metode ekstraksi ciri yang digunakan untuk pengenalan aksara Sunda.

Ruang Lingkup

Ruang lingkup dari penelitian ini yaitu: 1 Karakter aksara Sunda yang digunakan

adalah karakter swara (vokal), ngalagena (konsonan), dan angka (0–9), tanpa karakter imbuhan (penambah dan pengubah suara), berdasarkan naskah yang terdapat pada Unicode.

2 Model yang akan dikembangkan mengenali pola aksara hasil cetakan (OCR), bukan tulisan tangan.

3 Metode yang digunakan untuk menerapkan multi-class SVM ialah metode one-versus-all.

TINJAUAN PUSTAKA

Digital Image (Citra Digital)

Menurut Gonzales dan Woods (2002), sebuah citra dapat didefinisikan sebagai fungsi dua dimensi f(x , y), dengan x dan y adalah koordinat spasial atau bidang, dan nilai amp litudo f untuk masing-masing pasangan x dan y disebut intensitas atau derajat keabuan dari citra pada titik tersebut. Jika nilai x, y, serta


(11)

nilai amp litudo f berupa nilai d iskret, citra disebut citra digital. Citra digital tersusun atas sejumlah elemen yang masing-masing memiliki nilai dan lokasi tertentu yang disebut dengan picture elements (pixels).

Ekstr aksi Ciri

Devijver dan Kittler (1982, diacu dalam Trier et al. 1995) mendefinisikan ekstraksi ciri sebagai masalah “mengekstraksi informasi yang sangat relevan dari data mentah untuk proses klasifikasi, dalam arti meminimalkan variabili-tas pola dalam kelas sambil memperbesar varia-bilitas pola antarkelas.”

Metode Ekstraksi Ciri Zoning

Zoning merupakan salah satu metode ekstraksi ciri pada citra karakter. Secara u mu m, dengan metode ekstraksi ciri zoning, citra akan dibagi menjadi beberapa zona yang berukuran sama. Setiap zona kemudian d iambil cirinya.

Ada beberapa variasi algoritme untuk metode ekstraksi ciri zoning, yang dapat dikelo mpokkan berdasarkan

Tabel 1 Pengelo mpokan beberapa variasi metode ekstraksi ciri zoning

Kelo mpok Referensi

Ciri yang diambil Rata-rata jarak

antara pixel dan titik acuan

Rajashekararadhya dan Ranjan (2008), Gatos et al. (2011)

Rata-rata sudut antara pixel dan titik acuan

Rajashekararadhya dan Ranjan (2009a), Rajashe-kararadhya dan Ran jan (2009b)

Titik acuan

Image centroid Rajashekararadhya dan Ranjan (2008), Rajashe-kararadhya dan Ran jan (2009a), Rajashekarara-dhya dan Ranjan (2009b) Zone centroid Rajashekararadhya dan

Ranjan (2008), Rajashe-kararadhya dan Ran jan (2009b)

Titik lain Gatos et al. (2011) Posisi zona

Tetap Rajashekararadhya dan Ranjan (2008), Rajashe-kararadhya dan Ran jan (2009a), Rajashekarara-dhya dan Ranjan (2009b) Berubah-ubah

(adaptif)

Gatos et al. (2011)

Beberapa di antaranya tercantum dalam Tabel 1. Dalam penelitian in i, variasi metode ekstraksi ciri zoning yang digunakan adalah variasi yang disebutkan oleh Rajashekararadhya dan Ranjan (2008), yaitu metode ekstraksi ciri jarak metrik ICZ (image centroid and zone), metode ekstraksi ciri jarak metrik ZCZ (zone centroid and zone), dan metode ekstraksi ciri gabungan (ICZ dan ZCZ). Tahapan pengerjaan dari masing-masing algoritme akan dijelaskan sebagai berikut.

 Metode ekstraksi ciri jarak metrik Image Centroid and Zone

1 Hitung centroid (pusat) dari citra masukan.

2 Bagi citra masukan men jadi n zona yang sama.

3 Hitung jarak antara centroid citra dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang

ada dalam zona.

5 Hitung jarak rata-rata antara titik-titik tersebut.

6 Ulangi langkah 3–5 untuk semua zona secara berurutan.

7 Akhirnya, akan didapatkan n ciri untuk klasifikasi dan pengenalan.

 Metode ekstraksi ciri jarak metrik Zone Centroid and Zone

1 Bagi citra masukan men jadi n zona yang sama.

2 Hitung centroid tiap zona.

3 Hitung jarak antara centroid zona dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang

ada dalam zona.

5 Hitung jarak rata-rata antara titik-titik tersebut.

6 Ulangi langkah 3–5 untuk semua zona secara berurutan.

7 Akhirnya, akan didapatkan n ciri untuk klasifikasi dan pengenalan.

 Metode ekstraksi ciri gabungan (ICZ dan ZCZ)

1 Hitung centroid dari citra masukan. 2 Bagi citra masukan men jadi n zona yang

sama.

3 Hitung jarak antara centroid citra dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang

ada dalam zona.

5 Hitung jarak rata-rata antara titik-titik tersebut.

6 Hitung centroid tiap zona.

7 Hitung jarak antara centroid zona dan setiap pixel yang ada dalam zona. Ada beberapa variasi algoritme untuk

metode ekstraksi ciri zoning, yang dapat dikelo mpokkan berdasarkan ciri yang diambil, titik acuan yang digunakan, dan posisi zona. Beberapa


(12)

8 Ulangi langkah 7 untuk semua pixel yang ada dalam zona.

9 Hitung jarak rata-rata antara titik-titik tersebut.

10 Ulangi langkah 3–9 untuk semua zona secara berurutan.

11 Akhirnya, akan didapatkan 2n ciri untuk klasifikasi dan pengenalan.

K-fold Cross-validation

Cross-validation merupakan metode statisti-ka untuk mengevaluasi dan membandingstatisti-kan algoritme pembelajaran dengan membagi data men jadi dua bagian: satu bagian digunakan untuk mempelajari atau melatih model dan bagian lainnya digunakan untuk memvalidasi model tersebut. Salah satu bentuk cross-validation ialah k -fold cross-cross-validation.

Pada k -fold cross-validation, awalnya data dibagi menjadi k bagian yang berukuran sama (atau hampir sama). Secara berurutan, pelatihan dan validasi dilakukan sebanyak k ulangan sehingga dalam setiap perulangan satu bagian data yang berbeda digunakan untuk validasi sementara k – 1 bagian lainnya digunakan untuk pembelajaran atau pelatihan (Refaeilzadeh et al. 2009).

Support Vector Machine

Support Vector Machine (SVM) merupakan prosedur pembelajaran konstruktif yang universal yang berbasis teori pembelajaran

statistik. Istilah “universal” berarti bahwa SVM

dapat digunakan untuk mempelajari beragam representasi, seperti jaringan saraf (dengan fungsi aktivasi sigmoid biasa), radial basis function, dan spline. SVM mengo mbinasikan empat konsep berbeda, yaitu implementasi baru dari prinsip induktif Structural Risk Minimiza-tion (SRM), pemetaan data masukan ke ruang dimensi tinggi, fungsi linear dengan kendala pada kompleksitas, dan dualitas teori optimisasi (Cherkassky & Mulier 2007).

SVM akan mencari hyperplane (bidang pe-misah) terbaik yang memisahkan data dari suatu permasalahan. Menurut Osuna et al. (1997), suatu data dikatakan linearly separable (dapat dipisahkan secara linear) jika untuk permasa-lahan tersebut dapat dicari pasangan (w, b)

sedemikian sehingga:

i b i kelas (1) i b - i kelas (2)

Gambar 1 Keadaan linearly separable. Karenanya, ruang hipotesis adalah set fungsi yang diberikan oleh

b si n b

Gambar 1 menunjukkan kondisi suatu data yang linearly separable. Pada gambar tersebut, terdapat sebuah hyperplane yang memisahkan data di kelas +1 (lingkaran) dengan data di kelas

–1 (kotak). Terdapat pula margin, yaitu jarak antara hyperplane dengan elemen terluar dari kedua kelas. Bidang pemisah terbaik adalah bidang pemisah yang menghasilkan n ilai margin terbesar.

SVM d irancang tidak hanya untuk dapat menyelesaikan permasalahan linear, tetapi juga permasalahan non-linear. Agar permasalahan non-linear dapat diselesaikan, permasalahan tersebut dapat dipetakan ke dalam ruang ciri berdimensi lebih tinggi, kemudian diterapkan klasifikasi linear dalam ruang tersebut. Tepat-nya, variabel input x dipetakan ke dalam vektor

variabel ciri ϕ(x) dengan fungsi transformasi x ϕ . Fungsi yang memetakan suatu permasalahan non-linear ke dalam ruang ciri yang lebih tinggi disebut dengan fungsi k ernel, K(x, y). Terdapat tiga k ernel yang biasa

digunakan dalam SVM, yaitu sebagai berikut (Osuna et al. 1997).

 Polinomial dengan derajat d:

Gaussian Radial Basis Function (RBF):

e - - an

Multi Layer Perceptron (untuk beberapa nilai ): tanh - .

Metode M ulti-class SVM One -versus-all Pada awalnya, SVM d idesain untuk melakukan klasifikasi biner, dengan kata lain hanya dapat menangani data yang memiliki dua kelas. Cara untuk mengembangkan SVM agar

Kelas –1 Kelas +1


(13)

dapat digunakan untuk klasifikasi banyak kelas merupakan isu riset yang masih berjalan. Salah satu metode yang digunakan untuk klasifikasi multi-class SVM ialah metode one-versus-all atau metode one-against-all.

Menurut Hsu dan Lin (2002), metode one-versus-all kemungkinan merupakan metode implementasi untuk klasifikasi multi-class SVM paling awal. Metode ini membangun k model SVM, dengan k adalah jumlah kelas yang ada. Model SVM ke-i dilatih menggunakan semua contoh di kelas ke-i dengan label positif (kelas 1), dan semua contoh di kelas lain dengan label negatif (kelas –1). Setelah dilaku kan pelatihan SVM, d idapatkan k fungsi keputusan dari k model tersebut. Misalkan ada data baru x yang diujikan pada model SVM one-versus-all ini, x akan masuk ke dalam kelas tertentu yang memiliki nilai fungsi keputusan terbesar.

METODE PENELITIAN

Secara garis besar, tahapan dalam penelitian ini d igambarkan pada Gambar 2.

Gambar 2 Tahapan penelitian.

Pengumpulan Data

Data yang akan digunakan dalam pelatihan dan pengujian SVM diku mpulkan pada tahapan ini. Data didapatkan dari hasil pembangkitan yang dilaku kan oleh penulis dengan menulis aksara Sunda pada program pengolah vektor grafis. Setelah sedikit dio lah (diatur pos isinya, warna back ground, dan lain-lain), karakter aksara Sunda kemudian di-export menjad i file

citra PNG. File citra PNG ini akan digunakan sebagai data pelatihan danpengujian.

Karakter aksara Sunda yang digunakan berupa karakter tunggal yang ada pada naskah

Unico e se erti karakter “ka” ᮊ “ga” ᮌ),

an “nga” ᮍ). Data untuk setiap karakter akan diberikan variasi yang berbeda. Sebagai contoh,

variasi untuk karakter “ka” itunjukkan a a

Gambar 3. Pemberian variasi untuk setiap data bertujuan untuk membuat data yang digunakan men jadi lebih beragam. Contoh citra karakter aksara Sunda yang digunakan ditunjukkan pada Lamp iran 1.

Gambar 3 Variasi untuk karakter "ka".

Prapr oses Data

Pada tahapan praproses data, data citra yang sudah dibangkitkan pada tahap sebelumnya akan dipraproses agar dapat diolah pada tahap berikutnya. Metode praproses data yang akan digunakan ialah binerisasi (konversi citra warna men jadi citra biner) dan pemotongan (cropping) bagian karakter dari citra.

Ekstr aksi Ciri

Metode ekstraksi ciri yang digunakan ialah metode zoning. Metode ini memiliki beberapa variasi algoritme, tiga di antaranya seperti yang dijelaskan oleh Rajashekararadhya dan Ranjan (2008). Penelitian ini menggunakan ketiga variasi algoritme metode zoning, yaitu Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), dan gabungan dari ICZ dan ZCZ.

Sebagai ilustrasi, berikut ini akan diberikan contoh ekstraksi ciri menggunakan algoritme Image Centroid and Zone dan Zone Centroid and Zone. Sebagai citra ilustrasi digunakan sebuah citra berukuran 5x9 pixel, seperti pada Gambar 4.

Dengan menggunakan algoritme Image Cen-troid and Zone, pertama dihitung centroid (pusat) dari citra. Centroid dari citra d inyatakan dengan nilai koordinat titik (xc, yc). Cara menghitung centroid yaitu:

i i

an

i

i

(4) dengan f(x, y) adalah nilai pixel dari citra pada posisi tertentu. Perhitungan menghasilkan nilai xc = 3 dan yc = 5 sehingga didapatkan nilai centroid citra yaitu (3, 5).


(14)

Gambar 4 Contoh citra untuk algoritme ICZ dan ZCZ.

Berikutnya, citra d ibagi men jadi n zona yang sama, misalkan menjad i 3 zona, yaitu zona atas, zona tengah, dan zona bawah, dengan masing-masing zona berukuran 5x3 pixel. Kemudian, dihitung jarak antara centroid dan setiap pixel yang ada dalam zona, dalam hal ini pixel yang digunakan adalah pixel non-back ground. Jarak dihitung menggunakan rumus jarak Euclid, dengan rumus berikut:

jarak

Gambar 5 Perh itungan jarak pixel non- back ground dengan image centroid untuk zona 1.

Untuk zona 1 (zona atas), perhitungan jarak, yang divisualisasikan oleh Gambar 5, d ilakukan dengan perhitungan berikut:

jarak – – . jarak – – . jarak – – jarak – – . jarak – – .

Setelah didapatkan jarak centroid-pixel untuk masing-masing pixel non-back ground pada zona 1, jarak rata-ratanya dihitung sebagai berikut.

jarak jarak jarak

Perhitungan menghasilkan jarak rata-rata centroid-pixel untuk zona 1 ialah 3.196.

Dengan cara yang sama, jarak centroid-pixel dihitung untuk setiap pixel pada zona 2 (tengah) dan 3 (bawah), kemudian dihitung rata-ratanya. Dari hasil perhitungan, didapatkan bahwa jarak rata-rata centroid-pixel untuk zona 2 dan 3 berturut-turut ialah 0.94 dan 3.196.

Sementara itu, jika menggunakan algoritme Zone Centroid and Zone, pertama citra akan langsung dibagi menjadi n zona yang sama, misalkan menjadi 3 zona seperti pada algoritme Image Centroid and Zone, menjadi zona atas, zona tengah, dan zona bawah. Kemudian, zone centroid dari masing-masing zona dihitung menggunakan Persamaan 4. Dari hasil perhi-tungan, didapatkan hasil berikut:

 Zona 1 (atas): xc = 3, yc = 2.2  Zona 2 (tengah): xc = 3, yc = 5  Zona 3 (bawah): xc = 3, yc = 7.8

Gambar 6 Perh itungan jarak pixel non- back ground dengan zone centroid untuk zona 1.

Kemudian, untuk masing-masing zona, jarak antara centroid masing-masing zona dan setiap pixel non-back ground yang ada di dalam zona dicari menggunakan rumus jarak Euclid (Persamaan 5). Untuk zona 1 (atas), perhitungan jarak, yang divisualisasikan oleh Gambar 6, dilakukan dengan perhitungan berikut:

jarak – – . . jarak – – . .


(15)

jarak – – . . jarak – – . . jarak – – . .

Setelah didapatkan jarak centroid-pixel untuk masing-masing pixel non-back ground pada zona 1, jarak rata-ratanya dihitung, sebagai berikut.

jarak jarak jarak

Dari hasil perhitungan, didapatkan bahwa jarak rata-rata centroid zona dengan seluruh pixel untuk zona 1 ialah 1.508.

Dengan cara yang sama, jarak centroid-pixel dihitung untuk setiap pixel pada zona 2 (tengah) dan 3 (bawah), kemudian rata-ratanya dihitung. Dari hasil perhitungan, jarak rata-rata centroid-pixel untuk zona 2 dan 3 berturut-turut ialah 0.94 dan 1.508.

Dengan demikian, tiga nilai d idapatkan untuk masing-masing algoritme ekstraksi ciri, yang merupakan ciri dari citra yang didapatkan dari masing-masing zona. Untuk algoritme Image Centroid and Zone, hasilnya adalah 3.196, 0.94, dan 3.196. Sementara itu, untuk algoritme Zone Centroid and Zone hasilnya adalah 1.508, 0.94, dan 1.508. Ketiga nilai dari masing-masing algoritme ini kemudian akan digunakan dalam pelatihan dan/atau pengujian SVM.

K-fold Cross-validation

Data yang sudah dikenakan proses ekstraksi ciri kemudian dibagi menjad i data latih dan data uji dengan menggunakan k -fold cross-valida-tion. K-fold cross-validation membagi seluruh data menjadi k subbagian data yang sama, ke-mudian secara berurutan menggunakan k sub-bagian data tersebut sebagai data uji, dan k – 1 data yang lain digunakan sebagai data latih. Nilai k yang digunakan ialah 5.

Pelatihan Support Vector Machine

Pelatihan SVM dilakukan menggunakan data latih hasil ekstraksi ciri yang sebelumnya sudah dibagi menggunakan k -fold cross-validation. Dalam pelatihan SVM ini, akan dicobakan pelatihan menggunakan empat fungsi k ernel, yaitu k ernel linear (polino mial berderajat 1), quadratic (polinomial berderajat 2), polino-mial berderajat  3, dan Radial Basis Function (RBF).

Pengujian Support Vector Machine

Setelah didapatkan model dari pelatihan SVM, model akan diuji menggunakan data uji hasil ekstraksi ciri yang sebelumnya sudah dibagi menggunakan k -fold cross-validation.

Analisis

Dari hasil pelatihan dan pengujian SVM dengan k ernel dan algoritme pelatihan yang berbeda, akan didapatkan hasil untuk kinerja algoritme SVM dalam klasifikasi citra karakter aksara Sunda. Setelah itu, dicari akurasi untuk masing-masing hasil klasifikasi. Ru mus yang digunakan untuk menghitung akurasi hasil klasifikasi, yaitu:

kurasi umlah umlah ata uji benar Sementara itu, hal-hal yang akan dianalisis meliputi metode ekstraksi ciri dan ju mlah zona, serta jenis k ernel SVM yang digunakan.

Lingkungan Pe nelitian

Lingkungan yang digunakan untuk peneliti-an ini memiliki spesifikasi sebagai berikut. Perangkat keras:

Processor Intel Core i3-2310M, Memory 2 GB, dan

Harddisk 500 GB. Perangkat lunak:

 Sistem Operasi Microsoft Windows 7 Professional Service Pack 1 32-bit,

 MATLAB R2008b, dan  Inkscape 0.48.

HASIL DAN PEMBAHASAN

Pengumpulan Data

Data yang digunakan dalam penelitian ini didapat dari hasil pembangkitan yang dilakukan menggunakan program pengolah vektor grafis Inkscape dan font SundaneseLatin. Di dalam font SundaneseLatin, terdapat 40 karakter aksara Sunda, yang terdiri atas 7 karakter swara (vokal), 23 karakter ngalagena (konsonan), dan 10 karakter angka (0–9). Untuk 40 karakter tersebut, dibangkitkan 10 citra karakter berjen is PNG beru kuran 90x86 pixel, masing-masing dengan variasi posisi karakter, warna karakter, dan warna latar yang berbeda-beda, seperti ditunjukkan pada Gambar 7. Setelah tahapan ini selesai, didapatkan 400 data citra.


(16)

Gambar 7 Contoh citra hasil pembangkitan data.

Prapr oses Data

Pada tahapan praproses data, data citra yang sudah dibangkitkan sebelumnya diubah men jadi citra biner (b inerisasi), dipotong (crop), dan diubah ukurannya (resize).

Data hasil pembangkitan berupa citra warna RGB. Karena citra yang akan diproses harus berupa citra biner dengan bagian karakter ber-nilai 1 dan bagian back ground bernilai 0, citra RGB harus diubah menjad i citra b iner. Tahapan yang dilaku kan ialah mengubah citra RGB men jadi citra grayscale, mengubah citra gray-scale menjadi citra b iner, serta menegasikan citra, jika diketahui bagian karakter bernilai 0.

Pemotongan citra dilaku kan karena hanya bagian karakter saja yang akan diproses, semen-tara bagian latar akan dibuang. Cara memotong-nya sebagai berikut. Pertama, ditentukan batas kiri, kanan, atas dan bawah dari citra karakter yang akan diambil. Setelah itu, elemen citra yang berada di dalam batas diamb il sebagai citra baru.

Setelah dilaku kan pemotongan, ternyata didapatkan citra hasil yang ukurannya tidak seragam. Agar u kurannya seragam, citra hasil harus diubah ukurannya. Setelah dilakukan pengamatan, ditentukan bahwa ukuran citra untuk kemudian diproses lebih lanjut ialah 60x56 pixel. Perbandingan antara citra asli sebelum dilaku kan praproses data, setelah dilakukan binerisasi dan pemotongan, serta setelah dilakukan binerisasi, pemotongan, dan pengubahan ukuran ditunjukkan o leh Gambar 8.

Ekstraksi Ciri

Metode ekstraksi ciri yang digunakan adalah variasi dari metode ekstraksi ciri zoning, yaitu Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), dan gabungan dari ICZ dan ZCZ. Ju mlah zona yang digunakan yaitu 4, 6, 8, dan 12 zona.

Data hasil ekstraksi ciri menggunakan algoritme ICZ dan ZCZ d idapat dari hasil implementasi algoritme ICZ dan ZCZ yang disebutkan oleh Rajashekararadhya dan Ranjan (2008). Sementara itu, data hasil ekstraksi ciri gabungan ICZ dan ZCZ didapat dari pengga-bungan data hasil ekstraksi ciri ICZ dan ZCZ.

Hal ini dilaku kan karena sebenarnya algoritme gabungan ICZ dan ZCZ merupakan urutan pengerjaan ekstraksi ciri menggunakan algorit-me ICZ yang dilanjutkan dengan ekstraksi ciri menggunakan algoritme ZCZ.

Setelah dilakukan ekstraksi ciri mengguna-kan algoritme ICZ dan ZCZ serta empat macam zona, didapatkan 12 dataset dengan ukuran yang berbeda-beda, seperti ditunjukkan pada Tabel 2. Adapun contoh citra asli, citra hasil praproses, dan data hasil ekstraksi ciri menggunakan algoritme ICZ dan ZCZ untuk citra angka d itunjukkan pada Lamp iran 2.

memii

Gambar 8 (a) Citra sebelum dilaku kan praproses, (b) citra setelah dilakukan binerisasi dan pemotongan, serta (c) citra setelah dilakukan b inerisasi, pemotongan, dan pengubahan ukuran.

Tabel 2 Daftar u kuran data hasil ekstraksi ciri Metode

Ekstraksi Ciri

Jumlah Zona

4 6 8 12

ICZ 400 x 4 400 x 6 400 x 8 400 x 12 ZCZ 400 x

4 400 x 6 400 x 8 400 x 12 ICZ + ZCZ 400 x 8 400 x 12 400 x 16 400 x 24


(17)

Kl asifikasi Support Vector Machine

Setelah didapatkan data hasil ekstraksi ciri, proses dilanjutkan dengan klasifikasi(Support Vector Machine (SVM). Proses klasifikasi SVM diawali dengan memodifikasi fungsi SVM, agar dapat digunakan untuk menangani data yang memiliki banyak kelas. Teknik perluasan fungsionalitas yang digunakan ialah SVM one-versus-all. Dengan teknik in i, dapat dibangun SVM sebanyak ju mlah kelas yang ada, yaitu 40 buah, dengan masing-masing SVM mewakili setiap kelas yang ada. Misalkan SVM 1

mewakili kelas “nol” SVM ini akan mengenali citra karakter “nol” an “bukan nol”.

Data yang digunakan untuk pelatihan SVM sebanyak 320 buah, dan data uji yang digunakan sebanyak 80 buah. Pembagian data dilakukan menggunakan 5-fold cross-validation.

Setelah data dibagi menggunakan k -fold cross-validation, dilakukan klasifikasi SVM. Model SVM dibangun menggunakan empat fungsi k ernel, yaitu k ernel linear (polino mial berderajat 1), quadratic (polinomial berderajat 2), polino mial berderajat  3, dan RBF. Dengan menggunakan keempat fungsi k ernel ini, dibentuklah unit percobaan sebanyak 1728 buah. Setelah dilaku kan pelatihan dan pengujian hanya didapatkan 1667 hasil klasifikasi saja. Hal ini disebabkan oleh beberapa hal yang terjadi selama proses pelatihan dan pengujian unit percobaan.

Setelah didapatkan hasil klasifikasi, dihitung akurasi dari hasil klasifikasi tersebut. Perhitungan akurasi dilaku kan menggunakan Persamaan 6.

Analisis

Setelah hasil akurasi untuk semua kombinasi k ernel dan parameternya didapatkan, akurasi ku mulatif dih itung berdasarkan metode ekstrak-si ciri dan ju mlah zona, serta jen is k ernel.

Metode ekstraksi ciri dan jumlah z ona

Untuk hasil akurasi berdasarkan metode ekstraksi ciri dan jumlah zona yang digunakan, nilai akurasi yang dianalisis merupakan rata-rata nilai akurasi dari hasil klasifikasi untuk masing-masing dataset. Hasil akurasi rata-rata berdasar-kan metode ekstraksi ciri dan ju mlah zona yang digunakan ditunjukkan pada Tabel 3, sementara itu Gambar 9 memvisualisasikan Tabel 3 dari sudut pandang (a) metode ekstraksi ciri, dan (b) ju mlah zona yang digunakan.

Jika ditin jau berdasarkan metode ekstraksi ciri yang digunakan (Gambar 9.a.), dapat dilihat

Tabel 3 Hasil akurasi rata-rata berdasarkan metode ekstraksi ciri dan ju mlah zona yang digunakan

Jumlah zona

Metode Ekstraksi Ciri

ICZ ZCZ ICZ + ZCZ

4 75.03% 67.88% 89.74%

6 83.91% 84.99% 91.17%

8 82.75% 88.26% 91.51%

12 88.35% 90.79% 93.99%

(a)

(b)

Gambar 9 Hasil akurasi rata-rata berdasarkan (a) metode ekstraksi ciri, dan (b) ju mlah zona yang digunakan. bahwa metode ekstraksi ciri ZCZ menghasilkan akurasi yang lebih baik daripada metode ekstraksi ciri ICZ untuk ju mlah zona 6, 8, dan 12 buah. Sebaliknya, metode ekstraksi ciri ICZ menghasilkan akurasi yang lebih baik daripada metode ekstraksi ciri ZCZ untuk ju mlah zona 4 buah. Hal ini dapat disebabkan oleh metode ICZ yang merupakan metode ekstraksi ciri global, yang mengambil ciri dari citra secara keselu-ruhan. Sementara itu, metode ZCZ merupakan metode ekstraksi ciri lokal, yang mengamb il ciri

50% 60% 70% 80% 90% 100%

4 6 8 12

A

ku

ra

si

Jumlah zona

ICZ ZCZ ICZ + ZCZ

50% 60% 70% 80% 90% 100%

ICZ ZCZ ICZ + ZCZ

A

ku

ra

si

Metode ekstraksi ciri 4 6 8 12


(18)

dari citra secara lokal berdasarkan informasi pola lokal sehingga ciri yang diambil lebih mendetail dan dapat meningkatkan akurasi hasil klasifikasi.

Sementara itu, metode ekstraksi ciri gabungan ICZ dan ZCZ mendapatkan hasil akurasi terbaik untuk keempat zona. Bahkan untuk jumlah zona 6, 8, dan 12 buah, nilainya melebih i 90%. Hal ini wajar, karena data untuk metode ekstraksi ciri gabungan ICZ dan ZCZ merupakan gabungan antara data untuk metode ekstraksi ciri ICZ dan ZCZ, dan seharusnya data gabungan ini dapat menghasilkan nilai akurasi yang lebih tinggi daripada data hasil ekstraksi ciri menggunakan metode ICZ atau ZCZ saja.

Jika ditinjau berdasarkan ju mlah zona yang digunakan (Gambar 9.b.), dapat dilihat bahwa hasil akurasi meningkat seiring dengan penam-bahan jumlah zona yang digunakan ketika proses ekstraksi ciri. Hal yang sedikit berbeda terdapat pada hasil ekstraksi ciri menggunakan ICZ, yaitu penggunaan 6 buah zona mengha-silkan akurasi yang lebih baik daripada penggu-naan 8 buah zona. Secara u mu m, hal in i dapat disebabkan oleh jumlah ciri yang diamb il dari citra, karena ju mlah zona mempengaruhi ju mlah ciri yang diamb il. Semakin banyak ju mlah zona, semakin banyak ciri yang diamb il dari citra, baik ciri global maupun ciri lokal. Hal ini dapat membuat akurasi hasil klasifikasi meningkat.

Dari hasil in i, dapat dikatakan bahwa peningkatan jumlah zona yang digunakan dapat men ingkatkan akurasi, walaupun pada metode ICZ akurasi untuk ju mlah zona 6 buah lebih tinggi daripada akurasi untuk jumlah zona 8 buah.

Jenis kernel

Gambar 10 Hasil aku rasi berdasarkan jenis k ernel.

quadratic, polinomial berderajat  3, dan RBF, untuk data hasil metode ekstraksi ciri gabungan ICZ dan ZCZ dengan jumlah zona 12 buah. Pemilihan data hasil metode ekstraksi ciri serta ju mlah zona yang digunakan sebagai pemban-ding didasarkan pada hasil dari bagian sebelum-nya, yang menunjukkan bahwa metode ekstrak-si ciri dan ju mlah zona yang menghaekstrak-silkan akurasi terbaik ialah metode ekstraksi ciri gabungan ICZ dan ZCZ dan jumlah zona 12 buah. Hasil akurasi untuk seluruh klasifikasi untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dengan jumlah zona 12 buah dapat dilihat pada Lampiran 3, sementara tabel akurasi untuk hasil klasifikasi terbaik dari setiap fungsi kernel yang digunakan dapat dilihat pada Lamp iran 4.

Dari Gambar 10 diketahui bahwa klasifikasi SVM untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dan ju mlah zona 12 buah menggunakan keempat jenis fungsi kernel menghasilkan akurasi terbaik yang sama. Dari hasil in i dapat dikatakan bahwa keempat fungsi k ernel SVM memiliki kinerja yang sama dalam melakukan pelatihan SVM untuk data yang digunakan dalam penelitian in i.

SIMPULAN DAN SARAN

Simpulan

Pengenalan pola merupakan salah satu perkembangan dari artificial intelligence, yang memungkinkan ko mputer dapat mengenali pola karakter yang dikenali oleh manusia. Pengenalan pola biasa digunakan dalam proses OCR (optical character recognition) dan HCR (handwritten charater recognition).

Dalam penelitian ini, dibangun model pengenalan aksara Sunda tercetak menggunakan metode ekstraksi ciri zoning dan klasifikasi Support Vector Machine. Tujuan dari penelitian ini yaitu untuk menentukan metode ekstraksi ciri yang paling efektif di antara metode ekstraksi ciri yang digunakan untuk pengenalan aksara Sunda.

Dari hasil yang didapat, diketahui bahwa metode ekstraksi ciri gabungan ICZ dan ZCZ menghasilkan akurasi paling tinggi, untuk keempat ju mlah zona yang digunakan dalam proses ekstraksi ciri. Sementara itu, untuk ju mlah zona yang digunakan, akurasi paling tinggi didapat oleh ju mlah zona 12 buah, untuk ketiga metode ekstraksi ciri yang digunakan.

Dari apa yang telah dilaku kan, dapat disimpulkan bahwa metode ekstraksi ciri yang paling efektif di antara metode ekstraksi ciri

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Linear Quadratic Polinomial,

or er RBF

A

ku

ra

si

Jenis kernel

Gambar 10 menunjukkan hasil akurasi terbaik berdasarkan jenis k ernel yang digunakan pada pelatihan SVM, yaitu k ernel linear, quadratic


(19)

yang digunakan untuk pengenalan aksara Sunda ialah metode gabungan ICZ dan ZCZ, dengan ju mlah zona 12 buah.

Saran

Beberapa saran untuk penelitian selanjutnya yaitu:

1 Perancangan data latih dan data uji lebih lanjut untuk menguji kinerja algoritme zoning, misalnya dengan mengubah ukuran atau kemiringan karakter.

2 Penggunaan metode klasifikasi lain untuk pengenalan aksara Sunda, misalnya KNN atau Back propagation Neural Network. 3 Pengembangan sistem pengenalan aksara

Sunda lebih lan jut, sehingga sistem dapat mengenali karakter penambah dan pengubah suara.

4 Pengembangan aplikasi mobile untuk menerap kan model SVM yang sudah didapatkan dari penelitian ini.

DAFTAR PUSTAKA

Baidillah I, Darsa UA, Abdurahman O, Permadi T, Gunardi G et al. 2008. Direk tori Ak sara Sunda untuk Unicode. Bandung: Pemerintah Provinsi Jawa Barat.

Cherkassky V, Mulier F. 2007. Learning from Data: Concepts, Theory, and Methods. Ed ke-2. New Jersey: John Wiley & Sons. Devijver PA, Kittler J. 1982. Pattern

Recognition: A Statistical Approach. London: Prentice -Hall.

Gatos B, Kesid is AL, Papandreou A. 2011. Adaptive zoning features for character and word recognition. Di dalam: 11th International Conference on Document Analysis and Recognition; Beijing, 18-21 Sep 2011. Washington DC: IEEE Co mputer Society. h lm 1160-1164. Gon zalez R, Woods R. 2002. Digital Image

Processing. Ed ke-2. New Jersey: Prentice Hall.

Hsu CW, Lin CJ. 2002. A co mparison of methods for multiclass support vector

mach ines. IEEE Transactions on Neural Network s 13 (2): 415-425.

Mubarok. 2010. Pengenalan tulisan tangan aksara Sunda menggunakan kohonen neural network [skripsi]. Bandung: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam, Un iversitas Pendidikan Indonesia.

Osuna EE, Freund R, Girosi F. 1997. Support Vector Machines: Training and Applica-tions. AI Memo 1602, Massachusetts Institute of Technology.

Rajashekararadhya SV, Ranjan PV. 2008. Efficient zone based feature extration algorith m for handwritten numeral recognition of four popular South Indian scripts. Journal of Theoretical and Applied Information Technology 4 (12): 1171-1181.

Rajashekararadhya SV, Ranjan PV. 2009a. Handwritten numeral recognition of Kannada script. Di dalam: Bajaj P, Abraham A, ed itor. Work shop Proceedings of the International Work shop on Machine Intelligence Research; Nagpur, 24 Jan 2009. Washington: Machine Intelligence Research Labs. hlm 80-86.

Rajashekararadhya SV, Ranjan PV. 2009b. A novel zone based feature extraction algorith m for handwritten numeral recognition of four indian scripts. Digital Technology Journal 2: 41-51.

Refaeilzadeh P, Tang L, Liu H. 2009. Cross -validation. Di dalam: Liu L, Öszu MT, editor. Encyclopedia of Database Systems. New York: Sp ringer.

Trier OD, Jain AK, Taxt T. 1996. Feature extraction methods for character recognition – a survey. Pattern Recognition 4 (29): 641-662.

[Un icode]. 2008. The Unicode Standard, Version 5.1 Archived Code Charts. http://www.unicode.org/Public/5.1.0/charts /CodeCharts.pdf [27 Des 2011].


(20)

(21)

Lamp iran 1 Contoh karakter aksara Sunda yang digunakan Karakter angka

0 1 2 3 4

5 6 7 8 9

Karakter swara (vokal)

A É E EU I O U

Karakter ngalagena (konsonan)

BA CA DA FA GA HA

JA KA LA MA NA NGA

NYA PA QA RA SA TA


(22)

Lamp iran 2 Contoh citra asli, citra hasil praproses, dan data hasil ekstraksi ciri menggunakan algoritme ICZ dan ZCZ untuk citra angka

Karakter Citra Asli Citra Hasil Praproses 0

1

2

3

4

Karakter Citra Asli Citra Hasil Praproses 5

6

7

8

9

Data hasil ekstraksi ciri Metode ICZ dengan 4 zona

Karakter Data Hasil Ekstraksi Ciri 0 25.191 25.926 24.779 25.474 1 23.458 28.818 22.953 22.747 2 23.028 24.130 16.787 24.223 3 24.910 22.846 18.360 19.296 4 19.857 16.847 20.414 16.119 5 25.521 24.972 25.949 25.686 6 22.020 28.127 18.941 17.958 7 18.422 22.111 21.513 18.005 8 18.871 26.388 22.406 17.707 9 22.436 27.378 20.976 20.256 Metode ICZ dengan 6 zona

Karakter Data Hasil Ekstraksi Ciri

0 25.336 24.843 26.229 25.020 24.138 25.886 1 25.149 22.661 30.243 23.196 19.142 25.031 2 27.846 20.049 0.000 18.626 14.856 28.910 3 27.638 21.616 23.607 19.063 14.955 24.088 4 22.731 13.706 21.977 23.542 16.298 20.908 5 25.624 24.434 25.077 26.718 23.153 26.370 6 18.874 26.029 25.661 20.042 13.655 23.233 7 16.397 18.324 25.887 25.336 17.505 17.303 8 25.265 15.785 27.584 24.087 18.248 14.960 9 23.162 23.375 27.837 21.760 16.360 25.202


(23)

Lanjutan

Metode ICZ dengan 8 zona

Karakter Data Hasil Ekstraksi Ciri

0 25.301 25.784 25.032 26.143 24.866 25.944 24.720 25.178 1 27.633 28.818 13.951 0.000 16.706 19.757 25.789 25.951 2 28.723 26.923 11.713 11.562 9.069 17.957 21.887 26.797 3 29.605 29.279 13.767 21.614 11.882 15.603 21.811 22.749 4 22.539 20.677 10.752 12.930 16.204 16.101 26.614 19.142 5 28.912 28.489 18.524 18.096 22.583 21.863 27.400 27.347 6 27.556 32.002 16.810 21.589 13.892 14.160 21.715 21.036 7 23.421 27.452 13.338 14.910 13.553 13.048 26.668 22.449 8 23.577 30.880 8.141 16.603 15.301 13.866 26.346 21.940 9 26.870 28.330 13.632 20.959 14.199 15.754 24.420 23.957 Metode ICZ dengan 12 zona

Karakter Data Hasil Ekstraksi Ciri

0 25.7 24.8 26.3 25.0 0.0 26.1 24.9 0.0 25.9 25.2 24.1 25.8 1 30.3 24.9 30.2 14.6 12.8 0.0 16.8 10.3 22.9 27.3 22.5 27.6 2 31.3 25.8 0.0 11.5 11.8 0.0 12.0 6.3 27.7 22.8 20.8 29.2 3 32.2 26.3 0.0 14.0 13.4 23.6 13.2 8.7 22.4 23.0 19.4 25.5 4 23.9 19.2 22.9 17.4 7.0 20.8 20.5 11.9 20.9 29.2 25.0 0.0 5 29.6 24.8 29.4 18.5 16.8 18.1 22.6 0.0 21.9 29.3 23.2 29.2 6 25.6 29.5 32.4 17.1 15.6 23.8 15.1 8.0 22.2 23.4 17.6 23.9 7 21.9 23.2 31.6 15.4 9.6 19.1 17.5 7.4 15.2 30.7 22.2 21.8 8 26.1 21.6 31.5 8.0 8.8 17.7 18.1 11.6 15.0 27.6 22.8 0.0 9 28.8 25.8 29.3 14.0 12.8 22.9 15.3 9.2 22.9 25.8 20.9 26.9 Metode ZCZ dengan 4 zona

Karakter Data Hasil Ekstraksi Ciri 0 9.967 10.163 10.000 10.112 1 10.037 6.489 9.827 10.782 2 10.837 6.638 10.150 10.875 3 10.108 10.366 9.770 10.727 4 10.689 10.084 10.590 7.820 5 8.843 8.962 10.288 10.229 6 8.022 12.799 10.319 10.488 7 8.464 11.504 10.936 9.051

8 9.255 9.302 9.705 7.223

9 9.256 7.759 10.265 10.965 Metode ZCZ dengan 6 zona

Karakter Data Hasil Ekstraksi Ciri

0 7.792 5.783 7.902 7.768 5.792 7.871

1 9.607 7.757 4.352 8.540 9.012 8.810

2 8.387 8.247 0.000 7.979 11.454 6.956

3 9.173 7.633 4.931 8.191 9.469 10.326

4 8.035 9.977 10.054 10.561 8.135 4.507

5 8.680 8.968 8.727 8.487 5.779 8.536

6 5.530 8.577 9.809 8.724 9.339 10.033

7 5.007 9.019 8.184 8.605 8.942 6.416

8 4.909 8.563 8.236 8.104 9.652 2.460


(24)

Lanjutan

Metode ZCZ dengan 8 zona

Karakter Data Hasil Ekstraksi Ciri

0 6.652 6.780 4.759 4.566 4.767 4.643 6.674 6.797

1 8.321 6.489 4.813 0.000 4.856 7.682 7.952 7.190

2 8.629 3.508 5.008 5.360 6.083 10.308 7.353 7.786

3 8.279 1.499 4.586 6.008 5.791 8.276 7.274 6.458

4 6.861 5.804 7.509 8.289 8.799 7.772 5.107 0.000

5 6.800 6.953 4.593 4.686 4.633 4.744 8.349 8.258

6 4.817 3.597 4.920 6.178 6.110 8.276 8.023 6.484

7 4.470 9.949 5.380 8.369 7.397 6.001 9.195 5.056

8 6.870 6.793 4.319 4.180 6.675 4.263 8.373 3.928

9 7.194 5.031 4.750 5.739 6.245 8.662 7.986 6.545

Metode ZCZ dengan 12 zona

Karakter Data Hasil Ekstraksi Ciri

0 4.53 5.78 4.62 4.76 0.00 4.57 4.77 0.00 4.64 4.48 5.79 4.63 1 6.10 6.25 4.35 4.06 3.47 0.00 4.82 3.50 5.88 5.78 5.78 5.09 2 5.61 5.24 0.00 2.77 5.09 0.00 4.51 5.59 5.18 5.40 5.78 5.59 3 5.82 4.57 0.00 3.64 5.33 4.93 4.51 5.05 5.44 5.26 6.33 4.60 4 4.72 6.31 4.12 4.19 5.44 6.69 5.14 5.91 4.51 3.55 4.27 0.00 5 6.22 8.78 6.21 4.56 7.19 4.60 4.63 0.00 4.74 5.99 5.78 5.94 6 2.49 6.33 1.70 4.17 5.68 4.93 4.92 4.76 5.87 5.87 6.33 4.63 7 2.35 6.43 4.76 3.78 5.87 4.37 4.22 4.67 4.17 5.24 6.47 3.41 8 4.08 4.61 5.68 1.12 6.08 3.83 5.60 8.18 2.46 6.70 5.85 0.00 9 5.12 6.44 3.32 4.07 4.56 4.74 4.71 4.77 5.34 5.78 6.35 4.56


(25)

Lamp iran 3 Hasil akurasi keseluruhan untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dengan ju mlah zona 12 berdasarkan jenis k ernel yang digunakan

Kernel Linear

Percobaan ke-

1 2 3 4 5 6 7 8

99.25% 99.25% 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% Kernel Quadratic

Percobaan ke-

1 2 3 4 5 6 7 8

99.75% 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% Kernel Polino mial

Derajat Percobaan ke-

1 2 3 4 5 6 7 8

3 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% 4 99.25% 99.25% 99.25% 99.25% 99.25% 99.25% 99.25% 99.25% 5 94.50% 94.50% 94.50% 94.50% 94.50% 94.50% 94.50% 94.50% 6 64.00% 64.00% 64.00% 64.00% 64.00% 64.00% 64.00% 64.00% Kernel RBF

Sig ma Percobaan ke-

1 2 3 4 5 6 7 8

0.5 99.00% 99.00% 99.00% 99.00% 99.00% 99.00% 99.00% 99.00% 1 99.25% 99.25% 99.25% 99.25% 99.25% 99.25% 99.25% 99.25% 2 99.50% 99.50% 99.75% 99.75% 99.75% 99.75% 99.75% 99.75% 4 99.75% 99.50% 99.25% 99.25% 99.25% 99.75% 99.75% 99.75% 8 95.50% 96.50% 97.25% 99.25% 99.25% 99.25% 99.25% 99.25% 16 90.50% 86.75% 87.75% 92.75% 95.25% 95.75% 97.75% 99.25% 32 92.25% 90.75% 86.00% 83.75% 85.75% 89.00% 90.00% 94.75% 64 91.75% 91.75% 91.25% 90.75% 82.75% 83.75% 84.50% 88.50% 128 91.75% 91.75% 91.75% 91.75% 91.25% 90.75% 82.00% 83.75% 256 91.75% 91.75% 91.75% 91.75% 91.75% 91.75% 91.25% 90.75%


(26)

Lamp iran 4 Tabel akurasi untuk hasil klasifikasi terbaik dari setiap fungsi k ernel yang digunakan Kernel Linear

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1

19 10 10 1 10 1 10 1 10 1 10 1

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1

23 12 12 1 12 1 12 1 12 1 12 1

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1

50 25 25 1 25 1 25 1 25 1 25 1

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1


(27)

Lanjutan

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1

77 39 39 1 39 1 39 1 39 1 39 1

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1

Jumlah benar 80 79 80 80 80

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Kernel Quadratic

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1

19 10 10 1 10 1 10 1 10 1 10 1

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1


(28)

Lanjutan

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1

50 25 25 1 25 1 25 1 25 1 25 1

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1

54 27 27 1 27 1 27 1 27 1 27 1

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1

77 39 39 1 39 1 39 1 39 1 39 1

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1


(29)

Lanjutan

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Kernel Polino mial

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1

19 10 10 1 10 1 10 1 10 1 10 1

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1

23 12 12 1 12 1 12 1 12 1 12 1

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1


(30)

Lanjutan

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1

54 27 27 1 27 1 27 1 27 1 27 1

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1

77 39 39 1 39 1 39 1 39 1 39 1

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1

Jumlah benar 80 79 80 80 80

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Kernel RBF

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1


(31)

Lanjutan

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1

23 12 12 1 12 1 12 1 12 1 12 1

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1

50 25 25 1 25 1 25 1 25 1 25 1

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1

54 27 27 1 27 1 27 1 27 1 27 1

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1


(32)

Lanjutan

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1

Jumlah benar 80 79 80 80 80

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Keterangan:

Dari keempat tabel akurasi tersebut, kesalahan klasifikasi terjadi pada data yang sama, yaitu pada data uji ke 18 pada fold kedua. Seharusnya data tersebut masuk ke dalam kelas 9, akan tetapi hasil klasifikasi membuat data tersebut masuk ke dalam kelas 19.


(33)

ABSTRACT

ISNA N MULIA. Sundanese Script Recognition Using Zoning Feature Extraction and Support Vector Machine Classification. Superv ised by MUSHTHOFA.

This research aims to determine the most effective feature extraction method used in Sundanese script recognition. The data used in this research are generated in the form of image files, each of which contains a Sundanese character. Feature extraction method used is the variations of zoning method: Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), and combination of ICZ and ZCZ. The nu mber of zones used are 4, 6, 8, and 12 zones. Support Vector Machine is used as classifier, with linear, quadratic, polyno mial, and RBF kernel. A mong the feature extraction methods used, the hybrid feature extraction method ICZ and ZCZ obtain s maximu m accuracy for all the number of zones used. On the other side, the feature extraction method using 12 zones obtains the maximu m accuracy fo r all the feature extraction methods used. From th is result, it can be concluded that the most effective feature extraction method used in Sundanese script recognition is the hybrid method ICZ & ZCZ with 12 zones.

Keywords: pattern recognition, Sundanese script, support vector machine, zoning, image centroid and zone (ICZ), zone centroid and zone (ZCZ)


(1)

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1

77 39 39 1 39 1 39 1 39 1 39 1

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1

Jumlah benar 80 79 80 80 80

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Kernel Quadratic

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1

19 10 10 1 10 1 10 1 10 1 10 1

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1


(2)

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1

50 25 25 1 25 1 25 1 25 1 25 1

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1

54 27 27 1 27 1 27 1 27 1 27 1

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1

77 39 39 1 39 1 39 1 39 1 39 1

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1


(3)

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Kernel

Polino mial

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1

19 10 10 1 10 1 10 1 10 1 10 1

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1

23 12 12 1 12 1 12 1 12 1 12 1

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1


(4)

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1

54 27 27 1 27 1 27 1 27 1 27 1

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1

77 39 39 1 39 1 39 1 39 1 39 1

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1

Jumlah benar 80 79 80 80 80

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Kernel

RBF

No Kelas Asli Fold 1 Fold 2 Fold 3 Fold 4 Fold 5

Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama? Hasil Sama?

1 1 1 1 1 1 1 1 1 1 1 1

2 1 1 1 1 1 1 1 1 1 1 1

3 2 2 1 2 1 2 1 2 1 2 1

4 2 2 1 2 1 2 1 2 1 2 1

5 3 3 1 3 1 3 1 3 1 3 1

6 3 3 1 3 1 3 1 3 1 3 1

7 4 4 1 4 1 4 1 4 1 4 1

8 4 4 1 4 1 4 1 4 1 4 1

9 5 5 1 5 1 5 1 5 1 5 1

10 5 5 1 5 1 5 1 5 1 5 1

11 6 6 1 6 1 6 1 6 1 6 1

12 6 6 1 6 1 6 1 6 1 6 1

13 7 7 1 7 1 7 1 7 1 7 1

14 7 7 1 7 1 7 1 7 1 7 1

15 8 8 1 8 1 8 1 8 1 8 1

16 8 8 1 8 1 8 1 8 1 8 1

17 9 9 1 9 1 9 1 9 1 9 1

18 9 9 1 19 0 9 1 9 1 9 1


(5)

20 10 10 1 10 1 10 1 10 1 10 1

21 11 11 1 11 1 11 1 11 1 11 1

22 11 11 1 11 1 11 1 11 1 11 1

23 12 12 1 12 1 12 1 12 1 12 1

24 12 12 1 12 1 12 1 12 1 12 1

25 13 13 1 13 1 13 1 13 1 13 1

26 13 13 1 13 1 13 1 13 1 13 1

27 14 14 1 14 1 14 1 14 1 14 1

28 14 14 1 14 1 14 1 14 1 14 1

29 15 15 1 15 1 15 1 15 1 15 1

30 15 15 1 15 1 15 1 15 1 15 1

31 16 16 1 16 1 16 1 16 1 16 1

32 16 16 1 16 1 16 1 16 1 16 1

33 17 17 1 17 1 17 1 17 1 17 1

34 17 17 1 17 1 17 1 17 1 17 1

35 18 18 1 18 1 18 1 18 1 18 1

36 18 18 1 18 1 18 1 18 1 18 1

37 19 19 1 19 1 19 1 19 1 19 1

38 19 19 1 19 1 19 1 19 1 19 1

39 20 20 1 20 1 20 1 20 1 20 1

40 20 20 1 20 1 20 1 20 1 20 1

41 21 21 1 21 1 21 1 21 1 21 1

42 21 21 1 21 1 21 1 21 1 21 1

43 22 22 1 22 1 22 1 22 1 22 1

44 22 22 1 22 1 22 1 22 1 22 1

45 23 23 1 23 1 23 1 23 1 23 1

46 23 23 1 23 1 23 1 23 1 23 1

47 24 24 1 24 1 24 1 24 1 24 1

48 24 24 1 24 1 24 1 24 1 24 1

49 25 25 1 25 1 25 1 25 1 25 1

50 25 25 1 25 1 25 1 25 1 25 1

51 26 26 1 26 1 26 1 26 1 26 1

52 26 26 1 26 1 26 1 26 1 26 1

53 27 27 1 27 1 27 1 27 1 27 1

54 27 27 1 27 1 27 1 27 1 27 1

55 28 28 1 28 1 28 1 28 1 28 1

56 28 28 1 28 1 28 1 28 1 28 1

57 29 29 1 29 1 29 1 29 1 29 1

58 29 29 1 29 1 29 1 29 1 29 1

59 30 30 1 30 1 30 1 30 1 30 1

60 30 30 1 30 1 30 1 30 1 30 1

61 31 31 1 31 1 31 1 31 1 31 1

62 31 31 1 31 1 31 1 31 1 31 1

63 32 32 1 32 1 32 1 32 1 32 1

64 32 32 1 32 1 32 1 32 1 32 1

65 33 33 1 33 1 33 1 33 1 33 1

66 33 33 1 33 1 33 1 33 1 33 1

67 34 34 1 34 1 34 1 34 1 34 1

68 34 34 1 34 1 34 1 34 1 34 1

69 35 35 1 35 1 35 1 35 1 35 1

70 35 35 1 35 1 35 1 35 1 35 1

71 36 36 1 36 1 36 1 36 1 36 1

72 36 36 1 36 1 36 1 36 1 36 1

73 37 37 1 37 1 37 1 37 1 37 1

74 37 37 1 37 1 37 1 37 1 37 1

75 38 38 1 38 1 38 1 38 1 38 1

76 38 38 1 38 1 38 1 38 1 38 1


(6)

78 39 39 1 39 1 39 1 39 1 39 1

79 40 40 1 40 1 40 1 40 1 40 1

80 40 40 1 40 1 40 1 40 1 40 1

Jumlah benar 80 79 80 80 80

Akurasi 100.00% 98.75% 100.00% 100.00% 100.00%

Akurasi rata2 99.75%

Keterangan:

Dari keempat tabel akurasi tersebut, kesalahan klasifikasi terjadi pada data yang sama, yaitu pada data

uji ke 18 pada

fold

kedua. Seharusnya data tersebut masuk ke dalam kelas 9, akan tetapi hasil

klasifikasi membuat data tersebut masuk ke dalam kelas 19.