TA : Ektraksi Fitur Angka Jawa Menggunakan Diagonal Distance Feature dan Longest Run Feature.

(1)

EKTRAKSI FITUR ANGKA JAWA MENGGUNAKAN DIAGONAL

DISTANCE FEATURE DAN LONGEST RUN FEATURE

Nama

:

Muhammad Misbahul umam

NIM

:

11410200063

Program

:

S1(Strata Satu)

Jurusan

:

Sistem Komputer

INSTITUT BISNIS DAN INFORMATIKA STIKOM SURABAYA

2015


(2)

x

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN SYARAT ... ii

MOTTO... iii

HALAMAN PERSEMBAHAN... iv

HALAMAN PENGESAHAN ... v

HALAMAN PERNYATAAN ... vi

ABSTRAK ... vii

KATA PENGANTAR………..………viii

DAFTAR ISI ... x

DAFTAR GAMBAR ………...xiii

DAFTAR TABEL...xvi

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Perumusan Masalah ... 3

1.3 Batasan Masalah ... 3

1.4 Tujuan ... 4

1.5 Manfaat ... 4

1.6 Sistematika Laporan ... 5

BAB II LANDASAN TEORI ... 7

2.1 Aksara Jawa ... 7

2.2 Ektraksi Fitur ... 8


(3)

2.4 Region Of Interest (ROI) ... 9

2.5 Diagonal Distance Feature ... 10

2.6 Longest Run Feature ... 10

2.7 Handwritten ‘Bangla’ Alphabet Recognition Using An MLP Based Classifier (Basu, dkk., 2005) ... 11

2.8 An MLP Based Approach For Recognition of Handwritten ‘Bangla’ Numerals (Basu,dkk., 2005) ... 12

2.9 Handwriten Arabic Numeral Recognition Using Multi Layer Perceptrone (Das, dkk., 2006) ... 13

2.10 Handwritten Bangla Basic Coumpound Character Recognition Using MLP and SVM Classifier (Das dkk., 2010) ... 14

2.11 Pengenalan Pola Tulisan Tangan Jawa “Ha Na Ca Ra Ka” Menggunakan Multi Layer Perceptron (Wibowo dan Wira Kusuma, 2013) ... 14

2.12 Multi Layer Perceptron ... 15

BAB III METODE PENELITIAN... 18

3.1 Rancangan Penelitian ... 18

3.2 Tahapan Penelitian ... 20

3.3 Perancangan Perangkat Lunak ... 22

3.3.1 Desain Kanvas Virtual ... 22

3.3.2 Digitalisasi ... 24

3.3.3 Pembuatan ROI(Region of Interest) dan scalling (Resize) ... 25

3.3.4 Ektraksi Diiagonal Distance Feature ... 26


(4)

xii

3.3.6 Input Multi Layer Perceptron (MLP)... 34

3.3.7 Learning MLP ... 37

3.3.8 Output Multi Layer Perceptrone (MLP) ... 40

3.4 Alat dan Bahan Penelitian ... 41

3.4.1 Alat Penelitian ... 41

3.4.2 Bahan penelitian ... 42

3.5 Teknik Pengumpulan & Analisis Data ... 42

3.5.1 Pengunmpulan Data ... 42

3.5.3 Analisis Data ... 42

3.6 Uji Coba ... 43

BAB IV HASIL DAN PENGUJIAN ... 45

4.1 Pengujian ROI (Region Of Interest) ... 45

4.2 Pengujian Resize ... 50

4.3 Pengujian Longest Run Feature Extraction ... 53

4.4 Pengujian Diagonal Distance Feature Extraction ... 58

4.5 Pengujian Pengenalan MLP ... 62

BAB V PENUTUP ... 76

5.1 Kesimpulan ... 76

5.2 Saran ... 77

DAFTAR PUSTAKA ... 78

LAMPIRAN ... 80


(5)

1

PENDAHULUAN

1.1 Latar Belakang Masalah

Aksara jawa merupakan khazanah budaya yang telah diwariskan secara turun-temurun oleh nenek moyang masyarakat suku jawa. Zaman dahulu masyarakat suku jawa menggunakan aksara jawa dalam menulis dan berkomunikasi. Bukti sejarah mengenai aksara jawa dapat kita lihat pada peninggalan-peninggalan sejarah jawa seperti prasasti, manuskrip-manuskrip kuno dan lain sebagainya.

Aksara Jawa harus selalu dilestarikan agar Indonesia tidak kehilangan nilai budayanya. Beruntung hingga saat ini sekolah-sekolah di Indonesia masih terus mengajarkan membaca maupun menulis Aksara Jawa. Menulis Aksara Jawa di zaman modern ini dapat dilakukan dengan menggunakan berbagai macam media diantaranya komputer, tablet hingga handphone. Hasil tulisan Aksara Jawa menggunakan komputer, tablet dan handphone adalah berupa gambar. Akibatnya tulisan Aksara Jawa didalam gambar tersebut belum bisa terbaca sebagai teks yang dapat dikenali oleh komputer.

Agar tulisan yang ada di dalam gambar dapat dikenali sebagai teks oleh komputer, maka diperlukan sebuah aplikasi yang mampu mengenali tulisan pada gambar. Aplikasi dapat dibuat dengan menggunakan berbagai macam metode pengenalan pola. Salah satu metode pengenalan pola yang dapat digunakan yaitu multi layer perceptron (MLP).


(6)

2

Pada tahun 2013 telah dilakukan penelitian pengenalan pola pada Aksara Jawa menggunakan metode multi layer perceptron(MLP). Aksara Jawa yang diteliti hanya aksara “Ha Na Ca Ra Ka”. Inputan yang digunakan dalam pelatihan MLP adalah berupa piksel-piksel citra yang di ubah rosulusinya menjadi lebih kecil saja. Data yang digunakan dalam pelatihan MLP adalah data mentah piksel-piksel citra yang hanya dikecilkan saja. presentase keberhasilan pengenalan mencapai 100% pada sampel pelatihan dan 56% pada sampel yang belum pernah dilatihkan (Wibowo dan Wirakusuma, 2013).

Pada tahun 2006 telah dilakukan penelitian mengenai pengenalan pola angka arab Handwritten Arabic Numeral Recognition using a Multi Layer Perceptron. Inputan yang digunakan dalam pelatihan MLP adalah output dari proses ektraksi fitur. Hasil dari penelitian menunjukkan keberhasilan mencapai 95% tanpa dilakukan pelatihan sebelumnya (Nibaran das dkk, 2006).

Berdasarkan penelitian-penelitian yang sudah ada tersebut, dalam tugas akhir ini dilakukan proses ektraksi fitur pada citra Angka Jawa hasil tulisan tangan sebelum dilatihkan pada MLP. Ektraksi fitur Angka Jawa dapat dilakukan menggunakan metode diagonal distance feature dan longest run feature. Diagonal distance feature adalah metode yang berfungsi mengenali pola dengan menghitung jarak diagonal antara sudut siku gambar hingga di temukannya piksel hitam dari karakter gambar . Sedangkan longest run feature adalah metode untuk mengenali pola dengan menghitung jumlah piksel hitam yang terpanjang serta berturut-turut di sepanjang baris dan kolom, serta dua diagonal dari sub area citra. Hasil ekstraksi diagonal distance dan longest run feature nantinya menjadi input pelatihan MLP.


(7)

Proses pelatihan akan dilakukan sebanyak satu kali. Setelah dilatihkan dan diperoleh bobot yang optimal maka aplikasi siap untuk melakukan pengenalan pola. Pola yang dikenali adalah 10 jenis Angka Jawa. Data yang digunakan adalah 25 set tulisan tangan Angka Jawa untuk pelatihan, dan 25 set tulisan tangan Angka Jawa yang berbeda untuk pengujian.

Hasil pengujian untuk masing-masing sampel akan dikomparasikan untuk melihat kehandalan sistem yang menggunakan ektraksi diagonal distance feature dan longest run feature serta MLP untuk classifier-nya.

1.2 Perumusan Masalah

Dari latar belakang yang telah diuraikan di atas, maka dapat dirumuskan permasalahan yang dihadapi adalah :

1. Bagaimana mengekstraksi diagonal distance features dan longest run feature dari tulisan tangan Angka Jawa.

2. Bagaimana cara agar diagonal distance features dan longest run feature yang diekstrak menjadi input bagi MLP.

1.3 Pembatasan Masalah

Agar tidak menyimpang dari permasalahan, maka dalam penelitian ini memiliki batasan masalah sebagai berikut:

1. Objek yang dideteksi adalah pola tulisan tangan Angka Jawa.

2. Pengerjaan tugas akhir hanya fokus pada bagian ekstraksi ciri diagonal distance features dan longest run feature saja.


(8)

4

4. Angka Jawa yang dapat digunakan sebagai sampel adalah Angka Jawa yang terdiri dari satu digit angka mulai dari 0-9.

1.4 Tujuan

Tujuan dari pembuatan aplikasi yang dilakukan pada tugas akhir ini adalah sebagai berikut:

1. Mengekstraksi tulisan tangan Angka Jawa menggunakan diagonal distance feature dan longest run feature.

2. Mengenali Angka Jawa menggunakan MLP berdasarkan output ektraksi fitur menggunakan diagonal distance feature dan longest run feature. 3. Menguji hasil pengenalan pola Angka Jawa berdasarkan hasil ektraksi

fitur menggunakan diagonal distance feature dan longest run feature.

1.5 Manfaat Penelitian

Manfaat dari penelitian ini adalah:

1. Untuk mengetahui apakah hasil ekstraksi diagonal distance dan longest run feature lebih baik dari metode ektraksi lainnya.

2. Hasil penelitian ini diharapkan menjadi bahan pertimbangan untuk pengembangan ektraksi pengenalan pola khususnya menggunakan ekstraksi fitur diagonal distance dan longest run serta menjadi acuan untuk penelitian lebih lanjut.

3. Hasil penelitian ini diharapkan dapat menjadi informasi atau tambahan referensi bagi mahasiswa untuk menambah pengetahuan tentang longest run feature dan diagonal distance feature.


(9)

1.6 Sistematika penulisan

Penulisan tugas akhir ini secara sistematis diatur dan disusun dalam lima bab yang didalamnya terdapat beberapa sub bab, dimana akan dijelaskan secara rinci semua penjelasan dalam pembuatan alat ini. Secara ringkas uraian materi dari bab pertama hingga bab terakhir adalah sebagai berikut :

Bab I : Pendahuluan

Pada bab ini merupakan pendahuluan dari karya tulis tugas akhir ini yang membahas mengenai latar belakang masalah, perumusan masalah, batasan masalah, tujuan, manfaat, dan sistematika penulisan buku tugas akhir ini.

Bab II : Landasan Teori

Bab ini menjelaskan tentang beberapa teori yang mendukung pokok pembahasan tugas akhir yang meliputi definisi yang berkaitan dalam tugas akhirini diantaranya pembahasan tentang Aksara Jawa, optical character recognition (OCR), region of interest(ROI), multi layer perceptron (MLP), longest run feature, dan diagonal distance feature.

Bab III : Metode Penelitian

Bab ini menjelaskan mengenai perancangan dan pembuatan sistem yang membahas tentang proses penentuan region of interest (ROI),


(10)

6

ektraksi longest run feature, ektraksi diagonal distance feature, input multi layer perceptrone (MLP), dan multi layer perceptron (MLP).

Bab IV : Pengujian sistem

Bab ini menjelaskan mengenai pengujian ektraksi fitur dan pengenalan pola Angka Jawa. Pengujian yang dilakukan adalah sebagai berikut:

- Pengujian region of interest (ROI) - Pengujian resize

- Pengujian ektraksi diagonal distance feature - Pengujian ektraksi longest run feature

- Pengujian pengenalan pola Angka Jawa menggunakan MLP dengan ektraksi fitur menggunakan diagonal distance feature dan longest run feature.

Bab V : Penutup

Bab ini menjelaskan tentang kesimpulan serta saran dari penulis, sehingga dapat digunakan sebagai bahan penelitian lebih lanjut.


(11)

7 2.1 Aksara Jawa

Carakan (Abjad/Aksara Jawa) adalah huruf yang digunakan dalam ejaan bahasa Jawa yang pada dasarnya terdiri atas dua puluh aksara pokok (nglegena), yang ditunjukkan pada Gambar 2.1, yang bersifat silabik (kesukukataan). (Darusuprapta, dkk., 2002). Bentuk kontemporer Aksara Jawa terbentuk sejak masa Kerajaan Mataram pada abad ke-17.

Selain dua puluh aksara pokok tersebut, Aksara Jawa juga memiliki kelompok aksara kapital (murda), vokal (swara), rekaan (rekan), pengubah bunyi (sandangan), penanda gugus konsonan, penutup konsonan(pasangan), pangkon, tanda baca, dan angka.


(12)

8

Gambar 2.2 Angka Jawa

Gambar 2.3 Tanda “Pada Pangkat” untuk mengapit penulisan Angka Jawa Beberapa dari Angka Jawa, seperti pada Gambar 2.2, dalam Aksara Jawa memiliki bentuk yang mirip dengan kelompok Aksara Jawa lainnya. Beberapa di antaranya misalkan angka “1” dalam Aksara Jawa memiliki bentuk yang sama dengan huruf “Ga” pada kelompok Aksara Jawa Nglegena, kemudian angka “9” sama dengan huruf “Ya” dalam kelompok Aksara Jawa Nglegena. Oleh karena itu, penulisan Angka Jawa, menurut pedoman yang ditulis oleh Darusuprapta dkk., harus diapit oleh tanda baca yang memiliki istilah “pada pangkat” seperti pada Gambar 2.3.

2.2 Ektraksi Fitur

Ekstraksi fitur dapat didefinisikan sebagai ekstraksi yang mengutamakan informasi dari ciri yang mewakili sebuah baris data, yang mana data diminimalisasi ke dalam pola yang berbeda-beda (Trier, 1996). Untuk tujuan inilah, kumpulan dari ciri (fitur) yang diekstrak pada tiap-tiap kelas akan membantu untuk membedakan pola yang diekstrak dari pola lain.


(13)

2.3 Optical Character Recognition (OCR)

Optical character recognition (OCR) adalah proses pengenalan karakter dari file citra dan juga pengenalan alfanumerik yang dicetak atau penulisan tangan dari karakter, teks, angka, huruf dan simbol agar bisa dibaca oleh komputer (Mukherjee, 2010). OCR merupakan pengenalan pola dan pengolahan karakter tulisan tangan yang didasari keinginan manusia untuk meningkatkan komunikasi dengan komputer. Banyak penelitian yang telah dilakukan untuk mengembangkan sistem OCR dalam berbagai skrip. OCR meliputi scanning gambar kemudian diterjemahkan menjadi teks, dari dokumen kertas menjadi gambar, kemudian gambar diterjemahkan ke dalam kode karakter yang pada komputer seperti membaca kode ASCII. Pengenalan kode pos, pengolahan bentuk, verifikasi tanda tangan adalah bentuk-bentuk penerapan OCR (Mukherjee, 2010).

2.4 Region Of Interest (ROI)

Region of interest (ROI) merupakan salah satu fitur yang tersedia dalam JPEG2000. ROI memungkinkan dilakukannya pengkodean secara berbeda pada area tertentu dari citra digital, sehingga mempunyai kualitas yang lebih baik dari area sekitarnya. Fitur ini menjadi sangat penting, bila terdapat bagian tertentu dari citra digital yang dirasakan lebih penting dari bagian yang lainnya.

Piksel memiliki nilai intensitas tertinggi dalam seleksi citra, kemudian piksel dibandingkan dengan piksel tetangga. Perbandingan ada perubahan dalam tingkat intensitas nilai piksel. Semua piksel memiliki bentuk intensitas yang sama dalam ROI (Nurtanio, dkk, 2013).


(14)

10

2.5 Diagonal Distance Feature

Diagonal distance feature adalah metode ekstraksi fitur yang digunakan untuk mengenali suatu pola tulisan, angka, atau simbol pada citra dengan cara menghitung jarak sudut diagonal hingga bertemuanya piksel hitam pada dari citra (Nibaran das dkk, 2006). Citra yang dapat digunakan dalam metode ini hanya citra biner, Oleh karena perlu dilakukan konversi citra menjadi biner apabila tidak sesuai. Seperti diilutrasikan pada gambar 2.4.

Gambar 2.4. Diagonal Distance Feature

Empat nilai jarak dari sisi-sisi diagonal itulah yang akan menjadi nilai inputan untuk jaringan MLP.

2.6 Longest Run Feature

Longest run feature adalah suatu metode ekstraksi fitur yang digunakan untuk mengenali suatu pola tulisan, angka, atau simbol pada citra dengan cara menghitung jumlah piksel berwarna hitam yang saling berurutan pada tiap sub-sub citra. Jumlah piksel hitam yang terpanjang di seluruh baris dan kolom, serta dua diagonal dari area sub citra (Nibaran das dkk, 2006). Citra yang dapat digunakan dalam metode ini hanya citra biner, Oleh karena perlu dilakukan konversi citra menjadi biner apabila tidak sesuai.


(15)

2.7 Handwritten ‘Bangla’ Alphabet Recognition using an MLP Based Classifier (Basu, dkk., 2005)

Penelitian serupa pernah dilakukan oleh Basu pada tahun 2005. Dalam penelitian tersebut, metode yang digunakan adalah multi layer perceptron. MLP digunakan untuk melakukan pengenalan terhadap huruf-huruf alfabetik Bangla. Huruf alfabetik Bangla terdiri dari 50 jenis huruf yang terdiri dari 11 huruf vokal dan 39 huruf konsonan seperti pada gambar 2.5.

Pada penelitian tersebut, citra masing-masing sampel huruf Bangla dibagi menjadi 64 x 64 piksel. Pada citra huruf Bangla tersebut juga dilakukan ekstraksi fitur sebanyak 76 fitur yang dikategorikan dalam 24 Shadow Features, 16 centroid features, dan 36 longest-run features. Sampel huruf yang digunakan dalam penelitian ini adalah 10.000 sampel huruf yang didapatkan dari tulisan tangan 200 orang dengan jenis kelamin dan umur yang bervariasi. Dari 10.000 sampel tersebut, 8.000 sampel digunakan sebagai sampel pelatihan dan 2.000 sampel digunakan sebagai sampel uji.


(16)

12

(b)

Gambar 2.5 Huruf Alfabetik Bangla (a) Vokal dan (b) Konsonan Proses training dilakukan dengan bentuk jaringan yang hanya memiliki satu layer tersembunyi dan dengan beberapa konfigurasi jumlah neuron yang berbeda-beda. Masing-masing proses pelatihan dilakukan sampai dengan 2.000 iterasi, laju pembelajaran sebesar 0,8, dan nilai momentum sebesar 0,7.

Hasil percobaan dari penelitian ini ditunjukkan pada, di mana hasil yang paling baik didapatkan dari jaringan dengan jumlah neuron 60. Pada percobaan tersebut, persentase keberhasilan dari sampel pembelajaran adalah 86,46% sedangkan untuk sampel uji adalah 75,05%.

2.8 An MLP Based Approach for Recognition of Handwritten ‘Bangla’ Numerals (Basu, dkk., 2005)

Seperti halnya pada Sub-Bab 2.7, pada penelitian ini peneliti yang sama dan dengan metode yang sama. membuat pengenalan pola tulisan tangan untuk angka ‘Bangla’. Angka Bangla terdiri dari 10 jenis angka yang merepresentasikan 0 – 9 seperti pada Gambar 6.


(17)

Gambar 2.6 Bentuk tulisan angka ‘Bangla’

Pada penelitian kali ini digunakan data sampel tulisan tangan untuk angka-angka ‘Bangla’ dari 600 orang, sehingga didapatkan 6.000 sampel pola. 4.000 sampel digunakan sebagai sampel pembelajaran dan 2.000 sampel digunakan sebagai sampel uji.

Hasil dari penelitian ini menunjukkan bahwa tingkat keberhasilan paling tinggi didapatkan dari percobaan dengan jumlah neuron 65, yaitu 96,67%.

2.9 Handwritten Arabic Numeral Recognition using a Multi layer Perceptron (Das, dkk., 2006)

Di tahun 2006, oleh peneliti yang berbeda ada penelitian dengan tema yang sama, yaitu tentang optical character recognition (OCR). Sama halnya seperti dua penelitian sebelumnya pada Sub Bab 2.7 dan 2.8, pada penelitian ini metode yang digunakan juga masih sama. Hanya saja bedanya adalah jenis karakter yang dikenali adalah angka Arab.

Angka Arab terdiri dari 10 jenis karakter yang merepresentasikan 0 – 9 seperti pada Gambar 7. Dalam penelitian ini sebanyak 300 set tulisan angka Arab dari orang-orang yang berbeda digunakan sebagai sampel. Yang digunakan sebagai sampel uji sebanyak 2.000 sampel, sedangkan sisanya digunakan sebagai sampel uji.


(18)

14

Hasil paling baik didapatkan pada jaringan dengan jumlah neuron pada layer tersembunyi sebanyak 54 neuron. Persentase keberhasilan dari bentuk jaringan tersebut mencapai 95%.

Gambar 2.7 Bentuk tulisan Angka Arab

2.10 Handwritten Bangla Basic and Compound Character Recognition Using MLP and SVM Classifier (Das dkk., 2010)

Das dkk, pada 2010 melanjutkan penelitian pengenalan karakter Bangla. Kali ini, yang dikenali adalah 55 dari 160 karakter vokal dan konsonan pertama yang paling sering digunakan. Ekstraksi ciri yang digunakan adalah Shadow feature , longest-run feature, quad tree, dan diagonal distance. Sedangkan algoritma pengelompokan yang digunakan ada dua, yaitu MLP dan SVM (support vector machine).

Hasil dari penelitian ini menunjukkan tingkat keberhasilan rata-rata dengan menggunakan MLP adalah 79,25 %. Sedangkan pada metode SVM, rata-rata tingkat keberhasilannya naik menjadi 80,51%.

2.11 Pengenalan Pola Tulisan Tangan Aksara Jawa “Ha Na Ca Ra Ka” Menggunakan Multi Layer Perceptron (Wibowo dan Wirakusuma, 2013)

Pada 2013, Wibowo dan Wirakusuma telah melakukan kajian terhadap topik ini. Namun tulisan tersebut menggunakan 5 huruf awal, yaitu “Ha”, “Na”,


(19)

“Ca”, “Ra”, dan “Ka”. Jumlah sampel yang digunakan untuk pembelajaran adalah 15 set sampel dan pengujian dilakukan terhadap 5 set sampel.

Data yang digunakan untuk dimasukkan dalam jaringan MLP adalah data mentah dari citra yang dikecilkan saja. Dalam penelitian ini tidak digunakan proses ekstraksi ciri.

Hasil dari penelitian tersebut menunjukkan proses pembelajaran yang konvergen dengan nilai SSE sebesar 0.00096118032275095setelah iterasi ke-738.522.Konfigurasi yang digunakan pada penelitian tersebut adalah:

- Jumlah hidden layer : 2

- Jumlah neuron input : 300

- Jumlah neuron layer 1 : 80

- Jumlah neuron layer 2 : 80

- Jumlah neuron output : 5

- Laju pembelajaran (µ) : 0.1

- Error minimum : 10E-4

- Iterasi maksimum : 10E+5

Pengujian yang dilakukan mendapatkan hasil bahwa seluruh sampel pembelajaran yang dicoba untuk dikenali ulang berhasil dikenali dengan benar. Sedangkan untuk sampel uji, 14 huruf dari 25 huruf uji dapat dikenali dengan benar.

2.12 Multi Layer Perceptron

Multi layer perceptron (MLP) adalah perkembangan dari algoritma perceptron yang memiliki layer lebih dari sekedar input layer dan output layer.


(20)

16

Pada MLP, terdapat layer-layer tambahan yang disebut dengan hidden layer. Dengan adanya hidden layer ini MLP dimungkinkan untuk dapat mengenali pola yang kompleks yang tidak dapat dikenali oleh struktur jaringan perceptron konvensional. Struktur jaringan MLP dapat dilihat pada Gambar 2.8.

Gambar 2.8 Struktur Jaringan MLP (Ham, Kostanic, 2001)

Neuron-neuron pada hidden layer memiliki proses perhitungan yang sama dengan neuron-neuron pada output layer. Hanya saja nilai hasil perhitungan dari setiap neuron pada hidden layer ini nantinya akan digunakan sebagai masukan untuk layer-layer berikutnya. Proses perhitungan dari masing-masing neuron pada tiap layer melibatkan luaran dari neuron-neuron di layer sebelumnya dan bobot dari koneksi antara neuron tersebut dengan neuron-neuron di layer sebelumnya. Di mana w adalah bobot antara luaran x dari neuron di layer sebelumnya dengan


(21)

neuron yang akan dihitung luarannya. Namun nilai u tersebut bukanlah luaran akhir dari neuron. Untuk itu nilai u tersebut harus ditambah dengan bias atau dikurangi threshold untuk menjadi v sebelum dimasukkan ke dalam fungsi aktivasi. Jika fungsi aktifasi yang dipilih menggunakan fungsi sigmoid unipolar maka secara umum y didapat dengan persamaan:

=

�� �� =

1

1 +

−���

. Luaran y dari neuron di output layer adalah luaran akhir dari MLP. Proses yang terjadi mulai dari input layer hingga output layer ini disebut dengan feed-forward. Nilai luaran yang dihasilkan akan sangat bergantung pada konfigurasi bobot yang terhubung antar neuron. Untuk mendapatkan nilai bobot yang sesuai maka diperlukan proses pelatihan atau learning MLP.


(22)

18 BAB III

METODE PENELITIAN

3.1 Rancangan Penelitian

Pengerjaan tugas akhir ini ditunjukkan dalam bentuk blok diagram pada gambar 3.1. Blok diagram ini menggambarkan proses dari sampel citra hingga output berupa pengenalan Angka Jawa.

Gambar 3.1 Blok Diagram

Pengerjaan tugas akhir ini hanya fokus pada bagian dalam dari area garis biru putus-putus diatas. Sampel Citra tulisan tangan Angka Jawa diambil melalui canvas virtual pada aplikasi. Setiap participant akan menggambar 1 digit Angka Jawa satu demi satu dari angka 0 sampai 9. Data citra yang dihasilkan dapat memiliki resolusi serta motif yang bervariasi.

Pertama-tama dilakukan digitalisasi dari gambar ke biner. Selanjutnya Pada gambar tersebut dilakukan ROI untuk membuang bagian yang tidak


(23)

diperlukan. Hasil ROI berupa crop gambar berbentuk persegi. Kemudian hasil croping gambar diresize menjadi berukuran 64x64 piksel. Pada tiap piksel akan dicari nilai biner beserta nilai kordinatnya, jika warna piksel condong ke hitam

maka akan bernilai “0” dan jika lebih condong ke putih maka akan bernilai “1”.

Terakhir dilakukan ektraksi fitur diagonal distance feature dan longest run feature sekaligus normalisasi nilai fitur. Ekstraksi diagonal distance feature dilakukan dengan cara menghitung jarak diagonal dari sudut siku citra hingga bertemunya piksel hitam. Sedangkan ektraksi longest run feature dilakukan dengan cara menghitung jumlah piksel hitam yang saling berurutan dan terpanjang dari seluruh baris, kolom dan dua diagonal dari sub area citra. Ektraksi fitur longest run dari tiap sub area citra menghasilkan nilai fitur maksimal yaitu 1024. Semua nilai dari ektraksi fitur longest run tersebut dinormalisasi dengan membaginya dengan 1024 sehingga memiliki range nilai terkecil 0 dan terbesar 1. Pada ektraksi diagonal distance nilai fitur maksimal adalah 64 maka setiap nilai fitur dinormalisasi dengan membaginya dengan 64 sehingga memiliki range nilai terkecil 0 dan terbesar 1. Normalisasi digunakan untuk menghindari overflow variabel yang digunakan pada project tugas akhir.


(24)

20

3.2 Tahapan Penelitian

Tahapan-tahapan dalam menyelesaikan tugas akhir ini ditunjukkan pada Gambar 3.2 dibawah ini.

Gambar 3.2 Diagram Alir Tugas Akhir

a. Mengumpulkan literatur yang berhubungan dengan tugas akhir yang akan dikerjakan baik dari buku, jurnal, maupun dari internet. Serta mempelajari hingga detail pengenalan pola tulisan menggunakan menggunakan diagonal distance feature dan longest run feature extraction.

b. Melakukan perancangan aplikasi yang dibuat. Perancangan perangkat lunak dibagi menjadi beberapa tahap, yaitu :

1. Merancang media input pola Angka Jawa untuk keperluan pengujian sampel.

2. Merancang proses Region Of Interest (ROI) yang digunakan membuang bagian yang tidak perlu dari citra masukkan dari kanvas oleh user, agar lebih fokus pada citra yang akan di ektraksi.

Studi Literatur

Perancangan Aplikasi Diagonal Distance Feature

dan Longest Run Feature Extraction

Pengumpulan Data Sampel Uji

Pembelajaran Menggunakan Data Yang Sudah Diekstrak

Pencatatan Data Percobaan Analisis Data Dan Uji Signifikansi Pelaporan MLP


(25)

3. Merancang proses Resize citra menjadi sebesar 64 x 64 piksel yang digunakan untuk standarisasi resolusi citra, karena pada proses ROI menghasilkan resolusi citra yang bervariasi.

4. Merancang proses diagonal distance deature dan longest run feature extraction serta merancang ruang penyimpanan pola huruf yang sudah dimasukkan agar tidak perlu membuat pola baru untuk memudahkan saat dilakukan pengujian.

5. Merancang sistem proses evaluasi dan pencatatan.

c. Mengambil sampel data learning pola huruf pada media yang dibuat pada perangkat lunak. Data learning harus bervariasi. Ada 10 pola Angka Jawa yang harus dikenali dan masing – masing pola diberi 25 variasi sampel data training dan 25 sampel data untuk testing.

d. Menjalankan proses learning sesuai dengan data learning yang diberikan point c, yang kemudian diekstrak menggunakan diagonal distance feature dan longest run feature extraction.

e. Proses learning menggunakan MLP dari citra sudah diekstrak fitur-fiturnya menggunakan diagonal distance feature dan longest run feature extraction. f. Pencatatan data dan menjalankan sistem keseluruhan yang meliputi

parameter-parameter yang sesuai dengan perumusan masalah yang di kemukakan.

g. Melakukan analisa, penarikan kesimpulan dan pengujian siginifikasi hasil yang didapat dari sampel yang diolah terlebih dahulu dengan mengekstrak cirinya dibandingkan dengan learning menggunakan data mentah.


(26)

22

3.3 Perancangan Perangkat Lunak

Melakukan perancangan perangkat lunak yang akan dibuat. Perancangan perangkat lunak dibagi menjadi beberapa tahap, yaitu :

3.3.1 Desain Kanvas Virtual

Kanvas virtual digunakan sebagai media masukan oleh participant untuk menggambar pola Angka Jawa. Device yang bisa digunakan diantaranya mouse ,tablet pen dan smartphone. Kanvas virtual akan menangkap pola tulisan tangan yang telah digambarkan. Kanvas virtual ini dibuat menggunakan tool PictureBox yang disediakan pada Visual basic 6.0 dengan resolusi 256x256 piksel.

Untuk membuat pola Angka Jawa, pertama-tama participant harus mengetahui bentuk dari Angka Jawa yang akan dibuat. Selanjutnya participant dapat memulai menggambar pola Angka Jawa dengan cara drag mouse pada area kanvas. Icon pointer untuk penanda menggambar di kanvas menggunakan pointer default yaitu “arrow”. Tombol “clear” digunakan untuk menghapus seluruh gambar jika suatu saat terjadi salah penulisan pada canvas virtual.


(27)

Gambar 3.3 Kanvas Virtual

gambar pola Angka Jawa participant akan disimpan dengan format bitmap (.bmp). format bitmap umum digunakan pada sistem operasi windows dan juga dapat dibuka oleh hampir semua software pengolah gambar. cara membuat kanvas virtual adalah sebagai berikut:

1) Pada area kerja visual basic 6.0 bagian toolbox pilih frame

Gambar 3.4 Frame

2) Klik dan drag pada area kerja untuk membuat frame. Frame berfungsi untuk mengelompokkan semua item pada canvas virtual.

3) Pilih PictureBox, kemudian klik dan drag di dalam area frame.

Gambar 3.5 PictureBox

4) Buat tombol “clear” dengan pilih CommandButton, klik dan drag pada


(28)

24

Gambar 3.6 CommandButton 5) Atur property picture box seperti berikut ini:

- BackColor : warna putih - ScaleMode : pixel - Width : 3900 - Height : 3900

Gambar 3.7 Property PictureBox 3.3.2 Digitalisasi

Digitalsisasi adalah proses pembacaan dan pengkodean warna per pixel pada kanvas. piksel berwarna putih memiliki nilai 255 dan piksel berwarna hitam memiliki nilai 0. Gambar pola Angka Jawa akan di scaning per baris untuk membaca warna tiap piksel untuk di klasifikasikan. Saat scaning berlangsung kordinat piksel akan disimpan dalam array 2 dimensi dengan format kolom , baris (x,y).


(29)

3.3.3 Pembuatan ROI (Region Of Interest) dan Scalling / Resize

Proses ROI berfungsi untuk membuang bagian dari gambar yang tidak diperlukan untuk diolah, agar lebih fokus pada area pola Angka Jawa yang akan di ektraksi saja. Karena hasil tulisan tangan Angka Jawa dari participant memiliki pola dan resolusi yang bervariasi. Pertama-tama dilakukan scaning secara per baris dimulai dr kordinat (x,y)=(0,0) atas hingga bertemu piksel hitam, jika sudah bertemu piksel hitam kemudian break dan simpan kordinat untuk menandai batas atas(ba). selanjutnya dilakukan scaning secara baris juga namun dimulai dr kordinat (x,y)=(255,255) atas hingga bertemu piksel hitam, jika sudah bertemu piksel hitam kemudian break dan simpan kordinat untuk menandai batas bawah(bb). Langkah yang sama di ulangi namun scaning dijalankan dari secara per kolom. Nilai panjang sama dengan batas bawah – batas atas. Nilai lebar sama dengan batas kanan – batas kiri. Setelah itu dibandingkan nilai yang lebih panjang antara panjang dan lebar, yang nilainya lebih panjnag dikurangkan yang terpendek. Selisih dari pengurangan kemudian dibagi dua. Setelah itu nilainya ditambahkan untuk kedua sisi yang terpendek untuk menghasilkan perpotongan yang persegi. Dalam Proses croping, citra harus di crop secara persegi dan posisi citra berada tenggah-tengah persegi (center). Setelah croping selesai maka selanjutnya citra diresize menjadi resolusi 64x64 piksel.


(30)

26

Gambar 3.8 Citra yang akan melewati proses ROI dan scalling / resize

Gambar 3.9 Flowchart proses ROI dan resize 3.3.4 Ektraksi Diagonal Distance Feature

Metode ektraksi fitur diagonal distance digunakan pada penelitian ini karena ektraksi ini dapat digunakan untuk mengektraksi pola tulisan, angka, atau


(31)

simbol pada citra. Pada tahun 2010 pernah dilakukan penelitian mengenai pengenalan pola tulisan tangan pada huruf bangla menggunakan MLP dan input dari MLP adalah hasil dari ektraksi fitur. Salah satu ektaksi fitur yang digunakan pada penelitian tersebut adalah menggunakan ektraksi fitur diagonal distance (Das dkk., 2010). Diagonal distance feature adalah metode untuk mengektraksi fitur dengan cara menghitung jarak diagonal dari sudut siku citra hingga bertemunya piksel hitam. Citra yang sudah melalui proses ROI dan resize akan menghasilkan gambar beresolusi 64x64 piksel. Dari gambar ini akan dilakukan perhitungan jarak di mulai dari sudut siku gambar terus berjalan secara diagonal hingga bertemu piksel hitam. Pada ektraksi ini satuan jaraknya adalah piksel. Citra yang di ekstrak akan menghasilkan total fitur diagonal distance berjumlah 4 fitur seperti gambar 3.10 dibawah ini.

Gambar 3.10 Ektraksi diagonal distance feature

Pertama-tama dibuat 4 titik awal diagonal yang dimulai dari koordinat diagonal kiri atas (x,y)=(0,0), diagonal kanan atas (x,y)=(63,0), diagonal kiri bawah (x,y)=(0,63), dan diagonal kanan bawah (x,y)=(63,63). Kemudian penghitungan jarak dilakukan dengan menggunakan perulangan dengan pola sebagai berikut:


(32)

28

A. Diagonal 1 dicari dengan menaikkan satu koordinat (x,y) secara terus menerus hingga mencapai koordinat yang memiliki warna piksel hitam. Setiap nilai koordinat (x,y) dinaikkan satu maka saat itu dilakukan juga penghitungan(counter) jarak diagonal 1. Diilustrasikan pada gambar 3.11.

Gambar 3.11 Diagonal 1

B. Diagonal 2 dicari dengan menaikkan satu koordinat (y) dan menurunkan 1 nilai (x) secara terus menerus hingga mencapai koordinat yang memiliki warna piksel hitam. Setiap nilai koordinat (x,y) dinaikkan maka saat dilakukan juga penghitungan(counter) jarak diagonal 2. Diilustrasikan pada gambar 3.12.

Gambar 3.12 Diagonal 2

C. Diagonal 3 dicari dengan menaikkan satu koordinat (x) dan menurunkan 1 nilai (y) secara terus menerus hingga mencapai


(33)

koordinat yang memiliki warna piksel hitam. Setiap nilai koordinat (x,y) dinaikkan maka saat dilakukan juga penghitungan(counter) jarak diagonal 3. Diilustrasikan pada gambar 3.13

Gambar 3.13 Diagonal 3

D. Diagonal 1 dicari dengan menurunkan satu koordinat (x,y) secara terus menerus hingga mencapai koordinat yang memiliki warna piksel hitam. Setiap nilai koordinat (x,y) diturunkan satu maka saat itu dilakukan juga penghitungan(counter) jarak diagonal 4. Diilustrasikan pada gambar3. 14.

Gambar 3.14 Diagonal 4

Keempat nilai diagonal itulah yang akan digunakan sebagai input bagi jaringan MLP, sehingga dapat diklasifikasikan lebih lanjut.


(34)

30

Gambar 3.15 Tampilan pada aplikasi ektraksi diagonal distance feature Langkah-langkah ekstraksi dijelaskan dengan flowchart pada Gambar 3.16 dibawah ini:

Gambar 3.16 Flowchart diagonal distance feature extraction

3.3.5. Ektraksi Longest Run Feature

Metode ektraksi fitur longest run digunakan pada penelitian ini karena ektraksi ini dapat digunakan untuk mengektraksi pola tulisan, angka, atau simbol pada citra. Pada tahun 2010 pernah dilakukan penelitian mengenai pengenalan pola tulisan tangan pada huruf bangla menggunakan MLP dan input dari MLP


(35)

adalah hasil dari ektraksi fitur. Salah satu ektaksi fitur yang digunakan pada penelitian tersebut adalah menggunakan ektraksi fitur longest run (Das dkk., 2010). Sama seperti pada sub bab 3.3.4 bahwa citra tulisan tangan Angka Jawa dari participant, perlu dilakukan ROI (Region Of Interest), kemudian baru dilakukan resize ukuran citra. Pada ektraksi longest run, ukuran citra sebesar 64 x 64 piksel dibagi menjadi 9 sub area citra yang saling tumpang tindih, seperti ditunjukan pada gambar 3.17.

Gambar 3.17 Area sub citra

Longest run feature extraction adalah pengenalan pola dari suatu citra dengan cara menghitung jumlah piksel hitam yang terpanjang serta berturut-turut di sepanjang seluruh baris dan kolom, serta dua diagonal dari area sub citra, seperti ditunjukan pada gambar 3.18.


(36)

32

Gambar 3.18 Ilustrasi ekstraksi longest run (I). Longest run fitur dari baris

(II). Longest run fitur dari kolom (III). Longest run fitur dari diagonal a (IV). Longest run fitur dari diagonal b

Dari tiap sub area akan menghasilkan 4 fitur. Maka dari seluruhnya akan didapatkan 4 x 9 = 36 longest run feature dari karakter gambar yang diinputkan.


(37)

Gambar 3.19 Tampilan pada aplikasi ektraksi longest run feature


(38)

34

Gambar 3.20 Flowchart longest run feature extraction 3.3.6. Input Multi Layer Perceptrone (MLP)

Keluaran dari ekstraksi diagonal distance features adalah nilai jarak dari empat sudut diagonal persegi hingga mencapai piksel berwarna hitam. Sedangkan Keluaran dari ekstraksi longest run features adalah jumlah piksel hitam yang terpanjang serta berturut-turut di sepanjang seluruh baris dan kolom, serta dua diagonal dari area kotak kecil, total keseluruhan fitur longest run adalah 36 fitur. Skala citra sebesar 64 piksel x 64 piksel, fitur diagonal distance memiliki nilai maksimal fitur sebesar 64 piksel dan minimal 0 piksel, sehingga nilai diagonal distance dinormalisasi dengan membagi nilai fitur dengan 64. Tiap area kotak kecil pada longest run feature akan menghasilkan nilai maksimal baris dan kolom sebesar 1024 piksel saat semua piksel berwarna hitam, maka nilai yang didapatkan akan dinormalisasi dengan cara dibagi dengan 1024.


(39)

Gambar 3.21 Output diagonal distance features dan longest run feature menjadi inputan MLP

Total fitur yang akan di hasilkan berjumlah 40 fitur, yaitu 4 fitur dari ektraksi diagonal distance feature dan 36 fitur dari ektraksi longest run feature., begitu juga dengan neuron input dari MLP seperti pada gambar 16. Nilai normalisasi tersebut dimasukkan ke MLP untuk dilakukan learning dan pengenalan Angka Jawa.

Langkah meng-inputkan nilai output ekstraksi dan pengujian MLP serta pengolahan data ekstraksi diperlihatkan dalam flowchart pada Gambar 3.22.

1

2

3

Multi Layer Perceptron

(MLP)

Normalisasi Output Diagonal Distance

dan Longest Run Feature


(40)

36


(41)

Gambar 3.23 Flowchart testing MLP 3.3.7 Learning MLP

Aplikasi ini akan menghasilkan 2 buah file log untuk bobot yang dihasilkan. Bobot hasil akhir learning yang tercapai apabila syarat eror minimum atau iterasi maksimum terpenuhi, akan disimpan ke dalam file weight.dat. Selain itu, ada file bernama weight2.dat untuk menyimpan informasi bobot setiap 100 iterasi. Hal ini diperlukan sebagai tindakan preventif bila terjadi hal-hal yang dapat menghentikan aplikasi sebelum mencapai akhir learning, yang bisa disebabkan karena komputer hang atau putusnya aliran listrik. Penentuan konfigurasi learning adalah berdasarkan pada penelitian yang telah dilakukan oleh peneliti lain (Wibowo dan Wirakusuma, 2013).


(42)

38

Proses learning dilakukan dengan konfigurasi sebagai berikut: A. Konfigurasi learning MLP dengan input 40 Fitur

40 fitur adalah nilai-nilai hasil ektraksi menggunakan longest run feature dan diagonal distance. 36 fitur dari ektraksi menggunakan longest run dan 4 fitur dari ektraksi diagonal distance.

- Jumlah hidden layer : 2 - Jumlah neuron input : 40 - Jumlah neuron layer 1 : 20 - Jumlah neuron layer 2 : 40 - Jumlah neuron output : 10 - Laju learning (µ) : 0.1 - Error minimum : 10E-4 - Iterasi maksimum : 10E+5

Proses learning dilakukan sebanyak 1000000 iterasi dengan menggunakan 25 set sampel input dengan nilai error akhir sebesar 3.06665790754129E-04. Ini berarti proses learning selesai hingga iterasi maksimal terpenuhi. Bobot yang dihasilkan akan disimpan pada file weight.dat.

B. Konfigurasi learning MLP dengan input 36 Fitur

36 fitur adalah nilai-nilai hasil ektraksi menggunakan longest run feature. Sehingga hanya memerlukan 36 neuron untuk layer input. - Jumlah hidden layer : 2

- Jumlah neuron input : 36 - Jumlah neuron layer 1 : 20 - Jumlah neuron layer 2 : 40


(43)

- Jumlah neuron output : 10 - Laju learning (µ) : 0.1 - Error minimum : 10E-4 - Iterasi maksimum : 10E+5

Proses learning dilakukan sebanyak 1000000 iterasi dengan menggunakan 25 set sampel input dengan nilai error akhir sebesar 1.22653997160217E-04. Ini berarti proses learning selesai hingga iterasi maksimal terpenuhi. Bobot yang dihasilkan akan disimpan pada file weight.dat.

C. Konfigurasi learning MLP dengan input 4 Fitur

4 fitur adalah nilai-nilai hasil ektraksi menggunakan diagonal distance. Sehingga hanya memerlukan 4 neuron untuk layer input. - Jumlah hidden layer : 2

- Jumlah neuron input : 4 - Jumlah neuron layer 1 : 20 - Jumlah neuron layer 2 : 40 - Jumlah neuron output : 10 - Laju learning (µ) : 0.1 - Error minimum : 10E-4 - Iterasi maksimum : 10E+5

Proses learning dilakukan sebanyak 1000000 iterasi dengan menggunakan 25 set sampel input dengan nilai error akhir sebesar 27.0015495662298. Ini berarti proses learning selesai hingga iterasi maksimal terpenuhi. Bobot yang dihasilkan akan disimpan pada file weight.dat.


(44)

40

3.3.8 Output Multi Layer Perceptrone (MLP)

Keluaran dari MLP adalah pengenalan Angka Jawa. Angka Jawa yang akan dikenali terdiri dari satu digit Angka Jawa mulai angka 0 sampai 9. Pada MLP terdapat 10 buah output layer untuk mengakomodasi 10 Angka Jawa yang diklasifikasikan dengan pasangan data pelatihan MLP. table pasangan data pelatihan MLP ditunjukkan pada Tabel 3.1.

Tabel 3.1 Pasangan data pelatihan MLP untuk output layer

No. Angka Jawa Pasangan Data Layer 1 Layer 2 Layer 3 Layer 4 Layer 5 Layer 6 Layer 7 Layer 8 Layer 9 Layer 10

1 0 0 0 0 0 0 0 0 0 0 1

2 1 0 0 0 0 0 0 0 0 1 0

3 2 0 0 0 0 0 0 0 1 0 0

4 3 0 0 0 0 0 0 1 0 0 0

5 4 0 0 0 0 0 1 0 0 0 0

6 5 0 0 0 0 1 0 0 0 0 0

7 6 0 0 0 1 0 0 0 0 0 0

8 7 0 0 1 0 0 0 0 0 0 0

9 8 0 1 0 0 0 0 0 0 0 0

10 9 1 0 0 0 0 0 0 0 0 0

Pengenalan Angka Jawa menggunakan MLP dilakukan dengan cara melakukan pencocokan antara nilai fitur yang diperoleh dari threshold MLP dengan pasangan data. Threshold berfungsi menentukan jika output lebih besar dari 0,5 maka akan bernilai 1 dan jika lebih kecil maka dianggap sebagai 0. Dari


(45)

pasangan data yang yang dihasilkan dari 10 layer output maka akan menentukan output pengenalan dalam bentuk gambar seperti ditunjukkan pada gambar 3.24

Gambar 3.24 Output pengenalan MLP

Gambar diatas adalah contoh output pengenalan MLP saat penulis

menuliskan pola Angka Jawa “4” pada input project tugas akhir (kanvas virtual).

3.4 Alat dan Bahan Penelitian

Alat dan bahan yang akan digunakan dalam penelitian ini hanya terdiri dari beberapa alat pendukung untuk pembuatan program. Alat dan bahan yang akan digunakan sebagai berikut.

3.4.7 Alat Penelitian

Alat yang digunakan untuk menyelesaikan penelitian ini adalah personal computer (PC) / laptop. Alat tersebut bertujuan untuk membuat simulasi 2 dimensi dengan menggunakan program visual basic 6.0.


(46)

42

3.4.8 Bahan Penelitian

Bahan yang akan diteliti oleh penulis dalam penelitian kali ini meliputi beberapa aspek sebagai berikut.

2. Fitur diagonal distance dan longest run menggunakan software visual basic 6.0.

3. Data sampel set citra dari 50 orang yang simpan pola penulisannya pada komputer. 25 set untuk keperluan training perangkat lunak dan 25 set untuk keperluan testing.

3.5 Teknik Pengumpulan & Analisis Data 3.5.1 Pengumpulan Data

Data sampel primer untuk 1 set (10 pola angka) diperoleh dengan mengumpulkan hasil tulisan tangan dari orang yang berbeda. Karena ada 25 data sampel learning dan 25 data sampel uji untuk masing-masing angka, diperlukan 50 orang yang masing-masing memberikan 1 set sampel tulisan tangannya dalam Angka Jawa.

Pengumpulan data sekunder dilakukan dengan melakukan percobaan di laboratorium setelah perangkat lunak seperti yang dijelaskan pada sub bab 3.2 selesai dibuat dan sudah diperoleh bobot yang optimal. Sistem MLP dengan bobot optimal tersebut akan diuji menggunakan pola Angka Jawa, baik dari sampel yang digunakan untuk training maupun sampel testing.

3.5.2 Analisis Data

Data yang sudah terkumpul baik citra maupun hasil normalisasi ekstraksi (notepad) akan dilatihkan terhadap MLP. Akan dilakukan pengujian kembali pada


(47)

data sampel yang diperoleh untuk menghitung nilai error pada perangkat lunak sesudah learning.

Setelah menganalisa data sampel training berjumlah 25 set tulisan Angka Jawa, proses selanjutnya adalah analisa data sampel testing, sampel testing adalah data yang belum pernah dilatihkan pada MLP sebelumnya. Data tersebut diperoleh dari participant sebanyak 25 set tulisan Angka Jawa, dan sudah disimpan hasil normalisasi ekstraksinya. Kemudian pengujian secara langsung dengan citra tulisan Angka Jawa yang baru, selain data sampel training dan sampel testing. Ada 2 parameter yang akan diperhatikan dalam pengujian yang akan dihasilkan pada tiap-tiap pengujian, yaitu apakah pengenalan yang dihasilkan benar atau salah dikenali sebagai karakter yang lainnya.

3.6 Uji Coba

aplikasi ini akan diuji coba dengan cara melakukan proses ekstraksi fitur citra digital tulisan tangan Angka Jawa menggunakan metode diagonal distance feature dan longest run feature. Untuk mengetahui fitur yang didapat dari hasil ekstraksi diagonal distance maka akan dilakukan dengan cara mencetak angka-angka hasil ekstraksi yang didapatkan pada ListBox kemudian dibandingkan dengan ektraksi secara manual menghitung tiap piksel citra. Jika nilai manual dengan nilai dari aplikasi sama berarti ektraksi diagonal distance telah berjalan dengan baik. Selanjutnya akan dibuat cetakan gambar berupa piksel-piksel hitam pada PictureBox yang menunjukkan piksel tersebut telah terektraksi oleh diagonal distance. Kemudian untuk mengetahui fitur yang didapat dari hasil ekstraksi longest run maka akan dilakukan dengan cara mencetak angka-angka hasil ekstraksi yang didapatkan pada ListBox kemudian dibandingkan dengan


(48)

44

ektraksi secara manual menghitung tiap piksel citra. Jika nilai ektraksi secara manual dengan nilai ektraksi dari aplikasi sama berarti ektraksi longest run telah berjalan dengan baik. Selanjutnya akan dibuat cetakan gambar berupa piksel-piksel merah, biru, kuning dan hijau pada PictureBox yang menunjukkan piksel tersebut telah terektraksi oleh longest run. Akan dibuat 1 PictureBox untuk masing-masing metode ektraksi fitur tersebut. Selanjutnya hasil dari ekstraksi fitur Tulisan tangan aksara jawa akan dilakukan proses klasifikasi Angka Jawa dengan menggunakan aplikasi yang sudah dibuat, yaitu Multi Layer Perceptron (MLP) dengan inputan normalisasi output ektraksi diagonal distance dan longest run sehingga dapat dilihat kehandalan dari aplikasi yang telah dibuat.


(49)

45

Bab ini menjelaskan tentang seluruh hasil pengujian dari aplikasi yang telah dibuat. Pengujian yang dilakukan adalah menguji proses region of interest (ROI) yaitu suatu proses membuang bagian dari citra yang tidak diperlukan untuk diolah menjadi input, supaya fokus ektraksi hanya pada bagian yang terpenting dari citra saja. Menguji proses resize yaitu proses mengubah ukuran citra hasil ROI menjadi citra baru berukuran 64x64 piksel. Menguji hasil ektraksi citra menggunakan diagonal distance feature extraction yaitu ektraksi yang dilakukan dengan cara menghitung jarak dari sudut siku citra hingga bertemunya piksel berwarna hitam. Menguji hasil ektraksi citra menggunakan longest run feature extraction yaitu ektraksi yang dilakukan dengan cara mengbagi citra menjadi sembilan sub area citra, kemudian dari tiap sub area citra dicari jumlah dari piksel terpanjang serta berturut-turut di seluruh baris, kolom dan dua diagonalnya. Terakhir dilakukan pengujian mengenai hasil pengenalan Angka Jawa menggunakan sampel training dan sampel testing.

4.1 Pengujian Region Of Interest (ROI)

Pengujian dilakukan setelah participant menggambarkan sebuah citra berbentuk pola Angka Jawa pada kanvas virtual berukuran 256x256 piksel. Kemudian scaning pada citra dilakukan untuk mencari area piksel yang akan di crop.


(50)

46

4.1.1 Tujuan

Pengujian ini bertujuan untuk mengetahui apakah area yang di crop adalah bagian terpenting dari citra dan juga apakah hasil croping citra sudah berbentuk persegi.

4.1.2 Peralatan Yang Digunakan

A. Perangkat Keras

Peralatan yang digunakan untuk menguji region of interest (ROI) adalah sebuah personal computer yang memiliki spesifikasi seperti berikut:

- Processor : Intel, Core i3 @2.10Ghz (4CPUs)

- Memory : 4 GB

- Operating System : Windows 7 Ultimate – 64 Bit B. Perangkat Lunak

Perangkat lunak pendukung dalam menguji region of interest (ROI) adalah sebagi berikut:

- Project Tugas Akhir penulis digunakan untuk menghasilkan dan mengetahui ukuran croping citra ROI.

- Photoshop cs6 digunakan untuk mengetahui resolusi hasil crop secara manual.


(51)

4.1.3 Pengujian Region Of Interest (ROI)

A. Prosedur pengujian

1. Jalankan project tugas akhir *.vbp

2. Masukkan (Load) citra Angka Jawa pada direktori, seperti contoh gambar dibawah ini:

Gambar 4.1 Citra Angka Jawa 3. Klik entry

B. Hasil pengujian:


(52)

48

Area kuning pada gambar 4.2 adalah area yang dibuang. Citra asli menunjukkan berukuran 109x126 piksel. Setelah didapatkan citra asli selanjutnya dilakukan crop secara persegi. Sehinga ROI melakukan crop dengan ukuran 126x126 piksel. Sampai disini citra telah siap untuk diproses pada tahap resize. 4.1.4 Pengujian Region Of Interest (ROI) Secara Manual

A. Prosedur pengujian

1. Jalankan aplikasi adobe photoshop cs6 2. Klik file kemudian pilih open

3. Masukkan gambar yang sama seperti yang digunakan untuk pengujian pada sub bab 4.1.3

4. Lakukan zooming sampai maksimal dengan menekan tombol “CTRL

dan + “ pada keyboard secara bersamaan sampai piksel citra terlihat jelas seperti gambar dibawah ini:

Gambar 4.3 Zooming citra pada photoshop

4. Lakukan crop secara manual menggunakan tool crop dengan melihat batas-batas piksel terluar pada citra


(53)

5. Kemudian klik pada menu image, pilih image size B. Hasil pengujian:

Gambar 4.4 Hasil pengujian ROI pada Photoshop

Hasil crop secara manual menggunakan photoshop menunjukkan bahwa crop menghasilkan citra berukuran 109 x 126 piksel. Dari hasil pengujian ini dapat diambil kesimpulan bahwa Region Of Interest (ROI) telah menghasilkan crop citra dengan benar.


(54)

50

4.2 Pengujian Resize

Penentuan ukuran hasil resize akan berpengaruh pada hasil fitur yang akan didapatkan. Jika citra diresize dengan ukuran terlalu kecil maka akan menyebabkan perubahan bentuk karakter yang sangat jauh perbedaanya dari bentuk karakter yang semestinya. Hal ini juga dapat menyebabkan kemiripan fitur antara satu Angka Jawa dengan Angka Jawa yang lainnya menjadi lebih banyak. Namun jika resize terlalu besar maka akan menyebabkan proses ekstraksi akan berjalan semakin lama karena terlalu banyak piksel yang harus di scaning. Pemilihan hasil resize citra menjadi berukuran 64x64 piksel ditentukan berdasarkan penelitian yang pernah dilakukan (Nibaran das dkk, 2006). Citra yang sudah di ROI kemudian diresize menjadi berukuran 64 x 64 piksel. Proses resize dilakukan agar semua citra sampel nantinya memiliki ukuran sama saat diektrak.

4.2.1 Tujuan

Pengujian ini bertujuan untuk mengetahui resolusi citra yang telah diresize. Resize harus menghasilkan output citra dengan resolusi 64x64 piksel. 4.2.2 Peralatan Yang Digunakan

A. Perangkat Keras

Peralatan yang digunakan untuk menguji resize adalah sebuah personal computer yang memiliki spesifikasi seperti berikut:

- Processor : Intel, Core i3 @2.10Ghz (4CPUs)


(55)

- Operating System : Windows 7 Ultimate – 64 Bit B. Perangkat Lunak

Perangkat lunak pendukung dalam menguji resize citra adalah sebagi berikut: - Tugas akhir penulis digunakan untuk menghasilkan dan mengetahui

resolusi citra yang telah di resize.

- Photoshop cs6 digunakan untuk mengetahui resolusi citra hasil resize secara manual.

4.2.3 Pengujian Resize

A. Prosedur Pengujian

Prosedur pengujian adalah seperti langkah-langkah berikut ini: 1. Jalankan project tugas akhir*.vbp

2. Klik load untuk masukkan citra yang akan diuji

Gambar 4.5 Citra uji 3. Klik tombol entry

4. Buka file citra yang dihasilkan resize aplikasi pada direktori yang telah ditentukan


(56)

52

B. Hasil Pengujian

Gambar 4.6 Hasil pengujian resize

Pada gambar diatas menunjukkan dimensions atau resolusi citra berukuran 64x64 piksel, ini menunjukkan bahwa Resize telah menghasilkan citra dengan resolusi yang benar. Sebagai perbandingan, citra yang sama diujikan secara manual menggunakan adobe photoshop cs6 dibawah ini.

4.2.4 Pengujian Resize Secara Manual

A. Prosedur Pengujian

Prosedur pengujian adalah seperti langkah-langkah dibawah ini: 1. Buka Aplikasi Adobe photoshop cs6

2. Klik file kemudian open

3. Masukkan citra yang akan diujikan


(57)

B. Hasil Pengujian

Gambar 4.7 Hasil pengujian resize pada photoshop

Hasil pengujian secara manual menggunakan adobe photoshop menunjukkan hasil yang sama seperti pada pengujian pada bab 4.2.3. Citra telah diresize dengan resolusi 64x64 piksel. Dapat disimpulkan bahwa proses resize citra pada aplikasi tugas akhir telah menghasilkan output citra dengan resolusi yang benar.

4.3 Pengujian Longest Run Feature Extraction

Citra yang telah melalui ROI dan resize selanjutnya akan diolah untuk mendapatkan fitur-fiturnya. Nilai fitur yang dihasilkan dari metode longest run feature berjumlah 36 fitur. Fitur didapatkan dengan cara mecari jumlah piksel hitam terpanjang serta berurutan di seluruh baris, kolom serta dua diagonal dari sub area citra.

4.3.1 Tujuan

Pengujian ini bertujuan untuk mengetahui apakah ektraksi longest run feature telah menghasilkan output fitur yang benar.


(58)

54

4.3.2 Peralatan yang digunakan

A. Perangkat Keras

Peralatan yang digunakan untuk menguji longest run feature extraction adalah sebuah personal computer yang memiliki spesifikasi seperti berikut:

- Processor : Intel, Core i3 @2.10Ghz (4CPUs)

- Memory : 4 GB

- Operating System : Windows 7 Ultimate – 64 Bit B. Perangkat Lunak

Perangkat lunak pendukung dalam menguji metode longest run feature extraction adalah sebagi berikut:

- Project tugas akhir penulis digunakan untuk menghasilkan fitur citra melalui aplikasi yang telah dibuat.

- Matlab digunakan untuk membuat citra menjadi biner.

- Microsoft Excel 2010 digunakan untuk menyimpan dan menghitung nilai biner dari matlab, serta digunakan juga untuk mencari nilai fitur longest run secara manual.

4.3.3 Pengujian Ektraksi Longest Run

A. Prosedur Pengujian

Prosedur pengujian adalah seperti langkah-langkah berikut ini: 1. Jalankan project tugas akhir*.vbp


(59)

2. Masukkan (load) sampel citra yang akan di uji, seperti gambar dibawah ini:

Gambar 4.8 Sampel uji Longest Run Feature 3. Klik entry

B. Hasil Pengujian

Gambar 4.9 Hasil uji ektraksi longest run

Seluruh hasil ektraksi dari tiap sub area citra ditampilkan pada gambar 4.9. Selanjutnnya, dengan menggunakan sampel uji yang sama akan dilakukan pengujian secara manual menggunakan matlab dan microsoft excel.


(60)

56

4.3.4 Pengujian Ektraksi Longest Run Secara Manual

A. Prosedur Pengujian

Prosedur pengujian adalah seperti langkah-langkah berikut ini: 1. Buka Matlab

2. Buat projek baru (pilih file kemudian new project) 3. Tulisankan syntax dibawah ini:

clc

I=imread('D:\1 Tugas Akhir\Coding TA\angka sampel\Angka6.bmp'); level = graythresh(I);

BW = im2bw(I,level); imshow(BW);

4. Angka6.bmp diatas adalah citra yang sama, yang digunakan untuk pengujian ektraksi longest run melalui project tugas akhir penulis

5. Syntax diatas akan mengubah sampel uji menjadi bentuk biner, kemudian ditampilkan pada array editor

6. Copy data biner di array editor ke microsoft excel 7. Lakukan ektraksi secara manual untuk mencari nilai


(61)

B. Hasil Pengujian

Gambar 4.10 Pengujian ektraksi longest run secara manual

Gambar diatas adalah tampilan saat nilai biner dari array editor matlab diduplikat ke microsoft excel. Untuk memudahkan perhitungan area yang tidak dihitung atau angka-angka nol diberi warna merah muda. Gunakanlah fungsi sum pada excel untuk mempermudah perhitungan. Hasil uji secara manual ditunjukkan pada Tabel 4.1.


(62)

58

Tabel 4.1 Hasil uji fitur longest run secara manual

Area 1 2 3 4 5 6 7 8 9

Baris 42 84 43 146 127 74 104 61 72

Kolom 42 87 59 113 89 57 94 63 72

Da 2 2 7 2 2 2 2 2 2

Db 0 0 2 12 2 2 2 2 1

Tabel diatas menunjukkan bahwa hasil ektraksi menggunakan project tugas akhir penulis dan hasil ektraksi secara manual menunjukkan hasil yang sama. Sehingga dapat di simpulkan bahwa ektraksi longest run telah menghasilkan fitur yang benar.

4.4 Pengujian Diagonal Distance Feature Extraction

Citra yang telah melalui ROI dan resize selanjutnya akan di cari nilai fitur dari ektraksi diagonal distance. Nilai fitur yang dihasilkan dari ektraksi diagonal distance feature berjumlah 4 fitur. Fitur didapatkan dengan cara menghitung jarak diagonal dari sudut siku citra hingga piksel hitam.

4.4.1 Tujuan

Pengujian ini bertujuan untuk mengetahui apakah hasil ektraksi diagonal distance pada aplikasi tugas akhir telah menghasilkan fitur yang benar.

4.4.2 Peralatan yang digunakan

A. Perangkat Keras

Peralatan yang digunakan untuk menguji diagonal distance feature extraction adalah sebuah personal computer yang memiliki spesifikasi seperti berikut:


(63)

- Processor : Intel, Core i3 @2.10Ghz (4CPUs)

- Memory : 4 GB

- Operating System : Windows 7 Ultimate – 64 Bit B. Perangkat Lunak

Perangkat lunak pendukung dalam menguji longest run feature extraction adalah sebagi berikut:

- Project tugas akhir penulis digunakan untuk menghasilkan fitur citra. - Matlab digunakan untuk membuat citra menjadi biner.

- Microsoft excel 2010 digunakan untuk menyimpan dan menghitung nilai biner dari matlab, serta digunakan juga untuk mencari nilai fitur diagonal distance secara manual.

4.4.3 Pengujian Ektraksi Diagonal Distance Feature

A. Prosedur Pengujian

Prosedur pengujian adalah seperti langkah-langkah berikut ini: 1. Buka project tugas akhir*.vbp

2. Masukkan (load) sampel citra yang akan di uji, seperti gambar 4.11

Gambar 4.11 Sampel uji Diagonal Distance 3. Klik entry


(64)

60

B. Hasil Pengujian

Gambar 4.12 Hasil uji diagonal dictance pada aplikasi

Seluruh hasil ektraksi dari tiap diagonal ditampilkan pada gambar 4.12. D1=Diagonal 1, D2=Diagonal 2, D3=Diagonal 3 dan D4=Diagonal 4. Selanjutnnya, dengan menggunakan sampel uji yang sama akan dilakukan pengujian secara manual menggunakan matlab dan microsoft excel.

4.4.4 Pengujian Ektraksi Diagonal Distance Feature Secara Manual

A. Prosedur Pengujian

Prosedur pengujian adalah seperti langkah-langkah berikut ini: 1. Buka matlab

2. Buat projek baru (pilih file kemudian new project) 3. Tulisankan syntax dibawah ini:

clc

I=imread('D:\1 Tugas Akhir\Coding TA\angka sampel\Angka6.bmp'); level = graythresh(I);

BW = im2bw(I,level); imshow(BW);

4. Angka6.bmp diatas adalah citra yang sama, yang digunakan untuk pengujian melalui project tugas akhir penulis

5. Syntax diatas akan mengubah sampel uji menjadi bentuk biner, kemudian ditampilkan pada array editor.


(65)

6. Copy data biner pada array editor ke microsoft excel. 7. Lakukan ektraksi secara manual untuk mencari nilai

ektraksi dari tiap area. B. Hasil Pengujian

Gambar 4.13 Pengujian Ektraksi Diagonal Secara manual

Gambar 4.13 adalah tampilan saat nilai biner dari array editor matlab diduplikat ke microsoft excel. Gunakan fungsi sum pada microsoft excel untuk mempermudah menghitung nilai fitur. Hasil uji coba ditunjukkan pada tabel dibawah ini:

Tabel 4.2 Hasil uji fitur diagonal distance secara manual Diagonal 1 Diagonal 2 Diagonal 3 Diagonal 4


(66)

62

Tabel 4.2 menunjukkan bahwa hasil ektraksi menggunakan project tugas akhir dan hasil ektraksi secara manual menunjukkan hasil yang sama. Sehingga dapat diambil kesimpulan bahwa proses ektraksi diagonal distance telah menghasilkan fitur dengan benar.

4.5 Pengujian Pengenalan MLP

Pada pengujian ini memiliki beberapa model pengujian untuk mendapatkan presentase keberhasilan pengenalan, dimana pengujian MLP ditentukan berdasarkan jumlah fitur ektraksi yang digunakan sebagai input MLP. 4.5.1 Tujuan

Untuk mengetahui seberapa banyak pola angka yang dapat dikenali MLP dari sampel training maupun sampel testing yang masing-masing berjumlah 25 set pola Angka Jawa. Setiap set berisi Angka Jawa 0 sampai 9.

4.5.2 Peralatan yang digunakan

A. Perangkat Keras

Peralatan yang digunakan untuk menguji pengenalan MLP adalah sebuah personal computer (Notebook) yang memiliki spesifikasi seperti berikut:

- Processor : Intel, Core i3 @2.10Ghz (4CPUs)

- Memory : 4 GB


(67)

B. Perangkat Lunak

Perangkat lunak pendukung dalam menguji metode pengenalan MLP adalah sebagi berikut:

- Project tugas akhir penulis digunakan untuk membuat dan mengetahui tingkat keberhasilan pengenalan MLP.

- Microsoft excel 2010 digunakan untuk menghitung keberhasilan serta kegagalan pengenalan MLP.

4.5.3 Prosedur Pengujian

1. Jalankan project tugas akhir*.vbp

2. Setelah terbuka klik tombol run sample untuk pengujian pengenalan MLP pada sampel training

3. Setelah proses run sample selesai, klik run test untuk pengujian pengenalan MLP pada sampel testing

4. Setelah proses run sample dan run test selesai aplikasi akan menyimpan hasil pengenalan pada direktori aplikasi dengan nama file “training.csv”

dan “testing.csv”

4.5.4 Hasil Pengujian

Hasil pengujian pengenalan MLP dilakukan dalam beberapa tahap berdasarkan jumlah fitur yang digunakan untuk input MLP sebagai berikut.

A. Pengujian Pengenalan MLP Menggunakan Input 4 Fitur Diagonal Distance

Sampel untuk pengujian berjumlah 50 set. Setiap set berisi 10 Sampel yang terdiri dari satu digit Angka Jawa 0 - 9. Kemudian dari 50 set sampel


(68)

64

tersebut 25 set digunakan untuk learning MLP dan 25 set lainnya untuk testing. Setiap sampel Angka Jawa diektraksi fiturnya menggunakan diagonal distance dan longest run. Pada tiap Angka Jawa yang diektraksi menghasilkan 40 nilai fitur yang terdiri dari, 36 fitur dari ekstraksi longest run dan 4 fitur dari ektraksi diagonal distance. 40 nilai fitur tersebut kemudian disimpan dalam sebuah file fitur*.dat. Pada pengujian ini bobot MLP yang digunakan adalah bobot hasil learning MLP yang hanya menggunakan 4 fitur diagonal distance sebagai inputnya.

1. Hasil Pengenalan MLP Menggunakan Input 4 Fitur Pada Sampel Training

Sampel training adalah sampel yang nilai fiturnya digunakan untuk learning MLP. Selanjutnya 4 Nilai fitur diagonal distance dari tiap sampel training yang telah digunakan untuk learning MLP di inputkan kembali ke MLP untuk dilakukan pengenalan.

Tabel 4.3 Keberhasilan pengenalan MLP dengan input 4 fitur pada sampel training Angka Jumlah Data (buah) Data Yang Berhasil Dikenali (buah) Kesalahan Pengenalan (buah) Presentase Keberhasilan (%)

0 25 25 0 100%

1 25 0 25 0%

2 25 0 25 0%

3 25 0 25 0%

4 25 0 25 0%

5 25 0 25 0%

6 25 0 25 0%

7 25 0 25 0%

8 25 0 25 0%

9 25 0 25 0%


(69)

Presentase keberhasilan dihitung dengan cara data yang berhasil dikenali dibagi dengan jumlah data kemudian dikalikan 100%. Pada tabel 4.3 diatas menunjukkan tingkat keberhasilan pengenalan mencapai 10%. keberhasilan pengenalan paling besar yaitu pada pola Angka Jawa “0” dengan tingkat keberhasilan pengenalan 100%. selain angka “0” kegagalan pengenalan mencapai 100%. Untuk mengetahui kesalan-kesalahan pengenalan pada tiap angka ditunjukkan pada tabel4.4.

Tabel 4.4 Kesalahan pengenalan MLP dengan input 4 fitur pada sampel training

Angka

Dikenali Sebagai Angka Presentase Kesalahan

(%) 0 1 2 3 4 5 6 7 8 9

0 0%

1 23 2 100%

2 25 100%

3 23 2 100%

4 25 100%

5 25 100%

6 25 100%

7 25 100%

8 25 100%

9 25 100%

Rata-Rata Error %90

Presentase kesalahan dihitung dengan cara jumlah kesalahan dibagi dengan jumlah data(25) kemudian dikalikan 100%. Pada tabel 4.4 diatas menunjukkan selain angka “0” semuanya salah dikenali sebagai angka lain sebesar 100% . Angka ”1” dan ”3” salah dikenali sebagai angka “0” sebanyak 23


(70)

66

2. Hasil Pengenalan Menggunakan Input 4 Fitur MLP Pada Sampel Testing

Sampel testing adalah sampel yang nilai fiturnya tidak digunakan untuk learning MLP. 4 Nilai fitur diagonal distance dari tiap sampel testing di inputkan ke MLP untuk dilakukan pengenalan.

Tabel 4.5 Keberhasilan pengenalan MLP dengan input 4 fitur pada sampel testing Angka Jumlah Data (buah) Data Yang Berhasil Dikenali (buah) Kesalahan Pengenalan (buah) Presentase Keberhasilan (%)

0 25 25 0 100%

1 25 0 25 0%

2 25 0 25 0%

3 25 0 25 0%

4 25 0 25 0%

5 25 0 25 0%

6 25 0 25 0%

7 25 0 25 0%

8 25 0 25 0%

9 25 0 25 0%

Jumlah Persentase Total 10%

Sama seperti pada sampel training keberhasilan pengenalan pada sampel testing hanya mencapai 10%. keberhasilan pengenalan paling besar yaitu pada

pola Angka Jawa “0” dengan tingkat keberhasilan pengenalan 100%. selain

angka “0” kegagalan pengenalan mencapai 100%. Untuk mengetahui kesalan-kesalahan pengenalan pada tiap angka ditunjukkan pada tabel 4.6.


(71)

Tabel 4.6 Kesalahan pengenalan MLP dengan input 4 fitur pada sampel testing

Angka

Dikenali Sebagai Angka Presentase Kesalahan

(%) 0 1 2 3 4 5 6 7 8 9

0 0%

1 22 2 1 100%

2 24 1 100%

3 23 2 100%

4 25 100%

5 24 1 100%

6 25 100%

7 23 2 100%

8 25 100%

9 25 100%

Rata-Rata Error %90

Presentase kesalahan dihitung dengan cara jumlah kesalahan dibagi dengan jumlah data(25) kemudian dikalikan 100%. Pada tabel 4.6 diatas

menunjukkan selain angka “0” semuanya salah dikenali sebagai angka lain

sebesar 100% . kesalahan pengenalan paling bervariasi yaitu angka ”1” yang

dikenali sebagai angka “0” sebanyak 22 kali, salah dikenali sebagai angka 3 sebanyak 2 kali dan salah dikenali sebagai angka “4” sebanyak 1 kali.

B. Pengujian Pengenalan MLP Menggunakan Input 36 Fitur Longest Run

Sampel untuk pengujian berjumlah 50 set. Setiap set berisi 10 Sampel yang terdiri dari satu digit Angka Jawa 0 - 9. Kemudian dari 50 set sampel tersebut 25 set digunakan untuk learning MLP dan 25 set lainnya untuk testing. Setiap sampel Angka Jawa diektraksi fiturnya menggunakan diagonal distance dan longest run. Pada tiap Angka Jawa yang diektraksi menghasilkan 40 nilai fitur


(72)

68

yang terdiri dari, 36 fitur dari ekstraksi longest run dan 4 fitur dari ektraksi diagonal distance. 40 nilai fitur dari tiap sampel tersebut kemudian disimpan dalam sebuah file fitur*.dat. Pada pengujian ini bobot MLP yang digunakan adalah bobot hasil learning MLP yang hanya menggunakan 36 fitur longest run sebagai inputnya.

1. Hasil Pengenalan MLP Menggunakan Input 36 Fitur Pada Sampel Training

Sampel training adalah sampel yang nilai fiturnya digunakan untuk learning MLP. Selanjutnya 36 Nilai fitur longest run dari tiap sampel training yang telah digunakan untuk learning MLP di inputkan kembali ke MLP untuk dilakukan pengenalan.

Tabel 4.7 Keberhasilan pengenalan MLP dengan input 36 fitur pada sampel training Angka Jumlah Data (buah) Data Yang Berhasil Dikenali (buah) Kesalahan Pengenalan (buah) Presentase Keberhasilan (%)

0 25 25 0 100%

1 25 25 0 100%

2 25 25 0 100%

3 25 25 0 100%

4 25 25 0 100%

5 25 25 0 100%

6 25 25 0 100%

7 25 25 0 100%

8 25 25 0 100%

9 25 25 0 100%


(73)

Tabel 4.7 menunjukkan tingkat keberhasilan pengenalan mencapai 100% pada seluruh angka. tidak ada kesalahan satupun pada pengenalan Angka Jawa pada sampel training. Agar dapat diketahui keberhasilan pada sampel testing, selanjutnya dipaparkan juga pengujian pada sampel testing.

2. Hasil Pengenalan MLP Menggunakan Input 36 Fitur Pada Sampel Testing

Sampel testing adalah sampel yang nilai fiturnya tidak digunakan untuk learning MLP. 36 Nilai fitur longest run dari tiap sampel testing di inputkan ke MLP untuk dilakukan pengenalan.

Tabel 4.8 Keberhasilan pengenalan MLP dengan input 36 fitur pada sampel testing Angka Jumlah Data (buah) Data Yang Berhasil Dikenali (buah) Kesalahan Pengenalan (buah) Presentase Keberhasilan (%)

0 25 25 0 100%

1 25 25 0 100%

2 25 22 3 88%

3 25 21 4 84%

4 25 25 0 100%

5 25 24 1 96%

6 25 24 1 96%

7 25 23 2 92%

8 25 23 2 92 %

9 25 24 1 96 %

Jumlah Persentase Total 94,4%

Tabel 4.8 menunjukkan tingkat keberhasilan pengenalan mencapai 94,4%. keberhasilan pengenalan paling besar terjadi pada pola Angka Jawa “0”,”1”, dan

”4” dengan tingkat keberhasilan pengenalan 100%. Untuk mengetahui kesalan-kesalahan pengenalan ditunjukkan pada tabel 4.9.


(74)

70

Tabel 4.9 Kesalahan pengenalan MLP dengan input 36 fitur pada sampel testing

Angka

Dikenali Sebagai Angka Presentase Kesalahan

(%) 0 1 2 3 4 5 6 7 8 9

0 0%

1 0%

2 2 1 12%

3 1 2 1 16%

4 0%

5 1 4%

6 1 4%

7 1 1 8%

8 1 1 8%

9 1 4%

Rata-Rata Error 5,6%

Tabel 4.9 menunjukkan kesalahan pengenalan paling besar terjadi pada

angka “3” yang salah dikenali sebagai angka lain sebanyak 4 kali. Kesalahan pengenalan terkecil terjadi pada angka “0” dan “1” karena tidak terjadi kesalahan

pengenalan sama sekali.

C. Pengujian Pengenalan MLP Menggunakan Input 40 Fitur

Pada pengujian ini, input MLP menggunakan 40 fitur yang dihasilkan oleh 2 metode ektraksi. 36 fitur berasal dari ektraksi longest run dan 4 fitur dari ektraksi diagonal distance.

1. Hasil Pengenalan MLP Menggunakan Input 40 Fitur Pada Sampel Training

Sampel untuk pengujian berjumlah 50 set. Setiap set berisi 10 Sampel yang terdiri dari satu digit Angka Jawa 0 - 9. Kemudian dari 50 set sampel tersebut 25 set digunakan untuk learning MLP dan 25 set lainnya untuk testing. Setiap sampel Angka Jawa diektraksi fiturnya menggunakan diagonal distance


(75)

dan longest run. Pada tiap Angka Jawa yang diektraksi menghasilkan 40 nilai fitur yang terdiri dari, 36 fitur dari ekstraksi longest run dan 4 fitur dari ektraksi diagonal distance. 40 nilai fitur dari tiap sampel tersebut kemudian disimpan dalam sebuah file fitur*.dat. Pada pengujian ini bobot MLP yang digunakan adalah bobot hasil learning MLP yang menggunakan 40 fitur tersebut sebagai inputnya.

Tabel 4.10 Keberhasilan pengenalan MLP dengan input 40 fitur pada sampel training Angka Jumlah Data (buah) Data Yang Berhasil Dikenali (buah) Kesalahan Pengenalan (buah) Presentase Keberhasilan (%)

0 25 23 2 92 %

1 25 1 24 4 %

2 25 25 0 100 %

3 25 25 0 100 %

4 25 24 1 96 %

5 25 21 4 84 %

6 25 16 9 64 %

7 25 22 3 88 %

8 25 0 25 0 %

9 25 10 15 40 %

Jumlah Persentase Total 66,8 %

Tabel 4.10 menunjukkan tingkat keberhasilan pengenalan MLP dengan input 40 fitur mencapai 66,8%. Keberhasilan pengenalan tertinggi pada angka

“2” dan “3” dengan keberhasilan pengenalan mencapai 100% dan keberhasilan pengenalan paling rendah terjadi pada angka “8” dengan keberhasilan pengenalan 0%. Untuk mengetahui kesalan-kesalahan pengenalan pada tiap angka ditunjukkan pada tabel 4.11.


(76)

72

Tabel 4.11 Kesalahan pengenalan MLP dengan input 40 fitur pada sampel training

Angka

Dikenali Sebagai Angka Presentase Kesalahan

(%) 0 1 2 3 4 5 6 7 8 9

0 2 8 %

1 8 1 15 96 %

2 0 %

3 0 %

4 1 4 %

5 3 1 16 %

6 8 1 36 %

7 2 1 12 %

8 12 13 100 %

9 4 11 60 %

Rata-Rata Error 33,2 %

Tabel 4.11 Menunjukkan kesalahan pengenalan terkecil terjadi pada

angka “2” dan “3” yang semua sampelnya berhasil dikenali dengan benar.

Kesalahan pengenalan terbanyak terjadi pada angka “8” yang sama sekali tidak berhasil dikenali dengan benar, melainkan salah dikenali sebagai angka “0” sebanyak 12 kali dan dikenali sebagai angka “7” sebanyak 13 kali.

2. Hasil Pengenalan MLP Menggunakan Input 40 Fitur Pada Sampel Testing

Sampel testing adalah sampel yang nilai fiturnya tidak digunakan untuk learning MLP. 36 Nilai fitur longest run dari tiap sampel testing di inputkan ke MLP untuk dilakukan pengenalan.


(1)

Tabel 4.13 Kesalahan pengenalan MLP dengan input 40 fitur pada sampel testing Angka

Dikenali Sebagai Angka Presentase

Kesalahan (%)

0 1 2 3 4 5 6 7 8 9

0 4 16 %

1 9 11 80 %

2 2 1 12 %

3 1 4 20 %

4 1 4 %

5 4 3 28 %

6 5 2 28 %

7 4 2 1 28 %

8 11 14 100 %

9 1 13 56 %

Rata-Rata Error 37,2 %

Tabel 4.13 menunjukkan kesalahan pengenalan paling besar terjadi pada angka “8” yang sama sekali tidak berhasil dikenali dengan benar, melainkan salah dikenali sebagai angka “0” sebanyak 11 kali dan salah dikenali sebagai angka 7 sebanyak 14 kali.

Dari penelitian yang telah dilakukan menunjukkan bahwa input MLP menggunakan ektraksi longest run menghasilkan pengenalan yang lebih baik dibandingkan dengan ektraksi diagonal distance. Presentase keberhasilan pengenalan MLP dengan input ektraksi longest run (36 fitur) mencapai 100% pada sampel training sedangkan keberhasilan pengenalan MLP dengan input ektraksi diagonal distance (4 fitur) hanya mencapai 10%. Presentase keberhasilan pengenalan MLP pada sampel testing dengan input ektraksi longest run (36 fitur) mencapai 94,4% sedangkan keberhasilan pengenalan MLP dengan input ektraksi diagonal distance (4 fitur) hanya mencapai 10%.

Kecilnya pengenalan MLP dengan input 40 fitur disebabkan karena hasil ektraksi diagonal distance (4 fitur) yang buruk. Presentase keberhasilan


(2)

75

pengenalan MLP dengan input ektraksi 40 fitur atau hasil 2 metode ektraksi yaitu longest run dan diagonal distance, mencapai 66,8% pada sampel training dan 62,8% pada sampel testing. Sebagai perbandingan keberhasilan pengenalan Angka Jawa yang hanya menggunakan input ektraksi longest run jauh lebih bagus yaitu mencapai 100% pada sampel training dan 94,4% pada sampel testing. Sehingga ketika MLP hanya menggunakan input dari ektraksi longest run (36 fitur) saja akan menghasilkan pengenalan yang lebih optimal.


(3)

76 PENUTUP

Berdasarkan hasil pengujian pada project tugas akhir yaitu ektraksi fitur Angka Jawa menggunakan metode diagonal distance feature dan longest run feature kemudian digunakan sebagai input MLP, maka dapat diambil beberapa kesimpulan dan saran sebagai berikut.

5.1. Kesimpulan

Dari Pengujian dari penelitian ini, dapat diambil kesimpulan sebagai berikut:

1. Ektraksi diagonal distance kurang cocok bila digabungkan dengan longest run sebagai input MLP untuk pengenalan Angka Jawa, karena menghasilkan kesalahan pengenalan mencapai 33,2% dari 25 set pada sampel training dan 37,2% dari 25 set sampel testing. 2. Hasil ektraksi fitur diagonal distance kurang cocok jika digunakan

sebagai input MLP untuk pengenalan Angka Jawa, karena menghasilkan kesalahan pengenalan mencapai 90% dari 25 set pada sampel training maupun sampel testing.

3. Hasil ektraksi fitur longest run sangat baik jika digunakan sebagai input MLP untuk pengenalan Angka Jawa, karena menghasilkan keberhasilan pengenalan mencapai 100% dari 25 set pada sampel training dan 94,4% dari 25 set sampel testing


(4)

77

5.2 Saran

Berdasarkan kesimpulan penelitian, maka penulis merekomendasikan berupa saran-saran sebagai berikut :

1.

Perangkat lunak dapat dikembangkan untuk mengenali huruf, kata, kalimat hingga paragraf Aksara Jawa.

2.

Input Aksara Jawa perangkat lunak dapat dikembangkan dengan menggunakan kamera secara real-time.


(5)

78

DAFTAR PUSTAKA

Basu, S., dkk., 2005a, Handwritten ‘Bangla’ Alphabet Recognition using an MLP Based Classifier, Proceeding of the 2nd National Conference on Computer Processing of Bangla, hal. 285 – 291. Dhaka.

Wibowo, M.C. dan Wirakusuma, S., 2013, Pengenalan Pola Tulisan Tangan

Aksara Jawa “Ha Na Ca Ra Ka” Menggunakan Multi Layer Perceptron,

Prosiding Seminar Nasional Teknologi Informasi (SNASTI) 2013, Oktober 2013, Surabaya, hal. ICCS-27 – ICCS-32

Trier O.D., Anil K.J., dan Torfinn,T. ,”Feature Extraction methods for Character Recognition –A survey “, Pattern Recognition,Vol29, No.4, pp-641-662, 1996

Darusuprapta, dkk., 2002, Pedoman Penulisan Aksara Jawa, Yayasan Pustaka Nusatama, Yogyakarta.

Das, N., dkk., 2006, Handwritten Arabic Numeral Recognition using a Multi layerPerceptron, Proceeding National Conference on Recent Trends in Information Systems, hal. 200 – 203.

Ham, F.M. dan Kostanic, I., 2001, Principles of Neurocomputing for Science & Engineering. McGraw-Hill, New York.

Mukherjee, S., 2010, Recognition of Handwritten Bengali Character Based On Character Features, (M.Tech IT Thesis), Jadavpur University, Kolkata, India.


(6)

79

Das, N., dkk., 2010, Handwritten Bangla Basic and Compound Character Recognition Using MLP and SVM, Journal of Computing, Vol. 2, No. 2, hal. 109 – 115.

Basu, S., dkk., 2005b, An MLP Based Approach for Recognition of Handwritten ‘Bangla’ Numerals, Proceeding 2nd Indian International Conference on Artificial Intelligence, hal. 407 – 417. Pune.