Deskripsi Studi Numerik Pengenalan Huruf Alphabet

BAB IV STUDI NUMERIK DAN ANALISIS

Pada bab ini akan dijelaskan mengenai metode jaringan saraf buatan lapisan banyak menggunakan algoritma backpropagation dalam menghasilkan error minimum dalam mencari model yang tepat. Permasalahan yang akan dibahas yaitu mengenai permasalahan klasifikasi pengenalan huruf alphabet.

4.1. Deskripsi Studi Numerik

Metode jaringan saraf buatan lapisan banyak dapat diaplikasikan pada berbagai masalah tertentu di kehidupan sehari-hari. Untuk lebih memahami proses pengklasifikasian pada metode jaringan saraf buatan lapisan banyak dan nilai error, maka dilakukan studi numerik dengan mengambil permasalahan yang sederhana. Data-data tersebut diperoleh dari machine learning database [8]. Dalam proses kerjanya, data ini dipisahkan menjadi dua bagian yaitu training data dan test data. Pembagian data ini dilakukan secara random. Pada studi numerik disini penulis mengambil proporsi 70 training data dan 30 test data. Pengolahan data yang dilakukan dalam skripsi ini menggunakan algoritma backpropagation dengan bantuan software SPSS 16 dalam pencarian nilai errornya. Hal tersebut dilakukan karena asumsi dari data yang digunakan belum diketahui. Untuk mendapatkan nilai error yang lebih valid, percobaan tersebut dilakukan sebanyak sepuluh kali dengan sample random atau biasa dikenal dengan 10 fold cross validation CV. 42

4.2. Pengenalan Huruf Alphabet

Data pengenalan huruf alphabet merupakan salah satu data yang cocok untuk mengetahui pengenalan suatu pola. Permasalahan yang akan diangkat pada studi numerik adalah mencari nilai error minimum untuk mengidentifikasi setiap huruf dengan tulisan tangan berwarna hitam-putih yang terdapat dalam persegi panjang gambar digital dengan satuan pixel, huruf tersebut akan diklasifikasikan ke salah satu dari 26 huruf alphabet. Huruf-huruf tersebut berasal dari 20 bentuk huruf yang berbeda dan setiap huruf dari berbagai karakter tersebut diacak secara random. Simulasi yang dilakukan pada studi numerik ini menggunakan 20.000 baris data. Cara penulisan diambil dari 20 bentuk yang berbeda menggunakan dua cara teknik penulisan, yaitu stroke style merupakan penulisan huruf yang dilakukan dengan cara mengambil dari titik atas sampai titik bawah yang terdapat dalam 6 jenis cara penulisan yaitu simplex, duplex, triplex, complex, dan ghotic . Kemudian 6 jenis huruf tersebut dimasukan ke dalam bentuk tulisan seperti Block, Script, Italic, English, Italian dan German. Setiap karakter huruf di proses pertama kali dengan merubah kedalam koordinat vektor, dan pengidentifikasian dilakukan pada garis paling bawah pada huruf. Segmen garis tersebut dirubah ukurannya menjadi koordinat x,y yang berbentuk persegi panjang dengan satuan pixel. Ukuran pixel akan menggambarkan titik-titik yang berwarna hitam dan putih. Posisi ”on” pada satuan pixel yang berwarna hitam dan ”off” satuan pixel yang berwarna putih. Setiap huruf akan diidentifikasikan pada pixel on berwarna 43 hitam yang akan berbentuk huruf dan pixel tersebut berukuran persegi panjang dengan ukuran 45 x 45 pixel. Nilai error minimum diproses dalam pengidentifikasian huruf dari 20.000 baris data yang akan di karakteristik oleh 16 variabel prediktornya kemudian akan diproses ke dalam klasifikasi 26 huruf alphabet yang menjadi variabel target. Data pengenalan huruf tidak memuat data yang tidak lengkap missing value. Setiap huruf diklasifikasikan berdasarkan 17 variabel yang terdiri dari satu variabel target dan 16 variabel prediktor. Variabel prediktor ini merupakan sebuah bilangan integer yang berkisar antara 0 sampai 15. Variabel ini terdiri dari: a. Variabel target: 26 huruf alphabet dari A sampai Z b. Variabel prediktor: 1. V 1 merupakan posisi horizontal dihitung dari sebelah kiri gambar dan huruf berada di tengah box 2. V 2 merupakan posisi vertikal dihitung dari bagian bawah pada box. 3. V 3 merupakan panjang box. 4. V 4 merupakan tinggi box. 5. V 5 merupakan jumlah pixel on pada huruf dalam box. 6. V 6 merupakan rataan nilai x pada pixel berwarna hitam “on” 7. V 7 merupakan rataan nilai y pada pixel berwarna hitam “on” 8. V 8 merupakan variansi rataan nilai x pada pixel berwarna hitam “on” 9. V 9 merupakan variansi rataan nilai y pada pixel berwarna hitam “on” 44 10. V 10 merupakan jumlah rataan x dan y pada pixel berwarna hitam“on” 11. V 11 merupakan variansi rataan nilai x dikalikan dengan rataan y pada pixel berwarna hitam “on” 12. V 12 merupakan variansi rataan nilai y dikalikan dengan rataan x pada pixel berwarna hitam “on” 13. V 13 merupakan rataan posisi pixel ”on” dari kiri ke kanan. 14. V 14 merupakan jumlah posisi vertikal pada rataan posisi pixel ”on” dari kiri ke kanan. 15. V 15 merupakan rataan posisi pixel ”on” dari bawah ke atas. 16. V 16 merupakan jumlah posisi horizontal pada rataan posisi pixel ”on” dari bawah ke atas. Untuk lebih jelasnya pengidentifikasian huruf alphabet menggunakan 16 variabel prediktor akan dijelaskan dengan contoh berikut. Gambar 4.1. Contoh sampel yang merepresentasikan huruf ‘A dan Pembagian region pada sample berikut nilai pixel aktifnya Huruf A diprediksi berada dalam posisi horizontal yang dihitung dari sebelah kiri gambar dan huruf berada di tengah box pada titik koordinat 13 pixel, posisi vertikal dihitung dari bagian bawah pada box di titik koordinat 22 pixel, Sedangkan tinggi box berada pada titik koordinat 22 pixel. Jika 45 huruf A berada dalam karakteristik 16 variabel prediktor maka huruf tersebut sudah memiliki error minimum dan berhasil dalam mengklasifikasikan huruf alphabet. Gambar 4.2 menjelaskan struktur hasil pengidentifikasian huruf alphabet yaitu lapisan pertama terdapat 20.000 baris data yang digunakan sebagai input, banyaknya unit pada dua lapisan tersembunyi yang digunakan yaitu 40 unit pada lapisan kesatu dan 30 unit pada lapisan kedua, dan lapisan terakhir merupakan target yang dihasilkan dalam pengenalan huruf alphabet Gambar 4.2 Struktur JSB untuk Data Pengenalan Huruf Alphabet 46

4.3. Analisis Numerik