Pengenalan Kata Tulisan Tangan Huruf Korea Menggunakan Jaringan Saraf Tiruan Propagasi Balik

PENGENALAN KATA TULISAN TANGAN HURUF KOREA MENGGUNAKAN JARINGAN SARAF TIRUAN PROPAGASI BALIK SKRIPSI RIAN HARRIS NASUTION 091402071
PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFOMASI
UNIVERSITAS SUMATERA UTARA MEDAN 2014
Universitas Sumatera Utara

PENGENALAN KATA TULISAN TANGAN HURUF KOREA MENGGUNAKAN JARINGAN SARAF TIRUAN PROPAGASI BALIK SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
RIAN HARRIS NASUTION 091402071
PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFOMASI
UNIVERSITAS SUMATERA UTARA MEDAN
2014
Universitas Sumatera Utara

PERSETUJUAN

Judul
Kategori Nama Nomor Induk Mahasiswa Program Studi Departemen Fakultas

: PENGENALAN KATA TULISAN TANGAN HURUF KOREA MENGGUNAKAN JARINGAN SARAF TIRUAN PROPAGASI BALIK
: SKRIPSI : RIAN HARRIS NASUTION : 091402071 : SARJANA (S-1) TEKNOLOGI INFORMASI : TEKNOLOGI INFORMASI : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI


Komisi Pembimbing Pembimbing 2

Diluluskan di Medan, Februari 2014 :

Pembimbing 1

Dedy Arisandi S.T., M.Kom NIP. 19790831200912 1 002
Diketahui/Disetujui oleh Program Studi Teknologi Informasi Ketua,

Dr. Erna Budhiarti Nababan, M.IT

Prof. Dr. Opim Salim Sitompul, M.Sc NIP 19610817 198701 1001

Universitas Sumatera Utara

PERNYATAAN PENGENALAN KATA TULISAN TANGAN HURUF KOREA
MENGGUNAKAN JARINGAN SARAF TIRUAN PROPAGASI BALIK SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya. Medan, Februari 2014 RIAN HARRIS NASUTION 091402071
Universitas Sumatera Utara


PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT Yang Maha Pengasih dan Maha Penyayang, dengan segala rahmat dan karunia-Nya penulisan tugas akhir ini berhasil diselesaikan dalam waktu yang telah ditetapkan.
Dalam penyelesaian tugas akhir ini, tidak terlepas dari bantuan dan kerja sama serta doa dan dukungan dari berbagai pihak, untuk itu penulis sampaikan ucapan terima kasih sedalam-dalamnya dan penghargaan kepada :
1. Ketua dan Sekretaris Departemen Bapak Prof. Dr. Opim Salim Sitompul, M.Sc dan Bapak Drs. Sawaluddin, M.Sc yang telah memberikan dukungan, arahan dan bantuannya dalam menyelesaikan tugas akhir ini.
2. Seluruh dosen Departemen Teknologi Informasi dan Ilmu Komputer USU yang telah mengajarkan dan memberikan dukungan serta bantuannya dalam menyelesaikan tugas akhir ini, terutama kepada Ibu Dr. Erna Budhiarti Nababan, M.IT dan Bapak Dedy Arisandi, S.T., M.Kom selaku pembimbing yang selalu memberikan arahan, bimbingan, keluangan waktu serta dukungan dalam menyelesaikan tugas akhir ini beserta Bapak Mohammad Fadly Syahputra, B.Sc., M.Sc.IT dan Bapak Dani Gunawan, S.T., M.T yang bersedia menguji seminar hasil dan sidang sarjana penulis.
3. Seluruh staf tata usaha Teknologi Informasi, terutama kepada Bu Delima Harahap yang sudah banyak membantu penulis dalam mengurus tugas akhir ini.
4. Untuk Ayahanda Dr. Rizali Harris Nasution dan Ibunda Zuraidah Anggraini dan seluruh keluarga dan sanak saudara yang selalu memberi doa, dorongan serta motivasi untuk menyelesaikan tugas akhir ini.
5. Seluruh rekan dan sejawat di Pokmas Mandiri, Kak Endang, Kak Fatma, Kak Akmal, Kak Yuni, Bu Rani, Bang Deni, Kak Tuti, Kak Eni, Bang Putra dan lainnya yang telah membantu dan menyemangati penulis dalam menyelesaikan tugas akhir ini.
6. Senior penulis, Nanda Putra yang banyak membantu dalam penyelesaian tugas akhir ini dan juga sahabat-sahabat Buyung, Upik, Rozy, Yayuk, Irwan, Zyzy, Robet, Anggreiny, Bagus, Ari, Arif, Desi, Septi, Kak Mega dan teman-teman seangkatan, yang tidak dapat disebutkan satu per satu lainnya.
7. Teman-teman penulis di prodi akuntansi Harapan, kepada Amel, Risa, Ayu, Rika, Fifi, Dilla, Dana dan Danang yang telah membantu dan menyemangati penulis dalam menyelesaikan tugas akhir ini.
Semoga segala kebaikan dan bantuannya dibalas oleh Allah SWT dan semoga tugas akhir ini dapat bermanfaat bagi semua pihak yang memerlukannya.
Universitas Sumatera Utara

ABSTRAK
Pada penelitian ini, digunakan jaringan saraf tiruan propagasi balik dalam mengenali kata tulisan tangan huruf Korea (hangūl) menggunakan metode diagonal based feature extraction. Metode ini membagi data sampel menjadi lebar x tinggi zona dan menghitung nilai fitur dari setiap zona tersebut sebagai nilai masukan untuk jaringan saraf tiruan. Pada penelitian ini, data sampel dibagi menjadi 6x9 zona dengan ukuran masing-masing zona adalah 10x10 piksel. Metode diagonal based feature extraction menghitung nilai rata-rata histogram diagonal setiap zona dan juga menghitung ratarata nilai zona setiap baris dan kolom. Berdasarkan ekstraksi fitur didapat 69 fitur sebagai nilai masukan untuk jaringan saraf tiruan. Data sampel yang digunakan dalam pelatihan jaringan saraf tiruan adalah 225 data dan data sampel yang digunakan dalam pengujian adalah 75 data. Dari pengujian yang dilakukan didapat tingkat pengenalan tertinggi menggunakan jaringan saraf tiruan propagasi balik metode diagonal based feature extraction dengan memorisasi 98,2 % dan generalisasi 85,3 %.
Kata kunci : kata tulisan tangan, huruf Korea, hangūl, diagonal based feature extraction, jaringan saraf tiruan, propagasi balik.
Universitas Sumatera Utara

RECOGNITION OF HANDWRITTEN KOREAN WORDS USING BACKPROPAGATION NETWORK

ABSTRACT
In this paper, backpropagation neural network was used to recognize handwritten Korean words (hangūl) using diagonal based feature extraction method. This method divide sample to width x height grid zones and calculates feature vector from each zones to be the input data for the neural network. In this paper, the sample data is divided to 6x9 zones with the each size of the zones is 10x10 pixel. Diagonal based feature extraction method calculate the average number of diagonal histogram of each zones and also calculates the the average number of each zones’ row and column. Based on the extraction feature, 69 feature vector was given to the neural network as the input data. The number of sample data used in the training of neural network are 225 samples and for the training of neural network are 75 samples. Based on the testing phase of built neural network, the gained rate of recognition using backpropagation network using diagonal based feature extraction is memorization 98,2% and generalization 85,3%. Keywords : handwritten words, Korean words, hangūl, diagonal based feature extraction, neural network, backpropagation.
Universitas Sumatera Utara

DAFTAR ISI

Halaman

PERSETUJUAN PERNYATAAN PENGHARGAAN ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR BAB 1 PENDAHULUAN
1.1 Latar Belakang 1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian 1.5 Manfaat Penelitian 1.6 Sistematika Penulisan BAB 2 LANDASAN TEORI 2.1 Hangūl 2.2 Citra 2.3 Pengolahan Citra
2.3.1 Normalisasi 2.3.2 Thinning 2.4 Ekstraksi Fitur 2.4.1 Diagonal Based Feature Extraction 2.5 Jaringan Saraf Tiruan 2.5.1 Konsep Dasar Jaringan Saraf Tiruan 2.6 Algoritma Propagasi Balik 2.6.1 Algoritma Pelatihan Propagasi Balik 2.6.2 Fungsi Aktivasi
2.6.2.1 Fungsi Sigmoid Biner 2.6.3 Inisialisasi Bobot dan Bias

i ii iii iv v vi viii ix 1 1 3 3 3 4 4 6 6 7 9 9 9 10 11 12 13 14 15 17 17 18

Universitas Sumatera Utara

2.6.3.1 Inisialisasi Nguyen Widrow 2.6.4 Jumlah Lapisan Tersembunyi yang Digunakan 2.6.5 Peng-update-an Bobot dengan Momentum 2.7 Penelitian Terdahulu BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Akuisisi Citra 3.2 Prapengolahan Citra 3.2.1 Pembentukan Citra Keabuan (Grayscalling) 3.2.2 Pembentukan Citra Biner (Thresholding) 3.2.3 Pengubahan Ukuran Citra (Resizing) 3.2.4 Normalisasi 3.2.5 Pengurusan Citra Objek (Thinning) 3.3 Ekstraksi Fitur 3.3.1 Metode Ekstraksi Diagonal Based Feature Extraction 3.4 Tahap Jaringan Saraf Tiruan Propagasi Balik 3.4.1 Perancangan Jaringan Propagasi Balik 3.4.2 Proses Pelatihan 3.4.3 Proses Pengujian BAB 4 HASIL DAN PEMBAHASAN 4.1 Implementasi 4.2 Tampilan Implementasi Program 4.3 Pengujian Sistem 4.3.1 Hasil Pelatihan Jaringan Saraf Tiruan Propagasi Balik 4.3.2 Hasil Pengujian Jaringan Saraf Tiruan Propagasi Balik BAB 5 KESIMPULAN DAN SARAN DAFTAR PUSTAKA LAMPIRAN A: DATA SAMPEL LAMPIRAN B: CODING PROGRAM

vii

18 19 19 20 21 22 23 24 25 26 27 27 28 30 32 32 35 35 36 36 39 43 43 48 53 54 56 63

Universitas Sumatera Utara

DAFTAR TABEL

Tabel 2.1 Tabel 24 Karakter Dasar Hangūl Tabel 2.2 Tabel Penelitian Terdahulu Tabel 3.1 Tabel Nilai Keluaran dan Target Keluaran Jaringan Tabel 4.1 Tabel Fungsi Cimg.h yang Digunakan dalam Program Tabel 4.2 Tabel Hasil Pelatihan Jaringan Saraf Tiruan Propagasi Balik Tabel 4.3 Tabel Hasil Pengujian Jaringan Saraf Tiruan Propagasi Balik Tabel 4.4 Tabel Perbandingan Tingkat Pengenalan Jaringan yang Diujikan

6 20 32 37 44 48 52

Universitas Sumatera Utara

DAFTAR GAMBAR

Gambar 2.1 Enam Bagian Penulisan Kata Hangūl Gambar 2.2 Piksel P1 dengan 8 Tetangga Gambar 2.3 Karakter ukuran 60x90 Piksel Gambar 2.4 Pembagian Zona Ekstraksi Fitur Gambar 2.5 Diagonal Histogram Setiap Zona Gambar 2.6 Jaringan Propagasi Balik dengan Satu Buah Lapisan Tersembunyi Gambar 3.1 Skema Pengenalan Kata Tulisan Tangan Huruf Korea (Hangūl) Gambar 3.2 Contoh Penulisan Kata Hangūl Gambar 3.3 Tahapan Prapengolahan Citra Gambar 3.4 Flowchart Proses Grayscalling Gambar 3.5 Citra Hasil Grayscale Gambar 3.6 Citra Hasil Thresholding Gambar 3.7 Flowchart Proses Thresholding Gambar 3.8 Citra Hasil Resizing Gambar 3.9 Citra Hasil Normalisasi Gambar 3.10 Citra Hasil Thinning Gambar 3.11 Matrik Penyimpanan Nilai Fitur Gambar 3.12 Pembagian Zona menjadi 6 Kolom dan 9 Baris Gambar 3.13 Diagram Ekstraksi Fitur Diagonal Based Feature Extraction Gambar 3.14 Histogram Diagonal Zona Gambar 3.15 Flowchart Diagonal Based Feature Extraction Gambar 3.16 Arsitektur Jaringan Saraf Tiruan Gambar 4.1 Tampilan Main Program Gambar 4.2 Image Raw Gambar 4.3 Image Hasil Grayscale Gambar 4.4 Image Hasil Threshold Gambar 4.5 Image Hasil Resize Gambar 4.6 Image Hasil Normalisasi Gambar 4.7 Image Hasil Thinning

7 10 11 12 12 14 21 22 23 24 25 25 26 27 27 28 28 29 29 30 31 34 39 40 40 40 41 41 41

Universitas Sumatera Utara


Gambar 4.8 Nilai input untuk Jaringan Saraf Tiruan Gambar 4.9 Modul Training Gambar 4.10 Tampilan Training Selesai Gambar 4.11 Hasil Testing Memorisasi Jaringan Gambar 4.12 Hasil Testing Generalisasi Jaringan

x
42 42 42 43 43

Universitas Sumatera Utara

ABSTRAK
Pada penelitian ini, digunakan jaringan saraf tiruan propagasi balik dalam mengenali kata tulisan tangan huruf Korea (hangūl) menggunakan metode diagonal based feature extraction. Metode ini membagi data sampel menjadi lebar x tinggi zona dan menghitung nilai fitur dari setiap zona tersebut sebagai nilai masukan untuk jaringan saraf tiruan. Pada penelitian ini, data sampel dibagi menjadi 6x9 zona dengan ukuran masing-masing zona adalah 10x10 piksel. Metode diagonal based feature extraction menghitung nilai rata-rata histogram diagonal setiap zona dan juga menghitung ratarata nilai zona setiap baris dan kolom. Berdasarkan ekstraksi fitur didapat 69 fitur sebagai nilai masukan untuk jaringan saraf tiruan. Data sampel yang digunakan dalam pelatihan jaringan saraf tiruan adalah 225 data dan data sampel yang digunakan dalam pengujian adalah 75 data. Dari pengujian yang dilakukan didapat tingkat pengenalan tertinggi menggunakan jaringan saraf tiruan propagasi balik metode diagonal based feature extraction dengan memorisasi 98,2 % dan generalisasi 85,3 %.
Kata kunci : kata tulisan tangan, huruf Korea, hangūl, diagonal based feature extraction, jaringan saraf tiruan, propagasi balik.
Universitas Sumatera Utara

RECOGNITION OF HANDWRITTEN KOREAN WORDS USING BACKPROPAGATION NETWORK
ABSTRACT
In this paper, backpropagation neural network was used to recognize handwritten Korean words (hangūl) using diagonal based feature extraction method. This method divide sample to width x height grid zones and calculates feature vector from each zones to be the input data for the neural network. In this paper, the sample data is divided to 6x9 zones with the each size of the zones is 10x10 pixel. Diagonal based feature extraction method calculate the average number of diagonal histogram of each zones and also calculates the the average number of each zones’ row and column. Based on the extraction feature, 69 feature vector was given to the neural network as the input data. The number of sample data used in the training of neural network are 225 samples and for the training of neural network are 75 samples. Based on the testing phase of built neural network, the gained rate of recognition using backpropagation network using diagonal based feature extraction is memorization 98,2% and generalization 85,3%. Keywords : handwritten words, Korean words, hangūl, diagonal based feature extraction, neural network, backpropagation.
Universitas Sumatera Utara

BAB 1 PENDAHULUAN
1.1 Latar Belakang Pengenalan kata dalam dunia teknologi informasi merupakan suatu permasalahan yang tidak asing dalam bidang kecerdasan buatan. Pengenalan kata dalam bidang kecerdasan buatan menyangkut bagaimana proses meniru persepsi manusia akan penglihatan dan pendengaran. Pengenalan kata memiliki banyak jenis, yang dalam hal ini diambil contoh tulisan tangan. Tulisan tangan memiliki bentuk dan gaya penulisan yang khas dan unik bagi setiap individu, sehingga terkadang tulisan tangan dapat mengakibatkan makna ambigu dikarenakan variasi penulisan tiap orang berbeda-beda. Pengenalan kata berdasarkan tulisan tangan sudah lama diidentifikasi sebagai permasalahan yang cukup sulit untuk dipecahkan oleh komputer (Tay & Khalid, 1997). Bagi manusia, mengenali kata berdasarkan tulisan tangan dikategorikan mudah karena ketika melihat tulisan tangan tertentu, objek yang terpatri dapat langsung diproses secara otomatis dengan mencocokan kata yang paling mirip dengan memori di otak, namun bagi komputer, mengenali kata berdasarkan tulisan tangan dikategorikan sulit karena harus memiliki suatu mekanisme dimana diperlukan penyesuaian dengan cara kerja otak manusia dalam mengenali tulisan tangan.
Secara umum, pengenalan kata oleh komputer dibagi menjadi dua jenis, yakni metode online dan offline. Metode online menerapkan koordinat dua dimensi dari poin-poin penulisan direpresentasikan sebagai fungsi waktu dan urutan setiap garis yang dituliskan juga disimpan secara realtime untuk mengenali kata yang dituliskan (Arica & Yarman, 2001). Metode offline menerapkan pengambilan gambar dari scanner, kamera digital ataupun media input digital lainnya dimana image dipreprocessing dengan algoritma tertentu sehingga dikenali sesuai dengan objek yang aslinya.

Universitas Sumatera Utara

2
Dalam penerapannya, kompleksitas pengenalan kata berdasarkan tulisan tangan ada pada variasi daripada penulisan yang berbeda-beda, yang dapat menyebabkan ketidakakurasian dan ambiguitas . Tulisan tangan mempunyai variasi yang lebih tinggi dalam kata CJK (Cina, Jepang, Korea). Hal ini dikarenakan kata CJK memiliki aturan tersendiri mengenai jumlah goresan dan tata cara penulisan kata CJK. Keterbatasan metode pencocokan citra dan pendekatan statistik merupakan salah satu masalah dalam pengenalan kata berbasis CJK, oleh karena itu diperlukan suatu metode lain yang memungkinkan sistem pengenalan kata yang akan memberikan hasil yang lebih baik (Whan, 1996). Salah satu teknik dalam pemecahan masalah pengenalan kata khususnya tulisan tangan adalah dengan menggunakan jaringan saraf tiruan (neural network).
Jaringan saraf tiruan merupakan salah satu teknik untuk pengenalan kata yang memiliki kemampuan sangat baik (Tay & Khalid, 1997). Jaringan saraf tiruan yakni sebuah prosesor yang terdistribusi paralel dan mempunyai kecenderungan untuk menyimpan pengetahuan yang didapatkannya dari pengalaman dan membuatnya tetap tersedia untuk digunakan. Hal ini menyerupai kerja otak dalam dua hal yaitu: pengetahuan diperoleh oleh jaringan melalui suatu proses belajar dan kekuatan hubungan antar sel saraf yang dikenal dengan bobot sinapsis digunakan untuk menyimpan pengetahuan (Haykin, 1994).
Berdasarkan kemampuan daripada jaringan saraf tiruan dalam mengenali kata tulisan tangan, maka dalam penelitian ini, digunakan jaringan saraf tiruan propagasi balik dalam pengenalan kata berdasarkan tulisan tangan huruf Korea (hangūl). Tulisan tangan hangūl, sebagai fokus utama dalam penelitian ini memiliki beberapa hambatan dalam pengenalan dibanding dengan bahasa lain. Pertama, informasi dari pada goresan tidak redundant, dengan kata lain terdapat beberapa kata yang mirip satu sama lain hanya dengan menghilangkan atau menambah garis pada karakter tertentu. Kedua, fitur goresan memiliki variasi dalam penulisan dan banyaknya distorsi. Hal ini umum terjadi dalam pengenalan kata tulisan tangan, namun hal ini berdampak lebih buruk dalam hal hangūl, dikarenakan kata hangūl terdiri dari beberapa kombinasi karakter dan bentuk daripada kata tunggal dapat berbeda dikarenakan kombinasi daripada karakter sebelum atau sesudahnya. Ketiga, kata hangūl memiliki hambatan
Universitas Sumatera Utara

3
dalam hal segmentasi, yakni perbedaan sedikit dalam pemotongan kata menghasilkan perbedaan dalam jenis karakter. Berdasarkan beberapa permasalahan yang disebut diatas, pengenalan tulisan tangan hangūl dikategorikan sebagai permasalahan yang cukup sulit (Kang & J.H, 2003).
Penelitian terdahulu mengenai pengenalan kata huruf Korea sudah banyak dilakukan, baik menggunakan jaringan saraf tiruan ataupun metode lain seperti: (Lee et al. 1991) penemuan baru algoritma pendeteksi hangūl berdasarkan ekstraksi goresan, (Kang & J.H, 2003) pengenalan tulisan tangan hangūl dengan representasi kata hirarki stokastik. Meskipun penelitian tentang pengenalan kata huruf sudah banyak dilakukan, tetapi masih perlu dilakukan pengembangan lagi untuk menambah keakuratan dalam pengenalan kata tulisan tangan hangūl.
1.2 Rumusan Masalah
Dalam penerapannya, kompleksitas pengenalan kata berdasarkan tulisan tangan huruf Korea (hangūl) ada pada variasi daripada penulisan yang berbeda-beda, yang dapat menyebabkan ketidakakurasian dan ambiguitas dimana tulisan tangan mempunyai variasi yang lebih tinggi. Oleh karena itu, rumusan masalah dalam penelitian ini adalah bagaimana mengenali kata dari tulisan tangan huruf Korea (hangūl).
1.3 Batasan Masalah
Dalam penelitian ini, ditetapkan beberapa batasan masalah yakni : 1. Pengenalan kata berdasarkan tulisan tangan hangūl dilakukan secara offline. 2. Input berupa citra yang telah dipindai dalam format bitmap. 3. Akuisisi citra diambil dari 15 orang. 4. Kata yang dikenali terdiri dari 2 karakter.
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah menerapkan jaringan propagasi balik dengan algoritma ekstraksi diagonal based feature extraction untuk mengenali tulisan tangan huruf Korea (hangūl).
Universitas Sumatera Utara

4

1.5 Manfaat Penelitian
Adapun manfaat penelitian ini adalah : 1. Bagi penulis, diharapkan penelitian ini menambah wawasan dan pengetahuan bagaimana menerapkan jaringan saraf tiruan propagasi balik dalam pengenalan kata dari kata tulisan tangan hangūl dan menjawab keingintahuan penulis akan masalah yang diteliti. 2. Bagi pihak lain, diharapkan penelitian ini dapat dijadikan acuan baik sebagai referensi ataupun digunakan sebagai perbandingan metode lain yang telah ada untuk menambah ilmu pengetahuan dalam pengenalan kata berbasis hangūl.
1.6 Sistematika Penulisan
Penulisan skripsi ini menggunakan sistematika penulisan yang membagi pembahasan skrispi dalam lima bagian utama, yang terdiri atas:
BAB 1 PENDAHULUAN Pada bab ini merupakan pendahuluan yang berisi latar belakang, rumusan masalah, tujuan penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan skripsi.
BAB 2 STUDI LITERATUR Pada bab ini membahas mengenai teori-teori yang digunakan untuk memahami permasalahan yang berkaitan dengan pengenalan tulisan tangan yaitu pengolahan citra, ektraksi fitur dan jaringan saraf tiruan.
BAB 3 ANALISIS DAN PERANCANGAN SISTEM Pada bab ini berisikan analisis mengenai metode yang digunakan untuk menyelesaikan masalah dan perancangan dari sistem yang dibangun.
BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM Pada bab ini dibahas mengenai spesifikasi kebutuhan perangkat keras (hardware) dan perangkat lunak (software) dari sistem. Kemudian terdapat cara kerja dari sistem dan menampilkan hasil dari pengujian sistem ini.
Universitas Sumatera Utara

5 BAB 5 KESIMPULAN DAN SARAN Pada bab ini dibuat mengenai rangkuman dari hasil analisis dan implementasi kerja sistem pada bagian sebelumnya, dan pada bagian ini terdapat saran yang diberikan untuk pengembangan sistem selanjutnya.
Universitas Sumatera Utara

BAB 2 LANDASAN TEORI
Dalam bab ini dibahas teori yang digunakan sebagai landasan pengerjaan pengenalan kata berdasarkan tulisan tangan huruf Korea (hangūl) menggunakan jaringan saraf tiruan propagasi balik. Pembahasan bertujuan untuk menguraikan teori dan algoritma yang digunakan dalam pengenalan kata.
2.1 Hangūl ( Alfabet Bahasa Korea) Hangūl adalah alfabet bahasa Korea yang diciptakan oleh sekelompok pelajar kerajaan yang diperintah oleh Raja Sejong pada Dinasti Yi tahun 1443. Prinsip daripada hangūl adalah hieroglif. Pada masa penciptaannya, hangūl terdiri dari 28 karakter dasar, namun saat ini hanya 24 karakter yang digunakan (Lee et al. 1991). Karakter dasar hangūl dapat dibagi menjadi konsonan dasar dan vokal dasar seperti pada tabel 2.1.
Tabel 2.1 24 Karakter dasar hangūl Vokal ㅏ ㅑ ㅓ ㅕ ㅗ ㅛ ㅜ ㅠ ㅡ ㅣ Konsonan ㄱ ㄴ ㄷ ㄹ ㅂ ㅇ ㅊ
ㅋㅌ ㅍ ㅎ ㅅ ㅈ ㅁ
Hangūl adalah tulisan yang terbentuk sebagai gabungan dari beberapa karakter dan memiliki struktur dua dimensi. Karakter hangūl memiliki 3 bagian yakni bagian pertama konsonan, kedua vokal dan ketiga secara umum adalah konsonan. Untuk setiap kata, harus ada setidaknya sebuah karakter konsonan dan karakter vokal,
Universitas Sumatera Utara


7
dimana karakter konsonan selalu diatas kiri atau diatas karakter vokal. Menurut perspektif pemrosesan gambar, maka silabel karakter Korea dapat dibagi menjadi 6 bagian seperti yang ditunjukan pada gambar 2.1. Dalam penelitian ini, bagian yang diteliti hanya hangūl yang terdiri dari dua bagian.
Gambar 2.1 Enam bagian penulisan kata hangūl (Lee et al. 1991).
2.2 Citra Menurut pendapat ahli, citra (image) adalah objek yang dibuahkan oleh pantulan atau pembiasan sinar yang difokuskan dari sebuah lensa atau cermin (Simonett et al. 1983). Pantulan daripada cahaya yang dihasilkan ditangkap oleh alat optik seperti mata ataupun kamera yang direkam didalam memori dan dapat dihasilkan kembali dengan teknik pencetakan bagi alat optik seperti kamera atau menggambarkan kembali dalam bentuk memori bagi manusia.
Citra digital adalah gambar dua dimensi yang dapat ditampilkan pada layar monitor komputer sebagai himpunan berhingga (diskrit) nilai digital yang disebut piksel. Piksel adalah elemen citra yang memiliki nilai yang menunjukan intensitas warna. Berdasarkan cara penyimpanan atau pembentukannya, citra digital dapat dibagi menjadi dua yakni citra yang dibentuk oleh kumpulan piksel dalam array dua dimensi atau disebut bitmap dan citra yang dibentuk oleh fungsi geometrika dan matematika yang disebut grafik vektor. Dalam pembahasan teori ini, yang dimaksud dengan citra digital adalah citra bitmap. Secara umum, citra digital dikelompokan menjadi 3 macam yakni :
1. Citra biner Citra biner adalah citra yang masing-masing piksel hanya berwarna hitam dan putih. Oleh karena hanya terdapat dua nilai kemungkinan yaitu hitam dan putih,
Universitas Sumatera Utara

8

maka hanya diperlukan satu bit per piksel. Citra biner sangat efisien dalam hal tempat penyimpanan. Citra yang direpresentasikan sebagai citra biner sangat cocok digunakan untuk citra yang menggambarkan teks, finger print, atau rencana arsitektural. Untuk mengubah citra grayscale menjadi citra biner, proses yang dilakukan adalah mengubah kuantisasi citra dengan cara pengambangan secara global (global image thresholding). Setiap piksel di dalam citra dipetakan ke dalam dua nilai, 1 atau 0. Dengan fungsi pengambangan:

(,

)=

1, 0,

(, )≤


2. Citra keabuan (grayscale) Citra keabuan adalah citra yang masing-masing piksel berisikan warna abuabu dengan nilai normal antara 0 (hitam) sampai 255 (putih). Range tersebut berarti masing-masing piksel dapat direpresentasikan oleh nilai 8 bit atau satu bit. Untuk menghitung citra keabuan digunakan metode luminance dimana metode ini berdasarkan persepsi manusia akan warna, dimana warna hijau adalah warna yang paling sensitif terhadap penglihatan manusia, diikuti warna merah dan yang terakhir adalah warna biru (Lennie et al. 1993). Perhitungan pembentukan citra baru dengan metode luminance yakni dengan rumus : Pnew = 0.299 x R + 0.587 x G + 0.114 x B
Dengan Pnew adalah piksel baru yang berisikan nilai keabuan yang diperoleh dari penambahan daripada hasil perkalian red, green, blue. Pada rumus, nilai green lebih tinggi dari red dan blue dikarenakan warna hijau adalah warna yang paling sensitif terhadap persepsi penglihatan manusia.

3. Citra Warna Citra warna adalah citra yang masing-masing piksel mempunyai warna khusus. Warna dideskripsikan oleh kombinasi warna merah, hijau dan biru. Sistem pewarnaan citra warna ada beberapa macam, namun yang paling umum adalah sistem RGB (Red, Green, Blue).

Universitas Sumatera Utara

9
2.3 Pengolahan Citra Pengolahan citra atau image processing adalah proses yang mencakup dua aspek pengubahan sebuah citra yakni meningkatkan kualitas informasi dari sebuah citra (gambar) yang digunakan untuk kepentingan interpretasi manusia dan mengubah citra dari sebuah gambar yang digunakan untuk mempermudah pemrosesan persepsi mesin autonomous agar lebih mudah dalam mengambil keputusan. Dalam pembahasan teori ini berfokus pada hal digital image processing yakni proses pengolahan citra yang melibatkan komputer untuk mengubah dan memproses suatu citra digital.
2.3.1 Normalisasi
Normalisasi adalah proses mengubah nilai daripada intensitas piksel menjadi satu keseragaman dalam satu intensitas yang lebih mendekati kenormalan daripada kemampuan melihat suatu gambar. Normalisasi terkadang disebut juga pelebaran kontras dan pelebaran histogram (Gonzalez & Woods, 2007).
2.3.2 Thinning
Thinning adalah proses pengurangan data yang mengikis (erode) sebuah objek hingga menjadi ukuran 1 piksel dan menghasilkan kerangka (skeleton) dari objek tersebut. Objek seperti huruf atau silhouettes dapat lebih mudah dikenali dengan melihat kepada kerangkanya saja (Phillips, 2000). Pada penelitian ini digunakan algoritma thinning Zhang-Suen.
Algoritma ini adalah algoritma untuk citra biner, dimana piksel background citra bernilai 0, dan piksel foreground (region) bernilai 1. Algoritma ini cocok digunakan untuk bentuk yang diperpanjang (elongated) dan dalam aplikasi OCR (Optical Character Recognition). Algoritma ini terdiri dari beberapa penelusuran, dimana setiap penelusurannya terdiri dari 2 langkah dasar yang diaplikasikan terhadap titik yang pikselnya bernilai 1, dan memiliki paling sedikit 1 piksel dari 8-tetangganya yang bernilai 0. Gambar 2.2 mengilustrasikan titik objek P1 dan 8-tetangganya:
Universitas Sumatera Utara

10
Gambar 2.2 Piksel P1 dengan 8 tetangga
Langkah pertama dari sebuah penelusuran adalah menandai semua titik objek untuk dihapus, jika titik objek tersebut memenuhi syarat-syarat berikut:

a. 2 ≤ N (P1) ≤ 6 b. S(P1) = 1 c. P2 * P4 * P6 = 0 d. P4 * P6 * P8 = 0
Keterangan : 1. Jumlah dari tetangga titik objek P1, yang pikselnya bernilai 1, yaitu:
N(P1) = P2 + P3 + P4 + … + P9 2. S(P1) adalah jumlah perpindahan nilai nilai dari 0 (nol) ke 1 (satu) mulai dari P2,
P3, …, P8, P9. 3. P2 * P4 * P6 = 0, memiliki arti P2 atau P4 atau P6 bernilai 0 (nol).
Dan pada langkah kedua, kondisi (a) dan (b) sama dengan langkah pertama, sedangkan kondisi (c) dan (d) diubah menjadi: (c’) P2 * P4 * P8 = 0 (d’) P2 * P6 * P8 = 0
2.4 Ekstraksi Fitur
Ekstraksi Fitur adalah proses pengukuran terhadap data yang telah melalui image processing untuk membentuk sebuah nilai fitur yang khas yang digunakan sebagai pengenal bagi unit masukan dengan target keluaran dan memudahkan pengklasifikasian karena nilai fitur yang khas ciri nya mudah untuk dibedakan (Pradeep et al. 2011).
Universitas Sumatera Utara

11 2.4.1 Diagonal Based Feature Extraction Pradeep et al. (2011) menggunakan diagonal based feature extraction untuk mendapatkan input untuk pengenalan karakter tulisan tangan. Cara kerja ekstraksi fitur tersebut adalah sebagai berikut : 1. Setiap karakter image dengan ukuran 60x90 piksel (Gambar 2.3) dibagi menjadi
54 zona, setiap zona berukuran 10x10 piksel (Gambar 2.4). 2. Untuk setiap zona :
a. Hitung histogram secara diagonal untuk mendapatkan 19 subfitur (Gambar 2.5).
b. Hitung rata-rata dari 19 subfitur tersebut dan nilai tersebut digunakan untuk mewakili setiap zona.
3. Dari nilai setiap zona, hitung rata-rata masing-masing baris dan masing-masing kolom. Sehingga didapatkan 9 nilai baris dan 6 nilai kolom.
4. 54 fitur + 15 fitur menjadi nilai masukan untuk jaringan saraf tiruan.
Gambar 2.3 Karakter ukuran 60x90 piksel (Pradeep et al. 2011)
Universitas Sumatera Utara

12
Gambar 2.4 Pembagian zona ekstraksi fitur (Pradeep et al. 2011)

Gambar 2.5 Diagonal histogram setiap zona (Pradeep et al. 2011) 2.5 Jaringan Saraf Tiruan Jaringan saraf tiruan adalah paradigma pengolahan informasi yang terinspirasi oleh sistem saraf secara biologis, seperti proses informasi pada otak manusia. Elemen kunci dari paradigma ini adalah struktur dari sistem pengolahan informasi yang terdiri dari sejumlah besar elemen pemrosesan yang saling berhubungan (neuron), bekerja serentak untuk menyelesaikan masalah tertentu. Cara kerja jaringan saraf tiruan adalah
Universitas Sumatera Utara

13
seperti cara kerja manusia, yaitu belajar pola atau klasifikasi data, melalui proses pembelajaran (Sutojo et al. 2010)
Jaringan saraf tiruan disusun dengan asumsi yang sama seperti jaringan saraf biologi (Puspitaningrum, 2006): 1. Pengolahan informasi terjadi pada elemen-elemen pemrosesan (neuron). 2. Sinyal antara dua buah neuron diteruskan melalui link-link koneksi. 3. Setiap link koneksi memiliki bobot terasosiasi. 4. Setiap neuron menerapkan sebuah fungsi aktivasi terhadap input jaringan (jumlah
sinyal input berbobot). Tujuannya adalah untuk menentukan sinyal output.
2.5.1 Konsep Dasar Jaringan Saraf Tiruan
Pembagian arsitektur jaringan saraf tiruan bisa dilihat dari kerangka kerja dan skema antar interkoneksi. Kerangka kerja jaringan saraf tiruan bisa dilihat dari jumlah lapisan (layer) dan jumlah node pada setiap lapisan (Puspitaningrum, 2006).
Lapisan – lapisan penyusun jaringan saraf tiruan dapat dibagi menjadi tiga : 1. Lapisan input
Node-node di dalam lapisan input disebut unit-unit input. Unit-unit input menerima input dari dunia luar. Input yang dimasukkan merupakan penggambaran dari suatu masalah. 2. Lapisan tersembunyi Node-node di dalam lapisan tersembunyi disebut unit-unit tersembunyi. Output dari lapisan ini tidak secara langsung dapat diamati. 3. Lapisan output Node-node pada lapisan output disebut unit-unit output. Keluaran atau output dari lapisan ini merupakan output jaringan saraf tiruan terhadap suatu permasalahan.
Universitas Sumatera Utara

14
2.6 Algoritma Propagasi Balik Algoritma propagasi balik merupakan metode yang sangat baik dalam menangani masalah pengenalan pola-pola kompleks. Istilah propagasi balik diambil dari cara kerja jaringan ini, yaitu bahwa gradien error unit-unit tersembunyi diturunkan dari penyiaran kembali error yang disosialisasikan dengan unit output dikarenakan nilai target untuk unit tersembunyi tidak diberikan (Puspitaningrum, 2006). Contoh jaringan propagasi balik dengan satu buah lapisan tersembunyi dapat dilihat pada gambar 2.6.
Gambar 2.6 Jaringan propagasi balik dengan satu buah lapis tersembunyi (Puspitaningrum, 2006)
Algoritma propagasi balik dapat dibagi ke dalam dua bagian (Puspitaningrum, 2006): 1. Algoritma pelatihan
Terdiri dari 3 tahap: tahap umpan maju pola pelatihan input, tahap pempropagasian error, dan tahap pengaturan bobot. 2. Algoritma aplikasi Yang digunakan hanyalah tahap umpan maju saja.
Universitas Sumatera Utara

15
2.6.1 Algoritma Pelatihan Propagasi Balik
Berikut adalah algoritma pelatihan untuk jaringan propagasi balik dengan sebuah lapisan tersembunyi yang disusun menurut gambar 2.7.
Algoritma Pelatihan 1. Inisialisasi bobot-bobot.
Tentukan angka pembelajaran (α). Tentukan pula nilai toleransi error atau nilai ambang (bila menggunakan nilai ambang sebagai kondisi berhenti); atau set maksimal epoch (bila menggunakan banyaknya epoch sebagai kondisi berhenti). 2. While kondisi berhenti tidak terpenuhi do langkah ke-3 sampai langkah ke-10. 3. Untuk setiap pasangan pola pelatihan, lakukan langkah ke-4 sampai langkah ke-9.
Tahap Umpan Maju 4. Setiap unit input xi (dari unit ke-1 sampai unit ke-n pada lapisan input)
mengirimkan sinyal input ke semua unit yang ada di lapisan atasnya (ke lapisan tersembunyi) 5. Pada setiap unit di lapisan tersembunyi zj (dari unit ke-1 sampai unit ke-p; i=i,…,n; j=1,...,p) sinyal output lapisan tersembunyinya dihitung dengan menerapkan fungsi aktivasi terhadap penjumlahan sinyal-sinyal input berbobot xi:
=+ kemudian dikirim ke semua unit di lapisan atasnya. 6. Setiap unit di lapisan output yk (dari unit ke-1 sampai unit ke-m; i=1,...,n; k=1,…,m) dihitung sinyal output-nya dengan menerapkan fungsi aktivasi terhadap penjumlahan sinyal-sinyal input berbobot zj bagi lapisan ini:
=+
Universitas Sumatera Utara

16
Tahap Pemropagasibalikan Error 7. Setiap unit output yk (dari unit ke-1 sampai unit ke-m; i=1,…,p; k=1,….,m)
menerima pola target tk lalu informasi kesalahan lapisan output (δk) dihitung. δk dikirim ke lapisan di bawahnya dan digunakan untuk mengitung besar koreksi bobot dan bias (Δwjk dan Δw0k) antara lapisan tersembunyi dengan lapisan output:
δ = (t − y ) f′ w + z w
Δwjk = α δk zj Δw0k = α δk 8. Pada setiap unit di lapisan tersembunyi (dari unit ke-1 sampai unit ke-p; i=1,…,n; j=1,…,p; k=1,…,m) dilakukan perhitungan informasi kesalahan lapisan tersembunyi (δj). δj kemudian digunakan untuk menghitung besar koreksi bobot dan bias (Δwjk dan Δw0k) antara lapisan input dan lapisan tersembunyi. δ = δ w ) f′ v + x v
Δvij = α δj xi Δv0j = α δj
Tahap Peng-update-an Bobot dan Bias 9. Pada setiap unit output yk (dari unit ke-1 sampai unit ke-m) dilakukan peng-
update-an bias dan bobot (j=0,…,p; k=1,…,m) sehingga bias dan bobot baru menjadi:
wjk (baru) = wjk (lama) + Δ wjk Dari unit ke-1 sampai unit ke-p di lapisan tersembunyi juga dilakukan pengupdate-an pada bias dan bobotnya (i=0,…,n; j=1,…,p):
vij (baru) = vij (lama) + Δ vij 10. Tes kondisi berhenti.
Algoritma Aplikasi
Universitas Sumatera Utara

17
1. Inisialisasi bobot. Bobot ini diambil dari bobot-bobot terakhir yang diperoleh dari algoritma pelatihan.
2. Untuk setiap vektor input, lakukanlah langkah ke-3 sampai ke-5. 3 Setiap unit input xi (dari unit ke-1 sampai unit ke-n pada lapisan input; i=1,…,n)
menerima sinyal input pengujian xi dan menyiarkan sinyal xi ke semua unit pada lapisan di atasnya (unit-unit tersembunyi). 4. Setiap unit di lapisan tersembunyi zj (dari unit ke-1 sampai unit ke-p; i=1,…,n; j=1,….,p) menghitung sinyal output-nya dengan menerapkan fungsi aktivasi terhadap penjumlahan sinyal-sinyal input xi. Sinyal output dari lapisan tersembunyi kemudian dikirim ke semua unit pada lapisan di atasnya:
=+
5. Setiap unit output yk (dari unit ke-1 sampai unit ke-m; j=1,…,p; k=1,…,m) menghitung sinyal output-nya dengan menerapkan fungsi aktivasi terhadap penjumlahan sinyal-sinyal input bagi lapisan ini, yaitu sinyal-sinyal input zj dari lapisan tersembunyi:
=+
2.6.2 Fungsi Aktivasi
Pilihan fungsi aktivasi yang dapat digunakan pada metode propagasi balik yaitu fungsi sigmoid biner, sigmoid bipolar dan tangent hiperbolik. Karakteristik yang harus dimiliki fungsi aktivasi tersebut adalah kontinu, diferensiabel dan tidak menurun secara monoton. Fungsi aktivasi diharapkan jenuh (mendekati nilai-nilai maksimum dan minimum secara asimtot) (Puspitaningrum, 2006).
2.6.2.1 Fungsi Sigmoid Biner
Fungsi ini merupakan fungsi yang umum digunakan. Rentang-nya adalah (0,1) dan didefenisikan sebagai :
Universitas Sumatera Utara

18

dengan turunan :

(

)=

1 1+

( )= ( ) 1− ( )

2.6.3 Inisialisasi Bobot dan Bias

Cepat atau tidaknya pembelajaran pada pelatihan jaringan saraf tiruan propagasi balik dipengaruhi oleh nilai bobot antar neuron dan nilai bias. Bobot dan bias pada jaringan propagasi balik dapat diinisialisasi dengan berbagai cara, salah satunya adalah inisialisasi Nguyen-Widrow.

2.6.3.1 Inisialisasi Nguyen Widrow

Waktu pembelajaran jaringan propagasi balik yang bobot dan biasnya diinisalisasi dengan inisialisasi Nguyen-Widrow lebih cepat dibandingkan bila diinisialisasi dengan inisialisasi acak. Pada inisialisasi Nguyen-Widrow, inisialisasi acak tetap terpakai tetapi digunakan untuk menginisialisasi bias dan bobot dari unit tersembunyi ke unit output saja. Untuk bias dan bobot dari unit-unit input ke unit-unit tersembuyi digunakan bias dan bobot yang khusus diskala agar jatuh pada range tertentu. Dengan penskalaan maka diharapkan kemampuan belajar dari unit-unit tersembunyi dapat meningkat.
Faktor skala Nguyen-Widrow (β) didefenisikan sebagai : β = 0.7 (p)
di mana : n = banyak unit input p = banyak unit tersembunyi β = faktor skala

Prosedur inisialisasi Nguyen-Widrow Untuk setiap unit tersembunyi dari unit ke-1 sampai unit ke-p :

Universitas Sumatera Utara

19

1. Inisialisasi vektor bobot dari unit-unit input ke unit-unit tersembunyi (j = 1, …, p)

dengan cara :

a. Menentukan bobot-bobot antara unit input ke unit tersembunyi (vij) :

vij(lama) = bilangan acak antara - β dan β

di mana i = 1, …, n.

b. Menghitung || vij ||.

c. Menginisialisasi kembali vij :

= β . (lama)

2. Menentukan bias antara unit input ke unit tersembunyi (j = 1, …, p). voj diset dengan bilangan acak yang terletak pada skala antara - β dan β.

2.6.4 Jumlah Lapisan Tersembunyi yang Digunakan

Satu buah lapisan tersembunyi bisa dikatakan cukup memadai untuk menyelesaikan masalah sembarang fungsi pendekatan. Dengan menggunakan lebih dari satu buah lapisan tersembunyi, kadang-kadang suatu masalah lebih mudah untuk diselesaikan. Mengenai banyaknya lapisan tersembunyi yang dibutuhkan, tidak ada ketentuan khusus (Puspitaningrum, 2006).

2.6.5 Peng-update-an Bobot dengan Momentum

Penambahan parameter momentum dalam meng-update bobot seringkali bisa mempercepat proses pelatihan. Ini disebabkan karena momentum memaksa proses perubahan bobot terus bergerak sehingga tidak terperangkap dalam minimumminimum lokal. Peng-update-an bobot pada proses pelatihan jaringan yang biasa adalah sebagai berikut :

Δwjk = α δk zj Δvij = α δjxi

Universitas Sumatera Utara

20

Jika error tidak terjadi (output aktual telah sama dengan output target) maka δk menjadi nol dan hal ini akan menyebabkan koreksi bobot Δwjk = 0, atau dengan kata lain peng-update-an bobot berlanjut dalam arah yang sama seperti sebelumnya.

Jika parameter momentum digunakan maka persamaan-persamaan pengupdate-an bobot dengan langkah pelatihan t, dan t+1 untuk langkah pelatihan selanjutnya, mengalami modifikasi sebagai berikut :
Δwjk(t + 1) = α δk zj + µ Δwjk(t) Δvij(t + 1) = α δj xi + µ Δvij(t) dengan µ adalah parameter momentum dalam range antara 0 sampai 1.

2.7 Penelitian Terdahulu

Penelitian terdahulu mengenai pengenalan kata huruf sudah banyak dilakukan. Penelitian terdahulu berfungsi sebagai referensi dan masukan bagi pengerjaan pengenalan kata tulisan tangan berbasis huruf Korea agar lebih optimal. Berbagai penelitian terdahulu dapat dilihat pada tabel 2.2.

Peneliti Lee et al (1991)
Kang & J.H (2003)
Pradeep et al (2011)

Tabel 2.2 Penelitian terdahulu Metode Penelitian
Penemuan baru algoritma pendeteksi hangul berdasarkan ekstraksi goresan. Pengenalan tulisan tangan hangul dengan representasi kata hirarki stokastik.
Pengenalan tulisan tangan huruf alfabet dengan jaringan saraf tiruan menggunakan metode DBFE.

Khairunnisa (2012) Putra (2012)

Pengenalan tulisan tangan bersambung dengan jaringan saraf tiruan metode ekstraksi Zoning. Peningkatan nilai fitur pengenalan dengan gabungan metode Zoning dan DBFE menggunakan jaringan saraf tiruan.

Universitas Sumatera Utara

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Dalam bab ini dibahas data yang digunakan, penerapan algoritma dan analisis perancangan sistem dalam mengimplementasikan jaringan saraf tiruan propagasi balik dalam pengenalan kata berdasarkan tulisan tangan huruf Korea (hangūl). Pembahasan bertujuan untuk menguraikan spesifikasi dan kebutuhan dalam pengerjaan dan pengembangan aplikasi. Secara umum, skema dasar tahap-tahap pengenalan kata dapat dilihat pada gambar 3.1.

Akuisisi Citra

Prapengolahan citra

Ekstraksi Fitur

Citra Latih
Pelatihan dengan JST

Citra Uji

Pengujian JST Keluaran
Gambar 3.1 Skema pengenalan kata tulisan tangan huruf Korea (hangūl)

Universitas Sumatera Utara

22
Tahap pertama daripada pengerjaan adalah akuisisi data, yakni membaca citra kata tulisan tangan hangūl yang telah dikumpulkan dan dipindai. Tahap kedua yakni pemrosesan citra yang telah dikumpulkan menjadi satu kesatuan yang seragam agar sesuai untuk tahap selanjutnya. Tahap ketiga yakni ekstraksi fitur, dimana digunakan diagonal based feature extraction untuk mengekstrak nilai fitur daripada tiap citra yang akan digunakan sebagai masukan bagi jaringan saraf tiruan. Tahap keempat adalah pelatihan dan pengujian menggunakan jaringan saraf tiruan propagasi balik, dimana akan didapat keluaran daripada pelatihan dan pengujian citra oleh jaringan saraf tiruan.
3.1 Akuisisi Citra
Data sampel yang digunakan adalah 15 kata hangūl yang ditulis pada kertas putih ukuran A4 menggunakan pena spidol warna hitam. Data sampel dikumpulkan dari 15 orang responden yakni mahasiswa Teknologi Informasi dan responden luar. Cara penulisan sampel yakni 15 orang menuliskan 15 kata sebanyak 1 kali sebagai data latih dan 5 orang tambahan menuliskan 15 kata sebanyak 1 kali sebagai data uji. Sampel daripada kata terdiri dari 2 karakter dan memuat seluruh karakter dasar hangūl. Penulisan dilakukan dengan mengikuti sampel kata yang telah diberikan. Contoh penulisan dengan sampel kata dapat dilihat pada gambar 3.2.
Gambar 3.2 Contoh penulisan kata hangūl. Sampel kata (kiri) dan tulisan tangan (kanan)
Total data sampel yang digunakan adalah 300 kata tulisan tangan. Data kemudian dibagi penggunaannya untuk data pelatihan dan data pengujian. Total data pelatihan adalah 225 kata tulisan tangan dan total data pengujian adalah 75 kata
Universitas Sumatera Utara

23 tulisan tangan yang tidak dilatihkan. Data sampel yang digunakan penelitian ini dapat dilihat pada lampiran A.
Data sampel yang telah dikumpulkan, dipindai menggunakan scanner. Citra hasil pemindaian disimpan dalam format bitmap (.bmp). Setiap kata tulisan tangan dicrop terlebih dahulu sesuai dengan ukuran kata. Ukuran setiap citra yang disimpan tidak ditentukan karena akan diolah pada tahap prapengolahan citra. 3.2 Prapengolahan citra Tahapan proses pengolahan citra dapat dilihat pada gambar 3.3.
Gambar 3.3 Tahapan Prapengolahan Citra Pengolahan citra dimulai dengan mengubah citra warna (RGB) menjadi citra keabuan dan dilanjutkan diproses menjadi citra biner dengan proses thresholding. Tahap selanjutnya adalah resizing dan normalisasi citra menjadi ukuran yang seragam yani 60x90 piksel. Citra yang telah dinormalisasi kemudian di-thinning untuk mendapatkan kerangka dari objek kata. Citra hasil thinning yang kemudian digunakan untuk tahap ekstraksi fitur.
Universitas Sumatera Utara

24 3.2.1 Pembentukan Citra Keabuan ( Grayscalling) Tahap pemrosesan citra diawali dengan grayscalling yakni teknik yang digunakan untuk mengubah citra berwarna menjadi bentuk grayscale atau tingkat keabuan (dari hitam - putih). Pembentukan citra keabuan menggunakan metode luminance yakni nilai RGB dikalikan dengan nilai yang telah ditentukan yang kecocokan nya sesuai dengan sensitivitas mata terhadap warna. Hijau adalah warna paling dominan, diikuti merah dan terakhir biru (Lennie et al. 1993). Hasil akhir proses ini adalah nilai keabuan (8 bit) dengan rentang hitam (0) dan putih (255). Flowchart grayscalling dapat dilihat pada gambar 3.4.
Gambar 3.4 Flowchart proses grayscalling
Universitas Sumatera Utara

25
Gambar 3.5 Citra hasil Grayscale 3.2.2 Pembentukan Citra Biner (Thresholding) Tahap kedua yakni pembentukan citra biner dimana citra hasil grayscalling akan diubah menjadi citra biner yakni citra yang hanya memiliki dua nilai warna, hitam dan putih yang dinamakan proses threshold. Contoh citra RGB yang sudah di-grayscale dan diubah menjadi citra biner dapat dilihat pada gambar 3.6.
Gambar 3.6 Citra hasil thresholding Flowchart proses thresholding dapat dilihat pada gambar 3.7
Universitas Sumatera Utara

26

Start
Inisialisasi img (hasil Grayscale) tinggi = img(height)
lebar = img(width) threshold, i, j
j=0

j=j+1 No

j < tinggi
Yes i=0

No

End

i < lebar

Yes
img(i, j) > threshold Yes

No

img(i, j) = 255

img(i, j) = 0

i=i+1

Gambar 3.7 Flowchart proses thresholding
3.2.3 Pengubahan Ukuran Citra (Resizing)
Setelah didapat citra biner hasil thresholding, maka citra selanjutnya diubah ke ukuran standar pengenalan. Proses pengubahan ukuran citra dinamakan resizing. Resizing berfungsi untuk mereduksi dan menyeragamkan ukuran citra input. Adapun pada proses ini, semua citra diseragamkan menjadi ukuran 60x90 piksel berdasarkan penelitian yang dilakukan sebelumnya oleh Pradeep et al. (2011). Ukuran citra diperkecil dan diseragamkan agar memudahkan proses pengolahan citra. Contoh citra hasil resizing dapat dilihat pada gambar 3.8.

Universitas Sumatera Utara

27
Gambar 3.8 Citra hasil resizing 3.2.4 Normalisasi Citra Normalisasi bertujuan untuk mendapatkan data dengan mean nol dan standar deviasi sama dengan satu. Normalisasi dalam penelitian ini bertujuan untuk menyeragamkan nilai piksel daripada setiap citra menjadi satu standar untuk diekstrak pada ekstraksi fitur. Contoh citra hasil normalisasi dapat dilihat pada gambar 3.9.
Gambar 3.9 Citra hasil normalisasi 3.2.5 Pengurusan Objek Citra (Thinning) Proses terakhir daripada prapengolahan citra yakni thinning, yakni proses dimana objek kata tulisan tangan dikuruskan (thinning) sehingga ketebalan nya hanya 1 piksel namun tidak merubah atau menghilangkan informasi penting daripada citra tersebut. Dalam penelitian ini, digunakan algoritma thinning Zhang Suen. Algoritma Zhang Suen menggunakan nilai baru bagi tiap piksel dihasilkan dari nilai piksel pada iterasi sebelumnya. Penjelasan lebih lanjut mengenai Algoritma Zhang Suen dijelaskan pada sub bab 2. Contoh citra hasil thinning dapat dilihat pada gambar 3.10.
Universitas Sumatera Utara

28
Gambar 3.10 Citra hasil thinning 3.3 Ekstraksi Fitur Setelah dilakukan tahap prapengolahan citra maka tahap selanjutnya adalah tahap ekstraksi fitur. Pada tahap ini, data sampel (citra) diekstrak menggunakan metode diagonal based feature extraction untuk didapat nilai fitur sebagai masukan bagi lapis masukan jaringan propagasi balik. Nilai fitur disimpan dalam matrik dengan indeks 0 sampai dengan indeks n. Matrik nilai fitur dapat dilihat pada gambar 3.11.
0n Gambar 3.11 Matrik penyimpanan nilai fitur
Ukuran daripada data sampel mengikuti ukuran yang digunakan sebelumnya oleh Pradeep et al. (2011) dan Putra (2012) yakni 60x90 piksel. Ukuran citra diseragamkan agar memudahkan pengolahan citra. Ukuran citra yang terlalu besar akan memperlambat kerja sistem. Pada penelitian yang sebelumnya dilakukan, setiap data sampel dibagi menjadi zona-zona berukuran 10x10 piksel dengan hasil daripada pembagian didapat 6 kolom dan 9 baris. Jumlah zona adalah sebanyak 54 zona seperti pada gambar 3.12.
Universitas Sumatera Utara

60
10
10 Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 Z11 Z12 Z13 Z14 Z15 Z16 Z17 Z18 Z19 Z20 Z21 Z22 Z23 Z24
90 Z25 Z26 Z27 Z28 Z29 Z30 Z31 Z32 Z33 Z34 Z35 Z36 Z37 Z38 Z39 Z40 Z41 Z42 Z43 Z44 Z45 Z46 Z47 Z48 Z49 Z50 Z51 Z52 Z53 Z54

29

Gambar 3.12 Pembagian zona menjadi 6 kolom dan 9 baris
Proses ekstraksi fitur menggunakan metode diagonal based feature extraction dapat dijelaskan melalui alur pada gambar 3.13. Flowchart sistem mengacu pada gambar 3.15.

Bagi citra menjadi 6 kolom dan 9 baris dengan ukuran setiap
zona 10 x 10 piksel

Hitung histogram diagonal setiap
zona

Hitung rata – rata histogram setiap
zona

Hitung rata – rata zona per baris

Hitung rata – rata zona per kolom

Nilai fitur = rata – rata histogram zona, rata – rata zona per baris, rata – rata
zona per kolom

Gambar 3.13 Diagram Ekstraksi Fitur Diagonal Based Feature Extraction

Universitas Sumatera Utara

30
3.3.1 Metode Ekstraksi Diagonal Based Feature Extraction
Proses ekstraksi terdiri dari 4 bagian : Algoritma diagonal based feature extraction (Pradeep et al. 2011) :
1. Hitung histogram diagonal setiap zona. Histogram diagonal adalah banyaknya piksel hitam setiap diagonal pada satu zona. Setiap zona memiliki 19 nilai histogram diagonal yang disebut Histds, dimana 1 ≤ d ≤ 19.

Gambar 3.14 Histogram diagonal zona (Pradeep et al. 2011)

2. Hitung nilai fitur setiap zona, yaitu rata-rata histogram setiap zona, disebut Zn

dimana 1 ≤ n