Feature Extraction and Selection

Supeno, maka kita hanya melakukan cropping pada suku kata su yang terdapat pada citra. inImage = imread..Citra nama jalantrainingsu.jpg; Gambar 4.11 Hasil Cropping Citra Jalan Menteri Supeno Gambar 4.11 merupakan citra hasil cropping pada Gambar 4.10 untuk mendapatkan suku kata su yang akan disimpan sebagai database template. Setelah di-crop maka ukuran citra aksara su adalah 330 x 223 pixels. Setelah proses cropping, maka dari citra berwarna akan diubah menjadi citra abu-abu. Fungsi untuk mengubah citra berwarna menjadi citra abu-abu atau grayscale menggunakan fungsi rgb2gray pada Matlab. inImage = imread..Citra nama jalantrainingsu.jpg; im_gray = rgb2grayinImage; imshowim_gray; Gambar 4.12 Citra Abu-Abu Aksara Su Gambar 4.12 merupakan representasi dari citra keabuan yang diperoleh dengan mengubah Gambar 4.1. Hal tersebut dapat dibuktikan dengan nilai variabel im_gray yang sebelumnya nilai variabel B adalah 330x223x3 uint8 menjadi 330x223 uint8 yang menandakan citra tersebut terdiri dari 1 komponen warna. Tahap selanjutnya adalah mengubah citra abu-abu menjadi citra biner. Fungsi untuk mengubah citra abu-abu menjadi citra biner atau citra hitam- putih menggunakan fungsi im2bw pada Matlab. inImage = imread..Citra nama jalantrainingsu.jpg; im_gray = rgb2grayinImage; im_bw = im2bwim_gray; imshowim_bw; Gambar 4.13 Citra Biner Aksara Su Gambar 4.13 merupakan representasi dari citra biner yang diperoleh dengan mengubah citra abu-abu pada Gambar 4.12. Hal tersebut dapat dibuktikan dengan nilai variabel im_gray adalah 330x223 uint8 menjadi 330x223 logical yang artinya citra tersebut terdiri dari nilai 1 dan 0. Nilai 1 merepresentasikan warna putih sedangkan nilai 0 merepresentasikan warna hitam. Setelah diperoleh citra hitam-putih maka tahap selanjutnya adalah membuang background yang tidak perlu agar citra yang diperoleh benar- benar tepat pada aksaranya saja sekaligus proses resizing citra supaya berukuran 100 x 110 pixels. Setelah proses resizing lalu tahap feature extraction menggunakan metode ICZ-ZCZ. Langkah ini merupakan proses yang sama ketika melakukan segmentasi terhadap citra data uji. Di dalam pembuatan template database ini, data yang disimpan bukanlah objek citranya namun feature dari objek citra yang diperoleh dari proses ekstraksi ciri menggunakan metode ICZ-ZCZ yang menghasilkan 8 features. Delapan features tersebut yang akan disimpan beserta labelnya pada database. inImage = imread..Citra nama jalantrainingsu.jpg; im_gray = rgb2grayinImage; im_bw = im2bwim_gray; row = sizeim_bw,1; [v_line] = verProjim_bw; im_vline = imcropim_bw,[v_line1 1 v_line2-v_line1 row]; [h_line] = horzProjim_vline; if lengthh_line == 4 ... elseif lengthh_line == 6 ... else im_hline = imcropim_vline, [1 h_line1 v_line2- v_line1 h_line2-h_line1]; end aksara = imresizeim_hline, [100 110]; imshowaksara; feature = feature_extractionaksara; db_aksara{17,1} = feature; db_aksara{17,2} = su; Script diatas merupakan cara untuk menyimpan suatu data template ke dalam database template. Variabel inImage merupakan data citra template kemudian setelah melaui proses binarization maka akan dikenai proyeksi vertikal dan proteksi horizontal untuk mendapatkan objek aksaranya dan membuang bagian background yang tidak dibutuhkan. Selanjutnya diekstraksi cirinya dan disimpan nilai ciri tersebut ke database template bernama db_aksara. db_aksara{17,1} = feature menunjukkan bahwa nilai feature citra tersebut disimpan pada baris ke 17 kolom 1 sedangkan db_aksara{17,2} = su menunjukkan bawah data pada baris ke 17 memiliki label su yang disimpan pada kolom ke 2. Dengan jumlah citra yang diperoleh untuk pembuatan template database terkadang tidak semua mencakup berbagai kombinasi aksara dalam literasi aksara Jawa sehingga perlu dibuat sebuah kombinasi aksara dengan menggabungkan aksara legena, sandhangan maupun pasangan yang diambil dari data template yang ada. Proses ini diperlukan untuk melengkapi beberapa suku kata yang dapat dibentuk dengan semua kata dasar yang berjumlah 20 aksara. Sebagai contoh, Gambar 4.10 merupakan citra Jalan Menteri Supeno, dalam database kita simpan aksara pe dan konsonan n akan tetapi dari semua data training data template belum ada aksara ne dan konsonan m sehingga kita bisa mengkombinasikan aksara na dengan pepet pada aksara pa supaya membentuk kata ne dan kombinasi aksara ma yang diberi pangkon supaya membentuk konsonan m sehingga semua aksara asli dengan pepet dan pangkon menjadi lengkap. Proses untuk membuat tambahan kombinasi aksara tersebut dilakukan menggunakan aplikasi Photoshop.  + = dibaca “ne”  + = dibaca “m” Gambar 4.14 Pembuatan Kombinasi Aksara untuk Template Database Gambar 4.14 merupakan proses pembuatan kombinasi aksara Jawa untuk melengkapi beberapa aksara yang tidak termuat dalam citra data template. Adapun isi dari template database yang berisi nilai feature beserta labelnya adalah sebagai berikut: Gambar 4.15 Feature Database dari Template beserta Label Gambar 4.15 merupakan isi dari template database yang berisikan nilai features beserta labelnya. Jumlah seluruh data template adalah 100 data yang disimpan dalam variabel db_aksara.

4.5 Classification

Setelah melalui tahapan ekstraksi ciri maka kita mendapatkan nilai feature dari data testing dan pada data template training. Nilai feature dari data uji tersebut akan dihitung jaraknya terhadap semua template database. Proses perhitungan jarak ini menggunakan euclidean distance, seperti pada persamaan 2.7. Sebagai contoh, pada Gambar 4.8 merupakan citra hasil preprocessing untuk citra nama Jalan Pajeksan. Masing-masing objek dari citra tersebut akan diekstrak cirinya kemudian akan dilakukan proses perhitungan jarak dengan setiap data template. function [ transliteration ] = syllable_recognizer im_bw ... feature = feature_extractionaksara; db_size = sizedb_aksara,1; temp = db_aksara{1,1} - feature; min_dist = sqrttemp temp; ... Jika kita menjalankan fungsi syllable_recognizer dengan parameter citra biner Jalan Pajeksan maka yang pertama, kita bisa mengetahui nilai feature dari setiap objek, yaitu terdiri dari 8 objek citra seperti pada Gambar 4.9. Berdasarkan Gambar 4.9, kita akan menghitung nilai jarak feature objek pertama, yaitu [52.2161 37.5422 33.1642 46.7865 33.4379 34.5602 29.9238 28.8033] terhadap db_aksara{1,1} yang artinya feature pada template pada baris dan kolom ke 1. Gambar 4.16 Nilai Feature pada Template Pertama Gambar 4.16 merupakan data template pertama yang berisi nilai feature dari objek aksara ga. Nilai feature tersebut akan dibandingkan dengan data uji untuk dihitung seberapa besar jarak antar keduanya. Proses penghitungan jarak menggunakan euclidean distance seperti pada Persamaan 2.7. = [ . − . . − . . − . . − . . − . . − . . − . . − . ] = [ . . − . − . . . . − . ] = √ ∗ ′ = √ . = .