21
BAB III METODOLOGI PENELITIAN
Bab ini berisi penjelasan danproses pengolahan data yang akan digunakan dalam penelitian ini, serta perancangan sistem yang meliputi proses ekstraksi ciri,
pelatihan dan pengujian arsitektur JST, lalu pengenalandan uji data,rincian kebutuhan sistem danjuga perancangan antarmuka sistem.
3.1 Data
Dalam pengenalan pola aksara Batak Karo ini digunakan 21 huruf aksara tulisan tangan Batak Karo yang dimiliki oleh 8 orang yang berbeda.
Data yang diperoleh sebelumnya dengan mengisi kolom yang telah disediakan.
7,2 cm
2,7 cm
Gambar 3.1 Kolom Isi Responden
Setiap tipe tulisan tangan terdiri dari 168 gambar yang akan dijadikan sebagai data. Tipe tulisan tangan yang akan digunakan dalam pengenalan
pola ditunjukan pada gambar 3.2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 3.2 aksara Karo Tulisan Tangan
3.2 Perancangan Sistem
Sub bab ini berisi tentang perancangan sistem dari aplikasi yang akan dibuat.Proses dimulai dari preprossesing, ekstraksi ciri data aksara,
kemudian data hasil ekstraksi ciri masuk kedalam pelatihan arsitektur JST dengan parameter-parameter yang telah ditentukan, sehingga diperoleh
model jaringan yang menghasilkan akurasi terbaik, kemudian dilakukan uji pada sebuah data aksara baru yang juga telah diekstraksi ciri dan dilakukan
klasifikasi menggunakan modeljaringan yang telah diperoleh. Pada proses ekstraksi cirri data sebelum pelatihan arsitektur jaringan
dan pengujian data,digunakan fitur Mark Direction dan Intencity of Characther IoC. Untuk proses pelatihan arsitektur jaringan dan klasifikasi
data dalam pengujian digunakan metode Jaringan Syaraf Tiruan Back Propagation. Berikut ini gambaran sistem secara keseluruhan:
Data
Preprocessing
JST Back
Propagation Ekstraksi Ciri
Data Uji
Kombinasi Ciri Optimal
Pengenalan
Hasil Pengenalan
Gambar 3.3Diagram Blok Sistem
3.2.1 Prepossesing
Dalam proses preprosessing ini meliputi beberapa tahap yaitu: 1.
Mengubah Citra Warna. Dalam pemrosesan ini dimaksudkan untuk mengubah Citra
Warna RGB, dilanjutkan dari citra keabuan mengubah menjadi Citra Hitam Putih Biner.
Gambar 3.4 citra keabuan diubah RGB menjadi citra hitam putih IM2BW
2. Pengubahan Ukuran Resize Citra
Dalam proses resize citra dilakukan secara otomatis yakni, membaca seluruh citra gambar dan kemudian secara otomatis
menemukan citra terpanjang dan terlebar, setelah ditemukan maka ukuran tersebut dijadikan sebagai referensi untuk resize gambar.
Dari referensi yang ditemukan ukuran citra pada aksara ini 245 x 1350, namun itu membuat ukuran gambar tidak proposional,
maka ukuran di resize menjadi 600 x 600.
3. Penipisan Citra
Pada proses ini penipisan citra Thining menggunakan fungsi RosenfeldWidiarti, 2011. Thining dilakukan untuk
mengubah ukuran ketebalan citra menjadi kecil.
Gambar 3.5Citra setelah di thining PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4. Ekstraksi Ciri
Pada penelitian ini ekstraksi ciri menggunakan algoritma Mark Direction dan Intencity of Character IoCNugroho,
2016. MarkDirectionyaitu menghitung banyaknya piksel yang memiliki tetangga berarah horizontal, vertical, diagonal ke kiri,
dan diagonal ke kanan. MarkDirection ini digunakan untuk menghitung banyaknya piksel yang memenuhi masking
horizontal, vertical, diagonal kiri, dan diagonal kanan, sedangkan Intencity of Character itu sendiri digunakan untuk
menghitung nilai piksel 0 berwarna hitam pada citra. Dalam melakukan proses ekstraksi ciri dilakukan dengan beberapa
tahap, meliputi: a.
Membagi citra menjadi 9 segmen 3x3 segmen b.
Mencirikan citra pada tiap segmen menggunakan Mark Direction untuk menghitung berapa yang memenuhi
masking horizontal horz, vertical vert, diagonal ke kiri dig1, diagonal ke kanan dig2.
c. Mencirikan citra pada tiap segmen menggunakan
Intencity of Character untuk menghitung nilai piksel hitam black.
Gambar 3.6Citra di bagi menjadi 9 segmen PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Untuk memperoleh jaringan yang optimal terlebih dahulu kita mengetahui ekstraksi ciri yang optimal pula. Dalam hal ini penelitian
melakukan kombinasi ciri feature untuk dapat meghasilkan ekstraksi ciri yang memberikan hasil akurasi terbaik.
3.2.2 Pelatihan dan Pengujian Arsitektur JST
Dalam penelitian ini, proses pengenalan pola aksara Batak Karo dilakukan dengan mengklasifikasikan feature yang telah ditentukan.
Metode yang digunakan dalam prosespengenalanadalah metode Jaringan Syaraf Tiruan Back Propagation. Metode pengenalan ini
dipilih karena kemampuannya untuk menghasilkan decision boundaries yang kompleks pada fitur-fitur yang ada. Hasil ini dapat
dilihat dengan nilai keakuratan yang dihasilkan dari pengujian sampel diluar kumpulan sampel yang digunakan pada saat pelatihan.
Metode pembagian data pelatihan dan pengujian arsitektur JST yang digunakan adalah 4-Fold Cross Validation. Metode ini dipakai
karena menggunakan data yang berbeda untuk proses pelatihan dan pengujiannya, sehingga dapat diketahui dengan benar akurasi sistem
yang telah dibuat. Hasil ekstraksi ciri dan label data, akan digunakan sebagai input-an dalam proses pelatihan dan pengujian arsitektur JST.
Hasil dari proses ini adalah model jaringan dengan akurasi terbaik, yang akan digunakan dalam proses pengenalan.
Pada proses awal sesuai dengan metode K-Fold Cross Validation, data yang berjumlah 168 dibagi menjadi 4 bagian.Dari 4
bagian tersebut akan dilakukan 4 kali percobaan dalam proses pelatihan dan pengujian arsitektur JST. Berikut ini tabel penggunaan
bagian dalam setiap percobaan: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 3.14-Fold Cross Validation
Percobaan Training Testing 1
1,2 3,4
2 1,3
2,4 3
1,4 2,3
4 3,4
1,2
Ada 2 jenis arsitektur jaringan syaraf tiruan yang digunakan untuk proses pelatihan dan pengujian, yaitu arsitektur dengan satu
hidden layer dan dua hidden layer. 1.
Arsitektur Jaringan Syaraf Tiruan 1 Hidden Layer Diambil contoh dengan ciri 8 maka jumlah data input sebanyak
45 atribut, kemudian digunakan 1 hidden layer, dengan jumlah neuron pada hidden layer 1 sebanyak j, dan jumlah output
sebanyak 21.
Gambar 3.7Arsitektur JST 1 Hidden Layer
X1
X2
X3
X45 Z1
Z2
Z3
Zj Y1
Y2
Y3
Y21
Vij Wij
Input Hidden Layer 1
Output
2. Arsitektur Jaringan Syaraf Tiruan 2 Hidden Layer
Diambil contoh dengan ciri 8 maka jumlah data input sebanyak 45 atribut, kemudian digunakan 2 hidden layer, dengan jumlah
neuron pada hidden layer 2sebanyak j, dan jumlah output sebanyak 21.
Gambar 3.8Arsitektur JST 2 Hidden Layer
Berikut ini rincian parameter dalam arsitektur jaringan syaraf tiruan:
1. Lapisan jaringan terdiri dari 4 lapis, yaitu satu lapis masukan
input, 2 lapis tersembunyi hidden layer dan satu lapis keluaran output.
2. Untuk input dimana Xi adalah jaringan terdiri dari 1 – ineuron,
dimana i merupakan jumlah total data hasil ekstraksi ciri yang telah ditentukan. Berikut tabel jumlah data yang digunakan:
X1 X2
X3
X45 Z1
Z2
Z3
Zj Z1
Z2
Z3
Zj Y1
Y2
Y3
Y21
Vij Vij
Wij
Hidden Layer 1 Hidden Layer 2
Input Output
Tabel 3.2Jumlah Data Input Arsitektur Jaringan Kombinasi Feature
Feature Kombinasi Feature
Jumlah Data Feature
1 [Black]
9 2
[dig1] 9
3 [dig2]
9 4
[Black + dig1] 9 + 9 =18
5 [Black + dig2]
9 + 9 = 18 6
[horz + vert] 9 + 9 = 18
7 [dig1 + dig2]
9 + 9 = 18 8
[Black + dig1 + dig2, + horz + vert]
9 + 18 + 18= 45
3. Untuk mendapatkan arsitektur jaringan yang optimal, digunakan 2
jenis arsitektur jaringan yaitu dengan 1 hidden layer dan 2 hidden layer, dimana lapisan tersembunyi pertama dan kedua memiliki
jumlah neuron yang bervariasi mulai dari 10,15,… dilanjutkan
dengan kelipatan 5 hingga 45. Namun apabila pada neuron 45 nilai akurasi masih tinggi, maka dilanjutkan dengan kelipatan 5
selanjutnya hingga hasil akurasinya turun. Contoh: 10,15,20,…45 4.
Fungsi aktivasi yang digunakan adalah sigmoid biner logsig. 5.
Fungsi pelatihan yang digunakan adalah trainrp. 6.
Batas iterasiepoch adalah 500. 7.
Nilai laju pemahaman =learning rate adalah 0, 2.
8. Jumlah neuron pada lapisan keluaran output adalah 21, sesuai
dengan jumlah target aksara 9.
Memiliki 21neuron output yang merupakan target keluaran jaringan diantaranya,
target 1: BA 1,0,0….0, target 2: TA 0,1,0..target 3 : DA 0,0,1,
…0, ……, target 21: CA 0,0,0…1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Dalam pengujianarsitektur JST, dilakukan beberapa kali percobaan untuk mendapatkan model jaringan terbaik berdasarkan
akurasi hasil yang tertinggi. Percobaan dilakukan dengan mengambil sejumlah data hasil ekstraksi ciri berdasarkan kombinasi ciri yang ada
pada tabel 3.2 sebagai data masukan. Untuk setiap kombinasi ciri, dilakukan percobaan lagi dengan mengubah-ubah jumlah lapisan
tersembunyi, yaitu satu lapisan tersembunyi dan 2 lapisan tersembunyi. Pada satu lapisan tersembunyi, jumlah neuron divariasi
mulai dari 10, 15 hingga 45 dengan penambahan jumlah kelipatan 5, contohnya
10,15,20….,45.Dari percobaan tersebut diperoleh jumlah neuron dengan akurasi tertinggi. Jumlah neuron dengan akurasi
tertinggi di lapisan tersembunyi ke-1 kemudian digunakan dalam 2 lapisan tersembunyi. Jumlah neuron di lapisan tersembunyi ke-2
divariasi sama seperti di lapisan tersembunyi ke-1 hingga memperoleh akurasi tertingginya. Dari semua percobaan tersebut akan diperoleh
model jaringan terbaik berdasarkan akurasi yang tertinggi.
3.2.3 Uji Data Tunggal
Model jaringan yang telah didapat dari proses pelatihan dan pengujian arsitektur JST akan digunakan dalam proses pengenalandari
data masukan data baru untuk diuji. Proses dimulai dari memasukan data aksara baru untuk diuji,
kemudian dilakukan kombinasi ekstraksi ciri pada data tersebut dan diambil sejumlah data sesuai jumlah pilihan ciri terbaik yang telah
diperoleh. Hasil ekstraksi ciri tersebut disimulasikan kedalam model jaringan terbaik yang telah diperoleh, sehingga mendapatkan nilai
keluaran sesuai target keluaran yang telah ditentukan, untuk menunjukkan hasil pengenalan pola. Berikut ini gambaran proses
pengenalan dan uji data. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Data Uji Ekstraksi Ciri
Model Jaringan Hasil Pengenalan
Gambar 3.9 Proses Pengenalan dan Uji Data Tunggal
3.2.3.1 Perhitungan Akurasi
Karena menggunakan metode 4 – Fold dalam pembagian data,
maka dilakukan percobaan 4 kali percobaan training dan testing. Hasil dari percobaan berupa confusion matrix. Confusion Matrix
menunjukkan data yang dikenali sesuai kelompok data ciri. Contoh Confusion Matrix dapat dilihat dalam tabel sebagai berikut:
Dari confusion matrix dihitung besar akurasi. Perhitungan akurasi dilakukan untuk melihat jaringan syaraf tiruan yang optimal
BackPropagation dalam mengenali sistem pola tulisan tangan aksara Batak Karo.
Akurasi =
� ℎ
� ℎ
ℎ
Data Benar = Jumlah angka pada diagonal matrik Seluruh data = total data yang digunakan untuk training testing
3.3 Kebutuhan Sistem
Aplikasi ini membutuhkan perangkat keras dan lunak dalam proses perancangannya sehingga mendapatkan hasil yang maksimal.
1. Kebutuhan Perangkat
Aplikasi ini membutuhkan perangkat keras dan lunak dengan : 1.
Scanner 2.
Microsoft Windows 7 3.
Matlab R2012b Spesifikasi tersebut dipilih agar aplikasi berjalan dengan maksimal.
Scaner digunakan untuk menyecan data aksara dikarenakan tidak ada data berupa cetak. Microsoft Windows 7 digunakan sebagai sistem
operasi agar kedua perangkat lunak lainnya dapat berjalan. Matlab R2012b digunakan untuk membuat sistem sekaligus menjalankan sistem.
3.4 Perancangan Antarmuka Sistem
Gambar 3.10 Tampilan Antarmuka Sistem Pada gambar 3.10 merupakan tampilan antarmuka sistem yang terdiri
dari 1 menu sesuai dengan fungsi dari sistem yang akan dibuat. Menu mulai digunakan sebagai langkah awal pertama dalam menjalankan sistem.
Gambar 3.11 Tampilan Antarmuka Sistem PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Pada gambar 3.11 merupakan tampilan antarmuka sistem yang terdiri dari 2 panel sesuai dengan fungsi dari sistem yang akan dibuat. Berikut ini
rincian untuk setiap panel tersebut: 1.
Pelatihan Panel ini termasuk dalam data kombinasi ekstraksi ciri. Pada
panel ini terdapat beberapa komponen diantaranya: a.
Button Group - berfungsi untuk memilih data kombinasi ciri b.
Edit Text Hidden Layer 1 – berfungsi untuk memasukan jumlah neuron pada lapisan tersembunyi ke-1.
c. Edit Text Hidden Layer 2 - berfungsi untuk memasukan jumlah
neuron pada lapisan tersembunyi ke-2. d.
Edit Text Epoch – berfungsi untuk memasukan batas jumlah iterasiepoch dalam proses pelatihan arsitektur jaringan, dengan
nilai default yaitu 500. e.
Tombol Proses – berfungsi untuk menjalankan proses pelatihan arsitektur jaringan.
f. Text Akurasi – berfungsi untuk menampilkan hasil perhitungan
akurasi sistem . 2.
Pengujian Panel ini berisi komponen yang dapat berfungsi untuk mengambil
data uji, kemudian melakukan pengenalan data berdasarkan model jaringan yang telah diperoleh dan menampilkan hasil huruf aksara.
a. Edit Text Direktori file – berfungsi untuk menampilkan alamat
direktori dari data yang akan diuji. b.
Tombol Proses Kenal – berfungsi untuk membuka jendela pencarian direktori data aksara yang akan diuji.
c. Axes Citra – berfungsi untuk menampikan citra aksara yang diuji
d. Text Hasil kenal – berfungsi untuk menampilkan hasil pengenalan
data aksara yang diuji. e.
Tombol Proses – berfungsi untuk menjalankan proses pengenalan aksara.
34
3 BAB IV
IMPLEMENTASI DAN ANALISIS HASIL
Bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari implementasi sistem yang telah dibuat. Hasil penelitian berupa perbandingan
akurasi yang diperoleh dari percobaan metode Back Propagation berdasarkan jumla hidden layer serta jumlah node pada setiap hidden layer yang digunakan.
Pada bab ini juga dibahas mengenai user interface yang dibangun berdasar algoritma yang telah dirancang.
4.1 Implementasi Sistem