21
BAB III METODOLOGI PENELITIAN
Bab ini berisi penjelasan danproses pengolahan data yang akan digunakan dalam penelitian ini, serta perancangan sistem yang meliputi proses ekstraksi ciri,
pelatihan dan pengujian arsitektur JST, lalu pengenalandan uji data,rincian kebutuhan sistem danjuga perancangan antarmuka sistem.
3.1 Data
Dalam pengenalan pola aksara Batak Karo ini digunakan 21 huruf aksara tulisan tangan Batak Karo yang dimiliki oleh 8 orang yang berbeda.
Data yang diperoleh sebelumnya dengan mengisi kolom yang telah disediakan.
7,2 cm
2,7 cm
Gambar 3.1 Kolom Isi Responden
Setiap tipe tulisan tangan terdiri dari 168 gambar yang akan dijadikan sebagai data. Tipe tulisan tangan yang akan digunakan dalam pengenalan
pola ditunjukan pada gambar 3.2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 3.2 aksara Karo Tulisan Tangan
3.2 Perancangan Sistem
Sub bab ini berisi tentang perancangan sistem dari aplikasi yang akan dibuat.Proses dimulai dari preprossesing, ekstraksi ciri data aksara,
kemudian data hasil ekstraksi ciri masuk kedalam pelatihan arsitektur JST dengan parameter-parameter yang telah ditentukan, sehingga diperoleh
model jaringan yang menghasilkan akurasi terbaik, kemudian dilakukan uji pada sebuah data aksara baru yang juga telah diekstraksi ciri dan dilakukan
klasifikasi menggunakan modeljaringan yang telah diperoleh. Pada proses ekstraksi cirri data sebelum pelatihan arsitektur jaringan
dan pengujian data,digunakan fitur
Mark Direction dan Intencity of Characther IoC
. Untuk proses pelatihan arsitektur jaringan dan klasifikasi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
data dalam pengujian digunakan metode Jaringan Syaraf Tiruan
Back Propagation
. Berikut ini gambaran sistem secara keseluruhan:
Data
Preprocessing
JST Back
Propagation Ekstraksi Ciri
Data Uji
Kombinasi Ciri Optimal
Pengenalan
Hasil Pengenalan
Gambar 3.3Diagram Blok Sistem
3.2.1 Prepossesing
Dalam proses preprosessing ini meliputi beberapa tahap yaitu: 1.
Mengubah Citra Warna. Dalam pemrosesan ini dimaksudkan untuk mengubah Citra
Warna RGB, dilanjutkan dari citra keabuan mengubah menjadi Citra Hitam Putih Biner.
Gambar 3.4 citra keabuan diubah RGB menjadi citra hitam putih IM2BW
2. Pengubahan Ukuran
Resize
Citra Dalam proses
resize
citra dilakukan secara otomatis yakni, membaca seluruh citra gambar dan kemudian secara otomatis
menemukan citra terpanjang dan terlebar, setelah ditemukan maka ukuran tersebut dijadikan sebagai referensi untuk
resize
gambar. Dari referensi yang ditemukan ukuran citra pada aksara ini 245 x
1350, namun itu membuat ukuran gambar tidak proposional, maka ukuran di
resize
menjadi 600 x 600.
3. Penipisan Citra
Pada proses ini penipisan citra
Thining
menggunakan fungsi
Rosenfeld
Widiarti, 2011. Thining dilakukan untuk mengubah ukuran ketebalan citra menjadi kecil.
Gambar 3.5Citra setelah di thining PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4. Ekstraksi Ciri
Pada penelitian ini ekstraksi ciri menggunakan algoritma
Mark Direction
dan
Intencity of Character IoC
Nugroho, 2016.
MarkDirection
yaitu menghitung banyaknya piksel yang memiliki tetangga berarah horizontal, vertical, diagonal ke kiri,
dan diagonal ke kanan.
MarkDirection
ini digunakan untuk menghitung banyaknya piksel yang memenuhi masking
horizontal, vertical, diagonal kiri, dan diagonal kanan, sedangkan
Intencity of Character
itu sendiri digunakan untuk menghitung nilai piksel 0 berwarna hitam pada citra. Dalam
melakukan proses ekstraksi ciri dilakukan dengan beberapa tahap, meliputi:
a. Membagi citra menjadi 9 segmen 3x3 segmen
b. Mencirikan citra pada tiap segmen menggunakan Mark
Direction untuk menghitung berapa yang memenuhi masking horizontal horz, vertical vert, diagonal ke
kiri dig1, diagonal ke kanan dig2. c.
Mencirikan citra pada tiap segmen menggunakan Intencity of Character untuk menghitung nilai piksel
hitam black.
Gambar 3.6Citra di bagi menjadi 9 segmen PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Untuk memperoleh jaringan yang optimal terlebih dahulu kita mengetahui ekstraksi ciri yang optimal pula. Dalam hal ini penelitian
melakukan kombinasi ciri
feature
untuk dapat meghasilkan ekstraksi ciri yang memberikan hasil akurasi terbaik.
3.2.2 Pelatihan dan Pengujian Arsitektur JST
Dalam penelitian ini, proses pengenalan pola aksara Batak Karo dilakukan dengan mengklasifikasikan
feature
yang telah ditentukan. Metode yang digunakan dalam prosespengenalanadalah metode
Jaringan Syaraf Tiruan
Back Propagation.
Metode pengenalan ini dipilih karena kemampuannya untuk menghasilkan
decision boundaries
yang kompleks pada fitur-fitur yang ada. Hasil ini dapat dilihat dengan nilai keakuratan yang dihasilkan dari pengujian sampel
diluar kumpulan sampel yang digunakan pada saat pelatihan. Metode pembagian data pelatihan dan pengujian arsitektur JST
yang digunakan adalah
4-Fold Cross Validation
. Metode ini dipakai karena menggunakan data yang berbeda untuk proses pelatihan dan
pengujiannya, sehingga dapat diketahui dengan benar akurasi sistem yang telah dibuat. Hasil ekstraksi ciri dan label data, akan digunakan
sebagai
input-
an dalam proses pelatihan dan pengujian arsitektur JST. Hasil dari proses ini adalah model jaringan dengan akurasi terbaik,
yang akan digunakan dalam proses pengenalan. Pada proses awal sesuai dengan metode
K-Fold Cross Validation
, data yang berjumlah 168 dibagi menjadi 4 bagian.Dari 4 bagian tersebut akan dilakukan 4 kali percobaan dalam proses
pelatihan dan pengujian arsitektur JST. Berikut ini tabel penggunaan bagian dalam setiap percobaan:
Tabel 3.14
-F old Cross Validation
Percobaan Training Testing 1
1,2 3,4
2 1,3
2,4 3
1,4 2,3
4 3,4
1,2
Ada 2 jenis arsitektur jaringan syaraf tiruan yang digunakan untuk proses pelatihan dan pengujian, yaitu arsitektur dengan satu
hidden layer
dan dua
hidden layer.
1. Arsitektur Jaringan Syaraf Tiruan 1
Hidden Layer
Diambil contoh dengan ciri 8 maka jumlah data
input
sebanyak 45 atribut, kemudian digunakan 1
hidden layer,
dengan jumlah
neuron
pada
hidden layer 1
sebanyak j, dan jumlah
output
sebanyak 21.
Gambar 3.7Arsitektur JST 1 Hidden Layer
X1
X2
X3
X45 Z1
Z2
Z3
Zj Y1
Y2
Y3
Y21
Vij Wij
Input Hidden Layer 1
Output
2. Arsitektur Jaringan Syaraf Tiruan 2
Hidden Layer
Diambil contoh dengan ciri 8 maka jumlah data
input
sebanyak 45 atribut, kemudian digunakan 2
hidden layer,
dengan jumlah
neuron
pada
hidden layer 2
sebanyak j, dan jumlah
output
sebanyak 21.
Gambar 3.8Arsitektur JST 2 Hidden Layer
Berikut ini rincian parameter dalam arsitektur jaringan syaraf tiruan:
1. Lapisan jaringan terdiri dari 4 lapis, yaitu satu lapis masukan
input,
2 lapis tersembunyi
hidden layer
dan satu lapis keluaran
output
. 2.
Untuk
input
dimana Xi adalah jaringan terdiri dari 1
– i
neuron,
dimana i merupakan jumlah total data hasil ekstraksi ciri yang telah ditentukan. Berikut tabel jumlah data yang digunakan:
X1 X2
X3
X45 Z1
Z2
Z3
Zj Z1
Z2
Z3
Zj Y1
Y2
Y3
Y21
Vij Vij
Wij
Hidden Layer 1 Hidden Layer 2
Input Output
Tabel 3.2Jumlah Data
Input
Arsitektur Jaringan Kombinasi Feature
Feature Kombinasi Feature
Jumlah Data Feature
1 [Black]
9 2
[dig1] 9
3 [dig2]
9 4
[Black + dig1] 9 + 9 =18
5 [Black + dig2]
9 + 9 = 18 6
[horz + vert] 9 + 9 = 18
7 [dig1 + dig2]
9 + 9 = 18 8
[Black + dig1 + dig2, + horz + vert]
9 + 18 + 18= 45
3. Untuk mendapatkan arsitektur jaringan yang optimal, digunakan 2
jenis arsitektur jaringan yaitu dengan 1
hidden layer
dan 2
hidden
layer, dimana lapisan tersembunyi pertama dan kedua memiliki jumlah
neuron
yang bervariasi mulai dari 10,15,… dilanjutkan dengan kelipatan 5 hingga 45. Namun apabila pada
neuron
45 nilai akurasi masih tinggi, maka dilanjutkan dengan kelipatan 5
selanjutnya hingga hasil akurasinya turun. Contoh: 10,15,20,…45 4.
Fungsi aktivasi yang digunakan adalah
sigmoid biner logsig.
5. Fungsi pelatihan yang digunakan adalah
trainrp.
6. Batas iterasi
epoch
adalah 500. 7.
Nilai laju pemahaman =
learning rate
adalah 0, 2. 8.
Jumlah
neuron
pada lapisan keluaran
output
adalah 21, sesuai dengan jumlah target aksara
9. Memiliki 21
neuron output
yang merupakan target keluaran jaringan diantaranya,
target 1: BA 1,0,0….0, target 2: TA 0,1,0..target 3 : DA 0,0,1,
…0, ……, target 21: CA 0,0,0…1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Dalam pengujianarsitektur JST, dilakukan beberapa kali percobaan untuk mendapatkan model jaringan terbaik berdasarkan
akurasi hasil yang tertinggi. Percobaan dilakukan dengan mengambil sejumlah data hasil ekstraksi ciri berdasarkan kombinasi ciri yang ada
pada tabel 3.2 sebagai data masukan. Untuk setiap kombinasi ciri, dilakukan percobaan lagi dengan mengubah-ubah jumlah lapisan
tersembunyi, yaitu satu lapisan tersembunyi dan 2 lapisan tersembunyi. Pada satu lapisan tersembunyi, jumlah
neuron
divariasi mulai dari 10, 15 hingga 45 dengan penambahan jumlah kelipatan 5,
contohnya 10,15,20….,45.Dari percobaan tersebut diperoleh jumlah
neuron
dengan akurasi tertinggi. Jumlah
neuron
dengan akurasi tertinggi di lapisan tersembunyi ke-1 kemudian digunakan dalam 2
lapisan tersembunyi. Jumlah
neuron
di lapisan tersembunyi ke-2 divariasi sama seperti di lapisan tersembunyi ke-1 hingga memperoleh
akurasi tertingginya. Dari semua percobaan tersebut akan diperoleh model jaringan terbaik berdasarkan akurasi yang tertinggi.
3.2.3 Uji Data Tunggal
Model jaringan yang telah didapat dari proses pelatihan dan pengujian arsitektur JST akan digunakan dalam proses pengenalandari
data masukan data baru untuk diuji. Proses dimulai dari memasukan data aksara baru untuk diuji,
kemudian dilakukan kombinasi ekstraksi ciri pada data tersebut dan diambil sejumlah data sesuai jumlah pilihan ciri terbaik yang telah
diperoleh. Hasil ekstraksi ciri tersebut disimulasikan kedalam model jaringan terbaik yang telah diperoleh, sehingga mendapatkan nilai
keluaran sesuai target keluaran yang telah ditentukan, untuk menunjukkan hasil pengenalan pola. Berikut ini gambaran proses
pengenalan dan uji data. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Data Uji Ekstraksi Ciri
Model Jaringan Hasil Pengenalan
Gambar 3.9 Proses Pengenalan dan Uji Data Tunggal
3.2.3.1 Perhitungan Akurasi
Karena menggunakan metode 4 – Fold dalam pembagian data,
maka dilakukan percobaan 4 kali percobaan training dan testing. Hasil dari percobaan berupa confusion matrix. Confusion Matrix
menunjukkan data yang dikenali sesuai kelompok data ciri. Contoh
Confusion Matrix
dapat dilihat dalam tabel sebagai berikut: Dari confusion matrix dihitung besar akurasi. Perhitungan
akurasi dilakukan untuk melihat jaringan syaraf tiruan yang optimal
BackPropagation
dalam mengenali sistem pola tulisan tangan aksara Batak Karo.
Akurasi
=
� ℎ
� ℎ
ℎ
Data Benar = Jumlah angka pada diagonal matrik Seluruh data = total data yang digunakan untuk
training testing
3.3 Kebutuhan Sistem
Aplikasi ini membutuhkan perangkat keras dan lunak dalam proses perancangannya sehingga mendapatkan hasil yang maksimal.
1. Kebutuhan Perangkat
Aplikasi ini membutuhkan perangkat keras dan lunak dengan : 1.
Scanner 2.
Microsoft Windows 7 3.
Matlab R2012b Spesifikasi tersebut dipilih agar aplikasi berjalan dengan maksimal.
Scaner digunakan untuk menyecan data aksara dikarenakan tidak ada data berupa cetak. Microsoft Windows 7 digunakan sebagai sistem
operasi agar kedua perangkat lunak lainnya dapat berjalan. Matlab R2012b digunakan untuk membuat sistem sekaligus menjalankan sistem.
3.4 Perancangan Antarmuka Sistem
Gambar 3.10 Tampilan Antarmuka Sistem Pada gambar 3.10 merupakan tampilan antarmuka sistem yang terdiri
dari 1 menu sesuai dengan fungsi dari sistem yang akan dibuat. Menu mulai digunakan sebagai langkah awal pertama dalam menjalankan sistem.
Gambar 3.11 Tampilan Antarmuka Sistem PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Pada gambar 3.11 merupakan tampilan antarmuka sistem yang terdiri dari 2 panel sesuai dengan fungsi dari sistem yang akan dibuat. Berikut ini
rincian untuk setiap panel tersebut: 1.
Pelatihan Panel ini termasuk dalam data kombinasi ekstraksi ciri. Pada
panel ini terdapat beberapa komponen diantaranya: a.
Button Group -
berfungsi untuk memilih data kombinasi ciri b.
Edit Text Hidden Layer
1 – berfungsi untuk memasukan jumlah
neuron
pada lapisan tersembunyi ke-1. c.
Edit Text Hidden Layer
2 - berfungsi untuk memasukan jumlah
neuron
pada lapisan tersembunyi ke-2. d.
Edit Text Epoch
– berfungsi untuk memasukan batas jumlah iterasi
epoch
dalam proses pelatihan arsitektur jaringan, dengan nilai
default
yaitu 500. e.
Tombol Proses – berfungsi untuk menjalankan proses pelatihan arsitektur jaringan.
f.
Text
Akurasi – berfungsi untuk menampilkan hasil perhitungan
akurasi sistem . 2.
Pengujian Panel ini berisi komponen yang dapat berfungsi untuk mengambil
data uji, kemudian melakukan pengenalan data berdasarkan model jaringan yang telah diperoleh dan menampilkan hasil huruf aksara.
a.
Edit Text
Direktori file – berfungsi untuk menampilkan alamat
direktori dari data yang akan diuji. b.
Tombol Proses Kenal – berfungsi untuk membuka jendela pencarian direktori data aksara yang akan diuji.
c. Axes Citra – berfungsi untuk menampikan citra aksara yang diuji
d.
Text
Hasil kenal – berfungsi untuk menampilkan hasil pengenalan
data aksara yang diuji. e.
Tombol Proses – berfungsi untuk menjalankan proses pengenalan aksara.
34
3 BAB IV
IMPLEMENTASI DAN ANALISIS HASIL
Bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari implementasi sistem yang telah dibuat. Hasil penelitian berupa perbandingan
akurasi yang diperoleh dari percobaan metode
Back Propagation
berdasarkan jumla
hidden layer
serta jumlah node pada setiap
hidden layer
yang digunakan. Pada bab ini juga dibahas mengenai
user interface
yang dibangun berdasar algoritma yang telah dirancang.
4.1 Implementasi Sistem