Analisis Accurate Learning Pada Learning Vector Quantization (LVQ) Menggunakan Algoritma Genetika Dalam Pengenalan Pola Alfanumerik

4

BAB 2
LANDASAN TEORI

2.1. Accurate Learning
Training sample diasumsikan sebagai distribusi dari testing sampel termasuk
distribusi dari data baru (unclassifies sample) yang ingin diduga kelas labelnya. Untuk
mendapat akurasi yang baik saat mengklasifikasi testing data, training set harus
merepresentasikan keadaan data tes . Jika tidak, maka akurasi biasanya rendah.
(Figliola, 2011).
Dari proses pengenalan pola jaringan syaraf tiruan Learning Vector
Quantization (LVQ) menggunakan algoritma genetika, dapat dianalisa dengan
persamaan berikut :
% ������� =

�� ℎ ���� ���� �������� �����
�� ℎ ���� ���� �����

× 100% ………………………………..(2.1)


2.2. Learning Vector Quantization (LVQ)
Salah satu metode dari jaringan syaraf tiruan adalah Learning vector quantization
(LVQ) yang mana digunakan untuk klasifikasi pengenalan pola. Masing-masing
output mewakili kelas tertentu atau kategori. Beberapa unit output harus digunakan
untuk masing-masing kelas. Bobot vektor untuk unit output sering disebut sebagai
vektor referensi (codebook) yang mana untuk mewakili unit kelas kategori. Selama
pelatihan, unit ouput diposisikan dengan mngatur bobot mereka melalui spelatihan
diawasi (supervised training). Setelah pelatihan, jaringan LVQ mengklasifikasikan
vektor masukan dengan menetapkan ke kelas yang sama sebagai unit output yang
memiliki vektor bobot (vektor referensi) terdekatnya untuk vektor input. (Fausett,
1993).

Universitas Sumatera Utara

5

2.2.1. Arsitektur Jaringan
Pada dasarnya, arsitektur jaringan syaraf tiruan LVQ sama seperti arsitektur jaringan
Kohenen – Self Organizing Map (SOM), tanpa struktur topologi yang diasumsikan
untuk unit output). Selain itu, setiap unit output mewakili kelas yang diwakilinya.


...

Yl

Ym

w1m

w1j

wnj

wnl
wil

...

Yj


wim

wil

wnm

w1l

X1

...

Xi

...

Xn

Gambar 2.1. Arsitektur Jaringan Learning Vector Quantization (LVQ)
(Fausett, 1993)


2.2.2. Algoritma Learning Vector Quantization (LVQ)
Algoritma jaringan LVQ adalah untuk menentukan unit output yang paling dekat
dengan vektor input. Sehingga, jika vektor input dan vektor bobot memiliki kelas yang
sama, maka bobot baru akan menjadi vektor input yang selanjutnya. Tetapi jika vektor
input dan vektor bobot memiliki kelas yang berbeda, maka perubahan bobot baru
dikurang dengan bobot yang lama. Adapun tahap-tahap algoritma adalah sebagai
berikut :
1. Tetapkan vektor bobot (w), iterasi maksimum (epoch maksimum), error
minimum (eps) dan learning rate (α).
2. Jika kondisi berhenti False, lakukan tahap 3 – 7.
3. Untuk masing-masing vektor input x, lakukan tahap 4 – 6.
4. Hitung nilai J, yang mana �� − �� � = minimum (terkecil).
5. Hitung perubahan �� sebagai berikut

Jika T = J, maka �� (��� ) = �� (��� ) + ��� − �� (��� ) �;

(2.2)

(2.3)


Universitas Sumatera Utara

6

Jika T ≠ J, maka �� (��� ) = �� (��� ) − ��� − �� (��� ) �.

(2.4)

6. Kurangi nilai learning rate (α).

7. Pengujian berhenti, kondisi ini dapat menentukan jumlah tetap iterasi, yaitu
eksekusi tahap – 1 atau learning rate (α) mencapai nilai yang cukup kecil.

Keterangan :
x

= vektor training (�1 , … , �� , … , �� )

T = target atau kelas target


�� = vektor bobot untuk unit ouput ke – j ��1� , … , ��� , … , ��� �

J

= kategori atau kelas yang diperoleh dari unit output ke – j

�� − �� � = jarak Euclidean antara vektor input dan vektor bobot untuk
unit output ke – j.

2.3. Algoritma Genetika
Salah satu algoritma pencarian (searching algorithm) adalah algoritma genetika yang
mana berdasarkan pada mekanisme seleksi alam dan genetika (Goldberg, 1989).
Algoritma genetika merupakan adalah algoritma perncarian (search algorithm)
stokastik yang berdasarkan pada evolusi biologi. Secara umum, algoritma genetika
mengelola suatu populasi yang dibangkitkan secara random dan solusi dibangkitkan
sesudah tahapan konsekutif dari proses, selection, crossover dan mutasi. Untuk
menyelesaikan suatu permasalahan, setiap individu dari populasi memiliki nilai yang
dibentuk ke dalam suatu nilai fitness. (Cagnoni et al, 2007).
Urutan langkah-langkah algoritma genetika direpresentasikan berdasarkan

prosedur kromosom buatan, seleksi alami, dan teknik ini dikenal sebagai crossover
dan mutasi. Satu individu terdiri dari beberapa kromosom, dan kromosom terdiri dari
sejumlah ‘gen’, dan setiap gen nilainya dapat berupa bilangan numeric, biner, symbol
ataupun tergantung dari permasalahan yang ingin diselesaikan. (Negnevitsky, 2005).
Tahapan proses dari algoritma genetika secara umum diperlihatkan pada
Gambar 2.2. Kromosom direpresentasi dari solusi, yang mana operator genetika
terdiri dari crossover dan mutasi, dilakukan bersamaan atau hanya salah satu saja.
Evolusi yaitu proses seleksi kromosom dari parent (generasi induk) dan offspring
(generasi turunan) untuk membentuk generasi berikutnya (new population).

Universitas Sumatera Utara

7

Diharapkan akan lebih baik dalam memperkirakan solusi yang optimum, selanjutnya
proses iterasi dilakukan yang mana disesuaikan dengan jumlah generasi yang
ditetapkan.
Crossover
Kromosom (Parent)


1100101010

1100101010

1011101110

1011101110
Input
0011011001
1100101110

1100110001

1011101010

Mutasi
Seleksi

0011011001


1. Dilakukan secara acak pada
semua kromosom

0011001001

2. Dihitung nilai fitness, sehingga
finess diperoleh fitness yang
lebih baik dari sebelumnya

Evaluasi
Populasi Baru
1100101110
1011101010
0011001001
1100110001
Decoding
Solusi

Hitung Fitness


Gambar 2.2. Proses Algoritma Genetika
(Gen & Cheng, 1997)

Universitas Sumatera Utara

8

2.3.1. Struktur Algoritma Genetika
Nilai parameter algoritma genetika menduplikasi cara reproduksi genetika,
pembentukan kromosom baru, proses migrasi gen, serta seleksi, sehingga terbentuk
generasi baru yang diharapkan.
Start

Inisialisasi
populasi awal

Hitung
fitness

Seleksi


Crossover

Mutasi

Populasi
baru

Fitness optimal ?

No

Yes
End

Gambar 2.3. Struktur Umum Algoritma Genetika
(Goldberg, 1989)

Algoritma genetika dilakukan dengan meng-inisialisasi populasi secara
random yang mana sesuai dengan jumlah kromosom per populasi yang diinginkan.
Selanjutnya,perhitungan nilai fitness, seleksi dengan menggunakan metode roulette
wheel, tournament atau ranking. Setelah itu, dilakukan persilangan (crossover) dan
mutasi, selanjutnya proses ini berhenti sebanyak generasi yang diinginkan. Untuk

Universitas Sumatera Utara

9

membedakan prosedur pencarian atau optimasi yang lain, maka perlu diketahui
karakterstik berikut (Goldberg, 1989) :
1. Bekerja dengan pengkodean dari himpunan solusi permasalahan.
2. Pencarian populasi merupakan solusi permasalahan bukan hanya dari satu
individu.
3. Informasi dari fungsi objektif untuk mengevaluasi individu yang mempunyai
solusi terbaik, tetapi bukan turunan dari satu fungsi saja.
Aturan-aturan yang digunakan yaitu transisi peluang.

2.3.2. Operator Algoritma Genetika
Untuk menghindari konvergensi prematur yang mana solusi optimum belum
waktunya, solusi yang diperoleh adalah hasil local optima. Sehingga ada operator
algoritma genetika yang perlu diperhatikan, yaitu: (Goldberg, 1989).
1. Populasi, ukuran tergantung masalah yang akan diselesaikan. Jika masalah
lebih kompleks, diperlukan ukuran populasi yang lebih besar, untuk
menghasilkan lokal optima dan mencegah.
2. Probabilitas crossover (�� ), Setiap generasi, sebanyak �� × �, individu dalam

populasi mengalami pindah silang. Makin besar nilai �� , maka makin cepat

struktur individu baru diperkenalkan ke dalam populasi. Jika nilai �� diberikan

terlalu besar, individu merupakan solusi terbaik yang dapat hilang lebih cepat

dibanding seleksi untuk peningkatan kerja. Sebaliknya nilai �� yang rendah
dapat mengakibatkan stagnasi karena rendahnya angka eksplorasi.

3. Probabilitas mutasi ( �� ), setiap posisi bit string dalam populasi baru

mengalami perubahan secara acak setelah proses seleksi. Dalam satu generasi
panjang struktur (L), kemungkinan terjadi mutasi sebanyak �� × � × �.

4. Kriteria terminasi, berakhirnya spesifikasi kondisi pencarian solusi.

Universitas Sumatera Utara

10

2.3.3. Pengenalan Pola (Pattern Recognition)
Pengenalan pola (pattern recognition) adalah proses klasifikasi dari suatu objek atau
pola menjadi beberapa kategori atau kelas, yang mana bertujuan untuk memberikan
informasi. Pola merupakan bentuk atau model yang dapat dipakai untuk membuat atau
menghasilkan suatu bagian dari sesuatu yang ingin dikenal.
Pengenalan pola dapat dilakukan secara sintkas, statistik, dan jaringan syaraf
tiruan. Pengenalan pola yang dilakukan secara sintaks dengan menggunakan aturanaturan tertentu. Pengenalan pola yang dilakukan secara statistik yaitu menggunakan
data-data dari statistik, seperti pasar saham, curah hujan, dan lain-lain. Sedangkan
pengenalan pola dengan menggunakan jaringan syaraf tiruan, yangitu dengan
menggabungkan pengenalan pola statistic dan sintaks, dimana cara kerja jaringan
syaraf tiruan meniru cara kerja otak manusia. Pada pola ini, dasar untuk pengambilan
keputusan digunakan data statistik yang mana membuat rule-rule tertentu. Media
pengenalan pola bias berupa citra digital, audio, video, pola matriks biner, dan lainlain.

2.4. Penelitian-pelenelitian Terkait
2.4.1. Penelitian Terdahulu
Emnida (2014), dengan mengkombinasikan LVQ dan self organizing Kohonen
terdapat peningkatan kecepatan komputasi pelatihan dalam pengenelan pola tanda
tangan. Kombinasi LVQ dan self organizing Kohonen, yaitu membentuk bobot vektor
yang nantinya dimasukkan kembali ke dalam vektor bobot pada LVQ.
Blachnik dan Duch (2011), pada LVQ algorithm with instance weighting for
generation of prototype-based rules, dengan memanfaatkan parameter fungsi
pelatihan pada metode LVQ dapat membentukan prototipe berdasarkan modifikasi
aturan pada logika fuzzy.
Munjal (2011), pada ANN paradigms for Audio Recognition, dengan
membandingkan tiga metode jaringan syaraf tiruan Learning Vector Quantization
(LVQ), Multilayer Perceptron dan Self Organized Map (SOM), dimana metode klasik
LVQ memberikan hasil akurasi kurang baik dibandingkan metode MLP, tetapi metode
LVQ akan menjadi lebih baik jika pemilihan jumlah hidden layer dikombinasikan
dengan metode lain.

Universitas Sumatera Utara

11

Basu et al (2010), pada Use of Artificial Neural Network in Pattern Network,
meskipun ada beberapa kelebihan dan kekurangan pada penerapan kecerdasan buatan
dalam pengenalan pola, selalu diperoleh hasil yang lebih baik dari pada tanpa
menggunakan jaringan syaraf tiruan.
Chen et al (2006), pada An Approach to Seafloor Classification with GA-Based
Neural Network. Dengan mengklasifikasikan komponen-komponen dasar laut sebagai
objek penelitian dengan menggunakan pendekatan algoritma genetika berdasarkan
jaringan syaraf tiruan Learning Vector Quantization (LVQ), dengan memasukkan
parameter-parameter algoritma genetika yaitu selection, crossover dan mutasi ke
dalam pelatihan jaringan LVQ, diperoleh hasil yang cepat dan akurat dalam
mengklasifikasi komponen-komponen dasar laut. Salah satu titik kelemahan LVQ
adalah sensitifitas inisialisasi, yang berpengaruh terhadap akurasi klasifikasi dasar
laut, sehingga algoritma genetika digunakan untuk mengoptimasi nilai inisialisasi
LVQ. Pendeketan algoritma genetika ini diterapkan ke dalam pengklasifikasian
komponen-komponen dasar laut dengan menggunakan Multibeam Echo Sounder
(MBES) .
Adapun beberapa penelitian-penelitian yang telah dilakukan oleh peneliti yang
lain dapat dilihat pada Tabel 2.1.

Tabel 2.1.

Perbedaan penelitian yang dilakukan oleh peneliti yang lain

No
1

Nama Peneliti
Md. Mijanur
Rahman, Tania
Akter Setu
(2015)

Metode yang Digunakan
Hasil Penelitian
Algoritma genetika,
Meningkatkan akurasi pada
jaringan syaraf tiruan
perhitungan bobot jaringan
backpropagation
syaraf tiruan
backpropagation

2

Aijia Ouyang,
Kenli Li, Xu Zhou,
Yuming Xu1,
Guangxue Yue and
Lizhi Tan
(2014)

Learning Vector
Quantization (LVQ),
Linear Discriminant
Analysis (LDA)

Memperbaiki akurasi
pengenalan pola LVQ
dengan menggunakan LDA

Universitas Sumatera Utara

12

Tabel 2.1.

Perbedaan penelitian yang dilakukan oleh peneliti yang lain
(Lanjutan)

No
3

Nama Peneliti
Eminta Br Ginting,
Prof
Dr M Zarlis, Dr
Zakarias Situmorang
(2014)

4

Gilang Ananggadip,
Achmad Hidayatno,
dan Ajub Ajulian
Zahra
(2014)
Saeed Balochian,
Emad Abbasi
Seidabad and Saman
Zahiri Rad
(2013)
Geetika Munjal
(2011)

5

6

7

Marcin Blachnik,
Włodzisław Duch
(2011)

8

Jayanta Kumar Basu,
Debnath
Bhattacharyya, Taihoon Kim
(2010)
Okko Johannes
Räsänen, Unto
Kalervo Laine, and
Toomas Altosaar
(2009)
Yongqi CHEN,
Xinghua ZHOU,
Yongting WU, and
Qinhua TANG
(2006)

9

10

Metode yang Digunakan
Hasil Penelitian
Self Organizing Map
Mengkombinasikan jaringan
(SOM), Learning Vector
syaraf tiruan LVQ dengan
Quantization (LVQ)
SOM untuk meningkatkan
akurasi pengenalan pola
tanda tangan menggunakan
citra digital
Learning Vector
Membandingkan LVQ dan
Quantization (LVQ),
tujuh moment invariant
tujuh moment invariant
Hu
Algoritama genetika,
Multilayer Perceptron
(MLP)

Optimasi perhitungan bobot
pada jaringan syaraf tiruan
Multi Layer Perceptron
(MLP)

Learning Vector
Quantization (LVQ), Self
Organizing Map (SOM),
dan Multi Layer
Perceptron (MLP)
Learning Vector
Quantization (LVQ),
Fuzzy Logic

Membandingkan metode
LVQ, SOM, dan MLP pada
pengenalan pola audio

Multi Layer Perceptron
(MLP)

Learning Vector
Quantization (LVQ), Self
Organizing Map (SOM)

Algoritma genetika,
Learning Vector
Quantization (LVQ)

Menganalisa akurasi
pembelajaran jaringan
syaraf tiruan LVQ dengan
mengkombinasikan fuzzy
logic
Analisa pengenalan pola
dengan menggunakan
jaringan syaraf tiruan Multi
Layer Perceptron (MLP)
Mengkombinasikan LVQ
dengan SOM untuk
meningkatkan akurasi
pembelajaran pada
pengenalan pola suara
Menggunakan parameter
algoritama genetika untuk
meningkatkan performa
LVQ pada klasifikasi dasar
laut

Universitas Sumatera Utara

13

2.4.2. Perbedaan Penelitian
Pada penelitian ini, penulis akan menganalisis akurasi pembelajaran jaringan Learning
Vector Quantization (LVQ) dengan menggunakan algoritma genetika pada
pengenalan pola alfanumerik, yang mana teknik crossover yang digunakan
menggunakan teknik seleksi roulette wheel dan crossover point to point.

Universitas Sumatera Utara