Analisis kinerja metode entropy dalam penentuan bobot awal learning vector quantization pada proses klasifikasi Chapter III V

BAB 3
METODOLOGI PENELITIAN

Bab ini menjelaskan tahapan-tahapan yang dilakukan dalam penelitian, mulai dari
dataset yang digunakan dalam melatih dan menguji LVQ, arsitektur jaringan pada
LVQ dengan menggunakan Entropy sebagai penentuan vektor bobot awalnya, dan
contoh dari perhitungan penelitian.

3.1. Tahapan Penelitian
Tahapan penelitian ditunjukkan pada Gambar 3.1 di bawah ini :
Dataset yang
digunakan

Rancangan
Arsitektur
JST LVQ

Normalisasi dan
Pembobotan dengan
Entropy


Training &
Testing JST
LVQ

Analisis
Akurasi

Gambar 3.1 Tahapan Penelitian

3.2. Dataset yang Digunakan
Pada penelitian ini digunakan dataset (kumpulan data) yang berasal dari UCI Machine
Learning Repository yaitu dataset breast cancer. Dataset ini terdiri dari 699 jumlah

Universitas Sumatera Utara

13

data pasien, dengan klasifikasi 458 (65,5%) pasien kanker jinak dan 241 (34,5%)
pasien kanker ganas. Pada dataset tersebut terdapat satu atribut sebagai kode pasien, 9
kriteria/atribut yang masing-masing atribut memiliki skala data dari 1-10 dan satu

atribut lagi sebagai output dari kesembilan kriteria sebelumnya yaitu klasfikasi
sebagai tumor jinak atau ganas. Namun dataset ini memiliki nilai yang hilang (missing
value) beberapa atribut dan akan diganti dengan metode median yaitu dengan mencari
nilai tengah, metode ini adalah metode yang paling baik untuk kasus dataset tersebut
(Nurul et al, 2012). Adapun atribut/kriteria dan nilai dari dataset breast cancer dapat
dilihat pada Tabel 3.1
Tabel 3.1 Atribut Data
No.

Atribut/Kriteria

Nilai

1

Sample code number

Kode Pasien

2


Clump Thickness (X1)

1 sampai 10

3

Uniformity of Cell Size (X2)

1 sampai 10

4

Uniformity of Cell Shape (X3)

1 sampai 10

5

Marginal Adhesion (X4)


1 sampai 10

6

Single Epithelial Cell Size (X5)

1 sampai 10

7

Bare Nuclei (X6)

1 sampai 10

8

Bland Chromatin (X7)

1 sampai 10


9

Normal Nucleoli (X8)

1 sampai 10

10

Mitoses (X9)

1 sampai 10

11

Class (target)

kanker jinak,
kanker ganas


Dataset pasien dipisah sesuai target kelas untuk masuk ke dalam proses
perhitungan Entropy untuk menentukan vektor bobot terbaik yang dijadikan
perwakilan setiap kelasnya. Adapun contoh dataset breast cancer ditunjukkan pada
Tabel 3.2 , Tabel 3.3 dan Tabel 3.4.
Tabel 3.2 Dataset Kelas Kanker Jinak
Atribut/Kriteria
No.

Kode Pasien
X1

X2

X3

X4

X5

X6


X7

X8

X9

1

1000025

5

1

1

1

2


1

3

1

1

2

1002945

5

4

4

5


7

10

3

2

1

3

1015425

3

1

1


1

2

2

3

1

1

4

1016277

6

8


8

1

3

4

3

7

1

Universitas Sumatera Utara

14

Tabel 3.3 Dataset Kelas Kanker Jinak (lanjutan)
Atribut/Kriteria
No.

Kode Pasien
X1

X2

X3

X4

X5

X6

X7

X8

X9

5

1017023

4

1

1

3

2

1

3

1

1

6

1018099

1

1

1

1

2

10

3

1

1

7

1018561

2

1

2

1

2

1

3

1

1

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

458

841769

2

1

1

1

2

1

1

1

1

Tabel 3.4 Dataset Kelas Kanker Ganas
Atribut/Kriteria
No.

Kode Pasien
X1

X2

X3

X4

X5

X6

X7

X8

X9

1

1017122

8

10

10

8

7

10

9

7

1

2

1041801

5

3

3

3

2

2

4

4

1

3

1044572

8

7

5

10

7

9

5

5

4

4

1047630

7

4

6

4

6

1

4

3

1

5

1050670

10

7

7

6

4

10

4

1

2

6

1054590

7

3

2

10

5

10

5

4

4

7

1054593

10

5

5

3

6

7

7

10

1

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

4

8

8

5

4

5

10

4

1

.

.

.

.

.

.

241

887471

3.3. Perancangan Arsitektur JST LVQ
Arsitektur JST LVQ yang dibangun (lihat Gambar 3.2) memiliki satu lapisan input dan
satu lapisan output dengan parameter sebagai berikut.
1.

Jumlah Node pada Lapisan Input (Input Layer)
Lapisan input merupakan lapisan yang akan menempatkan data input yang
nantinya akan diproses sebagai pembelajaran. Pada dataset sebelumnya terdapat
11 atribut namun yang digunakan sebagai node pada lapisan input hanya 9 atribut

Universitas Sumatera Utara

15

yaitu atribut ke-2 sampai ke-10, karena kesembilan atribut tersebut merupakan
kriteria-kriteria yang dapat menentukan output dari klasifikasi. Sedangkan atribut
ke-1 hanya sebagai inisial kode dari setiap pasien.
2.

Jumlah Node pada Lapisan Output (Output Layer)
Lapisan output pada LVQ merupakan lapisan untuk memproses data input yang
kemudian mencari jarak antara data input dan bobot awal secara kompetitif yang
kemudian dijadikan sebagai output untuk menentukan pada kelas mana data input
tersebut berada. Jumlah node pada lapisan output terdiri dari 2 node karena
didapat dari target dataset yang dihasilkan memiliki 2 kelas yang berbeda yaitu
kanker jinak dan kanker ganas. Untuk arsitektur JST pada penelitian ini
ditunjukkan pada Gambar 3.2.
X1
X2
X3

║x - w1║

Kanker
Jinak

║x – w2║

Kanker
Ganas

X4
X5
X6
X7
X8
X9

Gambar 3.2 Arsitektur JST LVQ
Selanjutnya dalam penentuan parameter-parameter pada JST yaitu nilai laju
pembelajaran (learning rate), penururan tingkat pembelajaran (decrease rate), dan
maksimum iterasi (epoch). Untuk learning rate (α), jika nilai terlalu besar, amak
algoritma akan menjadi tidak stabil, sebaliknya jika terlalu besar makan proses nya
akan terlalu lama, oleh karena itu nilai learning rate haruslah 0 < α < 1 (Safwandi,

Universitas Sumatera Utara

16

2016). Pada penelitian tesis ini, penentuan konstanta learning rate mengacu pada
penelitian sebelumnya, dimana penelitian tersebut menggunakan dataset yang sama
pada penilitian tesis ini. Peneliti sebelumnya mendapatkan parameter yang memiliki
hasil terbaik dalam klasifikasi breast cancer menggunakan JST LVQ standar, yaitu 0,1
untuk learning rate dan 0,3 untuk penurunan tingkat pembelarajan (Nurdiyanto,
2015).

3.4. Penentuan Bobot Awal menggunakan Metode Entropy
Pada proses penentuan vektor bobot awal dengan metode Entropy dilakukan dengan
dua cara yaitu :
1. Penentunan vektor bobot awal langsung dihasilkan dari perhitungan
menggunakan Entropy dari dataset pasien dalam setiap kelasnya. Alur dalam
penentuan bobot awal dengan cara pertama dapat dilihat pada Gambar.3.3.
Start

Nilai Data
Pasien setiap
Kelas

A

Normalisasi Nilai Setiap
Atribut

Hitung Entropy Setiap
Atribut

Jumlahkan Nilai yang Telah
Dinormalisasikan Setiap
Atribut

Hitung Total Entropy

Hitung Konstanta
Entropy

Hitung Bobot Entropy
Setiap Atribut

A

Stop

Gambar 3.3 Penentuan Bobot Awal Cara Pertama
Berikut contoh perhitungan penentuan bobot awal menggunakan Entropy cara
pertama dengan dataset pasien kanker jinak yang ditampilkan pada Tabel 3.5.

Universitas Sumatera Utara

17

Tabel 3.5 Contoh Dataset Entropy Cara Pertama
Atribut/Kriteria
No.

Kode Pasien
X1

X2

X3

X4

X5

X6

X7

X8

X9

1

1000025

5

1

1

1

2

1

3

1

1

2

1002945

5

4

4

5

7

10

3

2

1

3

1015425

3

1

1

1

2

2

3

1

1

4

1016277

6

8

8

1

3

4

3

7

1

5

1017023

4

1

1

3

2

1

3

1

1

6

1018099

1

1

1

1

2

10

3

1

1

7

1018561

2

1

2

1

2

1

3

1

1

8

1033078

2

1

1

1

2

1

1

1

5

a. Normalisasi Nilai Setiap Atribut Xi
Hasil normalisasi dari Tabel 3.5 dapat dilihat pada Tabel 3.6.
Tabel 3.6 Contoh Normalisasi Entropy Cara Pertama
Atribut/Kriteria
Kode Pasien
X1

X2

X3

X4

X5

X6

X7

X8

X9

1000025

0,8333

0,1250

0,1250

0,2000

0,2857

0,1000

1,0000

0,1429

0,2000

1002945

0,8333

0,5000

0,500

1,0000

1,0000

1,0000

1,0000

0,2857

0,2000

1015425

0,5000

0,1250

0,1250

0,2000

0,2857

0,2000

1,0000

0,1429

0,2000

1016277

1,0000

1,0000

1,0000

0,2000

0,4286

0,4000

1,0000

1,000

0,2000

1017023

0,6667

0,1250

0,1250

0,6000

0,2857

0,1000

1,0000

0,1429

0,2000

1018099

0,1667

0,1250

0,1250

0,2000

0,2857

1,0000

1,0000

0,1429

0,2000

1018561

0,3333

0,1250

0,2500

0,2000

0.2857

0,1000

1,0000

0,1429

0,2000

1033078

0,3333

0,1250

0,1250

0,2000

0,2857

0,1000

0,3333

0,1429

0,2000

b. Perhitungan Entropy untuk setiap kriteria ke-i

=

=


Universitas Sumatera Utara

18

Dengan :


, maka :

c. Perhitungan Bobot Entropy untuk setiap kriteria ke-i
̅

maka didapatkan :

̅

]

[



̅

̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅

d. Dataset pasien breast cancer memiliki nilai range dari 1 hingga 10 maka
bobot Entropy dikalikan 10, maka vektor bobot yang dihasilkan dapat
dilihat pada Tabel 3.7
Tabel 3.7 Contoh Vektor Bobot Entropy Cara Pertama
Atribut

X1

X2

X3

X4

X5

X6

X7

X8

X9

Bobot

0,4986

1,7396

1,5499

1,0347

0,5592

1,8347

0,1531

1,5355

1,0947

2. Perkalian bobot Entropy dengan dataset pasien sehingga didapatkan data
pasien mana yang memiliki nilai tertinggi pada setiap kelasnya itu akan
dijadikan vektor bobot awal. Alur dalam penentuan bobot awal cara kedua ini
dapat ditunjukkan pada Gambar 3.4

Universitas Sumatera Utara

19

Start

Nilai Data
Pasien setiap
Kelas

A

Normalisasi Nilai Setiap
Atribut

Hitung Total Entropy

Jumlahkan Nilai yang Telah
Dinormalisasikan Setiap
Atribut

Hitung Bobot Entropy
Setiap Atribut

Hitung Konstanta
Entropy

Perkalian Bobot Entropy
dengan Setiap Data Pasien

Hitung Entropy Setiap
Atribut

Vektor Bobot Terbaik
setiap Kelas

A

Stop

Gambar 3.4 Penentuan Bobot Awal Cara Kedua
Berikut contoh perhitungan penentuan bobot awal menggunakan Entropy cara
pertama dengan beberapa dataset pasien kanker ganas yang dilihat pada Tabel
3.8.
Tabel 3.8 Contoh Dataset Entropy Cara Kedua
Atribut/Kriteria
No.

Kode Pasien
X1

X2

X3

X4

X5

X6

X7

X8

X9

1

1017122

8

10

10

8

7

10

9

7

1

2

1041801

5

3

3

3

2

2

4

4

1

3

1044572

8

7

5

10

7

9

5

5

4

4

1047630

7

4

6

4

6

1

4

3

1

5

1050670

10

7

7

6

4

10

4

1

2

6

1054590

7

3

2

10

5

10

5

4

4

7

1054593

10

5

5

3

6

7

7

10

1

8

887471

4

8

8

5

4

5

10

4

1

a. Normalisasi Nilai Setiap Atribut Xi
Hasil normalisasi dari Tabel 3.5 dapat dilihat pada Tabel 3.9.

Universitas Sumatera Utara

20

Tabel 3.9 Contoh Normalisasi Entropy Cara Kedua
Atribut/Kriteria
Kode Pasien
X1

X2

X3

X4

X5

X6

X7

X8

X9

1017122

0,8000

1,0000

1,0000

0,8000

1,0000

1,0000

1,0000

0,7000

0,2500

1041801

0,5000

0,3000

0,3000

0,3000

0,2857

0,3000

0,4444

0,4000

0,2500

1044572

0,8000

0,7000

0,5000

1,0000

1,0000

0,9000

0,5556

0,5000

1,0000

1047630

0,7000

0,4000

0,6000

0,4000

0,8571

0,1000

0,4444

0,3000

0,2500

1050670

1,0000

0,7000

0,7000

0,6000

0,5714

1,0000

0,4444

0,1000

0,5000

1054590

0,7000

0,3000

0,2000

1,0000

0,7143

1,0000

0,5556

0,4000

1,0000

1054593

1,0000

0,5000

0,5000

0,3000

0,8571

0,7000

0,7778

0,1000

0,2500

887471

0,8000

0,4000

0,5000

0,1000

0,2857

0,3000

0,7778

0,3000

0,2500

b. Perhitungan Entropy untuk setiap kriteria ke-i

=

=


Dengan :


, maka :

c. Perhitungan Bobot Entropy untuk setiap kriteria ke-i
̅

maka didapatkan :

[

]

̅



̅

̅̅̅
̅̅̅

Universitas Sumatera Utara

21

̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅

d. Bobot Entropy dikalikan dengan nilai dari setiap data pasien

dan

diranking sehingga menghasilkan pasien yang memiliki nilai tertinggi,
maka vektor bobot yang dihasilkan dapat dilihat pada Tabel 3.10.
Tabel 3.10 Contoh Vektor Bobot Entropy Cara Kedua
Atribut

X1

X2

X3

X4

X5

X6

X7

X8

X9

Bobot

8

10

10

8

7

10

9

7

1

Penentuan vektor bobot menggunakan Entropy dan pemilihan data pasien
sebagai vektor bobot tersebut diharapkan dapat menghasilkan proses pembelajaran
dan tingkat akurasi dapat lebih baik dibandingkan LVQ standar.

3.5. Training JST LVQ
Setelah menentukan arsitektur dan penentuan vektor bobot awal pada JST LVQ maka
langkah selanjutnya adalah melakukan proses training dan testing dataset. Training
dataset bertujuan untuk pembelajaran dari setiap masukkan data pasien agar jaringan
mengenali pola masukkan sehingga dapat mengklasifikasikan data pasien sesuai
kelasnya. LVQ akan mengenali pola masukkan berdasarkan pada pendekatan jarak
antara dua vektor yaitu vektor dari unit masukkan dengan vektor bobot. Karena dalam
penelitian ini mengharapkan tingkat pembelajran dan tingkat akurasi yang cepat
makan data yang digunakan pada saat traning akan bervariasi. Hal itu dilakukan untuk
mengetahui cara penentuan vektor bobot awal yang mana akan menghasilkan proses
pembelajaran data yang cepat. Dalam penenlitian ini data yang digunakan untuk
proses traning adalah sebanyak 697 dan 2 data pasien pertama pada kelas yang
berbeda digunakan sebagai vektor bobot pada LVQ standar.
Dalam traninig JST LVQ membutuhkan sejumlah data training. Data training
tersebut diambil dataset pasien breast cancer kemudia digunakan untuk proses

Universitas Sumatera Utara

22

pembelajaran ataupun pengelanan pola dataset. Pada penelitian ini jumlah data pasien
yang akan dilatih bervariasi, yaitu 20, 50, 100, dan 350 data dari 697 dataset pasien.
Dataset training tersebut juga akan dijadikan sebagai data masukan dari proses
perhitungan algoritma JST LVQ. Untuk menentukan data pasien mana yang akan
menjadi data training, maka digunakan metode statistik yaitu standar deviasi. Standar
deviasi sendiri memiliki kemampuan dalam mencari tingkat keberagaman yang baik
pada suatu sekumpulan dataset.






(3.1)

dimana,
s = standar deviasi
n = ukuran sampel
Penentuan jumlah data training sebanyak 20 dilakukan dengan membagi 697
dataset ke dalam 20 data pasien sehingga menghasilkan 35 dataset. Kemudian 35
dataset

tersetbut

yakan

dihitungan

masing-masing

standar

deviasinya

dan

dibandingkan nilai standar deviasi. Dataset yang menghasilkan standar deviasi
tertinggi akan dijadikan perwakilan sebagai data traninng (data masukan). Begitu juga
untuk mencari jumlah data training 50, 100 dan 350. Untuk jumlah data training
sebanyak 50 maka ada 14 dataset yang akan dihitung dan dibandingkan nilai standar
deviasinya. Pada jumlah data training sebanyak 100 maka ada 7 dataset yang akan
dihitung dan dibandingkan nillai standar deviasinya. Begitu juga untuk jumlah data
training 350 maka ada 2 dataset yang akan dihitung dan dibandingkan standar
deviasinya. Penentuan jumlah data training tersebut diharapkan menghasilkan data
training yang memiliki tingkat keberagaman yang tinggi sehingga dapat mewakili
keseluruhan dataset. Flowchart training JST LVQ dapat dilihat pada Gambar 3.5.
Begitu juga untuk jumlah iterasi, pada penelitian ini memilki jumlah data yang
beravariatif yakni sebanayak 5, 10, dan 20 iterasi. Setiap vektor bobot akhir yang
dihasilkan dalam setiap proses pembelajaran data, akan digunakan dalam setiap proses
training pada data selanjutnya hingga akhir iterasi.
Output dari proses training adalah vektor bobot baru yang akan digunakan
dalam perhitungan dalam proses testing. Jadi vektor bobot tersebut bisa dikatakan
dengan sebagai acuan datatset pasien breast cancer.

Universitas Sumatera Utara

23

Start
Data Input (X), Target, dan
Parameter (MaxEpoch, α)

Penetuan Vektor Bobot Awal dengan Entropy

Epoch = 0

Epoch = Epoch + 1

Baca Xi

Hitung Jarak
║Xi - Wj║

Temukan Jarak Terpendek Xi
Tidak
Tidak

Sesuai Target ?

Ya

Wj’ = Wj + α (Xi – Wj)

Tidak

Wj’ = Wj - α (Xi – Wj)

Xi = n
Ya
Mengurangi nilai α = α - Deca atau α = α *
Deca

Epoch ≤ MaxEpoch
atau α ≥ Min α
Ya
Bobot
Akhir
Stop

Gambar 3.5 Flowchart Training JST LVQ

Universitas Sumatera Utara

24

3.6. Testing JST LVQ
Setelah dilakukan pelatatihan terhadap semua data maka akan diperolah vektor bobot
akhir (w). Bobot tersebut selanjutnya akan digunakan untuk melakukan proses
simulasi atau testing data. Data untuk proses testing terdiri dari sisa data pada setiap
jumlah data training. Untuk jumlah data training sebanyak 20 maka jumlah data
testing sebanyak 677 data. Untuk jumlah data training sebanyak 50 maka jumlah data
testing sebanyak 647 data. Untuk jumlah data training sebanyak 100 maka jumlah
data testing sebanyak 597 data. Kemudian untuk jumlah data training sebanyak 350
maka jumlah data testing sebanyak 347. Flowchat testing JST LVQ pada penelitian ini
dapat dilihat pada Gambar 3.6.
Start

Data Input Testing (Xi),
Target, dan Vektor Bobot
Akhir (Wj)

Baca Xi

Hitung Jarak
Xi-Wj

Temukan Jarak Terpendek

Tidak

Ya

Sesuai Target

Kelas Sesuai
Target

Tidak
Kelas Tidak
Sesuai Target

Xi = n Input?
Ya
Jumlah Kelas yang
Dikenali dan Tidak
Dikenali

Stop

Gambar 3.6 Flowchart Testing JST

Universitas Sumatera Utara

25

3.7. Perhitungan Nilai Akurasi
Pada evaluasi penelitian ini, untuk mengentahui seberapa tingkat akurasi
pengklasifikasian pasien breast cancer akan dilakukan dengan cara membandingkan
dengan LVQ standar. Dalam menentukan vektor bobot awalnya diambil dari data
pasien pertama dan kedua sesuai kelasnya tanpa menormalisasikan data, serta learning
rate yaitu 0,1 dan penururan tingkat pembelajaran yaitu 0,3. Kemudian untuk
parameter pengujian nilai dalam penelitian ini akan digunakan parameter seperti pada
Tabel 3.11.
Tabel 3.11 Parameter Pengujian Nilai
Parameter Pengujian

Nilai

Jumlah Iterasi

5,10,20

Jumlah Data Training

20, 50, 100, 350

Proses perhitungan dalam penelitian ini dimulai dari pembagian dataset pasien
ke dalam dua kelas yaitu 457 data pasien kanker jinak sebanyak dan 240 data kanker
ganas. Kedua kelas dataset tersebut selanjutnya diproses menggunakan metode
Entropy untuk menentukan vektor bobot awal pada masing-masing kelas. Pada proses
metode Entropy, dimulai dengan menormalisasikan keseluruhan dataset pada setiap
kelas. Kemudian masuk ke dalam proses perhitungan Entropy untuk setiap
atirbut/kriteria.


Proses Perhitungan Entropy pada Kelas Kanker Jinak
o Perhitungan Entropy untuk setiap kriteria ke-i

=

=


Universitas Sumatera Utara

26

Dengan :


, maka :

o Perhitungan Bobot Entropy untuk setiap kriteria ke-i
̅

]

[

maka didapatkan :

̅



̅

̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅



Proses Perhitungan Entropy pada Kelas Kanker Ganas
o Perhitungan Entropy untuk setiap kriteria ke-i

=

=


Dengan :


, maka :

Universitas Sumatera Utara

27

o Perhitungan Bobot Entropy untuk setiap kriteria ke-i
̅

maka didapatkan :

̅

]

[



̅

̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅̅̅
̅



Perhitungan Penentuan Vektor Bobot Awal dengan Entropy
o Perhitungan Cara Pertama
Nilai Bobot Entropy dikalikan dengan 10 pada setiap atributnya karena nilai
pada setiap dataset breast cancer memiliki range nilai antara 1 sampai 10.
Maka vektor bobot awal yang dihasilkan ditunjukkan pada Tabel 3.12.
Tabel 3.12 Contoh Perhitungan Vektor Bobot Cara Pertama
Kelas

W1

W2

W3

W4

W5

W6

W7

W8

W9

JINAK

1,2920

1,1585

1,2977

1,3003

0,5335

1,6575

0,9206

1,4248

0,4151

GANAS

0,4990

0,7371

0,6389

1,4459

0,8266

0,8327

0,6031

1,4767

2,9501

o Perhitungan Cara Kedua
Bobot Entropy dikalikan dengan nilai dari setiap data pasien dan diranking
sehingga menghasilkan pasien yang memiliki nilai tertinggi. Maka vektor
bobot yang dihasilkan ditunjukkan pada Tabel 3.13.
Tabel 3.13 Contoh Perhitungan Vektor Bobot Cara Kedua
Kelas

W1

W2

W3

W4

W5

W6

W7

W8

W9

JINAK

1

1

1

1

1

1

1

1

1

GANAS

6

10

10

10

10

8

10

4

4

Universitas Sumatera Utara

28



Penentuan Dataset Training menggunakan Standar Deviasi
Dalam contoh ini, jumlah data training yang digunakan sebanyak 20 data dari 697
data pasien dan 2 data pasien pada kelas berbeda digunakan sebagai vektor bobot
awal untuk LVQ biasa. Untuk menentukan data pasien mana yang akan dijadikan
data training maka dilakukan dengan cara perhitungan statistik yaitu perhitungan
standar deviasi. Dengan standar deviasi akan didapatkan data yang mempunyai
keberagaman yang lebih baik. Maka 697 akan dibagi dengan 20 sehingga
menghasilkan 35 dataset . Kemudian 35 dataset tersebut dihitung standar
deviasinya dan nilainya dibandingkan. Dataset yang memiliki nilai standar deviasi
yang tertinggi akan dijadikan dataset dalam proses training. Maka dataset yang
dihasilkan dapat dilihat pada Tabel 3.13.
Tabel 3.13 Data Training 20 Pasien dari Hasil Standar Deviasi



Atribut/Kriteria

No.

Kode
Pasien

X1

X2

X3

X4

X5

X6

X7

X8

X9

Target

1

1216947

1

1

1

1

2

1

3

1

1

2

2

1217051

5

1

1

1

2

1

3

1

1

2

3

1217264

1

1

1

1

2

1

3

1

1

2

4

1218105

5

10

10

9

6

10

7

10

5

4

5

1218741

10

10

9

3

7

5

3

5

1

4

6

1218860

1

1

1

1

1

1

3

1

1

2

7

1218860

1

1

1

1

1

1

3

1

1

2

8

1219406

5

1

1

1

1

1

3

1

1

2

9

1219525

8

10

10

10

5

10

8

10

6

4

10

1219859

8

10

8

8

4

8

7

7

1

4

11

1220330

1

1

1

1

2

1

3

1

1

2

12

1221863

10

10

10

10

7

10

7

10

4

4

13

1222047

10

10

10

10

3

10

10

6

1

4

14

1222936

8

7

8

7

5

5

5

10

2

4

15

1223282

1

1

1

1

2

1

2

1

1

2

16

1223426

1

1

1

1

2

1

3

1

1

2

17

1223793

6

10

7

7

6

4

8

10

2

4

18

1223967

6

1

3

1

2

1

3

1

1

2

19

1224329

1

1

1

2

2

1

3

1

1

2

20

1225799

10

6

4

3

10

10

9

10

1

4

Perhitungan Proses Training pada JST LVQ
Pada proses training dilakukan dengan parameter learning rate sebesar 0,1 dan
penurunan tingkat pembelajarannya sebesar 0,3. Iterasi yang dilakukan sebanyak

Universitas Sumatera Utara

29

10 iterasi(epoch). 20 dataset yang telah ditentukan pada proses sebelumnya akan
digunakan sebagai inputan pada proses training.
o Training pada Entropy Cara Pertama
Iterasi ke-1
Data inputan ke-1 : (1,1,1,1,2,1,3,1,1)
Jarak pada :


Bobot Ke-1 =√
= 3,1993



Bobot Ke-2 =√
= 4,3788

Jarak terkecil didapat pada Bobot Ke-1 dan target data ke-1 = 2, maka data ke1 sesuai dengan target.
Bobot ke-1 baru adalah
W(baru) = W(lama) + α (X – W(lama)) = (1,4628 ; 1,1427 : 1,2679 : 1,2703 ; 0,6802 ;
1,6918 ; 1,1285 ; 1.3823 ; 0.4736)

Data inputan ke-2 : (5,1,1,1,2,1,3,1,1)
Jarak pada :


Bobot Ke-1 =√
= 12,6115



Bobot Ke-2 =√
= 13,8691

Jarak terkecil didapat pada Bobot Ke-1 dan target data ke-1 = 2, maka data ke1 sesuai dengan target.
Bobot ke-1 baru adalah
W(baru) = W(lama) + α (X – W(lama)) = (1, 9165; 1, 8284: 1, 9411: 1, 2433; 0,
9121; 1, 9226; 1, 3157; 1. 9441; 0. 5262)

Proses tersebut diteruskan hingga data ke-20 dan iterasi ke-10, sehingga
menghasilkan bobot ke-1 dan bobot ke-2 yang baru, yaitu

Universitas Sumatera Utara

30

Bobot ke-1 baru : (2,6852 ; 0,9497 ; 0,9648 ; 0,9664 ; 1,7996 ; 1,6832 ; 2,4115
; 0,8536 ; 1,2657)
Bobot ke-2 baru : (6,9302 ; 4,5274 ; 4,4022 ; 6,2760 ; 4,8983 ; 6,4282 ; 4,7865
; 4,2461 ; 2,4632)

o Training pada Entropy Cara Kedua
Proses training dilakukan dengan cara yang sama pada Entropy Cara Pertama.
Dihitung hingga data ke-20 dan epoch ke-10. Sehingga menghasilkan bobot
ke-1 dan bobot ke-2 yang baru, yaitu :
Bobot ke-1 baru : (2,2369; 0,6734; 0,4669; 0,6685; 1,4827; 1, 9035; 2,2541;
0,5663; 1,3718)
Bobot ke-2 baru : (8,3314 ; 6,8984 ; 6,3763 ; 8,5513 ; 6,9803 ; 9,8767 ; 6,7225
; 6,2892 ; 4,2076)

o Training pada LVQ Biasa
Proses training dilakukan dengan cara yang sama pada Entropy Cara Pertama.
Dihitung hingga data ke-20 dan epoch ke-10. Sehingga menghasilkan bobot
ke-1 dan bobot ke-2 yang baru, yaitu :
Bobot ke-1 baru : (2,3430 ; 0,5943 ; 0,3868 ; 0, 6675 ; 1,4976 ; 1,8332 ;
2,3076 ; 0,4978 ; 1,3734)
Bobot ke-2 baru : (8,2117 ; 5,4951 ; 4,9668 ; 7,7992 ; 6,6472 ; 10,1771 ;
5,6753 ; 5,3569 ; 2,2533)


Perhitungan Proses Testing
Proses testing dilakukan dengan sisa jumlah datapasien yang belum diolah yaitu
697 – 20 = 677 data pasien. Proses testing akan mencari berapa banyak data pasien
yang sesuai dengan kelasnya.
o Testing pada Entrpopy Cara Pertama
Data testing ke-1 : (5,4,4,5,7,10,3,2,1)
Jarak pada :


Bobot Ke-1 =√
= 0,9339

Universitas Sumatera Utara

31



Bobot Ke-2 =√
= 11,2074

Jarak terkecil didapat pada Bobot Ke-1 dan target data ke-1 = 2, maka data ke1 sesuai dengan target.
Proses tersebut dilakukan hingga data ke-677, sehingga diperoleh jumlah data
yang sesuai pada kelasnya ada sebanyak 658 data dan yang tidak sesuai
sebanyak 17 data pasien. Maka diperoleh tingkat akurasi pada Entropy cara
Pertama sebesar 660/677 = 97,48 %.
o Testing pada Entropy Cara Kedua
Proses testing dilakukan dengan cara yang sama juga dengan cara Entropy
Pertama. Sehingga meghasilkan jumlah data yang sesuai dengan kelasnya
sebanyak 643 data dan yang tidak sesuai sebanyak 34 data pasien. Maka
diperoleh tingkat akurasi pada Entropy cara Kedua sebesar 643/677 = 94,97 %.
o Testing pada LVQ Standar
Proses testing dilakukan dengan cara yang sama juga dengan cara Entropy
Pertama dan Entropy Kedua. Sehingga meghasilkan jumlah data yang sesuai
dengan kelasnya sebanyak 652 data dan yang tidak sesuai sebanyak 25 data
pasien. Maka diperoleh tingkat akurasi pada Entropy cara Kedua sebesar
652/677 = 96,30 %.

Universitas Sumatera Utara

BAB 4
HASIL DAN PEMBAHASAN

4.1. Pendahuluan
Pada bab ini menjelaskan bagaimana hasil penelitian dan pembahasan dari kinerja
metode Entropy untuk menentukan vektor bobot awal pada LVQ terhadap tingkat
akurasi yang dihasilkan. Vektor bobot awal yang dihasilkan oleh metode Entropy
diharapkan mendapatkan tingkat akurasi yang lebih baik pada proses klasifikasi jika
dibandingkan dengan cara LVQ standar.
Penelitian dilakukan dengan menggunakan daataset pasien breast cancer yang
didapat UCI Machine Learning Repository yang disumbang oleh Rumah Sakit
University of Wisconsin Madison. Dataset yang digunakan sebanyak 699 data pasien
yang terdiri dua kelas yaitu 458 data pasien kanker jinak dan 241 pasien kanker ganas.
Kemudian dataset tersebut dilakukan proses training LVQ untuk mengenali data agar
dapat diuji pada proses testing. Dalam proses pengujian ini, penelitian ini
diimplementasikan menggunakan aplikasi Matlab 6.1 pada sistem operasi Windows 7.

4.2.Vektor bobot Awal yang Dihasilkan
Penentuan vektor bobot awal pada penelitian ini dilakukan dengan tiga cara yaitu hasil
perhitungan bobot dengan metode Entropy, data pasien terbaik dari perhitungan
metode Entropy dan vektor bobot yang diiambil dari data pasien pertama pada setiap
kelasnya.
4.2.1. Perhitungan Bobot dengan Metode Entropy (Entropy Cara Pertama)
Penentuan vektor bobot awal dilakukan dengan menggunakan metode Entropy dari
dataset yang telah terbagi atas dua kelas yang berbeda, yaitu data pasien kanker jinak
dan ganas. Dataset kedua kelas tersebut dipisah dan kemudian diolah sehingga
menghasilkan nilai bobot Entropy. Hasil vektor bobot yang dihasilkan dapat dilihat
pada Tabel 4.1.

Universitas Sumatera Utara

33

Tabel 4.1 Vektor Bobot dengan Entropy Cara Pertama
Kelas

W1

W2

W3

W4

W5

W6

W7

W8

W9

JINAK

1,2920

1,1585

1,2977

1,3003

0,5335

1,6575

0,9206

1,4248

0,4151

GANAS

0,4990

0,7371

0,6389

1,4459

0,8266

0,8327

0,6031

1,4767

2,9501

4.2.2. Data Pasien Terbaik dari Perhitungan Entropy (Entropy Cara Kedua)
Penentuan vektor bobot awal dilakukan dengan perhitungan hasil metode Entropy
dikali dengan dataset pada setiap kelasnya sehingga didapatkan data pasien mana yang
memiliki nilai terbaik yang akan digunakan sebagai vektor bobot awal. Dari hasil
perhitungan diperoleh data dengan nomor pasien 1158247 untuk kelas kanker jinak
dan nomor pasien 877291 untuk kelas kanker ganas. Maka vektor bobot awal yang
dihasilkan dapat dilihat pada Tabel 4.2.
Tabel 4.2 Vektor Bobot dengan Entropy Cara Kedua
Kelas

W1

W2

W3

W4

W5

W6

W7

W8

W9

JINAK

1

1

1

1

1

1

1

1

1

GANAS

6

10

10

10

10

10

8

10

10

4.2.3. LVQ standar
Penentuan vektor bobot awal pada LVQ standar dilakukan dengan mengambil data
pertama dalam dataset pada setiap kelasnya. Maka dari dataset, pasien yang memiliki
nilai pertama adalah nomor pasien 1000025 untuk kelas kanker jinak dan nomor
pasien 1017122 untuk kelas kanker ganas. Maka vektor bobot awal yang dihasilkan
dapat dilihat pada Tabel 4.3.
Tabel 4.3 Vektor Bobot dengan LVQ standar
Kelas

W1

W2

W3

W4

W5

W6

W7

W8

W9

JINAK

5

1

1

1

2

1

3

1

1

GANAS

8

10

10

8

7

10

9

7

1

Universitas Sumatera Utara

34

4.3. Hasil Penelitian
Dalam melakukan pengujian pada penelitian ini dilakukan sebanyak 12 kali pengujian
terhadap tiga vektor yang telah dihasilkan. Ketiga vektor masuk ke dalam proses
training LVQ sehingga menghasilkan bobot yang akan digunakan sebagai pada proses
testing. Proses training dilakukan terhadap parameter varian jumlah data training dan
jumlah iterasi. Untuk menentukan data pasien mana yang akan dijadikan data training
maka dilakukan dengan cara perhitungan statistik yaitu perhitungan standar deviasi.
Dengan standar deviasi akan didapatkan data training yang mempunyai keberagaman
yang lebih baik. Pada proses testing akan dilakukan dengan menggunakan sisa data
pada setiap proses training sehingga menghasilkan berapa persentase tingkat akurasi
dalam pengklasifikasian breast cancer. Dan hasil dari proses testing, akan dilakukan
perbandingan sejauh mana tingkat akurasi yang dihasilkan.
Untuk jumlah data training sebanyak 20 maka jumlah data testing sebanyak
677 data. Untuk jumlah data training sebanyak 50 maka jumlah data testing sebanyak
647 data. Untuk jumlah data training sebanyak 100 maka jumlah data testing
sebanyak 597 data. Kemudian untuk jumlah data training sebanyak 350 maka jumlah
data testing sebanyak 347. Pada setiap masing-masing jumlah data traininng akan
dilakukan iterasi sebanyak 20, 50, 100, dan 350 sehingga total pengujian pada
penelitian ini sebanyak 12 jumlah pengujian.
Adapun hasil pengujian dilakukan dengan menggunakan parameter pada tabel
terhadap pengklasifikasian pasien breast cancer ditampilkan pada Tabel 4.4 dan Tabel
4.5.
Tabel 4.4 Hasil Pengujian
No

DT

Bobot Entropy 1

Bobot Entropy 2

Bobot LVQ Standar

S

TS

P

S

TS

P

S

TS

P

I

1

20

5

660

17

97,48

643

34

94,97

652

25

96,30

2

20

10

658

19

97,19

643

34

94,97

650

27

96,01

3

20

20

658

19

97,19

643

34

94,97

650

27

96,01

4

50

5

614

33

94,89

613

34

94,74

613

34

94,74

5

50

10

611

36

94,43

611

36

94,43

611

36

94,43

6

50

20

611

36

94,43

611

36

94,43

611

36

94,43

7

100

5

574

23

96,14

574

23

96,14

574

23

96,14

Universitas Sumatera Utara

35

Tabel 4.5 Hasil Pengujian (lanjutan)
No

DT

Bobot Entropy 1

Bobot Entropy 2

Bobot LVQ standar

S

TS

P

S

TS

P

S

TS

P

I

8

100

10

572

25

95,81

572

25

95,81

572

25

95,81

9

100

20

572

25

95,81

572

25

95,81

572

25

95,81

10

350

5

343

4

98,56

343

4

98,56

343

4

98,56

11

350

10

343

4

98,56

343

4

98,56

343

4

98,56

12

350

20

343

4

98,56

343

4

98,56

343

4

98,56

Tingkat Akurasi

96,59

95,99

96,28

Keterangan Tabel :
DT

= Jumlah Data Training

I

= Jumlah Iterasi

S

= Jumlah pasien yang SESUAI dengan kelasnya

TS

= Jumlah pasien yang TIDAK sesuai dengan kelasnya.

P

= Presentase Tingkat Akurasi Pengklasifikasian (%)

Dari tabel dan grafik di atas bisa dilihat bahwa vektor bobot awal diperoleh
dari cara Entropy pertama memiliki tingkat akurasi yang lebih baik dalam
mengklasifikasi jika dibandingkan cara yang lain yakni sebesar 96,59 %. Penentuan
vektor bobot awal dengan cara pertama juga menghasilkan tingkat pembelajaran yang
cepat dalam mengenali dataset. Hal itu dilbuktikan dari hasil pengujian pada jumlah
data training sejumlah 20 dan jumlah iterasi sebanyak 5 iterasi, yakni sebesar 97,48 %
, lebih baik dari cara penentuan bobot awal yang lainnya. Namun apabila semakin
besar jumlah data training dan jumlah iterasinya maka ketiga cara penentuan vektor
bobot awal tersebut memiliki tingkat akurasi yang sama baiknya.

4.4. Pembahasan
Dari hasil penelitian yang telah dilakukan bahwa metode Entropy dapat digunakan
sebagai penentu vektor bobot awal pada JST LVQ. Vektor bobot awal yang diperoleh
dari metode Entropy menunjukkan kinerja yang baik dalam mempelajari data pada
saat proses training. Metode Entropy cara pertama menghasilkan vektor bobot awal
yang dapat mewakili keseluruhan data pasien breast cancer dengan jumlah data

Universitas Sumatera Utara

36

training yang sedikit yaitu hanya 20 data walaupun dengan jumlah iterasi sebanyak 5.
Namun dengan iterasi yang lebih banyak lagi yaitu sebanyak 20 iterasi, proses
pemebelajaran semakin baik pula. Sehingga vektor bobot awal tersebut juga
menghasilkan tingkat akurasi yang lebih baik jika dibandkingkan dengan vektor bobot
awal yang dihasilkan metode Entropy cara kedua dan vektor bobot awal yang
dihasilkan dengan mengambil data pasien pertama dari setiap kelas. Hal ini
disebabkan oleh sifat dari perhitungan metode Entropy yang mampu menyelidiki
tingkat keserasian dalam sekumpulan data dan mampu beradaptasi dengan
sekumpulan data beratribut jamak yang memiliki variasi nilai yang berbeda antara
satu data pasien dengan data pasien lainnya. Sehingga vektor bobot awal yang didapat
mampu mempelajari dan mewakili data pasien dari setiap kelas jinak ataupun ganas
dengan cepat. Oleh karena itu, vektor bobot awal sangatlah mempengaruhi dari proses
pembelajaran data dan tingkat akurasi yang didapat.
Selain itu dalam hasil penelitian ini juga diperoleh bahwa semakin besar
jumlah data training yang dilakukan maka tingkat akurasi yang didapat semakin baik
pula. Hal ini dibuktikan pada ketiga cara penentuan vektor bobot awal tersebut yang
memiliki tingkat akurasi yang sama baiknya yaitu sebesar 98,56 % dengan jumlah
data training sebesar 350. Hal ini disebabkan oleh proses pembelajaran yang
dilakukan semakin banyak sehingga menghasilkan vektor bobot yang baik pula untuk
mengenali kelas pada proses testing. Namun secara keseluruhan pengujian, vektor
bobot awal yang dihasilkan dengan metode Entropy cara pertama memiliki tingkat
keberhasilan dalam pengklasifikasian data pasien breast cancer dibandkingkan dengan
cara yang lainnya. Maka dapat disimpulkan bahwa vektor bobot awal sangatlah
mempengaruhi dari proses pembelajaran data dan tingkat akurasi yang didapat.
Kemudian penentuan vektor bobot awal pada JST LVQ dengan menggunakan metode
Entropy bisa dikatakan lebih baik jika dibandingkan dengan penentuan vektor bobot
awal dengan cara LVQ standar.

Universitas Sumatera Utara

BAB 5
KESIMPULAN DAN SARAN

5.1. Kesimpulan
Kesimpulan dari hasil penelitian yang telah dilakukan yaitu :
1. Metode Entropy dalam penentuan vektor bobot awal pada Jaringan Syaraf
Tiruan Learning Vector Quantization membantu kinerja proses pembelajaran
Learning Vector Quantization dan menghasilkan tingkat akurasi yang lebih
baik dalam proses klasifikasi.
2. Dengan jumlah data training lebih sedikit, vektor bobot awal yang dihasilkan
metode Entropy mampu mempelajari data dengan baik dan menghasilkan
tingkat akurasi lebih tinggi, hal ini disebabkan sifat metode Entropy mampu
menyelidiki keserasian dari sekumpulan dataset sehingga menghasilkan vektor
bobot yang dapat mewakili setiap dataset pada setiap kelas.

5.2. Saran
Adapun saran yang diberikan oleh penulis yaitu :
1. Untuk hasil yang lebih akurat lagi dapat menggunakan metode penentuan
bobot selain metode Entropy ataupun mengkombinasikan JST LVQ dengan
metode lainnya.
2. Perlu diimplementasikan dengan data kasus yang lain misalnya pada kasus
pengenelan wajah.

Universitas Sumatera Utara