3.5. Cluster-isasi Pada John Hopkins University Ionosphere Dataset
John Hopkins University Ionosphere Dataset adalah sebuah dataset yang dikumpulkan oleh Vince Sigillito pada tahun 1989 yang bersumber dari Space Physics Group
Applied Physics Laboratory John Hopkins University terdiri dari 35 input features dari rangakaian 16 antenna frekuensi tinggi dengan total energi yang dialirkan pada
tingkat 6,4 kilowatts Sigillito, 1989 . Target pada dataset ini adalah elektron bebas pada ionosphere yang menunjukkan kondisi baik jika masih terdapat elektron bebas
pada ionosphere dan menunjukkan kondisi buruk jika sebaliknya. Berikut disajikan deskripsi John Hopkins University Ionosphere Dataset:
Universitas Sumatera Utara
Tabel 3.11 Training Sample John Hopkins University Ionosphere Dataset
35
Good …
Good …
Bad …
Bad
34
-0,4 …
…
0,2 …
33
0,1 …
0,7 …
-0,1 …
32
-0,5 …
…
0,3 …
31
-0,5 …
…
0,3 …
30
0,4 …
0,7 …
…
29
-0,3 …
0,2 …
0,1 …
28
0,2 …
1 …
-0,1 …
27
-0,4 …
…
0,2 …
0,2
26
0,4 …
0,8 …
…
1
25
-0,5 …
-0,1 …
0,2 …
24
0,5 …
0,8 …
…
23
-0,4 …
0,1 …
0,2 …
-1
22
0,3 …
0,7 …
…
1
21
-0,2 …
…
…
20
0,5 …
0,6 …
0,2 …
19
-0,3 …
…
0,2 …
-1
18
0,5 …
1 …
…
-1
17
-0,3 …
…
0,3 …
16
0,8 …
0,8 …
…
15
-0,3 …
…
0,2 …
-0,1
Universitas
Sumatera
Utara
14
0,6 …
0,7 …
…
-0,1
13
-0,4 …
0,1 …
0,3 …
0,3
12
0,5 …
0,8 …
0,2 …
1
11
-0,1 …
…
0,2 …
10
0,8 …
0,9 …
0,1 …
9
…
…
0,1 …
1
8
1 …
0,8 …
0,2 …
-1
7
-0,3 …
0,2 …
0,2 …
6
0,8 …
0,7 …
0,2 …
5
0,8 …
-0,1 …
0,07 …
4
-0,05 …
0,2 …
0,1 …
3
0,9 …
0,9 …
0,3 …
2
…
…
…
1
1 …
1 …
1 …
1 radar
sample
1 …
178 …
237 …
253
Universitas
Sumatera
Utara
Berikut disertakan ringkasan dari masing-masing attribut dalam John Hopkins University Ionosphere Dataset, seperti yang disajikan dalam tabel 3.12 berikut:
Tabel 3.12 Deskripsi John Hopkins University Ionosphere Dataset
Attribute Name
Attribute Type
Max Min
Mean Standard
Deviasi
radar 1 real
1 0,8733
0,3112 radar 2
real radar 3
real 1
-1 0,6110
0,4977 radar 4
real 1
-1 0,0258
0,4414 radar 5
real 1
-1 0,5705
0,5199 radar 6
real 1
-1 0,0989
0,4608 radar 7
real 1
-1 0,5332
0,4927 radar 8
real 1
-1 0,0858
0,5207 radar 9
real 1
-1 0,5103
0,5071 radar 10
real 1
-1 0,1592
0,4839 radar 11
real 1
-1 0,4891
0,5635 radar 12
real 1
-1 0,1311
0,4948 radar 13
real 1
-1 0,4165
0,6222 radar 14
real 1
-1 0,0707
0,4949 radar 15
real 1
-1 0,3609
0,6528 radar 16
real 1
-1 0,0617
0,4584 radar 17
real 1
-1 0,4033
0,6180 radar 18
real 1
-1 -0,0045
0,4968 radar 19
real 1
-1 0,3726
0,6263 radar 20
real 1
-1 -0,0154
0,5191 radar 21
real 1
-1 0,3321
0,6098 radar 22
real 1
-1 0,0390
0,5182 radar 23
real 1
-1 0,3511
0,6038 radar 24
real 1
-1 -0,0357
0,5275 radar 25
real 1
-1 0,3779
0,5785
Universitas Sumatera Utara
radar 26 real
1 -1
-0,0486 0,5085
radar 27 real
1 -1
0,53524 0,5162
radar 28 real
1 -1
-0,0533 0,5500
radar 29 real
1 -1
0,3360 0,5759
radar 30 real
1 -1
-0,0170 0,5080
radar 31 real
1 -1
0,3049 0,5715
radar 32 real
1 -1
0,0065 0,5136
radar 33 real
1 -1
0,3037 0,5227
radar 34 real
1 -1
0,0175 0,4683
class categorical 1
NA NA
Proses cluster pada John Hopkins University Ionosphere Dataset menggunakan Support Vector Machine dengan menggunakan radial basis function
sebagai kernel sama seperti proses cluster pada Iris Plants Dataset yang telah dilakukan pada BAB 3, proses cluster pada John Hopkins University Ionosphere
Dataset menggunakan 34 features yang akan dihitung nilai similarity nya untuk dapat menentukan apakah sebuah sample dalam kondisi baik atau buruk. Berikut disajikan
proses cluster pada John Hopkins University Ionosphere Dataset: Berikut adalah contoh proses cluster pada sebuah training sample pada John Hopkins
Ionosphere Dataset: radar1 = 1
radar8 = -0,3 radar15 = 0,6
radar22 = -0,2 radar29 =0,2
radar2 = 0 radar9 = 1
radar16 = -0,3 radar23 =0,3
radar30 =-0,3 radar3 = 0,9
radar10 = 0,03 radar17 = 0,8
radar24 =-0,4 radar31 =0,4
radar4 = -0,05 radar11 = 0,8
radar18 = -0,3 radar25 =0,5
radar32 =-0,5 radar5 = 0,8
radar12 = -0,1 radar19 = 0,5
radar26 =-0,5 radar33 =0,1
radar6 = 0,02 radar13 = 0,5
radar20 = -0,3 radar27 =0,4
radar34 =-0,4 radar7 = 0,8
radar14 = -0,4 radar21 = 0,5
radar28 =-0,4 yang akan di-cluster pada beberapa landmark yang ada:
Universitas Sumatera Utara
Training sample akan di-cluster terhadap landmark menggunakan standard deviasi = 0,5 pada persamaan 2.10, sehingga akan diperoleh nilai similarity function sebagai
berikut:
Untuk kemudian diolah dalam komputer menggunakan MATLAB R2010a dalam perhitungan me-minimisasi nilai
pada fungsi pada persamaan 2.12
untuk mendapatkan kesimpulan bahwa sample x termasuk dalam class yang dimiliki oleh
, ,
. Berikut akan disajikan dalam tabel hasil dari seluruh perhitungan proses cluster pada training sample dan landmark pada John Hopkins University
Ionosphere Dataset:
Universitas Sumatera Utara
Tabel 3.13 Cluster Pada John Hopkins University Ionosphere Dataset
sample 1 4
9 11
… 2
7 22
28 1
1 0,68
1 0,42
…
4 0,68
1 1
0,42 …
9 1
1 1
0,42 …
11
0,42 0,42
0,42 1
… …
… …
… …
… …
… …
…
2 …
1 0,32
0,98 0,68
7 …
0,32 1
0,22 0,06
22 …
0,98 0,22
1 0,78
28
… 0,68
0,06 0,78
1
keterangan: = instance tidak ada electron bebas pada ionosphere
= instance ada electron bebas pada ionosphere = sample dengan nilai similarity function = 1
Hasil cluster-isasi didapat bahwa dalam John Hopkins University Ionosphere Dataset terdapat 174 sample termasuk dalam class kondisi baik, dan 126 sample termasuk
dalam class kondisi baik.
3.6. Konfigurasi Support Vector Backpropagation
Setelah seluruh dataset di-cluster pada masing-masing class, maka langkah selanjutnya adalah merancang konfigurasi Support Vector Backpropagation yang di-
setting secara unik pada masing-masing dataset, berikut disajikan konfigurasi Support Vector Backpropagation yang digunakan dalam penelitian ini:
1. Konfigurasi Support Vector Backpropagation pada Iris Plants Dataset Konfigurasi Support Vector Backpropagation pada Iris Plants Dataset
menggunakan jaringan syaraf tiruan dengan 4 buah neuron input dengan 1 buah hidden layer dengan 4 buah neuron dengan 2 buah neuron pada output
Universitas Sumatera Utara
layer beserta
property khusus yang digunakan Support Vector
Backpropagation seperti yang dijelaskan dalam tabel berikut:
Tabel 3.14 Konfigurasi Support Vector Backpropagation Pada Iris Plants
Dataset
x
1 1
x
1 2
x
1 3
x
1 4
x
2 1
x
2 2
x
2 3
x
2 4
x
3 1
x
3 2
SVM
Ouput
Gambar 3.1 Arsitektur Support Vector Backpropagation Pada Iris Plants
Dataset Backpropagation Segment
Input layer 4 neurons
Hidden layer 4 neurons
Output layer 2 neurons
Bobot layer pertama Matriks 4 baris x 5 kolom
Bobot layer kedua Matriks 2 baris x 5 kolom
Fungsi aktivasi Sigmoid biner
Learning rate 0.02
Tolerance function 1.0e-8
Fungsi minimisasi fmincg
Support Vector Machine Segment Fungsi kernel
Radial Basis Function Showplot
True
Universitas Sumatera Utara
2. Konfigurasi Support Vector Backpropagation pada Wisconsin Diagnostic Breast Cancer Dataset
Konfigurasi Support Vector Backpropagation pada Wisconsin Diagnostic Breast Cancer Dataset menggunakan jaringan syaraf tiruan dengan 9 buah
neuron pada input layer dan 5 buah neuron pada hidden layer dan 2 buah neuron pada output layer beserta property khusus yang digunakan dalam
Support Vector Backpropagation seperti yang dijelaskan pada tabel berikut:
Tabel 3.15 Konfigurasi Support Vector Backpropagation Pada Wisconsin
Diagnostic Breast Cancer Dataset Backpropagation Segment
Input layer 9 neurons
Hidden layer 5 neurons
Output layer 2 neurons
Bobot layer pertama Matriks 5 baris x 9 kolom
Bobot layer kedua Matriks 2 baris x 6 kolom
Fungsi aktivasi Sigmoid biner
Learning rate 0.02
Tolerance function 1.0e-8
Fungsi minimisasi fmincg
Support Vector Machine Segment Fungsi kernel
Radial Basis Function Showplot
True
Universitas Sumatera Utara
x
1 1
x
1 2
x
1 3
x
1 4
x
2 1
x
2 2
x
2 3
x
2 4
x
3 1
x
3 2
SVM
Ouput x
1 5
x
1 7
x
1 8
x
1 9
x
2 5
...
Gambar 3.2 Arsitektur Support Vector Backpropagation Pada Wisconsin
Diagnostic Breast Cancer Dataset
3. Konfigurasi Support Vector Backpropagation pada Cleveland Heart Disease
Dataset
Konfigurasi Support Vector Backpropagation pada Cleveland Heart Disease Dataset menggunakan jaringan syaraf tiruan dengan 13 buah neuron pada
input layer dan 7 buah neuron pada hidden layer dan 2 buah neuron pada output layer serta beberapa property khusus yang digunakan pada Support
Vector Backpropagation seperti yang dijalskan pada tabel berikut:
Universitas Sumatera Utara
Tabel 3.16 Konfigurasi Support Vector Backpropagation Pada Cleveland
Heart Disease Dataset
x
1 1
x
1 2
x
1 3
x
1 4
x
2 1
x
2 2
x
2 3
x
2 4
x
3 1
x
3 2
SVM
Ouput x
1 5
x
1 11
x
1 12
x
1 13
x
2 5
...
x
2 6
x
2 7
Gambar 3.3 Arsitektur Support Vector Backpropagation Pada Cleveland
Heart Disease Dataset Backpropagation Segment
Input layer 13 neurons
Hidden layer 7 neurons
Output layer 2 neurons
Bobot layer pertama Matriks 7 baris x 14 kolom
Bobot layer kedua Matriks 2 baris x 8 kolom
Fungsi aktivasi Sigmoid biner
Learning rate 0.02
Tolerance function 1.0e-8
Fungsi minimisasi fmincg
Support Vector Machine Segment Fungsi kernel
Radial Basis Function Showplot
True
Universitas Sumatera Utara
4. Konfigurasi Support Vector Backpropagation pada John Hopkins University Ionosphere Dataset
Konfigurasi Support Vector Backpropagation pada John Hopkins University Ionosphere Dataset menggunakan jaringan syaraf tiruan dengan 34 buah
neuron pada input layer, 17 neuron pada hidden layer, dan 2 buah neuron pada output layer beserta property khusus pada Support Vector
Backpropagation seperti yang disajikan dalam tabel berikut:
Tabel 3.17 Konfigurasi Support Vector Backpropagation Pada John
Hopkins University Ionosphere Dataset
Backpropagation Segment Input layer
34 neurons Hidden layer
17 neurons Output layer
2 neurons Bobot layer pertama
Matriks 17 baris x 35 kolom Bobot layer kedua
Matriks 2 baris x 18 kolom Fungsi aktivasi
Sigmoid biner Learning rate
0.02 Tolerance function
1.0e-8 Fungsi minimisasi
fmincg
Support Vector Machine Segment Fungsi kernel
Radial Basis Function Showplot
True
Universitas Sumatera Utara
x
1 1
x
1 2
x
1 3
x
1 4
x
2 1
x
2 2
x
2 3
x
2 4
x
3 1
x
3 2
SVM
Ouput x
1 5
x
1 32
x
1 33
x
1 34
x
2 5
...
x
2 17
...
Gambar 3.4 Arsitektur Support Vector Backpropagation Pada John
Hopkins University Ionosphere Dataset
Universitas Sumatera Utara
BAB 4
IMPLEMENTASI DAN PENGUJIAN
Pada bab ini akan dibahas hasil proses komputasi Support Vector Backpropagation yang dilakukan menggunakan program MATLAB R2010a. MATLAB R2010a
merupakan software yang cocok dipakai sebagai alat komputasi yang melibatkan penggunaan matriks dan vector. Fungsi-fungsi dalam paket perangkat lunak toolbox
Matlab R2010a dibuat untuk memudahkan perhitungan tersebut. Banyak model jaringan syaraf tiruan dan machine learning menggunakan manipulasi matriks atau
vector dalam iterasinya. Oleh karena itu MATLAB R2010a merupakan perangkat lunak yang cocok dipakai dalam penelitian ini.
4.1. Proses Transformasi Iris Plants Dataset Oleh