dataset yang tidak ditransformasi memiliki 9 features diperoleh tingkat ketelitian sebesar 0, dalam hal ini baik klasifikasi pada dataset yang telah ditransformasi
hanya memiliki 2 features maupun pada dataset yang tidak ditransformasi memiliki 9 features sama-sama gagal dalam melakukan cluster-isasi pada
Wisconsin Diagnostic Breast Cancer Dataset. Terlihat pada hasil yang disajikan dalam tabel 4.10 bahwa transformasi yang dilakukan pada Wisconsin Diagnostic Breast
Cancer Dataset menghasilkan classifier dengan performa optimal 100 hanya pada classifier dengan 100 training sample namun classifier yang menggunakan dataset
hasil transformasi sama sekali gagal dikarenakan kondisi overfitting dalam melakukan classification pada jumlah training sample 200 sampai 680 sample, sementara
classifier yang menggunakan dataset yang tidak ditransformasi masih tetap mencapai akurasi 100 pada jumlah training sample dari 100 sampai 400 sample namun tetap
mengalami kondisi overfitting pada jumlah training sample 500 sampai 680 sample. Kegagalan Support Vector Backpropagation dalam melakukan classification
dikarenakan persebaran sparness training sample dalam feature space menjadi sangat padat mengakibatkan semua training sample yang ada dalam feature space
mulai bercampur dan menyatu antar cluster mengakibatkan tidak mungkin ditemukan garis pemisah decision boundary pada masing-masing class.
4.3. Proses Transformasi Cleveland Heart Disease Dataset Oleh Support Vector
Backpropagation
Proses transformasi Cleveland Heart Disease Dataset yang memiliki 13 attributes menjadi sebuah dataset berdimensi rendah 2 dimensi mengharuskan proses
transformasi memperhatikan persebaran data dalam dimensi ruang untuk menghindari overfitting penyebeb kegagalan proses cluster walaupun proses ini juga bergantung
dari banyaknya sample pelatihan yang ditransformasi-kan namun diharapkan proses transformasi tetap dapat mempertahankan tingkat akurasi yang optimal, seperti proses
transformasi sebuah training sample Cleveland Heart Disease Dataset yang dilakukan oleh Support Vector Backpropagation berikut ini:
Universitas Sumatera Utara
Tabel 4.11 Training Sample Cleveland Heart Disease Dataset Sebelum
Transformasi age
sex cp
trest chol
fbs restecg
45 1
1 110
264
thala exang oldpeak slope
ca thal
Target
132 1,2
2 7
Positif Sakit Jantung
Proses transformasi yang akan dilakukan pada seluruh sample pelatihan dalam Cleveland Heart Disease Dataset seperti yang diwakili oleh proses transformasi pada
sample tabel 4.11 diawali dengan penentuan bobot awal dengan nilai epsilon
init
=0,002
sesuai dengan persamaan 2.1, sehingga didapat bobot awal jaringan syaraf tiruan
sebagai berikut:
Setelah didapat bobot awal jaringan syaraf tiruan maka dilakukan proses pembelajaran menggunakan feedforwardpropagation pada hidden layer seperti pada persamaan
2.2, didapat hasil sebagai berikut:
Universitas Sumatera Utara
Selanjutnya nilai akan dicari nilai fungsi aktivasi-nya menggunkan sigmoid biner
seperti pada persamaan 2.3, didapat hasil sebagai berikut:
Selanjutnya nilai akan melewati proses fordwardpropagation pada output layer
seperti pada persamaan 2.2, sehingga didapat hasil sebagai berikut:
Untuk kemudian didapatkan nilai fungsi aktivasi menggunakan fungsi sigmoid pada output layer seperti pada persamaan 2.3, sehingga didapat hasil sebagai berikut:
Karena a3 Target, maka langkah selanjutnya adalah menghitung nilai error pada output layer seperti pada secara backpropagation persamaan 2.6, sehingga didapat
hasil sebagai berikut:
Kemudian backpropagation dilanjutkan menuju hidden layer seperti pada persamaan2.7, sehingga didapat hasil:
Universitas Sumatera Utara
Kemudian hitung nilai Theta
grad
sesuai dengan persamaan 2.8 pada Theta
1
dan Theta
2
sehingga didapat nilai Theta
grad
sebagai berikut:
Setelah didapat nilai Theta
grad
maka akan dilakukan penambahan bobot jaringan syaraf tiruan dengan learning rate lambda = 0,02 seperti pada persamaan 2.8, sehingga
didapat penambahan bobot-bobot awal sebagai berikut:
Kemudian dilakukan proses update bobot-bobot jaringan syaraf tiruan untuk mengetahui nilai Mean Square Error seperti pada persamaan 2.5, setelah dilakukan
proses pelatihan sebanyak epochs = 50 didapat nilai Mean Square Error
terkecil=1,3851 pada bobot optimal jaringan syaraf tiruan sebagai berikut:
Universitas Sumatera Utara
Dengan bobot optimal yang telah didapatakan maka kita dapat mentransformasikan sample pada tabel 4.1 dengan cara forwardpropagation seperti pada persamaan 2.2,
sehingga didapat hasil transformasi sample pada tabel 4.12 sebagai berikut:
Tabel 4.12 Training Sample Cleveland Heart Disease Dataset Pada Tabel 4.11
Setelah Transformasi
Feature 1 Feature 2
Target
0,5014 0,4983
Positif Sakit Jantung
Proses transformasi yang telah dilakukan pada seluruh training sample dalam Cleveland Heart Disease Dataset, menghasilkan sebuah dataset baru hasil
transformasi seperti pada tabel berikut:
Universitas Sumatera Utara
Tabel 4.13 Training Sample Cleveland Heart Disease Dataset
a Sebelum Transformasi b Sesudah Transformasi
sample age sex
cp trest
chol …
thal Target
1 63
1 1
145 233
… 6
Negatif Sakit Jantung …
… …
… …
… …
… …
90 66
1 4
120 302
… 3
Negatif Sakit Jantung …
… …
… …
… …
… 197
59 1
1 160
273 …
3 Positif Sakit Jantung
… …
… …
… …
… …
… 249
58 1
4 146
218 …
7 Positif Sakit Jantung
a
sample Feature 1
Feature 2 Target
1 0,4981
0,4954 Negatif Sakit Jantung
… …
… …
90 0,4975
0,4962 Negatif Sakit Jantung
… …
… …
197 0,4978
0,496 Positif Sakit Jantung
… …
… …
249 0,4979
0,4957 Positif Sakit Jantung
b
Setelah proses transformasi selesai dilakukan pada seluruh training sample dalam Cleveland Heart Disease Dataset, selanjutnya akan melalui proses cluster seperti pada
pada persamaan 2.10, sebagai berikut:
Universitas Sumatera Utara
Untuk kemudian diolah dalam komputer menggunakan MATLAB R2010a dalam perhitungan me-minimisasi nilai
pada fungsi pada persamman 2.12
untuk mendapatkan kesimpulan bahwa sample x termasuk dalam class yang dimiliki oleh
, ,
. Berikut akan disajikan dalam tabel hasil dari seluruh perhitungan proses cluster pada training sample dan landmark pada Cleveland Heart Disease
Dataset yang telah ditransformasi:
Tabel 4.14 Cluster-isasi Pada Cleveland Heart Disease Dataset
Setelah Transformasi
sample 1 …
91 …
197 …
249 1
1 …
0,77 …
0,32 …
0,66 …
… …
… …
… …
…
91 0,77
… 1
… 0,1
… 0,2
… …
… …
… …
… …
197
0,32 …
0,1 …
1 …
0,7 …
… …
… …
… …
…
249 0,66
… 0,2
… 0,7
… 1
keterangan: = instance negatif sakit jantung
= instance positif sakit jantung = sample dengan similarity function = 1
Setelah seluruh training sample di-transformasi kedalam low dimensional data, maka akan diuji tingkat akurasi classifier maupun sebelum maupun sesudah dataset di-
transformasi, hasilnya dijabarkan dalam tabel 4.15 berikut:
Universitas Sumatera Utara
Tabel 4.15 Perbandingan Tingkat Ketelitian Classifier Pada Cleveland Heart
Disease Dataset Sebelum Dan Sesudah Transformasi
training sample
test sample akurasi
sebelum transformasi sesudah transformasi
50 10
50 70
100 10
60 60
140 10
60 60
200 10
60 60
250 10
60 70
Berikut disajikan grafik perbandingan tingkat ketelitian classifier sebelum dan sesudah transformasi pada Cleveland Heart Disease Dataset:
Gambar 4.5 Grafik Perbandingan Tingkat Ketelitian Classifier Cleveland Heart
Disease Dataset Sebelum Dan Sesudah Transformasi
Universitas Sumatera Utara
Pada gambar 4.6 berikut, disajikan grafis hasil proses cluster mulai dari jumlah training sample paling sedikit yaitu 50 training sample sampai 250 training sample:
a b
c d
e
Gambar 4.6 Grafis Hasil Cluster Pada Cleveland Heart Disease Dataset
Sesudah Transformasi a 50 Sample b 100 Sample c 140 Sample
d 200 Sample e 250 Sample
Terlihat pada hasil percobaan penggunaan Support Vector Backpropagation pada klasifikasi Cleveland Heart Disease Dataset pada gambar 4.6 menggunakan a
diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah ditransformasi hanya memiliki 2 features adalah sebesar 70 sementara pada
dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian sebesar 50, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah
ditransformasi hanya memilki 2 features lebih tinggi 20 daripada tingkat ketelitian pada dataset yang tidak ditrasformasi memilki 13 features . Pada hasil
percobaan b diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset
Universitas Sumatera Utara
yang telah ditransformasi hanya memiliki 2 features adalah sebesar 60 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat
ketelitian sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memiliki 2 features sama dengan tingkat ketelitian pada
dataset yang tidak ditransformasi memiliki 13 features . Pada hasil percobaan c diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah
ditransformasi hanya memiliki 2 features adalah sebesar 60 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian
sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memliki 2 features sama dengan tingkat ketelitian pada
dataset yang tidak ditransformasi memiliki 13 features . Pada hasil percobaan d diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah
ditrasformasi hanya memiliki 2 features adalah sebesar 60 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian
sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memiliki 2 features sama dengan tingakt ketelitian pada
dataset yang tidak ditransformasi memiliki 13 features . Pada hasil percobaan e diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah
ditransformasi hanya memiliki 2 features diperoleh tingkat ketelitian sebesar 70 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh
tingkat ketelitian sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memilki 2 features lebih tinggi 10 daripada
tingkat ketelitian klasifikasi pada dataset yang tidak ditrasformasi memiliki 13 features . Secara keseluruhan hasil percobaan penggunaan Support Vector
Backpropagation pada Cleveland Heart Disease Dataset memberikan hasil tingkat ketelitian yang cenderung sama pada dataset yang telah ditransformasi hanya
memiliki 2 features dengan dataset yang tidak ditransformasi memliki 13 features .
Universitas Sumatera Utara
4.4. Proses Transformasi Pada John Hopkins University Ionosphere Dataset Oleh