Proses Transformasi Cleveland Heart Disease Dataset Oleh Support Vector

dataset yang tidak ditransformasi memiliki 9 features diperoleh tingkat ketelitian sebesar 0, dalam hal ini baik klasifikasi pada dataset yang telah ditransformasi hanya memiliki 2 features maupun pada dataset yang tidak ditransformasi memiliki 9 features sama-sama gagal dalam melakukan cluster-isasi pada Wisconsin Diagnostic Breast Cancer Dataset. Terlihat pada hasil yang disajikan dalam tabel 4.10 bahwa transformasi yang dilakukan pada Wisconsin Diagnostic Breast Cancer Dataset menghasilkan classifier dengan performa optimal 100 hanya pada classifier dengan 100 training sample namun classifier yang menggunakan dataset hasil transformasi sama sekali gagal dikarenakan kondisi overfitting dalam melakukan classification pada jumlah training sample 200 sampai 680 sample, sementara classifier yang menggunakan dataset yang tidak ditransformasi masih tetap mencapai akurasi 100 pada jumlah training sample dari 100 sampai 400 sample namun tetap mengalami kondisi overfitting pada jumlah training sample 500 sampai 680 sample. Kegagalan Support Vector Backpropagation dalam melakukan classification dikarenakan persebaran sparness training sample dalam feature space menjadi sangat padat mengakibatkan semua training sample yang ada dalam feature space mulai bercampur dan menyatu antar cluster mengakibatkan tidak mungkin ditemukan garis pemisah decision boundary pada masing-masing class.

4.3. Proses Transformasi Cleveland Heart Disease Dataset Oleh Support Vector

Backpropagation Proses transformasi Cleveland Heart Disease Dataset yang memiliki 13 attributes menjadi sebuah dataset berdimensi rendah 2 dimensi mengharuskan proses transformasi memperhatikan persebaran data dalam dimensi ruang untuk menghindari overfitting penyebeb kegagalan proses cluster walaupun proses ini juga bergantung dari banyaknya sample pelatihan yang ditransformasi-kan namun diharapkan proses transformasi tetap dapat mempertahankan tingkat akurasi yang optimal, seperti proses transformasi sebuah training sample Cleveland Heart Disease Dataset yang dilakukan oleh Support Vector Backpropagation berikut ini: Universitas Sumatera Utara Tabel 4.11 Training Sample Cleveland Heart Disease Dataset Sebelum Transformasi age sex cp trest chol fbs restecg 45 1 1 110 264 thala exang oldpeak slope ca thal Target 132 1,2 2 7 Positif Sakit Jantung Proses transformasi yang akan dilakukan pada seluruh sample pelatihan dalam Cleveland Heart Disease Dataset seperti yang diwakili oleh proses transformasi pada sample tabel 4.11 diawali dengan penentuan bobot awal dengan nilai epsilon init =0,002 sesuai dengan persamaan 2.1, sehingga didapat bobot awal jaringan syaraf tiruan sebagai berikut: Setelah didapat bobot awal jaringan syaraf tiruan maka dilakukan proses pembelajaran menggunakan feedforwardpropagation pada hidden layer seperti pada persamaan 2.2, didapat hasil sebagai berikut: Universitas Sumatera Utara Selanjutnya nilai akan dicari nilai fungsi aktivasi-nya menggunkan sigmoid biner seperti pada persamaan 2.3, didapat hasil sebagai berikut: Selanjutnya nilai akan melewati proses fordwardpropagation pada output layer seperti pada persamaan 2.2, sehingga didapat hasil sebagai berikut: Untuk kemudian didapatkan nilai fungsi aktivasi menggunakan fungsi sigmoid pada output layer seperti pada persamaan 2.3, sehingga didapat hasil sebagai berikut: Karena a3 Target, maka langkah selanjutnya adalah menghitung nilai error pada output layer seperti pada secara backpropagation persamaan 2.6, sehingga didapat hasil sebagai berikut: Kemudian backpropagation dilanjutkan menuju hidden layer seperti pada persamaan2.7, sehingga didapat hasil: Universitas Sumatera Utara Kemudian hitung nilai Theta grad sesuai dengan persamaan 2.8 pada Theta 1 dan Theta 2 sehingga didapat nilai Theta grad sebagai berikut: Setelah didapat nilai Theta grad maka akan dilakukan penambahan bobot jaringan syaraf tiruan dengan learning rate lambda = 0,02 seperti pada persamaan 2.8, sehingga didapat penambahan bobot-bobot awal sebagai berikut: Kemudian dilakukan proses update bobot-bobot jaringan syaraf tiruan untuk mengetahui nilai Mean Square Error seperti pada persamaan 2.5, setelah dilakukan proses pelatihan sebanyak epochs = 50 didapat nilai Mean Square Error terkecil=1,3851 pada bobot optimal jaringan syaraf tiruan sebagai berikut: Universitas Sumatera Utara Dengan bobot optimal yang telah didapatakan maka kita dapat mentransformasikan sample pada tabel 4.1 dengan cara forwardpropagation seperti pada persamaan 2.2, sehingga didapat hasil transformasi sample pada tabel 4.12 sebagai berikut: Tabel 4.12 Training Sample Cleveland Heart Disease Dataset Pada Tabel 4.11 Setelah Transformasi Feature 1 Feature 2 Target 0,5014 0,4983 Positif Sakit Jantung Proses transformasi yang telah dilakukan pada seluruh training sample dalam Cleveland Heart Disease Dataset, menghasilkan sebuah dataset baru hasil transformasi seperti pada tabel berikut: Universitas Sumatera Utara Tabel 4.13 Training Sample Cleveland Heart Disease Dataset a Sebelum Transformasi b Sesudah Transformasi sample age sex cp trest chol … thal Target 1 63 1 1 145 233 … 6 Negatif Sakit Jantung … … … … … … … … … 90 66 1 4 120 302 … 3 Negatif Sakit Jantung … … … … … … … … 197 59 1 1 160 273 … 3 Positif Sakit Jantung … … … … … … … … … 249 58 1 4 146 218 … 7 Positif Sakit Jantung a sample Feature 1 Feature 2 Target 1 0,4981 0,4954 Negatif Sakit Jantung … … … … 90 0,4975 0,4962 Negatif Sakit Jantung … … … … 197 0,4978 0,496 Positif Sakit Jantung … … … … 249 0,4979 0,4957 Positif Sakit Jantung b Setelah proses transformasi selesai dilakukan pada seluruh training sample dalam Cleveland Heart Disease Dataset, selanjutnya akan melalui proses cluster seperti pada pada persamaan 2.10, sebagai berikut: Universitas Sumatera Utara Untuk kemudian diolah dalam komputer menggunakan MATLAB R2010a dalam perhitungan me-minimisasi nilai pada fungsi pada persamman 2.12 untuk mendapatkan kesimpulan bahwa sample x termasuk dalam class yang dimiliki oleh , , . Berikut akan disajikan dalam tabel hasil dari seluruh perhitungan proses cluster pada training sample dan landmark pada Cleveland Heart Disease Dataset yang telah ditransformasi: Tabel 4.14 Cluster-isasi Pada Cleveland Heart Disease Dataset Setelah Transformasi sample 1 … 91 … 197 … 249 1 1 … 0,77 … 0,32 … 0,66 … … … … … … … … 91 0,77 … 1 … 0,1 … 0,2 … … … … … … … … 197 0,32 … 0,1 … 1 … 0,7 … … … … … … … … 249 0,66 … 0,2 … 0,7 … 1 keterangan: = instance negatif sakit jantung = instance positif sakit jantung = sample dengan similarity function = 1 Setelah seluruh training sample di-transformasi kedalam low dimensional data, maka akan diuji tingkat akurasi classifier maupun sebelum maupun sesudah dataset di- transformasi, hasilnya dijabarkan dalam tabel 4.15 berikut: Universitas Sumatera Utara Tabel 4.15 Perbandingan Tingkat Ketelitian Classifier Pada Cleveland Heart Disease Dataset Sebelum Dan Sesudah Transformasi training sample test sample akurasi sebelum transformasi sesudah transformasi 50 10 50 70 100 10 60 60 140 10 60 60 200 10 60 60 250 10 60 70 Berikut disajikan grafik perbandingan tingkat ketelitian classifier sebelum dan sesudah transformasi pada Cleveland Heart Disease Dataset: Gambar 4.5 Grafik Perbandingan Tingkat Ketelitian Classifier Cleveland Heart Disease Dataset Sebelum Dan Sesudah Transformasi Universitas Sumatera Utara Pada gambar 4.6 berikut, disajikan grafis hasil proses cluster mulai dari jumlah training sample paling sedikit yaitu 50 training sample sampai 250 training sample: a b c d e Gambar 4.6 Grafis Hasil Cluster Pada Cleveland Heart Disease Dataset Sesudah Transformasi a 50 Sample b 100 Sample c 140 Sample d 200 Sample e 250 Sample Terlihat pada hasil percobaan penggunaan Support Vector Backpropagation pada klasifikasi Cleveland Heart Disease Dataset pada gambar 4.6 menggunakan a diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah ditransformasi hanya memiliki 2 features adalah sebesar 70 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian sebesar 50, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memilki 2 features lebih tinggi 20 daripada tingkat ketelitian pada dataset yang tidak ditrasformasi memilki 13 features . Pada hasil percobaan b diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset Universitas Sumatera Utara yang telah ditransformasi hanya memiliki 2 features adalah sebesar 60 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memiliki 2 features sama dengan tingkat ketelitian pada dataset yang tidak ditransformasi memiliki 13 features . Pada hasil percobaan c diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah ditransformasi hanya memiliki 2 features adalah sebesar 60 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memliki 2 features sama dengan tingkat ketelitian pada dataset yang tidak ditransformasi memiliki 13 features . Pada hasil percobaan d diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah ditrasformasi hanya memiliki 2 features adalah sebesar 60 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memiliki 2 features sama dengan tingakt ketelitian pada dataset yang tidak ditransformasi memiliki 13 features . Pada hasil percobaan e diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah ditransformasi hanya memiliki 2 features diperoleh tingkat ketelitian sebesar 70 sementara pada dataset yang tidak ditransformasi memiliki 13 features diperoleh tingkat ketelitian sebesar 60, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi hanya memilki 2 features lebih tinggi 10 daripada tingkat ketelitian klasifikasi pada dataset yang tidak ditrasformasi memiliki 13 features . Secara keseluruhan hasil percobaan penggunaan Support Vector Backpropagation pada Cleveland Heart Disease Dataset memberikan hasil tingkat ketelitian yang cenderung sama pada dataset yang telah ditransformasi hanya memiliki 2 features dengan dataset yang tidak ditransformasi memliki 13 features . Universitas Sumatera Utara

4.4. Proses Transformasi Pada John Hopkins University Ionosphere Dataset Oleh