Chi2 dengan Inconsistency sebesar 5 Akurasi yang Dihasilkan Tiap Data Set

inconsistency untuk membandingkan output yang dihasilkan. Untuk pengujian proses training akan dilihat efek yang diberikan dengan menggunakan atau tidak menggunakan tambahan variabel diskrit. Sedangkan untuk proses pruning akan diuji efek yang diberikan dengan menggunakan atau tidak menggunakan tambahan varibel diskrit. Dataset yang akan digunakan dalam pengujian merupakan 5 dataset sintetik yang sudah terdapat pada aplikasi, yaitu chess dataset, cross dataset, cube dataset, two-triangle dataset dan x dataset. Selain itu, akan dilakukan pengujian terhadap 3 macam dataset yang diunduh dari UCI Machine Learning Repository, yaitu wdbc dataset, wpbc dataset dan breast-cancer dataset. Dimana setiap dataset memiliki perpaduan tipe atribut antara lain atribut bersifat diskrit, atribut bersifat kontinu dan atribut bersifat campuran antara diskrit dan kontinu.

4.1 Chi2 dengan Inconsistency sebesar 5

Proses pengujian yang akan dilakukan adalah pengamatan terhadap output yang dihasilkan dengan nilai inconsistency sebesar 5 dari algoritma Chi2. Inconsistency terjadi saat paling sedikit terdapat 2 data sampel yang semua atribut memiliki nilai yang sama, namun berada pada 2 kelompok yang berbeda. Dari tiap pengujian akan ditampilkan output atau interval yang dihasilkan oleh algoritma Chi2 untuk kelima data sintetik. Dimana, X 1 , X 2 ,…, X n merupakan atribut dari suatu sampel. Tabel 1. Cut-offs chess, cross dan cube dataset dengan 5 inconsistency Dataset Inconsistency = 5 Chess Cross Cube X 1 X 2 X 1 X 2 X 1 X 2 X 3 0.000 6 0.000 1 0.400 4 0.400 2 0.001 2 0.000 5 7.58- 06 0.254 5 0.256 1 0.499 3 0.499 0.479 7 0.513 8 0.5001 0.511 6 0.501 9 0.755 2 0.746 7 Tabel 2. Cut-offs two-triangle dan X dataset dengan 5 inconsistency Dataset Inconsistency = 5 Two-triangle X X 1 X 2 X 1 X 2 0.0005 0.0013 0.0005 0.0004 0.1938 0.0836 0.0797 0.0798 0.3028 0.2644 0.1682 0.1888 0.3740 0.4002 0.2456 0.2486 0.3804 0.6528 0.3088 0.3197 0.5316 0.7777 0.3717 0.3995 0.7282 0.6062 0.4826 0.8032 0.6628 0.5628 0.8093 0.7386 0.6495 0.9453 0.7982 0.7586 0.8756 0.8343 0.8864 Dengan nilai inconsistency sebesar 5, algoritma Chi2 berhasil menemukan nilai cut-off yang mewakili perpotongan data terutama untuk data set yang bersifat axis pararel, seperti chess data set, cross data set dan cube data set. Sedangkan untuk data set yang bersifat campuran terlihat bahwa cut-off dari perpotongan axis-pararel masih bisa didapatkan. Untuk data set dengan perpotongan data bersifat oblique terlihat masih banyak interval yang dihasilkan, seperti yang sudah diperkirakan sebelumnya.

4.2 Akurasi yang Dihasilkan Tiap Data Set

dengan Tanpa Diskritisasi dan Diskritisasi Chi2 Pengujian yang akan dilakukan adalah membandingkan akurasi yang didapat dengan berbagai metode yang digunakan. Sedangkan untuk algoritma Chi2 akan digunakan inconsistency sebesar 0 dan 5. Percobaan akan dilakukan dengan 1 hidden layer, 8 hidden unit, learning rate sebesar 0.1 selama 50 iterasi. Tabel 3. Perbandingan akurasi antara tanpa diskritisasi dengan inconsistency algoritma Chi2 0 dan 5 Dataset Tipe Akurasi dalam Tanpa diskritisasi Chi2 Chi2 5 Chess Training 52.62 98.92 98.15 Testing 50.90 95.78 96.38 Cross Training 52.30 99.97 99.87 Testing 51.38 98.64 100.0 Cube Training 86.12 99.55 99.35 Testing 83.90 97.52 99.16 Two-triangle Training 90.17 99.47 98.75 Testing 91.12 96.14 95.48 X Training 55.22 97.87 95.73 Testing 52.64 92.74 89.34 Breast cancer Training 97.22 97.15 95.62 Testing 98.06 97.53 98.59 WDBC Training 89.09 98.83 94.83 Testing 89.11 92.56 94.77 WPBC Training 76.04 88.75 83.95 Testing 76.92 70.51 75.12 Jika diperhatikan dari hasil pengujian pada Tabel 5, Jika diperhatikan dari hasil pengujian pada Tabel 5.13, dapat dilihat bahwa dengan inconsistency 0 akurasi untuk proses training selalu lebih baik dibandingkan dengan inconsistency 5. Jika dilihat dari akurasi proses testing untuk dataset asli dan dataset dengan perpotongan axis-parallel, didapatkan hasil yang sebaliknya dimana akurasi inconsistency 5 lebih baik dari pada inconsistency 0. Sedangkan untuk dataset dengan perpotongan oblique akurasi yang paling optimal didapatkan dengan menggunakan inconsistency sebesar 0. Oleh karena itu, dapat disimpulkan bahwa setiap dataset memiliki nilai inconsistency yang berbeda-beda untuk dapat mencapai akurasi yang optimal.

4.3 Pengamatan Informasi yang Dihasilkan