inconsistency untuk membandingkan output yang dihasilkan. Untuk pengujian proses training akan dilihat efek yang diberikan
dengan menggunakan atau tidak menggunakan tambahan variabel diskrit. Sedangkan untuk proses pruning akan diuji efek yang
diberikan dengan menggunakan atau tidak menggunakan tambahan varibel diskrit.
Dataset yang akan digunakan dalam pengujian merupakan 5 dataset sintetik yang sudah terdapat pada aplikasi, yaitu chess
dataset, cross dataset, cube dataset, two-triangle dataset dan x dataset. Selain itu, akan dilakukan pengujian terhadap 3 macam
dataset yang diunduh dari UCI Machine Learning Repository, yaitu wdbc dataset, wpbc dataset dan breast-cancer dataset.
Dimana setiap dataset memiliki perpaduan tipe atribut antara lain atribut bersifat diskrit, atribut bersifat kontinu dan atribut bersifat
campuran antara diskrit dan kontinu.
4.1 Chi2 dengan Inconsistency sebesar 5
Proses pengujian yang akan dilakukan adalah pengamatan terhadap output yang dihasilkan dengan nilai inconsistency
sebesar 5 dari algoritma Chi2. Inconsistency terjadi saat paling sedikit terdapat 2 data sampel yang semua atribut memiliki nilai
yang sama, namun berada pada 2 kelompok yang berbeda. Dari tiap pengujian akan ditampilkan output atau interval yang
dihasilkan oleh algoritma Chi2 untuk kelima data sintetik. Dimana, X
1
, X
2
,…, X
n
merupakan atribut dari suatu sampel. Tabel 1. Cut-offs chess, cross dan cube dataset dengan 5
inconsistency
Dataset Inconsistency = 5 Chess
Cross Cube
X
1
X
2
X
1
X
2
X
1
X
2
X
3
0.000 6
0.000 1
0.400 4
0.400 2
0.001 2
0.000 5
7.58- 06
0.254 5
0.256 1
0.499 3
0.499 0.479
7 0.513
8 0.5001
0.511 6
0.501 9
0.755 2
0.746 7
Tabel 2. Cut-offs two-triangle dan X dataset dengan 5 inconsistency
Dataset Inconsistency = 5 Two-triangle
X X
1
X
2
X
1
X
2
0.0005 0.0013
0.0005 0.0004
0.1938 0.0836
0.0797 0.0798
0.3028 0.2644
0.1682 0.1888
0.3740 0.4002
0.2456 0.2486
0.3804 0.6528
0.3088 0.3197
0.5316 0.7777
0.3717 0.3995
0.7282 0.6062
0.4826 0.8032
0.6628 0.5628
0.8093 0.7386
0.6495 0.9453
0.7982 0.7586
0.8756 0.8343
0.8864 Dengan nilai inconsistency sebesar 5, algoritma Chi2 berhasil
menemukan nilai cut-off yang mewakili perpotongan data terutama untuk data set yang bersifat axis pararel, seperti chess
data set, cross data set dan cube data set. Sedangkan untuk data set yang bersifat campuran terlihat bahwa cut-off dari perpotongan
axis-pararel masih bisa didapatkan. Untuk data set dengan perpotongan data bersifat oblique terlihat masih banyak interval
yang dihasilkan, seperti yang sudah diperkirakan sebelumnya.
4.2 Akurasi yang Dihasilkan Tiap Data Set
dengan Tanpa Diskritisasi dan Diskritisasi Chi2
Pengujian yang akan dilakukan adalah membandingkan akurasi yang didapat dengan berbagai metode yang digunakan. Sedangkan
untuk algoritma Chi2 akan digunakan inconsistency sebesar 0 dan 5. Percobaan akan dilakukan dengan 1 hidden layer, 8
hidden unit, learning rate sebesar 0.1 selama 50 iterasi.
Tabel 3. Perbandingan akurasi antara tanpa diskritisasi dengan inconsistency algoritma Chi2 0 dan 5
Dataset Tipe
Akurasi dalam Tanpa
diskritisasi Chi2
Chi2 5
Chess Training
52.62 98.92
98.15
Testing 50.90
95.78 96.38
Cross Training
52.30 99.97
99.87
Testing 51.38
98.64 100.0
Cube Training
86.12 99.55
99.35
Testing 83.90
97.52 99.16
Two-triangle Training
90.17 99.47
98.75
Testing 91.12
96.14 95.48
X Training
55.22 97.87
95.73
Testing 52.64
92.74 89.34
Breast cancer Training
97.22 97.15
95.62
Testing 98.06
97.53 98.59
WDBC Training
89.09 98.83
94.83
Testing 89.11
92.56 94.77
WPBC Training
76.04 88.75
83.95
Testing 76.92
70.51 75.12
Jika diperhatikan dari hasil pengujian pada Tabel 5, Jika diperhatikan dari hasil pengujian pada Tabel 5.13, dapat dilihat
bahwa dengan inconsistency 0 akurasi untuk proses training
selalu lebih baik dibandingkan dengan inconsistency 5. Jika dilihat dari akurasi proses testing untuk dataset asli dan dataset
dengan perpotongan axis-parallel, didapatkan hasil yang sebaliknya dimana akurasi inconsistency 5 lebih baik dari pada
inconsistency 0. Sedangkan untuk dataset dengan perpotongan oblique akurasi yang paling optimal didapatkan dengan
menggunakan inconsistency sebesar 0. Oleh karena itu, dapat disimpulkan bahwa setiap dataset memiliki nilai inconsistency
yang berbeda-beda untuk dapat mencapai akurasi yang optimal.
4.3 Pengamatan Informasi yang Dihasilkan