commit to user 64
Tabel 4.13. Tingkat Akurasi Pohon Optimal Dengan Data Testing Kondisi
Ketiga Kelas Sebenarnya
Total Kelas
Persentase Akurasi
Lancar N = 333
Tidak Lancar N = 101
Lancar 323
90.09 291
32 Tidak Lancar
111 62.16
42 69
Total 434
Rata-rata 76.13
Persentase Keseluruhan
Akurasi 82.95
4.2.4. Pemilihan Kondisi yang Tepat
Dari contoh kasus klasifikasi nasabah AJB Bumiputera 1912, diberlakukan tiga kondisi yang berbeda dalam membentuk pohon klasifikasi yaitu proporsi
pembagian data learning lebih besar dari data testing, proporsi pembagian data learning dan data testing sama, dan proporsi pembagian data learning lebih kecil dari
data testing. Nilai ketepatan atau tingkat keakuratan pohon klasifikasi dari ketiga kondisi dapat dilihat pada Tabel 4.14.
Tabel 4.14. Nilai Ketepatan dari Ketiga Kondisi
No Kondisi
Tingkat Ketepatan Klasifikasi Data Learning
Data Testing 1
Proporsi Data Learning Data Testing 86.33
83.65 2
Proporsi Data Learning = Data Testing 87.17
81.94 3
Proporsi Data Learning Data Testing 87.01
82.95
Pada Tabel 4.14. terlihat bahwa nilai ketepatan data learning untuk proporsi pembagian data learning data testing menghasilkan nilai keakuratan untuk data
commit to user 65
learning sebesar 86.33
.
Proporsi pembagian data learning data testing menghasilkan nilai keakuratan untuk data learning sebesar 87.01
.
Sedangkan proporsi pembagian data learning = data testing memiliki nilai keakuratan untuk data
learning sebesar 87.17 . Keakuratan nilai data testing untuk proporsi pembagian data learning = data
testing yaitu 81.94 . Proporsi pembagian data learning data testing menghasilkan nilai keakuratan data testing sebesar 82.95 . Sedangkan proporsi pembagian data
learning data testing memiliki nilai keakuratan data testing sebesar 83.65 . Hal ini berarti bahwa apabila kita ingin memodelkan data tersebut maka kita
pilih ketepatan klasifikasi data learning tertinggi yaitu untuk proporsi pembagian data learning = data testing. Akan tetapi apabila kita akan membuat model yang
nantinya digunakan untuk mengklasifikasikan data baru maka dipilih nilai ketepatan testingnya tertinggi yaitu proporsi pembagian data learning data testing.
4.2.5. Interpretasi Pohon Klasifikasi