84
b. Wisconsin Diagnostic Breast Cancer Database WDBC
Proses K-Means clustering pada data WDBC dilakukan dengan menggunakan program Minitab dan dilakukan secara trial and error untuk
menentukan banyak cluster yang menghasilkan akurasi terbaik. Tabel 3.6 berikut menunjukkan hasil akurasi dari beberapa cluster
dengan menggunakan metode K-Means clustering pada pembelajaran FRBFNN.
Tabel 3. 6 Persentase Akurasi Data Training dan Data Testing pada Model
FRBFNN Menggunakan Data WDBC
Cluster Akurasi
Training Akurasi
Testing 4
88,75 90
5 87,5
90 6
90 87,5
7 90
90 8
90,625 90
9 89,375
87,5 10
90,625 87,5
11 91,25
85 12
92,5 85
13 91,875
92,5 14
92, 85
15 93,75
87,5 16
93,75 90
17 95
90 18
95 90
19 92,5
87,5 20
92,5 87,5
Berdasarkan tabel 3.6 tersebut, banyaknya cluster yang digunakan sebagai uji coba pada metode trial and error yaitu 4 sampai 20 cluster. Dari
masing-masing banyaknya cluster yang dipilih dapat dilihat hasil akurasi data
85 training dan testing dimana secara keseluruhan hasil akurasi pada data training
dan data testing menunjukkan pola yang tidak beraturan. Pada cluster 17 dan 18 memiliki nilai akurasi data training dan testing
yang sama dengan nilai akurasi data training merupakan nilai akurasi yang terbaik yaitu 95. Sedangkan nilai akurasi terbaik untuk data testing diperoleh
pada cluster 13. Akan tetapi, karena data training digunakan untuk membangun sebuah model dan mendapatkan bobot yang sesuai, sedangkan data testing
digunakan hanya untuk mengetahui tingkat keakuratan hasil dengan nilai sebenarnya maka diantara cluster 17 dan cluster 18 dapat dipilih salah satu
sebagai jaringan optimum. Agar menghasilkan model yang lebih sederhana, pada tugas akhir ini dipilih cluster 17 dengan nilai akurasi training 95 dan
nilai akurasi testing 90 sebagai jaringan yang menghasilkan akurasi optimum. Nilai pusat dan jarak terlampir pada Lampiran 17 halaman 223. Dengan
demikian model FRBFNN terbaik untuk klasifikasi stadium kanker payudara yang digunakan pada tugas akhir ini yaitu mempunyai arsitektur 10 neuron pada
lapisan input, 17 neuron pada lapisan tersembunyi, dan 1 neuron pada lapisan output dengan fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah
fungsi aktivasi gaussian dan fungsi aktivasi yang digunakan pada lapisan output adalah fungsi linear atau identitas.
Arsitektur FRBFNN jaringan terbaik yang digunakan untuk klasifikasi stadium kanker payudara dengan menggunakan data WDBC adalah 10 neuron
berupa crisp input pada input layer yaitu sampai
, 30 neuron fuzzy pada
86 input layer,
� sampai � untuk 17 neuron pada lapisan tersembunyi, dan untuk 1 neuron outputnya dapat dilihat pada Gambar 3.10 berikut.
Gambar 3. 10 Arsitektur FRBFNN untuk Klasifikasi Stadium Kanker Payudara
pada Data WDBC
5. Hasil Klasifikasi