Wisconsin Diagnostic Breast Cancer Database WDBC

84

b. Wisconsin Diagnostic Breast Cancer Database WDBC

Proses K-Means clustering pada data WDBC dilakukan dengan menggunakan program Minitab dan dilakukan secara trial and error untuk menentukan banyak cluster yang menghasilkan akurasi terbaik. Tabel 3.6 berikut menunjukkan hasil akurasi dari beberapa cluster dengan menggunakan metode K-Means clustering pada pembelajaran FRBFNN. Tabel 3. 6 Persentase Akurasi Data Training dan Data Testing pada Model FRBFNN Menggunakan Data WDBC Cluster Akurasi Training Akurasi Testing 4 88,75 90 5 87,5 90 6 90 87,5 7 90 90 8 90,625 90 9 89,375 87,5 10 90,625 87,5 11 91,25 85 12 92,5 85 13 91,875 92,5 14 92, 85 15 93,75 87,5 16 93,75 90 17 95 90 18 95 90 19 92,5 87,5 20 92,5 87,5 Berdasarkan tabel 3.6 tersebut, banyaknya cluster yang digunakan sebagai uji coba pada metode trial and error yaitu 4 sampai 20 cluster. Dari masing-masing banyaknya cluster yang dipilih dapat dilihat hasil akurasi data 85 training dan testing dimana secara keseluruhan hasil akurasi pada data training dan data testing menunjukkan pola yang tidak beraturan. Pada cluster 17 dan 18 memiliki nilai akurasi data training dan testing yang sama dengan nilai akurasi data training merupakan nilai akurasi yang terbaik yaitu 95. Sedangkan nilai akurasi terbaik untuk data testing diperoleh pada cluster 13. Akan tetapi, karena data training digunakan untuk membangun sebuah model dan mendapatkan bobot yang sesuai, sedangkan data testing digunakan hanya untuk mengetahui tingkat keakuratan hasil dengan nilai sebenarnya maka diantara cluster 17 dan cluster 18 dapat dipilih salah satu sebagai jaringan optimum. Agar menghasilkan model yang lebih sederhana, pada tugas akhir ini dipilih cluster 17 dengan nilai akurasi training 95 dan nilai akurasi testing 90 sebagai jaringan yang menghasilkan akurasi optimum. Nilai pusat dan jarak terlampir pada Lampiran 17 halaman 223. Dengan demikian model FRBFNN terbaik untuk klasifikasi stadium kanker payudara yang digunakan pada tugas akhir ini yaitu mempunyai arsitektur 10 neuron pada lapisan input, 17 neuron pada lapisan tersembunyi, dan 1 neuron pada lapisan output dengan fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah fungsi aktivasi gaussian dan fungsi aktivasi yang digunakan pada lapisan output adalah fungsi linear atau identitas. Arsitektur FRBFNN jaringan terbaik yang digunakan untuk klasifikasi stadium kanker payudara dengan menggunakan data WDBC adalah 10 neuron berupa crisp input pada input layer yaitu sampai , 30 neuron fuzzy pada 86 input layer, � sampai � untuk 17 neuron pada lapisan tersembunyi, dan untuk 1 neuron outputnya dapat dilihat pada Gambar 3.10 berikut. Gambar 3. 10 Arsitektur FRBFNN untuk Klasifikasi Stadium Kanker Payudara pada Data WDBC

5. Hasil Klasifikasi