Menentukan Jaringan Optimum Hasil Model Radial Basis Function Neural Network untuk Klasifikasi

85 Pusat Cluster K-Means cluster Jarak Pusat Cluster Fuzzy C-Means cluster Jarak Cluster 9 -0,445 0,1719 3,16 -0,3150 0,3963 9,59 Cluster 10 0,4407 -0,8225 2,08 1,0808 -1,3947 11,50 Cluster 11 1,8145 -1,2535 3,50 -0,1762 0,0665 8,55 Hasil jarak dan pusat cluster secara lengkap terlampir pada Lampiran 11 untuk metode K-Means clustering dan Lampiran 12 untuk metode Fuzzy C-Means clustering. Setelah masing-masing pusat cluster dan jaraknya didapatkan, selanjutnya dilakukan proses RBFNN dengan menggunakan program rbfDesign dan globalRidge. Proses RBFNN ini dilakukan dengan MATLAB R2013a.

7. Menentukan Jaringan Optimum

Proses RBFNN selanjutnya adalah pengoptimalan jaringan dan pengoptimalan bobot menggunakan Persamaan 3.28. Jaringan optimum didapatkan dengan menentukan neuron tersembunyi terlebih dahulu. banyak neuron tersembunyi yang dapat menghasilkan jaringan optimum adalah neuron yang dapat menghasilkan akurasi terbaik. Dengan menggunakan metode trial and error, beberapa cluster dicoba pada program MATLAB R2013a. Hasil akurasi dari beberapa cluster baik dengan metode K-Means clustering maupun 86 Fuzzy C-Means clustering yang dicoba dalam MATLAB R2013a adalah sebagai berikut. Tabel 3.17. Persentase Akurasi Data Training dan Data Testing Cluster K-Means cluster Fuzzy C-Means cluster Akurasi Training Akurasi Testing Akurasi Training Akurasi Testing 3 41,67 50 43,75 54,17 4 53,13 54,17 48,96 54,17 5 53,13 62,5 48,96 58,33 6 55,21 54,17 58,33 62,5 7 54,17 54,17 57,29 58,33 8 63,54 70,83 63,54 62,5 9 71,86 75 62,5 58,33 10 79,17 75 72,92 66,67 11 80,21 79,17 75 75 12 80,21 79,17 61,46 58,13 13 78,13 75 70,83 66,67 14 33,33 33,33 64,58 54,17 15 78,13 79,17 75 79,17 16 79,17 75 77,08 75 17 77,08 70,83 76,04 75 20 76,04 66,67 77,08 75 22 69,79 66,67 77,08 70,83 Keterangan: Model Terbaik Dari cluster yang digunakan pada Tabel 3.17 dapat dilihat bahwa nilai akurasi data training dan testing berpola tidak beraturan, namun pada K-Means cluster nilainya cenderung menurun apabila cluster semakin banyak. Sama 87 seperti pada K-Means cluster, pada Fuzzy C-Means cluster semakin banyak cluster semakin menurun nilai akurasinya, meskipun penurunan akurasi tidak terlalu signifikan. Pada K-Means cluster nilai akurasi data training dan testing terbaik didapatkan dengan cluster sebanyak 11, sehingga jaringan dengan banyak cluster 11 merupakan jaringan yang menghasilkan akurasi optimum untuk metode K-Means clustering. Pada Fuzzy C-Means cluster nilai akurasi data training terbaik didapatkan dengan cluster sebanyak 16, 20, dan 22, namun pada nilai akurasi testing terbaik didapat dengan cluster 15 dengan nilai 79,17, berikutnya cluster 16, 17, dan 20 dengan nilai 75. Akan tetapi, karena data training digunakan untuk membangun sebuah model dan mendapatkan bobot yang sesuai, sedangkan data testing digunakan hanya untuk mengetahui tingkat keakuratan hasil dengan nilai sebenarnya maka cluster 16 dengan nilai akurasi training 77,08 dan nilai akurasi testing 75 merupakan jaringan yang menghasilkan akurasi optimum untuk metode Fuzzy C-Means clustering. Secara keseluruhan penggunaan K-Means clustering menghasilkan nilai akurasi lebih baik dibandingkan Fuzzy C-Means clustering. Jaringan dengan 11 cluster dengan metode K-Means clustering menghasilkan nilai akurasi yang paling baik yaitu 80,21 untuk data training dan 79,17 untuk data testing. Oleh karena itu, jaringan dengan banyak cluster 11 dipilih sebagai jaringan yang menghasilkan akurasi optimum. Nilai pusat dan jarak yang terlampir pada 88 Lampiran 11 untuk K-Means clustering dan Lampiran 12 untuk Fuzzy C- Means clustering. Dengan demikian model RBFNN terbaik untuk klasifikasi stadium kanker payudara mempunyai arsitektur 14 neuron pada lapisan input, 11 neuron pada lapisan tersembunyi, dan 2 neuron pada lapisan output. Fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah fungsi aktivasi gaussian dan fungsi yang digunakan pada lapisan output adalah fungsi linear atau identitas. Arsitektur RBFNN jaringan terbaik yang digunakan untuk klasifikasi stadium kanker payudara dengan 14 neuron pada lapisan input yaitu sampai , sampai untuk 11 neuron pada lapisan tersembunyi, dan sampai untuk 2 neuron outputnya dapat dilihat pada Gambar 3.5 berikut. Gambar 3.5 Arsitektur RBFNN untuk klasifikasi stadium kanker payudara dengan 11 cluster Lapisan Tersembunyi Lapisan input Lapisan output 89

D. Hasil Klasifikasi

Berdasarkan uraian diatas, didapatkan arsitektur RBFNN jaringan terbaik terdiri dari 14 neuron pada lapisan input, 11 neuron pada lapisan tersembunyi, dan 2 neuron pada lapisan output. Selanjutnya, menentukan bobot yang dihasilkan dari metode global ridge-regression pada fungsi aktivasi Gaussian serta model RBFNN yang didapatkan. Perhitungan untuk masing-masing metode clustering sebagai berikut.

1. K-Means clustering

Bobot antara neuron tersembunyi dan neuron output dicari dengan Persamaan 3.28 yaitu, ̂ ̂ ̂ vektor bobot klasifikasi ̂ vektor target klasifikasi fungsi aktivasi neuron tersembunyi parameter regulasi matriks Identitas ukuran Berdasarkan nilai pusat, jarak, dan bobot yang dihasilkan, maka model Radial Basis Function Neural Network RBFNN vektor [ adalah: ∑ dengan, ∑