85
Pusat Cluster K-Means cluster
Jarak Pusat Cluster
Fuzzy C-Means cluster
Jarak
Cluster 9 -0,445
0,1719 3,16
-0,3150 0,3963
9,59 Cluster 10
0,4407 -0,8225
2,08 1,0808
-1,3947 11,50
Cluster 11 1,8145
-1,2535 3,50
-0,1762 0,0665
8,55
Hasil jarak dan pusat cluster secara lengkap terlampir pada Lampiran 11 untuk metode K-Means clustering dan Lampiran 12 untuk metode Fuzzy C-Means
clustering. Setelah masing-masing pusat cluster dan jaraknya didapatkan,
selanjutnya dilakukan proses RBFNN dengan menggunakan program rbfDesign dan globalRidge. Proses RBFNN ini dilakukan dengan MATLAB
R2013a.
7. Menentukan Jaringan Optimum
Proses RBFNN selanjutnya adalah pengoptimalan jaringan dan pengoptimalan bobot menggunakan Persamaan 3.28. Jaringan optimum
didapatkan dengan menentukan neuron tersembunyi terlebih dahulu. banyak neuron tersembunyi yang dapat menghasilkan jaringan optimum adalah neuron
yang dapat menghasilkan akurasi terbaik. Dengan menggunakan metode trial and error, beberapa cluster dicoba pada program MATLAB R2013a. Hasil
akurasi dari beberapa cluster baik dengan metode K-Means clustering maupun
86
Fuzzy C-Means clustering yang dicoba dalam MATLAB R2013a adalah sebagai berikut.
Tabel 3.17. Persentase Akurasi Data Training dan Data Testing
Cluster K-Means cluster
Fuzzy C-Means cluster Akurasi
Training Akurasi
Testing Akurasi
Training Akurasi
Testing
3 41,67
50 43,75
54,17 4
53,13 54,17
48,96 54,17
5 53,13
62,5 48,96
58,33 6
55,21 54,17
58,33 62,5
7 54,17
54,17 57,29
58,33 8
63,54 70,83
63,54 62,5
9 71,86
75 62,5
58,33 10
79,17 75
72,92 66,67
11 80,21
79,17 75
75 12
80,21 79,17
61,46 58,13
13 78,13
75 70,83
66,67 14
33,33 33,33
64,58 54,17
15 78,13
79,17 75
79,17 16
79,17 75
77,08 75
17 77,08
70,83 76,04
75 20
76,04 66,67
77,08 75
22 69,79
66,67 77,08
70,83 Keterangan: Model Terbaik
Dari cluster yang digunakan pada Tabel 3.17 dapat dilihat bahwa nilai akurasi data training dan testing berpola tidak beraturan, namun pada K-Means
cluster nilainya cenderung menurun apabila cluster semakin banyak. Sama
87
seperti pada K-Means cluster, pada Fuzzy C-Means cluster semakin banyak cluster semakin menurun nilai akurasinya, meskipun penurunan akurasi tidak
terlalu signifikan. Pada K-Means cluster nilai akurasi data training dan testing terbaik
didapatkan dengan cluster sebanyak 11, sehingga jaringan dengan banyak cluster 11 merupakan jaringan yang menghasilkan akurasi optimum untuk
metode K-Means clustering. Pada Fuzzy C-Means cluster nilai akurasi data training terbaik
didapatkan dengan cluster sebanyak 16, 20, dan 22, namun pada nilai akurasi testing terbaik didapat dengan cluster 15 dengan nilai 79,17, berikutnya
cluster 16, 17, dan 20 dengan nilai 75. Akan tetapi, karena data training digunakan untuk membangun sebuah model dan mendapatkan bobot yang
sesuai, sedangkan data testing digunakan hanya untuk mengetahui tingkat keakuratan hasil dengan nilai sebenarnya maka cluster 16 dengan nilai akurasi
training 77,08 dan nilai akurasi testing 75 merupakan jaringan yang menghasilkan akurasi optimum untuk metode Fuzzy C-Means clustering.
Secara keseluruhan penggunaan K-Means clustering menghasilkan nilai akurasi lebih baik dibandingkan Fuzzy C-Means clustering. Jaringan dengan
11 cluster dengan metode K-Means clustering menghasilkan nilai akurasi yang paling baik yaitu 80,21 untuk data training dan 79,17 untuk data testing.
Oleh karena itu, jaringan dengan banyak cluster 11 dipilih sebagai jaringan yang menghasilkan akurasi optimum. Nilai pusat dan jarak yang terlampir pada
88
Lampiran 11 untuk K-Means clustering dan Lampiran 12 untuk Fuzzy C- Means clustering.
Dengan demikian model RBFNN terbaik untuk klasifikasi stadium kanker payudara mempunyai arsitektur 14 neuron pada lapisan input, 11
neuron pada lapisan tersembunyi, dan 2 neuron pada lapisan output. Fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah fungsi
aktivasi gaussian dan fungsi yang digunakan pada lapisan output adalah fungsi linear atau identitas.
Arsitektur RBFNN jaringan terbaik yang digunakan untuk klasifikasi stadium kanker payudara dengan 14 neuron pada lapisan input yaitu
sampai ,
sampai untuk 11 neuron pada lapisan tersembunyi, dan
sampai untuk 2 neuron outputnya dapat dilihat pada Gambar 3.5 berikut.
Gambar 3.5 Arsitektur RBFNN untuk klasifikasi stadium kanker
payudara dengan 11 cluster Lapisan
Tersembunyi
Lapisan input
Lapisan output
89
D. Hasil Klasifikasi
Berdasarkan uraian diatas, didapatkan arsitektur RBFNN jaringan terbaik terdiri dari 14 neuron pada lapisan input, 11 neuron pada lapisan tersembunyi,
dan 2 neuron pada lapisan output. Selanjutnya, menentukan bobot yang dihasilkan dari metode global ridge-regression pada fungsi aktivasi Gaussian
serta model RBFNN yang didapatkan. Perhitungan untuk masing-masing metode clustering sebagai berikut.
1. K-Means clustering
Bobot antara neuron tersembunyi dan neuron output dicari dengan Persamaan 3.28 yaitu,
̂ ̂
̂ vektor bobot klasifikasi ̂ vektor target klasifikasi
fungsi aktivasi neuron tersembunyi parameter regulasi
matriks Identitas ukuran Berdasarkan nilai pusat, jarak, dan bobot yang dihasilkan, maka model
Radial Basis Function Neural Network RBFNN vektor [ adalah:
∑ dengan,
∑