cluster sudah didapat maka akan dilakukan pembulatan satu angka dibelakang desimal sesuai dengan Error terkecil yang ditentukan pertama
kali. Berikut hasil clustering ditunjukkan pada tabel 2.13.
Tabel 2. 13 Hasil akhir perhitungan fuzzy c-means
C1 C2
C3 0,0
0,5 0,5
0,4 0,6
0,1 0,7
0,2 0,3
0,1 0,6
2.3 Silhouette Index
Jika DBI digunakan untuk mengukur validasi seluruh cluster dalam set data, maka Silhouette Index SI dapat digunakan untuk memvalidasi baik
sebuah data, cluster tunggal satu cluster dari sejumlah cluster, atau bahkan keseluruhan cluster. Metode ini paling banyak digunakan untuk memvalidasi
cluster yang menggabungkan nilai kohesi dan separasi. Untuk menghitung nilai SI dari sebuah data ke-i, ada 2 komponen yaitu a
i
dan b
i
. a
i
adalah rata – rata
jarak ke-i terhadap semua data lainnya dalam satu cluster, sedangkan b
i
didapatkan dengan menghitung rata – rata jarak data ke-i terhadap semua data
dari clusteryang lain tidak dalam satu cluster dengan data ke-i, kemudian yang terkecil [Tan et al, 2006], [Petrovic, 2003].
Berikut formula untuk menghitung a
i
: =
1 − 1
,
� �=1
�≠
, = 1,2,
… , … … … … … … … … 2.5
,
�
adalah jarak data ke-i dengan data ke-r dalam satu clusterj, sedangkan
adalah jumlah data dalam cluster ke-j. Berikut formula untuk menghitung b
i
: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
= min
=1, …,
≠
1 ,
� �=1
� ≠
, = 1, 2, … , … … … … … … … … 2.6
Untuk mendapatkan Silhouette Index SI data ke-i menggunakan persamaan berikut :
�� = −
max{ ,
} … … … … … … … … 2.7
Nilai a
i
mengukur seberapa tidak mirip sebuah data dengan cluster yang diikutinya, nilai yang semakin kecil menandakan semakin tepatnya data
tersebut berada dalam cluster tersebut. Nilai b
i
yang besar menandakan seberapa jeleknya data terhadapcluster yang lain. Nilai SI yang didapat dalam
rentang [-1, +1]. Nilai SI yang mendekati 1 menandakan bahwa data tersebut semakin tepat berada dalam cluster tersebut. Nilai SI negatif a
i
b
i
menandakan bahwa data tersebut tidak tepat berada dalam cluster tersebut karena lebih dekat ke cluster yang lain.SI bernilai 0 atau mendekati 0
berarti data tersebut posisinya berada di perbatasan di antara dua cluster.
Untuk nilai SI dari sebuah cluster didapatkan dengan menghitung rata
– rata nilai SI semua data yang bergabung dalam cluster tersebut, seperti pada persamaan berikut :
�� = 1
��
=1
… … … … … … … … 2.8
2.4 Bank