Silhouette Index LANDASAN TEORI

cluster sudah didapat maka akan dilakukan pembulatan satu angka dibelakang desimal sesuai dengan Error terkecil yang ditentukan pertama kali. Berikut hasil clustering ditunjukkan pada tabel 2.13. Tabel 2. 13 Hasil akhir perhitungan fuzzy c-means C1 C2 C3 0,0 0,5 0,5 0,4 0,6 0,1 0,7 0,2 0,3 0,1 0,6

2.3 Silhouette Index

Jika DBI digunakan untuk mengukur validasi seluruh cluster dalam set data, maka Silhouette Index SI dapat digunakan untuk memvalidasi baik sebuah data, cluster tunggal satu cluster dari sejumlah cluster, atau bahkan keseluruhan cluster. Metode ini paling banyak digunakan untuk memvalidasi cluster yang menggabungkan nilai kohesi dan separasi. Untuk menghitung nilai SI dari sebuah data ke-i, ada 2 komponen yaitu a i dan b i . a i adalah rata – rata jarak ke-i terhadap semua data lainnya dalam satu cluster, sedangkan b i didapatkan dengan menghitung rata – rata jarak data ke-i terhadap semua data dari clusteryang lain tidak dalam satu cluster dengan data ke-i, kemudian yang terkecil [Tan et al, 2006], [Petrovic, 2003]. Berikut formula untuk menghitung a i : = 1 − 1 , � �=1 �≠ , = 1,2, … , … … … … … … … … 2.5 , � adalah jarak data ke-i dengan data ke-r dalam satu clusterj, sedangkan adalah jumlah data dalam cluster ke-j. Berikut formula untuk menghitung b i : PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI = min =1, …, ≠ 1 , � �=1 � ≠ , = 1, 2, … , … … … … … … … … 2.6 Untuk mendapatkan Silhouette Index SI data ke-i menggunakan persamaan berikut : �� = − max{ , } … … … … … … … … 2.7 Nilai a i mengukur seberapa tidak mirip sebuah data dengan cluster yang diikutinya, nilai yang semakin kecil menandakan semakin tepatnya data tersebut berada dalam cluster tersebut. Nilai b i yang besar menandakan seberapa jeleknya data terhadapcluster yang lain. Nilai SI yang didapat dalam rentang [-1, +1]. Nilai SI yang mendekati 1 menandakan bahwa data tersebut semakin tepat berada dalam cluster tersebut. Nilai SI negatif a i b i menandakan bahwa data tersebut tidak tepat berada dalam cluster tersebut karena lebih dekat ke cluster yang lain.SI bernilai 0 atau mendekati 0 berarti data tersebut posisinya berada di perbatasan di antara dua cluster. Untuk nilai SI dari sebuah cluster didapatkan dengan menghitung rata – rata nilai SI semua data yang bergabung dalam cluster tersebut, seperti pada persamaan berikut : �� = 1 �� =1 … … … … … … … … 2.8

2.4 Bank