Sementara nilai SI global didapatkan dengan menghitung rata-rata nilai SI dari semua Cluster seperti pada persamaan berikut :
�� =
1
∑ ��
=1
......................................2.6 di mana :
j : cluster
k : jumlah cluster
�� : Silhouette Index cluster
SI : Silhouette Index global
Untuk memvalidasi seberapa baik sebuah cluster digunakan metode Silhouette Coefficient SC. Nilai SC didapatkan dengan mencari nilai maksimum SI Global
dari jumlah cluster 2 sampai jumlah cluster n-1, seperti persamaan berikut: �� = �
�� � ..................................2.7 di mana :
SC : Silhouette Coefficient
SI : Nilai Silhouette Global
k : jumlah cluster
Kriteria subjektif pengukuran baik atau tidaknya pengelompokan berdasarkan Silhouette Coefficient SC menurut Kauffman dan Roesseeuw 1990 disajikan
dalam Tabel 3.1
Tabel 3. 1 Kriteria subjetif pengukuran pengelompokan berdasarkan Silhouette Coefficient SC
Nilai SC Interpretasi SC
0,71 - 1,00 Struktur kuat
0,51 - 0,70 Struktur baik
0,26 - 0,50 Struktur Lemah
≤0,25 Struktur buruk
2.4 Algoritma Agglomerative Hierarchical Clustering AHC
Agglomerative Hierarchical
Clustering AHC
adalah metode
pengelompokan berbasis hirarki dengan pendekatan bottom up, yaitu proses pengelompokan dimulai dari masing-masing data sebagai satu buah cluster,
kemudian secara rekursif mencari cluster terdekat sebagai pasangan untuk bergabung sebagai satu cluster yang lebih besar. Prasetyo, 2014
Algoritma Agglomerative Hierarchical Clustering AHC dapat dijelaskan sebagai berikut Prasetyo, 2014 :
1. Hitung matriks kedekatan berdasarkan jenis jarak yang digunakan
2. Ulangi langkah 3 sampai 4, hingga hanya satu cluster yang tersisa
3. Gabungkan dua cluster terdekat berdasarkan parameter kedekatan yang
ditentukan 4.
Perbarui matriks kedekatan untuk merefleksikan kedekatan diantara cluster- cluster baru dan cluster yang tersisa
Pengelompokan berbasis hirarki sering ditampilkan dalam bentuk grafis menggunakan diagram yang mirip pohon tree yang disebut dengan dendogram.
Dendogram merupakan diagram yang menampilkan hubungan cluster dan subcluster-nya dalam urutan yang mana cluster yang digabung agglomerative
view atau dipecah divisive view.
Ada tiga teknik kedekatan yang digunakan Agglomerative Hierarchical Clustering AHC yaitu:
1. Single linkage jarak terdekat
Single linkage memberikan hasil bila cluster-cluster digabungkan menurut jarak antara anggota-anggota yang paling dekat diantara dua cluster.
Pengukuran jarak cluster dalam single linkage menggunakan formula jarak minimal. Teknik ini bagus untuk menangani set data yang distribusi datanya
non-elips, tapi sangat sensitif terhadap noise dan outlier.
dU,V = min {dU,V}; dU,V ϵ D .......................... 2.6
di mana: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI