Konsep Clustering Analisis Cluster

2.4 Algoritma Agglomerative Hierarchical Clustering AHC

Agglomerative Hierarchical Clustering AHC adalah metode pengelompokan berbasis hirarki dengan pendekatan bottom up, yaitu proses pengelompokan dimulai dari masing-masing data sebagai satu buah cluster, kemudian secara rekursif mencari cluster terdekat sebagai pasangan untuk bergabung sebagai satu cluster yang lebih besar. Prasetyo, 2014 Algoritma Agglomerative Hierarchical Clustering AHC dapat dijelaskan sebagai berikut Prasetyo, 2014 : 1. Hitung matriks kedekatan berdasarkan jenis jarak yang digunakan 2. Ulangi langkah 3 sampai 4, hingga hanya satu cluster yang tersisa 3. Gabungkan dua cluster terdekat berdasarkan parameter kedekatan yang ditentukan 4. Perbarui matriks kedekatan untuk merefleksikan kedekatan diantara cluster- cluster baru dan cluster yang tersisa Pengelompokan berbasis hirarki sering ditampilkan dalam bentuk grafis menggunakan diagram yang mirip pohon tree yang disebut dengan dendogram. Dendogram merupakan diagram yang menampilkan hubungan cluster dan subcluster-nya dalam urutan yang mana cluster yang digabung agglomerative view atau dipecah divisive view. Ada tiga teknik kedekatan yang digunakan Agglomerative Hierarchical Clustering AHC yaitu: 1. Single linkage jarak terdekat Single linkage memberikan hasil bila cluster-cluster digabungkan menurut jarak antara anggota-anggota yang paling dekat diantara dua cluster. Pengukuran jarak cluster dalam single linkage menggunakan formula jarak minimal. Teknik ini bagus untuk menangani set data yang distribusi datanya non-elips, tapi sangat sensitif terhadap noise dan outlier. dU,V = min {dU,V}; dU,V ϵ D .......................... 2.6 di mana: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI dU,V : jarak antar-cluster U dan V min{dU,V} : nilai minimum dari dari cluster U dan V 2. Complete linkage jarak terjauh Complete linkage terjadi bila kelompok-kelompok digabungkan menurut jarak antara anggota-anggota yang paling jauh di antara dua cluster. Pengukuran jarak cluster dalam complete linkage menggunakan formula jarak maksimal. Teknik ini kurang peka terhadap noise dan outlier, tetapi bagus untuk data yang mempunyai distribusi bentuk bulat. dU,V = max {dU,V}; dU,V ϵ D .......................... 2.7 Keterangan : dU,V : jarak antar-cluster U dan V max{dU,V} : nilai maksimum dari dari cluster U dan V 3. Average linkage jarak rerata Average linkage digabungkan menurut jarak-rata-rata antara pasangan- pasangan anggota masing-masing pada himpunan diantara dua cluster. Pengukuran jarak cluster dalam average linkage menggunakan formula jarak rerata. Teknik ini merupakan pendekatan yang mengambil pertengahan di antara single linkage dan complete linkage. dU,V = 1 x {dU,V}; dU,V ϵ D ........................ 2.8 Keterangan : n u : jumlah data pada cluster U n v : jumlah data pada cluster V dU,V : jarak antar-cluster U dan V PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI