2.4 Algoritma Agglomerative Hierarchical Clustering AHC
Agglomerative Hierarchical
Clustering AHC
adalah metode
pengelompokan berbasis hirarki dengan pendekatan bottom up, yaitu proses pengelompokan dimulai dari masing-masing data sebagai satu buah cluster,
kemudian secara rekursif mencari cluster terdekat sebagai pasangan untuk bergabung sebagai satu cluster yang lebih besar. Prasetyo, 2014
Algoritma Agglomerative Hierarchical Clustering AHC dapat dijelaskan sebagai berikut Prasetyo, 2014 :
1. Hitung matriks kedekatan berdasarkan jenis jarak yang digunakan
2. Ulangi langkah 3 sampai 4, hingga hanya satu cluster yang tersisa
3. Gabungkan dua cluster terdekat berdasarkan parameter kedekatan yang
ditentukan 4.
Perbarui matriks kedekatan untuk merefleksikan kedekatan diantara cluster- cluster baru dan cluster yang tersisa
Pengelompokan berbasis hirarki sering ditampilkan dalam bentuk grafis menggunakan diagram yang mirip pohon tree yang disebut dengan dendogram.
Dendogram merupakan diagram yang menampilkan hubungan cluster dan subcluster-nya dalam urutan yang mana cluster yang digabung agglomerative
view atau dipecah divisive view.
Ada tiga teknik kedekatan yang digunakan Agglomerative Hierarchical Clustering AHC yaitu:
1. Single linkage jarak terdekat
Single linkage memberikan hasil bila cluster-cluster digabungkan menurut jarak antara anggota-anggota yang paling dekat diantara dua cluster.
Pengukuran jarak cluster dalam single linkage menggunakan formula jarak minimal. Teknik ini bagus untuk menangani set data yang distribusi datanya
non-elips, tapi sangat sensitif terhadap noise dan outlier.
dU,V = min {dU,V}; dU,V ϵ D .......................... 2.6
di mana: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
dU,V : jarak antar-cluster U dan V
min{dU,V} : nilai minimum dari dari cluster U dan V
2. Complete linkage jarak terjauh
Complete linkage terjadi bila kelompok-kelompok digabungkan menurut jarak antara anggota-anggota yang paling jauh di antara dua cluster.
Pengukuran jarak cluster dalam complete linkage menggunakan formula jarak maksimal. Teknik ini kurang peka terhadap noise dan outlier, tetapi
bagus untuk data yang mempunyai distribusi bentuk bulat.
dU,V = max {dU,V}; dU,V ϵ D .......................... 2.7
Keterangan : dU,V
: jarak antar-cluster U dan V max{dU,V}
: nilai maksimum dari dari cluster U dan V
3. Average linkage jarak rerata
Average linkage digabungkan menurut jarak-rata-rata antara pasangan- pasangan anggota masing-masing pada himpunan diantara dua cluster.
Pengukuran jarak cluster dalam average linkage menggunakan formula jarak rerata. Teknik ini merupakan pendekatan yang mengambil pertengahan di
antara single linkage dan complete linkage.
dU,V =
1 x
{dU,V}; dU,V ϵ D ........................ 2.8
Keterangan : n
u
: jumlah data pada cluster U n
v
: jumlah data pada cluster V dU,V
: jarak antar-cluster U dan V PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI