Metode Hierarki Memilih Prosedur Pengclusteran
19
min ,
min ,
Sehingga diperoleh matriks: , ,
,
Jadi dapat disimpulkan, setelah cluster 1, 3, 5 dan 2, 4 digabungkan menjadi satu cluster dari kelima obyek tersebut, 1, 2, 3, 4, 5, dimana jarak terdekat antar
obyek adalah 5. 2 Metode Complete linkage farthest-neighbour method
Pada metode complete linkage, jarak antar cluster ditentukan oleh jarak terjauh farthest-neighbour antara dua obyek dalam cluster yang berbeda.
max ,
2.6 Dimana
dan masing-masing adalah jarak antara anggota yang paling jauh
dari cluster I dan J serta cluster J dan K Johnson Wichern, 1992. Sebagai contoh :
Terdapat matriks jarak antara 5 buah obyek, yaitu :
20
Langkah penyelesaiannya : a Menemukan jarak minimum dalam D = {d
ij
} min
Maka obyek 3 dan 5 digabungkan menjadi cluster 35. b Menghitung jarak antara cluster 35 dengan obyek lainnya.
max ,
max , max
, max ,
max ,
max , Dengan demikian akan terbentuk matriks jarak yang baru :
,
c Mencari obyek dengan jarak terdekat, yaitu 2 dan 4, sehingga terbentuk cluster 24.
max ,
max , max
, min ,
Sehingga matriksnya menjadi: ,
,
Penggabungan berikutnya menghasilkan cluster 124.
21
Pada tahap akhir, cluster 35 dan 124 digabungkan sebagai cluster tunggal, 12345, pada:
max ,
max ,
3 Metode Centroid Centroid adalah rata-rata semua obyek dalam cluster. Pada metode ini,
jarak antarcluster adalah jarak antar centroid. Centroid baru dihitung ketika setiap kali obyek digabungkan, sehingga setiap kali anggotanya bertambah maka
centroidnya akan berubah. Pada metode centroid, jarak antarcluster adalah jarak antar centroid. Centroid adalah rata-rata dari semua anggota dalam cluster
tersebut. Pada saat obyek digabungkan maka centroid baru dihitung, sehingga setiap kali ada penambahan anggota, centroid akan berubah pula Johnson
Wichern, 1992. 4 Metode Average Linkage
Pada metode average linkage, jarak antara dua cluster dianggap sebagai jarak rata-rata antara semua anggota dalam satu cluster dengan semua anggota
cluster lain.
∑ ∑
2.7
Dimana : : jarak antara obyek i pada cluster IJ dan obyek b pada cluster K
: jumlah item pada cluster IJ
22
: jumlah item pada cluster IJ dan K Sebagai contoh:
Terdapat matriks jarak antara 5 buah obyek, yaitu :
Langkah penyelesaiannya a Pasangan obyek yang berdekatan digabungkan menjadi satu cluster,
yaitu obyek 3 dan 5, sehingga menghasilkan cluster 35 b Menghitung jarak obyek 3 dan 5 yang bergabung menjadi satu cluster
dengan responden yang lain:
,
,
Sehingga menghasilkan matriks yang baru ,
, ,
,
23
c Penggabungan berikutnya terjadi pada cluster-cluster yang paling mirip, 2 dan 4, sehingga membentuk cluster yang kedua, yaitu cluster 24. Pada
tahap ini dihitung:
, ,
, ,
, ,
, ,
,
, ,
. ,
,
, ,
,
dan matriks jarak menjadi ,
, ,
, ,
Tahap penggabungan selanjutnya menghasilkan cluster 135. Pada tahap akhir cluster 135 dan 24 akan bergabung menjadi cluster tunggal 13524 pada
tingkat:
, ,
, ,
, ,
,
5 Metode Ward Metode varians bertujuan untuk memperoleh cluster yang memiliki
varians internal cluster yang sekecil mungkin. Metode varians yang umum
24
dipakai adalah metode Ward dimana rata-rata untuk setiap cluster dihitung. Lalu, dihitung jarak Euclidean antara setiap obyek dan nilai rata-rata itu, lalu jarak itu
dihitung semua. Pada setiap tahap, dua cluster yang memiliki kenaikan ‘sum of
squares dalam cluster’ yang terkecil digabungkan Simamora, 2005.
Metode Ward merupakan suatu metode pembentukan cluster yang didasari oleh hilangnya informasi akibat penggabungan obyek menjadi cluster. Hal ini
diukur dengan menggunakan jumlah total dari deviasi kuadrat pada mean cluster untuk setiap pengamatan. Error sum of squares SSE digunakan sebagai fungsi
obyektif. Dua obyek akan digabungkan jika mempunyai fungsi obyektif terkecil diantara kemungkinan yang ada.
∑ ∑
∑ 2.8
Dimana : : nilai untuk obyek ke-i pada cluster ke-j
p : banyaknya variabel yang diukur n : banyaknya obyek dalam cluster yang terbentuk
Langkah penyelesaian dengan metode Ward: a
Dimulai dengan memperhatikan N cluster yang mempunyai satu responden per cluster semua responden dinggap sebagai cluster.
Pada tahap pertama ini SSE bernilai nol. b
Cluster pertama dibentuk dengan memilih dua dari N cluster yang memiliki nilai SSE terkecil.
25
c N-1 kumpulan cluster kemudian diperhatikan kembali untuk
menentukan dua dari cluster ini yang bisa meminimumkan keheterogenan. Dengan demikian N cluster secara sistematik dikurangi
N-1. d
Mengulangi langkah c dan d, sampai diperoleh satu cluster atau semua responden bergabung menjadi satu cluster.
b Metode Devisif Proses dalam metode divisif berkebalikan dengan metode agglomerative.
Metode ini dimulai dengan satu cluster besar yang mencakup semua obyek pengamatan. Selanjutnya, secara bertahap obyek yang mempunyai
ketidakmiripan cukup besar akan dipisahkan ke dalam cluster-cluster yang berbeda. Proses dilakukan sehingga terbentuk sejumlah cluster yang diinginkan,
seperti, dua cluster, tiga cluster, dan seterusnya.