Analisis Gerombol TINJAUAN PUSTAKA
11 diinginkan belum diketahui. Sedangkan teknik tak berhirarki digunakan bila banyaknya
cluster
yang diinginkan telah diketahui. Secara umum langkah-langkah yang digunakan pada teknik berhirarki adalah:
1. Mulai dengan n gerombol, di mana tiap
cluster
hanya mengandung objek tunggal dan sebuah matriks jarak kemiripan D=
d
ik
2. Cari matriks jarak untuk pasangan
cluster
paling mirip. Jarak antara
cluster
r dan s yang paling mirip menjadi
d
rs
3. Gabung
cluster
r dan s ke dalam
cluster
baru rs. Perbarui elemen dalam matriks jarak dengan:a hapus baris dan kolom yang menghubungkan
cluster
r dan s, b tambahkan sebuah baris dan kolom yang memberi jarak antara gerombol rs dan
cluster
yang tersisa 4.
Ulangi langkah 2 dan 3 sampai n-1 kali sehingga semua objek terbentuk dalam satu
cluster
. Catat identitas dan level jarak kemiripan pada
cluster
yang digabung.
Metode penggabunganpautan dalam
cluster analysis
antara lain
single linkage
,
complete linkage
,
average linkage
,
ward
, dan
centroid
. Teknik dasar masing-masing metode pautan secara singkat diuraikan sebagai berikut.
a
Single linkage
Metode pautan ini didasarkan pada jarak minimum yang sering disebut pendekatan tetangga terdekat
nearest-neighbor
. Jarak minimum antara
cluster
dengan
cluster
lain misalkan
cluster
dituliskan sebagai: = min
� , � dengan
� dan � secara berturut-turut adalah jarak dari
cluster
ke
cluster
dan dari
cluster
ke
cluster cluster
, merupakan jarak terdekat antara
cluster
dan serta
cluster
dan Johnson, 2007. Sebagai contoh misalkan dimiliki matriks jarak Euclidean D, dengan elemen-elemen matriks sebagai berikut:
D = � =
1 2
3 4
5 9
3 6
11 7
5 10
9 2
8 0 maka
cluster
dengan jarak terdekat adalah
cluster
3 dan 5 pertama bergabungterpaut menjadi
cluster
baru yaitu
cluster 35
, selanjutnya dilakukan perhitungan matriks jarak baru. Elemen-elemen matriks jarak baru dihitung dengan perhitungan:
�
351
= min �
31
, �
51
= min 3,11 = 3
12 �
352
= min �
32
, �
51
= min 7,10 = 7 �
354
= min �
34
, �
54
= min 9,8 = 8 sehingga diperoleh matriks baru berikut.
� = 35
1 2
4 3
7 8
9 6
5 0
Prosedur ini akan dilakukan sampai semua pasangan gerombol dengan jarak minimum diperoleh dan bergabung menjadi satu gerombol. Hasil perhitungan akan digambarkan
dalam bentuk dendogram. b
Complete linkage
Metode
complete linkage
memiliki kemiripan dengan metode
single linkage
akan tetapi dalam pembentukan matriks jarak baru didasarkan pada jarak maksimum. Metode
ini sering disebut pendekatan tetangga terjauh
furthest-neighbor
atau metode diameter. Jarak maksimum antara
dengan kelompok lain yaitu kelompok dituliskan sebagai: = max
� , � Dari contoh matriks jarak D sebelumnya, setelah terjadi pautan pada jarak terdekat
pertama yaitu
cluster
3 dan 5, selanjutnya ditentukan matriks jarak baru dengan elemen- elelmen:
�
351
= max �
31
, �
51
= max 3,11 = 11 �
352
= max �
32
, �
51
= max 7,10 = 10 �
354
= max �
34
, �
54
= max 9,8 = 9 sehingga diperoleh matriks jarak baru berikut.
� = 35
1 2
4 11
10 9
9 6
5 0
Prosedur ini akan dilakukan sampai semua pasangan
cluster
bergabung menjadi satu
cluster
. c
Average linkage
Metode
average linkage
memiliki kemiripan dengan
single linkage
dan
complete linkage
, perbedaannya terletak pada perhitungan yang digunakan yaitu jarak rata-rata. Metode ini memiliki syarat menggabungkan pasangan
cluster
dengan nilai varians
13 terkecil. Jarak rata
– rata antara dengan kelompok lain yaitu kelompok dituliskan sebagai:
=
�
� �
� �
dengan �
�
adalah jarak obyek � pada
cluster
dan
cluster
dengan
cluster
tersebut membentuk
cluster
tunggal , dengan obyek pada
cluster
, �
dan � secara
berturut –turut merupakan obyek-obyek dalam
cluster
dan Johnson, 2007 Pembentukan matriks jarak baru dari contoh matriks jarak D sebelumnya setelah
cluster
3 dan 5 terpaut sebagai berikut: �
351
= �
31
+ �
51
2 =
3 + 11 2
= 7 �
352
= �
32
+ �
52
2 =
7 + 10 2
= 8,5 �
354
= �
34
+ �
54
2 =
9 + 8 2
= 8,5 sehingga diperoleh matriks baru berikut.
� = 35
1 2
4 1
7 8,5
8,5 9
6 5 0
Prosedur ini akan dilakukan sampai semua pasangan
cluster
bergabung menjadi satu. d
Ward
Metode
ward
adalah metode yang menggabungkan dua
cluster
dengan banyak pengamatan yang kecil. Jarak antar
cluster
yang digunakan dalam metode ini adalah jumlah kuadrat antara pasangan
cluster
tersebut berdasarkan jumlah semua variabel dari masing-masing
cluster
. Jika merupakan kombinasi kelompok dan kelompok ,
dengan jumlah jarak
cluster
dituliskan sebagai: =
� −
′
� − =
� −
′
� − =
� −
′
� − dengan
, ,
jumlah jarak
cluster
, dan , merupakan vektor kolom
berupa nilai rata-rata obyek ,
= 1,2,3,…,n, = � + � � � + � Rencher, 2002.
14