28 digunakan jika terdapat analisis lanjutan setelah PCA. Pada umumnya, PC
scores ke-1 dan ke-2 atau selanjutnya dapat dibandingkan, maka PC scores ini
perlu dibakukan untuk menghilangkan keragaman antar komponen ke-i. Persamaan untuk pembakuan tersebut adalah :
λ scores
PC baku
scores PC
= PCA dapat digunakan sebagai analisis antara maupun analisis akhir. PCA
sebagai analisis antara dapat menghilangkan multikolinearitas data dan menyederhanakan satu set data dengan variabel besar. Sedangkan PCA sebagai
analisis akhir berfungsi dalam pengelompokkan variabel-variabel penting dari satu kelompok variabel penduga pada suatu fenomena sekaligus pemahaman akan
struktur dan hubungan antar variabel.
2.8. Analisis Gerombol Cluster Analysis
Analisis gerombol Cluster Analysis akan mengelompokkan individu- individu sampel ke dalam beberapa gerombolkelas yang relatif homogen,
sehingga segugus data yang multivariabel dapat digambarkan secara sederhana dengan ciri, sifat, dan karakteristik yang hampir sama atau relatif mirip. Analisis
gerombol dapat dilakukan untuk tujuan : 1 menggali data atau eksplorasi data, 2 mereduksi data menjadi gerombol data baru dengan jumlah lebih kecil, 3
men-generalisasikan suatu populasi untuk memperoleh suatu hipotesis, dan 4 menduga karakteristik data-data.
Menurut Sharma 1996, terdapat dua teknik penggerombolan dalam analisis gerombol, yaitu metode berhirarki hierarchical clustering method dan
metode tak berhirarki non hierarchical clustering method.
29 Teknik hirarki terdiri dari dua metode, yaitu metode pengelompokkan
agglomerative dan metode pembagian divisive. Metode berhirarki dilakukan jika jumlah gerombol yang ditentukan sudah diketahui. Unit-unit analisis yang
dikelompokkan akan bergerombol sesuai dengan kedekatankemiripan karakteristiknya masing-masing. Pembentukan kelompok dengan metode
agglomeratif ini dapat digambarkan dalam suatu diagram pohon Tree Diagram atau dendogram.
Beberapa metode yang populer digunakan pada hierarchical clustering method
antara lain : centroid method, nearest-neighbour or single linkage method, farthest-neighbour or complete linkage method, average linkage method
, dan ward’s method
Sharma, 1996. Pada penelitian ini digunakan Metode Ward’s, yang mana penggabungan
antara dua gerombol data dilakukan dengan menghitung jumlah kuadrat jarak dari kedua gerombol hipotesis.
Teknik penggerombolan non hirarki dilakukan dengan metode K-means- clustering
dan disajikan dalam bentuk Scatterplot K-means method. Metode ini digunakan jika jumlah gerombol belum diketahui. Penggerombolan selanjutnya
dilakukan terhadap seluruh unit berdasarkan seluruh karakteristik yang diamati. Ukuran kehomogenitasan atau kemiripan individu-individu tersebut
didasarkan pada jauh dekatnya jarak antar variabel. Semakin dekat jaraknya maka individu-individu yang berada di dalam satu gerombol tersebut akan semakin
mirip. Ukuran kemiripannya dirumuskan dengan Squared Eucledian Distance
IJ
D . Semakin kecil nilai
IJ
D maka akan semakin besar nilai kemiripan yang
terjadi didalamnya, dan sebaliknya. Nilai eucledian distance dalam suatu individu
30 umumnya diabaikan. Perumusan umum nilai eucledian distance adalah :
∑
=
− =
p i
j i
IJ
Z Z
D
1 2
, untuk kasus multivariabel dan univariabel; dimana :
IJ
D adalah jarak eucledian antara unit spasial i dan j
i
Z dan
j
Z adalah atribut dari spasial i dan j kasus univariabel
mi
Z dan
mj
Z adalah nilai atribut dari unit spasial i dan j untuk peubah
m
Z dalam
kasus multivariabel
mi
Z dan
mj
Z adalah nilai dari
mi
Z dan
mj
Z yang telah distandarkan Asumsi yang harus dipenuhi dalam penggunaan jarak eucledian ini adalah
bahwa antar variabel tidak terjadi multicollinearitas atau variabel- variabel yang ada saling tegak lurus orthogonal. Oleh karena itu, data yang digunakan untuk
analisis gerombol telah melalui transformasi PCA.
2.9. Analisis Fungsi Diskriminan Discriminant Function Analysis