16
2.10 Analisis Gerombol
Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N buah individu atau objek yang mempunyai p peubah dan N objek
tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang diamati sehingga individu atau objek yang terletak dalam satu gerombol memiliki
kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain Dillon Goldstein, 1984.
Pengukuran jarak yang paling dikenal yaitu jarak Euclidean yang digunakan jika tidak ada korelasi antar peubah yang diminati. Jika terjadi korelasi
antar peubah maka perlu dilakukan Analisis Komponen Utama Principle Component terlebih dahulu atau dapat juga menggunakan konsep jarak lain seperti
jarak Mahalanobis, dan sebagainya. Teknik penggerombolan terdiri dari hirarki dan tidak berhirarki. Teknik
hirarki digunakan untuk mencari struktur penggabungan dari objek-objek, sedangkan teknik tidak berhirarki digunakan apabila jumlah gerombol yang
diinginkan diketahui. Teknik hirarki terdiri atas dua yaitu secara agglomerative penggabungan,
dimana masing-masing objek dianggap satu kelompok kemudian antar kelompok yang jaraknya berdekatan bergabung menjadi satu kelompok, dan secara divise
pemecahan yaitu pada awalnya semua objek berada dalam satu gerombol setelah itu sifat paling beda dipisahkan dan membentuk satu gerombol yang lain. Proses
berlanjut sampai semua objek tersebut masing-masing membentuk satu gerombol. Dalam proses penggabungan gerombol dengan metode hirarki selalu
diikuti dengan perbaikan matriks jarak matriks kesamaan. Metode perbaikan jarak antara lain :
1. Single Lingkage Metode ini mengelompokkan dua objek yang mempunyai jarak terdekat
terlebih dahulu. 2. Complete Lingkage
Metode ini justru akan mengelompokkan dua objek yang mempunyai jarak terjauh terlebih dahulu.
17 3. Average Lingkage
Metode ini akan mengelompokkan objek berdasar jarak rata-rata yang didapat dengan melakukan rata-rata semua jarak objek terlebih dahulu.
4. Ward’s Method Pada metode ini, jarak antar dua cluster yang terbentuk adalah sum of squares
di antara dua cluster tersebut. 5. Centroid Method
Pada metode ini, jarak antar dua cluster adalah jarak di antara centroid cluster- cluster tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster,
yang didapat dengan melakukan rata-rata pada semua anggota suatu cluster tertentu. Dengan metode ini, setiap terjadi cluster baru, segera terjadi
perhitungan ulang centroid, sampai terbentuk cluster tetap. Hasil dari analisis disajikan dalam bentuk dendogram. Pemotongan
dendogram dapat dilakukan pada selisih jarak penggabungan yang terbesar.Asumsi dari analisis gerombol adalah :
1. Data bebas dari oulierpencilan. 2. Tidak terjadi perbedaan satuan yang mencolok antar peubah.
BAB III KONDISI UMUM LOKASI