Analisis Gerombol Cluster Analysis

28 digunakan jika terdapat analisis lanjutan setelah PCA. Pada umumnya, PC scores ke-1 dan ke-2 atau selanjutnya dapat dibandingkan, maka PC scores ini perlu dibakukan untuk menghilangkan keragaman antar komponen ke-i. Persamaan untuk pembakuan tersebut adalah : λ scores PC baku scores PC = PCA dapat digunakan sebagai analisis antara maupun analisis akhir. PCA sebagai analisis antara dapat menghilangkan multikolinearitas data dan menyederhanakan satu set data dengan variabel besar. Sedangkan PCA sebagai analisis akhir berfungsi dalam pengelompokkan variabel-variabel penting dari satu kelompok variabel penduga pada suatu fenomena sekaligus pemahaman akan struktur dan hubungan antar variabel.

2.8. Analisis Gerombol Cluster Analysis

Analisis gerombol Cluster Analysis akan mengelompokkan individu- individu sampel ke dalam beberapa gerombolkelas yang relatif homogen, sehingga segugus data yang multivariabel dapat digambarkan secara sederhana dengan ciri, sifat, dan karakteristik yang hampir sama atau relatif mirip. Analisis gerombol dapat dilakukan untuk tujuan : 1 menggali data atau eksplorasi data, 2 mereduksi data menjadi gerombol data baru dengan jumlah lebih kecil, 3 men-generalisasikan suatu populasi untuk memperoleh suatu hipotesis, dan 4 menduga karakteristik data-data. Menurut Sharma 1996, terdapat dua teknik penggerombolan dalam analisis gerombol, yaitu metode berhirarki hierarchical clustering method dan metode tak berhirarki non hierarchical clustering method. 29 Teknik hirarki terdiri dari dua metode, yaitu metode pengelompokkan agglomerative dan metode pembagian divisive. Metode berhirarki dilakukan jika jumlah gerombol yang ditentukan sudah diketahui. Unit-unit analisis yang dikelompokkan akan bergerombol sesuai dengan kedekatankemiripan karakteristiknya masing-masing. Pembentukan kelompok dengan metode agglomeratif ini dapat digambarkan dalam suatu diagram pohon Tree Diagram atau dendogram. Beberapa metode yang populer digunakan pada hierarchical clustering method antara lain : centroid method, nearest-neighbour or single linkage method, farthest-neighbour or complete linkage method, average linkage method , dan ward’s method Sharma, 1996. Pada penelitian ini digunakan Metode Ward’s, yang mana penggabungan antara dua gerombol data dilakukan dengan menghitung jumlah kuadrat jarak dari kedua gerombol hipotesis. Teknik penggerombolan non hirarki dilakukan dengan metode K-means- clustering dan disajikan dalam bentuk Scatterplot K-means method. Metode ini digunakan jika jumlah gerombol belum diketahui. Penggerombolan selanjutnya dilakukan terhadap seluruh unit berdasarkan seluruh karakteristik yang diamati. Ukuran kehomogenitasan atau kemiripan individu-individu tersebut didasarkan pada jauh dekatnya jarak antar variabel. Semakin dekat jaraknya maka individu-individu yang berada di dalam satu gerombol tersebut akan semakin mirip. Ukuran kemiripannya dirumuskan dengan Squared Eucledian Distance IJ D . Semakin kecil nilai IJ D maka akan semakin besar nilai kemiripan yang terjadi didalamnya, dan sebaliknya. Nilai eucledian distance dalam suatu individu 30 umumnya diabaikan. Perumusan umum nilai eucledian distance adalah : ∑ = − = p i j i IJ Z Z D 1 2 , untuk kasus multivariabel dan univariabel; dimana : IJ D adalah jarak eucledian antara unit spasial i dan j i Z dan j Z adalah atribut dari spasial i dan j kasus univariabel mi Z dan mj Z adalah nilai atribut dari unit spasial i dan j untuk peubah m Z dalam kasus multivariabel mi Z dan mj Z adalah nilai dari mi Z dan mj Z yang telah distandarkan Asumsi yang harus dipenuhi dalam penggunaan jarak eucledian ini adalah bahwa antar variabel tidak terjadi multicollinearitas atau variabel- variabel yang ada saling tegak lurus orthogonal. Oleh karena itu, data yang digunakan untuk analisis gerombol telah melalui transformasi PCA.

2.9. Analisis Fungsi Diskriminan Discriminant Function Analysis