objek sekaligus simultaneously. Variabel adalah karakteristik, sifat, simbol, atau atribut yang diukur, yang di kepadanya diberi nilai. Variat itu sendiri adalah kombinasi linier variabel-variabel yang
memiliki bobot yang penentuannya bobot tersebut dilakukan secara empiris Zikmund, 2000. Dengan pengertian ini, analisis multivariat merupakan perluasan dari analisis univariat dan bivariat.
Analisis ini dapat menganalisis pengaruh beberapa variabel terhadap variabel-variabel lainnya dalam waktu yang bersamaan.
Mengenai pengertian multivariat, hingga saat ini belum terdapat kesepakatan antara para ahli. Beberapa ahli menyederhanakan pengertian analisis multivariat sebagai hubungan antara atau di
antara lebih dari dua variabel. Agar benar-benar multivariat, semua variabel harus acak random, terdapat interrealasi sesamanya, dan efek masing-masing variabel secara sendiri-sendiri sulit
diinterpretasikan. Beberapa ahli lain mengatakan tujuan tujuan analisis ini adalah mengukur, menerangkan, dan memprediksi tingkat relasi di antara variat-variat. Apa saja bentuk bentuk analisis
yang menggunakan banyak variabel dan variat, dimasukkan sebagai analisis multivariat. Berbagai teknik multivariat yang telah diterima sangat luas adalah principal component dan common factor
analysis, multiple regression dan multiple correlation, multiple discriminant analysis, multivariate
analysis of variance and covaroance, conjoint analysis, canonical correlation, custer analysis, multidimension analysis,
dan correspondence analysis Simamora, 2006. Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu analisis dependensi
dan analisis interdependensi. Analisis dependensi berfungsi untuk menerangkan atau memprediksi variabel tergantung dengan menggunakan dua atau lebih variabel bebas. Jenis analisis yang tergolong
ke dalam analisis dependensi terdiri atas analisis regresi linear berganda, analisis diskriminan, analisis multivariat varian MANOVA, dan analisis korelasi kanonikal. Analisis interdependensi berfungsi
untuk memberikan makna terhadap seperangkat variabel atau membuat kelompok-kelompok secara bersama-sama. Jenis analisis yang tergolong ke dalam analisis interdependensi terdiri atas analisis
faktor, analisis kluster, dan analisis multidimensional scalling.
3.12.1 Analisis Klaster Cluster Analysis
Analisis klaster sangat bermanfaat dalam membentuk kelompok-kelompok individu ataupun objek. Teknik ini dipakai untuk mengelompokkan entitas individu maupun objek ke dalam
kelompok-kelompok terpisah, berdasarkan kesamaan-kesamaan similarities di antara mereka Simamora, 2006. Dalam dunia kemometriks chemometrics, analisis klaster cluster analysis
tergolong ke dalam kelompok analisis pengenalan pola pattern recognition Adams, 2004. Objek bisa berupa produk barang atau jasa, benda tumbuhan atau lainnya, serta orang responden atau
konsumen. Objek tersebut akan diklasifikasikan ke dalam satu atau lebih klaster kelompok sehingga objek-objek yang berada dalam satu klaster akan mempunyai kemiripan satu dengan yang lain
Johnson dan Wichern, 2002. Mengklasterkan clustering juga dikenal sebagai unsupervised learning yang membagi data
menjadi kelompok atau cluster berdasarkan suatu kemiripan atrubut-atribut di antara data tersebut. Analisis klaster memerlukan tiga langkah. Langkah pertama, mengidentifikasi kesamaan atau asosiasi
di antara entitas-entitas untuk mengetahui ada berapa grup di dalam sampel. Langkah kedua merupakan proses klaster sebenarnya. Setiap entitas dihubungkan dengan kelompok-kelompok atau
klaster-klaster yang ada. Langkah ketiga, membuat profil individu atau objek untuk mengetahui komposisi mereka. Pada analisis klaster, variat yang ada diartikan sebagai sejumlah variabel
–yang dianggap sebagai karakteristik- yang dipakai untuk membandingkan sebuah objek dengan objek
lainnya. Jadi, dalam analisis klaster tidak dilakukan pencarian nilai variat secara empiris sebagaimana pada teknik-teknik multivariat lainnya Simamora, 2006.
31
Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota cluster dan meminimumkan kesamaan antar anggota cluster yang berbeda Han, 2001. Pada algoritma clustering,
yang banyak dikenal adalah Hierarchical Clustering. Hierarchical Clustering adalah salah satu algoritma clustering yang dapat digunakan untuk mengklaster dokumen. Hasil keseluruhan dari
algoritma hierarchical clustering secara grafik dapat digambarkan sebagai tree, yang disebut dengan dendogram. Tree ini secara grafik menggambarkan proses penggabungan dari cluster yang ada,
sehingga menghasilkan cluster yang lebih tinggi. Berikut ini adalah contoh dendogram Gambar 7. Dendogram biasa disebut tree graph, yaitu perangkat grafik untuk menunjukkan hasil dari
proses pengklasteran. Garis vertikal menunjukkan cluster yang digabungkan bersama. Posisi garis pada skala menunjukkan jarak dimana cluster bergabung. Membaca dendogram dilakukan dari kiri ke
kanan Steinbach, 2007.
Gambar 8. Dendogram analisis klaster hirarki Hal penting dalam metode hirarki adalah bahwa hasil pada tahap sebelumnya selalu bersarang
di dalam hasil pada tahap berikutnya, membentuk sebuah pohon. Ada lima metode aglomerasi dalam pembentukan cluster, yaitu :
a. Pautan Tunggal Single Linkage
Metode ini didasarkan pada jarak minimum. Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek maka keduanya akan ditempatkan pada cluster pertama, dan seterusnya.
Metode ini dikenal pula dengan nama pendekatan tetangga terdekat. b.
Pautan Lengkap Complete Linkage Metode ini disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak maksimum. Dalam
metode ini seluruh objek dalam suatu cluster dikaitkan satu sama lain pada suatu jarak maksimum atau dengan kesamaan minimum.
c. Pautan Rata-rata Average Linkage
Dasar metode ini adalah jarak rata-rata antar observasi. Pengelompokan dimulai dari tengah atau pasangan observasi dengan jarak paling mendekati jarak rata-rata.
d. Metode Ward Ward’s Method
Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat antara dua cluster untuk seluruh variabel. Metode ini cenderung digunakan untuk mengkombinasi cluster-cluster dengan
jumlah kecil. e.
Metode Centroid
32
Pada metode ini jarak antara dua cluster adalah jarak antar centroid cluster tersebut. Centroid cluster
adalah nilai tengah observasi pada variabel dalam suatu set variabel cluster. Keuntungannya adalah outlier hanya sedikit berpengaruh jika dibandingkan dengan metode lain.
3.13 PERMODELAN MATEMATIKA SISTEM DINAMIK