Analisis Klaster Ukuran Kemiripan

9 frekuensi makan dalam sehari, biaya kesehatan, pendidikan tertinggi kepala rumah tangga, dan tabungan [12].

2.3 Analisis Klaster

Analisis klaster merupakan teknik multivariate banyak variabel yang berfungsi mengelompokkan beberapa variabel atau objek [9]. Dalam analisis klaster, ingin mengetahui pengaruh dari setiap variabel bebas, baik secara individu maupun bersama terhadap variabel tidak bebas. Tujuan utama analisis klaster adalah mengklasifikasi objek seperti orang, produk atau barang, perusahaan, ke dalam kelompok-kelompok yang homogeny dan didasarkan pada suatu set variabel yang dipertimbangkan untuk diteliti. Pembentukan klaster didasarkan pada kuat tidaknya hubungan antar variabel. Suatu objek dimasukkan ke dalam suatu klaster atau kelompok sehingga lebih berhubungan berkorelasi dengan objek lainnya di dalam klasternya dibandingkan dengan objek di klaster lain. Terdapat dua metode dalam analisis klaster, yaitu metode hirarki dan metode non-hirarki. Pada metode non-hirarki umumnya digunakan jika banyaknya satuan pengamatan besar dan banyaknya klaster telah ditentukan sebelumnya. Sedangkan pada metode hirarki banyaknya satuan pengamatan tidak begitu besar dan banyaknya klaster tidak ditentukan sebelumnya. 10

2.4 Ukuran Kemiripan

Ukuran kemiripan yang biasa digunakan dalam analisis klaster adalah jarak Euclidean dan jarak Mahalanobis [4]. Jarak Euclidean digunakan jika variabel amatan saling bebas atau tidak berkorelasi satu sama lain tidak terjadi multikolinieritas. Namun jika terjadi multikolinieritas, dapat diatasi dengan mentransformasi data menggunakan Principle Component Analysis PCA karena bila data yang digunakan dalam analisis klaster adalah data skor komponen dari hasil PCA, maka tidak akan ditemukan lagi adanya Multikolinieritas [7]. Jarak Euclidean dirumuskan sebagai berikut : d i,j = ∑ − i= 1...471 ; j = 1 ... 7 2.1 dimana d i,j = jarak antara objek i dan objek j x ik = nilai objek i pada variabel ke k x jk = nilai objek j pada variabel ke k p = banyak variabel yang diamati Jika terjadi multikolinieritas selain dengan mentransformasi data dengan PCA dapat juga menggunakan ukuran jarak Mahalanobis. Jarak Mahalanobis dirumuskan sebagai berikut : di,j = − − = 1,2,3, . .471 ; = 1,2,3, . . ,7 2.2 dengan x i dan x j sebagai vektor dari nilai objek i dan j, sedangkan S merupakan matriks kovarian. 11

2.5 K-Means Klaster