Merumuskan Masalah Memilih Ukuran Jarak atau Similaritas

1. Mengetahui ada tidaknya perbedaan yang nyata signifikan antar kelompok yang terbentuk, dalam hal ini gerombol yang dihasilkan. 2. Melihat profil serta kecenderungan-kecenderungan dari masing-masing gerombol yang terbentuk. 3. Melihat posisi masing-masing objek terhadap objek lainnya dari gerombol yang terbentuk.

2.1.3 Asumsi Analisis Gerombol

Asumsi yang harus dipenuhi pada analisis gerombol: Santoso, 2010 1. Sampel yang diambil benar-benar bisa mewakili populasi yang ada. Memang tidak ada ketentuan jumlah sampel yang representatif, namun tetaplah diperlukan sejumlah sampel yang cukup besar agar proses clustering bisa dilakukan dengan benar. 2. Multikolinearitas, yaitu kemungkinan adanya korelasi antar objek. Sebaiknya tidak ada atau seandainya ada, besar multikolinearitas tersebut tidaklah tinggi misal di atas 0,5. Jika sampai terjadi multikolinearitas, dianjurkan untuk menghilangkan salah satu variabel dari dua variabel yang mempunyai korelasi cukup besar.

2.1.4 Melakukan Analisis

Gerombol Analisis gerombol ini terdiri dari beberapa proses dasar, yaitu :

1. Merumuskan Masalah

Hal yang paling penting di dalam perumusan masalah analisis gerombol ialah pemilihan variabel-variabel yang akan dipergunakan untuk penggerombolan pembentukan gerombol. Memasukkan satu atau dua variabel yang tidak relevan Universitas Sumatera Utara dengan masalah penggerombolanpengelompokan akan mendistorsi hasil penggerombolan yang kemungkinan besar sangat bermanfaat. Pada dasarnya set variabel yang akan dipilih harus menguraikan kemiripan antara objek, yang memang benar-benar relevan dengan masalah riset pemasaran. Variabel harus dipilih berdasarkan penelitian sebelumnya, teori atau suatu pertimbangan berkenaan dengan hipotesis yang akan diuji. Di dalam riset eksplorasi peneliti harus menggunakan pertimbangan dan intuisi.

2. Memilih Ukuran Jarak atau Similaritas

Oleh karena tujuan penggerombolan ialah untuk mengelompokkan objek yang mirip dalam gerombol yang sama, maka beberapa ukuran diperlukan untuk mengakses seberapa mirip atau berbeda objek-objek tersebut. Pendekatan yang paling biasa ialah mengukur kemiripan dinyatakan dalam jarak distance antara pasangan objek Supranto, 2004. Objek dengan jarak yang lebih pendek antara mereka akan lebih mirip satu sama lain dibandingkan dengan pasangan dengan jarak yang lebih panjang. Ada 3 metode yang digunakan : Santoso, 2010 a. Mengukur korelasi antara sepasang objek pada beberapa variabel. Cara ini sebenarnya sederhana; jika beberapa data memang akan ‘tergabung’ menjadi satu gerombol, tentulah di antara data tersebut ada hubungan yang erat, atau disebut berkorelasi satu dengan yang lain. Metode ini mendasarkan besaran korelasi antara data untuk mengetahui kemiripan data satu dengan yang lain. Universitas Sumatera Utara b. Mengukur jarak distance antara dua objek. Pengukuran ada bermacam- macam, yang paling popular adalah metode Euclidean Distance. Pada dasarnya, cara ini memasukkan sebuah data ke dalam gerombol tertentu dengan mengukur ‘jarak’ data tersebut dengan pusat gerombol. Jika data ada dalam jarak yang masih ada dalam batas tertentu, data tersebut dapat dimasukkan pada gerombol tersebut. c. Mengukur asosiasi antar-objek. Pada dasarnya, cara ini akan mengasosiasikan sebuah data dengan gerombol tertentu; dalam praktek, cara ini tidak sepopuler kedua cara sebelumnya. Korelasi dan distance digunakan jika data adalah metrik, sedangkan asosiasi digunakan jika data adalah non-metrik. Dalam praktek, penggunaan metode Euclidean Distance adalah yang paling popular.

3. Melakukan Proses Standarisasi Data Jika Diperlukan