∑
Ci =
jumlah kolom atribut
∑
Ci =
jumlah kolom kuadrat atribut
∑
R =
jumlah baris atribut
∑
Ri =
jumlah baris kuadrat atribut k = jumlah responden
3. Menentukan Q tabel Q tab, di mana Q tabel yang digunakan adalah dengan 05 . 0 =
α dan derajat kebebasan dk=k-1 yang dapat dilihat pada tabel Chi- Square distribution.
4. Membuat keputusan, di mana keputusan yang dipergunakan dalam pengujian ini adalah Tolak Ho dan terima Ha, jika Q hit Q tab dan terima Ho dan
tolak Ha, jika Q hit Q tab. 5. Mengambil kesimpulan, bila menolak Ho berarti proporsi jawaban Ya masih
berbeda pada semua atribut. Artinya belum ada kesepakatan di antara para responden tentang atribut. Namun bila menerima Ho berarti proporsi jawaban
Ya pada semua atribut dianggap sama. Dengan demikian, semua responden dianggap sepakat mengenai semua atribut sebagai faktor yang
dipertimbangkan.
2.11 PROSES PENGOLAHAN DATA
Pengolahan data yang akan dipergunakan dalam penelitian ini meliputi analisis cluster, dan analisis korespondensi.
2.11.1 ANALISIS CLUSTER
Analisis kluster adalah suatu teknik yang digunakan untuk mengklasifikasikan atau mengelompokkan objek-objek atau kasus - kasus ke
dalam kelompok yang secara relatif mempunyai kesamaan ke dalam kelompok yang disebut kluster. Objek-objek yang berada dalam suatu kluster cenderung
mempunyai kesamaan, sebaliknya objek-objek dalam kluster yang berbeda mempunyai kecenderungan perbedaan. Secara teknis, analisis kluster disebut juga
sebagai analisis klasifikasi atau taksonomi numerik. Dalam analisis kluster tidak ada variabel bebas dan tergantung karena model analisis ini merupakan model
independen.
II - 36
Analisis kluster digunakan untuk mengelompokkan objek-objek berdasarkan karakteristik tertentu yang sama. Objek dapat berupa benda, misalnya
produk ataupun orang yang biasa disebut responden. Kluster sebaiknya mempunyai kesamaan yang tinggi dalam kelompok kluster tersebut tetapi
mempunyai perbedaan yang besar antar kelompok kluster. Ada dua cara untuk mengelompokkan data ke dalam kluster. Cara pertama
disebut metode hirarki Agglomerative dan divisive dan cara kedua disebut metode non hirarki partitioning Jika kita menggunakan metode pertama maka
strategi pengelompokkan data didasarkan pada tingkat kesamaan yang terdekat. Prioritas pertama pertama kali diutamakan pada data yang paling tinggi tingkat
kesamaannya, kemudian diikuti yang tingkat kesamaan nomor dua, kemudian nomor tiga dan seterusnya. Metode hirarki menggunakan cara-cara sebagai
berikut untuk mengelompokkan data: 1.
Hubungan tunggal: mengelompokkan data berdasarkan jarak yang terdekat terlebih dahulu kemudian baru disusul dengan jarak yang lebih jauh.
2. Hubungan lengkap: merupakan kebalikan dari cara yang pertama, yaitu
mengelompokkan data berdasarkan jarak yang paling jauh yang menjadi prioritas utama, kemudian baru diikuti yang berjarak agak jauh dan
seterusnya. 3.
Hubungan rata-rata: metode ini mengelompokkan data berdasarkan rata-rata jarak yang diperoleh dari rata-rata semua jarak antar objek.
4. Metode ward: metode ini menggunakan formula jumlah kuadrat dari jarak
antara dua kluster 5.
Metode centroid: metode ini menggunakan centroid antara dua kluster. Yang dimaksud dengan centroid ialah rata-rata jarak pada suatu kluster yang
diperoleh dengan cara membuat rata-rata pada semua anggota dalam suatu kelompok kluster tertentu.
Dalam proses clustering, teknik yang dapat dilakukan untuk pengukuran jarak Dillon and Goldstein, 1984, antara lain:
1. Interval
a. Euclidian Distance
DX,Y = √
∑
X
i
– Y
i 2
2.4
II - 37
b. Squared Euclidian Distance
DX,Y =
∑
X
i
– Y
i 2
2.5 c.
Cosine SX,Y =
∑
X
i
Y
i
√
∑
X
i 2
∑
Y
i 2
2.6 d.
Pearson Correlation SX,Y =
∑
Z
Xi
Z
Yi
N-1 2.7
e. Chebychev
DX,Y = max │X
i
– Y
i
│ 2.8
f. Block
DX,Y =
∑
│X
i
– Y
i
│ 2.9
g. Minkowski
DX,Y = [
∑
│X
i
– Y
i
│
p
]
1p
2.10 h.
Customized DX,Y = [
∑
│X
i
– Y
i
│
p
]
1r
2.11 Langkah-langkah analisis cluster dapat dibagi dalam enam tahap Hair et
al, 1998, yaitu: 1. Penentuan tujuan analisis
Tujuan analisis cluster terbagi menjadi tiga, yaitu taxonomy description yang merupakan analisis cluster dilakukan dengan tujuan eksplorasi exploratory
purpose , yaitu untuk mengklasifikasikan objek-objek ke dalam beberapa grup,
data simplification adalah analisis cluster yang dilakukan untuk menyederhanakan
data, yaitu dengan mereduksi jumlah observasi bagi keperluan analisis selanjutnya dan relationship identification yaitu analisis cluster yang dilakukan untuk
mengidentifikasi hubungan, yaitu dengan mengidentifikasi hubungan kemiripan similarity dan perbedaan differences.
2. Penyusunan desain riset analisis Desain riset analisis cluster meliputi pendeteksian outlier, pengukuran
kemiripan objek dan penstandarisasian data. Dalam pendeteksian outlier, outlier dapat mengubah struktur asli dan menghasilkan cluster yang tidak representatif
terhadap struktur populasi yang sesungguhnya, oleh karena itu pendeteksian terhadap outlier sangat diperlukan. Outlier dapat dideteksi dengan menggunakan
II - 38
grafik, di mana dari grafik tersebut dapat diketahui adanya objek-objek yang mempunyai profil yang berbeda, yang ditunjukkan dari nilai yang sangat ekstrim
pada satu atau beberapa variabel. Pada analisis cluster, konsep kemiripan adalah sangat mendasar. Kemiripan interobjek adalah pengukuran kesesuaian atau
kemiripan antara objek yang akan dikelompokkan. Kemiripan interobjek dapat dilihat dari tiga ukuran, yaitu korelasi dan jarak untuk data metrik, serta asosiasi
untuk data nonmetrik. Untuk mengetahui kemiripan dapat dilihat dari koefisien korelasi antara
pasangan objek. Korelasi yang tinggi mengindikasikan kemiripan, dan sebaliknya korelasi yang rendah mengindikasikan perbedaan. Tetapi, pengukuran korelasi ini
sangat jarang digunakan karena penekanan aplikasi analisis cluster adalah pada jarak objek, bukan pola nilainya.
Pengukuran jarak berdasar kemiripan yang mewakili kemiripan sebagai kedekatan observasi dengan yang lain. Pengukuran jarak sesungguhnya adalah
pengukuran terhadap perbedaan, di mana semakin besar nilainya menunjukkan semakin kurang kemiripannya. Jarak dikonversikan sebagai pengukuran
kemiripan dengan menggunakan hubungan kebalikan. Pengukuran asosiasi berdasar kemiripan digunakan untuk membandingkan
objek yang termasuk data nonmetrik nominal dan ordinal. Pengukuran ini dapat menilai tingkat kepercayaan atau kesesuaian antara pasangan responden. Sebelum
proses penstandarisasian data dimulai, perlu ditentukan lebih dahulu apakah data perlu distandarisasi atau tidak. Pertimbangannya antara lain kebanyakan
pengukuran jarak sangat peka terhadap perbedaan skala atau besarnya variabel, variabel dengan standar deviasi yang besar mempunyai pengaruh yang lebih
terhadap nilai akhir kemiripan dan bila dilihat melalui grafik, tidak akan terlihat adanya perbedaan pada dimensi sehubungan dengan letaknya.
Proses standarisasi dapat terbagi menjadi dua, yaitu standarisasi variabel dan standarisasi observasiobjek. Standarisasi variabel adalah perubahan dari setiap
variabel menjadi skor standar Z Scores dengan mengurangi mean dan membaginya dengan standar deviasi setiap variabel. Standarisasi observasi
dilakukan terhadap responden atau objek. Standarisasi ini sangat diperlukan, jika
II - 39
cluster ing dilakukan dengan tujuan mengidentifikasi kepentingan relatif suatu
variabel terhadap variabel lainnya. 3. Pengujian asumsi
Analisis cluster tidak termasuk teknik statistik inferensia, di mana parameter analisis ini adalah seberapa besar sampel dapat mewakili populasi. Analisis
cluster mempunyai sifat matematik dan bukan dasar statistik, syarat kenormalan,
linieritas, dan homogenitas tidak begitu penting karena memberikan pengaruh yang kecil sehingga tidak perlu diuji.
Adapun hal-hal yang perlu diuji adalah kerepresentatifan sampel dan multikolonieritas. Dalam kerepresentatifan sampel, sampel dikumpulkan dan
cluster diperoleh dengan harapan dapat mewakili struktur populasi. Baik atau
tidaknya analisis cluster sangat tergantung pada seberapa representatif sampel sehingga terlebih dahulu sampel perlu diuji kerepresentatifannya.
Sementara itu, dalam multikolinieritasan, variabel-variabel yang bersifat multikolinier secara implisit mempunyai bobot lebih besar. Multikolinieritasan
bertindak sebagai proses pembobotan yang berpengaruh pada analisis, sehingga variabel-variabel yang digunakan terlebih dahulu harus diuji tingkat
multikolinieritasannya. 4. Pembentukan cluster partisi dan penilaian overall fit
Proses partisi partitioning dan penilaian overall fit dimulai setelah variabel- variabel yang digunakan dipilih dan matriks korelasi dibentuk. Sebelum proses
dimulai, harus dilakukan pemilihan algoritma pembentukan cluster yang akan digunakan, dan penentuan berapa jumlah cluster yang akan dibentuk.
Algoritma pembentukan cluster terdiri dari prosedur hirarki hierarchical procedures
dan prosedur nonhirarki nonhierarchical procedures. Teknik hirarki, adalah teknik clustering yang membentuk konstruksi hirarki atau berdasarkan
tingkatan tertentu seperti struktur pohon. Jadi proses pengelompokan dilakukan secara bertingkat atau bertahap.
Teknik hirarki terbagi menjadi dua yaitu metode agglomeratif agglomerative methods
dan metode divisif divisive methods. Metode agglomeratif dimulai dengan pernyataan bahwa setiap objek membentuk clusternya masing-masing.
Dua objek dengan jarak terdekat bergabung, selanjutnya objek ketiga akan
II - 40
bergabung dengan cluster yang ada atau bersama objek yang lain membentuk cluster
baru. Hal ini dilakukan dengan tetap memperhitungkan jarak kedekatan antar
objek. Proses akan terus berlanjut hingga akhirnya terbentuk satu cluster yang terdiri dari keseluruhan objek. Sementara itu, metode divisif berlawanan dengan
metode agglomeratif. Metode dimulai dengan satu cluster besar yang mencakup semua observasi objek, kemudian objek yang memiliki ketidakmiripan besar
dipisahkan sehingga membentuk cluster yang lebih kecil, dan seterusnya untuk objek-objek yang tidak mirip lainnya.
Proses pemisahan terus berlanjut hingga setiap observasi adalah cluster bagi dirinya sendiri. Sementara itu, prosedur nonhirarki tidak melibatkan proses
pembentukan konstruksi struktur pohon. Dimulai dengan memilih sejumlah nilai cluster
awal sesuai dengan jumlah yang diinginkan kemudian objek digabungkan ke dalam cluster-cluster tersebut. Metode nonhirarki yang digunakan adalah K-
Means Clustering.
5. Interpretasi hasil Pada tahap ini yang perlu diperhatikan adalah karakteristik apa yang
membedakan masing-masing cluster kemudian sesuai dengan tujuan, pemberian nama dilakukan berdasar apa yang dapat diberikan oleh objek pembentuk kepada
masing-masing cluster tersebut. Tentunya terlebih dahulu perlu ditentukan spesifikasikriteria yang mendasari cluster-cluster yang telah terbentuk. Di
samping itu, interpretasi dari hasil clustering dapat dilakukan terhadap grafik dendogram maupun analisis nilai koefisien agglomeratif.
Jarak antar pengelompokan sebenarnya merupakan interpretasi dari beberapa nilai kedekatan dalam menggabungkan objek dalam cluster. Interpretasi cluster
menghasilkan lebih dari hanya suatu deskripsi. Interpretasi cluster memberikan penilaian kesesuaian cluster yang terbentuk berdasar teori prioritas atau
pengalaman praktek. Dalam konfirmatori, analisis cluster memberikan pengertian secara langsung terhadap penilaian kesesuaian. Cluster juga memberikan langkah-
langkah untuk membuat suatu penilaian dari segi signifikansi prakteknya.
II - 41
6. Profiling cluster Tahap profiling meliputi penggambaran karakteristik dari setiap cluster untuk
menjelaskan bahwa masing-masing cluster adalah berbeda berdasar dimensi- dimensi tertentu. Analisis profil tidak memfokuskan pada apa yang secara
langsung menentukan cluster tapi karakteristik cluster setelah proses identifikasi. Lebih lanjut, adanya penegasan bahwa karakteristik adalah berbeda secara
signifikan terhadap cluster dan dapat memprediksikan anggota-anggota cluster secara lebih spesifik.
2.11.2 ANALISIS KORESPONDENSI