18
3.3 Uji Multikolinieritas
Uji multikolinieritas dilakukan untuk mengetahui ada tidaknya korelasi
antar variabel.
Uji multikolinieritas
dilakukan dengan
menggunakan nilai Variance inflation factor VIF. Jika nilai VIF lebih besar dari 5, maka variabel tersebut mempunyai permasalahan
multikolinieritas dengan variabel bebas lainnya [10].
3.4 Uji Normal Multivariate
Pengujian asumsi normal multivariate dilakukan pada masing- masing data tiap klaster untuk mengetahui apakah data pada tiap klaster
tersebut menyebar mengikuti sebaran normal multivariate, dengan langkah- langkah sebagai berikut :
a. Menghitung jarak Mahalanobis d
i 2
pada kelompok ke-i dengan persamaan :
d
i 2
= x
i
-
T
S
-1
x
i
- i = 1, 2, ..., n
3.1 d
i 2
= jarak Mahalanobis
x
i
=
vektor kolom berisi nilai-nilai pengamatan = vektor kolom berisi rataan kelompok ke-i
S = matriks kovarians
b. Mengurutkan d
i 2
dari yang terkecil ke terbesar sehingga d
1 2
d
2 2
.... d
n 2
dengan n menyatakan jumlah amatan. c. Untuk setiap nilai d
i 2
, dihitung
,
d. Mencari nilai χ
2
untuk setiap persentil dari sebaran χ
2
dengan p derajat bebas pada tabel Khi-kuadrat.
19 e.
Membuat plot antara χ
2
dengan d
i 2
Jika x ~ N
p
,
maka x
i
-
t
S
-1
x
i
- ~ χ
2 p
Apabila plot antara jarak Mahalanobis dan Khi-kuadrat mengikuti pola garis lurus maka dapat dikatakan bahwa data berdistribusi normal
multivariate [6].
3.5 Metode Kerja
Setelah data diperoleh, langkah selanjutnya adalah melakukan analisis data dengan menggunakan metode K-Means klaster dan K-Median
klaster. Tahapan analisis yang dilakukan sebagai berikut :
1. Menentukan banyaknya klaster yang akan dibentuk. Dalam penelitian ini klaster yang ingin dibentuk adalah 2 klaster.
2. Lakukan metode pengklasteran K-Means dan K-Median dengan k klaster yang didapat pada langkah 1. Tahapan yang dilakukan pada metode k-
means adalah sebagai berikut : a. Menentukan pusat klaster awal secara acak.
b. Menghitung jarak antara setiap objek dengan pusat klaster c. Masukkan tiap objek ke satu klaster yang memiliki jarak terdekat
dengan pusat klasternya. d. Menghitung kembali pusat klaster yang terbentuk.
e. Ulangi dari langkah b sampai tidak ada perpindahan objek antar klaster.
20 3. Mendeskripsikan karakteristik klaster.
Dalam mendeskripsikan klaster digunakan persamaan X =
∑
i = 1,2,3...n j=1,2,3...q
3.2 dengan X = Rata-rata sampel rata-rata variabel pada klaster tertentu.
n
j
= banyak anggota pada klaster ke-j. x
ij
= nilai data ke-i pada variabel ke-j 4. Uji Variance
Uji Variance dilakukan untuk melihat apakah variabel-variabel yang telah membentuk klaster memiliki perbedaaan pada tiap klaster, serta
untuk melihat variabel yang paling berpengaruh terhadap pembentukan klaster [9]. Hal ini dapat dilihat dengan menggunakan konsep sebagai
berikut :
= = 1,2
3.3 = rata-rata setiap variabel pada klaster ke-i
= jumlah anggota pada klaster ke-i
=
∑ ∑
3.4 = rataan populasi dari variabel
= banyaknya klaster
=
3.5 = rata-rata populasi
= nilai data ke-j pada variabel ke-k
21
=
∑
= 1,2
3.6 = variansi pada klaster ke-i
= nilai data ke-j pada klaster ke-i
Internal homogenity variance within cluster .
=
∑ 3.7
= variansi dalam klaster External homogenity variance between cluster
.
=
∑ 3.8
= variansi antar klaster =
3.9 Semakin besar nilai
suatu variabel, maka semakin besar perbedaan variabel tersebut pada ketiga klaster yang terbentuk. Hal ini dapat
digunakan sebagai metode pembanding untuk mengetahui metode pengelompokkan mana yang lebih baik. Semakin besar nilai
pada setiap variabel maka semakin baik metode pengelompokkan tersebut.
5. Analisis Diskriminan Analisis Diskriminan digunakan sebagai metode pembanding dalam
mengetahui seberapa besar ketepatan pengklasteran antara metode k- means dengan k-median. Hal ini dapat dilihat dari besar nilai ketepatan
klasifikasi. Jika nilai ketepatan klasifikasi semakin besar, maka
22 pengklasteran semakin baik. Sedangkan jika nilai ketepatan klasifikasi
semakin kecil, maka pengklasteran kurang baik.
Tabel 3.1. Tabel klasifikasi
D Prediksi
Total 1
2 Aktual
1 C11
C12 C11+C12
2 C21
C22 C21+C22
D = diskriminan Menghitung
seberapa besar
ketepatan klasifikasi
dengan menggunakan Correct Classification Rate CCR. CCR merupakan
persentase ketepatan nilai amatan dan dugaannya, CCR dihitung dengan persamaan sebagai berikut :
CCR = Jumlah prediksi yang tepat x 100 Jumlah data
CCR =
, ,
∑ ∑
x 100 3.10
Menghitung persentase kesalahan dalam klasifikasi dihitung menggunakan APER yaitu sebagai berikut :
APER =
, ,
∑ ∑
x 100 3.11
Semakin kecil nilai APER maka tingkat ketepatan klasifikasi semakin baik.
23
3.6 Alur Penelitian