Uji Multikolinieritas Uji Normal Multivariate Metode Kerja

18

3.3 Uji Multikolinieritas

Uji multikolinieritas dilakukan untuk mengetahui ada tidaknya korelasi antar variabel. Uji multikolinieritas dilakukan dengan menggunakan nilai Variance inflation factor VIF. Jika nilai VIF lebih besar dari 5, maka variabel tersebut mempunyai permasalahan multikolinieritas dengan variabel bebas lainnya [10].

3.4 Uji Normal Multivariate

Pengujian asumsi normal multivariate dilakukan pada masing- masing data tiap klaster untuk mengetahui apakah data pada tiap klaster tersebut menyebar mengikuti sebaran normal multivariate, dengan langkah- langkah sebagai berikut : a. Menghitung jarak Mahalanobis d i 2 pada kelompok ke-i dengan persamaan : d i 2 = x i - T S -1 x i - i = 1, 2, ..., n 3.1 d i 2 = jarak Mahalanobis x i = vektor kolom berisi nilai-nilai pengamatan = vektor kolom berisi rataan kelompok ke-i S = matriks kovarians b. Mengurutkan d i 2 dari yang terkecil ke terbesar sehingga d 1 2 d 2 2 .... d n 2 dengan n menyatakan jumlah amatan. c. Untuk setiap nilai d i 2 , dihitung , d. Mencari nilai χ 2 untuk setiap persentil dari sebaran χ 2 dengan p derajat bebas pada tabel Khi-kuadrat. 19 e. Membuat plot antara χ 2 dengan d i 2 Jika x ~ N p , maka x i - t S -1 x i - ~ χ 2 p Apabila plot antara jarak Mahalanobis dan Khi-kuadrat mengikuti pola garis lurus maka dapat dikatakan bahwa data berdistribusi normal multivariate [6].

3.5 Metode Kerja

Setelah data diperoleh, langkah selanjutnya adalah melakukan analisis data dengan menggunakan metode K-Means klaster dan K-Median klaster. Tahapan analisis yang dilakukan sebagai berikut : 1. Menentukan banyaknya klaster yang akan dibentuk. Dalam penelitian ini klaster yang ingin dibentuk adalah 2 klaster. 2. Lakukan metode pengklasteran K-Means dan K-Median dengan k klaster yang didapat pada langkah 1. Tahapan yang dilakukan pada metode k- means adalah sebagai berikut : a. Menentukan pusat klaster awal secara acak. b. Menghitung jarak antara setiap objek dengan pusat klaster c. Masukkan tiap objek ke satu klaster yang memiliki jarak terdekat dengan pusat klasternya. d. Menghitung kembali pusat klaster yang terbentuk. e. Ulangi dari langkah b sampai tidak ada perpindahan objek antar klaster. 20 3. Mendeskripsikan karakteristik klaster. Dalam mendeskripsikan klaster digunakan persamaan X = ∑ i = 1,2,3...n j=1,2,3...q 3.2 dengan X = Rata-rata sampel rata-rata variabel pada klaster tertentu. n j = banyak anggota pada klaster ke-j. x ij = nilai data ke-i pada variabel ke-j 4. Uji Variance Uji Variance dilakukan untuk melihat apakah variabel-variabel yang telah membentuk klaster memiliki perbedaaan pada tiap klaster, serta untuk melihat variabel yang paling berpengaruh terhadap pembentukan klaster [9]. Hal ini dapat dilihat dengan menggunakan konsep sebagai berikut : = = 1,2 3.3 = rata-rata setiap variabel pada klaster ke-i = jumlah anggota pada klaster ke-i = ∑ ∑ 3.4 = rataan populasi dari variabel = banyaknya klaster = 3.5 = rata-rata populasi = nilai data ke-j pada variabel ke-k 21 = ∑ = 1,2 3.6 = variansi pada klaster ke-i = nilai data ke-j pada klaster ke-i Internal homogenity variance within cluster . = ∑ 3.7 = variansi dalam klaster External homogenity variance between cluster . = ∑ 3.8 = variansi antar klaster = 3.9 Semakin besar nilai suatu variabel, maka semakin besar perbedaan variabel tersebut pada ketiga klaster yang terbentuk. Hal ini dapat digunakan sebagai metode pembanding untuk mengetahui metode pengelompokkan mana yang lebih baik. Semakin besar nilai pada setiap variabel maka semakin baik metode pengelompokkan tersebut. 5. Analisis Diskriminan Analisis Diskriminan digunakan sebagai metode pembanding dalam mengetahui seberapa besar ketepatan pengklasteran antara metode k- means dengan k-median. Hal ini dapat dilihat dari besar nilai ketepatan klasifikasi. Jika nilai ketepatan klasifikasi semakin besar, maka 22 pengklasteran semakin baik. Sedangkan jika nilai ketepatan klasifikasi semakin kecil, maka pengklasteran kurang baik. Tabel 3.1. Tabel klasifikasi D Prediksi Total 1 2 Aktual 1 C11 C12 C11+C12 2 C21 C22 C21+C22 D = diskriminan Menghitung seberapa besar ketepatan klasifikasi dengan menggunakan Correct Classification Rate CCR. CCR merupakan persentase ketepatan nilai amatan dan dugaannya, CCR dihitung dengan persamaan sebagai berikut : CCR = Jumlah prediksi yang tepat x 100 Jumlah data CCR = , , ∑ ∑ x 100 3.10 Menghitung persentase kesalahan dalam klasifikasi dihitung menggunakan APER yaitu sebagai berikut : APER = , , ∑ ∑ x 100 3.11 Semakin kecil nilai APER maka tingkat ketepatan klasifikasi semakin baik. 23

3.6 Alur Penelitian