33
4.5 Analisis Diskriminan
Untuk mengetahui hasil pengklasteran mana yang lebih baik antara metode klaster k-means dan k-median dilakukan analisis diskriminan
dengan langkah-langkah sebagai berikut : a. Pengujian Asumsi Normal Multivariate
Sebelum melakukan analisis diskriminan terlebih dahulu melakukan pengujian asumsi normal multivariate. Hasil pengujian asumsi normal
multivariate adalah sebagai berikut :
C26 C
2 8
300 250
200 150
100 50
0,12 0,10
0,08 0,06
0,04 0,02
0,00
Scatterplot of khi-kuadrat vs jarak mahalanobis iterasi 1
Gambar 4.1 . Scatter plot khi-kuadrat dengan jarak Mahalonobis
Berdasarkan grafik tersebut, terlihat bahwa terdapat satu nilai yang dideteksi sebagai outlier yaitu data ke 471, maka data tersebut dihilangkan
dari pengamatan.
34 Pada iterasi kedua, setelah menghilangkan data ke 471, didapat hasil
sebagai berikut :
C30 C
3 1
100 80
60 40
20 0,025
0,020 0,015
0,010 0,005
0,000
Scatterplot khi-kuadrat vs jarak mahalanobis iterasi 2
Gambar 4.2. Scatter plot khi-kuadrat dengan jarak Mahalonobis Pada grafik tersebut terlihat bahwa data berkumpul pada suatu garis.
Sehingga dapat dikatakan asumsi normal multivariate sudah terpenuhi. b. Menghitung ketepatan klasifikasi
1. K-means
Tabel 4.11. Ketepatan klasifikasi k-means
D Prediksi
Total 1
2 Aktual
1 390
4 394
2 3
73 76
Berdasarkan persamaan 3.10 maka didapat persentase ketepatan klasifikasi klaster k-means sebagai berikut :
CCR = x 100 = 98,51
35 Berdasarkan persamaan 3.11 persentase kesalahan dalam
pengklasifikasian adalah sebagai berikut : APER =
x 100 = 1,49
Berdasarkan perhitungan tersebut dapat terlihat bahwa nilai ketepatan klasifikasi k-means sangat tinggi dengan tingkat kesalahan
sebesar 1,49. 2. K-median
Tabel 4.12. Ketepatan klasifikasi k-median
D Prediksi
Total 1
2 Aktual
1
89 10
99
2 371
371
Berdasarkan persamaan 3.10 maka didapat persentase ketepatan klasifikasi klaster k-median adalah sebagai berikut :
CCR = x 100 = 97,87
Berdasarkan persamaan 3.11 persentase kesalahan dalam pengklasifikasian adalah sebagai berikut :
APER = x 100 = 2,13
36 Berdasarkan perhitungan tersebut dapat terlihat bahwa nilai
ketepatan klasifikasi k-median sangat tinggi dengan tingkat kesalahan sebesar 2,13.
Berdasarkan tingkat ketepatan klasifikasi terlihat bahwa nilai ketepatan klasifikasi k-means 98,51 lebih baik dibandingkan k-median
97,87.
37
BAB V KESIMPULAN DAN SARAN