Klasifikasi K-means Analisis Data

kecelakaan dalam kategori hati-hati dengan menggunakan nilai minimal, mean mewakili cluster kecelakaan dalam kategori wasapada, dan nilai maksimal mewakili kecelakaan dalam kategori berbahaya. Proses inisialisasi centroid awal dengan menggunakan metode analogy based estimation penerapan peringkat dapat mempermudah dalam proses pengelompokan data. Mengingat data yang digunakan dalam penelitian ini merupakan array multidimensi dan dibagi atas tiga cluster dimana setiap variabel sangat berpengaruh besar dalam pengelompokan data.

4.3.3 Klasifikasi K-means

1. Menghitung Jarak Objek Ke Centroid Distance

Dalam menghitung jarak objek ke centroid, kita dapat membandingkan hasil dari percobaan menggunakan simpel random sampling dan metode analogy based estimation dilakukan dengan penerapan peringkat. a. Hasil perhitungan jarak menggunakan metode simpel random sampling pada iterasi pertama pada anggota umur 12 tahun. Tabel 4.8 Cluster 1 Metode Acak Tabel 4.9 Cluster 2 Metode Acak Tabel 4.10 Cluster 3 Metode Acak 1 2 3 4 5 6 7 8 9 10 18.35755975 C1 5 5 8 10 5 8 5 15 5 5 C2 23.08679276 10 8 10 15 8 10 8 15 4 2 C3 29.3257566 b. Hasil perhitungan jarak menggunakan metode analogy based estimation dilakukan dengan penerapan peringkat pada iterasi pertama pada anggota umur 12 tahun. Tabel 4.11 Cluster 1 Metode Analogi Tabel 4.12 Cluster 2 Metode Analogi Tabel 4.13 Cluster 3 Metode Analogi Perbandingan hasil antara percobaan menggunakan metode simpele random sampling dan metode analogy based estimation dilakukan dengan penerapan peringkat sekilas sama. Persamaan dari kedua metode tersebut adalah anggota pada umur 12 tahun termasuk dalam kecelakaan kategori hati-hati. Namun terjadi perbedaan jarak variabel ke centroid, dimana metode analogy based estimation dilakukan dengan penerapan peringkat memiliki jarak yang lebih dekat ke cluster kategori rendah dibandingkan dengan perhitungan menggunakan metode simpel random sampling. C1 3.16227766 10 3 3 16 11 4 1 C2 20.19900988 52 3 3 54 2 1 1 37 11 10 C3 82.32860985

2. Cluster Mapping

Pemetaan anggota cluster antara metode analogy based estimation dilakukan dengan penerapan peringkat dan metode simpel random sampling pun berbeda. Tiap cluster memiliki anggota dengan jumlah yang berbeda. a. Hasil pemetaan anggota cluster menggunakan metode simpel random sampling pada iterasi pertama pada anggota umur 12 tahun. Tabel 4.14 Hasil Pemetaan Metode Acak Cluster C1 C2 C3 Jumlah Anggota 28 24 23 b. Hasil pemetaan anggota cluster menggunakan metode analogy based estimation dilakukan dengan penerapan peringkat pada iterasi pertama pada anggota umur 12 tahun. Tabel 4.15 Hasil Pemetaan Metode Analogi Cluster C1 C2 C3 Jumlah Anggota 34 34 7 Hasil pemetaan anggota cluster menggunakan metode simpel random sampling pada setiap cluster mempunyai jumlah anggota yang relatif sama, berbanding terbalik dengan metode analogy based estimation dilakukan dengan penerapan peringkat pada setiap cluster memiliki jumlah anggota yang berbeda. Perbedaan ini menandakan hasil dari perhitungan jarak objek ke centrooid berjalan dengan baik. Hasil dari pemetaan ini sangat menentukan perhitungan centroid baru di mana centroid baru akan menggantikan centroid lama pada proses inisialisasi.

3. Menentukan Centroid Baru

Menentukan centroid baru sangat erat kaitannya dengan cluster mapping atau pemetaan anggota yang dilakukan pada proses sebelumnya. Menentukan centroid baru dimulai dari menjumlahkan variabel dari anggota cluster tertentu, kemudian dibagi jumlah anggota cluster tersebut. Berikut ini perbedaan hasil perhitungan untuk menentukan centroid baru untuk iterasi berikutnya. a. Hasil perhitungan centroid baru menggunakan metode simpel random sampling pada iterasi pertama Tabel 4.16 Hasil Perhitungan C1 Metode Acak Pada Iterasi Pertama Tabel 4.17 Hasil Perhitungan New C1 Metode Acak Pada Iterasi Pertama Tabel 4.18 Hasil Perhitungan C2 Metode Acak Pada Iterasi Pertama Tabel 4.19 Hasil Perhitungan New C2 Metode Acak Pada Iterasi Pertama 1 2 3 4 5 6 7 8 9 10 18.35755975 C1 1.142857 0.5 0.178571 1.785714 0.035714 1.285714 0.321429 0.214286 New C1 5 5 8 10 5 8 5 15 5 5 C2 23.08679276 10.29412 3.176471 2.235294 15.17647 0.176471 0.352941 9.470588 2.764706 2.235294 New C2 Tabel 4.20 Hasil Perhitungan C3 Metode Acak Pada Iterasi Pertama Tabel 4.21 Hasil Perhitungan New C3 Metode Acak Pada Iterasi Pertama b. Hasil perhitungan centroid baru menggunakan metode analogy based estimation dilakukan dengan penerapan peringkat pada iterasi pertama Tabel 4.22 Hasil Perhitungan C1 Metode Analogi Pada Iterasi Pertama Tabel 4.23 Hasil Perhitungan New C1 Metode Analogi Pada Iterasi Pertama Tabel 4.24 Hasil Perhitungan C2 Metode Analogi Pada Iterasi Pertama Tabel 4.25 Hasil Perhitungan New C2 Metode Analogi Pada Iterasi Pertama Tabel 4.26 Hasil Perhitungan C3 Metode Analogi Pada Iterasi Pertama 22.9 5 4.933333 31.33333 0.5 0.133333 0.866667 22.5 5.2 5.133333 New C3 C1 3.16227766 1.142857 0.5 0.178571 1.785714 0.035714 1.285714 0.322045 0.214286 New C1 10 3 3 16 11 4 1 C2 20.19900988 14.97561 4.365854 4.121951 22.36585 0.341463 0.073171 0.682927 16.19512 3.756098 3.512195 New C2 10 8 10 15 8 10 8 15 4 2 C3 29.3257566 Tabel 4.27 Hasil Perhitungan C3 Metode Analogi Pada Iterasi Pertama Perbedaan menggunakan metode juga berpengaruh dalam perhitungan centroid baru. Dimana hasil dari cluster mapping menggunakan metode simpel random sampling dan analogy based estimation dilakukan dengan penerapan peringkat memiliki perbedaan jumlah anggota dari setiap cluster.

4. Proses Perulangan Looping

Dalam proses perulangan looping data yang ada dihitung ulang secara terus menerus untuk mengoreksi jarak antara objek ke centroid. Proses perulangan akan berhenti jika nilai jarak antara objek ke centroid mengalami sedikit perubahan atau bahkan tidak berubah dan setiap cluster memiliki anggota tetap. Perulangan ini memiliki peran sebagai tolak ukur kualitas sebuah pengelompokan data menggunakan k-means clustering. Semakin teliti nilai satu centroid pada cluster tertentu maka seakan baik pula hasil dari pengelompokan data tersebut. Perbandingan antara dua metode yang berbeda dalam proses inisialisasi ini dapat membuktikan bahwa pengelompokan data menggunakan k-means clustering sangat bergantung pada metode sampling pada tahap inisialisasi untuk centroid awal.

a. Proses perulangan Looping menggunakan metode simpel random

sampling 52 3 3 54 2 1 1 37 11 10 C3 82.32860985 41.33333 4.166667 2.833333 46.83333 0.666667 0.166667 0.666667 32.16667 8.166667 8 New C3