kecelakaan dalam kategori hati-hati dengan menggunakan nilai minimal, mean mewakili cluster kecelakaan dalam kategori wasapada, dan nilai maksimal
mewakili kecelakaan dalam kategori berbahaya. Proses inisialisasi centroid awal dengan menggunakan metode analogy
based estimation penerapan peringkat dapat mempermudah dalam proses pengelompokan data. Mengingat data yang digunakan dalam penelitian ini
merupakan array multidimensi dan dibagi atas tiga cluster dimana setiap variabel sangat berpengaruh besar dalam pengelompokan data.
4.3.3 Klasifikasi K-means
1. Menghitung Jarak Objek Ke Centroid Distance
Dalam menghitung jarak objek ke centroid, kita dapat membandingkan hasil dari percobaan menggunakan simpel random sampling dan metode analogy
based estimation dilakukan dengan penerapan peringkat. a.
Hasil perhitungan jarak menggunakan metode simpel random sampling pada iterasi pertama pada anggota umur 12 tahun.
Tabel 4.8 Cluster 1 Metode Acak
Tabel 4.9 Cluster 2 Metode Acak
Tabel 4.10 Cluster 3 Metode Acak
1 2
3 4
5 6
7 8
9 10
18.35755975 C1
5 5
8 10
5 8
5 15
5 5
C2 23.08679276
10 8
10 15
8 10
8 15
4 2
C3 29.3257566
b. Hasil perhitungan jarak menggunakan metode analogy based estimation
dilakukan dengan penerapan peringkat pada iterasi pertama pada anggota umur 12 tahun.
Tabel 4.11 Cluster 1 Metode Analogi
Tabel 4.12 Cluster 2 Metode Analogi
Tabel 4.13 Cluster 3 Metode Analogi
Perbandingan hasil antara percobaan menggunakan metode simpele random sampling dan metode analogy based estimation dilakukan dengan penerapan
peringkat sekilas sama. Persamaan dari kedua metode tersebut adalah anggota pada umur 12 tahun termasuk dalam kecelakaan kategori hati-hati. Namun terjadi
perbedaan jarak variabel ke centroid, dimana metode analogy based estimation dilakukan dengan penerapan peringkat memiliki jarak yang lebih dekat ke cluster
kategori rendah dibandingkan dengan perhitungan menggunakan metode simpel random sampling.
C1 3.16227766
10 3
3 16
11 4
1 C2
20.19900988
52 3
3 54
2 1
1 37
11 10
C3 82.32860985
2. Cluster Mapping
Pemetaan anggota cluster antara metode analogy based estimation dilakukan dengan penerapan peringkat dan metode simpel random sampling pun
berbeda. Tiap cluster memiliki anggota dengan jumlah yang berbeda.
a. Hasil pemetaan anggota cluster menggunakan metode simpel random
sampling pada iterasi pertama pada anggota umur 12 tahun. Tabel 4.14 Hasil Pemetaan Metode Acak
Cluster C1
C2 C3
Jumlah Anggota
28 24
23
b. Hasil pemetaan anggota cluster menggunakan metode analogy based
estimation dilakukan dengan penerapan peringkat pada iterasi pertama pada anggota umur 12 tahun.
Tabel 4.15 Hasil Pemetaan Metode Analogi Cluster
C1 C2
C3 Jumlah
Anggota 34
34 7
Hasil pemetaan anggota cluster menggunakan metode simpel random sampling pada setiap cluster mempunyai jumlah anggota yang relatif sama,
berbanding terbalik dengan metode analogy based estimation dilakukan dengan penerapan peringkat pada setiap cluster memiliki jumlah anggota yang berbeda.
Perbedaan ini menandakan hasil dari perhitungan jarak objek ke centrooid berjalan
dengan baik. Hasil dari pemetaan ini sangat menentukan perhitungan centroid baru di mana centroid baru akan menggantikan centroid lama pada proses inisialisasi.
3. Menentukan Centroid Baru
Menentukan centroid baru sangat erat kaitannya dengan cluster mapping atau pemetaan anggota yang dilakukan pada proses sebelumnya. Menentukan
centroid baru dimulai dari menjumlahkan variabel dari anggota cluster tertentu, kemudian dibagi jumlah anggota cluster tersebut. Berikut ini perbedaan hasil
perhitungan untuk menentukan centroid baru untuk iterasi berikutnya. a.
Hasil perhitungan centroid baru menggunakan metode simpel random sampling pada iterasi pertama
Tabel 4.16 Hasil Perhitungan C1 Metode Acak Pada Iterasi Pertama
Tabel 4.17 Hasil Perhitungan New C1 Metode Acak Pada Iterasi Pertama
Tabel 4.18 Hasil Perhitungan C2 Metode Acak Pada Iterasi Pertama
Tabel 4.19 Hasil Perhitungan New C2 Metode Acak Pada Iterasi Pertama
1 2
3 4
5 6
7 8
9 10
18.35755975 C1
1.142857 0.5
0.178571 1.785714 0.035714 1.285714 0.321429 0.214286
New C1
5 5
8 10
5 8
5 15
5 5
C2 23.08679276
10.29412 3.176471 2.235294 15.17647 0.176471 0.352941 9.470588 2.764706 2.235294
New C2
Tabel 4.20 Hasil Perhitungan C3 Metode Acak Pada Iterasi Pertama
Tabel 4.21 Hasil Perhitungan New C3 Metode Acak Pada Iterasi Pertama
b. Hasil perhitungan centroid baru menggunakan metode analogy based
estimation dilakukan dengan penerapan peringkat pada iterasi pertama Tabel 4.22 Hasil Perhitungan C1 Metode Analogi Pada Iterasi Pertama
Tabel 4.23 Hasil Perhitungan New C1 Metode Analogi Pada Iterasi Pertama
Tabel 4.24 Hasil Perhitungan C2 Metode Analogi Pada Iterasi Pertama
Tabel 4.25 Hasil Perhitungan New C2 Metode Analogi Pada Iterasi Pertama
Tabel 4.26 Hasil Perhitungan C3 Metode Analogi Pada Iterasi Pertama
22.9 5
4.933333 31.33333 0.5
0.133333 0.866667 22.5
5.2 5.133333
New C3
C1 3.16227766
1.142857 0.5
0.178571 1.785714 0.035714 1.285714 0.322045 0.214286
New C1
10 3
3 16
11 4
1 C2
20.19900988
14.97561 4.365854 4.121951 22.36585 0.341463 0.073171 0.682927 16.19512 3.756098 3.512195 New C2
10 8
10 15
8 10
8 15
4 2
C3 29.3257566
Tabel 4.27 Hasil Perhitungan C3 Metode Analogi Pada Iterasi Pertama
Perbedaan menggunakan metode juga berpengaruh dalam perhitungan centroid baru. Dimana hasil dari cluster mapping menggunakan metode simpel
random sampling dan analogy based estimation dilakukan dengan penerapan peringkat memiliki perbedaan jumlah anggota dari setiap cluster.
4. Proses Perulangan Looping
Dalam proses perulangan looping data yang ada dihitung ulang secara terus menerus untuk mengoreksi jarak antara objek ke centroid. Proses perulangan
akan berhenti jika nilai jarak antara objek ke centroid mengalami sedikit perubahan atau bahkan tidak berubah dan setiap cluster memiliki anggota tetap.
Perulangan ini memiliki peran sebagai tolak ukur kualitas sebuah pengelompokan data menggunakan k-means clustering. Semakin teliti nilai satu centroid pada
cluster tertentu maka seakan baik pula hasil dari pengelompokan data tersebut. Perbandingan antara dua metode yang berbeda dalam proses inisialisasi ini dapat
membuktikan bahwa pengelompokan data menggunakan k-means clustering sangat bergantung pada metode sampling pada tahap inisialisasi untuk centroid
awal.
a. Proses perulangan Looping menggunakan metode simpel random
sampling
52 3
3 54
2 1
1 37
11 10
C3 82.32860985
41.33333 4.166667 2.833333 46.83333 0.666667 0.166667 0.666667 32.16667 8.166667 8
New C3