Metode K- Means Clustering .1 Pengertian K- Means Clustering
2.3 Metode K- Means Clustering 2.3.1 Pengertian K- Means Clustering
Clustering atau clusterisasi adalah salah satu alat bantu pada data mining yang bertujuan mengelompokkan objek-objek ke dalam cluster-cluster. Cluster adalah
sekelompok atau sekumpulan objek-objek data yang similar satu sama lain dalam cluster yang sama dan dissimilar terhadap objek-objek yang berbeda cluster. Objek
akan dikelompokkan ke dalam satu atau lebih cluster sehingga objek-objek yang berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan
lainnya. Objek-objek dikelompokkan berdasarkan prinsip memaksimalkan kesamaan objek
pada cluster yang sama dan memaksimalkan ketidaksamaan pada cluster yang berbeda. Kesamaan objek biasanya diperoleh dari nilai-nilai atribut yang menjelaskan
objek data, sedangkan objek-objek data biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi. Seperti contoh clustering yang dapat dilihat pada
gambar 2.3 berikut.
Gambar 2.3 Contoh Clustering
Dimana K- means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada kedalam bentuk satu atau lebih clusterkelompok.
Metode ini mempartisi data kedalam cluster kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan kedalam satu clusterkelompok dan data yang
memiliki karakteristik yang berbeda dikelompokkan kedalam cluster kelompok yang
Universitas Sumatera Utara
lain. Nilai – nilai cluster secara random untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid, mean atau means.