Metode K- Means Clustering .1 Pengertian K- Means Clustering

2.3 Metode K- Means Clustering 2.3.1 Pengertian K- Means Clustering Clustering atau clusterisasi adalah salah satu alat bantu pada data mining yang bertujuan mengelompokkan objek-objek ke dalam cluster-cluster. Cluster adalah sekelompok atau sekumpulan objek-objek data yang similar satu sama lain dalam cluster yang sama dan dissimilar terhadap objek-objek yang berbeda cluster. Objek akan dikelompokkan ke dalam satu atau lebih cluster sehingga objek-objek yang berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan lainnya. Objek-objek dikelompokkan berdasarkan prinsip memaksimalkan kesamaan objek pada cluster yang sama dan memaksimalkan ketidaksamaan pada cluster yang berbeda. Kesamaan objek biasanya diperoleh dari nilai-nilai atribut yang menjelaskan objek data, sedangkan objek-objek data biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi. Seperti contoh clustering yang dapat dilihat pada gambar 2.3 berikut. Gambar 2.3 Contoh Clustering Dimana K- means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada kedalam bentuk satu atau lebih clusterkelompok. Metode ini mempartisi data kedalam cluster kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan kedalam satu clusterkelompok dan data yang memiliki karakteristik yang berbeda dikelompokkan kedalam cluster kelompok yang Universitas Sumatera Utara lain. Nilai – nilai cluster secara random untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid, mean atau means.

2.3.2 Prosedur Metode K- Means Clustering

Langkah-langkah dalam metode K- Means Clustering adalah : 1. Menentukan jumlah cluster yang akan dibentuk. 2. Menentukan nilai centroid atau rata – rata data yang ada di masing – masing cluster. Dalam menentukan nilai centroid untuk awal iterasi, nilai awal centroid dilakukan secara acak. 3. Menghitung jarak setiap data yang ada terhadap masing- masing centroid menggunakan rumus Euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid, seperti pada rumus 1 berikut. � �,� = �∑ �� �� − � �� � 2 � �=1 ........ 1 Dimana : D i,k = Perhitungan jarak data ke-i dengan pusat klaster ke-k p = maksimal data j = banyak data 4. Pengelompokan objek untuk menentukan anggota cluster adalah dengan memperhitungkan jarak minimum objek. Nilai yang diperoleh dalam keanggotaan data pada distance matriks adalah 0 atau 1, dimana nilai 1 untuk data yang dialokasikan ke cluster dan nilai 0 untuk data yang dialokasikan ke cluster yang lain. 5. Kembali ke tahap 2, lakukan perulangan hingga nilai centroid yang dihasilkan tetap dan anggota cluster tidak berpindah ke cluster lain. 6. Tampilkan hasil dan selesai. Universitas Sumatera Utara 2.4 Metode Analitycal Hierarchy Process AHP 2.4.1 Pengertian Analitycal Hierarchy Process AHP