K-Means Klaster K-Median Klaster

11

2.5 K-Means Klaster

K-Means merupakan metode pengelompokkan yang paling terkenal dan banyak digunakan di berbagai bidang karena sederhana dan mudah diimplementasikan. K-means merupakan metode pengklasteran secara partitioning yang memisahkan data ke dalam kelompok yang berbeda. K-means merupakan salah satu metode pengelompokkan data nonhirarki yang berusaha membagi data yang ada ke dalam bentuk dua atau lebih kelompok [13]. Metode ini dikembangkan oleh Mac Queen pada tahun 1967. Tujuan dari pengelompokkan data ini adalah untuk meminimalisasikan fungsi objektif dalam proses pengelompokkan, yang pada umumnya berusaha meminimalisasikan ragam di dalam suatu kelompok dan memaksimalkan ragam antar kelompok. Dasar algoritma K-means adalah sebagai berikut : 1. Diberikan nilai k sebagai jumlah klaster yang ingin dibentuk. 2. Bangkitkan k centroid titik pusat klaster awal secara random. 3. Hitung jarak setiap data ke masing-masing pusat klaster yaitu menggunakan Euclidean Distance. 4. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan pusatnya. 5. Tentukan posisi pusat klaster baru C kj dengan cara menghitung nilai rata-rata dari data-data yang ada pada pusat klaster yang sama. = ⋯ = 1,2, …,7 2.3 12 = pusat klaster ke-k pada variabel ke-j = banyak data pada klaster ke-k

2.6 K-Median Klaster

K-median merupakan salah satu metode dalam pengelompokkan. Namun jika pada K-means pengelompokkan berdasarkan nilai rataannya, pada K-median pengelompokkan didasarkan pada nilai mediannya [8]. Misalkan terdapat N buah data, jarak antara objek ke-i, dan objek ke-j, dinotasikan dengan . Dalam pemilihan suatu objek yang representatif dalam suatu klaster median awal, didefinisikan sebagai variabel biner 0 dan 1, dimana y = 1 jika objek ke-i dipiih sebagai median awal. Penempatan setiap objek ke-j ke salah satu median awal dituliskan sebagai , dengan bernilai 0 dan 1. Jika objek j ditempatkan ke klaster dimana objek i sebagai median maka = 1 . Berdasarkan definisi di atas, maka : min ∑ ∑ 2.4 dengan ` ∑ = 1 , ∀ ∈ 2.5 ≤ ∀ , ∈ 2.6 ∑ = , = jumlah klaster 2.7 ∈ {0,1} , ∀ , ∈ 2.8 ∈ {0,1} , ∀ ∈ 2.9 13 Persamaan 2.4 menyatakan bahwa klaster yang terbentuk dengan menempatkan setiap objek ke median yang terdekat. Persamaan 2.5 menyatakan bahwa setiap objek ditempatkan pada sebuah median. Persamaan 2.6 menyatakan bahwa penempatan objek didasarkan pada median. Persamaan 2.7 menyatakan bahwa hanya terdapat sebuah objek yang akan dipilih median. Dasar algoritma K-median adalah sebagai berikut : 1. Diberikan nilai k sebagai jumlah klaster yang ingin dibentuk. 2. Bangkitkan k centroid titik pusat klaster awal secara random. 3. Hitung jarak setiap data ke masing-masing pusat klaster yaitu menggunakan Euclidean Distance. 4. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan pusatnya. 5. Tentukan posisi pusat klaster baru C k dengan cara menghitung nilai median data-data yang ada pada pusat klaster yang sama.

2.7 Analisis Diskriminan