Langkah Algoritma K-Means clustering

21

2.2.2. Flowchart K-Means Clustering

Berikut penggambaran algoritma k-means clustering menggunakan flowchart : Gambar 2.3 Flowchart Algoritma KMeans Gambar diatas merupakan algoritma K-Means clustering dengan menggunakan flowchart. Langkah pertama adalah menentukan banyaknya jumlah cluster K, selanjutnya menentukan titik pusat, penentuan titik pusat dapat ditentukan secara random atau menggunakan salah satu cara yaitu Variance Initialization. Tahapan selanjutnya menghitung jarak obyek ke pusat salah satu penghitungannya menggunakan kedekatan Euclidean Distance, lalu kelompokkan obyek berdasar jarak minimum. Tahapan terakhir adalah apabila ada obyek yang harus dipindah, maka terjadi 22 pengulangan pada tahap penentuan titik pusat, ketika tidak ada lagi obyek yang harus dipindah maka selesai.

2.3. Confusion Matrix

Pada tahapan pengujian akurasi suatu clustering maka hal yang diproses adalah pemberian label pada masing-masing cluster. Pemberian label di dapat dari studi kasus, dimana pada label satu ialah percintaan, label dua ialah perjuangan, label ketiga ialah religi dan label empat ialah persahabatan. Setelah didapat empat label pada masing-masing cluster maka diproses menggunakan pengujian Confusion Matrix. Confusion Matrix berisi informasi yang aktual dan dapat diprediksi Kohavi dan Provost, 1998, dimana kinerja sistem dapat di evaluasi menggunakan data dalam matriks. Tabel dibawah ini menunjukkan confusion matrix untuk dua class Kohavi dan Provost, 1998 : Tabel 2.4 . Tabel Confusion Matrix Keterangan :  a adalah jumlah prediksi yang benar bahwa contoh bersifat negatif.  b adalah jumlah prediksi yang salah bahwa contoh bersifat positif.  c adalah jumlah prediksi yang salah bahwa contoh bersifat positif  d adalah jumlah prediksi yang benar bahwa contoh bersifat positif. 23 Beberapa macam cara untuk menghitung akurasi, antara lain dengan menggunakan :  Akurasi AD  Recall atau true positive rate TP  False positive rate FP  True negative rate TN  False negative rate FN  Tahap terakhir yaitu precision P Dalam penelitian ini, untuk menghitung tingkat akurasi penulis menggunakan perhitungan Akurasi AD, dengan penjelasan: Akurasi adalah jumlah prediksi yang benar, yang ditentukan dengan persamaan 2.11: 2.11