21
2.2.2. Flowchart K-Means Clustering
Berikut penggambaran algoritma k-means clustering menggunakan flowchart
:
Gambar 2.3 Flowchart Algoritma KMeans
Gambar diatas merupakan algoritma K-Means clustering dengan menggunakan flowchart. Langkah pertama adalah menentukan banyaknya
jumlah cluster K, selanjutnya menentukan titik pusat, penentuan titik pusat dapat ditentukan secara random atau menggunakan salah satu cara yaitu
Variance Initialization. Tahapan selanjutnya menghitung jarak obyek ke
pusat salah satu penghitungannya menggunakan kedekatan Euclidean Distance,
lalu kelompokkan obyek berdasar jarak minimum. Tahapan terakhir adalah apabila ada obyek yang harus dipindah, maka terjadi
22
pengulangan pada tahap penentuan titik pusat, ketika tidak ada lagi obyek yang harus dipindah maka selesai.
2.3. Confusion Matrix
Pada tahapan pengujian akurasi suatu clustering maka hal yang diproses adalah pemberian label pada masing-masing cluster. Pemberian label di
dapat dari studi kasus, dimana pada label satu ialah percintaan, label dua ialah perjuangan, label ketiga ialah religi dan label empat ialah persahabatan.
Setelah didapat empat label pada masing-masing cluster maka diproses menggunakan pengujian Confusion Matrix.
Confusion Matrix berisi informasi yang aktual dan dapat diprediksi
Kohavi dan Provost, 1998, dimana kinerja sistem dapat di evaluasi menggunakan data dalam matriks.
Tabel dibawah ini menunjukkan confusion matrix untuk dua class Kohavi dan Provost, 1998 :
Tabel 2.4 . Tabel Confusion Matrix
Keterangan : a adalah jumlah prediksi yang benar bahwa contoh bersifat negatif.
b adalah jumlah prediksi yang salah bahwa contoh bersifat positif. c adalah jumlah prediksi yang salah bahwa contoh bersifat positif
d adalah jumlah prediksi yang benar bahwa contoh bersifat positif.
23
Beberapa macam cara untuk menghitung akurasi, antara lain dengan menggunakan :
Akurasi AD Recall atau true positive rate TP
False positive rate FP True negative rate TN
False negative rate FN
Tahap terakhir yaitu precision P Dalam penelitian ini, untuk menghitung tingkat akurasi penulis
menggunakan perhitungan Akurasi AD, dengan penjelasan: Akurasi adalah jumlah prediksi yang benar, yang ditentukan dengan
persamaan 2.11: 2.11