Algoritma Fuzzy C-Means FCM

Distance dan juga Manhattan Distance, ukuran ini memiliki masalah jika salah satu atribut dalam vektor memiliki rentang yang lebih besar dibandingkan atribut-atribut lainnya. d. Cosine – Corelation ukuran kemiripan dari model Euclidean n-dimensi ..........................................................2.4 Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi walaupun sering pula digunakan bersama pendekatan lain untuk membatasi dimensi dari permasalahan. Dalam mendefenisikan ukuran jarak antar cluster yang digunakan beberapa algoritma untuk menentukan cluster mana yang terdekat, perlu dijelaskan mengenai atribut-atribut yang menjadi referensi dari suatu cluster Kantardzic, 2003. Untuk suatu cluster Km berisi N item {Xm1, Xm2, ..., Xmn}: a Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap itemdari suatu cluster menurut rumus: ...........................................................2.5 b Medoid: item yang letaknya paling tengah

2.2.4 Algoritma Fuzzy C-Means FCM

Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means FCM. FCM adalah suatu teknik clustering data yang mana keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut. Dalam metode Fuzzy C Means dipergunakan variabel membership fucntion i ku , yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota ke dalam suatu cluster . Pada metode ini juga digunakan suatu variabel m yang merupakan weighting exponent dari membership function. Variabel ini dapat mengubah besaran pengaruh dari membership function i ku dalam proses clustering. Variabel m mempunyai wilayah nilai m 1 , sampai pada saat ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal dalam melakukan optimasi suatu permasalahan clustering. Nilai m yang umum digunakan adalah 2 Wahyuni,2009 . Secara mendasar terdapat dua cara pengalokasian data kembali kedalam masing-masing cluster pada saat proses iterasi clustering. Yang pertama adalah pengalokasian dengan cara tegas hard. Dimana data item secara tegas dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster yang lain. Yang kedua dengan menggunakan nilai Fuzzy dimana masing-masing data item diberikan nilai kemungkinan untuk bisa bergabung ke setiap cluster yang ada. Pada K-Means pengalokasian data kembali didasarkan pada perbandingan jarak antara data dengan centroid setiap cluster yang ada. Pada Fuzzy C Means pengalokasian kembali data kedalam masing-masing cluster dipergunakan variabel membership function u ik yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota dalam satu cluster. Keluaran dari FCM bukan merupakan sistem inferensi fuzzy, namun merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap – tiap titik data. Algoritma Fuzzy C-Means FCM diberikan sebagai berikut Kusumadewi,2010. 1. Masukan data yang akan di cluster U , berupa matriks berukuranmxn n = jumlah sampel data,m = atribut setiap data. U ik = data sampel ke-i i=1,2,...,n,atribut ke- k k =1,2,...,m. 2. Menetapkan nilai pangkat w misal: w=2, Epsgalat terkecil misal:10 -5 , MaxIter misal:100, jumlah cluster c 1, dan iterasi awal t = 1, Menetapkan fungsi objektif awal: P t c = 0. 3. Menetapkan matriks partisi µ f c awal sembarang, sebagai berikut. 4. Menaikkan nomor iterasi: t=t+1. 5. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut sebagai berikut. 6. Memodifikasi tiap-tiap nilai keanggotaan sebagai berikut. a. Jika y k ≠ v fi , b. Jika y k = v fi , µ ik y k = 1, jika i =g; µ ik y k = 0, jika i ≠g; 7. Menghitung fungsi objektif sebagai berikut. 8. Memodifikasi matriks partisi sebagai berikut. 9. Memeriksa kondisi untuk berhenti, yaitu: P t c - P t-1 c Eps atau t MaxIter Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-4.

2.2.5 Contoh Penerapan Fuzzy C-Means FCM