Distance dan juga Manhattan Distance, ukuran ini memiliki masalah jika salah satu atribut dalam vektor memiliki rentang yang lebih besar
dibandingkan atribut-atribut lainnya. d. Cosine
– Corelation ukuran kemiripan dari model Euclidean n-dimensi ..........................................................2.4
Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi walaupun sering pula digunakan bersama pendekatan lain untuk
membatasi dimensi dari permasalahan. Dalam mendefenisikan ukuran jarak antar cluster yang digunakan
beberapa algoritma untuk menentukan cluster mana yang terdekat, perlu dijelaskan mengenai atribut-atribut yang menjadi referensi dari suatu cluster
Kantardzic, 2003. Untuk suatu cluster Km berisi N item {Xm1, Xm2, ..., Xmn}:
a Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap itemdari suatu cluster menurut rumus:
...........................................................2.5
b Medoid: item yang letaknya paling tengah
2.2.4 Algoritma Fuzzy C-Means FCM
Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means FCM. FCM adalah suatu teknik clustering data yang mana
keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun
1981. Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang
akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan
untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa
pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang
diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.
Dalam metode Fuzzy C Means dipergunakan variabel membership fucntion i
ku
, yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota ke dalam suatu cluster . Pada metode ini juga digunakan
suatu variabel m yang merupakan weighting exponent dari membership function. Variabel ini dapat mengubah besaran pengaruh dari membership function i
ku
dalam proses clustering. Variabel m mempunyai wilayah nilai m 1 , sampai pada saat ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal
dalam melakukan optimasi suatu permasalahan clustering. Nilai m yang umum digunakan adalah 2 Wahyuni,2009 .
Secara mendasar terdapat dua cara pengalokasian data kembali kedalam masing-masing cluster pada saat proses iterasi clustering. Yang pertama adalah
pengalokasian dengan cara tegas hard. Dimana data item secara tegas dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster
yang lain. Yang kedua dengan menggunakan nilai Fuzzy dimana masing-masing data item diberikan nilai kemungkinan untuk bisa bergabung ke setiap cluster
yang ada. Pada K-Means pengalokasian data kembali didasarkan pada perbandingan jarak antara data dengan centroid setiap cluster yang ada. Pada
Fuzzy C Means pengalokasian kembali data kedalam masing-masing cluster dipergunakan variabel membership function u
ik
yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota dalam satu cluster.
Keluaran dari FCM bukan merupakan sistem inferensi fuzzy, namun merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap
– tiap titik data.
Algoritma Fuzzy C-Means FCM diberikan sebagai berikut Kusumadewi,2010.
1. Masukan data yang akan di cluster U , berupa matriks berukuranmxn n = jumlah sampel data,m = atribut setiap data. U
ik
= data sampel ke-i i=1,2,...,n,atribut ke- k k =1,2,...,m.
2. Menetapkan nilai pangkat w misal: w=2, Epsgalat terkecil misal:10
-5
, MaxIter misal:100, jumlah cluster c 1, dan iterasi awal t = 1,
Menetapkan fungsi objektif awal: P
t
c = 0. 3. Menetapkan matriks partisi µ
f
c awal sembarang, sebagai berikut.
4. Menaikkan nomor iterasi: t=t+1. 5. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut
sebagai berikut.
6. Memodifikasi tiap-tiap nilai keanggotaan sebagai berikut. a. Jika y
k
≠ v
fi
,
b. Jika y
k
= v
fi
, µ
ik
y
k
= 1, jika i =g; µ
ik
y
k
= 0, jika i ≠g;
7. Menghitung fungsi objektif sebagai berikut.
8. Memodifikasi matriks partisi sebagai berikut.
9. Memeriksa kondisi untuk berhenti, yaitu:
P
t
c - P
t-1
c Eps atau t MaxIter
Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-4.
2.2.5 Contoh Penerapan Fuzzy C-Means FCM