Fuzzy C-Means FCM TINJAUAN PUSTAKA

C. Fuzzy C-Means FCM

Fuzzy C-Mean Clustering FCM juga dikenal sebagai fuzzy ISODATA. Pengelompokan setiap titik data dalam sebuah cluster ditentukan oleh derajat keanggotaannya. Bezdek mengusulkan algoritma ini tahun 1973 sebagai pengembangan awal dari hard C-mean HCM clustering Jang et. al ., 1997. FCM membagi sebuah koleksi ke-n dari vektor x i, dengan i = 1,2,3,...,n ke dalam c grup fuzzy dan mencari pusat cluster pada masing-masing grup yakni fungsi biaya dari ukuran ketidakmiripan yang paling minimal. Fuzzy c mean memiliki dua proses yakni menghitung pusat cluster dan menandai poin untuk pusat cluster menggunakan sebuah jarak euclidean. Proses ini dilakukan berulang hingga pusat cluster stabil. Keberadaan setiap titik data pada FCM dalam suatu cluster ditentukan oleh derajat keanggotaan antara 0 hingga 1 Jang et. al., 1997 dan Cox, 2005. Untuk mengakomodasi fuzzy partisi, keanggotaan matrik U harus memiliki nilai antara 0 dan 1 Jang et. al., 1997 dan Pedrycz, 2005. Normalisasi penetapan hasil derajat keanggotaan dari set data menggunakan persamaan 9. n j u c i ij ,..., 3 , 2 , 1 , 1 1 = ∀ = ∑ = 9 dengan µ ij adalah derajat keanggotaan point data terhadap pusat-pusat cluster, C adalah jumlah cluster C, serta n adalah jumlah data. Fungsi objektif pada fuzzy c-mean digunakan persamaan 10. ∑ ∑ ∑ = = = = n j ij m ij c i c i i c d u J c c U J 2 1 1 1 ,..., , 10 dengan J adalah fungsi objektif, u ij adalah derajat keanggotaan poin data terhadap cluster-cluster dengan nilai antara 0 dan 1, c adalah jumlah cluster, n adalah banyaknya poin data, m adalah nilai parameter fuzzy dan d ij adalah jarak antara pusat cluster ke-i hingga ke-j dari titik data. Jarak antar pusat cluster ke-i hingga ke ke-j dari titik data didapatkan dari persamaan d ij = ||c i -x j || ; Nilai minimum dari pusat cluster digunakan persamaan 11 di bawah ini : ∑ ∑ = = = n j m ij n j j m ij i u x u c 1 1 11 dengan c i adalah pusat cluster ke-i, n adalah banyaknya poin data, u ij adalah derajat keanggotaan poin data terhadap cluster-cluster dengan nilainya antara 0 dan 1, m adalah nilai parameter fuzzy, serta x j adalah data poin ke-j. Untuk menghitung perubahan matrik partisi derajat keanggotaan poin data terhadap semua cluster yang baru digunakan persamaan 12. ∑ = − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = c k m kj ij ij d d u 1 1 2 1 12. dengan u ij adalah derajat keanggotaan poin data terhadap cluster-cluster yang nilainya antara 0 dan 1, c adalah jumlah pusat cluster dari grup fuzzy ke-i, m adalah parameter fuzzy, d ij adalah jarak euclidian antara pusat cluster ke-i hingga ke-j dari poin data, d kj adalah jarak euclidian antara pusat cluster ke-k hingga ke-j dari poin data. Algoritma FCM diawali dengan menentukan derajat keanggotaan secara acak setiap titik data terhadap cluster. Berdasarkan derajat keanggotaan, kemudian ditentukan pusat cluster. Pada kondisi awal, pusat cluster tentu saja masih belum akurat. Derajat keanggotaan selanjutnya diperbaiki berdasarkan fungsi jarak antara titik data dengan pusat cluster Nascimento et. al., 2003. Dengan memperbaiki pusat cluster dan derajat keanggotaan tiap titik data secara berulang dan terus menerus maka pusat cluster akan bergeser ke titik yang tepat. Kinerja FCM tergantung pada inisialisasi pusat cluster. Keluaran FCM adalah deretan pusat cluster dan derajat keanggotaan data terhadap setiap cluster. FCM menentukan pusat cluster c i dan keanggotaan matriks U Jang et. al ., 1997 dengan langkah-langkah sebagai berikut : 1. Inisialisasi keanggotaan matrik U dengan nilai random antara 0 dan 1 dengan persamaan 9. 2. Menghitung c pusat cluster fuzzy c i , i = 1,2,3,...c menggunakan persamaan 11. 3. Menghitung fungsi objektif berdasarkan persamaan 10. Berhenti jika hasil fungsi objektifnya mencapai nilai toleransi atau hasil fungsi objektifnya setelah iterasi maksimal yang ditetapkan. 4. Menghitung matrik partisi baru menggunakan persamaan 12 dan kembali ke langkah ke-2. Diagram alir proses clustering data pada algoritma fuzzy c-mean dapat dilihat pada Gambar 8. Gambar 8. Tahapan algoritma fuzzy c-mean clustering Jiang, 2003 dengan U adalah matrik partisi, C adalah pusat cluster, D adalah jarak antar matrik, m adalah nilai parameter fuzzifikasi, k adalah jumlah cluster, n adalah jumlah data serta p jumlah atribut data. Kemudian untuk nilai E-step dan M-Step dapat dihitung dengan persamaan 13 dan persamaan 14. E-step : m k = α α ik n i i ik n i U X U ∑ ∑ = = 1 1 13 M-step : U ik = ∑ = − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − 1 1 1 1 l l i k i m x m x α 14 dengan m k adalah pusat cluster ke-k dan U ik adalah derajat keanggotaan poin data terhadap pusat cluster M-step. Dalam algoritma FCM ada beberapa hal yang perlu diperhatikan saat membangun sistem diantaranya iterasi maksimal, error terkecil yang diinginkan ξ, pemangkat m 1 dan inisialisasi terhadap pusat awal cluster c ≥ 2.

D. Metodologi Pelabelan Otomatis Citra