Pengembangan Algoritma Penentuan Titik Awal Dalam Metode Clustering Algoritma Fuzzy C-Means
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
TESIS
Oleh
EDRIAN HADINATA
127038076
PROGRAM MAGISTER S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
EDRIAN HADINATA
127038076
PROGRAM MAGISTER S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
ii
PERSETUJUAN
Judul
Kategori
Nama
Nomor Induk Mahasiwa
Program Studi
Fakultas
: PENGEMBANGAN ALGORITMA PENENTUAN
TITIK AWAL DALAM METODE CLUSTERING
ALGORITMA FUZZY C-MEANS
: Tesis
: Edrian Hadinata
: 127038076
: Magister S2 Teknik Informatika
: ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI UNIVERSITAS SUMATERA
UTARA
Komisi Pembimbing :
Pembimbing 2
Pembimbing 1
Dr. Zakarias Situmorang
Prof. Dr. Herman Mawengkang
Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika
Ketua,
Prof. Dr. Muhammad Zarlis
NIP. 195707011986011003
iii
PERNYATAAN
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 15 Mei 2015
Edrian Hadinata
NIM.127038076
iv
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:
Nama
: Edrian Hadinata
NIM
: 127038076
Program Studi
: Magister S2 Teknik Informatika
Jenis Karya Ilmiah
: Tesis
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL DALAM
METODE CLUSTERING ALGORITMA FUZZY C-MEANS
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 15 Mei 2015
Edrian Hadinata
NIM.127038076
v
Telah diuji pada
Tanggal: 15 Mei 2015
PANITIA PENGUJI TESIS
Ketua
: Prof. Dr. Herman Mawengkang
Anggota
: 1. Dr. Zakarias Situmorang
2. Prof. Dr. Saib Suwilo, M.Sc
3. Rahmat W. Sembiring, M.Sc.IT, Ph.D
4. Prof. Dr. Muhammad Zarlis
vi
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap berikut gelar
: Edrian Hadinata, S.Kom.
Tempat dan Tanggal Lahir
: Sei Semayang, 3 Mei 1983
Alamat Rumah
: Jl. Binjai Km. 15 Diski Gg. Jambu No. 135
Telepon/HP
: 081265536325
e-mail
: edrianhadinata@gmail.com
Instansi Tempat Bekerja
: Sekolah Tinggi Teknologi Harapan Medan
Alamat Kantor
: Jl. H.M. Joni Medan
Telepon
: 061-4515661
DATA PENDIDIKAN
SD
: SD Tamansiswa Diski
Tamat
: 1995
SLTP
: SMP Taman Siswa Diski
Tamat
: 1998
SMK
: SMK Swasta Immanuel Medan
Tamat
: 2001
Diploma 3
: Statistik FMIPA USU
Tamat
: 2005
Strata-1
: Ilmu Komputer USU
Tamat
: 2011
Strata-2
: Magister Teknik Informatika USU
Tamat
: 2015
vii
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kepada Allah SWT atas segala
limpahan rahmat dan karunia-Nya sehingga tesis ini dapat diselesaikan. Juga tak lupa
kami kirimkan shalawat beserta salam kepada junjungan kami Rasulullah Muhammad
SAW yang telah membawa cahaya kebenaran dalam hidup di dunia ini.
Dengan selesainya tesis ini, perkenankanlah kami mengucapkan terima kasih
kepada: Pejabat Rektor Universitas Sumatera Utara Prof. Subhilhar, Ph.D atas
kesempatan yang diberikan kepada kami untuk mengikuti dan menyelesaikan
pendidikan Program Magister.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi dan juga Ketua
Program Studi Magister Teknik Informatika FASILKOM-TI Universitas Sumatera
Utara, Prof. Dr. Muhammad Zarlis, M.Sc, Sekretaris Program Studi Magister Teknik
Informatika FASILKOM-TI Universitas Sumatera Utara M. Andri Budiman, S.T.,
M.Comp.Sc, MEM beserta seluruh staf pengajar dan pegawai pada Program Studi
Magister Teknik Informatika FASILKOM-TI Universitas Sumatera Utara. Terima
kasih tak terhingga dan penghargaan yang setingi-tingginya kami ucapkan kepada
Prof. Dr. Herman Mawengkang, selaku Pembimbing Utama yang dengan penuh
perhatian dan telah memberikan dorongan,bimbingan dan juga arahan, demikian juga
kepada Dr. Zakarias Situmorang selaku Pembimbing Anggota yang dengan penuh
kesabaran menuntun dan membimbing kami hingga selesainya penelitian ini.
Kepada ayahanda Alm Edi Siswanto dan ibunda Alm Suarni serta Kakek dan
Nenek, bapak mertua M. Rusdan Sadar dan mamak beserta seluruh keluargaku terima
kasih atas segala pengorbanan kalian baik berupa moril maupun materil, budi baik ini
tidak bisa dibalas hanya diserahkan kepada Allah SWT.
Untuk Maitri Rahmadhani, SS,M.Hum istriku yang ku cintai, terima kasih atas
segala dukungan dan motivasi yang sudah tercurah selama ini, tanpa mu tak kan kuat
kaki ini menapak.
viii
Terima kasih juga kami sampaikan kepada Ketua STT Harapan Medan yang
telah memberikan ijin kepada kami untuk melanjutkan studi, serta teman-teman dosen
di STT Harapan yang banyak mendukung dan memberikan dorongan mulai dari
kuliah awal sampai selesainya studi ini, hal yang sama juga saya ucapkan kepada
seluruh teman-teman mahasiswa di Program Studi Magister Teknik Informatika
FASILKOM-TI USU atas kerja samanya selama ini.
Medan, 15 Mei 2015
Edrian Hadinata
NIM.127038076
ix
ABSTRAK
Penentuan titik awal dalam algoritma fuzzy c-means (FCM) diambil dengan cara
random. Hal ini dapat menghasilkan perulangan yang berhingga. Untuk itu
dikembangkan algoritma penentuan titik awal dengan pendekatan hierarchical
agglomerative clustering sebagai pengganti proses randomisasi derajat keanggotaan
pada iterasi awal. Diharapkan nantinya proses clustering menghasilkan iterasi yang
lebih sedikit. Nilai-nilai yang dihasilkan pada algoritma ini merupakan penggabungan
sejumlah pusat cluster dari variabel-variabel berdasarkan perhitungan pendekatan
yang terdapat pada complete linkage. Kemudian menghitung selisih fungsi objektif
disetiap iterasi setelah dilakukan proses clustering pada FCM. Proses iterasi berhenti
setelah selisih fungsi objektif lebih kecil dari batas yang ditentukan.
Kata kunci : Fuzzy c-means, penentuan titik awal, complete linkage.
x
THE EXPANSION OF STARTING POINT ALGORITHM ON
CLUSTERING METHOD WITH FUZZY C-MEANS
ALGORITHM
ABSTRACT
Determining the starting point from fuzzy c-means(FCM) produced by random values.
The algorithm would produce limited looping. Therefore the expansion of starting
point algorithm approach by hierarchical agglomerative clustering as alternate step
from random process of membership degree in early iteration. Clustering process that
expected produce fewer iteration. Values that produce by this algorithm is merging of
cluster center from all variables based of complete linkage algorithm. Then calculate
the difference of objective function in the each iteration. Iteration process stopped
after the differences objective function is smaller than prescribed limit.
Keywords : Fuzzy c-means, starting point, complete linkage.
xi
DAFTAR ISI
Halaman
PERSETUJUAN ....................................................................................................... ii
PERNYATAAN ....................................................................................................... iii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPERLUAN AKADEMIS .................................................................................... iv
RIWAYAT HIDUP ................................................................................................. v
KATA PENGANTAR ............................................................................................. vi
ABSTRAK ............................................................................................................... vii
ABSTRACT ............................................................................................................. viii
DAFTAR ISI ................................................................................................................. xi
DAFTAR GAMBAR .................................................................................................. xiii
DAFTAR TABEL ........................................................................................................ xv
BAB 1 PENDAHULUAN ............................................................................................. 1
1.1
Latar Belakang .......................................................................................... 1
1.2
Rumusan Masalah ..................................................................................... 2
1.3
Batasan Masalah ....................................................................................... 3
1.4
Tujuan Penelitian ...................................................................................... 3
1.5
Manfaat Penelitian .................................................................................... 3
BAB 2 TINJAUAN PUSTAKA .................................................................................... 4
2.1
Metode Clustering .................................................................................... 4
2.2
Clustering Dengan Pendekatan Partisi ...................................................... 4
2.2.1 K-Means ........................................................................................ 4
2.2.2 Mixture Modelling (Mixture Modeling) ........................................ 5
2.3
Clustering dengan Pendekatan Hirarki ..................................................... 6
2.3.1 Agglomerative Clustering ............................................................. 6
2.3.2 Divisive Clustering ..................................................................... 11
2.4
Clustering Dengan Pendekatan Automatic Mapping.............................. 11
2.4.1 Self-Organising Map (SOM) ....................................................... 11
2.5
Clustering Dengan Pendekatan Berbasis Fuzzy ..................................... 13
xii
2.5.1 Fuzzy Clustering Means (Fuzzy C-Means) ................................ 13
2.5.2 Langkah Algoritma Fuzzy Clustering Means (FCM) ................. 14
2.6
Cluster Analysis ...................................................................................... 18
BAB 3 METODOLOGI PENELITIAN ...................................................................... 19
3.1
Pendahuluan ............................................................................................ 19
3.2
Diagram Kerja Tahapan Penelitian ......................................................... 22
3.3
Penentuan Titik Awal ............................................................................. 25
3.3.1 Penentuan Titik Awal Pusat Cluster Menggunakan Metode
Hierarki Clustering Agglomeratif Complete Linkage ................. 25
3.3.2 Pengembangan Algoritma ........................................................... 26
3.3.3 Uji Akurasi .................................................................................. 26
3.4
Data Set Uji Coba ................................................................................... 27
BAB 4 HASIL DAN PEMBAHASAN ....................................................................... 29
4.1
Pendahuluan ............................................................................................ 29
4.2
Kinerja Fuzzy C-Means .......................................................................... 29
4.3
Pengujian untuk Fuzzy C-Means ............................................................ 30
4.4
Pendekatan Complete Linkage Dalam Pencarian Pusat Cluster ............. 36
4.5
Inisialisasi titik awal Fuzzy C-Means ..................................................... 49
4.6
Pembuatan Algoritma.............................................................................. 52
4.7
Pengujian Keakuratan ............................................................................. 53
4.8
Hasil Akhir Analisis ................................................................................ 57
BAB 5 KESIMPULAN DAN SARAN ....................................................................... 58
5.1
Kesimpulan ............................................................................................. 58
5.2
Saran ....................................................................................................... 58
DAFTAR PUSTAKA .................................................................................................. 61
xiii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Flowchart Fuzzy C-Means ...................................................................... 8
Gambar 2.2 Grafik Fluktuasi Nilai Fungsi Objektif ................................................... 8
Gambar 2.3 Flowchart algoritma Agglomerative Clustering Complete Linkage....... 9
Gambar 2.4 Perbandingan pencarian pusat cluster, kiri Complete Linkage dan kanan
Persamaan (2.3). ..................................................................................... 10
Gambar 2.5 Flowchart Fuzzy C-Means ...................................................................... 17
Gambar 3.1 Grafik Fluktuasi Nilai Fungsi Objektif .................................................... 19
Gambar 3.2 Grafik Selisih Fungsi Objektif Ke-22 ...................................................... 21
Gambar 3.3 Perbandingan Grafik Sebaran pada Fuzzy C-Means 5 Cluster pada setiap
iterasi....................................................................................................... 22
Gambar 3.4 Diagram alir Metodologi Penelitian ......................................................... 24
Gambar 3.5 Perbandingan Perbedaan Pusat Cluster iterasi ke-1 dan ke-5 .................. 25
Gambar 4.1 Grafik selisih fungsi objektif hingga t=11 ............................................... 33
Gambar 4.2 Grafik sebaran pada iterasi ke-11, untuk jumlah data sebanyak
4716 baris dan 250 kolom....................................................................... 34
Gambar 4.3 Grafik Sebaran data 0x ............................................................................. 38
Gambar 4.4 Sebaran data dengan 3 cluster kolom 0x. ................................................. 42
Gambar 4.5 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 0x ................................................................................... 43
Gambar 4.6 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 1x ................................................................................... 44
xiv
Gambar 4.7 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 2x ................................................................................... 45
Gambar 4.8 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 3x ................................................................................... 46
Gambar 4.9 Titik pusat kolom 0x ................................................................................ 47
Gambar 4.10 Titik pusat kolom 1x .............................................................................. 48
Gambar 4.11 Titik pusat kolom 2x .............................................................................. 48
Gambar 4.12 Titik pusat kolom 3x .............................................................................. 48
Gambar 4.13 Grafik Fungsi Objektif hingga t=5 ......................................................... 51
Gambar 4.14 Grafik Selisih Fungsi Objektif ............................................................... 52
xv
DAFTAR TABEL
Halaman
Tabel 3.1 Nilai Fungsi Objektif dan Selisih |P[t]-P[t-1]| ................................................. 20
Table 3.2 Daftar Atribut Rekaman Microsoft Kinect Sensor ...................................... 28
Tabel 4.1 Data Affirmative .......................................................................................... 30
Tabel 4.2 Data u random dengan jumlah cluster c = 3 ................................................ 31
Tabel 4.3 Data pusat cluster Vjk ................................................................................... 31
Tabel 4.4 Selisih fungsi objektif .................................................................................. 32
Tabel 4.5 Pusat cluster Vik untuk t=11 ........................................................................ 33
Tabel 4.6 Perhitungan Pusat Cluster dan Fungsi Objektif dimana t=1 ........................ 35
Tabel 4.7 Perhitungan jarak Xi dengan Xj ................................................................... 37
Tabel 4.8 Level 1 Pencarian pusat klaster menggunakan complete linkage ................ 41
Tabel 4.9 Level 5 Pencarian pusat klaster.................................................................... 41
Tabel 4.10 Top Level algoritma Complete Linkage kolom 0x .................................... 42
Tabel 4.11 Pusat cluster ............................................................................................... 47
Tabel 4.12 Perhitungan jarak pusat cluster dengan data observasi .............................. 50
Tabel 4.13 Fungsi Objektif pada iterasi 5 .................................................................... 50
Tabel 4.14 Selisih Fungsi Objektif .............................................................................. 51
Tabel 4.15 Tabel Cluster .............................................................................................. 54
Tabel 4.16 Proses perhitungan grand total dan rata-rata setiap kelompok .................. 55
Tabel 4.17 Perhitungan harga awal untuk analisis variansi ......................................... 55
Tabel 4.18 Perbandingan Between Group dan Within Group dengan titik awal......... 57
Tabel 4.19 Perbandingan Between Group dan Within Group tanpa titik awal ........... 57
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
TESIS
Oleh
EDRIAN HADINATA
127038076
PROGRAM MAGISTER S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
EDRIAN HADINATA
127038076
PROGRAM MAGISTER S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
ii
PERSETUJUAN
Judul
Kategori
Nama
Nomor Induk Mahasiwa
Program Studi
Fakultas
: PENGEMBANGAN ALGORITMA PENENTUAN
TITIK AWAL DALAM METODE CLUSTERING
ALGORITMA FUZZY C-MEANS
: Tesis
: Edrian Hadinata
: 127038076
: Magister S2 Teknik Informatika
: ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI UNIVERSITAS SUMATERA
UTARA
Komisi Pembimbing :
Pembimbing 2
Pembimbing 1
Dr. Zakarias Situmorang
Prof. Dr. Herman Mawengkang
Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika
Ketua,
Prof. Dr. Muhammad Zarlis
NIP. 195707011986011003
iii
PERNYATAAN
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 15 Mei 2015
Edrian Hadinata
NIM.127038076
iv
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:
Nama
: Edrian Hadinata
NIM
: 127038076
Program Studi
: Magister S2 Teknik Informatika
Jenis Karya Ilmiah
: Tesis
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL DALAM
METODE CLUSTERING ALGORITMA FUZZY C-MEANS
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 15 Mei 2015
Edrian Hadinata
NIM.127038076
v
Telah diuji pada
Tanggal: 15 Mei 2015
PANITIA PENGUJI TESIS
Ketua
: Prof. Dr. Herman Mawengkang
Anggota
: 1. Dr. Zakarias Situmorang
2. Prof. Dr. Saib Suwilo, M.Sc
3. Rahmat W. Sembiring, M.Sc.IT, Ph.D
4. Prof. Dr. Muhammad Zarlis
vi
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap berikut gelar
: Edrian Hadinata, S.Kom.
Tempat dan Tanggal Lahir
: Sei Semayang, 3 Mei 1983
Alamat Rumah
: Jl. Binjai Km. 15 Diski Gg. Jambu No. 135
Telepon/HP
: 081265536325
: edrianhadinata@gmail.com
Instansi Tempat Bekerja
: Sekolah Tinggi Teknologi Harapan Medan
Alamat Kantor
: Jl. H.M. Joni Medan
Telepon
: 061-4515661
DATA PENDIDIKAN
SD
: SD Tamansiswa Diski
Tamat
: 1995
SLTP
: SMP Taman Siswa Diski
Tamat
: 1998
SMK
: SMK Swasta Immanuel Medan
Tamat
: 2001
Diploma 3
: Statistik FMIPA USU
Tamat
: 2005
Strata-1
: Ilmu Komputer USU
Tamat
: 2011
Strata-2
: Magister Teknik Informatika USU
Tamat
: 2015
vii
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kepada Allah SWT atas segala
limpahan rahmat dan karunia-Nya sehingga tesis ini dapat diselesaikan. Juga tak lupa
kami kirimkan shalawat beserta salam kepada junjungan kami Rasulullah Muhammad
SAW yang telah membawa cahaya kebenaran dalam hidup di dunia ini.
Dengan selesainya tesis ini, perkenankanlah kami mengucapkan terima kasih
kepada: Pejabat Rektor Universitas Sumatera Utara Prof. Subhilhar, Ph.D atas
kesempatan yang diberikan kepada kami untuk mengikuti dan menyelesaikan
pendidikan Program Magister.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi dan juga Ketua
Program Studi Magister Teknik Informatika FASILKOM-TI Universitas Sumatera
Utara, Prof. Dr. Muhammad Zarlis, M.Sc, Sekretaris Program Studi Magister Teknik
Informatika FASILKOM-TI Universitas Sumatera Utara M. Andri Budiman, S.T.,
M.Comp.Sc, MEM beserta seluruh staf pengajar dan pegawai pada Program Studi
Magister Teknik Informatika FASILKOM-TI Universitas Sumatera Utara. Terima
kasih tak terhingga dan penghargaan yang setingi-tingginya kami ucapkan kepada
Prof. Dr. Herman Mawengkang, selaku Pembimbing Utama yang dengan penuh
perhatian dan telah memberikan dorongan,bimbingan dan juga arahan, demikian juga
kepada Dr. Zakarias Situmorang selaku Pembimbing Anggota yang dengan penuh
kesabaran menuntun dan membimbing kami hingga selesainya penelitian ini.
Kepada ayahanda Alm Edi Siswanto dan ibunda Alm Suarni serta Kakek dan
Nenek, bapak mertua M. Rusdan Sadar dan mamak beserta seluruh keluargaku terima
kasih atas segala pengorbanan kalian baik berupa moril maupun materil, budi baik ini
tidak bisa dibalas hanya diserahkan kepada Allah SWT.
Untuk Maitri Rahmadhani, SS,M.Hum istriku yang ku cintai, terima kasih atas
segala dukungan dan motivasi yang sudah tercurah selama ini, tanpa mu tak kan kuat
kaki ini menapak.
viii
Terima kasih juga kami sampaikan kepada Ketua STT Harapan Medan yang
telah memberikan ijin kepada kami untuk melanjutkan studi, serta teman-teman dosen
di STT Harapan yang banyak mendukung dan memberikan dorongan mulai dari
kuliah awal sampai selesainya studi ini, hal yang sama juga saya ucapkan kepada
seluruh teman-teman mahasiswa di Program Studi Magister Teknik Informatika
FASILKOM-TI USU atas kerja samanya selama ini.
Medan, 15 Mei 2015
Edrian Hadinata
NIM.127038076
ix
ABSTRAK
Penentuan titik awal dalam algoritma fuzzy c-means (FCM) diambil dengan cara
random. Hal ini dapat menghasilkan perulangan yang berhingga. Untuk itu
dikembangkan algoritma penentuan titik awal dengan pendekatan hierarchical
agglomerative clustering sebagai pengganti proses randomisasi derajat keanggotaan
pada iterasi awal. Diharapkan nantinya proses clustering menghasilkan iterasi yang
lebih sedikit. Nilai-nilai yang dihasilkan pada algoritma ini merupakan penggabungan
sejumlah pusat cluster dari variabel-variabel berdasarkan perhitungan pendekatan
yang terdapat pada complete linkage. Kemudian menghitung selisih fungsi objektif
disetiap iterasi setelah dilakukan proses clustering pada FCM. Proses iterasi berhenti
setelah selisih fungsi objektif lebih kecil dari batas yang ditentukan.
Kata kunci : Fuzzy c-means, penentuan titik awal, complete linkage.
x
THE EXPANSION OF STARTING POINT ALGORITHM ON
CLUSTERING METHOD WITH FUZZY C-MEANS
ALGORITHM
ABSTRACT
Determining the starting point from fuzzy c-means(FCM) produced by random values.
The algorithm would produce limited looping. Therefore the expansion of starting
point algorithm approach by hierarchical agglomerative clustering as alternate step
from random process of membership degree in early iteration. Clustering process that
expected produce fewer iteration. Values that produce by this algorithm is merging of
cluster center from all variables based of complete linkage algorithm. Then calculate
the difference of objective function in the each iteration. Iteration process stopped
after the differences objective function is smaller than prescribed limit.
Keywords : Fuzzy c-means, starting point, complete linkage.
xi
DAFTAR ISI
Halaman
PERSETUJUAN ....................................................................................................... ii
PERNYATAAN ....................................................................................................... iii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPERLUAN AKADEMIS .................................................................................... iv
RIWAYAT HIDUP ................................................................................................. v
KATA PENGANTAR ............................................................................................. vi
ABSTRAK ............................................................................................................... vii
ABSTRACT ............................................................................................................. viii
DAFTAR ISI ................................................................................................................. xi
DAFTAR GAMBAR .................................................................................................. xiii
DAFTAR TABEL ........................................................................................................ xv
BAB 1 PENDAHULUAN ............................................................................................. 1
1.1
Latar Belakang .......................................................................................... 1
1.2
Rumusan Masalah ..................................................................................... 2
1.3
Batasan Masalah ....................................................................................... 3
1.4
Tujuan Penelitian ...................................................................................... 3
1.5
Manfaat Penelitian .................................................................................... 3
BAB 2 TINJAUAN PUSTAKA .................................................................................... 4
2.1
Metode Clustering .................................................................................... 4
2.2
Clustering Dengan Pendekatan Partisi ...................................................... 4
2.2.1 K-Means ........................................................................................ 4
2.2.2 Mixture Modelling (Mixture Modeling) ........................................ 5
2.3
Clustering dengan Pendekatan Hirarki ..................................................... 6
2.3.1 Agglomerative Clustering ............................................................. 6
2.3.2 Divisive Clustering ..................................................................... 11
2.4
Clustering Dengan Pendekatan Automatic Mapping.............................. 11
2.4.1 Self-Organising Map (SOM) ....................................................... 11
2.5
Clustering Dengan Pendekatan Berbasis Fuzzy ..................................... 13
xii
2.5.1 Fuzzy Clustering Means (Fuzzy C-Means) ................................ 13
2.5.2 Langkah Algoritma Fuzzy Clustering Means (FCM) ................. 14
2.6
Cluster Analysis ...................................................................................... 18
BAB 3 METODOLOGI PENELITIAN ...................................................................... 19
3.1
Pendahuluan ............................................................................................ 19
3.2
Diagram Kerja Tahapan Penelitian ......................................................... 22
3.3
Penentuan Titik Awal ............................................................................. 25
3.3.1 Penentuan Titik Awal Pusat Cluster Menggunakan Metode
Hierarki Clustering Agglomeratif Complete Linkage ................. 25
3.3.2 Pengembangan Algoritma ........................................................... 26
3.3.3 Uji Akurasi .................................................................................. 26
3.4
Data Set Uji Coba ................................................................................... 27
BAB 4 HASIL DAN PEMBAHASAN ....................................................................... 29
4.1
Pendahuluan ............................................................................................ 29
4.2
Kinerja Fuzzy C-Means .......................................................................... 29
4.3
Pengujian untuk Fuzzy C-Means ............................................................ 30
4.4
Pendekatan Complete Linkage Dalam Pencarian Pusat Cluster ............. 36
4.5
Inisialisasi titik awal Fuzzy C-Means ..................................................... 49
4.6
Pembuatan Algoritma.............................................................................. 52
4.7
Pengujian Keakuratan ............................................................................. 53
4.8
Hasil Akhir Analisis ................................................................................ 57
BAB 5 KESIMPULAN DAN SARAN ....................................................................... 58
5.1
Kesimpulan ............................................................................................. 58
5.2
Saran ....................................................................................................... 58
DAFTAR PUSTAKA .................................................................................................. 61
xiii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Flowchart Fuzzy C-Means ...................................................................... 8
Gambar 2.2 Grafik Fluktuasi Nilai Fungsi Objektif ................................................... 8
Gambar 2.3 Flowchart algoritma Agglomerative Clustering Complete Linkage....... 9
Gambar 2.4 Perbandingan pencarian pusat cluster, kiri Complete Linkage dan kanan
Persamaan (2.3). ..................................................................................... 10
Gambar 2.5 Flowchart Fuzzy C-Means ...................................................................... 17
Gambar 3.1 Grafik Fluktuasi Nilai Fungsi Objektif .................................................... 19
Gambar 3.2 Grafik Selisih Fungsi Objektif Ke-22 ...................................................... 21
Gambar 3.3 Perbandingan Grafik Sebaran pada Fuzzy C-Means 5 Cluster pada setiap
iterasi....................................................................................................... 22
Gambar 3.4 Diagram alir Metodologi Penelitian ......................................................... 24
Gambar 3.5 Perbandingan Perbedaan Pusat Cluster iterasi ke-1 dan ke-5 .................. 25
Gambar 4.1 Grafik selisih fungsi objektif hingga t=11 ............................................... 33
Gambar 4.2 Grafik sebaran pada iterasi ke-11, untuk jumlah data sebanyak
4716 baris dan 250 kolom....................................................................... 34
Gambar 4.3 Grafik Sebaran data 0x ............................................................................. 38
Gambar 4.4 Sebaran data dengan 3 cluster kolom 0x. ................................................. 42
Gambar 4.5 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 0x ................................................................................... 43
Gambar 4.6 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 1x ................................................................................... 44
xiv
Gambar 4.7 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 2x ................................................................................... 45
Gambar 4.8 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 3x ................................................................................... 46
Gambar 4.9 Titik pusat kolom 0x ................................................................................ 47
Gambar 4.10 Titik pusat kolom 1x .............................................................................. 48
Gambar 4.11 Titik pusat kolom 2x .............................................................................. 48
Gambar 4.12 Titik pusat kolom 3x .............................................................................. 48
Gambar 4.13 Grafik Fungsi Objektif hingga t=5 ......................................................... 51
Gambar 4.14 Grafik Selisih Fungsi Objektif ............................................................... 52
xv
DAFTAR TABEL
Halaman
Tabel 3.1 Nilai Fungsi Objektif dan Selisih |P[t]-P[t-1]| ................................................. 20
Table 3.2 Daftar Atribut Rekaman Microsoft Kinect Sensor ...................................... 28
Tabel 4.1 Data Affirmative .......................................................................................... 30
Tabel 4.2 Data u random dengan jumlah cluster c = 3 ................................................ 31
Tabel 4.3 Data pusat cluster Vjk ................................................................................... 31
Tabel 4.4 Selisih fungsi objektif .................................................................................. 32
Tabel 4.5 Pusat cluster Vik untuk t=11 ........................................................................ 33
Tabel 4.6 Perhitungan Pusat Cluster dan Fungsi Objektif dimana t=1 ........................ 35
Tabel 4.7 Perhitungan jarak Xi dengan Xj ................................................................... 37
Tabel 4.8 Level 1 Pencarian pusat klaster menggunakan complete linkage ................ 41
Tabel 4.9 Level 5 Pencarian pusat klaster.................................................................... 41
Tabel 4.10 Top Level algoritma Complete Linkage kolom 0x .................................... 42
Tabel 4.11 Pusat cluster ............................................................................................... 47
Tabel 4.12 Perhitungan jarak pusat cluster dengan data observasi .............................. 50
Tabel 4.13 Fungsi Objektif pada iterasi 5 .................................................................... 50
Tabel 4.14 Selisih Fungsi Objektif .............................................................................. 51
Tabel 4.15 Tabel Cluster .............................................................................................. 54
Tabel 4.16 Proses perhitungan grand total dan rata-rata setiap kelompok .................. 55
Tabel 4.17 Perhitungan harga awal untuk analisis variansi ......................................... 55
Tabel 4.18 Perbandingan Between Group dan Within Group dengan titik awal......... 57
Tabel 4.19 Perbandingan Between Group dan Within Group tanpa titik awal ........... 57