Pengembangan Algoritma Penentuan Titik Awal Dalam Metode Clustering Algoritma Fuzzy C-Means

PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS

TESIS

Oleh

EDRIAN HADINATA
127038076

PROGRAM MAGISTER S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015

PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS


TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika

EDRIAN HADINATA
127038076

PROGRAM MAGISTER S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015

ii

PERSETUJUAN

Judul


Kategori
Nama
Nomor Induk Mahasiwa
Program Studi
Fakultas

: PENGEMBANGAN ALGORITMA PENENTUAN
TITIK AWAL DALAM METODE CLUSTERING
ALGORITMA FUZZY C-MEANS
: Tesis
: Edrian Hadinata
: 127038076
: Magister S2 Teknik Informatika
: ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI UNIVERSITAS SUMATERA
UTARA

Komisi Pembimbing :

Pembimbing 2


Pembimbing 1

Dr. Zakarias Situmorang

Prof. Dr. Herman Mawengkang

Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika
Ketua,

Prof. Dr. Muhammad Zarlis
NIP. 195707011986011003

iii

PERNYATAAN

PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA

FUZZY C-MEANS

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 15 Mei 2015

Edrian Hadinata
NIM.127038076

iv

PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:

Nama

: Edrian Hadinata

NIM

: 127038076

Program Studi

: Magister S2 Teknik Informatika

Jenis Karya Ilmiah

: Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL DALAM

METODE CLUSTERING ALGORITMA FUZZY C-MEANS
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.

Medan, 15 Mei 2015

Edrian Hadinata
NIM.127038076

v

Telah diuji pada
Tanggal: 15 Mei 2015

PANITIA PENGUJI TESIS
Ketua


: Prof. Dr. Herman Mawengkang

Anggota

: 1. Dr. Zakarias Situmorang

2. Prof. Dr. Saib Suwilo, M.Sc
3. Rahmat W. Sembiring, M.Sc.IT, Ph.D
4. Prof. Dr. Muhammad Zarlis

vi

RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap berikut gelar

: Edrian Hadinata, S.Kom.

Tempat dan Tanggal Lahir


: Sei Semayang, 3 Mei 1983

Alamat Rumah

: Jl. Binjai Km. 15 Diski Gg. Jambu No. 135

Telepon/HP

: 081265536325

e-mail

: edrianhadinata@gmail.com

Instansi Tempat Bekerja

: Sekolah Tinggi Teknologi Harapan Medan

Alamat Kantor


: Jl. H.M. Joni Medan

Telepon

: 061-4515661

DATA PENDIDIKAN

SD

: SD Tamansiswa Diski

Tamat

: 1995

SLTP

: SMP Taman Siswa Diski


Tamat

: 1998

SMK

: SMK Swasta Immanuel Medan

Tamat

: 2001

Diploma 3

: Statistik FMIPA USU

Tamat

: 2005


Strata-1

: Ilmu Komputer USU

Tamat

: 2011

Strata-2

: Magister Teknik Informatika USU

Tamat

: 2015

vii

KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kepada Allah SWT atas segala
limpahan rahmat dan karunia-Nya sehingga tesis ini dapat diselesaikan. Juga tak lupa
kami kirimkan shalawat beserta salam kepada junjungan kami Rasulullah Muhammad
SAW yang telah membawa cahaya kebenaran dalam hidup di dunia ini.
Dengan selesainya tesis ini, perkenankanlah kami mengucapkan terima kasih
kepada: Pejabat Rektor Universitas Sumatera Utara Prof. Subhilhar, Ph.D atas
kesempatan yang diberikan kepada kami untuk mengikuti dan menyelesaikan
pendidikan Program Magister.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi dan juga Ketua
Program Studi Magister Teknik Informatika FASILKOM-TI Universitas Sumatera
Utara, Prof. Dr. Muhammad Zarlis, M.Sc, Sekretaris Program Studi Magister Teknik
Informatika FASILKOM-TI Universitas Sumatera Utara M. Andri Budiman, S.T.,
M.Comp.Sc, MEM beserta seluruh staf pengajar dan pegawai pada Program Studi
Magister Teknik Informatika FASILKOM-TI Universitas Sumatera Utara. Terima
kasih tak terhingga dan penghargaan yang setingi-tingginya kami ucapkan kepada
Prof. Dr. Herman Mawengkang, selaku Pembimbing Utama yang dengan penuh
perhatian dan telah memberikan dorongan,bimbingan dan juga arahan, demikian juga
kepada Dr. Zakarias Situmorang selaku Pembimbing Anggota yang dengan penuh
kesabaran menuntun dan membimbing kami hingga selesainya penelitian ini.
Kepada ayahanda Alm Edi Siswanto dan ibunda Alm Suarni serta Kakek dan
Nenek, bapak mertua M. Rusdan Sadar dan mamak beserta seluruh keluargaku terima
kasih atas segala pengorbanan kalian baik berupa moril maupun materil, budi baik ini
tidak bisa dibalas hanya diserahkan kepada Allah SWT.
Untuk Maitri Rahmadhani, SS,M.Hum istriku yang ku cintai, terima kasih atas
segala dukungan dan motivasi yang sudah tercurah selama ini, tanpa mu tak kan kuat
kaki ini menapak.

viii

Terima kasih juga kami sampaikan kepada Ketua STT Harapan Medan yang
telah memberikan ijin kepada kami untuk melanjutkan studi, serta teman-teman dosen
di STT Harapan yang banyak mendukung dan memberikan dorongan mulai dari
kuliah awal sampai selesainya studi ini, hal yang sama juga saya ucapkan kepada
seluruh teman-teman mahasiswa di Program Studi Magister Teknik Informatika
FASILKOM-TI USU atas kerja samanya selama ini.

Medan, 15 Mei 2015

Edrian Hadinata
NIM.127038076

ix

ABSTRAK

Penentuan titik awal dalam algoritma fuzzy c-means (FCM) diambil dengan cara
random. Hal ini dapat menghasilkan perulangan yang berhingga. Untuk itu
dikembangkan algoritma penentuan titik awal dengan pendekatan hierarchical
agglomerative clustering sebagai pengganti proses randomisasi derajat keanggotaan
pada iterasi awal. Diharapkan nantinya proses clustering menghasilkan iterasi yang
lebih sedikit. Nilai-nilai yang dihasilkan pada algoritma ini merupakan penggabungan
sejumlah pusat cluster dari variabel-variabel berdasarkan perhitungan pendekatan
yang terdapat pada complete linkage. Kemudian menghitung selisih fungsi objektif
disetiap iterasi setelah dilakukan proses clustering pada FCM. Proses iterasi berhenti
setelah selisih fungsi objektif lebih kecil dari batas yang ditentukan.
Kata kunci : Fuzzy c-means, penentuan titik awal, complete linkage.

x

THE EXPANSION OF STARTING POINT ALGORITHM ON
CLUSTERING METHOD WITH FUZZY C-MEANS
ALGORITHM

ABSTRACT

Determining the starting point from fuzzy c-means(FCM) produced by random values.
The algorithm would produce limited looping. Therefore the expansion of starting
point algorithm approach by hierarchical agglomerative clustering as alternate step
from random process of membership degree in early iteration. Clustering process that
expected produce fewer iteration. Values that produce by this algorithm is merging of
cluster center from all variables based of complete linkage algorithm. Then calculate
the difference of objective function in the each iteration. Iteration process stopped
after the differences objective function is smaller than prescribed limit.
Keywords : Fuzzy c-means, starting point, complete linkage.

xi

DAFTAR ISI

Halaman

PERSETUJUAN ....................................................................................................... ii
PERNYATAAN ....................................................................................................... iii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPERLUAN AKADEMIS .................................................................................... iv
RIWAYAT HIDUP ................................................................................................. v
KATA PENGANTAR ............................................................................................. vi
ABSTRAK ............................................................................................................... vii
ABSTRACT ............................................................................................................. viii
DAFTAR ISI ................................................................................................................. xi
DAFTAR GAMBAR .................................................................................................. xiii
DAFTAR TABEL ........................................................................................................ xv
BAB 1 PENDAHULUAN ............................................................................................. 1
1.1

Latar Belakang .......................................................................................... 1

1.2

Rumusan Masalah ..................................................................................... 2

1.3

Batasan Masalah ....................................................................................... 3

1.4

Tujuan Penelitian ...................................................................................... 3

1.5

Manfaat Penelitian .................................................................................... 3

BAB 2 TINJAUAN PUSTAKA .................................................................................... 4
2.1

Metode Clustering .................................................................................... 4

2.2

Clustering Dengan Pendekatan Partisi ...................................................... 4
2.2.1 K-Means ........................................................................................ 4
2.2.2 Mixture Modelling (Mixture Modeling) ........................................ 5

2.3

Clustering dengan Pendekatan Hirarki ..................................................... 6
2.3.1 Agglomerative Clustering ............................................................. 6
2.3.2 Divisive Clustering ..................................................................... 11

2.4

Clustering Dengan Pendekatan Automatic Mapping.............................. 11
2.4.1 Self-Organising Map (SOM) ....................................................... 11

2.5

Clustering Dengan Pendekatan Berbasis Fuzzy ..................................... 13

xii

2.5.1 Fuzzy Clustering Means (Fuzzy C-Means) ................................ 13
2.5.2 Langkah Algoritma Fuzzy Clustering Means (FCM) ................. 14
2.6

Cluster Analysis ...................................................................................... 18

BAB 3 METODOLOGI PENELITIAN ...................................................................... 19
3.1

Pendahuluan ............................................................................................ 19

3.2

Diagram Kerja Tahapan Penelitian ......................................................... 22

3.3

Penentuan Titik Awal ............................................................................. 25
3.3.1 Penentuan Titik Awal Pusat Cluster Menggunakan Metode
Hierarki Clustering Agglomeratif Complete Linkage ................. 25
3.3.2 Pengembangan Algoritma ........................................................... 26
3.3.3 Uji Akurasi .................................................................................. 26

3.4

Data Set Uji Coba ................................................................................... 27

BAB 4 HASIL DAN PEMBAHASAN ....................................................................... 29
4.1

Pendahuluan ............................................................................................ 29

4.2

Kinerja Fuzzy C-Means .......................................................................... 29

4.3

Pengujian untuk Fuzzy C-Means ............................................................ 30

4.4

Pendekatan Complete Linkage Dalam Pencarian Pusat Cluster ............. 36

4.5

Inisialisasi titik awal Fuzzy C-Means ..................................................... 49

4.6

Pembuatan Algoritma.............................................................................. 52

4.7

Pengujian Keakuratan ............................................................................. 53

4.8

Hasil Akhir Analisis ................................................................................ 57

BAB 5 KESIMPULAN DAN SARAN ....................................................................... 58
5.1

Kesimpulan ............................................................................................. 58

5.2

Saran ....................................................................................................... 58

DAFTAR PUSTAKA .................................................................................................. 61

xiii

DAFTAR GAMBAR

Halaman
Gambar 2.1 Flowchart Fuzzy C-Means ...................................................................... 8
Gambar 2.2 Grafik Fluktuasi Nilai Fungsi Objektif ................................................... 8
Gambar 2.3 Flowchart algoritma Agglomerative Clustering Complete Linkage....... 9
Gambar 2.4 Perbandingan pencarian pusat cluster, kiri Complete Linkage dan kanan
Persamaan (2.3). ..................................................................................... 10
Gambar 2.5 Flowchart Fuzzy C-Means ...................................................................... 17
Gambar 3.1 Grafik Fluktuasi Nilai Fungsi Objektif .................................................... 19
Gambar 3.2 Grafik Selisih Fungsi Objektif Ke-22 ...................................................... 21
Gambar 3.3 Perbandingan Grafik Sebaran pada Fuzzy C-Means 5 Cluster pada setiap
iterasi....................................................................................................... 22
Gambar 3.4 Diagram alir Metodologi Penelitian ......................................................... 24
Gambar 3.5 Perbandingan Perbedaan Pusat Cluster iterasi ke-1 dan ke-5 .................. 25
Gambar 4.1 Grafik selisih fungsi objektif hingga t=11 ............................................... 33
Gambar 4.2 Grafik sebaran pada iterasi ke-11, untuk jumlah data sebanyak
4716 baris dan 250 kolom....................................................................... 34
Gambar 4.3 Grafik Sebaran data 0x ............................................................................. 38
Gambar 4.4 Sebaran data dengan 3 cluster kolom 0x. ................................................. 42
Gambar 4.5 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 0x ................................................................................... 43
Gambar 4.6 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 1x ................................................................................... 44

xiv

Gambar 4.7 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 2x ................................................................................... 45
Gambar 4.8 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 3x ................................................................................... 46
Gambar 4.9 Titik pusat kolom 0x ................................................................................ 47
Gambar 4.10 Titik pusat kolom 1x .............................................................................. 48
Gambar 4.11 Titik pusat kolom 2x .............................................................................. 48
Gambar 4.12 Titik pusat kolom 3x .............................................................................. 48
Gambar 4.13 Grafik Fungsi Objektif hingga t=5 ......................................................... 51
Gambar 4.14 Grafik Selisih Fungsi Objektif ............................................................... 52

xv

DAFTAR TABEL

Halaman

Tabel 3.1 Nilai Fungsi Objektif dan Selisih |P[t]-P[t-1]| ................................................. 20
Table 3.2 Daftar Atribut Rekaman Microsoft Kinect Sensor ...................................... 28
Tabel 4.1 Data Affirmative .......................................................................................... 30
Tabel 4.2 Data u random dengan jumlah cluster c = 3 ................................................ 31
Tabel 4.3 Data pusat cluster Vjk ................................................................................... 31
Tabel 4.4 Selisih fungsi objektif .................................................................................. 32
Tabel 4.5 Pusat cluster Vik untuk t=11 ........................................................................ 33
Tabel 4.6 Perhitungan Pusat Cluster dan Fungsi Objektif dimana t=1 ........................ 35
Tabel 4.7 Perhitungan jarak Xi dengan Xj ................................................................... 37
Tabel 4.8 Level 1 Pencarian pusat klaster menggunakan complete linkage ................ 41
Tabel 4.9 Level 5 Pencarian pusat klaster.................................................................... 41
Tabel 4.10 Top Level algoritma Complete Linkage kolom 0x .................................... 42
Tabel 4.11 Pusat cluster ............................................................................................... 47
Tabel 4.12 Perhitungan jarak pusat cluster dengan data observasi .............................. 50
Tabel 4.13 Fungsi Objektif pada iterasi 5 .................................................................... 50
Tabel 4.14 Selisih Fungsi Objektif .............................................................................. 51
Tabel 4.15 Tabel Cluster .............................................................................................. 54
Tabel 4.16 Proses perhitungan grand total dan rata-rata setiap kelompok .................. 55
Tabel 4.17 Perhitungan harga awal untuk analisis variansi ......................................... 55
Tabel 4.18 Perbandingan Between Group dan Within Group dengan titik awal......... 57
Tabel 4.19 Perbandingan Between Group dan Within Group tanpa titik awal ........... 57