Analisis Kinerja Metode Dbscan (Density-Based Spatial Clustering of Applications with Noise) dan K-Means Dalam Sistem Pendukung Keputusan

1

ANALISIS KINERJA METODE DBSCAN (Density-Based Spatial
Clustering of Applications with Noise) DAN K-MEANS DALAM
SISTEM PENDUKUNG KEPUTUSAN

TESIS

FAUZIAH NUR
147038069

PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2017

1

Universitas Sumatera Utara


2

ANALISIS KINERJA METODE DBSCAN (Density-Based Spatial
Clustering of Applications with Noise) DAN METODE K-MEANS
DALAM SISTEM PENDUKUNG KEPUTUSAN

TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika

FAUZIAH NUR
147038069

PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2017

2


Universitas Sumatera Utara

PERSETUJUAN

Judul

: ANALISIS KINERJA METODE DBSCAN (DensityBased Spatial Clustering of Applications with Noise)
DAN K-MEANS DALAM SISTEM PENDUKUNG
KEPUTUSAN

Kategori

: TESIS

Nama

: FAUZIAH NUR

Nomor Induk Mahasiswa


: 147038069

Program Studi

: MAGISTER (S2) TEKNIK INFORMATIKA

Fakultas

: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA

Komisi Pembimbing :

Pembimbing 2

Pembimbing 1

Dr. Benny Benyamin Nasution


Prof. Dr. Muhammad Zarlis

Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika
Ketua,

Prof. Dr. Muhammad Zarlis
NIP. 19570701 198601 1 003

Universitas Sumatera Utara

PERNYATAAN

ANALISIS KINERJA METODE DBSCAN (Density-Based Spatial Clustering of
Applications with Noise) DAN K-MEANS DALAM
SISTEM PENDUKUNG KEPUTUSAN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan

dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, April 2017

Fauziah Nur
NIM. 147038069

Universitas Sumatera Utara

PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS

Sebagai civitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:

Nama

: Fauziah Nur


NIM

: 147038069

Program Studi

: Magister (S2) Teknik Informatika

Jenis Karya Ilmiah

: Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:

ANALISIS KINERJA METODE DBSCAN (Density-Based Spatial Clustering of
Applications with Noise) DAN K-MEANS DALAM
SISTEM PENDUKUNG KEPUTUSAN


Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa menerima izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, April 2017

Fauziah Nur
NIM.147038069
Telah diuji pada

Universitas Sumatera Utara

Tanggal: April 2017

PANITIA PENGUJI TESIS
Ketua

: Prof. Dr. Muhammad Zarlis


Anggota

: 1. Dr. Benny Benyamin Nasution
2. Dr. Syahril Efendi, S.Si., M.IT
3. Dr. Pahala Sirait, ST., M.Kom

Universitas Sumatera Utara

RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap (berikut gelar)

: Fauziah Nur, S.Kom, S.Pd

Tempat dan Tanggal Lahir

: Medan, 19 November 1991


Alamat Rumah

: Jl. Mangaan IV Lr. Rahayu
Gg.Mulia No. 30 A Mabar, 20242
Medan Deli – Sumatera Utara

Telepon/Faks/HP

: 0852 7732 5102

E-Mail

: nur4ziah@gmail.com

DATA PENDIDIKAN

SD

: SDN 101785 Mabar


TAMAT: 2004

SMP : MTs Negeri 3 Medan

TAMAT: 2007

SMA : MAN 1 Medan

TAMAT: 2010

S1

: STMIK Logika Medan

TAMAT: 2014

S1

: Universitas Negeri Medan


TAMAT: 2015

S2

: Magister Teknik Informatika

TAMAT: 2017

Universitas Sumatera Utara

KATA PENGANTAR

Alhamdulillah, pertama tama dan yang paling utama, penulis mengucapkan puji
dan syukur kehadirat Allah SWT, yang telah melimpahkan rahmat dan karunia-Nya
kepada penulis, sehingga penulis dapat menyelesaikan tesis ini dengan sebaik-baiknya.
Penulis mengucapkan terima kasih yang tak terhingga kepada pihak yang telah
mendukung diantaranya:
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, S.H.,
M.Hum., atas kesempatan yang telah diberikan kepada penulis untuk dapat
mengikuti

dan menyelesaikan pendidikan

Program

Magister

Teknik

Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas
Sumatera Utara.
2. Dekan Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI)
Universitas Sumatera Utara, Bapak Prof. Dr. Opim Salim Sitompul, yang sudah
banyak memberikan bimbingan dan arahan.
3. Ketua Program Studi Magister Teknik Informatika, Bapak Prof. Dr. Muhammad
Zarlis. Sekretaris Program Studi Teknik Informatika, Bapak Syahril Efendi,
S.Si., M.IT. Beserta seluruh Staf Pengajar Program Studi Magister Teknik
Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas
Sumatera Utara.
4. Bapak Prof. Dr. Muhammad Zarlis selaku Pembimbing Utama, demikian juga
kepada Dr. Benny Benyamin Nasution. selaku Pembimbing Kedua yang dengan
penuh kesabaran menuntun dan membimbing penulis hingga selesainya tesis ini
dengan baik.
5. Bapak Dr. Syahril Efendi dan Bapak Dr. Pahala Sirait, sebagai Dosen
Pembanding yang telah memberikan saran dan masukan serta arahan yang baik
demi penyelesaian tesis ini.
6. Ayahanda tercinta Marno, Ibunda tercinta Ratnawati, serta kakak – kakakku
tersayang serta seluruh keluarga besar yang selalu memberi do’a dan dukungan
kepada penulis.

Universitas Sumatera Utara

7. Seluruh staf pegawai Program Studi Magister S2 Teknik Informatika Fakultas
Ilmu Komputer dan Teknik Informatika, serta teman-teman seperjuangan
mahasiswa/i Kom-C 2014.
8. Dan seluruh pihak yang tidak dapat disebutkan satu persatu dalam tesis ini,
sekali lagi terima kasih atas segala bantuan dan doa yang telah diberikan.
Penulis menyadari bahwa penelitian ini masih jauh dari kata sempurna, ini
dikarenakan oleh keterbatasan, kemampuan dan pengetahuan penulis. Harapan penulis,
semoga penelitian ini bermanfaat bagi penulis khususnya dan pembaca pada umumnya.
Sekali lagi penulis mengucapkan terima kasih, semoga Allah SWT membalas kebaikan
yang telah diberikan. Aamiin.

Medan,
Penulis,

April 2017

Fauziah Nur
NIM: 147038069

Universitas Sumatera Utara

ABSTRAK

Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan
(unsupervised) dan suatu metode untuk mencari dan mengelompokan data yang
memiliki kemiripan karakteristik antara satu data dengan data lain. Dalam penelitian
ini, untuk pengelompokan data menggunakan metode K-Means dan metode DBSCAN,
adapun tambahan metode pengelompokan yaitu rule-based classification sebagai
perbandingan antara metode K-Means dan DBSCAN. Dalam hal ini, peneliti
mengelompokan 6 kelompok jurusan pada sekolah menengah kejuruan SMK Swasta
Medan Area.1 dengan menggunakan kriteria – kriteria yang terdapat dalam data siswa
tersebut seperti jenis kelamin, pendapatan orang tua, tanggungan anak orang tua, nilai
tes dan tinggi badan siswa. Data sampel yang diuji adalah berjumlah 40 data siswa
SMK. Pada penelitian ini, untuk pengujian rule-based classification menghasilkan 648
rule. Kemudian data dikelompokan dengan menggunakan k-Means yang menghasilkan
6 kelompok, dengan adanya 2 noise. Pengelompokan terjadi hingga 4 kali iterasi. Pada
metode DBSCAN pengelompokan data menggunakan 2 parameter yaitu epsilon=
0.00972 dan MinPts= 2 yang menghasilkan 3 kelompok. Setelah hasil pengelompokan
dengan menggunakan kedua metode tersebut, selanjutnya data diuji menggunakan uji
statistik nonparametrik dengan hasil Zhitung = 4.8 sehingga didapat hasil menolak H0 dan
menerima H1 yang berarti penggunaan K-Means lebih optimal daripada penggunaan
DBSCAN dalam penelitian ini. Pengelompokan ini bermanfaat untuk mengelompokan
siswa sesuai jurusan berdasarkan beberapa kriteria yang telah ditentukan dan menguji
kinerja metode yang digunakan.

Kata Kunci: K-Means, DBSCAN, Clustering, SMK

Universitas Sumatera Utara

ANALYSIS OF PERFORMANCE DBSCAN (Density-Based Spatial Clustering
of Applications with Noise) AND K-MEANS METHODS IN DECISION OF
SUPPORT SYSTEM

ABSTRACT

Clustering is one of the unsupervised mining data methods; it is also a method used to
seek and to group data which have characteristic resemblance from one datum to
another one. In this research, K-means method and DBSCAN method were used to
group the data; rule-based classification was also used to the supplementary clustering
method as a comparison between K-Means method and DBSCAN method. In this case,
the research grouped 6 clusters at SMK Swasta (Private Vocational School) Medan
Area 1 by using the criteria found in the students’ data such as sex, parents’ income,
parents’ dependents, test scores, and students’ body height. There were 40 data of the
students as the samples. The result of rule-based classification was 648 rules. The data
were then grouped by using K-Means method which yielded 6 clusters with only 3
noises. Grouping occurred until 4 iterations. In DBSCAN method, the data were
grouped by using 2 parameters: epsilon = 0.00972 and MinPts = 2 which yielded 3
clusters. After grouping by using both methods, the data were tested by using nonparametric statistical test; the result was Zcount = 4.8 so the Ho was rejected and Hi was
accepted which indicated that using K-Means was more optimal than using DBSCAN
in this research. This clustering was beneficial to group the students according some
criteria which had determined and tested the performance of the used methods.

Keywords: K-Means, DBSCAN, Clustering, SMK

Universitas Sumatera Utara

DAFTAR ISI

HALAMAN JUDUL
PERSETUJUAN
PERNYATAAN
PERSETUJUAN PUBLIKASI
PANITIA PENGUJI
RIWAYAT HIDUP
UCAPAN TERIMA KASIH
ABSTRAK
ABSTRACT
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
BAB 1 PENDAHULUAN
1.1. Latar Belakang
1.2. Perumusan Masalah
1.3. Batasan Masalah
1.4.Tujuan Penelitian
1.5.Manfaat Penelitian
BAB 2 TINJAUAN PUSTAKA
2.1. Penelitian Terkait
2.2. Sistem Pendukung Keputusan (SPK)
2.3. Data Mining
2.3.1. Proses Data Mining
2.3.2. Data Mining dalam Berbagai Disiplin Ilmu
2.4. Clustering
2.4.1. Konsep Clustering
2.4.2. Ciri – Ciri Cluster
2.4.3. Hierarchical dan Non Hierarchical Clustering
2.5. Rule-Based Classification

Universitas Sumatera Utara

2.6. Metode DBSCAN
2.7. Metode K-Means
2.8. Konvergen
2.9. Statistik Nonparametrik
2.10. Uji Tanda(Sign Test)
BAB 3 METODOLOGI PENELITIAN
3.1. Pendahuluan
3.2. Lingkungan Penelitian
3.3. Teknik Pengembangan
3.4. Rancangan Penelitian
3.5. Tahapan Penelitian
3.5.1. Analisis dan Pengambilan Data
3.5.2. Pengelompokan Data Sesuai Kriteria
3.5.3. Clustering Data
3.5.3.1. Algoritma DBSCAN
3.5.3.2. Clustering dengan DBSCAN
3.5.3.3. Algoritma K-Means
3.5.3.4. Clustering dengan K-Means
3.5.4. Pengujian Metode
BAB 4 HASIL DAN PEMBAHASAN
4.1. Pengantar
4.2. Hasil Uji Coba
4.2.1. Clustering Metode DBSCAN
4.2.2. Clustering Metode K-Means
4.2.3. Kinerja Metode
4.3. Kontribusi Penelitian
BAB 5 KESIMPULAN DAN SARAN
5.1. Kesimpulan
5.2. Saran
DAFTAR PUSTAKA
LAMPIRAN

Universitas Sumatera Utara

DAFTAR TABEL

Tabel 3.1 Inisialisasi Data
Tabel 3.2 Penentuan Range untuk Cluster
Tabel 3.3 Centroid Awal
Tabel 4.1 Hasil Cluster dengan DBSCAN
Tabel 4.2 Centroid Baru Pertama
Tabel 4.3 Centroid Baru Kedua
Tabel 4.4 Centroid Baru Ketiga
Tabel 4.5 Hasil Cluster dengan K-Means
Tabel 4.6 Uji Tanda Data

Universitas Sumatera Utara

DAFTAR GAMBAR

Gambar 2.1 Komponen Sistem Pendukung Keputusan (SPK)
Gambar 2.2 Proses Data Mining
Gambar 2.3 Posisi Data Mining di antara Beberapa Bidang Ilmu
Gambar 2.4 Pengelompokan dengan Cluster
Gambar 3.1 Rancangan Penelitian
Gambar 3.2 Flowchart DBSCAN
Gambar 3.3 Jarak Euclidean pada DBSCAN
Gambar 3.4 Flowchart K-Means
Gambar 3.5 Penggunaan Notasi Uji Nonparametrik
Gambar 3.6 Penetapan H0 dan H1
Gambar 4.1 Proses Pengujian pada DBSCAN
Gambar 4.2 Hasil Uji pada DBSCAN
Gambar 4.3 Pengelompokan Data dengan DBSCAN
Gambar 4.4 Cluster Awal pada K-Means
Gambar 4.5 Cluster Akhir pada K-Means

Universitas Sumatera Utara