Analisis Kinerja Metode Dbscan (Density-Based Spatial Clustering of Applications with Noise) dan K-Means Dalam Sistem Pendukung Keputusan

BAB 1
PENDAHULUAN

1.1.

Latar Belakang

Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan
(unsupervised) dan suatu metode untuk mencari dan mengelompokan data yang
memiliki kemiripan karakteristik antara satu data dengan data lain (J. Oscar Ong, 2013).
Menurut kategori kekompakan, pengelompokan terbagi menjadi dua, yaitu komplet dan
parsial. Jika semua data dapat bergabung menjadi satu, dapat dikatakan semua data
kompak menjadi satu kelompok. Namun, jika terdapat satu atau dua data yang tidak ikut
bergabung, maka data tersebut dikatakan mempunyai perilaku menyimpang, yang
disebut sebagai outlier atau noise. Metode yang dapat mendeteksi outlier tersebut
adalah DBSCAN dan K-Means dengan melakukan sejumlah komputasi tambahan (Eko
Prasetyo, 2012).
DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
merupakan algoritma pengelompokan berdasarkan daerah yang memiliki kepadatan
data yang lebih tinggi dari daerah sekitarnya (Irving et al, 2015). Sedangkan K-Means
merupakan metode analisis kelompok yang mengarah pada partisian N objek

pengamatan ke dalam K kelompok, di mana setiap objek pengamatan sebuah kelompok
data dengan mean (rata-rata) terdekat (Eko Prasetyo, 2012). Dalam penelitian ini
analisis dilakukan dengan menggunakan DBSCAN dan K-Means apabila data yang
akan dikelompokan sangat besar, namun jika data yang akan dikelompokan tidak terlalu
besar maka dapat menggunakan rule-based classification. Sehingga data yang
dikelompokan dapat menggunakan metode yang sesuai dengan jumlah data tersebut.
Metode DBSCAN sendiri dikembangkan berdasarkan algoritma density (kepadatan)
sehingga menumbuhkan area-area yang cukup tinggi ke dalam cluster-cluster dan
menemukan cluster-cluster tersebut dalam bentuk sembarang dalam suatu database

Universitas Sumatera Utara

spatial yang memuat noise (I Made S.P, 2013). Metode DBSCAN dipakai karena dapat
mengatasi kelemahan dari data yang memiliki penyimpangan.
Pengelompokan dapat terjadi dalam mengelompokan berbagai data, salah satunya
dapat pengelompokan jurusan untuk siswa baru sesuai kriteria pada sekolah menengah
kejuruan. Pada umumnya penentuan jurusan pada sekolah menengah kejuruan hanya
didasarkan dengan nilai siswa, sehingga ketidakseimbangan kemampuan siswa dengan
jurusan pada SMK tersebut. Oleh karena itu, dengan menerapkan metode
pengelompokan DBSCAN diharapkan dapat menentukan jurusan siswa tanpa ada data

yang menyimpang dengan pengelompokan dalam mengambil jurusan sekolah
menengah kejuruan. Namun tidak disertakan dengan kriteria – kriteria lainnya, sehingga
pengelompokan tidak merata. Oleh karena itu, untuk mengambil keputusan dengan
menambahkan beberapa parameter dalam menentukan jurusan siswa tersebut. Kriteria
– kriteria tersebut diantaranya jenis kelamin, pendapatan orang tua, tanggungan anak
orang tua nilai tes dan tinggi badan siswa. Agar data yang akan dikelompokan dengan
banyak parameter menjadi efektif maka penggunaan metode DBSCAN yang dapat
membantu pengelompokan dengan mudah. Namun metode K-Means juga dapat
melakukan pengelompokkan dengan didasarkan kemiripan karakteristik setiap individu
yang akan dikelompokkan.
Atas dasar tersebut, penulis melakukan pengujian kinerja metode DBSCAN, KMeans, DBSCAN dengan K-Means, serta rule-based classification berdasarkan data
yang memiliki karakteristik tertentu, sehingga akan diperoleh pengelompokan data
yang efektif dan optimal.

1.2.

Perumusan Masalah

Berdasarkan latar belakang masalah yang diuraikan di atas, maka perumusan masalah
adalah menguji kinerja metode pengelompokan dengan cluster pada sistem pendukung

keputusan menggunakan metode DBSCAN (Density-Based Spatial Clustering of
Applications with Noise) dan K-Means.

Universitas Sumatera Utara

1.3.

Batasan Masalah

Berdasarkan perumusan masalah terdapat batasan masalah, yaitu:
1. Metode yang digunakan dalam penelitian ini adalah DBSCAN (Density-Based
Spatial Clustering of Applications with Noise) dan K-Means.
2. Penelitian ini menggunakan rule-based classification pada saat data dalam
jumlah yang tidak besar.
3. Menguji

kinerja

metode


DBSCAN

dan

K-Means

dengan

statisttik

nonparametrik.

1.4.

Tujuan Penelitian

Adapun Tujuan dari penelitian ini adalah:
1. Menghasilkan suatu sistem pendukung keputusan untuk memudahkan
pengelompokan data siswa dalam penentuan jurusan pada sekolah menengah
kejuruan.

2. Menghasilkan metode yang akurat dan efektif secara pengelompokan diantara
metode DBSCAN (Density-Based Spatial Clustering of Applications with
Noise) dengan metode K-Means.

1.5.

Manfaat Penelitian

Manfaat yang diharapkan dari hasil penelitian ini adalah sebagai berikut:
1. Menyelesaikan data yang memiliki kriteria tertentu dengan menggunakan
DBSCAN, K-Means, dan rule based classification.
2. Mengetahui tingkat efektivitas kinerja metode DBSCAN dan K-Means.

Universitas Sumatera Utara