Analisis Fungsi Algoritma c-means dan Cluster Analysis (variance)

BAB I
PENDAHULUAN

1.1 Latar Belakang
Ketersediaan data yang melimpah yang berasal dari pengguna teknologi sistem
informasi hampir di semua bidang kehidupan menimbulkan kebutuhan untuk
menggali informasi yang terkandung dalam data yang berlimpah tersebut, maka
lahirlah teknik data maining. Data maining merupakan suatu proses untuk mencari
informasi/pola yang merupakan nilai tambah dalam suatu data yang ukurannya besar
yang kadang tidak dapat diketahui keberadaannya secara manual sehingga harus
menggunakan teknik-teknik tertentu, (Bramer, 2007).
Teknik clustering termasuk teknik yang cukup terkenal dan banyak dipakai
dalam data mining. Clustering merupakan pengelompokan dengan objek yang tidak
mirip ke dalam cluster lain (Bramer, 2007). Prinsip dari clustering untuk
memaksimalkan

homogenitas/kesamaan

ciri

dalam


satu

kelompok

dan

memaksimalkan heterogenitas/ketidaksamaan ciri antara kelompok. Selain itu metode
ini mampu mengelompokkan data yang tersebar secara tidak teratur.
Beberapa peneitian telah melakukan penelitian tentang pengklasteran data
dengan berbagai metode yang dipakai, diantaranya, penelitian yang dilakukan oleh
beberapa peneliti berikut ini; Bahar (2011), melakukan penelitian penentuan jurusan
sekolah menengah atas dengan Algoritma C-Means memiliki tingkat akurasi yang
lebih tinggi (yaitu rata-rata 78,39%), jika dibanding dengan metode penentuan jurusan
secara manual yang selama ini dilakukan (hanya memiliki tingkat akurasi rata-rata
56,17%); (Beni Ilham Priyambono, et al. 2011). Menentukan cluster yang ideal
dengan meggunakan variance dalam penelitian yang membahas implementasi metode
single linkage untuk menentukan kinerja agent pada call center berbasis astersk for
java.


Universitas Sumatera Utara

Berdasarkan penelitian yang ada tersebut, penulis mencoba untuk melakukan
penelitian menggunakan Algoritma C-Means dan Cluster Analysis (Variance) dalam
clustering data, diharapkan dapat menentukan berapa sesungguhnya cluster yang ideal
yang terbentuk dari range data yang akan di clustering dan juga penelitian ini dapat
memberikan kontribusi yang lebih besar maka Algoritma C-Means dan Cluster
Analysis (Variance) ini akan diterapkan dalam suatu alat bantu (berupa software yaitu
Microsoft Visual Studio 2010).

1.2

Perumusan Masalah

Perumusan masalah yang dapat ditarik dari penjelasan latar belakang adalah:
Apakah Algoritma C-Means dan Cluster Analysis (Variance) dapat
menentukan berapa sesungguhnya cluster yang ideal yang terbentuk dari range data
yang akan di clustering.

2.3


Batasan Masalah

Rumusan masalah di atas, dibatasi dengan beberapa hal sebagai berikut:
1.

Algoritma yang digunakan dalam pengolahan data adalah Algoritma C-Means
dan Cluster Analysis (Variance).

2.

Aplikasi yang akan digunakan: bahasa pemrograman Microsoft Visual Studio
2010.

1.4 Tujuan Penelitian
Adapun tujuan penelitian ini adalah menentukan berapa sesungguhnya cluster
yang ideal yang terbentuk dari range data yang akan di clustering dengan Algoritma
C-Means dan Cluster Analysis (Variance).

Universitas Sumatera Utara


1.5 Manfaat Penelitian
Manfaat yang diharapkan dari hasil penelitian adalah sebagai berikut:
1. Dapat mengetahui apakah Algoritma C-Means dan Cluster Analysis (Variance)
dapat menentukan berapa sesungguhnya cluster yang ideal yang terbentuk dari
range data yang akan di clustering.
2. Dapat mengaplikasikan Algoritma C-Means dan Cluster Analysis (Variance) dalam
clustering data.
3. Dapat mengetahui lebih dalam tentang Algoritma C-Means dan Cluster Analysis
(Variance).

Universitas Sumatera Utara