Optimasi Pusat Cluster Awal K-Means dengan Algoritma Genetika Pada Pengelompokan Dokumen

ABSTRAK

Pengelompokan dokumen berdasarkan karakteristik kata yang ada pada dokumen
dilakukan untuk memudahkan mengorganisir dokumen pada kebutuhan lebih lanjut.
Algoritma K-Means clustering merupakan salah satu algoritma pengelompokan yang
melakukan pengelompokan secara iteratif dengan melakukan partisi set data ke dalam
sejumlah K cluster. Namun hasil pada K-Means clustering tersebut sangat ditentukan
pada penentuan pusat cluster awal yang pada umumnya ditentukan secara random.
Pada penelitian ini dilakukan penentuan pusat cluster awal K-Means untuk masalah
pengelompokan dokumen dengan memanfaatkan algoritma genetika sebagai algoritma
yang mengoptimasi pusat cluster awal K-Means tersebut. Pada hasil pengujian
pengelompokan dokumen berita yang dilakukan sebanyak 5 kali untuk pusat cluster
awal secara random tingkat keberhasilan mencapai 26.66 % sedangkan untuk pusat
cluster awal dengan algoritma genetika tingkat keberhasilan mencapai 46.66 %.
Kata Kunci : Pengelompokan, K-Means Clustering, Pusat Cluster Awal, Algoritma
Genetika, Optimasi, Dokumen

viii
Universitas Sumatera Utara

OPTIMIZATION OF INITIAL CLUSTER CENTER K-MEANS WITH

GENETIC ALGORITHM IN DOCUMENTS CLUSTERING

ABSTRACT

Clustering a data set of documents based on certain data points in documents are an
easy way to organize document for extension to work. K-Means clustering algorithm
is one of iterative cluster algorithm to partition a set of entities into K cluster.
Unfortunately, resulting in K Means cluster is depending on the initial cluster center
that generally assigned randomly. In this reserach, determining initial cluster center
K-Means for documents clustering are investigated by using genetic algorithm as an
algorithm which optimize initial cluster center of K-Means. Based on the result of this
test, clustering news document with 5 times for initial cluster center randomly has
26.66% for level of success, meanwhile for initial cluster center by using genetic
algorithm has 46.66% for level of success.
Keyword : Clustering, K-Means Clustering, Initial Cluster Center, Genetic Algorithm,
Optimization, Document

ix
Universitas Sumatera Utara