Optimasi Pusat Cluster Awal K-Means dengan Algoritma Genetika Pada Pengelompokan Dokumen
ABSTRAK
Pengelompokan dokumen berdasarkan karakteristik kata yang ada pada dokumen
dilakukan untuk memudahkan mengorganisir dokumen pada kebutuhan lebih lanjut.
Algoritma K-Means clustering merupakan salah satu algoritma pengelompokan yang
melakukan pengelompokan secara iteratif dengan melakukan partisi set data ke dalam
sejumlah K cluster. Namun hasil pada K-Means clustering tersebut sangat ditentukan
pada penentuan pusat cluster awal yang pada umumnya ditentukan secara random.
Pada penelitian ini dilakukan penentuan pusat cluster awal K-Means untuk masalah
pengelompokan dokumen dengan memanfaatkan algoritma genetika sebagai algoritma
yang mengoptimasi pusat cluster awal K-Means tersebut. Pada hasil pengujian
pengelompokan dokumen berita yang dilakukan sebanyak 5 kali untuk pusat cluster
awal secara random tingkat keberhasilan mencapai 26.66 % sedangkan untuk pusat
cluster awal dengan algoritma genetika tingkat keberhasilan mencapai 46.66 %.
Kata Kunci : Pengelompokan, K-Means Clustering, Pusat Cluster Awal, Algoritma
Genetika, Optimasi, Dokumen
viii
Universitas Sumatera Utara
OPTIMIZATION OF INITIAL CLUSTER CENTER K-MEANS WITH
GENETIC ALGORITHM IN DOCUMENTS CLUSTERING
ABSTRACT
Clustering a data set of documents based on certain data points in documents are an
easy way to organize document for extension to work. K-Means clustering algorithm
is one of iterative cluster algorithm to partition a set of entities into K cluster.
Unfortunately, resulting in K Means cluster is depending on the initial cluster center
that generally assigned randomly. In this reserach, determining initial cluster center
K-Means for documents clustering are investigated by using genetic algorithm as an
algorithm which optimize initial cluster center of K-Means. Based on the result of this
test, clustering news document with 5 times for initial cluster center randomly has
26.66% for level of success, meanwhile for initial cluster center by using genetic
algorithm has 46.66% for level of success.
Keyword : Clustering, K-Means Clustering, Initial Cluster Center, Genetic Algorithm,
Optimization, Document
ix
Universitas Sumatera Utara
Pengelompokan dokumen berdasarkan karakteristik kata yang ada pada dokumen
dilakukan untuk memudahkan mengorganisir dokumen pada kebutuhan lebih lanjut.
Algoritma K-Means clustering merupakan salah satu algoritma pengelompokan yang
melakukan pengelompokan secara iteratif dengan melakukan partisi set data ke dalam
sejumlah K cluster. Namun hasil pada K-Means clustering tersebut sangat ditentukan
pada penentuan pusat cluster awal yang pada umumnya ditentukan secara random.
Pada penelitian ini dilakukan penentuan pusat cluster awal K-Means untuk masalah
pengelompokan dokumen dengan memanfaatkan algoritma genetika sebagai algoritma
yang mengoptimasi pusat cluster awal K-Means tersebut. Pada hasil pengujian
pengelompokan dokumen berita yang dilakukan sebanyak 5 kali untuk pusat cluster
awal secara random tingkat keberhasilan mencapai 26.66 % sedangkan untuk pusat
cluster awal dengan algoritma genetika tingkat keberhasilan mencapai 46.66 %.
Kata Kunci : Pengelompokan, K-Means Clustering, Pusat Cluster Awal, Algoritma
Genetika, Optimasi, Dokumen
viii
Universitas Sumatera Utara
OPTIMIZATION OF INITIAL CLUSTER CENTER K-MEANS WITH
GENETIC ALGORITHM IN DOCUMENTS CLUSTERING
ABSTRACT
Clustering a data set of documents based on certain data points in documents are an
easy way to organize document for extension to work. K-Means clustering algorithm
is one of iterative cluster algorithm to partition a set of entities into K cluster.
Unfortunately, resulting in K Means cluster is depending on the initial cluster center
that generally assigned randomly. In this reserach, determining initial cluster center
K-Means for documents clustering are investigated by using genetic algorithm as an
algorithm which optimize initial cluster center of K-Means. Based on the result of this
test, clustering news document with 5 times for initial cluster center randomly has
26.66% for level of success, meanwhile for initial cluster center by using genetic
algorithm has 46.66% for level of success.
Keyword : Clustering, K-Means Clustering, Initial Cluster Center, Genetic Algorithm,
Optimization, Document
ix
Universitas Sumatera Utara