ANALISIS PENGARUH NILAI CENTROID TERHADA
ANALISIS PENGARUH NILAI CENTROID TERHADAP JUMLAH
ITERASI DENGAN MENGGUNAKAN METODE CLUSTERING
(STUDI KASUS PT. PHP MOTOR)
Evri Ekadiansyah1, Purwa Hasan Putra2
1
Dosen Teknik Informatika, STMIK Potensi Utama
Mahasiswa Sistem Informasi, STMIK Potensi Utama
1,2
Jl. K L. Yos Sudarso Km 6,5 No. 3A Tanjung Mulia-Medan
1
[email protected] 2 [email protected]
2
Abstrak
Currently, the concept of data mining is increasingly recognized as an important tool in the management
of information due to the amount of information that increasingly large numbers. One of the known
techniques in data mining, namely clustering. Understanding clustering in data mining scientific data or
grouping a number of objects in the cluster will contain data that is as similar as possible and different
from the other objects in the cluster. In this study, the authors tried to analyze the amount of the value of
the centroid of the number of iterations by using clustering methods. Testing the number of centroid value
2 has a smaller number of iterations is the 3rd iteration with previous data similarity level, compared to
the number of centroid values 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15, 16, 17, 18, 19, 20. Testing the
number of centroid value 4 has a greater number of iterations, reaching 14 iterations to reach the level of
similarity to previous data. The number of different centroid values will result in the number of iterations
of the different anyway. The number of large centroid value does not always lead to the number of
iterations increases.
Kata kunci: data mining, clustering.
1.Pendahuluan
Saat ini, konsep data mining semakin
dikenal sebagai tools penting dalam manajemen
infomasi karena jumlah informasi yang semakin
besar jumlahnya. Data mining sendiri sering
disebut sebagai knowledge discovery in database
(KDD) adalah
kegiatan
yang
meliputi
pengumpulan, pemakaian data historis untuk
menemukan keteraturan, pola hubungan dalam
set data berukuran besar . Output dari data mining
ini dapat digunakan untuk pengambilan
keputusan di masa depan.
Salah satu teknik yang dikenal dalam data
mining yaitu clustering. Pengertian clustering
keilmuan dalam data mining pengelompokan
sejumlah data atau objek ke dalam cluster
tersebut akan berisi data yang semirip mungkin
dan berbeda dengan objek dalam cluster yang
lainnya. Sampai saat ini, para ilmuan masih terus
melakukan berbagai usaha untuk melakukan
perbaikan model cluster dan menghitung jumlah
cluster yang optimal sehingga dapat dihasilkan
cluster yang paling baik [1].
Tutik
Khotimah
(2014)
melakukan
pengelompokan surat-surat dalam Al Qur’an
dengan menggunakan algoritma K-means.
Pengelompokan menghasilkan 4 cluster dengan
anggota cluster_0 sebanyak 18 surat, cluster_1
sebanyak 26 surat, cluster_2 sebanyak 7 surat,
cluster_3 sebanyak 63 surat. Pengelompokan ini
telah mencapai nilaioptimal pada iterasi ke-14
[3].
Kumar Ch.N.Santosh, V.Shita Ramulu, et
al. (2012) Tujuan utama dari data mining adalah
untuk menemukan pengetahuan yang kompleks
dari data yang tersembunyi. Berdasarkan amalisis
clustering
ditemukan
informasi
yang
menggambarkan objek atau hubungan data
terdapat semua anggota dari cluster yang sama
memiliki fitur serupa sedangkan cluster yang
berbeda memiliki fitur yang berbeda [4].
Dari penelitian sebelumnya belum pernah
digunakan pengaruh nilai centroid terhadap
jumlah iterasi dengan menggunakan metode
Clustering.
Tujuan penelitian ini dilakukan adalah
untuk menganalisis pengaruh jumlah nilai
centroid terhadap jumlah iterasi dengan
menggunakan metode clustering.
2.Data Mining
Data mining merupakan proses seni
otomatik yang menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine
learning
untuk
mengekstraksi
dan
mengidentifikasi
informasi
pengetahuan
potensial dan berguna yang bermanfaat yang
tersimpan database besar. Secara sederhana, data
mining dapat diartikan sebagai proses
“menggali” knowledge yang ada pada
sekumpulan (sejumlah) data [6].
3. Metode Penelitian
c31=598
Metode penelitian ini meliputi tahapan
analisis dilakukan pada saat tahap perencanaan
telah selesai. Pada tahapan ini melakukan
penelitian lanjutan untuk memperoleh data yang
lebih terperinci, yang betujuan untuk keperluan
pengembangan sistem secara teknis.
Selanjutnya
penelitian
ini
untuk
menganalisa pengaruh centroid terhadap jumlah
iterasi dengan metode clustering. Penulis ingin
mengetahui apakah ada perbedaan antara
penambahan centroid dengan jumlah iterasi.
Untuk mencapai tujuan tersebut, penulis
akan
melakukan
perbandingan
dengan
menggunakan data kredit sepeda motor pada
PT.PHP MOTOR.
Pengaruh nilai centroid terhadap jumlah
iterasi dengan metode clustering digunakan
langkah-langkah sebagai berikut.
a. Sumber data yang digunakan dalam
penelitian ini merupakan data kredit sepeda
motor dari konsumen PT.PHP MOTOR.
b. Melakukan
studi
pustaka
tentang
pengelompokan data dengan metode
clustering.
c. Menentukan variable-variabel dari data
konsumen kredit sepeda motor pada
PT.PHP MOTOR diantaranya: nama
pelanggan, jumlah angsuran, lama angsuran
dan tunggakan kredit.
d. Menentukan parameter dalam pengujian
diantaranya: jumlah centroid yang di
variasikan dari centroid 2 sampai centroid
20, jumlah data konsumen sebanyak 100
data, dan jumlah iterasi maksimum 15.
e. Pengujian dilakukan bertujuan untuk
mengetahui pengaruh nilai centroid dengan
jumlah iterasi maksimum dengan metode
clustering.
4.Hasil Dan Pembahasan
Dalam penelitian ini akan dilakukan
analisis pengaruh nilai centroid terhadap jumlah
iterasi dengan menggunakan metode clustering.
Untuk mengetahui pengaruh nilai centroid
maka jumlah centroid di variasikan dari nilai
centroid 2 sampai nilai centroid 20 dengan
jumlah data 100 dan jumlah iterasi maksimum
15.
Berikut berupa tahapan-tahapan dari
proses clustering dengan nilai centroid 2,
jumlah data 100, dan jumlah iterasi maksimum
15 dapat dilihat pada Tabel 1.
Tabel 1(a). Pusat cluster awal dengan iterasi ke 1
Pusat Cluster Awal
c11=559
c21=1314
c12=33
c12=33
c12=33
c33=5
Pada tabel 1(a) jumlah centroid 1=11,
jumlah centroid 2=51, dan jumlah centroid
3=38 dengan iterasi ke 1.
Tabel 1(b). Pusat cluster baru dengan iterasi ke 2
Menghitung Pusat Cluster Baru
c11=539.55
c12=33
c13=5.82
c21=1389.71
c22=14.76
c23=5.33
c31=759.21
c22=14.76
c33=5.39
Pada tabel 1(b) jumlah centroid 1=22,
jumlah centroid 2=36, dan jumlah centroid
3=42 dengan iterasi ke 2 dimana tingkat
kesamaan dengan data sebelumnya 64 data.
Tabel 1(c). Pusat cluster baru dengan iterasi ke 3
Menghitung Pusat Cluster Baru
c11=596.77
c12=29.77
c13=5.5
c21=1629.03
c22=12.27
c23=5.37
c31=938.02
c32=21.23
c33=5.39
Pada tabel 1(c) jumlah centroid 1=26,
jumlah centroid 2=30, dan jumlah centroid
3=44 dengan iterasi ke 3 dimana tingkat
kesamaan dengan data sebelumnya 90 data.
Tabel 1(d). Pusat cluster baru dengan iterasi ke 4
Menghitung Pusat Cluster Baru
c11=616.8
c12=28.8
c13=5.63
c21=1686.62
c22=11.92
c23=5.54
c31=984.18
c32=20.5
c33=5.18
Pada tabel 1(d) jumlah centroid 1=30,
jumlah centroid 2=26, dan jumlah centroid
3=44 dengan iterasi ke 4 dimana tingkat
kesamaan dengan data sebelumnya 92 data.
Tabel 1(e). Pusat cluster baru dengan iterasi ke 5
Menghitung Pusat Cluster Baru
c11=655.79
c12=27.77
c13=5.62
c21=1756.18
c22=12.09
c23=5.41
c31=1062.77
c32=18.64
c33=5.21
Pada tabel 1(e) jumlah centroid 1=39,
jumlah centroid 2=22, dan jumlah centroid
3=39 dengan iterasi ke 5 dimana tingkat
kesamaan dengan data sebelumnya 87 data.
Tabel 1(f). Pusat cluster baru dengan iterasi ke 6
Menghitung Pusat Cluster Baru
c11=655.79
c12=27.77
c13=5.62
c13=8
c21=1899
c22=12.5
c23=5.19
c23=5
c31=1104.44
c32=17.62
c33=5.31
5
5
Pada tabel 1(f) jumlah centroid
c
1=39,
jumlah centroid 2=16, dan jumlah
ju
centroid
3=45 dengan iterasi ke 6 d
dimana tingkat
kesamaan dengan data sebelumny
nya 94 data.
6
5
7
8
8
6
9
4
Tabel 1(g). Pusat cluster baru deng
engan iterasi ke 7
Menghitung Pusat Cluster Baru
10
13
11
8
c11=666.56
c12=27.73
c13=5.56
12
5
c11=666.56
c22=12.5
c23=5.19
13
7
c31=1115.05
c32=17.19
c33=5.35
14
5
15
8
16
8
17
18
19
20
5
7
7
7
Pada tabel 1(g) jumlah centroid
c
1=41,
jumlah centroid 2=16, dan jumlah
ju
centroid
3=43 dengan iterasi ke 7 d
dimana tingkat
kesamaan dengan data sebelumny
nya 98 data.
Tabel 1(h). Pusat cluster baru deng
engan iterasi ke 8
Menghitung Pusat Cluster Baru
c11=666.56
c12=27.73
c13=5.56
c21=1955.29
c22=12.14
c23=5
c31=1132.38
c32=17.09
c33=5.4
Pada tabel 1(h) jumlah centroid
c
1=41,
jumlah centroid 2=14, dan jumlah
ju
centroid
3=45 dengan iterasi ke 8 d
dimana tingkat
kesamaan dengan data sebelumny
nya 98 data.
Tabel 1(i). Pusat cluster baru deng
ngan iterasi ke 9
Menghitung Pusat Cluster Baru
c11=666.56
c12=27.73
c13=5.56
c21=1988.69
c22=12.23
c23=5.15
c31=1140.83
c32=16.96
c33=5.35
Pada tabel 2, dapat dilih
ilihat bahwa pengujian
dengan jumlah nilai centroid
oid 2 memiliki jumlah
iterasi yang lebih kecil yaitu
itu mencapai iterasi ke
3 dengan tingkat kesamaann data
d sebelumnya, dari
pada pengujian mengguna
unakan jumlah nilai
centroid 3, 4, 5, 6, 7, 8, 9,, 10,
10 11, 12, 13, 14, 15,
16, 17, 18, 19, 20. Pada tab
tabel 2(c), dapat dilihat
bahwa pengujian dengan jumlah
jum
nilai centroid 4
memiliki jumlah iterasi yang
yan lebih besar yaitu
mencapai iterasi ke 14 untu
ntuk mencapai tingkat
kesamaan data sebelumnya.
Pada tabel 2, dapat dilihat
di
bahwa jumlah
nilai centroid yang berbeda
da akan menghasilkan
jumlah iterasi yang berbeda
eda pula. Jumlah nilai
centroid yang besar tidakk selalu
s
menyebabkan
jumlah iterasi meningkat.
t. Grafik perbandingan
pengaruh jumlah nilai centroid
id dengan jumlah iterasi
dapat dilihat pada Gambar 1.
Pada tabel 1(i) jumlah centroid
c
1=41,
jumlah centroid 2=13, dan jumlah
ju
centroid
3=46 dengan iterasi ke 9 d
dimana tingkat
kesamaan dengan data sebelum
lumnya 99 data.
Setelah iterasi ke 9 masih belum
lum di dapatkan
kesamaan dengan data sebel
belumnya maka
selanjutnya menghitung pusat
at cluster baru
dengan iterasi ke 10 sehingga tin
tingkat kesamaan
dengan data sebelumnya mencapa
apai 100.
Selanjutnya penulis melaku
akukan beberapa
pengujian pengaruh nilai centroi
roid pada jumlah
iterasi dengan metode clustering dimana jumlah
nilai centroid 2 sampai nilai centr
ntroid 20 dengan
jumlah data 100 dan jumlah iter
terasi maksimum
15. Hasil pengujian dapat dilihat
at pada tabel 2.
Tabel 2. Pengaruh nilai centroid
id 2 sampai 20
terhadap jumlah iteras
rasi
Jumlah Nilai Centroid
Juml
mlah Iterasi
2
3
3
10
4
14
Gambar 1: Grafik perbandingan
an pengaruh jumlah nilai
centroid dengan jumlah
jum iterasi
Dari gambar 1 dapatt ddilihat bahwa jumlah
nilai centroid yang berbeda
da akan menghasilkan
jumlah iterasi yang berbe
beda pula. Pengujian
dengan jumlah nilai centroi
troid yang besar tidak
selalu menyebabkan jumlahh iiterasi meningkat.
5.Kesimpulan
Dari hasil penelitian dapat
dap diambil beberapa
kesimpulan antara lain:
1. Jumlah nilai centroid yang berbeda akan
menghasilkan jumlah iterasi yang berbeda
pula.
2. Jumlah nilai centroid yang besar tidak selalu
menyebabkan jumlah iterasi meningkat.
3. Pengujian dengan jumlah nilai centroid 2
memiliki jumlah iterasi yang lebih kecil yaitu
iterasi ke 3 dengan tingkat kesamaan data
sebelumnya, dibandingkan dengan jumlah
nilai centroid 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,
14, 15, 16, 17, 18, 19, 20.
4. Pengujian dengan jumlah nilai centroid 4
memiliki jumlah iterasi yang lebih besar yaitu
mencapai iterasi ke 14 untuk mencapai tingkat
kesamaan data sebelumnya.
Daftar Pustaka
[1] Alfina, et al, 2012. “Analisa perbandingan
metode hierarchical clustering, k-means dan
gabungan keduanya dalam cluster data (studi
kasus: problem kerja praktek jurusan teknik
industri its),” jurnal teknik its vol.1, (sept, 2012)
issn: 2301-9271.
[2] David, 2013. “Ant colony optimization untuk
clustering dokumen hasil pencarian,” seminar
nasional informatika 2013.
[3] Khotimah Tutik, 2014. “Pengelompokan surat
dalam alquran menggunakan algoritma k-means,
jurnal simetris,” vol 5 no1 april 2014, issn: 22524983.
[4] Kumar.Ch.N.Santhosh et al, 2012. “Spatial
data mining using cluster analysis,” International
journal of computer science & information
technology (IJCSIT) Vol 4, No 4, August 2012.
[5] Rozi Dwi Joko Fachrur, Yahya Kresnayana,
2013. “Analisa risiko kredit sepeda motor pada
pt.x finance (studi kasus kantor cabang
wilayah gresik dan lamongan),” jurnal sains dan
seni pomits vol.2, no.2, (2013) 2337-3520 (2301928x print).
[6] Sholeh Khoirul, et al, (2013). “Implementasi
metode k-means clustering untuk pembangkitan
aturan fuzzy pada klasifikasi ketahanan hidup
penderita kanker payudara”.
LAMPIRAN:
Tabel 3. Hasil Pengelompokan Data Ke-1
Dengan Menggunakan Metode Clustering
ITERASI DENGAN MENGGUNAKAN METODE CLUSTERING
(STUDI KASUS PT. PHP MOTOR)
Evri Ekadiansyah1, Purwa Hasan Putra2
1
Dosen Teknik Informatika, STMIK Potensi Utama
Mahasiswa Sistem Informasi, STMIK Potensi Utama
1,2
Jl. K L. Yos Sudarso Km 6,5 No. 3A Tanjung Mulia-Medan
1
[email protected] 2 [email protected]
2
Abstrak
Currently, the concept of data mining is increasingly recognized as an important tool in the management
of information due to the amount of information that increasingly large numbers. One of the known
techniques in data mining, namely clustering. Understanding clustering in data mining scientific data or
grouping a number of objects in the cluster will contain data that is as similar as possible and different
from the other objects in the cluster. In this study, the authors tried to analyze the amount of the value of
the centroid of the number of iterations by using clustering methods. Testing the number of centroid value
2 has a smaller number of iterations is the 3rd iteration with previous data similarity level, compared to
the number of centroid values 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15, 16, 17, 18, 19, 20. Testing the
number of centroid value 4 has a greater number of iterations, reaching 14 iterations to reach the level of
similarity to previous data. The number of different centroid values will result in the number of iterations
of the different anyway. The number of large centroid value does not always lead to the number of
iterations increases.
Kata kunci: data mining, clustering.
1.Pendahuluan
Saat ini, konsep data mining semakin
dikenal sebagai tools penting dalam manajemen
infomasi karena jumlah informasi yang semakin
besar jumlahnya. Data mining sendiri sering
disebut sebagai knowledge discovery in database
(KDD) adalah
kegiatan
yang
meliputi
pengumpulan, pemakaian data historis untuk
menemukan keteraturan, pola hubungan dalam
set data berukuran besar . Output dari data mining
ini dapat digunakan untuk pengambilan
keputusan di masa depan.
Salah satu teknik yang dikenal dalam data
mining yaitu clustering. Pengertian clustering
keilmuan dalam data mining pengelompokan
sejumlah data atau objek ke dalam cluster
tersebut akan berisi data yang semirip mungkin
dan berbeda dengan objek dalam cluster yang
lainnya. Sampai saat ini, para ilmuan masih terus
melakukan berbagai usaha untuk melakukan
perbaikan model cluster dan menghitung jumlah
cluster yang optimal sehingga dapat dihasilkan
cluster yang paling baik [1].
Tutik
Khotimah
(2014)
melakukan
pengelompokan surat-surat dalam Al Qur’an
dengan menggunakan algoritma K-means.
Pengelompokan menghasilkan 4 cluster dengan
anggota cluster_0 sebanyak 18 surat, cluster_1
sebanyak 26 surat, cluster_2 sebanyak 7 surat,
cluster_3 sebanyak 63 surat. Pengelompokan ini
telah mencapai nilaioptimal pada iterasi ke-14
[3].
Kumar Ch.N.Santosh, V.Shita Ramulu, et
al. (2012) Tujuan utama dari data mining adalah
untuk menemukan pengetahuan yang kompleks
dari data yang tersembunyi. Berdasarkan amalisis
clustering
ditemukan
informasi
yang
menggambarkan objek atau hubungan data
terdapat semua anggota dari cluster yang sama
memiliki fitur serupa sedangkan cluster yang
berbeda memiliki fitur yang berbeda [4].
Dari penelitian sebelumnya belum pernah
digunakan pengaruh nilai centroid terhadap
jumlah iterasi dengan menggunakan metode
Clustering.
Tujuan penelitian ini dilakukan adalah
untuk menganalisis pengaruh jumlah nilai
centroid terhadap jumlah iterasi dengan
menggunakan metode clustering.
2.Data Mining
Data mining merupakan proses seni
otomatik yang menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine
learning
untuk
mengekstraksi
dan
mengidentifikasi
informasi
pengetahuan
potensial dan berguna yang bermanfaat yang
tersimpan database besar. Secara sederhana, data
mining dapat diartikan sebagai proses
“menggali” knowledge yang ada pada
sekumpulan (sejumlah) data [6].
3. Metode Penelitian
c31=598
Metode penelitian ini meliputi tahapan
analisis dilakukan pada saat tahap perencanaan
telah selesai. Pada tahapan ini melakukan
penelitian lanjutan untuk memperoleh data yang
lebih terperinci, yang betujuan untuk keperluan
pengembangan sistem secara teknis.
Selanjutnya
penelitian
ini
untuk
menganalisa pengaruh centroid terhadap jumlah
iterasi dengan metode clustering. Penulis ingin
mengetahui apakah ada perbedaan antara
penambahan centroid dengan jumlah iterasi.
Untuk mencapai tujuan tersebut, penulis
akan
melakukan
perbandingan
dengan
menggunakan data kredit sepeda motor pada
PT.PHP MOTOR.
Pengaruh nilai centroid terhadap jumlah
iterasi dengan metode clustering digunakan
langkah-langkah sebagai berikut.
a. Sumber data yang digunakan dalam
penelitian ini merupakan data kredit sepeda
motor dari konsumen PT.PHP MOTOR.
b. Melakukan
studi
pustaka
tentang
pengelompokan data dengan metode
clustering.
c. Menentukan variable-variabel dari data
konsumen kredit sepeda motor pada
PT.PHP MOTOR diantaranya: nama
pelanggan, jumlah angsuran, lama angsuran
dan tunggakan kredit.
d. Menentukan parameter dalam pengujian
diantaranya: jumlah centroid yang di
variasikan dari centroid 2 sampai centroid
20, jumlah data konsumen sebanyak 100
data, dan jumlah iterasi maksimum 15.
e. Pengujian dilakukan bertujuan untuk
mengetahui pengaruh nilai centroid dengan
jumlah iterasi maksimum dengan metode
clustering.
4.Hasil Dan Pembahasan
Dalam penelitian ini akan dilakukan
analisis pengaruh nilai centroid terhadap jumlah
iterasi dengan menggunakan metode clustering.
Untuk mengetahui pengaruh nilai centroid
maka jumlah centroid di variasikan dari nilai
centroid 2 sampai nilai centroid 20 dengan
jumlah data 100 dan jumlah iterasi maksimum
15.
Berikut berupa tahapan-tahapan dari
proses clustering dengan nilai centroid 2,
jumlah data 100, dan jumlah iterasi maksimum
15 dapat dilihat pada Tabel 1.
Tabel 1(a). Pusat cluster awal dengan iterasi ke 1
Pusat Cluster Awal
c11=559
c21=1314
c12=33
c12=33
c12=33
c33=5
Pada tabel 1(a) jumlah centroid 1=11,
jumlah centroid 2=51, dan jumlah centroid
3=38 dengan iterasi ke 1.
Tabel 1(b). Pusat cluster baru dengan iterasi ke 2
Menghitung Pusat Cluster Baru
c11=539.55
c12=33
c13=5.82
c21=1389.71
c22=14.76
c23=5.33
c31=759.21
c22=14.76
c33=5.39
Pada tabel 1(b) jumlah centroid 1=22,
jumlah centroid 2=36, dan jumlah centroid
3=42 dengan iterasi ke 2 dimana tingkat
kesamaan dengan data sebelumnya 64 data.
Tabel 1(c). Pusat cluster baru dengan iterasi ke 3
Menghitung Pusat Cluster Baru
c11=596.77
c12=29.77
c13=5.5
c21=1629.03
c22=12.27
c23=5.37
c31=938.02
c32=21.23
c33=5.39
Pada tabel 1(c) jumlah centroid 1=26,
jumlah centroid 2=30, dan jumlah centroid
3=44 dengan iterasi ke 3 dimana tingkat
kesamaan dengan data sebelumnya 90 data.
Tabel 1(d). Pusat cluster baru dengan iterasi ke 4
Menghitung Pusat Cluster Baru
c11=616.8
c12=28.8
c13=5.63
c21=1686.62
c22=11.92
c23=5.54
c31=984.18
c32=20.5
c33=5.18
Pada tabel 1(d) jumlah centroid 1=30,
jumlah centroid 2=26, dan jumlah centroid
3=44 dengan iterasi ke 4 dimana tingkat
kesamaan dengan data sebelumnya 92 data.
Tabel 1(e). Pusat cluster baru dengan iterasi ke 5
Menghitung Pusat Cluster Baru
c11=655.79
c12=27.77
c13=5.62
c21=1756.18
c22=12.09
c23=5.41
c31=1062.77
c32=18.64
c33=5.21
Pada tabel 1(e) jumlah centroid 1=39,
jumlah centroid 2=22, dan jumlah centroid
3=39 dengan iterasi ke 5 dimana tingkat
kesamaan dengan data sebelumnya 87 data.
Tabel 1(f). Pusat cluster baru dengan iterasi ke 6
Menghitung Pusat Cluster Baru
c11=655.79
c12=27.77
c13=5.62
c13=8
c21=1899
c22=12.5
c23=5.19
c23=5
c31=1104.44
c32=17.62
c33=5.31
5
5
Pada tabel 1(f) jumlah centroid
c
1=39,
jumlah centroid 2=16, dan jumlah
ju
centroid
3=45 dengan iterasi ke 6 d
dimana tingkat
kesamaan dengan data sebelumny
nya 94 data.
6
5
7
8
8
6
9
4
Tabel 1(g). Pusat cluster baru deng
engan iterasi ke 7
Menghitung Pusat Cluster Baru
10
13
11
8
c11=666.56
c12=27.73
c13=5.56
12
5
c11=666.56
c22=12.5
c23=5.19
13
7
c31=1115.05
c32=17.19
c33=5.35
14
5
15
8
16
8
17
18
19
20
5
7
7
7
Pada tabel 1(g) jumlah centroid
c
1=41,
jumlah centroid 2=16, dan jumlah
ju
centroid
3=43 dengan iterasi ke 7 d
dimana tingkat
kesamaan dengan data sebelumny
nya 98 data.
Tabel 1(h). Pusat cluster baru deng
engan iterasi ke 8
Menghitung Pusat Cluster Baru
c11=666.56
c12=27.73
c13=5.56
c21=1955.29
c22=12.14
c23=5
c31=1132.38
c32=17.09
c33=5.4
Pada tabel 1(h) jumlah centroid
c
1=41,
jumlah centroid 2=14, dan jumlah
ju
centroid
3=45 dengan iterasi ke 8 d
dimana tingkat
kesamaan dengan data sebelumny
nya 98 data.
Tabel 1(i). Pusat cluster baru deng
ngan iterasi ke 9
Menghitung Pusat Cluster Baru
c11=666.56
c12=27.73
c13=5.56
c21=1988.69
c22=12.23
c23=5.15
c31=1140.83
c32=16.96
c33=5.35
Pada tabel 2, dapat dilih
ilihat bahwa pengujian
dengan jumlah nilai centroid
oid 2 memiliki jumlah
iterasi yang lebih kecil yaitu
itu mencapai iterasi ke
3 dengan tingkat kesamaann data
d sebelumnya, dari
pada pengujian mengguna
unakan jumlah nilai
centroid 3, 4, 5, 6, 7, 8, 9,, 10,
10 11, 12, 13, 14, 15,
16, 17, 18, 19, 20. Pada tab
tabel 2(c), dapat dilihat
bahwa pengujian dengan jumlah
jum
nilai centroid 4
memiliki jumlah iterasi yang
yan lebih besar yaitu
mencapai iterasi ke 14 untu
ntuk mencapai tingkat
kesamaan data sebelumnya.
Pada tabel 2, dapat dilihat
di
bahwa jumlah
nilai centroid yang berbeda
da akan menghasilkan
jumlah iterasi yang berbeda
eda pula. Jumlah nilai
centroid yang besar tidakk selalu
s
menyebabkan
jumlah iterasi meningkat.
t. Grafik perbandingan
pengaruh jumlah nilai centroid
id dengan jumlah iterasi
dapat dilihat pada Gambar 1.
Pada tabel 1(i) jumlah centroid
c
1=41,
jumlah centroid 2=13, dan jumlah
ju
centroid
3=46 dengan iterasi ke 9 d
dimana tingkat
kesamaan dengan data sebelum
lumnya 99 data.
Setelah iterasi ke 9 masih belum
lum di dapatkan
kesamaan dengan data sebel
belumnya maka
selanjutnya menghitung pusat
at cluster baru
dengan iterasi ke 10 sehingga tin
tingkat kesamaan
dengan data sebelumnya mencapa
apai 100.
Selanjutnya penulis melaku
akukan beberapa
pengujian pengaruh nilai centroi
roid pada jumlah
iterasi dengan metode clustering dimana jumlah
nilai centroid 2 sampai nilai centr
ntroid 20 dengan
jumlah data 100 dan jumlah iter
terasi maksimum
15. Hasil pengujian dapat dilihat
at pada tabel 2.
Tabel 2. Pengaruh nilai centroid
id 2 sampai 20
terhadap jumlah iteras
rasi
Jumlah Nilai Centroid
Juml
mlah Iterasi
2
3
3
10
4
14
Gambar 1: Grafik perbandingan
an pengaruh jumlah nilai
centroid dengan jumlah
jum iterasi
Dari gambar 1 dapatt ddilihat bahwa jumlah
nilai centroid yang berbeda
da akan menghasilkan
jumlah iterasi yang berbe
beda pula. Pengujian
dengan jumlah nilai centroi
troid yang besar tidak
selalu menyebabkan jumlahh iiterasi meningkat.
5.Kesimpulan
Dari hasil penelitian dapat
dap diambil beberapa
kesimpulan antara lain:
1. Jumlah nilai centroid yang berbeda akan
menghasilkan jumlah iterasi yang berbeda
pula.
2. Jumlah nilai centroid yang besar tidak selalu
menyebabkan jumlah iterasi meningkat.
3. Pengujian dengan jumlah nilai centroid 2
memiliki jumlah iterasi yang lebih kecil yaitu
iterasi ke 3 dengan tingkat kesamaan data
sebelumnya, dibandingkan dengan jumlah
nilai centroid 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,
14, 15, 16, 17, 18, 19, 20.
4. Pengujian dengan jumlah nilai centroid 4
memiliki jumlah iterasi yang lebih besar yaitu
mencapai iterasi ke 14 untuk mencapai tingkat
kesamaan data sebelumnya.
Daftar Pustaka
[1] Alfina, et al, 2012. “Analisa perbandingan
metode hierarchical clustering, k-means dan
gabungan keduanya dalam cluster data (studi
kasus: problem kerja praktek jurusan teknik
industri its),” jurnal teknik its vol.1, (sept, 2012)
issn: 2301-9271.
[2] David, 2013. “Ant colony optimization untuk
clustering dokumen hasil pencarian,” seminar
nasional informatika 2013.
[3] Khotimah Tutik, 2014. “Pengelompokan surat
dalam alquran menggunakan algoritma k-means,
jurnal simetris,” vol 5 no1 april 2014, issn: 22524983.
[4] Kumar.Ch.N.Santhosh et al, 2012. “Spatial
data mining using cluster analysis,” International
journal of computer science & information
technology (IJCSIT) Vol 4, No 4, August 2012.
[5] Rozi Dwi Joko Fachrur, Yahya Kresnayana,
2013. “Analisa risiko kredit sepeda motor pada
pt.x finance (studi kasus kantor cabang
wilayah gresik dan lamongan),” jurnal sains dan
seni pomits vol.2, no.2, (2013) 2337-3520 (2301928x print).
[6] Sholeh Khoirul, et al, (2013). “Implementasi
metode k-means clustering untuk pembangkitan
aturan fuzzy pada klasifikasi ketahanan hidup
penderita kanker payudara”.
LAMPIRAN:
Tabel 3. Hasil Pengelompokan Data Ke-1
Dengan Menggunakan Metode Clustering