Perbandingan Algoritme K-Means Dengan Algoritme Fuzzy C Means (FCM) Dalam Clustering Moda Transportasi Berbasis GPS
Vol. 2, No. 10, Oktober 2018, hlm. 4107-4115 http://j-ptiik.ub.ac.id
Perbandingan Algoritme K-Means Dengan Algoritme Fuzzy C Means
(FCM) Dalam Clustering Moda Transportasi Berbasis GPS
1 2 3 Rahman Syarif , Muhammad Tanzil Furqon , Sigit AdinugrohoProgram Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 1 3 Email: rahman8syarif@gmail.com.id, sigit.adinu@ub.ac.id
Abstrak
Transportasi sudah menjadi kebutuhan dasar bagi masyarakat modern saat ini. Namun seringkali kebutuhan akan transportasi ini tidak diikuti dengan informasi mengenai ketersediaan trasnportasi di suatu tempat. Pada kasus ini, data dari GPS dapat digunakan untuk mengelompokkan moda transportasi yang tersedia serta memberikan informasi mengenai jumlah tiap-tiap moda transportasi yang tersebar dalam suatu wilayah dan waktu tertentu. Algoritme yang digunakan untuk memngelompokkan moda transportasi pada penelitian ini adalah K-Means dan Fuzzy C Means (FCM). Dua algoritme ini kemudian dibandingkan mana yang lebih baik hasilnya. Pengelompokan moda transportasi pada algoritme K-Means diperoleh dari jarak terkecil data moda trasnportasi dengan pusat klaster. Sedangkan pada algoritme FCM pengelompokan diperoleh dari nilai derajat keanggotaan terbesar. Setelah dilakukan pengujian sebanyak 10 kali, didapatkan rata-rata akurasi K-Means sebesar 58,46154 dan 70,86538 untuk algoritme FCM. Sedangkan untuk nilai silhouette Coefficient diperoleh rata-rata 0,4582670 untuk K-Means dan 0,440682 untuk algoritme FCM. Dari hasil pengujian, disimpulkan bahwa algoritme FCM lebih unggul dibandingkan K-Means.
Kata kunci: GPS, transportasi,clustering, K-Means, FCM, Silhouette Coefficient.
Abstract
Transportation has become a basic necessity for today’s society. But often the need for transportation
is not followed by information on the availability of transportation in a certain place. In this case, data
from GPS can be used to group the available modes of transportation and provide information on the
number of each mode of transportation scattered in a certain place and time. Algorithm used to group
modes of transportation in this research is K-Means and Fuzzy C Means (FCM). These two algorithms
then compared which one with the better result. The transportation mode grouping on the K-Means
algorithm is obtained from the smallest distance of the transport mode data with the cluster center.
Whereas in the FCM algorithm, grouping is obtained from the greatest degree values. After 10 times
testing, obtained an average of K-Means accuracy of 58.46154 and 70.86538 for FCM algorithm. While
for the silhouette Coefficient value obtained an average of 0.4582670 for K-Means and 0.440682 for
FCM algorithm. From the results, it was concluded that the FCM algorithm is superior to K-Means.Keywords: GPS, transportation, clustering, K-Means, FCM, Silhouette Coefficient.
kebutuhan mendasar bagi manusia modern saat 1.
PENDAHULUAN ini. Namun dalam beberapa kasus, pengguna
transportasi mengalami kebingungan dalam
Global Positioning System atau yang sering
memilih moda transportasi apa yang akan disingkat GPS adalah sistem navigasi berbasis digunakan (Arifianto, 2012). Hal ini terjadi satelit yang ditemukan dan dikembangkan oleh akibat kurangnya informasi ketersedian jenis departemen Amerika Serikat (Junus, 2012). GPS moda transportasi dalam wilayah dan waktu dapat memberikan informasi posisi, kecepatan, tertentu itu. Dalam kasus ini, data dari GPS dapat serta informasi mengenai waktu di hampir digunakan untuk mengelompokkan moda seluruh bagian di dunia secara akurat yang bebas transportasi yang tersedia serta memberikan dari pengaruh waktu, tempat, maupun cuaca. informasi mengenai jumlah tiap-tiap moda
Transportasi merupakan hal yang sudah menjadi transportasi yang tersebar dalam suatu wilayah
Fakultas Ilmu Komputer Universitas Brawijaya
4107 dan waktu tertentu. Selain itu, hasil pengelompokan moda transportasi ini dapat dijadikan acuan untuk melakukan manipulasi pengaturan lalulintas di wilayah tertentu itu. Untuk itu dibutuhkan aplikasi atau metode yang bisa secara tepat mengelompokkan moda transportasi berbasis GPS.
Clustering merupakan bagian dari data mining yang dilakukan untuk mengolah data
pencarian informasi lebih mendalam mengenai data yang umumnya berjumlah besar dengan menggunakan teknik statistika, matematika,
Belajar yang diawasi (supervised
mining dibagi menjadi (Ridwan et al,2013): a.
Berdasarkan Metode pelatihannya, data
2.2.1 Pengelompokan Data Mining
kegiatan dalam mengumpulkan, menggunakan data dengan tujuan untuk mencari pola atau hubungan antar data dalam satu set data besar (Ridwan et al,2013).
Database (KDD) merupakan suatu proses
(Gunadi et al,2012). Data mining yang biasa disebut dengan istilah Knowledge Discovery in
machine learning dankecerdasan buatan
2.2 Data Mining Data Mining merupakan proses
lebih lanjut untuk menghasilkan informasi baru (Ramadhana, 2014). Clustering adalah proses pengelompokan objek data ke dalam kelompok berdasrkan kemiripannya. Salah satu algoritme yang sering digunakan dalam clustering adalah algoritme K-Means. K-Means mengelompokkan data berdasarkan kemiripan/ kedekatan sebuah data dengan centroid atau pusat tiap kelompok data. Algoritme ini memiliki tingkat kompleksitas yang cukup efisien dan mudah dipahami sehingga algoritme ini sering digunakan dalam berbagai kasus. Menurut Agusta (2007) K-Means memiliki beberapa kekurangan yang salah satunya adalah kegagalan dalam converge atau pergerakan data ke pusat cluster. K-Means secara tegas mengalokasikan data ke cluster tertentu sehingga perpindahan data dari satu cluster ke cluster yang lainnya tidak akan dianggap. Untuk menutupi kelemahannya ini, maka dikembangkanlah metode Fuzzy C-Means.
GPS menggunakan metode reseksi jarak dalam penentuan posisinya (Purnama, 2009). Beberapa satelit yang telah diketahui koordinatnya secara simultan mengukur jarak dari posisi yang dicari. Setiap data dari GPS memimiliki empat parameter yaitu 3 parameter koordinat X,Y,Z atau lintang, bujur , ketinggian dan satu parameter kesalahan waktu akibat ketidaksinkronan jam osilator di satelit dengan jam di receiver GPS.
2.1.1 Prinsip penentuan posisi GPS
Saat ini GPS telah digunakan orang di seluruh dunia dalam berbagai bidang profesi ataupun aplikasi yang menuntut informasi tentang posisi, kecepatan, percepatan ataupun waktu yang akurat (Zheng, 2010). Tingkat ketelitian GPS dalam menentukan posisi objek bervariasi mulai dari beberapa millimeter hingga dengan puluhan meter.
GPS (Global Positioning System) adalah sistem navigasi dan penentuan posisi dengan menggunakan satelit yang ditemukan dan dikembangkan oleh Amerika Serikat (Junus,2012).
2.1 Global Positioning System (GPS)
2. KAJIAN PUSTAKA
clustering moda transportasi berbasis GPS.
Berdasarkan latar belakang tersebut, penulis tertarik untuk meneliti dan mengkaji lebih lanjut mengenai perbandingan algoritme K-Means dengan algoritme Fuzzy C Means (FCM) dalam
Fuzzy C-Means menggunakan model pengelompokan Fuzzy sehingga data dapat menjadi anggota dari semua kelas atau cluster yang terbentuk dengan derajat atau tingkat keanggotaan yang berbeda (Luthfi, 2007). Dalam konsep fuzzy, keanggotaan sebuah objek atau data tidak diberikan secara tegas dengan nilai 1 (menjadi anggota) dan nilai 0 (tidak menjadi anggota), melainkan dengan suatu nilai derajat keanggotaannya yang jangkauan nilainya antara 0 sampai 1. Semakin tinggi nilai keanggotaan sebuah data semakin tinggi pula derajat keanggotaanya dan sebaliknya semakin kecil maka semakin rendah derajat keanggotaanya. Namun Aprianto dkk (2010) yang melakukan perbandingan terhadap algoritme K-Means dengan Fuzzy C Means untuk pengelompokan keypoint descriptor pada citra sidik jari menyatakan bahwa algoritme K- means lebih baik dari segi performansi dan hasil. Ini membuktikan bahwa tujuan pengembangan K-Means ke bentuk fuzzy tidak sepenuhnya berhasil.
learning ) Dalam metode
supervised learning , metode belajar dengan adanya
pengelompokkan data berdasarkan kemiripan. Data yang memiliki tingkat kemiripan yang tinggi akan dikelompokkan dalam sebuah cluster.
dengan mengelompokkan data yang ada ke dalam beberapa cluster. Data akan dikumpulkan dalam satu cluster berdasarkan kemiripan ataupun kedekatan karakteristik dengan data yang lain yang ada di cluster itu. K-Means akan berusaha menjauhkan data pada suatu cluster dengan cluster lainnya. Hal ini dilakukan untuk meminimalkan variasi antar data yang berada dalam satu cluster dan memaksimalkan variasi dengan data yang berada di cluster lainnya. Prosedur algoritme K-Means ditunjukkan pada Gambar 1.
partitional (Agusta, 2007). K-Means bekerja
K-Means adalah salah satu metode dalam data mining dengan teknik unsupervised yang mengelompokkan data dengan sistem
2.4 Algortime K-Means
menyederhankan data kedalam dimensi yang lebih kecil.
unsupervised yang bertujuan untuk
adalah pembagian obyek ‐obyek data ke dalam kelompok. Hierarchical clustering dilakukan dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan sebaliknya. SOM merupakan bagian dari jaringan syarif tiruan dengan konsep
clustering dan (SOM) . Partional clustering
dengan objek yang memiliki karaktristik sama (Andayani, 2007). Setiap data dimasukkan kedalam cluster dengan karektiristik yang paling mirip lalu kemudian berusaha menjauhkannya dengan cluster yang lain. Agusta (2007) membagi clustering menjadi tiga kelompok, yaitu hierarchical clustering, partitional
Clustering membagi data ke dalam grup
Asosiasi Tugas asosiasi dalam data mining adalah untuk menemukan atribut yang muncul dalam satu waktu.
f.
Clustering merupakan
latihan (training) dan target. Contoh: Regresi, analisa Deskriminan dll.
Pengklusteran (Clustering)
e.
Prediksi (Prediction) Prediksi memiliki kesamaan dengan klasifikasi dan estimasi. Tukjuan dari prediksi adalah nilai atau hasil yang akan ada di masa datang..
d.
Estimasi (Estimation) Estimasi hampir sama dengan klasifikasi, perbedaannya terletak pada atribut target pada estimasi bersifat numerik sedangkan klasifikasi kategori.
Klasifikasi (Classification) Dalam klasifikasi, terdapat variabel target yaitu kategori. Zvariabel ini yang akan membagi data kedalam beberapa kategori c.
b.
Deskripsi (Description) Peneliti biasanya ingin mencari cara untuk menggambarkan pola atau hubungan antar data. Pola yang terjadi berulang-ulang akan memberikan gambaran mengenai kecenderungan suatu data.
mining dikelompokkan menjadi: a.
Sedangkan berdasarkan tugasnya data
Metode ini tanpa disertai atribut target/label. Oleh karena itu, data mining pada metode ini ditujukan untuk menemukan pola berulang dan kedekatan dalam kumpulan data. Contoh clustering dan Self Organization Map (SOM).
Belajar tanpa pengawasan (unsupervised learning)
b.
2.3 Clustering
Gambar 1. Prosedur Algoritme K-Means Gambar 2. Prosedur FCM
2.7 Silhoette Coefficient
2.6 Fuzzy C-Means
Silhouette Coefficient merupakan salah
Fuzzy C-means (FCM) pertama kali satu metode evaluasi untuk menguji kualitas diperkenalkan oleh Jim Bezdek pada tahun 1981. sebuah cluster (Furqon,2016). Metode ini
Metode ini merupakan pengembangan dari K- menggunakan rumus Eculidean distance dalam Means dengan menggabungkan prinsip fuzzy proses perhitungannya. Secara singkat metode dengan metode K-Means (Luthfi,2007). Berbeda
Silhouette Coefficient ditunjukkan pada halnya dengan K-Means, data yang di-cluster persamaan (1). menggunakan FCM akan menjadi aggota dari setiap cluster yang ada. Ikatan data dengan
( − ) cluster ditentukan oleh nilai keanggotannya
(1)
= max( , )
yang berada pada rentang 0 hingga 1.Prosedur Algoritme Fuzzy C means clustering
= Silhouette Coefficient ditunjukkan pada Gambar 2.
= rata-rata jarak dari objek i dengan seluruh objek yang berada pada cluster yang sama
nilai terkecil dari rata-rata jarak objek i
=
dengan objek lain pada cluster yang berbeda Nilai Shilouette coefficient berada pada rentan (-1) hingga 1. Semakin tinggi nilianya, maka semakin bagus pula kualitasnya.
2.7 Normalisasi Max/Min
Normalisasi Max/min adalah metode yang dilakukan untuk menyamakan dan memperkecil rentang data. Normalisasi dilakukan dengan mengurangkan variabel dengan nilai maksimum dengan variabel dibagi dengan pengurangan antara variabel maksimum dengan variabel minimum. Ditunjukkan melalui persamaan (2).
−
(2)
= − x normalisasi
=
= Nilai variabel terbesar Nilai variabel terkecil
= 3.
METODOLOGI PENELITIAN
Gambar 3. Tahapan Penelitian
Penjelasan mengenai tahapan-tahapan dalam Perbandingan algoritme K-Means dengan
3.1 Pengumpulan Data
algoritme Fuzzy C-Means pada pengelompokan Data yang digunakan adalah data moda transportasi berbasis Global Positioning sekunder yang berasal dari data lintasan GPS
System (GPS). Metodologi penelitian yang
yang dikumpulkan dalam proyek Geolife dilakukan dalam penelitian ini melalui beberapa (Microsoft Research Asia) yang dilakukan tahapan yaitu studi literatur, pengumpulan data, dengan mengambil data GPS dari 180 orang dari analisa kebutuhan sistem, perancangan sistem, rentang april 2007 sampai Agustus 2012. Sebuah implementasi sistem, pengujian sistem, dan lintasan GPS merupakan urutan dari beberapa pengambilan kesimpulan. Diagram blok titik koordinat GPS yang terdiri dari posisi metodologi penelitian yang berisi tahapan- bujur,dan lintang. Data lintasan yang digunakan tahapan yang dilakukan dalam penelitian yang adalah data lintasan yang berkisar antara 10 . diajukan ditunjukan pada Gambar 3 hingga 20 menit dengan jarak waktu antar titik selama 30 detik yang terdiri dari 6 jenis transportasi yaitu bike, bus, car, subway, taxi, dan train. Data yang akan dikelompokkan pada penelitian ini adalah data jarak dari tiap titik GPS dengan titik selanjutnya dalam satu lintasan.
4. PERANCANGAN Perancangan sistem secara umum ditunjukkan pada Gambar 4.
Adapun parameter input yang digunkan adalah sebagai berikut:
K = 6; Maksimum iterasi = 30; P0 = 0; W = 2; Ѳ = 0.01;
Pengujian ini dilakukan sebanyak 10 kali dengan menggunakan 208 data. Hal ini dilakukan karena setiap algoritme memiliki elemen random yang bisa mempengaruhi hasil.
5.1 Pengujian Akurasi
Pengujian ini akan membandingkan nilai akurasi dari kedua algoritme. Akurasi ini didapatkan dari akumulasi dari jumlah kelas mayoritas pada masing-masing cluster. Nilai akurasi dari kedua algoritme ditunjukkan pada Tabel 1.
Tabel 1. Pengujian Nilai Akurasi Percobaan K-Means FCM
ke-1 66.82692 71.63462 Gambar 4. Perancangan sistem ke-2 58.65385 71.63462 ke-3 53.84615 71.15385
Pertama yang dilakukan adalah menentukan jumlah data yang akan di-cluster. Data akan ke-4 59.13462 71.63462 dipilih secara acak sesuai dengan jumlah ke-5 62.01923 71.63462 yang diinginkan. ke-6 54.80769 70.19231
Selanjutnya adalah menginputkan jumlah ke-7 58.65385 69.71154
cluster yang akan dibentuk (k), batas iterasi
ke-8 54.80769 69.71154 maksimum yang bisa dilakukan, pembobot ke-9 54.80769 71.63462
(w), threshold (Ѳ). ke-10 61.05769 69.71154
Proses selanjutnya adalah menjalankan algoritme K-Means dimana pusat cluster average 58.46154 70.86538 awal akan dipilih secara acak. Prosedur K- Means ditunjukkan pada Gambar 1.
Pada pengujian yang dilakukan sebanyak 10 kali, akurasi algoritme FCM
Setelah proses K-Means, akan dilakukan proses FCM. Nilai matrik partisi awal akan
selalu lebih unggul dibandingkan algoritme
ditentukan secara acak dari rentan 0-1. Prosedur
K-Means. Nilai akurasi terbesar algoritme FCM ditunjukkan pada Gambar 2. FCM sebesar 71,63462 dan yang terkecil
Proses selanjutnya adalah menghitung
sebesar 69,71154 dengan nilai rata-rata
nilai silhouette coefficient dari cluster yang
sebesar 70,86538 . Sedangkan nilai akurasi
dihasilkan tiap algoritme. Proses terakhir adalah
terbesar algoritme K-Means sebesar
menampilkan data tiap cluster dari masing- 66,82692 dan nilai terkecil sebesar 53,84615 masing algoritme beserta nilai silhouette
58,46154 dengan nilai rata-rata sebesar .
coefficient- nya.
Grafik pengujian akurasi algoritme ditunjukkan pada Gambar 5.
5. PENGUJIAN
Pada penelitian ini pengujian yang dilakukan yaitu pengujian akurasi dan pengujian nilai Silhouette Coefficient.
Gambar 5. Grafik Pengujian Akurasi Algoritme
12
1 Train
6
13
5
14 Taxi
3
3
4
6 Subway
6
5
20 Car
22
1
8
68 Bus
K0 K1 K2 K3 K4 K5 Bike v
1 Tabel 5. Distribusi Data FCM Percobaan Kedua
6
22
3
1
13 Train
6
5
7
1
4 Taxi
2 Subway
6
2
3
5 Train
13
1
6
1 Taxi
3
4
15
1
5
3 Dari Tabel diatas dapat dilihat bahwa distibusi data algoritme FCM lebih merata dibandingkan K-Means. Hal lainnya juga menunjukkan bahwa distribusi data algoritme FCM memiliki pola yang sama pada percobaan pertama dan kedua, ini membuktikan bahwa algoritme FCM lebih konsisten dalam hasil klasterisasinya.
14
3
5
3 Car
8
1
17
68 Bus
Bike
6. K0 K1 K2 K3 K4 K5
Pengujian Sillhoette Coefficient dilakukan untuk mengetahui kualitas suatu cluster. Sillhoette Coefficient didapatkan dengan membandingkan jarak data pada cluster yang sama dengan jarak data di cluster lainnya. Perbandingan nilai Sillhouette Coefficient ditunjukkan pada Tabel
5.2 Pengujian Sillhoutte Coefficient
1
3
Perbedaan nilai akurasi dari percobaan ini diakibatkan karena adanya elemen random pada setiap algoritme. Elemen random pada algoritme K-Means yaitu pada penentuan centroid awal sedangkan elemen random pada FCM yaitu pada penentuan derajat keanggotaan awal. Grafik algoritme FCM pada Gambar 5 terlihat lebih lurus dibandingkan grafik algoritme K-Means. Hal ini menandakan bahwa akurasi dari algoritme FCM cenderung lebih konsisten. Nilai akurasi sangat bergantung pada distribusi data pada tiap cluster. Distribusi data K-Means pada percobaan pertama dan kedua ditunjukkan pada Tabel 2 dan 3.
15
22 Tabel 3. Distribusi Data K-Means Percobaan Kedua K0 K1 K2 K3 K4 K5
6
2
3
5 Train
13
1
6
1 Taxi
3
4
1
68 Bus
2 Subway
5
14
3
5
3 Car
8
1
17
68 Bus
K0 K1 K2 K3 K4 K5 Bike
Tabel 2. Distribusi Data K-Means Percobaan Pertama
Bike
27
3
5 Sedangkan untuk distribusi data FCM pada percobaan pertama dan kedua akan ditunjukkan pada Tabel 4 dan 5.
14
6 Subway
12
6
5
1 Car
20
8
68 Bus
Bike
Pertama K0 K1 K2 K3 K4 K5
Tabel 4. Distribusi Data FCM Percobaan
22
2 Car
4
2
1 Train
16
8
1 Taxi
15
3
5
6 Subway
16
7
22
Tabel 6. Pengujian Silhoutte Coeffcient
Sedangkan visualisasi hasil clustering algoritme FCM ditunjukkan pada Gambar 8.
selama 10 kali menunjukkan bahwa akurasi algoritme Fuzzy C Means lebih baik dibanding algoritme K- Means dengan nilai rata-rata sebesar 70,86538 sedangkan K-Means
2. Hasil pengujian yang dilakukan
diklasterisasi menggunakan algoritme K-Means dan Fuzzy C Means. Penentuan cluster algoritme K-Means diperoleh dari perhitungan jarak terkecil antara data dengan pusat cluster (centroid). Sedangkan penentuan cluster algoritme Fuzzy C Means diperoleh dari nilai derajat keanggotaan terbesar data terhadap setiap cluster.
trajectory . Data ini selanjutnya
Dalam clustering moda transportasi berbasis GPS, data trajectory moda transportasi ditransformasi menjadi data movement dengan mencari jarak dari titik satu ke titik selanjutnya dalam sebuah
Berdasarkan hasil penelitian yang telah diuraikan pada bab sebelumnya, maka dapat disimpulkan: 1.
KESIMPULAN
Gambar 8. Visualisasi Hasil Clustering FCM 6.
Gambar 7. Visualisasi Hasil Clustering K-Means
Si K-Means FCM ke-1 0.41906 0.444101 ke-2 0.470766 0.444101 ke-3 0.482061 0.446025 ke-4 0.477358 0.444417 ke-5 0.45554 0.443806 ke-6 0.451478 0.435722 ke-7 0.477812 0.434946 ke-8 0.452987 0.434946 ke-9 0.448257 0.443806 ke-10 0.447356 0.434946 average 0.458267 0.440682
Visualissi hasil clustering algoritme K- Means pada percobaan pertama ditunjukkan pada Gambar 7.
Hal ini sangat dipengaruhi oleh data yang digunakan. Pada kasus ini, data yang digunakan merupakan data lintasan yang memiliki keunikan tersendiri.
Pada Gambar 6 terlihat bahwa grafik FCM lebih stabil dibanding K-Means Yang bisa diartikan bahwa nilai silhouette coefficient FCM cenderung lebih konsisten. Dari dua hasil pengujian ini kita juga bisa mengetahui bahwa tidak selamanya nilai Silhoette Coefficient berbanding lurus dengan tingkat akurasi cluster.
Gambar 6. Grafik Pengujian Nilai Sillhoette Coefficient
Grafik pengujian Silhoette Coeficient algoritme ditunjukkan pada Gambar 6.
. Sedangkan nilai rata-rata algoritme FCM sebesar 0,440682 . .
0,458267
Berbeda dengan pengujian akurasi, pengujian Silhouette Coefficient justru menunjukkan bahwa algoritme K-Means lebih unggul dibandingkan FCM. Nilai Silhouette Coefficient rata-rata algoritme K- Means sebesar
5.3 Visualisasi Hasil Clustering
32-40. Purnama, Bambang Eka.2009. Pemanfaatan
Global Positioning System Untuk Pelacakan Objek Bergerak . Journal Speed
7. SARAN
- – Sentra Penelitian Engineering dan Edukasi – Volume 2 No 2 – 2009.
Gunadi, Goldie,Dana Indra Sensuse.2012.
Penerapan metode data mining market basket analysis terhadap data penjualan produk buku dengan menggunakan algoritme Apriori dan Frequent Pattern Growth (FP-Growth): studi kasus percetakan PT. Gramedia. Jurnal
DAFTAR PUSTAKA
TELEMATIKA MKOM Vol.4 No.1, Maret 2012. Ridwan, Mujib, Hadi Suyono, M. Sarosa. 2013.
Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritme Naive Bayes Classifier. Jurnal EECCIS Vol.7, No. 1, Juni 2013.
Agusta,Yudi.2007. K-Means
GeoLife: A Collaborative Social Networking Service among User, location and trajectory . Invited paper, in IEEE Data Engineering Bulletin. 33, 2, 2010, pp.
rute terpendek pada jaringan multi moda transportasi umum menggunkan algoritme Dijkstra. Semarang: Universitas Diponegoro.
Arifianto, Sofyan. 2012. Sistem aplikasi penentu
kendaraan dengan teknologi GPS&GPRS berbasis web. Jurnal ELTEK, Vol 10 No 02, Oktober 2012 ISSN 1693-4024 .
Junus, M. 2012. Sistem pelacakan posisi
trajectory memiliki keunikan dan kerumitan tersendiri.
Untuk memperbaiki penelitian ini, dibutuhkan metode khusus dalam mengelompokkan data trajectory karena data
sebesar 58,46154. ebih baik dibanding Fuzzy C Means dengan nilai rata-rata 0,4582670 sedangkan Fuzzy C Means sebesar 0,440682. Ketidak-selarasan hasil penngujian akurasi dengan Sillhoette Coefficient ini sangat dipengaruhi oleh data yang digunakan.
Zheng, Yu, Xing Xie, Wei-Ying Ma.2010.
- – Penerapan, Permasalahan dan Metode Terkait. Jurnal
Perbadingan algoritme K-Means dan Fuzzy C-Means untuk pengelompokan keypoint descriptor dalam citra sidik jari.
Seminar Nasional Teknologi 2007 (SNT 2007). Aprianto, Indra , Catur Supriyanto. 2010.
untuk clustering data (studi kasus: data performance mengajar dosen).
Informasi & Komunikasi Terapan 2013 (SEMANTIK 2013). Luthfi, Emha Taufiq. 2007.Fuzzy C-Means
dengan Algoritme Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata . Seminar Nasional Teknologi
Kartina Diah K. W.2013. Data Mining
Andayani,Sri.2007.
Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritme K‐Means. SEMNAS
Matematika dan Pend. Matematika 2007. Furqon, Muhammad Tanzil, Lailil
Muflikhakh.2016. Clustering the potential
risk of tsunami using Density-Based Spatial clustering of application with noise (DBSCAN). Journal of
Environmental Engineering & Sustainable Technology (JEEST) Vol. 03 No. 01, July 2016, Pages 1-8.
Sistem dan Informatika Vol. 3 (Pebruari 2007), 47-60. Ramadhana,Cakra , Yohana Dewi Lulu W, and
Semarang: Universitas Dian nuswantoro.