Perbandingan Algoritme K-Means Dengan Algoritme Fuzzy C Means (FCM) Dalam Clustering Moda Transportasi Berbasis GPS

  

Vol. 2, No. 10, Oktober 2018, hlm. 4107-4115 http://j-ptiik.ub.ac.id

Perbandingan Algoritme K-Means Dengan Algoritme Fuzzy C Means

(FCM) Dalam Clustering Moda Transportasi Berbasis GPS

1 2 3 Rahman Syarif , Muhammad Tanzil Furqon , Sigit Adinugroho

  Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 1 3 Email: rahman8syarif@gmail.com.id, sigit.adinu@ub.ac.id

  

Abstrak

  Transportasi sudah menjadi kebutuhan dasar bagi masyarakat modern saat ini. Namun seringkali kebutuhan akan transportasi ini tidak diikuti dengan informasi mengenai ketersediaan trasnportasi di suatu tempat. Pada kasus ini, data dari GPS dapat digunakan untuk mengelompokkan moda transportasi yang tersedia serta memberikan informasi mengenai jumlah tiap-tiap moda transportasi yang tersebar dalam suatu wilayah dan waktu tertentu. Algoritme yang digunakan untuk memngelompokkan moda transportasi pada penelitian ini adalah K-Means dan Fuzzy C Means (FCM). Dua algoritme ini kemudian dibandingkan mana yang lebih baik hasilnya. Pengelompokan moda transportasi pada algoritme K-Means diperoleh dari jarak terkecil data moda trasnportasi dengan pusat klaster. Sedangkan pada algoritme FCM pengelompokan diperoleh dari nilai derajat keanggotaan terbesar. Setelah dilakukan pengujian sebanyak 10 kali, didapatkan rata-rata akurasi K-Means sebesar 58,46154 dan 70,86538 untuk algoritme FCM. Sedangkan untuk nilai silhouette Coefficient diperoleh rata-rata 0,4582670 untuk K-Means dan 0,440682 untuk algoritme FCM. Dari hasil pengujian, disimpulkan bahwa algoritme FCM lebih unggul dibandingkan K-Means.

  Kata kunci: GPS, transportasi,clustering, K-Means, FCM, Silhouette Coefficient.

  

Abstract

Transportation has become a basic necessity for today’s society. But often the need for transportation

is not followed by information on the availability of transportation in a certain place. In this case, data

from GPS can be used to group the available modes of transportation and provide information on the

number of each mode of transportation scattered in a certain place and time. Algorithm used to group

modes of transportation in this research is K-Means and Fuzzy C Means (FCM). These two algorithms

then compared which one with the better result. The transportation mode grouping on the K-Means

algorithm is obtained from the smallest distance of the transport mode data with the cluster center.

Whereas in the FCM algorithm, grouping is obtained from the greatest degree values. After 10 times

testing, obtained an average of K-Means accuracy of 58.46154 and 70.86538 for FCM algorithm. While

for the silhouette Coefficient value obtained an average of 0.4582670 for K-Means and 0.440682 for

FCM algorithm. From the results, it was concluded that the FCM algorithm is superior to K-Means.

  Keywords: GPS, transportation, clustering, K-Means, FCM, Silhouette Coefficient.

  kebutuhan mendasar bagi manusia modern saat 1.

   PENDAHULUAN ini. Namun dalam beberapa kasus, pengguna

  transportasi mengalami kebingungan dalam

  Global Positioning System atau yang sering

  memilih moda transportasi apa yang akan disingkat GPS adalah sistem navigasi berbasis digunakan (Arifianto, 2012). Hal ini terjadi satelit yang ditemukan dan dikembangkan oleh akibat kurangnya informasi ketersedian jenis departemen Amerika Serikat (Junus, 2012). GPS moda transportasi dalam wilayah dan waktu dapat memberikan informasi posisi, kecepatan, tertentu itu. Dalam kasus ini, data dari GPS dapat serta informasi mengenai waktu di hampir digunakan untuk mengelompokkan moda seluruh bagian di dunia secara akurat yang bebas transportasi yang tersedia serta memberikan dari pengaruh waktu, tempat, maupun cuaca. informasi mengenai jumlah tiap-tiap moda

  Transportasi merupakan hal yang sudah menjadi transportasi yang tersebar dalam suatu wilayah

  Fakultas Ilmu Komputer Universitas Brawijaya

4107 dan waktu tertentu. Selain itu, hasil pengelompokan moda transportasi ini dapat dijadikan acuan untuk melakukan manipulasi pengaturan lalulintas di wilayah tertentu itu. Untuk itu dibutuhkan aplikasi atau metode yang bisa secara tepat mengelompokkan moda transportasi berbasis GPS.

  Clustering merupakan bagian dari data mining yang dilakukan untuk mengolah data

  pencarian informasi lebih mendalam mengenai data yang umumnya berjumlah besar dengan menggunakan teknik statistika, matematika,

  Belajar yang diawasi (supervised

  mining dibagi menjadi (Ridwan et al,2013): a.

  Berdasarkan Metode pelatihannya, data

  2.2.1 Pengelompokan Data Mining

  kegiatan dalam mengumpulkan, menggunakan data dengan tujuan untuk mencari pola atau hubungan antar data dalam satu set data besar (Ridwan et al,2013).

  Database (KDD) merupakan suatu proses

  (Gunadi et al,2012). Data mining yang biasa disebut dengan istilah Knowledge Discovery in

  machine learning dankecerdasan buatan

  2.2 Data Mining Data Mining merupakan proses

  lebih lanjut untuk menghasilkan informasi baru (Ramadhana, 2014). Clustering adalah proses pengelompokan objek data ke dalam kelompok berdasrkan kemiripannya. Salah satu algoritme yang sering digunakan dalam clustering adalah algoritme K-Means. K-Means mengelompokkan data berdasarkan kemiripan/ kedekatan sebuah data dengan centroid atau pusat tiap kelompok data. Algoritme ini memiliki tingkat kompleksitas yang cukup efisien dan mudah dipahami sehingga algoritme ini sering digunakan dalam berbagai kasus. Menurut Agusta (2007) K-Means memiliki beberapa kekurangan yang salah satunya adalah kegagalan dalam converge atau pergerakan data ke pusat cluster. K-Means secara tegas mengalokasikan data ke cluster tertentu sehingga perpindahan data dari satu cluster ke cluster yang lainnya tidak akan dianggap. Untuk menutupi kelemahannya ini, maka dikembangkanlah metode Fuzzy C-Means.

  GPS menggunakan metode reseksi jarak dalam penentuan posisinya (Purnama, 2009). Beberapa satelit yang telah diketahui koordinatnya secara simultan mengukur jarak dari posisi yang dicari. Setiap data dari GPS memimiliki empat parameter yaitu 3 parameter koordinat X,Y,Z atau lintang, bujur , ketinggian dan satu parameter kesalahan waktu akibat ketidaksinkronan jam osilator di satelit dengan jam di receiver GPS.

  2.1.1 Prinsip penentuan posisi GPS

  Saat ini GPS telah digunakan orang di seluruh dunia dalam berbagai bidang profesi ataupun aplikasi yang menuntut informasi tentang posisi, kecepatan, percepatan ataupun waktu yang akurat (Zheng, 2010). Tingkat ketelitian GPS dalam menentukan posisi objek bervariasi mulai dari beberapa millimeter hingga dengan puluhan meter.

  GPS (Global Positioning System) adalah sistem navigasi dan penentuan posisi dengan menggunakan satelit yang ditemukan dan dikembangkan oleh Amerika Serikat (Junus,2012).

  2.1 Global Positioning System (GPS)

  2. KAJIAN PUSTAKA

  clustering moda transportasi berbasis GPS.

  Berdasarkan latar belakang tersebut, penulis tertarik untuk meneliti dan mengkaji lebih lanjut mengenai perbandingan algoritme K-Means dengan algoritme Fuzzy C Means (FCM) dalam

  Fuzzy C-Means menggunakan model pengelompokan Fuzzy sehingga data dapat menjadi anggota dari semua kelas atau cluster yang terbentuk dengan derajat atau tingkat keanggotaan yang berbeda (Luthfi, 2007). Dalam konsep fuzzy, keanggotaan sebuah objek atau data tidak diberikan secara tegas dengan nilai 1 (menjadi anggota) dan nilai 0 (tidak menjadi anggota), melainkan dengan suatu nilai derajat keanggotaannya yang jangkauan nilainya antara 0 sampai 1. Semakin tinggi nilai keanggotaan sebuah data semakin tinggi pula derajat keanggotaanya dan sebaliknya semakin kecil maka semakin rendah derajat keanggotaanya. Namun Aprianto dkk (2010) yang melakukan perbandingan terhadap algoritme K-Means dengan Fuzzy C Means untuk pengelompokan keypoint descriptor pada citra sidik jari menyatakan bahwa algoritme K- means lebih baik dari segi performansi dan hasil. Ini membuktikan bahwa tujuan pengembangan K-Means ke bentuk fuzzy tidak sepenuhnya berhasil.

  learning ) Dalam metode

  supervised learning , metode belajar dengan adanya

  pengelompokkan data berdasarkan kemiripan. Data yang memiliki tingkat kemiripan yang tinggi akan dikelompokkan dalam sebuah cluster.

  dengan mengelompokkan data yang ada ke dalam beberapa cluster. Data akan dikumpulkan dalam satu cluster berdasarkan kemiripan ataupun kedekatan karakteristik dengan data yang lain yang ada di cluster itu. K-Means akan berusaha menjauhkan data pada suatu cluster dengan cluster lainnya. Hal ini dilakukan untuk meminimalkan variasi antar data yang berada dalam satu cluster dan memaksimalkan variasi dengan data yang berada di cluster lainnya. Prosedur algoritme K-Means ditunjukkan pada Gambar 1.

  partitional (Agusta, 2007). K-Means bekerja

  K-Means adalah salah satu metode dalam data mining dengan teknik unsupervised yang mengelompokkan data dengan sistem

  2.4 Algortime K-Means

  menyederhankan data kedalam dimensi yang lebih kecil.

  unsupervised yang bertujuan untuk

  adalah pembagian obyek ‐obyek data ke dalam kelompok. Hierarchical clustering dilakukan dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan sebaliknya. SOM merupakan bagian dari jaringan syarif tiruan dengan konsep

  clustering dan (SOM) . Partional clustering

  dengan objek yang memiliki karaktristik sama (Andayani, 2007). Setiap data dimasukkan kedalam cluster dengan karektiristik yang paling mirip lalu kemudian berusaha menjauhkannya dengan cluster yang lain. Agusta (2007) membagi clustering menjadi tiga kelompok, yaitu hierarchical clustering, partitional

  Clustering membagi data ke dalam grup

  Asosiasi Tugas asosiasi dalam data mining adalah untuk menemukan atribut yang muncul dalam satu waktu.

  f.

  Clustering merupakan

  latihan (training) dan target. Contoh: Regresi, analisa Deskriminan dll.

  Pengklusteran (Clustering)

  e.

  Prediksi (Prediction) Prediksi memiliki kesamaan dengan klasifikasi dan estimasi. Tukjuan dari prediksi adalah nilai atau hasil yang akan ada di masa datang..

  d.

  Estimasi (Estimation) Estimasi hampir sama dengan klasifikasi, perbedaannya terletak pada atribut target pada estimasi bersifat numerik sedangkan klasifikasi kategori.

  Klasifikasi (Classification) Dalam klasifikasi, terdapat variabel target yaitu kategori. Zvariabel ini yang akan membagi data kedalam beberapa kategori c.

  b.

  Deskripsi (Description) Peneliti biasanya ingin mencari cara untuk menggambarkan pola atau hubungan antar data. Pola yang terjadi berulang-ulang akan memberikan gambaran mengenai kecenderungan suatu data.

  mining dikelompokkan menjadi: a.

  Sedangkan berdasarkan tugasnya data

  Metode ini tanpa disertai atribut target/label. Oleh karena itu, data mining pada metode ini ditujukan untuk menemukan pola berulang dan kedekatan dalam kumpulan data. Contoh clustering dan Self Organization Map (SOM).

  Belajar tanpa pengawasan (unsupervised learning)

  b.

2.3 Clustering

  Gambar 1. Prosedur Algoritme K-Means Gambar 2. Prosedur FCM

  2.7 Silhoette Coefficient

2.6 Fuzzy C-Means

  Silhouette Coefficient merupakan salah

  Fuzzy C-means (FCM) pertama kali satu metode evaluasi untuk menguji kualitas diperkenalkan oleh Jim Bezdek pada tahun 1981. sebuah cluster (Furqon,2016). Metode ini

  Metode ini merupakan pengembangan dari K- menggunakan rumus Eculidean distance dalam Means dengan menggabungkan prinsip fuzzy proses perhitungannya. Secara singkat metode dengan metode K-Means (Luthfi,2007). Berbeda

  Silhouette Coefficient ditunjukkan pada halnya dengan K-Means, data yang di-cluster persamaan (1). menggunakan FCM akan menjadi aggota dari setiap cluster yang ada. Ikatan data dengan

  ( − ) cluster ditentukan oleh nilai keanggotannya

  (1)

  = max⁡( , )

  ⁡

  yang berada pada rentang 0 hingga 1.Prosedur Algoritme Fuzzy C means clustering

  = Silhouette Coefficient ditunjukkan pada Gambar 2.

  = rata-rata jarak dari objek i dengan seluruh objek yang berada pada cluster yang sama

  nilai terkecil dari rata-rata jarak objek i

  =

  dengan objek lain pada cluster yang berbeda Nilai Shilouette coefficient berada pada rentan (-1) hingga 1. Semakin tinggi nilianya, maka semakin bagus pula kualitasnya.

2.7 Normalisasi Max/Min

  Normalisasi Max/min adalah metode yang dilakukan untuk menyamakan dan memperkecil rentang data. Normalisasi dilakukan dengan mengurangkan variabel dengan nilai maksimum dengan variabel dibagi dengan pengurangan antara variabel maksimum dengan variabel minimum. Ditunjukkan melalui persamaan (2).

  −

  (2)

  = ⁡ − x normalisasi

  =

  = Nilai variabel terbesar Nilai variabel terkecil

  = 3.

METODOLOGI PENELITIAN

  Gambar 3. Tahapan Penelitian

  Penjelasan mengenai tahapan-tahapan dalam Perbandingan algoritme K-Means dengan

  3.1 Pengumpulan Data

  algoritme Fuzzy C-Means pada pengelompokan Data yang digunakan adalah data moda transportasi berbasis Global Positioning sekunder yang berasal dari data lintasan GPS

  System (GPS). Metodologi penelitian yang

  yang dikumpulkan dalam proyek Geolife dilakukan dalam penelitian ini melalui beberapa (Microsoft Research Asia) yang dilakukan tahapan yaitu studi literatur, pengumpulan data, dengan mengambil data GPS dari 180 orang dari analisa kebutuhan sistem, perancangan sistem, rentang april 2007 sampai Agustus 2012. Sebuah implementasi sistem, pengujian sistem, dan lintasan GPS merupakan urutan dari beberapa pengambilan kesimpulan. Diagram blok titik koordinat GPS yang terdiri dari posisi metodologi penelitian yang berisi tahapan- bujur,dan lintang. Data lintasan yang digunakan tahapan yang dilakukan dalam penelitian yang adalah data lintasan yang berkisar antara 10 . diajukan ditunjukan pada Gambar 3 hingga 20 menit dengan jarak waktu antar titik selama 30 detik yang terdiri dari 6 jenis transportasi yaitu bike, bus, car, subway, taxi, dan train. Data yang akan dikelompokkan pada penelitian ini adalah data jarak dari tiap titik GPS dengan titik selanjutnya dalam satu lintasan.

  4. PERANCANGAN Perancangan sistem secara umum ditunjukkan pada Gambar 4.

  Adapun parameter input yang digunkan adalah sebagai berikut:

  K = 6; Maksimum iterasi = 30; P0 = 0; W = 2; Ѳ = 0.01;

  Pengujian ini dilakukan sebanyak 10 kali dengan menggunakan 208 data. Hal ini dilakukan karena setiap algoritme memiliki elemen random yang bisa mempengaruhi hasil.

  5.1 Pengujian Akurasi

  Pengujian ini akan membandingkan nilai akurasi dari kedua algoritme. Akurasi ini didapatkan dari akumulasi dari jumlah kelas mayoritas pada masing-masing cluster. Nilai akurasi dari kedua algoritme ditunjukkan pada Tabel 1.

  Tabel 1. Pengujian Nilai Akurasi Percobaan K-Means FCM

  ke-1 66.82692 71.63462 Gambar 4. Perancangan sistem ke-2 58.65385 71.63462 ke-3 53.84615 71.15385

   Pertama yang dilakukan adalah menentukan jumlah data yang akan di-cluster. Data akan ke-4 59.13462 71.63462 dipilih secara acak sesuai dengan jumlah ke-5 62.01923 71.63462 yang diinginkan. ke-6 54.80769 70.19231

   Selanjutnya adalah menginputkan jumlah ke-7 58.65385 69.71154

  cluster yang akan dibentuk (k), batas iterasi

  ke-8 54.80769 69.71154 maksimum yang bisa dilakukan, pembobot ke-9 54.80769 71.63462

  (w), threshold (Ѳ). ke-10 61.05769 69.71154

   Proses selanjutnya adalah menjalankan algoritme K-Means dimana pusat cluster average 58.46154 70.86538 awal akan dipilih secara acak. Prosedur K- Means ditunjukkan pada Gambar 1.

  Pada pengujian yang dilakukan sebanyak 10 kali, akurasi algoritme FCM

  Setelah proses K-Means, akan dilakukan proses FCM. Nilai matrik partisi awal akan

  selalu lebih unggul dibandingkan algoritme

  ditentukan secara acak dari rentan 0-1. Prosedur

  K-Means. Nilai akurasi terbesar algoritme FCM ditunjukkan pada Gambar 2. FCM sebesar 71,63462 dan yang terkecil

  Proses selanjutnya adalah menghitung

  sebesar 69,71154 dengan nilai rata-rata

  nilai silhouette coefficient dari cluster yang

  sebesar 70,86538 . Sedangkan nilai akurasi

  dihasilkan tiap algoritme. Proses terakhir adalah

  terbesar algoritme K-Means sebesar

  menampilkan data tiap cluster dari masing- 66,82692 dan nilai terkecil sebesar 53,84615 masing algoritme beserta nilai silhouette

  58,46154 dengan nilai rata-rata sebesar .

  coefficient- nya.

  Grafik pengujian akurasi algoritme ditunjukkan pada Gambar 5.

5. PENGUJIAN

  Pada penelitian ini pengujian yang dilakukan yaitu pengujian akurasi dan pengujian nilai Silhouette Coefficient.

  Gambar 5. Grafik Pengujian Akurasi Algoritme

  12

  1 Train

  6

  13

  5

  14 Taxi

  3

  3

  4

  6 Subway

  6

  5

  20 Car

  22

  1

  8

  68 Bus

  K0 K1 K2 K3 K4 K5 Bike v

  1 Tabel 5. Distribusi Data FCM Percobaan Kedua

  6

  22

  3

  1

  13 Train

  6

  5

  7

  1

  4 Taxi

  2 Subway

  6

  2

  3

  5 Train

  13

  1

  6

  1 Taxi

  3

  4

  15

  1

  5

  3 Dari Tabel diatas dapat dilihat bahwa distibusi data algoritme FCM lebih merata dibandingkan K-Means. Hal lainnya juga menunjukkan bahwa distribusi data algoritme FCM memiliki pola yang sama pada percobaan pertama dan kedua, ini membuktikan bahwa algoritme FCM lebih konsisten dalam hasil klasterisasinya.

  14

  3

  5

  3 Car

  8

  1

  17

  68 Bus

  Bike

  6. K0 K1 K2 K3 K4 K5

  Pengujian Sillhoette Coefficient dilakukan untuk mengetahui kualitas suatu cluster. Sillhoette Coefficient didapatkan dengan membandingkan jarak data pada cluster yang sama dengan jarak data di cluster lainnya. Perbandingan nilai Sillhouette Coefficient ditunjukkan pada Tabel

  5.2 Pengujian Sillhoutte Coefficient

  1

  3

  Perbedaan nilai akurasi dari percobaan ini diakibatkan karena adanya elemen random pada setiap algoritme. Elemen random pada algoritme K-Means yaitu pada penentuan centroid awal sedangkan elemen random pada FCM yaitu pada penentuan derajat keanggotaan awal. Grafik algoritme FCM pada Gambar 5 terlihat lebih lurus dibandingkan grafik algoritme K-Means. Hal ini menandakan bahwa akurasi dari algoritme FCM cenderung lebih konsisten. Nilai akurasi sangat bergantung pada distribusi data pada tiap cluster. Distribusi data K-Means pada percobaan pertama dan kedua ditunjukkan pada Tabel 2 dan 3.

  15

  22 Tabel 3. Distribusi Data K-Means Percobaan Kedua K0 K1 K2 K3 K4 K5

  6

  2

  3

  5 Train

  13

  1

  6

  1 Taxi

  3

  4

  1

  68 Bus

  2 Subway

  5

  14

  3

  5

  3 Car

  8

  1

  17

  68 Bus

  K0 K1 K2 K3 K4 K5 Bike

  Tabel 2. Distribusi Data K-Means Percobaan Pertama

  Bike

  27

  3

  5 Sedangkan untuk distribusi data FCM pada percobaan pertama dan kedua akan ditunjukkan pada Tabel 4 dan 5.

  14

  6 Subway

  12

  6

  5

  1 Car

  20

  8

  68 Bus

  Bike

  Pertama K0 K1 K2 K3 K4 K5

  Tabel 4. Distribusi Data FCM Percobaan

  22

  2 Car

  4

  2

  1 Train

  16

  8

  1 Taxi

  15

  3

  5

  6 Subway

  16

  7

  22

  Tabel 6. Pengujian Silhoutte Coeffcient

  Sedangkan visualisasi hasil clustering algoritme FCM ditunjukkan pada Gambar 8.

  selama 10 kali menunjukkan bahwa akurasi algoritme Fuzzy C Means lebih baik dibanding algoritme K- Means dengan nilai rata-rata sebesar 70,86538 sedangkan K-Means

  2. Hasil pengujian yang dilakukan

  diklasterisasi menggunakan algoritme K-Means dan Fuzzy C Means. Penentuan cluster algoritme K-Means diperoleh dari perhitungan jarak terkecil antara data dengan pusat cluster (centroid). Sedangkan penentuan cluster algoritme Fuzzy C Means diperoleh dari nilai derajat keanggotaan terbesar data terhadap setiap cluster.

  trajectory . Data ini selanjutnya

  Dalam clustering moda transportasi berbasis GPS, data trajectory moda transportasi ditransformasi menjadi data movement dengan mencari jarak dari titik satu ke titik selanjutnya dalam sebuah

  Berdasarkan hasil penelitian yang telah diuraikan pada bab sebelumnya, maka dapat disimpulkan: 1.

   KESIMPULAN

  Gambar 8. Visualisasi Hasil Clustering FCM 6.

  Gambar 7. Visualisasi Hasil Clustering K-Means

  Si K-Means FCM ke-1 0.41906 0.444101 ke-2 0.470766 0.444101 ke-3 0.482061 0.446025 ke-4 0.477358 0.444417 ke-5 0.45554 0.443806 ke-6 0.451478 0.435722 ke-7 0.477812 0.434946 ke-8 0.452987 0.434946 ke-9 0.448257 0.443806 ke-10 0.447356 0.434946 average 0.458267 0.440682

  Visualissi hasil clustering algoritme K- Means pada percobaan pertama ditunjukkan pada Gambar 7.

  Hal ini sangat dipengaruhi oleh data yang digunakan. Pada kasus ini, data yang digunakan merupakan data lintasan yang memiliki keunikan tersendiri.

  Pada Gambar 6 terlihat bahwa grafik FCM lebih stabil dibanding K-Means Yang bisa diartikan bahwa nilai silhouette coefficient FCM cenderung lebih konsisten. Dari dua hasil pengujian ini kita juga bisa mengetahui bahwa tidak selamanya nilai Silhoette Coefficient berbanding lurus dengan tingkat akurasi cluster.

  Gambar 6. Grafik Pengujian Nilai Sillhoette Coefficient

  Grafik pengujian Silhoette Coeficient algoritme ditunjukkan pada Gambar 6.

  . Sedangkan nilai rata-rata algoritme FCM sebesar 0,440682 . .

  0,458267

  Berbeda dengan pengujian akurasi, pengujian Silhouette Coefficient justru menunjukkan bahwa algoritme K-Means lebih unggul dibandingkan FCM. Nilai Silhouette Coefficient rata-rata algoritme K- Means sebesar

5.3 Visualisasi Hasil Clustering

  32-40. Purnama, Bambang Eka.2009. Pemanfaatan

  Global Positioning System Untuk Pelacakan Objek Bergerak . Journal Speed

7. SARAN

  • – Sentra Penelitian Engineering dan Edukasi – Volume 2 No 2 – 2009.

  Gunadi, Goldie,Dana Indra Sensuse.2012.

  Penerapan metode data mining market basket analysis terhadap data penjualan produk buku dengan menggunakan algoritme Apriori dan Frequent Pattern Growth (FP-Growth): studi kasus percetakan PT. Gramedia. Jurnal

DAFTAR PUSTAKA

  TELEMATIKA MKOM Vol.4 No.1, Maret 2012. Ridwan, Mujib, Hadi Suyono, M. Sarosa. 2013.

  Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritme Naive Bayes Classifier. Jurnal EECCIS Vol.7, No. 1, Juni 2013.

  Agusta,Yudi.2007. K-Means

  GeoLife: A Collaborative Social Networking Service among User, location and trajectory . Invited paper, in IEEE Data Engineering Bulletin. 33, 2, 2010, pp.

  rute terpendek pada jaringan multi moda transportasi umum menggunkan algoritme Dijkstra. Semarang: Universitas Diponegoro.

  Arifianto, Sofyan. 2012. Sistem aplikasi penentu

  kendaraan dengan teknologi GPS&GPRS berbasis web. Jurnal ELTEK, Vol 10 No 02, Oktober 2012 ISSN 1693-4024 .

  Junus, M. 2012. Sistem pelacakan posisi

  trajectory memiliki keunikan dan kerumitan tersendiri.

  Untuk memperbaiki penelitian ini, dibutuhkan metode khusus dalam mengelompokkan data trajectory karena data

  sebesar 58,46154. ebih baik dibanding Fuzzy C Means dengan nilai rata-rata 0,4582670 sedangkan Fuzzy C Means sebesar 0,440682. Ketidak-selarasan hasil penngujian akurasi dengan Sillhoette Coefficient ini sangat dipengaruhi oleh data yang digunakan.

  Zheng, Yu, Xing Xie, Wei-Ying Ma.2010.

  • – Penerapan, Permasalahan dan Metode Terkait. Jurnal

  Perbadingan algoritme K-Means dan Fuzzy C-Means untuk pengelompokan keypoint descriptor dalam citra sidik jari.

  Seminar Nasional Teknologi 2007 (SNT 2007). Aprianto, Indra , Catur Supriyanto. 2010.

  untuk clustering data (studi kasus: data performance mengajar dosen).

  Informasi & Komunikasi Terapan 2013 (SEMANTIK 2013). Luthfi, Emha Taufiq. 2007.Fuzzy C-Means

  dengan Algoritme Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata . Seminar Nasional Teknologi

  Kartina Diah K. W.2013. Data Mining

  Andayani,Sri.2007.

  Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritme K‐Means. SEMNAS

  Matematika dan Pend. Matematika 2007. Furqon, Muhammad Tanzil, Lailil

  Muflikhakh.2016. Clustering the potential

  risk of tsunami using Density-Based Spatial clustering of application with noise (DBSCAN). Journal of

  Environmental Engineering & Sustainable Technology (JEEST) Vol. 03 No. 01, July 2016, Pages 1-8.

  Sistem dan Informatika Vol. 3 (Pebruari 2007), 47-60. Ramadhana,Cakra , Yohana Dewi Lulu W, and

  Semarang: Universitas Dian nuswantoro.