Institutional Repository | Satya Wacana Christian University: Analisis Perilaku Pembayaran Anggota Pusat Kebugaran Silver Sport Club Salatiga dengan Clustering Data Mining

  

Analisis Perilaku Pembayaran

Anggota Pusat Kebugaran Silver Sport Club Salatiga

dengan Clustering Data Mining

  

Artikel Ilmiah

Peneliti:

  

Rifky Hangga Permana (672010606)

Magdalena A. Ineke Pakereng, M.Kom.

  

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

  

November 2017

  

Analisis Perilaku Pembayaran

Anggota Pusat Kebugaran Silver Sport Club Salatiga

dengan Clustering Data Mining

  

Artikel Ilmiah

Diajukan kepada

Fakultas Teknologi Informasi

untuk memperoleh gelar Sarjana Komputer

  

Peneliti:

Rifky Hangga Permana (672010606)

Magdalena A. Ineke Pakereng, M.Kom.

  

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

  

November 2017

  

Analisis Perilaku Pembayaran

Anggota Pusat Kebugaran Silver Sport Club Salatiga

1) 2)

dengan Clustering Data mining

Rifky Hangga Permana Magdalena A. Ineke Pakereng,

  

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

1) 2)

Jl. Diponegoro 52-60, Salatiga 50711, Indonesia

Email: 672010606@student.uksw.edu, ineke.pakereng@staff.uksw.edu

Abstract

  Silver Sport Club Salatiga seeks to sustain business and at the same time also increases the

number of members who come to exercise. A customer retention strategy requires knowledge of

customer characteristics, which can be obtained from the information systems used by the company.

This study aims to develop software that can be used to shape customer segmentation in the Silver

Sport Club. The method used in this research is clustering with K-Means algorithm. The result of

this research is the application of Silver Sprot Club customer data clustering. Benefits that can be

given by the cluster forming results are, the discovery of new knowledge, namely the pattern of

attendance and payment patterns of customers. For Silver Sport Club, this knowledge can be used as

a basis to provide promotions, discounts, or other business strategies.

  Keywords: Clustering, Data Mining, K-Means

Abstrak

  Silver Sport Club Salatiga berusaha untuk mempertahankan usaha dan pada saat yang

bersamaan juga meningkatkan jumlah member yang datang untuk berolah raga. Strategi

mempertahankan pelanggan memerlukan pengetahuan tentang karakteristik pelanggan, yang dapat

diperoleh dari sistem informasi yang digunakan oleh perusahaan tersebut. Penelitian ini bertujuan

untuk mengembangkan perangkat lunak yang dapat digunakan untuk membentuk segmentasi

pelanggan yang ada di Silver Sport Club. Metode yang digunakan pada penelitian ini adalah

clustering dengan algoritma K-Means. Hasil dari penelitian ini adalah aplikasi clustering data

pelanggan Silver Sport Club. Manfaat yang dapat diberikan oleh hasil pembentukan cluster tersebut

adalah ditemukannya pengetahuan baru, yaitu pola kehadiran dan pola pembayaran pelanggan. Bagi

Silver Sport Club, pengetahuan ini dapat digunakan sebagai dasar untuk memberikan promosi,

diskon, atau strategi bisnis yang lain. 1) Kata Kunci: Clustering, Data Mining, K-Means

Mahasiswa Program Studi Pendidikan Teknologi Informasi dan Komputer, Fakultas Teknologi

2) Informasi, Universitas Kristen Satya Wacana Staf Pengajar Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana

  Sektor usaha yang bergerak dalam bidang rekreasi dan pariwisata memberikan sumbangan 10 persen dari total PDB [1]. Salah satu usaha yang masuk kategori rekreasi ini adalah UMKM dalam bidang olah raga. UMKM jenis ini pada umumnya menyediakan jasa sewa sarana dan lokasi olah raga dan kebugaran. Salah satu daerah di Indonesia yang mengalami kemajuan di bidang UMKM yaitu Salatiga. Berdasarkan data UMKM binaan tri wulan IV tahun 2013 yang diperoleh dari Dinas Perindustrian, Perdagangan, Koperasi dan UMKM kota Salatiga, jumlah UMKM yang terdaftar mencapai 1.008 unit dengan jenis usaha perternakan, pertanian, industri, pengolahan, perdagangan, hotel, restoran, bangunan, pertambangan dan galian, komunikasi, gas, air bersih, dan jasa-jasa lain. Penyerapan jumlah tenaga kerja pada UMKM Salatiga pada tahun 2013 mencapai 4.0063 orang yang merupakan jumlah dari penyerapan tenaga kerja usaha mikro sebanyak 3.129 orang, usaha kecil 928 orang, usaha menengah sebanyak 6 orang [2].

  Silver Club Sport merupakan salah satu UKM di Salatiga, yang memiliki bidang usaha persewaan sarana dan lokasi kebugaran dengan memiliki visi untuk menjadi pusat kegiatan olahraga dan kebugaran di Salatiga. Pendapatan perusahaan diperoleh dari biaya

  

membership yang dibayarkan oleh pelanggannya tiap bulan. Berdasarkan hasil wawancara

  dengan pemilik usaha, Silver Club Sport berusaha untuk mempertahankan jumlah pelanggan 100 pelanggan tiap bulan. Strategi mempertahankan pelanggan ini memerlukan pengetahuan tentang karakteristik pelanggan. Tiap pelanggan memiliki atribut yang berbeda-beda, seperti umur, status pekerjaan, lama menjadi anggota, dan ketertiban dalam hal membayar biaya

  

membership. Pengetahuan tentang pelanggan merupakan aset yang kritikal [3]. Usaha untuk

  mengumpulkan, mengelola dan membagi pengetahuan tentang pelanggan dapat menjadi kegiatan yang penting bagi suatu usaha kecil menengah (UKM) [4]. Berdasarkan informasi tersebut, dapat dikatakan bahwa Silver Club Sport menghadapi masalah yaitu bagaimana mempertahankan pelanggan, meningkatkan pelanggan.

  Silver Club Sport memiliki dasar pengetahuan pelanggan diperoleh dari sistem informasi yang selama ini digunakan untuk mencatat pendaftaran, pembayaran, dan kehadiran pelanggan. Pengetahuan tentang pelanggan dapat diperoleh dari sistem informasi yang digunakan oleh perusahaan [5]. Selama ini, solusi yang digunakan untuk memahami data pelanggan adalah dengan menggunakan aplikasi spreadsheet. Informasi yang diperoleh dari proses tersebut adalah jumlah kehadiran pelanggan per bulan, jumlah hadir per pelanggan dalam bulan tertentu, dan jumlah pelanggan baru per bulan.

  Informasi dari hasil pengolahan dengan spreadsheet tersebut tidak mencukupi untuk dapat membentuk segmentasi pelanggan. Berdasarkan pengetahuan yang diketahui tentang pelanggan, dapat dilakukan proses segmentasi pelanggan. Segmentasi pelanggan merupakan bagian dari strategi bisnis yang disebut dengan Customer Relationship Management (CRM). Lebih tepatnya CRM adalah salah satu strategi bisnis untuk meningkatkan keuntungan, penghasilan, dan kepuasan konsumen dengan cara mengatur segmentasi konsumen, cara memberikan perlakuan terhadap konsumen, dan mengimplementasikan proses customer-

  

centric [6]. Tujuan dari proses segmentasi konsumen adalah untuk mengetahui perilaku

  konsumen dan menerapkan strategi pemasaran yang tepat sehingga mendatangkan keuntungan bagi pihak perusahaan [7]. Pada penelitian ini diajukan solusi untuk membentuk segmen pelanggan berdasarkan data yang ditarik dari sistem informasi yang ada. Sejak tahun 2012, sistem informasi tersebut merekam data perubahan anggota dan juga data kehadiran anggota tiap hari. Salah satu data yang disimpan adalah waktu kedatangan pelanggan untuk latihan, waktu pembayaran membership, dan jumlah uang yang dibayarkan. Data tersebut, yang dikumpulkan oleh sistem sejak tahun 2012, dapat digali lebih dalam untuk mengenali pola perilaku pelanggan, yaitu dalam hal pola kedatangan dan pola pembayaran.

  Proses segmentasi ini dapat ditempuh dengan menggunakan teknik Knowledge

  

Discovery Data mining [8]. Salah satu metode pengenalan pola dalam KDD adalah teknik

clustering. Algoritma yang sering digunakan adalah K-Means [9]. K-Means merupakan

  salah satu metode data non-hierarchical clustering yang dapat mengelompokkan data ke dalam beberapa cluster berdasarkan kemiripan dari data tersebut, sehingga data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain yang memiliki karakteristik yang sama [7]. Pada penerapannya di Silver Sport Club, maka satu cluster akan mewakili satu segmen pelanggan.

  Penelitian ini bertujuan untuk menggali perilaku pembayaran ini, kemudian menghubungkan perilaku pembayaran dengan perilaku kedatangan anggota yaitu seberapa rajin anggota club untuk datang berolahraga dalam satu minggu atau bulan. Analisis akan dilakukan dengan teknik clustering dengan atribut yang digunakan adalah rata-rata jeda waktu pembayaran, dan rata-rata kedatangan anggota club per bulan.

  Terdapat beberapa penelitian terdahulu yang digunakan sebagai acuan pada penelitian ini. Penelitian-penelitian ini menggunakan data mining untuk tujuan mengenali melakukan klasifikasi data, sehingga hasilnya dapat digunakan sebagai pendukung pengambilan keputusan. Wei pada penelitiannya [10] menggunakan teknik data mining untuk mengidentifikasi tipe pelanggan pada penyedia layanan tata rambut. Teknik yang digunakan merupakan kombinasi antara self-orginizing map (SOM) dan K-means untuk diterapkan pada model RFM (recency, frequency, dan monetary). Teknik tersebut membantu mengidentifikasi empat tipe pelanggan, yaitu pelanggan setia, pelanggan potensial, pelanggan baru dan pelanggan hilang, dan kemudian membangun strategi pemasaran yang spesifik bagi empat tipe pelanggan tersebut. Wei tidak menyebutkan angka tingkat akurasi dari identifikasi yang dihasilkan. Namun berhasil mengidentifikasi pelanggan ke dalam empat kategori, sekaligus memberikan kebiasaan dan saran strategi bisnis untuk tiap jenis pelanggan. Untuk pelanggan setia, penting untuk diberikan layanan yang dapat dikostumisasi sewaktu-waktu, memberikaan promosi layanan yang dapat dicoba secara gratis, dan mengirimkan informasi tentang produk dan layanan yang baru. Bagi pelanggan yang potensial, strateginya adalah dengan memberikan informasi tentang kegiatan promosi yang akhir-akhir ini dilakukan, dan layanan spesial untuk perawatan rambut. Salon juga dapat memberikan gift atau diskon untuk tiap transaksi dengan batas jumlah tertentu. Bagi pelanggan baru, salon dapat memberikan layanan yang nyaman dengan tujuan untuk membuat pelanggan tinggal lebih lama. Parkir gratis dan konsultasi gratis juga dapat mendukung strategi ini sehingga pelanggan baru tertarik untuk data lagi. Bagi kategori pelanggan yang hilang, pihak salon dapat menggunakan media promosi yang murah sebagai contoh email dan sms, untuk menginformasikan promosi produk dan layanan yang baru.

  Pemanfaatan clustering untuk membantu menentukan strategi bisnis dibahas oleh Putri pada penelitiannya pada Toko Buku Gramedia [11]. Toko Buku Gramedia Palembang merupakan perusahaan yang yang bergerak di bidang bisnis ritel dengan produk utama buku dan alat-alat tulis. Hal tersebut tentu saja menimbulkan persaingan bisnis antar perusahaan yang sangat besar. Data mining mampu menganalisa data yang besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung keputusan. Salah satu teknik data mining yang digunakan adalah clustering. Clustering merupakan teknik di dalam pemanfaatan data

  

mining yang digunakan dengan mengelompokkan data berdasarkan kemiripan data tersebut.

  Pada penelitian tersebut, clustering digunakan untuk membantu menemukan sejumlah aturan dari data transaksi penjualan produk buku pada Toko Buku Gramedia Palembang, sehingga untuk selanjutnya dapat digunakan sebagai pertimbangan dalam menentukan strategi penjualan yang efektif.

  Ramadhani menggunakan K-Means untuk menentukan strategi promosi Universitas Dian Nuswantoro [12]. Proses penerimaan mahasiswa baru Universitas Dian Nuswantoro menghasilkan data mahasiswa yang sangat besar berupa data profil mahasiswa dan data kegiatan belajar mengajar. Hal tersebut terjadi secara berulang dan menimbulkan penumpukan terhadap data mahasiswa, sehingga mempengaruhi pencarian informasi terhadap data tersebut. Penelitian ini bertujuan untuk melakukan pengelompokan terhadap data mahasiswa Universitas Dian Nuswantoro dengan memanfaatkan proses data mining dengan menggunakan teknik Clustering. Metode yang digunakan adalah CRISP-DM dengan melalui proses business understanding, data understanding, data preparation, modeling,

  

evaluation dan deployment. Algoritma yang digunakan untuk pembentukan cluster adalah

  algoritma K-Means. K-Means merupakan salah satu metode data non-hierarchical

  

clustering yang dapat mengelompokkan data mahasiswa ke dalam beberapa cluster

  berdasarkan kemiripan dari data tersebut, sehingga data mahasiswa yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain. Implementasi menggunakan Rapid Miner 5.3 digunakan untuk membantu menemukan nilai yang akurat. Atribut yang digunakan adalah kota asal, program studi dan IPK mahasiswa. Cluster mahasiswa yang terbentuk adalah tiga cluster, dengan cluster pertama 804 mahasiswa, cluster kedua 2792 mahasiswa dan cluster ketiga sejumlah 223 mahasiswa. Hasil dari penelitian ini digunakan sebagai salah satu dasar pengambilan keputusan untuk menentukan strategi promosi berdasarkan cluster yang terbentuk oleh pihak admisi UDINUS.

  Pada penelitian Via, Nugroho dan Syafrizal [13], digunakan algoritma Naïve Bayes untuk membangun sistem pendukung keputusan klasifikasi tingkat keganasan kanker payudara. Kanker payudara merupakan salah satu jenis kanker yang sering ditemukan pada kebanyakan wanita. Kanker ini ditandai dengan sel-sel abnormal yang tumbuh di luar kendali pada payudara. Hal ini menunjukkan bahwa kanker payudara adalah penyakit yang sangat ganas dan karenanya memerlukan pemeriksaan intensif dengan mendeteksi dini tingkat keganasan kanker payudara. Penelitian tersebut menganalisis tentang pengelompokan data kanker payudara untuk mengetahui kanker tersebut termasuk kanker jinak atau kanker ganas. Penelitian tersebut menggunakan 9 atribut sebagai masukan sistem dan data set yang digunakan adalah data set publik Breast Cancer Wisconsin Original (WBCO) yang diambil dari UCI Machine Learning. Untuk mengklasifikasi tingkat keganasan dapat dilakukan dengan pemanfaatan bio informatic dengan menggunakan teknik

  

data mining salah satunya adalah algoritma Naïve Bayes Classifier (NBC). Berdasarkan

  hasil pengujian dengan confusion matrix diketahui bahwa NBC yang diterapkan untuk melakukan klasifikasi tingkat keganasan kanker payudara memiliki akurasi pola yang cukup besar yaitu 97,82%, sedangkan error rate yang dihasilkan sebesar 2,18%. Hasil penelitian tersebut menunjukkan bahwa dengan error rate yang cukup kecil maka algoritma Naïve

  Bayes Classifier terbukti cukup bagus untuk melakukan klasifikasi pada data WBCO.

  Amborowati melakukan penelitian yang bertujuan untuk melihat dukungan

  

marketing intelligence pada strategi pemasaran [14]. Di era globalisasi seperti saat ini

  kebutuhan organisasi akan teknologi informasi sangatlah besar. Teknologi informasi yang berkembang saat ini digunakan tidak hanya untuk transaksi harian organisasi tapi juga untuk dukungan keunggulan kompetitif khususnya dalam membuat strategi pemasaran. Teknologi informasi untuk dukungan strategi pemasaran salah satunya adalah business intelligence.

  Pada penelitian Amborowati, dianalisis dukungan business intelligence khususnya pada bidang marketing intelligence pada strategi pemasaran dengan metode yang digunakan adalah studi literatur. Dan hasilnya adalah bahwa dukungan marketing intelligence pada strategi pemasaran dari sisi teknologi adalah untuk melakukan segmentasi pasar/ konsumen yang salah satunya dengan teknologi data mining.

  Berdasarkan penelitian-penelitian terkait data mining dan clustering, maka dilakukan penelitian yang membahas tentang data mining untuk mengenali perilaku pembayaran anggota club pusat kebugaran Silver Sport Club Salatiga. Rumusan masalah dalam penelitian adalah bagaimana menggali perilaku pembayaran anggota club, dan menghubungkan perilaku pembayaran dengan perilaku kedatangan anggota yaitu seberapa rajin anggota club untuk datang berolahraga dalam satu minggu atau bulan.

  Penelitian ini menggunakan data mining untuk menemukan pengetahuan dari tumpukan data. Pada bagian ini dibahas beberapa teori yang digunakan yaitu data mining dan knowledge discovery in database, clustering sebagai salah satu teknik dalam data

  

mining, dan algoritma K-Means yang merupakan salah satu algoritma untuk pembentukan

cluster.

  Data mining merupakan solusi yang mampu menemukan kandungan informasi yang tersembunyi berupa pola dan aturan sekumpulan data yang besar agar mudah dipahami [15].

Data mining didefinisikan sebuah proses untuk menemukan hubungan, pola, dan tren baru

  yang bermakna dengan menyaring data yang sangat besar, yang tersimpan dalam penyimpanan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika.

  Data mining dan knowledge discovery in database (KDD) merupakan istilah yang

  memiliki konsep yang berbeda akan tetapi saling berkaitan karena data mining adalah bagian dalam proses knowledge discovery in database [16]. KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini dapat digunakan untuk memperbaiki pengambilan keputusan di masa depan.

  Clustering merupakan metode pengelompokan data, record, pengamatan, atau

  memperhatikan untuk membentuk kelas-kelas objek baru yang memiliki kemiripan satu dengan yang lainnya. Contoh penerapan clustering dalam bisnis dan penelitian adalah: 1) Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar. 2) Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik dan mencurigakan.

  Gambar 1 Clustering [17]

  Clustering adalah proses membagi dataset ke dalam kelompok-kelompok dengan

  anggota tiap kelompok memiliki kedekatan sifat atau perilaku. Clustering merupakan pembelajaran tanpa pengawasan (unsupervised learning). Clustering dapat mengungkap hubungan yang sebelumnya tidak terdeteksi dalam dataset. Ada banyak aplikasi untuk

  

clustering. Misalnya, dalam bisnis, clustering dapat digunakan untuk menemukan dan

  mengenali segmen pelanggan, untuk tujuan pemasaran. Pada bidang biologi, dapat digunakan untuk klasifikasi tumbuhan dan hewan berdasarkan fitur/ciri khas yang dimiliki, seperti cara berkembang biak, alat pernafasan yang dimiliki, sistem pencernaan, dan lain- lain [17].

  Tan membagi clustering dalam dua kelompok, yaitu hierarchical and partitional

  

clustering [18]. Partitional Clustering disebutkan sebagai pembagian obyek-obyek data ke

  dalam kelompok yang tidak saling overlap sehingga setiap data berada tepat di satu cluster [19]. Hierarchical clustering adalah sekelompok cluster yang bersarang seperti sebuah pohon berjenjang (hirarki) [20]. Algoritma clustering terbagi ke dalam kelompok besar seperti berikut:

  1. Partitioning algorithms: algoritma dalam kelompok ini membentuk bermacam partisi dan kemudian mengevaluasinya dengan berdasarkan beberapa kriteria.

  2. Hierarchy algorithms: pembentukan dekomposisi hirarki dari sekumpulan data menggunakan beberapa kriteria.

  3. Density-based: pembentukan cluster berdasarkan pada koneksi dan fungsi densitas [21].

  4. Grid-based: pembentukan cluster berdasarkan pada struktur multiple-level granularity.

  5. Model-based: sebuah model dianggap sebagai hipotesa untuk masing-masing cluster dan model yang baik dipilih di antara model hipotesa tersebut.

  Algoritma K-Means adalah algoritma clustering yang paling popular dan banyak digunakan dalam dunia industri [22]. Algoritma ini disusun atas dasar ide yang sederhana. Algoritma K-Means merupakan model centroid. Model centroid adalah model yang menggunakan centroid untuk membuat cluster. Centroid adalah “titik tengah” suatu cluster yang berupa nilai. Centroid digunakan untuk menghitung jarak suatu obyek data terhadap centroid.

  (1) Rumus untuk K-Means ditunjukkan pada Persamaan 1. J adalah fungsi objective, k adalah jumlah kluster, n adalah jumlah data, x i adalah data ke-I, c j adalah titik tengah

  2

cluster ke-j. ||x i -c j || adalah fungsi jarak. Fungsi jarak digunakan untuk mengukur jarak

antara satu data terhadap suatu cluster.

  Pada awalnya ditentukan berapa cluster yang akan dibentuk. Sembarang obyek atau elemen pertama dalam cluster dapat dipilih untuk dijadikan sebagai titik tengah (centroid

  

point) cluster. Algoritma K-Means selanjutnya akan melakukan pengulangan sampai terjadi

  kestabilan (tidak ada obyek yang dapat dipindahkan). Berikut langkah-langkahnya : Menentukan koordinat titik tengah setiap cluster.

  1. Menentukan jarak setiap obyek terhadap koordinat titik tengah.

  2. Mengelompokkan obyek-obyek tersebut berdasarkan pada jarak minimumnya.

  3. Secara umum metode K-Means menggunakan algoritma sebagai berikut [23] :

  Tentukan k sebagai jumlah cluster yang dibentuk. Untuk menentukan banyaknya 1.

  cluster k dilakukan dengan beberapa pertimbangan seperti pertimbangan teoritis dan konseptual yang mungkin diusulkan untuk menentukan berapa banyak cluster.

  Bangkitkan k Centroid (titik pusat cluster) awal secara random. Penentuan centroid 2. awal dilakukan secara random/acak dari objek-objek yang tersedia sebanyak k

  cluster, kemudian untuk menghitung centroid cluster ke-i berikutnya, Hitung jarak setiap objek ke masing-masing centroid dari masing-masing cluster.

  3. Ada beberapa cara penghitungan jarak yang biasa digunakan yaitu: Euclidean

  distance, Manhattan distance disebut juga taxicab, Chebichev distance. Persamaan

  untuk Euclidean distance yang digunakan pada penelitian ini adalah sebagai berikut: (2) dengan ( , ) adalah jarak antara cluster dengan pusat cluster pada kata ke i , adalah bobot kata ke i pada cluster yang ingin dicari jaraknya, bobot kata ke i pada pusat cluster.

  Alokasikan masing-masing objek ke dalam centroid yang paling terdekat.

  4. Lakukan iterasi, kemudian tentukan posisi centroid baru dengan menghitung rata- 5. rata tiap atribut yang dimiliki oleh objek-objek di dalam cluster. Persamaan yang digunakan untuk menentukan titik baru (centroid) cluster adalah berikut:

  (3) Dimana = jumlah data dalam cluster, dan = jumlah dari nilai jarak yang masuk dalam masing-masing cluster Ulangi langkah 3 jika posisi centroid mengalami perubahan nilai, atau jika batas 6. maksimal iterasi sudah tercapai.

  Pada clustering, diperlukan nilai jarak yang digunakan untuk menentukan kedekatan suatu data terhadap titik pusat cluster. Pendekatan pengukuran jarak di antaranya adalah

  Euclidean distance dan Manhattan distance.

  Euclidean distance adalah perhitungan jarak dari 2 buah titik dalam Euclidean

space. Euclidean space diperkenalkan oleh Euclid, seorang matematikawan dari Yunani

  sekitar tahun 300 SM. untuk mempelajari hubungan antara sudut dan jarak. Euclidean ini berkaitan dengan Teorema Phytagoras dan biasanya diterapkan pada 1, 2 dan n dimensi [24].

  Pada bidang 1 dimensi, rumus Euclidean diberikan: (4)

  Pada bidang 2 dimensi, jika p= (p1,p2) dan q = (q1, q2), maka jarak dapat diperoleh dengan rumus: (5)

  Pada bidang n dimensi, jika suatu data memiliki n dimensi/atribut, maka jarak data p dengan data q diperoleh dengan rumus berikut:

  (6)

  Manhattan distance/City Block distance, merupakan salah satu teknik yang sering

  digunakan untuk menentukan kesamaan antara dua buah obyek. Pengukuran ini dihasilkan berdasarkan penjumlahan jarak selisih antara dua buah obyek dan hasil yang didapatkan dari

  

Manhattan distance bernilai mutlak Dimana, Manhattan distance melakukan perhitungan

jarak dengan cara tegak lurus [25].

  (7) Sebagai contoh, jarak antara (p1, p2) dan (q1, q2) adalah:

  (8)

Metode Penelitian 3

  Pada penelitian ini dilakukan analisis perilaku pembayaran yang dilakukan oleh anggota Silver Sport Club. Anggota club melakukan pembayaran sesuai dengan jenis keanggotaan. Sebagai contoh, dengan membayar 80 ribu rupiah, maka anggota club dapat menggunakan fasilitas club selama 30 hari. Setelah masa 30 hari ini, anggota club perlu melakukan pembayaran lagi, yang disebut dengan “reload”. Tidak ada denda yang diberikan jika pembayaran terlambat, namun konsekuensinya adalah anggota club dengan masa keanggotaan yang belum “reload”, tidak diijinkan masuk dan menggunakan fasilitas club. Bagi sisi pengusaha club, anggota yang paling menguntungkan adalah anggota yang sesegera mungkin melakukan “reload”.

  Penelitian yang dilakukan, diselesaikan melalui tahapan penelitian yang terbagi dalam empat tahapan, yaitu: (1) Identifikasi masalah dan studi literatur, (2) Pengumpulan Data, (3) Pengembangan Aplikasi Clustering, dan (4) Analisis Hasil Clustering.

  

Identifikasi Masalah dan Studi Literatur

Pengumpulan Data

Pengembangan Aplikasi Clustering

Analisis Hasil Clustering

  

Gambar 2 Tahapan Penelitian Tahapan penelitian pada Gambar 2, dapat dijelaskan sebagai berikut. Tahap

  

pertama: identifikasi masalah dan studi literatur, yaitu bagaimana menganalisis perilaku

  pelanggan berdasarkan data pelanggan yang ada di Silver Sport Club, dan bagaimana menerapkan hasil analisis tersebut untuk kemajuan usaha Silver Sport Club. Studi literatur dilakukan dengan tujuan menemukan dan mempelajari penelitian terdahulu dan teori mengenai pengolahan data, terutama data pelanggan untuk mengenali karakteristik pelanggan, sehingga dapat bermanfaat untuk kemajuan bisnis; Tahap kedua: pengumpulan data, yaitu data yang berasal dari sistem informasi absensi yang saat ini digunakan oleh Silver Sport Club. Data yang diambil adalah sebagian data, bukan keseluruhan data. Data ini meliputi tabel Member, tabel Pembayaran, dan tabel Absensi; Tahap ketiga: pengembangan aplikasi clustering. Pada tahap ini dikembangkan sebuah aplikasi clustering, yang berfungsi untuk membaca data yang telah diambil dari tahap kedua, dan melakukan proses clustering; dan Tahap keempat: analisis hasil clustering. Analisis dilakukan pada cluster yang terbentuk dari tahap ketiga. Pada tahap ini diharapkan untuk diperoleh pengetahuan baru mengenai perilaku kedatangan dan pembayaran yang dilakukan oleh anggota club.

  Data tidak dapat langsung diolah dengan menggunakan sistem data mining. Data tersebut harus dipersiapkan terlebih dahulu agar hasil yang diperoleh dapat lebih maksimal. Tahapan dalam proses Knowledge Discovery In Databases (KDD) dapat dilihat pada Gambar 3 terdiri dari tahapan-tahapan sebagai berikut [26]. 1) Cleaning and Integration. Langkah pertama adalah dengan melakukan pembersihan terhadap data dan penggabungan data. Proses data cleaning bertujuan untuk menghilangkan noise dan data yang tidak konsisten dan proses data integration bertujuan untuk menggabungkan sumber data dari berbagai tempat menjadi satu penyimpanan; 2) Selection and Transformation. Pada tahap

  

selection and transformation, data dan atribut yang akan digunakan diambil dari database

  untuk dianalisis. Selanjutnya data tersebut diubah menjadi bentuk yang tepat untuk dilakukan proses mining; 3) Data mining. Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan; 4)

  

Evaluation and Presentation. Pada tahap ini, dilakukan identifikasi pola-pola yang benar-

  benar menarik dari hasil data mining. Setelah didapatkan pola yang dihasilkan dari proses

  

data mining perlu divisualisasikan atau ditampilkan dalam bentuk yang mudah dimengerti

  oleh pihak yang berkepentingan; Cleaning and Integration Transformation Selection and (Clustering with K-Means) Data mining Evaluation and Presentation

  

Gambar 3 Rancangan Arsitektur Sistem Aplikasi cluster dikembangkan dengan menggunakan pustaka .Net Framework 4.5, dengan database yang digunakan adalah Sql Server 2012 Express Edition. Penulisan program dilakukan dengan menggunakan Visual Studio 2015. Data yang digunakan pada penelitian ini, terdiri dari 2859 record data member, dan 45,509 record catatan kehadiran

  

member. Data diperoleh dari pengelola Silver Sport Club, yang merupakan catatan

  kehadiran member sejak bulan Februari 2012 sampai dengan November 2017. Database ini terdiri dari beberapa tabel, beberapa tabel yang digunakan untuk proses analisis adalah tabel

  

Member, tabel Pembayaran dan tabel Absensi. Struktur tabel dan hubungan antar tabel

ditunjukkan pada Gambar 4. Member Pembayaran Absensi MemberId PK Barcode Nama NoKTP

TempatLahir

TanggalLahir

JenisKelamin

Alamat

TanggalDaftar

Telp Email Tinggi

attribute name

MemberId TanggalPembayaran ValidDari ValidSampai JenisKeanggotaan Biaya Delay MemberId WaktuMasuk WaktuKeluar

  

Gambar 4 Skema Struktur Data yang Digunakan pada Proses Data Mining

  Tiga tabel tersebut kemudian disederhanakan, sehingga mudah untuk proses analisis

  

K-Means. Berdasarkan tabel-tabel tersebut, diambil field MemberId, TanggalDaftar dari

  tabel Member. Pada tabel pembayaran, dilakukan proses penyatuan (aggregate) dengan fungsi rata-rata, sehingga diperoleh rata-rata keterlambatan pembayaran tiap member. Demikian juga pada tabel absensi, dilakukan perhitungan rata-rata kehadiran member tiap bulan. Hasil akhir diringkas ke dalam satu tabel, dengan struktur dan contoh data ditunjukkan pada Tabel 1.

  

Tabel 1 Struktur Tabel dan Contoh Data Untuk Proses Analisis

Member Umur

  Keanggotaan (dalam satuan bulan) Total Datang (kali) Rasio Umur dan Total Keterlambatan Pembayaran (dalam satuan hari) (A) (B) (B) / (A) 1001

  69 1 0.014 117.69 1002 69 4 0.058

  0.00 1003 69 1 0.014

  0.00

  1004

  0.00 3741 30 34 1.133

  

Gambar 5 Tampilan Hasil Implementasi Aplikasi Clustering

Pada Gambar 5 ditunjukkan hasil implementasi dalam bentuk aplikasi desktop.

  bulan yang lalu, terhitung sampai dengan bulan November 2017. Member 1001 memiliki catatan datang 1 kali selama 69 bulan, rasio kedatangannya berarti 0.014 per bulan. Rata- rata keterlambatan pembayaran member tersebut adalah 117.69 hari. Member 1013, memiliki rata-rata kehadiran per bulan yaitu 0.029 kali per bulan. Member 1013 memiliki catatan pembayaran -4.09 hari, yang berarti member tersebut membayar 4 hari sebelum habis masa keanggotaan. Member 1007 dan 3741 memiliki rasio kehadiran 1.3 dan 1.1, yang berarti selama masa keanggotaannya, kedua member ini datang paling tidak 1 kali dalam 1 bulan.

  0.00 Pada Tabel 1 ditunjukkan, bahwa member 1001 terdaftar sebagai anggota sejak 69

  26.34 3744 30 4 0.133

  26.34 3743 30 15 0.500

  17.64 3742 30 21 0.700

  14.57 1015 69 28 0.406 -2.14 3740 30 5 0.167

  69 1 0.014

  0.00 1013 69 2 0.029 -4.09 1014 69 278 4.029

  0.00 1012 69 2 0.029

  0.00 1009 69 1 0.014

  60.45 1008 69 1 0.014

  0.00 1007 69 94 1.362

  0.00 1005 69 35 0.507 379.00 1006 69 3 0.043

  Aplikasi ini membaca data member seperti ditunjukkan pada Tabel 1. Tiap member diwakilkan dengan satu point pada chart. Cluster dibedakan dengan warna dan bentuk point. Proses pembentukan cluster, diperlukan input yaitu jumlah cluster. Pembentukan cluster akan berhenti pada iterasi tertentu, yaitu ketika iterasi N menghasilkan cluster sama seperti pada iterasi N-1 (iterasi sebelumnya).

  

Gambar 6 Hasil Pembentukan 2 Cluster

  Proses pembentukan cluster 2 cluster, ditunjukkan pada Gambar 6. Cluster-0 memiliki jumlah anggota 2664, dan sisanya yaitu 195 berada di cluster-1. Cluster-0 memiliki nilai rata-rata (titik tengah) yaitu 10.69 hari keterlambatan pembayaran, dan 0.42 rata-rata kehadiran dalam 1 bulan. Cluster-1 memiliki rata-rata 233.32 hari keterlambatan, dan 0.27 rata-rata kehadiran per bulan.

  

Gambar 7 Hasil Pembentukan 3 Cluster Pada Gambar 7 ditunjukkan hasil pembentukan 3 cluster. Pengelompokan ke dalam 3 cluster ini dapat memperjelas makna tiap cluster. Sebagai contoh pada cluster-0, adalah

  

cluster paling menguntungkan bagi pemilik tempat fitnes. Cluster ini terdiri dari member

  yang memiki rata-rata pembayaran terlambat 6 hari, dengan maksimal keterlambatan adalah 73 hari, dan paling cepat adalah 16 hari sebelum batas pembayaran.

  

Gambar 8 Hasil Pembentukan 5 Cluster

  Pada Gambar 8 dibentuk 5 cluster, sehingga pada tiap cluster berisi member-member yang memiliki kriteria lebih mirip. Informasi tiap cluster ditunjukkan pada Tabel 2. Pada Tabel 2 ditunjukkan bahwa semakin kecil nilai rata-rata kehadiran per bulan, maka angka keterlambatan cenderung membesar. Promosi dapat diberikan kepada member sehingga dapat memotivasi untuk lebih rajin berolahraga, sehingga akan memberikan pengaruh pada ketepatan waktu membayar.

  Tabel 2 Statistik Cluster yang Dibentuk

Nomor Jumlah Rata-rata Rata-rata Maks. Maks. Min. Min.

  Cluster Member Keterlambatan kehadiran Keterlambatan Kehadiran Keterlambatan Kehadiran per bulan per bulan per bulan

  Cluster-0 2286

  1.89

  0.38

  26.66 9.61 -16.62

  0.01 Cluster-1 84 263.25

0.23 387.50

0.91 201.54

  0.01 Cluster-2 294

  51.85

  0.75

  92.11

  6.09

  26.99

  0.02 Cluster-3 16 529.45

0.09 671.23

0.18 401.17

  0.03 Cluster-4 179 133.10

0.41 194.42

  1.80

  93.30

  0.01 Proses pembentukan cluster memiliki batas iterasi maksimal yang berbeda, demikian

  juga waktu proses yang dibutuhkan. Pada Tabel 3 dilakukan pengujian pembentukan cluster dari sejumlah 2, kemudian ditingkatkan satu demi satu sampai mencapai jumlah 7 cluster.

  Tabel 3 Pengujian Pembentukan Cluster

Jumlah Cluster Iterasi Lama Proses (detik)

  2

  12

  0.49

  3

  32

  0.63

  4

  24

  0.78

  5

  Berdasarkan penelitian yang telah dilakukan, maka dapat disimpulkan bahwa dengan menggunakan K-Means, maka dapat dibentuk cluster-cluster member yang merupakan segmentasi konsumen Silver Sport Club. Tiap cluster memberikan informasi perilaku

member dalam hal pembayaran dan rata-rata kehadiran seorang member per bulan.

Berdasarkan proses data mining dengan K-Means untuk membentuk 5 cluster, diketahui bahwa semakin kecil nilai rata-rata kehadiran per bulan, maka angka keterlambatan cenderung membesar. Dengan menggunakan informasi ini maka pihak pengelola usaha dapat memberikan promosi yang dapat memotivasi member untuk lebih rajin datang berolahraga, sehingga dapat mengurangi rentang waktu keterlambatan pembayaran.

  Management (CRM) dengan Metode Klasifikasi (Algoritma J-48, ZERO-R dan Naive Bayes). Prosiding SNST Fakultas Teknik 1. [9]. Widayani, W., Kusrini, K. & Al Fatta, H. 2015. Perancangan Sistem Pendukung

  Denpasar [8]. Maghfirah, M., Adji, T. B. & Setiawan, N. A. 2015. Menggunakan Data Mining untuk Segmentasi Customer pada Bank untuk Meningkatkan Customer Relationship

  [6]. Garcia, I., Pacheco, C. & Martinez, A. 2012. Identifying critical success factors for adopting CRM in small: A framework for small and medium enterprises. Software Engineering Research, Management and Applications 2012 , 1–15. [7]. Nugraheni, Y. 2011. Data Mining dengan Metode Fuzzy untuk Customer Relationship Management (CRM) pada Perusahaan Retail. Universitas Udayana.

  (doi:10.1057/palgrave.jors.2601365) [5]. Jamhur, A. I. 2017. Penerapan Data Mining untuk Menganalisa Jumlah Pelanggan Aktif dengan Menggunakan Algoritma C 4.5. Majalah Ilmiah UPI-YPTK 23.

  Management Review 43, 89–105. (doi:10.2307/41166102) [4]. Garcia-Murillo, M. & Annabi, H. 2002. Customer knowledge management. Journal of the Operational Research Society 53, 875–884.

  Menengah (UKM) terhadap Pertumbuhan Ekonomi Daerah (Studi di Pemerintah Kota Batu). WACANA, Jurnal Sosial dan Humaniora 17, 88–96. [3]. Winer, R. S. 2001. A Framework for Customer Relationship Management. California

  [1]. Mutmainah, D. A. 2016. Kontribusi UMKM Terhadap PDB Tembus Lebih Dari 60 Persen. CNN Indonesia. [2]. Hapsari, P. P., Hakim, A. & Noor, I. 2014. Pengaruh Pertumbuhan Usaha Kecil

  6. Daftar Pustaka

  5. Simpulan

  32

  diperlukan. Jumlah iterasi yang diperlukan tidak dipengaruhi oleh jumlah cluster yang harus dibentuk. Pada Tabel 3 ditunjukkan bahwa untuk membentuk 3 cluster sama dengan untuk 5 dan 7 cluster, yaitu 32 iterasi. Sedangkan untuk membentuk 6 cluster, diperlukan putaran yang lebih banyak yaitu 33 iterasi.

  1.02 Semakin banyak cluster yang harus dibentuk, semakin lama waktu proses yang

  32

  7

  1.01

  33

  6

  0.89

  Keputusan Penentuan Impor Bawang Merah. Creative Information Technology Journal 2, 181–191. [10]. Wei, J.-T., Lee, M.-C., Chen, H.-K. & Wu, H.-H. 2013. Customer relationship management in the hairdressing industry: An application of data mining techniques.

  Expert Systems with Applications 40, 7513–7518. [11]. Putri, T. U., Herdiansyah, M. I. & Purnamasari, S. D. 2014. Penerapan Data Mining untuk Menentukan Strategi Penjualan pada Toko Buku Gramedia Palembang dengan

  Menggunakan Metode Clustering. Jurnal Mahasiswa Teknik Informatika [12]. Ramadhani, R. D. 2014. Data Mining Menggunakan Algoritma K-Means Clustering

  Untuk Menentukan Strategi Promosi Universitas Dian Nuswantoro. Jurnal Sistem Informasi 12. [13]. Via, Y. V., Nugroho, B. & Syafrizal, A. 2015. Sistem Pendukung Keputusan

Dokumen yang terkait

Institutional Repository | Satya Wacana Christian University: Penerapan Metode Eksperimen Berbantuan Media Benda Konkret untuk Meningkatkan Hasil Belajar IPA Siswa Kelas 5 SD Negeri 1 Mangunsari Kecamatan Ngadirejo Kabupaten Temanggung Semester 2 Tahun Pe

0 3 113

1 BAB I PENDAHULUAN 1.1 Latar Belakang - Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Problem Based Learning (PBL) Berbantuan Kuis untuk Meningkatkan Hasil Belajar IPA pada Siswa Kelas 5 SD Negeri Sampetan Ke

0 0 7

BAB II KAJIAN PUSTAKA 2.1 Kajian Teori 2.1.1 Hakikat Belajar dan Hasil Belajar 2.1.1.1 Belajar - Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Problem Based Learning (PBL) Berbantuan Kuis untuk Meningkatkan Ha

0 0 27

BAB III METODE PENELITIAN 3.1 Setting dan Karakteristik Subyek Penelitian - Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Problem Based Learning (PBL) Berbantuan Kuis untuk Meningkatkan Hasil Belajar IPA pada

0 0 25

Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Problem Based Learning (PBL) Berbantuan Kuis untuk Meningkatkan Hasil Belajar IPA pada Siswa Kelas 5 SD Negeri Sampetan Kecamatan Ampel Kabupaten Boyolali Semester

0 0 52

Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Problem Based Learning (PBL) Berbantuan Kuis untuk Meningkatkan Hasil Belajar IPA pada Siswa Kelas 5 SD Negeri Sampetan Kecamatan Ampel Kabupaten Boyolali Semester

0 0 21

BAB II KAJIAN PUSTAKA 2.1 Kajian Teori 2.1.1 Hakikat Belajar - Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Kooperatif Tipe Teams Game Tournament untuk Meningkatkan Kemampuan Kerjasama dan Hasil Belajar Matem

0 0 20

Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Kooperatif Tipe Teams Game Tournament untuk Meningkatkan Kemampuan Kerjasama dan Hasil Belajar Matematika pada Siswa Kelas V SD Negeri Kutowinangun 11 Kecamatan Ti

0 0 29

BAB IV HASIL PENELITIAN DAN PEMBAHASAN 4.1 Gambaran Subyek Penelitian - Institutional Repository | Satya Wacana Christian University: Penggunaan Model Pembelajaran Kooperatif Tipe Teams Game Tournament untuk Meningkatkan Kemampuan Kerjasama dan Hasil Bela

0 0 59

Institutional Repository | Satya Wacana Christian University: Aplikasi Informasi Kuliner Kabupaten Semarang Berbasis Android dengan Memanfaatkan Google Maps API

0 0 21