IMPLEMENTASI ALGORITMA APRIORI UNTUK EKSTRAKSI ATURAN DARI DATA KUNJUNGAN WISATAWAN DI TAMAN WISATA SENGKALING

  

IMPLEMENTASI ALGORITMA APRIORI UNTUK

EKSTRAKSI ATURAN DARI DATA KUNJUNGAN

WISATAWAN DI TAMAN WISATA SENGKALING

Gita Indah Marthasari

  

Universitas Muhammadiyah Malang, Malang

Kontak Person:

  

Gita Indah Marthasari

Jl. Tlogomas 246

Malang, 65144

E-mail: gita@umm.ac.id

Abstrak

  

Perkembangan teknologi informasi (TI) memberikan manfaat positif pada berbagai bidang

industri salah satunya pariwisata. Industri pariwisata telah menggunakan TI untuk

meningkatkan efisiensi operasional usahanya. Selain itu, TI juga digunakan untuk

memperkaya pengalaman para wisatawan baik berkaitan dengan pengetahuan akan objek

wisata, kepuasan, maupun kemudahan. Data mining merupakan teknik penggalian

pengetahuan yang seringkali digunakan pada banyak bidang salah satunya adalah wisata..

Salah satu metode dalam penggalian data adalah ekstraksi aturan asosiasi (association rule

mining). Ekstraksi aturan asosiasi merupakan salah satu teknik analisis data yang populer

dalam bidang penggalian data. Ekstraksi aturan asosiasi merupakan salah satu teknik untuk

menemukan seluruh aturan asosiasi berdasarkan nilai minimum support dan minimum

confidence tertentu. Taman Wisata Sengkaling merupakan objek wisata yang terletak di

Kabupaten Malang. Terdapat lebih dari 20 wahana yang dapat dinikmati oleh para

wisatawan yang berkunjung. Data kunjungan wisatawan pada wahana-wahana di Sengkaling

dapat dimanfaatkan oleh pengelola untuk memperoleh pengetahuan dalam bentuk pola

keterkaitan antar wahana yang dikunjungi. Pada penelitian ini, algoritma Apriori digunakan

untuk menemukan pola tersebut. Algoritma Apriori merupakan algoritma yang populer untuk

ekstraksi aturan asosiasi antar data. Data diperoleh dari hasil survey terhadap pengunjung

Taman Wisata Sengkaling. Implementasi algoritma Apriori dilakukan memanfaatkan aplikasi

WEKA. Dari pengujian penentuan nilai support dan confidence diperoleh nilai terbaik 0.3

dan 0.97. Kedua nilai tersebut menghasilkan keterkaitan antara wahana Kiddy Car dan

Kincir Angin serta wahana Kiddy Train dan Kincir Angin.

  Kata kunci: aturan asosiasi, algoritma Apriori, taman wisata sengkaling, WEKA

Pendahuluan

  Perkembangan teknologi informasi (TI) memberikan manfaat positif pada berbagai bidang industri salah satunya pariwisata. Industri pariwisata telah menggunakan TI untuk meningkatkan efisiensi operasional usahanya. Selain itu, TI juga digunakan untuk memperkaya pengalaman para wisatawan baik berkaitan dengan pengetahuan akan objek wisata, kepuasan, maupun kemudahan. Dalam industri pariwisata, mengetahui keinginan konsumen merupakan salah satu cara untuk meningkatkan kepuasan konsumen terhadap layanan yang disediakan. Adanya inovasi pemanfaatan TI dapat mendukung peningkatan kinerja perusahaan industri pariwisata. Dengan menggunakan TI, perusahaan dapat memperoleh pengetahuan terkait perilaku konsumen dimana pengetahuan ini akan bermanfaat untuk menyusun strategi pemasaran antara lain dalam hal promosi, penetapan harga, dan lain sebagainya.

  I - 81 mempengaruhi jumlah data yang tersimpan pada sebuah basis data. Dibutuhkan sebuah mekanisme untuk mengekstrak pengetahuan dari tumpukan data tersebut sehingga pengetahuan yang diperoleh dapat menjadi sarana perumusan strategi pengembangan yang lebih baik. Salah satu teknik untuk menganalisis data adalah penggalian data (data mining). Penggalian data merupakan metode untuk mengidentifikasi pengetahuan dari basis data dimana tujuan utamanya adalah untuk prediksi dan deskripsi. Teknik ini memberikan kemampuan bagi pengguna untuk menemukan pengetahuan dari data (Juwattanasamran, et.al, 2013). Pengetahuan ini dapat berupa pola keterkaitan antar data dan aturan-aturan. Dengan menggunakan teknik dan data yang sesuai dapat diperoleh pola dari data dimana pola ini merupakan model pengetahuan dari basis data.

  Salah satu metode dalam penggalian data adalah ekstraksi aturan asosiasi (association rule

  

mining) . Ekstraksi aturan asosiasi merupakan salah satu teknik analisis data yang populer dalam

  bidang penggalian data. Ekstraksi aturan asosiasi merupakan salah satu teknik untuk menemukan seluruh aturan asosiasi berdasarkan nilai minimum support dan minimum confidence tertentu.

  Aturan asosiasi tersusun atas dua elemen yaitu anteseden dan konsekuen. Langkah-langkah penerapannya ada dua yaitu menerapkan minimum support terhadap seluruh item dari data dan membentuk frequent item

  

set berdasarkan nilai minimum confidence. Teknik aturan asosiasi akan menghasilkan aturan dalam

  format “jika A maka B”, dimana A dan B dapat berupa item tertentu, nilai, kata-kata, dan lain-lain. Analisis data menggunakan aturan asosiasi telah diterapkan dalam berbagai bidang antara lain pengaturan stok barang (Luthfi, 2009), penjualan buku (Gunadi, et.al, 2012), menganalisis data lokasi foto (Lee, et.al, 2013), analisis perilaku siswa (Kumar, et.al, 2011) dan juga bidang pariwisata (Saraee, et.al, 2005; Juwattanasamran, et.al, 2013).

  Di dalam bidang usaha retail, metode penggalian aturan asosiasi dari data dikenal dengan istilah

  

market basket analysis (MBA) (Gunadi, et.al, 2012). MBA adalah suatu metode analisis atas perilaku

  konsumen secara spesifik dari kelompok atau golongan tertentu. MBA umumnya dimanfaatkan sebagai titik awal pencarian pengetahuan dari data transaksi ketika belum diketahui pola spesifik yang ingin dicari. Hasil dari MBA adalah aturan asosiasi yang menyatakan pola-pola keterkaitan antar data dalam basis data.

  Taman Wisata Sengkaling merupakan objek wisata yang terletak di Kabupaten Malang. Meskipun Sengkaling menonjolkan wisata air, namun wahana yang ditawarkan tidak hanya itu. Terdapat lebih dari 20 wahana yang dapat dinikmati oleh para wisatawan yang berkunjung. Para wisatawan dapat memilih mengunjungi wahana-wahana yang diinginkan. Data kunjungan wisatawan pada wahana-wahana di Sengkaling dapat dimanfaatkan oleh pengelola untuk memperoleh pengetahuan dalam bentuk pola keterkaitan antar wahana yang dikunjungi. Pengetahuan mengenai pola ini dapat digunakan oleh pihak perusahaan pengelola untuk meningkatkan kinerja dan pelayanan kepada konsumen. Penggalian aturan asosiasi dari data kunjungan wisatawan di Taman Rekreasi Sengkaling dapat menghasil pengetahuan mengenai serangkaian wahana yang kerap dikunjungi oleh pengujung. Hasil ini dapat digunakan antara lain untuk promosi produk, penentuan harga tiket wahana-wahana berbayar, dan perancangan strategi paket wahana. Adapun tujuan penelitian ini adalah menganalisis data kunjungan wisatawan pada wahana di Taman Rekreasi Sengkaling untuk menemukan pola berupa aturan asosiasi.

Metode Penelitian Penelitian ini akan menggunakan data kuantitatif yang diperoleh melalui kuisioner

  Responden dari kuisioner adalah para pengunjung dewasa (> 17 tahun) Taman Rekreasi Sengkaling dimana responden kategori ini dirasa mampu untuk berpikir secara independen. Tujuan kuisioner adalah mengumpulkan data wahana-wahana yang telah dikunjungi oleh responden tersebut. Data hasil kuisioner selanjutnya dianalisis menggunakan program WEKA untuk memperoleh aturan-aturan asosiasi. Sebelum diolah, data dari kuisioner mengalami pra-pemrosesan terlebih dahulu untuk mempersiapkan dan menyesuaikan dengan format yang diminta oleh perangkat lunak analisis.

  Secara garis besar, tahap-tahap yang akan dilakukan pada penelitian ini mengikuti tahapan umum dalam proses penggalian data yaitu sebagai berikut (Kumar, et.al, 2012): a.

  Pembersihan dan Transformasi Data Tahap ini merupakan langkah penting pada penggalian data karena akan mempengaruhi kualitas pengetahuan yang dihasilkan dari keseluruhan tahap penggalian data. Pada tahap ini dilakukan pra-pemrosesan data yang bertujuan memilih data yang relevan dan membentuk

  I - 82 SENTRA format atribut-relasi dan disimpan dalam file yang bertipe .arff.

  b.

  Penggalian Pola Pada tahap ini, data yang telah ditransformasikan dianalisis menggunakan algoritma Apriori oleh perangkat lunak WEKA. Tujuannya adalah menemukan aturan-aturan asosiasi dari data.

  Ada beberapa parameter yang dimasukkan dalam proses ini antara lain nilai minimum support yang merupakan batas bawah nilai support yang diinginkan dan minimum confidence yang merupakan nilai confidence yang diinginkan.

  c.

  Evaluasi Pola Pada tahap ini, aturan-aturan yang ditemukan diuji untuk mengetahui aturan terbaik yang diperoleh dari data. Variabel-variabel uji yang akan digunakan adalah nilai support dan

  confidence . Tujuannya adalah menemukan aturan terbaik yang memiliki nilai support dan confidence tertinggi. Aturan yang ditemukan selanjutnya diinterpretasi untuk menerjemahkan

  pengetahuan yang diperoleh dari data.

Hasil Penelitian dan Pembahasan

  

Data yang digunakan adalah data kunjungan wisatawan di Taman Rekreasi Sengkaling. Data

diperoleh dari hasil penyebaran kuisioner yang diisi oleh para wisatawan. Gambar 1

menunjukkan denah wahana-wahana di Taman Wisata Sengkaling.Data diperoleh dari 100

pengunjung. Selanjutnya hasil dilakukan proses sebagai berikut :

  

Gambar 1 Denah Lokasi Wahana Taman Wisata Sengkaling

  i. Pra-pemrosesan Data Proses ini bertujuan untuk mempersiapkan data mentah sebelum diolah menggunakan WEKA.

  Proses yang diterapkan adalah transformasi data yang tujuannya adalah dalam rangka menyesuaikan hasil kuisioner dengan format masukan proses Apriori di WEKA. Format yang dimaksud adalah dalam file .arff. Format tersebut mengharuskan adanya deklarasi variabel atau atribut dan nilai tiap atribut secara berurutan. Jumlah variabel yang digunakan sama

  I - 83 yang telah ditentukan sebelumnya. Nilai tiap atribut bertipe Boolean yaitu true atau false dimana nilai true diberikan jika responden mengunjungi wahana tersebut dan false jika sebaliknya. Data mentah diubah mengikuti aturan file .arff. ii. Analisis dengan WEKA Explorer

  Analisis menggunakan aplikasi WEKA ditunjukkan pada Gambar 2. Salah satu tujuan penerapan Algoritma Apriori adalah menemukan aturan terbaik yaitu yang memiliki nilai minimal dan confidence minimal tertinggi. Berdasarkan hasil uji coba, ditemukan 2

  support

  aturan terbaik dengan min_sup = 0.3 dan min_conf = 0.9. Aturan pertama yang ditemukan adalah “KKC=t 34 ==> KKA=t 33 conf:(0.97)”. Nilai 34 dan 33, serta 0.97 pada aturan tersebut menyatakan nilai support untuk KKC dan KKA, serta nilai confidence-nya. KKC adalah kode untuk wahana Kiddy Car sedangkan KKA menyatakan wahana Kincir Angin. Aturan ini menunjukkan bahwa pengunjung yang singgah ke wahana Kiddy Car berpotensi untuk melanjutkan ke wahana Kincir Angin. Aturan terbaik kedua adalah “KKT=t 34 ==>

  KKA=t 33

  Aturan kedua ini menyatakan bahwa kunjungan ke wahana Kiddy Train cenderung diikuti oleh kunjungan ke wahana Kincir Angin. Untuk nilai support yang lebih kecil (dengan nilai confidence yang sama) diperoleh lebih banyak aturan dari data. Untuk nilai support = 0.25 dan nilai confidence = 0.9 diperoleh selain kedua aturan yang telah disebutkan sebelumnya, ditemukan aturan ketiga yaitu “KKC=t

  KKT=t 26 ==> KKA=t 26

  Aturan ini menjelaskan kaitan antara kunjungan ke wahana Kiddy Car, Kiddy Train, dan Kincir Angin. Ketiga wahana ini ada di dalam cakupan kedua aturan terkuat sebelumnya (support = 0.3 dan confidence = 0.9).

  

Gambar 2 Implementasi Algoritma Apriori di WEKA

Kesimpulan

  Pada penelitian ini, Algoritma Apriori digunakan untuk memperoleh pengetahuan berupa aturan asosiasi dari data kunjungan wisatawan di Taman Wisata Sengkaling. Analisis dilakukan menggunakan aplikasi WEKA. Berdasarkan hasil uji coba, dari 100 data yang dianalisis dapat disimpulkan bahwa aturan terbaik yang dapat digali dari data memiliki nilai support = 0.3 dan nilai

  

confidence = 0.97. Terdapat 2 aturan yang memenuhi nilai-nilai tersebut yaitu (1) Kunjungan ke

  wahana Kiddy Car cenderung diikuti oleh kunjungan ke wahana Kincir Angin dan (2) Kunjungan ke wahana Kiddy Train cenderung diikuti oleh kunjungan ke wahana Kincir Angin. Selain kedua aturan di atas, jika nilai support diturunkan maka diperoleh aturan ketiga yang menunjukkan relasi antara wahana Kiddy Car, Kiddy Train, dan Kincir Angin. Untuk penelitian selanjutnya, dapat dibuat sebuah

  I - 84 SENTRA sistem yang dapat mencatat data kunjungan wisatawan di tiap wahana sekaligus melakukan penggalian aturan asosiasi secara otomatis.

Referensi

  [1] Gunadi, G. dan Sensuse, D.I. 2012. Penerapan Metode Data Mining Market Basket

  Analysis terhadap Data Penjualan Produk Buku dengan menggunakan Algoritma Apriori dan Frequent Pattern Growth (FP-Growth) : Studi Kasus Percetakan PT Gramedia. Jurnal Telematika MKOM, Vol. 4, No. 1, Maret 2012.

  [2] Juwattanasamran, P., Supattranuwong, S., dan Sinthupinyo, S. 2013. Applying Data

  Mining to Analyze Travel Pattern in Searching Travel Pattern Destination Choices. The International Journal of Engineering and Sciences, Vol. 2, Issue 4, pages 38-44.

  [3]

  Kumar, Varun, and Anupama Chadha. 2012. "Mining association rules in student’s assessment data." International Journal of Computer Science Issues 9.5 (2012): 211-216.

  [4] Lee, Ickjai, Guochen Cai, and Kyungmi Lee. 2013. "Mining points-of-interest

  association rules from geo-tagged photos." System Sciences (HICSS), 2013 46th Hawaii International Conference on. IEEE.

  [5] Luthfi, E.T. 2009. Penerapan Data Mining Algoritma Asosiasi untuk Meningkatkan Penjualan. Jurnal DASI, vol. 10, no. 1, 1 Maret 2009. [6] Saraee, Mohamad, Shafiullah Khan, and Sertan Yamaner. 2005. "Data mining approach

  to implement a recommendation system for electronic tour guides." Proceedings of The 2005 International Conference on E-Business, Enterprise Information Systems, E- Government, and Outsourcing, EEE 2005, Las Vegas, Nevada, USA, June 20-23, 2005. CSREA Press.

  [7] WEKA. 2014. Diakses secara online di pada tanggal 23 Desember 2014.

  I - 85