Pariwisata Data Mining Implementasi Metode Association Rule Pada Aplikasi Pariwisata Bangka Belitung Di Platform Anroid

1. Data Selection Dalam penelitian ini dilakukan tahapan selection, dengan memisahkan atribut tempat wisata dan aktivitas. 1. Data Cleaning Proses menghilangkan noise atau data yang tidak konsisten, dalam penelitian ini dilakukan proses data cleaning untuk menghilangkan data yang satu transaksinya hanya memiliki satu item atau tidak memiliki keterkaitan dengan item lainnya. 2. Data mining Pada proses ini, peneliti mencari pola atau informasi menarik dari data yang telah tersedia menggunakan teknik ataupun metode yang digunakan. Dalam penelitian ini metode yang digunakan adalah association rule dan menggunakan algoritma apriori. 3. InterpretationEvaluation Pola informasi yang dihasilkan harus mudah dimengerti dan diperiksa apakah bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

II.4 Association Rule

Association rule merupakan suatu prosedur untuk mencari hubungan antar- item dalam suatu dataset [3]. Association rule aturan asosiasi akan menemukan pola tertentu untuk mengasosiasikan data yang satu dengan data yang lain. Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah semua pola frequent itemset ditemukan, barulah mencari aturan assosiatif atau aturan keterkaitan yang memenuhi syarat yang telah ditentukan [3]. Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki boolean variabel yang akan menunjukkan keberadaannya atau tidak barang tersebut dalam satu transaksi atau satu keranjang belanja. Pola boolean yang didapat digunakan untuk menganalisa barang yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule. Sebagai contoh konsumen biasanya akan membeli komputer dan software antivirus pada saat yang sama yang ditujukkan sebagai berikut [3]: Komputer  software antivirus [support = 2, confidence = 60 ] Association rule diperlukan suatu variabel ukuran yang ditentukan sendiri oleh user untuk menentukan batasan sejauh mana atau sebanyak apa output yang diinginkan user. Support dan confidence adalah sebuah ukuran kepercayaan dan kegunaan suatu pola yang telah ditemukan. Nilai support 2 menunjukkan bahwa keseluruhan dari total transaksi konsumen membeli komputer dan software antivirus secara bersamaan yaitu sebanyak 2. Sedangkan confidence 60 yaitu menunjukkan bila konsumen membeli komputer dan pasti membeli software antivirus sebesar 60 [3].

II.5 Algoritma Apriori

Algoritma apriori adalah salah satu algoritma yang melakukan pencarian frequent itemset dengan menggunakan teknik association rule. Algortima apriori menggunakan pengetahuan frekuensi atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya. Pada algoritma apriori, menentukan kandidat yang mungkin muncul dengan cara memperhatikan minimum support dan minimum confidence. Support adalah nilai pengunjung atau persentase kombinasi sebuah item dalam database [3]. Nilai support sebuah item diperoleh dengan rumus sebagai berikut: [3] � � = A ∩ B = ∑J a T a a ya M a a ∑T a T a a ∗ 2.1 Sedangkan confidence adalah nilai kepastian yaitu kuatnya hubungan antar item dalam sebuah apriori. Confidence dapat dicari setelah pola frekuensi munculnya sebuah item ditemukan. Rumus untuk menghitung confidence adalah sebagai berikut [3]: � � = ∑J a a a ya a a ∑T a a ya a ∗ 2.2