1. Data Selection
Dalam penelitian ini dilakukan tahapan selection, dengan memisahkan atribut tempat wisata dan aktivitas.
1. Data Cleaning
Proses menghilangkan noise atau data yang tidak konsisten, dalam penelitian ini dilakukan proses data cleaning untuk menghilangkan data yang satu
transaksinya hanya memiliki satu item atau tidak memiliki keterkaitan dengan item lainnya.
2. Data mining
Pada proses ini, peneliti mencari pola atau informasi menarik dari data yang telah tersedia menggunakan teknik ataupun metode yang digunakan. Dalam
penelitian ini metode yang digunakan adalah association rule dan menggunakan algoritma apriori.
3. InterpretationEvaluation
Pola informasi yang dihasilkan harus mudah dimengerti dan diperiksa apakah bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
II.4 Association Rule
Association rule merupakan suatu prosedur untuk mencari hubungan antar-
item dalam suatu dataset [3]. Association rule aturan asosiasi akan menemukan
pola tertentu untuk mengasosiasikan data yang satu dengan data yang lain. Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang harus
dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah semua pola
frequent itemset ditemukan, barulah mencari aturan assosiatif atau aturan
keterkaitan yang memenuhi syarat yang telah ditentukan [3].
Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki boolean variabel yang akan menunjukkan
keberadaannya atau tidak barang tersebut dalam satu transaksi atau satu keranjang belanja. Pola boolean yang didapat digunakan untuk menganalisa barang yang
dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule.
Sebagai contoh konsumen biasanya akan membeli komputer dan software antivirus
pada saat yang sama yang ditujukkan sebagai berikut [3]:
Komputer software antivirus [support = 2, confidence = 60 ]
Association rule diperlukan suatu variabel ukuran yang ditentukan sendiri oleh user untuk menentukan batasan sejauh mana atau sebanyak apa output yang diinginkan
user. Support dan confidence adalah sebuah ukuran kepercayaan dan kegunaan suatu pola yang telah ditemukan. Nilai support 2 menunjukkan bahwa keseluruhan
dari total transaksi konsumen membeli komputer dan software antivirus secara bersamaan yaitu sebanyak 2. Sedangkan confidence 60 yaitu menunjukkan bila
konsumen membeli komputer dan pasti membeli software antivirus sebesar 60
[3].
II.5 Algoritma Apriori
Algoritma apriori adalah salah satu algoritma yang melakukan pencarian frequent itemset dengan menggunakan teknik association rule. Algortima apriori
menggunakan pengetahuan frekuensi atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya. Pada algoritma apriori, menentukan
kandidat yang mungkin muncul dengan cara memperhatikan minimum support dan minimum confidence. Support adalah nilai pengunjung atau persentase kombinasi
sebuah item dalam database [3]. Nilai support sebuah item diperoleh dengan rumus sebagai berikut: [3]
� � = A ∩ B =
∑J a T a a
ya M a
a ∑T a T a a
∗ 2.1
Sedangkan confidence adalah nilai kepastian yaitu kuatnya hubungan antar item dalam sebuah apriori. Confidence dapat dicari setelah pola frekuensi
munculnya sebuah item ditemukan. Rumus untuk menghitung confidence adalah
sebagai berikut [3]:
� �
=
∑J a a a
ya a
a ∑T a a
ya a
∗ 2.2