Algoritma Apriori Tinjauan Literatur dan Metode 1. Mining Association R ule

2.2. Algoritma Apriori

Persoalan association rule mining terdiri dari dua sub persoalan : a. Menemukan semua kombinasi dari item, disebut dengan frequent itemsets,yang memiliki support yang lebih besar daripada minimum support. b. Gunakan frequent itemsets untuk men-generate aturan yang dikehendaki.Semisal, ABCD dan AB adalah frequent, maka didapatkan aturan AB - CD jika rasio dari supportABCD terhadap supportAB sedikitnya sama dengan minimum confidence. Aturan ini memiliki minimum support karena ABCD adalah frequent. Algoritma Apriori yang bertujuan untuk menemukan frequent itemsets dijalankan pada sekumpulan data. Pada iterasi ke -k, akan ditemukan semua itemsets yang memiliki k items, disebut dengan k - itemsets. Tiap iterasi berisi dua tahap. Misal Oracle Data Mining Fk merepresentasikan himpunan dari frequent k -itemsets, dan Ck adalah himpunan candidate k-itemsets yang potensial untuk menjadi frequent itemsets. Tahap pertama adalah men-generate kandidat, dimana himpunan dari semua frequent k- 1 itemsets, Fk-1, ditemukan dalam iterasi ke-k-1, digunakan untuk men-generate candidate itemsets Ck. Prosedur generate candidate memastikan bahwa Ck adalah superset dari himpunan semua frequent k-itemsets. Struktur data hash-tree digunakan untuk menyimpan Ck. Kemudian data di-scan dalam tahap penghitungan support. Untuk setiap transaksi, candidates dalam Ck diisikan ke dalam transaksi, ditentukan dengan menggunakan struktur data hash-tree hashtree dan nilai penghitungan support dinaikkan. Pada akhir dari tahap kedua, nilai Ck diuji untuk menentukan yang mana dari candidates yang merupakan frequent. Kondisi penghitung terminate condition dari algoritma ini dicapai pada saat Fk atau Ck+1 kosong. I lustrasi Algoritma Apriori Gambar 1. Ilustrasi Algoritma Apriori Dari ilustrasi di atas dapat dijelaskan bahwa: a. Untuk menghasilkan L k , maka diperlukan candidate k -itemset C k yang dibentuk dari proses join antar L k-1 b. Catatan konvensi: Apriori mengasumsikan bahwa item dalam transaksi atau itemset telah terurut berdasarkan urutan lexicographic. c. Proses join, L k-1 × L k-1 , dilakukan jika k -2 itemset dari L k-1 “sama”. d. Misal l l dan l l adalah itemset dari L k- 1 , supaya proses join dapat dilakukan maka harus dipenuhi: l 1 [1] = l 2 [1] l 1 [2] = l 2 [2] … l 1 [k- 2 ] = l 2 [k- 2 ] l 1 [k- 1 ] l 2 [k- 1 ] e. Kondisi l 1 [k- 1 ] l 2 [k- 1 ] menjamin tidak ada kembar pada proses join. Jadi itemset yang dihasilkan dari proses join antara I 1 dan I 2 adalah l 1 [1] l 1 [2] ... l 1 [k- 1 ] I 2 [k- 2 ] f. Notasi l 1 [j] menyatakan item yang ke-j dalam l. 3. Tahapan Mining Association R ule 3.1.