32
B,E
terdapat pada L2 atau tidak. Karena
C,E
ada dalam L2, maka
B,C,E
menjadi kandidat 3 -itemset. Karena tidak ada kandidat 4 -itemset, maka algoritme ini berakhir.
c. Membuat Association Rule berdasarkan Frequent Itemset
Tahap kedua dalam penelusuran assosiation rule didasarkan pada seluruh i- itemset yang sering muncul, yang didapat dari tahap pertama. Untuk rule yang
mengandung
X1, X2, X3
→ X4, rule tersebut dianggap bermakna jika kedua
itemset tersebut
X1, X2, X3, X4
dan
X1, X2, X3
adalah frequent. Sehingga tingkat kepercayaan C dari rule tersebut dihitung sebagai hasil bagi dari support
itemset, yaitu : C = SX1, X2, X3, X4 SX1, X2, X3.
Strong association rule adalah rule dengan tingkat kepercayaan C diatas S
min
. Misalkan dari tabel 1 akan dicek apakah association rule B,C
→ E adalah strong
rule. Pertama harus dipilih hubungan support dari tabel L2 dan L3.
SB,C = 2, SB,C,E = 2 CB,C
→ E = SB,C,ESB,C = 22 = 1 100
Karena tingkat kepercayaan adalah maksimal, maka jika transaksi berisi item B dan C maka transaksi tersebut juga berisi item E.
d. Classification-Based Association
Saat ini, salah satu teknik data mining telah dikembangkan adalah dengan menerapkan konsep association rule mining dalam masalah klasifikasi. Ada
beberapa metode yang bisa digunakan, antara lain association rule clustering
system ARCS dan associative classification Han Kamber, 2001. Metode
ARCS melakukan association rule mining didasarkan pada clustering kemudian menggunakan aturan yang dihasilkan untuk klasifikasi. ARCS, melakukan
association rule mining dalam bentuk A
quant1
∧ A
quant2
⇒ A
cat
, dimana bentuk A
quant1
dan A
quant2
adalah data test yang atributnya punya rentang nilai, A
cat
menunjukkan label kelas untuk atribut kategori yang diberikan dari training data . Metode associative classification mining menghasilkan aturan dalam bentuk
condset ⇒
y, dimana condset adalah sekumpulan item dan y adalah label kelas.
33 Aturan yang sesuai dengan minimum support tertentu disebut frequent. Rule
mempunyai support s jika s dari sample dalam data set yang mengandung condset dan memiliki kelas y. Aturan yang sesuai dengan minimum confidence
disebut accurate. Aturan mempunyai confidence c jika c dari sample dalam data set yang mengandung condset memiliki kelas y. Jika beberapa rule mempunyai
condset yang sama, maka rule dengan confidence tertinggi d ipilih sebagai possible rule PR. Metode associative classification mining menggunakan
algoritme association rule, seperti algoritme Appriori untuk menghasilkan association rule, kemudian memilih sekelompok aturan yang mempunyai kualitas
tinggi dan menggunakan aturan tersebut untuk memprediksi data. Associative classification masih kurang efisien karena seringkali menghasilkan aturan dalam
jumlah yang besar Yin Han, 2003. Metode
classification -based association lainnya adalah CPAR Classification based on Predictive Association Rule. Algoritme ini mengambil
ide dari FOIL First Order Inductive Leaner dalam menghasilkan aturan dan mengintegrasikannya dengan associative classification.
e. Classification based on Predictive Association Rules CPAR