14
2.1.6 Algoritma Apriori
Algoritma Apriori merupakan algoritma untuk menemukan frequent itemset. Algoritma Apriori merupakan algoritma yang paling banyak digunakan untuk
menemukan frequent itemset dan aturan asosiasi. Konsep utama dari algoritma Apriori adalah sebagai berikut:
1. Setiap subset dari frequent itemset adalah frequent itemset. 2. Himpunan itemset dengan panjang k disebut Ck
3. Himpunan itemset yang memenuhi batasan minimum support disebut sebagai Lk , Lk adalah kandidat himpunan yang digunakan untuk tahap selanjutnya.
4. Ck+1 dibangkitkan dengan menggabungkan Lk dan dirinya sendiri. Itemset-itemset yang memenuhi kriteria masing-masing memiliki lebih satu elemen dari itemset
sebelumnya. Lk kemudian dihasilkan dengan menghilangkan dari elemen-elemen yang tidak
memenuhi aturan minimum support. Sebab, kandidat sequence yang dibangkitkan dimulai dengan ukuran sequence terkecil dan secara bertahap ukuran sequence
meningkat yang disebut dengan pendekatan breadth first search.R.Kartika,2013
2.1.7 Pendekatan Association Rule Algoritma CBA Classification Based
Assoiciation
Algoritma CBA merupakan algoritma pengklasifikasi yang sedikit lebih akurat dan efektif berdasarkan pendekatan assosiatif. Konsep utama dari algoritma CBA
terbagi dalam dua tahap.
2.1.5.1 Algoritma CBA-RGRule Generator
CBA-RG atau yang bisa disebut dengan sebuah rule generator dibangun berdasarkan algoritma Apriori untuk menemukan rules asosiasi. CBA-RG
digunakan untuk menemukan semua ruleitems yang memenuhi minsup. condset ,y adalah sebuah ruleitems , dimana condset adalah set dari items, y
Y adalah
15
label kelas. CondsupCount adalah jumlah case di dataset D support count yang mengandung condset. RulesupCount adalah jumlah case di D support count yang
mengandung condset dan berlabel kelas y. Setiap ruleitems merepresentasikan
sebuah rule condset → y, dimana =
� | |
× ...................................................................... 2.2
� =
�
× ...............................................................2.3
Dimana | | adalah jumlah ukuran dataset. Ruleitem yang memiliki nilai support
lebih dari nilai minsup disebut frequent ruleitems, sedangkan yang nilai supportnya lebih kecil disebut infrequent itemsets. Ruleitem yang confident tertinggi dipilih
sebagai possible rule yang merepresentasikan set dari ruleitem. Kalau ada lebih dari 1 ruleitem yang punya confident tertinggi, maka dipilih secara acak.
Tahapan Algoritma CBA-RG Classification Based on Association-Rule Generator Rizky Kartika Putri,2013:
1. Tentukan minimum support dan minimum confidence .
2. Rule dibentuk dengan langkah awal mencari semua condset sekumpulan item
set dari semua kriteria dan jumlah masing-masing condset yang disebut sebagai CondSupCount.
3. Lalu dicari ruleitem pertama dari condset dengan class beserta jumlah rule
tersebut yang bisa disebut sebagai RulesupCount. 4.
Lalu dicari support dari ruleitem, dengan menggunakan rumus berikut : =
� | |
× | |= jumlahukuran dataset.
� = ruleitem pertama dari condset dengan class beserta jumlah
rule.
16
Ruleitem yang mempunyai support diatas minimum support merupakan frequent ruleitem.
5. Selanjutnya dicari juga confidence dari setiap ruleitem, dengan menggunakan
rumus berikut : �
=
�
× Ruleitem yang mempunyai confidence melebihi minimum confidence disebut
accurate ruleitem. Ruleitem yang frequent dan accurate merupakan possible rule.
6. Possible rule ini merupakan CARs sekaligus digunakan untuk menggenerate
frequent ruleitem yang lainnya dengan cara mengkombinasikan frequent ruleitem dengan frequent ruleitem dalam possible rule dengan syarat frequent
ruleitem tidak boleh berpasangan dengan dirinya sendiri. 7.
Selanjutnya dicari RulesupCount dan CondsupCount dari ruleitem yang baru. 8.
Kemudian dihitung supportnya, ruleitem yang supportnya melebihi minsup merupakan frequent ruleitem dan dihitung juga confidencenya, ruleitem yang
memiliki nilai confidence lebih tinggi dari mincof merupakan accurate rulitem. Jika ruleitem memenuhi frequent dan accurate ruleitem , maka itulah possible
rule. 9.
Possible rule kali ini harus memenuhi syarat selanjutnya, yaitu semua frequent ruleitem pada possible rule merupakan frequent ruleitem pada possible rule
sebelumnya. 10.
Pada tahap kombinasi selanjutnya ,frequent ruleitem - frequent ruleitem yang dapat dikombinasikan adalah Frequent ruleitem - frequent ruleitem yang
memiliki kesamaan dalam k-1 frequent ruleitem pertama. 11.
Digunakan cara yang sama untuk menggenerate possible rule berikutnya.
17
2.1.5.2 Algoritma CBA-CBClassifier Builder