BAB II TINJAUAN PUSTAKA
Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam melakukan penelitian data mining dengan metode asosiasi menggunakan algoritma
apriori yang terdiri dari state of the art
,
pengertian data mining
,
aplikasi data mining
,
tahapan data mining
,
metode asosiasi serta teori tentang algoritma apriori
.
2.1 State of the Art
Penelitian ini didasarkan atas penelitian sebelumnya yang berhubungan dengan pengembangan data mining dengan metode asosiasi menggunakan algoritma
apriori
.
Penelitian yang dilakukan R
.
Agrawal
,
et al pada tahun 1993 yang berjudul “Mining Association Rules Between Sets of Items in Large Databases” adalah awal
mula dikembangkannya data mining dengan metode asosiasi menggunakan algoritma apriori
.
Pada tahun 1994
,
R
.
Agrawal dan R
.
Srikant kembali melakukan penelitian mengenai metode asosiasi dengan judul “Fast Algorithms for Mining Association
Rules ”
.
Penelitian ini kemudian difokuskan untuk menyempurnakan algoritma apriori yang sudah dikembangkan sebelumnya dan dari situlah algoritma apriori dikenal
sebagai salah satu algoritma untuk metode asosiasi
.
Penelitian tentang metode apriori terus berkembang
.
Para peneliti terus mencoba untuk melakukan optimasi terhadap
12
metode apriori agar mendapatkan kinerja yang lebih cepat dan menemukan aturan asosiasi terbaik
.
Jogi Suresh dan T
.
Ramanjaneyulu 2013 melakukan penelitian dengan judul “Mining Frequent Itemsets Using Apriori Algorithm”
.
Penelitian Suresh dan Ramanjaneyulu menggunakan algoritma apriori klasik yang sudah dikembangkan
sebelumnya dan belum menggunakan teknik optimasi untuk memperoleh aturan asosiasi yang lebih efisien
.
Sheila A
.
Abaya pada tahun 2012 dalam penelitiannya yang berjudul “Association Rule Mining based on Apriori Algorithm in Minimizing Candidate
Generation ” melakukan improvisasi terhadap algoritma apriori
.
Improvisasi dilakukan dengan cara menentukan “set size” dan “set size frequency”
.
Set size adalah jumlah item per transaksi sedangkan set size frequency adalah jumlah transaksi yang
setidaknya memiliki “set size” item
.
Set size dan set size frequency ini digunakan untuk mengeliminasi kandidat kunci yang tidak signifikan
.
Jiao Yabing 2013 dalam penelitiannya dengan judul “Research of an
Improved Apriori Algorithm in Data mining Association Rules ” melakukan optimasi
terhadap algoritma apriori yaitu dengan cara mengurangi atau memangkas pruning jumlah calon kandidat frequent itemset pada kandidat itemset Ck
.
Jaishree Singh
,
et al pada tahun 2013 melakukan penelitian dengan judul “Improving Efficiency of Apriori Algorithm Using Transaction Reduction”
.
Penelitian Singh
,
dkk ini melakukan improvisasi algoritma apriori dengan cara mengurangi jumlah transaksi transaction reduction yang jumlah item
pertransaksinya tidak memenuhi nilai batas yang ditentukan
.
Pengurangan transaksi tersebut berdampak pada efisiensi waktu yang lebih cepat saat scanning database
.
Tabel 2
.
1 Penelitian yang Sudah Dilakukan Sebelumnya
No Peneliti
Judul Penelitian Metode
1 R
.
Agrawal
,
et al 1993
Mining Association Rules between Sets of
Items in Large Databases
Menemukan frequent itemset dengan metode asosiasi
.
Awal mula algoritma apriori
2 R
.
Agrawal R
.
Srikant 1994 Fast Algorithm for
Mining Association Rules
Menyempurnakan algoritma apriori sebelumnya
3 Sheila A
.
Abaya 2012
Association Rule Mining based on
Apriori Algorithm in Minimizing
Candidate Generation
Modifikasi algoritma apriori dengan mereduksi kandidat kunci
dengan nilai set size dan set size frequency
4 Jiao Yabing
2013 Research of an
Improved Apriori Algorithm in Data
mining Association Rules
Modifikasi dengan cara memangkas pruning jumlah
calon kandidat frequent itemset pada kandidat itemset Ck
5 Jaishree Singh
,
et al 2013
Improving Efficiency of Apriori Algorithm
Using Transaction Reduction
Modifikasi algoritma apriori dengan cara mengurangi jumlah
transaksi yang jumlah item pertransaksinya tidak memenuhi
nilai batas yang ditentukan
6 Jogi Suresh dan T
.
Ramanjaneyulu 2013
Mining Frequent itemsets Using
Apriori Algorithm Menggunakan algoritma apriori
klasik yang sudah dikembangkan sebelumnya dan belum
menggunakan teknik optimasi
Inti dari semua penelitan-penelitian terdahulu mengenai optimasi terhadap algoritma apriori yang tercantum dalam tabel diatas adalah membatasi calon kandidat
frequent itemset yang dimunculkan
.
Pembatasan tersebut dilakukan dengan cara memangkas item, kombinasi dan transaksi serta pembatasan iterasi yang tidak
diinginkan sehingga tidak terjadi perulangan scanning database yang berlebihan, dengan begitu akan menghasilkan aturan asosiasi secara tepat dan dalam waktu yang
lebih cepat
.
2.2 Pengertian Data mining