State of the Art

BAB II TINJAUAN PUSTAKA

Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam melakukan penelitian data mining dengan metode asosiasi menggunakan algoritma apriori yang terdiri dari state of the art , pengertian data mining , aplikasi data mining , tahapan data mining , metode asosiasi serta teori tentang algoritma apriori .

2.1 State of the Art

Penelitian ini didasarkan atas penelitian sebelumnya yang berhubungan dengan pengembangan data mining dengan metode asosiasi menggunakan algoritma apriori . Penelitian yang dilakukan R . Agrawal , et al pada tahun 1993 yang berjudul “Mining Association Rules Between Sets of Items in Large Databases” adalah awal mula dikembangkannya data mining dengan metode asosiasi menggunakan algoritma apriori . Pada tahun 1994 , R . Agrawal dan R . Srikant kembali melakukan penelitian mengenai metode asosiasi dengan judul “Fast Algorithms for Mining Association Rules ” . Penelitian ini kemudian difokuskan untuk menyempurnakan algoritma apriori yang sudah dikembangkan sebelumnya dan dari situlah algoritma apriori dikenal sebagai salah satu algoritma untuk metode asosiasi . Penelitian tentang metode apriori terus berkembang . Para peneliti terus mencoba untuk melakukan optimasi terhadap 12 metode apriori agar mendapatkan kinerja yang lebih cepat dan menemukan aturan asosiasi terbaik . Jogi Suresh dan T . Ramanjaneyulu 2013 melakukan penelitian dengan judul “Mining Frequent Itemsets Using Apriori Algorithm” . Penelitian Suresh dan Ramanjaneyulu menggunakan algoritma apriori klasik yang sudah dikembangkan sebelumnya dan belum menggunakan teknik optimasi untuk memperoleh aturan asosiasi yang lebih efisien . Sheila A . Abaya pada tahun 2012 dalam penelitiannya yang berjudul “Association Rule Mining based on Apriori Algorithm in Minimizing Candidate Generation ” melakukan improvisasi terhadap algoritma apriori . Improvisasi dilakukan dengan cara menentukan “set size” dan “set size frequency” . Set size adalah jumlah item per transaksi sedangkan set size frequency adalah jumlah transaksi yang setidaknya memiliki “set size” item . Set size dan set size frequency ini digunakan untuk mengeliminasi kandidat kunci yang tidak signifikan . Jiao Yabing 2013 dalam penelitiannya dengan judul “Research of an Improved Apriori Algorithm in Data mining Association Rules ” melakukan optimasi terhadap algoritma apriori yaitu dengan cara mengurangi atau memangkas pruning jumlah calon kandidat frequent itemset pada kandidat itemset Ck . Jaishree Singh , et al pada tahun 2013 melakukan penelitian dengan judul “Improving Efficiency of Apriori Algorithm Using Transaction Reduction” . Penelitian Singh , dkk ini melakukan improvisasi algoritma apriori dengan cara mengurangi jumlah transaksi transaction reduction yang jumlah item pertransaksinya tidak memenuhi nilai batas yang ditentukan . Pengurangan transaksi tersebut berdampak pada efisiensi waktu yang lebih cepat saat scanning database . Tabel 2 . 1 Penelitian yang Sudah Dilakukan Sebelumnya No Peneliti Judul Penelitian Metode 1 R . Agrawal , et al 1993 Mining Association Rules between Sets of Items in Large Databases Menemukan frequent itemset dengan metode asosiasi . Awal mula algoritma apriori 2 R . Agrawal R . Srikant 1994 Fast Algorithm for Mining Association Rules Menyempurnakan algoritma apriori sebelumnya 3 Sheila A . Abaya 2012 Association Rule Mining based on Apriori Algorithm in Minimizing Candidate Generation Modifikasi algoritma apriori dengan mereduksi kandidat kunci dengan nilai set size dan set size frequency 4 Jiao Yabing 2013 Research of an Improved Apriori Algorithm in Data mining Association Rules Modifikasi dengan cara memangkas pruning jumlah calon kandidat frequent itemset pada kandidat itemset Ck 5 Jaishree Singh , et al 2013 Improving Efficiency of Apriori Algorithm Using Transaction Reduction Modifikasi algoritma apriori dengan cara mengurangi jumlah transaksi yang jumlah item pertransaksinya tidak memenuhi nilai batas yang ditentukan 6 Jogi Suresh dan T . Ramanjaneyulu 2013 Mining Frequent itemsets Using Apriori Algorithm Menggunakan algoritma apriori klasik yang sudah dikembangkan sebelumnya dan belum menggunakan teknik optimasi Inti dari semua penelitan-penelitian terdahulu mengenai optimasi terhadap algoritma apriori yang tercantum dalam tabel diatas adalah membatasi calon kandidat frequent itemset yang dimunculkan . Pembatasan tersebut dilakukan dengan cara memangkas item, kombinasi dan transaksi serta pembatasan iterasi yang tidak diinginkan sehingga tidak terjadi perulangan scanning database yang berlebihan, dengan begitu akan menghasilkan aturan asosiasi secara tepat dan dalam waktu yang lebih cepat .

2.2 Pengertian Data mining