Pengembangan Algortima Apriori Untuk Pengambilan Keputusan

BAB 1
PENDAHULUAN

1.1. Latar Belakang
Algoritma Apriori termasuk jenis aturan assosiasi pada data mining atau market
basket analysis,Tanna & Ghodasara(2014). Algoritma apriori salah satu algoritma
data mining berfungsi sebagai untuk menemukan pola frekuensi tinggi. Pola prekuensi
tinggi adalah item yang sering muncul pada database dan memiliki frekuensi support
diatas ambang tertentu yang disebut dengan istilah minimum support, Tanna &
Ghodasara (2014). Pola frekuensi tinggi ini digunakan untuk menyusun aturan
assosiasi dan juga beberapa teknik data mining lainnya, Tanna & Ghodasara (2014).
Dari teknik pengerjaannya algoritma apriori dibagi menjadi beberapa tahap yang
disebut iterasi. Tiap iterasi menghasilkan pola frekuensi tinggi dengan panjang yang
sama dimulai dari iterasi pertama yang menghasilkan pola frekuensi tinggi dengan
panjang satu. Di iterasi pertama ini support dari setiap item dihitung dengan membaca
database.Setelah support dipilih sebagai pola frekuensi tinggi dengan panjang 1 atau
sering disebut 1-item set. Singkatan k-itemset berarti satu set yang dari k item, Heena
et al(2014).
Untuk asosiasi rule mining merupakan prosedur untuk mencari hubungan
antar item dalam suatu data set yang ditentukan meliputi : mencari kombinasi yang
sering terjadi dari suatu item set dan mendefenisikan condition dan result (untuk

conditional assosiation rule), Tanna

& Ghodasara (2014). Dalam menentukan

association rule terdapat suatu interesttingness (ukuran kepercayaan) dari hasil
pengolahan data tertentu. Terdapat dua ukuran: support yakni menunjukkan berapa
besar tingkat dominasi dari suatu item/itemset dalam suatu transaksi, sedangakan
confidence menunjukkan hubungan antara dua item secara conditional( mis: seberapa
sering item B dibeli bersamaan jika orang membeli item A , Abdullah (2011).
Iterasi kedua menghasilkan 2-itemset yang tiap set-nya memiliki dua item. Pertama
dibuat kandidat 2-itemset dari kombinasi semua 1-itemset. Lalu untuk tiap kandidat 2itemset ini dihitung support-nya dengan membaca database. Support disini

artinya jumlah transaksi dalam database yang mengandung kedua item dalam
kandidat 2-itemset, Heena et al (2014). Setelah support dari semua kandidat 2-itemset
didapatkan, kandidat 2-itemset yang memenuhi syarat minimum support dapat
ditetapkan sebagai 2-itemset yang juga merupakan pola frekuensi tinggi dengan
panjang 2,Heena et al (2014).
Dari

konsep algoritma apriori melakukan proses frequent itemset untuk


menemukan aturan asosiasi antara suatu kombinasi item/itemset, Abdullah (2011).
Analisis pola frekuensi tinggi dan pembentukan aturan asosiasi yang memenuhi syarat
minimum

confidence. penyelesaian masalah pada proses akstraksi informasi dari

sebuah database atau data mining dengan melakukan generasi iterasi frequent itemset
dalam jenis aturan asosiasi rule mining (association rule mining) sehingga
menghasilkan nilai support dan confidence. Untuk menghasilkan nilai support dan
confidence harus melakukan membaca database secara berulang dan menghasilkan
frequent itemset cukup banyak begitu juga dengan candidate generation, Heena et al
(2014).
Untuk database yang cukup besar proses pencairan asosiasi rule mining pada
algoritma apriori membutuhkan waktu cukup lama, disebabkan semakin besar
database maka semakin banyak frequent yang dihasilkan dan candidate generation,
dapat dilihat pada gambar 1.1. Sehingga algoritma apriori ini perlu ada metode yang
baru dalam mengatasi banyak frequent item/itemset .

Gambar 1.1 Proses iterasi asosiasi rule pada algoritma apriori

Sumber: Heena (2014)

Dari gambar 1.1. diatas diketahui bahwa semakin banyak / besar database
akan semakin banyak lagi proses iterasi kombinasi item/itemset yang harus dilakukan
setiap kali iterasi, sehingga waktu yang diperlukan cukup lama dalam penyelesaian
pencapaian nilai support dan confidence. Jadi inilah masalah algoritma apriori
sehingga perlu dikembangkan karena banyak menghasilkan candidate generation.
Penelitian yang telah dilakukan berkaitan dengan algoritma apriori tentang
frequent itemset: Penelitian Kaur et al (2014) desain dan implementasi efesien pada
algoritma apriori, Heena et al (2014) menganalisis frequent pattern dalam
perpindahan item pada algoritma apriori dan Penelitian Kumar & Rukmani (2010)
implementasi web menggunakan algoritma apriori dan algoritma FP-Growth.
Berdasarkan penelitian diatas, maka perlu dilakukan penelitian pada
algoritma apriori untuk pembuatan teknik baru dalam mengatasi masalah frequent
item/itemset dalam pencarian nilai support dan nilai confidence dalam asosiasi rule
mining pada database yang besar, sehingga tanpa melakukan candidate generation
dapat menghasilkan asosiasi rule mining dan hal ini mampu mengefesiensikan waktu
pengerjaan pada tahap frequent item pada algoritma apriori.

1.2. Rumusan Masalah

Berdasarkan uraian pada latar belakang maka penulis mencoba meneliti bagaimana
mengatasi frequent item/itemset pada database yang cukup besar tanpa melakukan
candidate generation.

1.3. Batasan Masalah
Dengan rumusan masalah diatas, penulis membatasi masalah hanya mengkaji Pattern
Frequent Item/Itemset pada Algoritma apriori dengan menggunakan file database
sales penjualan produk berbentuk format.CSV ± 1500 dataset records.

1.4. Tujuan Penelitian
Penelitian ini bertujuan untuk mengurangi

frequent item/itemset

pada proses

pembentukan asosiasi rule mining pada algoritma apriori dengan menerapkan teknik
metode baru.

1.5. Manfaat Penelitian

Manfaat yang diharapkan dari hasil penelitian ini adalah sebagai berikut :
1. Dengan menerapkan metode yang baru, penelitian ini diharapkan dapat
memberikan sekumpulan informasi yang tepat dan akurat untuk dijadikan
sebagai pengambilan keputusan.
2. Dengan mengembangkan algoritma apriori ini diharapkan dapat menambah
dan menggali pengetahuan ( knowledge database) berdasarkan pengalaman
yang telah terjadi sehingga mampu memahami pengembangan algoritma
apriori secara lebih mendalam lagi.