aturan asosiasi yang memiliki nilai confidence minconf
. Aturan asosiasi dapat ditemukan dari setiap frequent itemset.
2.4 Algoritma Apriori
Algoritma Apriori merupakan algoritma untuk mencari frequent itemset
yang berdasarkan prinsip apriori, yaitu jika suatu itemset merupakan frequent itemset
maka semua subset-nya akan berupa frequent itemset Tan, et.al. 2006. Pembentukan frequent itemset dilakukan dengan mencari semua
kombinasi item-item yang memiliki support yang lebih besar atau sama dengan minsup yang telah ditentukan. Pseudocode untuk pencarian frequent
itemset menggunakan algoritma apriori adalah sebagai berikut Gunawan,
2003 [11] : = candidate itemset untuk ukuran k
= frequent itemset large itemset untuk ukuran k = {candidate 1-itemset}
= {large 1-itemset}
for do begin
new candidate for all transaction
do begin candidate contained in
for all candidates do
end end
Answer =
Algoritma diatas dapat dijelaskan sebagai berikut : a. Pada iterasi pertama dihitung jumlah kemunculan setiap item dalam
transaksi untuk menentukan large 1-itemset. Pada iterasi selanjutnya akan dihasilkan candidate k-itemset C
k
menggunakan frequentk-1- itemset
yang ditemukan pada iterasi sebelumnya. Candidate generation diimplementasikan menggunakan sebuah fungsi yang disebut apriori-
gen . Apriori-gen digunakan untuk menghasilkan candidate itemset yang
menyebabkan tidak seluruh itemset diolah pada proses selanjutnya, hanya yang memenuhi persyaratan saja yaitu sesuai dengan support
yang telah ditentukan. Hal ini mempersingkat waktu proses pencarian seluruh aturan asosiasi.
b. Setelah itu, dilakukan penelusuran dalam basisdata untuk menghitung support
bagi setiap candidate itemset dalam C
k
. Untuk setiap transaksi t,
dicari semua candidate itemset t dalam set C
k
yang terkandung dalam transaksi tersebut. Kumpulan dari semua candidate itemset dalam C
k
yang terkandung dalam transaksi t disebut C
t
dan ditulis dengan notasi
c. Selanjutnya nilai support dari semua candidate k-itemset dalam C
t
dinaikkan. Penelusuran dilanjutkan pada transaksi berikutya sampai semua transaksi dalam basisdata ditelusuri. Lalu akan dilakukan
eliminasi candidate itemset yang memiliki nilai support lebih kecil dari minsup.
Sedangkan semua candidate k-itemset yang memenuhi minsup
disimpan dalam L
k
yang akan digunakan untuk membentuk large k+1- itemset.
Algoritma berakhir ketika tidak ada large itemset baru yang dihasilkan.
Pencarian frequent itemset menggunakan algoritma apriori memiliki 2 karakteristik penting yaitu :
1. Apriori merupakan algoritma level-wise dimana proses pada algoritma ini membangkitkan frequent itemset per level, dimulai
dari level 1-itemset sampai ke itemset terpanjang dan candidate level
yang baru, dibentuk dari frequent itemset yang ditemukan di level sebelumnya lalu menentukan nilai supportnya.
2. Algoritma ini menggunakan strategi generate and test untuk menemukan frequent itemset. Pada tiap iterasi, candidate itemset
yang baru, dihasilkan dari frequent itemset yang ditemukan pada iterasi sebelumnya. Nilai support tiap candidate dihitung dan di
bandingkan kembali dengan ambang batas minsupnya. Jumlah iterasi
yang dibutuhkan algoritma ini adalah
, dimana k
max
merupakan ukuran maksimum dari frequent itemset.
Algoritma apriori menggunakan arah pencarian bottom-up, dimana arah pencarian dimulai dari frequent itemset menuju itemset terpanjang.
Strategi yang digunakan adalah breadth-first search dimana proses pencarian dilakukan per level dan untuk tiap level-nya ditentukan nilai
support -nya untuk menemukan frequent itemset pada level tersebut.
Sedangkan strategi perhitungan nilai support dilakukan dengan horizontal counting
, dengan cara membaca transaksi satu persatu, jika ditemukan itemset
yang dicari pada transaksi tersebut maka counter bertambah satu, begitu selanjutnya.
BAB III ANALISIS DAN PERANCANGAN SISTEM
3.1 Identifikasi Masalah
PT. ASDP Indonesia Ferry Persero Cabang Kupang menangani pelayaran antar pulau di daerah Nusa Tenggara Timur. Data transaksi
operasional pelayaran di tiap lintasan meliputi kapal yang beroperasi, jenis tiket yang terdiri dari tiket penumpang, tiket kendaraan, dan tiket barang
serta produksi dan pendapatan. Data operasional produksi dan pendapatan yang dimiliki oleh PT. ASDP Kupang ini masih tercatat secara manual
dalam bentuk file excel sehingga pihak Supervisor mengalami kesulitan dalam menganalisa data tersebut. Jadi untuk memudahkan menganalisa
data tersebut maka digunakan teknik gudang data untuk merangkum transaksi sehingga mudah dianalisa.
Pada tugas akhir ini akan dibangun sebuah gudang data yang dimanfaatkan
untuk keperluan
OLAP dan
penambangan data
menggunakan algoritma Apriori. OLAP membantu pihak ASDP Kupang dalam pelaporan produksi dan pendapatan. Teknik penambangan data
dengan algoritma apriori membantu pencarian pola asosiasi antara hari, lintasan, dan pendapatan. Data transaksi yang digunakan adalah data
transaksi tahun 2010 dan 2011 yang diperoleh dari PT. ASDP Indonesia Ferry Persero Cabang Kupang.