Algoritma Apriori LANDASAN TEORI

aturan asosiasi yang memiliki nilai confidence minconf . Aturan asosiasi dapat ditemukan dari setiap frequent itemset.

2.4 Algoritma Apriori

Algoritma Apriori merupakan algoritma untuk mencari frequent itemset yang berdasarkan prinsip apriori, yaitu jika suatu itemset merupakan frequent itemset maka semua subset-nya akan berupa frequent itemset Tan, et.al. 2006. Pembentukan frequent itemset dilakukan dengan mencari semua kombinasi item-item yang memiliki support yang lebih besar atau sama dengan minsup yang telah ditentukan. Pseudocode untuk pencarian frequent itemset menggunakan algoritma apriori adalah sebagai berikut Gunawan, 2003 [11] : = candidate itemset untuk ukuran k = frequent itemset large itemset untuk ukuran k = {candidate 1-itemset} = {large 1-itemset} for do begin new candidate for all transaction do begin candidate contained in for all candidates do end end Answer = Algoritma diatas dapat dijelaskan sebagai berikut : a. Pada iterasi pertama dihitung jumlah kemunculan setiap item dalam transaksi untuk menentukan large 1-itemset. Pada iterasi selanjutnya akan dihasilkan candidate k-itemset C k menggunakan frequentk-1- itemset yang ditemukan pada iterasi sebelumnya. Candidate generation diimplementasikan menggunakan sebuah fungsi yang disebut apriori- gen . Apriori-gen digunakan untuk menghasilkan candidate itemset yang menyebabkan tidak seluruh itemset diolah pada proses selanjutnya, hanya yang memenuhi persyaratan saja yaitu sesuai dengan support yang telah ditentukan. Hal ini mempersingkat waktu proses pencarian seluruh aturan asosiasi. b. Setelah itu, dilakukan penelusuran dalam basisdata untuk menghitung support bagi setiap candidate itemset dalam C k . Untuk setiap transaksi t, dicari semua candidate itemset t dalam set C k yang terkandung dalam transaksi tersebut. Kumpulan dari semua candidate itemset dalam C k yang terkandung dalam transaksi t disebut C t dan ditulis dengan notasi c. Selanjutnya nilai support dari semua candidate k-itemset dalam C t dinaikkan. Penelusuran dilanjutkan pada transaksi berikutya sampai semua transaksi dalam basisdata ditelusuri. Lalu akan dilakukan eliminasi candidate itemset yang memiliki nilai support lebih kecil dari minsup. Sedangkan semua candidate k-itemset yang memenuhi minsup disimpan dalam L k yang akan digunakan untuk membentuk large k+1- itemset. Algoritma berakhir ketika tidak ada large itemset baru yang dihasilkan. Pencarian frequent itemset menggunakan algoritma apriori memiliki 2 karakteristik penting yaitu : 1. Apriori merupakan algoritma level-wise dimana proses pada algoritma ini membangkitkan frequent itemset per level, dimulai dari level 1-itemset sampai ke itemset terpanjang dan candidate level yang baru, dibentuk dari frequent itemset yang ditemukan di level sebelumnya lalu menentukan nilai supportnya. 2. Algoritma ini menggunakan strategi generate and test untuk menemukan frequent itemset. Pada tiap iterasi, candidate itemset yang baru, dihasilkan dari frequent itemset yang ditemukan pada iterasi sebelumnya. Nilai support tiap candidate dihitung dan di bandingkan kembali dengan ambang batas minsupnya. Jumlah iterasi yang dibutuhkan algoritma ini adalah , dimana k max merupakan ukuran maksimum dari frequent itemset. Algoritma apriori menggunakan arah pencarian bottom-up, dimana arah pencarian dimulai dari frequent itemset menuju itemset terpanjang. Strategi yang digunakan adalah breadth-first search dimana proses pencarian dilakukan per level dan untuk tiap level-nya ditentukan nilai support -nya untuk menemukan frequent itemset pada level tersebut. Sedangkan strategi perhitungan nilai support dilakukan dengan horizontal counting , dengan cara membaca transaksi satu persatu, jika ditemukan itemset yang dicari pada transaksi tersebut maka counter bertambah satu, begitu selanjutnya.

BAB III ANALISIS DAN PERANCANGAN SISTEM

3.1 Identifikasi Masalah

PT. ASDP Indonesia Ferry Persero Cabang Kupang menangani pelayaran antar pulau di daerah Nusa Tenggara Timur. Data transaksi operasional pelayaran di tiap lintasan meliputi kapal yang beroperasi, jenis tiket yang terdiri dari tiket penumpang, tiket kendaraan, dan tiket barang serta produksi dan pendapatan. Data operasional produksi dan pendapatan yang dimiliki oleh PT. ASDP Kupang ini masih tercatat secara manual dalam bentuk file excel sehingga pihak Supervisor mengalami kesulitan dalam menganalisa data tersebut. Jadi untuk memudahkan menganalisa data tersebut maka digunakan teknik gudang data untuk merangkum transaksi sehingga mudah dianalisa. Pada tugas akhir ini akan dibangun sebuah gudang data yang dimanfaatkan untuk keperluan OLAP dan penambangan data menggunakan algoritma Apriori. OLAP membantu pihak ASDP Kupang dalam pelaporan produksi dan pendapatan. Teknik penambangan data dengan algoritma apriori membantu pencarian pola asosiasi antara hari, lintasan, dan pendapatan. Data transaksi yang digunakan adalah data transaksi tahun 2010 dan 2011 yang diperoleh dari PT. ASDP Indonesia Ferry Persero Cabang Kupang.