Pembentukan Minimal Non-Redundant Association Rules Menggunakan Frequent Closed Itemsets pada Data Transaksi Swalayan

(1)

Frequent Closed Itemsets pada Data Transaksi Swalayan. Dibimbing oleh FIRMAN ARDIANSYAH dan IMAS S. SITANGGANG.

Teknik association rules mining di dalam data mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak yang dapat mengandung aturan-aturan yang berulang, yaitu aturan-aturan yang memberikan informasi yang sama. Penelitian ini menggunakan teknik mining minimal non-redundant association rules untuk menghasilkan aturan asosiasi yang tidak berulang pada data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Konsep closure dalam Galois connection diterapkan dalam teknik minimal non-redundant association rules mining untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Pada penelitian ini dilakukan pembentukan generators dan frequent closed itemsets dengan menggunakan empat nilai minimum support, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Berdasarkan generators dan frequent closed itemsets, dibentuk minimal non-redundant association rules menggunakan 11 nilai minimum confidence, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.

Hasil penelitian memperlihatkan bahwa teknik minimal non-redundant association rules mining dapat menghasilkan aturan asosiasi yang tidak berulang dengan antesedan yang minimal dan konsekuen yang maksimal serta mengandung informasi lebih banyak. Di samping itu, waktu eksekusi dan penggunaan sumberdaya komputasi untuk implementasi teknik tersebut lebih efisien. Waktu eksekusi pembentukan minimal non-redundant association rules tercepat adalah 2 detik yang terjadi pada nilai minimum support terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai minimum support terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minimum support, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Kata kunci: data mining, aturan asosiasi, lattices, Galois connection, non-redundant


(2)

RISA MAISARAH

G64103009

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR


(3)

RISA MAISARAH

G64103009

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR


(4)

RISA MAISARAH

G64103009

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR


(5)

Frequent Closed Itemsets pada Data Transaksi Swalayan. Dibimbing oleh FIRMAN ARDIANSYAH dan IMAS S. SITANGGANG.

Teknik association rules mining di dalam data mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak yang dapat mengandung aturan-aturan yang berulang, yaitu aturan-aturan yang memberikan informasi yang sama. Penelitian ini menggunakan teknik mining minimal non-redundant association rules untuk menghasilkan aturan asosiasi yang tidak berulang pada data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Konsep closure dalam Galois connection diterapkan dalam teknik minimal non-redundant association rules mining untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Pada penelitian ini dilakukan pembentukan generators dan frequent closed itemsets dengan menggunakan empat nilai minimum support, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Berdasarkan generators dan frequent closed itemsets, dibentuk minimal non-redundant association rules menggunakan 11 nilai minimum confidence, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.

Hasil penelitian memperlihatkan bahwa teknik minimal non-redundant association rules mining dapat menghasilkan aturan asosiasi yang tidak berulang dengan antesedan yang minimal dan konsekuen yang maksimal serta mengandung informasi lebih banyak. Di samping itu, waktu eksekusi dan penggunaan sumberdaya komputasi untuk implementasi teknik tersebut lebih efisien. Waktu eksekusi pembentukan minimal non-redundant association rules tercepat adalah 2 detik yang terjadi pada nilai minimum support terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai minimum support terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minimum support, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Kata kunci: data mining, aturan asosiasi, lattices, Galois connection, non-redundant


(6)

NRP :

G64103009

Menyetujui:

Pembimbing I, Pembimbing II,

Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si.,M.Kom

NIP 132 311 919 NIP 132 206 235

Mengetahui:

Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

Dr. drh. Hasim, DEA

NIP 131 578 806


(7)

ketiga dari tiga bersaudara dari pasangan Rafli Munir dan Suriawati MS. Pada tahun 2003, penulis lulus dari SMUN 1 Tapaktuan, Aceh Selatan dan diterima menjadi mahasiswa Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2007, Penulis berkesempatan menjalankan Praktik Kerja Lapangan (PKL) di Pusat Penelitian dan Pengembangan Perkebunan, Bogor selama kurang lebih dua bulan.


(8)

PRAKATA

Alhamdulillaahi rabbil ‘aalamin dengan memanjatkan puji syukur kehadirat Allah SWT atas segala rahmat dan hidayah-Nya, sehingga penulis dapat menyelesaikan skripsi dengan judul Pembentukan Minimal Non-Redundant Association Rules menggunakan frequent closed itemsets pada Data Transaksi Swalayan. Shalawat serta salam juga penulis sampaikan kepada junjungan Nabi besar Muhammad SAW beserta seluruh keluarganya, sahabatnya, dan kita semua sebagai generasi penerusnya hingga akhir zaman.

Penulis mengucapkan terima kasih banyak kepada Bapak Firman Ardiansyah, S.Kom, M.Si. selaku pembimbing 1 dan Ibu Imas S. Sitanggang, S.Si.,M.Kom selaku pembimbing 2 yang telah banyak membantu dan memberikan saran yang bermanfaat serta arahan dalam proses penyelesaian skripsi. Terima kasih juga penulis ucapkan kepada dosen penguji atas kesediaannya untuk menguji dalam masa seminar dan sidang serta saran dan masukannya. Di samping itu, penulis juga ingin mengucapkan terima kasih kepada:

1 Mama dan almarhum Ayah tercinta yang selalu memberikan kasih sayang, doa, dan motivasi yang tidak pernah putus.

2 Ibu Yul, almarhumah Bapak Hatta, Papa Is, Anda Esy, dan Bang Meiby serta keluarga besar di Banda Aceh dan Tapaktuan atas semua perhatian dan dukungannya yang telah diberikan selama ini.

3 Kak Rini dan Bang Eyuu tercinta yang selalu memberikan perhatian, motivasi, dan doa yang tidak pernah putus.

4 Keluarga besar penulis yang berada di Jakarta atas perhatian dan dukungannya.

5 Teman-teman seperjuangan di Ilkom 40 Eggy, Anti, Tessy, Nanik, Ratih, Wisyu, Ocha, dan Chita serta semua ilkomerz 40 terima kasih atas perhatian, kerja sama, dan bantuannya selama penulis kuliah di IPB.

6 Teman-teman di Wisma Green House Eggy, Kak Eka, Mbak Yuyun, Mbak Nani, Mbak Rahmae, Rahma, Melly, Fitri, Restu, Nana, Mira, Umi, dan Evi atas kesabaran, perhatian, bantuan dan motivasinya selama ini.

7 Teman-teman terbaik di Banda Aceh dan Tapaktuan yang selalu memberikan perhatian dan motivasi.

8 Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu penulis selama masa perkuliahan dan penelitian.

9 Semua pihak yang telah banyak membantu penulis dalam menyelesaikan perkuliahan di Ilmu Komputer IPB.

Penulis mohon maaf jika ada kekurangan-kekurangan yang terdapat dalam skripsi ini. Penulis berharap semoga skripsi ini dapat bermanfaat bagi perkembangan dunia ilmu pengetahuan di Indonesia.

Bogor, April 2008

Penulis


(9)

DAFTAR TABEL...vi

DAFTAR GAMBAR ...vi

DAFTAR LAMPIRAN ...vi

PENDAHULUAN...1

Latar Belakang ...1

Tujuan ...1

Ruang Lingkup...1

Manfaat Penelitian...1

TINJAUAN PUSTAKA...1

Knowledge Discovery in Database (KDD) ...1

Data Mining...2

Minimal Non-Redundant Association Rules...2

Galois Connection...3

Lift...4

METODE PENELITIAN...4

Metode Penelitian...4

Lingkungan Pengembangan Sistem ...6

Perancangan Basis Data ...6

HASIL DAN PEMBAHASAN ...7

Pembentukan Frequent Closed Itemsets...7

Pembentukan Minimal Non-Redundant Association Rules...9

Hasil Perbandingan Minimal Non-Redundant Association Rules Mining dengan Association Rules Mining pada Penelitian Widodo (2004)...11

KESIMPULAN DAN SARAN ...12

Kesimpulan ...12

Saran...12

DAFTAR PUSTAKA ...12

LAMPIRAN...13


(10)

1 Tabel dalam basis data ...6

2 Pembentukan frequent closed itemsets (FC)...8

3 Pembentukan large itemset...8

4 Jumlah minimal non-redundant association rules...9

5 Jumlah aturan asosiasi...9

6 Minimal non-redundant association rules dengan nilai confidence terbesar ...10

7 Aturan asosiasi dengan nilai confidence terbesar ...10

DAFTAR GAMBAR

Halaman 1 Tahapan dalam KDD (Han & Kamber 2006)...2

2 Basis data D dan closed itemset lattice dari D...3

3 Bagan alir minimal non-redundant association rules mining...7

4 Grafik waktu eksekusi...8

5 Waktu eksekusi pembentukan MNRAA dan AA dari (a) minsup 5 %, (b) minsup 2 %, (c) minsup 1 %, dan (d) minsup 0,5 %...9

6 Total waktu eksekusi minimal non-redundant association rules mining...11

7 Total waktu eksekusi association rules mining...11

DAFTAR LAMPIRAN

Halaman 1 Daftar properti tabel ...15

2 Tabel daftar kelompok barang...17

3 Data hasil kandidat FC dan FC dengan nilai minsup 5 %, 2 %, 1 %, dan 0,5 % ...18

4 Minimal non-redundant association rules (MNRAA) ...39

5 Minimal non-redundant association rules (MNRAA)yang memiliki korelasi positif ...45

6 Minimal non-redundant association rules (MNRAA)yang memiliki korelasi negatif ...51


(11)

PENDAHULUAN

Latar Belakang

Perkembangan yang cepat dalam teknologi pengumpulan dan penyimpanan data telah memudahkan organisasi untuk mengumpulkan sejumlah data berukuran besar, sehingga menghasilkan tumpukan data. Konsep data mining digunakan untuk mengelola tumpukan data menjadi suatu pengetahuan yang berharga, sehingga dapat diaplikasikan dalam berbagai bidang, di antaranya dalam bidang bisnis dan kedokteran.

Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Salah satu teknik data mining adalah metode association rule mining

yang berguna untuk menemukan aturan asosiasi pada basis data. Pada dasarnya aturan asosiasi digunakan untuk menggambarkan keterkaitan antar item pada sekumpulan data (Han & Kamber 2006).

Penerapan association rules dapat

dicontohkan pada analisis pembelian di suatu pasar swalayan, sehingga dapat diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan barang atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.

Teknik association rules mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak. Menurut Bastide et al. (2000), aturan asosiasi yang berjumlah banyak dapat mengandung aturan-aturan yang tidak relevan (minimal anteseden dan maksimal konsekuen) dan aturan yang berulang, yaitu aturan–aturan yang memberikan informasi yang sama.

Penelitian ini menerapkan teknik minimal non-redundant association rulesmining untuk menghasilkan aturan asosiasi yang tidak berulang menggunakan konsep closure dalam

Galois connection. Algoritma Close

digunakan untuk mengekstrak generators dan

frequent closed itemsets. Berdasarkan

generators dan frequent closed itemsets yang didapat akan dibentuk minimal non-redundant association rules (Bastide et al. 2000).

Minimal non-redundant association rules

mempresentasikan aturan dengan anteseden yang minimal dan konsekuen yang maksimal tanpa mengurangi informasi yang terkandung dalam data yang ditambang. Berdasarkan sudut pandang pengguna, aturan asosiasi yang

tidak berulang dengan anteseden yang minimal dan konsekuen yang maksimal menjadi bentuk aturan asosiasi paling relevan dan berguna (Bastide et al. 2000).

Tujuan

Tujuan penelitian ini adalah:

1 menerapkan konsep closure dari Galois connection untuk membentuk generators dan frequent closed itemsets

menggunakan algoritma Close (Pasquier 1998),

2 membentuk minimal non-redundant

association rules menggunakan

generators dan frequent closed itemsets,

3 membandingkan hasil dan waktu eksekusi pada minimal non-redundant association rules mining dengan association rules mining dalam penelitian sebelumnya (Widodo 2004).

Ruang Lingkup

Ruang lingkup penelitian ini dibatasi pada penggunaan konsep closure dalam Galois connection untuk mendapatkan minimal non-redundant association rules. Penelitian ini menggunakan data transaksi yang sama dengan penelitian Widodo (2004), yaitu data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004).

Manfaat Penelitian

Hasil penelitian diharapkan dapat

memberikan minimal non-redundant

association rules yang paling relevan dan berguna serta mudah dipahami oleh pengguna.

TINJAUAN PUSTAKA

Knowledge Discovery in Database (KDD) Knowledge Discovery in Database (KDD) adalah proses untuk menemukan pengetahuan dari suatu basis data yang terdiri atas urutan langkah-langkah yang dapat dilihat pada Gambar 1 (Han & Kamber 2006).

Menurut Han & Kamber (2006), tahapan proses KDD adalah:

1 Pembersihan Data

Pembersihan terhadap data dilakukan untuk menghilangkan data yang tidak konsisten dan data yang mengandung noise.


(12)

Gambar 1 Tahapan dalam KDD (Han & Kamber 2006).

2 Seleksi Data

Proses seleksi data mengambil data yang relevan digunakan untuk proses analisis. 3 Transformasi Data

Proses ini mentransformasikan atau menggabungkan data ke dalam bentuk yang tepat untuk ditambangdengan cara melakukan peringkasan atau operasi agregrasi.

4 Data Mining

Data mining merupakan proses yang penting, di mana metode-metode cerdas diaplikasikan untuk mengekstrak pola-pola dalam data.

5 Evaluasi Pola

Evaluasi pola diperlukan untuk mengidentifikasi pola-pola yang menarik dalam merepresentasikan pengetahuan. 6 Presentasi Pengetahuan

Penggunaan visualisasi dan teknik representasi untuk menunjukkan pengetahuan hasil penggalian gunung data kepada pengguna.

Data Mining

Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Beberapa teknik di dalam data mining antara lain: clustering, classification, association rule mining, dan

anomaly detaction. Association rule mining

digunakan untuk mencari hubungan menarik di antara items dalam suatu himpunan data (Han & Kamber 2006).

Ukuran objektif yang dapat digunakan untuk menemukan aturan asosiasi adalah nilai

support dan confidence. Support adalah persentase kombinasi item dalam basis data dan confidence merupakan nilai persentase dari hubungan antar item dalam aturan asosiasi.

Misalkan S adalah jumlah semua transaksi dari basis data transaksi, Txy adalah himpunan dari banyak transaksi yang mengandung himpunan item data X dan Y. Tx adalah himpunan dari transaksi yang mengandung

item data X maka support dan confidence dari aturan asosiasi X → Y didefinisikan sebagai berikut:

Support = xy

T

S

Confidence =

xy

x

T

T

Minimal Non-Redundant Association Rules

Sebuah aturan asosiasi dikatakan berulang jika terdapat aturan asosiasi lain yang memberikan informasi yang sama sehingga aturan asosiasi tersebut menjadi tidak efektif (Bastide et al. 2000). Aturan asosiasi yang berulang dicontohkan sebagai berikut:

NO Aturan Asosiasi Support Confidence

1 A → B 33 % 66 %

2 A → B, C 33 % 66 %

3 A → B, C, E 33 % 66 %

Berdasarkan contoh di atas, ketiga aturan asosiasi tersebut berulang karena tidak memberikan tambahan informasi bagi pengguna. Hanya aturan asosiasi A → B, C, E yang paling relevan dan berguna untuk ditampilkan pada pengguna karena memiliki anteseden yang minimal dan konsekuen yang paling maksimal dan mengandung keseluruhan informasi dari ketiga aturan.

Aturan asosiasi yang berulang sering terdapat pada data yang bersifat dense (padat) dan memiliki korelasi data yang tinggi. Data yang padat memiliki nilai null yang sedikit, sehingga korelasi di dalam data kuat. Dalam data transaksi, korelasi terjadi pada transaksi dan item dalam data.

Menurut Bastide et al. (2000), sebuah aturan asosiasi r : l1→l2 adalah minimal

non-redundant association rules jika dan hanya jika tidak ada aturan asosiasi lain r’ : l’1→l’2 dengan support(r) = support(r’), confidence(r) = confidence(r’), l’1⊆ l1, dan l2 ⊆ l’2. Aturan asosiasi terbagi menjadi dua jenis, yaitu (Bastide et al. 2000):

1 Exact association rules adalah aturan asosiasi yang memiliki nilai confidence = 100 % dengan bentuk aturan asosiasi adalah r : l1

l2.

2 Approximate association rules adalah aturan asosiasi yang memiliki nilai

confidence < 100 % dengan bentuk aturan asosiasi adalah r : l1 → l2.


(13)

Algoritma Close (Bastide 2000) digunakan untuk menghasilkan generators dan frequent closed itemsets yang memenuhi syarat

minimum support (minsup). Minimal non-redundant association rules membentuk exact association rules dan approximate association rules menggunakan generators dan frequent closed itemsets yang memenuhi syarat

minimum confidence (mincof ).

Minimal non-redundant association rules

meminimalkan jumlah aturan asosasi yang berulang dengan tetap memaksimalkan kuantitas dan kualitas informasi yang

dihasilkan. Minimal non-redundant

association rules menampilkan aturan asosiasi yang meliputi semua item yang ada dalam basis data.

Galois Connection

Galois connection ditemukan oleh ahli matematika dari Prancis bernama Evariste Galois. Galois connection didefinisikan sebagai hubungan antara dua item berbeda yang saling berhubungan satu sama lain dalam sebuah aplikasi. Konsep closure dalam Galois connection adalah suatu konsep hubungan antara dua item berbeda karena memiliki kesamaan (Priss 2006).

Dalam konteks datamining terdapat notasi untuk basis data D = ( , , R), dengan

adalah himpunan transaksi, adalah

himpunan item dalam basis data, dan R

Χ adalah suatu hubungan dalam nilai biner antara transaksi dan item. Setiap pasangan (o,

i)

R menyatakan transaksi o

memiliki

itemi

(Pasquier et al. 1999).

Berdasarkan pengertian konteks data mining, dijelaskan beberapa definisi yang berhubungan dengan mining minimal non-redudant association rules (Pasquier et al. 1999), yaitu:

Definisi 1 (Galois connection)

Diketahui D = ( , , R) dengan O

dan I ⊆ maka didefinisikan:

f(O) : 2 → 2

f(O) = {i

|∀o

O, (o, i)

R}

g(I) : 2 → 2

g(I) = {o

|∀i

I, (o, i)

R}

f(O) berasosiasi dengan O yang

mengandung item untuk semua transaksi

o

O dan g(I) berasosiasi dengan I di mana transaksi mengandung semua item i

I. Pasangan aplikasi (f, g) merupakan Galois connection antara himpunan kuasa dari dengan himpunan kuasa dari . Dimisalkan

untuk semua I, I1, I2 ⊆ dan O, O1, O2 ⊆ memiliki sifat-sifat sebagai berikut: (1) I1 ⊆ I2

g(I1)

g(I2) (1’) O1 ⊆ O2

f(O1)

f(O2) (2) Og(I)

If(O) Definisi 2 (Galois closure operator)

Operator h = f g untuk 2 dan h’ = g f untuk 2 disebut Galois closure operator. Diketahui suatu Galois connection (f, g) dengan memiliki sifat-sifat sebagai berikut: Perluasan: (3) Ih(I)

(3’) Oh’(O) Persamaan: (4) h(h(I)) = h(I) (4’) h’(h’(O)) = h’(O)) Monoton: (5) I1 ⊆ I2

h(I1) ⊆ h(I2)

(5’) O1 ⊆ O2

h’(O1) ⊆ h’(O2) Definisi 3 (Closed itemsets)

Diketahui itemset C ⊆ dalam D adalah

closed itemset jika dan hanya jika h(C) = C.

Closed itemset yang paling minimal mengandung itemset I untuk h(I), h(I) disebut

closure dari I.

Definisi 4 (Closed itemset lattice)

Diketahui adalah himpunan dari closed itemset di dalam D yang didapat menggunakan

Galois closure operators. = ( , ≤) adalah

lattice yang kompleks disebut closed itemset lattice. Struktur dasar lattice memiliki dua ciri, yaitu:

1 Urutan elemen latticeC1, C2 ⊆ adalah

C1 ≤ C2 jika hanya jika C1 C2.

2 memiliki batas atas dari fungsi join

dan batas bawah dari fungsi meet

terhadap elemen. Dimisalkan S

maka fungsi join dan meet terhadap elemen-elemen didefinisikan sebagai berikut:

Join (S) = h( ) Meet (S) =

C S C

C S C

OID Item

1 A C D

2 B C E

3 A B C E

4 B E

5 A B C E

Gambar 2 DatasetD dan closed itemset lattice dari D.

Gambar 2 menunjukkan dataset D yang memiliki closed itemset lattice sesuai dengan


(14)

struktur dasar lattice. Closed itemset lattice

digunakan untuk menemukan frequent closed itemset.

Definisi 5 (Frequent closed itemset)

Closed itemset C adalah frequent closed itemset jika support(C) ≥minsup.

Definisi 6 (Generator) (Bastide et al. 2000) Sebuah itemset g dengan g ⊆ adalah

generator yang minimal dari closed itemsetl

jika dan hanya jika h(g) = l dan tidak ada g’⊆ dengan gg sehingga h(g’) = l. Urutan

generator dinotasikan sebagai i sehingga disebut i-generator.

Lift

Aturan asosiasi yang memenuhi nilai

minsup dan mincof, terkadang bisa menjadi aturan asosiasi yang menyesatkan bagi

pengguna. Aturan asosiasi A → B bisa

menyesatkan jika ternyata pembelian item A tidak diikuti dengan pembelian item B. Oleh sebab itu, digunakan suatu cara untuk mendapatkan aturan asosiasi yang tidak menyesatkan dengan mencari nilai korelasi antar data itemsets.

Pembelian itemset A adalah independent

terhadap pembelian itemset B jika P(A B) = P(A)P(B). Jika P(A B) ≠ P(A)P(B) maka pembelian itemset A dan B adalah dependent

dan saling berhubungan dalam transaksi yang sama. Menurut Han & Kamber (2006), korelasi antara pembelian A dan B dapat ditulis sebagai:

corrA,B = ( )

( ) ( )

P A B P A P B

Nilai korelasi corrA,B sama dengan nilai

P(B|A)/P(B) yang disebut juga dengan lift dari aturan asosiasi A → B. Jika nilai corrA,B < 1

maka aturan asosiasi A → B memiliki korelasi negatif yang berarti pembelian item A tidak diikuti dengan pembelian item B. Aturan asosiasi A → B memiliki korelasi positif jika nilai corrA,B > 1, hal ini berarti pembelian item

A akan diikuti dengan pembelian item B.

Itemsets A dan B adalah independent dan tidak memiliki korelasi di antara A dan B jika nilai corrA,B = 1.

METODE PENELITIAN

Metode Penelitian

Metode yang digunakan dalam penelitian ini mengacu pada bagian datamining sebagai

salah satu tahapan proses Knowledge

Discovery in Database (KDD) (Han & Kamber 2006) yang meliputi:

1 Praproses Data

Praproses data meliputi pembersihan data, integrasi data, seleksi data dan transformasi data. Hasil praproses data tersebut berupa data yang dapat ditambang. Penelitian ini menggunakan data yang telah melalui tahap praproses dalam penelitian sebelumnya (Widodo 2004).

2 Data Mining

Dalam mencari minimal non-redudant

association rules, proses mining dibagi menjadi dua tahap, yaitu pembentukan

frequent closed itemsets dan pembentukan

minimal non-redundant association rules.

Pembentukan Frequent Closed Itemsets

Pembentukan himpunan frequent closed itemsets (FCi) yang memenuhi minsup dilakukan dengan terlebih dahulu membentuk himpunan kandidat frequent closed itemsets

(FCCi). Himpunan FCCi terdiri dari generator,

closed itemset (closure), dan support dari

closure. Langkah ini dilakukan dengan iterasi

untuk mencari semua himpunan FC yang

memiliki kardinalitas dari 1 sampai i (i

-generator), pencarian berhenti jika tidak terbentuk lagi generator baru.

Pembentukan frequent closed itemsets

dilakukan dengan menggunakan Algoritma

Close sebagai berikut (Pasquier et al. 1998): Generators in FCC1 = {1-itemsets};

for (i = 1;FCCi.generator • Ø;i++)

do begin

closures in FCCi = Ø; supports in FCCi = 0; FCCi = Gen-Closure(FCCi);

forall candidate closed itemsets

c

FCCi do begin

if(c.support minsupport)then

FCi = FCi

c

end

FCCi+1 = Gen-Generator(FCi);

end

Answer FC = 1 (FC 1

j i j

= − =

j.closure,

FCj.support);

Berdasarkan algoritma di atas, pada awal iterasi, FCC1 merupakan himpunan kandidat 1-generators berdasarkan urutan 1-itemsets.

Setiap 1-generator akan mengalami

penelusuran dalam basis data untuk mencari

closure-nya dan support dari closure

menggunakan fungsi Gen-Closure. Fungsi

Gen-Closure akan menghasilkan himpunan

FCC1, setiap closurec dengan c

FCC1 yang

memenuhi minsup masuk dalam himpunan


(15)

Berdasarkan 1-generator dalam FC1, maka dibentuklah himpunan kandidat 2-generator

untuk FCC2 menggunakan fungsi

Gen-Generator. Pada iterasi kedua, proses yang sama pada iterasi pertama dilakukan terhadap

FCC2. Iterasi pada algoritma Close akan berhenti jika tidak terbentuk lagi kandidat

generator baru.

Secara lebih detail, fungsi-fungsi yang ada pada algoritma Close dijelaskan sebagai berikut (Pasquier et al. 1998):

a.Fungsi Gen-Closure

Pada fungsi ini dilakukan pencarian

closure dan support dari closure untuk setiap

i-generator pada FCCi. Algoritma untuk fungsi Gen-Closure sebagai berikut:

forall objects o

O do begin

Go = Subset(FCCi.generator, f({o}));

forall generators p

G

o

do begin

if (p.closure = Ø) then

p.closure = f({o});

else p.closure = p.closure

f({o}); p.support++;

end

end

Answer =

{c

FCCi|c.closure • Ø};

Pencarian closure dimulai dengan

membentuk Go, yaitu himpunan subsets

generators berdasarkan subsets dari itemset

dalam transaksi f({o}). Proses penelusuran dalam Go dilakukan untuk mencari closure dan

support dari closure tiap generator. b.Fungsi Gen-Generator

Pada fungsi ini dilakukan pembentukan kandidat himpunan generators baru untuk

FCC. Algoritma untuk fungsi Gen-Generator

sebagai berikut:

insert into FCCi + 1.generator

select p.item1, p.item2,..., p.itemi,

q.item i

from FCi.generator p,FCi.generatorq

where p.item1 = q.item1,..., p.itemi – 1 = q.itemi – 1, p.itemi < q.itemi;

forall generators

p

FCCi + 1.generator

do begin

forall i-subsets s of p do begin

if (s

FCi.generator) then

delete p from FCCi+1.generator;

end end

forall generators

p

FCC

i + 1.generator do begin

Sp = Subset (FCCi.generator,p);

forall s

Sp do begin

if (p s.closure) then

delete p from FCCi+1.generator;

end end

Pembentukan himpunan (i+1)-generator

baru untuk FCCi+1 dilakukan dengan

menggabungkan himpunan i-generator p dan

q di dalam FCi yang memiliki p.item1 =

q.item1 dengan p.itemi < q.itemi. Himpunan

(i+1)-generator pada FCCi+1 akan mengalami

dua proses pruning (pemangkasan) pada

fungsi ini.

Proses pruning pertama dilakukan terhadap (i+1)-generator, jika i-subset pada (i

+1)-generator tidak ada pada himpunan

generators dalam FCi. Proses pruning kedua

dilakukan terhadap (i+1)-generator, jika (i

+1)-generator adalah subset atau sama dengan

closure dari i-generator yang ada pada himpunan generators dalam FCCi.

Pembentukan Minimal Non-Redundant Association Rules

Himpunan frequent closed itemsets (FCi)

yang telah dibentuk pada tahap satu digunakan

untuk membentuk minimal non-redundant

association rules. Minimal non-redundant association rules terdiri dari exact association rules dan approximate association rules.

Pembentukan exact association rules dan

approximate association rules dilakukan melalui dua proses pembentukan yang berbeda (Bastide et al. 2000), yaitu:

a Pembentukan exact association rules Exact association rule r: l1

(l2 \ l1) merupakan aturan asosiasi antara itemsetl1 dan

l2 dengan h(l1) = h(l2). Berdasarkan h(l1) =

h(l2) dianggap l1

l2, sehingga support (l1) =

support (l2) dan nilai confidence = 1 atau 100%. Exact association rules dibentuk menggunakan Algoritma Gen-GB (Bastide et al. 2000) sebagai berikut:

Input: himpunan dari FCi

Output: himpunan dari GB yaitu

exact association rules GB • {}

forall set FCi

FC do begin

forall i-generator g

FC

i such

that gh(g) do begin

GB GB {(r:g (h(g)\g), h(g).support)};

end end

return GB;

b Pembentukan approximate association rules Approximate association rule r: l1 → (l2 \ l1) merupakan aturan asosiasi antara itemset

l1 dan l2 dengan l1

l2 dan h(l1)

h(l2), sehingga nilai confidence < 1. Approximate association rules dibentuk menggunakan


(16)

Algoritma Gen-RI (Bastide et al. 2000) sebagai berikut:

µ = ukuran maksimal FCi minconfidence = mincof

Succg= himpunan supersets dari h(g) Input: himpunan FCidan nilai

minconfidence

Output: himpunan dari RI yaitu approximate association rules

RI • {}

for (i • 1;i

µ

- 1;i++) do begin

forall i-generator g

FCido begin

Succg • {};

for (j = |h(g)|;j

µ

;j++)

do begin

S

j • {f

FC|f

h(g)

|f|=j};

end

for (j=|h(g)|;j

µ

; j++)

do begin

forall frequent closed itemset

f

Sj do begin

if ( s

Succ

g|s

f)

then do begin

SuccgSuccg

f ;

r.confidence •

f.support/g.support; if(r.confidence •

minconfidence)then

RIRI {r : g • (f \ g), r.confidence, f.support};

endif end end end end

return RI;

3 Evaluasi Pola

Evaluasi pola yakni melakukan pencarian aturan asosiasi yang menarik dan tidak

misleading (menyesatkan). Tahap ini

dilakukan pada minimal non-redundant

association rules yang telah dihasilkan berdasarkan nilai lift dari minimal non-redundant association rules.

4 Presentasi Pengetahuan

Presentasi pengetahuan merupakan tahap akhir di mana hasil evaluasi pola minimal non-redundant association rules yang telah dihasilkan ditampilkan dalam bentuk tabel.

Tabel memuat minimal non-redundant

association rules, nilai support dan confidence.

Lingkungan Pengembangan Sistem

Lingkungan pengembangan sistem ini adalah sebagai berikut:

Perangkat keras:

• prosesor: Intel Pentium IV, 2.4 Ghz,

• memori: 256 MB RAM,

harddisk dengan kapasitas 80 GB,

, dan

ra k:

i: Microsoft Windows XP

• soft Access 2003, dan

0.

akan adalah basis dat

ini

ata

erangan

mouse,

keyboard • monitor. Pe ngkat luna

• sistem operas

Professional, DBMS: Micro

• bahasa pemrograman: Visual Basic 6.

Perancangan Basis Data

Basis data yang digun

a pada penelitian Widodo (2004). Pada penelitian ini dilakukan beberapa perubahan dalam basis data sebelumnya untuk kepentingan implementasi Algoritma Close, Algoritma Gen-GB, dan Algoritma Gen-RI.

Basis data yang digunakan dalam sistem terdiri dari sembilan tabel yang dapat dilihat pada Tabel 1, properti dari setiap tabel terdapat pada Lampiran 1.

Tabel 1 Tabel dalam basis d

Nama Tabel Ket

tblTransaksiAsli Data hasil transaksi

tblKelBarang Data kelompok barang

tblTransaksiReduksi Data hasil proses

selection

tblCleanTransaksi Data hasil proses

cleaning

tblBiner Data hasil proses

integration dan

transformation

tblCGenerator Data kandiat

generators

tblGenClosure Data kandidat

frequent closed itemsets

tblClosure Data frequent closed

itemsets

tblBantu Data et dari

r subs

kandidat generato

tblResult Data hasil proses

mining


(17)

Penelitian ini melakukan pencarian

min

ian Widodo (2004), data pra

imal non-redundant association rules

(MNRAA) berdasarkan urutan proses dalam bagan alir minimal non-redundant association rules mining yang ditampilkan pada Gambar 3. Penelitian ini menggunakan hasil praproses yang telah dihasilkan penelitian sebelumnya (Widodo 2004).

Pada penelit

proses menghasilkan 35 jenis kelompok barang (Lampiran 2) dan 23.631 record. Pencarian minimal non-redundant association rules dilakukan melalui dua tahap, yaitu:

Gambar 3 Bagan alir minimal non- redundan

1 Pembentukan Frequent Closed itemsets

s

(FC e

kan

FC

Redundant

h frequent closed

item be

kan minimal non-red

roses pem

n terhadap kedua pendekatan ini (as

osed Itemsets

ng me

t association rules mining.

Pembentukan frequent closed itemset

) dilakukan d ngan membentuk kandidat

frequent closed itemsets (FCC). FCC yang memenuhi nilai minsup akan menjadi FC.

Pada penelitian ini dilakukan pembentu dengan menggunakan empat nilai minsup, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Empat nilai minsup

tersebut dipilih untuk mendapatkan variasi jumlah kandidat FC dan FC.

2 Pembentukan Minimal Non-Association Rules

Setelah diperole

sets, kemudian dilakukan pem ntukan

minimal non-redundant association rules.

Pembentukan minimal non-redundant

association rules dilakukan menggunakan 11 nilai mincof, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %. Nilai–nilai mincof tersebut digunakan untuk mengetahui nilai maksimum confidence

dari aturan asosiasi pada empat nilai minsup

yang telah dicobakan. Penelitian membanding

undant association rules mining dengan

association rules mining pada penelitian sebelumnya (Widodo 2004). Perbandingan dilakukan terhadap waktu eksekusi pembentukan dan jumlah kandidat FC dan FC

yang memenuhi minsup dengan waktu

eksekusi pembentukan dan jumlah kandidat

itemset dan large itemset yang memenuhi

minsup pada penelitian Widodo (2004). Perbandingan juga dilakukan pada p

bentukan aturan asosiasi. Waktu eksekusi

pembentukan dan jumlah minimal

non-redundant association rules yang memenuhi

mincof dengan waktu eksekusi pembentukan dan jumlah aturan asosiasi yang memenuhi

mincof pada penelitian sebelumnya (Widodo 2004).

Percobaa

sociation rules mining dan minimal non-redundant association rules mining) dilakukan di lingkungan sistem dan data transaksi yang sama. Nilai-nilai minsup dan mincof yang akan dicobakan juga sama.

Pembentukan Frequent Cl

Jumlah kandidat FC dan FC ya

menuhi empat nilai minsup yang dicobakan menggunakan Algoritma Close, disajikan pada Tabel 2. Data generator, closed itemset

(closure) dan support dari closure dalam


(18)

memenuhi empat nilai minsup yang dicobakan dapat dilihat pada Lampiran 3.

Tabel 2 Pembentukan frequent closed itemsets (FC)

Minsup (%) Parameter

5 2 1 0,5

Kandidat FC1 35 35 35 35

FC1 13 19 24 30

Kandidat FC2 78 171 276 435

FC2 2 11 37 87

Kandidat FC3 - 5 93 407

FC3 - - 5 34

Kandidat FC4 - - - 22

FC4 - - - -

Hasil pembentukan kandidat FC dan FC

dibandingkan dengan hasil pembentukan

kandidat itemset dan large itemset

menggunakan algoritma Apriori dari

penelitian sebelumnya (Widodo 2004). Jumlah kandidat itemset dan large itemset yang memenuhi empat nilai minsup yang dicobakan dapat dilihat pada Tabel 3.

Tabel 3 Pembentukan large itemset Minsup (%) Parameter

5 2 1 0,5

Kandidat 1-itemset 35 35 35 35

Large 1-itemset 13 19 24 30

Kandidat 2-itemset 78 171 276 435

Large 2-itemset 2 11 37 87

Kandidat 3-itemset - 5 93 407

Large 3-itemset - - 5 34

Kandidat 4-itemset - - - 23

Large 4-itemset - - - - Grafik waktu eksekusi pembentukan kandidat FC dan FC (algoritma Close), dan pembentukan kandidat itemset dan large itemset (algoritma Apriori) untuk empat nilai

minsup yang dicobakan, dapat dilihat pada Gambar 4. 0 100 200 300 400 500 600

5 2 1 0,5

Minsup (%) W akt u ( de ti k) Apriori Close

Gambar 4 Grafik waktu eksekusi. Berdasarkan data pada Tabel 2 dan Tabel 3 dapat dapat dinyatakan bahwa jumlah

kandidat FC dan kandidat itemset yang terbentuk sama kecuali pada minsup 0,5 %. Algoritma Close membentuk 22 kandidat FC4 sedangkan algoritma Apriori menghasilkan 23 kandidat 4-itemset.

Perbedaan hasil pada kandidat FC4, disebabkan proses pemangkasan (pruning) kedua pada generator dalam pembentukan kandidat FC4. Generator {003, 008, 009, 025} adalah subset dari atau sama dengan closed itemset dari generator {003, 009, 025} dalam

FC3.

Jumlah FC dari kandidat FC dan jumlah

large itemset dari kandidat itemset yang

memenuhi keempat nilai minsup sama.

Algoritma Close menghasilkan FC yang identik dengan hasil large itemset dari algoritma Apriori.

Hasil algoritma Close berupa kandidat FC

dan FC identik dengan hasil algoritma Apriori

berupa kandidat itemset dan large itemset. Hal ini disebabkan data transaksi yang ditambang bersifat sparse (jarang) atau tidak padat. Data transaksi yang digunakan dalam penelitian ini bersifat tidak padat karena banyak mengandung nilai null. Data transaksi yang jarang mengakibatkan korelasi dalam data lemah.

Data transaksi yang bersifat jarang dan berkorelasi rendah mempengaruhi hasil dari algoritma Close dimana hasil closed itemsets

dari generator adalah generator itu sendiri. Oleh sebab itu, kedua proses pruning dalam algoritma Close tidak bisa memperkecil iterasi proses pembentukan set FC dan memperkecil jumlah kandidat FC dan FC yang terbentuk.

Grafik pada Gambar 4 menunjukkan waktu eksekusi algoritma Close lebih lama dibandingkan waktu eksekusi algoritma

Apriori. Algoritma Close membutuhkan waktu lebih untuk proses akses pada basis data selama proses pembentukan kandidat FC dan

FC. Hal ini juga disebabkan waktu yang

digunakan dua proses pruning dalam

algoritma Close untuk memperkecil iterasi pembentukan set FC menjadi tidak berguna. Oleh sebab itu, waktu eksekusi algoritma

Close menjadi lebih lama.

Berdasarkan data pada Tabel 2 dan Tabel 3, semakin tinggi nilai minsup, maka semakin kecil jumlah FC dan large itemset yang diperoleh dari masing-masing kandidat. Berdasarkan grafik pada Gambar 3, semakin kecil nilai minsup maka semakin lama waktu eksekusi untuk algoritma Close dan Apriori.


(19)

Pembentukan Minimal Non-Redundant Association Rules

Minimal non-redundant association rules

dibentuk menggunakan data hasil generators

dan frequent closed itemsets yang memenuhi empat nilai minsup yang telah dicobakan. Jumlah minimal non-redundant association rules terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 4. Jumlah minimal non-redundant association rules untuk nilai

minsup dan mincof yang dicobakan terdapat pada Lampiran 4.

Tabel 4 Jumlah minimal non-redundant

associaton rules

Minsup (%)

Mincof

(%) 5 2 1 0,5

75 0 0 0 1

70 0 0 1 2

65 0 0 2 4

60 0 0 3 10

55 0 0 5 15

50 0 1 8 25

45 0 1 8 26

40 1 3 10 39

30 1 5 19 73

20 4 14 44 128

10 4 19 77 226

Berdasarkan data hasil large itemset yang memenuhi empat nilai minsup yang telah dicobakan, dilakukan pembentukan aturan asosiasi menggunakan aplikasi penelitian sebelumnya (Widodo 2004). Jumlah aturan asosiasi terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 5.

Tabel 5 Jumlah aturan asosiasi

Minsup (%)

Mincof

(%) 5 2 1 0,5

75 0 0 0 0

70 0 0 1 1

65 0 0 1 2

60 0 0 2 3

55 0 0 4 5

50 0 0 4 8

45 0 0 4 9

40 1 2 6 15

30 1 3 7 22

20 2 9 16 39

10 2 11 34 71

Pembentukan aturan asosiasi untuk empat nilai minsup yang dicobakan dengan nilai

mincof > 78,67 % tidak lagi menghasilkan aturan asosiasi.

Grafik waktu eksekusi pembentukan

minimal non-redundant association rules

(MNRAA) pada penelitian ini dan aturan asosiasi (AA) pada penelitian Widodo (2004) untuk empat nilai minsup dan 11 nilai mincof

yang dicobakan, dapat dilihat pada Gambar 5.

0 2 4 6 8 10 12

75 70 65 60 55 50 45 40 30 20 10

Mincof (%) Waktu ( d etik) MNRAA AA (a) 0 10 20 30 40 50

75 70 65 60 55 50 45 40 30 20 10

Mincof (%) Waktu (detik) MNRAA AA (b) 0 40 80 120 160 200

75 70 65 60 55 50 45 40 30 20 10

Mincof (%) Waktu (detik) MNRAA AA (c) 0 200 400 600 800 1000 1200

75 70 65 60 55 50 45 40 30 20 10 Mincof (%) Wa ktu ( d eti k ) MNRAA AA

(d)

Gambar 5 Waktu eksekusi pembentukan MNRAA dan AA dari (a)

minsup 5 %, (b) minsup 2 %, (c)

minsup 1 %, dan (d) minsup


(20)

Berdasarkan data hasil pada Tabel 4 dan Tabel 5, semakin kecil nilai minsup dan

mincof maka jumlah aturan asosiasi yang dihasilkan semakin banyak. Untuk setiap nilai

minsup dan mincof yang dicobakan, jumlah

minimal non-redundant association rules yang dihasilkan lebih banyak dari jumlah aturan asosiasi.

Pada nilai minsup 2 % dengan nilai mincof

50 % dan 45 %, aturan asosiasi tidak menghasilkan aturan sedangkan minimal non-redundant association rules telah menghasilkan aturan asosiasi, yaitu aturan 026

→ 013 (pasta gigi → sabun) dengan support

2,67 % dan confidence 53,64 %. Hal ini berarti 2,67 % dari konsumen akan membeli pasta gigi dan sabun bersamaan dan 53,64 % dari konsumen yang membeli pasta gigi akan selalu diikuti dengan pembelian sabun.

Untuk nilai minsup 0,5 % dan mincof

75 % aturan asosiasi tidak menghasilkan

aturan sedangkan minimal non-redundant

association rules dapat menghasilkan aturan, yaitu aturan 003, 009 → 008 (susu, pelengkap roti → snack) dengan support 0,7 % dan

confidence 78,67 %. Hal ini berarti 0,7 % dari konsumen akan membeli susu, pelengkap roti dan snack bersamaan dan 78,67 % dari konsumen yang membeli susu dan pelengkap roti akan selalu diikuti dengan pembelian snack.

Data minimal non-redundant association rules dengan nilai confidence terbesar dari empat nilai minsup yang telah dicobakan dapat dilihat pada Tabel 6. Data minimal non-redundant association rules yang memiliki korelasi positif dan korelasi negatif terdapat pada Lampiran 5 dan 6.

Tabel 6 Minimal non-redundant association rules dengan nilai confidence terbesar

Minsup (%) Aturan Asosiasi Support (%) Confidence (%)

5 susu → snack 6,54 44,64

2 pasta gigi → sabun

2,67 53,64

1 susu, permen →

snack

1,21 70,44

0,5 susu, pelengkap roti → snack

0,7 78,67

Data aturan asosiasi dengan nilai

confidence terbesar dari empat nilai minsup

yang telah dicobakan pada penelitian sebelumnya (Widodo 2004) dapat dilihat pada Tabel 7.

Tabel 7 Aturan asosiasi dengan nilai

confidence terbesar

Minsup (%) Aturan Asosiasi Support (%) Confidence (%)

5 susu → snack 6,54 44,64

2 susu → snack 6,54 44,64

1 susu, permen

→ snack

1,21 70,44

0,5 susu, permen

→ snack

1,21 70,44

Berdasarkan data hasil pada Tabel 6 dan

Tabel 7, mining minimal non-redundant

association rules menghasilkan aturan asosiasi dengan nilai confidence tertinggi yang berbeda-beda untuk empat nilai minsup yang dicobakan. association rules mining pada penelitian Widodo (2004) menghasilkan aturan asosiasi dengan confidence tertinggi yang sama untuk minsup 5% dan 2 %, begitu juga untuk minsup 1 % dan 0,5 %

Minimal non-redundant association rules

menghasilkan aturan asosasi yang lebih banyak mengandung informasi dibandingkan aturan asosiasi yang dihasilkan pada penelitian sebelumnya (Widodo 2004). Jika penelitian Widodo (2004) menghasilkan aturan asosiasi (013 → 026) untuk minsup

1 % dan mincof 10 %, maka selain menghasilkan aturan asosasi yang sama,

minimal non-redundant association rules juga menghasilkan aturan asosasi (026 → 013) dengan informasi nilai support yang sama, yaitu 2,67 % tetapi nilai confidence yang berbeda. Nilai confidence aturan asosiasi (013

→ 026) adalah 26,7 % sedangkan aturan

asosiasi (026 → 013) adalah 53,64 %. Selain membentuk aturan asosiasi yang berbeda, waktu eksekusi pembentukan aturan asosiasi juga memiliki perbedaan yang cukup signifikan. Berdasarkan grafik waktu eksekusi

pembentukan minimal non-redundant

association rules dan aturan asosiasi dari penelitian sebelumnya (Widodo 2004) untuk empat nilai minsup yang ditunjukkan pada Gambar 5, semakin kecil nilai minsup, maka waktu eksekusi untuk pembentukan minimal non-redundant association rules dan aturan asosiasi semakin lama.

Rataan perbedaan waktu eksekusi pembentukan aturan asosiasi untuk masing-masing nilai minsup berbeda-beda. Untuk

minsup 5 %, rataan perbedaan waktu eksekusi adalah 9 detik, minsup 2 % adalah 40,45 detik,

minsup 1% adalah 192 detik (sekitar 3,5 menit), dan minsup 0,5 % adalah 1035 detik (sekitar 17,25 menit).


(21)

Hasil Perbandingan Mining Minimal Non-Redundant Association Rules dengan

Mining Association Rules pada Penelitian Widodo(2004)

Algoritma Apriori yang digunakan pada penelitian Widodo (2004), membentuk large itemset dengan membangkitkan itemset lattice

yang ada dalam basis data. Secara umum

proses pembangkitan itemset lattice

memerlukan waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.

Algoritma Close menggunakan closed itemset lattice yang merupakan sub-order dari

itemset lattice untuk membentuk generators

dan frequent closed itemsets. Penggunaan

closed itemset lattice bisa mengurangi waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.

Generators dan frequent closed itemsets

yang dihasilkan algoritma Close sangat

mempengaruhi pembentukan minimal

non-redundant association rules. Proses pruning

kedua dalam algoritma Close bertujuan

menghilangkan frequent closed itemsets yang berulang, sehingga tidak terjadi pembentukan aturan asosiasi yang berulang dalam minimal non-redundant association rules.

Grafik total waktu eksekusi minimal non-redundant association rules mining, meliputi waktu pembentukan frequent closed itemsets

(algoritma Close) dan waktu rata-rata

pembentukan minimal non-redundant

association rules (MNRAA) pada penelitian ini dapat dilihat pada Gambar 6.

0 100 200 300 400 500 600

5 2 1 0,5

Minsup (%)

W

aktu (detik)

MNRAA Close

Gambar 6 Total waktu eksekusi minimal non-redundant association rules mining.

Grafik total waktu eksekusi association rules mining, meliputi waktu pembentukan

large itemsets (algoritma Apriori) dan waktu rata-rata pembentukan aturan asosiasi (AA) pada penelitian Widodo (2004) dapat dilihat pada Gambar 7.

0 200 400 600 800 1000 1200

5 2 1 0,5

Minsup (%)

Waktu (detik)

AA Apriori

Gambar 7 Total waktu eksekusi

association rules mining. Grafik pada Gambar 6 dan Gambar 7

menunjukkan pada minsup 5 % dan 2 %,

minimal non-redundant association rules mining membutuhkan waktu eksekusi lebih lama. Minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close, sedangkan

association rules mining membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi. Pada minsup 1 % dan 0,5 %, association rules mining membutuhkan waktu eksekusi

lebih lama. Association rules mining

membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi, sedangkan

minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close.

Penelitian ini menggunakan data transaksi yang bersifat tidak padat sehingga memiliki korelasi yang lemah dalam data. Hal

ini membuat algoritma Close tidak

memperlihatkan keunggulannya dalam efisiensi waktu dan penggunaan sumberdaya komputasi.

Pembentukan minimal non-redundant

association rules membutuhkan waktu eksekusi lebih sedikit. Pembentukan aturan asosiasi yang menggunakan aplikasi penelitian Widodo (2004) membutuhkan waktu eksekusi yang lebih lama. Hal ini disebabkan pembentukan aturan asosiasi dilakukan dengan mengkombinasikan semua item yang

ada dalam large itemset, sehingga

membutuhkan waktu eksekusi yang lebih lama dan sumberdaya komputasi yang besar.

Berdasarkan data transaksi yang digunakan, jumlah aturan asosiasi yang dihasilkan oleh aplikasi penelitian Widodo (2004) lebih kecil dibandingkan jumlah

minimal non-redundant association rules. Aturan asosiasi yang berulang tidak terbentuk karena dipengaruhi sifat data yang digunakan pada penelitian ini, sehingga keunggulan


(22)

mining minimal non-redundant association rules tidak terlihat.

Meskipun begitu, mining minimal non-redundant association rules mampu menghasilkan aturan asosiasi yang mengandung informasi lebih banyak yang tidak dihasilkan oleh aplikasi penelitian sebelumnya (Widodo 2004). Terbentuknya aturan asosasi tersebut merupakan keunggulan lain yang dimiliki mining minimal non-redundant association rules.

Berdasarkan hasil perbandingan, mining minimal non-redundant association rules

memiliki keunggulan dibandingkan mining association rules pada penelitian sebelumnya (Widodo 2004). Keunggulan dalam waktu eksekusi, penggunaan sumberdaya komputasi dan hasil aturan asosiasi yang dihasilkan.

Pada penelitian ini, keunggulan mining non-redundant association rules hanya terlihat

pada proses pembentukan minimal

non-redundant association rules saja. Algoritma

Close tidak memperlihatkan keunggulannya karena sifat data transaksi yang tidak padat dan berkorelasi lemah.

KESIMPULAN DAN SARAN

Kesimpulan

Penelitian ini menerapkan teknik minimal non-redundant association rules mining

menggunakan generators dan frequent closed itemsets untuk membentuk aturan asosisi yang tidak berulang. Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice, untuk membentuk generators dan frequent closed itemsets.

Minimal non-redundant association rules mining menghasilkan aturan asosiasi yang mengandung informasi lebih banyak dibandingkan dengan mining association rules. Pada penelitian ini, mining minimal non-redundant association rules mampu menghasilkan aturan asosiasi 003, 009 → 008 (susu, pelengkap roti → snack) dengan nilai

support 0,7 % dan confidence 78,67 % untuk

nilai minsup 0,5 % dan mincof 75 %

sedangkan mining association rules tidak menghasilkan aturan tersebut.

Berdasarkan hasil penelitian, dapat

dinyatakan keunggulan minimal

non-redundant association rules mining sebagai berikut:

1 menghasilkan aturan asosiasi yang tidak berulang dengan anteseden yang minimal dan konsekuen yang maksimal,

2 menghasilkan aturan asosasi yang lebih banyak mengandung informasi dari basis data. Jika dihasilkan aturan asosiasi 001

→ 003 (mie instant → susu) maka akan dihasilkan juga aturan asosasi 003 → 001 (susu → mie instant) dengan informasi nilai support yang sama tetapi nilai

confidence yang berbeda,

3 efisiensi terhadap waktu eksekusi dan

penggunaan sumberdaya komputasi. Waktu eksekusi pembentukan aturan asosiasi tercepat adalah 2 detik yang terjadi pada nilai minsup terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai

minsup terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close

membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minsup, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Saran

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan dapat dicobakan dengan menggunakan data yang bersifat padat dan memiliki korelasi tinggi,

sehingga mining minimal non-redundant

association rules dapat memperlihatkan keunggulannya.

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan, dapat dikembangkan dengan menggunakan algoritma lain untuk membentuk generators

dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.

DAFTAR PUSTAKA

Bastide Y, Pasquier N, Taouil R, Stumme G, Lakhal L. 2000. Mining Minimal Non-Redundant Association Rules using Frequent Closed Itemsets. France: Blaise Pascal University.

Godin R, Missaoui R, Alaoui H. 1995.

Incremental Concept Formation Algorithms based on Galois (Concept)

Lattices. Computational Intelligence: 246-267.


(23)

Han J, Kamber M. 2006. Data Mining: Concepts and Techniques (second edition). San Diego, USA: Morgan-Kaufmann.

Pasquier N, Bastide Y, Taouil R, Lakhal L. 1998. Pruning Closed Itemset Lattices for Association Rules. France: Blaise Pascal University.

---. 1999. Discovering Closed Itemsets for Association Rules. France: Blaise Pascal University.

Priss U. 2006. Formal Concept Analysis in Information Science. Di dalam: Cronin,

Blaise, editor. Annual Review of

Information Science and Technology. American Society for Information Science and Technology. hlm 521-543.

Widodo S. 2004. Penerapan Data Mining dengan Metode Association Rule untuk Analisis Cross-Market (Studi Kasus: Toko Sinar Bogor) [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.


(24)

(1)

memenuhi empat nilai minsup yang dicobakan dapat dilihat pada Lampiran 3.

Tabel 2 Pembentukan frequent closed itemsets (FC)

Minsup (%) Parameter

5 2 1 0,5 Kandidat FC1 35 35 35 35

FC1 13 19 24 30

Kandidat FC2 78 171 276 435

FC2 2 11 37 87

Kandidat FC3 - 5 93 407

FC3 - - 5 34

Kandidat FC4 - - - 22

FC4 - - - -

Hasil pembentukan kandidat FC dan FC

dibandingkan dengan hasil pembentukan kandidat itemset dan large itemset

menggunakan algoritma Apriori dari penelitian sebelumnya (Widodo 2004). Jumlah kandidat itemset dan large itemset yang memenuhi empat nilai minsup yang dicobakan dapat dilihat pada Tabel 3.

Tabel 3 Pembentukan large itemset Minsup (%) Parameter

5 2 1 0,5 Kandidat 1-itemset 35 35 35 35

Large 1-itemset 13 19 24 30

Kandidat 2-itemset 78 171 276 435

Large 2-itemset 2 11 37 87

Kandidat 3-itemset - 5 93 407

Large 3-itemset - - 5 34

Kandidat 4-itemset - - - 23

Large 4-itemset - - - -

Grafik waktu eksekusi pembentukan kandidat FC dan FC (algoritma Close), dan pembentukan kandidat itemset dan large itemset (algoritma Apriori) untuk empat nilai

minsup yang dicobakan, dapat dilihat pada Gambar 4.

0 100 200 300 400 500 600

5 2 1 0,5

Minsup (%)

W

akt

u (

de

ti

k)

Apriori Close

Gambar 4 Grafik waktu eksekusi. Berdasarkan data pada Tabel 2 dan Tabel 3 dapat dapat dinyatakan bahwa jumlah

kandidat FC dan kandidat itemset yang terbentuk sama kecuali pada minsup 0,5 %. Algoritma Close membentuk 22 kandidat FC4

sedangkan algoritma Apriori menghasilkan 23 kandidat 4-itemset.

Perbedaan hasil pada kandidat FC4,

disebabkan proses pemangkasan (pruning) kedua pada generator dalam pembentukan kandidat FC4. Generator {003, 008, 009, 025}

adalah subset dari atau sama dengan closed itemset dari generator {003, 009, 025} dalam

FC3.

Jumlah FC dari kandidat FC dan jumlah

large itemset dari kandidat itemset yang memenuhi keempat nilai minsup sama. Algoritma Close menghasilkan FC yang identik dengan hasil large itemset dari algoritma Apriori.

Hasil algoritma Close berupa kandidat FC

dan FC identik dengan hasil algoritma Apriori

berupa kandidat itemset dan large itemset. Hal ini disebabkan data transaksi yang ditambang bersifat sparse (jarang) atau tidak padat. Data transaksi yang digunakan dalam penelitian ini bersifat tidak padat karena banyak mengandung nilai null. Data transaksi yang jarang mengakibatkan korelasi dalam data lemah.

Data transaksi yang bersifat jarang dan berkorelasi rendah mempengaruhi hasil dari algoritma Close dimana hasil closed itemsets

dari generator adalah generator itu sendiri. Oleh sebab itu, kedua proses pruning dalam algoritma Close tidak bisa memperkecil iterasi proses pembentukan set FC dan memperkecil jumlah kandidat FC dan FC yang terbentuk.

Grafik pada Gambar 4 menunjukkan waktu eksekusi algoritma Close lebih lama dibandingkan waktu eksekusi algoritma

Apriori. Algoritma Close membutuhkan waktu lebih untuk proses akses pada basis data selama proses pembentukan kandidat FC dan

FC. Hal ini juga disebabkan waktu yang digunakan dua proses pruning dalam algoritma Close untuk memperkecil iterasi pembentukan set FC menjadi tidak berguna. Oleh sebab itu, waktu eksekusi algoritma

Close menjadi lebih lama.

Berdasarkan data pada Tabel 2 dan Tabel 3, semakin tinggi nilai minsup, maka semakin kecil jumlah FC dan large itemset yang diperoleh dari masing-masing kandidat. Berdasarkan grafik pada Gambar 3, semakin kecil nilai minsup maka semakin lama waktu eksekusi untuk algoritma Close dan Apriori.


(2)

Pembentukan Minimal Non-Redundant Association Rules

Minimal non-redundant association rules

dibentuk menggunakan data hasil generators

dan frequent closed itemsets yang memenuhi empat nilai minsup yang telah dicobakan. Jumlah minimal non-redundant association rules terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 4. Jumlah minimal non-redundant association rules untuk nilai

minsup dan mincof yang dicobakan terdapat pada Lampiran 4.

Tabel 4 Jumlah minimal non-redundant associaton rules

Minsup (%)

Mincof

(%) 5 2 1 0,5

75 0 0 0 1

70 0 0 1 2

65 0 0 2 4

60 0 0 3 10

55 0 0 5 15

50 0 1 8 25

45 0 1 8 26

40 1 3 10 39

30 1 5 19 73

20 4 14 44 128

10 4 19 77 226

Berdasarkan data hasil large itemset yang memenuhi empat nilai minsup yang telah dicobakan, dilakukan pembentukan aturan asosiasi menggunakan aplikasi penelitian sebelumnya (Widodo 2004). Jumlah aturan asosiasi terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 5.

Tabel 5 Jumlah aturan asosiasi

Minsup (%)

Mincof

(%) 5 2 1 0,5

75 0 0 0 0

70 0 0 1 1

65 0 0 1 2

60 0 0 2 3

55 0 0 4 5

50 0 0 4 8

45 0 0 4 9

40 1 2 6 15

30 1 3 7 22

20 2 9 16 39

10 2 11 34 71

Pembentukan aturan asosiasi untuk empat nilai minsup yang dicobakan dengan nilai

mincof > 78,67 % tidak lagi menghasilkan aturan asosiasi.

Grafik waktu eksekusi pembentukan

minimal non-redundant association rules

(MNRAA) pada penelitian ini dan aturan asosiasi (AA) pada penelitian Widodo (2004) untuk empat nilai minsup dan 11 nilai mincof

yang dicobakan, dapat dilihat pada Gambar 5.

0 2 4 6 8 10 12

75 70 65 60 55 50 45 40 30 20 10

Mincof (%)

Waktu (

d

etik)

MNRAA AA

(a)

0 10 20 30 40 50

75 70 65 60 55 50 45 40 30 20 10

Mincof (%)

Waktu (detik)

MNRAA AA

(b)

0 40 80 120 160 200

75 70 65 60 55 50 45 40 30 20 10

Mincof (%)

Waktu (detik)

MNRAA AA

(c)

0 200 400 600 800 1000 1200

75 70 65 60 55 50 45 40 30 20 10

Mincof (%)

Wa

ktu (

d

eti

k

)

MNRAA AA

(d)

Gambar 5 Waktu eksekusi pembentukan MNRAA dan AA dari (a)

minsup 5 %, (b) minsup 2 %, (c)

minsup 1 %, dan (d) minsup


(3)

Berdasarkan data hasil pada Tabel 4 dan Tabel 5, semakin kecil nilai minsup dan

mincof maka jumlah aturan asosiasi yang dihasilkan semakin banyak. Untuk setiap nilai

minsup dan mincof yang dicobakan, jumlah

minimal non-redundant association rules yang dihasilkan lebih banyak dari jumlah aturan asosiasi.

Pada nilai minsup 2 % dengan nilai mincof

50 % dan 45 %, aturan asosiasi tidak menghasilkan aturan sedangkan minimal

non-redundant association rules telah

menghasilkan aturan asosiasi, yaitu aturan 026

→ 013 (pasta gigi → sabun) dengan support

2,67 % dan confidence 53,64 %. Hal ini berarti 2,67 % dari konsumen akan membeli pasta gigi dan sabun bersamaan dan 53,64 % dari konsumen yang membeli pasta gigi akan selalu diikuti dengan pembelian sabun.

Untuk nilai minsup 0,5 % dan mincof

75 % aturan asosiasi tidak menghasilkan aturan sedangkan minimal non-redundant association rules dapat menghasilkan aturan, yaitu aturan 003, 009 → 008 (susu, pelengkap roti → snack) dengan support 0,7 % dan

confidence 78,67 %. Hal ini berarti 0,7 % dari konsumen akan membeli susu, pelengkap roti dan snack bersamaan dan 78,67 % dari konsumen yang membeli susu dan pelengkap roti akan selalu diikuti dengan pembelian snack.

Data minimal non-redundant association rules dengan nilai confidence terbesar dari empat nilai minsup yang telah dicobakan dapat dilihat pada Tabel 6. Data minimal non-redundant association rules yang memiliki korelasi positif dan korelasi negatif terdapat pada Lampiran 5 dan 6.

Tabel 6 Minimal non-redundant association rules dengan nilai confidence terbesar

Minsup

(%)

Aturan Asosiasi

Support

(%)

Confidence

(%) 5 susu → snack 6,54 44,64 2 pasta gigi →

sabun

2,67 53,64 1 susu, permen →

snack

1,21 70,44 0,5 susu, pelengkap

roti → snack

0,7 78,67

Data aturan asosiasi dengan nilai

confidence terbesar dari empat nilai minsup

yang telah dicobakan pada penelitian sebelumnya (Widodo 2004) dapat dilihat pada Tabel 7.

Tabel 7 Aturan asosiasi dengan nilai

confidence terbesar

Minsup

(%)

Aturan Asosiasi

Support

(%)

Confidence

(%) 5 susu → snack 6,54 44,64 2 susu → snack 6,54 44,64 1 susu, permen

→ snack

1,21 70,44 0,5 susu, permen

→ snack

1,21 70,44

Berdasarkan data hasil pada Tabel 6 dan Tabel 7, mining minimal non-redundant association rules menghasilkan aturan asosiasi dengan nilai confidence tertinggi yang berbeda-beda untuk empat nilai minsup yang dicobakan. association rules mining pada penelitian Widodo (2004) menghasilkan aturan asosiasi dengan confidence tertinggi yang sama untuk minsup 5% dan 2 %, begitu juga untuk minsup 1 % dan 0,5 %

Minimal non-redundant association rules

menghasilkan aturan asosasi yang lebih banyak mengandung informasi dibandingkan aturan asosiasi yang dihasilkan pada penelitian sebelumnya (Widodo 2004). Jika penelitian Widodo (2004) menghasilkan aturan asosiasi (013 → 026) untuk minsup

1 % dan mincof 10 %, maka selain menghasilkan aturan asosasi yang sama,

minimal non-redundant association rules juga menghasilkan aturan asosasi (026 → 013) dengan informasi nilai support yang sama, yaitu 2,67 % tetapi nilai confidence yang berbeda. Nilai confidence aturan asosiasi (013

→ 026) adalah 26,7 % sedangkan aturan asosiasi (026 → 013) adalah 53,64 %.

Selain membentuk aturan asosiasi yang berbeda, waktu eksekusi pembentukan aturan asosiasi juga memiliki perbedaan yang cukup signifikan. Berdasarkan grafik waktu eksekusi pembentukan minimal non-redundant association rules dan aturan asosiasi dari penelitian sebelumnya (Widodo 2004) untuk empat nilai minsup yang ditunjukkan pada Gambar 5, semakin kecil nilai minsup, maka waktu eksekusi untuk pembentukan minimal non-redundant association rules dan aturan asosiasi semakin lama.

Rataan perbedaan waktu eksekusi pembentukan aturan asosiasi untuk masing-masing nilai minsup berbeda-beda. Untuk

minsup 5 %, rataan perbedaan waktu eksekusi adalah 9 detik, minsup 2 % adalah 40,45 detik,

minsup 1% adalah 192 detik (sekitar 3,5 menit), dan minsup 0,5 % adalah 1035 detik (sekitar 17,25 menit).


(4)

Hasil Perbandingan Mining Minimal Non-Redundant Association Rules dengan

Mining Association Rules pada Penelitian Widodo(2004)

Algoritma Apriori yang digunakan pada penelitian Widodo (2004), membentuk large itemset dengan membangkitkan itemset lattice

yang ada dalam basis data. Secara umum proses pembangkitan itemset lattice

memerlukan waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.

Algoritma Close menggunakan closed itemset lattice yang merupakan sub-order dari

itemset lattice untuk membentuk generators

dan frequent closed itemsets. Penggunaan

closed itemset lattice bisa mengurangi waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.

Generators dan frequent closed itemsets

yang dihasilkan algoritma Close sangat mempengaruhi pembentukan minimal non-redundant association rules. Proses pruning

kedua dalam algoritma Close bertujuan menghilangkan frequent closed itemsets yang berulang, sehingga tidak terjadi pembentukan aturan asosiasi yang berulang dalam minimal non-redundant association rules.

Grafik total waktu eksekusi minimal non-redundant association rules mining, meliputi waktu pembentukan frequent closed itemsets

(algoritma Close) dan waktu rata-rata pembentukan minimal non-redundant association rules (MNRAA) pada penelitian ini dapat dilihat pada Gambar 6.

0 100 200 300 400 500 600

5 2 1 0,5

Minsup (%)

W

aktu (detik)

MNRAA Close

Gambar 6 Total waktu eksekusi minimal non-redundant association rules mining.

Grafik total waktu eksekusi association rules mining, meliputi waktu pembentukan

large itemsets (algoritma Apriori) dan waktu rata-rata pembentukan aturan asosiasi (AA) pada penelitian Widodo (2004) dapat dilihat pada Gambar 7.

0 200 400 600 800 1000 1200

5 2 1 0,5

Minsup (%)

Waktu (detik)

AA Apriori

Gambar 7 Total waktu eksekusi

association rules mining. Grafik pada Gambar 6 dan Gambar 7 menunjukkan pada minsup 5 % dan 2 %,

minimal non-redundant association rules mining membutuhkan waktu eksekusi lebih lama. Minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close, sedangkan

association rules mining membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi. Pada minsup 1 % dan 0,5 %, association rules mining membutuhkan waktu eksekusi lebih lama. Association rules mining

membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi, sedangkan

minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close.

Penelitian ini menggunakan data transaksi yang bersifat tidak padat sehingga memiliki korelasi yang lemah dalam data. Hal ini membuat algoritma Close tidak memperlihatkan keunggulannya dalam efisiensi waktu dan penggunaan sumberdaya komputasi.

Pembentukan minimal non-redundant

association rules membutuhkan waktu

eksekusi lebih sedikit. Pembentukan aturan asosiasi yang menggunakan aplikasi penelitian Widodo (2004) membutuhkan waktu eksekusi yang lebih lama. Hal ini disebabkan pembentukan aturan asosiasi dilakukan dengan mengkombinasikan semua item yang ada dalam large itemset, sehingga membutuhkan waktu eksekusi yang lebih lama dan sumberdaya komputasi yang besar.

Berdasarkan data transaksi yang digunakan, jumlah aturan asosiasi yang dihasilkan oleh aplikasi penelitian Widodo (2004) lebih kecil dibandingkan jumlah

minimal non-redundant association rules. Aturan asosiasi yang berulang tidak terbentuk karena dipengaruhi sifat data yang digunakan pada penelitian ini, sehingga keunggulan


(5)

mining minimal non-redundant association rules tidak terlihat.

Meskipun begitu, mining minimal

non-redundant association rules mampu

menghasilkan aturan asosiasi yang mengandung informasi lebih banyak yang tidak dihasilkan oleh aplikasi penelitian sebelumnya (Widodo 2004). Terbentuknya aturan asosasi tersebut merupakan keunggulan lain yang dimiliki mining minimal non-redundant association rules.

Berdasarkan hasil perbandingan, mining minimal non-redundant association rules

memiliki keunggulan dibandingkan mining association rules pada penelitian sebelumnya (Widodo 2004). Keunggulan dalam waktu eksekusi, penggunaan sumberdaya komputasi dan hasil aturan asosiasi yang dihasilkan.

Pada penelitian ini, keunggulan mining non-redundant association rules hanya terlihat pada proses pembentukan minimal non-redundant association rules saja. Algoritma

Close tidak memperlihatkan keunggulannya karena sifat data transaksi yang tidak padat dan berkorelasi lemah.

KESIMPULAN DAN SARAN

Kesimpulan

Penelitian ini menerapkan teknik minimal non-redundant association rules mining

menggunakan generators dan frequent closed itemsets untuk membentuk aturan asosisi yang tidak berulang. Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice, untuk membentuk generators dan frequent closed itemsets.

Minimal non-redundant association rules mining menghasilkan aturan asosiasi yang mengandung informasi lebih banyak dibandingkan dengan mining association rules. Pada penelitian ini, mining minimal

non-redundant association rules mampu

menghasilkan aturan asosiasi 003, 009 → 008 (susu, pelengkap roti → snack) dengan nilai

support 0,7 % dan confidence 78,67 % untuk nilai minsup 0,5 % dan mincof 75 % sedangkan mining association rules tidak menghasilkan aturan tersebut.

Berdasarkan hasil penelitian, dapat dinyatakan keunggulan minimal non-redundant association rules mining sebagai berikut:

1 menghasilkan aturan asosiasi yang tidak berulang dengan anteseden yang minimal dan konsekuen yang maksimal,

2 menghasilkan aturan asosasi yang lebih banyak mengandung informasi dari basis data. Jika dihasilkan aturan asosiasi 001

→ 003 (mie instant → susu) maka akan dihasilkan juga aturan asosasi 003 → 001 (susu → mie instant) dengan informasi nilai support yang sama tetapi nilai

confidence yang berbeda,

3 efisiensi terhadap waktu eksekusi dan penggunaan sumberdaya komputasi. Waktu eksekusi pembentukan aturan asosiasi tercepat adalah 2 detik yang terjadi pada nilai minsup terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai

minsup terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close

membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minsup, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Saran

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan dapat dicobakan dengan menggunakan data yang bersifat padat dan memiliki korelasi tinggi, sehingga mining minimal non-redundant association rules dapat memperlihatkan keunggulannya.

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan, dapat dikembangkan dengan menggunakan algoritma lain untuk membentuk generators

dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.

DAFTAR PUSTAKA

Bastide Y, Pasquier N, Taouil R, Stumme G, Lakhal L. 2000. Mining Minimal Non-Redundant Association Rules using Frequent Closed Itemsets. France: Blaise Pascal University.

Godin R, Missaoui R, Alaoui H. 1995.

Incremental Concept Formation Algorithms based on Galois (Concept)

Lattices. Computational Intelligence: 246-267.


(6)

mining minimal non-redundant association rules tidak terlihat.

Meskipun begitu, mining minimal

non-redundant association rules mampu

menghasilkan aturan asosiasi yang mengandung informasi lebih banyak yang tidak dihasilkan oleh aplikasi penelitian sebelumnya (Widodo 2004). Terbentuknya aturan asosasi tersebut merupakan keunggulan lain yang dimiliki mining minimal non-redundant association rules.

Berdasarkan hasil perbandingan, mining minimal non-redundant association rules

memiliki keunggulan dibandingkan mining association rules pada penelitian sebelumnya (Widodo 2004). Keunggulan dalam waktu eksekusi, penggunaan sumberdaya komputasi dan hasil aturan asosiasi yang dihasilkan.

Pada penelitian ini, keunggulan mining non-redundant association rules hanya terlihat pada proses pembentukan minimal non-redundant association rules saja. Algoritma

Close tidak memperlihatkan keunggulannya karena sifat data transaksi yang tidak padat dan berkorelasi lemah.

KESIMPULAN DAN SARAN

Kesimpulan

Penelitian ini menerapkan teknik minimal non-redundant association rules mining

menggunakan generators dan frequent closed itemsets untuk membentuk aturan asosisi yang tidak berulang. Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice, untuk membentuk generators dan frequent closed itemsets.

Minimal non-redundant association rules mining menghasilkan aturan asosiasi yang mengandung informasi lebih banyak dibandingkan dengan mining association rules. Pada penelitian ini, mining minimal

non-redundant association rules mampu

menghasilkan aturan asosiasi 003, 009 → 008 (susu, pelengkap roti → snack) dengan nilai

support 0,7 % dan confidence 78,67 % untuk nilai minsup 0,5 % dan mincof 75 % sedangkan mining association rules tidak menghasilkan aturan tersebut.

Berdasarkan hasil penelitian, dapat dinyatakan keunggulan minimal non-redundant association rules mining sebagai berikut:

1 menghasilkan aturan asosiasi yang tidak berulang dengan anteseden yang minimal dan konsekuen yang maksimal,

2 menghasilkan aturan asosasi yang lebih banyak mengandung informasi dari basis data. Jika dihasilkan aturan asosiasi 001

→ 003 (mie instant → susu) maka akan dihasilkan juga aturan asosasi 003 → 001 (susu → mie instant) dengan informasi nilai support yang sama tetapi nilai

confidence yang berbeda,

3 efisiensi terhadap waktu eksekusi dan penggunaan sumberdaya komputasi. Waktu eksekusi pembentukan aturan asosiasi tercepat adalah 2 detik yang terjadi pada nilai minsup terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai

minsup terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close

membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minsup, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Saran

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan dapat dicobakan dengan menggunakan data yang bersifat padat dan memiliki korelasi tinggi, sehingga mining minimal non-redundant association rules dapat memperlihatkan keunggulannya.

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan, dapat dikembangkan dengan menggunakan algoritma lain untuk membentuk generators

dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.

DAFTAR PUSTAKA

Bastide Y, Pasquier N, Taouil R, Stumme G, Lakhal L. 2000. Mining Minimal Non-Redundant Association Rules using Frequent Closed Itemsets. France: Blaise Pascal University.

Godin R, Missaoui R, Alaoui H. 1995.

Incremental Concept Formation Algorithms based on Galois (Concept)

Lattices. Computational Intelligence: 246-267.