Pembentukan Large Itemset Dengan Pembentukan Large itemset dengan
Knowledge Representation
Knowledge representation merupakan tahap
untuk merepresentasikan hasil asosiasi yang diperoleh ke dalam bentuk yang mudah
dipahami. Pada penelitian ini, knowledge representation
mendeskripsikan hasil
penelitian.
Lingkungan Pengembangan
Penelitian ini dilakukan dalam lingkungan pengembangan sebagai berikut :
Perangkat lunak : - Microsoft Windows 7
- MySQL client - PHP
- Browser
Perangkat Keras : - Processor AMD E350
- 2 GB RAM - Harddisk kapasitas 320 GB
- Monitor dengan resolusi 1280 x 800 piksel
HASIL DAN PEMBAHASAN
Pada penelitian ini, data yang digunakan adalah data transaksi pembelian Sinar Mart
Swalayan selama periode waktu 1 Maret hingga 31 Maret 2004. Data transaksi pembelian yang
didapat memiliki tiga atribut
,
yaitu customer id sid, waktu transaksi eid, dan barang yang
dibeli item. Data didapat dalam format Microsoft Excel transaksi_maret2004.xlsx.
Urutan pengerjaan digambarkan pada Lampiran 1 dan deskripsi sampel data transaksi pembelian
Sinar Mart Swalayan dapat dilihat pada Lampiran 2.
Pembersihan Data
Pembersihan data dilakukan apabila terdapat data pembelian barang yang sama pada satu
transaksi, pembelian barang tersebut dicatat hanya satu kali.
Transformasi Data
Pada tahap ini dilakukan beberapa proses transformasi data, yaitu:
1 Konversi waktu transaksi eid ke dalam bentuk numerik. Waktu transaksi eid yang
semula berformat date diubah menjadi numerik dengan mengganti format date
menjadi number yang terdapat pada Microsoft Excel untuk menyesuaikan ke
dalam format MySQL.
2 Konversi item ke dalam bentuk numerik. Item
s yang dibeli oleh pembeli diubah ke dalam bentuk numerik dengan memberikan
kode yang dimulai dari 1 hingga 35. Mie instan dikodekan dengan 1, minyak goreng
dikodekan dengan 2, demikian halnya dengan jenis barang lain. Format item yang
dikonversi ke dalam bentuk numerik dapat dilihat pada Lampiran 3. Data hasil konversi
terdiri atas 11866 baris, 308 pembeli yang berbeda dan 35 item yang berbeda. Sampel
data transaksi pembelian setelah praproses dapat dilihat pada Lampiran 4.
Data mining
Pada tahap ini, percobaan dilakukan terhadap data transaksi pembelian Sinar Mart
Swalayan yang telah melewati tahap praproses sebanyak 11866 record. Tahapan-tahapan yang
dilakukan, yaitu
1 Identifikasi interesting itemset
Sebelum mencari interesting itemset pada NAR
adalah menemukan
frequent dan
infrequent itemset . Pada tahap ini, pengguna
harus terlebih dahulu memberikan nilai minimum
support. Nilai minimum support digunakan
ialah 10, 30, 50, 70. Selanjutnya, dari masing-masing hasil min_sup
tersebut, jika min_sup 70 tidak ada itemset yang memenuhi, kemudian diturunkan hingga
min_sup 50 hanya didapatkan frequent itemset
dengan 1 itemset, yaitu itemset snack dengan
support 53.81.
Hasil pada min_sup 50 tidak bisa dijadikan sebagai bahan untuk analisis, karena
karena pada
large 1-itemset
hanya menghasilkan 1 itemset, sehingga pada large 2-
itemset tidak bisa menghasilkan frequent dan
infrequent itemset
. Kemudian,
min_sup diturunkan lagi dan dicoba dengan min_sup
30 dan 10.