Implementasi Data Mining Terhadap Penentuan Paket Hemat Sembako dan Kebutuhan Harian Mengunakan Aturan Association Rule di Primer Koperasi Kartika Baja Cilegon
1. DATA DIRI
Nama : Shativa Sonrisa Tempat/Tanggal Lahir : Serang / 1 Oktober 1994 Jenis Kelamin : Perempuan Status Pernikahan : Belum Menikah Warga Negara : Indonesia Agama : Islam Alamat : Jln. Kramat Jaya 1 No 11, Kramat Watu, Serang-
Banten, 42161 (Komplek Tomon) Nomor Telepon : 081285058958 Email : [email protected] 2.
RIWAYAT PENDIDIKAN a.
2001 - 2007 : SDK BPK Penabur Serang b.
2007 - 2009 : SMPN 1 Kota Serang c.
2009 - 2011 : SMAN 2 Kota Serang d.
2012 - Sekarang : Universitas Komputer Indonesia,Bandung
IMPLEMENTASI DATA MINING TERHADAP
PENENTUAN PAKET HEMAT SEMBAKO DAN
KEBUTUHAN HARIAN MENGGUNAKAN ATURAN
ASSOCIATION RULE DI PRIMER KOPERASI
KARTIKA BAJA CILEGON DENGAN ALGORITMA
FP-GROWTH
SKRIPSI
Diajukan Untuk Menempuh Ujian Akhir Sarjana
Shativa Sonrisa
10112281
KATA PENGANTAR
Assalamu’alaikum Wr. Wb., Alhamdulillahi Rabbil ‘alamiin, puji dan syukur pemulis panjatkan
kehadirat Allah SWT, karena atas berkah, rahmat, dan hidayahNya sehingga penulis dapat menyelesaikan laporan tugas akhir (skripsi) ini dengan baik. Adapun laporan tugas akhir ini syarat utama untuk memenuhi kelulusan program pendidikan Strata 1 jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia.
Penulis sangat menyadari bahwa masih banyak kekurangan dalam penyusunan laporan tugas akhir sehingga masih jauh dari kata sempurna dan tidak luput dari kesalahan. Hal ini dikarenakan oleh pengetahuan, pengalaman, dan kemampuan penulis yang terbatas. Oleh karena itu, kritik dan saran yang membangun sangat penulis harapkan untuk menyempurnakannya laporan tugas akhir ini.
Selama menulis laporan tugas akhir ini, penulis telah mendapat banyak sekali bimbingan dan bantuan dari berbagai pihak yang telah dengan segenap hati dan keikhlasan yang penuh membantu dan membimbing penulis dalam menyelesaikan laporan ini. Dengan kesadaran hati, penulis ucapkan terima kasih kepada: 1.
Allah SWT yang telah memberikan segala yang terbaik sehingga penulis dapat dengan lancar menyelesaikan tugas akhir ini.
2. Kedua orang tuaku, Amaludin Bachtiar dan Marhaen Dyah Ismoyowati,
keikhlasannya membimbing dan memberikan ilmunya kepada penulis dalam menulis laporan tugas akhir ini.
4. Ibu Dian Dharmayanti, S.T., M.Kom. selaku reviewer seminar dan dosen penguji I yang telah banyak memberi masukan serta revisi yang sangat berarti dalam penelitian ini.
5. Ibu Kania Evita Dewi, S.Pd., M.Si. selaku penguji III yang telah memberi masukan yang membangun.
6. Bapak Irfan Maliki, S.T., M.T. selaku dosen wali IF-7 2012, serta Bapak dan Ibu dosen Fakultas Teknik Informatika yang telah memberi banyak ilmu baru.
7. Kedua kakakku, Adam Mukharil Bachtiar, S.Kom., M.T. dan Anrio Sonri Bachtiar, S.T. yang telah menghibur penulis di saat-saat sulit.
8. Fitria Indrianti dan Ahmad Sopian, S.Kom. yang telah memberi banyak bantuan kepada penulis saat diperlukan.
9. Teman-teman IF-7, Archena, Ardi, Fahrul dan teman-teman bimbingan Pak Adam dan Bu Dian terutama Dinar Priskawati, Luthfia Sarafina.N, dan Wisnu Bima Prasetyo, S.Kom. yang telah setia menemani penulis saat tugas akhir berlangsung.
10. Primer Koperasi Kartika Baja Kodim Cilegon yang telah mengizinkan dan memberikan data untuk penelitian tugas akhir ini. Dan semua pihak yang tidak dapat penulis tuliskan namanya satu persatu yang telah memberikan dorongan semangat kepada penulis.
Bandung, 25 Agustus 2016
DAFTAR ISI
DAFTAR PUSTAKA
[1] Erwin, “Analisis Market BAsket Dengan Algoritma Apriori dan Fp-Growth,” vol. 4, 2009. [2] P. Chapman, 2000. [Online]. Available: http://the- modeling- agency.com/crisp-dm.pdf.. [Diakses 14 3 2016]. [3]
F. “Buku Teks Komputer,” dalam Basis Data, 5th ed, Bandung, Informatika, 2004. [4] R. Ramaksrihnan dan J. Gehrke, dalam Sistem Manajemen Database Edisi 3, Penerbit Andi, p. 3. [5]
B. Santosa, “Data Minning,” dalam Teknik Pemanfaat Data Untuk Keperluan Bisnis, Yogyakarta, Graha Ilmu, 2007.
[6] W. A. Triyanto, V. Suhartono dan H. H. , “Analisis Keranjang Pasar Menggunakan K-Medoids dan FP-
Growth,” Jurnal Psedocode.ISSN 2355- 5920, vol. 2, 2014. [7] J. Han, J. Pei, Y. Yin dan R. Mao, Mining Frequent Pattern without Candidate Generation, Netherlands: Kluwer Academic Publishers, 2004. [8] P. Chapman, J. Clinto, R. Kerber, T. Khabaza, T. Reinartz, C. Shearer dan R.
Wirth. [Online]. Available: https://www.the-modeling-agency.com/crisp- dm.pdf. [Diakses 15 Maret 2016].
BAB 1 PENDAHULUAN
1.1 Latar Belakang Masalah
Primer Koperasi Kartika Baja adalah sebuah usaha perdagangan barang dan jasa di Kodim 0623 Cilegon. Koperasi ini terletak di Jalan Jendral Sudirman No. 3 Cilegon, Banten. Perdagangan barang dan jasa yang disediakan di antaranya ada jasa simpan pinjam, perasuransian, perkebunan, perikanan, sembako, jasa pendidikan, dan pelatihan perkoperasian. Dalam sistem pelayanannya, Koperasi ini menerapkan konsep layaknya minimarket pada umumnya, yang membiarkan pembeli memilih barang kebutuhan yang ingin dibelinya dan membayar pada kasir yang berjaga. Selain itu juga, pembeli dapat memilih banyak pilihan barang-barang keperluan harian hingga keperluan pangkat TNI-AD. Tentu saja hal tersebut dapat memberikan kemudahan bagi pembeli yang kebanyakan adalah tentara maupun PNS yang dinas di Kodim 0623 Cilegon. Namun belakangan ini, pembelian sembako maupun kebutuhan-kebutuhan harian lainnya tingkat penjualannya lebih tinggi dibandingkan penjualan barang lain yang tersedia di koperasi. Kebutuhan harian sendiri meliputi sembako, makanan, minuman, dan berbagai jenis rokok. Sehingga penjualan sembako maupun barang-barang kebutuhan harian lainnya lebih menguntungkan.
Di sisi lain, pembeli ingin membeli beberapa sembako dan kebutuhan harian sekaligus dengan harga yang lebih murah sedangkan Primer Koperasi Kartika Baja kadang mengeluarkan paket dan kadang tidak mengeluarkan paket. Hal ini disebabkan karena saat Primer Koperasi Kartika Baja mengeluarkan paket, paket tersebut tidak terlalu diminati oleh pembeli karena paket yang disediakan tidak dibiarkan tersimpan tanpa adanya pemanfaatan dari data tersebut. Pihak koperasi juga belum cukup memanfaatkan dan mengembangkan informasi tersebut untuk memperoleh suatu informasi baru yang seharusnya bisa memberikan kemudahan tersendiri bagi kedua pihak, pihak pembeli maupun pihak koperasi itu sendiri.
Oleh karena itu, untuk dapat mengatasi permasalahan-permasalah tersebut, perlu dilakukannya suatu Implementasi data mining terhadap penentuan paket hemat sembako dan kebutuhan harian menggunakan aturan association rule di Primer Koperasi Kartika Baja Cilegon dengan algoritma Fp-Growth. Karena data
mining dapat membantu kita melihat barang mana yang memiliki keterkaitan satu
sama lain. Algoritma Fp-Growth digunakan untuk menggali informasi yang ada di dalam data transaksi penjualan guna memprediksi kombinasi barang atau sembako mana yang paling sering dibeli secara bersamaan dan harga yang diminati oleh pembeli. Algortima yang dapat digunakan dalam metode association rule ada Fp-
growth, apriori, dan lain-lain. Tapi Fp-growth lebih sedikit dalam penggunaan
memori computer dan proses pencarian frequent itemset menjadi lebih cepat [1].Sehingga dengan pengimplementasian ini diharapkan dapat mempermudah pihak koperasi dalam penentuan paket hemat sembako dan kebutuhan harian yang akan ditawarkan kepada para pembeli atau pelanggan koperasi tersebut. Selain itu, tentunya diharapkan juga dapat meningkatkan daya tarik pembeli dalam membeli lebih banyak sembako dan barang-barang lainnya.
1.2 Perumusaan Masalah
Berdasarkan latar belakang di atas, maka didapatkan suatu perumusan masalah yaitu bagaimana cara memperdayakan data yang ada dan menggali informasi yang ada di dalam data transaksi menggunakaan data mining dengan algoritma fp-growth
1.3 Maksud dan Tujuan
Maksud dari penelitian ini adalah untuk mengimplementasikan metode
association rule dengan algoritma fp-growth pada penjualan di Primer Koperasi
Kartika Baja agar dapat dimanfaatkan untuk penentuan paket hemat sembako dan kebutuhan harian.
Sedangkan tujuan yang ingin dicapai untuk penelitian ini adalah mempermudah KOMURNIKKOP dalam menentukan paket hemat sembako dan kebutuhan harian.
1.4 Batasan Masalah
Batasan masalah yang akan diterapkan terhadap pengimplementasian data mining menggunakan association rule terhadap data transaksi di Primer Koperasi Kartika Baja adalah sebagai berikut: 1.
Input yang digunakan dalam penelitian ini adalah data primer yang berupa data transaksi penjualan.
2. Output yang dihasilkan berupa penentuan paket hemat sembako dan kebutuhan harian.
3. Tampilan paket hemat sembako dan kebutuhan harian hanya berupa teks, bukan gambar.
4. Aplikasi yang akan dibangun berbasis desktop.
5. Menggunakan bahasa pemograman C#.
1.5 Metodologi Penelitian
Metodologi yang digunakan dalam penelitian ini adalah Cross-Industry
Standard for Data Mining (CRISP-DM). Metodologi CRISP-DM membedakan
antara model referensi dan panduan pengguna. Model referensi menyajikan
Gambar 1. 1 Fase dalam CRISP-DM
1.Business understanding Tahap awal ini berfokus pada penentuan tujuan bisnis, menilai situasi, penentuan sasaran data mining, dan membuat rencana proyek.
2. Data understanding
Tahap pemahaman data dimulai dengan pengumpulan data awal, menjelaskan data, menjelajahi data yang memungkinkan kita untuk lebih mengenal data, dan mengidentifikasikan masalah kualitas data, 3. Data preparation
Tahap persiapan data mencakup semua kegiatan yang diperlukan untuk membangun data set akhir dari data mentah awal. Tugas persiapan data pemilihan data, cleaning data, pembangunan data, format data, dan dekripsi dataset. meninjau kembali langkah dalam pembuatannya, untuk memastikan bahwa model benar-benar mencapai tujuan bisnis. Tujuan utama adalah untuk menentukan apakah ada beberapa masalah bisnis yang belum cukup dipertimbangkan. Pada akhir dari tahap ini, keputusan tentang penggunaan hasil
data mining harus dicapai.
6. Deployment
Pada tahap ini, informasi yang telah diperoleh akan dipresentasikan dalam bentuk khusus sehingga dapat digunakan oleh pengguna. Tahap deployment dapat berupa pembangunan atau penginstalan software, pemantauan dan pemeliharaan, menghasilkan suatu laporan dan review proyek. Dalam beberapa kasus, tahap ini melibatkan konsumen, di samping analisis data karena sangat penting bagi konsumen untuk memahami tindakan apa yang harus dilakukan untuk menggunakan model yang telah dibuat.
1.6 Sistematika Penulisan
Sistematika penulisan yang akan menggambarkan secara umum penelitian ini adalah sebagai berikut:
BAB 1 PENDAHULUAN Bab ini menerangkan mengenai latar belakang, perumusan masalah,
maksud dan tujuan, batasan masalah, metode penelitian, dan sistematika penulisan tugas akhir
BAB 2 TINJAUAN PUSTAKA Bab ini membahas tentang profil dari Primer Koperasi Kartika Baja dan
BAB 3 ANALISIS DAN PERANCANGAN Bab ini berisikan mengenai analisis dan perancangan yang dibuat
berdasarkan data yang ada yang diperoleh dari Primer Koperasi Kartika Baja dengan algoritma Fp-Growth.
BAB 4 IMPLEMENTASI DAN PENGUJIAN Bab ini berisikan implementasi dan pengujian terhadap sitem yang dibuat
terhadap tingkat keberhasilan aturan asosiasi yang telah didapat setelah penerapan sesuai dengan nilai support dan nilai confident yang telah dihasilkan dari kombinasi yang ada.
BAB 5 KESIMPULAN DAN SARAN Bab ini berisikan tentang kesimpulan akhir dari hasil penelitian yang telah dilakukan dan berisi saran untuk pengembangan sistem lebih lanjut ke depannya.
BAB 2 TINJAUAN PUSTAKA
2.1 Profil Instansi
Berikut adalah profil dari Primer Koperasi Kartika Baja. Dalam profil ini akan membahas tentang sejarah, logo, struktur organisasi, dan visi misi mengenai Primer Koperasi Kartika Baja Cilegon.
2.1.1 Sejarah Primer Koperasi Kartika Baja
Berdirinya Primer Koperasi Kartika Baja tentunya tidak terlepas dari keberadaan satuan itu sendiri karena Primer Koperasi Kartika Baja selalu berdiri bernaung di dalam Kodim 0623 Cilegon. Karena keberadaan Primer Koperasi Kartika Baja tidak terlepas dari Kodim 0623 Cilegon, pertama akan diulas dahulu mengenai satuan itu sendiri. Kodim 0623 Cilegon berada di bawah naungan Korem 064/Maulana Yusuf Serang, Banten di mana Korem itu sendiri membawahi beberapa Kodim.
2.1.2 Logo
Berikut ini adalah logo Primer Koperasi Kartika Baja. Bisa dilihat pada gambar 2.1: Berikut ini adalah struktur organisasi dari Primer Koperasi Kartika Baja yang dapat dilihat pada Gambar 2.2:
Gambar 2. 2 Struktur Organisasi Primkop Kartika Baja
Job description: 1.Ketua bertanggung jawab serta mengatur seluruh anggota koperasi. Tugas dan tanggung jawabnya adalah sebagai berikut: a.
Memimpin, mengkoordinir dan mengendalikan serta mengawasi anggota koperasi. c.
Mendata semua kegiatan koperasi dan membuat laporan bulanan.
Merencanakan pola jaringan pasar antar Kopad, Kopad dengan koperasi lain dan masyarakat umum dengan berperan sebagai koordinator pengadaan dan pemasarannya.
c.
Mengumpulkan, mengolah data menyajikan data/keterangan di bidang administrasi pembendaharaan.
b.
Menyelenggarakan pembinaan sistem administrasi dan pembukuan keuangan pada Primkopadnya.
5. KOMURBEN memiliki tugas dan tanggung jawab sebagai berikut: a.
Meningkatkan dan mengembangkan usaha-usaha dengan mitra baik untuk kepentingan anggota dan masyarakat pada umumnya.
c.
b.
3. KOMURNIKKOP memiliki tugas dan tanggung jawab sebagai berikut: a.
Memantapkan, mengendalikan dan mengembangkan kegiatan usaha yang ada, baik yang langsung melayani kepentingan anggota maupun kepentingan umum.
4. KOMURUS memiliki tugas dan tanggung jawab sebagai berikut: a.
Menyusun rencana kerja dan rencana anggaran belanja untuk bidang tugasnya serta mengawasi pelaksanaannya.
c.
Menjalin hubungan dan kerjasama dengan Kakandepkop Dekopinda dan Primkopad-Primkopad lain dalam rangka meningkatkan usaha Primkopad.
b.
Melaksanakan pembinaan, pengawasan dan penelitiaan bidang dan teknik perkoperasian pada Primkopad.
Mengadakan analisa dan evaluasi serta menyampaikan saran tindakan dalam rangka pengendalian pembendaharaan di lingkungan Primkopad maupun badan usaha Primkopad.
2.1.4 Visi dan Misi
Visi dari Primer Koperasi Kartika Baja adalah: 1.
Mendirikan koperasi yang bersifat kekeluargaan.
2. Mewujudkan kesejahteraan para pegawai Kodim 0623 Cilegon maupun warga sipil Misi dari Primer Koperasi Kartika Baja adalah: 1.
Mengutamakan pelanggan dengan pelayanan terbaik.
2. Memberi inovasi pada sistem penjualan secara berkala.
3. Mengembangkan koperasi agar lebih besar dan lebih cepat dalam meambah variasi-variasi barang baru.
2.2 Landasan Teori
Dalam sub bab ini akan dijelaskan mengenai definisi dan teori-teori yang berkaitan dengan penelitian ini. Berikut adalah teori-teori yang mendasari dari perancangan sistem penentuan paket hemat berbasis desktop.
2.2.1 Data
Data adalah representasi fakta dunia nyata yang mewakili suatu objek seperti manusia (pegawai, siswa, pembeli, pelanggan), barang, hewan, peristiwa, konsep, keadaan, dan sebagainya, yang direkam dalam bentuk angka, huruf, simbol, teks, gambar, bunyi, atau kombinasinya [3]. Jumlah informasi yang tersedia bagi kita sangat banyak, dan nilai data sebagai asset organisasi telah diakui secara luas. Untuk memanfaatkan dataset yang besar dan kompleks, pengguna memerlukan alat yang memudahkan tugas mengatur data dan mengekstraksi informasi yang berguna dalam cara yang baik. Sebaliknya, data dapat menjadi sesuatu yang tidak berguna
2.2.2 Database Database adalah kumpulan data, umumnya mendeskripsikan aktivitas satu
organisasi yang berhubungan atau lebih. Misalnya, database universitas mungkin berisi informasi mengenai hal berikut: a.
Entitas seperti mahasiswa fakultas, mata kuliah, dan ruang kuliah.
b.
Hubungan antara entitas, seperti registrasi mahasiswa dalam mata kuliah, fakultas yang mengajarkan mata kuliah, dan penggunaan ruang untuk kuliah [4].
2.2.3 Data Mining
Berikut ini adalah penjelasan mengenai pengertian dan konsep yang terdapat pada data mining.
2.2.3.1 Pengertian Data Mining Data mining sering juga disebut knowledge discovery in database (KDD),
adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan. Sehingga istilah pattern recognition sekarang jarang digunakan karena ia temasuk bagian dari data mining [5].
2.2.3.2 Konsep Data Mining Data mining sangat diperlukan terutama dalam mengelola data yang sangat
besar untuk memudahkan aktifitas recording suatu transaksi data untuk proses data
warehousing agar dapat memberikan informasi yang akurat bagi pengguna data inilah yang nantinya sangat berguna untuk pengembangan. Berikut adalah langkah- langkah dalam data mining [5], bisa dilihat pada gambar 2.3:
Gambar 2. 3 Konsep Data Mining
1.Data cleaning yaitu untuk menghilangkan noise data yang tidak konsisten.
2. Data integration yaitu menggabungkan beberapa file atau database.
3. Data selection yaitu data yang relevan dengan tugas analisis dikembalikan ke dalam database untuk proses data mining.
4. Data transformation yaitu data data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan perfoma atau operasi agresi.
5. Data mining yaitu proses esensial dimana metode yang intelejen digunakan untuk mengekstrak pola data.
6. Knowledge Discovery yaitu proses essential dimana metode yang intelejen
2.2.4 Association Rule
Aturan asosiasi (Association rules) atau analisis afinitas (affinity analysis) berkenaa n dengan studi tentang ‘apa bersama apa’. Ini bisa berupa studi transaksi di supermarket, misalnya seseorrang yang membeli susu bayi juga membeli sabun mandi. Di sini berarti susu bayi bersama dengan sabun mandi. Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan market basket analysis [5].
Association Rule
adalah bentuk jika “kejadian sebelumnya” kemudian “konseuensinya” (if antecedent, then consequent), yang diikuti dengan perhitungan aturan support dan confident. Bentuk umum dari association rule adalah Antecedent
-> Consequent. Bila kita ambil contoh dalam sebuah transaksi pembelian barang di
sebuah minimarket didapat bentuk association rule roti -> selai. Yang artinya bahwa pelanggan yang membeli roti ada kemungkinan pelanggan tersebut juga membeli selai, dimana tidak ada batasan dalam jumlah item-item pada bagian
antecedent atau consequent dalam sebuah rule. Dalam menentukan suatu
association rule, terdapat suatu interestingness measure (ukuran kepercayaan) yang
didapat dari hasil pengolahan data dengan perhitungan tertentu. Umumnya ada dua ukuran yaitu:
1. Support: suatu ukuran yang menunjukan seberapa besar tingkat dominasi suatu item/itemset dari keseluruhan transaksi. Support merupakan matrik pertama yang ditetapkan dalam analisis keranjang pasar, yang merupakan probabilitas dari asosiasi (probabilitas dari dua item yang diberi bersama- sama). Support dihasilkan dari beberapa kali jumlah item A dan B terjadi bersamaan dalam transaksi yang sama dibagi dengan jumlah total dari
Confidence = P (B / A) = � ∩ �
Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebur yang ditentukan oleh pengguna. Bila suatu pola memenuhi kedua nilai minimum parameter yang sudah ditentukan sebelumnya, maka pola tersebut dapat disebut sebagai interesting rule atau
strong rule. Metodologi dasar analisis asosiasi terbagi menjadi dua tahap
yaitu [6]: 1.
Analisis pola frekuensi tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dan database. Nilai support sebuah item diperoleh dengan rumus berikut:
� =
� �ℎ � � � ya �� � � �ℎ � � � �
X 100 % Persamaan (2-1)
Sementara itu, nilai support dari 2 item diperoleh ddari rumus berikut: , = � ∩ )…Persamaan (2-2)
� , =
� �ℎ � � � ya �� � � � �ℎ � � � �
x100%. Persamaan(2-2) 2.
Pembentukan aturan asosiasi Setelah semua pola frekuensi tinggi ditemukan, kemudian mencari aturan asosiasi yang cukup kuat ketergantungan antar item. Dalam
Misalkan kita memilih himpunan item A dan himpunan item B, kemudian aturan asosiatif akan berbentuk: Jika A, maka B (A->B) Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B dimana aturan: Jika A, maka B
Tidak berarti Jika B, maka A Sebuah itemset adalah himpunan item-item yang ada dalam I, dan itemset.
Frekuensi itemset merupakan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang telah ditentukan.
Nilai confident dari aturan A->B diperoleh dari rumus berikut.
� �ℎ � � � ya �� � �
� = � | =
� �ℎ � � � �� � �� �
Persamaan (2-3)
2.2.5 Algoritma Fp-Growth
Algoritma yang sama dengan apriori, Fp-Growth mulai dengan menghitung
item tunggal sesuai dengan jumlah kemunculan item yang ada di dalam dataset.
Setelah proses perhitungan selesai maka akan dibuat struktur pohon pada tahap kedua. Pohon yang dibuat mulanya kosong yang nantinya akan diisi dengan hasil dari dataset yang telah didapat sebelumnya. Kunci untuk mendapatkan struktur pohon yang bisa didapatkan dengan proses lebih cepat untuk mencari item set yang besar menjadi sedikit dengan diurutkan secara descending dari frekuensi yang ada di dalam dataset tersebut [7].Fp-Tree merupakan struktur penyimpanan data yang dimampatkan. Fp-Tree dari Fp-Tree adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien.
Adapun Fp-Tree adalah sebuah pohon dengan definisi sebagai berikut: a.
Fp-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan berupa pohon yang beranggotakan item-item tertentu dan sebuah tabel
frequent header.
b. Setiap simpul dalam Fp-Tree mengandung tiga informasi penting, yaitu label
item, menginformasikan jenis item yang direpresentasikan simpul tersebut, support count, merepresentasikan jumlah lintasan transaksi melalui simpul
tersebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label atau item sama antar lintasan, ditandai dengan garis panah putus-putus.
2.2.5.1 Langkah-Langkah Proses Perhitungan Association Rule Dengan
Algoritma FP-GrowthProses perhitungan association rule terdiri dari beberapa tahap adalah sebagai berikut [8]:
1. Membuat Header Item
Header dalam hal ini selain sebagai header suatu item ke FP-Tree juga
sebagai jenis item dasar yang memenuhi minimum support. Setelah mendapatkan item dan nilai support-nya, maka item yang tidak frequent dibuang dan item diurutkan berdasarkan nilai support-nya. Header untuk item, disiapkan pada suatu array tertentu dan ditambahkan ketika membuat FP-Tree.
2. Membuat FP-Tree melengkapi path baru pada FP-Tree tersebut. Hal ini dilakukan selama item pada transaksi masih ada yang qualified, artinya memenuhi nilai minimum support. Jadi, item-item yang ditemukan dalam transaksi akan berurutan memanjang ke bawah. Dalam struktur FP-Tree, diterapkan alur
path dari child hingga ke root. Jadi, suatu path utuh dalam FP-Tree adalah
dari child terbawah hingga ke root. Tiap node pada FP-Tree memiliki pointer ke parent, sehingga pencarian harus dimulai dari bawah.
3. Pattern Extraction
Pattern extraction dilakukan berdasarkan keterlibatan item pada suatu path. Di setiap path, diperiksa semua kombinasi yang mungkin dimana item tersebut terlibat. Di iterasi berikutnya dilakukan dengan melakukan item pada suatu path. Di setiap path, diperiksa semua kombinasi yang
mungkin dimana item tersebut terlibat. Di iterasi berikutnya dilakukan dengan melibatkan item berikutnya, tanpa melibatkan item sebelumnya, sehingga pattern yang sama tidak akan ditemukan dua kali pada path yang sama. Bila item pertama suatu hasil kombinasi bukan item terakhir (sebelum
root), maka kombinasi itemset tersebut masih bisa dikembangkan lagi.
4. Memasukkan setiap pattern yang ditemukan dalam PatternTree
Setelah mengolah FP-Tree menjadi pattern-pattern, diperlukan proses akumulasi pattern-pattern yang ditemukan mengingat pattern yang sama dapat ditemukan pada path yang berbeda. Untuk itu digunakan struktur data Pattern Tree (lihat Gambar 2.4). Setiap node di Pattern Tree merepresentasikan dan menyimpan frekuensi suatu pattern. Pattern Tree terdiri atas Pattern TreeNode yang menyimpan nilai item, nilai support dan dilengkapi dengan dua pointer yaitu untuk horizontal dan vertikal.
Gambar 2. 4 Pattern Tree
Misalnya pada node d:1 di atas, berarti terdapat pattern a-c-d bernilai
support 1. Kemudian bila ada pattern a-c-d lagi bernilai support n yang ditemukan dari FP-Tree maka nilai support 1 tersebut menjadi n+1.
Contoh hasil lengkap dari PatternTree tersebut: 1. a:5 menggambarkan bahwa ada pattern a sebanyak 5 2. b:4 menggambarkan bahwa ada pattern a-b sebanyak 4 3. c:4 menggambarkan bahwa ada pattern a-b-c sebanyak 4 4. d:3 menggambarkan bahwa ada pattern a-b-c-d sebanyak 3 5. c:2 menggambarkan bahwa ada pattern a-c sebanyak 2 6. d:1 menggambarkan bahwa ada pattern a-c-d sebanyak 1 7. d:3 menggambarkan bahwa ada pattern a-d sebanyak 3 5.
Mengurutkan dan menyeleksi Pattern.
Pattern yang tidak memenuhi minimum support, dihapus dari daftar pattern.
Pattern-pattern yang tersisa kemudian diurutkan untuk memudahkan pembuatan rules.
BAB 3 PEMBAHASAN
3.1 Analisis Sistem
Analisis merupakan suatu tahapan pemahaman terhadap sistem atau aplikasi yang sedang berjalan maupun yang akan dibuat. Tahapan analisis bertujuan untuk mengetahui mekanisme atau prosedur kerja dari proses yang sedang berjalan maupun yang akan dibuat.
3.1.1 Analisis Masalah
Analisis masalah adalah pengidentifikasian terhadap kendala yang terjadi dalam suatu penelitian yang sedang dilakukan. Masalah sendiri dapat diartikan sebagai sesuatu yang memerlukan suatu jalan keluar atau penyelesaian. Berdasarkan hasil pengamatan, Primer Koperasi Kartika Baja memiliki permasalahan dalam penentuan paket hemat sembako dan kebutuhan harian yang memiliki harga yang menarik minat pembeli.
3.1.2 Business Understanding
Pemahaman bisnis ini merupakan tahap pertama dalam CRISP-DM. Di dalamnya terdapat beberapa tahap lagi yang meliputi:
1. Penentuan tujuan bisnis Primer Koperasi Kartika Baja dalam proses bisnisnya memiliki tujuan bisnis yaitu dapat mensejahterakan dan memenuhi setiap kebutuhan para pembelinya.
2. Menilai situasi
Tabel 3.1 Spesifikasi Perangkat KerasNo Perangkat Keras Spesifikasi
1 Monitor LCD 14”
2 Processor Intel Dual Core 2.93 GHz
3 RAM
1 GB
4 Harddisk 250 GB
5 VGA 512 MB 3.
Penentuan sasaran data mining Tujuan dari penetapan data mining dalam penentuan paket sembako dan kebutuhan harian adalah membantu KOMURNIKKOP dalam menentukan paket yang dapat menarik minat pembeli.
3.1.3 Data Understanding
Setelah melakukan tahap business understanding, selanjutnya akan ada tahap
data understanding. Untuk memahami data, ada beberapa tahapan yang harus
dilakukan, diantaranya sebagai berikut: 1.
Mengumpulkan data awal Data dalam penelitian ini adalah sample data transaksi penjualan di Primkop Kartika Baja yang berasal dari nota-nota transaksi penjualan yang dimasukan ke dalam file berbentuk Microsoft excel (.xlsx) yang nantinya akan dilakukan proses mining pada program. Paket akan dibentuk per bulan dan data yang digunakan adalah data pada periode 2 bulan terakhir.
2. Menjelaskan data
Data transaksi awal diambil dari nota penjualan yang terdapat di Primkop Kartika Baja. Berikut adalah contoh nota penjualan sebelum dipindahkan dalam file Microsoft Excel (.xlsx) dapat dilihat pada gambar 3.1:
Gambar 3. 1 Contoh Nota Penjualan
Lalu data dari nota penjualan dipindahkan ke dalam file Microsoft Excel (.xlsx) seperti pada tabel 3.2:
Tabel 3. 2 Data transaksi dari nota
No.Nama Barang Qty Harga Jumlah
No. Transaksi Nama Barang Qty Harga Satuan Jumlah 5004 BERAS 1 56000 56000 5004 GULA PUTIH
3 16000 48000 5004 SEGITIGA BIRU 2 9500 19000 5005 MACKEREL 2 11000 22000 5005 BERAS 1 56000 56000 5005 BIMOLI 1000ML 1 14000 14000 5006 MACKEREL 1 11000 11000 5006 GULA PUTIH 5 16000 80000 5007 BERAS 1 56000 56000 5007 GULA PUTIH 5 16000 80000 5007 WHITE KOFFEE
10 1350 13500 5008 MACKEREL 1 11000 11000 5008 GULA PUTIH 2 16000 32000 5008 BIMOLI 1000ML 2 14000 28000 5009 MACKEREL 1 11000 11000 5009 BERAS 1 56000 56000 5009 GULA PUTIH 1 16000 16000 5009
INDOMIE GORENG 3 2400 7200 5010 MACKEREL 1 11000 11000 5010 BERAS 1 56000 56000 5010 GULA PUTIH 2 16000 32000 5010 SEGITIGA BIRU 3 9500 28500 5011 JAKET NKRI 1 145500 145500 5011
INDOMIE AYAM BAWANG 2 2200 4400 5012 PAKET 1 1 23691 23691 5013 MARLBORO PUTIH 1 18350 18350 5014 SARUNG LORENG 1 45500 45500 5014 SABUK 1 35500 35500 5014 DJI SAM SOE 1 13150 13150 5015 BIMOLI 1000ML 1 14000 14000 5016 BARET 1 90500 90500 5017 TOPI SILIWANGI 1 35500 35500 5018 BERAS 1 56000 56000 Untuk pemaketan sendiri, dibutuhkan kode barang dan jenis untuk melihat apa yang akan dibutuhkan dalam tahap selanjutnya. Untuk kode barang dan jenis dapat dilihat dari tabel stok barang, contoh dari tabel stok barang dapat dilihat pada tabel 3.3:
Tabel 3. 3 Contoh data stok barang
Selanjutnya, kode barang dan jenis dimasukan dan disatukan ke dalam file data transaksi yang telah tersedia, berikut hasil setelah kode barang dan jenis yang telah dimasukan dapat dilihat pada tabel 3.4:
Tabel 3. 4 Data Transaksi
No.Transaksi Nama Barang
Kode
Barang
Jenis Qty Harga Satuan Jumlah 5001 MACKEREL SM-227 SEMBAKO 1 11000 11000
No. Transaksi Nama Barang
Kode
Barang
Jenis Qty Harga Satuan Jumlah 5004 SEGITIGA BIRU SM-336 SEMBAKO 2 9500 19000 5005 MACKEREL SM-227 SEMBAKO
2 11000 22000 5005 BERAS SM-55 SEMBAKO 1 56000 56000 5005 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5006 MACKEREL SM-227 SEMBAKO 1 11000 11000 5006 GULA PUTIH SM-141 SEMBAKO 5 16000 80000 5007 BERAS SM-55 SEMBAKO 1 56000 56000 5007 GULA PUTIH SM-141 SEMBAKO 5 16000 80000 5007 WHITE KOFFEE MN-439 MNM
10 1350 13500 5008 MACKEREL SM-227 SEMBAKO 1 11000 11000 5008 GULA PUTIH SM-141 SEMBAKO 2 16000 32000 5008 BIMOLI 1000ML SM-57 SEMBAKO 2 14000 28000 5009 MACKEREL SM-227 SEMBAKO 1 11000 11000 5009 BERAS SM-55 SEMBAKO 1 56000 56000 5009 GULA PUTIH SM-141 SEMBAKO 1 16000 16000 5009
INDOMIE GORENG MK-161 MKN 3 2400 7200 5010 MACKEREL SM-227 SEMBAKO 1 11000 11000 5010 BERAS SM-55 SEMBAKO 1 56000 56000 5010 GULA PUTIH SM-141 SEMBAKO 2 16000 32000 5010 SEGITIGA BIRU SM-336 SEMBAKO 3 9500 28500 5011 JAKET NKRI SN-177 SANDANG 1 145500 145500 5011
INDOMIE AYAM BAWANG MK-160 MKN 2 2200 4400 5012 PAKET 1 PK-1 PAKET 1 23691 23691 5013 MARLBORO PUTIH RK-2 ROKOK 1 18350 18350 5014 SARUNG LORENG SN-334 SANDANG 1 45500 45500 5014 SABUK SN-325 SANDANG 1 35500 35500 5014 DJI SAM SOE RK-9 ROKOK 1 13150 13150 5015 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5016 BARET SN-44 SANDANG 1 90500 90500 5017 TOPI SILIWANGI SN-415 SANDANG 1 35500 35500 5018 BERAS SM-55 SEMBAKO 1 56000 56000 5018 MACKEREL SM-227 SEMBAKO 1 11000 11000 5018 BIMOLI 1000ML SM-57 SEMBAKO 2 14000 28000
Berikut ini adalah penjelasan masing-masing atribut yang terdapat pada tabel hasil pergabungan antara nota dan data stok barang yang telah disatukan dalam file Micosoft Excel (.xlsx), dapat dilihat pada tabel 3.5:
Tabel 3.5 Struktur Data Transaksi
Keterangan
Fungsi Untuk mengetahui barang yang sering dibeli oleh pembeli Format Microsoft Excel (.xlsx) Atribut No_transaksi Urutan penjualan Nama_barang Nama barang yang dibeliKode_barang Kode tiap-tiap barang Jenis Jenis tiap-tiap barang Qty Jumlah barang yang dibeli Harga_satuan Harga satuan masing-masing barang
Jumlah Jumlah keseluruhan harga barang
3.1.4 Data Preparation
Dalam proses data mining ini, tidak semua atribut dalam data transaksi penjualan akan digunakan. Maka sebelum diproses, ada beberapa tahapan yang harus dilakukan agar data siap digunakan untuk masuk ke dalam pemrosesan. Adapun beberapa tahap tersebut antara lain: 1.
Cleaning data Dalam tahap pembersihan data ini, data yang memiliki jenis selain SEMBAKO, MKN, MNM, dan ROKOK dan yang mengandung paket akan dihapus serta data transaksi yang hanya memiliki data tunggal juga akan dihapus sebab data tunggal tidak perlu digunakan dalam proses selanjutnya karena dapat dilihat bahwa data tunggal tidak memiliki hubungan atau keterkaitan dengan antar barang lainnya. Dalam tahap ini, dari 46 record, terhapus menjadi 38 record. Data yang terdiri dari No.Transaksi 5011, 5012, 5014, 5016, 5017, dan 5019 mengandung jenis barang selain
Tabel 3. 6 Cleaning jenis dan paket
No.Transaksi Nama Barang
Kode
Barang
Jenis Qty Harga Satuan Jumlah 5001 MACKEREL SM-227 SEMBAKO 1 11000 11000 5001 BERAS SM-55 SEMBAKO
1 56000 56000 5001
INDOMIE GORENG MK-161 MKN 10 2400 24000 5001 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5002 BERAS SM-55 SEMBAKO 1 56000 56000 5002 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5003 TISU NICE 120 SCHT SM-411 SEMBAKO 1 5952 5952 5004 BERAS SM-55 SEMBAKO 1 56000 56000 5004 GULA PUTIH SM-141 SEMBAKO 3 16000 48000 5004 SEGITIGA BIRU SM-336 SEMBAKO 2 9500 19000 5005 MACKEREL SM-227 SEMBAKO 2 11000 22000 5005 BERAS SM-55 SEMBAKO 1 56000 56000 5005 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5006 MACKEREL SM-227 SEMBAKO 1 11000 22000 5006 GULA PUTIH SM-141 SEMBAKO 5 16000 80000 5007 BERAS SM-55 SEMBAKO 1 56000 56000 5007 GULA PUTIH SM-141 SEMBAKO 5 16000 80000 5007 WHITE KOFFEE MN-439 MNM
10 1350 13500 5008 MACKEREL SM-227 SEMBAKO 1 11000 11000 5008 GULA PUTIH SM-141 SEMBAKO 2 16000 32000 5008 BIMOLI 1000ML SM-57 SEMBAKO 2 14000 28000 5009 MACKEREL SM-227 SEMBAKO 1 11000 11000 5009 BERAS SM-55 SEMBAKO 1 56000 56000 5009 GULA PUTIH SM-141 SEMBAKO 1 16000 16000 5009
INDOMIE GORENG MK-161 MKN 3 2400 7200 5010 MACKEREL SM-227 SEMBAKO 1 11000 11000 5010 BERAS SM-55 SEMBAKO 1 56000 56000 5010 GULA PUTIH SM-141 SEMBAKO 2 16000 32000 5010 SEGITIGA BIRU SM-336 SEMBAKO 3 9500 28500 5011
INDOMIE AYAM BAWANG MK-160 MKN 2 2200 4400 5013 MARLBORO PUTIH RK-2 ROKOK 1 18350 18350
Lalu tahap kedua yaitu menghapus data tunggal yang terdapat dalam transaksi, seperti yang dapat dilihat di tabel 3.7 nomor transaksi 5003, 5011, 5013, 5014, 5015, 5019, dan 5020 dihapus datanya karena tidak memenuhi syarat. Dari 38 record, terdapat 31 record yang tersisa. Data yang telah di-
cleaning dapat dilihat pada tabel 3.7:
Tabel 3.7 Cleaning data tunggal No.Transaksi Nama Barang
Kode
Barang
Jenis Qty Harga Satuan Jumlah 5001 MACKEREL SM-227 SEMBAKO 1 11000 11000 5001 BERAS SM-55 SEMBAKO
1 56000 56000 5001
INDOMIE GORENG MK-161 MKN 10 2400 24000 5001 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5002 BERAS SM-55 SEMBAKO 1 56000 56000 5002 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5004 BERAS SM-55 SEMBAKO 1 56000 56000 5004 GULA PUTIH SM-141 SEMBAKO 3 16000 48000 5004 SEGITIGA BIRU SM-336 SEMBAKO 2 9500 19000 5005 MACKEREL SM-227 SEMBAKO 2 11000 22000 5005 BERAS SM-55 SEMBAKO 1 56000 56000 5005 BIMOLI 1000ML SM-57 SEMBAKO 1 14000 14000 5006 MACKEREL SM-227 SEMBAKO 1 11000 11000 5006 GULA PUTIH SM-141 SEMBAKO 5 16000 80000 5007 BERAS SM-55 SEMBAKO 1 56000 56000 5007 GULA PUTIH SM-141 SEMBAKO 5 16000 80000 5007 WHITE KOFFEE MN-439 MNM
10 1350 13500 5008 MACKEREL SM-227 SEMBAKO 1 11000 11000 5008 GULA PUTIH SM-141 SEMBAKO 2 16000 32000 5008 BIMOLI 1000ML SM-57 SEMBAKO 2 14000 28000 5009 MACKEREL SM-227 SEMBAKO 1 11000 11000 5009 BERAS SM-55 SEMBAKO 1 56000 56000 5009 GULA PUTIH SM-141 SEMBAKO 1 16000 16000 5009
INDOMIE GORENG MK-161 MKN 3 2400 7200
2. Pemilihan Atribut
Dalam proses data mining nanti, atribut yang akan dipakai hanya no_transaksi dan kode_barang. No_transaksi di sini berfungsi untuk menunjukkan urutan transaksi sekaligus sebagai pembeda antar transaksi. Sedangkan kode_barang berfungsi sebagai identitas masing-masing barang yang telah dibeli oleh pembeli. Atribut yang telah dipilih dapat dilihat pada tabel 3.8:
Tabel 3.8 Atribut yang dipilih No. Transaksi Kode Barang5001 SM-227 5001 SM-55 5001 MK-161 5001 SM-57 5002 SM-55 5002 SM-57 5004 SM-55 5004 SM-141 5004 SM-336 5005 SM-227 5005 SM-55 5005 SM-57 5006 SM-227 5006 SM-141 5007 SM-55 5007 SM-141 5007 MN-439 5008 SM-227 5008 SM-141 5008 SM-57 5009 SM-227 5009 SM-55
No. Kode
Transaksi Barang
5018 SM-57
3.1.5 Modelling
Modelling merupakan tahap untuk membuat desain sistem yang akan
dibangun. Data yang akan digunakan dalam pengolahan data adalah data yang telah melalui data preparation yaitu data yang ada dalam Tabel 3.8. Di dalam tahapan ini akan dilakukan penyelesaian masalah pada pemaketan produk di Primkop Kartika Baja dengan metode association rule dan menggunakan algoritma FP- Growth.
Metode association rule dibagi menjadi dua tahapan yaitu tahap mencari pola frekuensi yang berfungsi untuk mencari frekuensi setiap barang dan pembentukan atau perhitungan asosiasi untuk mencari pola item yang memenuhi nilai minimum support.
Dalam proses ini, untuk melihat banyaknya variasi data yang diperoleh, nilai
minimum support yang akan digunakan adalah yang bernilai 2. Jika hasil dari
minimum support bilangan decimal, maka harus dibulatkan ke atas. Hasil dari
perhitungan support count bisa dilihat dalam Tabel 3.9 berikut:
Tabel 3.9 Support CountSupport Kode_Barang Count SM-227
7 SM-55
8 MK-161
2 SM-57
5 SM-141
6 SM-336
2 MN-439
1
Tabel 3.10 Barang yang memenuhi nilai minimum support Kode_Barang Support Count
8
2
6 3.
Urutkan kode barang sesuai nilai priority dari urutan pertama sampai urutan terakhir. Hasilnya dapat dilihat pada Tabel 3.12:
Tabel 3.12 Pengurutan sesuai nilai priority Kode_Barang
Support
Count
PrioritySM-55
1 SM-227
6
7
2 SM-141
6
3 SM-57
5
4 MK-161
2
3 SM-336
4 SM-141
SM-227
Tabel 3.11 Pemberian Nilai Priority Kode_Barang7 SM-55
8 MK-161
2 SM-57
5 SM-141
6 SM-336