Penerapan Data Mining Menggunakan Metode Association Rule pada Data Tansaksi Makmur Jaya Kosmetik

(1)

(2)

(3)

(4)

RIWAYAT HIDUP PENULIS

DATA PRIBADI

Nama : Juwita Permata Sari

NIM : 10111651

Tempat, Tgl Lahir : Garut, 21 Januari 1994 Jenis Kelamin : Perempuan

Agama : Islam

Alamat : Kp. Cikantong RT 01 RW 04 Desa Sukmukti Kec Sukawening Kab.Garut 44184

No. Telp : 085793158271

E-Mail : juwitapermatasari21@gmail.com

PENDIDIKAN

Tahun 2011-2016 : Universitas Komputer Indonesia, Fakultas Teknik dan Ilmu Komputer, Jurusan Teknik Informatika, Jenjang Strata1.

Tahun 2008– 2011 : SMK YPPT GARUT Tahun 2005– 2008 : SMP Negeri 1 Sukawening Tahun 1999– 2005 : SD Negeri Sukamukti IV

Dengan ini penulis menyatakan bahwa semua informasi yang diberikan dalam dokumen ini adalah benar


(5)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

JUWITA PERMATA SARI

10111651

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

2016


(6)

iii

penyusunan skripsi yang berjudul “PENERAPAN DATA MINING MENGGUNAKAN METODE ASSOCIATION RULES PADA DATA TRANSAKSI MAKMUR JAYA KOSMETIK” ini dengan baik.

Adapun tujuan dari penyusunan skripsi ini adalah untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi Teknik Informatika Universitas Komputer Indonesia.

Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari berbagai pihak dan berkah dari Allah SWT sehingga kendala-kendala yang dihadapi dapat diatasi. Untuk itu penulis menyampaikan rasa hormat dan terima kasih sebesar-besarnya kepada :

1. Allah Subhannahu wa Ta’ala yang telah mencurahkan rahmat dan karunia-Nya hingga saat ini.

2. Bapak Alif Finandhita, S.Kom., M.T. selaku dosen pembimbing yang telah meluangkan waktu, pikiran, memberikan motivasi, arahan, dan saran serta ilmu pengetahuannya kepada penulis dalam penyusunan skripsi ini.

3. Bapak Adam Mukharil Bachtiar, S.Kom., M.T. selaku dosen reviewer yang telah memberikan saran serta kritiknya dalam penyusunan skripsi ini.

4. Ibu Gentisya Tri Mardiani, S.Kom., M.Kom. selaku dosen wali yang telah memberikan banyak masukan dan kritikannya terhadap penyusunan tugas akhir ini.

5. Ibu Nelly Indriani W. , S.Si., M.T. selaku dosen penguji yang telah memberikan masukkan pada saat sidang skripsi.


(7)

iv

7. Ibunda Iis Liswati, Ayahanda Asep Saepudin, Mamah Hj Hasanah, Abah H.Memed (Alm), Apa Iya Juhriya(Alm) tercinta yang selalu memberi

dukungan, do’a dan semangat tanpa hentinya, terimakasih atas kasih sayang

yang tiada ada duanya.

8. Adik tersayang Sansan dan Wildan yang selalu memberi motivasi serta dukungan kepada penulis agar cepat menyelesaikan kuliah.

9. Teman - teman IF-14 angkatan 2011.

10. Teman – teman satu bimbingan Pak Alif Finandhita, S.Kom., M.T dan teman

– teman satu angkatan TA .

11. Sahabat yang tak terlupakan Idam, Tono, Rizal atas dukungan dan kebersamaanya selama ini, penulis tidak akan pernah melupakan masa-masa indah bersama kalian.

12. Teman – teman seperjuangan Keling, Lukman, Eza, Egi, Sisil yang rela bertukar pendapat dan berjuang bersama hingga akhir dalam mentuntaskan tugas akhir ini.

13. Sahabat tercinta Anti, Anna, Rifni, Farida, Gilang, Hesti, Iis, barudak Re’damz,

barudak A’TKJ 11, semua sahabat yang tidak bisa disebutkan satu persatu atas

dukungan, semangat dan motivasi serta selalu mendengarkan curhatan dikala galau melanda

14. Semua pihak yang tidak dapat penulis sebut satu persatu yang telah membantu dalam penyelesaian penulisan skripsi ini.

Keterbatasan kemampuan, pengetahuan dan pengalaman penulis dalam pembuatan skripsi ini masih jauh dari kesempurnaan. Untuk itu penulis akan selalu menerima segala masukan yang ditujukan untuk menyempurnakan skripsi ini.


(8)

v

Bandung, 30 Juli 2016


(9)

vi

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... iv

DAFTAR GAMBAR ... vii

DAFTAR TABEL ... xii

DAFTAR SIMBOL ... xv

DAFTAR LAMPIRAN ... xx

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Perumusan Masalah ... 2

1.3 Maksud dan Tujuan ... 2

1.4 Batasan Masalah... 2

1.5 Metodologi Penelitian ... 3

1.5.1 Metode Pengumpulan Data ... 3

1.5.2 Metode Pembangunan Data mining ... 3

1.6 Sistematika Penulisan ... 5

BAB 2 TINJAUAN PUSTAKA ... 7

2.1 Profil Institusi ... 7

2.1.1 Sejarah Toko ... 7


(10)

vii

2.2.1 Data ... 9

2.2.2 Basis Data ... 10

2.2.3 Database Mangement System ... 11

2.2.4 Data Mining ... 11

2.2.5 Cross-Industry Standard Process for Data Mining (CRISP-DM) ... 14

2.2.6 Association Rule ... 17

2.2.7 Algoritma FP-Growth ... 19

2.2.8 FP – Tree ... 23

2.2.9 Unified Modeling Language (UML) ... 24

2.2.10 MySQL ... 26

BAB 3 ANALISIS DAN PERANCANGAN ... 27

3.1 Analisis Sistem ... 27

3.1.1 Analisis Masalah ... 27

3.1.2 Analisis Penerapan Metode Crisp-DM ... 27

3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 93

3.1.3.1 Analisis Pengguna ... 93

3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 93

3.2 Perancangan Sistem ... 112

3.2.1 Perancangan Class ... 112

3.2.2 Perancangan Basis data ... 116

3.2.6 Perancangan Struktur Menu ... 118

3.2.7 Perancangan Antar Muka ... 119

3.2.5 Perancangan Pesan ... 122


(11)

viii

4.1.2 Perangkat lunak yang digunakan ... 124

4.1.3 Implementasi Basis Data ... 125

4.1.4 Implementasi Antarmuka ... 126

4.2 Pengujian Sistem ... 127

4.2.1 Rencana Pengujian ... 127

4.2.2 Pengujian Fungsional ... 127

4.2.2 Kesimpulan Pengujian Fungsional ... 130

4.2.3 Pengujian Wawancara ... 130

4.2.4 Kesimpulan Pengujian Wawancara ... 131

4.2.5 Pengujian Hasil ... 131

4.2.7 Kesimpulan Pengujian Hasil ... 135

BAB 5 KESIMPULAN DAN SARAN ... 136

5.1 Kesimpulan ... 136

5.2 Saran ... 136


(12)

140

[2] P. Chapman, J. Clinton, R. Keber, T. Khabaza, T. Reinartz, C. Shearer and R. Wirth, CRISP-DM 1.0, Step-by-step data mining guide, 2000

[3] H.A.Fajar, Data Mining. Andi, 2013.

[4] Kusrini, Strategi Perancangan dan Pengolahan Basis Data, Andi, 2007. [5] B. Santoso, Data Mining: Teknik Pemanfaatan Data Untuk Keperluan

Bisnis, Yogyakarta: Graha Ilmu, 2007.

[6] Yuhefizard, Database Management Menggunakan Microsoft Access 2003, Jakarta : PT. Elex Media Komputindo, 2008.

[7] Prasetyo Eko, Data Mining, Andi, 2012.

[8] J. Han and M. Kamber, Data Mining : Concept and Techniques, 2nd ed. San Fransisco: Morgan Kauffman, 2006.

[9] Kusrini and E. T. Lutfi, Algoritma Data Mining, Andi, 2009.

[10] J. Santoni, “Implementasi Data Mining Dengan Metode Market Basket Analysis,” Teknologi Informasi dan Pendidikan, vol. 5, p.2, Sep.2012 [11] D.T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to

DATA MINING, Hoboken, New Jersey: John Wiley & Sons, Inc., 2005.


(13)

1

Makmur Jaya Kosmetik merupakan toko produk kosmetik yang paling besar di daerah Garut, berdiri sejak tahun 1996. Produk utama yang dijual di adalah produk-produk kebutuhan penunjang kecantikan, berbagai merk produk-produk bisa ditemukan di toko ini. Untuk mendapatkan produk yang diinginkan, konsumen akan berkontak langsung dengan pelayan toko dan melakukan transaksi pembelian. juga menawarkan paket produk kosmetik.

Dari hasil pengamatan, toko Makmur Jaya Kosmetik mengalami permasalah dalam pembentukan paket. Dari sekian banyak produk paket yang ditawarkan hanya sedikit paket yang dibeli oleh pelanggan, karena pasangan produk yang dijual dalam satu paket merupakan produk yang kurang dibutuhkan oleh pelanggan. Hal ini terjadi karena kurangnya pertimbangan dari pemilik toko terhadap pola pembelian konsumen dalam pembentukan paket, sehingga mengakibatkan melesetnya informasi dalam pembentukan paket penjualan produk kosmetik dan mengakibatkan terjadinya penumpukan barang di gudang sehingga barang tersebut menjadi kadaluarsa dan tidak bisa dijual lagi.

Data Mining memiliki banyak metode salah satunya adalah Association Rules. Menurut "Data Preparationfor Data Mining" dalam Applied Artificial Intelligence (Zhang,Zhang, & Yang, 2003) Association Rule merupakan salah satu metode yang bertujuan untuk mencari pola yang sering muncul pada banyak transaksi, dimana setiap transaksi terdiri dari beberapa item. Untuk permasalahan pada toko dapat diatasi dengan metode Association Rule. Salah satu pengaplikasian dari Association Rule adalah Market Basket Analysis, dimana bertujuan untuk menemukan bagaimana item yang dibeli oleh pelanggan dalam supermarket atau toko saling berhubungan. Algoritma yang digunakan adalah algoritma Improved Growth, Improved FP-Growth merupakan salah satu alternatif algoritma yang cukup efektif untuk mencari


(14)

himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data yang besar Pola pembelian yang didapat merupakan pola pembelian konsumen yang sering terjadi pada pembelian.

Berdasarkan masalah yang dihadapi di , maka perlu dilakukan suatu “ PENERAPAN DATA MINING MENGGUNAKAN METODE ASSOCIATION RULES PADA DATA TRANSAKSI MAKMUR JAYA KOSMETIK” Agar dapat mengetahui pola pembelian dari pelanggan dan memberikan informasi yang berguna kepada pihak untuk mengambil keputusan dalam membentuk paket penjualan produk kosmetiknya.

1.2 Perumusan Masalah

Berdasarkan uraian latar belakang masalah di atas maka rumusan masalahdalam penelitian ini adalah bagaimana menerapkan Data Mining menggunakan metode Association Rules dengan algoritma FP-Growthuntuk rekomendasi pembentukan paket penjualan produk di toko .

1.3 Maksud dan Tujuan

Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas akhir ini adalah untuk membuat aplikasi Data Mining menggunakan metode Association Rules dengan algoritma FP-Growth pada data transaksi penjualan untuk rekomendasi pembentukan paket penjualan produk di toko .

Sedangkan tujuan yang ingin dicapai dalam pembangunan aplikasi ini adalah untuk menghasilkan informasi berupa rekomendasi paket penjualan produk kosmetik pada pihak .

1.4 Batasan Masalah

1. Data yang dianalisa merupakan data transaksi penjualan di periode Januari 2016.

2. Jenis item yang dicakup merupakan produk yang dijual, yaitu berupa jenis kosmetik berbagai merk.

3. Algoritma yang digunakan dalam Data Mining yaitu algoritma FP-Growth untuk mencari pola pembelian.


(15)

4. Informasi yang dihasilkan berupa pola pembelian konsumen yang akan menjadi dasar sebagai pembentukan paket yang akan ditawarkan kepada konsumen.

1.5 Metodologi Penelitian

Metodologi penelitian merupakan suatu proses yang digunakan untuk memecahkan suatu masalah yang logis, dimana memerlukan data untuk mendukung terlaksananya suatu penelitian. Metodologi penelitian yang digunakan adalah metode deskriptif, yaitu metode yang menggambarkan fakta-fakta dan informasi dalam situasi atau kejadian dimasa sekarang secara sistematis, faktual dan akurat. Metodologi penelitian ini memiliki dua metode, yaitu metode pengumpulan data dan metode pembangunan perangkat lunak.

1.5.1 Metode Pengumpulan Data

Metode Metod epengumpulan data dapat diperoleh secara langsung dari objek penelitian dan referensi-referensi yang telah diperoleh. Cara-cara yang digunakan untuk mendapatkan data adalah sebagai berikut:

1. StudiLapangan

Studi lapangan adalah metode pengumpulan data yang dilakukan dengan mengadakan penelitian ke Toko . Studi lapangan ini dilakuka dengan dua cara, yaitu: a. Observasi

Observasi merupakan metode pengumpulan data dengan mengadakan penelitian dan peninjauan langsung ke Toko .

b. Wawancara

Wawancara merupakan metode pengumpulan data yang dilakukan dengan mengadakan tanya jawab secara langsung kepada area manager di Toko .

2. StudiLiteratur

Studi Literatur merupakan metode pengumpulan data dengan cara mengumpulkan jurnal, paper dan bacaan-bacaan yang berkaitan dengan topik yang sedang diteliti.


(16)

1.5.2 Metode Pembangunan Data mining

Dalam penelitian ini mengikuti standar dari Cross-Industry Standard for Data mining (CRISP-DM) merupakan suatu standar yang telah dikembangkan pada tahun 1996 yang ditunjukkan untuk melakukan proses analisis dari suatu industri sebagai strategi pemecahan masalah dari bisnis satu unit penelitian [3]. Untuk data yang dapat di proses dengan CRSP-DM ini, tidak ada ketentuan atau karakteristik tertentu, karena data tersebut akan diproses kembali pada fase-fase di dalamnya.

Gambar 1. 1 Cross Industri Standard for Data Mining(CRISP-DM)[4]

Berikut ini adalah tahapan-tahapan yang akan dilakukan dalam penelitian ini sesuai dengan CRISP-DM :

1. Business understanding

Tujuan data mining dalam penelitian ini adalah menggali pengetahuan pada data transaksi penjualan di Makmur Jaya Kosmetik , sehingga dapat diketahui pola pembelian konsumen sehingga diketahui produk mana saja yang tepat sebagai rekomendasi dalam pembuatan paket produk


(17)

2. Data understanding

Pada tahap pemahaman data ini terlebih dahulu akan mengumpulkan semua data yang diperlukan dari hasil data-data transaksi penjualan di Makmur Jaya Kosmetik dari bulan Januari 2016. Dilanjutkan dengan proses pemahaman tentang data yang akan digunakan sebagai hipotesa untuk menemukan informasi yang tersembunyi.

3. Data preparation

Tahap ini meliputi semua kegiatan untuk membangun dataset akhir (data yang akan diproses pada tahap pemodelan/modeling) mengacu dari data transaksi penjualan Makmur Jaya Kosmetik dengan periode januari 2016. Pada tahap ini juga mencakup pemilihan tabel, record, dan atribut-atribut data, termasuk proses pembersihan untuk kemudian dijadikan masukan dalam tahap pemodelan (modeling).

4. Modeling

Dalam tahapan pemodelan ini akan menggunakan teknik metode data mining dengan metode association rule dengan cara menemukan aturan asosiatif atau pola kombinasi produk berdasarkan hasil data transaksi, sehingga dapat diketahui item produk mana saja yang sering dibeli oleh konsumen secara bersamaan.

5. Evaluation

Pada tahap evaluasi ini akan dibandingkan hasil Fp-growth dilakukan oleh sistem dengan perhitungan manual, dengan mengambil beberapa sampel acak. Evaluasi ini ditujukan untuk mengukur apakah pemodelan yang dilakukan sesuai dengan tujuan pengimplementasian data mining pada sistem ini.

6. Deployment

Setiap tahap evaluasi di mana menilai secara detail hasil dari pemodelan, maka akan dilakukan pengimplementasian dari keseluruhan model yang telah dirancang. Selain itu juga dilakukan penyesuaian dari model dengan sistem yang akan dibangun sehingga dapat menghasilkan suatu hasil yang sesuai dengan target pemahaman bisnis.


(18)

1.6 Sistematika Penulisan

Sistematika penulisan yang digunakan dalam penyusunan laporan tugas akhir ini adalah sebagai berikut :

BAB 1. PENDAHULUAN

Bab ini membahas mengenai Latar Belakang Masalah, Rumusan Masalah, Maksud dan Tujuan, Batasan Masalah, Metodologi Penelitian, dan Sistematika Penulisan yang digunakan.

BAB 2. TINJAUAN PUSTAKA

Bab ini membahas tentang sejarah, logo, visi, misi, struktur organisasi dari Makmur Jaya Kosmetik dan berbagai konsep dasar dan teori-teori yang berhubungan dengan judul penelitian, seperti pengertian data, data mining, associaiton rule algoritma Fp-growth , UML, kamus data dan spesifikasi proses.

BAB 3. ANALISIS DAN PERANCANGAN SISTEM

Bab ini berisi tentang analisis dan perancangan sistem yang akan dibangun berdasarkan data penjualan yang diperoleh dari Makmur Jaya Kosmetik dengan menggunakan data mining dengan metode associaiton rule menggunakan algoritma Fp-growth

BAB 4. IMPLEMENTASI DAN PENGUJIAN

Bab ini menjelaskan tentang implementasi dan pengujian terhadap tingkat kekuatan dan keakuratan aturan-aturan asosiasi yang telah didapatkan berdasarkan pola pembelian yang telah diterapkan sesuai dengan algoritma Fp-growth .

BAB 5. KESIMPULAN DAN SARAN

Bab ini berisi tentang kesimpulan dari hasil penelitian yang telah dilakukan dan saran-saran pengembangan lebih lanjut dari sistem yang dibangun.


(19)

7

Makmur Jaya Kosmetik merupakan salah satu bidang usaha penjualan produk-produk kebutuhan kecantikan dan kebutuhan salon dari berbagai merk dalam negeri maupun merk dari luar negeri. Makmur Jaya Kosmetik berlokasi di Jln. Jend. A. Yani No.62 Garut

2.1.1 Sejarah Toko

Toko Makmur Jaya Kosmetik didirikan oleh ibu Hj. Ratna Rosita pada tahun 1986. Nama Makmur Jaya diambil dari nama anak beliau yang bernama Reka Makmur Jaya. Ide untuk mendirikan toko Makmur Jaya Kosmetik ini berawal dari banyaknya konsumen wanita yang sudah membutuhkan kosmetik dan pada saat itu toko kosmetik masih dibilang jarang. Toko Makmur Jaya Kosmetik awalnya adalah sebuah kios kecil biasa yang menjual merk dagang dalam negri. Seiring berkembangnya waktu, kebutuhan akan penunjang kecantikan khususnya bagi kaum wanita semakin bertambah. Pada saat ini Makmur Jaya Kosmetik sudah banyak menjual produk dalam dan luar negri seperti : Rista, Wardah, Ponds, LaTulipe, Tloac Paris, Tull Jye, Tje Fuk, jade, Bless dan lain-lain. Hingga akhirnya sampai sekarang Toko Makmur Jaya Kosmetik merupakan toko kosmetik terbesar dan terkemuka diwilayahnya.

2.1.2 Logo

Logo dari Toko terdapat gambar bunga dibagian kiri serta nama dibagian kanan. Lambang bunga sendiri diambil karena bunga identik dengan keindahan atau kecantikan. Untuk tulisan Makmur Jaya diambil dari nama toko dan untuk tulisan Kosmetik diambil dari bidang usaha yang dijalani. Warna merah muda untuk logo diambil karena warna merah muda identik dengan wanita. Logo dari toko dapat dilihat pada gambar 2.1.


(20)

Gambar 2. 1 Logo Toko

2.1.3 Visi dan Misi

Berikut adalah visi dan misi dari toko :

2.1.3.1 Visi

Visi dari toko adalah sebagai berikut:

1. Menjadi penyedia kosmetik yang aman, lengkap dan terpercaya, serta dapat memberikan pelayanan yang berkualitas

2.1.3.2 Misi

Misi dari toko adalah sebagai berikut:

1. Menyediakan produk kosmetik dari berbagai merk yang dibutuhkan oleh pelanggan

2. Menyediakan kosmetik yang aman yang memiliki label halal serta tercatat di Badan Pom

3. Memberikan pelayanan yang baik pada seluruh pelanggan

2.1.4 Struktur Organisasi

Struktur organisasi dari toko dapat dilihat dari gambar 2.2. Pemimpin

Manager

Bag. Gudang Bag.

Keuangan

Karyawan Karyawan Karyawan


(21)

Deskripsi Jabatan :

1. Pemimpin

Pemimpin merupakan pemilik dari toko yang bertanggung jawab penuh terhadap segala sesuatu yang terjadi di toko .

2. Manager

Manager merupakan seseorang yang membantu pemimpin dalam mengontrol atau mengawasi segala kegiatan di toko .

3. Bag. Gudang

Bagian Gudang merupakan seseorang yang bertugas membantu pemilik dalam mengatur, mengelola, dan mencatat produk-produk yang ada digudang serta produk-produk yang akan dipesan untuk stok barang.

4. Bag. Keuangan

Bagian Keuangan merupakan seseorang yang bertugas untuk membantu pemilik dalam mencatat produk yang terjual dan transaksi yang telah terjadi.

5. Karyawan

Karyawan merupakan seseorang yang bertugas untuk melayani konsumen dalam melakukan pembelian dan transaksi pembayaran.

2.2 Landasan teori

Landasan teori yang berkaitan dengan materi atau teori yang digunakan sebagai acuan melakukan penenlitian. Landasan teori yang diuraikan merupakan hasil studi literatur, buku-buku, maupun situs internet.

2.2.1 Data

Data adalah segala fakta, angka atau teks yang dapat diproses oleh komputer. Data dapat digunakan sebagai input dan menghasilkan sebuah informasi. Data adalah sesuatu yang belum memiliki arti dan masih membutuhkan suatu pengolahan. Dalam data terdapat himpunan data yang merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek yang biasanya dikenal sebagai variabel, field,


(22)

dari sekumpulan record, yang masing-masing terdiri dari satu set atribut yang tetap. Salah satu yang termasuk dalam tipe data record yaitu data transaksi. Data transaksi merupakan sebuah tipe khusus dari record data, dimana tiap record (transaksi) meliputi satu set item

[3].

2.2.2 Basis Data

Basis data adalah kumpulan data yang saling berelasi. Data sendiri merupakan fakta mengenai obyek, orang, dan lain – lain. Data dinyatakan dengan nilai (angka, deretan karakter, atau symbol) [4].

Basis Data sendiri dapat didefinisikan dalam sejumlah sudut pandang seperti[4] : 1. Himpunan kelompok data (arsip) yang saling berhubungan yang diorganisasi

sedemikian rupa agar kelak dapat dimanfaatkan kembali dengan cepat dan mudah.

2. Kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.

3. Kumpulan file/ tabel/ arsip yang saling berhubungan yang disimpan dalam media penyimpanan elektronis.

2.2.2.1 Data pada Basis Data dan Hubungannya

Ada 3 jenis data pada sistem database, yaitu [5] :

1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data

2. Data masukan (input data), data dari luar sistem yang dimasukan melalui peralatan input (keyboard), yang dapat merubah data operasional.

3. Data kelauran (output data), berupa laporan melalui peralatan output sebagai hasil dari dalam sistem yang mengakses data operasional.

2.2.2.2 Keuntungan dan Kerugian Pemakaian Sistem Database

Keuntungan [5] :


(23)

2. Data dapat dipakai secara bersama-sama.

3. Memudahkan penerapan standarisaasi dan batas-batas pengamanan. 4. Terpeliharanya keseimbangan atas perbedaan kebutuhan data dari setiap aplikasi.

5. Program /data independent. Kerugian :

1. Mahal dalam implementasinya. 2. Rumit

3. Penanganan proses recoverybackup sulit.

4. Kerusakan pada sistem basis data dapat mempengaruhi.

2.2.3 Database Mangement System

Database Management System atau disingkat DBMS adalah perangkat lunak (software) yang berfungsi untuk mengelola database. Mulai dari membuat database itu sendiri, sampai dengan prosesyang berlaku dalam database tersebut, baik berupa entry, edit, hapus, query terhadap data, membuat laporan dan lain sebagainya secara efektif dan efesien. Salah satu jenis DBMS yang sangat terkenal saat ini adalah Relational DBMS (RDBMS), RDBMS mempresentasikan data dalam bentuk tabel – tabel yang saling berhubugan. Sebuah tabel disususn dalam bentuk baris (record) dan kolom (field) [6].

2.2.4 Data Mining

Data mining adalah proses untuk mendapatkan informasi yang berguna dari gedung basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Istilah

data mining kadang disebut juga knowledge discovery. Salah satu teknik yang dibuat dalam data mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model, kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain yang tidak berada dalam basis data yang tersimpan. Dalam data mining, pengelompokan data juga bisa dilakukan. Tujuannya adalah agar kita dapat megetahui pola universal data-data yang ada [7].


(24)

1. Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar.

2. Ekstrasi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui potensi kegunaannya) pola atau pengetahuan dari data yang di simpan dalam jumlah besar.

3. Eksplorasi dari analisa secara otomatis atau semiotomatis terhadap data data dalam jumlah besar untuk mencari pola dan aturan yang berarti.

2.2.4.1 Metode Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu [9] :

1. Deskripsi

Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat mengumpulkan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelesan untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.


(25)

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah :

1. Prediksi harga beras dalam tiga bulan yang akan datang.

2. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikan.

4. Klasifikasi

Dalam klasifikasi, terdapat terget variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah :

1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.

2. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk class objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keselurahan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam suatu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah :


(26)

1. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang besar.

2. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan.

3. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah : 1. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler

yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.

2. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.

2.2.5 Cross-Industry Standard Process for Data Mining (CRISP-DM)

Cross-Indutry Standard Prosess for Data Mining (CRISP-DM) yang dikembangkan tahun 1996 oleh analis dari beberapa industri seperti Daimler Chrysler, SPSS dan NCR. CRISP-DM menyediakan standar proses data mining sebagai strategi pemecahan masalah secara umum dari bisnis atau unit penelitian. Dalam CRISP-DM, sebuah proyek data mining memiliki siklus hidup yang terbagi dalam enam fase. Keseluruhan fase berurutan yang ada tersebut bersifat adaptif. Fase berikutnya dalam urutan bergantung kepada keluaran dari fase sebelumnya. Hubungan antarfase digambarkan dengan panah. Sebagai contoh, jika proses berada pada fase modelling. Berdasar pada perilaku dan karakteristik model, proses mungkin harus kembali kepada fase data preparation untuk perbaikan lebih lanjut terhadap data atau berpindah maju kepada fase evaluation. Enam fase yang ada dalam metode CRISP-DM tersebut dapat dilihat pada Gambar 2.2 :


(27)

Fase-fase dari CRISP-DM [11] : 1. Business understanding

a. Penentuan tujuan objek dan kebutuhan secara detail dalam lingkup bisnis atau unit penelitian secara keseluruhan.

b. Menilai situasi objek untuk mengetahui sumber daya yang tersedia.

c. Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining.

2. Data understanding a. Mengumpulkan data.

b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal.

c. Mengevaluasi kualitas data.

d. Jika diinginkan, pilih sebagian kecil grup data yang mungkin mengandung pola dari permasalahan.


(28)

3. Data preparation

a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk

keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif.

b. Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang akan dilakukan.

c. Lakukan perubahan pada beberapa variabel jika dibutuhkan. d. Sipakan data awal sehingga siap untuk perangkat pemodelan. 4. Modelling

a. Pilihan dan aplikasikan teknik pemodelan yang sesuai. b. Membangun model yang digunakan.

c. Menilai model yang digunakan.

d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk

menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.

e. Aturan bisnis pembentukan paket 5. Evaluation

a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk

digunakan.

b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal. c. Menentukan apakah terdapat permasalahan penting dari bisnis atau


(29)

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining. 6. Deployment

a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.

b. Contoh sederhana penyebaran : pembuataan laporan.

c. Contoh kompleks penyebaran : penerapan proses data mining secara paralel pada departemen lain.

2.2.6 Association Rule

Aturan asosiasi (Association rule) adalah salah satu teknik tentang ‘apa

bersama apa’. Ini bisa berupa transaksi di supermarket, misalnya seseorang yang

membeli susu bayi juga membeli sabun mandi. Di sini berarti susu bayi bersama sabun mandi. Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan Market Basket [10].

Untuk mencari association ruledari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah semua pola frequent itemset ditemukan, barulah mencari aturan asosiatif atau aturan keterkaitan yang memenuhui syarat yang telah ditentukan.

Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki Booleanvariable yang akan menunjukan keberadaannya atau tidak barang tersebut dalam satu transaksi atau satu keranjang belanja. Pola Boolean yang didapat digunakan untuk menganalisa barang yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule. Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditujukan sebagai berikut :


(30)

Nilai support 2% menunjukan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence 60% yaitu menunjukan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.

Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Support (nilai penunjang) adalah presentase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar-item dalam aturan asosiasi.

Dalam menentukan suatu association rule, terdapat suatu ukuran kepercayaan yang didapat dari hasil pengelolahan data dengan perhitungan tertentu. Umumnya ada dua ukuran, yaitu:

1) Support : suatu ukuran yang menunjukan seberapa besar tingkat dominasi suatu itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu itemset layak untuk dicari confidence-nya ( misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item yang menunjukan bahwa item A dan item B dibeli bersamaan).

2) Confidence : suatu ukuran yang menunjukan hubungan antara 2 item secara conditional (misal, menghitung kemungkinan seberapa sering item B dibeli oleh pelanggan jika pelanggan tersebut membeli sebuah item A).

Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence).

Nilai support sebuah item diperoleh dengan rumus sebagai berikut[11] : � � A =� �ℎ � � � � � � � � ��� � �x100%….. Persamaan (2.1)

Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut:


(31)

Sedangkan nilai confidence dapat dicari setelah pola frekuensi munculnya sebuah item ditemukan. Rumus untuk menghitung confidence adalah sebagai berikut:

� � =J Ja a aa a a ya ya a a a x100%…..Persamaan(2.3) 2.2.7 Algoritma FP-Growth

Algoritma fp-growth merupakan salah satu alternatif algoritma yang cukup efektif untuk mencari himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data yang besar. Algoritma fp-growth merupakan algoritma association rules yang cukup sering dipakai. Algoritma fp-growth ini dikembangkan dari algoritma apriori. Algoritma apriori menghasilkan kombinasi yang sangat banyak sehingga sangat tidak efisien.

Algoritma fp-growth ini merupakan salah satu solusi dari algoritma apriori yang memakan waktu yang sangat lama karena harus melakukan pattern matching yang secara berulang-ulang. Sedangkan dalam proses algoritma fp-growth terdapat banyak kelebihan yang terbukti sangat efisien karena hanya dilakukan pemetaan data atau scan

database sebanyak 2 kali untuk membangun struktur ”tree”. Maka dari itu, algoritma fp-growth dikenal juga dengan sebutan algoritma FP-Tree . Dengan menggunakan struktur FP-Tree , algoritma fp-growth dapat langsung mengekstrak frequent itemset dari susunan FP-Tree yang telah terbentuk. Metode fp-grwth dapat dibagi menjadi 3 tahapan utama yaitu sebagai :

1) Tahap Pembangkitan conditional pattern base.

Conditional Pattern Base merupakan sub database yang berisi prefix path dan suffix pattern. Pembangkitan conditinal pattern base didapatkan melalui FP-Tree yang telah dibangun sebelumnya.

2) Tahap Pembangkitan Conditional FP-Tree

Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar atau sama dengan minimum support count ξ akan dibangkitkan dengan conditional FP-Tree .


(32)

3) Tahap Pencarian frequent itemset

Apabila conditional FP-Tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dnegan melakukan kombinasi item untuk setiap conditional FP-Tree . Jika bukan lintasan tunggal, maka dilakukan pembangkitan FP-Growth secara rekursif.

Ketiga tahap tersebut merupakan langkah yang akan dilakukan untuk mendapat frequent itemset,yang dapat dilihat pada algoritma berikut :

Contoh kasus penerapan Algoritma FP-Growth Input : FP-Tree Tree

Output : Rt Sekumpulan lengkap pola frequent Method : FP-Ggrowth ( Tree, null )

Procedure : FP-Growth ( Tree, _ ) {

01 : if Tree mengandung single path P;

02 : then untuk tiap kombinasi ( dinotasikan _ ) dari node node dalam path do 03 : bangkitkan pola _ _ dengan support daro node-node dalam _;

04 : else untuk tiap a1 dalam header dari Tree do

{

05 : bangkitkan pola

06 : bangun _ = a1 _ dengan support = a1. Support

07 : if Tree _ = _

08 : then panggil FP-Growth (Tree, _ ) }


(33)

-Misalkan didapat hasil dari tabel pembangkitan conditional pattern base sebagai berikut, diketahui sebelumnya nilai minimum support 5%.

a. Tahap Pembangkitan Conditional Pattern Base

Tabel 2. 1 Conditional Pattern Base

Item Conditional Pattern Base

1 2,3, 1:6

b. Tahap Pembangkitan Conditional FP-Tree

Pada tahap ini, support count dari setiap item dijumlahkan, lalu setiapdan dibandingkan dengan conditional fp - tree

- Conditional fp – tree 1: { 2,4,3 }

Karena support count 1 adalah 6, maka memenuhi minimum support yaitu 4. Berikut adalah tahap-tahap pembangkitan conditional FP-Tree 1.

- Pada lintasan yang berakhiran {1} dengan support count 1 atau lebih yang dimilikinya akan dihilangkan dan support count yang melewati

lintasan pertama atau lintasan lainnya yang berakhiran {1}, akn disamain sesuai dengan support count yang dimilikinya.


(34)

- Proses selanjutnya adalah apabila dalam suatu lintasan, melintasi dua atau lebih, maka support count akan selalu bertambah 1

Setelah proses pembangkitan, proses terakhir adalah mencari frequent itemset yang keluar. 2:6 dan 3:6 adalah item yang keluar

Gambar 2. 6 Conditional FP-Tree 1,2:6 Hasil Frequent Itemset

Gambar 2. 7 Conditional FP-Tree 1,3:6 Hasil Frequent Itemset

c. Tahap Pencarian frequent itemset - Akumulasiakn count setiap item - Buat conditional FP-Tree


(35)

Gambar 2. 8 Conditional FP-Tree Untuk Item Frequenset 1, 2:6

2.2.8 FP Tree

FP-Tree merupakan struktur penyimpanan data yang dimampatkan. FP-Tree

dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan tertentu dalam FP-Tree . Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-Tree semakin efektif. Kelebihan dari FP-Tree adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien. Adapun FP-Tree adalah sebuah pohon dengan definisi sebagai berikut :

1. FP-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan pohon yang beranggotakan item-item tertentu, dan sebuah tabel frequent header.

2. Setiap simpul dalam FP-Tree mengandung tiga informasi penting, yaitu label item, menginformasikan jenis item yang dipresentasikan simpul


(36)

tersebut, support count merepresentasikan jumlah lintasan transaksi yang melalui simpul tersebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antar lintasan, ditandai dengan garis putus-putus.

2.2.9 Unified Modeling Language (UML)

Unified Modeling Language (UML) adalah himpunan struktur dan teknik untuk pemodelan desain program berorientasi objek serta aplikasinya. Berikut adalah beberapa model yang digunakan dalam perancangan Data Mining Pemaketan Produk untuk menggambarkan sistem dalam UML:

1. Diagram Use Case 2. Diagram Class 3. Diagram Aktivitas 4. Diagram Objek

2.2.9.1. Diagram Use Case

Diagram use case adalah model fungsional sebuah sistem yang menggunakan aktor dan use case. Use case adalah layanan (services) atau fungsi–fungsi yang disediakan oleh sistem untuk penggunanya.

Deskripsi Diagram Use Case:

1. Sebuah use case adalah dimana sistem digunakan untuk memenuhi satu atau lebih kebutuhan pemakai.

2. Use case merupakan awal yang sangat baik untuk setiap fase pengembangan berbasis objek, design testing, dan dokumentasi.

3. Use case menggambarkan kebutuhan sistem dari sudut pandang di luar sistem.

4. Use case menentukan nilai yang diberikan sistem kepada pemakainya. 5. Use case hanya menetapkan apa yang seharusnya dikerjakan oleh


(37)

6. Use case tidak untuk menentukan kebutuhan nonfungsional, misal: sasaran kerja, bahasa pemrograman.

2.2.9.2 Diagram Class

Diagram class adalah Diagram UML yang menggambarkan class -class dalam sebuah sistem dan hubungannya antara satu dengan yang lain, serta dimasukkan pula atribut dan operasi. Tahapan dari Diagram class adalah sebagai berikut:

1. Mengidentifikasi objek dan mendapatkan class-classnya. 2. Mengidentifikasi atribut class-class.

3. Mulai mengkonstruksikan kamus data. 4. Mengidentifikasi operasi pada class-class.

5. Mengidentifikasikan hubungan antar class dengan menggunakan asosiasi, agregasi, dan inheritance (pewarisan).

2.2.9.3 Diagram Aktifitas

Diagram aktivitas adalah representasi grafis dari seluruh tahapan alur kerja. Diagram ini mengandung aktivitas, pilihan tindakan, perulangan dan hasil dari aktivitas tersebut. Diagram ini dapat digunakan untuk menjelaskan proses bisnis dan alur kerja operasional secara langkah demi langkah dari komponen suatu sistem.

2.2.9.4 Diagram Objek

Diagram objek adalah suatu Diagram yang berfungsi untuk mengatur atribut, objek dan hubungan antara contoh dalam Diagram. Diagram objek juga dapat menampilkan struktur model sistem dalam waktu tertentu. Diagram objek menggambarkan struktur sistem dari segi penamaan objek dan jalannya objek dalam sistem. Pada Diagram objek harus dipastikan semua class yang sudah didefinisikan pada Diagram class harus dipakai objeknya, karena jika tidak, pendefinisian class itu tidak dapat dipertanggungjawabkan. Meskipun Diagram class diperlukan untuk mendokumentasikan struktur class, tetapi


(38)

Diagram objek, dapat berguna. Sebuah Diagram objek dasarnya instansiasi semua atau bagian dari Diagram class

2.2.10 MySQL

MySQL adalah multiuser database yang menggunakan bahasa structured Query Language (SQL). MySQL dalam operasi client server melibatkan server daemon MySQL di sisi server dan berbagai macam program serta library yang berjalan di sisi client. MySQL mampu menangani data yang cukup besar. Perusahaan yang mengembangkan MySQL yaitu TcX, mengaku bahwa MySQL yang mampu menyimpan data lebih dari 40 database, 10.000 tabel dan sekitar 7 juta baris, totalnya kurang lebih 100 Gigabyte data [12].

SQL adalah bahasa standar yang digunakan untuk mengakses database server. Bahasa ini pada awalnya dikembangkan oleh IBM, namun telah diadopsi dan digunakan sebagai bahasa yang standar industri. Dengan menggunakan SQL, proses akses database menjadi lebih user-friendly dibandingkan dengan menggunakan DBASE atau Clipper yang masih menggunakan perintah-perintah pemrograman.


(39)

27

Analisis sistem (System Analysis) dapat didefinisikan sebagai penguraian dari suatu sistem informasi yang utuh ke dalam bagian-bagian komponennya dengan maksud untuk mengidentifikasikan dan mengevaluasi permasalahan-permasalahan, kesempatan-kesempatan, hambatan-hambatan yang terjadi dan kebutuhan-kebutuhan yang diharapkan sehingga dapat diusulkan perbaikan-perbaikannya. Dalam analisa sistem ini meluputi beberapa bagian, yaitu :

1. Analisis Masalah

2. Analisis Penerapan Metode Crisp-DM

3. Analisis Prosedur Penentuan Paket Produk Kosmetik 4. Analisis Spesifikasi Kebutuhan Perangkat Lunak

3.1.1 Analisis Masalah

Berdasarkan hasil pengamatan, dapat disimpulkan bahwa permasalahan yang ada di toko yaitu belum adanya informasi penentuan paket produk kosmetik yang sesuai dengan minat konsumen yang akan ditawarkan.

3.1.2 Analisis Penerapan Metode Crisp-DM 3.1.2.1Pemahaman Bisnis

Pemahaman Bisnis atau disebut dengan Business Understanding merupakan tahapan pertama yang dilakukan dalam kerangka kerja CRISP-DM. Dalam tahapan bisnis ini terbagi menjadi dua bagian, yaitu:

1. Penentuan Tujuan Bisnis

Menjual produk dalam bentuk paket untuk memenuhi permintaan konsumen dan menghasilkan keuntungan untuk perusahaan.


(40)

Menilai situasi merupakan tahapan untuk menjelaskan sumber daya yang tersedia di Makmur Jaya Kosmetik. Berikut Merupakan sumber daya yang ada pada Makmur Jaya Kosmetik

1. Sumber Daya Perangkat Keras

1.1Terdapat Alat penunjang transaksi yaitu, printer thermal dan cashdrawer (laci Kasir)

1.2Komputer 2. Sumber daya data

2.1Sumber daya data yang di Makmur Jaya Kosmetik yaitu data transaksi penjualan.

2.2Sumber daya data ini bersifat internal yaitu tersimpan di database Makmur Jaya Kosmetik

3. Sumber data personil

3.1Pegawai kasir yang bertugas melakukan transaksi pembeli , mencetak nota dan membuat laporan penjualan yang akan di serahkan ke manager.

4. Kebutuhan

4.1Data yang digunakan dalam penelitian ini adalah data transaksi penjualan.

5. Asumsi

5.1Data transaksi yang digunakan merupakan hasil import dari aplikasi kasir di Makmur Jaya Kosmetik dengan format database (.sql) 5.2Data transaksi yang digunakan periode bulan Januari 2016 6. Batasan

6.1Hasil dari data mining ini berupa rule sebagai acuan untuk membuat paket.


(41)

3. Penentuan Sasaran Data Mining

Mengetahui keterkaitan produk yang sering dibeli oleh kosumen sehingga bisa dijadikan acuan dalam penentuan paket produk.

3.1.2.2Pemahaman Data

Tahapan pemahaman data dimulai dengan pengumpulan data awal dan hasil kegiatan untuk mengidentifikasi masalah data, untuk mendetekdi subset menarik untuk membetuk hipotesis untuk informasi yang tersembunyi.

1. Mengumpulkan Data Awal

Sumber yang didapat adalah data transaksi di Makmur Jaya Kosmetik. Yang dapat dilihat di Gambar 3.1.


(42)

Data yang ada saat ini merupakan bentuk tidak normal, untuk memudahkan proses analisis dalam data miningmaka dilakukan proses normalisasi. Berikut adalah tahapan proses normalisasi:

a. Tahap 1: Bentuk unnormalize

Tabel 3. 1 Bentuk Unnormalize Data Transaksi

b. Tahap 2: Bentuk Normal Ke-1

Tabel 3. 2 Bentuk Norma ke-1 Nama toko Alamat

toko

Tlp toko

No Faktur Tang gal

Kode Nama Produk Qty Harga Jumla h Total Harga Makmur Jaya Kosmetik Jl. Jend A.Yani No.62, Garut (0262) 233624

16010001 01/01 /2016

WFS60 Wardah Facial Scrub 60 ml

1 39000 39000

5541500

PCSAC40 PONDS CS ACNE C 40 1 22500 22500

CHPWGUV40 CITRA HAZ SPOTLES

WHITE GLOW UV 40 G

1 10500 10500

LTMC120 La Tulip Milk Cleanser

120 ml New

1 23000 23000

KS35 KAPAS SARIAYU 35 1 5000 5000

PAR Pensil Alis Revlon 1 5000 5000

PSHPAD170 PANTENE SHP ANTI

DANRUFF 170 ML ATLAS

1 22000 22000

WLDCS30S1 Wardah Lig Day Cream

Step 1 30 gr

1 24000 24000

No Faktur

Tanggal Kode Nama Produk Qty Harga Jumla h

Total Harga 1601000

1

01/01/2016 WFS60 Wardah Facial Scrub 60 ml

1 3900 0

39000 5541500 1601000

1

01/01/2016 PCSAC40 PONDS CS ACNE C 40

1 2250 0

22500 5541500 1601000

1

01/01/2016 CHPWGU V40

CITRA HAZ

SPOTLES WHITE GLOW UV 40 G

1 1050 0

10500 5541500

1601000 1

01/01/2016 LTMC120 La Tulip Milk Cleanser 120 ml New

1 2300 0


(43)

2. Mendeskripsikan Data

Tahap kedua dalam pemahaman data adalah mendeskripsikan data dengan tujuan untuk memahami data yang didapat dari hasil pengumpulan data awal. Berikut merupakan penjelasan dari masing-masing atribut yang terdapat pada tabel transaksi yang dapat dilihat pada tabel 3.1 dibawah ini :

Tabel 3. 3Struktur Data Transaksi Penjualan

Dokumen Keterangan

Detail Data Transaksi

Deskripsi Data ini berisi mengenai data transaksi yang ada di toko Format Microsoft Excel (.xlsx)

Atribut No Faktur Nomor struk

Tanggal Tanggal pencetakan struk Kode Kode barang yang dibeli Nama Produk Nama barang yang dibeli Qty Jumlah barang yang dibeli Harga Harga barang yang dibeli

Jumlah Harga Barang dikalikan dengan Qty Total Harga Total harga dari barang yang dibeli

3.1.2.2.3 Verify Data Quality (Verifikasi Kualitas Data)

Dari data transaksi yang didapat terdapat noise, noise yaitu data transaksi yang hanya memiliki 1 barang dalam sekali transaksi sehingga data tersebut perlu dihilangkan dikarenakan data tersebut akan mempengaruhi proses mining kedepanya. Maka dari itu data – data yang memiliki noise akan dilakukan pembersihan data pada tahap berikutnya.

1601000 1

01/01/2016 KS35 KAPAS SARIAYU 35

1 5000 5000 5541500 1601000

1

01/01/2016 PAR Pensil Alis Revlon 1 5000 5000 5541500 1601000

1

01/01/2016 PSHPAD17 0

PANTENE SHP ANTI DANRUFF 170 ML ATLAS

1 2200 0

22000 5541500

1601000 1

01/01/2016 WLDCS30 S1

Wardah Lig Day Cream Step 1 30 gr

1 2400 0


(44)

3.1.2.3Data Preparation

Persiapan Data merupakan tahap dimana akan dilakukan pemilihan tabel dan field yang akan digunakan dalam proses mining. Persiapan data dilakukan dengan sebutan Preprocessing Data. Preprocessing merupakan hal yang harus dilakukan dalam proses data mining, karena tidak semua data atau atribut data dalam data digunakan dalam proses data mining. Proses ini dilakukan agar data yang digunakan sesuai dengan kebutuhan. Adapun tahapan-tahapan preprocessing data dalam penelitian ini adalah sebagai berikut:

1. Ekstrasi Data

Ekstraksi data dapat diartikan sebagai proses pengambilan data dari sumber data dalam rangka untuk melanjutkan proses pengolahan data ke tingkat selanjutnya ataupun untuk menyimpan data hasil ekstrak tersebut. Dalam penelitian ini, data yang berasal dari flat file berformat microsoft excel (.xlsx) di ekstrak kedalam format sql, kemudian disimpan kedalam sebuah database agar memudahkan dalam proses pengolahan data. Berikut merupakan contoh sampel data transaksi 1 bulan periode bulan Januari sebanyak 30 transaksi yang terdapat di toko , dimana atribut-atribut yang terdapat dalam data tersebut antara lain No, No Faktur, Tanggal, Kode Barang, Nama Barang, Varian, Harga Barang, Qty, Jumlah, dan Total Harga.

2. Pemilihan Atribut ( Select Data)

Proses pemilihan atribut atau selection data adalah proses dimana atribut data akan dipilih dan diproses sesuai dengan kebutuhan data mining. Sebelum melakukan proses cleaning atau pembersihan data akan lebih efisien jika melakukan proses selection atau pemilihan atribut ini terlebih dahulu. Karena dari data transaksi yang sebanyak ribuan record ini memiliki 10 atribut sedangkan yang dibutuhkan untuk data mining hanya 2 atribut. Dengan menyeleksi atribut yang tidak dibutuhkan akan memudahkan pada proses pembersihan data nanti, sehingga pada saat pembersihan data tidak akan memperberat memori karena program harus membaca atribut yang


(45)

tidak perlu. Dalam penelitian ini, 2 atribut yang akan digunakan adalah atribut No Faktur dan Kode. K edua atribut ini digunakan untuk memenuhi tujuan awal dimana akan dicari pola pembelian konsumen berdasarkan produk yang dibeli. Seperti atribut No Faktur digunakan untuk membedakan satu transaksi dengan transaksi lainnya, dan atribut Kode digunakan untuk mengetahui produk apa saja yang dibeli dalam satu transaksi.

Tabel 3. 4 Pemilihan Atriburt

NoFaktur Kode NoFaktur Kode

16010001 WFS60 16010014 PELB

16010001 PCSAC40 16010014 WFSNDS

16010001 CHPWGUV40 16010015 WLCF60

16010001 LTMC120 16010015 PCSAC40

16010001 KS35 16010015 MSDHM500

16010001 PAR 16010015 PFLC25

16010001 PSHPAD170 16010015 PCSACWFF50 16010001 WLDCS30S1 16010016 CHPWGUV40

16010002 WFS60 16010016 LTMC120

16010002 PCSAC40 16010016 WLNC20S2

16010002 CHPWGUV40 16010016 RAWL10

16010002 MSDHM500 16010016 ELDW

16010002 PFLC25 16010016 JMS

16010002 KS35 16010016 PLDS35

16010002 PELB 16010017 WFS60

16010002 PSHPAD170 16010017 PCSAC40


(46)

16010003 WLCF60 16010017 PCSACWFF50

16010003 CHPWGUV40 16010017 PAR

16010003 MSDHM500 16010017 WLBBCL15

16010003 KS35 16010017 SSHP170

16010003 PELB 16010018 WFS60

16010003 WLDCS30S1 16010018 MSDHM500

16010003 WLNC20S2 16010018 LTMC120

16010003 WFSNDS 16010018 PFLC25

16010003 WELFSP20 16010018 MKP120

16010004 WLCF60 16010018 ELDW

16010004 PCSAC40 16010019 WLCF60

16010004 CHPWGUV40 16010019 PCSACWFF50

16010004 PELB 16010019 RAWL10

16010004 PSHPAD170 16010019 HICAT60

16010005 WFS60 16010020 WFS60

16010005 PCSAC40 16010020 WLCF60

16010005 MSDHM500 16010020 PFLC25

16010005 LTMC120 16010020 PAR

16010005 PAR 16010020 EHVITR

16010005 PELB 16010021 WLCF60

16010005 WLDCS30S1 16010021 SSHP170

16010006 WLCF60 16010022 HICAT60

16010007 PCSAC40 16010023 WFS60

16010008 WFS60 16010023 PCSAC40

16010008 CHPWGUV40 16010023 MSDHM500

16010008 MSDHM500 16010023 LTMC120

16010008 KS35 16010023 PFLC25

16010008 PELB 16010024 WFS60

16010008 PSHPAD170 16010024 PCSACWFF50

16010009 WLCF60 16010024 PAR

16010009 CHPWGUV40 16010024 WLBBCL15

16010009 KS35 16010024 EHVITR

16010009 PAR 16010025 WLCF60

16010009 PELB 16010025 CHPWGUV40

16010009 WLDCS30S1 16010025 PFLC25

16010009 WFSNDS 16010025 RAWL10

16010009 SSHP170 16010025 HICAT60


(47)

16010010 WFS60 16010026 WFS60

16010010 PCSAC40 16010026 PCSAC40

16010010 CHPWGUV40 16010026 MSDHM500

16010010 MSDHM500 16010026 PCSACWFF50

16010010 LTMC120 16010026 WLNC20S2

16010010 KS35 16010026 WLBBCL15

16010010 PELB 16010026 SSHP170

16010010 PSHPAD170 16010026 EHVITR

16010011 WLCF60 16010027 WFS60

16010011 LTMC120 16010027 PCSAC40

16010011 KS35 16010027 LTMC120

16010011 PSHPAD170 16010027 PFLC25 16010011 WLDCS30S1 16010027 PCSACWFF50

16010011 WLNC20S2 16010027 WLBBCL15

16010011 WFSNDS 16010027 WELFSP20

16010011 SSHP170 16010028 WFS60

16010012 WFS60 16010028 WLCF60

16010012 WLCF60 16010028 PFLC25

16010012 CHPWGUV40 16010028 PCSACWFF50

16010012 LTMC120 16010028 RAWL10

16010012 PAR 16010028 WELFSP20

16010012 WLDCS30S1 16010029 WLCF60

16010013 WLCF60 16010029 PCSAC40

16010013 MSDHM500 16010029 MSDHM500

16010013 KS35 16010029 PFLC25

16010013 PSHPAD170 16010029 PCSACWFF50

16010013 WLNC20S2 16010029 EHVITR

16010013 WFSNDS 16010030 WLCF60

16010013 HICAT60 16010030 PCSAC40

16010014 WFS60 16010030 CHPWGUV40

16010014 PCSAC40 16010030 MSDHM500

16010014 CHPWGUV40 16010030 PFLC25

16010014 LTMC120 16010030 PCSACWFF50

16010014 KS35 16010030 WLNC20S2


(48)

3. Pembersihan Data

Proses pembersihan data atau cleaning data adalah proses menghilangkan data tidak relevan atau inkosisten dan proses menghilangkan noise. Noise disini yaitu data transaksi yang hanya memiliki 1 produk dalam sekali pembelian. Dalam data transaksi ini akan dilakukan pengeleminasian terhadap transaksi yang memiliki jumlah produk kurang dari 2 produk dalam satu kali transaksinya, karena syarat ini diperlukan dalam Association Rules untuk melihat keterhubungan antar 2 produk atau lebih. Setelah melakukan proses pembersihan data, dari data transaksi yang awalnya sebanyak 33 transaksi di cleaning menjadi 27 transaksi.

Sebelum Pembersihan Data Setelah Pembersihan Dara

NoFaktur Kode NoFaktur Kode

16010005 WFS60 16010005 WFS60

16010005 PCSAC40 16010005 PCSAC40 16010005 MSDHM500 16010005 MSDHM500 16010005 LTMC120 16010005 LTMC120

16010005 PAR 16010005 PAR

16010005 PELB 16010005 PELB

16010005 WLDCS30S1 16010005 WLDCS30S1 16010006 WLCF60 16010008 WFS60 16010007 PCSAC40 16010008 CHPWGUV40

16010008 WFS60 16010008 MSDHM500

16010008 CHPWGUV40 16010008 KS35 16010008 MSDHM500 16010008 PELB

16010008 KS35 16010008 PSHPAD170

16010008 PELB 16010008 PSHPAD170

Tabel 3. 5 Hasil Pembersihan Data

NoFaktur Kode NoFaktur Kode

16010001 WFS60 16010014 WFSNDS

16010001 PCSAC40 16010015 WLCF60

16010001 CHPWGUV40 16010015 PCSAC40

16010001 LTMC120 16010015 MSDHM500


(49)

16010001 PAR 16010015 PCSACWFF50

16010001 PSHPAD170 16010016 CHPWGUV40

16010001 WLDCS30S1 16010016 LTMC120

16010002 WFS60 16010016 WLNC20S2

16010002 PCSAC40 16010016 RAWL10

16010002 CHPWGUV40 16010016 ELDW

16010002 MSDHM500 16010016 JMS

16010002 PFLC25 16010016 PLDS35

16010002 KS35 16010017 WFS60

16010002 PELB 16010017 PCSAC40

16010002 PSHPAD170 16010017 CHPWGUV40

16010003 WFS60 16010017 PCSACWFF50

16010003 WLCF60 16010017 PAR

16010003 CHPWGUV40 16010017 WLBBCL15

16010003 MSDHM500 16010017 SSHP170

16010003 KS35 16010018 WFS60

16010003 PELB 16010018 MSDHM500

16010003 WLDCS30S1 16010018 LTMC120

16010003 WLNC20S2 16010018 PFLC25

16010003 WFSNDS 16010018 MKP120

16010003 WELFSP20 16010018 ELDW

16010004 WLCF60 16010019 WLCF60

16010004 PCSAC40 16010019 PCSACWFF50

16010004 CHPWGUV40 16010019 RAWL10

16010004 PELB 16010019 HICAT60

16010004 PSHPAD170 16010020 WFS60

16010005 WFS60 16010020 WLCF60

16010005 PCSAC40 16010020 PFLC25

16010005 MSDHM500 16010020 PAR

16010005 LTMC120 16010020 EHVITR

16010005 PAR 16010021 WLCF60

16010005 PELB 16010021 SSHP170

16010005 WLDCS30S1 16010023 WFS60

16010008 WFS60 16010023 PCSAC40

16010008 CHPWGUV40 16010023 MSDHM500

16010008 MSDHM500 16010023 LTMC120

16010008 KS35 16010023 PFLC25


(50)

16010008 PSHPAD170 16010024 PCSACWFF50

16010009 WLCF60 16010024 PAR

16010009 CHPWGUV40 16010024 WLBBCL15

16010009 KS35 16010024 EHVITR

16010009 PAR 16010025 WLCF60

16010009 PELB 16010025 CHPWGUV40

16010009 WLDCS30S1 16010025 PFLC25

16010009 WFSNDS 16010025 RAWL10

16010009 SSHP170 16010025 HICAT60

16010009 MKP120 16010025 MKP120

16010010 WFS60 16010026 WFS60

16010010 PCSAC40 16010026 PCSAC40

16010010 CHPWGUV40 16010026 MSDHM500

16010010 MSDHM500 16010026 PCSACWFF50

16010010 LTMC120 16010026 WLNC20S2

16010010 KS35 16010026 WLBBCL15

16010010 PELB 16010026 SSHP170

16010010 PSHPAD170 16010026 EHVITR

16010011 WLCF60 16010027 WFS60

16010011 LTMC120 16010027 PCSAC40

16010011 KS35 16010027 LTMC120

16010011 PSHPAD170 16010027 PFLC25

16010011 WLDCS30S1 16010027 PCSACWFF50

16010011 WLNC20S2 16010027 WLBBCL15

16010011 WFSNDS 16010027 WELFSP20

16010011 SSHP170 16010028 WFS60

16010012 WFS60 16010028 WLCF60

16010012 WLCF60 16010028 PFLC25

16010012 CHPWGUV40 16010028 PCSACWFF50

16010012 LTMC120 16010028 RAWL10

16010012 PAR 16010028 WELFSP20

16010012 WLDCS30S1 16010029 WLCF60

16010013 WLCF60 16010029 PCSAC40

16010013 MSDHM500 16010029 MSDHM500

16010013 KS35 16010029 PFLC25

16010013 PSHPAD170 16010029 PCSACWFF50

16010013 WLNC20S2 16010029 EHVITR


(51)

16010013 HICAT60 16010030 PCSAC40

16010014 WFS60 16010030 CHPWGUV40

16010014 PCSAC40 16010030 MSDHM500

16010014 CHPWGUV40 16010030 PFLC25

16010014 LTMC120 16010030 PCSACWFF50

16010014 KS35 16010030 WLNC20S2

16010014 PAR 16010030 WLBBCL15

16010014 PELB

3.1.2.4Modeling

Pemodelan merupakan tahap untuk mebuat model atau desain sistem yang akan dibangun. Data yang digunakan untuk pengolahan data adalah data yang tertera pada tabel 3.3

1. Select Modeling Technique ( Memilih Teknik Pemodelan)

Dengan menggunakan metode Data Mining, data transaksi akan diolah dengan aturan asosiasi untuk menemukan pola-pola pembelian barang yang sering dibeli oleh konsumen. Didalam tahap ini metode yang digunakan adalah Assosiacion Rule.

Penelitian ini bertujuan menemukan pola assosiasi pembelian konsumen. Teknik pemodelan yang digunakan dalam penelitian ini adalah metode Association Rules sedangkan algoritma yang digunakan dalam penelitian ini adalah algoritma FP-Growth Dengan menerapkan Data Mining, data transaksi akan diolah dengan aturan asosiasi atau metode Association Rules untuk menemukan pola-pola pembelian produk yang sering dibeli oleh konsumen.

2. Build Model ( Membangun Model)

Algoritma yang digunakan dalam penelitian ini adalah algoritma FP-Growth. Algoritma ini akan mencari himpunan menu yang sering dibeli dengan melihat FP-Tree yang sudah dibuat terlebih dahulu sehingga proses pencarian himpunan produk dapat lebih cepat dilakukan daripada algoritma apriori. Berikut ini adalah langkah-langkah proses pengerjaan algoritma FP-Growth :


(52)

Dengan menggunakan tabel 3.3, masing-masing item dihitung frekuensi kemunculan berdasarkan itemnya. Hasil dari penghitungan kemunculan item dapat dilihat pada tabel 3.4 dibawah ini.

Tabel 3. 6 Hasi Perhitungan Kemunculan Produk

Nama Produk Support

Count

Wardah Facial Scrub 60 ml 16

PONDS CS ACNE C 40 13

PONDS CS ACNE C 40 13

CITRA HAZ SPOTLES WHITE GLOW UV 40 G 13 MAKARIZO SALON DAILY HAIR MASK 500gr NEW 12 La Tulip Milk Cleanser 120 ml New 10

PONDS FAIR LOVELY CREAM 25 G 10

KAPAS SARIAYU 35 9

PONDS CS ACNE CLEAR WHITE FF50 G 9

Pensil Alis Revlon 8

Pixy Eye Liner Black 8

PANTENE SHP ANTI DANRUFF 170 ML ATLAS 7

Wardah Lig Day Cream Step 1 30 gr 6

Wardah LIG NIGHT CREAM 20 step 2 6

WARDAH FACIAL SERUM NORMAL DRY SKIN 5

SUNSILK SHP SOFT 170 ML 5

WARDAH LIGHT BB CREAM LIGHT 15ML 5

REXONA ADVANCED WHITENING LOT 10G 4

ELIPS Hair Vit Repair 4

Wardah Excl. Liq Found. 02 Sheer Pink 20 ml 3

MINYAK KAYU PUTIH 120 3

HOT IN CREAM A.THERAPY 60 G 3

Eye LINER DAVIS WARNA 2

Just Miss Serut 1

Purbasari lips Daily Series 35 1

Awal mula ditentukan minimum support dan juga confidence dari keinginan pengguna untuk melihat batasan terendah munculnya menu. Penentuan minimum support sangat berpengaruh dengan hasil yang akan didapatkan. Apabila nilai minimum


(53)

support terlalu besar maka hasil yang didapatkan terlalu sedikit bahkan tidak ada, sedangkan apabila nilai minimum support nya terlalu kecil, hasil yang didapatkan terlalu banyak. Untuk kasus ini dimisalkan ditentukan minimum support : 4 dan confidence : 60%.. Hal ini dilakukan dengan memproses data yang ada pada tabel 3.6 yang dapat dilihat pada tabel 3.7.

Tabel 3. 7 Hasil Perhitungan Support Item

Kode

SUPPORT

COUNT Nilai Support

WFS60 16 59.25925926

WLCF60 14 51.85185185

PCSAC40 13 48.14814815

CHPWGUV40 13 48.14814815 MSDHM500 12 44.44444444

LTMC120 10 37.03703704

PFLC25 10 37.03703704

KS35 9 33.33333333

PCSACWFF50 9 33.33333333

PAR 8 29.62962963

PELB 8 29.62962963

PSHPAD170 7 25.92592593 WLDCS30S1 6 22.22222222

WLNC20S2 6 22.22222222

WFSNDS 5 18.51851852

SSHP170 5 18.51851852

WLBBCL15 5 18.51851852

RAWL10 4 14.81481481

EHVITR 4 14.81481481

WELFSP20 3 11.11111111

MKP120 3 11.11111111

HICAT60 3 11.11111111

ELDW 2 7.407407407

JMS 1 3.703703704


(54)

Langkah ke dua yaitu mengeleminasi menu yang tidak memenuhi minimum support 15%. Hasil Pengeleminasian menu dapat dilihat pada tabel 3.8.

Tabel 3. 8 Hasil Eleminasi Minimum Support

Kode SUPPORT COUNT

WFS60 16

WLCF60 14

PCSAC40 13

CHPWGUV40 13

MSDHM500 12

LTMC120 10

PFLC25 10

KS35 9

PCSACWFF50 9

PAR 8

PELB 8

PSHPAD170 7

WLDCS30S1 6

WLNC20S2 6

WFSNDS 5

SSHP170 5

WLBBCL15 5

RAWL10 4

EHVITR 4

Langkah ketiga yaitu mengurutkan kembali frequent berdasarkan banyaknya kemunculan menu yang disebut dengan Frequency of occurrence yang dapat dilihat pada tabel 3.9.

Tabel 3. 9 Priority

Kode

SUPPORT

COUNT Priority

WFS60 16 1

WLCF60 14 2

PCSAC40 13 3

CHPWGUV40 13 4

MSDHM500 12 5


(55)

PFLC25 10 7

KS35 9 8

PCSACWFF50 9 9

PAR 8 10

PELB 8 11

PSHPAD170 7 12

WLDCS30S1 6 13

WLNC20S2 6 14

WFSNDS 5 15

SSHP170 5 16

WLBBCL15 5 17

RAWL10 4 18

EHVITR 4 19

Langkah keempat adalah membuat fp-tree. Berikut proses pembentukan FP-Tree dibawah ini :

1) Transaksi 16010001 : WFS60, PCSAC40, CHPWGUV40, LTMC120, KS35, PAR, PSHPAD170, WLDCS30S1

2) Lakukan pembacaan pada data transaksi pertama yang akan diproses.

3) Lakukan pengecekan pada rootyang diinisialisasikan dengan Null, jika root belum mempunyai anak (child), maka data yang dibaca tadi menjadi anak pertama dari root. Dan support count dari masing masing node bertambah 1, kecuali root.


(56)

WFS60 :1

NULL

PCSA C40:1

CHPW GUV4 0:1

LTMC 120:1

KS35:1

PAR :1

PSHPA D170 : 1

WLDC S30S1 : 1

Gambar 3. 2 Tree Transaksi 16010001

1) Transaksi 16010002 : WFS60, PCSAC40, CHPWGUV40, MSDHM500, PFLC25, KS35, PELB, PSHPAD170

1) Lakukan pembacaan pada data transaksi kedua yang akan diproses.

2) Jika data yang keluar berikutnya sama dengan data yang pertama, maka itu bukan anak kedua dari root, tetapi tetap anak dari root yang sebelumnya keluar, yang berubah adalah support count-nya menjadi bertambah 1.


(57)

WFS60 :2 NULL

PCSA C40:2

CHPW GUV4 0:2

LTMC 120:1

KS35:1

PAR :1

PSHPA D170 : 1

WLDC S30S1 :

1

MSDH M500 : 1

PFLC2 5 : 1

KS35:1

PELB : 1

PSHPA D170 : 1

Gambar 3. 3 Tree Transaksi 16010002

2) Transaksi 16010003 : WFS60, WLCF60, CHPWGUV40, MSDHM500, KS35, PELB, WLDCS30S1, WLNC20S2, WFSNDS, WELFSP20

1) Lakukan pembacaan pada data transaksi ketiga yang akan diproses.

2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasanmaka node pada laintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.


(58)

WFS60 :3

NULL

PCSA C40:2

CHPW GUV4 0:2

LTMC 120:1

KS35:1

PAR :1

PSHPA D170 : 1

WLDC S30S1 :

1

MSDH M500 : 1

PFLC2 5 : 1

KS35:1

PELB : 1

PSHPA D170 : 1

WLCF 60 : 1

CHPW GUV4 0:1

MSDH M500 : 1

KS35:1

PELB : 1

WLDC S30S1 :

1

WLNC 20S2 : 1

WFSN DS : 1

WELF SP20 :

1


(59)

3) Setelah pembacaan sampai ke transaksi 16010030 : WLCF60, PCSAC40, CHPWGUV40, MSDHM500, PFLC25, PCSACWFF50, WLNC20S2, WLBBCL15 akan membentuk FP-tree di Gambar 3.5

WFS60 : 15 NULL PCSA C40:8 CHPW GUV4 0:4 LTMC 120:2 KS35:2 PAR :2 PSHPA D170 : 1 WLDC S30S1 : 1 MSDH M500 : 2 PFLC2

5 : 1 KS35:1 PELB : 1 PSHPA D170 : 1 WLCF 60 : 4 CHPW GUV4 0:2 MSDH M500 : 1 KS35:1 PELB : 1 WLDC S30S1 : 1 WLNC 20S2 : 1 WFSN DS : 1 WELF SP20 : 1

WLCF 60 : 10 PCSA C40:4 CHPW GUV4 0:2 PELB : 1 PSHPA D170 : 1 MSDH M500 : 3 LTMC 120:2 PAR :1 PELB : 1 WLDC S30S1 : 1 CHPW GUV4 0:1 MSDH M500 : 1 KS35:1 PELB : 1 PSHPA D170 : 1 CHPW GUV4 0:2 KS35:1 PAR :1 PELB : 1 WLDC S30S1 : 1 WFSN DS : 1 SSHP1 70 : 1 MKP1 20 : 1 LTMC 120:1 KS35:1 PELB : 1 PSHPA D170 : 1 LTMC 120:1 KS35:1 PSHPA D170 : 1 WLDC S30S1 : 1 WLNC 20S2 : 1 WFSN DS : 1 SSHP1 70 : 1 LTMC 120:1 PAR :1 WLDC S30S1 : 1 MSDH M500 : 1 KS35:1 PSHPA D170 : 1 WLNC 20S2 : 1 WFSN DS : 1 HICAT 60 : 1 PELB :

1 WFSN DS : 1

MSDH M500 : 2 PFLC2 5 : 2 PCSA CWFF 50 : 2

CHPW GUV4 0:1 LTMC 120:1 WLNC 20S2 : 1 RAWL 10 : 1 ELDW

:1 JMS : 1 PLDS3 5 : 1

CWFS 60 : 1 PCSA C40:1 CHPW GUV4 0:1 PCSA CWFF 50 : 1 PAR :1 WLBB CL15 : 1 SSHP1 70 : 1 MSDH M500 : 1 LTMC 120:1 PFLC2 5 : 1 MKP1 20 : 1 ELDW :1

PCSA CWFF 50 : 1 RAWL 10 : 1 HICAT 60 : 1 PFLC2

5 : 2 PAR

:1 EHVIT

R : 1

SSHP1 70 : 1

PFLC2 5 : 1

PCSA CWFF 50 : 1 PAR :1 WLBB CL15 : 1 EHVIT R : 1

PFLC2 5 : 1 RAWL 10 : 1 HICAT 60 : 1 MKP1 20 : 1 PCSA

CWFF 50 : 1 WLNC 20S2 : 1 WLBB CL15 : 1 SSHP1 70 : 1 EHVIT R : 1

LTMC 120:1 PFLC2 5 : 1 PCSA CWFF 50 : 1 WLBB CL15 : 1 WELF SP20 : 1 PCSA CWFF 50 : 1 RAWL 10 : 1 WELF SP20 : 1

EHVIT R : 1 MSDH M500 : 2 PFLC2

5 : 2 PCSA CWFF 50 : 2 WLNC 20S2 : 1 WLBB CL15 : 1


(60)

Setelah pembuatan fp-tree dilakukan langkah selanjutnya adalahTahap Pembangkitan Conditional Pattern Base, Tahap Pembangkitan Conditional FP-Tree dan pencarian Frequent Pattern. Adapun langkahnya yaitu :

a. Tahap Pembangkitan Conditional Pattern Base

Mencari support count terkecil dari setiap Item sampai dengan terbesar berdasarkan hasil pembentukan fp-tree sebelumnya . Berikut ini adalah support count terkecil sampai dengan terbesar dapat dilihat pada table 3.10

Tabel 3. 10 Conditonal Pattern Base

Item Conditonal Pattern Base

EHVITR WFS60, PCSAC40, MSDHM500,

PCSACWFF50, WLNC20S2, WLBBCL15, SSHP170 : 1

WFS60, WLCF60, PFLC25, PAR : 1

WFS60, PCSAWFF50. PAR, WLBBCL : 1

WLCF60, PCSAC40, MSDHM500, PFLC25, PCSAWFF50: 1

RAWL10 WFS60, WLCF60, PFLC25, PCSACWFF50 : 1

WLCF60, CHPWGUV40, PFLC25 : 1

WLCF60, PCSACWFF50 : 1

CHPWGUV40, LTMC120, WLNC20S2 : 1 WLBBCL15 WFS60, PCSAC40, CHPWGUV40,

PCSACWFF50, PAR : 1

WFS60, PCSAC40, MSDHM500, PCSACWFF50, WLNC20S2 : 1

WFS60, PCSAC40, LTMC120, PFLC25, PCSACWFF50 : 1

WFS60, PCSACWFF50, PAR : 1

WLCF60, PCSAC40, CHPWGUV40, MSDHM500, PFLC25, PCSACWFF50, WLNC20S2 : 1

WFSNDS WFS60, PCSAC40, CHPWGUV40, LTMC120, KS35, PAR, PELB : 1


(61)

WFS60, WLCF60, CHPWGUV40,

MSDHM500, KS35, PELB, WLDCS30S1, WLNC20S2 : 1

WLCF60, CHPWGUV40, KS35, PAR, PELB, WLDCS30S1 : 1

WLCF60, LTMC120, KS35, PSHPAD170, WLDCS30S1, WLNC20S2 : 1

WLCF60, MSDH500, KS35, PSHPAD170, WLNC20S2 : 1

WLNC20S2 WFS60, PCSA40, MSDHM500, PCSACWFF50:1

WFS60, WLCF60, CHPWGUV40,

MSDHM500, KS35, PELB, WLDCS30S1:1

WLCF60, PCSA40, CHPWGUV40, MSDHM500, PFLC2, PCSACWFF50:1

WLCF60, LTMC120, KS35, PSHPAD170, WLDCS30S1: 1

WLCF60, MSDH500, KS35, PSHPAD170 : 1

CHPWGUV40, LTMC120 : 1

WLDCS30S1 WFS60, PCSAC40, CHPWGUV40, LTMC120, KS35, PAR, PSHPAD170 : 1

WFS60, PCSAC40, MSDHM500, LTMC120, PAR,PELB : 1

WFS60, WLCF60,

CHPWGUV40,MSDHM500,KS35, PELB : 1 WFS60, WLCF60, CHPWGUV40,LTMC120,

PAR : 1

WLCF60, CHPWGUV40, KS35, PAR, PELB : 1 WLCF60, LTMC120, KS35, PSHPAD170 : 1 PSHPAD170 WFS60, PCSAC40,CHPWGUV40,LTMC120,

KS35, PAR : 1

WFS60, PCSAC40,CHPWGUV40,MSDHM500, PFLC2, KS35, PELB : 1


(62)

WFS60, PCSAC40,CHPWGUV40,MSDHM500, LTMC120, KS35, PELB : 1

WFS60, CHPWGUV40, MSDHM500, KS35, PELB : 1

WLCF60, PCSAC40,CHPWGUV40, PELB : 1 WLCF60, LTMC120, KS35 : 1

WLCF60, MSDHM500, KS35 : 1

PELB WFS60, PCSAC40,CHPWGUV40,LTMC120,

KS35, PAR : 1

WFS60, PCSAC40,CHPWGUV40,MSDHM500, PFLC2, KS35 ; 1

WFS60, PCSAC40,CHPWGUV40,MSDHM500, LTMC120, KS35 ; 1

WFS60, PCSAC40,MSDHM500, LTMC120, PAR ; 1

WFS60, CHPWGUV40, MSDHM500, KS35, : 1 WFS60, WLCF60, CHPWGUV40,

MSDHM500, KS35 : 1

WLCF60, PCSAC40,CHPWGUV40 : 1 WLCF60, CHPWGUV40, KS35, PAR : 1 PCSACWFF50 WFS60, PCSAC40, MSDHM500 : 1

WFS60, PCSAC40,LTMC120, PFLC25 : 1 WFS60, PCSAC40, CHPWGUV40 : 1 WFS60, WLCF60, PFLC25 : 1

WFS60 : 1

WLCF60, PCSAC40, CHPWGUV40, MSDHM500, PLFC25 : 1

WLCF60, PCSAC40, MSDHM500, PLFC25 : 2 WLCF60 : 1

KS35 WFS60, PCSAC40, CHPWGUV40, LTMC120 : 2

WFS60, PCSAC40, CHPWGUV40, MSDHM500, PFLC25 : 1

WFS60, PCSAC40, CHPWGUV40, MSDHM500, LTMC120 : 1


(63)

WFS60, CHPWGUV40, MSDHM500 : 1

WFS60, WLCF60, CHPWGUV40, MSDHM500 : 1

WLCF60, CHPWGUV40 : 1 WLCF60, LTMC120 : 1 WLCF60, MSDHM500 : 1

PFLC25 WFS60, PCSAC40, CHPWGUV40, MSDHM500 : 1

WFS60, PCSAC40, MSDHM500, LTMC120 : 1 WFS60, PCSAC40, LTMC120 : 1

WFS60, WLCF60 : 2

WFS60, MSDHM500, LTMC120 : 1 WLCF60, PCSAC40, CHPWGUV40,

MSDHM500 : 1

WLCF60, PCSAC40, MSDHM500 : 2 WLCF60, CHPWGUV40 : 1

LTMC120 WFS60, PCSAC40, CHPWGUV40 : 2 WFS60, PCSAC40, CHPWGUV40,

MSDHM500 : 1

WFS60, PCSAC40, MSDHM500 : 2 WFS60, PCSAC40 : 1

WFS60, WLCF60, CHPWGUV40 : 1 WFS60, MSDHM500 : 1

WLCF60: 1 CHPWGUV40 : 1

MSDHM500 WFS60, PCSAC40, CHPWGUV40 : 2 WFS60, PCSAC40 : 3

WFS60, CHPWGUV40 : 1

WFS60, WLCF60, CHPWGUV40 : 1 WFS60 : 1

WLCF60, PCSAC40, CHPWGUV40 : 1 WLCF60, PCSAC40 : 2

WLCF60 : 1

CHPWGUV40 WFS60, PCSAC40 : 5 WFS60 : 1


(1)

4.2.5 Pengujian Hasil

Pengujian hasil ini menguji perangkat lunak yang telah dibangun apakah menghasilkan data yang diinginkan dengan masukan min support = 4 dan min confidence yang berbeda-beda. Berikut Pengujiannya :

1. Pengujian manual dan pengujan program a. Pengujian Manual

Pencarian rules dengan perhitungan manual pada uji kasus minimum support = 4, minimum confidence = 60 %

Tabel 4. 10 Pengujian Manual

Rule Minimum

Confidence%

WLBBCL15 - > WFS60 4/5*100 = 80%

WLBBCL15 -> PCSAC40 4/5*100 = 80 %

WLBBCL15 -> PCSACWFF50 4/5*100 = 80%

WFSNDS - >KS35 4/5*100 = 80 %

WFSNDS -> WLCF60 4/5*100 = 80 %

WLBBCL15 -> WFS60,PCSAC40 4/5*100% = 80 %

WFSNDS -> KS35, WLCF60 4/*5*100 = 80 %

PSHPAD170 -> KS35 6/7*100% = 86%

KS35 -> PSHPAD170 6/9*100% = 67%

PELB -> WFS60, CHPWGUV40, KS35 6/8*100 = 75 %

KS35->PELB, WFS60, CHPWGUV40 6/9*100 = 67 %

PAR -> WFS60 7/8*100% = 88%

PCSAC40 -> WFS60 9/14 * 100% = 64%

WFS60 -> PCSAC40 9/13 * 100% = 69%

CHPWGUV40 -> WFS60 8 / 13 * 100% = 61%

WFS60 -> CHPWGUV40 8/16 * 100 = 50%

MSDHM500, PCSAC40 8/12 * 100% = 67%

PCSA40 -> MSDHM500 8/13 * 100% = 61%

MSDHM500, WFS60 8/12 * 100% = 67%

LTMC120 -> WFS60 8/10 *100% = 80%

LTMC120 -> PCSAC40 6/10*100% = 60%


(2)

136

KS35 -> CHPWGUV40, WFS60 6/9*100 = 67 %

PFLC25 -> MSDHM500, PCSAC40, WLCF60, WFS60 6/10*100 = 60 %

LTMC120 -> PCSAC40, WFS60 8/10*100 = 80 %

PCSAC40 -> LTMC120, WFS60 8/13*100 = 62 %

WFS60 -> LTMC120, PCSAC40 8/16*100 = 50 %

MSDHM500 -> PCSAC40, WFS60 8/12*100 = 67 %

PCSAC40 -> MSDHM500, WFS60 8/13*100 = 62 %

PFLC25 -> MSDHM500 6/10*100% = 60%

PFLC25 -> PCSAC40 6/10*100% = 60%

PFLC25 -> WLCF60 6/10*100% = 60%

PFLC25 -> WFS60 6/10*100% = 60%

KS35 -> CHPWGUV40 6/9*100% = 67%

KS35 -> WFS60 6/9*100% = 67%

PCSACWFF50-> PCSAC40 6/9*100% = 67%

CHPWGUV40 -> PCSAC40, WLCF60, WFS60 813*100 = 62 %

PCSAC40 -> CHPWGUV40, WLCF60, WFS60 8/13*100 = 62 %

PCSAC40 -> WFS60 9/14 * 100% = 64%

WFS60 -> PCSAC40 9/13 * 100% = 69%

PAR -> WFS60 7/8*100% = 88%

PELB -> KS35 6/8*100% = 75%

KS35 -> PELB 6/9*100% = 67%

PELB -> WFS60 6/8*100% = 75%

PELB -> CHPWGUV40 6/8*100% = 75%

PSHPAD170 -> KS35 6/6*100% = 100%

KS35 -> PSHPAD170 6/9*100% = 67%

b. Pengujian Program

1. Pencarian rules dengan program pada uji kasus minimum support = 4 minimum confidence = 60 %


(3)

Gambar 4. 1 Hasil Pengujian 1

2. Pencarian rules dengan program Weka pada uji kasus minimum support = 4 minimum confidence = 60 %

Gambar 4. 2 Hasil Pengujian Weka

Dengan perbandingan di pengujian 1 dari aplikasi dan manual dapat dilihat dalam hasil aplikasi rule yang dihasilkan sama dengan yang perhitungan manual hanya saja urutan


(4)

138

dalam aplikasi berbeda dengan hasil manual dan hasil rule dari aplikasi lebih banyak daripada yang dihasilkan oleh manual, akan teteapi untuk rule yang dihasilkan sama saja, sedangkan untuk nilai confident dari perhitungan manual dan aplikasi terlihat sama dari beberapa rule yang dihasilkan

3. Pencarian rules dengan program pada uji kasus minimum support = 4 minimum confidence = 70 %.

Gambar 4. 3 Hasil Pengujian 2

4. Pencarian rules dengan program dengan uji kasus minimum support = 4 minimum confidence = 80 %


(5)

Gambar 4. 4 Hasil Pengujian 3 4.2.7 Kesimpulan Pengujian Hasil

Berdasarkan hasil pengujian, dapat disimpulkan bahwa aplikasi data mining yang telah dibangun telah sesuai dengan perhitungan manual. Aplikasi yang telah dibangun menunjukkan hasil rule yang sama dengan menggunakan perhitungan manual. Maka dari itu aplikasi data minig dapat digunakan oleh pihak Makmur Jaya Kosmetik untuk mengetahui barang apa saja yang dapat di jadikan satu paket.


(6)

139 BAB 5

KESIMPULAN DAN SARAN

Pada bab ini akan dibahas tentang kesimpulan yang berisi hasil-hasil yang diperoleh setelah dilakukan analisis, desain, dan implementasi dari perancangan perangkat lunak yang dibangun dan telah dikembangkan serta saran-saran yang akan memberikan catatan penting dan kemungkinan perbaikan yang perlu dilakukan untuk pengembangan perangkat lunak selanjutnya.

5.1 Kesimpulan

Berdasarkan hasil analisis dan pengujian yang telah dilakukan maka dapat diambil kesimpulan sebagai berikut :

1. Aplikasi yang dibangun dapat memberikan informasi baru mengenai pola pembelian produk yang dilakukan oleh konsumen.

2. Aplikasi yang dibangun dapat membantu memberikan informasi mengenai paket produkyang sering dibeli secara bersamaan oleh konsumen sehingga dapat dijadikan bahan pertimbangan untuk pembentukan paket produk kepada konsumen.

5.2 Saran

Adapun saran yang diberikan untuk penelitian tugas akhir dalam pengembangan sistem ini adalah sebagai berikut :

1. Perlu adanya pengembangan dari aplikasi Data Mining yang dibangun agar hasil mining yang didapatkan lebih baik.

2. Perlu adanya pembuatan aplikasi Data Mining dengan algoritma yang berbeda sehingga dapat dijadikan bahan pembanding ke akuratan mining data sehingga dengan adanya pembanding bisa dipilih algoritma mana yang lebih baik dalam penyelesaian Data Mining.