Penerapan Data Mining Dalam Perekomendasian Produksi TasDengan Metode Assosiation Mining Rules Di Kartin Collection
SKRIPSI
Diajukan untuk Menempuh Ujian Akhir Sarjana
NUR AZIZAH
10111609
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS KOMPUTER INDONESIA
2016
(2)
iii
kepada Allah SWT atas berkat, rahmat, taufik dan hidayah-Nya, penyusunan skripsi yang berjudul “PENERAPAN DATA MINING DALAM
PEREKOMENDASIAN PRODUKSI TAS DENGAN METODE
ASSOSIATION MINING RULES DI KARTIN COLLECTION” dapat diselesaikan dengan baik.
Adapun tujuan dari penyusunan skripsi ini adalah untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi Teknik Informatika Universitas Komputer Indonesia.
Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari berbagai pihak dan berkah dari Allah SWT sehingga kendala-kendala yang dihadapi dapat diatasi. Untuk itu penulis menyampaikan rasa hormat dan terima kasih sebesar-besarnya kepada :
1. Allah SWT yang telah mencurahkan rahmat dan hidayah-Nya hingga detik ini.
2. Bapak Alif Finandhita, S.Kom., M.T selaku dosen pembimbing yang telah meluangkan waktu, tenaga, pikiran, memberikan motivasi, arahan dan saran serta ilmu pengetahuannya kepada penulis dalam penyusunan skripsi ini. 3. Bapak Adam Muchair Bachtiar, S.Kom., M.T selaku dosen penguji 1 yang
telah memberikan saran serta kritiknya dalam penyusunan skripsi ini.
4. Ibu Dian Dharmayanti, S.T., M.Kom. selaku dosen penguji 2 yang telah memberikan saran serta kritiknya dalam penyusunan skripsi ini.
5. Ibu Riani Lubis, M.T. selaku ketua panitia skripsi yang telah memberikan bantuan dalam kelancaran penyusunan skripsi ini.
(3)
iv penghargaan yang setinggi-tingginya kepada :
1. Ibunda Kurniatin dan Ayahanda Agus Jaya serta kakak dan adik tercinta Eko Kurnia Dijaya, Titin Damayanti dan Dimas Kevin yang telah tulus selalu mendoakan, memberikan dorongan moril dan materil, masukan, perhatian, dukungan sepenuhnya, dan kasih sayang yang tidak ternilai dan tanpa batas yang telah kalian berikan.
2. Kepada teman-teman angkatan 2011 atas dukungan dan kebersamaannya, terutama untuk Yusep Rahadian dan Febi Nurafiah yang tanpa henti memberikan support dan telah bersedia meluangkan waktunya untuk berbagi pendapat dengan penulis dalam menyelesaikan skripsi ini.
3. Kepada teman-teman satu bimbingan Bapak Alif Finandhita, S.Kom., M.T atas dukungan dan kebersamaannya untuk penulis dalam menyelesaikan skripsi ini.
4. Semua pihak yang tidak dapat penulis sebut satu persatu yang telah membantu dalam penyelesaian penulisan skripsi ini.
Keterbatasan kemampuan, pengetahuan dan pengalaman penulis dalam pembuatan skripsi ini masih jauh dari kesempurnaan. Untuk itu penulis akan selalu menerima segala masukan yang ditujukan untuk menyempurnakan skripsi ini. Akhir kata penulis mengharapkan semoga skripsi ini dapat bermanfaat serta manambah wawasan pengetahuan baik bagi penulis sendiri maupun bagi pembaca pada umunya,
Bandung, 31 Januari 2016
(4)
v
ABSTRACT ... .... . ii
KATA PENGANTAR ... .... iii
DAFTAR ISI ... .... .. v
DAFTAR GAMBAR ... .... viii
DAFTAR TABEL ... ....xiii
DAFTAR SIMBOL ... ...xv
DAFTAR LAMPIRAN ... ..xviii
BAB PENDAHULUAN ... ...1
1.1 Latar Belakang Masalah ... ...1
1.2 Perumusan Masalah ... ...2
1.3 Maksud dan Tujuan ... ...2
1.3.1 Maksud ... ...2
1.3.2 Tujuan ... ...2
1.4 Batasan Masalah ... ...2
1.5 Metodologi Penelitian ... .... ..3
1.5.1 Metodologi Penelitian ... ...3
1.5.2 Metode Pembangunan Data Mining... ...3
1.6 Sistematika Penulisan ... ...6
BAB 2 TINJAUAN PUSTAKA ... ...7
2.1 Pofil Instansi ... ...7
2.1.1 Sejarah Kartin Collection ... ...7
(5)
vi
2.2.1 Data ... ...9
2.2.2 Basis Data ... ...10
2.2.3 Database Mangement System ... ...11
2.2.4 Data Mining ... ...11
2.2.5 Association Rule ... ...16
2.2.6. Algoritma FP-Growth ... ...17
2.2.7 Unified Modeling Language (UML) ... ....22
2.2.8 MySQL ... ....25
BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... ....26
3.1 Analisis Sistem ... ....26
3.1.1 Analisis Masalah ... ....26
3.1.2 Analisis Penerapan Metode CRISP-DM ... ....27
3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... ....93
3.2 Perancangan Sistem ... ...122
3.2.1 Perancangan Class ... ...122
3.2.2 Perancangan Basis Data ... ...125
3.2.2 Perancangan Struktur Menu ... ...128
3.2.3 Perancangan Antar Muka ... ...129
3.2.4 Perancangan Pesan ... ...131
3.2.5 Jariangan Semantik ... ...132
BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... ...133
(6)
vii
4.1.4 Implementasi Antarmuka ... ...136
4.2 Pengujian Sistem ... ...137
4.2.1 Pengujian Alpha ... ...137
4.2.1.2 Kesimpulan Pengujian Alpha ... ...139
4.2.2 Pengujian Beta ... ...139
4.2.2.1 Kesimpulan Pengujian Beta ... ...140
4.2.3 Pengujian Hasil ... ...140
4.2.3.1 Kesimpulan Pengujian Hasil ... ...144
BAB 5 KESIMPULAN DAN SARAN ... ...145
5.1 Kesimpulan ... ...145
5.2 Saran ... ...145
(7)
146
DAFTAR PUSTAKA
[1] Larose D, T., 2005, Discovering knowledge in data : an introduction to data mining, Jhon Wiley & Sons Inc.
[2] (sumber : An Introduction to Database System, Canada: ( Adision – Wessley Publishing Company, 181, Third Edition ), hal 237.)..
[3] R. W. Pate Chapman, 2000. [Online]. Available: http://the- modeling-agency.com/crisp-dm.pdf. [Diakses 25 September 2015].
[4] F. Buku Teks Komputer: Basis Data, 5th ed., Bandung: Informatika, 2004.
[5] H.A.Fajar, Data Mining. Andi, 2013.
[6] J. Simarmata and I. Prayuda, Basis Data, Yogyakarta: Andi Offset, 2006. [7] F. Buku Teks Komputer: Basis Data, 5th ed., Bandung: Informatika,
2004.
[8] Ramon A. Mata Toledeo, Pailine K. Cushman, Dasar-dasar Database Relasional. Jakarta: Airlangga, 2007.
[9] B. Santoso, Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Yogyakarta: Graha Ilmu, 2007.
[10] J. Han and M. Kamber, Data Mining : Concept and Techniques, 2nd ed. San Fransisco: Morgan Kauffman, 2006.
[11] D. T. Larose, DATA MINING METHODS AND MODELS, New Jersey: John Wiley & Sons, Inc, 2006.
[12] K. and E. T. Luthfi, Algoritma Data Mining, Andi, 2009.
[13] Widiati, Elsa. 2014. Implementasi Data Mining Menggunakan Aturan association Rules Terhadap Penyusunan Layout Makanan dan Penentuan
Paket Makanan Hemat Di RM. Roso Echo Dengan Algoritma Apriori,
(8)
1
Kartin collection merupakan salah satu home industri dalam bidang konveksi tas yang berlokasi di jalan Karang Tineung Dalam No.1 Bandung. Kartin collection telah banyak memproduksi berbagai macam produk tas dengan model yang beragam. Produk-produk tas yang diproduksi oleh kartin collection dipasarkan kebanyak toko-toko yang tersebar di Bandung. Selain itu Kartin Collection juga menerima konsumen yang secara langsung membeli eceran ke tempat produksi. Dari waktu ke waktu data penjualan yang ada semakin banyak dan hanya dijadikan arsip tanpa adanya pengolahan untuk medapatkan informasi didalamnya.
Kartin Collection mengalami penurunan dalam penjualan karena pemilihan model – model tas yang telah diproduksi tidak terjual seperti biasanya. Karena tidak adanya pertimbangan saat penentuan model tas yang harus diproduksi mengakibatkan melesetnya informasi model tas yang harus diproduksi, sehingga terjadi penumpukan barang digudang. Hal ini tentu akan mempengaruhi penjualan untuk beberapa waktu yang akan datang.
Salah satu teknik untuk memecahkan permasalahan ini adalah dengan metode data mining. Data mining adalah sebuah proses percarian informasi secara otomatis dalam tempat penyimpanan data berukuran besar[1]. Teknik data mining
digunakan untuk memeriksa basis data dari transaksi penjualan untuk menemukan pola yang baru dan berguna untuk pendukung keputusan dalam meningkatkan pelayanan dan penjualan tas di Kartin Collection. Salah satu metode yang digunakan dalam teknologi data mining adalah metode association rules.
Association rules merupakan teknik pencarian aturan-aturan asosiasi yang
menunjukkan kondisi-kondisi nilai atribut yang sering terjadi bersama-sama[1] pola asosiasi yang akan menjadi pertimbangan bagi pihak Kartin Collection dalam menentukan model tas yang akan diproduksi.
(9)
Berdasarkan masalah yang dihadapi di Kartin Collection, maka perlu dilakukan suatu “ Penerapan Data Mining Dalam Perekomendasian Produksi Tas Dengan Metode Assosiation Mining Rules Di Kartin Collection” Agar dapat mengetahui pola pembelian dari pelanggan dan memberikan informasi kepada pihak Kartin Collection dalam menentukan model tas yang akan produksi.
1.2 Perumusan Masalah
Dari latar belakang diatas dapat disimpulkan perumusan masalah yaitu bagaimana cara menerapkan data mining dengan metode association rules untuk merekomendasikan model tas yang harus diproduksi oleh Kartin Collection.
1.3 Maksud dan Tujuan 1.3.1 Maksud
Maksud dari penelitian ini adalah untuk menerapkan data mining dalam perekomedasian produksi tas dengan metode association mining rules di Kartin Collection.
1.3.2 Tujuan
Adapun tujuan yang ingin dicapai adalah sebagai berikut :
1. Membantu pihak Kartin Collection dalam memanfaatkan data penjualan untuk mendapatkan informasi didalam data penjualan tersebut.
2. Membantu pihak Kartin Collection untuk mendapatkan informasi mengenai model tas apa saja yang harus diproduksi.
1.4 Batasan Masalah
Berdasarkan perumusan masalah diatas maka batasan masalah dapat disimpukan sebagai berikut :
1. Metode yang digunakan adalah metode association rules.[1] 2. Algoritma yang digunakan adalah algoritma Fp-Growth [1].
3. Data yang digunakan adalah data penjualan di home industri Kartin Collection dari bulan Maret-Juli 2015.
(10)
4. Aplikasi yang akan dibuat berbasis dekstop.
5. Metode analisis yang digunakan dalam pembangunan perangkat lunak ini menggunakan pendekatan analisis pemograman berorientasi objek.
1.5 Metodologi Penelitian
Metodologi penelitian yang digunakan adalah metodologi penelitian kuantitatif dengan metode penelitian eksperimental, yaitu metode penelitian yang bertujuan untuk membandingkan antara hasil penelitian yang dilakukan secara manual dengan hasil penelitian yang dilakukan melalui suatu sistem atau alat[3]. Metode penelitian ini dibagi menjadi 2 tahap, yaitu tahap pengumpulan data dan tahap pembangunan data mining.
1.5.1 Metodologi Penelitian
Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut :
1. Studi Literatur
Studi literatur adalah metode pengumpulan data yang dilakukan dengan cara mengumpulkan literatur, jurnal, paper, dan website yang ada kaitannya dengan judul penelitian.
2. Wawancara
Wawancara yang dilakukan langsung kepada pihak perusahaan untuk mendapatkan informasi tentang data transaksi penjualan dan meminta data transaksi tersebut.
3. Observasi
Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan langsung terhadap permasalahan yang diambil..
1.5.2 Metode Pembangunan Data Mining
Dalam penelitian ini mengikuti standar dari Cross-Industry Standard for
Data Mining (CRISP-DM) merupakan suatu standar yang telah dikembangkan
pada tahun 1996 yang ditunjukkan untuk melakukan proses analisis dari suatu industri sebagai strategi pemecahan masalah dari bisnis satu unit penelitian [3].
(11)
Untuk data yang dapat di proses dengan CRSP-DM ini, tidak ada ketentuan atau karakteristik tertentu, karena data tersebut akan diproses kembali pada fase-fase di dalamnya.
Gambar 1. 1 Cross Industri Standard for Data Mining(CRISP-DM)[3]
Berikut ini adalah tahapan-tahapan yang akan dilakukan dalam penelitian ini sesuai dengan CRISP-DM :
1. Business understanding
Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut pandang bisnis, kemudian menterjemahkan pengetahuan ini kedalam pendefinisan masalah data mining, untuk menentukan bisnis perusahaan yang sedang berjalan di kartin collection.
2. Data understanding
Pada tahap pemahaman data ini terlebih dahulu akan mengumpulkan semua data yang diperlukan dari hasil data-data pejualan di Kartin Collection dari bulan Maret-July 2015. Dilanjutkan dengan proses pemahaman tentang
(12)
data yang akan digunakan sebagai hipotesa untuk menemukan informasi yang tersembunyi.
3. Data preparation
Tahap ini meliputi semua kegiatan untuk membangun dataset akhir (data
yang akan diproses pada tahap pemodelan/modeling) dari data mentah. Pada tahap ini juga mencakup pemilihan tabel, record, dan atribut-atribut data, termasuk proses pembersihan untuk kemudian dijadikan masukan dalam tahap pemodelan (modeling).
4. Modeling
Dalam tahapan pemodelan ini akan menggunakan teknik metode data
mining dengan metode association rule dengan cara menemukan aturan
asosiatif atau pola kombinasi model tas berdasarkan hasil data transaksi, sehingga dapat diketahui model tas apa saja yang sering dibeli secara bersamaan oleh konsumen.
5. Evaluation
Pada tahap evaluasi ini akan dibandingkan hasil improved fp-growth
dilakukan oleh sistem dengan perhitungan manual, dengan mengambil beberapa sampel acak. Evaluasi ini ditujukan untuk mengukur apakah pemodelan yang dilakukan sesuai dengan tujuan pengimplementasian data
mining pada sistem ini.
6. Deployment
Setiap tahap evaluasi dimana menilai secara detail hasil dari pemodelan, maka akan dilakukan pengimplementasian dari keseluruhan model yang telah dirancang. Selain itu juga dilakukan penyesuaian dari model dengan sistem yang akan dibangun sehingga dapat menghasilkan suatu hasil yang sesuai dengan target pemahaman bisnis.
(13)
1.6 Sistematika Penulisan
Sistematika penulisan yang digunakan dalam penyusunan laporan tugas akhir ini adalah sebagai berikut :
BAB I. PENDAHULUAN
Bab ini membahas mengenai Latar Belakang Masalah, Rumusan Masalah, Maksud dan Tujuan, Batasan Masalah, Metodologi Penelitian, dan Sistematika Penulisan yang digunakan.
BAB II. TINJAUAN PUSTAKA
Bab ini membahas tentang sejarah, logo, visi, misi, struktur organisasi dari Kartin Collection dan berbagai konsep dasar dan teori-teori yang berhubungan dengan judul penelitian, seperti pengertian data, datamining, associaiton rule algoritma improved fp-growth,UML.
BAB III. ANALISIS DAN PERANCANGAN SISTEM
Bab ini berisi tentang analisis dan perancangan sistem yang akan dibangun berdasarkan data penjualan yang diperoleh dari Kartin Collection dengan menggunakan data mining dengan metode associaiton rule menggunakan algoritma improved fp-growth.
BAB IV. IMPLEMENTASI DAN PENGUJIAN
Bab ini menjelaskan tentang implementasi dan pengujian terhadap tingkat kekuatan dan keakuratan aturan-aturan asosiasi yang telah didapatkan berdasarkan pola pembelian yang telah diterapkan sesuai dengan algoritma improved
fp-growth.
BAB V. KESIMPULAN DAN SARAN
Bab ini berisi tentang kesimpulan dari hasil penelitian yang telah dilakukan dan saran-saran pengembangan lebih lanjut dari sistem yang dibangun.
(14)
7 2.1.1 Sejarah Kartin Collection
Konveksi tas Kartin Collection didirikan oleh seorang wirausahawan yang bernama bapak Agus Supianto. Konveksi tersebut berdiri tahun 1990 di Jln. Karang Tineung No.1 Bandung . Tujuan pendirian usaha pembuatan tas dari bahan dolbi maupun bahan lain ini dilihat dari potensi masyarakat akan bersifat konsumtif, bapak Agus akhirnya mendirikan suatu konveksi pembuatan tas. Tidak hanya dilihat dari masyarakatnya saja pendirian usaha tersebut difungsikan untuk memenuhi kebutuhan keluarga bapak Agus. Akhirnya sampai saat ini konveksi tersebut dapat berkembang pesat dengan kiat-kiat seorang wirausaha yang dimiliki oleh bapak Agus yaitu percaya diri, optimis, dan tekad yang besar untuk menggapai suatu impian dalam berwirausaha. Ditambah etos kerja dan ulet dalam mengerjakan usaha yang digelutinya.
2.1.2 Logo
Berikut ini adalah logo dari konveksi tas Kartin Collection yang dapat dilihat pada gambar 2.1 dibawah ini :
(15)
2.1.3 Struktur Organisasi
Berikut ini adalah struktur organisasi konveksi tas kartin Collection yang dapat dilihat pada gambar 2.2 dibawah ini :
Gambar 2. 2 Struktur Organisasi kartin Collection
Job description :
1. Pemilik bertanggung jawab penuh terhadap Kartin Collection, tugas dan tanggung jawabnya sebagai berikut:
a. Membuat perencanaan, strategi dan kebijakan yang menyangkut operasi Kartin Collection.
b. Menyusun anggaran kebutuhan persediaan bahan baku. c. Melakukan kontrol secara keseluruhan di Kartin Collection.
d. Memegang kendali atas keputusan penting yang bersifat umum berkaitan dengan keuangan.
2. Bagian Gudang memiliki tugas dan tanggung jawab sebagai berikut : a. Mengecek ketersedian bahan baku.
b. Membeli persedian bahan baku.
c. Memberikan bahan baku kepada pekerja.
3. Pekerja memeliki tugas dan tanggung jawab sebagai berikut: a. Membuat tas sesuai perintah.
b. Menyelesaikan pembuatan tas tepat waktu. Pemilik
Bagian Gudang
Pekerja Adm
Keuangan
Bagian pemasaran
(16)
4. Bagian Adm keuangan bertugas terhadap transaksi pelanggan, tugas dan tanggung jawab sebagai berikut :
a. Bertanggung jawab terhadap hal-hal yang menyangkut keuangan. b. Menghitung pemasukan dan pengeluaran setiap bulannya.
5. Bagian pemasaran memeliki tugas dan tanggung jawab untuk memasarkan dan memdistribusikan produk tas kepada pelanggan.
2.1.4 Visi dan Misi
Visi dari Kartin Collection ini adalah menjadikan perusahaan konveksi yang terbaik, dengan pengerjaan pesanan yang tepat waktu dan mampu melayani permintaan pesanan sesuai dengan apa yang diinginkan oleh setiap konsumen. baik dari segi pelayanan, kualitas, maupun kuantitas yang memuaskan, sedangkan misinya adalah Mengutamakan pelayanan pada kepuasan yang optimal bagi para pelanggan. Berperan aktif untuk meningkatkan kualitas dan produktivitas yang dapat memberikan kepuasan para pelanggan, karyawan dan mitra bisnis. mengembangkan sumber daya untuk dapat menghasilkan produk yang berkualitas dan memiliki mutu yang konsisten.
2.2 Landasan teori
Landasan teori yang berkaitan dengan materi atau teori yang digunakan sebagai acuan melakukan penenlitian. Landasan teori yang diuraikan merupakan hasil studi literatur, buku-buku, maupun situs internet.
2.2.1 Data
Data adalah representasi fakta dunia nyata yang mewakili suatu objek seperti manusia (pegawai, siswa, pembeli, pelanggan), barang, hewan, peristiwa, konsep, keadaan, dan sebagainya, yang direkam dalam bentuk angka, huruf, simbol, teks, gambar, bunyi, atau kombinasinya [5]. Data dapat digunakan sebagai input dan menghasilkan sebuah informasi. Data juga merupakan sesuatu yang belum memiliki arti dan masih membutuhkan suatu pengolahan. Dalam data
terdapat himpunan data yang merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek yang biasanya dikenal
(17)
sebagai variabel, field, karakteristik atau fitur. Salah satu himpunan data adalah
recorddata, yaitu data yang terdiri dari sekumpulan record, yang masing-masing
terdiri dari satu set atribut yang tetap. Salah satu yang termasuk dalam tipe data
record yaitu data transaksi. Data transaksi merupakan sebuah tipe khusus dari
record data, dimana tiap record (transaksi) meliputi satu setitem [6].
2.2.2 Basis Data
Basis data adalah mekanisme yang digunakan untuk menyimpan informasi atau data. Informasi adalah sesuatu yang kita gunakan sehari-hari untuk berbagai alasan. Dengan basis data, pengguna dapat menyimpan data secara terorganisasi. Setelah data disimpan, informasi harus mudah diambil. Kriteria dapat digunakan untuk mengambil informasi. Cara data disimpan dalam basis data menentukan seberapa mudah mencari informasi berdasarkan banyak kriteria. Data pun harus mudah ditambahkan ke dalam basis data, dimodifikasi, dan dihapus [7].
Menurut Fathansyah [8], basis data sendiri dapat didefinisikan dalam sejumlah sudut pandang seperti :
1. Himpunan kelompok data (arsip) yang saling berhubungan yang diorganisasi sedemikian rupa agar kelak dapat dimanfaatkan kembali dengan cepat dan mudah.
2. Kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.
3. Kumpulan file/ tabel/ arsip yang saling berhubungan yang disimpan dalam media penyimpanan elektronis.
2.2.2.1 Data pada Basis Data dan Hubungannya Ada 3 jenis data pada sistem database, yaitu [9] :
1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data
2. Data masukan (input data), data dari luar sistem yang dimasukan melalui peralatan input (keyboard), yang dapat merubah data operasional.
(18)
3. Data kelauran (output data), berupa laporan melalui peralatan output sebagai hasil dari dalam sistem yang mengakses data operasional.
2.2.2.2 Keuntungan dan Kerugian Pemakaian Sistem Database
Keuntungan [9] :
1. Terpeliharanya keselarasan data
2. Data dapat dipakai secara bersama-sama.
3. Memudahkan penerapan standarisaasi dan batas-batas pengamanan. 4. Terpeliharanya keseimbangan atas perbedaan kebutuhan data dari setiap aplikasi.
5. Program /data independent. Kerugian :
1. Mahal dalam implementasinya. 2. Rumit
3. Penanganan proses recoverybackup sulit.
4. Kerusakan pada sistem basis data dapat mempengaruhi. 2.2.3 Database Mangement System
Kumpulan atau gabungan database dengan perangkat lunak aplikasi yang berbasis database tersebut dinamakan Database Management System (DBMS). DBMS
merupakan koleksi terpadu dari database dan program–program komputer (utilitas) yang digunakan untuk mengakses dan memelihara database. Program-program tersebut menyediakan berbagai fasilitas operasi untuk memasukan, melacak, dan memodifikasi data kedalam database, mendefinisikan data baru, serta mengolah data menjadi informasi yang dibutuhkan (DBMS = Database + Program Utilitas) [8].
2.2.4 Data Mining
Data mining, sering juga disebut knowledge discovery in database (KDD),
adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data
mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan.
(19)
Secara umum, definisi data mining dapat diartikan sebagai berikut [11]: 1. Proses penemuan pola yang menarik dari data yang tersimpan dalam
jumlah besar.
2. Ekstrasi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui potensi kegunaannya) pola atau pengetahuan dari data yang di simpan dalam jumlah besar.
3. Eksplorasi dari analisa secara otomatis atau semiotomatis terhadap data data dalam jumlah besar untuk mencari pola dan aturan yang berarti.
2.2.4.1 Konsep Data Mining
Data mining sangat diperlukan terutama dalam mengelola data yang
sangat besar untuk memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi bagi pengguna data mining. Alasan utama data mining sangat dibutuhkan dalam industri informasi karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran atau berjumlah besar. Informasi iniliah yang nantinya sangat berguna untuk pengembangan. Berikut adalah langkah-langkah dalam data mining [10] :
(20)
1. Data cleaning yaitu untuk menghilangkan noise data yang tidak
konsisten.
2. Data integration yaitu menggabungkan beberapa file atau
database.
3. Data selection yaitu data yang relevan dengan tugas analisis
dikembalikan ke dalam database untuk proses data mining.
4. Data transformation yaitu data berubah atau bersatu menjadi
bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi.
5. Data mining yaitu proses esensial dimana metode yang intelejen
digunakan untuk mengekstrak pola data.
6. Knowledge disccovery yaitu proses esential dimana metode yang
intelejen digunakan untuk mengekstrak pola data.
7. Pattern evolution yaitu untuk mengidentifikasi pola yang
benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik.
8. Knowledge presentation yaitu gambaran teknik visualisasi dan
pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambah kepada user.
2.2.4.2 Metode Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan, yaitu [12] : 1. Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat mengumpulkan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelesan untuk suatu pola atau kecenderungan.
(21)
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah :
1. Prediksi harga beras dalam tiga bulan yang akan datang.
2. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikan.
4. Klasifikasi
Dalam klasifikasi, terdapat terget variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah :
1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.
2. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu
(22)
dengan yang lainnya dan tidak memiliki kemiripan dengan record-record
dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari
variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk
melakukan pembagian terhadap keselurahan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan
record dalam suatu kelompok akan bernilai maksimal, sedangkan kemiripan
dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah :
1. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang besar.
2. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan.
3. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah :
1. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.
2. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.
(23)
2.2.5 Association Rule
Aturan asosiasi (Association rule) adalah salah satu teknik tentang ‘apa
bersama apa’. Ini bisa berupa transaksi di supermarket, misalnya seseorang yang membeli susu bayi juga membeli sabun mandi. Di sini berarti susu bayi bersama sabun mandi. Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan Market Basket [13].
Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent
itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah
semua pola frequent itemset ditemukan, barulah mencari aturan asosiatif atau aturan keterkaitan yang memenuhui syarat yang telah ditentukan.
Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki Boolean variable yang akan menunjukan keberadaannya atau tidak barang tersebut dalam satu transaksi atau satu keranjang belanja. Pola Boolean yang didapat digunakan untuk menganalisa barang yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule.
Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditujukan sebagai berikut :
Kopi → susu [support = 2%, confidence = 60%]
Nilai support 2% menunjukan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence 60% yaitu menunjukan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.
Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Support (nilai penunjang) adalah presentase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar-item dalam aturan asosiasi.
Dalam menentukan suatu association rule, terdapat suatu ukuran kepercayaan yang didapat dari hasil pengelolahan data dengan perhitungan tertentu. Umumnya ada dua ukuran, yaitu:
(24)
a. Support : suatu ukuran yang menunjukan seberapa besar tingkat dominasi suatu
itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu
itemset layak untuk dicari confidence-nya ( misal, dari keseluruhan transaksi
yang ada, seberapa besar tingkat dominasi suatu item yang menunjukan bahwa
item A dan item B dibeli bersamaan).
b. Confidence : suatu ukuran yang menunjukan hubungan antara 2 item secara
conditional (misal, menghitung kemungkinan seberapa sering item B dibeli
oleh pelanggan jika pelanggan tersebut membeli sebuah item A).
Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence).
Nilai support sebuah item diperoleh dengan rumus sebagai berikut[6] :
x100%….. Persamaan (2.1)
Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut:
x100%..Persamaan (2.2) Sedangkan nilai confidence dapat dicari setelah pola frekuensi munculnya sebuah
item ditemukan. Rumus untuk menghitung confidence adalah sebagai berikut:
x100%…..Persamaan(2.3)
2.2.6 Algoritma FP-Growth
Algoritma yang sama dengan Apriori, FP-Growth mulai dengan menghitung item tunggal sesuai dengan jumlah kemunculan item yang ada didalam dataset. Setelah proses penghitungan selesai maka akan dibuat struktur pohon pada tahap kedua. Pohon yang dibuat mulanya kosong yang nanti akan diisi dengan hasil dari dataset yang telah didapat sebelumnya. Kunci untuk mendapatkan struktur pohon yang bisa didapatkan dengan proses lebih cepat untuk mencari item set yang besar menjadi sedikit dengan di urutkan secara
(25)
descending dari frekuensi yang ada dataset tersebut. Masing-masing item yang tidak mencapai kebutuhan minimum dari threshold tidak dimasukkan kedalam pohon, tapi dikeluarkan secara efektif dari dataset.
FP-Tree merupakan struktur penyimpanan data yang dimampatkan.
FP-Tree dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan
tertentu dalam FP-Tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-Tree semakin efektif. Kelebihan dari FP-Tree adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien. FP-Growth dapat dibagi menjadi 3 tahapan utama yaitu sebagai :
1. Tahap Pembangkitan conditional pattern base.
Conditional Pattern Base merupakan sub database yang berisi prefix
path dan suffix pattern. Pembangkitan conditinal pattern base
didapatkan melalui FP-Tree yang telah dibangun sebelumnya. 2. Tahap Pembangkitan Conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional
pattern base dijumlahkan, lalu setiap item yang memiliki jumlah
support count lebih besar atau sama dengan minimum support count ξ
akan dibangkitkan dengan conditional FP-Tree. 3. Tahap Pencarian frequent pattern
Apabila conditional FP-Tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dnegan melakukan kombinasi item untuk setiap conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan pembangkitan FP-Growth secara rekursif.
Berikut ini merupakan contoh kasus penerapan metode association rule
menggunakan Algoritma FP-Growth :
Misalkan diberikan tabel data transaksi sebagai berikut dengan minimum support
(26)
Tabel 2.1 Data Transaksi
TID Items
1 B
2 B, D
3 A, C, D, E
4 A, D, E
5 B, C
6 A, C
7 A
Yang mana nilai support count didapat dari :
x 100% = 2.14 ≈ 2 Frekuensi kemunculan tiap item dapat dilihat pada tabel berikut:
Tabel 2. 2 Frekuensi Kemunculan Tiap Karakter
Item Frekuensi
A 4
B 3
C 3
D 3
E 2
Selanjutnya pada gambar di bawah ini memberikan ilustrasi mengenai pembentukan FP-Tree setelah pembacaan TID 2
(27)
Gambar 2.5 Hasil Pembentukan FP-Tree setelah pembacaan TID 5
Gambar 2.6 Hasil pembentukan FP-Tree setelah pembacaan TID 7 Diberikan 7 data transaksi dengan 5 jenis item seperti pada tabel di atas. Gambar 5-7 menunjukan proses terbentuknya FP-Tree setiap TID dibaca. Setiap simpul pada FP-Tree mengandung nama sebuah item dan counter support yang berfungsi untuk menghitung frekuensi kemunculan item tersebut dalam tiap lintasan transaksi.
Setelah FP-Tree terbentuk dari sekumpulan data transaksi maka, proses pencarian frequent itemset dengan menggunakan algoritma FP-Growth akan dilakukan yang dibagi menjadi tiga tahapan utama, yaitu:
(28)
a. Tahap pembangkitan conditional pattern base
Merupakan subdata yang berisi prefix path (lintasan awal) dan suffix pattern
(pola akhiran). Pembangkitan conditional pattren base didapatkan melalui FP-Tree yang telah dibangun sebelumnya.
b. Tahap pembangkitan conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern
base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih
besar atau sama dengan minimum support count akan dibangkitkan dengan
conditionalFP-Tree.
Tabel 2. 3 Hasil Perhitungan Conditional Pattern Base dan Conditional FP-Tree
Item Conditional Pattern Base ConditionalFP Tree
E {{A,C,D:1}, {A,D:1}} {<A:2,D:2>} D {{B:1}, {A,C:1}, {A:1}} {A:2}
C {B:1}, {A:2} {A:2}
c. Tahap pencarian frequent itemset.
Apabila conditional FP-Tree merupakan lintasan tunggal(single-path), maka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap
conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan
pembangkitan FP-Growth secara rekursif (proses memanggil dirinya sendiri) seperti contoh pada tabel 2.3 dibawah ini :
Tabel 2. 4 Hasil Frequent Itemset
Suffix Frequent Itemset
E E, A-E, D-E, A-D-E
D D, A-D
(29)
Tabel 2.5 Hasil Generate Rule
Rule Support Confidence (%)
A → E 2 (2/4)*100 = 50
E → A 2 (2/2)*100 = 100
A → D 2 (2/4)*100 = 50
D → A 2 (2/3)*100 = 66.67
A → C 2 (2/4)*100 = 50
C → A 2 (2/3)*100 = 66.67
D → E 2 (2/3)*100 = 66.67
E → D 2 (2/2)*100 = 100
A- D →E 2 (2/2)*100 = 100
D- E →A 2 (2/2)*100 = 100
2.2.7 Unified Modeling Language (UML)
Unified Modeling Language (UML) adalah himpunan struktur dan teknik
untuk pemodelan desain program berorientasi objek serta aplikasinya. Berikut adalah beberapa model yang digunakan dalam perancangan Data Mining
Pemaketan Produk di Minimarket Warga Tunggal untuk menggambarkan sistem dalam UML:
1. Diagram Use Case 2. Diagram Aktivity
3. Diagram Class
4. Diagram Sequence
2.2.7.1 Diagram Use Case
Diagram use case adalah model fungsional sebuah sistem yang menggunakan aktor dan use case. Use case adalah layanan (services) atau fungsi–fungsi yang disediakan oleh sistem untuk penggunanya.
(30)
1. Sebuah use case adalah dimana sistem digunakan untuk memenuhi satu atau lebih kebutuhan pemakai.
2. Use case merupakan awal yang sangat baik untuk setiap fase
pengembangan berbasis objek, design testing, dan dokumentasi.
3. Use case menggambarkan kebutuhan sistem dari sudut pandang di
luar sistem.
4. Use case menentukan nilai yang diberikan sistem kepada pemakainya.
5. Use case hanya menetapkan apa yang seharusnya dikerjakan oleh
sistem, yaitu kebutuhan fungsional sistem.
6. Use case tidak untuk menentukan kebutuhan nonfungsional, misal:
sasaran kerja, bahasa pemrograman.
2.2.7.2 Diagram Class
Diagram kelas adalah diagram UML yang menggambarkan kelas-kelas dalam sebuah sistem dan hubungannya antara satu dengan yang lain, serta dimasukkan pula atribut dan operasi. Tahapan dari diagram kelas adalah sebagai berikut:
1. Mengidentifikasi objek dan mendapatkan kelas-kelasnya. 2. Mengidentifikasi atribut kelas-kelas.
3. Mulai mengkonstruksikan kamus data. 4. Mengidentifikasi operasi pada kelas-kelas.
5. Mengidentifikasikan hubungan antar kelas dengan menggunakan
asosiasi, agregasi, dan inheritance (pewarisan).
2.2.7.3 Diagram Aktifitas
Diagram aktivitas adalah representasi grafis dari seluruh tahapan alur kerja. Diagram ini mengandung aktivitas, pilihan tindakan, perulangan dan hasil dari aktivitas tersebut. Diagram ini dapat digunakan untuk menjelaskan proses bisnis dan alur kerja operasional secara langkah demi langkah dari komponen suatu sistem.
(31)
2.2.7.4 Diagram Objek
Sequence diagram (diagram urutan) adalah suatu diagram yang memperlihatkan atau menampilkan interaksi-interaksi antar objek di dalam sistem yang disusun pada sebuah urutan atau rangkaian waktu. Interaksi antar objek tersebut termasuk pengguna, display, dan sebagainya berupa pesan/message. Sequence Diagram digunakan untuk menggambarkan skenario atau rangkaian langkah-langkah yang dilakukan sebagai sebuah respon dari suatu kejadian/even untuk menghasilkan output tertentu. Sequence Diagram diawali dari apa yang me-trigger aktivitas tersebut, proses dan perubahan apa saja yang terjadi secara internal dan output apa yang dihasilkan.
2.2.8 MySQL
MySQL adalah multiuser database yang menggunakan bahasa structured
Query Language (SQL). MySQL dalam operasi client server melibatkan server
daemon MySQL di sisi server dan berbagai macam program serta library yang
berjalan di sisi client. MySQL mampu menangani data yang cukup besar. Perusahaan yang mengembangkan MySQL yaitu TcX, mengaku bahwa MySQL yang mampu menyimpan data lebih dari 40 database, 10.000 tabel dan sekitar 7 juta baris, totalnya kurang lebih 100 Gigabyte data [2].
SQL adalah bahasa standar yang digunakan untuk mengakses database
server. Bahasa ini pada awalnya dikembangkan oleh IBM, namun telah diadopsi
dan digunakan sebagai bahasa yang standar industri. Dengan menggunakan SQL, proses akses database menjadi lebih user-friendly dibandingkan dengan menggunakan DBASE atau Clipper yang masih menggunakan perintah-perintah pemrograman.
(32)
25
Analisis sistem adalah penguraian dari suatu informasi yang utuh kedalam bagian-bagian komponennya dengan maksud untuk mengidentifikasi dan mengevaluasi permasalahan, kesempatan, hambatan yang terjadi dan kebutuhan yang diharapkan sehingga dapat diusulkan perbaikan. Analisis Sistem ini bertujuan untuk menjelaskan permasalahan yang muncul pada saat pembangunan sistem, hal ini bertujuan untuk membantu ketika proses perancangan sistem berlangsung. Tugas utama analisis sistem dalam tahap ini adalah menemukan kelemahan-kelemahan dari sistem yang berjalan sehingga dapat diusulkan perbaikannya. Dalam analisis sistem ini meliputi beberapa bagian, yaitu :
1. Analisis Masalah
2. Analisis Penerepan Metode CRISP-DM
3. Analisis Spesifikasi Kebutuhan Perangkat Lunak 3.1.1 Analisis Masalah
Analisis masalah yang dilakukan adalah melihat dan mengidentifikasi permasalahan atau kendala di dalam penelitian yang dilakukan. Masalah dapat diartikan sebagai suatu pernyataan yang menyatakan tentang situasi yang memerlukan pemecahan. Perlu ada analisis masalah melalui rumusan masalah yang sudah ditentukan sebelumnya. Berdasarkan hasil pengamatan, diketahui bahwa analisis masalahnya adalah sebagai berikut :
1. Kartin Collection masih mengalami masalah dalam penentuan model tas yang akan diproduksi
2. Belum adanya perekomendasian untuk menentukan model tas yang harus diproduksi.
(33)
3.1.2 Analisis Penerapan Metode CRISP-DM
Metode pembangunan perangkat data mining yang digunakan dalam penelitian ini adalah Cross-Industry Standard Process for Data Mining (CRISP-DM).
3.1.2.1 Pemahaman Bisnis
Tahapan pemahaman bisnis merupakan tahapan pertama dilakukan dalam kerangka kerja CRISP-DM. Dalam tahapan bisnis ini terdapat beberapa tahapan lainnya, yaitu :
1. Tujuan Bisnis
Dalam proses bisnisnya Kartin Collection mempunyai tujuan bisnis yaitu untuk meningkatkan mutu kualitas tas sesuai dengan permintaan dari pelanggan tetap.
2. Penentuan Sasaran Data Mining
Tujuan dari penerapan data mining nya adalah untuk mementukan model tas apa saya yang akan diproduksi, sesuai dengan permintaan pelangan tetap atau pelanggan lainnya.
3.1.2.2 Pemahaman Data
Dalam penelitian ini adalah data transaksi yang terjadi di Kartin Collection yang berasal dari file microsoft excel (.xlsx). Berikut merupakan penjelasan dari masing-masing atribut yang terdapat pada tabel Data transaksi yang dapat dilihat pada tabel 3.1 dibawah ini :
(34)
Tabel 3. 1 Struktur Data Transaksi Keterangan
Fungsi Untuk mengetahui jenis produk –produk yang paling sering terjual oleh customer
Format Microsoft Excel (.xlsx)
Atribut No No urut
Tgl Tanggal proses pembelian
Lokasi Tempat pembelian
Tuan/Toko Nama pemilik yang melayani No Transaksi Nomor pembelian
Banyaknya Banyaknya barang yang dibeli Kode Barang Kode dari setiap barang Nama Barang Nama barang yang dibeli
Hitam Warna hitam dari setiap nama barang Abu Warna abu dari setiap nama barang Cream Warna cream dari setiap nama barang Merah Warna merah dari setiap nama
barang
Coklat Warna coklat dari setiap nama barang Denim Hitam Warna denim hitam dari setiap nama
barang
Denim Biru Warna biru dari setiap nama barang Harga Harga barang yang dibeli
Jumlah Jumlah barang yang dibeli Return Barang yang dikembalikan Ket Alasan dari pengembalian barang
(35)
3.1.2.3 Persiapan Data
Sebelum dilakukan proses data mining harus dipersiapkan karena tidak semua data atau atribut dalam data digunakan pada proses mining. Proses ini dilakukan agar data dapat digunakan sesuai kebutuhan. Adapun tahapan – tahapan persiapan data adalah sebagai berikut :
1. Ekstraksi Data
Ekstraksi Data adalah proses pengambilan data transaksi penjualan
dikartin collection dari sumber data yang berasal dari file berformat microsoft
excel. Data yang telah diekstrak akan disimpan kedalam database, untuk
melanjutkan proses pengolahan data ke tahap selanjutnya. Berikut adalah
data transaksi penjualan yang terjadi di kartin collection dapat dilihat pada lampiran E.
2. Pemilihan atribut
Berdasarkan imformasi yang ingin didapat oleh pengguna mengenai model produk yang dibeli secara bersamaan, maka atribut yang digunakan dalam data transaksi diatas adalah No Transaksi dan Kode Barang. No transaksi adalah ID dari transaksi dan atribuit Kode Barang adalah jenis barang yang dibeli. Ini bertujuan untuk proses mining, karena tidak semua data yang digunakan dalam data transaksi digunakan untuk proses mining. Berikut dibawah ini table proses pemilihan atribut dapat dilihat pada tabel 3.2 :
Tabel 3. 2Pemilihan atribut No Transaksi KodeBarang
1 14
1 9
2 9
2 2
2 14
3 9
3 14
3 2
3 1
4 12
(36)
No Transaksi KodeBarang
4 5
4 15
4 10
4 2
4 1
5 14
5 5
5 9
5 1
5 7
5 12
5 5
5 15
6 14
6 9
6 5
6 2
6 10
6 3
6 7
6 15
7 9
7 14
7 2
8 9
8 14
9 2
9 1
10 12
10 7
11 2
11 1
11 14
12 5
12 9
13 1
14 7
14 12
14 5
(37)
No Transaksi KodeBarang
15 13
15 7
15 15
16 14
16 2
16 1
17 12
17 7
18 15
18 10
18 8
19 11
19 9
19 14
19 2
20 1
20 12
20 7
20 5
20 15
20 14
20 6
20 9
21 1
21 2
21 14
21 15
22 14
22 15
22 4
22 2
23 1
23 14
23 12
23 15
23 7
24 14
24 9
24 16
(38)
No Transaksi KodeBarang
25 9
25 1
25 2
26 14
26 15
26 12
26 7
3. Pembersihan Data
Pembersihan Data merupakan proses menghilangkan data dari hasil pemilihan atribut pada tabel 3.2. Data yang dihilangkan adalah ata pada satu transaksi yang hanya terdapat satu pembelian model tas, karena data tersebut tidak memiliki hubungan assosiasi dengan Item lain. data yang telah dibersihkan dapat dilihat pada tabel 3.3 :
Tabel 3. 3 Hasil Pembersihan Data
No Transaksi KodeBarang
1 14
1 9
2 9
2 2
2 14
3 9
3 14
3 2
3 1
4 12
4 7
4 5
4 15
4 10
4 2
4 1
5 14
5 5
5 9
(39)
No Transaksi KodeBarang
5 7
5 12
5 5
5 15
6 14
6 9
6 5
6 2
6 10
6 3
6 7
6 15
7 9
7 14
7 2
8 9
8 14
9 2
9 1
10 12
10 7
11 2
11 1
11 14
12 5
12 9
14 7
14 12
14 5
15 14
15 13
15 7
15 15
16 14
16 2
16 1
17 12
17 7
18 15
(40)
No Transaksi KodeBarang
18 8
19 11
19 9
19 14
19 2
20 1
20 12
20 7
20 5
20 15
20 14
20 6
20 9
21 1
21 2
21 14
21 15
22 14
22 15
22 4
22 2
23 1
23 14
23 12
23 15
23 7
24 14
24 9
24 16
24 6
25 9
25 1
25 2
26 14
26 15
26 12
(41)
4. Penyiapan Data awal
Setelah proses semua dilakukan dan data telah siap di mining, maka data
transaksi sudah dapat digunakan proses selanjutnya yaitu pemodelan.
3.1.2.4 Pemodelan
Pemodelan merupakan tahap untuk membuat model atau desain sistem yang akan dibangun. Data yang digunakan untuk pengolahan data ini adalah data
yang terdapat dalam table 3.3. Didalam tahap ini metode yang dipakai adalah metode association rule dengan algoritma fp-growth.
Metode assosiation rules terbagi menjadi dua tahap yaitu mencari pola frekuensi dan pembentukan atau perhitungan aturan asosiasi. Pencarian frekuensi adalah tahap mencari nilai frekuensi dari setiap Item, sedangkan pembentukan
asosiasi adalah proses perhitungan untuk mencari pola Item yang memenuhi nilai
minimum support.
Nilai minimum support yang digunakan adalah 10% dari 26 sampel data
transaksi yaitu 2.6 3. yang bertujuan untuk melihat banyaknya variasi data yang terjadi dalam proses pencarian hasil akhir yaitu rule.
Berikut adalah tahap pencarian frekuensi dari setiap Item yaitu menuliskan setiap kode barang dan memberikan nilai frekuensi dengan cara menghitung kemunculan setiap barang. Hasil pencarian frekuensi dapat dilihat pada tabel 3.4 :
Tabel 3. 4Perhitungan Frekuensi Kode Barang Frekuensi
1 10
2 11
3 1
4 1
5 6
(42)
Kode Barang Frekuensi
7 9
8 2
9 12
10 3
11 1
12 8
14 18
15 10
16 1
Adapun tahapan dalam proses pencarian selanjutnya adalah sebagai berikut :
1. Langkah pertama menghilangkan data yang tidak memenuhi minimum
support yang sudah ditentukan sebelumnya yaitu 3, berikut data yang
memenuhi nilai minimum support dapat dilihat pada tabel 3.5 : Tabel 3. 5 Data Yang Memenuhi Minimum Support
Kode Barang Support count
1 10
2 11
5 6
7 9
9 12
10 3
12 8
14 18
(43)
2. Langkah kedua adalah memberikan nilai priority untuk setiap Item. Setelah mendapatkan data yang memenuhi nilai minimum support seperti pada tabel 3.5 diatas, selanjutnya melakukan proses pengurutan secara ascending dari kemunculan setiap support count yang muncul dan memberikan priority
sebagai tanda dari setiap Item yang memiliki support count paling besar sampai dengan terkecil. Jika terdapat kode barang dengan support count yang sama maka yang akan didahulukan adalah kode barang yang kemunculannya lebih awal pada data transaksi dibandingkan yang lainnya. Berikut adalah hasil pengurutan berdasarkan prioritydapat dilihat pada tabel 3.6 :
Tabel 3. 6 Pengurutan Secara Ascending
Kode Barang Support Count Priority
14 18 1
9 12 2
2 11 3
1 10 4
15 10 5
7 9 6
12 8 7
5 6 8
10 3 9
3. Langkah ketiga setelah semua Item mendapatkan nilai priority maka data
transaksi yang memenihi minimum support akan diurutkan berdasarkan
priority. Pada tahap ini Item yang memiliki nilai priority tertinggi pada satu
transaksi akan didahulakan penulisannya. Hasil pengurutan berdasarkan
(44)
Tabel 3. 7 Pengurutan Data Berdasarkan Priority
No Transaksi Kode Barang
1 14
1 9
2 14
2 9
2 2
3 14
3 9
3 2
3 1
4 2
4 1
4 15
4 7
4 12
4 5
4 10
5 14
5 9
5 1
5 15
5 7
5 12
5 5
6 14
6 9
6 2
6 15
(45)
No Transaksi Kode Barang
6 5
6 10
7 14
7 9
7 2
8 14
8 9
9 2
9 1
10 7
10 12
11 14
11 2
11 1
12 9
12 5
14 7
14 12
14 5
15 14
15 15
16 14
16 2
16 1
17 7
17 12
18 15
18 10
(46)
No Transaksi Kode Barang
19 9
20 14
20 9
20 1
20 15
20 7
20 12
20 5
21 14
21 2
21 1
21 15
22 14
22 2
22 15
23 14
23 1
23 15
23 7
23 12
24 14
24 9
25 14
25 9
25 2
25 1
26 14
26 15
(47)
No Transaksi Kode Barang
26 12
4. Langkah keempat adalah membuat fp-tree. Berikut proses pembentukan
FP-Tree dibawah ini :
1. Transaksi 1 : 14,9
1) Lakukan pembacaan pada data transaksi pertama yang akan diproses.
2) Lakukan pengecekan pada root yang diinisialisasikan dengan Null, jika root belum mempunyai anak (child), maka data yang dibaca tadi menjadi anak pertama dari
root. Dan support count dari masing masing node
bertambah 1, kecuali root.
NUll
14:1
9:1
Gambar 3. 1 Tree No transaksi
2. Transaksi 2 : 14,9,2
1) Lakukan pembacaan pada data transaksi kedua yang akan diproses.
2) Jika data yang keluar berikutnya sama dengan data yang pertama, maka itu bukan anak kedua dari root, tetapi tetap anak dari root yang sebelumnya keluar, yang berubah adalah support count-nya menjadi bertambah 1.
(48)
NUll
14:2
9:2
2:1
Gambar 3. 2 Tree No transaksi 2
3. Transaksi 3 : 14,9,2,1
1) Lakukan pembacaan pada data transaksi ketiga yang akan diproses.
2) Jika data yang keluar berikutnya sama dengan data yang pertama, maka itu bukan anak kedua dari root, tetapi tetap anak dari root yang sebelumnya keluar, yang berubah adalah
support count-nya menjadi bertambah 1.
NUll
14:3
9:3
2:2
1:1
(49)
4. Transaksi 4 : 2,1,15,7,12,5,10
1) Lakukan pembacaan pada data transaksi keempat yang akan diproses.
2) Jika data yang dibaca atau data yang keluar berbeda dengan
data yang kelaur sebelumnya maka itu menjadi anak terakhir dari root dan menjadi sibling dari node data pertama. Dan
support count dari node tersebut bertambah1.
NUll
14:3
9:3
2:2
1:1
2:1
1:1
15:1
10:1 7:1
12:1
5:1
Gambar 3. 4 Tree No transaksi 4
5. Transaksi 5 : 14,9,1,15,7,12,5
1) Lakukan pembacaan pada data transaksi kelima yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(50)
NUll
14:4
9:4
2:2
1:1
2:1
1:1
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1
Gambar 3. 5 Tree No transaksi 5
6. Transaksi 6: 14,9,2,15,7,5,10
1) Lakukan pembacaan pada data transaksi keenam yang akan diproses.
2) Jika Data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.
(51)
NUll
14:5
9:5
2:3
1:1
2:1
1:1
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
Gambar 3. 6 Tree No transaksi 6
7. Transaksi 7 : 14,9,2
1) Lakukan pembacaan pada data transaksi ketujuh yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(52)
NUll
14:6
9:6
2:4
1:1
2:1
1:1
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
Gambar 3. 7 Tree No transaksi 7
8. Transaksi 8 : 14,9
1) Lakukan pembacaan pada data transaksi kedelapan yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(53)
NUll
14:7
9:7
2:4
1:1
2:1
1:1
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
Gambar 3. 8 Tree No transaksi 8
9. Transaksi 9 : 2,1
1) Lakukan pembacaan pada data transaksi kesembilan yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.
(54)
NUll 14:7 9:7 2:4 1:1 2:2 1:2 15:1 10:1 7:1 12:1 5:1 1:1 15:1 7:1 12:1 5:1 15:1 7:1 5:1 10:1 3:1
Gambar 3. 9 Tree No transaksi 9
10.Transaksi 10 : 7,12
1) Lakukan pembacaan pada data transaksi kesepuluh yang akan diproses.
2) Jika data yang dibaca atau data yang keluar berbeda dengan
data yang kelaur sebelumnya maka itu menjadi anak terakhir dari root dan menjadi sibling dari node data pertama. Dan
support count dari node tersebut bertambah1.
NUll 14:7 9:7 2:4 1:1 2:2 1:2 15:1 10:1 7:1 12:1 5:1 1:1 15:1 7:1 12:1 5:1 15:1 7:1 5:1 10:1 7:1 12:1
(55)
11.Transaksi 11 : 14,2,1
1) Lakukan pembacaan pada data transaksi kesebelas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.
NUll
14:8
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:1
12:1 2:1
1:1
Gambar 3. 11 Tree No transaksi 11
12.Transaksi 12 : 9,5
1) Lakukan pembacaan pada data transaksi kedua belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(56)
NUll
14:8
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:1
12:1 2:1
1:1
9:1
5:1
Gambar 3. 12 Tree No transaksi 12
13.Transaksi 14 : 7,12,5
1) Lakukan pembacaan pada data transaksi keempat belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(57)
NUll
14:8
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:2
12:2 2:1
1:1
9:1
5:1
5:1
Gambar 3. 13 Tree No transaksi 14
14.Transaksi 15 : 14,15
1) Lakukan pembacaan pada data transaksi kelima belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(58)
NUll
14:9
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:2
12:2 2:1
1:1
9:1
5:1
5:1 15:1
Gambar 3. 14 Tree No transaksi 15
15.Transaksi 16 : 14,2,1
1) Lakukan pembacaan pada data transaksi keenam belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(59)
NUll
14:10
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:2
12:2 2:2
1:2
9:1
5:1
5:1 15:1
Gambar 3. 15 Tree No transaksi 16
16.Transaksi 17 : 7,12
1) Lakukan pembacaan pada data transaksi ketujuh belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(60)
NUll
14:10
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:3
12:3 2:2
1:2
9:1
5:1
5:1 15:1
Gambar 3. 16 Tree No transaksi 17
17.Transaksi 18 : 15,10
1) Lakukan pembacaan pada data transaksi kedelapan belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya Data yang dibaca sama saja yang
(61)
NUll
14:10
9:7
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:3
12:3 2:2
1:2
9:1
5:1
5:1 15:1
15:1
10:1
Gambar 3. 17 Tree No transaksi 18
18.Transaksi 19 : 14,9
1) Lakukan pembacaan pada data transaksi kesembilan belas yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasanmaka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(62)
NUll
14:11
9:8
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
10:1
7:3
12:3 2:2
1:2
9:1
5:1
5:1 15:1
15:1
10:1
Gambar 3. 18 Tree No transaksi 19
19.Transaksi 20 : 14,9,1,15,7,12,5
1) Lakukan pembacaan pada data transaksi kedua puluh yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.
(63)
NUll
14:12
9:9
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:2
15:2
7:2
12:2
5:2 15:1
7:1
5:1
10:1
7:3
12:3 2:2
1:2
9:1
5:1
5:1 15:1
15:1
10:1
Gambar 3. 19 Tree No transaksi 20
20.Transaksi 21 : 14,2,1,15
1) Lakukan pembacaan pada data transaksi kedua puluh satu yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.
(64)
NUll
14:13
9:9
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:2
15:2
7:2
12:2
5:2 15:1
7:1
5:1
10:1
7:3
12:3 2:3
1:3
9:1
5:1
5:1 15:1
15:1
10:1
15:1
Gambar 3. 20 Tree No transaksi 21
21.Transaksi 22 : 14,2,15
1) Lakukan pembacaan pada data transaksi keduapuluh dua yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(65)
Gambar 3. 21 Tree No transaksi 22
22.Transaksi 23 : 14,1,15,7,12
1) Lakukan pembacaan pada data transaksi keduapuluh tiga yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah support count-nya, hanya data yang dibaca sama saja yang bertambah support count-nya.
NUll
14:14
9:9
2:4
1:1
2:2
1:2
15:1
10:1 7:1
12:1
5:1 1:2
15:2
7:2
12:2
5:2 15:1
7:1
5:1
10:1
7:3
12:3 2:4
1:3
9:1
5:1
5:1 15:1
15:1
10:1
15:1
(66)
NUll 14:15 9:9 2:4 1:1 2:2 1:2 15:1 10:1 7:1 12:1 5:1 1:2 15:2 7:2 12:2 5:2 15:1 7:1 5:1 10:1 7:3 12:3 2:4 1:3 9:1 5:1 5:1 15:1 15:1 10:1 15:1 1:1 15:1 7:1 12:1 15:1
Gambar 3. 22 Tree No transaksi 23
23.Transaksi 24 : 14,9
1) Lakukan pembacaan pada data transaksi kedua puluh empat yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(67)
NUll 14:16 9:10 2:4 1:1 2:2 1:2 15:1 10:1 7:1 12:1 5:1 1:2 15:2 7:2 12:2 5:2 15:1 7:1 5:1 10:1 7:3 12:3 2:4 1:3 9:1 5:1 5:1 15:1 15:1 10:1 15:1 1:1 15:1 7:1 12:1 15:1
Gambar 3. 23 Tree No transaksi 24
24.Transaksi 25 : 14,9,2,1
1) Lakukan pembacaan pada data transaksi keduapuluh lima yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya data yang dibaca sama saja yang
(68)
NUll 14:17 9:11 2:5 1:2 2:2 1:2 15:1 10:1 7:1 12:1 5:1 1:2 15:2 7:2 12:2 5:2 15:1 7:1 5:1 10:1 7:3 12:3 2:4 1:3 9:1 5:1 5:1 15:1 15:1 10:1 15:1 1:1 15:1 7:1 12:1 15:1
Gambar 3. 24 Tree No transaksi 25
25.Transaksi 26 : 14,15,7,12
1) Lakukan pembacaan pada data transaksi kedua puluh enam yang akan diproses.
2) Jika data yang keluar sama setelah pembacaan, namun berbeda lintasan maka node pada lintasan yang lain tidak bertambah
support count-nya, hanya cata yang dibaca sama saja yang
(69)
NUll 14:18 9:11 2:5 1:2 2:2 1:2 15:1 10:1 7:1 12:1 5:1 1:2 15:2 7:2 12:2 5:2 15:1 7:1 5:1 10:1 7:3 12:3 2:4 1:3 9:1 5:1 5:1 15:2 15:1 10:1 15:1 1:1 15:1 7:1 12:1 7:1 12:1 15:1
Gambar 3. 25 Tree No transaksi 26
Setelah pembuatan fp-tree dilakukan langkah selanjutnya adalah tahap Pembangkitan Conditional Pattern Base, Tahap Pembangkitan Conditional
FP-Tree dan pencarian Frequent Pattern. Adapun langkahnya yaitu :
a. Tahap Pembangkitan Conditional Pattern Base
Mencari support count terkecil dari setiap Item sampai dengan terbesar berdasarkan hasil pembentukan fp-tree sebelumnya . Berikut ini adalah
support count terkecil sampai dengan terbesar dapat dilihat pada tabel
3.8 :
Tabel 3. 8 Condiitonal Pattern Base
Item Conditonal Pattern Base
10 14,9,2,15,7,5:1
2,1,15,7,12,5:1
15:1
5 14,9,2,15,7:1
(70)
2,1,15,7,12:1
7,12:1
9:1
12 14,9,1,15,7:2
14,15,7:1
14,1,15,7:1
2,1,15,7:1
7:3
7 14,9,2,15:1
14,9,1,15:2
14,15:1
14,1,15:1
2,1,15:1
15 14,9,2:1
14,9,1:2
14,2,1:1
14,2:1
14:2
14,1:1
2,1:1
1 14,9,2:2
14,9:2
14,2:3
14:1
2:2
2 14,9:5
14:4
(71)
b. Tahap Pembangkitan Conditional FP-Tree
Pada tahap ini setiap Item-Itemakan dibuat conditional fp-tree, dan apabila ada Item yang memenuhi minimum support atau sama dengan 3, maka Item tersebut akan dibangkitkan lagi untuk mencari frequent
pattern. Berikut adalah conditional fp-tree dari tiap Item.
1. Conditional FP-Tree Item 10:
Tahap pembentukan Conditional FP-Tree untuk Item10 dengan
Conditional pattern base
{14,9,2,15,7,5:1},{2,1,15,7,12,5:1},{15:1} NUll
14:18
9:11
2:5
2:2
1:2
15:1
10:1 7:1
12:1
5:1 15:1
7:1
5:1
10:1
15:1
10:1
Gambar 3. 26 Conditional FP-Tree Item
Karena support count Item 10 memenuhi minimum support maka Item10 akan dibangkitkan dengan conditional fp-tree, berikut langkah langkahnya :
1. Item {10} akan dihilangkan dan support count yang satu lintasan dengan {10} akan sama dengan support count {10} sebelumnya.
2. Apabila dalam suatu lintasan melintasi satu atau dua lintasan, maka
(72)
NUll
14:1
9:1
2:1
2:1
1:1
15:1
7:1
12:1
5:1 15:1
7:1
5:1
15:1
Gambar 3. 27 Conditional FP-TreeItem 10 setelah dibangkitkan
3. Setelah proses pembangkitan, maka proses terakhir adalah mencari
frequent pattern yang memenuhi minimum support.{15:3} adalah Item
yang keluar yang dapat memenuhi minimum support.
Null
15:3
Gambar 3. 28 Conditional FP-Tree 10,15:3 Hasil Frequent Pattern
2. Conditional FP-Tree untuk Item 5 dengan conditional pattern base
(73)
NUll 14:18 9:11 2:5 2:2 1:2 15:1 7:1 12:1 5:1 1:2 15:2 7:2 12:2 5:2 15:1 7:1 5:1 7:3 12:3 9:1 5:1 5:1
Gambar 3. 29 Conditional FP-Tree Item 5
Karena support count Item 5 memenuhi minimum support maka Item 5 akan dibangkitkan dengan conditional fp-tree, berikut langkah langkahnya :
1. Item {5} akan dihilangkan dan support count yang satu lintasan dengan {5} akan sama dengan support count {5} sebelumnya.
2. Apabila dalam suatu lintasan melintasi satu atau dua lintasan, maka
support count-nya akan selalu bertambah 1.
NUll 14:3 9:3 2:1 2:1 1:1 15:1 7:1 12:1 1:2 15:2 7:2 12:2 15:1 7:1 7:1 12:1 9:1
(74)
3. Setelah proses pembangkitan, maka proses terakhir adalah mencari
frequent pattern yang memenuhi minimum support.
{14:3},{9:4},{1:3},{15:4},{7:5},{12:4} adalah Item yang keluar yang dapat memenuhi minimum support.
Null
14:3
Gambar 3. 31 Conditional FP-Tree 5,14:3 Hasil Frequent pattern
Null
9:4
Gambar 3. 32 Conditional FP-Tree 5,9:4 Hasil FrequentPattertn
Null
1:3
Gambar 3. 33 Conditional FP-Tree 5,1:3 Hasil Frequent Pattern
Null
15:4
Gambar 3. 34 Conditional FP-Tree 5,15:4 Hasil FrequentPattertn
Null
7:5
(75)
Null
12:4
Gambar 3. 36 Conditional FP-Tree 5,12:4 Hasil FrequentPattertn
3. Conditional FP-Tree untuk Item 12 dengan conditional pattern base
{14,9,1,15,7:2} {14,15,7:1} {14,1,15,7:1} {2,1,15,7:1} {7,:3} NUll
14:18
9:11
2:2
1:2
15:1
7:1
12:1 1:2
15:2
7:2
12:2
7:3
12:3
15:2 1:1
15:1
7:1
12:1 7:1
12:1
Gambar 3. 37 Conditional FP-TreeItem 12
Karena support count Item 12 memenuhi minimum support maka Item 12 akan dibangkitkan dengan conditional fp-tree, berikut langkah langkahnya :
1. Item {12} akan dihilangkan dan support count yang satu lintasan dengan {12} akan sama dengan support count {12} sebelumnya.
2. Apabila dalam suatu lintasan melintasi satu atau dua lintasan, maka
(76)
NUll
14:4
9:2
2:1
1:1
15:1
7:1 1:2
15:2
7:2
7:3
15:1
1:1
15:1
7:1 7:1
Gambar 3. 38 Conditional FP-Tree Item 12 setelah dibangkitkan
3. Setelah proses pembangkitan, maka proses terakhir adalah mencari
frequen patterns harus memenuhi minimum support.
{14:4},{1:4},{15:5},{7:8} adalah Item yang memenuhi minimum support.
Null
14:4
Gambar 3. 39 Conditional FP-Tree 12,14:4 Hasil Frequent Pattertn
Null
1:4
Gambar 3. 40 Conditional FP-Tree 12,1:4 Hasil Frequent Pattertn
Null
15:5
(1)
143
4.2.3.1 Kesimpulan Pengujian Hasil
Berdasarkan hasil dari pengujian,dapat disimpulkan bahwa semakin kecil nilai minimum support yang digunakan maka akan semakin banyak aturan asosiasi yang dihasilkan yang membuat pihak Kartin Collection memiliki banyak opsional untuk produksi di bulan berikutnya dan sebaliknya semakin besar nilai minimum support maka akan semakin sedikit aturan asosiasi yang akan dihasilkan yang membuat pihak Kartin Collection memiliki sedikit opsional. Semakin kecil nilai minimum support maka akan membutuhkan waktu lama dalam mencari pola pembelian sebaliknya jika semakin besar nilai minimum support kemungkinan akan lebih cepat dalam mecari pola pembelian. Semakin kecil nilai minimum confidence, kemungkinan nilai kepastian aturan asosiasi yang dihasilkan akan semakin banyak yang membuat pihak Kartin Collection memiliki banyak opsional produk akan tetapi dengan presentasi kemunculan bersama menyatu dengan presentasi kemunculan yang sedikit dan semakin besar nilai minimum confidence maka akan semakin sedikit aturan asosiasi yang dihasilkan yang membuat pihak Kartin Collection mudah untuk memilih opsional produk dengan tingkat kemunculan yang tinggi dan bisa di produksi pada bulan berikutnya. Sehingga akan lebih baik menggunakan nilai minimum support yang kecil dengan nilai confidance yang besar, karena dengan pengambilan nilai seperti itu pihak kartin collection akan mendapatkan opsional rekomendasi kombinasi model tas yang harus diproduksi dibulan berikutnya lebih banyak dengan tingkat presentasi kemunculan yang tinggi.
(2)
144 BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil implementasi dan pengujian yang telah dilakukan pada sistem penerapan data mining dengan menggunakan metode association rule maka dapat diambil kesimpulan sebagai berikut :
1. Aplikasi yang dibangun dapat membantu pihak perusahaan untuk memanfaatkan atau mengelola data penjualan yang ada menjadi sebuah informasi.
2. Aplikasi yang dibangun dapat membantu pihak perusahaan mengetahui kombinasi model apa saja yang bisa dijadikan opsional dalam memproduksi produk tas dibulan berikutnya .
5.2 Saran
Saran untuk pengembangan lebih lanjut, yaitu sebagai berikut :
1. Penambahan fitur untuk penyaringan data transaksi penjualan yang akan dianalisis berdasarkan warna serta ukuran yang dibeli.
2. Pengembangan dalam menentukan frequent pattern dapat dikembangkan lagi menggunakan algoritma yang serupa dan dapat dikembangkan kembali agar hasil yang didapatkan lebih baik lagi.
(3)
RIWAYAT HIDUP PENULIS
Nama : Nur Azizah
NIM : 10111609
Tempat/Tanggal Lahir : Subang, 18 Mei 1993 Jenis Kelamin : Perempuan
Agama : Islam
Alamat :Dusun II Cipeundeuy RT/RW 16/05 Desa Cipeundeuy Kec.Cipeundeuy
Kota : Subang Kode POS:41272
Telepon : 089616666693
Email : azizah9392@yahoo.com
PENDIDIKAN
1. 1999 – 2005 : SDN Cipeundeuy 2. 2005 – 2008 : SMPN 1 Kalijati 3. 2008 – 2011 : SMAN 2 Subang
4. 2011 – 2016 : Program Studi S1 Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer
Universitas Komputer Indonesia, Bandung
Dengan ini Penulis menyatakan bahwa semua informasi yang diberikan dalam dokumen ini adalah benar
Bandung, 27-Februari-2016 Penulis
(4)
(5)
(6)