Penerapan Data Mining Pada Penjualan Produk Benang Di PT. Bandung Perkasa Jaya Menggunakan Metode Associantion Rule
1
BAB 1
PENDAHULUAN
I.1. Latar Belakang Masalah
PT. Bandung Perkasa Jaya merupakan sebuah perusahaan yang bergerak di bidang industri tekstil khususnya memproduksi benang. PT. Bandung Perkasa Jaya telah banyak melayani transaksi pesanan produksi yang melibatkan 15 jenis benang yang berbeda. Saat ini pemanfaatan data yang berada di PT. Bandung Perkasa Jaya belum maksimal, hanya sebatas arsip, laporan bagi perusahaan dan tidak dimanfaatkan untuk menjadi acuan jenis benang yang akan diproduksi. PT. Bandung Perkasa Jaya memproduksi benang berdasarkan dua hal, yaitu permintaan agen tetap dan history penjualan banyaknya jenis barang yang sering dijual secara langsung. Penentuan produksi benang berdasarkan laporan transaksi penjualan jenis produk benang yang sering dijual mengakibatkan penumpukan hasil produksi, yang merupakan akibat dari adanya kesalahan informasi jenis produk benang yang seharusnya diproduksi.
Data mining diartikan sebagai menambang data atau upaya menggali
informasi yang berharga dan berguna pada database yang sangat besar ( Agrawal, R., Srikant, 1996 ). Hal terpenting dalam data mining adalah aturan untuk menemukan pola frekuensi tinggi antar himpunan itemset yang disebut fungsi
Association Rules. Data mining Association Rules ini dapat membantu dalam
proses penjualan dengan memberikan hubungan antar data penjualan sehingga akan didapat pola pembelian pelanggan dalam suatu transaksi.
Dalam penelitian ini penulis akan mencoba menerapkan data mining terhadap data transaksi penjualan produk benang di PT. Bandung Perkasa Jaya dengan menggunakan metode Association Rules untuk melihat hubungan asoaiasi antara sejumalh atribut penjualan. Diharapkan dengan penelitian ini dapat mengetahui pola pembelian dari pelanggan dan mengetahui jenis benang apa saja yang harus pihak perusahaan sediakan sehingga semua informasi yang di dapat ini dapat digunakan perusahaan sebagai acuan memproduksi jenis benang apa saja yang akan diproduksi.
(2)
I.2. Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan diatas, diperoleh titik permasalahan dalam penelitian ini adalah :
“Bagaimana cara menerapkan data mining pada penjualan produk benang di PT. Bandung Perkasa Jaya menggunakan metode association”.
I.3. Maksud dan Tujuan
Maksud penelitian ini adalah untuk menerapkan data mining pada penjualan produk benang di PT. Bandung Perkasa Jaya menggunakan metode association. Sedangkan tujuan dalam penelitian ini adalah:
a. Membantu pihak perusahaan agar mengetahui bagaimana pola pembelian dari pelanggan.
b. Membantu pihak perusahaan agar mengetahui jenis produk benang apa saja yang sering dipesan secara bersamaan oleh pelanggan.
I.4. Batasan Masalah
Dalam penelitian ini, penulis membatasi masalah sebagai berikut:
1. Data yang akan dianalisis merupakan data transaksi penjualan produk benang periode Januari 2014 sampai dengan Desember 2014.
2. Penentuan produk yang paling banyak dipesan berdasarkan jenis benang. 3. Algoritma yang digunakan dalam metode association yang dilakukan adalah
Algoritma FP-Growth
4. Hasil dari analisis adalah diketahuinya jenis benang apa saja yang menjadi acuan produksi di PT. Bandung Perkasa Jaya.
5. Metode yang digunakan adalah metode terstruktur dimana tools yang digunakan adalah Data Flows Diagram (DFD) dan Entity Relationship
Diagram (ERD).
6. Perangkat lunak database yang digunakan adalah MySql 7. Aplikasi dibangun menggunakan bahasa pemrograman C#.
(3)
3
I.5. Metodologi Penelitian
Metodologi Penelitian yang digunakan dalam penulisan tugas akhir ini adalah menggunakan metode penelitian deskriptif, yaitu menggambarkan secara sistematis fakta dan karakteristik objek dan subjek yang diteliti secara tepat.
Pengumpulan data dan pembangunan perangkat lunak dalam penelitian ini menggunakan metode sebagai berikut:
I.6. Metode Pengumpulan Data
Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagi berikut :
a. Studi Literatur
Pengumpulan data dengan cara mengumpulkan literatur, jurnal, paper, dan bacaan-bacaan yang ada kaitannya dengan judul penelitian.
b. Observasi
Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan langsung terhadap permasalahan yang ada kaitannya dengan judl penelitian.
I.7. Metode Pembangunan Perangkat Lunak
Teknik analisis data dalam pembuatan perangkat lunak menggunakan metode CRISP-DM. Proses data mining berdasarkan CRISP-DM terdiri dari 6 fase.Yaitu:
a. Bussiness Understanding atau pemahaman domain (penelitian). Pad afase
ini dibutuhkan pemahaman tentang substansi dari kegiatan data mining
yang akan dilakukan.
b. Data Understanding atau pemahaman data adalah fase mengumpulkan
data awal, mempelajari data untuk bisa mengenal data yang akan dipakai. Fase ini mencoba mengidentifikasi masalah yang berkaitan dengan kualitas data,mendeteksi subset yang menarik dari data untuk membuat hipotesis.
c. Data Preparation atau persiapan data. Aktivitas yang dilakukan antara lain
memilih table dan field yang akan ditransformasikan ke dalam database baru untuk bahan data mining (sel data mentah).
(4)
d. Modeling adalah fase menentukan teknik data mining yang digunakan, menentukan tools data mining, teknik data mining, algoritma data
mining, menentukan parameter dengan nilai yang optimal.
e. Evaluation adalah fase interpretasi terhadap hasil data mining yang
ditujukan dalam proses pemodelan pada fase sebelumnya. Evaluasi dilakukan secara mendalam dengan tujuan menyesuaikan model yang didapat agar sesuai dengan sasaran yang ingin dicapai dalam fase pertama.
f. Deployment atau penyebaran adalah fase penyusunan laporan atau
presentasi dari pengetahuan yang didapat dari evaluasi pada proses data
mining.
Gambar I.1.Skema CRISP-DM I.8. Sistematika Penulisan
Sistematika penulisan proposal penelitian ini disusun untuk memberikan gambaran umum tentang kasus yang akan dipecahkan. Sistematika penulisan tugas akhir ini adalah sebagai berikut :
BAB I. PENDAHULUAN
Menguraikan tentang latar belakang permasalahan, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian serta sistematika penulisan
(5)
5
BAB II. TINJAUAN PUSTAKA
Bab ini membahas tentang profil perusahaan, proses produksi, hasil produksi serta berbagai konsep dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan hal-hal yang berguna dalam proses analisis permasalahan.
BAB III. ANALISIS DAN PERANCANGAN SISTEM
Menganalisis masalah dari data hasil penelitian, kemudian dilakukan pula proses perancangan sistem yang akan dibangun sesuai dengan analisa yang telah dilakukan.
BAB IV. IMPLEMENTASI DAN PENGUJIAN SISTEM
Berisi tentang implementasi dari tahapan penting yang telah dilakukan sebelumnya kemudian dilakukan pengujian terhadap sistem sesuai dengan tahapan yang telah dijalani untuk memperlihatkan sejauh mana sistem yang dibangun layak digunakan.
BAB V. KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran yang sudah diperoleh dari hasil penulisan tugas akhir.
(6)
(7)
7
BAB II
TINJAUAN PUSTAKA
II.1. Tentang PT. Bandung Perkasa Jaya
PT. Bandung Perkasa Jaya merupakan perusahaan yang bergerak dibidang produski benang/spinning dan merupakan perusahaan kecil yang akan berkembang. PT. Bandung Perkasa Jaya berdiri sejak tahun 2003 dengan tanah seluas 4,5 hektare. Pemasaranya hanya utnuk pasar lokal saja. Dan sampe saat ini, PT. Bandung Perkasa Jaya mempunyai sekitar 300 karyawan tetap. Mempunyai berbagai jenis mesin untuk produksi benang diantaranya, mesin blowing 2 buah,
carding, drawing, spinning dan winding.
Nama Perusahaan : PT. Bandung Perkasa Jaya
Lokasi : Jalan Solokan Jeruk, Majalaya, Jawa Barat Bidang : Produksi Benang/Spinning
II.2. Struktur Organisasi Perusahaan
Berikut ini adalah struktur organisasi PT. Bandung Perkasa Jaya yang dapat dilihat pada Gambar II.1 :
(8)
Uraian tugas dan wewenang masing-masing bagian pada struktur organisasi PT. Bandung Perkasa Jaya adalah sebagai berikut :
1. Pengelola
Mengawasi kegiatan produksi, penjualan, keuangan, pembelian, administrasi dan kegiatan lain dalam rangka pencapaian tujuan perusahaan 2. Kepala Bagian Mesin
Mengawasi Seluruh kegiatan produksi yang berhubungan dengan mesin atau alat produksi lainnya.
3. Kepala Bagian Produksi
Megawasi kegiatan produksi dari awal bahan mentah hingga akhir proses menjadi barang siap jual.
4. Kepala Bagian Gudang
Mengawasi kegiatan keluar masuk barang yang akan dijual atau dipesan II.3. Landasan Teori
Landasan teori yang berkaitan dengan materi atau teori yang digunakan sebagai acuan dalam melakukan penelitian. Landasan teori yang diuraikan merupakan hasil dari literatur dan buku-buku.
II.4. Pengertian data mining
Data mining adalah suatu istilah yang digunakan untuk mneguraikan
penemuan pengetahuan di dalam basis data. Didalamnya juga terdapar proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat
dan pengetahuan yang terkait dari berbagai basis data.
Menurut Fajar Astuti Hermawati, “Data mining adalah proses yang memperkerjakan satu atau lebih teknik pembelajaran komputer untuk menganalisis dan mengekstrasi pengetahuan secara otomatis.”
Menurut Han Jiawei, “Data mining adalah sebuag proses berulang bertujuan untuk menganalisa database yang besar dengan tujuan penggalian informasi dan
(9)
9
pengetahuan yang berkaitan dengan pengambilan keputusan dan pemecahan masalah.”
Dari definisi-definisi yang telah disampaikan, hal-hal penting yang terkait dengan data mining adalah :
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.
II.4.1. Tahapan data mining
Proses data mining secara garis besar dapat dijelaskan sebagai berikut :
1. Data Selection
Seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari baris data operasional.
2. Pre-Processing/cleaning
Sebelum proses data mining dapat dilakukan, perlu dilakukan dahulu proses
cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup
antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memeperbaiki kesalahan pada data. Juga dilakukan proses enrichment, yaitu proses “meperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD. Pre-processing data adalah hal yang harus dilakukan dalam proses data mining karena tidak semua data atau atribut data dalam data digunakan dalam proses data mining. Proses ini dilakukan agar data yang akan digunakan sesuai dengan kebutuhan. Adapun langkah-langkah pre-processing adalah sebagai berikut :
a. Pemilihan atribut (atribut selection)
Pemilihan atribut adalah proses pemilihan mana saha atribut data yang akan digunakan sehingga data tersebut dapat kita olah sesuai dengan kebutuhan proses data mining
(10)
b. Pembersihan data (data cleaning)
Proses menghilangkan noise dan menghilangkan data yang tidak relevan.
3. Transformation
Coding adalah proses transformasi pada ata yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pad ajenis atau pola informasi yang akan dicari dalam basis data.
4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data
terpilij dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algortima yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
5. Interpretation/evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang disebut bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
II.4.2. Arsitektur data mining
Secara garis besar, sistem data mining terdiri dari komponen-komponen berikut:
a. Database, data warehouse, atau media penyimpanan informasi
Media penyimpanan dalam hal ini bisa berupa database, data warehouse
spreadsheets, atau jenis-jenis penampung informasi lainnya.
b. Database atau data warehouse server
Database atau data warehouse server berfungsi untuk menyediakan data yang
relevan berdasarkan permintaan dari user data mining.
c. Knowledge base
Merupakan dasar pengetahuan yang digunakan sebagai panduan dalam pencarian pola.
(11)
11
d. Data mining engine
Merupakan bagian dari software yang menjalankan program berdasarkan algortima yang ada.
e. Pattern evaluation module
Merupakan bagian dari software yang berguna untuk menemukan pattern atau pola-pola yang terdapat di dalam database yang diolah sehingga nantinya proses data mining dapat menemukan knowledge yang sesuai.
f. Graphical user interface
Merupakan sarana antara pengguna dan sistem data mining untuk berkomunikasi, dimana pengguna dapat berinteraksi dengan sistem melalui data mining query, untuk menyediakan informasi yang dapat membantu dalam pencarian knowledge.
II.5. Association Rule
Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan asosiasi antara kombinasi item. Aturan asosiasi akan menggunakan data latihan, sesuai dengan perngertian data mining untuk menemukan knowledge. Knowledge untuk mengetahui item-item belanja yang sering dibeli secara bersamaan dalam suatu waktu.
Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Support (nilai penunjang) adalah suatu ukuran yang memnunjukkan seberapa besar tingkat dominasi suatu item/itemset
layak untuk dicari confidence-nya, sedangkan confidence (nilai kepastian) adalah suatu ukuran yang menunjukkan hubungan antara 2 item secara conditional.
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap [4] : 1. Analisis pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut.
(12)
Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut.
... Persamaan (II.2)
... Persamaan (II.3)
2. Pembentukan Aturan asosiasi
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang cukup kuat tingkat ketergantungan antar item dalam antecedent (pendahulu)
dan consequent (pengikut) serta memenuhi syarata minimum untuk confidence
dengan menghitung confidence aturan Asosiatif A B
Misalkan D adalah himpunan transaksi, dimana setiap transaksi T dalam D merepresentasikan himpunan item yang berada alam I. I adalah himpunan item yang dijual. Misalkan kita memilih himpunan item A dan himpunan item lain B, kemudian aturna asosiasi akan berbentuk :
Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B merupakan mutually exclusive dimana aturan :
Tidak berarti
Sebuah itemset adalah himpunan item-item yang ada dalam I, dan k-temset adalah itemset yang berisi k item. Frekuensi itemset merupakan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang telah ditentukan (ɸ). Misalkan (ɸ) = 2, maka semua itemset yang frekuensi kemunculannya lebih dari atau sama dengan 2 kali disebut frequent. Himpunan dari frequent k-itemset dilambangkan dengan Fk.
(13)
13
Nilai confidence dari aturan A B diperoleh dari rumus berikut.
...Persamaan (II.4)
II.6. Algoritma FP-Growth
Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga kekuragan dari algortima Apriori diperbaiki oleh algoritma
FP-Growth[4].
Frequent Pattern Growth (FP-Growth) adalah salsah satu alternatif
algoritma yang digunakan untuk menentuka himpunan data yang paling sering muncul dalam sebuah kumplan data[8].
Pada algortima Apriori diperlukan generatecandidate untuk mendapatkan
frequent itemset. Akan tetapi, pada algortima FP-Growthgenerate candidate tidak
dilakukan karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian frequent itemset. Hal ini yang menyebabkan algortima FP-Growth lebih cepat dari algortima Apriori.
Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algortima FP-Growth dapat langsung mengekstrak frequent itemset dari FP-Tree.
Penggalian itemset yang frequent dengan menggunakan algortima
FP-Growth akan dilakukan dengan cara membangkitkan struktur data FP-Tree.
Metode FP-Growth dapat dibagi menjadi 3 tahapan utama yaitu[6]: 1. Tahap pembangkitan conditional pattern base.
2. Tahap pembangkitan conditional FP-Tree
3. Tahap pencarian frequent itemset
Tahap-tahap tersebut merupakan tahap yang akan dilakukan untuk mendapat frequent itemset yang dapat dilihat pada algortima berikut :
Input : FP-Tree Tree
Output : Rt Sekumpulan lengkap pola frequent Method : FP-Ggrowth ( Tree, null )
(14)
{
01 : if Tree mengandung single path P;
02 : then untuk tiap kombinasi ( dinotasikan _ ) dari node node dalam path do 03 : bangkitkan pola _ _ dengan support daro node-node dalam _;
04 : else untuk tiap a1 dalam header dari Tree
do {
05 : bangkitkan pola
06 : bangun _ = a1 _ dengan support = a1.
Support
07 : if Tree _ = _
08 then panggil FP-Growth (Tree, _ ) }
II.7. FP-Tree
FP-Tree merupakan struktur penyimpanan data yang dimampatkan dengan
memetakan setiap data transaksi ke dalam setiap lintssan tertentu dalam fp-tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data fp-tree semakin efektif. Kelebihan dari
fp-tree yaitu hanya memerlukan dua kali pemindaian data transaksi. Berikut
merupakan definisi lain dari fp-tree :
1. Fp-tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan
pohon yang beranggotakan item-item tertentu, dan sebuah label frequent header.
2. Setiap simpul dalam fp-tree mengandung tiga informasi penting, yaitu
label item, menginformasikan jenis item yang dipresentasikan simpul
tersebut, support count mempresentasikan jumlah lintasan transaksi yang melalui simpul tersebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antar lintasan, ditandai dengan garis putus-putus.
(15)
15
II.8. Basis Data (Database)
Basis Data terdiri dari atas dua kata, yaitu Basis dan Data. Basis kurang lebih dapat diartikan sebagai markas atau gudang, tempat bersarang atau berkumpul. Sedangkan Data adalah representasi fakta dunia nyata yang mewakili objek seperti manusia, barang, hewan, peristiwa, konsep, keadaan, dan sebagainya yang direkam dalam bentuk angka, huruf, simbol, teks, gambar, bunyi, atau kombinasinya.
Database adalah kumplan data yang saling berkaitan, berhubungan yang disimpan secara bersama-sama sedemikian rupa tanpa pengulangan yang tidak perlu, untuk memenuhi berbagai kebutuhan. Data-data ini harus mengandung semua informasi untuk mendukung semua kebutuhan sistem. Proses dasar yang dimiliki oleh database ada empat, yaitu:
1. Pembuatan data-data baru (create database) 2. Penambahan data (insert)
3. Mengubah data (update) 4. Menghapus data (delete).
Database merupakan salah satu komponen yang penting dalam sistem informasi, karena merupakan basis dalam menyediakan informasi pada para pengguna. Basis data (database) menjadi penting karena munculnya beberapa masalah bila tidak menggunakan data yang terpusat, seperti adanya duplikasi data, hubungan antar data tidak jelas, organisasi data dan update menjadi rumit. Jadi tujuan dari pengaturan data dengan menggunakan basis data adalah :
a. Menyediakan penyimpanan data untuk dapat digunakan oleh organisasi saat sekarang dan masa yang akan datang.
b. Cara pemasukan data sehingga memudahkan tugas operator dan menyangkut pula waktu yang diperlukan oleh pemakai untuk mendapatkan data serta hak-hak yang dimiliki terhadap data yang ditangani.
c. Pengendalian data untuk setiap siklus agar data selalu up-to-date dan dapat mencerminakan perubahan spesifik yang terjadi di setiap sistem.
(16)
d. Pengamanan data terhadap kemungkinan penambahan, modifikasi, pencurian dan gangguan-gangguan lain.
Dalam basis data sistem informasi digambarkan dalam model entity relationship (E-R). Bahasa yang digunakan dalam basis data (database) yaitu :
a. DDL (Data Definition Language)
Merupakan bahasa definisi data yang digunakan untuk membuat dan mengelola objek database seperti database, tabel dan view.
b. DML (Data Manipulation Language)
Merupakan bahasa manipulasi data yang digunakan untuk memanipulasi data pada objek database seperti tabel.
c. DCL (Data Control Language)
Merupakan bahasa yang digunakan untuk mengendalikan pengaksesan data.Penyusunan basis data meliputi proses memasukkan data kedalam media penyimpanan data, dan diatur dengan menggunakan perangkat Sistem Manajemen Basis Data (Database Management System / DBMS). II.9. Database Management System (DBMS)
Managemen Sistem Basis Data (Database Management System /DBMS) adalah perangkat lunak yang di desain untuk membantu dalam hal pemeliharaan dan utilitas kumpulan data dalam jumlah besar.
Sistem Manajemen Basis data (Database Management System) merupakan sistem pengoperasian dan sejumlah data pada komputer. Dengan sistem ini dapat merubah data, memperbaiki data yang salah dan menghapus data yang tidak dapat dipakai. Sistem manajemen database merupakan suatu perluasan software sebelumnya mengenai software pada generasi komputer yang pertama. Dalam hal ini data dan informasi merupakan kesatuan yang saling berhubungan dan berkerja sama yang terdiri dari: peralatan, tenaga pelaksana dan prosedur data. Sehingga pengolahan data ini membentuk sistem pengolahan data. Peralatan dalam hal ini berupa perangakat keras (hardware) yang digunakan, dan prosedur data yaitu berupa perangakat lunak (software) yang digunakan dan dipakai untuk mengalokasikan dalam pembuatan sistem informasi pengolahan database.
(17)
17
Manipulasi basis data meliputi pembuatan pernyataan (query) untuk mendapatkan informasi tertentu, melakukan pembaharuan atau penggantian
(update) data, serta pembuatan report dari data. Tujuan utama DBMS adalah
untuk menyediakan tinjauan abstrak dari data bagi user. Jadi sistem menyembunyikan informasi mengenai bagaimana data disimpan dan dirawat, tetapi data tetap dapat diambil dengan efisien.
Pertimbangan efisiensi yang digunakan adalah bagaimana merancang struktur data yang kompleks, tetapi tetap dapat digunakan oleh pengguna yang masih awam, tanpa mengetahui kompleksitas stuktur data. Sistem manajemen database atau database management system (DBMS) adalah merupakan suatu sistem software yang memungkinkan seorang user dapat mendefinisikan, membuat, dan memelihara serta menyediakan akses terkontrol terhadap data. Database sendiri adalah sekumpulan data yang berhubungan dengan secara logika dan memiliki beberapa arti yang saling berpautan. DBMS yang utuh biasanya terdiri dari :
1. Hardware merupakan sistem komputer aktual yang digunakan untuk
menyimpan dan mengakses database. Dalam sebuah organisasi berskala besar, hardware terdiri : jaringan dengan sebuah server pusat dan beberapa program client yang berjalan di komputer desktop.
2. Software beserta utility Software adalah DBMS yang aktual. DBMS
memungkinkan para user untuk berkomunikasi dengan database. Dengan kata lain DBMS merupakan mediator antara database dengan user. Sebuah database harus memuat seluruh data yang diperlukan oleh sebuah organisasi.
3. Bagian integral dari setiap sistem adalah sekumpulan prosedur yang mengontrol jalannya sistem, yaitu praktik-praktik nyata yang harus diikuti user untuk mendapatkan, memasukkan, menjaga, dan mengambil data. 4. Data adalah jantung dari DBMS. Ada dua jenis data. Pertama, adalah
kumpulan informasi yang diperlukan oleh suatu organisasi. Jenis data kedua adalah metadata, yaitu informasi mengenai database.
(18)
5. Ada sejumlah user yang dapat mengakses atau mengambil data sesuai dengan kebutuhan penggunaan aplikasi-aplikasi dan interface yang disediakan oleh DBMS, antara lain adalah :
a. Database administrator adalah orang atau group yang
bertanggungjawab mengimplementasikan sistem database di dalam suatu organisasi.
b. Enduser adalah orang yang berada di depan workstation dan berinteraksi secara langsung dengan sistem.
c. Programmer aplikasi, orang yang berinteraksi dengan database melalui cara yang berbeda.
II.10. Entity Relationship Diagram (ERD)
ERD adalah suatu model jaringan yang menggunakan susunan data yang disimpan dalam sistem secara abstrak[6]. Basis data Relasional adalah kumpulan dari relasi-relasi yang mengandung seluruh informasi berkenaan suatu entitas/ objek yang akan disimpan di dalam database. Tiap relasi disimpan sebagai sebuah file tersendiri. Perancangan basis data merupakan suatu kegiaatan yang setidaknya bertujuan sebagai berikut:
a. Menghilangkan redundansi data.
b. Meminimumkan jumlah relasi di dalam basis data.
c. Membuat relasi berada dalam bentuk normal, sehingga dapat meminimumkan permasalahan berkenaan dengan penambahan, pembaharuan dan penghapusan.
ERD adalah suatu pemodelan dari basis data relasional yang didasarkan atas persepsi di dalam dunia nyata, dunia ini senantiasa terdiri dari sekumpulan objek yang saling berhubungan antara satu dengan yang lainnya. Suatu objek disebut entity dan hubungan yang dimilikinya disebut relationship. Suatu entity bersifat unik dan memiliki atribut sebagai pembeda dengan entity lainnya.
Contoh : entity Mahasiswa, mempunyai atribut nama, umur, alamat, dan nim.
(19)
19
Diagram E-R terdiri dari:
a.Kotak persegi panjang, menggambarkan himpunan entitas. b.Elips, menggambarkan atribut-atribut entitas.
c.Diamon, menggambarkan hubungan antara himpunan entitas d.Garis, yang menghubungkan antar objek dalam diagram E-R
E-R Diagram merupakan suatu bahasa pemodelan dimana posisinya dapat dianalogikan dengan story board dalam industri film, blue print arsitektur suatu bangunan, miniatur, dan lain-lain. Dalam praktiknya, membangun suatu sistem terlebih dahulu dilakukannya suatu perencanaan. Pemodelan merupakan suatu sub bagian dari perencanaan secara keseluruhan sebagai salah satu upaya feedback evaluasi perampungan suatu perencanaan. E-R Diagram sebagai suatu pemodelan setidaknya memiliki beberapa karakteristik dan manfaat sebagai berikut:
a. Memudahkan untuk dilakukannya analisis dan perubahan sistem sejak dini, bersifat murah dan cepat
b. Memberikan gambaran umum akan sistem yang akan di buat sehingga memudahkan developer.
c. Menghasilkan dokumentasi yang baik untuk client sebagai bahan diskusi dengan bentuk E-R Diagram itu sendiri, dan
d. Kamus data bagi bagi para pengembang database.
Struktur dari E-R Diagram secara umum ialah terdiri dari:
a. Entitas merupakan objek utama yang informasi akan disimpan, iasanya berupa kata benda, ex; Mahasiswa, Dosen, Nasabah, Mata Kuliah, Ruangan, dan lain-lain. Objek dapat berupa benda nyata maupun abstrak. b. Atribut merupakan deskripsi dari objek yang bersangkutan.
c. Relationship merupakan suatu hubungan yang terjalin antara dua entitas yang ada.
Kardinalitas Relasi ERD yang mempersentasikan suatu basis data relasional senantiasa memiliki relasi-relasi dari sejumlah entitas yang dapat ditentukan banyaknya. Banyaknya suatu relasi yang dimiliki oleh suatu relasi entitas disebut derajat relasi. Derajat relasi maksimum disebut dengan
(20)
kardinalitas, sedangkan derajat minimum disebut dengan modalitas. Kardinalitas yang terjadi diantara dua himpunan entitas (misal A dan B) dapat berupa :
a. One to One, satu record dipetakan dengan satu record di entitas lain.
Contoh: satu nasabah punya satu account.
b. One to Many, Satu record dapat dipetakan menjadi beberapa record
di entitas lain. Contoh: satu nasabah dapat punya lebih dari satu account.
c. Many to Many, Beberapa record dapat dipetakan menjadi beberapa
record di entitas lain. Contoh: satu nasabah dapat memiliki lebih dari satu account. Satu account dapat dimiliki lebih dari satu nasabah (join account).
II.11. Data Flow Diagram (DFD)
DFD adalah suatu model logika data atau proses yang dibuat untuk menggambarkan dari mana asal data dan kemana tujuan data yang keluar dari sistem, dimana data disimpan, proses apa yang menghasilkan data tersebut dan interaksi antara data yang tersimpan dan proses yang dikenakan pada data tersebut.
DFD sering digunakan untuk menggambarkan suatu sistem yang telah ada atau sistem baru yang akan dikembangkan secara logika tanpa mempertimbangkan lingkungan fisik dimana data tersebut mengalir atau dimana data tersebut akan disimpan.
DFD merupakan alat yang digunakan pada metodologi pengembangan sistem yang terstruktur. Kelebihan utama pendekatan aliran data, yaitu :
a. Kebebasan dari menjalankan implementasi teknis sistem.
b. Pemahaman lebih jauh mengenai keterkaitan satu sama lain dalam sistem dan subsistem.
c. Mengkomunikasikan pengetahuan sistem yang ada dengan pengguna melalui diagram aliran data.
d. Menganalisis sistem yang diajukan untuk menentukan apakah data-data dan proses yang diperlukan sudah ditetapkan.
(21)
21
a. Dapat digunakan sebagai latihan yang bermanfaat bagi penganalisis, sehingga bisa memahami dengan lebih baik keterkaitan satu sama lain dalam sistem dan subsistem.
b. Membedakan sistem dari lingkungannya dengan menempatkan batas-batasnya.
c. Dapat digunakan sebagai suatu perangkat untuk berinteraksi dengan pengguna.
d. Memungkinkan penganalisis menggambarkan setiap komponen yang digunakan dalam diagram.
DFD terdiri dari context diagram dan diagram rinci (DFD Levelled). Context diagram berfungsi memetakan model lingkungan (menggambarkan hubungan antara entitas luar, masukan dan keluaran sistem), yang direpresentasikan dengan lingkaran tunggal yang mewakili keseluruhan sistem. DFD levelled menggambarkan sistem sebagai jaringan kerja antara fungsi yang berhubungan satu sama lain dengan aliran dan penyimpanan data, model ini hanya memodelkan sistem dari sudut pandang fungsi.
Dalam DFD levelled akan terjadi penurunan level dimana dalam penurunan level yang lebih rendah harus mampu merepresentasikan proses tersebut ke dalam spesifikasi proses yang jelas. Jadi dalam DFD levelled bisa dimulai dari DFD level 0 kemudian turun ke DFD level 1 dan seterusnya. Setiap penurunan hanya dilakukan bila perlu. Aliran data yang masuk dan keluar pada suatu proses di level x harus berhubungan dengan aliran data yang masuk dan keluar pada level x+1 yang mendefinisikan proses pada level x tersebut. Proses yang tidak dapat diturunkan/dirinci lagi dikatakan primitif secara fungsional dan disebut sebagai proses primitif.
II.12. Kamus Data (Data Dictionary)
Merupakan katalog (tempat penyimpanan) dari elemen-elemen yang berada dalam satu sistem. Kamus data mempunyai fungsi yang sama dalam pemodelan sistem dan juga berfungsi membantu pelaku sistem untuk mengerti aplikasi secara detail, dan me-reorganisasi semua elemen data yang digunakan
(22)
dalam sistem sehingga pemakai dan penganalisa sistem punya dasar pengertian yang sama tentang masukan, keluaran, penyimpanan dan proses.
Kamus data mendefinisikan elemen data dengan fungsi sebagai berikut : a. Menjelaskan arti aliran data dan penyimpanan dalam DFD.
b. Mendeskripsikan komposisi paket data yang bergerak melalui aliran misalnya alamat diuraikan menjadi kota, negara dan kode pos.
c. Mendeskripsikan komposisi penyimpanan data.
d. Menspesifikasikan nilai dan satuan yang relevan bagi penyimpanan dan aliran data.
e. Mendeskripsikan hubungan detail antar penyimpanan yang akan menjadi titik perhatian dalam Diagram Keterhubungan Entitas (E-R).
II.13. MySQL
MySQL adalah sebuah program database server yang mampu menerima dan mengirimkan datanya dengan sangat cepat, multi user serta menggunakan perintah standar SQL (structure Query Language). MySQL merupakan sebuah database server yang free, artinya kita bebas menggunakan database ini untuk keperluan pribadi atau usaha tanpa harus membeli atau membayar lesensinya.
MySQL sendiri adalah sebuah database server yang mampu menangani beberapa user didalamnya. Dengan demikian, MySQL juga mampu menangani beberapa instruksi sekaligus dalam setiap waktu akses. Di dalam sistemnya, MySQL merekam semua data user dalam sebuah tabel user yang berada pada database yang bernama mysql. Dalam tabel user tersebut demua akses dan hak akses user mampu ditangani dengan baik.
Adapun beberapa kelebihan MySQL dalam teknik mengakses data maupun mengelola servernya :
1. Local Client
MySQL sebagai sebuah Server database, juga dapat berfungsi sebagai client yang dijalankan pada komputer lokal dimana MySQL itu berjalan. 2. Remote Client
(23)
23
3. Remote Login
Dapat diakses dengan menggunakan program MySQL yang berada pada komputer lain.
4. Web Browser
Dapat diakses menggunakan program yang dibuat dengan sebuah program yang berbasis server site yang berjalan di bawah Web Browser. 5. Scripting Language
Dapat diakses melalui programaplikasi client yang kita ciptakan sendiri dengan menggunakan pemrograman visual maupun non visual yang berjalan di dalam jaringan.
II.14. Microsoft Visual Studio .Net dan C#
Visual studio .Net adalah sekumpulan alat pengembangan software yang diperuntukkan bagi .Net platform[8]. Microsoft Visual Studio merupakan sebuah perangkat lunak lengkap (suite) yang dapat digunakan untuk melakukan pengembangan aplikasi, baik itu aplikasi bisnis, aplikasi personal, ataupun komponen aplikasinya, dalam bentuk aplikasi console, aplikasi Windows, ataupun aplikasi Web. Microsoft Visual Studio dapat digunakan untuk mengembangkan aplikasi dalam native code (dalam bentuk bahasa mesin yang berjalan di atas Windows) ataupun managed code (dalam bentuk Microsoft Intermediate Language di atas .NET Framework).
C# sering dianggap sebagai bahasa penerus C++ atau versi canggih dari C++. C# adalah sebuah bahasa pemrograman yang dikembangkan oleh Microsoft dan menjadi salah satu bahasa pemrograman yang mendukung .Net programming melalui Visual Studio. C# didasarkan pada bahasa pemrograman C++, C# juga memiliki kemiripan dengan beberapa bahasa pemrograman seperti Visual Basic, Java, Delphi dan tentu saja C++.
(24)
(25)
25 BAB III
ANALISIS DAN PERANCANGAN SISTEM
III.1. Analisis Sistem
Analisis sistem adalah pengurain dari suatu sistem informasi yang utuh kedalam bagian-bagian komponennya dengan maksud untuk mengidentifikasi dan mengevaluasi permasalahan, kesempatan, hambatan yang terjadi dan kebutuhan yang diharapkan sehingga dapat diusulkan perbaikan. Tahap analisis sistem merupakan tahapan yang sangat kritis dan penting, karena kesalahan di dalam tahap ini akan menyebabkan juga kesalahan di tahap selanjutnya. Tugas utama analisis sistem dalam tahap ini adalah menemukan kelemahan-kelemahan dari sistem yang berjalan sehingga dapat diusulkan perbaikannya. Dalam analisis sistem ini meliputi beberapa bagian, yaitu :
a. Analisis Masalah
b. Analisis Penerapan Data Mining
c. Analisis Spesifikasi Kebutuhan Perangkat Lunak d. Analisis Kebutuhan Non-Fungsional
e. Analisis Kebutuhan Fungsional
III.1.1.Analisis Masalah
Adapun analisis masalah di PT. Bandung Perkasa Jaya adalah sebagai berikut :
a. Banyaknya jenis hasil benang yang diproduksi oleh PT. Bandung Perkasa Jaya membuat pihak bagian produksi sulit untuk menemukan jenis benang apa saja yang harus disediakan.
b. Penentuan jenis benang yang akan diproduksi berdasarkan history penjualan benang yang sering dijual sering terjadi kesalahan sehingga mengurangi pendapatan.
Untuk meminimalisir atau bahkan mengatasi permasalahan di atas, pihak terkait di perusahaan harus dapat mengambil keputusan untuk menentukan
(26)
jenis benang yang akan diproduksi. Untuk melakukan hal tersebut, perusahaan memerlukan informasi yang cukup untuk dapat dianalisis lebih lanjut.
III.1.2.Analisis Penerapan Data Mining
Adapun tahapan-tahapan dalam penerapan data mining yang digunakan dalam penelitian ini adalah sebagai berikut :
III.1.2.1. Pemahaman Bisnis
Tahapan ini merupakan tahapan awal pada metode Data Mining. Tahap ini bertujuan untuk memahami tujuan dan kebutuhan dari sudut pandang bisnis PT. Bandung Perkasa Jaya. Dalam tahapan ini ada beberapa tahapan lainnya, yaitu:
Tujuan Bisnis
Memasarkan berbagai produk jenis benang yang dijual kepada konsumen merupakan proses bisnis dari PT. Bandung Perkasa Jaya. Tujuannya adalah untuk memenuhi permintaan konsumen sehingga dapat meningkatkan pendapatan.
Penentuan Sasaran Data Mining
Tujuan dari penerapan data mining pada penjualan produk jenis benang ini adalah untuk mengetahui bagaimana pola pembelian dari pelanggan dan jenis produk benang apa saja yang sering dipesan secara bersamaan oleh pelanggan. III.1.2.2. Pemahaman Data
Berdasarkan tujuan bisnis pada PT. Bandung Perkasa Jaya data yang digunakan dalam penelitian ini adalah laporan transaksi penjualan produk jenis benang pada bulan Januari 2014 sampai dengan Desember 2014 yang berasal dari
file microsoft excel (.xlsx). Untuk lebih jelasnya dapat dilihat di Tabel D-1 pada
lampiran D. Atribut yang terdapat pada laporan transaksi penjualan terdiri dari: 1. No. Nota
2. Kode Barang 3. Nama Barang 4. Jumlah 5. Tanggal
(27)
27
Berikut merupakan penjelasan dari masing-masing atribut yang terdapat pada tabel laporan transaksi penjualan yang dapat dilihat pada Tabel III.1.
Tabel III.1. Penjelasan Atribut
No. Atribut Tipe Data Definisi
1 No. Nota Varchar No transaksi pada nota penjualan 2 Kode Barang Varchar Kode dari barang pada transaksi
penjualan
3 Nama Barang Varchar Nama dari barang pada transaksi penjualan
4 Jumlah Int Jumlah produk yang dibeli oleh
konsumen
5 Tanggal Date Tanggal transaksi penjualan
III.1.2.3. Persiapan Data
Tahapan persiapan data harus dilakukan dalam proses data mining karena tidak semua record atau attribute digunakan dalam proses data mining. Proses ini dilakukan agar data yang akan digunakan sesuai dengan kebutuhan. Adapun tahapan-tahapan persiapan data dalam penelitian ini adalah sebagai berikut:
1. Pemilihan Atribut
Berdasarkan informasi yang ingin didapat oleh pengguna mengenai jenis produk apa saja yang dibeli secara bersamaan oleh pelanggan, maka dalam tahap ini atribut yang akan digunakan dari tabel D-1 dalam lampiran D hanyalah NoNota dan KodeBarang. Atribut NoNota merupakan identitas dari transaksi dan atribut KodeBarang merupakan kode dari jenis barang yang dibeli pelanggan. Hasil pemilihan atribut dapat dilihat pada tabel D-2 dalam lampiran D.
(28)
2. Pembersihan Data
Pada tahap ini, hasil pemilihan atribut pada tabel D-2 dalam lampiran D akan dibersihkan dari data transaksi yang hanya memiliki satu produk dalam satu nota. Hasil pembersihan record-record tersebut dapat dilihat pada tabel D-3 dalam lampiran D.
3. Penyiapan Data Awal
Setelah semua proses telah berhasil dilakukan dan data transaksi telah sesuai dengan kebutuhan yang diperlukan dalam proses data mining, maka data transaksi pada tabel D-3 dalam lampiran D disederhanakan agar mempermudah dalam pembacaan. Untuk lebih jelasnya dapat dilihat pada tabel D-4 dalam lampiran D.
III.1.2.4. Pemodelan
Pemodelan ini dilakukan dengan menggunakan metode Association Rule
dengan algoritma FP-Growth terhadap data awal pada tabel D-4 dalam lampiran D untuk mendapatkan rule yang dihasilkan. Adapun tahapan-tahapan dalam metode Association Rule dengan algortima FP-Growth adalah sebagai berikut : Pembangunan FP-Tree
Hasil data awal pada tabel D-4 pada lampiran D akan diolah untuk mendapatkan rule dengan mengasumsikan minimum support 10. Karena dengan menggunakan nilai minimum support ini akan memperoleh hasil yang maksimal sesuai dengan tujuan yang telah ditentukan sebelumnya. Maka bagi item yang memiliki frekuensi ≤ 10 akan dihapus.
a. Penentuan Frequent Itemset
Data awal pada tabel D-4 dalam lampiran D akan dihitung nilai frekuensui kemunculan tiap item dengan hasil sebagai berikut :
(29)
29
Tabel III.2. Frekuensi Kemunculan Item Item Frequent
CA16 6
CA20 19
CA24 17
CA28 3
CA30 19
CA40 30
CO20 26
CO24 24
CO30 24
Setelah mendapatkan frekuensi dari tiap item, selanjutnya membandingkan frekuensi dari tiap item dengan nilai minimum support dan menghilangkan item yang memiliki frekuensi lebih kecil dari minimum support. Pada tabel III.2 ada 2 item yang memiliki frekuensi kurang dari minimum support yaitu CA16, CA28. Maka item dan transaksi yang mengandung item tersebut pun dihilangkan . Dan hasilnya sebagai berikut :
Tabel III.3. Item yang memenuhi minimum support
Item Frequent
CA20 19
CA24 17
CA30 19
CA40 30
CO20 26
CO24 24
(30)
Setelah didapatkan data yang memenuhi minimum support, selanjutnya mencari frequency of occurance. Tabel frequency of occurance ini didapatkan dengan cara mengurutkan item dari tabel III.3 yang memiliki frekuensi terbesar hingga terkecil, lalu ditentukan priority-nya sesuai dengan urutan frekuensi tersebut.
Tabel III.4. Frequency of Occurance Item Frequent Priority
CA40 30 1
CO20 26 2
CO24 24 3
CO30 24 4
CA20 19 5
CA30 19 6
CA24 17 7
Setelah menentukan nilai priority, selanjutnya data yang berada pada tabel III.3 diurutkan sesuai priority dari masing-masing item. Berikut adalah hasil pengurutan data berdasarkan priority :
Tabel III.5. Hasil Pengurutan Data Transaksi
NoNota KodeBarang
1 CA20, CA30
2 CA30, CO24
3 CA24, CA40, CA20
5 CA30, CA40
6 CA30, CA24
7 CO30, CA24
8 CA30, CA40, CA20
11 CA40, CA30
12 CA24, CA20
18 CA30, CA40, CA20
19 CA20, CA30, CA40, CO24
20 CO24, CA30
(31)
31
NoNota KodeBarang
24 CA20, CO24
25 CA24, CA30, CA40
28 CO20, CO30
33 CO20, CA40
34 CO20, CO30, CO24, CA40
35 CA24, CA20
46 CA40, CA20, CO30
47 CA40, CO20, CA24, CA30
49 CA40, CA20, CA30
50 CA40, CO20, CA24
51 CA40, CO24, CA30
52 CO30, CA20
53 CO20, CA24
55 CO20, CO24, CA20
61 CO30, CA20
62 CO24, CA30, CA40, CO20
63 CA24, CO30
64 CO30, CA40, CA20, CO24 65 CO24, CA30,CA40, CO20
67 CO24, CO20
68 CO30, CA40, CO24, CO20
69 CO20, CO24, CO30
71 CO30, CO24
75 CA24, CO20,CO30, CA40
77 CO24, CA20, CO30
78 CA30, CA40
79 CO30, CA24
80 CO30, CO24, CA40, CO20
83 CO20, CO30, CA30
84 CO20, CA40
86 CO20, CO24, CA40, CA24
87 CA40, CO20, CO24
91 CO30, CO20, CA24, CA40, CO24
92 CO30, CA20, CA40
93 CO20, CA30, CA24, CO24
94 CA30, CA20, CA40
95 CO20, CO30
96 CO30, CA40, CO24
97 CO30, CA40, CO20
(32)
NoNota KodeBarang 99 CO24, CA20, CA24, CO20
100 CA20, CA24, CO20
Tabel III.6. Data Transaksi Setelah Diurutkan NoNota KodeBarang (Ordered)
1 CA20, CA30
2 CO24, CA30
3 CA40, CA20, CA24
5 CA40, CA30
6 CA30, CA24
7 CO30, CA24
8 CA40, CA20, CA30
11 CA40, CA30
12 CA20, CA24
18 CA40, CA20, CA30
19 CA40, CO24, CA20, CA30
20 CO24, CA30
23 CA40, CO20, CO24, CO30
24 CO24, CA20
25 CA40, CA30, CA24
28 CO20, CO30
33 CA40, CO20
34 CA40, CO20, CO24, CO30
35 CA20, CA24,
46 CA40, CO30, CA20
47 CA40, CO20, CA30, CA24
49 CA40, CA20, CA30
50 CA40, CO20, CA24
51 CA40, CO24, CA30
52 CO30, CA20
53 CO20, CA24
55 CO20, CO24, CA20
61 CO30, CA20
62 CA40, CO20, CO24, CA30
63 CO30, CA24,
64 CA40, CO24, CO30, CA20, 65 CA40, CO20, CO24, CA30
67 CO20, CO24,
(33)
33
NoNota KodeBarang (Ordered)
69 CO20, CO24, CO30
71 CO24, CO30
75 CA40, CO20, CO30, CA24
77 CO24, CO30, CA20
78 CA40, CA30
79 CO30, CA24
80 CA40, CO20, CO24, CO30
83 CO20, CO30, CA30
84 CA40, CO20
86 CA40, CO20, CO24, CA24
87 CA40, CO20, CO24
91 CA40, CO20, CO24, CO30, CA24
92 CA40, CO30, CA20
93 CO20, CO24, CA30, CA24
94 CA40, CA20, CA30
95 CO20, CO30
96 CA40, CO24, CO30
97 CA40, CO20, CO30
98 CO24, CO30
99 CO20, CO24, CA20, CA24
100 CO20, CA20, CA24
Setelah mendapatkan data yang telah diurutkan, selanjutnya membuat fp-tree dari data yang ada pada tabel III.6. Berikut adalah langkah-langkah dalam pembuatan
fp-tree :
a. Jika root belum mempunyai child, maka data yang keluar akan menjadi child
pertama dari root tersebut dengan nilai support count-nya adalah 1.
b. Jika root sudah mempunyai child, namun child tersebut berbeda dengan data yang keluar, maka root-nya memiliki child baru lagi dengan nilai support
count-nya 1.
c. Jika root sudah mempunyai child dan data yang keluar sama dengan child
tersebut, maka support count-nya bertambah 1.
d. Jika ada child yang sama dengan data yang keluar, namun berbeda path,
(34)
Selanjutnya adalah pembentukan fp-tree dari data pada tabel III.6 dengan menggunakan langkah-langkah di atas.
Untuk tranasaksi dengan NoNota 1 : CA20, CA30. Support count dari node
yang muncul adalah 1 karena data baru pertama kali muncul. root
CA20 :1
CA30 :1
Gambar III.3. Fp-Tree setelah pembacaan NoNota 1
Untuk tranasaksi dengan NoNota 2 : CO24, CA30. Support count dari node
yang muncul adalah 1 karena data baru pertama kali muncul. root
CA20 :1
CA30 :1
CO24 :1
CA30 :1
Gambar III.4. Fp-Tree setelah pembacaan NoNota 2
Untuk transaksi dengan NoNota 3 : CA40, CA20, CA24. Support count dari
(35)
35
root
CA20 :1
CA30 :1
CO24 :1
CA30 :1
CA40 :1
CA20 :1
CA24 :1
Gambar III.5. Fp-Tree setelah pembacaan NoNota 3
Untuk transaksi dengan NoNota 5 : CA40, CA30. Support count dari node
CA40 bertambah 1 sedangkan CA30 menjadi child kedua dari CA40 dengan
support count 1.
root
CA20 :1
CA30 :1
CO24 :1
CA30 :1
CA40 :2
CA20 :1
CA24 :1
CA30 :1
(36)
Untuk transaksi dengan NoNota 6 : CA30, CA24. Support count dari node
yang muncul adalah 1 karena data baru pertama kali muncul.. root CA20 :1 CA30 :1 CO24 :1 CA30 :1 CA40 :2 CA20 :1 CA24 :1 CA30 :1 CA30 :1 CA24 :1
Gambar III.7. Fp-Tree setelah pembacaan NoNota 6
Untuk transaksi dengan NoNota 100 : CO20, CA20, CA24. Karena node ini pernah muncul sebelumnya, maka support count bertambah 1.
root CA20 :3 CA30 :1 CO24 :6 CA30 :2 CA40 :30 CA20 :6 CA24 :2 CA30 :4 CA30 :1 CA24 :1 CO30:5 CA24 :3 CA30 :4
CA24 :2 CO24 :3
CA20 :1 CA30 :1 CO20 :15 CO24 :9 CO30 :5 CA20 :1 CA24 :1 CO20 :11 CO30 :3 CO30:2 CA20 :2 CA30 :2 CA24 :1
CA20 :2 CA24 :1 CO24 :5
CA20 :2 CA30 :2 CO30 :2 CA20 :1 CO30 :1 CO30 :3 CO30 :2 CA24 :1 CA20 :1 CA30 :1 CA24 :1 CA24 :1 CA30 :1 CA24 :1 CA24 :1 CA20 :1 CA24 :1
Gambar III.8. Fp-Tree setelah pembacaan NoNota 100
b. Penerapan Algoritma FP-Growth
Setelah tahap pembentuka FP-Tree dari sekumpulan data transaksi, selanjutnya penerapan algoritma FP-Growth untuk mencari frequent itemset yang signifikan. Algoritma FP-Growth dapat dibagi menjadi tiga langkah utama, yaitu : a. Tahap Pembangkitan Conditional Pattern Base
Conditional Pattern Base merupakan subdatabase yang berisi prefix path dan
suffix pattern. Pembangkitan conditinal pattern base didapatkan melalui
(37)
37
b. Tahap Pembangkitan Conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar atau sama dengan minimum support count ξ akan dibangkitkan dengan
conditional FP-Tree.
c. Tahap Pencarian frequent itemset
Apabila conditional FP-Tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dnegan melakukan kombinasi item untuk setiap
conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan
pembangkitan FP-Growth secara rekursif.
Tahap Pembangkitan Conditional Pattern Base
Berikut adalah langkah-langkah pembentukan conditional pattern base :
Dimulai dari item yang memiliki priority paling rendah dalam tabel III.6.
Telusuri fp-tree yang sebelumnya telah dibentuk mulai dari root sampai pada item yang memiliki priority terendah.
Akumulasikan semua path yang mengandung item tersebut kedalam tabel
conditonal pattern base.
Lakukan hal tersebut hingga semua item yang tersedia di tabel III.5 ditelusuri
path-nya.
Berikut adalah hasil dari conditional pattern base dari setiap item : Tabel III.7. Conditional Pattern Base
Item Cond. Pattern Base
CA24 CA20 : 2
CA24, CA40 : 2
CA30, CA40 : 1
CO30, CO24, CO20, CA40 : 1
CO24, CO20, CA40 : 1
(38)
CO30, CO20, CA40 : 1
CA30 : 1
CO30 : 3
CO20 : 1
CA20, CO24, CO20 : 1
CA30, CO24, CO20 : 1
CA20, CO20 : 1
CA30 CA20 : 1
CO24 : 2
CA20, CA40 : 4
CA40 : 4
CA20, CO24, CA40 : 1
CO24, CO20, CA40 : 2
CO20, CA40 : 2
Null : 1
CO30, CO20 : 1
CO20 : 1
CA20 NULL : 2
CO24 : 1
CO30, CO24 : 1
CA40 : 6
CO24, CA40 : 1
CO30, CA40 : 1
CO30, CA40 : 2
CO30 : 2
CO24, CO20 : 2
CO20 : 1
CO30 CO24 : 2
CO24, CA40 : 2
CO24, CO20, CA40 : 5
CO20, CA40 : 2
CA40 : 2
(39)
39
CO20 : 3
CO24, CA40 : 2
CO24 NULL : 6
CA40 : 3
CO20, CA40 : 9
CO20 : 5
CO20 CA40 : 15
NULL : 11
CA40 NULL : 30
Setelah membuat conditonal pattern base, selanjutnya membuat
conditional fp-tree. Untuk setiap pattern base lakukan hal berikut :
a. Akumulasikan count untuk setiap item dalam tabel III.7
b. Jika jumlah count pada item yang dicari lebih besar atau sama dengan jumlah
count pada item yang berada pada path yang dilewati maka conditonal fp-tree
dapat dibentuk karena termasuk item yang frequent.
c. Selanjutnya jika item tersebut dapat terbentuk conditional fp-tree-nya, maka
conditional fp-tree untuk item tersebut dapat di-mining secara rekursif hingga
tidak terdapat lagi itemset yang bisa dibentuk.
Berikut adalah tahapan pembentukan conditional fp-tree dari tabel III.7 : 1. Tahap pembentukan Conditional Fp-Tree untuk item CA24.
(40)
root
CA20 :2 CA40 :5
CA20 :2 CA24 :2 CA30 :1 CA30 :1 CA24 :1 CO30:3 CA24 :3
CA24 :2 CO20 :2
CO24 :2 CO30 :1 CA24 :1 CO20 :4 CA30 :1 CA24 :1
CA24 :1 CO24 :2
CA20 :1 CO30 :1 CA24 :1 CA24 :1 CA24 :1 CA30 :1 CA24 :1 CA24 :1 CA20 :1 CA24 :1
Gambar III.9. FP-Tree yang mengandung CA24
Karena tidak ada kombinasi item yang berakitan dengan CA24 yang memenuhi
minimum support, maka conditional fp-tree dari CA24 tidak bisa dibentuk.
2. Tahap pembentukan Conditional FP-Tree untuk item CA30
root CA20 :1 CA30 :1 CO24 :2 CA30 :2 CA40 :13
CA20 :4 CA30 :4
CA30 :1 CA30 :4 CO24 :1 CA20 :1 CA30 :1 CO20 :4 CO24 :2 CO20 :2 CO30 :1 CA30 :2 CA30 :2
CA30 :1 CA30 :1
Gambar III.10. FP-Tree yang mengandung CA30
Karena hanya kombinasi CA30, CA40 yang memiliki support count yang memenuhi minimum support, maka hanya CA30, CA40 yang bisa dibentuk.
(41)
41
root
CA40 :13
CA30 :13
Gambar III.11. Conditional FP-Tree CA30, CA40
3. Tahap pembentukan Conditional FP-Tree untuk item CA20
root
CA20 :2 CO24 :2 CA40 :10
CA20 :6
CO30:2
CO24 :2
CA20 :1 CA20 :1
CO20 :3
CO30:2
CA20 :2
CA20 :2 CO24 :2
CA20 :2 CO30 :1
CA20 :1 CO30 :1
CA20 :1
CA20 :1
(42)
Karena tidak ada kombinasi item yang berakitan dengan CA24 yang memenuhi
minimum support, maka conditional fp-tree dari CA24 tidak bisa dibentuk.
4. Tahap pembentukan Conditional FP-Tree untuk item CO30
root
CO24 :3 CA40
:11 CO30:5
CO24 :2 CO20 :7
CO24 :5
CO30 :5
CO20 :5
CO30 :3
CO30:2 CO24 :2
CO30 :2 CO30 :2
CO30 :3
CO30 :2
Gambar III.13. Fp-Tree yang mengandung CO30
Ada 3 pasanga 2-kombinasi yang memenuhi minimum support yaitu (CO30, C024), (CO30, CA40), (CO30, CO20).
root
CO24 :12
CO30 :12
(43)
43
root
CA40 :11
CO30 :11
Gambar III.15. Conditional FP-Tree CO30, CA40
root
CO20 : 12
CO30 :12
Gambar III.16. Conditional FP-Tree CO30, CO20
(44)
root
CO24 :6 CA40 :12
CO24 :3 CO20 :9
CO24 :9
CO20 :5
CO24 :5
Gambar III.17. FP-Tree yang mengandunug CO24
Hanya ada 2 pasanga 2-kombinasi yang mmenuhi minimum support yaitu, (CO24, CO20) dan (CO24, CA40).
root
CA40 :12
CO24 :12
Gambar III.18. Conditional FP-Tree untuk CO24, CA40
root
CO20 : 14
CO24 :14
(45)
45
6. Tahap pembentukan Conditional FP-Tree untuk item CO20 root
CA40 :15
CO20 :15
CO20 :11
Gambar III.20. FP-Tree yang mengandung CO20 Hanya kombinasi CO20, CA40 yang memenuhi minimum support.
root
CA40 :15
CO20 :15
Gambar III.21. Conditonal FP-Tree untuk CO20, CA40
Setelah proses pembentukan conditional fp-tree, selanjutnya dilakukan pencarian frequent itemset. Agar memudahkan dalam pembacaan data, maka hasil dari conditional fp-tree dimasukkan ke dalam bentuk tabel. Berikut adalah hasil dari conditional fp-tree :
Tabel III.8. Hasil Conditional FP-Tree
Item Cond. Pattern Base Cond. FP-Tree
CA24 CA20 : 2
CA24, CA40 : 2
CA30, CA40 : 1
(46)
CO30, CO24, CO20, CA40 : 1
CO24, CO20, CA40 : 1
CA30, CO20, CA40 : 1
CO30, CO20, CA40 : 1
CA30 : 1
CO30 : 3
CO20 : 1
CA20, CO24, CO20 : 1
CA30, CO24, CO20 : 1
CA20, CO20 : 1
CA30 CA20 : 1
CO24 : 2
CA20, CA40 : 4
CA40 : 4
CA20, CO24, CA40 : 1
CO24, CO20, CA40 : 2
CO20, CA40 : 2
Null : 1
CO30, CO20 : 1
CO20 : 1
CA30,CA40 : 13
CA20 NULL : 2
CO24 : 1
CO30, CO24 : 1
CA40 : 6
CO24, CA40 : 1
CO30, CA40 : 1
CO30, CA40 : 2
CO30 : 2
CO24, CO20 : 2
CO20 : 1
empty
CO30 CO24 : 2
CO24, CA40 : 2
CO30, CO24 : 12
(47)
47
CO24, CO20, CA40 : 5
CO20, CA40 : 2
CA40 : 2
NULL : 5
CO20 : 3
CO24, CA40 : 2
CO30, CO20 : 12
CO24 NULL : 6
CA40 : 3
CO20, CA40 : 9
CO20 : 5
CO24, CA40 : 12
CO24, CO20 : 14
CO20 CA40 : 15
NULL : 11
CO20, CA40 : 15
CA40 NULL : 30 empty
Setelah proses pembentukan conditional fp-tree dilakukan, selanjutnya melakukan prmbentukan tabel frequent itemset dari hasil conditional fp-tree yang telah dibentuk sebelumnya. Hasil dari tahap pembentukan conditional fp-tree
dapat dilihat pada tabel III.9.
Tabel III.9. Frequent Itemset
Item Frequent Itemset
CA24 Empty
CA30
CA30
CA30,CA40 : 13
CA20 Empty
CO30
CO30
CO30, CO24 : 12, CO30, CA40 : 11, CO30, CO20 : 12
CO24 CO24 CO24, CA40 : 12, CO24, CO20 : 14
CO20
CO20
CO20, CA40 : 15
CA40 Empty
(48)
Dari hasil frequent itemset selanjutnya dilakukan perhitungan confidence dari setiap itemset dengan persamaan II.4. Hasil dari perhitungan dapat dilihat pada tabel dibawah ini :
Tabel III.10. Perhitungan Confidence
Item Confidence
CO20 CA40 57.6 % CO24 CA40 54.1 % CO24 CO20 58.3 % CO30 CA40 45.8 % CO30 CO20 45.8 % CO30 CO24 45.8 % CA30 CA40 68. 4%
Setelah confidence dari setiap itemset dihitung, selanjutnya dilakukan generate
dengan minimum support = 10 dan minimum confidence = 50%. Adapun hasil
generate rule dapat dilihat pada tabel berikut ini :
Tabel III.11. Generate Rule
Item Confidence
CO20 CA40 57.6 % CO24 CA40 54.1 % CO24 CO20 58.3 % CO30 CA40 45.8 % CO30 CO20 45.8 % CO30 CO24 45.8 % CA30 CA40 68. 4%
Kesimpulan berdasarkan rule yang dihasilkan maka pola pembelian pelanggan adalah sebagai berikut :
(49)
49
Tabel III.12. Hasil perhitungan pengujian metode association rule dengan algoritma fp-growth
Kombinasi Support Confidence
CO20 CA40 15 57.6 % CO24 CA40 13 54.1 % CO24 CO20 14 58.3 % CA30 CA40 13 68.4 %
III.1.2.Analisis Spesifikasi Kebutuhan Perangkat Lunak
Spesifikasi kebutuhan perangkat lunak adalah kebutuhan-kebutuhan apa saja yang diperlukan untuk membangun sebuah perangkat lunak berdasarkan kebutuhan pengguna. Ada dua bagian dalam spesifikasi kebutuhan perangkat lunak yaitu kebutuhan non-fungsional dan kebutuhan fungsional.
III.1.3.Analisis Kebutuhan Non-Fungsional
Analisis kebuthuan non-fungsional dilakukan untuk mengetahui spesifikasi kebutuhan sistem. Spesifikasi kebuthan melibatkan analisis perangkat keras (hardware), analisis perangkat lunak (software), dan analisis pengguna (user).
III.1.4.1. Analisis Kebutuhan Perangkat Keras
Perangkat keras pendukung dalam pembangunan perangkat keras lunak ini adalah sebagai berikut :
1. Analisi spesifikasi kebutuhan perangkat keras pada sistem yang sedang berjalan di PT. Bandung Perkasa Jaya adalah :
a. Processor : Intel Core Duo
b. Harddisk : 160 GB
c. Memory : 2 GB
2. Analisis spesifikasi minimum kebutuhan perangkat keras pada sistem yang akan dibangun membutuhkan :
(50)
a. Processor berkecepatan minimal 2 Ghz
b. Harddisk 1 Gb untuk menyimpan data
c. Memory 512 MB
3. Evaluasi kebutuhan perangkat keras
Dari data spesifikasi perangkat keras yang dimiliki oleh PT. Bandung Perkasa Jaya, sudah cukup untuk menjalankan aplikasi pengolahan data transaksi yang akan dibangun.
III.1.4.2. Analisis Kebutuhan Perangkat Lunak
Kebutuhan perangkat lunak pendukung merupakan hal penting bagi pembangunan perangkat lunak yang sedang dibangun. Perangkat lunak pendukung dalam pembangunan perangkat lunak ini adalah sebagai berikut :
1. Analisis kebutuan perangkat lunak pada sistem yang sedang berjalan di PT. Bandung Perkas Jaya adalah :
a. Sistem operasi Windows 7
b. Microsoft Office
2. Analisis kebutuhan perangkat lunak untuk menjalankan sistem yang akan dibangun adalah :
a. Sistem operasi Windows 7
b. Wamserver sebagai database server
c. Visual Studio 2012
3. Evaluasi kebutuhan perangkat lunak
Berdasarkan analisis spesifikasi perangkat lunak yang ada di PT. Bandung Perkasa Jaya, spesifikasi pernagkat lunak yang akan digunakan kurang memenuhi spesifikasi lunak yang dibutuhkan. Kekurangan tersebut dapat diatasi dengan meng-install WampServer dan Visual Studio pada komputer yang digunakan.
(51)
51
III.1.4.3. Analisis Pengguna
Analisis pengguna dibuat untuk memenuhi siapa saja dan seperti apa karakteristik yang dimiliki oleh orang yang dapat menggunakan aplikasi yang akan dibuat. Untuk lebih detailnya dapat dilihat pada tabel III.13.
Tabel III.13. Karakteristik Pengguna
Pengguna Tanggung
Jawab Hak Akses
Tingkat Pendidikan
Tingkat
Keterampilan Pengalaman
User Mengoperasikan aplikasi sesuai
dengan tugas
yang diberikan
Melakukan kegiatan yang berhubungan dengan isis dari tampilan yang ada pad aaplikasi minimal Sekolah Menengah Atas (SMA) Memahami
konten yang
tersedia pada aplikasi
Minimal mampu
mengoperasikan komputer
Dengan kondisi yang terdapat diatas, dapat diambil kesimpulan bahwa aplikasi yang dibuat dapat dijalankan oleh staf diperusahaan tersebut. Staf dalam hal ini adalah orang yang bekerja di bagian produksi yang akan menggunakan aplikasi yang dibangun.
III.1.4.Analisis Kebutuhan Fugsional
Analisis kebutuhan fungsional yang akan dibuat meliputi diagram konteks, Data Flow Diagram (DFD), spesifikasi proses dan kamus data.
III.1.5.1. Diagram konteks
Berikut adalah diagram konteks dari sistem pendekatan struktur yang menggambarkan sistem secara garis besar yang kemudian akan dipecah menjadi bagian-bagian yang lebih detail. Adapaun diagram konteks dari sistem yang akan dibangun adalah sebagi berikut :
(52)
User Data Mining Association Rule Data Alamat File
Data Transaksi.xlsx Data Akhir Data Nilai Minimum Support Data Nilai Minimum Confidence
Info Data Transaksi Info Pemilihan Atribut Info Pembersihan Data Info Pengurutan Data Info Frekuensi Produk Info Aturan Pola Pembelian Pelanggan
Info Nilai Minimum Support Info Nilai Minimum Confidence
Laporan Transaksi Penjualan*.xlsx Data Laporan transaksi
penjualan
Gambar III.22. Diagaram Konteks
III.1.5.2. Data Flow Diagram
Data Flow Diagram (DFD) merupakan proses yang menggambarkan suatu
alir informasi yang lebih terperinci yang merupakan pengembangan dari diagram konteks. Berikut ini merupakan data flow diagram dari sistem yang akan dibangun :
a. DFD Level 1
Berikut adalah gambar DFD level 1 dapat dilihat pada Gambar III.23 dibawah ini :
1 Persiapan Data
2 Proses Asosiasi
User
Data Alamat File Data Transaksi.xlsx
Data Akhir
Data Transaksi .xlsx Data Transaksi
Info Data Transaksi Penjualan Info Pemilihan Atribut Info Pembersihan data
transaksi Data Transaksi Data Transaksi preprocessing Data Hasil Persiapan Data Data Preprocessing
Info Frekuensi Produk Info Pengurutan Data Info Nilai Support Info Nilai Confidence Info Pola Pembelian Pelanggan
rule
Data Rule Data Rule Data Nilai Minimum Support
Data Nilai Minimum Confidence
pengurutan Hasil
Pengurutan Data Data Pengurutan
Gambar III.23. DFD Level 1 Aplikasi Data mining Association Rule PT.Bandung Perkasa Jaya
(53)
53
b. DFD Level 2 untuk Proses 1
Berikut adalah gambar DFD level 2 Proses 1 dapat dilihat pada Gambar 3.24 dibawah ini :
User
Data Transaksi.xlsx
preprocessing 1.1
Pilih Data
1.2 Pilih Atribut 1.3 Pembersihan Data
Data Transaksi Penjualan Data Alamat File
Data Transaksi.xlsx
Data Hasil Pemilihan Atribut
Data Hasil Pembersihan Data Hasil Pemilihan Data
transaksi
Data Penjualan Info Pemilihan atribut
Info Pembersihan Data
Pemilihan atribut
Pembersihan Data
Info Data Transaksi
Gambar III.24. DFD Level 2 Proses 1
c. DFD Level 2 Proses 2
Berikut adalah gambar DFD level 2 Proses 2 dapat dilihat pada Gambar 3.25 dibawah ini :
User preprocessing 2.3 Algoritma FP-Growth 2.2 Pengurutan Produk
Data Nilai Minimum Support
Data Nilai Minimum Confidence Data pengurutan
rule Data Hasil Pengurutan Data
Data Rule Info Nilai Support
Info Nilai Confidence Info Aturan Pola Pembelian Pelanggan
Info Pengurutan Data
2.1 Frekuensi Produk 2.4 Rule pengurutan Data Preprocessing
Info Frekuensi Produk
Data Rule Frekuensi Produk
Pengurutan Data
Frekuensi Produk
(54)
III.1.5.3. Spesifikasi Proses
Spesifikasi proses berfungsi untuk menjelaskan proses model aliran yang terdapat pada DFD. Adapun spesifikasi proses dari DFD yang telah dibuat akan dijelaskan pada tabel berikut :
Tabel III.14. Spesifikasi Proses
No Proses Keterangan
1 No Proses 1
Nama Proses Persiapan data
Source (sumber) User
Input -Alamat data transaksi penjualan.xlsx -Pemilihan atribut
-Pembersihan data
Output -Info data transaksi penjualan -Info pemilihan atribut -Info pembersihan data
Destination (tujuan) simpan data ke database
Logika Proses 1. Aplikasi menampilkan form pilih data 2. User memilih data yang akan dianalisa 3. User menyimpan data ke database
4. Melakukan pemilihan atribut 5. Melakukan pembersihan data 2 No Proses 1.1
Nama Proses Pilih Data
Source (sumber) User
Input Alamat data transaksi penjualan
Output -Info data transaksi penjualan -Info jumlah data transaksi penjualan
Destination (tujuan) Simpan data ke database
Logika Proses 1. Aplikasi menampilkan form untuk memilih data yang akan digunakan
2. Aplikasi menerima alamat data transaksi dan mengekstraknya ke dalam aplikasi
3. User dapat melihat data
3 No Proses 1.2
Nama Proses Pilih Atribut
Source (sumber) User
Input Data transaksi
Output Info pemilihan atribut
Destination (tujuan) - User
(55)
55
Logika Proses 1. User melakukan pemilihan atribut
2. Aplikasi menampilkan hasil pemilihan atribut 4 No Proses 1.3
Nama Proses Pembersihan data
Source (sumber) User
Input Data hasil Pemilihan atribut
Output Info pembesihan data
Destination (tujuan) - User
- Preprocessing
Logika Proses 1. Aplikasi menerima data hasil pemilihan atribut 2. User melakukan pembersihan data
3. Aplikasi menampilkan hasil pembersihan data 4. hasil pembersihan data di simpan ke tabel
preprocessing
5 No Proses 2
Nama Proses Penentuan rule pola pembelian pelanggan
Source (sumber) User
Input -Frekuensi Produk
-Pengurutan data
-Data nilai minimum support
-Data nilai minimum confidence Output -info frekuensi produk
-info pengurutan data -info nilai support
-info nilai confidence
-info rule pola pembelian pelanggan
Destination (tujuan) User
Logika Proses 1. Aplikasi menampilkan form aturan asosiasi 2. Aplikasi menampilkan frekuensi setiap produk 3. Setelah frekuensi diketahui user melakukan pengurutan data
4. Aplikasi menampilkan hasil pengurutan data 5. User menginputkan nilai minimum support dan nilai
minimum confidence
6. Aplikasi menampilkan Info nilai support, nilai
confidence dan aturan penentuan kombinasi produk 6 No Proses 2.1
Nama Proses Frekuensi produk
Source (sumber) User
Input Data Preprocessing
Output Info frekuensi setiap produk
Destination (tujuan) - User
- Pengurutan data
Logika Proses 1. Aplikasi mengambil data dari tabel preprocessing
(56)
7 No Proses 2.2
Nama Proses Pengurutan Data
Source (sumber) User
Input Data frekuensi produk
Output Menampilkan info pengurutan data
Destination (tujuan) - User
- simpan pengurutan data ke database
Logika Proses 1. Aplikasi mengambil nilai dari hasil frekuensi produk 2. Aplikasi mengeluarkan tabel dari proses hasil frekuensi produk
3. Setelah tabel dikeluarkan aplikasi mengurutkan berdasarkan frekuensi kemunculan terbanyak 4. Menampilkan hasil pengurutan data 8 No Proses 2.3
Nama Proses Algoritma FP-Growth Source (sumber) User
Input -Input nilai support -Input nilai confidence
Output Data rule
Destination (tujuan) Rule
Logika Proses 1. User menginputkan data nilai minimum support dan data nilai minimum confidence
2. Aplikasi mengambil data hasil preprocessing yang sudah diurutkan
3. Aplikasi membuat struktur data fp-tree
4. Aplikasi menghasilkan frekuensi itemset dan rule
III.1.5.4. Kamus Data
Kamus data berfungsi untuk menjelaskan semua data yang digunakan di dalam sistem. Berikut adalah kamus data untuk perangkat lunak yang akan dibangun :
Nama Data Data Transaksi
Deskripsi File excel data transaksi
Struktur Data NoNota, KodeBarang, NamaBarang, Jumlah, Tanggal
NoNota {0..9}
KodeBarang {A..Z│a..z} {0..9} Nama Barang {A..Z│a..z} {0..9}
Jumlah {0..9}
Tanggal {0..9}
(57)
57
Deskripsi Berisi data hasil preprocessing dari data transaksi Struktur Data NoNota, KodeBarang
No Nota {0..9}
KodeBarang {A..Z│a..z} {0..9}
Nama Data Pengurutan
Deskripsi Berisi data yang sudah diurutkan dan siap di mining
Struktur Data KodeBarang, Frekuensi KodeBarang {A..Z│a..z} {0..9}
Frekuensi {0..9}
Nama Data Rule
Deskripsi Berisi aturan pola pembelian pelanggan Struktur Data Rule, Support, Confidence
Rule {A..Z|a..z|0..9}
Support {0..9}
Confidence {0..9}
Deskripsi Presentase nilai kepastian kuatnya hubungan antar-item dalam aturan asosiasi yang diinginkan user
III.1.5.5. Perancangan Sistem
Proses perancangan yang akan dilakukan pada tahapan ini adalah perancangan sistem basis data, perancangan struktur menu, perancangan antar muka, perancangan pesan, jaringan semantik dan perancangan procedural
Perancangan Basis Data
Perancangan tabel pada aplikasi yang akan dibangun meliputi struktur tabel
a. Struktur Tabel
Struktur tabel pada aplikasi yang akan dibangun terdiri dari 3 tabel dengan rincian sebagai berikut :
(58)
Tabel III.15. . Struktur Tabel Data Transaksi
Nama Atribut Tipe Data Panjang Keterangan
No Nota Varchar 6 Not Null
KodeBarang Varchar 4 Not Null
Nama Barang Varchar 25 Not Null
Jumlah Int 11 Not Null
Tanggal Varchar 15 Not Null
Tabel III.16. Struktur Tabel Preprocessing
Nama Atribut Tipe Data Panjang Keterangan
No Nota Varchar 6 Not Null
KodeBarang Varchar 4 Not Null
Tabel III.17. Struktur Tabel Pengurutan
Nama Field Tipe Data Panjang Keterangan
Kodebarang Varchar 6 Not Null
(59)
59
Tabel III.18. Struktur Tabel Rule
Nama Field Tipe Data Panjang Keterangan
Rule Varchar 25 Not Null
Support Float Not Null
Confidence Float Not Null
Perancangan Antar Muka
Dalam perancagan sebuah perangkat lunak dibutuhkan struktur menu yang berisikan menu dan submenu yang berfungsi untuk memudahkan user dalam menggunakan perangkat lunak tersebut. Berikut ini digambarkan mengenai struktur menu dalam aplikasi ini :
APLIKASI DATA MINING ASSOCIATION RULE PT. BANDUNG PERKASA JAYA
Preprocessing Data Proses Asosiasi
Gambar III.26. Struktur Menu a. Perancangan Tampilan Program
Perancangan tampilan program dari aplikasi data mining association rule yang akan dibangun adalah sebagai berikut :
(60)
a. Tampilan Halaman Utama
Ukuran, font, Background dan warna disesuaikan
Klik Persiapan Data untuk menuju T02
Klik Proses asosiasi
untuk menuju T03
T01 - X
(61)
61
b. Tampilan Preprocessing Data
Ukuran, font, Background dan warna disesuaikan
Klik Cari u tuk e ilih file
excel yang akan digunakan
klik Si pa u tuk u tuk
menyimpan data file excel ke dalam database
Klik Clea i g u tuk elihat
hasil pembersihan data yang tidak digunakan dalam proses asosiasi
Klik Selectio u tuk elihat
hasil pemilihan atribut yang akan digunakan pada proses asosiasi
Jika button simpan diklik dan data alamat file masih kosong maka akan muncul P01
Jika penyimpanan berhasil akan muncul P02
Jika penyimpanan tidak berhasil muncul P03
Jika pemilihan atribut berhasil akan muncul P04
Jika pembersihan data berhasil akan muncul P05
T02
-
XGambar III.28. Tampilan Preprocessing Data (T02)
(62)
c. Tampilan Proses Asosiasi
Ukuran, font, Background dan warna disesuaikan
Isi textBox 1 dengan nilai minimum support
Isi textBox 2 dengan nilai minimum confidence
Klik A alisis u tuk
memproses analisis data mining dan
menampilkan hasil dari pembentukan aturan asosiasi
Klik Hitu g Frekue si
untuk meilihat hasil perhitungan dari data
Klik Urutka u tuk
mengurutkan data sesuai dengan frekuensi
Jika Perhitungan frekuensi berhasil akan muncul P06
Jika pengurutan data berhasil akan muncul P07
T03
-
XGambar III.29. Tampilan Pembentukan Aturan Asosiasi (T03)
(63)
63
Perancangan Tampilan Pesan
Berikut ini adalah perancangan pesan dari aplikasi yang akan dibangun.
Pilih File Terlebih dahulu !
OK
P01 X
Data Berhasil Disimpan
OK
P02 X
Terjadi Kesalahan, Ulangi Pemilihan File
OK
P03 X
Pemilihan Atribut Berhasil
OK
P04 X
Pembersihan Data Berhasil
OK
P05 X
Penghitungan Frekuensi Berhasil
OK
P06 X
Pengurutan Data Berhasil
OK
P07 X
(64)
Jaringan Semantik
Berikut ini adalah jaringan sematik dari perangkat lunak yang akan dibuat untuk menunjukan keterhubungan antar objek perancangan.
T01
T02
T03
P01,P02,P03,P04,P05
P06,P07
(1)
DAFTAR PUSTAKA
1. J. C. R. K. T. K. T. R. C. S. a. R. W. Pate Chapman, 2000. [Online]. Available: http://the-modeling-agency.com/crisp-dm.pdf. [Accessed 21 Februari 2015].
2. H.A.Fajar, Data Mining. Andi, 2013.
3. Ramon A. Mata Toledeo, Pailine K. Cushman, Dasar-dasar Database Relasional. Jakarta : Airlangga, 2007.
4. Prasetyo Eko, Data Mining. Andi 2012.
5. J. Han and M. Kamber, Data Mining : Concept and Techniques, 2nd ed. San Fransisco: Morgan Kauffman, 2006.
6. R. J. A. Little and D. B. Rubin, Statistical Analysis With Missing Data, 2nd ed. Wiley, 2002.
7. D. T. Larose, DATA MINING METHODS AND MODELS, New Jersey: John Wiley & Sons, Inc, 2006.
8. D. T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to DATA MINING, Hoboken, New Jersey: John Wiley & Sons, Inc., 2005. 9. U. D, “Mining an Online Auctions Data Warehouse,” The Mid-Atlantic
Student Workshop on Programming Languages and Systems, vol. 19, 2002. 10.J. Santoni, “Implementasi Data Mining Dengan Metode Market Basket
Analysis,” Teknologi Informasi dan Pendidikan, vol. 5, p.2, Sep.2012.
11.R. S. Pressman, Software Engineering - A Practitionar's Approach, 5th ed. McGraw-Hill International, 2001.
(2)
iii
KATA PENGANTAR
Assalaamu’alaikum wr.wb,
Alhamdulillahi Rabbil alamiin, segala puji dan syukur penulis panjatkan kepada Allah SWT atas rahmat dan karunia-Nya sehingga penulis dapat
menyelesaikan skripsi yang berjudul “Penerapan Data Mining Pada Penjualan Produk Benang Di PT. Bandung Perkasa Jaya Menggunakan Metode Association” sebagai syarat untuk menyelesaikan program studi Strata I Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer di Universitas Komputer Indonesia dengan sebaik-baiknya.
Penyusunan skripsi ini tidak akan terwujud tanpa adanya dukungan, bantuan, kerjasama dan masukan dari berbagai pihak dan rahmat dari Allah SWT sehingga penulis dapat mengatasa kendala-kendala yang dihadapi. Untuk itu, penulis ingin menyampaikan terima kasih yang sebesar-besarnya kepada :
1. Allah SWT yang saya cintai, yang telah memberikan karunia, hidayah, kesehatan, kesabaran, ketenangan, kekuatan, petunjuk dan kemudahan selama mengerjakan skripsi ini. Shawalat dan salam selalu tercurahkan kepada Baginda Rasulullah Muhammad SAW.
2. Keluarha dekat penulis, kepada mamah, Bapak, sepupu, sodara dan kakak saya yang selalu membantu usaha saya dalam menyelesaikan kuliah baik berbentuk moral ataupun material.
3. Ibu Dian Dharmayanti, S.T., M.Kom. selaku dosen pembimbing yang telah meluangkan waktu, tenaga, pikiran, memberikan motivasi, arahan, dan saran serta ilmu pengetahuannya kepada penulis dalam penyusunan skripsi ini. 4. Bapak Adam Mukharil Bachtiar, S.Kom., M.T. selaku dosen reviewer yang
telah memberikan saran dan kritiknya dalam penyusunan skripsi ini.
5. Bapak Andri Heryandi, S.T. sebagai dosen penguji tiga selama sidang skripsi berlangsung
(3)
iv
6. Ibu Sufaatin, S.T., M.Kom. selaku dosen wali IF-10 angkatan 2015.
7. Teman-teman IF10 angkatan 2010 yang telah bersama-sama melewati masa-masa perkuliahan ada yang 4 tahun, ada yang 5 tahun, ada yang 9 semester dan sisanya.
8. Kepada teman skripsi seperjuangan dari awal sidang proposal hingga yudisium dan wisuda.
9. Kepada Rizka Maria Merdeka, Suci Iwari, Zefi Firmansyah Atmadipura, dan sahabat serta teman-teman lainnya.
10.Seluruh Dosen dan Staf pengajar jurusan Teknik Informatika Universitas Komputer Indonesia.
11.Semua pihak yang terlibat dan ikut membantu dalam skripsi ini baik secara langsung maupun tidak langsung.
Sangat disadari bahwa dalam pelaksanaan dan penyusunan laporan skripsi ini masih banyak kekurangan dan jauh dari kesempurnaa. Oleh karena itu, sadan dan kritik yang membangun sangat diharapkan untuk pengembangan ke arah yang lebih baik.
Bandung, 29 Juli 2015
(4)
(5)
(6)