Penerapan Data Mining pada Data Penjualan di Slasher Clothing Menggunakan Metode Association Rule

  

BIODATA PENULIS

DATA PRIBADI

  Nama Lengkap : Maulana Hidayat Jenis Kelamin : Laki-laki Tempat, Tanggal lahir : Bandung , 03-10-1992 Kewarganegaraan : Indonesia Status Hubungan : Belum Menikah Tinggi , Berat : 176 cm , 100 kg Agama : Islam Alamat Lengkap : Jln. Cibaduyut Lama Gg. Saluyu No. 13 RT/RW 06/07 Bandung 40235 Handphone : 082318924370 E - mail : maul.hid@gmail.com

RIWAYAT PENDIDIKAN

  1998 – 2004 : SD Al-Basyariah. 2004 – 2007 : SMP Negeri 38 Bandung. 2007 – 2010 : SMK Prakarya Internasional. 2010

  • – 2016 : Universitas Komputer Indonesia, Fakultas Teknik dan Ilmu Komputer, Jurusan S1 Teknik Informatika

  PENERAPAN DATA MINING PADA DATA PENJUALAN DI SLASHER CLOTHING MENGGUNAKAN METODE ASSOCIATION RULE SKRIPSI

  Diajukan Untuk Menempuh Ujian Akhir Sarjana

MAULANA HIDAYAT 10110680

KATA PENGANTAR

  Assalamu’alaikum Wr. Wb,

  Puji syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat hidayah dan karunia-Nya, shalawat serta salam semoga selalu tercurah kepada Rasulullah SAW, sehingga penulis dapat menyelesaikan skripsi yang berjudul ” PENERAPAN DATA MINING PADA DATA

  PENJUALAN DI SLASHER CLOTHING MENGGUNAKAN METODE

ASSOCIATION RULE

  ” Adapun tujuan dari penyusunan skripsi ini adalah untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi

  Teknik Informatika, Universitas Komputer Indonesia. Penulis membutuhkan peran serta dari pihak lain untuk proses penyelesaian skripsi ini, karena keterbatasan ilmu dan pengetahuan. Oleh karena itu ijinkanlah penulis untuk menyampaikan ucapan terima kasih yang sebesarbesarnya kepada :

  1. Allah SWT, yang telah memberikan rahmat, hidayah, dan karunia-Nya kepada penulis sehingga dapat menyelesaikan skripsi dengan baik.

  2. Bapak, Mamah, aa, teteh, anjul, teh fika, teh imas dan semua keluarga terimakasih selalu memberikan dorongan, motivasi, doa yang tak terkira serta bantuan baik secara moril maupun materil.

  3. Bapak Alif Finandhita, S.Kom., M.T selaku dosen pembimbing. Terima kasih karena telah banyak meluangkan waktu untuk memberikan bimbingan, saran dan nasehatnya selama penyusunan skripsi ini.

  4. Ibu Dian Dharmayanti, S.T., M.Kom. selaku dosen reviewer. Terima kasih karena telah meluangkan waktu untuk menjadi reviewer yang telah memberikan bimbingan, saran dan nasehatnya selama penyusun skripsi ini.

  5. Ibu Nelly Indriani W, S.Si., M.T. selaku dosen wali kelas IF-16 Angkatan 2010.

  6. Mumu, aji, isal, apin, ali, dan semua anggota Karang Taruna RT 06 yang sudah memberikan motifasi dan hiburan dalam mengerjakan skripsi ini.

  7. Pirman, Yusuf, Putri, Chandra, Yogi, dan teman-teman seperjuangan yang berjuang dalam mengerjakan skripsi ini.

  8. Tarkiman, Edi, Dadan, Dinda, Bibi, Kaerur, dan semua teman kelas IF-16 2010.

  9. Serta semua pihak yang telah turut membantu dalam penyusunan skripsi ini, yang tidak bisa disebutkan satu persatu.

  Didalam penulisan skripsi ini, penulis telah berusaha seoptimal mungkin walaupun demikian penulis menyadari bahwa skripsi ini jauh dari sempurna. Masukan atau saran yang ditujukan untuk penyempurnaan skripsi ini akan diterima oleh penulis dengan senang hati.

  Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat bagi penulis pada khususnya dan pembaca pada umumya.

  Wassalamualaikum Wr. Wb.

  Bandung, 27 Agustus 2016 Penulis

  

DAFTAR ISI

ABSTRAK .............................................................................................................. I

ABSTRACT ........................................................................................................... II

KATA PENGANTAR ......................................................................................... III

DAFTAR GAMBAR ........................................................................................ VIII

DAFTAR TABEL ............................................................................................... IX

DAFTAR SIMBOL ............................................................................................. XI

DAFTAR lAMPIRAN ...................................................................................... XIII

  

BAB I PENDAHULUAN ...................................................................................... 1

I.1 Latar Belakang Masalah ........................................................................... 1

I.2 Rumusan Masalah ...................................................................................... 2

I.3 Maksud dan Tujuan ................................................................................... 2

I.4 Batasan Masalah ........................................................................................ 3

I.5.1 Metode Pengumpulan Data ................................................................ 3

I.5.2 Metode Pembangunan Perangkat Lunak ......................................... 4

I.5.3 Metode Tahapan Data Mining ........................................................... 5

I.6 Sistematika Penulisan ................................................................................ 6

BAB II TINJAUAN PUSTAKA ........................................................................... 9

II. 1 Profil Prusahaan ........................................................................................ 9

II.1.1 Visi dan Misi ........................................................................................ 9

II.1.2 Logo Perusahaan................................................................................. 9

II.1.3 Struktur Perusahaan ........................................................................ 10

II. 2 Landasan Teori ........................................................................................ 10

II.2.1 Data .................................................................................................... 10

II.2.2 Database ............................................................................................. 11

II.2.3 Database Management Sistem (DBMS) ........................................... 11

II.2.4 Data Mining ....................................................................................... 12

Association Rule ................................................................... 13 II.2.5 Metode II.2.6 Algoritma Improved Apriori ............................................................. 14

II. 3 Alat Permodelan Sistem .......................................................................... 15

  

II.3. 2 Diagram Konteks .............................................................................. 16

  

II.3. 3 Data Flow Diagram (DFD) ............................................................... 16

  

II. 4 Alat-alat Pembangunan Perangkat Lunak ............................................ 17

  

II.4. 1 C#........................................................................................................ 17

  

II.4. 2 SQL Server ........................................................................................ 19

  

BAB III ANALISIS DAN PERANCANGAN ................................................... 21

III.1 Analisis Sistem ...................................................................................... 21

III.1.1 Analisis Masalah ............................................................................... 21

III.1.2 Analisis Selection Data ...................................................................... 22 III.1.3 Analisis Preprocessing Data.............................................................. 25 III.1.4 Analisis Transformation Data ........................................................... 35 III.1.5 Analisis Data Mining ......................................................................... 36

III.1.6 Analisis Spesifikasi Kebutuhan Perangkat Lunak ........................ 54

III.1.7 Analisis Kebutuhan Non Fungsional .............................................. 54

III.1.8 Analisis Basis Data ............................................................................ 57

III.1.9 Analisis Kebutuhan Fungsional ....................................................... 58

III.1.9.1 Diagram Konteks ....................................................................... 58 III.1.9.2 Data Flow Diagram (DFD) ....................................................... 59

III.1.10 Spesifikasi Proses .......................................................................... 66

III.1.11 Kamus Data DFD .......................................................................... 70

III.2 Perancangan Sistem ............................................................................. 71

III.2.1 Perancangan Basis Data ................................................................... 72

III.2.1.1 Diagram Relasi .......................................................................... 72 III.2.1.2 Struktur Tabel ........................................................................... 73

III.2.2 Perancangan Struktur Menu ........................................................... 75

III.2.3 Perancangan Antar Muka ............................................................... 76

III.2.4 Perancangan Pesan ........................................................................... 79

III.2.5 Perancangan Jaringan Semantik .................................................... 80

III.2.6 Perancangan Prosedural .................................................................. 81

BAB IV IMPLEMENTASI DAN PENGUJIAN .............................................. 84

IV. 1. Implementasi ......................................................................................... 84

  IV. 1. 2. Perangkat Keras Pembangunan .................................................. 84

  IV. 1. 3. Implementasi Basis Data .............................................................. 85

  IV. 1. 4. Implementasi Antar Muka ........................................................... 86

  

IV. 2. Pengujian Sistem .................................................................................. 87

  

IV. 2. 1. Pengujian Aplikasi ............................................................................ 87

  

IV. 2. 2. Kasus dan hasil pengujian Aplikasi ................................................ 87

  

IV. 2. 3. Kesimpulan Pengujian Aplikasi ...................................................... 91

  

IV. 2. 4. Pengujian Pengguna ......................................................................... 91

  

IV. 2. 5. Kesimpulan Pengujian pengguna .................................................... 92

  

IV. 2. 6. Pengujian Hasil ................................................................................. 92

  

IV. 2. 7. Kesimpulan Pengujian Hasil............................................................ 95

  

BAB V KESIMPULAN DAN SARAN .............................................................. 97

V.1 Kesimpulan ............................................................................................... 97

V.2 Saran ......................................................................................................... 97

DAFTAR PUSTAKA .......................................................................................... 99

DAFTAR PUSTAKA

  [1] Sanjaya, Yudi Arseta. Susanto, Edy. Ratnawati, Dian Eka. “PENERAPAN METODE ASSOCIATION RULE DENGAN ALGORITMA FOLD-GROWTH PADA DATA TRANSAKSI TOKO BUKU”, Universitas Brawijaya.

  [2 ] Fang, Xiang. 2013. “An Improved Apriori Algorithm on the Frequent Items”,

  Department of Department of Computer Science, Shandong Institute of Business and Technology, Shandong, 264005, China. [3] Noor, Juliansyah. 2011. “Metodologi Penelitian Skripsi,Tesis, Disertasi, dan karya ilmiah”, Jakarta : Kencana Prenada Media Group.

  [4] Sommerville, Ian. 2010. ‟Design and Implementation‟, Pearson Education, Software Engineering, 9th (ed), United States,Addison-Wesley,pp 176-198. [5lothing 8 November 2015 pukul 09.38. [6] Watson, Richard T. (1999), Data Management : Databases and Organizations (2nd ed)., Jhon Wiley & Sons, Inc. [7] Novianda, K.R., (2010). Microsoft Business Intelligence dengan SQL Server 2008 R2 dan Sharepoint 2010. [8] Harold, Davis (2002). Visual C# .Net Programming. Sybex, 2002.

BAB I PENDAHULUAN I.1 Latar Belakang Masalah Distro Slasher Clothing merupakan anak perusahaan dari PT. Lentera Sadjiwa, Distro Slasher Clothing bergerak di bidang penjualan pakaian dan

  asesoris seperti kaos, sweater, tas, sepatu, dan yang lainnya. Distro Slasher Clothing beralamat di Jalan Cigondewah Rahayu No 133 Bandung. Dalam menjalankan proses bisnisnya Distro Slasher Clothing tidak hanya menjalankan bisnisnya secara konvensional, Distro Slasher Clothing juga sudah mempunyai sebuah website sehingga konsumen dapat melakukan pemesanan secara online untuk membeli pakaian dan asesoris.

  Pada setiap hari besar pihak Slasher memberikan promosi sebagai salah satu strategi bisnis yang dilakukan oleh pihak Slasher. Produk yang ditawarkan beragam, pemilihan produk dilakukan dengan cara memilih produk berdasarkan produk dengan penjualan terbanyak. Berdasarkan data yang terlampir pada Lampiran D bagian D-5 diketahui, bahwa produk promosi yang ditawarkan pada konsumen kurang diminati, sehingga berdampak pada target penjualan yang tidak tercapai. Agar produk promosi lebih diminati konsumen, pihak slasher akan melakukan promosi dengan berbagai macam bentuk, bisa dengan cara melakukan promosi buy 1 get 1, pemaketan produk, atau dengan cara bila membeli produk “a” mendapatkan diskon untuk produk “b”, dan lain sebagainya. Maka dari itu Pihak Slasher akan menganalisis data penjualan agar mengetahui pola penjualan produk. Dengan mengetahui pola penjualan produk, pihak Slasher dapat mengetahui produk dan jenis promosi yang tepat. Akan tetapi ada permasalahan yang dihadapi, pihak Slasher kesulitan dalam mencari pola penjualan produk berdasarkan data tersebut. Permasalahan ini terjadi karena banyaknya data yang harus diolah dan data tersebut sulit untuk diolah menggunakan sistem yang saat ini digunakan Distro Slasher Clothing, oleh karena itu dibuatkan suatu sistem yang dapat mempermudah pihak slasher dalam menentukan produk mana saja yang akan dijadikan sebagai produk promosi.

  Ketersediaan data yang banyak dapat dimanfaatkan untuk mencari serangkaian informasi yang berguna sebagai pendukung keputusan. Data mining merupakan salah satu cara efektif yang dapat digunakan untuk mengetahui adanya serangkaian pola informasi dari sejumlah besar data yang ada. Dalam permasalahan pencarian pola penjualan produk, dibutuhkan metode data mining yang disebut metode Association Rule. Metode Association Rule merupakan metode data mining yang dapat mencari korelasi antara item-item yang berbeda dengan mengetahui pola asosiasinya [1]. Algoritma yang digunakan dalam penelitian ini menggunakan algoritma Improved Apriori, dijelaskan dalam penelitian yang dilakukan oleh Xiang Fang, bahwa Improved Apriori mempunyai kelebihan dalam mengonsumsi waktu lebih cepat dari pada Apriori biasa [2].

  Berdasarkan permasalahan diatas maka penulis ingin membangun sebuah sistem hasil dari implementasi Data Mining menggunakan metode Association

  

Rule yang dapat mencari pola penjualan produk. Dengan adanya sistem ini

  diharapkan dapat membantu pihak slasher dalam pemaketan produk yang akan dipromosikan.

  I.2 Rumusan Masalah

  Berdasarkan latar belakang yang telah ada dijelaskan di atas, maka penulis dapat merumuskan permasalahan sebagai berikut : Bagaimana cara membangun perangkat lunak Data Mining dengan menggunakan metode Association rules di Distro Slasher Clothing.

  I.3 Maksud dan Tujuan

  Berdasarkan permasalahan yang diteliti, maka maksud dari penelitian ini adalah membagun aplikasi data mining yang dapat memberi informasi untuk menentukan pemaketan produk menggunakan metode association rule.

  Sedangkan tujuan yang akan dicapai dalam penelitian adalah: 1.

  Membantu pihak slasher dalam menemukan informasi yang tepat mengenai paket produk promosi.

2. Memberikan informasi rekomendasi produk promosi kepada pihak

  Slasher

I.4 Batasan Masalah

  Berdasarkan latar belakang masalah yang telah di uraikan sebelumnya, maka dibuat batasan masalah agar penyajian lebih terarah dan mencapai sasaran yang ditentukan.

  Adapun batasan masalah yang di buat adalah sebagai berikut: 1.

  Data yang digunakan adalah sample data penjualan pada bulan oktober tahun 2014

  2. Metode yang digunakan adalah metode aliran terstruktur dengan menggunaan tools Data Flow Diagram (DFD) dan Entity

  Relationship Diagram (ERD) 3.

  Perangkat lunak yang dibangun berbasiskan Desktop 4. Metode Association Rule yang diimplementasikan menggunakan Algoritma Improved Apriori.

5. Informasi yang dihasilkan adalah informasi mengenai paket produk.

I.5 Metodologi Penelitian

  Metodologi penelitian yang akan digunakan dalam pembuatan skripsi ini menggunakan metodologi deskriptif, yaitu metode penelitian yang bertujuan untuk mendapatkan gambaran yang jelas tentang hal-hal yang dibutuhkan dan berusaha menggambarkan serta menginterpretasi objek yang sesuai dengan fakta secara sistematis dan akurat [3].

I.5.1 Metode Pengumpulan Data

  Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut: a.

  Studi Literatur Pengumpulan data dengan cara mempelajari Jurnal, browsing internet, buku referensi, dan bacaan-bacaan lainnya yang berhubungan erat dengan judul penelitian.

  b.

  Wawancara Teknik pengumpulan data dengan cara tanya jawab secara langsung

I.5.2 Metode Pembangunan Perangkat Lunak

  Tahapan dalam pembangunan aplikasi ini akan menggunakan model waterfall. Secara mendasar dalam aktifitas proses seperti spesification,

  

development, valitadion dan evolution. Mewakili fase dalam proses terpisah

  seperti requirements, software design,implementations, testing dan maintenance [4] .

  

Gambar I. 1 Metode Waterfall

  1) Requirements Definition

  Mendefinisikan kebutuhan yang diperlukan untuk pembangunan perangkat lunak. Diantaranya Laptop, Data Penjualan, Visual Studio, DBMS, dll.

  2) Sistem and Software Design

  Menganalisis serta merancang sistem yang akan dibangun seperti merencanakan sistem antarmuka, proses sistem yang akan dibangun sesuai dengan kebutuhan pengguna yang sudah dianalisis sebelumnya.

  3) Implementation and Unit Testing

  Penerapan desain antarmuka dari data yang dianalisis kedalam bentuk yang mudah dimengerti oleh pengguna.

  4) Integration and Sistem Testing

  Tahap penerjemahan data atau pemecahan masalah yang telah dirancang

  5) Operation

  Merupakan tahap pengujian terhadap perangkat lunak yang dibangun.

  6) Maintenance

  Tahap akhir dimana perangkat lunak yang sudah selesai dapat mengalami perubahan

  • –perubahan atau penambahan sesuai dengan permintaan user.

I.5.3 Metode Tahapan Data Mining

  Tahapan Data Mining yang digunakan pada penelitian ini adalah tahapan

  

data mining KDD (Knowledge Discovery in Databases) yang meliputi beberapa

  tahap diantaranya Seleksi, Praproses, Transformasi, Menjalankan Algoritma, Implementasi, dan Evaluasi. Tahapan KDD dapat dilihat pada gambar berikut :

  

Gambar I. 2 Tahapan Data Mining

a.

  Seleksi Data Memilih Data yang digunakan untuk proses analisis dalam kasus ini

  Data laporan Penjualan digunakan sebagai sumber data yang dianalisis dengan atribut yang sudah disesuaikan.

  b.

  Praprosessing Data Praprosessing data melakukan kegiatan untuk import sumber data, c.

  Transformasi Data Transformasi data melakukan peringkasan data dan mengasumsikan

data tersimpan di dalam tempat penyimpanan tunggal.

  d.

  Menjalankan Algoritma Setelah melakukan semua proses di atas, maka algoritma Improved Apriori siap untuk di jalankan.

  e.

  Evaluasi Data Inilah hasil akhir yang akan di sajikan berupa data yang mudah di pahami, yang merupakan hasil dari pengolahan data melakukan Data

  mining.

I.6 Sistematika Penulisan

  Sistematika penulisan laporan akhir dari penelitian ini disusun untuk memberikan gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah sebagai berikut :

  BAB I PENDAHULUAN Bab ini membahas penjelasan mengenai latar belakang masalah, identifikasi

  masalah, maksud dan tujuan, batasan masalah, metodologi penelitian serta sistematika penulisan.

  BAB II LANDASAN TEORI Bab ini membahas mengenai landasan teori yang digunakan dalam membangun

  aplikasi data mining, materi-materi umum dan yang berkaitan dengan teori-teori pendukung lainnya.

  BAB III ANALISIS DAN PERANCANGAN Bab ini membahas tentang Penganalisaan dan perancangan sistem yang di bangun

  menggunakan dengan metode Association Rule, Fungsionalitas sistem serta desain antar muka sistem.

  BAB IV IMPLEMENTASI Bab ini Menjelaskan mengenai implementasi aplikasi yang telah di buat serta melakukan pengujian terhadap aplikasi yang di implementasikan tersebut.

BAB V KESIMPULAN DAN SARAN Bab ini Menjelaskan tentang kesimpulan yang diperoleh dari hasil implementasi

  dan pengujian aplikasi yang telah dibuat, serta saran-saran untuk pengembangan selanjutnya.

BAB II TINJAUAN PUSTAKA II. 1 Profil Prusahaan Distro Slasher Clothing berdiri tahun 2013 di Cigondewah Rahayu No

  133. Sebuah kawasan Sub-urban kota Bandung, yang juga merupakan kawasan tekstil terbesar di kota Bandung. Slasher bergerak di bidang fashion yang menangkap Pop & Youth Culture, -so called- Indie Movement, dan semua bentuk pergerakan Do It Yourself. Seakan sudah menjadi atau identik dengan kota Bandung, yang kadung tercitrakan sebagai kota kreatif, dan termasuk pionir dalam industri kreatif di Indonesia, Distro Slasher Clothing adalah perpanjangan tangan dari ide dan spirit kreatif yang diaplikasikan lewat fashion. Slasher Streetwear : “Fashion Doesn’t Need The Goverment. Existed to Survive, Dressed to Kill[5].

  II.1.1 Visi dan Misi Visi

  Menjadi perusahaan yang menghasilkan produk yang berkualitas tinggi, dan mampu menguasai pasar

  Misi

  Menjadi perusahaan fashion yang dikenal di seluruh Indonesia, dan mempunyai cabang di seluruh kawasan Indonesia

  II.1.2 Logo Perusahaan

  Adapun logo perusahaan Distro Slasher Clothing sebagai berikut :

  

Gambar II. 1 Logo Perusahaan

II.1.3 Struktur Perusahaan

  Struktur organisasi dalam suatu perusahaan merupakan hal yang sangat penting, dengan adanya struktur organisasi ini memberikan pembagian tugas sesuai dengan bidangnya masing-masing. Adapun struktur organisasi di Distro Slasher Clothing adalah sebagai berikut : (PUPUH SABUR) DIREKTUR UTAMA

  

MANAGING

DIRECTOR

(FERRY)

MANAGER

(ADI)

DESIGNER PRODUCTION MARKETING (FERRY) (133 CREW) (ADI) (RAHMAT) (EKI) (NINA) IT & USER DEV LOGISTIC INVENTORY MANAGER STORE (ADE)

Gambar II. 2 Struktur Organisasi Distro Slasher Clothing

  II. 2 Landasan Teori

  Landasan teori membahas mengenai materi atau teori apa saja yang digunakan sebagai acuan dalam membuat tugas akhir ini. Landasan teori yang diuraikan merupakan hasil dari studi literatur yaitu pengumpulan data dengan cara mempelajari jurnal, browsing internet, referensi buku dan bacaan-bacaan lainnya yang berhubungan erat dengan penelitian yang dilakukan.

  II.2.1 Data Data adalah fakta mentah mengenai orang, tempat, kejadian, dan hal-hal

  yang penting dalam organisasi [6]. Data merupakan bahasa, simbol-simbol pengganti lain yang disepakati oleh umum dalam menggambarkan objek, manusia, peristiwa, aktivitas, konsep. Singkatnya data merupakan suatu kenyataan apa adanya [6].

II.2.2 Database

  Database atau Basis data merupakan kumpulan data yang disimpan secara

  sistematis didalam komputer dan dapat diolah atau dimanipulasi menggunakan perangkat lunak (program aplikasi) untuk menghasilkan informasi. Pendefinisian basis data meliputi spesifikasi berupa tipe data, struktur, dan juga batasan-batasan

  

data yang akan disimpan. Basis data merupakan aspek yang sangat penting dalam

  sistem informasi dimana basis data merupakan gudang penyimpanan data yang akan diolah lebih lanjut. Basis data menjadi penting karena dapat menghidari duplikasi data, hubungan antar data yang tidak jelas, organisasi data, dan juga update yang rumit [6]. Basis data (Database) sendiri dapat didefinisikan dalam sejumlah sudut pandang seperti [6]:

  1. Himpunan kelompok data (arsip) yang saling berhubungan yang diorganisasi sedemikian rupa agar kelak dapat dimanfaatkan kembali dengan cepat dan mudah.

  2. Kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redun-dansasisi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.

3. Kumpulan file, tabel, arsip yang saling berhubungan yang disimpan dalam media penyimpanan elektronis.

II.2.3 Database Management Sistem (DBMS)

  Aplikasi yang digunakan untuk membangun sebuah sistem basis data yang memungkinkan Pengguna untuk mendefinisikan, membuat, memelihara dan mengontrol akses ke database merupakan pengertian dari Database Management

  

Sistem (DBMS). DBMS membantu dalam pemeliharaan dan pengolahan

  kumpulan data dalam jumlah besar, sehingga dengan bantuan. DBMS tidak akan menimbulkan kekacauan dan dapat digunakan oleh pengguna sesuai dengan kebutuhan. Bahasa basis data biasanya terdiri atas perintah-perintah yang diformulasikan dalam bentuk query sehingga perintah tersebut akan diproses oleh

II.2.4 Data Mining

  Data mining merupakan istilah yang sering dikatakan sebagai suatu cara

  untuk menguraikan serta mencari penemuan berupa pengetahuan didalam suatu

  database. Data mining

  adalah proses pemilihan atau “menambang” pengetahuan dari sekumpulan data dalam jumlah yang banyak (Han, Jiawei 2006).

  

Gambar II. 3 Tahapan Data Mining

  Terdapat beberapa Tahapan dalam data mining, antara lain : a.

  Seleksi Data Biasanya data dari proses transaksi di simpan pada lokasi yang berbeda-beda. Maka dari itulah di butuhkan kemampuan dari sistem untuk dapat mengumpulkan data dengan cepat. Biasanya data tersebut sangat banyak dan memerlukan waktu dalam menganalisisnya. Maka dari itu di butuhkan seleksi data untuk memperkecil ruang lingkup dengan memanfaatkan data yang penting saja.

  b.

  Pembersihan Data

  Data-data yang sudah terkumpul selanjutnya akan mengalami proses

  pembersihan. Pembersihan ini dilakukan untuk membuang record yang keliru, merasionalisasi struktur data dan mengendalikan data yang hilang.

  c.

  Transformasi Data Transformasi data melakukan peringkasan data dan mengasumsikan

  data tersimpan di dalam tempat penyimpanan tunggal. Hasil dari data

  pusat yang telah teringkas menggunakan ekstraksi data di ringkas kembali dengan Transformasi data supaya data yang di hasilkan lebih padat dan di simpat di tempat penyimpanan tunggal. Fungsi agregate yang sering di gunakan adalah average, minimum, maximum, dan cunt.

  d.

  Menjalankan Algoritma Setelah melakukan semua proses di atas, maka algoritma data mining sudah siap untuk di jalankan.

  e.

  Evaluasi Data Inilah hasil akhir yang akan di sajikan berupa data yang mudah di pahami, yang merupakan hasil dari pengolahan data melakukan Data

  mining.

II.2.5 Metode Association Rule

  Dalam pencarian hubungan antar item dalam suatu kumpulan data yang ditentukan, dibutuhkan suatu prosedur yang disebut association rule. Informasi yang diberikan dalam association rule berbentuk ”if – then” atau ”jika–maka” atau biasanya dikenal dengan istilah antecedent. Association rule meliputi dua tahap, yaitu mencari kombinasi yang paling sering terjadi dari suatu itemset dan membangkitkan association rule dari Large itemset yang telah dibuat sebelumnya. Dalam association rule terdapat dua ukuran, yaitu support dan confidence. Rule dikatakan valid association rule adalah yang memiliki confidence sama atau lebih dari minimum confidence. Rule dikatakan strong rule adalah memenuhi baik minimum support maupun minimum confidence[1]. Rumus untuk perhitungan support dan confidence sebagai berikut : a.

   Support (nilai penunjang) adalah presentase kombinasi item tersebut

  Support, s(X→Y) = *100……………………...……..………(2.1) N : Total transaksi X : Produk yang dipresentasikan “jika” Y : Produk yang dipresentasikan “maka” b.

   Confidence (nilai kepastian) adalah kuatnya hubungan antar-item dalam

  aturan asosiasi Confidence, c

  (X→Y) =

  • 100………………………...………(2.2)

II.2.6 Algoritma Improved Apriori

  Algoritma improved apriori merupakan peningkatan algoritma dari apriori biasa dengan perningkatan efisiensi dalam proses scaning data, dalam apriori biasa untuk menemukan setiap itemset harus melakukan scaning pada database secara penuh, sedangkan pada improved apriori scaning database dilakukan hanya pada saat Large 1-itemset diproduksi, untuk menemukan Large k-itemset

  

scaning dilakukan pada Large(K-1) sehingga mereduksi waktu yang diperlukan

dan meningkatkan efisiensi dalam proses asosiasi [2].

  Adapun Tahapan dari Improved Apriori yang diteliti oleh Xiang Fang sebagai berikut :

  1. Menentukan nilai minimal support count dan minimal confidence 2.

  Memproduksi L1 (Large 1-itemsets) Melakukan scaning database satu kali untuk memperoleh L1-

  candidate, setelah terbentuk hapus itemset yang mempunyai nilai

  kurang dari minimum support count untuk menemukan set dari frequent items L1.

  3. Memproduksi Lk (k ≥ 2) Untuk memproduksi Lk-candidate

  (k ≥ 2) scaning dilakukan pada hasil lage itemset sebelumnya, yaitu pada L(k-1) dengan cara sebagai berikut :

1) Membandingkan setiap itemset yang ada pada L(k-1).

  2) Jika dari itemset yang dibandingkan terdapat id_transaksi yang sama, maka join dua Lk-1 untuk membentuk Lk-candidate dan tambahkan itemset yang mempunyai id_transaksi yang sama ke dalam Lk-candidate.

  3) Setelah Lk-candidate terbentuk sepenuhnya, hapus itemset yang mempunyai nilai kurang dari minimum support count untuk menemukan set dari frequent items Lk.

  4) Lakukan cara 1) – 3) untuk menemukan Lk-candidate selanjutnya (k = k+1).

  5) Proses pembentuk candidate akan terus dilakukan hingga himpunan candidate itemsetnya null, atau sudah tidak ada lagi

  candidate yang dapat dibentuk.

  4. Menghitung Confidence dari setiap rule yang sudah terbentuk agar mengetahui rule yang sudah terbentuk merupakan rule yang kuat atau tidak, rule yang kuat mempunyai nilai yang sama atau lebih dari nilai minimum confidence yang sudah ditentukan sebelumnya. Kelemahan dari tradisional Apriori adalah setiap item yang ada pada

  

candidate untuk mencari frequent dari setiap item harus melakukan scaning pada

  seluruh database, dan efesiensi dari eksekusinya sangat rendah. Sedangkan pada Improved Apriori yang diteliti oleh Xiang Fang, scaning database hanya dilakukan untuk memproduksi L1-candidate, selanjutnya untuk mencari Lk selanjutnya scaning dilakukan pada L(k-1) yang sudah terbentuk sebelumnya, Sehingga mereduksi I/O Load dan meningkatkan efesiensinya.

  II. 3 Alat Permodelan Sistem

  Alat-alat pemodelan sistem membahas mengenai tools apa saja yang digunakan dalam membuat tugas akhir ini.

  II.3. 1 Entriry Relation Diagram (ERD) Entity Relationship Diagram merupakan model data berupa notasi grafis

  dalam pemodelan data konseptual yang menggambarkan hubungan antara penyimpan satu dengan penyimpan yang lain. Model data sendiri merupakan hubungan satu sama lain, semantiknya, serta batasan konsistensi. Model data terdiri dari model hubungan entitas dan model relasional. Diagram hubungan entitas ditemukan oleh Peter Chen dalam buku Entity Relational Model-Toward a Unified of Data. Pada saat itu diagram hubungan entitas dibuat sebagai bagian dari perangkat lunak yang juga merupakan modifikasi khusus, karena tidak ada bentuk tunggal dan standar dari diagram hubungan entitas [7].

  II.3. 2 Diagram Konteks

  Diagram konteks merupakan diagram yang menggambarkan kondisi sistem yang ada baik input maupun output serta menyertakan terminator yang terlibat dalam penggunaan sistem. Diagram ini akan memberi gambaran tentang keseluruhan sistem. Sistem dibatasi oleh boundary (dapat digambarkan dengan garis putus). Dalam diagram konteks hanya ada satu proses. Tidak boleh ada store dalam diagram konteks[7].

  Diagram konteks berisi gambaran umum (secara garis besar sistem yang akan dibuat. Secara kalimat, dapat dikatakan bahwa diagram konteks ini berisi “siapa saja yang memberi data (dan data apa saja) ke sistem, serta kepada siapa saja informasi (dan informasi apa saja) yang harus dihasilkan sistem.” Maka dapat disimpulkan bahwa diagram konteks adalah diagram yang terdiri dari suatu proses dan menggambarkan ruang lingkup suatu sistem. Diagram konteks merupakan level tertinggi dari DFD yang menggambarkan seluruh input ke sistem atau output dari sistem.

  II.3. 3 Data Flow Diagram (DFD) Data Flow Diagram (DFD) adalah alat pembuatan model yang

  memungkinkan profesional sistem untuk menggambarkan sistem sebagai suatu jaringan proses fungsional yang dihubungkan satu sama lain dengan alur data, baik secara manual maupun komputerisasi. DFD ini sering disebut juga dengan nama Bubble chart, Bubble diagram, model proses, diagram alur kerja, atau model fungsi. DFD ini adalah salah satu alat pembuatan model yang sering digunakan, khususnya bila fungsi-fungsi sistem merupakan bagian yang lebih penting dan kompleks dari pada data yang dimanipulasi oleh sistem. Dengan kata lain, DFD adalah alat pembuatan model yang memberikan penekanan hanya pada fungsi sistem [7].

  DFD merupakan alat perancangan sistem yang berorientasi pada alur data dengan konsep dekomposisi dapat digunakan untuk penggambaran analisa maupun rancangan sistem yang mudah dikomunikasikan oleh profesional sistem kepada pemakai maupun pembuat program.

  II. 4 Alat-alat Pembangunan Perangkat Lunak

  Alat-alat Pembangunan Perangkat Lunak membahas mengenai alat atau tools apa saja yang digunakan dalam membuat Aplikasi data mining dalam penelitian ini.

  II.4. 1 C#

  Bahasa pemrograman C# dikembangkan oleh Microsoft sebagai bahasa yang simple, modern, general purpose, dan berorientasi objek. Pengembangan bahasa C# sangat dipengaruhi oleh bahasa pemrograman terdahulu, terutama C++. Delphi, dan Java. C++ dikenal memiliki kecepatan yang tinggi dan memiliki akses memori hapir hingga ke low level. Namun bagi para programmer, C++ merupakan Bahasa yang relatif rumit dibandingkan bahasa pemrograman lainnya. Kehadiran C# memberi suntikan optimisme bagi para programmer untuk dapat mengembangkan aplikasi yang berdasa guna dengan baik cepat dan lebih mudah. Bahasa C# masih harus dikembangkan dengan kemampuan untuk melakukan berbagai task. Namun dalam hal performansi hingga saat ini C++ masih diakui sebagai salah satu yang terbaik.

  C# dikembangkan sejalan dengan pengembangan teknologi .Net. Teknologi .NET telah berevolusi dari .NET 1.0 hingga .NET 4.0. Sendiri merupakan sebuah framework yang memiliki base class library, dan bisa diimplementasikan ke dalam beberpaa bahasa pemrograman yang dikembangkan

  

Microsoft termasuk diantaranya adalah bahasa C#. Microsoft mengembangkan

  IDE yang secara khusus mendukung pengembangan aplikasi dengan teknologi .NET, versi terakhirnya yaitu Visual Studio 2010, mendukung teknologi .Net 4. Diantara karakteristik dari .NET adanya sebuah Common Langguage Runtime diakses program pada saat runtime kode yang ditulis dalam bahasa C# ataupun

  VB.NET misalnya dicompile oleh .NET Compiler menjadi code dalam format Common Intermediate Langguage (CIL).

  CIL merupakan sebuah format bahasa standar pada level intermediate yang digunakan dalam bidang teknologi .NET apa pun bahasa pemrograman yang digunakan oleh kode. Kemudian pada saat runtime, CLR mengeksekusi CIL dengan melakukan proses loading dan linkin serta menghasilkan bahasa mesin untuk mengeksekusi program. Proses ini memunculkan istilah multilangguage pada pengembangan aplikasi .Net programmer memiliki pilihan untuk menentukan pilihan untuk menggunakan bahasa pemrograman, yang familiar bagi mereka dan apapun bahasa pemgraman apapun mereka tetap memilih akan tetap memiliki keungulan-keungulan dan teknologi lainnya.

  European Computer Maufacturer Association (ECMA)

  Standar mendatarkan beberapa tujuan desain dari bahasa pemrograman C#, sebagai berikut [8]:

  1) Bahasa pemrograman C# dibuat sebagai bahasa pemrograman yang bersifat bahasa pemrograman general

  • – purpose (untuk tujuan jamak), berorientasi objek, modern, dan sederhana.

  2) Bahasa pemrograman C# ditujukan untuk digunakan dalam mengembangkan komponen perangkat lunak yang mampu mengambil keuntungan dari lingkungan terdistribusi.

  3) Portabilitas programmer sangatlah penting, khususnya bagi programmer yang telah lama menggunakan bahasa pemrogaman C dan C++.

  4) Dukungan untuk internasionalisasi (multi- language) juga sangat penting.

  5) C# ditujukan agar cocok digunakan untuk menulis program aplikasi baik dalam sistem klien-server (hosted sistem) maupun sistem 38

  embedded (embedded sistem), mulai dari perangkat lunak yang

  sangat besar yang menggunakan sistem operasi yang canggih hingga kepada perangkat lunak yang sangat kecil yang memiliki fungsi- fungsi terdedikasi.

II.4. 2 SQL Server

  SQL Server adalah sistem manajemen database relasional (RDBMS) yang

  dirancang untuk aplikasi dengan arsitektur client/server. Istilah client, server, dan

  

client/server dapat digunakan untuk merujuk kepada konsep yang sangat umum

  atau hal yang spesifik dari perangkat keras atau perangkat lunak. Pada level yang sangat umum, sebuah client adalah setiap komponen dari sebuah sistem yang meminta layanan atau sumber daya (resource) dari komponen sistem lainnya. Sedangkan sebuah server adaah setiap komponen sistem yang menyediakan layanan atau sumber daya ke komponen sistem lainnya [7].