Bab ini berisikan tentang landasan teori yang mendukung perancangan aplikasi yang akan dibangun.
BAB 3 : ANALISIS DAN PERANCANGAN SISTEM
Bab ini membahas mengenai analisa data yang akan diproses berdasarkan analisis asosiasi dengan algoritma apriori kemudian
membuat DFD, flowchart, struktur tabel dan merancang tampilan dari aplikasi data mining.
BAB 4 : IMPLEMENTASI DAN PENGUJIAN SISTEM
Bab ini akan membahas tentang implementasi dari sistem yang dibuat berdasarkan hasil analisis dan perancangan sistem yang telah dibuat.
Kemudian dilakukan pengujian sistem untuk mengetahui apakah sistem dapat berjalan sesuai tujuan dan harapan perancangan.
BAB 5 : KESIMPULAN DAN SARAN
Bab ini berisi tentang kesimpulan dan saran yang diberikan untuk perbaikan sistem sehingga menjadi lebih baik dan bermanfaat bagi
pengguna maupun pembaca skripsi.
BAB 2 LANDASAN TEORI
2.1 DataBase
Universitas Sumatera Utara
Basis data adalah kumpulan terintegrasi dari occurences filetable yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain
adalah sistem penyimpanan-record secara komputer elektronis. Basis data sendiri dapat digambarkan sebagai suatu lemari file yang berisi berbagai kumpulan file data
yang terkomputerisasi. Pemilik lemari file tentu saja dapat melakukan berbagai bentuk tindakan terhadap sistem yang dimilikinya, seperti berikut ini.
1. Penambahan file baru 2. Penambahan data pada file yang ada
3. Pengambilan data dari file yang ada 4. Pemutakhiran data dalam file yang ada
5. Penghapusan data dari file yang ada 6. Penghapusan file yang sudah tidak diperlukan
Perangkat lunak yang didesain untuk membantu dalam hal pemeliharaan dan utilitas kumpulan data dalam jumlah besar atau untuk memudahkan pengelolaan
database disebut DBMS Database Management System.
2.2 Data Mining
Data mining adalah sejumlah proses pencarian pola dari data-data dengan jumlah
yang sangat banyak yang tersimpan dalam suatu tempat penyimpanan dengan menggunakan teknologi pengenal data, teknik statistik, dan matematik. Data mining
sebagai proses untuk menemukan korelasi atau pola dari ratusan atau ribuan field dari sebuah relasional database yang besar. Data mining dapat diartikan sebagai
serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data[6].
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih dalam satu dimensi. Penemuan pola merupakan keluaran dari data
mining [4]. Misalnya suatu perusahaan ritel yang akan meningkatkan penjualan
produk, maka perusahaan akan mencari pola dari pelanggan yang ada untuk mengetahui pelanggan yang potensial dan pelanggan yang tidak potensial. Data
mining sering disebut juga Knowledge Discovery in Database KDD adalah kegiatan
Universitas Sumatera Utara
yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set berukuran besar[3].
2.2.1 Arsitektur Data mining Arsitektur data mining dapat dilihat pada gambar berikut:
Knowledge base
Data cleaning data integration fltering
Gambar 2.1 Arsitektur Data Mining
Keterangan :
1. Data cleaning Pembersihan Data : untuk membuang data yang tidak
konsisten dan noise
2. Data integration : penggabungan data dari beberapa sumber 3. Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai
untuk di mining
4. Pattern evaluation : untuk menemukan pengetahuan yang bernilai melalui
knowledge base
5. Graphical User Interface GUI : untuk end user
Graphical User Interface GUI
Pattern Evaluation
Data Mining Engine
DataBase or data warehouse server
Universitas Sumatera Utara
2.2.2 Pengelompokan Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu: 1. Deskripsi
Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi Pada estimasi, model dibangun menggunakan record lengkap yang
menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat
berdasarkan nilai variabel prediksi. 3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang.
4. Klasifikasi Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.
5. Pengklusteran Pengklusteran merupakan pengelompokkan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
6. Asosiasi Tugas utama dalam data mining adalah menemukan atribut yang muncul
dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
2.3 Association Rule
Aturan asosiasi atau association rule adalah teknik data mining untuk menemukan aturan asosiatif antara suatu korelasi item. Tugas asosiasi dalam data mining adalah
menemukan atribut yang muncul bersamaan dalam suatu waktu. Contoh aturan asosiatif di dalam suatu pasar swalayan adalah dapat diketahuinya berapa besar
Universitas Sumatera Utara
kemungkinan seorang pelanggan membeli kopi bersamaan dengan gula. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan
produknya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk korelasi barang tertentu.
Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. Secara khusus, salah satu
tahap analisis asosiasi yang menarik banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis pola frekuensi tinggi frequent pattern mining. Penting
tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support
dan confidence. Support
adalah presentasi kombinasi item tersebut dalam database,
sedangkan confidence adalah nilai probability suatu item akan dibeli bersama item
lain.
2.4 Algoritma Apriori