Penambangan Data Data Mining

Gambar 2.1 Star Schema dari PHI-Minimart 2.1.9.5 Surrogate key Surrogate key adalah key kolom data di tabel dimensi yang menjadi primary key dari tabel tersebut. Nilai ini biasanya berupa nilai sekuensial dan tidak memiliki arti dari proses bisnis darimana sumber data berasal [10].

2.2 Penambangan Data Data Mining

“Penambangan data adalah proses pengolahan informasi dari sebuah database yang besar, meliputi proses ekstraksi, pengenalan, komprehensif, dan penyajian informasi sehingga dapat digunakan dalam pengambilan keputusan bisnis yang krusial “ Connolly dan Begg 2004, p1233. Sedangkan menurut Han dan Kamber 2006, p7., “Penambangan Data adalah proses menambang mining pengetahuan dari sekumpulan data yang sangat besar. “. Penambangan Data merupakan suatu langkah dalam knowledge discovery in database KDD. Langkah-langkah dalam menemukan pengetahuan discovery knowledge meliputi : 1. Data cleaning Menghilangkan noise dan data yang tidak konsisten 2. Data integration Menggabungkan berbagai sumber data 3. Data Selection Menerima data yang berhubungan dnegan analisa dari database 4. Data transformation Mengubah data ke bentuk yang sesuai untuk mining dengan melakukan agregasi atau summary 5. Data mining Melakukan proses mining untuk mengekstrak data 6. Pattern evaluation Mengidentifikasi pola yang menggambarkan pengetahuan knowledge 7. Knowledge presentation Menampilkan mined knowledge kepada pengguna Gambar 2.3 Langkah-Langkah Discovery Knowledge Suatu sistem atau query data mining mungkin saja menghasilkan ribuan pola, namun tidak semua pola tersebut adalah pola yang menarik atau penting. Ukuran suatu pola yang menarik atau penting adalah jika pola tersebut mudah dimengerti oleh manusia, bermanfaat, valid benar pada data baru atau data tes dan membenarkna beberapa hipotesis. Penambangan data berkaitan erat dengan Gudang Data dan OLAP On- Line Analytical Processing . Gudang Data merupakan data mentah yang akan digunakan untuk analisa data menggunakan teknik penambangan data sedangkan OLAP adalah basisdata yang khusus digunakan untuk menunjang proses pengambilan keputusan decision making. Teknologi yang ada di gudang data dan OLAP dimanfaatkan penuh untuk melakukan penambangan data. Gambar 2.4 Data Mining dan teknologi basisdata lainnya

2.3 Metode Analisis Asosiasi