Gambar 2.1 Star Schema dari PHI-Minimart 2.1.9.5
Surrogate key
Surrogate key adalah key kolom data di tabel dimensi yang menjadi primary
key dari tabel tersebut. Nilai ini biasanya berupa nilai sekuensial dan tidak
memiliki arti dari proses bisnis darimana sumber data berasal [10].
2.2 Penambangan Data Data Mining
“Penambangan data adalah proses pengolahan informasi dari sebuah database
yang besar, meliputi proses ekstraksi, pengenalan, komprehensif, dan penyajian informasi sehingga dapat digunakan dalam pengambilan
keputusan bisnis yang krusial “ Connolly dan Begg 2004, p1233. Sedangkan menurut Han dan Kamber 2006, p7., “Penambangan
Data adalah proses menambang mining pengetahuan dari sekumpulan data
yang sangat besar. “. Penambangan Data merupakan suatu langkah dalam knowledge discovery in database
KDD. Langkah-langkah dalam menemukan pengetahuan discovery knowledge
meliputi : 1. Data cleaning
Menghilangkan noise dan data yang tidak konsisten 2. Data integration
Menggabungkan berbagai sumber data 3. Data Selection
Menerima data yang berhubungan dnegan analisa dari database 4. Data transformation
Mengubah data ke bentuk yang sesuai untuk mining dengan melakukan agregasi atau summary
5. Data mining Melakukan proses mining untuk mengekstrak data
6. Pattern evaluation Mengidentifikasi pola yang menggambarkan pengetahuan knowledge
7. Knowledge presentation
Menampilkan mined knowledge kepada pengguna
Gambar 2.3 Langkah-Langkah Discovery Knowledge
Suatu sistem atau query data mining mungkin saja menghasilkan ribuan pola, namun tidak semua pola tersebut adalah pola yang menarik atau penting.
Ukuran suatu pola yang menarik atau penting adalah jika pola tersebut mudah dimengerti oleh manusia, bermanfaat, valid benar pada data baru atau data tes
dan membenarkna beberapa hipotesis. Penambangan data berkaitan erat dengan Gudang Data dan OLAP On-
Line Analytical Processing . Gudang Data merupakan data mentah yang akan
digunakan untuk analisa data menggunakan teknik penambangan data sedangkan OLAP adalah basisdata yang khusus digunakan untuk menunjang proses
pengambilan keputusan decision making. Teknologi yang ada di gudang data dan OLAP dimanfaatkan penuh untuk melakukan penambangan data.
Gambar 2.4 Data Mining dan teknologi basisdata lainnya
2.3 Metode Analisis Asosiasi