BAB II LANDASAN TEORI
2.1. Konsep Dasar Data Warehouse
2.1.1. Pengertian Data
Menurut Inmon 2002, “Data adalah kumpulan fakta, konsep, atau instruksi dalam
sebuah media penyimpanan untuk komunikasi, pengambilan, dan pengolahan yang bertujuan untuk penyediaan informasi yang
dapat dipahami oleh manusia ”.
2.1.2. Pengertian Gudang Data
Gudang data memiliki banyak pengertian, berikut ini merupakan pengertian dari beberapa ahli, diantaranya:
Menurut Inmon 2005, “Gudang data adalah koleksi data yang mempunyai sifat
berorientasi subyek, terintegrasi, time-variant, tidak mengalami perubahan dan memiliki rentang waktu tertentu yang mendukung
pengambilan keputusan dari pihak manajemen ”.
Menurut Kimball dan Caserta 2004, “Gudang data adalah suatu sistem yang dapat
mengekstrak, membersihkan, menyesuaikan, dan memberikan sumber data ke dalam data dimensi serta mendukung dan
mengimplementasikan kueri dan analisis yang bertujuan untuk pengambilan keputusan
”. Menurut Lane 2007, gudang data merupakan database
relasional yang didesain lebih kepada kueri dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses
transaksi dan bisa juga data dari sumber yang lain. Gudang data memisahkan beban kerja analisis dari beban kerja transaksi dan
memungkinkan organisasi menggabung atau konsolidasi data dari berbagai macam sumber.
Berdasarkan tiga pengertian diatas maka dapat ditarik kesimpulan bahwa gudang data adalah sekumpulan data yang dapat
mendukung proses pengambilan keputusan dalam suatu organisasi.
2.1.3. Karakteristik Gudang Data
Menurut Jiawei Han dan Micheline Kamber 2006 terdapat empat karakteristik data warehouse, diantaranya :
1. Subject-oriented Sebuah gudang data dibangun berdasarkan kebutuhan
subject utama seperti customer, supplier, produk dan penjualan. Sebuah gudang data fokus pada pemodelan dan
analisis data untuk pengambilan keputusan. 2. Integrated
Sebuah gudang data dibangun dengan mengintegrasikan bermacam sumber heterogen seperti relational databases, flat
files, dan catatan transaksi online. Pembersihan data dan teknik integrasi digunakan untuk memastikan konsistensi penamaan,
struktur, atribut measure dan sebagainya. 3. Time-variant
Data disimpan untuk menyediakan informasi dari tahun sebelumnya seperti 5-10 tahun yang lalu. Batasan waktu
untuk gudang data akan lebih lama pada database operasional. 4. Nonvolatile
Gudang data secara fisik terpisah dari penyimpanan data. Proses update tidak terjadi pada lingkungan gudang data.
Sebuah gudang data tidak memerlukan proses transaksi, recovery, dan mekanisme control concurrency. Hanya dua
operasi saat pengaksesan data yaitu initial loading of data dan access of data.
2.1.4. Arsitektur Gudang Data
Gudang data sering mengadopsi beberapa arsitektur, diantaranya yaitu three-tier seperti gambar 2.1 menurut Jiawei Han
dan Micheline Kamber 2006:
Gambar 2.1 Arsitektur Data Warehouse Sumber : Jiawei Han dan Micheline Kamber. 2006
a. Data warehouse server