BAB II LANDASAN TEORI
2.1. Konsep Dasar
Data Warehouse
2.1.1. Pengertian Data
Menurut Inmon 2002, “Data adalah kumpulan fakta, konsep, atau instruksi dalam
sebuah media penyimpanan untuk komunikasi, pengambilan, dan pengolahan yang bertujuan untuk penyediaan informasi yang
dapat dipahami oleh manusia
”
.
2.1.2. Pengertian Gudang Data
Gudang data memiliki banyak pengertian, berikut ini merupakan pengertian dari beberapa ahli, diantaranya:
Menurut Inmon 2005, “
Gudang data adalah koleksi data yang mempunyai sifat berorientasi subyek, terintegrasi, time-variant, tidak mengalami
perubahan dan memiliki rentang waktu tertentu yang mendukung pengambilan keputusan dari pihak manajemen
”
.
Menurut Kimball dan Caserta 2004, “
Gudang data
adalah suatu
sistem yang
dapat mengekstrak, membersihkan, menyesuaikan, dan memberikan
sumber data ke dalam data dimensi serta mendukung dan mengimplementasikan kueri dan analisis yang bertujuan untuk
pengambilan keputusan
”
.
Menurut Lane 2007, gudang data merupakan database relasional yang didesain lebih kepada kueri dan analisa dari pada
proses transaksi, biasanya mengandung
history
data dari proses transaksi dan bisa juga data dari sumber yang lain. Gudang data
memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung atau konsolidasi data dari
berbagai macam sumber. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Berdasarkan tiga pengertian diatas maka dapat ditarik kesimpulan bahwa gudang data adalah sekumpulan data yang dapat
mendukung proses pengambilan keputusan dalam suatu organisasi.
2.1.3. Karakteristik Gudang Data
Menurut Jiawei Han dan Micheline Kamber 2006 terdapat empat karakteristik
data warehouse,
diantaranya : 1.
Subject-oriented
Sebuah gudang data dibangun berdasarkan kebutuhan subject utama seperti
customer
,
supplier,
produk dan penjualan. Sebuah gudang data fokus pada pemodelan dan
analisis data untuk pengambilan keputusan. 2.
Integrated
Sebuah gudang data dibangun dengan mengintegrasikan bermacam sumber heterogen seperti
relational databases
,
flat files,
dan catatan transaksi
online.
Pembersihan data dan teknik integrasi digunakan untuk memastikan konsistensi penamaan,
struktur, atribut
measure
dan sebagainya. 3.
Time-variant
Data disimpan untuk menyediakan informasi dari tahun sebelumnya seperti 5-10 tahun yang lalu. Batasan waktu
untuk gudang data akan lebih lama pada database operasional. 4.
Nonvolatile
Gudang data secara fisik terpisah dari penyimpanan data. Proses
update
tidak terjadi pada lingkungan gudang data. Sebuah gudang data tidak memerlukan proses transaksi,
recovery,
dan mekanisme
control concurrency.
Hanya dua operasi saat pengaksesan data yaitu
initial loading of data
dan
access of data.
2.1.4. Arsitektur Gudang Data