Konsep Dasar Data Warehouse

BAB II LANDASAN TEORI

2.1. Konsep Dasar Data Warehouse

2.1.1. Pengertian Data

Menurut Inmon 2002, “Data adalah kumpulan fakta, konsep, atau instruksi dalam sebuah media penyimpanan untuk komunikasi, pengambilan, dan pengolahan yang bertujuan untuk penyediaan informasi yang dapat dipahami oleh manusia ”.

2.1.2. Pengertian Gudang Data

Gudang data memiliki banyak pengertian, berikut ini merupakan pengertian dari beberapa ahli, diantaranya: Menurut Inmon 2005, “Gudang data adalah koleksi data yang mempunyai sifat berorientasi subyek, terintegrasi, time-variant, tidak mengalami perubahan dan memiliki rentang waktu tertentu yang mendukung pengambilan keputusan dari pihak manajemen ”. Menurut Kimball dan Caserta 2004, “Gudang data adalah suatu sistem yang dapat mengekstrak, membersihkan, menyesuaikan, dan memberikan sumber data ke dalam data dimensi serta mendukung dan mengimplementasikan kueri dan analisis yang bertujuan untuk pengambilan keputusan ”. Menurut Lane 2007, gudang data merupakan database relasional yang didesain lebih kepada kueri dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber yang lain. Gudang data memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung atau konsolidasi data dari berbagai macam sumber. Berdasarkan tiga pengertian diatas maka dapat ditarik kesimpulan bahwa gudang data adalah sekumpulan data yang dapat mendukung proses pengambilan keputusan dalam suatu organisasi.

2.1.3. Karakteristik Gudang Data

Menurut Jiawei Han dan Micheline Kamber 2006 terdapat empat karakteristik data warehouse, diantaranya : 1. Subject-oriented Sebuah gudang data dibangun berdasarkan kebutuhan subject utama seperti customer, supplier, produk dan penjualan. Sebuah gudang data fokus pada pemodelan dan analisis data untuk pengambilan keputusan. 2. Integrated Sebuah gudang data dibangun dengan mengintegrasikan bermacam sumber heterogen seperti relational databases, flat files, dan catatan transaksi online. Pembersihan data dan teknik integrasi digunakan untuk memastikan konsistensi penamaan, struktur, atribut measure dan sebagainya. 3. Time-variant Data disimpan untuk menyediakan informasi dari tahun sebelumnya seperti 5-10 tahun yang lalu. Batasan waktu untuk gudang data akan lebih lama pada database operasional. 4. Nonvolatile Gudang data secara fisik terpisah dari penyimpanan data. Proses update tidak terjadi pada lingkungan gudang data. Sebuah gudang data tidak memerlukan proses transaksi, recovery, dan mekanisme control concurrency. Hanya dua operasi saat pengaksesan data yaitu initial loading of data dan access of data.

2.1.4. Arsitektur Gudang Data

Gudang data sering mengadopsi beberapa arsitektur, diantaranya yaitu three-tier seperti gambar 2.1 menurut Jiawei Han dan Micheline Kamber 2006: Gambar 2.1 Arsitektur Data Warehouse Sumber : Jiawei Han dan Micheline Kamber. 2006

a. Data warehouse server