Komponen Gudang Data Gudang Data 1. Pengertian Gudang Data

2. Menurut Paul Lane, gudang data merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Gudang data memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabungkonsolidasi data dari berbagai macam sumber.[3] 3. Menurut Vidette Poe, gudang data merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan. [4] Dari pengertian-pengertian mengenai gudang data di atas, maka dapat disimpulkan bahwa gudang data adalah database yang didesain untuk mengarsipkan dan menganalisis data untuk mendapatkan analisa yang lebih baik dari data yang berjumlah sangat besar yang digunakan untuk membantu para pengambil keputusan.

2.2.2. Komponen Gudang Data

Komponen dalam gudang data yaitu [5] : 1. Sumber Data Data Source Untuk membangun suatu gudang data yang baik, data yang didapatkan harus teralokasi dengan baik. Ini melibatkan OLTP saat ini, dimana informasi ‘dari hari ke hari’ tentang bisnis yang berjalan, tentunya dengan data historis periode sebelumnya, yang mungkin telah dikumpulkan dalam beberapa bentuk sistem lain. Sering kali data yang terbentuk bukan database relasional sehingga membutuhkan banyak upaya untuk mengambil data yang diinginkan. 2. Desain Gudang Data Proses perancangan gudang data sangat berhati-hati dalam memilih jenis query yang digunakan. Tahapan ini memerlukan pemahaman yang baik tentang skema database yang akan dibuat, dan harus selalu aktif untuk berkomunikasi dengan pengguna. Desain adalah proses yang tidak dilakukan satu kali, melainkan berulang-ulang agar model yang dimiliki stabil. Tahap ini harus dilakukan secara berhati-hati karena model akan diisi dengan data dengan jumlah yang banyak, yang salah satunya dari beberapa model adalah model yang tak dapat diubah. 3. Akuisi Data Akuisi data merupakan proses perpindahan data dari sumbernya source ke gudang data. Proses ini merupakan proses yang memerlukan banyak waktu dalam proyek gudang data dan dilakukan dengan software yang dikenal dengan ETL Extract, Transform, Load Tools. 4. Perubahan Data Capture Pembaharuan data periodik gudang data dari sistem transaksi menjadi rumit karena harus diidentifikasi dari sumber data yang selalu up to date . Tahapan ini disebut dengan ‘perubahan data capture’. 5. Pembersihan Data Tahapan ini biasanya dilakukan dengan akuisisi data dan dalam proses ETL Extract, Transform, Load terdapat pada bagian ‘Transform’. Ide dibalik pembuatan gudang data adalah untuk memudahkan pengambilan keputusan, jika keputusan besar ditunjang oleh data yang tidak valid maka perusahaan mengalami resiko yang amat besar pula. Pembersihan data merupakan suatu proses rumit yang memvalidasi dan bila perlu data dikoreksi sebelum masuk ke dalam gudang data. Pembersihan data dapat juga disebut sebagai “data scrubbing” atau “penjamin kualitas data”. Proses ini harus dilakukan secara berhati-hati dan dilakukan secara keseluruhan terutama gudang data yang diambil dari perangkat yang sudah tua. 6. Data Aggregation Tahapan ini termasuk proses tansformasi, di mana gudang data dirancang untuk menyimpanan data yang amat detil dari tiap transaksi, untuk beberapa tingkat aggregate ringkasan. Keuntungan apabila data diringkas yaitu query khusus dalam gudang data dapat berjalan lebih cepat. Kekurangannya adalah informasi yang didapat kurang, karena ringkasnya data yang ada pada gudang data. Ini harus berhati-hati karena keputusan tidak dapat dibatalkan tanpa membangun kembali gudang data dan mencocokan dengan gudang data lain atau sumber data lain. Paling aman digunakan oleh perusahaan yang amat besar, yang mampu membangun gudang data tingkat detail yang tinggi dengan biaya yang besar pula.

2.2.3. Karakteristik Gudang Data