K4
Menurut Connolly dan Begg, perbedaan OLTP dan OLAP adalah sebagai berikut:
Tabel 2.1 Perbedaan OLTP dan OLAP
Fitur OLTP
OLAP Karakteristik
Proses operasional Proses Informasi
Orientasi Transaksi
Analysis Fungsi
Menangani transaksi sehari- hari
Kebutuhan informasi jangka panjang, pendukung keputusan
Desain Database Berorientasi pada aplikasi
StarSnowflake Schema Data
Data up-to-date Data histori
Unit Kerja Transaksi sederhana
Complex query
2.6.7. Extract, Transform, Loag ETL
1. Extraction Proses pemindahan dari suatu proses ETL adalah mengekstrak data
dari sumber data. Disebut ekstrak, karena proses pengambilan data ini tidak mengambil keseluruhan data yang ada di database operasional,
mengambil data matang saja. Menurut Kimball dan Ross 1998, extraction adalah langkah pertama dalam proses mendapatkan data ke
dalam lingkungan gudang data. Proses extraction ini meliputi
penyaringan data yang akan melainkan hanya mengambil data matang
K5
saja. Proses ini meliputi penyaringan data yang akan digunkana dalam pembuatan gudang data. Dapat langsung dimasukkan dalam
penampungan sementara terlebih dahulu. Pada hakikatnya bagian dari ekstraksi melibatkan penguraian dari
data yang telah diekstrak, menghasilkan suatu pengecekan jika data bertemu dengan suatu struktur atau pola yang diharapkan. Jika bukan,
data tersebut mungkin ditolak secara keseluruhan. K. Transformation
Proses yang ke dua adalah transformasi data yang telah diekstrak ke dalam format yang diperlukan. Hal ini perlu dilakukan mengingat data
yang diambil berasal dari sumber yang berbeda yang kemungkinan memiliki standarisasi yang berbeda pula. Data dari beberapa sistem
perlu ditransformasi ke dalam format umum yang disepakati dan digunakan dalam gudang data.
Menurut Kimball dan Ross 1998, setelah data diesktrak ada sejumlah transformasi yang mungkin dilakukan, seperti melakukan
pembersihan data memperbaiki kesalahan pengejaan kata, mengatasi masalah elemen yang hilang, atau mengubah ke bentuk standar,
mengkombinasikan data dari berbagai sumber, dan memberikan warehouse keys.
K6
Berikut adalah hal-hal yang digunakan dalam tahap transformasi :
Hanya memilih kolom tertentu saja memasukkan ke dalam data warehouse.
Menterjemahkan nilai-nilai yang berupa kode.
Mengkodekan nilai-nilai kedalam bentuk bebas contoh :
memetakan “pria” ke dalam “p”.
Melakukan perhitungan nilai-nilai barucontoh : nilai-qtyharga .
Menggabungkan data dari berbagai sumber.
Membuat ringkasan dari kumpulan data.
Menentukan nilai surrogate key.
Transposing atau pivoting mengubah sekumpulan kolom menjadi sekumpulan baris atau sebaliknya.
Memisahkan sebuah kolom menjadi beberapa kolom.
Menggunakan berbagai bentuk validasi data baik yang sederhana
maupun kompleks. 3. Loading
Tahap load adalah men-load data ke dalam target akhir end-target, yang pada umumnya adalah data warehouse DW. Bergantung pada
kebutuhan organisasi, proses ini bervariasi secara luas. Beberapa gudang
K7
data memperbolehkan melakukan penulisan informasi yang ada secara kumulatif, dengan data yang diperbarui tiap minggu, ketika DW lain
atau bahkan bagian lain dari DW yang sama boleh menambahkan data baru dalam format historis, sebagai contoh, tiap jam. Pemilihan waktu
dan lingkup untuk menggantikan atau menambahkan aneka pilihan desain strategi bergantung pada waktu yang tersediadan kebutuhan
bisnis tersebut. Kebanyakan sistem yang komplek dapat memelihara suatu histori dan jejak audit dari semua perubahan yang ada ke data
yang di-load ke dalam gudang data. Menurut Kimball dan Ross 1998, setelah melakukan transformasi,
maka data dapat dimuat ke dalam gudang data. Menurut Tod Saunders K009, dalam gudang data, salah satu bagian terbesar dalam
pengembangan adalah proses ETL Extract, Transform, Loading yang berarti mengambil data dari titik A sumber system, kemudian
mentransformasi data contohnya mengubah euro menjadi US dollar dan loading ke titik B tabel yang benar dalam gudang data.
K8
Gambar 2.3 Sistem kerja Gudang Data
2.6.8. Pemodelan Gudang Data 2.6.8.1. Dimensional Modeling