Extract, Transform, Loag ETL

K4 Menurut Connolly dan Begg, perbedaan OLTP dan OLAP adalah sebagai berikut: Tabel 2.1 Perbedaan OLTP dan OLAP Fitur OLTP OLAP Karakteristik Proses operasional Proses Informasi Orientasi Transaksi Analysis Fungsi Menangani transaksi sehari- hari Kebutuhan informasi jangka panjang, pendukung keputusan Desain Database Berorientasi pada aplikasi StarSnowflake Schema Data Data up-to-date Data histori Unit Kerja Transaksi sederhana Complex query

2.6.7. Extract, Transform, Loag ETL

1. Extraction Proses pemindahan dari suatu proses ETL adalah mengekstrak data dari sumber data. Disebut ekstrak, karena proses pengambilan data ini tidak mengambil keseluruhan data yang ada di database operasional, mengambil data matang saja. Menurut Kimball dan Ross 1998, extraction adalah langkah pertama dalam proses mendapatkan data ke dalam lingkungan gudang data. Proses extraction ini meliputi penyaringan data yang akan melainkan hanya mengambil data matang K5 saja. Proses ini meliputi penyaringan data yang akan digunkana dalam pembuatan gudang data. Dapat langsung dimasukkan dalam penampungan sementara terlebih dahulu. Pada hakikatnya bagian dari ekstraksi melibatkan penguraian dari data yang telah diekstrak, menghasilkan suatu pengecekan jika data bertemu dengan suatu struktur atau pola yang diharapkan. Jika bukan, data tersebut mungkin ditolak secara keseluruhan. K. Transformation Proses yang ke dua adalah transformasi data yang telah diekstrak ke dalam format yang diperlukan. Hal ini perlu dilakukan mengingat data yang diambil berasal dari sumber yang berbeda yang kemungkinan memiliki standarisasi yang berbeda pula. Data dari beberapa sistem perlu ditransformasi ke dalam format umum yang disepakati dan digunakan dalam gudang data. Menurut Kimball dan Ross 1998, setelah data diesktrak ada sejumlah transformasi yang mungkin dilakukan, seperti melakukan pembersihan data memperbaiki kesalahan pengejaan kata, mengatasi masalah elemen yang hilang, atau mengubah ke bentuk standar, mengkombinasikan data dari berbagai sumber, dan memberikan warehouse keys. K6 Berikut adalah hal-hal yang digunakan dalam tahap transformasi :  Hanya memilih kolom tertentu saja memasukkan ke dalam data warehouse.  Menterjemahkan nilai-nilai yang berupa kode.  Mengkodekan nilai-nilai kedalam bentuk bebas contoh : memetakan “pria” ke dalam “p”.  Melakukan perhitungan nilai-nilai barucontoh : nilai-qtyharga .  Menggabungkan data dari berbagai sumber.  Membuat ringkasan dari kumpulan data.  Menentukan nilai surrogate key.  Transposing atau pivoting mengubah sekumpulan kolom menjadi sekumpulan baris atau sebaliknya.  Memisahkan sebuah kolom menjadi beberapa kolom.  Menggunakan berbagai bentuk validasi data baik yang sederhana maupun kompleks. 3. Loading Tahap load adalah men-load data ke dalam target akhir end-target, yang pada umumnya adalah data warehouse DW. Bergantung pada kebutuhan organisasi, proses ini bervariasi secara luas. Beberapa gudang K7 data memperbolehkan melakukan penulisan informasi yang ada secara kumulatif, dengan data yang diperbarui tiap minggu, ketika DW lain atau bahkan bagian lain dari DW yang sama boleh menambahkan data baru dalam format historis, sebagai contoh, tiap jam. Pemilihan waktu dan lingkup untuk menggantikan atau menambahkan aneka pilihan desain strategi bergantung pada waktu yang tersediadan kebutuhan bisnis tersebut. Kebanyakan sistem yang komplek dapat memelihara suatu histori dan jejak audit dari semua perubahan yang ada ke data yang di-load ke dalam gudang data. Menurut Kimball dan Ross 1998, setelah melakukan transformasi, maka data dapat dimuat ke dalam gudang data. Menurut Tod Saunders K009, dalam gudang data, salah satu bagian terbesar dalam pengembangan adalah proses ETL Extract, Transform, Loading yang berarti mengambil data dari titik A sumber system, kemudian mentransformasi data contohnya mengubah euro menjadi US dollar dan loading ke titik B tabel yang benar dalam gudang data. K8 Gambar 2.3 Sistem kerja Gudang Data 2.6.8. Pemodelan Gudang Data 2.6.8.1. Dimensional Modeling