22
2.2.3. Arsitektur Gudang Data
Banyak sekali arsitektur gudang data yang dikemukakan, akan tetapi pada umumnya memiliki bentuk seperti pada gambar 2.9 berikut :
Gambar 2.9 Arsitektur Data Warehouse Conolly dkk, 2008
2.2.4. Extract, Transform, Load ETL
Data yang akan diolah ke gudang data, pertama kali harus diekstak terlebih dahulu dari satu atau lebih sumber data, kemudian
ditransformasi ke bentuk yang lebih mudah untuk menganalisa dan konsisten atau bertipe sama dengan data yang telah ada di gudang, dan
akhirnya dimuat ke dalam gudang data. Seluruh proses ini disebut sebagai ekstraksi, transformasi dan loading ETL dan merupakan
proses yang penting dalam setiap proyek gudang data. Bila mengacu pada pernyataan di atas, maka gudang data
memerlukan kemampuan dalam hal sebagai berikut www.phi- Integration.com :
23 1. Membaca dari dan mengirim data ke berbagai sumber file
teks, excel, database relational, dan sebagainya. 2. Mampu menyesuaikan transformasi data.
3. Memiliki informasi meta data pada setiap perjalanan transformasi.
4. Memilikik auditlog yang baik. 5. Dapat ditingkatkan performanya dengan scale up dan scale
out. 6. Mudah diimplementasikan.
ETL terdiri dari 3 bagian utama, setiap bagian memiliki fungsi sesuai namanya.
1. Extract, semua proses yang diperlukan untuk terhubung
dengan beragamsumbr data, dan membuat data tersebut tersedia bagi proses-proses selanjutnya.
2. Transform, mengacu pada fungsi apa saja yang berfungsi
untuk mengubah data yang masuk menjadi data yang dikehendaki seperti pemindahan data, validasi data,
odifikasi struktur data, penggabungan data dari berbagai sumber, perhitungan, dan lain-lain.
3. Load, semua proses yang diperlukan untuk mengisi data
ke target.
24
2.2.5. Desain Gudang Data
Gudang data dapat diterapkan dengan mengikuti langkah-langkah pokok seperti berikut ini Wasito, 2010.
1. Membaca data legacy.
Memperhatikan bagian
–bagian data yang perlu untuk dibersihkan.
2. Menggabungkan data berbagai sumber terpisah.
Setiap jenis informasi yang diinginkan mungkin berasal dari beberapa file yang harus digabungkan untuk digunakan pada
gudang data. 3.
Memindahkan data dari sumber ke server gudang data. Membuat standarisasi format copy-kan data dari sumber
sekaligus data dibuat bersih clean. 4.
Memecah gudang data dalam tabel fakta dan tabel dimensi. Tabel fakta dan tabel dimensi disusun menurut kebutuhan
subyek.
2.2.6. Hubungan Datawarehouse dan OLAP
Kemampuan kita mengumpulkan dan menyimpan segala jenis data melampaui kemampuan kita melakukan analisis, peringkasan, dan
ekstraksi pengetahuan dari data. Untuk membentuk analisis data diperlukan kakas otomatis yang dapat membantu melakukan ekstraksi
dan penemuan pengetahuan dari data. Saat ini orang sudah sepakat bahwa informasi berkualitas tinggi adalah sangat penting dalamdunia