Membaca dari dan mengirim data ke berbagai sumber file teks, excel, database relational, dan sebagainya
Mampu menyesuaikan atau transformasi data Memiliki informasi metadata pada setiap perjalanan
transformasi Memiliki audit log yang baik
Dapat ditingkatkan performanya dengan scale up dan scale
out Mudah diimplementasikan.
Secara singkat dari proses ETL dapat dilihat pada gambar 2.3:
Gambar 2.3 Sistem Kerja Data Warehouse Sumber : Han dan Kamber. 2001
2.3. Model Data Multidimensi
2.3.1. Model Dimensional
Model dimensional merupakan perancangan logikal yang bertujuan untuk menampilkan data dalam bentuk standar dan
intuitif yang menggunakan konsep entity diagram atau model hubungan antar entitas. Setiap model dimensi terdiri dari sebuah
tabel dengan sebuah composite primary key yang disebut dengan tabel fakta dan satu set tabel yang lebih kecil yang disebut dengan
tabel dimensi. Berikut ini penjelasan dari beberapa ahli mengenai tabel fakta dan tabel dimensi.
Menurut Connolly dan Begg, tabel fakta merupakan sebuah tabel yang memiliki sebuah composite primary key dimana tabel
tersebut akan membentuk sebuah model dimensional. Menurut Poe, Klaver, dan Brobst, tabel fakta disebut juga
dengan tabel major, yang terdiri dari data sebenarnya dari suatu bisnis dan biasanya menggunakan pengukuran angka dan bisa
terdiri dari banyak baris dan kolom. Tabel dimensi disebut juga dengan tabel minor, lebih kecil
dari tabel fakta dan menyimpan penjelasan data yang mencerminkan dimensi-dimensi dari suatu bisnis.
Tabel dimensi merupakan sekumpulan dari tabel-tabel yang lebih kecil yang memiliki sebuah primary key sederhana yang
merespon secara benar terhadap salah satu dari composite key yang ada dari tabel fakta.
Susunan tabel fakta dan tabel dimensi memiliki standar perancangan atau skema karena terbukti meningkatkan peforma
dan kemudahan dalam penerjemahan ke sistem OLAP. Model dimensional yang sering digunakan adalah skema bintang star
schema dan skema butiran salju snowflake.
2.3.2. Skema Bintang
Pengertian skema bintang menurut Connolly 2010, adalah model data dimensional yang mempunyai sebuah tabel fakta yang
berisi data fakta ditengah dan dikelilingi oleh tabel-tabel dimensi yang terdiri dari data referensi yang biasanya dapat di
denormalisasi. Skema bintang mengambil karakteristik dari data fakta yang di-generate oleh event yang terjadi dimasa lampau.
Menurut Poe 1996, skema bintang adalah metode perancangan yang dilakukan dengan struktur sederhana dengan
menggunakan beberapa tabel dan hubungan antar tabel yang jelas. Skema bintang akan menghasilkan waktu respon yang cepat dalam
kueri data dibandingkan dengan proses transaksional yang menggunakan struktur normalisasi dan memudahkan end user
untuk memahami struktur basisdata pada gudang data yang dirancang.
Gambar 2.4 Contoh Star Schema Sumber: Connolly dan Begg. 2010
2.3.3. Kelebihan Menggunakan Skema Bintang
Skema bintang memiliki beberapa kelebihan, diantaranya yaitu :
1. Efisiensi Efficiency Struktur basis data yang konsisten sehingga lebih efisiensi
dalam akses data dengan menggunakan alat untuk menampilkan data seperti laporan tertulis dan kueri.
2. Kemampuan untuk mengatasi perubahan kebutuhan Ability to handle changing requirements, skema bintang dapat
beradaptasi terhadap perubahan kebutuhan pengguna, PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
karena semua tabel dimensi memiliki kesamaan hal memberikan akses ke tabel fakta.
3. Extensibility Model
dimensional dapat
dikembangkan, misalnya
menambahkan tabel fakta selama data masih konsisten, kemudian menambahkan dimensi baru selama ada nilai
tunggal dari dimensi tersebut yang mendefinisikan untuk setiap record tabel fakta yang ada, menambahkan atribut
pada dimensi baru dan memecah record tabel dimensi yang ada menjadi level atau tingkat yang lebih rendah dari level
sebelumnya. 4. Kemampuan untuk menggambarkan situasi bisnis Ability
to model common business situations, pendekatan standar untuk menangani situasi pemodelan dalam dunia bisnis,
dimana dalam situasi ini memiliki perangkat program yang dapat secara khusus menspesifikasikan ke dalam penulisan
laporan kueri dan antar pengguna yang lainnya. 5. Proses kueri yang dapat diprediksi Predictable query
processing, aplikasi gudang data yang mencari data dari level dibawahnya akan dengan mudah menambah jumlah
atribut pada tabel dimensi dari skema bintang. Aplikasi yang mencari data dari level yang setara akan
menghubungkan tabel fakta yang terpisah melalui tabel dimensi yang dapat diakses bersama.
6. End-user dapat
menyesuaikan cara
berfikir dan
menggunakan data. 7. Lebih mudah dipahami
2.3.4. Kekurangan Menggunakan Skema Bintang
Selain kelebihan dari skema bintang diatas, ada beberapa kekurangan bila menggunakan skema bintang, diantaranya adalah:
1. Pada penyimpanan
atau memory,
skema bintang
membutuhkan ukuran penyimpanan yang relatif besar. 2. Dalam melakukan perawatan maintenance dan update
lebih sulit, karena tabel yang tidak normal. 3. Long time loading dimension table, dalam loading pada
tabel dimensi dibutuhkan waktu yang cukup lama, ketika data yang dimiliki rendah dalam integritas dan nilai dalam
replika tinggi maka waktu untuk melakukan loading menjadi meningkat.
4. Skema bintang tidak fleksibel dalam hal kebutuhan analisis, seperti model data yang dinormalisasi jika data yang
dibutuhkan melakukan normalisasi. Skema bintang dibangun hanya untuk kebutuhan data tertentu, sehingga
tidak benar-benar memungkinkan analisis yang lebih kompleks.
5. Skema bintang tidak memiliki relasi many-to-many.
2.3.5. Skema Butiran Salju Snowflake
Menurut Connoly 2002, skema butiran salju Snowflake Schema merupakan bentuk lain dari skema bintang dimana data
dalam tabel dimensi belum dinormalisasi. Ciri-ciri dari skema butiran salju adalah :
1. Tabel dimensi dinormalisasi dengan dekomposisi pada level
atribut.
2. Setiap dimensi mempunyai satu kunci key untuk setiap
level pada hirarki dimensi.
3. Kunci level terendah menghubungkan tabel dimensi dengan
tabel fakta dan tabel atribut berlevel rendah.
Gambar 2.5 Contoh Snowflake Schema Sumber: Connolly dan Begg. 2010
2.3.6. Kelebihan Menggunakan Skema Snowflake
Kelebihan menggunakan skema butiran salju snowflake adalah :
1. Kecepatan memindahkan data dari data OLTP ke dalam metadata.
2. Sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi dimana dengan tipe yang seperti ini seluruh struktur
dapat digunakan sepenuhnya. 3. Banyak yang beranggapan lebih nyaman merancang dalam
bentuk normal ketiga. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.3.7. Kekurangan Menggunakan Skema Snowflake
1. Cenderung lebih sulit dipahami karena kompleksitasnya dimana tabel-tabel dimensi skema snowflake merupakan
normalisasi dari beberapa tabel yang berhubungan. 2. Memiliki masalah besar dalam hal performance atau
kinerja untuk melakukan kueri, hal ini disebabkan karena semakin banyaknya join antar tabel-tabel yang dilakukan
dalam skema snowflake maka semakin lambat kinerja yang dilakukan.
2.3.8. Cube, Dimension, Measure, dan Member
Pengertian dari dimension, measure dan member menurut
phi integration yaitu:
Cube adalah struktur multi dimensi konseptual, terdiri dari dimension dan measure dan biasanya mencakup pandangan
bisnis tertentu seperti penjualan. Dimension atau dimensi adalah struktur view atau sudut
pandang yang menyusun cube. Dimensi dapat terdiri dari berbagai level.
Measure adalah nilai pengukuran. Member adalah isi atau anggota dari suatu dimensional
measure tertentu.
2.3.9. Surrogate Key
Surrogate key adalah key kolom data di tabel dimensi yang menjadi primary key dari tabel tersebut. Nilai ini biasanya
berupa nilai sekuensial dan tidak memiliki arti dari proses bisnis darimana sumber data berasal. Surrogate key sendiri dibutuhkan
karena gudang data tidak hanya berasal dari satu sumber saja, melainkan dari banyak sumber.
2.4. Online Analytical Processing