Membaca dari dan mengirim data ke berbagai sumber file teks,
excel, database relational,
dan sebagainya Mampu menyesuaikan atau transformasi data
Memiliki informasi metadata pada setiap perjalanan
transformasi Memiliki
audit log
yang baik Dapat ditingkatkan performanya dengan
scale up
dan
scale out
Mudah diimplementasikan. Secara singkat dari proses ETL dapat dilihat pada gambar 2.3:
Gambar 2.3 Sistem Kerja Data Warehouse Sumber : Han dan Kamber. 2001
2.3. Model Data Multidimensi
2.3.1. Model Dimensional
Model dimensional merupakan perancangan logikal yang bertujuan untuk menampilkan data dalam bentuk standar dan
intuitif yang menggunakan konsep
entity diagram
atau model hubungan antar entitas. Setiap model dimensi terdiri dari sebuah
tabel dengan sebuah
composite primary key
yang disebut dengan tabel fakta dan satu set tabel yang lebih kecil yang disebut dengan
tabel dimensi. Berikut ini penjelasan dari beberapa ahli mengenai tabel fakta dan tabel dimensi.
Menurut Connolly dan Begg, tabel fakta merupakan sebuah tabel yang memiliki sebuah
composite primary key
dimana tabel tersebut akan membentuk sebuah model dimensional.
Menurut Poe, Klaver, dan Brobst, tabel fakta disebut juga dengan tabel major, yang terdiri dari data sebenarnya dari suatu
bisnis dan biasanya menggunakan pengukuran angka dan bisa terdiri dari banyak baris dan kolom.
Tabel dimensi disebut juga dengan tabel minor, lebih kecil dari tabel fakta dan menyimpan penjelasan data yang
mencerminkan dimensi-dimensi dari suatu bisnis. Tabel dimensi merupakan sekumpulan dari tabel-tabel yang
lebih kecil yang memiliki sebuah
primary key
sederhana yang merespon secara benar terhadap salah satu dari
composite key
yang ada dari tabel fakta.
Susunan tabel fakta dan tabel dimensi memiliki standar perancangan atau skema karena terbukti meningkatkan peforma
dan kemudahan dalam penerjemahan ke sistem OLAP. Model dimensional yang sering digunakan adalah skema bintang
star schema
dan skema butiran salju
snowflake.
2.3.2. Skema Bintang
Pengertian skema bintang menurut Connolly 2010, adalah model data dimensional yang mempunyai sebuah tabel fakta yang
berisi data fakta ditengah dan dikelilingi oleh tabel-tabel dimensi yang terdiri dari data referensi yang biasanya dapat di
denormalisasi. Skema bintang mengambil karakteristik dari data fakta yang di-
generate
oleh
event
yang terjadi dimasa lampau. Menurut Poe 1996, skema bintang adalah metode
perancangan yang dilakukan dengan struktur sederhana dengan PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
menggunakan beberapa tabel dan hubungan antar tabel yang jelas. Skema bintang akan menghasilkan waktu respon yang cepat dalam
kueri data dibandingkan dengan proses transaksional yang menggunakan struktur normalisasi dan memudahkan
end user
untuk memahami struktur basisdata pada gudang data yang dirancang.
Gambar 2.4 Contoh Star Schema Sumber: Connolly dan Begg. 2010
2.3.3. Kelebihan Menggunakan Skema Bintang