Model Data Multidimensi LANDASAN TEORI

 Membaca dari dan mengirim data ke berbagai sumber file teks, excel, database relational, dan sebagainya  Mampu menyesuaikan atau transformasi data  Memiliki informasi metadata pada setiap perjalanan transformasi  Memiliki audit log yang baik  Dapat ditingkatkan performanya dengan scale up dan scale out  Mudah diimplementasikan. Secara singkat dari proses ETL dapat dilihat pada gambar 2.3: Gambar 2.3 Sistem Kerja Data Warehouse Sumber : Han dan Kamber. 2001

2.3. Model Data Multidimensi

2.3.1. Model Dimensional

Model dimensional merupakan perancangan logikal yang bertujuan untuk menampilkan data dalam bentuk standar dan intuitif yang menggunakan konsep entity diagram atau model hubungan antar entitas. Setiap model dimensi terdiri dari sebuah tabel dengan sebuah composite primary key yang disebut dengan tabel fakta dan satu set tabel yang lebih kecil yang disebut dengan tabel dimensi. Berikut ini penjelasan dari beberapa ahli mengenai tabel fakta dan tabel dimensi. Menurut Connolly dan Begg, tabel fakta merupakan sebuah tabel yang memiliki sebuah composite primary key dimana tabel tersebut akan membentuk sebuah model dimensional. Menurut Poe, Klaver, dan Brobst, tabel fakta disebut juga dengan tabel major, yang terdiri dari data sebenarnya dari suatu bisnis dan biasanya menggunakan pengukuran angka dan bisa terdiri dari banyak baris dan kolom. Tabel dimensi disebut juga dengan tabel minor, lebih kecil dari tabel fakta dan menyimpan penjelasan data yang mencerminkan dimensi-dimensi dari suatu bisnis. Tabel dimensi merupakan sekumpulan dari tabel-tabel yang lebih kecil yang memiliki sebuah primary key sederhana yang merespon secara benar terhadap salah satu dari composite key yang ada dari tabel fakta. Susunan tabel fakta dan tabel dimensi memiliki standar perancangan atau skema karena terbukti meningkatkan peforma dan kemudahan dalam penerjemahan ke sistem OLAP. Model dimensional yang sering digunakan adalah skema bintang star schema dan skema butiran salju snowflake.

2.3.2. Skema Bintang

Pengertian skema bintang menurut Connolly 2010, adalah model data dimensional yang mempunyai sebuah tabel fakta yang berisi data fakta ditengah dan dikelilingi oleh tabel-tabel dimensi yang terdiri dari data referensi yang biasanya dapat di denormalisasi. Skema bintang mengambil karakteristik dari data fakta yang di-generate oleh event yang terjadi dimasa lampau. Menurut Poe 1996, skema bintang adalah metode perancangan yang dilakukan dengan struktur sederhana dengan menggunakan beberapa tabel dan hubungan antar tabel yang jelas. Skema bintang akan menghasilkan waktu respon yang cepat dalam kueri data dibandingkan dengan proses transaksional yang menggunakan struktur normalisasi dan memudahkan end user untuk memahami struktur basisdata pada gudang data yang dirancang. Gambar 2.4 Contoh Star Schema Sumber: Connolly dan Begg. 2010

2.3.3. Kelebihan Menggunakan Skema Bintang

Skema bintang memiliki beberapa kelebihan, diantaranya yaitu : 1. Efisiensi Efficiency Struktur basis data yang konsisten sehingga lebih efisiensi dalam akses data dengan menggunakan alat untuk menampilkan data seperti laporan tertulis dan kueri. 2. Kemampuan untuk mengatasi perubahan kebutuhan Ability to handle changing requirements, skema bintang dapat beradaptasi terhadap perubahan kebutuhan pengguna, PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI karena semua tabel dimensi memiliki kesamaan hal memberikan akses ke tabel fakta. 3. Extensibility Model dimensional dapat dikembangkan, misalnya menambahkan tabel fakta selama data masih konsisten, kemudian menambahkan dimensi baru selama ada nilai tunggal dari dimensi tersebut yang mendefinisikan untuk setiap record tabel fakta yang ada, menambahkan atribut pada dimensi baru dan memecah record tabel dimensi yang ada menjadi level atau tingkat yang lebih rendah dari level sebelumnya. 4. Kemampuan untuk menggambarkan situasi bisnis Ability to model common business situations, pendekatan standar untuk menangani situasi pemodelan dalam dunia bisnis, dimana dalam situasi ini memiliki perangkat program yang dapat secara khusus menspesifikasikan ke dalam penulisan laporan kueri dan antar pengguna yang lainnya. 5. Proses kueri yang dapat diprediksi Predictable query processing, aplikasi gudang data yang mencari data dari level dibawahnya akan dengan mudah menambah jumlah atribut pada tabel dimensi dari skema bintang. Aplikasi yang mencari data dari level yang setara akan menghubungkan tabel fakta yang terpisah melalui tabel dimensi yang dapat diakses bersama. 6. End-user dapat menyesuaikan cara berfikir dan menggunakan data. 7. Lebih mudah dipahami

2.3.4. Kekurangan Menggunakan Skema Bintang

Selain kelebihan dari skema bintang diatas, ada beberapa kekurangan bila menggunakan skema bintang, diantaranya adalah: 1. Pada penyimpanan atau memory, skema bintang membutuhkan ukuran penyimpanan yang relatif besar. 2. Dalam melakukan perawatan maintenance dan update lebih sulit, karena tabel yang tidak normal. 3. Long time loading dimension table, dalam loading pada tabel dimensi dibutuhkan waktu yang cukup lama, ketika data yang dimiliki rendah dalam integritas dan nilai dalam replika tinggi maka waktu untuk melakukan loading menjadi meningkat. 4. Skema bintang tidak fleksibel dalam hal kebutuhan analisis, seperti model data yang dinormalisasi jika data yang dibutuhkan melakukan normalisasi. Skema bintang dibangun hanya untuk kebutuhan data tertentu, sehingga tidak benar-benar memungkinkan analisis yang lebih kompleks. 5. Skema bintang tidak memiliki relasi many-to-many.

2.3.5. Skema Butiran Salju Snowflake

Menurut Connoly 2002, skema butiran salju Snowflake Schema merupakan bentuk lain dari skema bintang dimana data dalam tabel dimensi belum dinormalisasi. Ciri-ciri dari skema butiran salju adalah : 1. Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut. 2. Setiap dimensi mempunyai satu kunci key untuk setiap level pada hirarki dimensi. 3. Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan tabel atribut berlevel rendah. Gambar 2.5 Contoh Snowflake Schema Sumber: Connolly dan Begg. 2010

2.3.6. Kelebihan Menggunakan Skema Snowflake

Kelebihan menggunakan skema butiran salju snowflake adalah : 1. Kecepatan memindahkan data dari data OLTP ke dalam metadata. 2. Sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi dimana dengan tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya. 3. Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal ketiga. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

2.3.7. Kekurangan Menggunakan Skema Snowflake

1. Cenderung lebih sulit dipahami karena kompleksitasnya dimana tabel-tabel dimensi skema snowflake merupakan normalisasi dari beberapa tabel yang berhubungan. 2. Memiliki masalah besar dalam hal performance atau kinerja untuk melakukan kueri, hal ini disebabkan karena semakin banyaknya join antar tabel-tabel yang dilakukan dalam skema snowflake maka semakin lambat kinerja yang dilakukan.

2.3.8. Cube, Dimension, Measure, dan Member

Pengertian dari dimension, measure dan member menurut phi integration yaitu:  Cube adalah struktur multi dimensi konseptual, terdiri dari dimension dan measure dan biasanya mencakup pandangan bisnis tertentu seperti penjualan.  Dimension atau dimensi adalah struktur view atau sudut pandang yang menyusun cube. Dimensi dapat terdiri dari berbagai level.  Measure adalah nilai pengukuran.  Member adalah isi atau anggota dari suatu dimensional measure tertentu.

2.3.9. Surrogate Key

Surrogate key adalah key kolom data di tabel dimensi yang menjadi primary key dari tabel tersebut. Nilai ini biasanya berupa nilai sekuensial dan tidak memiliki arti dari proses bisnis darimana sumber data berasal. Surrogate key sendiri dibutuhkan karena gudang data tidak hanya berasal dari satu sumber saja, melainkan dari banyak sumber.

2.4. Online Analytical Processing