2. Kesalahan dalam membuat kerangka arsitektur data
warehouse Kerangka adalah blue print untuk membangun dan
menggunakan berbagai komponen data warehouse. Bila terjadi kesalahan dalam pembuatan kerangka maka akan berakibat fatal,
karena kerangka arsitektur data warehouse sangat penting. 3.
Ketidakmampuan menyusun asumsi Asumsi dan data potensial harus dimasukan ke dalam
kerangka data warehouse, asumsi yang harus dipersiapkan antara lain :
a. Jumlah data yang akan dimasukan kedalam data warehouse.
b. Berapa sering data harus diperbahurui dilakukan update?
c. Dimanakah data warehouse akan ditempatkan?
4. Kesalahan dalam menentukan peralatan
Untuk memilih peralatan dalam membangun data warehouse harus sangat tepat.karena dalam membangun data warehouse
menggunakan peralatan yang berbeda dengan peralatan yang digunakan untuk membangun sistem operasional.
5. Kesalahan siklus hidup data warehouse.
Siklus hidup data warehouse berbeda dengan system development life cycle SDLC
. Meski terdapat kesamaan namun ada perbedaan mendasar yaitu siklus hidup data warehouse tidak
pernah berakhir, selalu berlanjut sehingga perlu selalu diperbaharui.
6. Kecenderungan membatalkan data
Kecenderungan membatalkan data yang mengandung perbedaan. Perlu dilakukan penyesuaian terhadap data yang
berbeda dan bukan menghilangkan data, karena redudansi data wajar terjadi di dalam data warehouse.
7. Menggagalkan dokumen jika terjadi kesalahan
2.2 Extract, Transform, and Load ETL
Proses Extract, Transform and Load ETL adalah proses untuk melakukan extract data. Kemudian dari extract berbagai macam data
akan dilakukan transformasi data kemudian dilakukan proses load kedalam data warehouse. Untuk itu dapat di katakana proses ETL dibagi
menjadi tiga proses besar yaitu: 1.
Extract Mengumpulkan data dari multiple, heterogeneous dan external
sources. 2.
Transform Mengubah data dari format asli legacy kedalam format data
warehouse. 3.
Load Merupakan proses untuk membuat rangkuman informasi yang sudah
diolah dan membangun indeks serta partisi untuk disajikan kedalam computer views
.
2.3 Multi Dimensional Modeling
2.3.1 Cube, Dimension, Measure dan Member
OLAP menggunakan multi dimensional modeling, artinya kita dapat melihat analisis pengukuran dengan pandangan berbagai dimensi.
Dalam konsep OLAP kita akan mengerti beberapa istilah berkaitan dengan OLAP :
1. Cube
: cube adalah struktur multi dimensional konseptual yang terdiri dari dimension dan measure. Biasanya mencakup pandangan bisnis
tertentu. 2.
Dimension : dimensi adalah struktur view sudut pandang yang akan
menyusun cube. Demensi terdiri dari berbagai macam level. 3.
Measure : nilai pengukuran itu sendiri.
4. Member :
anggota dari dimensi measure tertentu. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.3.2 Fact Table dan Dimension Table
Tabel fakta adalah tabel dimensional yang akan menyimpan data numeric
dan berisi composite primary key. Tabel dimensi adalah sekumpulan tabel-tabel yang lebih kecil dari tabel fakta pada model
dimensional yang berisi pointer sehingga dapat menunjukan data ditabel terpisah. Setiap tabel dimensi memiliki non-composite primary key
Connolly dkk, 2005. Di dalam model multi dimensional , database terdiri dari beberapa
tabel fakta dan beberapa tabel dimensi yang saling terkait. Tabel fakta berisi nilai dari agregasi yang menjadi pengukuran measure serta
beberapa key yang terkait ke tabel dimensi yang menjadi sudut pandang dari measure tersebut. Dalam perkembangannya, susunan tabel fakta dan
tabel dimensi memiliki standar perancangan atau schema karena dapat meningkatkan performa dan kemudahan dalam penerjemahan ke OLAP.
Schema inilah yang menjadi dasar untuk melakukan data warehousing.
Salah satu schema yang umum digunakan adalah skema bintang star schema
yang dapat diterapkan di berbagai OLAP engine.
2.4 Skema Kristal Salju Snowflake schema dan Skema Bintang
Menurut Connolly dan Begg 2010, skema snowflake adalah variasi lain dari skema bintang dimana tabel dimensi tidak berisi data yang denormalized.
Suatu tabel dimensi dapat memiliki tabel dimensi lainnya. Skema bintang star schema adalah struktur logical yang memiliki sebuah
tabel fakta yang berisi data factual yang diletakan di tengah dan di kelilingi oleh tabel dimensi yang berisi data refrensi. Skema bintang mengeksploitasi
karakteristik dari data factual di mana fakta dibuat dari peristiwa yang muncul di masa lalu dan tidak mungkin berubah, dengan mengabaikan bagaimana data
dianalisis. Penting untuk memperlakukan data fakta sebagai data refrensi yang dapat dibaca read only refrence data yang tidak akan berubah sepanjang
waktu Connolly dkk, 2005. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI