Langkah Pembuatan Data Warehouse Implementasi Data Warehouse

2. Kesalahan dalam membuat kerangka arsitektur data warehouse Kerangka adalah blue print untuk membangun dan menggunakan berbagai komponen data warehouse. Bila terjadi kesalahan dalam pembuatan kerangka maka akan berakibat fatal, karena kerangka arsitektur data warehouse sangat penting. 3. Ketidakmampuan menyusun asumsi Asumsi dan data potensial harus dimasukan ke dalam kerangka data warehouse, asumsi yang harus dipersiapkan antara lain : a. Jumlah data yang akan dimasukan kedalam data warehouse. b. Berapa sering data harus diperbahurui dilakukan update? c. Dimanakah data warehouse akan ditempatkan? 4. Kesalahan dalam menentukan peralatan Untuk memilih peralatan dalam membangun data warehouse harus sangat tepat.karena dalam membangun data warehouse menggunakan peralatan yang berbeda dengan peralatan yang digunakan untuk membangun sistem operasional. 5. Kesalahan siklus hidup data warehouse. Siklus hidup data warehouse berbeda dengan system development life cycle SDLC . Meski terdapat kesamaan namun ada perbedaan mendasar yaitu siklus hidup data warehouse tidak pernah berakhir, selalu berlanjut sehingga perlu selalu diperbaharui. 6. Kecenderungan membatalkan data Kecenderungan membatalkan data yang mengandung perbedaan. Perlu dilakukan penyesuaian terhadap data yang berbeda dan bukan menghilangkan data, karena redudansi data wajar terjadi di dalam data warehouse. 7. Menggagalkan dokumen jika terjadi kesalahan

2.2 Extract, Transform, and Load ETL

Proses Extract, Transform and Load ETL adalah proses untuk melakukan extract data. Kemudian dari extract berbagai macam data akan dilakukan transformasi data kemudian dilakukan proses load kedalam data warehouse. Untuk itu dapat di katakana proses ETL dibagi menjadi tiga proses besar yaitu: 1. Extract Mengumpulkan data dari multiple, heterogeneous dan external sources. 2. Transform Mengubah data dari format asli legacy kedalam format data warehouse. 3. Load Merupakan proses untuk membuat rangkuman informasi yang sudah diolah dan membangun indeks serta partisi untuk disajikan kedalam computer views .

2.3 Multi Dimensional Modeling

2.3.1 Cube, Dimension, Measure dan Member

OLAP menggunakan multi dimensional modeling, artinya kita dapat melihat analisis pengukuran dengan pandangan berbagai dimensi. Dalam konsep OLAP kita akan mengerti beberapa istilah berkaitan dengan OLAP : 1. Cube : cube adalah struktur multi dimensional konseptual yang terdiri dari dimension dan measure. Biasanya mencakup pandangan bisnis tertentu. 2. Dimension : dimensi adalah struktur view sudut pandang yang akan menyusun cube. Demensi terdiri dari berbagai macam level. 3. Measure : nilai pengukuran itu sendiri. 4. Member : anggota dari dimensi measure tertentu. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

2.3.2 Fact Table dan Dimension Table

Tabel fakta adalah tabel dimensional yang akan menyimpan data numeric dan berisi composite primary key. Tabel dimensi adalah sekumpulan tabel-tabel yang lebih kecil dari tabel fakta pada model dimensional yang berisi pointer sehingga dapat menunjukan data ditabel terpisah. Setiap tabel dimensi memiliki non-composite primary key Connolly dkk, 2005. Di dalam model multi dimensional , database terdiri dari beberapa tabel fakta dan beberapa tabel dimensi yang saling terkait. Tabel fakta berisi nilai dari agregasi yang menjadi pengukuran measure serta beberapa key yang terkait ke tabel dimensi yang menjadi sudut pandang dari measure tersebut. Dalam perkembangannya, susunan tabel fakta dan tabel dimensi memiliki standar perancangan atau schema karena dapat meningkatkan performa dan kemudahan dalam penerjemahan ke OLAP. Schema inilah yang menjadi dasar untuk melakukan data warehousing. Salah satu schema yang umum digunakan adalah skema bintang star schema yang dapat diterapkan di berbagai OLAP engine.

2.4 Skema Kristal Salju Snowflake schema dan Skema Bintang

Menurut Connolly dan Begg 2010, skema snowflake adalah variasi lain dari skema bintang dimana tabel dimensi tidak berisi data yang denormalized. Suatu tabel dimensi dapat memiliki tabel dimensi lainnya. Skema bintang star schema adalah struktur logical yang memiliki sebuah tabel fakta yang berisi data factual yang diletakan di tengah dan di kelilingi oleh tabel dimensi yang berisi data refrensi. Skema bintang mengeksploitasi karakteristik dari data factual di mana fakta dibuat dari peristiwa yang muncul di masa lalu dan tidak mungkin berubah, dengan mengabaikan bagaimana data dianalisis. Penting untuk memperlakukan data fakta sebagai data refrensi yang dapat dibaca read only refrence data yang tidak akan berubah sepanjang waktu Connolly dkk, 2005. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI