10
Dari Gambar 2.1 terdapat 3 tahap utama dalam arsitektur data warehouse
yaitu : 1. Membangun OLAP Cube Databases. Proses ini diawali
dengan pre-processing data yang kemudian dilanjutkan dengan proses ETL yang diakhiri dengan pembentukan fact
tabl e dan cube.
2. Membangun OLAP Server. Proses ini dilakukan untuk membangun OLAP pada OLAP engine server. Pada proses
ini OLAP view beserta perangkatnya dibangun. 3. User Service dimana user akan mengakses OLAP yang
telah dibangun.
2.1.5 Langkah Pembuatan Data warehouse
1. Membaca data legacy Memperhatikan bagian-bagian data yang perlu untuk
dibersihkan 2. Menggabungkan data dari sumber terpisah
Setiap jenis informasi yang diinginkan mungkin berasal dari beberapa file yang harus digabungkan untuk digunakan pada
data warehouse .
3. Memecah data warehouse dalam tabel fakta dan tabel dimensi Tabel fakta dan tabel dimensi disusun menurut kebutuhan
subyek.
2.1.6 Implementasi Data warehouse
Ada banyak cara untuk mengimplementasikan
data warehouse
tetapi yang utama adalah mendesain basis data dengan skema yang baik harus agar mudah melakukan integrasi data. Data
warehouse harus dapat melakukan proses pembersihan terhadap
11
data. Data dengan maksud yang sama seharusnya dipandang sama. Perbedaan harus dihilangkan dalam data warehouse.
Denis Kozar 1997, wakil pimpinan dari Enterprise Information
Architecture dari
Chase Manhattan
Bank mengemukakan ‘tujuh kesalahan fatal’ dalam menerapkan data
warehouse yaitu:
1. Pada saat membangun data warehouse, data akan datang. Kesalahan
yang sering kali terjadi adalah tidak merencanakan dengan baik data warehouse. Pada saat
membangun data warehouse
, seharusnya dipikirkan bagaimana melakukan desain, membangun dan memelihara
data warehouse itu.
Data warehouse tidak dengan
sendirinya dibangun dengan harapan akan ada orang yang memanfaatkannya.
2. Kesalahan dalam membuat kerangka arsitektur data
warehouse Hal yang penting adalah bagaimana membangun kerangka
arsitektur data
warehouse .
Kerangka inilah
yang merupakan blue print untuk membangun dan menggunakan
berbagai komponen data warehouse. Sehingga kesalahan pada pembuatan kerangka ini akanlah berakibat sangat
fatal. 3. Ketidakmampuan menyusun asumsi
Asumsi dan data potensial harus dimasukkan ke dalam kerangka data warehouse.
Asumsi yang harus dipersiapkan antara lain:
a. Berapa banyak data yang akan dimasukkan ke dalam data warehouse?
b. Berapa sering data harus diperbaharui? c. Dimanakah data warehouse akan diterapkan?
12
Jawaban tepat atas pertanyaan diatas akan sangat membantu dalam pembuatan data warehouse.
4. Kesalahan dalam menentukan peralatan yang akan digunakan untuk menyelesaikan tugas. Dalam memilih
peralatan untuk membangun data warehouse haruslah tepat. Peralatan data warehouse tidaklah sama dengan peralatan
yang digunakan untuk membangun sistem operasional. 5. Kesalahan dalam siklus hidup data warehouse. Siklus hidup
data warehouse berbeda dengan System Development Life
Cycle SDLC. Walaupun memiliki kesamaan, akan tetapi
ada perbedaan mendasar yaitu bahwa siklus hidup data warehouse
tidak pernah berakhir, selalu berlanjut sehingga perlu selalu diperbaharui. Hal ini heruslah perlu disadari.
6. Cenderung membatalkan
data yang
mengandung perbedaan. Perlu dilakukan penyesuaian terhadap data yang
berbeda dan buka menghilangkan data. 7. Menggagalkan dokumen yang ada kesalahan.
Tujuh kesalahan diatas harus dihindari selama proses pembuatan data warehouse.
2.2 Extract, Transform dan Load ETL
Secara singkat proses ETL dibagi dalam 3 proses besar yaitu : 1. Extract
Mengumpulkan data dari multiple, heterogeneous dan external sources.
2. Transform Merubahconvert data dari format aslilegacy ke dalam format
data warehouse .
3. Load