Pembandingan Waktu Operasi dalam OLAP PPMB IPB pada Palo Versi 1.0c dengan Palo Versi 2.0

ABSTRAK
HOLAN. Pembandingan Waktu Operasi dalam OLAP (On-Line Analytical Processing) PPMB IPB
pada Versi 1.0c dengan Versi 2.0. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan HARI
AGUNG ADRIANTO.
Saat ini berbagai macam aplikasi data warehouse beserta aplikasi OLAP (On-Line Analytical
Processing) telah banyak bermunculan, dan masing-masing menawarkan kelebihan dan kemudahan
dalam penggunaannya. Jedox adalah satu dari sekian banyak pengembang aplikasi data warehouse
beserta OLAP-nya yang menyediakan aplikasi open source dan versi gratis dari aplikasinya yaitu
Palo. Pada saat penelitian ini dilakukan versi Palo sudah mencapai versi 2.0.
Dalam penelitian ini dilakukan proses migrasi aplikasi OLAP PPMB IPB yang sebelumnya
berjalan di Palo versi 1.0c ke Palo versi 2.0. Kemudian dilakukan pembandingan waktu operasi
OLAP yang meliputi drill-down, slice, dan dice. Proses pembandingan dilakukan dengan menjalankan
aplikasi OLAP PPMB IPB pada dua komputer virtual yang telah ter-install Palo dengan versi berbeda.
Dari penelitian ini didapat bahwa untuk migrasi dari Palo versi 1.0c ke Palo versi 2.0
diperlukan beberapa perubahan, diantaranya konfigurasi sistem dan penambahan modul untuk
penyesuaian hasil query kubus di Palo versi 2.0. Berdasarkan hasil pembandingan operasi OLAP,
didapat bahwa perbedaan waktu terbesar terjadi pada operasi OLAP yang melibatkan proses query
yang kompleks, sebagai contoh pada operasi drill-down untuk tiap level hirarki dengan jumlah filter
dimensi 0 (semua filter = All atau tidak ada filter dimensi yang dipilih), aplikasi OLAP PPMB IPB di
Palo 2.0 hampir sepuluh kali lebih cepat dari aplikasi OLAP PPMB IPB di Palo 1.0c pada kubus
mahasiswa dan empat sampai lima kali lebih cepat pada kubus pelamar. Semakin banyak jumlah filter

dimensi cenderung semakin kecil perbedaan waktu eksekusinya.
Kata kunci: Palo, data warehouse, OLAP (On-Line Analytical Processing).

PEMBANDINGAN WAKTU OPERASI DALAM OLAP PPMB IPB
PADA PALO VERSI 1.0c DENGAN PALO VERSI 2.0

HOLAN

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2008

14

DAFTAR PUSTAKA
Bouzeghoub M, Kedad Z. 2000. A QualityBased Framework for Physical Data
warehouse Design. Laboratoire PRiSM,
Université de Versailles. Versailles Cedex,
France.

Han J, Kamber M. 2006. Data Mining
Concepts & Techniques. Simon Fraser
University. USA: Morgan Kaufman.
Inmon WH. 2002. Building the Data
warehouse. Ed ke-3. New York, USA:
John Wiley & Sons.
Kantardzic M. 2003. Data Mining Concept,
Models, Methods, dan Algorithms. New
Jersey, USA: A John Wiley & Sons.
Mallach EG. 2000. Decision Support and
Data warehouse Systems, International
Edition. Singapore: McGraw-Hill.
Post GV. 2005. Database Management
Systems: Designing and Building Business
Applications. Ed ke-3. New York, USA:
McGraw Hill.
Silberschatz A, Korth HF, Sudarshan S. 2006.
Database System Concepts. Ed ke-5.
Singapore: McGraw-Hill.


PEMBANDINGAN WAKTU OPERASI DALAM OLAP PPMB IPB
PADA PALO VERSI 1.0c DENGAN PALO VERSI 2.0

HOLAN

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2008

PEMBANDINGAN WAKTU OPERASI DALAM OLAP PPMB IPB
PADA PALO VERSI 1.0c DENGAN PALO VERSI 2.0

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh:


HOLAN
G64101025

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2008

Judul

: Pembandingan Waktu Operasi dalam OLAP PPMB IPB pada Palo
Versi 1.0c dengan Palo Versi 2.0

Nama

: Holan

NIM

: G64101025


Menyetujui:
Pembimbing I,

Pembimbing II,

Imas S. Sitanggang, S.Si, M.Kom.
NIP 132206235

Hari Agung Adrianto, S.Kom, M.Si.
NIP 132311918

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Drh. Hasim, DEA
NIP 131578806

Tanggal Lulus:


ABSTRAK
HOLAN. Pembandingan Waktu Operasi dalam OLAP (On-Line Analytical Processing) PPMB IPB
pada Versi 1.0c dengan Versi 2.0. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan HARI
AGUNG ADRIANTO.
Saat ini berbagai macam aplikasi data warehouse beserta aplikasi OLAP (On-Line Analytical
Processing) telah banyak bermunculan, dan masing-masing menawarkan kelebihan dan kemudahan
dalam penggunaannya. Jedox adalah satu dari sekian banyak pengembang aplikasi data warehouse
beserta OLAP-nya yang menyediakan aplikasi open source dan versi gratis dari aplikasinya yaitu
Palo. Pada saat penelitian ini dilakukan versi Palo sudah mencapai versi 2.0.
Dalam penelitian ini dilakukan proses migrasi aplikasi OLAP PPMB IPB yang sebelumnya
berjalan di Palo versi 1.0c ke Palo versi 2.0. Kemudian dilakukan pembandingan waktu operasi
OLAP yang meliputi drill-down, slice, dan dice. Proses pembandingan dilakukan dengan menjalankan
aplikasi OLAP PPMB IPB pada dua komputer virtual yang telah ter-install Palo dengan versi berbeda.
Dari penelitian ini didapat bahwa untuk migrasi dari Palo versi 1.0c ke Palo versi 2.0
diperlukan beberapa perubahan, diantaranya konfigurasi sistem dan penambahan modul untuk
penyesuaian hasil query kubus di Palo versi 2.0. Berdasarkan hasil pembandingan operasi OLAP,
didapat bahwa perbedaan waktu terbesar terjadi pada operasi OLAP yang melibatkan proses query
yang kompleks, sebagai contoh pada operasi drill-down untuk tiap level hirarki dengan jumlah filter
dimensi 0 (semua filter = All atau tidak ada filter dimensi yang dipilih), aplikasi OLAP PPMB IPB di

Palo 2.0 hampir sepuluh kali lebih cepat dari aplikasi OLAP PPMB IPB di Palo 1.0c pada kubus
mahasiswa dan empat sampai lima kali lebih cepat pada kubus pelamar. Semakin banyak jumlah filter
dimensi cenderung semakin kecil perbedaan waktu eksekusinya.
Kata kunci: Palo, data warehouse, OLAP (On-Line Analytical Processing).

RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 16 Oktober 1982 dari ayah Janes Sarman Saragih dan
ibu Sugiharsi. Penulis merupakan anak pertama dari tiga bersaudara.
Tahun 2001 Penulis lulus dari SMU Negeri 99 Jakarta dan pada tahun yang sama lulus seleksi
masuk IPB melalui jalur Undangan Seleksi Mahasiswa IPB. Penulis memilih Program Studi Ilmu
Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB.
Tahun 2005 bulan Januari sampai Maret, Penulis melakukan kegiatan Praktik Lapang di Balai
Penelitian Bioteknologi Perkebunan Indonesia, terlibat dalam tim pembangunan Sistem Informasi
Manajemen SimBiotek. Pada Juli 2006 sampai Desember 2007, Penulis bekerja di PT Anabatic
Teknologi sebagai software developer J2EE di divisi Telco and Multimedia Solution Group.

PRAKATA
Segala pujian dan syukur Penulis kepada Tuhan Yang Maha Esa atas segala berkat dan karuniaNya sehingga skripsi ini dapat diselesaikan. Skripsi ini merupakan hasil penelitian yang dilakukan dari
Maret 2008 sampai Juli 2008 dengan bidang kajian Pembandingan Waktu Operasi dalam OLAP
PPMB IPB pada Palo Versi 1.0c dengan Versi 2.0.

Penulis mengucapkan terima kasih kepada Ibu Imas S. Sitanggang, S.Si, M.Kom selaku
pembimbing I yang telah memberi saran, masukan, dan ide-ide kepada Penulis dalam menyusun
skripsi ini. Terima kasih juga Penulis ucapkan kepada Bapak Hari Agung Adrianto, S.Kom, M.Si
selaku pembimbing II yang telah memberi saran dan masukan kepada Penulis. Ucapan terima kasih
juga kepada Bapak Wisnu Ananta Kusuma, S.T, M.T selaku penguji.

Bogor, Juli 2008

Holan

DAFTAR ISI
Halaman
DAFTAR TABEL .............................................................................................................................. vii
DAFTAR GAMBAR .......................................................................................................................... vii
DAFTAR LAMPIRAN....................................................................................................................... viii
PENDAHULUAN .............................................................................................................................. 1 
Latar Belakang ............................................................................................................................... 1 
Tujuan ............................................................................................................................................ 1 
Ruang Lingkup............................................................................................................................... 1 
Manfaat .......................................................................................................................................... 1

TINJAUAN PUSTAKA ..................................................................................................................... 1 
Data Warehouse............................................................................................................................. 1 
Model Data Multidimensi .............................................................................................................. 2 
On-Line Analytical Processing (OLAP) ........................................................................................ 3 
Arsitektur Data Warehouse............................................................................................................ 4 
Palo ................................................................................................................................................ 5
METODE PENELITIAN ................................................................................................................... 5 
Migrasi Data dan Aplikasi OLAP .................................................................................................. 5 
Mekanisme Pembandingan ............................................................................................................ 6 
Lingkungan Pembandingan............................................................................................................ 6
HASIL DAN PEMBAHASAN........................................................................................................... 7 
Migrasi Data dan Aplikasi OLAP .................................................................................................. 7 
Hasil Pembandingan ...................................................................................................................... 8
KESIMPULAN DAN SARAN........................................................................................................... 13 
Kesimpulan .................................................................................................................................... 13 
Saran .............................................................................................................................................. 13
DAFTAR PUSTAKA ......................................................................................................................... 14
LAMPIRAN ....................................................................................................................................... 15 

vi


DAFTAR TABEL
Halaman





Kombinasi untuk operasi slice kubus mahasiswa ......................................................................... 10
Kombinasi untuk operasi slice kubus pelamar .............................................................................. 11
Kombinasi untuk operasi dice kubus mahasiswa .......................................................................... 12
Kombinasi untuk operasi dice kubus pelamar ............................................................................... 12 

DAFTAR GAMBAR
Halaman

2




6

8

Representasi kubus data dengan 3 dimensi (Han dan Kamber 2006). .......................................... 3 
Skema bintang (Han & Kamber 2006). ......................................................................................... 3 
Skema snowflake (Han & Kamber 2006). ..................................................................................... 3 
Skema galaksi (Han & Kamber 2006). ......................................................................................... 3 
Arsitektur three-tier data warehousing (Han dan Kamber 2006). ................................................ 4 
Skema Galaksi data warehouse PPMB IPB.................................................................................. 5 
Perbedaan array pada Palo versi 1.0c dengan 2.0. ........................................................................ 7 
Waktu eksekusi operasi drill-down pada kubus mahasiswa berdasarkan jumlah filter
dimensi dengan ukuran rataan IPK TPB, hirarki program studi level 0. ....................................... 8 
9 Waktu eksekusi operasi drill-down pada kubus mahasiswa berdasarkan jumlah filter
dimensi dengan ukuran rataan IPK TPB, hirarki program studi level 1. ....................................... 8 
10 Waktu eksekusi operasi drill-down pada kubus mahasiswa berdasarkan jumlah filter
dimensi dengan ukuran rataan IPK TPB, hirarki program studi level 2. ....................................... 8 
11 Waktu eksekusi operasi drill-down pada kubus mahasiswa berdasarkan jumlah filter
dimensi dengan ukuran rataan IPK TPB, hirarki program studi level 3. ....................................... 9 
12 Waktu eksekusi operasi drill-down pada kubus pelamar berdasarkan jumlah filter
dimensi dengan ukuran jumlah pelamar USMI, hirarki program studi putusan dan
program studi pilihan 1 level 0. ..................................................................................................... 9 
13 Waktu eksekusi operasi drill-down pada kubus pelamar berdasarkan jumlah filter
dimensi dengan ukuran jumlah pelamar USMI, hirarki program studi putusan dan
program studi pilihan 1 level 1. ..................................................................................................... 9 
14 Waktu eksekusi operasi drill-down pada kubus pelamar berdasarkan jumlah filter
dimensi dengan ukuran jumlah pelamar USMI, hirarki program studi putusan dan
program studi pilihan 1 level 2. ..................................................................................................... 10 
15  Waktu eksekusi operasi drill-down pada kubus pelamar berdasarkan jumlah filter
dimensi dengan ukuran jumlah pelamar USMI, hirarki program studi putusan dan
program studi pilihan 1 level 3. ..................................................................................................... 10 
16 Waktu eksekusi operasi slice pada kubus mahasiswa dengan kombinasi operasi pada
Tabel 1. ......................................................................................................................................... 11 
17 Waktu eksekusi operasi slice pada kubus pelamar dengan kombinasi operasi pada Tabel
2..................................................................................................................................................... 11 
18 Waktu eksekusi operasi dice pada kubus mahasiswa dengan kombinasi operasi pada
Tabel 3. ......................................................................................................................................... 12 
19 Waktu eksekusi operasi dice pada kubus pelamar dengan kombinasi operasi pada Tabel
4..................................................................................................................................................... 13 

vii

DAFTAR LAMPIRAN
Halaman
1
2
3
4
5
6
7

Kombinasi operasi drill-down untuk kubus mahasiswa ................................................................ 16
Kombinasi operasi drill-down untuk kubus pelamar..................................................................... 17
Kombinasi operasi slice pada kubus mahasiswa ........................................................................... 19
Kombinasi operasi slice pada kubus pelamar ................................................................................ 19
Kombinasi operasi dice pada kubus mahasiswa............................................................................ 20
Kombinasi operasi dice pada kubus pelamar ................................................................................ 20
Waktu eksekusi dari pengulangan operasi drill-down di Lampiran 1 pada kubus
mahasiswa ..................................................................................................................................... 21
8 Waktu eksekusi dari pengulangan operasi drill-down di Lampiran 2 pada kubus pelamar .......... 24
9  Waktu eksekusi dari pengulangan operasi slice di Lampiran 3 pada kubus mahasiswa ............... 28
10  Waktu eksekusi dari pengulangan operasi slice di Lampiran 4 pada kubus pelamar .................... 29
11  Waktu eksekusi dari pengulangan operasi dice di Lampiran 5 pada kubus mahasiswa ................ 30
12  Waktu eksekusi dari pengulangan operasi dice di Lampiran 6 pada kubus pelamar..................... 31

viii

1

PENDAHULUAN
Latar Belakang
Saat ini sudah banyak organisasi yang
telah mengadopsi teknologi data warehouse.
Penerapan teknologi ini sangat membantu
sekali bagi suatu organisasi yang memiliki
data yang sangat besar (sepertii data
pelanggan, data penjualan dan sebagainya
yang berasal dari masa lalu hingga sekarang)
untuk menganalisis perkembangan organisasi
dan hasil-hasil yang telah dicapainya secara
histori. Data yang sangat besar tersebut, yang
bersumber dari berbagai macam bentuk
penyimpanan data dan memiliki format yang
berbeda-beda dapat diintegrasikan menjadi
suatu bentuk penyimpanan data melalui proses
pembersihan dan integrasi data. Data yang
sudah tergabung tersebut terpisah secara fisik
dari lingkungan operasional.
Data warehouse umumnya diintegrasikan
dengan
aplikasi
On-Line
Analytical
Processing (OLAP) yang memudahkan
pengguna untuk memilah informasi dari data
multi dimensi secara interaktif. Informasi
yang didapatkan biasanya berupa pola
kecenderungan ukuran suatu subjek pada
beberapa waktu tertentu, misalnya informasi
jumlah pelanggan dari tahun 2000 hingga
2008.
Saat ini berbagai macam aplikasi data
warehouse beserta aplikasi OLAP-nya telah
banyak bermunculan, dan masing-masing
menawarkan kelebihan dan kemudahan dalam
penggunaannya. Palo adalah satu dari sekian
banyak pengembang aplikasi data warehouse
beserta OLAP-nya yang menyediakan aplikasi
open source dan versi gratis dari aplikasinya.
Aplikasi yang diberikan adalah sebuah server
OLAP dan sebuah OLAP client yang bisa
dijalankan dengan program spreadsheet
Microsoft Excel. Namun Palo juga
menyediakan API (Aplication Program
Interface) bagi server OLAP-nya untuk
berbagai platform bahasa pemrograman
seperti Java, PHP, C, dan .NET. Hal ini
membuatnya
bersifat
fleksibel
untuk
diintegrasikan dengan berbagai aplikasi.
Perkembangan Palo pada saat tulisan ini
dibuat sudah mencapai versi 2.0.
Pada penelitian ini akan dibuat suatu
perbandingan kinerja antara Palo versi 1.0c
dengan Palo versi 2.0. Aplikasi OLAP yang
digunakan dalam perbandingan ini adalah
aplikasi yang telah dibangun sebelumnya oleh
Abi Herlambang, S.Kom, yaitu Aplikasi

OLAP PPMB IPB yang berbasis web. Data
yang digunakan dalam penelitian ini juga
sama, yaitu data pelamar melalui jalur USMI
dan data mahasiswa dari PPMB serta data IPK
mahasiswa Tingkat Persiapan Bersama (TPB)
IPB tahun masuk 2000 sampai 2004.
Tujuan
Tujuan dari penelitian ini adalah:
1. Mengetahui seberapa besar perbedaan
kinerja antara Palo versi 1.0c dengan Palo
versi 2.0. berdasarkan waktu eksekusi
suatu operasi OLAP.
2. Melakukan proses migrasi dari Palo 1.0c
ke Palo 2.0 untuk aplikasi OLAP PPMB
IPB.
Ruang Lingkup
Dalam penelitian ini versi dari bahasa
pemrograman yang digunakan adalah berbeda,
yaitu PHP versi 5.1.6 untuk Palo versi 1.0c
dan PHP versi 5.2.5 karena API yang
digunakan pada masing-masing Palo hanya
bisa bekerja sesuai dengan versi PHP tersebut.
Operasi OLAP yang dibandingkan hanya tiga,
yaitu drill-down, slice, dan dice. Perbandingan
kinerja hanya didasarkan pada lama waktu
eksekusi dari operasi OLAP yang dilakukan.
Manfaat
Hasil dari penelitian ini diharapkan dapat
menjadi bahan pertimbangan bagi pihak-pihak
yang telah menggunakan Palo versi 1.0c untuk
bermigrasi ke Palo versi 2.0.

TINJAUAN PUSTAKA
Data Warehouse
Data warehouse adalah sebuah sistem
yang berisi sekumpulan data dari berbagai
macam sumber yang terintegrasi menjadi satu
dan dikelola secara terpisah dari basis data
operasional.
Data warehouse merupakan ruang
penyimpanan (atau arsip) informasi yang
dikumpulkan dari berbagai sumber, disimpan
dengan sebuah skema terintegrasi pada satu
tempat. Data/infomasi tersebut tersimpan
dalam jangka waktu yang lama, sehingga
memungkinkan pengguna mengakses data
historis. Data warehouse menyediakan satu
tampilan data terkonsolidasi, sehingga
menciptakan query untuk proses pengambilan
keputusan menjadi lebih mudah. Dengan
mengakses informasi dari data warehouse,

2

proses traksaksi online tidak terganggu oleh
beban kerja proses pengambilan keputusan
(Silberschatz et al 2006).
Data warehouse adalah sekumpulan data
berorientasi subjek, terintegrasi, time-variant,
dan non-volatile yang mendukung proses
pembuatan keputusan dari manajemen (Inmon
2002). Keempat istilah tersebut adalah hal-hal
yang membedakan antara data warehouse
dengan sistem penyimpanan data lainnya.
• Subject–oriented artinya sebuah data
warehouse diorientasikan pada subjeksubjek utama, seperti pelanggan, penyedia
barang, produk, dan penjualan. Hal ini
berbeda dengan operasional basis data
yang berfokus pada operasi dan proses
transaksi harian, data warehouse lebih
berfokus pada pemodelan dan analisa dari
data untuk pembuatan keputusan.
• Integrated artinya sebuah data warehouse
dibangun
dengan
mengintegrasikan
berbagai macam sumber data yang
berbeda-beda seperti basis data relasional,
file text biasa, dan data transaksi online.
Hal ini berbeda dengan data operasional
yang hanya berasal dari sumber-sumber
sistem penyimpanan data yang identik.
• Time-variant artinya setiap data yang ada
dalam data warehouse adalah merupakan
informasi yang memiliki perspektif histori,
seperti misalnya produksi suatu item
sepanjang lima tahun terakhir. Setiap
struktur kunci dalam data warehouse
mengandung elemen waktu baik secara
eksplisit maupun secara implisit. Hal ini
berbeda dengan data operasional yang bisa
memiliki banyak perspektif.
• Nonvolatile
artinya
sebuah
data
warehouse selalu terpisah secara fisik dari
aplikasi pengolahan data yang ada di
dalam lingkungan operasional. Jadi
berdasarkan hal tersebut data warehouse
tidak membutuhkan pemrosesan transaksi,
proses
recovery,
dan
mekanisme
pengaturan concurrency. Operasi yang ada
biasanya hanya berupa pengisian awal data
dan pengaksesan data.
Data warehouse merupakan ruang
penyimpanan (atau arsip) informasi yang
dikumpulkan dari berbagai sumber, disimpan
dengan sebuah skema terintegrasi pada satu
tempat. Data/infomasi tersebut tersimpan
dalam jangka waktu yang lama, sehingga
memungkinkan pengguna mengakses data
historis. Data warehouse menyediakan satu

tampilan data terkonsolidasi, sehingga
menciptakan query untuk proses pengambilan
keputusan menjadi lebih mudah. Dengan
mengakses informasi dari data warehouse,
proses traksaksi online tidak terganggu oleh
beban kerja proses pengambilan keputusan
(Silberschatz et al 2006).
Data
warehousing
adalah
suatu
infrastruktur
perangkat
lunak
yang
mendukung
aplikasi
OLAP
dengan
menyediakan sebuah koleksi alat bantu yang
(i) mengumpulkan data dari sekumpulan
sumber-sumber heterogen terdistribusi, (ii)
membersihkan dan mengintegrasikan data
tersebut ke dalam representasi yang seragam
(iii) mengagregasi dan mengorganisasi data
tersebut ke dalam struktur multidimensional
yang tepat untuk pengambilan keputusan, dan
(iv) memperbaharuinya secara periodik untuk
menjaga agar data mutakhir dan akurat
(Bouzeghoub dan Kedad 2000).
Model Data Multidimensi
Pembuatan data warehouse didasarkan
pada model data multidimensi. Model ini
menampilkan data dalam bentuk kubus.
Model data multidimensi terdiri dari dimensi
(dimensions) dan fakta (facts) (Han dan
Kamber 2006).
Dimensi adalah perspektif atau entitas
penting yang dimiliki oleh organisasi. Setiap
dimensi mungkin memiliki satu tabel yang
berasosiasi dengannya yang disebut dengan
tabel dimensi yang mendeskripsikan dimensi
itu sendiri. Dimensi akan berubah jika analisis
kebutuhan pengguna berubah. Dimensi
mendefinisikan label yang membentuk isi
laporan. Tabel dimensi berukuran lebih kecil
daripada tabel fakta dan berisi data tidak
numerik. Pada data warehouse, kubus data
merupakan kubus dengan n-dimensi (Han dan
Kamber 2006).
Fakta adalah ukuran-ukuran numerik,
merupakan kuantitas yang akan dianalisis
hubungan antar dimensinya. Tabel fakta berisi
nama-nama fakta (ukuran) dan key dari tabeltabel dimensi yang berelasi dengan tabel fakta
itu. Data fakta diekstrak dari berbagai sumber.
Data fakta cenderung stabil dan tidak berubah
seiring waktu. Tabel fakta berukuran besar,
memiliki jumlah baris sesuai dengan jumlah
kombinasi nilai dimensi yang mungkin dan
jumlah kolom sesuai dengan jumlah dimensi
yang direpresentasikan (Han dan Kamber
2006).

3

Kubus data disebut juga cuboid, berasal
dari banyak dimensi. Potongan cuboid yang
lebih kecil dapat dibuat dengan mengambil
sebagian dimensi dari sebuah cuboid besar.
Potongan cuboid memiliki tingkat yang lebih
tinggi (besar nilainya) dari cuboid asalnya,
cuboid dengan tingkat terendah disebut base
cuboid (Han dan Kamber 2006). Gambaran
kubus data dengan tiga dimensi dapat dilihat
pada Gambar 1. Kubus data tersebut memiliki
dimensi time, item, dan location, ukuran yang
ditampilkan adalah jumlah hasil penjualan
item.

Gambar 2 Skema bintang (Han & Kamber
2006).
ƒ Skema snowflake (snowflake schema)
Skema snowflake adalah variasi dari
skema bintang dimana beberapa tabel
dimensi dinormalisasi, jadi dihasilkan
beberapa tabel tambahan. Bentuk skema
snowflake dapat dilihat pada Gambar 3.

Gambar 1 Representasi kubus data dengan 3
dimensi (Han dan Kamber 2006).
Skema basis data berisi kumpulan entitas
dan hubungan antarentitas. Sebuah data
warehouse memerlukan skema yang ringkas
dan berorientasi subjek yang dapat digunakan
dalam analisis data on-line (Han dan Kamber
2006). Skema-skema yang biasa dipakai untuk
membangun data warehouse di antaranya
adalah:
ƒ

Skema bintang (star schema)
Skema ini disebut skema bintang
karena hubungan antara tabel dimensi dan
tabel fakta menyerupai bintang, dimana
satu tabel fakta dihubungkan dengan
beberapa tabel dimensi. Bentuk skema
bintang dapat dilihat pada Gambar 2.

Gambar 3 Skema snowflake (Han & Kamber
2006).
ƒ Skema galaksi (fact constellation)
Pada skema galaksi, beberapa tabel
fakta berbagi tabel dimensi. Bentuk skema
galaksi dapat dilihat pada Gambar 4.

Gambar 4 Skema galaksi (Han & Kamber
2006).
On-Line Analytical Processing (OLAP)
On-Line Analytical Processing (OLAP)
terdiri dari seperangkat aplikasi untuk
membantu proses analisis dan perbandingan
data dalam basis data. Kegunaan utama

4

aplikasi
OLAP
adalah
kemampuan
interaktifnya untuk membantu pimpinan
organisasi melihat data dari berbagai
perspektif (Post 2005).
Aplikasi dan metoda OLAP membantu
pengguna menganalisis data pada sebuah data
warehouse dengan menyediakan berbagai
tampilan data, dan didukung dengan
representasi grafik yang dinamis. Dalam
tampilan tersebut dimensi-dimensi data
berbeda menunjukkan karakteristik bisnis
yang berbeda pula. Aplikasi OLAP sangat
membantu untuk melihat data dimensional
dari berbagai sudut pandang. Aplikasi OLAP
tidak belajar dan tidak menciptakan
pengetahuan baru dari data dengan sendirinya,
tetapi merupakan alat bantu visualisasi khusus
untuk
membantu
end-user
menarik
kesimpulan dan keputusan. Aplikasi OLAP
sangat berguna untuk proses data mining,
OLAP dapat menjadi bagian dari data mining
tetapi keduanya tidak bersifat substitusi
(Kantardzic 2003).
Berikut adalah operasi-operasi yang bisa
dilakukan oleh aplikasi OLAP (Han dan
Kamber 2006):

yang bertujuan untuk menyediakan
presentasi alternatif dari data.
Satu kategori dari OLAP yang mulai
muncul pada tahun 1997 adalah Web-based
OLAP (WOLAP). Dengan produk ini
pengguna web browser atau komputer dalam
jaringan dapat mengakses dan menganalisis
data dalam data warehouse. WOLAP dapat
diterapkan dalam internet atau intranet,
namun banyak organisasi lebih memilih
intranet karena alasan keamanan dan
kerahasiaan data. WOLAP dapat digunakan
selama klien memiliki perangkat lunak web
yang diperlukan dan terhubung dengan
jaringan komputer yang benar. Teknologi ini
juga mengeliminasi kebutuhan akan instalasi
paket perangkat lunak pada komputer
pengguna (Mallach 2000).
Arsitektur Data Warehouse
Data warehouse biasanya dibangun
dengan menggunakan arsitektur three-tier.
Bentuk arsitektur three-tier dapat dilihat pada
Gambar 5.

ƒ Roll-up
Operasi ini melakukan agregasi pada
kubus data dengan cara menaikkan tingkat
suatu hirarki konsep atau mengurangi
dimensi. Misalkan pada kubus data
dimensi wilayah pada level kota di-roll-up
menjadi level propinsi atau negara.
ƒ Drill-down
Drill-down adalah kebalikan dari rollup. Operasi ini mempresentasikan data
menjadi lebih detil. Drill-down dilakukan
dengan cara menurunkan tingkat suatu
hirarki konsep atau menambahkan
dimensi. Misalkan suatu elemen tahun didrill-down menjadi elemen triwulan,
bulan, atau hari.
ƒ Slice dan Dice
Operasi slice melakukan pemilihan
satu dimensi dari kubus data sehingga
menghasilkan bagian kubus (subcube).
Operasi dice menghasilkan bagian kubus
(subcube) dengan melakukan pemilihan
dua atau lebih dimensi.
ƒ Pivot (rotate)
Pivot adalah operasi visualisasi dengan
memutar koordinat data pada tampilan

Gambar 5 Arsitektur
three-tier
data
warehousing (Han dan Kamber
2006).
Lapisan-lapisan arsitektur data warehousing
tersebut adalah (Han dan Kamber 2006):
ƒ Lapis bawah (bottom tier)
Pada lapis bawah terdapat server data
warehouse yang biasanya merupakan
sebuah sistem basis data relasional. Pada
lapis ini data diambil dari basis data
operasional dan sumber eksternal lainnya,
diekstrak, dibersihkan, dan ditransformasi.
Data disimpan sebagai data warehouse.

5

ƒ Lapis tengah (middle tier)
Lapis tengah adalah OLAP server yang
biasanya
diimplementasikan
dengan
OLAP Relasional (ROLAP) atau OLAP
Multidimensional (MOLAP).

METODE PENELITIAN
Migrasi Data dan Aplikasi OLAP

ƒ Lapis atas (top tier)
Lapis atas adalah lapisan front-end client
yang berisi query dan perangkat pelaporan,
perangkat analisis, dan/atau perangkat
data mining (seperti: analisis tren,
prediksi, dan lainnya).
Palo
Palo merupakan basis data berbasis sel
yang multidimensional, hirarkis, dan berbasis
memori. Query dalam Palo menghasilkan satu
nilai sel tunggal, bukan baris data seperti basis
data relasional. Palo menyimpan data dalam
kubus data. Dengan dimensi yang hirarkis,
kubus data Palo mampu melakukan agregasi
multidimensi. Palo berbasis memori yang
berimplikasi pada kecepatan (www.jedox.com
2008).
Palo menyediakan Palo Excel Add-In yang
terintegrasi dengan Microsoft Office Excel.
Palo Excel Add-In memiliki fasilitas untuk
menampilkan data dari kubus data Palo,
membentuk struktur kubus data Palo, dan

Asal
PK

memuat data dari sumber eksternal ke kubus
data Palo (www.jedox.com 2008).

Aplikasi
OLAP
dibangun
untuk
mempresentasikan
hasil
operasi-operasi
OLAP. Kelebihan aplikasi ini dibanding Palo
Excel Add-In adalah berbasis web, terdapat
operasi roll-up dan drill-down dalam tabel,
dan grafik dinamis. Pengguna dapat
mengevaluasi pola dengan menentukan kubus,
ukuran, dimensi-dimensi, dan elemen-elemen
dimensi,
kemudian
aplikasi
akan
memvisualisasikan ke bentuk yang mudah
dipahami.
Aplikasi OLAP PPMB IPB yang berjalan
pada Palo versi 1.0c menggunakan skema
galaksi. Skema galaksi digunakan karena
terdapat dua tabel fakta, yaitu tabel Pelamar
dan tabel Mahasiswa, dan terdiri dari sepuluh
tabel dimensi, yaitu tabel Asal, Listrik,
BiayaHidup,
KategoriSLA,
Waktu,
JenisKelamin, Studi, Jalur, Pendidikan, dan
PekerjaanAyah.
Bentuk
skema
data
warehouse PPMB IPB dapat dilihat pada
Gambar 6.

Waktu

id_asal

PK

propinsi
pulau

id_waktu

Jalur
PK

tahun_masuk
Pelamar

Mahasiswa

id_jalur
jalur

Listrik
PK

id_listrik
listrik

BiayaHidup
PK

id_biaya
biaya_hidup

FK1
FK2
FK3
FK4
FK5
FK6
FK7
FK8
FK9

id_waktu
id_asal
id_kel
studi_pilihan1
studi_pilihan2
studi_putusan
id_listrik
id_biaya
id_kategori
jumlah_pelamar_usmi

JenisKelamin
PK

id_kel
lelaki_perempuan

FK1
FK2
FK3
FK4
FK5
FK6
FK7

id_waktu
id_jalur
id_kel
pendidikan_ayah
pendidikan_ibu
id_pek
id_studi
rataan_pendapatan_ayah
rataan_ipk_tpb
jumlah_mhs

Studi
PK

id_studi

KategoriSLA
PK

id_kategori
kategori_sla

program_studi
departemen
fakultas

Gambar 6 Skema Galaksi data warehouse PPMB IPB.

Pendidikan
PK

id_pend
pendidikan

PekerjaanAyah
PK

id_pek
pekerjaan_ayah

6

Aplikasi OLAP yang telah dibuat
sebelumnya, OLAP PPMB IPB yang berjalan
pada Palo versi 1.0c, dibangun dengan
menggunakan bahasa pemrograman web PHP
dan berjalan pada server OLAP Palo versi
1.0c. Sebagai penghubung antara aplikasi PHP
dengan server OLAP adalah Palo PHP API
(Application Program Interface). Modul
utama yang terdapat dalam aplikasi OLAP
tersebut adalah:
ƒ app.class.php, merupakan class induk
yang menjalankan aplikasi,
ƒ content.class.php, merupakan class untuk
mengatur isi dari aplikasi,
ƒ olap_function.class.php, merupakan class
untuk menjalankan operasi-operasi OLAP,
ƒ olap_render.class.php, merupakan class
untuk menampilkan aplikasi dalam
sintaksis HTML,
ƒ olap_graph_generator.class.php,
merupakan class untuk menggambar
grafik hasil operasi OLAP. Class ini
menggunakan library JpGraph untuk
menghasilkan grafik.
Aplikasi OLAP yang akan dijadikan
pembanding adalah aplikasi OLAP yang
berjalan pada server OLAP Palo 2.0. Karena
data yang digunakan sama, maka ada proses
migrasi data dari Palo 1.0c ke Palo 2.0. Data
warehouse PPMB yang ada pada Palo 1.0c
disalin ke lokasi atau folder tempat
penyimpanan data warehouse Palo 2.0.
Selanjutnya proses perubahan format data
tersebut dilakukan secara otomatis oleh server
OLAP Palo 2.0.

aplikasi OLAP yang berjalan pada Palo 2.0
dilakukan dengan membandingkan lamanya
waktu suatu operasi. Untuk itu dibuat suatu
fungsi penghitung lamanya waktu operasi
yang diintegrasikan dengan modul aplikasi
yang
telah
ada
yaitu
modul
olap_function.class.php. Fungsi penghitungan
waktu tersebut ditempatkan sebelum dan
setelah fungsi palo_getdata($connection,
$basis data, $cube, $coordinates), kemudian
dicari selisihnya untuk mendapatkan lamanya
tiap operasi pada aplikasi OLAP.
Agar pembandingan dapat dilakukan
dengan benar, maka tiap aplikasi OLAP
tersebut masing-masing dijalankan pada
komputer virtual yang terpisah dengan
spesifikasi mesin dan sistem operasi yang
sama. Komputer virtual dibuat dengan
menggunakan aplikasi VMWare Workstation
5.5.3.
Operasi-operasi yang dibandingkan pada
kedua aplikasi OLAP ini adalah operasi drilldown, operasi slice, dan operasi dice. Tiap
operasi dilakukan pengulangan sebanyak lima
kali, kemudian diambil rata-ratanya
Pembandingan
operasi
drill-down
dilakukan dengan mengkombinasikan jumlah
filter dimensi, ukuran yang dipakai, dan level
hirarki dari dimensi. Daftar kombinasi
tersebut dapat dilihat pada Lampiran 1 dan 2.
Pembandingan operasi slice dilakukan
dengan mengkombinasikan dimensi yang
ditampilkan (yang menjadi baris dan kolom),
satu elemen dimensi terpilih, dan ukuran yang
dipakai. Daftar kombinasinya dapat dilihat
pada Lampiran 3 dan 4.
Untuk operasi dice, yang dikombinasikan
adalah dimensi yang ditampilkan dengan
filter-nya, dan ukuran yang dipakai. Daftar
kombinasinya dapat dilihat pada Lampiran 5
dan 6.

Terdapat perbedaan Palo PHP API pada
versi 1.0c dan 2.0, sehingga diperlukan
penggantian modul API jika akan migrasi dari
Palo 1.0c ke Palo 2.0. Begitu juga dengan
interpreter PHP-nya, yang memerlukan
penggunaan versi API yang sesuai. Dalam hal
ini, karena aplikasi OLAP yang telah
dibangun sebelumnya menggunakan PHP
5.1.6 maka API yang digunakan harus Palo
PHP API yang ditujukan untuk PHP 5.1.x. Di
samping itu karena API yang tersedia untuk
Palo 2.0 adalah API yang ditujukan untuk
PHP versi 5.2.x ke atas, maka aplikasi OLAP
yang akan dibandingkan menggunakan
interpreter PHP versi 5.2.5.

ƒ Prosesor Mobile Intel Core Duo T2250,
1733 MHz (13 x 133).

Mekanisme Pembandingan

ƒ Memori 1 GB DDR2 SDRAM 533

Pembandingan kinerja antara aplikasi
OLAP yang berjalan pada Palo 1.0c dengan

ƒ Harddisk 160 GB

Lingkungan Pembandingan
Lingkungan pembandingan dilakukan
dalam dua komputer virtual yang berjalan
pada satu komputer induk. Adapun spesifikasi
inti dari komputer induk adalah :
ƒ Tipe komputer notebook

7

ƒ Sistem Operasi Microsoft Windows XP
Professional Service Pack 2

ƒ Harddisk 8 GB

Sub-sub kubus itu dapat dibedakan dengan
namanya, yaitu sub kubus selalu diawali
dengan karakter “#”. Untuk itu perlu ditambah
fungsi untuk mengubah isi dari array kubus
sehingga array kubus-nya hanya terdiri dari
kubus-kubus utama, yaitu kubus mahasiswa
dan kubus pelamar. Berikut adalah fungsi
penghilangan sub-kubus dari array kubus
pada aplikasi OLAP Palo 2.0:

ƒ Sistem Operasi: Microsoft Windows XP
Professional Service Pack 2

protected function
normal_cube($arr)

Aplikasi inti yang berjalan didalamnya yaitu:

{

Sedangkan spesifikasi inti kedua virtual
komputernya adalah:
ƒ Prosesor tunggal
ƒ Memori 512 MB

$arr_length=count($arr);

ƒ Web Server Apache 2.0.52

$new_cubes=array();

ƒ Microsoft Internet Explorer 6

$c=0;

ƒ Microsoft Excel 2003
Perbedaan antara kedua komputer virtual
tersebut adalah aplikasi Palo dan interpreter
PHP yang masing-masing di-install dengan
versi yang berbeda.

for ($a=0; $a