Pembuatan Data Warehouse Potensi Desa di Wilayah Bogor menggunakan Oracle Data Warehouse

ABSTRACT

DINA WISUDAWAN KUSUMANINGTIAS. Pembuatan Data Warehouse Potensi Desa di
Wilayah Bogor menggunakan Oracle Data Warehouse. Dibimbing oleh HARI AGUNG
ADRIANTO dan IMAS S SITANGGANG.
Since year 1980, BPS ( Badan Pusat Statistik) performing a census of countryside potency.
Target of Census of countryside potency is provide the data to various need specially related to
requirement planning regional (spatial) in each area and provide the potency data (circumstance
of development and countryside growth). Data of Census of countryside potency cover the social
circumstance, economic, facilities, and also potency exist in countryside ( chief of village). Data
of countryside Potency progressively increase every year census. The data kept in separate file to
every year census. Such data condition cause the difficulty accessed data and analysed. To
integrate the data of countryside potency from various year needed data warehouse to facilitate
the process analyse and information accessing. This research aim to design and build a
multidimensional data model for the countryside potency data region Bogor. Those model will be
implemented by making data cube and OLAP (On Line Analitical Processing) on countryside
potency data warehouse. This Research scope is limited at countryside potency data which the
result of year census 1996, 1999, 2003, and 2006. Making of Scheme of data warehouse use three
solution. Those done to find the most effective solution in case regional change of subdistrict in the
year 1996, 1999, 2003, and 2006. Finally, this research use solution which is not considering
location change prblem. This research yield four dimension ( location dimension, year dimension,

settlement dimension, and farm dimension) and four fact table ( resident fact, settlement fact, farm
fact, and fact of education facility. Implementation of OLAP operation consist of roll-up, drilldown, slice, dice and pivot. User can see the data warehouse from application which have been
made. With this application consumer can see the dimension data and fact at data warehouse,
including new data, and see the data warehouse visualizinged in the form of data of tabular and
graph (bar graph, line graph, and pie graph).
Keyword: data warehouse, OLAP, dimension table, fact table, data cube scheme.

ABSTRAK

DINA WISUDAWAN KUSUMANINGTIAS. Pembuatan Data Warehouse Potensi Desa di
Wilayah Bogor menggunakan Oracle Data Warehouse. Dibimbing oleh HARI AGUNG
ADRIANTO dan IMAS S SITANGGANG.
Sejak tahun 1980, BPS (Badan Pusat Statistik) mengadakan sensus potensi desa. Tujuan sensus
potensi desa menyediakan data untuk berbagai keperluan khususnya yang berkaitan dengan
kebutuhan perencanaan regional (spasial) di setiap daerah dan menyediakan data potensi (keadaan
pembangunan dan perkembangan desa). Data sensus potensi desa meliputi keadaan sosial,
ekonomi, sarana dan prasarana, serta potensi yang ada di desa (kelurahan). Data potensi desa
semakin bertambah setiap tahun sensus. Data tersebut disimpan dalam file terpisah untuk setiap
tahun sensus. Kondisi data yang demikian menyebabkan data sulit diakses dan dianalisis. Untuk
mengintegrasikan data potensi desa dari berbagai tahun diperlukan data warehouse untuk

memudahkan proses analisis dan pengaksesan informasi. Penelitian ini bertujuan untuk merancang
dan membangun suatu model data multidimensi untuk data potensi desa di wilayah Bogor. Model
data tersebut akan diimplementasikan dalam pembuatan kubus data dan OLAP (On Line Analitical
Processing) pada data warehouse potensi desa. Ruang lingkup penelitian ini dibatasi pada data
potensi desa hasil sensus tahun 1996, 1999, 2003, dan 2006. Pembuatan skema data warehouse
menggunakan tiga solusi. Hal ini dilakukan untuk menemukan solusi yang paling efektif dalam
kasus potensi desa di wilayah Bogor yang mengalami perubahan wilayah kecamatan pada tahun
1996, 1999, 2003, dan 2006. Solusi yang digunakan dalam penelitian ini adalah solusi yang tidak
mempertimbangkan aspek perubahan wilayah. Penelitian ini menghasilkan empat dimensi
(dimensi lokasi, dimensi tahun, dimensi pemukiman, dan dimensi lahan) dan empat tabel fakta
(fakta penduduk, fakta pemukiman, fakta lahan, dan fakta sarana pendidikan). Operasi OLAP yang
diimplementasikan adalah operasi roll-up, drill-down, slice, dan dice. Pengguna dapat melihat data
warehouse dari aplikasi OLAP yang telah dibuat. Dengan aplikasi ini pengguna dapat melihat data
dimensi dan fakta pada data warehouse, memasukkan data baru, dan melihat data warehouse yang
divisualisasikan dalam bentuk data tabular dan grafik (diagram batang, diagram garis, dam grafik
pie).
Kata kunci: data warehouse, OLAP, dimension table, fact table, data cube schema.

PEMBUATAN DATA WAREHOUSE POTENSI DESA DI
WILAYAH BOGOR MENGGUNAKAN

ORACLE DATA WAREHOUSE

DINA WISUDAWAN KUSUMANINGTIAS
G64103018

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

PEMBUATAN DATA WAREHOUSE POTENSI DESA DI
WILAYAH BOGOR MENGGUNAKAN
ORACLE DATA WAREHOUSE

DINA WISUDAWAN KUSUMANINGTIAS
G64103018

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR

2007

PEMBUATAN DATA WAREHOUSE POTENSI DESA DI
WILAYAH BOGOR MENGGUNAKAN
ORACLE DATA WAREHOUSE

Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh:
DINA WISUDAWAN KUSUMANINGTIAS
G64103018

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007


Demi Masa.
Sesungguhnya manusia itu benar-benar berada dalam kerugian,
kecuali orang-orang yang beriman dan mengerjakan amal sholeh
dan nasehat menasehati supaya mentaati kebenaran
dan nasehat menasehati supaya menetapi kesabaran.(Q.S Al ‘Ashr: 1-3)
Jadilah ikan di air laut,
Meskipun airnya asin, tapi ikannya tidak asin.

Kupersembahkan untuk Bapak, Ibu, Adik-adik serta
Kakek dan Nenek tercinta

ABSTRACT

DINA WISUDAWAN KUSUMANINGTIAS. Pembuatan Data Warehouse Potensi Desa di
Wilayah Bogor menggunakan Oracle Data Warehouse. Dibimbing oleh HARI AGUNG
ADRIANTO dan IMAS S SITANGGANG.
Since year 1980, BPS ( Badan Pusat Statistik) performing a census of countryside potency.
Target of Census of countryside potency is provide the data to various need specially related to
requirement planning regional (spatial) in each area and provide the potency data (circumstance
of development and countryside growth). Data of Census of countryside potency cover the social

circumstance, economic, facilities, and also potency exist in countryside ( chief of village). Data
of countryside Potency progressively increase every year census. The data kept in separate file to
every year census. Such data condition cause the difficulty accessed data and analysed. To
integrate the data of countryside potency from various year needed data warehouse to facilitate
the process analyse and information accessing. This research aim to design and build a
multidimensional data model for the countryside potency data region Bogor. Those model will be
implemented by making data cube and OLAP (On Line Analitical Processing) on countryside
potency data warehouse. This Research scope is limited at countryside potency data which the
result of year census 1996, 1999, 2003, and 2006. Making of Scheme of data warehouse use three
solution. Those done to find the most effective solution in case regional change of subdistrict in the
year 1996, 1999, 2003, and 2006. Finally, this research use solution which is not considering
location change prblem. This research yield four dimension ( location dimension, year dimension,
settlement dimension, and farm dimension) and four fact table ( resident fact, settlement fact, farm
fact, and fact of education facility. Implementation of OLAP operation consist of roll-up, drilldown, slice, dice and pivot. User can see the data warehouse from application which have been
made. With this application consumer can see the dimension data and fact at data warehouse,
including new data, and see the data warehouse visualizinged in the form of data of tabular and
graph (bar graph, line graph, and pie graph).
Keyword: data warehouse, OLAP, dimension table, fact table, data cube scheme.

ABSTRAK


DINA WISUDAWAN KUSUMANINGTIAS. Pembuatan Data Warehouse Potensi Desa di
Wilayah Bogor menggunakan Oracle Data Warehouse. Dibimbing oleh HARI AGUNG
ADRIANTO dan IMAS S SITANGGANG.
Sejak tahun 1980, BPS (Badan Pusat Statistik) mengadakan sensus potensi desa. Tujuan sensus
potensi desa menyediakan data untuk berbagai keperluan khususnya yang berkaitan dengan
kebutuhan perencanaan regional (spasial) di setiap daerah dan menyediakan data potensi (keadaan
pembangunan dan perkembangan desa). Data sensus potensi desa meliputi keadaan sosial,
ekonomi, sarana dan prasarana, serta potensi yang ada di desa (kelurahan). Data potensi desa
semakin bertambah setiap tahun sensus. Data tersebut disimpan dalam file terpisah untuk setiap
tahun sensus. Kondisi data yang demikian menyebabkan data sulit diakses dan dianalisis. Untuk
mengintegrasikan data potensi desa dari berbagai tahun diperlukan data warehouse untuk
memudahkan proses analisis dan pengaksesan informasi. Penelitian ini bertujuan untuk merancang
dan membangun suatu model data multidimensi untuk data potensi desa di wilayah Bogor. Model
data tersebut akan diimplementasikan dalam pembuatan kubus data dan OLAP (On Line Analitical
Processing) pada data warehouse potensi desa. Ruang lingkup penelitian ini dibatasi pada data
potensi desa hasil sensus tahun 1996, 1999, 2003, dan 2006. Pembuatan skema data warehouse
menggunakan tiga solusi. Hal ini dilakukan untuk menemukan solusi yang paling efektif dalam
kasus potensi desa di wilayah Bogor yang mengalami perubahan wilayah kecamatan pada tahun
1996, 1999, 2003, dan 2006. Solusi yang digunakan dalam penelitian ini adalah solusi yang tidak

mempertimbangkan aspek perubahan wilayah. Penelitian ini menghasilkan empat dimensi
(dimensi lokasi, dimensi tahun, dimensi pemukiman, dan dimensi lahan) dan empat tabel fakta
(fakta penduduk, fakta pemukiman, fakta lahan, dan fakta sarana pendidikan). Operasi OLAP yang
diimplementasikan adalah operasi roll-up, drill-down, slice, dan dice. Pengguna dapat melihat data
warehouse dari aplikasi OLAP yang telah dibuat. Dengan aplikasi ini pengguna dapat melihat data
dimensi dan fakta pada data warehouse, memasukkan data baru, dan melihat data warehouse yang
divisualisasikan dalam bentuk data tabular dan grafik (diagram batang, diagram garis, dam grafik
pie).
Kata kunci: data warehouse, OLAP, dimension table, fact table, data cube schema.

Judul
Nama
NRP

: Pembuatan Data Warehouse Potensi Desa di Wilayah Bogor
menggunakan Oracle Data Warehouse
: Dina Wisudawan Kusumaningtias
: G64103018

Menyetujui:


Pembimbing II,

Pembimbing I,

Hari Agung Adrianto, S.Kom., M.Si.
NIP 132311918

Imas S. Sitanggang, S.Si., M.Kom.
NIP 132206235

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Prof. Dr. Ir. Yonny Koesmaryono, M.S.
NIP 131473999

Tanggal lulus:


RIWAYAT HIDUP

Penulis dilahirkan di Purworejo pada tanggal 24 Maret 1985 dari Ayah Drs. Sukirno dan
Ibu Isni Winarsih, S.Pd. Penulis merupakan anak pertama dari tiga bersaudara. Tahun 2003
penulis lulus dari SMU Negeri 1 Purworejo dan pada tahun yang sama diterima di Program Studi
Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Institut Petanian Bogor melalui jalur Undangan Seleksi Masuk IPB.
Pada tahun 2006 Penulis melaksanakan praktek lapangan di PT Infomedia Nusantara
(Yellow Pages) selama kurang lebih 2 bulan. Selama perkuliahan, penulis pernah menjabat sebagai
Ketua Departemen Fund Development Himpunan Mahasiswa Ilmu Komputer (FD HIMALKOM)
pada tahun 2004-2005.

1

PRAKATA

Ahamdulillahi robbil’alamiin. Puji syukur kehadirat Allah SWT atas limpahan rahmat,
karunia, hidayah, dan inayah-Nya sehingga skripsi dengan judul Pembuatan Data Warehouse
Potensi Desa di Wilayah Bogor menggunakan Oracle Data Warehouse dapat diselesaikan.
Shalawat serta salam juga Penulis sampaikan kepada junjungan kita Nabi Muhammad

Shallalahu‘alaihi wasallam beserta seluruh sahabat dan umatnya hingga akhir zaman.
Penulis menyampaikan terima kasih kepada semua pihak yang telah membantu dalam penulisan
skripsi ini khususnya kepada Bapak Hari Agung, S.Kom., M.Si selaku pembimbing I dan Ibu Imas
S Sitanggang, S.Si., M.Kom selaku pembimbing II yang telah membimbing dengan penuh
ketekunan dan kesabaran hingga selesainya penulisan skripsi ini, serta Bapak Firman Ardiansyah,
S.Kom., M.Si yang telah bersedia menjadi penguji sidang. Selanjutnya, penulis juga ingin
mengucapkan terima kasih kepada:
1

Bapak dan Ibu serta adik-adik tercinta (Pramudya Pamungkas dan Dwijayanti Setiarini) yang
senantiasa memberikan dukungan moral, spiritual, dan dukungan doa kepada penulis.

2

Bapak Muhammad Ikhsan dan keluarga yang telah memberikan banyak nasehat dan
mengarahkan penulis dalam memperbaiki hidup serta memberikan bimbingan spiritual.

3

Bulik In dan Om Sukiman sekeluarga yang sudah menjadi keluarga kedua selama di Bogor
dan senantiasa memberi dukungan moral.

4

Meynar yang selalu memberi dukungan untuk terus maju. Vita dengan keceriaan dan ceritacerita anehnya. Nanik yang banyak membagi pengalaman yang berharga. Teh Arum yang
selalu lemah lembut menghadapiku dengan keluh kesahku.

5

Anti teman seperjuangan sekaligus teman berbagi selama penelitian. Yustin yang selalu
memberi dorongan dan dukungan. Galan terima kasih atas bantuan dan doanya. Kak Ifnu dan
Kak Hendra yang telah membantu penulis belajar oracle. Nacha, Ghofar, Atik, Aristi, Yulia,
Ratih, Sofi, Thessi, dan teman-teman seperjuangan Ilkom 40 terima kasih atas
kebersamaannya selama perkuliahan di Ilkom.

6

Mbak Yani sebagai kakak di Delonix yang selalu menemani dan memberi dukungan, terima
kasih juga untuk Ilum yang suka ”rekaman” menghibur saat stress, Mba Oni atas bantuannya,
Tyas, Yana, Dede, Mba Urip, Mba Erna, teman-teman RZ, teman-teman Delonix Ceria, dan
teman-teman Gamapuri 40 yang senantiasa memberikan keceriaan dan kegembiraan.

7

Seluruh staf pengajar atas ilmu dan wawasan yang telah diberikan, seluruh staf administrasi
Departemen Ilmu Komputer atas bantuannya, dan semua pihak yang tidak dapat disebutkan
satu per satu.

Penulis menyadari bahwa masih banyak kekurangan dalam penelitian ini. Oleh karena itu,
kritik dan saran sangat Penulis harapkan untuk perbaikan di masa mendatang. Semoga skripsi ini
dapat bermanfaat bagi semua pihak. Amin.

Bogor, Agustus 2007

Dina Wisudawan K

vii

DAFTAR ISI
Halaman
DAFTAR TABEL..........................................................................................................................viii
DAFTAR GAMBAR .....................................................................................................................viii
DAFTAR LAMPIRAN..................................................................................................................viii
PENDAHULUAN ............................................................................................................................1
Latar Belakang ..............................................................................................................................1
Tujuan ...........................................................................................................................................1
Ruang Lingkup..............................................................................................................................1
Manfaat .........................................................................................................................................1
TINJAUAN PUSTAKA ...................................................................................................................1
Potensi Desa (Podes).....................................................................................................................1
Data warehouse ............................................................................................................................1
Model Data Multidimensi .............................................................................................................2
Kubus Data: Komputasi Kuantitas Agregat ..................................................................................3
Online Analytical Processing ( OLAP).........................................................................................4
Data Praproses ..............................................................................................................................5
Arsitektur Data Warehouse...........................................................................................................5
Operasi-Operasi Pada Data Multidimensi.....................................................................................5
Oracle Data Warehouse ................................................................................................................6
METODE PENELITIAN..................................................................................................................6
Analisis Aliran Data......................................................................................................................6
Perancangan dan Pembuatan Data Warehouse .............................................................................7
Pengembangan OLAP...................................................................................................................7
HASIL DAN PEMBAHASAN.........................................................................................................8
Analisis Aliran Data......................................................................................................................8
Perancangan dan Pembuatan Data Warehouse .............................................................................9
Pengembangan OLAP (On Line Analytical Processing) ............................................................12
KESIMPULAN DAN SARAN.......................................................................................................13
Kesimpulan .................................................................................................................................13
Saran ...........................................................................................................................................14
DAFTAR PUSTAKA .....................................................................................................................14
LAMPIRAN....................................................................................................................................15

viii

DAFTAR TABEL
Halaman
1 Total hasil penjumlahan semua lokasi untuk waktu dan produk tertentu.....................................3
2 Marginal total dari Tabel 1............................................................................................................3
3 Atribut hasil ekstraksi data dan deskripsinya ................................................................................8
4 Atribut yang mengalami transformasi pada data potensi desa (podes) .........................................9
5 Dimensi pada solusi 1 .................................................................................................................10
6 Fakta pada solusi 1......................................................................................................................10
7 Dimensi yang digunakan pada solusi 2 .......................................................................................10

DAFTAR GAMBAR
Halaman
1 Skema bintang (Elmasri & Navathe 2000)....................................................................................2
2 Skema snowflake (Elmasri & Navathe 2000)................................................................................3
3 Skema galaksi (Elmasri & Navathe 2000) ....................................................................................3
4 Arsitektur tiga tingkat data warehouse (Han & Kamber 2006). ...................................................5
5 Ilustrasi untuk operasi-operasi pada data multidimensi. .............................................................6

DAFTAR LAMPIRAN
Halaman
1 Daftar kecamatan yang mengalami pemecahan dan perubahan wilayah ....................................16
2 Skema kubus data untuk solusi 1 ................................................................................................17
3 Daftar tabel fakta yang digunakan pada solusi 2.........................................................................18
4 Skema kubus data yang digunakan pada solusi 2........................................................................19
5 Operasi roll up untuk mengetahu jumlah penduduk tiap kecamatan di kabupaten Bogor .........20
6 Drill down untuk mengetahui jumlah SD di masing-masing kecamatan ....................................21
7 Pivot pada dimensi lahan dengan dimensi lokasi.......................................................................22
8 Contoh operasi slice untuk mengetahui jumlah keluarga tahun 2003 di Kabupaten Bogor........23
9 Contoh operasi dice untuk mengetahui jumlah keluarga di Kecamatan Nanggung dan
Megamendung .............................................................................................................................24
10 Jumlah penduduk kecamatan Ciawi, Cisarua, dan Megamendung divisualisasikan menggunakan
diagram batang dan diagram garis ...............................................................................................25
11 Persentase jumlah penduduk pria dan jumlah penduduk wanita pada tahun 2006 di Kabupaten
Bogor divisualisasikan menggunakan grafik pie.........................................................................26
12 Hasil uji fungsi melihat data pada data warehouse....................................................................27
13 Hasil uji fungsi menampilkan data pada kubus data ...................................................................28
14 Hasil uji fungsi melakukan operasi OLAP.................................................................................29
15 Hasil uji fungsi visualisasi data dalam bentuk diagram batang, diagram garis, dan grafik pie ...30

1

PENDAHULUAN
Latar Belakang
Kemajuan teknologi komputer semakin
memudahkan proses penyimpanan dan
pengolahan data berukuran besar. Namun
demikian, seringkali data yang sudah
tersimpan belum dimanfaatkan secara
maksimal menjadi suatu informasi dan
pengetahuan yang penting di kemudian hari.
Pemakaian sumber informasi yang
terkandung dalam basis data sangat berperan
dalam proses permintaan dan pelayanan
query. Terkadang proses query tersebut
melibatkan sumber informasi yang besar
sehingga diperlukan peningkatan kinerja
query untuk mempercepat akses informasi.
Data warehouse dan On-Line Analytical
Processing (OLAP) merupakan elemen
penting
dalam
mendukung
proses
pengambilan keputusan.
Badan Pusat Statistik (BPS) secara
teratur melakukan pengumpulan data untuk
memantau kondisi penduduk dan sosial
ekonomi Indonesia, misalnya melalui Survei
Potensi Desa (Podes). Podes merupakan
data yang berhubungan dengan wilayah (tata
ruang) dengan basis desa/kelurahan. Podes
pertama kali dilakukan pada tahun 1980
bersamaan dengan Sensus Penduduk 1980.
Data Podes terdiri dari 257 item untuk
seluruh desa di Indonesia.
Data podes memiliki volume yang besar
sehingga perlu disimpan dalam sebuah
repositori yang solid, yaitu data warehouse.
Data warehouse dapat digunakan untuk
menyimpan
dan
mengolah
data
multidimensi agar dapat mendukung
keputusan yang lebih cepat dan lebih tepat.
Tujuan

jumlah keluarga, dan jumlah rumah. Data
diambil dari hasil sensus potensi desa yang
dilakukan BPS tahun 1996, 1999, 2003, dan
2006.
Manfaat
Manfaat penelitian ini adalah tersedianya
data dan informasi mengenai potensi desa
yang dapat diakses secara cepat dan akurat.
Dengan demikian, diharapkan data dan
informasi tersebut dapat digunakan oleh
pihak-pihak terkait (BPS dan Pemerintah)
dalam mendukung proses pengambilan
keputusan.

TINJAUAN PUSTAKA
Potensi Desa (Podes)
Potensi desa (podes) adalah kemampuan
atau
daya/kekuatan
yang
memiliki
kemungkinan untuk dikembangkan dalam
wilayah otonomi desa. Data potensi desa
merupakan data yang berurusan dengan
wilayah/tata ruang dengan basis desa/
kelurahan. Sensus podes dilakukan setiap
tiga tahun. Tujuan diadakannya PODES
antara lain (www.bps.go.id/podes2006):
• Tersedianya data yang potensi/keadaan
pembangunan
di
desa/
dan
perkembangannya meliputi keadaan
sosial, ekonomi, sarana dan prasarana,
serta potensi yang ada di desa/kelurahan.
• Menyediakan data untuk berbagai
keperluan khususnya yang berkaitan
dengan kebutuhan perencanaan regional
(spasial) di setiap daerah.
• Melengkapi
penyusunan
kerangka
sampling (sampling frame) untuk
kegiatan statistik lebih lanjut.

Penelitian ini bertujuan untuk merancang
dan membangun suatu model basis data
multidimensi untuk data potensi desa
wilayah Bogor. Model data tersebut akan
diimplementasikan dalam pembuatan kubus
data dan OLAP (On Line Analitical
Processing) pada data warehouse potensi
desa.

• Menyediakan informasi bagi keperluan
penentuan klasifikasi/updating desa
urban dan rural, desa tertinggal dan tidak
tertinggal.

Ruang Lingkup

Data Warehouse
Secara umum, data warehouse merujuk
pada tempat penyimpanan data yang
dikelola secara terpisah dari basis data-basis
data operasional yang dimiliki sebuah

Penelitian ini akan dibatasi pada
pembuatan data warehouse potensi desa
wilayah Bogor dengan subjek utama luas
lahan, jumlah penduduk, jumlah sekolah,

• Menyediakan
data
pokok
bagi
penyusunan statistik wilayah kecil (small
area statistics).

2

instansi.
Data warehouse seringkali
dibangun dari berbagai basis data yang
diintegrasikan dengan berbagai sistem
aplikasi
untuk
mendukung
proses
pengambilan keputusan dan analisis data
dengan menyediakan platform yang solid
untuk data historikal dan gabungan
(consolidated). Definisi dari data warehouse
telah dinyatakan oleh Bill Inmon pada tahun
1980an, yaitu koleksi data yang bersifat
subject-oriented, integrated, time variant,
dan non-volatile, yang digunakan dalam
pembuatan keputusan strategis (Imhoff et.
al. 2003).
Istilah data warehousing merujuk ke
proses konstruksi dan pengunaan data
warehouse (Tam 1998). Konstruksi data
warehouse memerlukan tahapan data
integration, data cleaning, dan data
consolidation. Hal ini dikarenakan basis
data diintegrasikan dari sumber data yang
heterogen. Sumber-sumber data tersebut
mungkin mengandung data dengan kualitas
yang beragam atau memiliki representasi
format data yang tidak konsisten.
Model Data Multidimensi
Model data multidimensi adalah model
data yang digunakan pada data warehouse.
Model data multidimensi terdiri dari dua
data, yaitu (Mallach 2000):
• Data dimensi (dimension data)
Data dimensi adalah entitas yang
ingin
disimpan
oleh
perusahaan
(organisasi). Data dimensi akan berubah
jika analisis kebutuhan pengguna
berubah. Data dimensi mendefinisikan
label yang membentuk isi laporan. Setiap
dimensi diulang untuk setiap kelompok.
Atribut data dimensi diletakkan pada
tabel dimensi. Tabel dimensi berukuran
lebih kecil daripada tabel fakta, berisi
data bukan numerik yang berasosiasi
dengan atribut dimensi.
• Data fakta (fact data)
Data fakta adalah data utama dari
data multidimensi yang merupakan
kuantitas yang ingin diketahui dengan
menganalisis hubungan antardimensi.
Data fakta diekstrak dari berbagai
sumber. Data fakta cenderung stabil dan
tidak berubah seiring waktu. Atribut data
fakta diletakkan pada tabel fakta. Tabel
fakta berukuran besar, memiliki jumlah
baris sesuai dengan jumlah kombinasi

nilai dimensi yang mungkin dan jumlah
kolom sesuai dengan jumlah dimensi
yang direpresentasikan. Tabel fakta
berisi nama-nama fakta, ukuran, dan
foreign key dari tabel dimensi yang
berhubungan.
Model data multidimensi menampilkan
data dalam bentuk kubus data. Kubus data
memungkinkan data dimodelkan dan
ditampilkan dalam banyak dimensi. Kubus
data disebut juga cuboid. Pola-pola cuboid
dapat dibuat apabila diberikan satu
kumpulan dimensi. Masing-masing pola
menampilkan data pada tingkat kesimpulan
yang berbeda-beda (Han & Kamber 2006).
Untuk
menggambarkan
hubungan
antardata pada data multidimensi digunakan
skema
multidimensi.
Skema
adalah
sekumpulan objek dalam basis data. Pada
data
warehouse,
skema
merupakan
sekumpulan tabel yang berhubungan. Skema
digunakan untuk menunjukkan hubungan
antara tabel dimensi dengan tabel fakta.
Skema ditentukan berdasarkan kebutuhan
data warehouse dan keinginan pembuat data
warehouse. Data warehouse membutuhkan
skema yang ringkas dan berorientasi subjek.
Tipe-tipe skema multidimensi antara lain
(Han & Kamber 2006):
• Skema bintang (star schema)
Skema bintang adalah skema data
warehouse yang paling sederhana.
Skema ini disebut skema bintang karena
hubungan antara tabel dimensi dan tabel
fakta menyerupai bintang dimana satu
tabel
fakta
dihubungkan
dengan
beberapa tabel dimensi. Titik tengah
skema bintang adalah satu tabel fakta
besar dan sudut-sudutnya adalah tabeltabel dimensi. Bentuk skema bintang
dapat
dilihat
pada
Gambar
1.
Keuntungan
yang
didapat
jika
menggunakan
skema
ini
adalah
peningkatan kinerja data warehouse,
pemrosesan query yang lebih efisien, dan
waktu respon yang cepat.

Gambar 1 Skema bintang (Elmasri &
Navathe 2000)

3

Skema snowflake adalah variasi dari
skema bintang dimana beberapa tabel
dimensi dinormalisasi, jadi dihasilkan
beberapa tabel tambahan. Bentuk skema
snowflake dapat dilihat pada Gambar 2.
Keuntungan yang didapat dengan
menggunakan
skema
ini
adalah
penghematan memori, tapi waktu yang
dibutuhkan untuk pemrosesan query
menjadi lebih lama.

Gambar 2 Skema snowflake (Elmasri &
Navathe 2000)
• Skema galaksi (fact constellation)
Pada skema galaksi, beberapa tabel
fakta berbagi tabel dimensi. Bentuk
skema galaksi dapat dilihat pada Gambar
3. Keuntungan menggunakan skema ini
adalah
menghemat
memori
dan
mengurangi kesalahan yang mungkin
terjadi.

untuk setiap tabel-tabel dimensi
berelasi berada dalam tabel fakta.

yang

Motivasi utama untuk menentukan data
multidimensi adalah pentingnya membuat
agregasi data dalam berbagai cara. Measure
pada kubus data adalah fungsi numerik
yang dievaluasi pada tiap titik di dalam
ruang kubus data (Han & Kamber 2006).
Dalam contoh penjualan, kita dapat
menemukan pendapatan penjualan total
untuk tahun tertentu dan untuk produk
tertentu, atau mungkin ingin dilihat
pendapatan penjualan tahunan untuk setiap
lokasi untuk semua produk. Perhitungan
agregasi total melibatkan penetapan nilai
tertentu untuk beberapa atribut yang
digunakan
sebagai
dimensi
dan
menjumlahkan semua nilai yang mungkin
untuk atribut-atribut yang membentuk
dimensi-dimensi sisanya.
Tabel 1
menunjukkan total yang dihasilkan dari
semua lokasi untuk waktu tertentu dan Tabel
2 menunjukkan marginal total dari Tabel 1.
Tabel 1 Total hasil penjumlahan semua
lokasi untuk waktu dan produk tertentu
Tahun
Jan 1,
Jan 2,
.. Dec
2004
2004
31,
2004
1
1,001
987
.. 891
.. …
… …

Product ID

• Skema snowflake (snowflake schema)

27


10,265


10,225


..

9,325


Tabel 2 Marginal total dari Tabel 1.

Kubus Data: Komputasi Kuantitas
Agregat
Kubus data didefinisikan oleh dimensi
dan fakta. Dimensi berisi perspektif atau
entitas-entitas dimana organisasi menyimpan
record data, sedangkan fakta mengandung
ukuran-ukuran data dan relasi antardimensi
akan dianalisis.
Setiap dimensi dapat
memiliki sebuah tabel dimensi yang
menjelaskan lebih jauh dimensi-dimensi,
sedangkan informasi tentang fakta seperti
nama-nama fakta, ukuran-ukuran serta kunci

Product ID

1

Gambar 3 Skema galaksi (Elmasri &
Navathe 2000)


27

Total

Jan
1,
2004
1,
001


Jan
2,
2004
987

..

..

Dec
31,
2004
891



..



10,
265

527,
362

10,
225

532,.
953

..
..

9,
325

631,
221

Total

370,
000

3,800,
020

227,
352,
127

Jika terdapat 365 hari dalam satu tahun
dan 1000 produk, maka Tabel 1 memiliki
entri sebanyak 365,000 (nilai total), untuk
setiap pasangan data produk. Dapat juga
ditentukan lokasi toko dan tanggal serta
menjumlahkan nilai pada semua produk atau

4

menentukan lokasi dan produk serta
menjumlahkan nilai pada seluruh tanggal.
Tabel 2 menunjukkan marginal total dari
Tabel 1. Nilai-nilai total ini dihasilkan dari
penjumlahan pada tanggal dan produk.
Dalam Tabel 3, pendapatan penjualan total
untuk produk 1, yang diperoleh dengan
menjumlahkan seluruh nilai pada baris 1
(seluruh
tanggal),
adalah
370,000.
Pendapatan penjualan total pada 1 Januari
2004, yang diperoleh dengan menjumlahkan
seluruh nilai pada kolom 1 (seluruh produk),
adalah 527,362. Pendapatan penjualan total,
yang diperoleh dengan menjumlahkan
semua baris dan semua kolom (semua
tanggal dan produk) adalah 227, 352, 127.
Hal yang penting dalam contoh ini
adalah bahwa terdapat sejumlah total
(agregat) yang berbeda yang dapat dihitung
untuk
sebuah
array
multidimensi,
tergantung kepada berapa banyak atribut
yang kita jumlahkan. Diasumsikan bahwa
terdapat n dimensi dan bahwa dimensi
(atribut) ke-i memiliki si nilai yang
mungkin. Terdapat n cara yang berbeda
untuk menjumlahkan hanya pada sebuah
atribut.
Jika kita menjumlahkan pada
dimensi j, maka diperoleh s1*...* sj-1*sj+1*...*
sn total, masing-masing untuk setiap
kombinasi nilai atribut yang mungkin dari
n−1 atribut (dimensi) lainnya. Total yang
dihasilkan dari penjumlahan satu atribut dari
array multidimensi dengan n−1 dimensi dan
terdapat n array dari total. Dalam contoh
penjualan, terdapat tiga himpunan total yang
dihasilkan dari pejumlahan hanya pada satu
atribut dan masing-masing total dapat
ditampilkan sebagai tabel dua dimensi.
Jika kita menjumlahkan nilai atribut pada
dua dimensi (mungkin dimulai dengan salah
satu dari array total yang diperoleh dengan
penjumlahan pada satu dimensi), maka kita
akan
memperoleh
sebuah
array
multidimensi total dengan n−2 dimensi.
Terdapat ⎛⎜ n ⎞⎟ array yang berbeda untuk
⎜2⎟
⎝ ⎠

total. Untuk contoh penjualan, terdapat
⎛3⎞
array total yang dihasilkan dari
⎜ ⎟=3
⎜2⎟
⎝ ⎠

penjumlahan pada lokasi dan produk, lokasi
dan waktu, atau produk dan waktu. Secara
umum, penjumlahan pada k dimensi
menghasilkan ⎛⎜ n ⎞⎟ array total, masing⎜k⎟
⎝ ⎠

masing dengan n−k dimensi.

Representasi data multidimensi, bersama
dengan semua total (agregat) yang mungkin,
dikenal sebagai kubus data. Selain nama,
ukuran dari setiap dimensi, yaitu banyaknya
nilai atribut, tidak harus sama. Di samping
itu, sebuah kubus data dapat memiliki
dimensi kurang atau lebih dari tiga.
Online Analytical Processing ( OLAP)
Sistem data warehouse digunakan untuk
analisis data dan pembuatan keputusan.
Sistem ini dikenal sebagai on-line analytical
processing (OLAP) system. Sistem OLAP
dapat
mengorganisasikan
dan
mempresentasikan data dalam beragam
format
agar
dapat
mengakomodasi
kebutuhan pengguna yang beragam.
Online Analytical Processing (OLAP)
adalah
proses
komputer
yang
memungkinkan pengguna dapat dengan
mudah dan selektif memilih dan melihat
data dari sudut pandang yang berbeda (Han
& Kamber 2006). Data pada OLAP
disimpan dalam basis data multidimensi.
Jika basis data relasional terdiri atas dua
dimensi, maka basis data multidimensi
terdiri atas banyak dimensi yang dapat
dipisahkan oleh OLAP menjadi beberapa
sub atribut. OLAP dapat digunakan untuk
menemukan hubungan antara suatu item
yang belum ditemukan.
Berdasarkan struktur basis datanya,
OLAP dibedakan menjadi tiga kategori
utama (Han & Kamber 2006):
1 Multidimensional Online Analytical
Processing (MOLAP) adalah OLAP
yang secara langsung mengarah pada
basis data multidimensi. MOLAP
memproses data yang telah disimpan
dalam array multidimensional dimana
semua kombinasi data yang mungkin
dicerminkan, masing-masing di dalam
suatu sel yang dapat diakses secara
langsung.
2 Relational Online Analytical Processing
(ROLAP) adalah OLAP yang melakukan
analisis data secara dinamis yang
disimpan dalam basis data relasional
bukan pada basis data multidimensi.
ROLAP merupakan bentuk teknologi
dari OLAP yang paling berkembang.
3 Hybrid Online Analytical Processing
(HOLAP) merupakan kombinasi antara
ROLAP dengan MOLAP. HOLAP
dikembangkan untuk mengkombinasikan

5

antara kapasitas data pada ROLAP yang
besar dengan kemampuan proses pada
MOLAP.
Data Praproses
Data praproses adalah proses yang harus
dilakukan
sebelum
membuat
data
warehouse. Proses-proses tersebut adalah
(Han & Kamber 2006):
1 Ekstraksi (extraction)
Ekstraksi adalah pengambilan data
yang relevan dari basis data operasional
sebelum masuk ke data warehouse. Pada
ekstraksi, atribut-atribut dan recordrecord yang diinginkan dipilih dan
diambil dari basis data operasional. Hal
ini perlu dilakukan karena tidak semua
elemen data berguna dalam pembuatan
keputusan.
2 Pembersihan (cleaning)

Arsitektur Data Warehouse
Salah satu arsitektur data warehouse
adalah arsitektur tiga tingkat seperti pada
Gambar 4 (Han & Kamber 2006), yaitu:
1 Tingkat paling bawah merupakan server
basis data warehouse yang seringkali
berupa sistem basis data relasional. Pada
awal proses data diekstrak dan
ditransformasi agar siap dimasukkan ke
data warehouse. Setelah data siap, maka
dilakukan perancangan data warehousenya.
2 Tingkat tengah adalah server OLAP
yang diimplementasikan menggunakan
sebuah OLAP multidimensi (MOLAP)
atau OLAP relasional (ROLAP).
3 Tingkat paling atas adalah tingkat
pengguna. Pada tingkat ini dibuat suatu
analysis tools, reporting tools, atau data
mining tools.

Pada pembersihan semua kesalahan
dihilangkan dan diperbaiki. Pembersihan
dilakukan
untuk
menghilangkan
kesalahan (error). Kesalahan yang
umum terjadi adalah nilai yang hilang
(missing values), noise, dan data yang
tidak konsisten. Pembersihan dilakukan
dengan mengisi nilai yang kosong dan
menghilangkan noise.
3 Transformasi (transformation)
Pada transformasi, data dari semua
sumber diberikan format dan nama yang
umum. Proses transformasi dilakukan
agar data tetap konsisten. Transformasi
yang paling penting adalah transformasi
nama agar tidak ada nama atribut yang
sama atau atribut yang sama memiliki
nama yang berbeda pada basis data yang
berbeda. Setelah transformasi nama,
semua elemen data harus dikonversikan
ke format yang umum.
4 Pemuatan (loading)
Setelah
tahap
ekstraksi
dan
transformasi dilakukan, maka data sudah
siap untuk dimasukkan ke data
warehouse. Pada tahap ini juga
dilakukan pengurutan dan pengecekan
integritas.
5 Refresh
Tahapan ini dilakukan jika ada data
baru yang masuk.

Gambar 4 Arsitektur tiga tingkat data
warehouse (Han & Kamber 2006).
Operasi-Operasi Pada Data Multidimensi
Operasi-operasi pada data multidimensi
meliputi (Han & Kamber 2006):


Slicing dan Dicing

Slicing adalah pemilihan sekelompok sel
dari seluruh array multidimensi dengan
menentukan nilai tertentu untuk satu atau
lebih dimensi. Dicing merupakan pemilihan
sebuah subset dari sel dengan menentukan
range nilai atribut. Hal ini ekuivalen dengan
mendefinisikan sebuah subarray dari array
yang lengkap. Dalam praktis, kedua operasi

6

ini dapat disertai oleh agregasi pada
beberapa dimensi.
• Roll up dan Drill down
Nilai atribut seperti tanggal memiliki
nilai yang menyatakan tahun, bulan dan
minggu. Sebuah lokasi juga dapat memiliki
beberapa ciri seperti country (negara), state
(propinsi) dan kabupaten. Product dapat
dibagi ke dalam berbagai kategori seperti
elektronik dan furniture.
Seringkali
kategori
ini
dapat
diorganisasikan sebagai pohon hirarki atau
lattice. Sebagai contoh, tahun berisi bulan
dan minggu, keduanya berisi hari. Lokasi
dapat dibagi ke dalam negara, yang terdiri
dari propinsi, dan propinsi terdiri dari
kabupaten. Contoh lain adalah kategori
produk, furniture, dapat dibagi ke dalam sub
kategori kursi, meja, sofa dan lain-lain.
Struktur hirarki memunculkan operasi
roll-up dan drill-down. Sebagai ilustrasi,
pada data penjualan, yang merupakan data
multidimensi dengan entri-entri untuk setiap
tanggal, kita dapat menentukan agregat
(roll-up) penjualan untuk semua tanggal
dalam satu bulan. Sebaliknya, diberikan
representasi data dimana dimensi waktu
dipecah ke dalam bulan, kita ingin
memisahkan total penjualan bulanan (drill
down) ke dalam total penjualan harian.
Dengan demikian operasi roll-up dan
drill-down berkaitan dengan agregasi. Akan
tetapi kedua ini berbeda dengan operasi
agregasi yang telah dibahas, bahwa operasi
roll-up dan drill-down mengagregasi sel
dalam sebuah dimensi, bukan pada seluruh
dimensi.
• Pivot
Agregasi yang dijelaskan sebelumnya
dapat dipandang sebagai bentuk reduksi
dimensionalitas. Secara khusus, dimensi ke-j
dieliminasi dengan penjumlahan pada
dimensi tersebut. Secara konseptual, hal ini
meringkas setiap kolom dari sel dalam
dimensi ke-j ke dalam sebuah sel. Jika sj
adalah banyaknya nilai yang mungkin dari
dimensi ke-j, banyaknya sel direduksi oleh
faktor dari sj.
Pivoting merujuk kepada agregasi pada
semua dimensi. Hasilnya adalah tabulasi
silang dua dimensi dengan dua dimensi yang
ditentukan sebagai dimensi-dimensi sisanya.
Gambar 5 menunjukkan ilustrasi untuk
operasi-operasi pada data multidimensi.

Gambar 5 Ilustrasi untuk operasi-operasi
pada data multidimensi.
Oracle Data Warehouse
Oracle data warehouse adalah proses
pembangunan
data
warehouse
menggunakan tools yang terdapat dalam
oracle sehingga data dapat dengan mudah
dikelola, diakses, dan dianalisis. Dengan
manajemen antarmuka tunggal, Oracle
Database 10g melakukan pemeliharaan
sederhana terhadap pengembangan data
warehouse (Oracle 2006).

METODE PENELITIAN
Penelitian ini akan dilakukan dalam
beberapa tahap yaitu tahap analisis aliran
data, perancangan, dan pembuatan data
warehouse, dan pengembangan OLAP.
Tahap-tahap tersebut dijelaskan sebagai
berikut :
Analisis Data
Sensus potensi desa (podes) dilakukan
setiap tiga tahun. Data yang akan digunakan
dalam pembuatan data warehouse potensi
desa di wilayah Bogor adalah data potensi
desa hasil sensus BPS pada tahun 1996,
1999, 2003, 2006. Untuk data Potensi Desa
akan dilakukan praproses data meliputi

7

ekstraksi
data,
transformasi
data,
pembersihan data, dan pemuatan data.

Pengembangan OLAP
Tahap pengembangan OLAP meliputi:

Perancangan dan Pembuatan Data
Warehouse
Tahap pembuatan data warehouse
meliputi:

a

a

b

Pada tahap ini didefinisikan
spesifikasi fungsi yang diperlukan
untuk
pengembangan
OLAP
menggunakan tools pada oracle.
Spesifikasi fungsi disesuaikan dengan
kebutuhan pengguna.

Pendefinisian
Kubus
Data
dan
perancangan model data multidimensi.
Pada tahap ini akan ditentukan
skema kubus data yang akan digunakan
apakah skema star, skema snowflake
atau skema galaksi.

b

Pendefinisian Dimensi

Pendefinisian
Hirarki

Level

Dimensi

d

• Perancangan Input
Perancangan input dilakukan dengan
cara mengidentifikasi input yang
dibutuhkan
dalam
proses
penambahan data, pemrosesan kubus
data, dan penjelajahan OLAP.

atau

Untuk masing-masing dimensi akan
ditentukan tingkat perincian yang
diperlukan berserta hirarki yang
membentuknya. Dengan data yang ada
dimensi lokasi dapat disusun dalam
empat
level
yaitu
propinsi
>
kabupaten/kota > kecamatan > desa,
sedangkan dimensi waktu hanya
memiliki satu level (tahun : 1996, 1999,
2003, 2006). Dimensi lahan memiliki
satu level yaitu jenis lahan. Dimensi
pemukiman memiliki satu level yaitu
jenis pemukiman.

• Perancangan Proses
Proses dirancang untuk menentukan
urutan kejadian sampai diperolehnya
output yang diinginkan berdasarkan
data input yang ada.
• Perancangan Output
Output dirancang agar pengguna
dapat dengan mudah memahami dan
memperoleh output dari OLAP.
c

Pendefinisian Fungsi Agregat
Pada tahap ini didefinisikan fungsi
agregat numerik yang digunakan.
Fungsi agregat dapat berupa SUM
(penjumlahan), AVG (average/ratarata), MAX (maksimum), dan MIN
(minimum).

f

Pembangunan Data warehouse
Data warehouse akan dikembangkan
menggunakan Oracle 10g Database, dan
Oracle Data warehouse.

Implementasi
Implementasi OLAP
dibangun
menggunakan
tools
Analytic
Workspace Manager 10.2.0.3, Oracle
Data Warehouse, dan TOAD versi 8.0.
Perangkat keras yang digunakan yaitu:
Processor Intel Celeron 1.7 GHz,
Memory 1 GB, Harddisk 120 GB,
keyboard dan mouse.

Pendefinisian measure
Pada tahap ini ditentukan ukuran yang
akan dianalisis pada data potensi desa
(podes) wilayah Bogor.

e

Desain
Perancangan visualisasi OLAP
didefinisikan sebagai proses dimana
kebutuhan OLAP telah didefinisikan
pada
tahap
analisis
kebutuhan.
Perancangan OLAP dibagi menjadi
tiga, yaitu:

Pada tahap ini didefinisikan
dimensi yang akan digunakan dalam
pembuatan data warehouse. Dimensi
yang terlibat adalah dimensi lokasi,
dimensi waktu, dimensi pemukiman,
dan dimensi lahan.
c

Analisis

d

Pengujian
Pengujian merupakan tahap untuk
menguji data warehouse apakah telah
sesuai dengan kebutuhan dan berfungsi
dengan baik. Pengujian dilakukan pada
kubus data yang divisualisasikan
dengan tools OLAP pada oracle.
Metode pengujian yang digunakan
adalah black-box testing. Black-box
testing merupakan pengujian yang

8

memeriksa apakah masukan dari
pengguna akan memberikan keluaran
yang
sesuai
dengan
tidak
memperhatikan proses yang terjadi di
dalamnya (Sommerville 2000).

HASIL DAN PEMBAHASAN
Dalam pembuatan data warehouse
potensi desa wilayah Bogor melalui
beberapa tahap yaitu:
Analisis Data
1 Definisi Masalah
Data podes tahun 1996 terdiri atas 408
atribut, tahun 1999 terdiri atas 448 atribut,
tahun 2003 terdiri atas 750 atribut, dan tahun
2006 terdiri atas 437 atribut. Atribut-atribut
tersebut ada yang sama untuk keempat
tahun, namun ada juga yang berbeda atau
tidak ada pada keempat tahun. Jumlah
atribut yang sama dan ada pada keempat
tahun tersebut sebanyak 257 atribut. Atribut
yang digunakan pada data warehouse adalah
atribut yang ada pada keempat tahun atau
atribut yang ada minimal pada tiga tahun.
2 Data Praproses
Sebelum masuk ke pembuatan data
warehouse, data harus diproses terlebih
dahulu. Tahap-tahap praproses pada data
podes yaitu:
a Ekstraksi Data
Data podes asli yang diperoleh dari
Badan Pusat Statistik berupa file dalam
format file SAS (SSD). Oleh karena itu, data
tersebut
dikonversi ke format SAV,
selanjutnya diimpor menjadi file CSV
(comma delimited) untuk memudahkan
dalam pemilihan atribut-atribut yang relevan
yang akan digunakan dalam pembuatan
data warehouse.
Pemilihan atribut berdasarkan subjek
utama yang akan dianalisis untuk proses
pengambilan keputusan. Atribut yang
digunakan dapat dilihat pada Tabel 3.

Tabel 3 Atribut hasil ekstraksi data dan
deskripsinya
Nama Atribut
Deskripsi
Nama_kab
Nama kabupaten
Nama_kec
Nama kecamatan
Nama_desa
Nama desa
Jml_pddk
Menyatakan jumlah
penduduk suatu daerah
Jml_pddk_wnt
Menyatakan jumlah
penduduk wanita
Jml_pddk_pria
Menyatakan jumlah
penduduk pria
Jml_kel
Menyatakan jumlah
keluarga
Jml_rmh
Menyatakan jumlah
rumah
Luas_lahan
Menyatakan luas lahan
Jml_sekolah
Menyatakan jumlah
sekolah
Jns_lahan
Menyatakan jenis lahan
Jns_pemukiman Menyatakan jenis
pemukiman
b Transformasi Data
Pada tahap ini data podes diubah menjadi
format yang lebih umum supaya mudah
dipahami saat proses analisis. Transformasi
data meliputi pemberian nama atribut yang
sama untuk data tahun 1996, 1999, 2003,
dan 2006. Dilakukan pemisahan atribut yang
pada tahun 1999 digabung, sedangkan pada
tahun yang lain dipisahkan. Atribut yang
mengalami penambahan yaitu atribut yang
berhubungan
dengan
kependudukan
(jumlah penduduk) pada tahun 1999. Atribut
kependudukan pada tahun 1996, 2003, dan
2006 terdiri atas jumlah penduduk, jumlah
penduduk wanita, dan jumlah penduduk
pria, sedangkan pada tahun 1999 hanya
jumlah penduduk. Oleh karena itu, atribut
tahun 1999 ditambah atribut jumlah
penduduk wanita dan jumlah penduduk pria
yang setiap baris datanya diisi dengan nilai 0
(nol).
Atribut nama desa dan nama kecamatan
pada tahun 1996 tidak ada. Untuk mengatasi
hal ini, maka dilakukan pengisian data pada
atribut nama desa dan nama kecamatan
disesuaikan dengan nama kecamatan tahun
1999 berdasarkan kode kecamatannya.
Untuk nama desa disamakan urutannya
dengan nama desa pada tahun 1999. Atribut
yang mengalami transformasi dapat dilihat
pada Tabel 4.

9

Tabel 4 Atribut yang mengalami
transformasi pada data potensi desa (podes)
Nama
Keterangan
Atribut
Jumlah
Atribut jumlah penduduk
penduduk
laki-laki pada tahun 1999
laki-laki
tidak ada sehingga masingmasing row diisi 0 (nol)
Jumlah
Atribut jumlah penduduk
penduduk
laki-laki pada tahun 1999
perempuan
tidak ada sehingga masingmasing row diisi 0 (nol)
Nama
Atribut nama kecamatan pada
kecamatan
tahun 1996 diisi data
kecamatan
tahun
1999
berdasarkan
kode
kecamatannya.
Nama desa
Atribut nama desa pada tahun
1996 diisi data nama desa
pada tahun 1999 secara
berurutan.

1 Pendefinisian dimensi

Pada tahap ini juga dibuat atribut baru
untuk memenuhi kebutuhan dalam proses
analisis. Atribut baru tersebut adalah atribut
tahun yang menyatakan waktu (tahun
tersedianya data).

Dimensi yang dibentuk dalam pembuatan
data warehouse terdiri atas empat tabel yaitu
dimensi lokasi, dimensi tahun, dimensi
lahan, dan dimensi pemukiman. Dimensi
dan deskripsinya dapat dilihat pada Tabel 5.

Pada atribut nama kecamatan, terdapat
beberapa data yang mengalami perubahan
nama, mengalami pemecahan wilayah
kecamatan atau perubahan nama kecamatan
setiap tahun (1996, 1999, 2003, dan 2006).
Untuk mengatasi hal ini, maka data
kecamatan disamakan untuk masing-masing
tahun. Data kecamatan yang digunakan
adalah nama kecamatan yang terbaru yaitu
tahun 2006 karena data kecamatan pada
tahun 2006 lebih lengkap dibanding
kecamatan
pada
tahun
sebelumnya.
Kecamatan yang belum ada pada tahun
1996, 1999, dan 2003 disamakan kode
lokasinya dengan kecamatan pada tahun
2006.

2

c

Pembersihan Data (Cleaning)

Data potensi