Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006

IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI
PROVINSI JAWA BARAT TAHUN 2003 DAN 2006

SOFIYANTI INDRIASARI
G64103046

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

ABSTRAK
SOFIYANTI INDRIASARI. Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi Jawa
Barat Tahun 2003 dan 2006. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan SRI
NURDIATI.
Kurangnya pemanfaatan atau pengolahan terhadap gunung data yang sebenarnya dapat
menghasilkan suatu informasi atau pengetahuan yang penting untuk mendukung pengambilan
keputusan. Data Potensi Desa yang bersumber dari Badan Pusat Statistik (BPS) memiliki peranan
yang cukup strategis di masa yang akan datang dan merupakan produk unggulan BPS. Untuk itu
sangat penting melakukan analisis data Podes secara efisien dan cepat. Data warehouse adalah
tempat penyimpanan data terintegrasi yang dapat digunakan untuk query dan analisis. Operasi

query ini dilakukan dengan On-line Analytical Processing (OLAP). Data real dijumpai sering kali
mengandung informasi yang tidak tepat dan ketidakpastian (uncertain). Teori himpunan fuzzy
digunakan untuk menangani masalah tersebut. Penelitian ini bertujuan membangun data
warehouse untuk data Potensi Desa di Provinsi Jawa Barat tahun 2003 dan 2006 yang
direpresentasikan dalam model data multidimensi dengan menggunakan teori himpunan fuzzy dan
mengimplementasikan operasi OLAP.
Ruang lingkup penelitian adalah dibatasi pada implementasi fuzzy OLAP untuk data Potensi
Desa di Provinsi Jawa Barat tahun 2003 dan 2006. Sistem yang akan dibangun mengikuti
arsitektur data warehouse tiga tingkat. Struktur data pada data warehouse digambarkan dengan
skema galaksi. Operasi-operasi yang diimplementasikan adalah operasi roll-up, drill-down, slice,
dice, dan pivot. Operasi untuk fuzzy OLAP dilakukan sesuai dengan konsep pengoperasian data
multidimensi fuzzy.
Hasil penelitian ini adalah terbentukya data warehouse yang diimplementasikan dengan
konsep fuzzy serta data warehouse untuk data crisp sebagai pelengkap penyajian informasi. Data
warehouse yang dibangun menggunakan konsep fuzzy terlebih dahulu melalui tahapan praproses
data dan proses clustering menggunakan algoritma FCM untuk mendapatkan himpunan fuzzy dan
nilai derajat keanggotaan tiap atribut. Data warehouse tersebut memiliki 4 kubus data yaitu
penduduk, rumah tangga, lahan, dan sekolah. Data dapat ditampilkan dalam bentuk crosstab atau
grafik. Penelitian ini memberikan informasi berupa data fuzzy dan data crisp. Data fuzzy yang
disajikan memberikan informasi natural dengan mendefinisikan variabel linguistic. Data crisp

disajikan sebagai penunjang untuk mendapatkan informasi.

Kata kunci: data warehouse, OLAP, model data multidimensi, fuzzy.

IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI
PROVINSI JAWA BARAT TAHUN 2003 DAN 2006

Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh :
SOFIYANTI INDRIASARI
G64103046

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007


Judul

: Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi
Jawa Barat Tahun 2003 dan 2006
Nama : Sofiyanti Indriasari
NIM
: G64103046

Menyetujui:
Pembimbing I,

Pembimbing II,

Imas S. Sitanggang, S.Si, M.Kom
NIP 132 206 235

Dr. Ir. Sri Nurdiati, M.Sc
NIP 131 578 805


Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131 473 999

Tanggal Lulus :

v

PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala
curahan rahmat dan karunia-Nya sehingga penelitian ini berhasil diselesaikan. Tema yang dipilih dalam
penelitian yang dilaksanakan sejak bulan Januari 2007 ini ialah data warehouse, dengan judul
Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006
Penyelesaian penelitian ini tidak terlepas dari bantuan berbagai pihak, karena itu penulis
mengucapkan terima kasih sebesar-besarnya kepada:
1.
Ayahanda Achmad Azhari dan Ibunda Syafa’atur Rofiah , Kakakku Sofyan Rizalanda, serta adikadikku Asrofi Hanafiah dan Asrofi Hanifah atas doa, kasih sayang, dan kehangatannya yang tidak

pernah berhenti tercurah selama ini,
2.
Ibu Imas S. Sitanggang, S.Si., M.Kom. selaku pembimbing I, Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku
pembimbing II dan Bapak Hari Agung Adrianto, S.Kom. selaku dosen penguji,
3.
Keluarga besar Ibu Sri Nurdiati di Bogor yang telah menjadi keluarga kedua bagi penulis,
4.
Kak Hendra dan Kak Ifnu atas kesabarannya menjawab pertanyaan penulis, serta Diku atas
tumpangannya mengangkut komputer untuk keperluan penelitian ini,
5.
Sahabat penulis: Gibtha, Meynar, Firat, Pandi, Qwill, Ratih, Ghofar, Jemi, Hida, Dina, Vita, dan
Nanik atas saran, dukungan, kerjasama, bantuan, dan hiburannya,
6.
Teman-teman seperjuangan Ilkomers 40 lainnya untuk pengalaman dan kenangan yang tak ternilai,
7.
Mas Irvan atas bantuannya mencari referensi untuk penelitian ini dan Pak Soleh atas bantuan dan
nasehatnya,
8.
Departemen Ilmu Komputer, staf dan dosen yang telah begitu banyak membantu baik selama
penelitian maupun pada masa perkuliahan.

Segala kesempurnaan hanya milik Allah SWT, semoga hasil penelitian ini dapat bermanfaat, Amin.

Bogor, Mei 2007

Sofiyanti Indriasari

vi

RIWAYAT HIDUP
Penulis dilahirkan di Blitar pada tanggal 5 Oktober 1984 dari ayah Achmad Azhari dan ibu
Syafa’atur Rofiah. Penulis merupakan putri kedua dari empat bersaudara. Tahun 2003 penulis lulus dari
SMU Negeri I Sidoarjo. Pada tahun yang sama penulis diterima di Program Studi Ilmu Komputer,
Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor
melalui jalur USMI.
Selama mengikuti perkuliahan, penulis pernah menjadi pengurus Korps Sukarela PMI Unit I IPB
tahun kepengurusan 2004/2005. Selain itu, penulis juga pernah menjadi pengurus Himpunan
Mahasiswa Ilmu Komputer (HIMALKOM) tahun kepengurusan 2005/2006. Pada tahun 2006, penulis
pernah melakukan kegiatan praktik lapangan selama dua bulan di Pusat Data dan Informasi Kesejahteraan
Sosial, Departemen Sosial Republik Indonesia.


vii

DAFTAR ISI
Halaman
DAFTAR TABEL........................................................................................................................................... viii
DAFTAR GAMBAR...................................................................................................................................... viii
DAFTAR LAMPIRAN .................................................................................................................................. viii
PENDAHULUAN ............................................................................................................................................. 1
Latar Belakang .............................................................................................................................................. 1
Tujuan Penelitian .......................................................................................................................................... 1
Ruang Lingkup Penelitian ............................................................................................................................ 1
Manfaat Penelitian ........................................................................................................................................ 1
TINJAUAN PUSTAKA .................................................................................................................................... 1
Data Warehouse............................................................................................................................................ 1
Model Data Multidimensi............................................................................................................................. 2
On-line Analytical Processing (OLAP) ....................................................................................................... 2
Himpunan Fuzzy ........................................................................................................................................... 4
Fuzzy C-Means (FCM) ................................................................................................................................. 5
Ukuran Kevalidan Cluster ............................................................................................................................ 5
Kubus Data Fuzzy ......................................................................................................................................... 6

Dimensi Fuzzy............................................................................................................................................... 6
METODE PENELITIAN .................................................................................................................................. 7
Tahapan Penelitian........................................................................................................................................ 7
Praproses Data............................................................................................................................................... 7
Arsitektur Sistem .......................................................................................................................................... 8
Lingkungan Pengembangan Sistem ............................................................................................................. 8
HASIL DAN PEMBAHASAN ......................................................................................................................... 8
Praproses Data............................................................................................................................................... 8
Tingkat Bawah (Bottom Tier)..................................................................................................................... 10
Tingkat Tengah (Middle Tier) .................................................................................................................... 13
Tingkat Atas (Top Tier) .............................................................................................................................. 13
KESIMPULAN DAN SARAN ....................................................................................................................... 18
Kesimpulan ................................................................................................................................................. 18
Saran............................................................................................................................................................ 19
DAFTAR PUSTAKA...................................................................................................................................... 19
LAMPIRAN..................................................................................................................................................... 20

viii

DAFTAR TABEL

Halaman
1
2
3
4
5
6

Validasi atribut lahan bukan sawah untuk non pertanian 2006 .................................................................. 10
Validasi atribut lahan bukan sawah untuk non pertanian 2003 .................................................................. 10
Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data crisp.......................... 10
Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data crisp............................... 10
Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data fuzzy.......................... 11
Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data fuzzy............................... 11

DAFTAR GAMBAR
Halaman
1
2
3

4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Skema bintang (Han & Kamber 2001)....................................................................................................... 2
Skema snowflake (Han & Kamber 2001).................................................................................................... 2

Skema galaksi (Han & Kamber 2001) ........................................................................................................ 2
Contoh operasi roll-up (Han & Kamber 2001)........................................................................................... 3
Contoh operasi drill-down (Han & Kamber 2001) ..................................................................................... 3
Contoh operasi slice (Han & Kamber 2001)............................................................................................... 4
Contoh operasi dice (Han & Kamber 2001) ............................................................................................... 4
Contoh operasi pivot (Han & Kamber 2001) ............................................................................................. 4
Contoh kubus data fuzzy 3 dimensi (Alhajj & Mehmet 2003) ................................................................... 6
Contoh path pada dimensi fuzzy.................................................................................................................. 7
Tahap praproses data ................................................................................................................................... 7
Arsitektur tiga tingkat data warehouse (Han & Kamber 2001) ................................................................. 8
Skema galaksi untuk data crisp ................................................................................................................. 12
Skema galaksi untuk data fuzzy ................................................................................................................ 12
Contoh tampilan fuzzy OLAP untuk subjek penduduk tahun 2003 pada level desa................................ 14
Contoh operasi roll-up pada dimensi lokasi.............................................................................................. 14
Contoh tampilan data crisp untuk contoh kasus tampilan subjek penduduk tahun 2003. ...................... 15
Contoh tampilan modul_desa .................................................................................................................... 16
Contoh tampilan modul_kecamatan.......................................................................................................... 17
Contoh tampilan modul_kabupaten .......................................................................................................... 18

DAFTAR LAMPIRAN
Halaman
1
2
3
4
5
6
7
8
9

Atribut-atribut yang terpilih dari hasil ekstraksi ......................................................................................... 21
Hasil validasi cluster.................................................................................................................................... 23
Contoh hasil clustering berupa linguistic dan derajat keanggotaan ........................................................... 29
Skema galaksi yang disesuaikan dengan kebutuhan software Oracle........................................................ 31
Skema relasi modul pendukung .................................................................................................................. 32
Contoh tampilan fuzzy OLAP dan hasil operasinya................................................................................... 35
Tampilan data yang dikombinasikan dengan bentuk visualisasi model graph.......................................... 38
Tampilan query builder ............................................................................................................................... 38
Keterangan kode-kode kategori umum pada modul pendukung ................................................................ 40

1

PENDAHULUAN
Latar Belakang
Dewasa ini, ketersediaan data semakin
melimpah, apalagi ditunjang dengan banyaknya
kegiatan yang sudah dilakukan secara
terkomputerisasi. Namun seringkali data tersebut
hanya disimpan tanpa diolah lebih lanjut untuk
keperluan di masa mendatang. Padahal jika
dianalisis lebih dalam, data tersebut dapat
menghasilkan informasi atau pengetahuan yang
penting dan berharga. Data Potensi Desa (Podes)
yang bersumber dari Badan Pusat Statistik (BPS)
memiliki peranan yang cukup strategis di masa
yang akan datang dan merupakan produk
unggulan BPS. Untuk itu sangat penting
dilakukan analisis data Podes secara efisien dan
cepat.
Data warehouse adalah tempat penyimpanan
data terintegrasi yang dapat digunakan untuk
query dan analisis. Operasi query ini dilakukan
dengan On-line Analytical Processing (OLAP).
OLAP akan menghasilkan data dalam bentuk
ringkasan. Dengan operasi ini query dapat
dijalankan lebih mudah dan lebih efisien. OLAP
muncul dengan sebuah cara pandang data
multidimensi. Cara pandang multimensi ini
didukung oleh teknologi basis data multidimensi.
Data warehouse dan On-Line Analytical
Processing (OLAP) merupakan elemen penting
dalam
mendukung
proses
pengambilan
keputusan.
Data real yang dijumpai sering kali
mengandung informasi yang tidak tepat dan
ketidakpastian (uncertain).
Teori himpunan
fuzzy digunakan untuk menangani masalah
tersebut.

Ruang Lingkup Penelitian
Penelitian ini dibatasi pada implementasi
fuzzy OLAP pada data Potensi Desa di Provinsi
Jawa Barat tahun 2003 dan 2006 yang bersumber
dari Badan Pusat Statistik (BPS). Penelitian ini
akan menghasilkan aplikasi fuzzy OLAP yang
dapat menampilkan informasi untuk mendukung
proses pengambilan keputusan.
Manfaat Penelitian
Aplikasi yang dihasilkan pada penelitian ini
diharapkan dapat digunakan oleh pihak yang
berkepentingan untuk mendapatkan informasi
yang menarik dan akurat sebagai pendukung
proses pengambilan keputusan terkait dengan
data Potensi Desa. Sistem diharapkan dapat
menyediakan informasi ringkas dan jelas secara
cepat melalui operasi-operasi OLAP seperti rollup, drill-down, slice,dice, dan pivot.

TINJAUAN PUSTAKA
Data Warehouse
Data Warehouse adalah sekumpulan data
berorientasi subjek, terintegrasi, time-variant,
dan non-volatile yang mendukung proses
manajemen pembuatan keputusan (Inmon 1996).
Kata kunci dari pengertian data warehouse di
atas adalah (Han & Kamber 2001):


Berorientasi subjek: data warehouse
diorganisasikan berdasarkan subjek-subjek
utama, seperti pelanggan, produk atau
penjualan. Data warehouse menyediakan
tampilan yang sederhana dan ringkas untuk
subjek tertentu dengan menghilangkan data
yang tidak berguna dalam proses pembuatan
keputusan.



Terintegrasi: data warehouse dibangun
dengan mengintegrasikan berbagai sumber
data yang heterogen, seperti basis data
relasional, flat file, dan transaksi on-line.
Teknik pembersihan dan integrasi data
digunakan untuk memastikan data tetap
konsisten.



Time-variant:
data
disimpan
untuk
menyediakan
informasi
berdasarkan
kejadian yang sudah lewat.



Non-volatile: data warehouse adalah tempat
penyimpanan data yang terpisah dari basis
data operasional.

Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1.

2.

Membangun data warehouse untuk data
Potensi Desa tahun 2003 dan 2006. Aplikasi
yang dibangun mengolah data yang
direpresentasikan dalam model data
multidimensi dengan menggunakan teori
himpunan fuzzy.
Mengimplementasikan
operasi-operasi
OLAP, yaitu roll-up, drill-down, slice, dice,
dan pivot dengan menggunakan pendekatan
fuzzy.

2

Model Data Multidimensi
Model data multidimensi menampilkan data
dalam bentuk kubus data. Kubus data
memungkinkan
data
dimodelkan
dan
ditampilkan dalam dimensi banyak. Kubus data
disebut juga cuboid. Pola-pola cuboid dapat
dibuat apabila diberikan satu kumpulan dimensi.
Masing-masing pola menampilkan data pada
tingkat kesimpulan yang berbeda-beda (Han &
Kamber 2001).
Untuk menggambarkan hubungan antardata
pada data multidimensi digunakan skema
multidimensi. Pada data warehouse, skema
merupakan sekumpulan tabel yang berhubungan.
Skema digunakan untuk menunjukkan hubungan
antara tabel dimensi dengan tabel fakta. Skema
ditentukan
berdasarkan
kebutuhan
data
warehouse dan keinginan pembuat data
warehouse. Data warehouse membutuhkan
skema yang ringkas dan berorientasi subjek.
Tipe-tipe skema multidimensi antara lain (Han &
Kamber 2001):
• Skema bintang (star schema)
Skema bintang adalah skema data
warehouse yang paling sederhana. Skema ini
disebut skema bintang karena hubungan antara
tabel dimensi dan tabel fakta menyerupai
bintang di mana satu tabel fakta dihubungkan
dengan beberapa tabel dimensi. Titik tengah
skema bintang adalah satu tabel fakta besar
dan sudut-sudutnya adalah tabel-tabel dimensi.
Bentuk skema bintang dapat dilihat pada
Gambar 1. Keuntungan yang didapat jika
menggunakan skema ini adalah peningkatan
kinerja data warehouse, pemrosesan query
yang lebih efisien, dan waktu respon yang
cepat.

• Skema snowflake (snowflake schema)
Skema snowflake adalah variasi dari skema
bintang di mana beberapa tabel dimensi
dinormalisasi, jadi dihasilkan beberapa tabel
tambahan. Bentuk skema snowflake dapat
dilihat pada Gambar 2. Keuntungan yang
didapat dengan menggunakan skema ini
adalah penghematan memory, tapi waktu yang
dibutuhkan untuk pemrosesan query menjadi
lebih lama.

Gambar 2 Skema snowflake (Han & Kamber
2001)
• Skema galaksi (fact constellation)
Pada skema galaksi, beberapa tabel fakta
berbagi tabel dimensi. Bentuk skema galaksi
dapat dilihat pada Gambar 3. Keuntungan
menggunakan skema ini adalah menghemat
memory dan mengurangi kesalahan yang
mungkin terjadi.

Gambar 3 Skema galaksi (Han & Kamber 2001)

Gambar 1 Skema bintang (Han & Kamber 2001)

On-line Analytical Processing (OLAP)
OLAP adalah operasi basis data untuk
mendapatkan data dalam bentuk ringkasan
dengan
menggunakan
agregasi
sebagai
mekanisme utama. OLAP menyediakan tampilan
data yang fleksibel dari sudut pandang yang
berbeda dan menyediakan lingkungan yang userfriendly untuk membantu analisis data.
Tipe-tipe operasi OLAP antara lain (Han &
Kamber 2001):

IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI
PROVINSI JAWA BARAT TAHUN 2003 DAN 2006

SOFIYANTI INDRIASARI
G64103046

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

ABSTRAK
SOFIYANTI INDRIASARI. Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi Jawa
Barat Tahun 2003 dan 2006. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan SRI
NURDIATI.
Kurangnya pemanfaatan atau pengolahan terhadap gunung data yang sebenarnya dapat
menghasilkan suatu informasi atau pengetahuan yang penting untuk mendukung pengambilan
keputusan. Data Potensi Desa yang bersumber dari Badan Pusat Statistik (BPS) memiliki peranan
yang cukup strategis di masa yang akan datang dan merupakan produk unggulan BPS. Untuk itu
sangat penting melakukan analisis data Podes secara efisien dan cepat. Data warehouse adalah
tempat penyimpanan data terintegrasi yang dapat digunakan untuk query dan analisis. Operasi
query ini dilakukan dengan On-line Analytical Processing (OLAP). Data real dijumpai sering kali
mengandung informasi yang tidak tepat dan ketidakpastian (uncertain). Teori himpunan fuzzy
digunakan untuk menangani masalah tersebut. Penelitian ini bertujuan membangun data
warehouse untuk data Potensi Desa di Provinsi Jawa Barat tahun 2003 dan 2006 yang
direpresentasikan dalam model data multidimensi dengan menggunakan teori himpunan fuzzy dan
mengimplementasikan operasi OLAP.
Ruang lingkup penelitian adalah dibatasi pada implementasi fuzzy OLAP untuk data Potensi
Desa di Provinsi Jawa Barat tahun 2003 dan 2006. Sistem yang akan dibangun mengikuti
arsitektur data warehouse tiga tingkat. Struktur data pada data warehouse digambarkan dengan
skema galaksi. Operasi-operasi yang diimplementasikan adalah operasi roll-up, drill-down, slice,
dice, dan pivot. Operasi untuk fuzzy OLAP dilakukan sesuai dengan konsep pengoperasian data
multidimensi fuzzy.
Hasil penelitian ini adalah terbentukya data warehouse yang diimplementasikan dengan
konsep fuzzy serta data warehouse untuk data crisp sebagai pelengkap penyajian informasi. Data
warehouse yang dibangun menggunakan konsep fuzzy terlebih dahulu melalui tahapan praproses
data dan proses clustering menggunakan algoritma FCM untuk mendapatkan himpunan fuzzy dan
nilai derajat keanggotaan tiap atribut. Data warehouse tersebut memiliki 4 kubus data yaitu
penduduk, rumah tangga, lahan, dan sekolah. Data dapat ditampilkan dalam bentuk crosstab atau
grafik. Penelitian ini memberikan informasi berupa data fuzzy dan data crisp. Data fuzzy yang
disajikan memberikan informasi natural dengan mendefinisikan variabel linguistic. Data crisp
disajikan sebagai penunjang untuk mendapatkan informasi.

Kata kunci: data warehouse, OLAP, model data multidimensi, fuzzy.

IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI
PROVINSI JAWA BARAT TAHUN 2003 DAN 2006

Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh :
SOFIYANTI INDRIASARI
G64103046

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

Judul

: Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi
Jawa Barat Tahun 2003 dan 2006
Nama : Sofiyanti Indriasari
NIM
: G64103046

Menyetujui:
Pembimbing I,

Pembimbing II,

Imas S. Sitanggang, S.Si, M.Kom
NIP 132 206 235

Dr. Ir. Sri Nurdiati, M.Sc
NIP 131 578 805

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131 473 999

Tanggal Lulus :

v

PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala
curahan rahmat dan karunia-Nya sehingga penelitian ini berhasil diselesaikan. Tema yang dipilih dalam
penelitian yang dilaksanakan sejak bulan Januari 2007 ini ialah data warehouse, dengan judul
Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006
Penyelesaian penelitian ini tidak terlepas dari bantuan berbagai pihak, karena itu penulis
mengucapkan terima kasih sebesar-besarnya kepada:
1.
Ayahanda Achmad Azhari dan Ibunda Syafa’atur Rofiah , Kakakku Sofyan Rizalanda, serta adikadikku Asrofi Hanafiah dan Asrofi Hanifah atas doa, kasih sayang, dan kehangatannya yang tidak
pernah berhenti tercurah selama ini,
2.
Ibu Imas S. Sitanggang, S.Si., M.Kom. selaku pembimbing I, Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku
pembimbing II dan Bapak Hari Agung Adrianto, S.Kom. selaku dosen penguji,
3.
Keluarga besar Ibu Sri Nurdiati di Bogor yang telah menjadi keluarga kedua bagi penulis,
4.
Kak Hendra dan Kak Ifnu atas kesabarannya menjawab pertanyaan penulis, serta Diku atas
tumpangannya mengangkut komputer untuk keperluan penelitian ini,
5.
Sahabat penulis: Gibtha, Meynar, Firat, Pandi, Qwill, Ratih, Ghofar, Jemi, Hida, Dina, Vita, dan
Nanik atas saran, dukungan, kerjasama, bantuan, dan hiburannya,
6.
Teman-teman seperjuangan Ilkomers 40 lainnya untuk pengalaman dan kenangan yang tak ternilai,
7.
Mas Irvan atas bantuannya mencari referensi untuk penelitian ini dan Pak Soleh atas bantuan dan
nasehatnya,
8.
Departemen Ilmu Komputer, staf dan dosen yang telah begitu banyak membantu baik selama
penelitian maupun pada masa perkuliahan.
Segala kesempurnaan hanya milik Allah SWT, semoga hasil penelitian ini dapat bermanfaat, Amin.

Bogor, Mei 2007

Sofiyanti Indriasari

vi

RIWAYAT HIDUP
Penulis dilahirkan di Blitar pada tanggal 5 Oktober 1984 dari ayah Achmad Azhari dan ibu
Syafa’atur Rofiah. Penulis merupakan putri kedua dari empat bersaudara. Tahun 2003 penulis lulus dari
SMU Negeri I Sidoarjo. Pada tahun yang sama penulis diterima di Program Studi Ilmu Komputer,
Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor
melalui jalur USMI.
Selama mengikuti perkuliahan, penulis pernah menjadi pengurus Korps Sukarela PMI Unit I IPB
tahun kepengurusan 2004/2005. Selain itu, penulis juga pernah menjadi pengurus Himpunan
Mahasiswa Ilmu Komputer (HIMALKOM) tahun kepengurusan 2005/2006. Pada tahun 2006, penulis
pernah melakukan kegiatan praktik lapangan selama dua bulan di Pusat Data dan Informasi Kesejahteraan
Sosial, Departemen Sosial Republik Indonesia.

vii

DAFTAR ISI
Halaman
DAFTAR TABEL........................................................................................................................................... viii
DAFTAR GAMBAR...................................................................................................................................... viii
DAFTAR LAMPIRAN .................................................................................................................................. viii
PENDAHULUAN ............................................................................................................................................. 1
Latar Belakang .............................................................................................................................................. 1
Tujuan Penelitian .......................................................................................................................................... 1
Ruang Lingkup Penelitian ............................................................................................................................ 1
Manfaat Penelitian ........................................................................................................................................ 1
TINJAUAN PUSTAKA .................................................................................................................................... 1
Data Warehouse............................................................................................................................................ 1
Model Data Multidimensi............................................................................................................................. 2
On-line Analytical Processing (OLAP) ....................................................................................................... 2
Himpunan Fuzzy ........................................................................................................................................... 4
Fuzzy C-Means (FCM) ................................................................................................................................. 5
Ukuran Kevalidan Cluster ............................................................................................................................ 5
Kubus Data Fuzzy ......................................................................................................................................... 6
Dimensi Fuzzy............................................................................................................................................... 6
METODE PENELITIAN .................................................................................................................................. 7
Tahapan Penelitian........................................................................................................................................ 7
Praproses Data............................................................................................................................................... 7
Arsitektur Sistem .......................................................................................................................................... 8
Lingkungan Pengembangan Sistem ............................................................................................................. 8
HASIL DAN PEMBAHASAN ......................................................................................................................... 8
Praproses Data............................................................................................................................................... 8
Tingkat Bawah (Bottom Tier)..................................................................................................................... 10
Tingkat Tengah (Middle Tier) .................................................................................................................... 13
Tingkat Atas (Top Tier) .............................................................................................................................. 13
KESIMPULAN DAN SARAN ....................................................................................................................... 18
Kesimpulan ................................................................................................................................................. 18
Saran............................................................................................................................................................ 19
DAFTAR PUSTAKA...................................................................................................................................... 19
LAMPIRAN..................................................................................................................................................... 20

viii

DAFTAR TABEL
Halaman
1
2
3
4
5
6

Validasi atribut lahan bukan sawah untuk non pertanian 2006 .................................................................. 10
Validasi atribut lahan bukan sawah untuk non pertanian 2003 .................................................................. 10
Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data crisp.......................... 10
Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data crisp............................... 10
Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data fuzzy.......................... 11
Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data fuzzy............................... 11

DAFTAR GAMBAR
Halaman
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Skema bintang (Han & Kamber 2001)....................................................................................................... 2
Skema snowflake (Han & Kamber 2001).................................................................................................... 2
Skema galaksi (Han & Kamber 2001) ........................................................................................................ 2
Contoh operasi roll-up (Han & Kamber 2001)........................................................................................... 3
Contoh operasi drill-down (Han & Kamber 2001) ..................................................................................... 3
Contoh operasi slice (Han & Kamber 2001)............................................................................................... 4
Contoh operasi dice (Han & Kamber 2001) ............................................................................................... 4
Contoh operasi pivot (Han & Kamber 2001) ............................................................................................. 4
Contoh kubus data fuzzy 3 dimensi (Alhajj & Mehmet 2003) ................................................................... 6
Contoh path pada dimensi fuzzy.................................................................................................................. 7
Tahap praproses data ................................................................................................................................... 7
Arsitektur tiga tingkat data warehouse (Han & Kamber 2001) ................................................................. 8
Skema galaksi untuk data crisp ................................................................................................................. 12
Skema galaksi untuk data fuzzy ................................................................................................................ 12
Contoh tampilan fuzzy OLAP untuk subjek penduduk tahun 2003 pada level desa................................ 14
Contoh operasi roll-up pada dimensi lokasi.............................................................................................. 14
Contoh tampilan data crisp untuk contoh kasus tampilan subjek penduduk tahun 2003. ...................... 15
Contoh tampilan modul_desa .................................................................................................................... 16
Contoh tampilan modul_kecamatan.......................................................................................................... 17
Contoh tampilan modul_kabupaten .......................................................................................................... 18

DAFTAR LAMPIRAN
Halaman
1
2
3
4
5
6
7
8
9

Atribut-atribut yang terpilih dari hasil ekstraksi ......................................................................................... 21
Hasil validasi cluster.................................................................................................................................... 23
Contoh hasil clustering berupa linguistic dan derajat keanggotaan ........................................................... 29
Skema galaksi yang disesuaikan dengan kebutuhan software Oracle........................................................ 31
Skema relasi modul pendukung .................................................................................................................. 32
Contoh tampilan fuzzy OLAP dan hasil operasinya................................................................................... 35
Tampilan data yang dikombinasikan dengan bentuk visualisasi model graph.......................................... 38
Tampilan query builder ............................................................................................................................... 38
Keterangan kode-kode kategori umum pada modul pendukung ................................................................ 40

1

PENDAHULUAN
Latar Belakang
Dewasa ini, ketersediaan data semakin
melimpah, apalagi ditunjang dengan banyaknya
kegiatan yang sudah dilakukan secara
terkomputerisasi. Namun seringkali data tersebut
hanya disimpan tanpa diolah lebih lanjut untuk
keperluan di masa mendatang. Padahal jika
dianalisis lebih dalam, data tersebut dapat
menghasilkan informasi atau pengetahuan yang
penting dan berharga. Data Potensi Desa (Podes)
yang bersumber dari Badan Pusat Statistik (BPS)
memiliki peranan yang cukup strategis di masa
yang akan datang dan merupakan produk
unggulan BPS. Untuk itu sangat penting
dilakukan analisis data Podes secara efisien dan
cepat.
Data warehouse adalah tempat penyimpanan
data terintegrasi yang dapat digunakan untuk
query dan analisis. Operasi query ini dilakukan
dengan On-line Analytical Processing (OLAP).
OLAP akan menghasilkan data dalam bentuk
ringkasan. Dengan operasi ini query dapat
dijalankan lebih mudah dan lebih efisien. OLAP
muncul dengan sebuah cara pandang data
multidimensi. Cara pandang multimensi ini
didukung oleh teknologi basis data multidimensi.
Data warehouse dan On-Line Analytical
Processing (OLAP) merupakan elemen penting
dalam
mendukung
proses
pengambilan
keputusan.
Data real yang dijumpai sering kali
mengandung informasi yang tidak tepat dan
ketidakpastian (uncertain).
Teori himpunan
fuzzy digunakan untuk menangani masalah
tersebut.

Ruang Lingkup Penelitian
Penelitian ini dibatasi pada implementasi
fuzzy OLAP pada data Potensi Desa di Provinsi
Jawa Barat tahun 2003 dan 2006 yang bersumber
dari Badan Pusat Statistik (BPS). Penelitian ini
akan menghasilkan aplikasi fuzzy OLAP yang
dapat menampilkan informasi untuk mendukung
proses pengambilan keputusan.
Manfaat Penelitian
Aplikasi yang dihasilkan pada penelitian ini
diharapkan dapat digunakan oleh pihak yang
berkepentingan untuk mendapatkan informasi
yang menarik dan akurat sebagai pendukung
proses pengambilan keputusan terkait dengan
data Potensi Desa. Sistem diharapkan dapat
menyediakan informasi ringkas dan jelas secara
cepat melalui operasi-operasi OLAP seperti rollup, drill-down, slice,dice, dan pivot.

TINJAUAN PUSTAKA
Data Warehouse
Data Warehouse adalah sekumpulan data
berorientasi subjek, terintegrasi, time-variant,
dan non-volatile yang mendukung proses
manajemen pembuatan keputusan (Inmon 1996).
Kata kunci dari pengertian data warehouse di
atas adalah (Han & Kamber 2001):


Berorientasi subjek: data warehouse
diorganisasikan berdasarkan subjek-subjek
utama, seperti pelanggan, produk atau
penjualan. Data warehouse menyediakan
tampilan yang sederhana dan ringkas untuk
subjek tertentu dengan menghilangkan data
yang tidak berguna dalam proses pembuatan
keputusan.



Terintegrasi: data warehouse dibangun
dengan mengintegrasikan berbagai sumber
data yang heterogen, seperti basis data
relasional, flat file, dan transaksi on-line.
Teknik pembersihan dan integrasi data
digunakan untuk memastikan data tetap
konsisten.



Time-variant:
data
disimpan
untuk
menyediakan
informasi
berdasarkan
kejadian yang sudah lewat.



Non-volatile: data warehouse adalah tempat
penyimpanan data yang terpisah dari basis
data operasional.

Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1.

2.

Membangun data warehouse untuk data
Potensi Desa tahun 2003 dan 2006. Aplikasi
yang dibangun mengolah data yang
direpresentasikan dalam model data
multidimensi dengan menggunakan teori
himpunan fuzzy.
Mengimplementasikan
operasi-operasi
OLAP, yaitu roll-up, drill-down, slice, dice,
dan pivot dengan menggunakan pendekatan
fuzzy.

2

Model Data Multidimensi
Model data multidimensi menampilkan data
dalam bentuk kubus data. Kubus data
memungkinkan
data
dimodelkan
dan
ditampilkan dalam dimensi banyak. Kubus data
disebut juga cuboid. Pola-pola cuboid dapat
dibuat apabila diberikan satu kumpulan dimensi.
Masing-masing pola menampilkan data pada
tingkat kesimpulan yang berbeda-beda (Han &
Kamber 2001).
Untuk menggambarkan hubungan antardata
pada data multidimensi digunakan skema
multidimensi. Pada data warehouse, skema
merupakan sekumpulan tabel yang berhubungan.
Skema digunakan untuk menunjukkan hubungan
antara tabel dimensi dengan tabel fakta. Skema
ditentukan
berdasarkan
kebutuhan
data
warehouse dan keinginan pembuat data
warehouse. Data warehouse membutuhkan
skema yang ringkas dan berorientasi subjek.
Tipe-tipe skema multidimensi antara lain (Han &
Kamber 2001):
• Skema bintang (star schema)
Skema bintang adalah skema data
warehouse yang paling sederhana. Skema ini
disebut skema bintang karena hubungan antara
tabel dimensi dan tabel fakta menyerupai
bintang di mana satu tabel fakta dihubungkan
dengan beberapa tabel dimensi. Titik tengah
skema bintang adalah satu tabel fakta besar
dan sudut-sudutnya adalah tabel-tabel dimensi.
Bentuk skema bintang dapat dilihat pada
Gambar 1. Keuntungan yang didapat jika
menggunakan skema ini adalah peningkatan
kinerja data warehouse, pemrosesan query
yang lebih efisien, dan waktu respon yang
cepat.

• Skema snowflake (snowflake schema)
Skema snowflake adalah variasi dari skema
bintang di mana beberapa tabel dimensi
dinormalisasi, jadi dihasilkan beberapa tabel
tambahan. Bentuk skema snowflake dapat
dilihat pada Gambar 2. Keuntungan yang
didapat dengan menggunakan skema ini
adalah penghematan memory, tapi waktu yang
dibutuhkan untuk pemrosesan query menjadi
lebih lama.

Gambar 2 Skema snowflake (Han & Kamber
2001)
• Skema galaksi (fact constellation)
Pada skema galaksi, beberapa tabel fakta
berbagi tabel dimensi. Bentuk skema galaksi
dapat dilihat pada Gambar 3. Keuntungan
menggunakan skema ini adalah menghemat
memory dan mengurangi kesalahan yang
mungkin terjadi.

Gambar 3 Skema galaksi (Han & Kamber 2001)

Gambar 1 Skema bintang (Han & Kamber 2001)

On-line Analytical Processing (OLAP)
OLAP adalah operasi basis data untuk
mendapatkan data dalam bentuk ringkasan
dengan
menggunakan
agregasi
sebagai
mekanisme utama. OLAP menyediakan tampilan
data yang fleksibel dari sudut pandang yang
berbeda dan menyediakan lingkungan yang userfriendly untuk membantu analisis data.
Tipe-tipe operasi OLAP antara lain (Han &
Kamber 2001):

3
• Roll-up
Operasi ini melakukan pengelompokan
pada kubus data dengan cara mengurutkan
suatu hirarki konsep secara menaik
(ascending) atau mereduksi dimensi. Contoh
operasi roll-up untuk kubus data penjualan
dapat dilihat pada Gambar 4.
Contoh :
Suatu hirarki lokasi: kota < provinsi <
negara
Operasi roll-up melakukan pengelompokan
dengan mengurutkan hirarki lokasi dari tingkat
kota sampai pada tingkat negara.
• Drill-down
Drill-down adalah kebalikan dari roll-up.
Drill-down dapat dilakukan dengan cara
mengurutkan suatu hirarki konsep secara
menurun
(descending)
atau
dengan
menambahkan nilai dimensi. Contoh operasi
drill-down untuk kubus data penjualan dapat
dilihat pada Gambar 5.

Suatu hirarki waktu: bulan < kuartal <
tahun
Drill-down melakukan pengelompokan
dengan mengurutkan hirarki waktu dari tingkat
tahun ke tingkat yang lebih detil yaitu tingkat
bulan.
• Slice dan dice
Operasi slice melakukan pemilihan satu
dimensi
dari
kubus
data
sehingga
menghasilkan bagian kubus (subcube). Contoh
operasi slice untuk kubus data penjualan dapat
dilihat pada Gambar 6. Operasi dice
menghasilkan bagian kubus (subcube) dengan
melakukan pemilihan dua atau lebih dimensi.
Contoh operasi dice untuk kubus data
penjualan dapat dilihat pada Gambar 7.
• Pivot (rotate)
Pivot adalah operasi yang memutar
koordinat data pada tampilan dengan tujuan
untuk menyediakan alternatif tampilan data.
Contoh operasi pivot untuk kubus data
penjualan dapat dilihat pada Gambar 8.

Contoh :

Gambar 4 Contoh operasi roll-up (Han & Kamber 2001)

Gambar 5 Contoh operasi drill-down (Han & Kamber 2001)

4

Gambar 6 Contoh operasi slice (Han & Kamber 2001)

Gambar 7 Contoh operasi dice (Han & Kamber 2001)

Gambar 8 Contoh operasi pivot (Han & Kamber 2001)

Himpunan Fuzzy
Konsep logika fuzzy pertama kali
diperkenalkan oleh Prof. Lutfi A Zadeh dari
Universitas California pada bulan Juni 1965.
Logika fuzzy merupakan generalisasi dari logika
klasik yang hanya memiliki dua nilai
keanggotaan 0 dan 1. Dalam logika fuzzy nilai

kebenaran suatu pernyataan berkisar dari
sepenuhnya benar ke sepenuhnya salah. Inti dari
himpunan fuzzy yaitu fungsi keanggotaan yang
menggambarkan hubungan antara domain
himpunan fuzzy dengan
nilai
derajat
keanggotaan. Dengan teori himpunan fuzzy
suatu objek dapat menjadi anggota dari banyak
himpunan dengan derajat keanggotaan yang

5

berbeda dalam masing-masing himpunan.
Derajat
keanggotaan
menujukkan
nilai
keanggotaan suatu objek pada suatu himpunan.
Nilai keanggotaan ini berkisar antara 0 sampai 1
(Cox 2005). Teori himpunan fuzzy telah banyak
digunakan dalam pembangunan sistem data
mining. Alhajj dan Mehmet (2003) telah
menggunakan
himpunan
fuzzy
untuk
membangun kubus data fuzzy.
Fuzzy C-Means (FCM)
Menurut Jang et al. (1997), Fuzzy C-Means
merupakan algoritma clustering data di mana
setiap titik data masuk dalam sebuah cluster
dengan ditandai oleh derajat keanggotaan. FCM
membagi sebuah koleksi dari n data vektor xj
(j=1, 2, …, n) menjadi c cluster, dan
menemukan sebuah pusat cluster (center) untuk
tiap kelompok dengan meminimalisasi ukuran
dari fungsi objektif. Pada FCM hasil dari
clustering adalah sebuah titik data dapat
menjadi anggota untuk beberapa cluster yang
ditandai oleh derajat keanggotaannya antara 0
dan 1.
Berikut tahapan clustering menggunakan
algoritma FCM:
1. Inisialisasi keanggotaan matriks U yang
berisi derajat keanggotan terhadap cluster
dengan nilai antara 0 dan 1, sehingga
c

∑ u ij = 1,

∀ j = 1,..., n

digunakan untuk clustering data
fuzzy adalah sama dengan 2.
Kemudian melihat kondisi berhenti :
• Jika (|Jt –Jt-1| < nilai toleransi
terkecil yang diharapkan) atau (t >
maksimal iterasi) maka proses
berhenti.
• Jika tidak : t = t + 1, mengulangi
langkah 3.
4. Penghitungan matriks U baru menggunakan
formula berikut:

u

ij

k =1

c

ci =

j =1
n

j =1

S =

J (U , c1 ,..., c c ) =

∑ J i = ∑∑
i =1

i =1 j

.
2

n

∑ ∑ µij 2 || Vi − X j ||2
i =1 j =1

adalah

nilai

n

3. Penghitungan fungsi objektif (Ji):
n

i =1 j =1

2

i, j


c

n

n min Vi − V j

c

(uij ) m

c

2
m −1)

dengan:

.



kj

∑ ∑ µij2 Vi − X j

2. Penghitungan c sebagai pusat cluster,
ci , i = 1, …, c dengan menggunakan



ij

⎞(




Ukuran Kevalidan Cluster
Menurut Xie dan Beni (1991), ukuran
kevalidan cluster merupakan proses evaluasi
hasil clustering untuk menentukan cluster mana
yang terbaik. Kevalidan sebuah cluster (S)
ditentukan oleh dua hal yaitu: ukuran kedekatan
antaranggota pada tiap cluster (compactness),
dan ukuran keterpisahan antarcluster satu
dengan cluster yang lainnya (separation).
Semakin kecil nilai S, maka cluster tersebut
semakin valid.

.

((uij ) m x j )

⎛ d
∑ ⎜⎜
⎝ d
c

i =1

n

1

=

u ijm d ij2

di mana:
• uij adalah elemen matriks U yang
bernilai antara 0 dan 1,
• dij = ||ci - xj|| adalah jarak antara
pusat cluster ke-i dan titik data
ke-j,
• ci adalah pusat cluster ke-i,
• m ∈ [1, ∞ ] adalah parameter
fuzzifikasi. Nilai m yang umum




compactness,
n adalah banyaknya titik data,
V adalah pusat cluster,



∑ di j 2

n

adalah variation dari cluster

j =1

ke-i,


dij = µij || X j − Vi ||

adalah

fuzzy

deviation Xj dari cluster ke-i, dan
notasi ||y|| biasanya merupakan norma
(panjang)
penghitungan
jarak
Euclidean,

6



dij adalah jarak antara Xj dan Vi yang
diboboti oleh derajat keanggotaan
fuzzy titik ke-j pada cluster ke-i,
2
adalah separation yang
min Vi − V j



i, j

merupakan jarak minimum antarpusat
cluster.
Kubus Data Fuzzy
Himpunan fuzzy dapat didefinisikan untuk
atribut kuantitatif, misalkan x, dengan fungsi