PengembanganData Warehouse dan OLAP untuk Metadata Penelitian Institut Pertanian Bogor

PENGEMBANGANDATA WAREHOUSE DAN OLAPUNTUK
METADATA PENELITIAN INSTITUT PERTANIAN BOGOR

WIWIEK DEWI ANGGRAENI

DEPARTEMEN ILMU KOMPUTER
FAKULTASMATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

PENGEMBANGANDATA WAREHOUSE DAN OLAPUNTUK
METADATA PENELITIAN INSTITUT PERTANIAN BOGOR

WIWIEK DEWI ANGGRAENI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer


DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

ABSTRACT
WIWIEK DEWI ANGGRAENI. Development of Data Warehouse and Olap for Metadata Research in
Bogor Agricultural University. Supervised by FIRMAN ARDIANSYAH.
Data warehouse is a subject oriented, integrated, time variant, and nonvolatile collection of data
used in strategic decision making. Bogor Agricultural University library has metadata. The activity of
searching and browsing in the library Bogor Agricultural University can be based on metadata fields,
such as title, author, faculty, department, subject, year, and keyword. This research develops a data
warehouse and web-based OLAP (Online Analytical Processing) for undergraduate theses, master
theses, disertations, and journal articles. Data warehouse and OLAP are part of Business Intelligence.
Document corpus contains 65026 research metadata, 51389 undergraduate theses, 11260 master
theses, 2377disertations, and 2000 journal articles from 1958 to 2011. The metadata are represented in
a multidimensional model using galaxy scheme that consists of four data cube, with five dimension
tables, i.e., faculty, department, time, lecturer, subject, and number of research. The result provides
information that can be visualized into various types of graphic models, such as bar graphs, line

graphs, and pie charts using Microsoft Sharepoint 2010. This application can be used to analyze
undergraduate and graduate research as well as to provide a decision making support for research
management in Bogor Agricultural University.
Keywords: Business Intelligence, Data Warehouse, Metadata, OLAP

ii

Judul Skripsi : PengembanganData Warehouse dan OLAP untuk Metadata Penelitian Institut
Pertanian Bogor
Nama
: Wiwiek Dewi Anggraeni
NIM
: G64070048

Menyetujui :
Dosen Pembimbing,

Firman Ardiansyah, S. Kom, M. Si.
NIP 19790522 200501 1 003


Mengetahui
Ketua Departemen,

Dr. Ir. Agus Buono, M. Si, M. Kom
NIP 19660702 199302 1 001

Tanggal Lulus :

iii

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhanahu Wata’alayang telah memberikan
rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tugas akhir dengan judul
PengembanganData Warehouse dan OLAP untuk Metadata Penelitian Institut Pertanian Bogor.
Sholawat serta salam selalu tercurah kepada Nabi Muhammad Shallalahu ‘Alahi Wassallam, keluarga,
para sahabat, dan para pengikutnya.
Banyak orang yang berjasa dalam proses pembuatan skripsi ini. Terima kasih pertama penulis
ucapkan kepada kedua orang tua atas semua cinta, kasih sayang, dan pengorbanan yang selalu
diberikan tulus untuk penulis.Semoga karya sederhana ini dapat menjadi pemberat pahala serta
timbangan amal kebaikan Papa dan Mama di akhirat nanti. Kepada dosen terbaik Bapak Firman

Ardiansyah, S.Kom, M.Si selaku pembimbing yang telah memberikan saran, ide, inspirasi,
keteladanan, bimbingan, dan nasihat kepada penulis dalam menyusun skripsi ini. Tak lupa kepada
Bapak Toto Haryanto, S.Kom, M.Sidan Bapak Hari Agung Adrianto, S.Kom, M.Si sebagai penguji
yang telah memberikan banyak kritik dan saran. Penulis juga mengucapkan terima kasih kepada:
1 Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam, Ibu Dr. Ir Sri Nurdiati, M.Sc, terima
kasih telah banyak membimbing selama 3 tahun dan mengajarkan banyak ilmu baik itu ilmu dunia
maupun akhirat. Ibu adalah motivator terhebat yang pernah penulis kenal.
2 Kepala Perpustakaan Pusat IPB yang telah mengizinkan penulis untuk mengambil data penelitian
IPB berupa skripsi, tesis, dan disertasi.
3 Sekretaris Perpustakaan IPB, Bapak Setyo Edy Susanto, S.Th.I. yang telah memberikan data
lengkap sampai tahun 2011 untuk keperluan tambahan sistem yang dibuat penulis.
4 Bapak Ir. Abdul Rahman Saleh, M.Sc yang telah memberikan data yang penulis perlukan.
5 Seluruh staf pengajar yang telah membagikan ilmunya selama penulis menuntut ilmu di
Departemen Ilmu Komputer dan juga terima kasih kepada seluruh staf administrasi dan staf
perpustakaan atas bantuannya dalam melayani kebutuhan administrasi dan kepustakaan.
6 Rekan-rekan Ilkomerz 44 yang telah membagi ilmunya, mendoakan dan selalu memberi semangat
kepada penulis.
7 Ikmal Saputra, terima kasih karena setiap saat selalu memberi dukungan, semangat, nasihat, dan
doa dengan ikhlas agar penulis segera lulus dan mendapat gelar Sarjana Komputer.
8 Sahabat-sahabat Wisma Melati yang telah memberikan semangat ketika penulis jenuh dan bantuan

ketika penulis sedang sakit.
9 Wa zul sekeluarga, Wa Oding sekeluarga, Wa Lili sekeluarga, Mang Nunu sekeluarga atas doa,
dukungan, dan pengorbanannya selama penulis mengerjakan tugas akhir ini.
10 Teman-teman SMAN 1 Sindang Indramayu Kelas Standar Internasional yang selalu memberi
motivasi dan membantu penulis dengan ikhlas.
11 Data Warehouse forum, OLAP forum, Business Intelligenceforum dan rekan-rekan dunia maya
lainnya yang telah membantu serta mendukung penulis.
Terakhir terima kasih kepada semua pihak lainnya yang tidak dapat disebutkan satu per satu yang
telah membantu penulis selama pengerjaan tugas akhir ini.Semoga Allah Subhanahu Wata’ala
senantiasa membalas segala amal kebaikan kalian dengan balasan-Nya yang terbaik dan semoga hasil
dari tugas akhir ini dapat memberikan manfaat.Jazakumullah khairan katsiran.

Bogor, November 2011

Wiwiek Dewi Anggraeni

i

RIWAYATHIDUP
Wiwiek Dewi Anggraeni lahir di Bandung pada tanggal 13 Juni 1989 sebagai anak pertama dari

dua bersaudara dengan ayah bernama Yusirwan dan Ibu bernama Nani Tresnaningsih.
Pada tahun 2007,penulis lulus dari Sekolah Menengah Atas SMA Negeri 1 Sindang dan diterima
di Institut Pertanian Bogor melalui jalur USMI atau Undangan Seleksi Masuk IPB. Pada tahun 2008,
penulis diterima di Departemen Ilmu Komputer, Institut Pertanian Bogor.Penulis aktif mengikuti
berbagai kegiatan akademik maupun non akademik.Pada tahun 2010, penulis melaksanakan kegiatan
praktik kerja lapangan di Pertamina UP VI Balongan Indramayu selama tujuh minggu.Pada tahun
2009-2011, penulis terpilih menjadi asisten Praktikum Basis Data, Metode Kuantitatif dan Penerapan
Komputer.Pada tahun 2011, penulis bekerja selama 3 bulan di DKSI (Direktorat Komunikasi dan
Informasi) untuk membuat website KMS (Knowledge Management System).Organisasi yang pernah
diikuti adalah Omda Ikada, Kopma, dan Himalkom. Penulis pernahmenjadi Master of ceremony acara
kampus yaitu pada saat wisuda departemen Ilmu Komputer IPB, temu bareng wong dermayu, halal
bihalal, dan up grading Omda Ikada.
Selama kuliah di IPB beasiswa yang pernah penulis dapatkan adalah beasiswa PPA (Peningkatan
Prestasi Akademik) dan beasiswa Jamsostek (Jaminan Sosial dan Tenaga Kerja). Penulis sangat
produktif dalam menulis dan berkarya, penghargaan yang pernah penulis raih sejak tahun 2009 sampai
2011 adalah menjadi Perempuan Inspiratif Nova, Finalis iMulai 3.0 Microsoft dengan USAID, Finalis
GEPI (Global Entrepreneurship Program Indonesia), Juara 3 Social Fair BEM KM IPB, Juara 3
Peningkatan Kreasi Seni dan Budaya Pertanian Direktorat Kemahasiswaan IPB, dan Program Hibah
MITI Indonesia.


iv

DAFTAR ISI
Halaman
DAFTAR GAMBAR ............................................................................................................................. vi
DAFTAR TABEL ................................................................................................................................. vi
DAFTAR LAMPIRAN.......................................................................................................................... vi
PENDAHULUAN
Latar Belakang ................................................................................................................................... 1
Tujuan ................................................................................................................................................ 1
Ruang Lingkup................................................................................................................................... 1
Manfaat Penelitian ............................................................................................................................. 1
TINJAUAN PUSTAKA
Metadata............................................................................................................................................. 2
CDS/ISIS (Computerised Documentation Service / Integrated Set Information Systems) ................ 2
INDOMARC ...................................................................................................................................... 2
Data Warehouse................................................................................................................................. 2
Model Data Multidimensi .................................................................................................................. 2
METODE PENELITIAN
Analisis .............................................................................................................................................. 3

Desain Konseptual ............................................................................................................................. 3
Desain Logikal ................................................................................................................................... 3
Desain Fisik ....................................................................................................................................... 3
Ekstraksi Data .................................................................................................................................... 4
Transformasi Data .............................................................................................................................. 4
Pemuatan Data ................................................................................................................................... 4
Implementasi Business Intelligence ................................................................................................... 4
Uji Query ........................................................................................................................................... 5
HASIL DAN PEMBAHASAN
Analisis .............................................................................................................................................. 6
Desain Konseptual ............................................................................................................................. 6
Desain Logikal ................................................................................................................................... 6
Desain Fisik ....................................................................................................................................... 6
Ekstraksi Data .................................................................................................................................... 7
Transformasi Data .............................................................................................................................. 7
Pemuatan Data ................................................................................................................................... 7
Implementasi Business Intelligence ................................................................................................... 7
Uji Query ........................................................................................................................................... 9
Gambaran Umum Aplikasi ................................................................................................................ 9
Kelebihan dan kekurangan ................................................................................................................. 9

Eksplorasi dan Presentasi Hasil ....................................................................................................... 10
KESIMPULAN DAN SARAN
Kesimpulan ...................................................................................................................................... 11
Saran ................................................................................................................................................ 11
LAMPIRAN ......................................................................................................................................... 12

v

v

DAFTAR GAMBAR
Halaman
1
2
3
4
5
6
7
8

9
10
11
12
13
14
15
16
17

Skema galaksi (Han and Kamber 2006) ............................................................................................ 2
Diagram alir metode penelitian ......................................................................................................... 3
Skema galaksi dengan empat tabel fakta dan lima tabel dimensi ...................................................... 6
Hirarki penelitian berdasarkan jenis penelitian. ................................................................................ 6
Hirarki penelitian berdasarkan dimensi fakultas dan departemen ..................................................... 6
Hirarki penelitian berdasarkan dimensi tahun penelitian................................................................... 7
Hirarki penelitian berdasarkan dimensi jenjang pendidikan .............................................................. 7
Hirarki penelitian berdasarkan dimensi dosen. .................................................................................. 7
Hirarki penelitian berdasarkan dimensi subjek .................................................................................. 7
Format ekspor XML .......................................................................................................................... 7

Data yang mengandung nilai null ...................................................................................................... 7
Data yang mengandung nilai null yang sudah diisi dengan nilai subjek. .......................................... 8
Hasil pembersihan data penelitian ..................................................................................................... 8
Grafik garis skripsi sejak tahun 1958 sampai dengan 2011 ............................................................... 8
Grafik batang skripsi berdasarkan dimensi tahun, fakultas, dan departemen .................................. 10
Grafik batang jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan dosen. .......... 10
Grafik batang jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan subjek .......... 10

DAFTAR TABEL
Halaman
1
2
3
4
5
6
7
8

Atribut pada data penelitian............................................................................................................... 5
Atribut hasil reduksi .......................................................................................................................... 5
Atribut yang digunakan ..................................................................................................................... 5
Dimensi pada data penelitian............................................................................................................. 6
Atribut tabel fakta penelitian ............................................................................................................. 6
Desain fisik tabel fakta penelitian ..................................................................................................... 6
Atribut yang direduksi pada data penelitian ...................................................................................... 8
Hasil pengujian query........................................................................................................................ 9

DAFTAR LAMPIRAN
Halaman
1
2
3
4
5
6
7

Keterangan nomor tag MARC pada metadata tesis......................................................................... 13
Data tabel dimensi ........................................................................................................................... 14
Data tabel fakta ................................................................................................................................ 14
Data tabel jumlah penelitian ............................................................................................................ 23
Desain logikal skema galaksi dengan empat tabel fakta.................................................................. 26
Model hirarki dimensi ..................................................................................................................... 27
Hasil pengujian ............................................................................................................................... 30

vi

1

PENDAHULUAN
Latar Belakang
Institut Pertanian Bogor (IPB) terdiri atas 9
Fakultas yaitu Pertanian, Kedokteran Hewan,
Perikanan, Peternakan, Kehutanan, Teknologi
Pertanian, Matematika dan Ilmu Pengetahuan
Alam, Ekonomi dan Manajemen, Serta Ekologi
Manusia. Program Sarjana terdiri atas 34
departemen, sedangkan Sekolah Pascasarjana
terdiri atas 65 program mayor untuk program
magister dan 43 mayor untuk program doktor.
IPB memiliki visi “Menjadi perguruan tinggi
bertaraf internasional dalam pengembangan
IPTEKS dan sumberdaya manusia dengan
kompetisi utama pertanian tropika.”IPB berusaha
menghasilkan lulusan yang berkualitas dan
mampu mengembangkan serta menerapkan
IPTEKS sesuai dengan kebutuhan masyarakat
masa kini serta mendatang. Hal ini bertujuan
mendukung
pembangunan
nasional
dan
memperbaiki kesejahteraan umat manusia.
Lulusan IPB yang kompeten dan berkualitas
salah satunya dapat dilihat dari hasil penelitian
atau tugas akhir yang telah ditempuhnya.
Semakin banyak hasil penelitian IPB berbasis
IPTEKS
yang
dapat
dimanfaatkan,
dikembangkan, dan diterapkan baik secara
nasional maupun global maka akandapat
terwujud visi IPB tersebut.
Salah satu cara mewujudkan visi tersebut
dapat dilakukan penelitian mengenai Business
Intelligence dengan menggunakan metadata hasil
penelitian IPB untuk mengetahui pengembangan
IPTEKS di IPB. Data Penelitian IPB dapatberupa
skripsi, tesis, disertasi, dan jurnal ilmiah dari
tahun 1958 sampai 2011.Data ini terdapat di
perpustakaan pusat, perpustakaan tiap fakultas,
perpustakaan tiap departemen, LPPM, RKS, dan
pusat-pusat penelitian.Data tersimpan dalam
bentuk metadata.Field yang terdapat dalam
metadata adalah judul, penulis, subjek, kata
kunci, departemen, fakultas, dosen pembimbing,
dan tahun.Track record dan trendpenelitian IPB
dapat dianalisis dari data tersebut.
Dari waktu ke waktu jumlah dokumen
penelitian IPB selalu bertambah sehingga terjadi
penumpukan data.Hal ini tidak menjadi masalah
apabila dilihat dari sisi perangkat keras karena
telah tersedia media penyimpanan data yang
dapat menampung kapasitas data yang sangat
besar.Namun saat ini terdapat tuntutan untuk
menyajikan informasi yang akurat, cepat, dan
menarik agar data tersebut dapat bermanfaat bagi
pengguna.Business Intelligence merupakan salah
satu solusi dari permasalahan penumpukan
data.Business Intelligence adalah kegiatan untuk
mengumpulkan dan menganalisis data sehingga
dapat digunakan untuk memprediksi trend,

menentukan target, mengambil keputusan untuk
para pengambil keputusan serta mengukur hasil
dari setiap keputusan yang ada terhadap faktor
pendukung eksternal maupun internal.Teknologi
ini dapat mengolah data dan menampilkan
informasi yang dibutuhkan untuk mengambil
keputusan berdasarkan data historis yang ada.
Business Intelligence mencakup proses
pembuatan Data warehouse dan OLAP (Online
Analytical Processing). Proses pembuatan data
warehouse
dilakukan
dengancara
mengumpulkan, menyimpan, dan menyediakan
data untuk aplikasi OLAP server yang bersifat
query dan reporting. OLAP dapat membantu
pengguna dalam menganalisis data pada sebuah
data warehouse dengan menyediakan berbagai
tampilan data grafik yang dinamis untuk
mengetahui jumlah penelitian yang telah
dilakukan oleh peneliti dari tahun ke tahun,
fakultas dan departemen yang banyak meneliti,
presentase subjek yang paling diminati untuk
diteliti.Hasil dari penelitian ini diharapkan dapat
memberikan manfaat bagi pengguna dalam
mempermudah analisis data penelitian IPB
sehingga dapat membantu pengaksesan data,
penyampaian informasi, pembuatan laporan dan
keputusan yang lebih baik.
Tujuan
Penelitian ini bertujuan membangun data
warehousedan
aplikasi
online
analytical
processing dengan menggunakan Microsoft
Business Intelligence berbasis web untuk
menampilkan tren penelitian IPB berupa skripsi,
tesis, disertasi, dan jurnal ilmiah.
Ruang Lingkup
Ruang lingkup penelitian ini adalah :
1 Data yang digunakan dalam penelitian ini
berupa skripsi, tesis, disertasi, dan jurnal
ilmiah tahun 1958-2011 yang terdapat di
perpustakaan pusat IPB.
2 Pembuatan Data Warehouse dan aplikasi
OLAP berbasis web. Tahapan yang akan
dilakukan
adalah
pengumpulan,
penyimpanan,
pembersihan,
integrasi,
transformasi, penggabungan, dan peringkasan
data.
3 Microsoft SQL Server 2008 R2 dan
SharePoint Server 2010 adalah tools yang
digunakan dalam penelitian ini.
Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan
informasi mengenai jumlah penelitian yang telah
dilakukan oleh peneliti dari tahun ke tahun,
mengetahui track record dan tren penelitian IPB,
serta membantu dalam proses pengambilan
keputusan secara tepat. Penelitian ini juga

2

diharapkan dapat memberikan manfaat kepada
pihak terkait di lingkungan IPB, seperti
perpustakaan pusat, perpustakaan tiap fakultas,
perpustakaan tiap departemen, LPPM, RKS, dan
pusat-pusat penelitian dalam memberikan dan
menyajikan analisis data secara cepat, interaktif,
mudah dimengerti, dan menarik.

TINJAUAN PUSTAKA
Metadata
Metadata adalah informasi terstruktur yang
menjelaskan, mengGambarkan, menempatkan
sumber informasi yang membuat kemudahan
dalam proses temu kembali, penggunaan, dan
manajemen(NISO 2004).Di dalam lingkungan
perpustakaan, metadata biasa digunakan untuk
skema formal dari deskripsi sumber, menerapkan
ke berbagai tipe objek, digital atau bukan digital.
CDS/ISIS
(Computerised
Documentation
Service / Integrated Set Information Systems)
CDS/ISIS adalah sistem temu kembali dan
penyimpanan informasi yang didesain secara
spesifik untuk manajemen terkomputerisasi dari
database non-numerik yang terstruktur.Salah satu
keuntungan yang ditawarkan oleh sistem desain
penyamarataan
adalah
CDS/ISIS
dapat
memanipulasi sejumlah database secara tak
terbatas di mana setiap database dapat memiliki
elemen-elemen yang berbeda (UNESCO 2004).
INDOMARC
Format
INDOMARC
merupakan
implementasi
dari
International
Standar
Organization (ISO)Format ISO 2709 untuk
Indonesia, sebuah format untuk tukar menukar
informasi bibliografis melalui pita magnetik
(magnetic tape), cakram padat (compact disc),
atau media terbacakan mesin (machine-readable)
lainnya.Informasi bibliografis secara umum
mencakup pengarang, judul, subjek, catatan, data
penerbitan, dan deskripsi fisik (PNRI 2005).

Model Data Multidimensi
Model data multidimensi terdiri atas satu atau
lebih tabel dimensi dan tabel fakta. Dimensi
adalah perspektif atau entitas yang digunakan
sebagai tempat menyimpan beberapa record yang
saling berhubungan. Setiap dimensi memiliki
tabel yang biasa disebut dengan tabel
dimensi.Tabel dimensi dapat dispesifikasikan
oleh pengguna atau para ahli, atau dihasilkan
secara otomatis dan diatur berdasarkan distribusi
data.Fakta adalah ukuran-ukuran numerik. Fakta
merupakan kuantitas yang akan dianalisis
hubungan antar dimensinya. Tabel fakta berisi
nama dari fakta (ukuran) dan juga keys untuk
setiap tabel dimensi yang berhubungan. Dalam
data warehouse kubus data adalah n-dimensi.
Kubus data disebut juga cuboid.Cuboid yang
tingkat kesimpulannya paling rendah disebut base
cuboid sedangkan cuboid dengan tingkat paling
tinggi disebut apex cuboid.Data warehouse
membutuhkan skema yang ringkas dan
berorientasi subjek untuk memfasilitasi analisis
data secara online. Tipe-tipe skema model
multidimensional adalah star schema, snowflake
schema, dan galaxy schema. Star schema
merupakan skema data warehouse yang paling
sederhana, terdiri atas satu tabel fakta yang
dihubungkan dengan beberapa tabel dimensi yang
polanya menyerupai bintang. Keuntungan star
schema yaitu pada proses query dan waktu
respons yang cepat. Snowflake schema
merupakan variasi dari star schema dimana
beberapa tabel dimensinya dinormalisasikan
sehingga menghasilkan beberapa tabel tambahan.
Keuntungan snowflake schema yaitu tabel
dimensi dapat dijaga tetap dalam bentuk normal
sehingga mengurangi redudancy.Penelitian ini
menggunakan
galaxy
schema
karena
membutuhkan tabel fakta yang banyak untuk
berbagi dengan tabel dimensi.Galaxy schema
dapat dilihat Pada Gambar 1 (Han & Kamber
2006).

Data Warehouse
Data warehouse adalah sekumpulan data
yang berorientasi subjek, terintegrasi, timevariant dan nonvolatile yang mendukung dalam
manajemen pengambilan keputusan. Data
warehouse menyediakan arsitektur dan alat bagi
para eksekutif bisnis untuk mengatur secara
sistematis, mengerti dan menggunakan data
tersebut
untuk
pengambilan
keputusan.
Penjelasan secara rinci dari pengertian data
warehouse (Han & Kamber 2006) :

Gambar 1 Skema galaksi (Han & Kamber 2006).

3

METODE PENELITIAN
Tahapan yang dilakukan pada penelitian ini
dapat dilihat Pada Gambar 2.
Mulai

sistem
adalah
administrator
dan
staf.Administrator memiliki akses ke dalam
database dan antarmuka. Staf memiliki akses
antarmuka dengan fasilitas dapat memilih
dimensi drop-down list, menampilkan data dalam
bentuk drill up,drill down, dan grafik.
Desain Konseptual

Analisis Data

Desain Konseptual

Desain
Desain Logikal

Desain Fisik

Ekstraksi Data

Praproses Data
Transformasi Data

Pada tahapan inidilakukan desain skema
dalam pembuatan data warehouse, analisis
measure dan dimensi yang akan digunakan.
Penelitian
ini
menggunakan
galaxy
schema.Terdapat empat tabel fakta yaitu skripsi,
tesis, disertasi, dan jurnal IPB. Selain itu terdapat
lima dimensi yaitu fakultas, departemen, dosen
pembimbing, tahun dan subjek. Dalam tabel fakta
terdiri atasforeign key dari tabel dimensi,
danukuran jumlah penelitian.
Desain Logikal
Pada tahapan inidilakukan perancangan
database dengan membuat relasi-relasi data dan
menentukan hubungan satu atribut dangan atribut
lainnya. Penyimpanan data pada database
dengan penyimpanan multidimensional.
Desain Fisik

Pemuatan Data

Implementasi
Data warehouse
Tidak

Uji Query

Pada tahapan ini menjelaskan kubus data yang
sudah
siap
digunakan
dalam
data
warehouse.Kubus data yang dibuat yaitu kubus
skripsi, kubus tesis, kubus disertasi, dan kubus
jurnal. Terdapat lima dimensi yaitu fakultas,
departemen, dosen pembimbing, tahun, dan
subjek. Jumlah skripsi, jumlah tesis, jumlah
disertasi, dan jumlah jurnal merupakan ukuran.
Skema sudah dapat diimplementasikan ke dalam
data warehouse yang akan dibangun.
Ektraksi Data

Ya
Selesai

Gambar 2 Diagram alir metode penelitian.
Analisis
Data penelitian terdapat di perpustakaan
pusat, perpustakaan tiap fakultas, perpustakaan
tiap departemen, LPPM, RKS, dan pusat-pusat
penelitian.Data tersebut berupa skripsi, tesis,
disertasi, dan jurnal yang telah diperoleh
selanjutnya dianalisis untuk mendapatkan
spesifikasi kebutuhan yang sesuai dengan
keinginan pengguna. Spesifikasi kebutuhan ini
akan menghasilkan desain konseptual, desain
logikal, dan desain fisik. Desain tersebut
digunakan untuk menentukan atribut, dimensi,
fakta, dan skema untuk model data multidimensi
dalam pembuatan data warehouse.Pengguna

Data yang digunakan seringkali bersifat noisy
(data tidak jelas atau rusak), incomplete (data
kekurangan nilai atribut atau hanya berisi
agregasi), dan inconsistent (data tidak
konsisten).Ekstraksi data dilakukan untuk
ketepatan dan kesesuaian data terjaga.Proses
ekstraksi mencakup integrasi, reduksi, dan
pembersihan data.Reduksi dilakukan bersamaan
dengan proses integrasi dengan membuang
atribut-atribut yang tidak diperlukan dari tabel
yang dianalisis. Setelah itu mengisi data yang
hilang, mengatasi data yang kotor dan rusak,
mengidentifikasi atau membuang data pencilan
serta memperbaiki data yang tidak konsisten.
Perpustakaan IPB menggunakan CDS/ISIS untuk
menyimpan data penelitian. Hasil ekspor data
penelitian dalam format XML. Sebelum diimpor
ke Microsoft SQL Server 2008, atribut-atribut
data yang relevan dipilih menggunakan bantuan
Microsoft Excel.Pemilihan atribut ini berdasarkan
tujuan pembuatan data warehouse.Dari 15 atribut

4

yang ada pada data penelitian direduksi menjadi 8
atribut saja.
Transformasi Data
Proses transformasi dilakukan agar kondisi
data tetap konsisten dan dapat digunakan untuk
proses selanjutnya.Data dari semua sumber
dikonversi ke dalam format yang umum sesuai
dengan skema multidimensional yang telah
dibuat.
Pemuatan Data
Pada tahap ini, data telah siap untuk dimuat
(load) ke dalam data warehouse, bertujuan
memuat data yang terseleksi dan membuat indeks
yang diperlukan.
Data Warehouse
Data warehouse adalah sekumpulan data
yang berorientasi subjek, terintegrasi, timevariant dan nonvolatile yang mendukung dalam
manajemen pengambilan keputusan. Data
warehouse menyediakan arsitektur dan alat bagi
para eksekutif bisnis untuk mengatur secara
sistematis, mengerti dan menggunakan data
tersebut untuk pengambilan keputusan. Microsoft
SQL Server 2008 merupakan platform untuk
melakukan
datawarehouse
(Noviandi
2010).Arsitektur data warehouse yang umum
digunakan adalah arsitektur three-tier. Arsitektur
ini disebut three-tier karena terdiri atas tiga
lapisan.Lapisan-lapisan
arsitektur
three-tier
adalah sebagai berikut (Han & Kamber 2006) :
1 Lapisan Bawah (Bottom Tier)
Lapisan bawah merupakan tempat pengolahan
sumber data warehouse yang bertujuan agar
data tersebut dapat digunakan dengan baik.
Pengolahan tersebut biasanya menggunakan
sistem basis data relasional.Pada lapisan ini
data diambil dari basis data operasional dan
sumber
eksternal
lainnya,
diekstrak,
dibersihkan, ditransformasi, dan disimpan
sebagai data warehouse.Sistem basisdata
relasional (SQL Server 2008 R2) yang
berfungsi sebagai tempat pengolahan data.
2 Lapisan Tengah (Middle Tier)
Lapisan tengah merupakan OLAP Server
yang berfungsi menyimpan struktur dari
kubus data.Dalam penelitian ini, digunakan
Microsoft Business Intelligence (BI) sebagai
OLAP server.Microsoft SQL Server 2008 R2
merupakan salah satu platform untuk
melakukan data warehouse maupun data
mart. Perbedaan data warehouse dan data
mart memiliki batasan yang sangat tipis,
namun
perbedaan
ini
tidak
perlu
dikhawatirkan karena secara subtansi tujuan
dari pembuatannya memiliki kesamaan
(Noviandi 2010). Konsep data warehouse
sudah dikenal sebagai platform yang

fundamental dari setiap solusi BI yang
dikembangkan.
Keberhasilan
dalam
merancang dan memasukkan data ke dalam
data warehouse akan sangat berpengaruh
terhadap berhasil atau tidaknya solusi BI yang
dikembangkan dalam sebuah organisasi
(Noviandi 2010).
3 Lapisan Atas (Top Tier)
Lapisan atas merupakan lapisan untuk end
user yang berisi query dan menampilkan
informasi atau perangkat analisis dan data
mining (seperti: analisis tren, prediksi, dan
lainnya) serta ringkasan dari isi data
warehouse yang merupakan hasil dari operasi
OLAP (SharePoint 2010). OLAP (Online
Analitycal Processing)terdiri atas seperangkat
tool untuk membantu proses analisis dan
perbandingan data dalam basis data. Tool dan
metode
OLAP
membantu
pengguna
menganalisis data pada sebuah data
warehouse dengan menyediakan berbagai
tampilan data, dan didukung dengan
representasi data grafik yang dinamis (Han
&Kamber 2006).
Implementasi Business Intelligence
Business Inteligence (BI) adalah kegiatan
untuk mengumpulkan dan menganalisis data
sehingga dapat digunakan untuk memprediksi
trend, menentukan target, mengambil keputusan
untuk para pengambil keputusan serta mengukur
hasil dari setiap keputusan yang ada terhadap
faktor pendukung eksternal maupun internal. BI
diperlukan jika database disimpan dalam
platform yang berbeda-beda (misalnya : SQL
Server, Oracle, My SQL), akan menjadi sulit
ketika menganalisis data dan jika akan melihat
trend dari waktu ke waktu. Microsoft
menyediakan alat yang dibutuhkan untuk
mengelola dan menggunakan solusi BI. Microsoft
SQL Server 2008 merupakan platform untuk
melakukan datawarehouse (Noviandi 2010).
Ada 3 komponen penting yang diperlukan
untuk membangun sebuah solusi BI dalam
Microsoft BI Framework, 3 komponen ini adalah:
1 Proses ETL (extract, transform dan load)
menggunakan data penelitian IPB berupa
skripsi, tesis, disertasi, dan jurnal dari tahun
1958 sampai 2011 untuk keperluan ini
Microsoft
menyediakan
SQL
Server
Integration
Services
yang
memiliki
kemampuan untuk melakukan proses ETL
terhadap data yang ada.
2 Proses analisis dengan pendekatan OLAP
(online analitical processing), analisis data
sendiri dengan pendekatan Cube dan dimensi
bisa dilakukan dengan SQL Server Analysist
Services.

5

3 Proses reporting yang digunakan sebagai
representasi hasil analisis data yang sudah
dilakukan
yang
dapat
dibuat
denganmenggunakan Tools SQL Server
Reporting Services.
End-User dapat mempublikasikan solusi data
melalui SharePoint 2010 untuk mengelola versi
secara efektif, akses pengguna, pemanfaatan
sumber daya yang ada, dan membantu
ketersediaan data dan solusi secara konsisten.
Uji Query
Pada tahap ini dilakukan pengujian untuk
melihat apakah operasi dasar OLAP berhasil
diimplementasikan dan sesuai dengan informasi
yang ditampilkan.Pengujian dilakukan dengan
memvisualisasikan kubus data dengan grafik dan
tabel pivot.
Lingkungan Pengembangan Sistem
Spesifikasi beberapa perangkat lunak dan
perangkat keras yang digunakan dalam penelitian
ini adalah sebagai berikut:
1 Perangkat Lunak :
• Windows 7 Ultimate 64 bit
• Windows Server R2
• Windows Identify Foundation
• Visual Studio
• Microsoft SQL Server 2008
• Microsoft SharePoint 2010
• Microsoft Filter Pack 2.0
• Microsoft Charts Controls
• Internet Information Services (IIS)
• Notepad++
• Microsoft Visio, Excel, dan Powerpoint
• Web Browser Internet Explorer
2 Perangkat Keras :
• Intel Core 2 Duo Processor 2.26GHz
• Memori 256MB DDR3 SDRAM
• Monitor resolusi 1280 x 800 pixels
• Mouse dan keyboard

HASIL DAN PEMBAHASAN
Analisis
Penelitian ini menggunakan metadata
penelitian IPB dengan jumlah data yaitu 51389
skripsi, 11260 tesis, 2377 disertasi, dan 2000
jurnal ilmiah dari tahun 1958-2011. Metadata
terdapat dalam CDS/ISIS milik Perpustakaan
Pusat IPB. Nama-nama field yang digunakan
pada metadata mengikuti format INDOMARC
dan setiap field memiliki nomor tag tersendiri.
Contoh field yang terdapat pada metadata skripsi,
tesis, disertasi, dan jurnal IPB dapat dilihat di
Tabel 1.

Tabel 1 Atribut pada data penelitian.
Nomor Tag
Field Metadata
999
No. Registrasi
985
Jumlah Eksemplar
998
Jenis Karya [D/T]
980
008/005 Tanggal Registrasi
981
Tanggal Input Pengolahan
35
No. Kendali Setempat
80
Nomor UDC
99
Nomor Panggil
100
Pengarang Utama
245
Judul
260(a,b,c)
Impresum
300
Deskripsi Fisik
502
Catatan Karya (T/D)
650
Subjek
710(a,b,c)
Badan Korporasi
712
Program Studi
759
Nama Pembimbing
695
Kata Kunci
986
Kode Operator

Atribut yang telah direduksi dapat dilihat
pada Tabel 2.
Tabel 2 Atribut hasil reduksi
Nomor Tag Field Metadata
260(a,b,c)
Impresum
650
Subjek
710(a,b,c)
Badan Korporasi
759
Nama Pembimbing
Atribut yang akan digunakan pada Tabel 3
adalah sebagai berikut:
1 Atribut yang dipilih adalah atribut yang
berkaitan dengan data penelitian secara
spesifik untuk dianalisis
2 Atribut yang dapat direlasikan dengan atribut
(foreign key)
3 Data tidak mengandung nilai null >50 %
record.
Tabel 3 Atribut yang digunakan
Nomor Tag Field Metadata
260_c
Tahun
650
Subjek
710_b
Fakultas
710_c
Departemen
759
Dosen Pembimbing
Spesifikasi kebutuhan yang ditentukan
adalah sebagai berikut:
1 Tren jumlah penelitian setiap tahun
2 Tren jumlah penelitian berdasarkan fakultas
setiap tahun
3 Tren
jumlah
penelitian
berdasarkan
departemen setiap tahun
4 Tren jumlah penelitian berdasarkan dosen
setiap tahun

6

5 Tren jumlah penelitian berdasarkan subjek
setiap tahun
6 Tren jumlah penelitian berdasarkan jenjang
pendidikan setiap tahun
7 Tren jumlah penelitian berdasarkan fakultas,
departemen, dosen, subjek, dan tahun.

Desain Konseptual

Tabel 6 Desain fisik tabel fakta penelitian
Nama Atribut

Deskripsi

Waktu

Tahun akademik

Fakultas

Nama fakultas

Departemen

Nama departemen

dosen_pembimbing

Nama dosen pembimbing

Subjek

Kata subjek

Desain konseptual diawali dengan memilih
atribut-atribut yang bisa dijadikan sebagai
measure dan dimensi.Dimensi yang terbentuk
adalah dimensi tahun, dimensi departemen,
dimensi fakultas, dimensi dosen, dimensi subjek,
dimensi tahun, dan dimensi strata.Atribut pada
tabel-tabel fakta terdiri atas foreign key dari
dimensi-dimensi dan measure.Desain konseptual
dapat dilihat pada Tabel 4.
Tabel 4 Dimensi pada data penelitian
Nama Atribut

Tipe Data

Waktu

Int (4)

Fakultas

Varchar (20)

Departemen

Varchar (50

dosen_pembimbing

Varchar (30)

Subjek

Varchar (50)

Desain Logikal
Pada desain logikal, terdapat empat tabel
fakta yaitu skripsi, tesis, disertasi, dan jurnal IPB.
Tabel fakta memiliki lima atribut yaitu tahun,
fakultas, departemen, dosen pembimbing, dan
subjek. Desain Logikal dapat dilihat pada Tabel
5.
Tabel 5 Atribut tabel fakta penelitian
Nama Dimensi

Deskripsi

Tahun

Tahun akademik

Fakultas

Nama fakultas

Departemen

Nama departemen

Dosen Pembimbing

Nama dosen pembimbing

Subjek

Kata subjek

Ukuran Skripsi

Jumlah skripsi

Gambar 3 Skema galaksi dengan 4 tabel fakta
dan 5 dimensi.
Dari dimensi pada fakta yang ada, terbentuk
struktur hirarki.Hirarki adalah satu bagian
dimensi.Dimensi merupakan hirarki berupa
jenjang
atau
tingkatan
dari
dimensi
tersebut.Dengan adanya hirarki tersebut, dimensi
dapat menunjukkan tingkatannya (Han & Kamber
2006). Beberapa hirarki yang terbentuk ialah:
•hirarki fakultas
•hirarki departemen
• hirarki tahun
• hirarki dosen
• hirarki subjek
Hirarki jenis penelitian adalah hirarki dari
jenis penelitian yang dilakukan oleh Mahasiswa
IPB.Struktur hirarki dimensi jenis penelitian
dapat dilihat Pada Gambar 4.
PENELITIAN

SKRIPSI

TESIS

DISERTASI

JURNAL
ILMIAH

Desain Fisik

Gambar 4 Hirarki penelitian berdasarkan dimensi
jenis penelitian.

Desain fisik dan atribut pada tabel fakta
penelitian dapat dilihat pada Tabel 6.Penelitian
ini menggunakan skema galaksi karena tabel
fakta yang dihasilkan ada empat yaitu skripsi,
tesis, disertasi, dan jurnal.Skema Galaksi dapat
dilihat Pada Gambar 3.

Hirarki berdasarkan fakultas dan departemen
adalah hirarki dari fakultas dan departemen yang
terdapat di IPB. Struktur hirarki dimensi
berdasarkan fakultas dan departemendapat dilihat
Pada Gambar 5.

7

hirarki dimensi jenis penelitian dapat dilihat Pada
Gambar 9.

PENELITIAN

PENELITIAN



A

I

ABORTUS



TSL

ARL



ZOOPLANKTON

Gambar 9 Hirarki penelitian berdasarkan dimensi
subjek.

Gambar 5 Hirarki penelitian berdasarkan dimensi
fakultas dan departemen.

Ekstraksi Data

Hirarki waktu adalah hirarki dari tahun
penelitian yang dilakukan oleh Mahasiswa
IPB.Struktur hirarki dimensi jenis penelitian
dapat dilihat Pada Gambar 6.

Data dalam CDS/ISIS tersebut diekspor ke
dalam bentuk XML. Tedapat beberapa pilihan
format untuk format XML yang akan diekspor.
Format eksporXML yang digunakan ditunjukkan
Pada Gambar10.

PENELITIAN



1958

2011

Gambar 6 Hirarki penelitian berdasarkan dimensi
tahun penelitian.
Hirarki strata adalah hirarki dari jenis strata
yang ada di IPB.Struktur hirarki dimensi strata
dapat dilihat Pada Gambar 7.
Gambar10 Format eksporXML.
PENELITIAN

S1

S2

S3

Gambar 7 Hirarki penelitian berdasarkan dimensi
jenjang pendidikan.
Hirarki dosen adalah hirarki dari dosen yang
membimbing Mahasiswa IPB dalam melakukan
penelitian.Struktur hirarki dimensi dosen dapat
dilihat Pada Gambar 8.
PENELITIAN

ABDULGANI




ZULKARNAIN


Terdapat kesalahan-kesalahan pada XML
yang dihasilkan, yaitu XML yang dihasilkan
bukan termasuk XML yang well-formed dan
terdapat banyak metadata yang memiliki illegal
character pada XML tersebut. Ini artinya
dokumen tersebut harus mematuhi peraturan ,
termasuk (Harold & Means 2004) :
Setiap start-tag harus memiliki end-tag.
Setiap element boleh bersarang tapi tidak
overlap.
3 Harus terdapat satu root element
4 Nilai atribut harus diberi tanda kutip dua.
5 Sebuah elemen tidak boleh memiliki dua
atribut dengan nama yang sama
6 Komentar dan instruksi processing tidak
boleh ada di dalam tags.
7 Tidak boleh ada tanda “