Pembangunan Data Warehouse dan Aplikasi OLAP Kepegawaian Institut Pertanian Bogor
PEMBANGUNAN DATA WAREHOUSE DAN
APLIKASI OLAP KEPEGAWAIAN
INSTITUT PERTANIAN BOGOR
SRI RAHAYU
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pembangunan Data
Warehouse dan Aplikasi OLAP Data Kepegawaian Institut Pertanian Bogor
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Desember 2013
Sri Rahayu
NIM G64080059
ABSTRAK
SRI RAHAYU. Pembangunan Data Warehouse dan Aplikasi OLAP
Kepegawaian Institut Pertanian Bogor. Dibimbing oleh HARI AGUNG
ADRIANTO dan FIRMAN ARDIANSYAH
Sistem Kepegawaian IPB saat ini menggunakan SQL Server sebagai
Database Management System (DBMS). Namun, sistem ini belum dilengkapi
dengan aplikasi yang cukup untuk melakukan analisis data kepegawaian.
Penelitian ini bertujuan untuk membangun data warehouse dan aplikasi OLAP
untuk mendukung proses analisis data kepegawaian. Pembangunan data
warehouse dan aplikasi OLAP ini menghasilkan tiga tabel fakta dan 10 tabel
dimensi. Ketiga tabel fakta tersebut adalah DW_FactBiodataPegawai,
DW_FactPendidikan, dan DW_FactPendidikanTime. Sedangkan dimensi yang
dihasilkan
adalah
DW_DimKategoriUsia,
DW_DimStatusPekerjaan,
DW_DimStatusPegawai,
DW_DimPendidikan,
DW_DimTahunPendidikan,
DW_DimJabatan, DW_DimUniversitas, DW_DimBidangIlmu, DW_DimTime,
dan DW_DimDepartemen. Target yang dapat dikerjakan oleh aplikasi ini terdiri
dari enam poin yang meliputi tiga inti penekanan kondisi kepegawaian, yaitu
kategori usia, tingkat pendidikan, dan jabatan pegawai.
Kata kunci: Data warehouse, DBMS, Institut Pertanian Bogor, Kepegawaian,
OLAP, SQL Server
ABSTRACT
SRI RAHAYU. Data Warehouse and OLAP Application Development of Bogor
Agricultural University Employee Data. Supervised by HARI AGUNG
ADRIANTO and FIRMAN ARDIANSYAH.
IPB Employment System currently uses SQL Server as a Database
Management System (DBMS). However, the system do not have sufficient tools
to conduct an optimal employee data analysis. This research aims at developing
data warehouse and OLAP application to support the process of employee data
analysis. Development of data warehouse and OLAP applications produces three
fact tables and ten dimension tables. The three fact tables are
DW_FactBiodataPegawai, DW_FactPendidikan, and DW_FactPendidikanTime,
while the dimension tables are DW_DimKategoriUsia, DW_DimStatusPekerjaan,
DW_DimStatusPegawai,
DW_DimPendidikan,
DW_DimTahunPendidikan,
DW_DimJabatan, DW_DimUniversitas, DW_DimBidangIlmu, DW_DimTime,
and DW_DimDepartemen. There are six targets that can be done by this
application including three core emphases on employment conditions, such as
age, education level, and structural position of the employee.
Keyword: Data warehouse, DBMS, Institut Pertanian Bogor, Kepegawaian,
OLAP, SQL Server
PEMBANGUNAN DATA WAREHOUSE DAN
APLIKASI OLAP KEPEGAWAIAN
INSTITUT PERTANIAN BOGOR
SRI RAHAYU
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
Penguji: Annisa, SKom, MKom
Judul Skripsi : Pembangunan Data Warehouse dan Aplikasi OLAP Kepegawaian
Institut Pertanian Bogor
Nama
: Sri Rahayu
NIM
: G64080059
Disetujui oleh
Hari Agung Adrianto, SKom, MSi
Pembimbing I
Firman Ardiansyah, SKom, MSi
Pembimbing II
Diketahui oleh
Dr Ir Agus Buono, MSi, MKom
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan ke hadirat Allah Subhanahu wa-ta'ala
atas segala rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tugas
akhir dengan judul Pembangunan Data Warehouse dan Aplikasi OLAP Data
Kepegawaian Institut Pertanian Bogor. Penelitian ini dilaksanakan mulai Februari
2013 sampai dengan Agustus 2013 dan bertempat di Departemen Ilmu Komputer
Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada Bapak Hari Agung Adrianto, SKom,
MSi dan Bapak Firman Ardiansyah, SKom, MSi selaku pembimbing. Ungkapan
terima kasih juga disampaikan kepada ayah, ibu, seluruh keluarga, serta temanteman atas segala doa dan kasih sayangnya.
Semoga penelitian ini dapat memberikan manfaat bagi penulis serta pihak
lain yang membutuhkan.
Bogor, Desember 2013
Sri Rahayu
2
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
1
Ruang Lingkup Penelitian
2
METODE
2
Analisis
4
Tahap Design
5
Praproses Data
6
Pembuatan Data Warehouse, Uji Query, dan Data Warehouse Final
7
Spesifikasi Perangkat Lunak
8
HASIL DAN PEMBAHASAN
8
Analisis
Tahap Design
8
10
Design Konseptual
10
Design Logika
11
Design Fisik
13
Praproses Data
14
Pembuatan Data Warehouse dan Uji Query
17
SIMPULAN DAN SARAN
21
Simpulan
21
Saran
21
DAFTAR PUSTAKA
21
LAMPIRAN
22
RIWAYAT HIDUP
27
3
DAFTAR TABEL
1
2
3
4
5
6
7
Tahap metode penelitian dan hasil
Data pegawai aktif
Contoh data pendidikan pegawai
Daftar fakta dan dimensi
Sumber pembentukan DW_FactBiodataPegawai
Daftar generalisasi pendidikan
Target penelitian dan grafik hasil
2
9
10
11
14
16
17
DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
Tahapan metode penelitian
Arsitektur three-tier
Skema galaksi SimpegIPB
Diagram DW_FactBiodataPegawai
Diagram DW_FactPendidikan
Diagram DW_FactPendidikanTime
Diagram Integrasi DW_FactBiodataPegawai, DW_FactPendidikan,
dan DW_FactPendidikanTime
Grafik jumlah pegawai aktif berdasarkan pendidikan untuk setiap
fakultas
Grafik jumlah pegawai aktif berdasarkan kategori usia
untuk setiap fakultas
Grafik jumlah pegawai aktif berdasarkan pendidikan
pada setiap tahun
Grafik persentase dosen berdasarkan tingkat
pendidikan
Grafik persentase tenaga kependidikan berdasarkan
tingkat pendidikan
Grafik persentase dosen berdasarkan jabatan
3
5
11
12
12
13
13
18
18
19
19
20
20
DAFTAR LAMPIRAN
1
2
3
4
Tabel fakta dan dimensi
Staging riwayat pendidikan pegawai generalisasi kode
Staging riwayat pendidikan pegawai use
Contoh data yang siap dimuat
22
24
25
26
PENDAHULUAN
Latar Belakang
Institut Pertanian Bogor (IPB) sebagai institusi pendidikan nasional
membutuhkan pegawai yang mampu mendukung berlangsungnya proses
pendidikan. Setiap bagian dari IPB, mulai dari fakultas hingga departemen
membutuhkan pegawai dengan jumlah dan standar yang berbeda. Dengan adanya
pegawai yang berkualitas dan sesuai dengan kebutuhan, proses pendidikan di IPB
akan berjalan dengan baik. Untuk itu, proses rekrutmen pegawai harus berjalan
maksimal dengan hasil analisis data kepegawaian yang diperoleh dari setiap
bagian di IPB.
Analisis data adalah tahap pengambilan informasi dari data yang ada.
Hingga saat ini, proses rekrutmen pegawai belum berjalan dengan maksimal
karena proses analisis data pegawai belum berjalan dengan baik. Perkembangan
teknologi memperkenalkan data warehouse dan aplikasi OLAP sebagai salah satu
solusi dari permasalahan terkait analisis data. Adanya data warehouse dan
aplikasi OLAP akan membantu pihak-pihak yang berperan dalam proses
pengambilan keputusan rekrutmen pegawai dalam menentukan pegawai yang
benar-benar dibutuhkan oleh IPB.
Pada penelitian kali ini, analisis difokuskan berdasarkan beberapa kategori
seperti tingkat pendidikan dan usia pegawai. Jumlah pegawai yang ada di IPB,
baik dengan status dosen ataupun tenaga kependidikan lainnya memiliki kondisi
yang beragam dan penting untuk diketahui sebagai rekomendasi penetapan
keputusan terkait rekrutmen seperti yang telah disebutkan sebelumnya. Pihakpihak yang berperan sebagai pengambil kebijakan rekrutmen membutuhkan
informasi yang jelas tentang kondisi pegawai yang ada untuk dapat memenuhi
kebutuhan dari bagian-bagian yang ada. Bukan hanya berdasarkan jumlah
pegawai secara keseluruhan, akan tetapi jumlah pegawai dari masing-masing
bagian dengan spesifikasi kebutuhan seperti jumlah pegawai dengan kategori usia
tertentu untuk tiap fakultas dan departemen.
Bila dianalisis lebih lanjut, kategori usia merupakan aspek penting yang
harus diperhatikan oleh pihak-pihak pengambil keputusan atau kebijakan
rekrutmen. Jika jumlah pegawai dengan kategori usia mendekati pensiun banyak
untuk sebuah fakultas, maka perlu dipersiapkan pegawai pengganti sebagai
langkah antisipasi kurangnya pegawai dari fakultas tersebut. Tidak hanya sebatas
penambahan jumlah pegawai, tapi spesifikasi kebutuhan pegawai juga harus
diperhatikan, seperti tingkat pendidikan pegawai dan jabatan pegawai. Untuk itu,
pengembangan data warehouse dan OLAP untuk data kepegawaian IPB sangatlah
diperlukan agar kuantitas dan kualitas pegawai dapat benar-benar menunjang
sistem kependidikan di IPB dengan maksimal.
Tujuan Penelitian
Tujuan dari penelitian ini adalah membangun data warehouse dan aplikasi
OLAP untuk data kepegawaian IPB.
2
Ruang Lingkup Penelitian
Ruang lingkup penelitian hanya difokuskan pada pembangunan data
warehouse dan aplikasi OLAP. Data yang digunakan adalah data kepegawaian
IPB dan pembangunan aplikasi dilakukan dengan SQL Server 2008 R2.
METODE
Data warehouse merupakan ruang penyimpanan atau arsip informasi yang
dikumpulkan dari berbagai sumber dan disimpan dengan sebuah skema
terintegrasi pada satu tempat. Data atau informasi tersebut tersimpan dalam jangka
waktu yang lama sehingga memungkinkan pengguna menciptakan query untuk
proses pengambilan keputusan dengan lebih mudah. Dengan mengakses informasi
dari data warehouse, proses transaksi online tidak terganggu oleh beban kerja
proses pengambilan keputusan (Han dan Kamber 2006).
Keuntungan yang didapat jika menggunakan data warehouse antara lain
(Connolly dan Begg 2002):
Menghasilkan keuntungan yang kompetitif dengan cara memperbolehkan
pembuat keputusan mengakses data yang dapat memunculkan informasi yang
sebelumnya tidak ada, tidak diketahui, dan tidak digunakan.
Meningkatkan produktivitas para pembuat keputusan dengan cara
menciptakan basis data terintegrasi yang terdiri atas data historis yang
konsisten dan berorientasi subjek.
Tujuan utama dari pembuatan data warehouse ialah menyatukan beragam
data di dalam sebuah tempat penyimpanan sehingga pengguna dapat dengan
mudah menjalankan query, menghasilkan laporan, dan melakukan analisis
terhadap data yang ada.
Metode yang digunakan untuk mengembangkan data warehouse pada
penelitian ini dapat dilihat pada Gambar 1, sedangkan hasil dari tahapan metode
penelitian yang dilakukan dapat dilihat pada Tabel 1.
Tabel 1 Tahap metode penelitian dan hasil
Tahap Metode Penelitian
Hasil
Analisis
Target pengembangan sistem.
Design
Konseptual
Terbentuk tabel fakta, tabel dimensi, dan
measure
Logika
Terbentuk detail variable data dan
integrasi tiap tabel
Fisik
Implementasi rancangan di dalam DBMS
Praproses
Pembersihan Data
Data yang siap digunakan pada sistem
Data
data warehouse yang dibuat
Integrasi Data
Transformasi Data
Pemuatan Data
Pembuatan Data Warehouse
Data Warehouse dan Aplikasi OLAP
Kepegawaian IPB
Uji Query
Data Warehouse Final
3
Tahap Design
Design
Konseptual
Design Logika
Design Fisik
Uji Query
Data Warehouse
Final
Gambar 1 Tahapan metode penelitian
4
Analisis
Pengembangan data warehouse dilakukan dengan perancangan database
yang jelas. Tahap pertama adalah analisis spesifikasi kebutuhan yang terdiri atas
pengumpulan kebutuhan dari permintaan pengguna ke dalam spesifikasi koheren
dan ringkas. Sejak data warehouse ditujukan untuk mendukung proses
pengambilan keputusan, tahapan yang digunakan dalam desain database
konvensional juga telah diadopsi untuk mengembangkan data warehouse
(Malinowski dan Zim’anyi 2008).
Data warehouse dibangun untuk mengatasi masalah teknis dan bisnis yang
berkaitan dengan pembangunan data dan informasi untuk mengambil keputusan.
Secara rinci dijelaskan oleh Inmon (1993) bahwa data warehouse mempunyai
empat karakteristik, yaitu:
Subject Oriented Data
Data Warehouse diorganisasikan meliputi subjek utama dari enterprise
(misal: customer, product, sales) alih-alih area aplikasi utama (misal:
customer invoicing, stock control, product sales). Hal ini direfleksikan dalam
kebutuhan untuk menyimpan data pendukung keputusan alih-alih data
berorientasi aplikasi.
Integrasi Data
Data warehouse menggabungkan data berorientasi aplikasi dari sistem
sumber yang berbeda, yang sering menyertakan data yang tidak konsisten.
Data sumber yang terintegrasi harus dibuat menjadi konsisten untuk
merepresentasikan tampilan data yang terpadu ke pengguna.
Time Variant Data
Data pada warehouse akan menjadi akurat dan valid pada beberapa saat atau
beberapa interval waktu. Time variance menampilkan perpanjangan waktu
dari data yang ada secara implisit atau eksplisit. Selain itu, time variant juga
menampilkan keterhubungan antara waktu dengan keseluruhan data dan
kenyataan bahwa data merepresentasikan serangkaian kejadian.
Non Volatile Data
Data pada warehouse tidak di-update secara real time tetapi di-refresh dari
sistem operasional dalam basis reguler. Data baru selalu ditambahkan sebagai
tambahan pada basis data, alih-alih menggantikan data sebelumnya.
Menurut Han dan Kamber (2006), data warehouse pada umumnya
mengadopsi arsitektur three-tier, seperti digambarkan pada Gambar 2. Lapisanlapisan arsitektur data warehousing tersebut adalah:
1 Lapisan bawah (bottom tier)
Lapisan bawah adalah server data warehouse yang biasanya sebuah sistem
database relasional. Pada lapisan ini data diambil dari database operasional
dan sumber eksternal lainnya, diekstrak, dibersihkan, dan ditransformasikan.
Data disimpan sebagai data warehouse.
2 Lapisan tengah (middle tlier)
Lapisan tengah OLAP server yang biasanya diimplementasikan dengan
OLAP relasional (ROLAP) atau OLAP Multidimensional (MOLAP).
5
Lapisan atas (top tier)
Lapisan atas adalah lapisan front-end client, berisi query dan perangkat
analisis, dan atau perangkat data mining (misalnya: analisis tren, prediksi, dan
lainnya).
Selama proses pengumpulan informasi, analisis kebutuhan pengguna di
berbagai tingkat manajemen diwawancara untuk mengetahui analisis kebutuhan
yang dibutuhkan (Malinowski dan Zim’anyi 2008). Tahap analisis ini juga
ditujukan untuk mengetahui karakteristik dari masing-masing data yang diketahui,
sehingga memudahkan dalam penentuan desain data warehouse yang akan
dirancang.
3
Gambar 2 Arsitektur three-tier
Tahap Design
Tahap berikutnya yaitu desain konseptual, desain logis, dan desain fisik
yang merupakan hasil penerjemahaan dari kebutuhan pengguna. Spesifikasi yang
diperoleh berfungsi sebagai dasar untuk membuat sebuah skema database sesuai
dengan permintaan pengguna. Pembentukan skema dari hasil analisis yang
diperoleh merupakan tahapan design konseptual. Tahapan ini terkait dengan
pembuatan data warehouse yang didasarkan pada model data multidimensi.
Model ini menampilkan data dalam bentuk kubus. Model data multidimensi
terdiri atas dimensi (dimensions) dan fakta (facts) (Han dan Kamber 2006).
Dimensi adalah perspektif atau entitas penting yang dimiliki oleh
organisasi. Setiap dimensi mungkin memiliki satu tabel yang berasosiasi
dengannya yang disebut dengan tabel dimensi yang mendeskripsikan tabel itu
sendiri. Dimensi akan berubah jika analisis kebutuhan pengguna berubah.
Dimensi mendefinisikan label yang membentuk isi laporan. Tabel dimensi
berukuran lebih kecil daripada tabel fakta dan berisi data tidak numerik. Pada data
warehouse, kubus data merupakan kubus dengan n-dimensi.
6
Fakta adalah ukuran-ukuran numerik merupakan kuantitas yang akan
dianalisis hubungan antar-dimensinya. Tabel fakta berisi nama-nama fakta
(ukuran) dan key dari tabel-tabel dimensi yang berelasi dengan tabel fakta itu.
Data fakta diekstrak dari berbagai sumber. Data fakta cenderung stabil dan tidak
berubah seiring waktu. Tabel fakta berukuran besar dan memiliki jumlah baris
sesuai dengan jumlah kombinasi nilai dimensi yang mungkin dan jumlah kolom
sesuai dengan jumlah dimensi yang direpresentasikan.
Kubus data disebut juga cuboid, dan berasal dari banyak dimensi. Potongan
cuboid yang lebih kecil dapat dibuat dengan mengambil sebagian dimensi dari
sebuah cuboid besar. Potongan cuboid memiliki tingkat yang lebih tinggi (besar
nilainya) dari cuboid asalnya. Kubus data tersebut memiliki dimensi time, item,
dan location. Skema basis data berisi kumpulan enititas dan hubungan
antarentitas. Sebuah data warehouse memerlukan skema yang ringkas dan
berorientasi subjek yang dapat digunakan dalam analisis data on-line. Tipe-tipe
skema model data multidimensi adalah:
Skema Bintang (Star Schema)
Skema bintang adalah skema data warehouse yang paling sederhana. Skema
ini disebut skema bintang karena hubungan antartabel dimensi dan tabel fakta
menyerupai bintang, yaitu satu tabel fakta dihubungkan dengan beberapa
tabel dimensi. Titik tengah skema bintang adalah satu tabel fakta besar dan
sudut-sudutnya adalah tabel-tabel dimensi. Keuntungan yang didapat jika
menggunakan skema ini adalah peningkatan kinerja data warehouse,
pemrosesan query yang lebih efisien, dan waktu respon yang cepat.
Skema Snowflake (Snowflake Schema)
Skema snowflake adalah variasi dari skema bintang dengan beberapa tabel
dimensi dinormalisasi, sehingga dihasilkan beberapa tabel tambahan.
Keuntungan yang didapat dengan menggunakan skema ini adalah
penghematan memory, namun waktu yang dibutuhkan untuk pemrosesan
query menjadi lebih lama.
Skema Galaksi (Fact Constellation)
Pada skema galaksi beberapa tabel fakta berbagi tabel dimensi. Keuntungan
menggunakan skema ini adalah menghemat memory dan mengurangi
kesalahan yang mungkin terjadi.
Proses selanjutnya adalah design logika. Pada tahapan ini, konsep yang ada
dibuat lebih detail dengan menambahkan variabel dan menentukan key dari
masing-masing tabel yang ada di dalam rancangan konseptual. Logika yang telah
tersusun kemudian diimplementasikan langsung ke dalam DBMS di tahap design
fisik. Setelah itu, desain fisik disimpan pada Database Management System
(DBMS).
Praproses Data
Tahapan berikutnya adalah praproses data. Pada tahap ini, data yang ada
diolah dengan perlakuan untuk dapat menghasilkan komposisi data yang sesuai
dengan design yang ada. Sumber data terdiri atas dua database, yaitu
StaggingSimpegIPB dan SDM. Dari kedua database tersebut, tidak semua data
digunakan, tetapi hanya yang sesuai dengan hasil analisis dan design yang akan
7
diperlukan. Untuk itu, tahap praproses data menjadi penting untuk dilakukan.
Pembersihan data adalah proses memilih data-data yang dibutuhkan, baik tabel
ataupun hanya variabel. Setelah itu, data yang telah dipilih diintegrasikan untuk
membentuk rancangan data yang diinginkan. Transformasi kemudian dilakukan
untuk data butuh penyeragaman format. Setelah data siap diolah ke dalam
warehouse, maka data dimuat ke dalam sistem.
Penjelasan lain terkait tahap ini dituliskan Malinowski dan Zim’anyi (2008).
Beberapa pengalaman menunjukan bahwa pengembangan data warehouse sistem
berbeda secara signifikan dari pengembangan database konvensional. Oleh karena
itu, modifikasi terhadap metode yang dijelaskan di atas sangat penting. Sebagai
contoh, tidak seperti database konvensional, data di data warehouse diekstrak
dari beberapa sumber. Akibatnya, beberapa pendekatan untuk desain data
warehouse tidak hanya mempertimbangkan kebutuhan pengguna tetapi juga
ketersediaan data. Dalam banyak kasus, data diambil dari sumber yang berbeda
sehingga harus ditransformasikan sebelum dimasukan ke dalam data warehouse.
Hal ini merupakan salah satu yang perlu dipertimbangkan selama penyusunan
desain proses ekstraksi, transformasi, dan loading (ETL). Di sisi lain, belum ada
metode yang sesuai untuk merancang database spasial atau temporal.
Pembuatan Data Warehouse, Uji Query, dan Data Warehouse Final
Setelah data dimuat ke dalam sistem tabel-tabel yang telah dirancang, maka
aplikasi pun dibuat dengan membentuk cube dan memproses cube tersebut. Uji
query dilakukan dengan melihat kesesuaian hasil dari OLAP yang telah dibuat
dengan query yang menyusunnya. Jika uji query berhasil, maka data warehouse
final terbentuk, jika query gagal maka proses akan kembali mengarah pada
pembuatan data warehouse kembali.
Online Analytical Processing (OLAP) terdiri atas seperangkat tool untuk
membantu proses analisis dan perbandingan data dalam database. Tool dan
metode OLAP membantu pengguna menganalisis data pada sebuah data
warehouse dengan menyediakan berbagai tampilan data, dan didukung dengan
representasi data grafik yang dinamis (Han dan Kamber 2006).
Teknologi yang digunakan pada penelitian kali ini adalah SQL Server 2008
R2. SQL Server dipilih dengan beberapa alasan, yaitu teknologi ini adalah
teknologi yang digunakan oleh IPB, sehingga diharapkan dengan penggunaan
SQL Server akan mudah mengintegrasikan penelitian dengan sistem yang
berjalan. Selain itu, data yang tersedia juga dapat diproses oleh teknologi ini,
sehingga memudahkan untuk melakukan pengolahan data.
SQL Server adalah server basis data yang secara fungsional merupakan
proses atau aplikasi yang menyediakan layanan basis data. Client berinteraksi
dengan layanan basis data melalui antarmuka komunikasi tertentu yang bertujuan
untuk pengendalian dan keamanan. Client tidak mempunya akses langsung ke
data, tetapi selalu berkomunikasi dengan server basis data. (Marcus et al. 2004).
SQL Server menggunakan tipe dari database yang disebut database
relasional. Database relasional adalah database yang digunakan sebuah data
untuk mengatur atau mengorganisasikan ke dalam tabel. Tabel-tabel adalah alat
bantu untuk mengatur atau mengelompokan data mengenai subyek yang sama dan
8
mengandung informasi dan kolom dan baris. Tabel-tabel saling berhubungan
dengan mesin database ketika dibutuhkan.
SQL Server mendukung beberapa tipe data yang berbeda, termasuk untuk
karakter, angka, tanggal (datetime), dan uang (money). SQL Server digunakan
untuk
menggambarkan
model
dan
implementasi
pada
database.
Keuntungan menggunakan SQL Server dapat didefinisikan menjadi dua bagian
yaitu satu bagian untuk menjalankan pada server dan bagian lain untuk client.
Keuntungan Client antara lain:
Mudah digunakan.
Mendukung berbagai perangka keras.
Mendukung berbagai aplikasi perangkat lunak.
Biasa untuk digunakan
Sementara itu keuntungan Server antara lain:
Dapat diandalkan (Reliable)
Toleransi kesalahan (Fault Tolerant)
Konkurensi (Concurrent)
Performa tinggi dalam perangkat keras (High-performance Hardware)
Pengendalian terpusat (Centralized Control)
Penguncian yang canggih (Sophisticated Locking).
Spesifikasi Perangkat Keras dan Perangkat Lunak
Aplikasi ini dikembangkan dengan menggunakan perangkat keras:
Processor Intel(R) Core(TM) 2 Duo CPU T6500 @ 2.10 GHz (2 CPUs), 3 GB
Memory, Harddisk 320 GB , Mouse dan Keyboard , Monitor 14.1” dengan
resolusi 1024 x 768 pixels, VGA ATI Radeon HD 3400 Series. Sementara itu
perangkat lunak yang digunakan adalah Sistem Operasi Microsoft Windows 7
Ultimate 32-bit (6.1, Build 7600) dan SQL Server 2008 R2.
HASIL DAN PEMBAHASAN
Analisis
Analisis yang dilakukan melingkupi analisis kebutuhan sistem dan analisis
data yang ada. Analisis dimulai dari analisis karakteristik data warehouse yang
terdiri atas subject oriented data, integrasi data, time variant data, dan non
volatile data. Data warehouse yang dikembangkan berorientasi pada subject
pegawai. Data merupakan integrasi dari database SDM dengan database
StagingSimpegIPB. Data yang digunakan adalah data dari tahun pertama hingga
tahun 2012 dan bukan dalam bentuk rael time.
Berdasarkan arsitektur three-tier, lapisan bawah pada penelitian ini
dikerjakan di dalam SQL Server 2008 R2, tepatnya pada bagian SQL Server
Integration Service (SSIS). Lapisan tengah menggunakan SQL Server Analysis
Service (SSAS), dan lapisan atas menggunakan Microsoft Office Excel 2010.
Analisis kebutuhan sistem menghasilkan enam target dari dibangunnya data
9
warehouse dan aplikasi OLAP Kepegawaian IPB. Keenam target diperoleh dari
hasil diskusi dengan pihak Direktorat Komunikasi dan Sistem Informasi (DKSI)
IPB dan Key Performance Indicators (KPI) IPB yang terkait dengan kepegawaian.
Target pertama adalah mengetahui jumlah pegawai aktif berdasarkan tingkat
pendidikan untuk tiap fakultas dan departemen. Dari contoh data pada Tabel 2,
target ini akan membantu memahami data, contohnya jumlah pegawai aktif
dengan pendidikan S1 untuk Fakultas Ekologi Manusia adalah 2 orang dan jumlah
pegawai aktif dengan pendidikan S1 untuk Departemen Gizi Masyarakat adalah 1
orang.
Nama
Fengky
Satria
Yoresta
Lindawati
Kartika
Azis Boing
Sitanggang
Karina
Rahmadia
Ekawidyani
Noerhayati
Rofiah
Tabel 2 Data pegawai aktif
Kategori
Usia
Pendidikan Tahun
Departemen
Usia
26
26-30
S2
2010
Hasil Hutan
Tahun
27
26-30
Tahun
26-30
Tahun
S2
2009
Manajemen
S2
2010
27
26-30
Tahun
S1
2008
Ilmu dan
Teknologi
Pangan
Gizi
Masyarakat
28
26-30
Tahun
S1
2008
27
Fakultas
Kehutanan
Ekonomi dan
Manajemen
Teknologi
Pertanian
Ekologi
Manusia
Ilmu
Ekologi
Keluarga dan Manusia
Konsumen
Target kedua adalah mengetahui jumlah pegawai aktif pada rentang usia
tertentu untuk tiap departemen dan fakultas. Target ini akan membantu pengguna
memahami data, misalnya jumlah pegawai aktif dengan kategori usia 26-30 tahun
untuk Departemen Ilmu dan Teknologi Pangan adalah 1 orang dan jumlah
pegawai aktif dengan kategori usia 26-30 tahun untuk Fakultas Ekologi Manusia
adalah 2 orang.
Mengetahui jumlah pegawai dengan pendidikan pada tahun tertentu adalah
target ketiga dari pembangunan data warehouse dan aplikasi OLAP ini. Misalkan
ada data seperti Tabel 2, target ditujukan untuk membantu pengguna memahami
data, misalnya jumlah pegawai dengan pendidikan S1 pada tahun 2005 adalah 1
orang dan jumlah pegawai dengan pendidikan S1 pada tahun 2006 adalah 2 orang.
Data pegawai dengan pendidikan S1 bertambah pada tahun 2006 dan dengan
begitu maka jumlah pegawai dengan pendidikan D3 pada tahun 2006 adalah 0,
karena B telah terhitung sebagai pegawai dengan pendidikan S1 pada tahun 2006.
Target keempat adalah mengetahui persentase dosen yang bergelar doktor
(S3). Melihat contoh data yang ada pada Tabel 3, target ini ditujukan untuk dapat
memahami data, misalnya persentase dosen dengan pendidikan S3 untuk data
terakhir dari kependidikan pegawai adalah 1 dari 2 orang, atau sama dengan
setengah dari jumlah dosen yang ada.
10
Tabel 3 Contoh data pendidikan pegawai
Nama Pendidikan TahunP
Status Pegawai
Jabatan
A
S1
2004 Dosen
Staff Pengajar
A
S2
2007 Dosen
Staff Pengajar
B
D3
2002 TenagaKependidikan
Pustakawan Pratama
B
S1
2006 TenagaKependidikan
Pustakawan Pratama
C
S2
2003 Dosen
Guru Besar
C
S3
2005 Dosen
Guru Besar
D
D3
2005 Tenaga Kependidikan Pustakawan Pratama
D
S1
2006 Tenaga Kependidikan Pustakawan Pratama
E
S1
2001 Dosen
Staff Pengajar
E
S2
2005 Dosen
Staff Pengajar
E
S3
2007 Dosen
Staff Pengajar
Target kelima adalah mengetahui persentase pegawai dengan pendidikan
terakhir minimal D3. Dari data pada Tabel 2, OLAP ditujukan untuk membantu
memahami data, misalnya persentase tenaga kependidikan dengan pendidikan
terkhir D3 adalah sebanyak 3 dari 3 orang, atau sama dengan seluruh dari jumlah
dosen yang ada.
Target keenam dari pembagunan data warehouse dan aplikasi OLAP pada
penelitian ini adalah mengetahui persentase dosen dengan jabatan guru besar.
OLAP dapat membantu memahami data, misalnya persentase dosen dengan
jabatan guru besar adalah sebanyak 1 dari 2 orang, atau sama dengan setengah
dari jumlah dosen yang ada.
Tahap Design
Tahap design terdiri atas design konseptual, design logika, dan design fisik.
Berikut pembahasan masing-masing hasil tahapan design.
Design Konseptual
Design konseptual seperti yang telah dijelaskan pada bagian metode bahwa
tahapan ini menghasilkan rancangan skema secara umum. Skema yang dibentuk
merupakan skema galaksi dengan tiga tabel fakta dan 10 tabel dimensi seperti
dirinci pada Tabel 4.
Tabel DW_FactBiodataPegawai merupakan tabel fakta yang dibentuk
dengan tujuan untuk memenuhi target pertama, kedua, keempat, dan keenam dari
rincian target yang telah disebutkan pada bagian analisis. Target ketiga difokuskan
pada tabel DW_FactPendidikanTime, dan target kelima dengan tabel
DW_FactPendidikan. Skema yang digunakan dalam penelitian ini adalah skema
galaksi yang dapat dilihat pada Gambar 3.
11
No
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
Tabel 4 Daftar fakta dan dimensi
Dimensi
Fakta
DW_FactBiodataPegawai
DW_DimDepartemen
DW_DimKategoriUsia
DW_DimStatusPekerjaan
DW_DimStatusPegawai
DW_DimPendidikan
DW_DimTahunPendidikan
DW_DimJabatan
DW_FactPendidikan
DW_DimPendidikan
DW_DimKategoriUsia
DW_DimStatusPekerjaan
DW_DimStatusPegawai
DW_DimUniversitas
DW_DimBidangIlmu
DW_DimTahunPendidikan
DW_DimDepartemen
DW_FactPendidikanTime
DW_DimTime
DW_DimPendidikan
Measure
JumlahPegawai
JumlahPegawai
JumlahPegawai
Gambar 3 Skema galaksi SimpegIPB
Design Logika
Design logika merupakan pemetaan model data yang telah dirancang pada
tahap sebelumnya. Detail skema dari masing-masing fakta ditunjukkan pada
Gambar 4 untuk DW_FactBiodataPegawai, Gambar 5 untuk DW_FactPendidikan,
Gambar 6 untuk DW_FactPendidikanTime, dan Gambar 7 Integrasi
DW_FactBiodataPegawai, DW_FactPendidikan, dan DW_FactPendidikanTime.
12
Gambar 4 Diagram DW_FactBiodataPegawai
Gambar 5 Diagram DW_FactPendidikan
13
Gambar 6 Diagram DW_FactPendidikanTime
Gambar 7 Diagram Integrasi DW_FactBiodataPegawai, DW_FactPendidikan, dan
DW_FactPendidikanTime
Design Fisik
Design fisik kemudian dilakukan dengan membentuk semua rancangan ini
di dalam DBMS (SQL Server 2008 R2). Tahap ini membentuk database dan
table-tabel penyusunnya untuk mempersiapkan praproses data. Tabel fakta dan
dimensi yang dibentuk beserta tipe datanya dapat dilihat pada Lampiran 1.
14
Praproses Data
Tahap praproses data terdiri dari integrasi, pembersihan, transformasi, dan
pemuatan data. Tahapan ini dibahas berdasarkan tabel fakta yang terbentuk dan
data source yang digunakan. Tabel fakta DW_FactBiodataPegawai dibentuk dari
database StagingSimpegIPB dengan tabel Stg_TrsBiodata. Sumber pembentukan
tabel DW_FactBiodataPegawai dijelaskan pada Tabel 5 berikut ini.
Tabel 5 Sumber pembentukan DW_FactBiodataPegawai
Tabel yang Digunakan
Database Source
Field yang Digunakan
Simpeg IPB
SimpegIPB.dbo.Staging Riwayat KodePendidikan,
Pendidikan PegawaiUse
Tahun
SimpegIPB.dbo.Staging
FakDeptTest
sdm
Fakultas, Departemen
SimpegIPB. dbo.Staging Biodata NIP,
KategoriUsia,
Pegawai
StatusPekerjaan
sdm.dbo. tBiodata
StatusPegawai
Dalam proses pembentukan tabel DW_FactBiodataPegawai, dilakukan
tahapan praproses data yang dimulai dari pembentukan tabel-tabel sumbernya.
Tabel DW_FactBiodataPegawai terdiri dari dimensi DimDepartemen,
DimStatusPegawai, DimStatusPekerjaan, DimJabatan, DimTahunPendidikan,
DimPendidikan, dan DimKategoriUsia. Data yang dibutuhkan disimpan terlebih
dahulu di dalam tabel Stg_TrsBiodata. Pembersihan dan integrasi dilakukan untuk
dapat membentuk tabel Stg_TrsBiodata. Pengolahan data pertama ditujukan untuk
mendapatkan field KodePendidikan dan TahunPendidikan yang kemudian akan
dijadikan rujukan dalam pembentukan DimTahunPendidikan dan DimPendidikan.
Integrasi data terjadi antara tabel TrsRiwayatPendidikan dan tabel MstPendidikan
untuk membentuk tabel Staging RiwayatPendidikanPegawaiGeneralisasiKode.
Query SQL yang digunakan adalah
select a.[NIP]
,a.[Universitas]
,a.[BidangIlmu]
,a.[TahunPendidikan]
,b.KodePendidikan,
CASE a.Pendidikan when 'SD' THEN 'SD'
WHEN 'SLTP' THEN 'SLTP'
WHEN 'SLTA Paket C' THEN 'SLTA Paket C'
WHEN 'SPP' THEN 'SMA'
WHEN 'KPAA' THEN 'SMA'
WHEN 'SMT' THEN 'SMA'
WHEN 'Madrasah Aliyah' THEN 'SMA'
WHEN 'MAN' THEN 'SMA'
WHEN 'SMU' THEN 'SMA'
WHEN 'SMA' THEN 'SMA'
WHEN 'SLTA' THEN 'SMA'
WHEN 'SMEA' THEN 'SMA'
WHEN 'SMA' THEN 'SMA'
15
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
'SMAK' THEN 'SMK'
'SMKK' THEN 'SMK'
'SLTA Kejuruan' THEN 'SMK'
'STM' THEN 'SMK'
'SMK' THEN 'SMK'
'D1' THEN 'D1'
'D2' THEN 'D2'
'Sarjana Muda' THEN 'D3'
'D3' THEN 'D3'
'S1' THEN 'S1'
'S2' THEN 'S2'
'S3' THEN 'S3'
END as 'PendidikanPegawai'
FROM
[StagingSimpegIPB].[dbo].[Stg_TrsRiwayatPendidikan] a
inner join StagingSimpegIPB.dbo.Stg_MstPendidikan b
on a.pendidikan = b.pendidikan
order by PendidikanPegawai.
Hasil tabel Staging RiwayatPendidikanPegawaiGeneralisasiKode dapat
dilihat pada Lampiran 2. Sesuai dengan namanya, table ini merupakan table yang
ditujukan untuk memunculkan hasil dari generalisasi KodePendidikan.
Transformasi data dilakukan pada bagian KodePendidikan yang digeneralisasi
yang dapat dilihat pada Tabel 6.
Setelah generalisasi KodePendidikan terbentuk, dipilih data dengan tingkat
pendidikan yang tertinggi. Data pegawai dengan tingkat pendidikan tertinggi
untuk
masing-masing
individu
disimpan
di
dalam
tabel
StagingRiwayatPendidikanPegawaiUse. Query SQL yang digunakan adalah
select NIP, KodePendidikan, Pendidikan, Universitas,
BidangIlmu, Tahun from (
select NIP, KodePendidikan, Pendidikan, Universitas,
BidangIlmu, Tahun,
row_number() over (partition by NIP order by
KodePendidikan desc) AS recid
from
[SimpegIPB].[dbo].[StaggingRiwayatPendidikanPegawaiGene
ralisasiKode]
) AS f where recid = 1 order by KodePendidikan. Tabel
Staging Riwayat Pendidikan Pegawai Use.
Hasil query dapat dilihat pada Lampiran 3.
16
Tabel 6 Daftar generalisasi pendidikan
Daftar Generalisasi Pendidikan
Sebelum Generalisasi
Setelah Generalisasi
SD
SD
SLTP
SLTP
SLTA Paket C
SLTA Paket C
SMA
SPP
SMA
KPAA
SMA
SMT
SMA
SMEA
SMA
Madrasah Aliyah
SMA
MAN
SMA
SMU
SMA
SLTA
SMK
SMKK
SMK
SMAK
SMK
SLTA Kejuruan
SMK
STM
D1
D1
D2
D2
Sarjana Muda
D3
S1
S1
S2
S2
S3
S3
SimpegIPB.dbo.StagingFakDeptTest dibentuk dari sdm.dbo.tMutasi dengan
mengambil kolom NIP, unitKerja, dan bagian dengan filter pada kolom AktifUnit
= 1 dan unitKerja tidak sama dengan ' '. Data Departemen dan Fakultas
merupakan tujuan dibentuknya StagingFakDeptTest tersebut. Setelah keempat
tabel dari dua database tersebut siap, maka data dimuat untuk membentuk
Stg_TrsBiodata dan FactBiodataPegawai.
DW_FactPendidikan dibentuk dari hasil join Staging Simpeg IPB .dbo.
TrsRiwayatPendidikan dengan StagingSimpegIPB.dbo.TrsBiodata. Fakta terakhir
adalah DW_FactPendidikanTime yang merupakan hasil pemrosesan dari
StagingSimpegIPB.dbo.TrsRiwayatPendidikan. Penelitian ini memfokuskan pada
tingkat pendidikan D1 hingga S3. Tabel FactPendidikanTime berisi data NIP dan
daftar tahun beserta tingkat pendidikan pegawai pada tahun tersebut. Daftar tahun
pendidikan ini merupakan hasil dari pemrosesan data berdasarkan tahun mulai
pendidikan ditingkat tertentu hingga tahun mulai pendidikan dijenjang setelahnya.
Tahun mulai pendidikan di jenjang yang lebih tinggi tersebut menandakan
berakhirnya status pendidikan pada tingkat pendidikan yang dijalani, sehingga
didapatkan range tahun seorang pegawai berada pada jenjang pendidikan tertentu.
Data yang telah diolah kemudian dimuat kedalam sistem yang sedang
dibangun. Contoh data yang siap diolah dapat dilihat pada Lampiran 4.
17
Pembuatan Data Warehouse dan Uji Query
Pembuatan OLAP dan aplikasi data warehouse dilakukan dengan
menggunakan SQL Server 2008 R2. Proses pembuatan OLAP ini meliputi proses
pembuatan design konseptual yang berupa tabel fakta, dimensi, measure ke dalam
SQL Server 2008 R2 hingga membentuk cube dan menghasilkan keluaran. Uji
query dilakukan dengan membandingkan query yang telah dibuat dengan hasil
yang terbentuk. Dari enam target yang ada, semuanya dapat tercapai. Target dan
hasilnya, didaftarkan jelas pada Tabel 7.
No.
Target
1
2
3
4
5
6
Tabel 7 Target penelitian dan grafik hasil
Deskripsi Target
Mengetahui jumlah pegawai aktif berdasarkan
tingkat pendidikan untuk tiap departemen dan
fakultas.
Mengetahui jumlah pegawai aktif pada rentang usia
tertentu untuk tiap departemen dan fakultas.
Mengetahui jumlah pegawai dengan pendidikan pada
tahun tertentu
Mengetahui persentase dosen yang bergelar doktor.
Mengetahui persentase pegawai dengan pendidikan
terakhir minimal D3.
Mengetahui persentase dosen dengan jabatan guru
besar.
Hasil
Gambar 8
Gambar 9
Gambar 10
Gambar 11
Gambar 12
Gambar 13
Dari Gambar 8, dapat diketahui bahwa jumlah pegawai aktif dengan tingkat
pendidikan S3 tertinggi terdapat pada Fakultas Pertanian. Tingkat pendidikan S2
dan S1 tertinggi terdapat pada Fakultas Matematika dan Ilmu Pengetahuan Alam.
Data ini dapat menjadi pertimbangan bagi pihak terkait untuk meningkatkan
kualitas pendidikan pegawai untuk fakultas-fakultas yang masih rendah jumlah
pegawainya pada tingkat pendidikan tertentu.
Target kedua yang ditunjukkan pada Gambar 9 membantu pihak terkait
dalam mengetahui kondisi kebutuhan SDM dengan melihat usia dari SDM yang
ada. Sebagian contoh pada Fakultas pertanian yang terdata memiliki SDM
kategori usia 51 – 56 tahun tertinggi dibandingkan fakultas yang lain, menjadi
bahan pertimbangan tersendiri untuk segera menambahkan SDM baru dengan usia
dibawahnya. Penetapan system rentang usia ini dimaksudkan untuk
mempermudah pengguna dalam melihat data dan memahami maknanya.
Gambar 10 membantu pengguna untuk melihat perkembangan kualitas
pendidikan SDM yang ada di setiap tahunnya. Dari hasil tersebut terlihat jumlah
SDM S3 semakin meningkat dan jumlah SDM S1 semakin berkurang. Hal ini
membantu pihak terkait dalam proses evaluasi jangka panjang.
Pada Gambar 11, persentase lebih difokuskan pada kategori dosen.
Persentase dosen dengan gelar Doktor atau S3 terdata paling besar, akan tetapi
masih terdapat juga dosen dengan tingkat pendidikan S1 yang masih harus
ditingkatkan ke jenjang yang lebih tinggi. Target selanjutnya dapat dilihat pada
Gambar 12 dengan melihat perbandingan persentase jumlah pegawai dengan
18
tingkat pendidikan D3 ke atas dengan jumlah pegawai dengan tingkat pendidikan
D3 ke bawah. Gambar 13 dapat terlihat persentase dosen dengan jabatan guru
besar dibandingkan dengan lima jabatan dosen lainnya secara fungsional.
Gambar 8 Grafik jumlah pegawai aktif berdasarkan pendidikan untuk setiap
fakultas
Gambar 9 Grafik jumlah pegawai aktif berdasarkan kategori usia untuk setiap
fakultas
19
Gambar 10 Grafik jumlah pegawai aktif berdasarkan pendidikan pada setiap
tahun
Gambar 11 Grafik persentase dosen berdasarkan tingkat pendidikan
20
Gambar 12 Grafik persentase tenaga kependidikan berdasarkan tingkat pendidikan
Gambar 13 Grafik persentase dosen berdasarkan jabatan
21
SIMPULAN DAN SARAN
Simpulan
Penelitian ini menghasilkan aplikasi data warehouse dan OLAP
Kepegawaian IPB dengan satu kubus data yaitu kubus DW_SimpegIPB. Tabel
fakta yang terbentuk yaitu, DW_FactBiodataPegawai, DW_FactPendidikan, dan
DW_FactPendidikanTime. Tabel-tabel fakta tersebut terhubung oleh sepuluh tabel
dimensi,
yaitu
DW_DimKategoriUsia,
DW_DimDepartemen,
DW_DimPendidikan,
DW_DimTime,
DW_DimStatusPekerjaan,
DW_DimStatusPegawai,
DW_DimTahunPendidikan,
DW_DimJabatan,
DW_DimBidangIlmu, dan DW_DimUniversitas. Measure dari kubus data ini
adalah jumlah pegawai. Penyajian gambar dapat dilihat dalam bentuk grafik
batang, pie chart, garis, dan jenis grafik lain yang terdapat dalam Microsoft Excel.
Operasi-operasi OLAP yang digunakan pada kubus data yang dibentuk adalah
roll-up, drill-down, slice, dan dice.
Saran
Saran untuk penelitian data warehouse dan aplikasi OLAP kepegawaian
IPB selanjutnya adalah:
1 Memperluas lingkup target yang dibentuk dengan analisis yang lebih
mendalam tentang keadaan kepegawaian IPB.
2 Meningkatkan kualitas data source, sehingga hasil yang ada merupakan
data yang benar-benar relevan dengan kondisi pegawai IPB.
3 Menyesuaikan tools untuk reporting dengan teknologi yang digunakan
oleh sistem di IPB.
DAFTAR PUSTAKA
Connolly T, Begg C. 2002. Database System: A Practical Approach to Design,
Implementation, and management. Massachusetts (US): Addison Wesley.
Han J, Kamber M. 2006. Data Mining: Concept and Techniques. San Francisco
(US): Morgan Kaufmann.
Inmon WH. 2005. Building The Data Warehouse. Indianapolis (US): Wiley
Publishing.
Malinowski, Zim’anyi. 2008. Advanced Data warehouse Design. Berlin (DE):
Springer.
Marcus T, Prijono A, Widiati J. 2004. Delphi Developer dan SQL Server 2000.
Bandung (ID): Informatika.
22
Lampiran 1 Tabel fakta dan dimensi
Tabel Dimensi bidang ilmu
Column Name
BidangIlmuKey
BidangIlmu
Data Type
int
varchar(50)
Tabel Dimensi departemen
Column Name
Data Type
DeptKey
int
KodeDepartemen
nvarchar(10)
Departemen
nvarchar(100)
KodeFakultas
nvarchar(10)
Fakultas
nvarchar(100)
Tabel Dimensi jabatan
Column Name
Data Type
JabatanKey
int
KodeJabatan
nvarchar(5)
Jabatan
nvarchar(50)
Tabel Dimensi kategori usia
Column Name
Data Type
KategoriUsiaKey
int
KategoriUsia
varchar(20)
Tabel Dimensi pendidikan
Column Name
Data Type
PendidikanKey
int
Pendidikan
varchar(50)
Tabel Dimensi status pegawai
Column Name
Data Type
StatusPegawaiKey
int
KodeStatusPegawai
nvarchar(5)
StatusPegawai
nvarchar(25)
Tabel Dimensi status pekerjaan
Column Name
Data Type
StatusPekerjaanKey
int
StatusPekerjaan
varchar(20)
Tabel Dimensi tahun pendidikan
Column Name
Data Type
TahunPendidikanKey
int
TahunPendidikan
varchar(4)
23
Lanjutan
Tabel Dimensi time
Column Name
Data Type
TimeKey
int
Tanggal
datetime
Tahun
Tabel Dimensi universitas
Column Name
Data Type
UniversitasKey
int
Universitas
varchar(50)
Tabel Fakta biodata pegawai
Column Name
Data Type
JumlahPegawai
int
KategoriUsiaKey
int
StatusPekerjaanKey
int
StatusPegawaiKey
int
PendidikanKey
int
DepartemenKey
int
TahunPendidikanKey
int
JabatanKey
int
Tabel Fakta pendidikan
Column Name
Data Type
JumlahPegawai
int
KategoriUsiaKey
int
StatusPekerjaanKey
int
PendidikanKey
int
UniversitasKey
int
BidangIlmuKey
int
DepartemenKey
int
TahunPendidikanKey
int
StatusPegawaiKey
int
Tabel Fakta pendidikan time
Column Name
Data Type
JumlahPegawai
int
TimeKey
int
PendidikanKey
int
24
24
Lampiran 2 Staging riwayat pendidikan pegawai generalisasi kode
ID
NIP
Kode Pendidikan
Pendidikan
Universitas
3796
130042185
11
S3
810
811
3312
812
3311
813
3309
3797
814
3310
3798
815
3308
3799
3800
816
3307
3801
130075890
130120138
130120138
130128209
130128209
130143845
130143845
130143845
130154833
130154833
130154833
130160307
130160307
130160307
130160323
130160326
130160326
130160326
9
9
10
9
10
9
10
11
9
10
11
9
10
11
11
9
10
11
S1
S1
S2
S1
S2
S1
S2
S3
S1
S2
S3
S1
S2
S3
S3
S1
S2
S3
North Carolina State
Univ.
Universitas Indonesia
Institut Pertanian Bogor
Institut Pertanian Bogor
Universitas Indonesia
University of Kentucky
Universitas Indonesia
University of Toronto
University of Wisconsin
Universitas Indonesia
University of Kentucky
Institut Pertanian Bogor
Institut Pertanian Bogor
University of Georgia
University of Georgia
Institut Pertanian Bogor
Universitas Indonesia
University of Kentucky
Institut Pertanian Bogor
Bidang Ilmu
Tahun
Experimental Statistics
1964
Ilmu Perpustakaan
Teknologi Pertanian
Ilmu Pangan
Pertanian
Botani
Kehutanan
Kehutanan
Plant Pathology
Kedokteran Hewan
Embriologi
Embriologi
Ilmu Tanah
Ilmu Tanah
Ilmu Konservasi Tanah
Biologi
Kedokteran Hewan
Dairy Science
Ilmu Ternak
1976
1973
1979
1961
1963
1958
1970
1974
1960
1966
1975
1961
1963
1965
1979
1960
1964
1981
25
Lampiran 3 Staging riwayat pendidikan pegawai use
NIP
KodePendidikan Pendidikan
Universitas
11
S3
North Carolina State
130042185
Univ.
9
S1
Universitas Indonesia
130075890
10
S2
Institut Pertanian Bogor
130120138
10
S2
University of Kentucky
130128209
11
S3
University of Wisconsin
130143845
11
S3
Institut Pertanian Bogor
130154833
11
S3
University of Georgia
130160307
11
S3
Institut Pertanian Bogor
130160323
11
S3
Institut Pertanian Bogor
130160326
10
S2
Institut Pertanian Bogor
130160331
11
S3
Montana State University
130168635
130176917
11
S3
130176920
130176921
130176923
11
11
11
S3
S3
S3
130176928
130183161
130183165
130183168
9
10
11
11
S1
S2
S3
S3
Oklahoma State
University
Institut Pertanian Bogor
University of Florida
North Carolina State
Univ.
Universitas Indonesia
Michigan State University
University of Wisconsin
University of Wisconsin
BidangIlmu
Experimental Statistics
Tahun
1964
Ilmu Perpustakaan
Ilmu Pangan
Botani
Plant Pathology
Embriologi
Ilmu Konservasi Tanah
Biologi
Ilmu Ternak
Ilmu Pengetahuan Hutan
Applied Economoics &
Econometrica
Entomologi
1976
1979
1963
1974
1975
1965
1979
1981
1988
1974
Ilmu Ternak
Animal Science
Forest Engineering
1981
1972
1972
Kedokteran Hewan
Ilmu Pangan
Entomologi Hasil hutan
Ilmu Nutrisi Ternak
1961
1965
1975
1976
1968
25
26
26
Lampiran 4 Contoh data yang siap dimuat
130801609
Bogor
61
61-65 Tahun
L
Islam
Tenaga
Kependidikan
STG02
Kode
Pendidi
kan
2
130808890
Bogor
61
61-65 Tahun
P
Islam
Tenaga
Kependidikan
STG02
4
1976
G01
G
130809125
Tebing
61
61-65 Tahun
P
Islam
Dosen
STG03
10
1984
F05
F
130813798
Banyuwangi
57
56-60 Tahun
L
Islam
Dosen
STG01
11
2003
E01
E
131278113
Bogor
60
56-60 Tahun
L
Islam
Tenaga
Kependidikan
STG02
4
1971
C00
C
131671606
Bukit
53
51-55 Tahun
L
Islam
Dosen
STG04
11
1995
E02
E
131681401
Magetan
51
51-55 Tahun
L
Islam
Dosen
STG03
11
1998
A03
A
131693600
Bogor
60
56-60 Tahun
L
Islam
Tenaga
Kependidikan
STG02
4
1972
G00
G
131788594
Ambon
50
46-50 Tahun
P
Protestan
Dosen
STG04
10
1990
C04
C
131855679
Ababi,Bali
50
46-50 Tahun
L
Hindu
Dosen
STG01
11
2001
G08
G
131881980
Bogor
51
51-55 Tahun
L
Islam
Tenaga
Kependidikan
STG04
7
1984
A00
A
132084932
Subang
45
41-45 Tahun
L
Islam
Dosen
STG01
11
2004
C02
C
132158757
Jakarta
41
41-45 Tahun
P
Islam
Dosen
STG04
10
2003
G06
G
NIP
TempatLahir
Usia
Kategori
Usia
Jenis
Kelamin
Agama
Status
Pekerjaan
Status
Pegawai
Tahun
Kode
Pendi
Dept
dikan
1969
B03
Kode
Fak
B
27
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 18 November 1989. Penulis
merupakan anak keempat dari pasangan Purwanto dan Nasirah. Pada tahun 2008,
penulis menamatkan pendidikan di SMA Negeri 58 Jakarta. Pada tahun yang
sama, penulis diterima menjadi mahasiswa di Institut Pertanian Bogor (IPB)
melalui jalur Undangan Seleksi Masuk IPB (USMI). Penulis menjadi mahasiswa
di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan
Alam.
Pada bulan Juli hingga Agustus 2011, penulis melaksanakan kegiatan
Praktik Kerja Lapangan di Direktorat Jenderal Hortikultura, Kementerian
Pertanian Republik Indonesia. Selain itu, penulis berkesempatan aktif dalam
organisasi kampus diantaranya, Badan Eksekutif Mahasiswa (BEM) Tingkat
Persiapan Bersama, BEM Fakultas Matematika dan Ilmu Pengetahuan Alam,
Himpunan Mahasiswa Ilmu Komputer dan BEM Keluarga Mahasiswa IPB.
APLIKASI OLAP KEPEGAWAIAN
INSTITUT PERTANIAN BOGOR
SRI RAHAYU
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pembangunan Data
Warehouse dan Aplikasi OLAP Data Kepegawaian Institut Pertanian Bogor
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Desember 2013
Sri Rahayu
NIM G64080059
ABSTRAK
SRI RAHAYU. Pembangunan Data Warehouse dan Aplikasi OLAP
Kepegawaian Institut Pertanian Bogor. Dibimbing oleh HARI AGUNG
ADRIANTO dan FIRMAN ARDIANSYAH
Sistem Kepegawaian IPB saat ini menggunakan SQL Server sebagai
Database Management System (DBMS). Namun, sistem ini belum dilengkapi
dengan aplikasi yang cukup untuk melakukan analisis data kepegawaian.
Penelitian ini bertujuan untuk membangun data warehouse dan aplikasi OLAP
untuk mendukung proses analisis data kepegawaian. Pembangunan data
warehouse dan aplikasi OLAP ini menghasilkan tiga tabel fakta dan 10 tabel
dimensi. Ketiga tabel fakta tersebut adalah DW_FactBiodataPegawai,
DW_FactPendidikan, dan DW_FactPendidikanTime. Sedangkan dimensi yang
dihasilkan
adalah
DW_DimKategoriUsia,
DW_DimStatusPekerjaan,
DW_DimStatusPegawai,
DW_DimPendidikan,
DW_DimTahunPendidikan,
DW_DimJabatan, DW_DimUniversitas, DW_DimBidangIlmu, DW_DimTime,
dan DW_DimDepartemen. Target yang dapat dikerjakan oleh aplikasi ini terdiri
dari enam poin yang meliputi tiga inti penekanan kondisi kepegawaian, yaitu
kategori usia, tingkat pendidikan, dan jabatan pegawai.
Kata kunci: Data warehouse, DBMS, Institut Pertanian Bogor, Kepegawaian,
OLAP, SQL Server
ABSTRACT
SRI RAHAYU. Data Warehouse and OLAP Application Development of Bogor
Agricultural University Employee Data. Supervised by HARI AGUNG
ADRIANTO and FIRMAN ARDIANSYAH.
IPB Employment System currently uses SQL Server as a Database
Management System (DBMS). However, the system do not have sufficient tools
to conduct an optimal employee data analysis. This research aims at developing
data warehouse and OLAP application to support the process of employee data
analysis. Development of data warehouse and OLAP applications produces three
fact tables and ten dimension tables. The three fact tables are
DW_FactBiodataPegawai, DW_FactPendidikan, and DW_FactPendidikanTime,
while the dimension tables are DW_DimKategoriUsia, DW_DimStatusPekerjaan,
DW_DimStatusPegawai,
DW_DimPendidikan,
DW_DimTahunPendidikan,
DW_DimJabatan, DW_DimUniversitas, DW_DimBidangIlmu, DW_DimTime,
and DW_DimDepartemen. There are six targets that can be done by this
application including three core emphases on employment conditions, such as
age, education level, and structural position of the employee.
Keyword: Data warehouse, DBMS, Institut Pertanian Bogor, Kepegawaian,
OLAP, SQL Server
PEMBANGUNAN DATA WAREHOUSE DAN
APLIKASI OLAP KEPEGAWAIAN
INSTITUT PERTANIAN BOGOR
SRI RAHAYU
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
Penguji: Annisa, SKom, MKom
Judul Skripsi : Pembangunan Data Warehouse dan Aplikasi OLAP Kepegawaian
Institut Pertanian Bogor
Nama
: Sri Rahayu
NIM
: G64080059
Disetujui oleh
Hari Agung Adrianto, SKom, MSi
Pembimbing I
Firman Ardiansyah, SKom, MSi
Pembimbing II
Diketahui oleh
Dr Ir Agus Buono, MSi, MKom
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan ke hadirat Allah Subhanahu wa-ta'ala
atas segala rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tugas
akhir dengan judul Pembangunan Data Warehouse dan Aplikasi OLAP Data
Kepegawaian Institut Pertanian Bogor. Penelitian ini dilaksanakan mulai Februari
2013 sampai dengan Agustus 2013 dan bertempat di Departemen Ilmu Komputer
Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada Bapak Hari Agung Adrianto, SKom,
MSi dan Bapak Firman Ardiansyah, SKom, MSi selaku pembimbing. Ungkapan
terima kasih juga disampaikan kepada ayah, ibu, seluruh keluarga, serta temanteman atas segala doa dan kasih sayangnya.
Semoga penelitian ini dapat memberikan manfaat bagi penulis serta pihak
lain yang membutuhkan.
Bogor, Desember 2013
Sri Rahayu
2
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
1
Ruang Lingkup Penelitian
2
METODE
2
Analisis
4
Tahap Design
5
Praproses Data
6
Pembuatan Data Warehouse, Uji Query, dan Data Warehouse Final
7
Spesifikasi Perangkat Lunak
8
HASIL DAN PEMBAHASAN
8
Analisis
Tahap Design
8
10
Design Konseptual
10
Design Logika
11
Design Fisik
13
Praproses Data
14
Pembuatan Data Warehouse dan Uji Query
17
SIMPULAN DAN SARAN
21
Simpulan
21
Saran
21
DAFTAR PUSTAKA
21
LAMPIRAN
22
RIWAYAT HIDUP
27
3
DAFTAR TABEL
1
2
3
4
5
6
7
Tahap metode penelitian dan hasil
Data pegawai aktif
Contoh data pendidikan pegawai
Daftar fakta dan dimensi
Sumber pembentukan DW_FactBiodataPegawai
Daftar generalisasi pendidikan
Target penelitian dan grafik hasil
2
9
10
11
14
16
17
DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
Tahapan metode penelitian
Arsitektur three-tier
Skema galaksi SimpegIPB
Diagram DW_FactBiodataPegawai
Diagram DW_FactPendidikan
Diagram DW_FactPendidikanTime
Diagram Integrasi DW_FactBiodataPegawai, DW_FactPendidikan,
dan DW_FactPendidikanTime
Grafik jumlah pegawai aktif berdasarkan pendidikan untuk setiap
fakultas
Grafik jumlah pegawai aktif berdasarkan kategori usia
untuk setiap fakultas
Grafik jumlah pegawai aktif berdasarkan pendidikan
pada setiap tahun
Grafik persentase dosen berdasarkan tingkat
pendidikan
Grafik persentase tenaga kependidikan berdasarkan
tingkat pendidikan
Grafik persentase dosen berdasarkan jabatan
3
5
11
12
12
13
13
18
18
19
19
20
20
DAFTAR LAMPIRAN
1
2
3
4
Tabel fakta dan dimensi
Staging riwayat pendidikan pegawai generalisasi kode
Staging riwayat pendidikan pegawai use
Contoh data yang siap dimuat
22
24
25
26
PENDAHULUAN
Latar Belakang
Institut Pertanian Bogor (IPB) sebagai institusi pendidikan nasional
membutuhkan pegawai yang mampu mendukung berlangsungnya proses
pendidikan. Setiap bagian dari IPB, mulai dari fakultas hingga departemen
membutuhkan pegawai dengan jumlah dan standar yang berbeda. Dengan adanya
pegawai yang berkualitas dan sesuai dengan kebutuhan, proses pendidikan di IPB
akan berjalan dengan baik. Untuk itu, proses rekrutmen pegawai harus berjalan
maksimal dengan hasil analisis data kepegawaian yang diperoleh dari setiap
bagian di IPB.
Analisis data adalah tahap pengambilan informasi dari data yang ada.
Hingga saat ini, proses rekrutmen pegawai belum berjalan dengan maksimal
karena proses analisis data pegawai belum berjalan dengan baik. Perkembangan
teknologi memperkenalkan data warehouse dan aplikasi OLAP sebagai salah satu
solusi dari permasalahan terkait analisis data. Adanya data warehouse dan
aplikasi OLAP akan membantu pihak-pihak yang berperan dalam proses
pengambilan keputusan rekrutmen pegawai dalam menentukan pegawai yang
benar-benar dibutuhkan oleh IPB.
Pada penelitian kali ini, analisis difokuskan berdasarkan beberapa kategori
seperti tingkat pendidikan dan usia pegawai. Jumlah pegawai yang ada di IPB,
baik dengan status dosen ataupun tenaga kependidikan lainnya memiliki kondisi
yang beragam dan penting untuk diketahui sebagai rekomendasi penetapan
keputusan terkait rekrutmen seperti yang telah disebutkan sebelumnya. Pihakpihak yang berperan sebagai pengambil kebijakan rekrutmen membutuhkan
informasi yang jelas tentang kondisi pegawai yang ada untuk dapat memenuhi
kebutuhan dari bagian-bagian yang ada. Bukan hanya berdasarkan jumlah
pegawai secara keseluruhan, akan tetapi jumlah pegawai dari masing-masing
bagian dengan spesifikasi kebutuhan seperti jumlah pegawai dengan kategori usia
tertentu untuk tiap fakultas dan departemen.
Bila dianalisis lebih lanjut, kategori usia merupakan aspek penting yang
harus diperhatikan oleh pihak-pihak pengambil keputusan atau kebijakan
rekrutmen. Jika jumlah pegawai dengan kategori usia mendekati pensiun banyak
untuk sebuah fakultas, maka perlu dipersiapkan pegawai pengganti sebagai
langkah antisipasi kurangnya pegawai dari fakultas tersebut. Tidak hanya sebatas
penambahan jumlah pegawai, tapi spesifikasi kebutuhan pegawai juga harus
diperhatikan, seperti tingkat pendidikan pegawai dan jabatan pegawai. Untuk itu,
pengembangan data warehouse dan OLAP untuk data kepegawaian IPB sangatlah
diperlukan agar kuantitas dan kualitas pegawai dapat benar-benar menunjang
sistem kependidikan di IPB dengan maksimal.
Tujuan Penelitian
Tujuan dari penelitian ini adalah membangun data warehouse dan aplikasi
OLAP untuk data kepegawaian IPB.
2
Ruang Lingkup Penelitian
Ruang lingkup penelitian hanya difokuskan pada pembangunan data
warehouse dan aplikasi OLAP. Data yang digunakan adalah data kepegawaian
IPB dan pembangunan aplikasi dilakukan dengan SQL Server 2008 R2.
METODE
Data warehouse merupakan ruang penyimpanan atau arsip informasi yang
dikumpulkan dari berbagai sumber dan disimpan dengan sebuah skema
terintegrasi pada satu tempat. Data atau informasi tersebut tersimpan dalam jangka
waktu yang lama sehingga memungkinkan pengguna menciptakan query untuk
proses pengambilan keputusan dengan lebih mudah. Dengan mengakses informasi
dari data warehouse, proses transaksi online tidak terganggu oleh beban kerja
proses pengambilan keputusan (Han dan Kamber 2006).
Keuntungan yang didapat jika menggunakan data warehouse antara lain
(Connolly dan Begg 2002):
Menghasilkan keuntungan yang kompetitif dengan cara memperbolehkan
pembuat keputusan mengakses data yang dapat memunculkan informasi yang
sebelumnya tidak ada, tidak diketahui, dan tidak digunakan.
Meningkatkan produktivitas para pembuat keputusan dengan cara
menciptakan basis data terintegrasi yang terdiri atas data historis yang
konsisten dan berorientasi subjek.
Tujuan utama dari pembuatan data warehouse ialah menyatukan beragam
data di dalam sebuah tempat penyimpanan sehingga pengguna dapat dengan
mudah menjalankan query, menghasilkan laporan, dan melakukan analisis
terhadap data yang ada.
Metode yang digunakan untuk mengembangkan data warehouse pada
penelitian ini dapat dilihat pada Gambar 1, sedangkan hasil dari tahapan metode
penelitian yang dilakukan dapat dilihat pada Tabel 1.
Tabel 1 Tahap metode penelitian dan hasil
Tahap Metode Penelitian
Hasil
Analisis
Target pengembangan sistem.
Design
Konseptual
Terbentuk tabel fakta, tabel dimensi, dan
measure
Logika
Terbentuk detail variable data dan
integrasi tiap tabel
Fisik
Implementasi rancangan di dalam DBMS
Praproses
Pembersihan Data
Data yang siap digunakan pada sistem
Data
data warehouse yang dibuat
Integrasi Data
Transformasi Data
Pemuatan Data
Pembuatan Data Warehouse
Data Warehouse dan Aplikasi OLAP
Kepegawaian IPB
Uji Query
Data Warehouse Final
3
Tahap Design
Design
Konseptual
Design Logika
Design Fisik
Uji Query
Data Warehouse
Final
Gambar 1 Tahapan metode penelitian
4
Analisis
Pengembangan data warehouse dilakukan dengan perancangan database
yang jelas. Tahap pertama adalah analisis spesifikasi kebutuhan yang terdiri atas
pengumpulan kebutuhan dari permintaan pengguna ke dalam spesifikasi koheren
dan ringkas. Sejak data warehouse ditujukan untuk mendukung proses
pengambilan keputusan, tahapan yang digunakan dalam desain database
konvensional juga telah diadopsi untuk mengembangkan data warehouse
(Malinowski dan Zim’anyi 2008).
Data warehouse dibangun untuk mengatasi masalah teknis dan bisnis yang
berkaitan dengan pembangunan data dan informasi untuk mengambil keputusan.
Secara rinci dijelaskan oleh Inmon (1993) bahwa data warehouse mempunyai
empat karakteristik, yaitu:
Subject Oriented Data
Data Warehouse diorganisasikan meliputi subjek utama dari enterprise
(misal: customer, product, sales) alih-alih area aplikasi utama (misal:
customer invoicing, stock control, product sales). Hal ini direfleksikan dalam
kebutuhan untuk menyimpan data pendukung keputusan alih-alih data
berorientasi aplikasi.
Integrasi Data
Data warehouse menggabungkan data berorientasi aplikasi dari sistem
sumber yang berbeda, yang sering menyertakan data yang tidak konsisten.
Data sumber yang terintegrasi harus dibuat menjadi konsisten untuk
merepresentasikan tampilan data yang terpadu ke pengguna.
Time Variant Data
Data pada warehouse akan menjadi akurat dan valid pada beberapa saat atau
beberapa interval waktu. Time variance menampilkan perpanjangan waktu
dari data yang ada secara implisit atau eksplisit. Selain itu, time variant juga
menampilkan keterhubungan antara waktu dengan keseluruhan data dan
kenyataan bahwa data merepresentasikan serangkaian kejadian.
Non Volatile Data
Data pada warehouse tidak di-update secara real time tetapi di-refresh dari
sistem operasional dalam basis reguler. Data baru selalu ditambahkan sebagai
tambahan pada basis data, alih-alih menggantikan data sebelumnya.
Menurut Han dan Kamber (2006), data warehouse pada umumnya
mengadopsi arsitektur three-tier, seperti digambarkan pada Gambar 2. Lapisanlapisan arsitektur data warehousing tersebut adalah:
1 Lapisan bawah (bottom tier)
Lapisan bawah adalah server data warehouse yang biasanya sebuah sistem
database relasional. Pada lapisan ini data diambil dari database operasional
dan sumber eksternal lainnya, diekstrak, dibersihkan, dan ditransformasikan.
Data disimpan sebagai data warehouse.
2 Lapisan tengah (middle tlier)
Lapisan tengah OLAP server yang biasanya diimplementasikan dengan
OLAP relasional (ROLAP) atau OLAP Multidimensional (MOLAP).
5
Lapisan atas (top tier)
Lapisan atas adalah lapisan front-end client, berisi query dan perangkat
analisis, dan atau perangkat data mining (misalnya: analisis tren, prediksi, dan
lainnya).
Selama proses pengumpulan informasi, analisis kebutuhan pengguna di
berbagai tingkat manajemen diwawancara untuk mengetahui analisis kebutuhan
yang dibutuhkan (Malinowski dan Zim’anyi 2008). Tahap analisis ini juga
ditujukan untuk mengetahui karakteristik dari masing-masing data yang diketahui,
sehingga memudahkan dalam penentuan desain data warehouse yang akan
dirancang.
3
Gambar 2 Arsitektur three-tier
Tahap Design
Tahap berikutnya yaitu desain konseptual, desain logis, dan desain fisik
yang merupakan hasil penerjemahaan dari kebutuhan pengguna. Spesifikasi yang
diperoleh berfungsi sebagai dasar untuk membuat sebuah skema database sesuai
dengan permintaan pengguna. Pembentukan skema dari hasil analisis yang
diperoleh merupakan tahapan design konseptual. Tahapan ini terkait dengan
pembuatan data warehouse yang didasarkan pada model data multidimensi.
Model ini menampilkan data dalam bentuk kubus. Model data multidimensi
terdiri atas dimensi (dimensions) dan fakta (facts) (Han dan Kamber 2006).
Dimensi adalah perspektif atau entitas penting yang dimiliki oleh
organisasi. Setiap dimensi mungkin memiliki satu tabel yang berasosiasi
dengannya yang disebut dengan tabel dimensi yang mendeskripsikan tabel itu
sendiri. Dimensi akan berubah jika analisis kebutuhan pengguna berubah.
Dimensi mendefinisikan label yang membentuk isi laporan. Tabel dimensi
berukuran lebih kecil daripada tabel fakta dan berisi data tidak numerik. Pada data
warehouse, kubus data merupakan kubus dengan n-dimensi.
6
Fakta adalah ukuran-ukuran numerik merupakan kuantitas yang akan
dianalisis hubungan antar-dimensinya. Tabel fakta berisi nama-nama fakta
(ukuran) dan key dari tabel-tabel dimensi yang berelasi dengan tabel fakta itu.
Data fakta diekstrak dari berbagai sumber. Data fakta cenderung stabil dan tidak
berubah seiring waktu. Tabel fakta berukuran besar dan memiliki jumlah baris
sesuai dengan jumlah kombinasi nilai dimensi yang mungkin dan jumlah kolom
sesuai dengan jumlah dimensi yang direpresentasikan.
Kubus data disebut juga cuboid, dan berasal dari banyak dimensi. Potongan
cuboid yang lebih kecil dapat dibuat dengan mengambil sebagian dimensi dari
sebuah cuboid besar. Potongan cuboid memiliki tingkat yang lebih tinggi (besar
nilainya) dari cuboid asalnya. Kubus data tersebut memiliki dimensi time, item,
dan location. Skema basis data berisi kumpulan enititas dan hubungan
antarentitas. Sebuah data warehouse memerlukan skema yang ringkas dan
berorientasi subjek yang dapat digunakan dalam analisis data on-line. Tipe-tipe
skema model data multidimensi adalah:
Skema Bintang (Star Schema)
Skema bintang adalah skema data warehouse yang paling sederhana. Skema
ini disebut skema bintang karena hubungan antartabel dimensi dan tabel fakta
menyerupai bintang, yaitu satu tabel fakta dihubungkan dengan beberapa
tabel dimensi. Titik tengah skema bintang adalah satu tabel fakta besar dan
sudut-sudutnya adalah tabel-tabel dimensi. Keuntungan yang didapat jika
menggunakan skema ini adalah peningkatan kinerja data warehouse,
pemrosesan query yang lebih efisien, dan waktu respon yang cepat.
Skema Snowflake (Snowflake Schema)
Skema snowflake adalah variasi dari skema bintang dengan beberapa tabel
dimensi dinormalisasi, sehingga dihasilkan beberapa tabel tambahan.
Keuntungan yang didapat dengan menggunakan skema ini adalah
penghematan memory, namun waktu yang dibutuhkan untuk pemrosesan
query menjadi lebih lama.
Skema Galaksi (Fact Constellation)
Pada skema galaksi beberapa tabel fakta berbagi tabel dimensi. Keuntungan
menggunakan skema ini adalah menghemat memory dan mengurangi
kesalahan yang mungkin terjadi.
Proses selanjutnya adalah design logika. Pada tahapan ini, konsep yang ada
dibuat lebih detail dengan menambahkan variabel dan menentukan key dari
masing-masing tabel yang ada di dalam rancangan konseptual. Logika yang telah
tersusun kemudian diimplementasikan langsung ke dalam DBMS di tahap design
fisik. Setelah itu, desain fisik disimpan pada Database Management System
(DBMS).
Praproses Data
Tahapan berikutnya adalah praproses data. Pada tahap ini, data yang ada
diolah dengan perlakuan untuk dapat menghasilkan komposisi data yang sesuai
dengan design yang ada. Sumber data terdiri atas dua database, yaitu
StaggingSimpegIPB dan SDM. Dari kedua database tersebut, tidak semua data
digunakan, tetapi hanya yang sesuai dengan hasil analisis dan design yang akan
7
diperlukan. Untuk itu, tahap praproses data menjadi penting untuk dilakukan.
Pembersihan data adalah proses memilih data-data yang dibutuhkan, baik tabel
ataupun hanya variabel. Setelah itu, data yang telah dipilih diintegrasikan untuk
membentuk rancangan data yang diinginkan. Transformasi kemudian dilakukan
untuk data butuh penyeragaman format. Setelah data siap diolah ke dalam
warehouse, maka data dimuat ke dalam sistem.
Penjelasan lain terkait tahap ini dituliskan Malinowski dan Zim’anyi (2008).
Beberapa pengalaman menunjukan bahwa pengembangan data warehouse sistem
berbeda secara signifikan dari pengembangan database konvensional. Oleh karena
itu, modifikasi terhadap metode yang dijelaskan di atas sangat penting. Sebagai
contoh, tidak seperti database konvensional, data di data warehouse diekstrak
dari beberapa sumber. Akibatnya, beberapa pendekatan untuk desain data
warehouse tidak hanya mempertimbangkan kebutuhan pengguna tetapi juga
ketersediaan data. Dalam banyak kasus, data diambil dari sumber yang berbeda
sehingga harus ditransformasikan sebelum dimasukan ke dalam data warehouse.
Hal ini merupakan salah satu yang perlu dipertimbangkan selama penyusunan
desain proses ekstraksi, transformasi, dan loading (ETL). Di sisi lain, belum ada
metode yang sesuai untuk merancang database spasial atau temporal.
Pembuatan Data Warehouse, Uji Query, dan Data Warehouse Final
Setelah data dimuat ke dalam sistem tabel-tabel yang telah dirancang, maka
aplikasi pun dibuat dengan membentuk cube dan memproses cube tersebut. Uji
query dilakukan dengan melihat kesesuaian hasil dari OLAP yang telah dibuat
dengan query yang menyusunnya. Jika uji query berhasil, maka data warehouse
final terbentuk, jika query gagal maka proses akan kembali mengarah pada
pembuatan data warehouse kembali.
Online Analytical Processing (OLAP) terdiri atas seperangkat tool untuk
membantu proses analisis dan perbandingan data dalam database. Tool dan
metode OLAP membantu pengguna menganalisis data pada sebuah data
warehouse dengan menyediakan berbagai tampilan data, dan didukung dengan
representasi data grafik yang dinamis (Han dan Kamber 2006).
Teknologi yang digunakan pada penelitian kali ini adalah SQL Server 2008
R2. SQL Server dipilih dengan beberapa alasan, yaitu teknologi ini adalah
teknologi yang digunakan oleh IPB, sehingga diharapkan dengan penggunaan
SQL Server akan mudah mengintegrasikan penelitian dengan sistem yang
berjalan. Selain itu, data yang tersedia juga dapat diproses oleh teknologi ini,
sehingga memudahkan untuk melakukan pengolahan data.
SQL Server adalah server basis data yang secara fungsional merupakan
proses atau aplikasi yang menyediakan layanan basis data. Client berinteraksi
dengan layanan basis data melalui antarmuka komunikasi tertentu yang bertujuan
untuk pengendalian dan keamanan. Client tidak mempunya akses langsung ke
data, tetapi selalu berkomunikasi dengan server basis data. (Marcus et al. 2004).
SQL Server menggunakan tipe dari database yang disebut database
relasional. Database relasional adalah database yang digunakan sebuah data
untuk mengatur atau mengorganisasikan ke dalam tabel. Tabel-tabel adalah alat
bantu untuk mengatur atau mengelompokan data mengenai subyek yang sama dan
8
mengandung informasi dan kolom dan baris. Tabel-tabel saling berhubungan
dengan mesin database ketika dibutuhkan.
SQL Server mendukung beberapa tipe data yang berbeda, termasuk untuk
karakter, angka, tanggal (datetime), dan uang (money). SQL Server digunakan
untuk
menggambarkan
model
dan
implementasi
pada
database.
Keuntungan menggunakan SQL Server dapat didefinisikan menjadi dua bagian
yaitu satu bagian untuk menjalankan pada server dan bagian lain untuk client.
Keuntungan Client antara lain:
Mudah digunakan.
Mendukung berbagai perangka keras.
Mendukung berbagai aplikasi perangkat lunak.
Biasa untuk digunakan
Sementara itu keuntungan Server antara lain:
Dapat diandalkan (Reliable)
Toleransi kesalahan (Fault Tolerant)
Konkurensi (Concurrent)
Performa tinggi dalam perangkat keras (High-performance Hardware)
Pengendalian terpusat (Centralized Control)
Penguncian yang canggih (Sophisticated Locking).
Spesifikasi Perangkat Keras dan Perangkat Lunak
Aplikasi ini dikembangkan dengan menggunakan perangkat keras:
Processor Intel(R) Core(TM) 2 Duo CPU T6500 @ 2.10 GHz (2 CPUs), 3 GB
Memory, Harddisk 320 GB , Mouse dan Keyboard , Monitor 14.1” dengan
resolusi 1024 x 768 pixels, VGA ATI Radeon HD 3400 Series. Sementara itu
perangkat lunak yang digunakan adalah Sistem Operasi Microsoft Windows 7
Ultimate 32-bit (6.1, Build 7600) dan SQL Server 2008 R2.
HASIL DAN PEMBAHASAN
Analisis
Analisis yang dilakukan melingkupi analisis kebutuhan sistem dan analisis
data yang ada. Analisis dimulai dari analisis karakteristik data warehouse yang
terdiri atas subject oriented data, integrasi data, time variant data, dan non
volatile data. Data warehouse yang dikembangkan berorientasi pada subject
pegawai. Data merupakan integrasi dari database SDM dengan database
StagingSimpegIPB. Data yang digunakan adalah data dari tahun pertama hingga
tahun 2012 dan bukan dalam bentuk rael time.
Berdasarkan arsitektur three-tier, lapisan bawah pada penelitian ini
dikerjakan di dalam SQL Server 2008 R2, tepatnya pada bagian SQL Server
Integration Service (SSIS). Lapisan tengah menggunakan SQL Server Analysis
Service (SSAS), dan lapisan atas menggunakan Microsoft Office Excel 2010.
Analisis kebutuhan sistem menghasilkan enam target dari dibangunnya data
9
warehouse dan aplikasi OLAP Kepegawaian IPB. Keenam target diperoleh dari
hasil diskusi dengan pihak Direktorat Komunikasi dan Sistem Informasi (DKSI)
IPB dan Key Performance Indicators (KPI) IPB yang terkait dengan kepegawaian.
Target pertama adalah mengetahui jumlah pegawai aktif berdasarkan tingkat
pendidikan untuk tiap fakultas dan departemen. Dari contoh data pada Tabel 2,
target ini akan membantu memahami data, contohnya jumlah pegawai aktif
dengan pendidikan S1 untuk Fakultas Ekologi Manusia adalah 2 orang dan jumlah
pegawai aktif dengan pendidikan S1 untuk Departemen Gizi Masyarakat adalah 1
orang.
Nama
Fengky
Satria
Yoresta
Lindawati
Kartika
Azis Boing
Sitanggang
Karina
Rahmadia
Ekawidyani
Noerhayati
Rofiah
Tabel 2 Data pegawai aktif
Kategori
Usia
Pendidikan Tahun
Departemen
Usia
26
26-30
S2
2010
Hasil Hutan
Tahun
27
26-30
Tahun
26-30
Tahun
S2
2009
Manajemen
S2
2010
27
26-30
Tahun
S1
2008
Ilmu dan
Teknologi
Pangan
Gizi
Masyarakat
28
26-30
Tahun
S1
2008
27
Fakultas
Kehutanan
Ekonomi dan
Manajemen
Teknologi
Pertanian
Ekologi
Manusia
Ilmu
Ekologi
Keluarga dan Manusia
Konsumen
Target kedua adalah mengetahui jumlah pegawai aktif pada rentang usia
tertentu untuk tiap departemen dan fakultas. Target ini akan membantu pengguna
memahami data, misalnya jumlah pegawai aktif dengan kategori usia 26-30 tahun
untuk Departemen Ilmu dan Teknologi Pangan adalah 1 orang dan jumlah
pegawai aktif dengan kategori usia 26-30 tahun untuk Fakultas Ekologi Manusia
adalah 2 orang.
Mengetahui jumlah pegawai dengan pendidikan pada tahun tertentu adalah
target ketiga dari pembangunan data warehouse dan aplikasi OLAP ini. Misalkan
ada data seperti Tabel 2, target ditujukan untuk membantu pengguna memahami
data, misalnya jumlah pegawai dengan pendidikan S1 pada tahun 2005 adalah 1
orang dan jumlah pegawai dengan pendidikan S1 pada tahun 2006 adalah 2 orang.
Data pegawai dengan pendidikan S1 bertambah pada tahun 2006 dan dengan
begitu maka jumlah pegawai dengan pendidikan D3 pada tahun 2006 adalah 0,
karena B telah terhitung sebagai pegawai dengan pendidikan S1 pada tahun 2006.
Target keempat adalah mengetahui persentase dosen yang bergelar doktor
(S3). Melihat contoh data yang ada pada Tabel 3, target ini ditujukan untuk dapat
memahami data, misalnya persentase dosen dengan pendidikan S3 untuk data
terakhir dari kependidikan pegawai adalah 1 dari 2 orang, atau sama dengan
setengah dari jumlah dosen yang ada.
10
Tabel 3 Contoh data pendidikan pegawai
Nama Pendidikan TahunP
Status Pegawai
Jabatan
A
S1
2004 Dosen
Staff Pengajar
A
S2
2007 Dosen
Staff Pengajar
B
D3
2002 TenagaKependidikan
Pustakawan Pratama
B
S1
2006 TenagaKependidikan
Pustakawan Pratama
C
S2
2003 Dosen
Guru Besar
C
S3
2005 Dosen
Guru Besar
D
D3
2005 Tenaga Kependidikan Pustakawan Pratama
D
S1
2006 Tenaga Kependidikan Pustakawan Pratama
E
S1
2001 Dosen
Staff Pengajar
E
S2
2005 Dosen
Staff Pengajar
E
S3
2007 Dosen
Staff Pengajar
Target kelima adalah mengetahui persentase pegawai dengan pendidikan
terakhir minimal D3. Dari data pada Tabel 2, OLAP ditujukan untuk membantu
memahami data, misalnya persentase tenaga kependidikan dengan pendidikan
terkhir D3 adalah sebanyak 3 dari 3 orang, atau sama dengan seluruh dari jumlah
dosen yang ada.
Target keenam dari pembagunan data warehouse dan aplikasi OLAP pada
penelitian ini adalah mengetahui persentase dosen dengan jabatan guru besar.
OLAP dapat membantu memahami data, misalnya persentase dosen dengan
jabatan guru besar adalah sebanyak 1 dari 2 orang, atau sama dengan setengah
dari jumlah dosen yang ada.
Tahap Design
Tahap design terdiri atas design konseptual, design logika, dan design fisik.
Berikut pembahasan masing-masing hasil tahapan design.
Design Konseptual
Design konseptual seperti yang telah dijelaskan pada bagian metode bahwa
tahapan ini menghasilkan rancangan skema secara umum. Skema yang dibentuk
merupakan skema galaksi dengan tiga tabel fakta dan 10 tabel dimensi seperti
dirinci pada Tabel 4.
Tabel DW_FactBiodataPegawai merupakan tabel fakta yang dibentuk
dengan tujuan untuk memenuhi target pertama, kedua, keempat, dan keenam dari
rincian target yang telah disebutkan pada bagian analisis. Target ketiga difokuskan
pada tabel DW_FactPendidikanTime, dan target kelima dengan tabel
DW_FactPendidikan. Skema yang digunakan dalam penelitian ini adalah skema
galaksi yang dapat dilihat pada Gambar 3.
11
No
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
Tabel 4 Daftar fakta dan dimensi
Dimensi
Fakta
DW_FactBiodataPegawai
DW_DimDepartemen
DW_DimKategoriUsia
DW_DimStatusPekerjaan
DW_DimStatusPegawai
DW_DimPendidikan
DW_DimTahunPendidikan
DW_DimJabatan
DW_FactPendidikan
DW_DimPendidikan
DW_DimKategoriUsia
DW_DimStatusPekerjaan
DW_DimStatusPegawai
DW_DimUniversitas
DW_DimBidangIlmu
DW_DimTahunPendidikan
DW_DimDepartemen
DW_FactPendidikanTime
DW_DimTime
DW_DimPendidikan
Measure
JumlahPegawai
JumlahPegawai
JumlahPegawai
Gambar 3 Skema galaksi SimpegIPB
Design Logika
Design logika merupakan pemetaan model data yang telah dirancang pada
tahap sebelumnya. Detail skema dari masing-masing fakta ditunjukkan pada
Gambar 4 untuk DW_FactBiodataPegawai, Gambar 5 untuk DW_FactPendidikan,
Gambar 6 untuk DW_FactPendidikanTime, dan Gambar 7 Integrasi
DW_FactBiodataPegawai, DW_FactPendidikan, dan DW_FactPendidikanTime.
12
Gambar 4 Diagram DW_FactBiodataPegawai
Gambar 5 Diagram DW_FactPendidikan
13
Gambar 6 Diagram DW_FactPendidikanTime
Gambar 7 Diagram Integrasi DW_FactBiodataPegawai, DW_FactPendidikan, dan
DW_FactPendidikanTime
Design Fisik
Design fisik kemudian dilakukan dengan membentuk semua rancangan ini
di dalam DBMS (SQL Server 2008 R2). Tahap ini membentuk database dan
table-tabel penyusunnya untuk mempersiapkan praproses data. Tabel fakta dan
dimensi yang dibentuk beserta tipe datanya dapat dilihat pada Lampiran 1.
14
Praproses Data
Tahap praproses data terdiri dari integrasi, pembersihan, transformasi, dan
pemuatan data. Tahapan ini dibahas berdasarkan tabel fakta yang terbentuk dan
data source yang digunakan. Tabel fakta DW_FactBiodataPegawai dibentuk dari
database StagingSimpegIPB dengan tabel Stg_TrsBiodata. Sumber pembentukan
tabel DW_FactBiodataPegawai dijelaskan pada Tabel 5 berikut ini.
Tabel 5 Sumber pembentukan DW_FactBiodataPegawai
Tabel yang Digunakan
Database Source
Field yang Digunakan
Simpeg IPB
SimpegIPB.dbo.Staging Riwayat KodePendidikan,
Pendidikan PegawaiUse
Tahun
SimpegIPB.dbo.Staging
FakDeptTest
sdm
Fakultas, Departemen
SimpegIPB. dbo.Staging Biodata NIP,
KategoriUsia,
Pegawai
StatusPekerjaan
sdm.dbo. tBiodata
StatusPegawai
Dalam proses pembentukan tabel DW_FactBiodataPegawai, dilakukan
tahapan praproses data yang dimulai dari pembentukan tabel-tabel sumbernya.
Tabel DW_FactBiodataPegawai terdiri dari dimensi DimDepartemen,
DimStatusPegawai, DimStatusPekerjaan, DimJabatan, DimTahunPendidikan,
DimPendidikan, dan DimKategoriUsia. Data yang dibutuhkan disimpan terlebih
dahulu di dalam tabel Stg_TrsBiodata. Pembersihan dan integrasi dilakukan untuk
dapat membentuk tabel Stg_TrsBiodata. Pengolahan data pertama ditujukan untuk
mendapatkan field KodePendidikan dan TahunPendidikan yang kemudian akan
dijadikan rujukan dalam pembentukan DimTahunPendidikan dan DimPendidikan.
Integrasi data terjadi antara tabel TrsRiwayatPendidikan dan tabel MstPendidikan
untuk membentuk tabel Staging RiwayatPendidikanPegawaiGeneralisasiKode.
Query SQL yang digunakan adalah
select a.[NIP]
,a.[Universitas]
,a.[BidangIlmu]
,a.[TahunPendidikan]
,b.KodePendidikan,
CASE a.Pendidikan when 'SD' THEN 'SD'
WHEN 'SLTP' THEN 'SLTP'
WHEN 'SLTA Paket C' THEN 'SLTA Paket C'
WHEN 'SPP' THEN 'SMA'
WHEN 'KPAA' THEN 'SMA'
WHEN 'SMT' THEN 'SMA'
WHEN 'Madrasah Aliyah' THEN 'SMA'
WHEN 'MAN' THEN 'SMA'
WHEN 'SMU' THEN 'SMA'
WHEN 'SMA' THEN 'SMA'
WHEN 'SLTA' THEN 'SMA'
WHEN 'SMEA' THEN 'SMA'
WHEN 'SMA' THEN 'SMA'
15
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
WHEN
'SMAK' THEN 'SMK'
'SMKK' THEN 'SMK'
'SLTA Kejuruan' THEN 'SMK'
'STM' THEN 'SMK'
'SMK' THEN 'SMK'
'D1' THEN 'D1'
'D2' THEN 'D2'
'Sarjana Muda' THEN 'D3'
'D3' THEN 'D3'
'S1' THEN 'S1'
'S2' THEN 'S2'
'S3' THEN 'S3'
END as 'PendidikanPegawai'
FROM
[StagingSimpegIPB].[dbo].[Stg_TrsRiwayatPendidikan] a
inner join StagingSimpegIPB.dbo.Stg_MstPendidikan b
on a.pendidikan = b.pendidikan
order by PendidikanPegawai.
Hasil tabel Staging RiwayatPendidikanPegawaiGeneralisasiKode dapat
dilihat pada Lampiran 2. Sesuai dengan namanya, table ini merupakan table yang
ditujukan untuk memunculkan hasil dari generalisasi KodePendidikan.
Transformasi data dilakukan pada bagian KodePendidikan yang digeneralisasi
yang dapat dilihat pada Tabel 6.
Setelah generalisasi KodePendidikan terbentuk, dipilih data dengan tingkat
pendidikan yang tertinggi. Data pegawai dengan tingkat pendidikan tertinggi
untuk
masing-masing
individu
disimpan
di
dalam
tabel
StagingRiwayatPendidikanPegawaiUse. Query SQL yang digunakan adalah
select NIP, KodePendidikan, Pendidikan, Universitas,
BidangIlmu, Tahun from (
select NIP, KodePendidikan, Pendidikan, Universitas,
BidangIlmu, Tahun,
row_number() over (partition by NIP order by
KodePendidikan desc) AS recid
from
[SimpegIPB].[dbo].[StaggingRiwayatPendidikanPegawaiGene
ralisasiKode]
) AS f where recid = 1 order by KodePendidikan. Tabel
Staging Riwayat Pendidikan Pegawai Use.
Hasil query dapat dilihat pada Lampiran 3.
16
Tabel 6 Daftar generalisasi pendidikan
Daftar Generalisasi Pendidikan
Sebelum Generalisasi
Setelah Generalisasi
SD
SD
SLTP
SLTP
SLTA Paket C
SLTA Paket C
SMA
SPP
SMA
KPAA
SMA
SMT
SMA
SMEA
SMA
Madrasah Aliyah
SMA
MAN
SMA
SMU
SMA
SLTA
SMK
SMKK
SMK
SMAK
SMK
SLTA Kejuruan
SMK
STM
D1
D1
D2
D2
Sarjana Muda
D3
S1
S1
S2
S2
S3
S3
SimpegIPB.dbo.StagingFakDeptTest dibentuk dari sdm.dbo.tMutasi dengan
mengambil kolom NIP, unitKerja, dan bagian dengan filter pada kolom AktifUnit
= 1 dan unitKerja tidak sama dengan ' '. Data Departemen dan Fakultas
merupakan tujuan dibentuknya StagingFakDeptTest tersebut. Setelah keempat
tabel dari dua database tersebut siap, maka data dimuat untuk membentuk
Stg_TrsBiodata dan FactBiodataPegawai.
DW_FactPendidikan dibentuk dari hasil join Staging Simpeg IPB .dbo.
TrsRiwayatPendidikan dengan StagingSimpegIPB.dbo.TrsBiodata. Fakta terakhir
adalah DW_FactPendidikanTime yang merupakan hasil pemrosesan dari
StagingSimpegIPB.dbo.TrsRiwayatPendidikan. Penelitian ini memfokuskan pada
tingkat pendidikan D1 hingga S3. Tabel FactPendidikanTime berisi data NIP dan
daftar tahun beserta tingkat pendidikan pegawai pada tahun tersebut. Daftar tahun
pendidikan ini merupakan hasil dari pemrosesan data berdasarkan tahun mulai
pendidikan ditingkat tertentu hingga tahun mulai pendidikan dijenjang setelahnya.
Tahun mulai pendidikan di jenjang yang lebih tinggi tersebut menandakan
berakhirnya status pendidikan pada tingkat pendidikan yang dijalani, sehingga
didapatkan range tahun seorang pegawai berada pada jenjang pendidikan tertentu.
Data yang telah diolah kemudian dimuat kedalam sistem yang sedang
dibangun. Contoh data yang siap diolah dapat dilihat pada Lampiran 4.
17
Pembuatan Data Warehouse dan Uji Query
Pembuatan OLAP dan aplikasi data warehouse dilakukan dengan
menggunakan SQL Server 2008 R2. Proses pembuatan OLAP ini meliputi proses
pembuatan design konseptual yang berupa tabel fakta, dimensi, measure ke dalam
SQL Server 2008 R2 hingga membentuk cube dan menghasilkan keluaran. Uji
query dilakukan dengan membandingkan query yang telah dibuat dengan hasil
yang terbentuk. Dari enam target yang ada, semuanya dapat tercapai. Target dan
hasilnya, didaftarkan jelas pada Tabel 7.
No.
Target
1
2
3
4
5
6
Tabel 7 Target penelitian dan grafik hasil
Deskripsi Target
Mengetahui jumlah pegawai aktif berdasarkan
tingkat pendidikan untuk tiap departemen dan
fakultas.
Mengetahui jumlah pegawai aktif pada rentang usia
tertentu untuk tiap departemen dan fakultas.
Mengetahui jumlah pegawai dengan pendidikan pada
tahun tertentu
Mengetahui persentase dosen yang bergelar doktor.
Mengetahui persentase pegawai dengan pendidikan
terakhir minimal D3.
Mengetahui persentase dosen dengan jabatan guru
besar.
Hasil
Gambar 8
Gambar 9
Gambar 10
Gambar 11
Gambar 12
Gambar 13
Dari Gambar 8, dapat diketahui bahwa jumlah pegawai aktif dengan tingkat
pendidikan S3 tertinggi terdapat pada Fakultas Pertanian. Tingkat pendidikan S2
dan S1 tertinggi terdapat pada Fakultas Matematika dan Ilmu Pengetahuan Alam.
Data ini dapat menjadi pertimbangan bagi pihak terkait untuk meningkatkan
kualitas pendidikan pegawai untuk fakultas-fakultas yang masih rendah jumlah
pegawainya pada tingkat pendidikan tertentu.
Target kedua yang ditunjukkan pada Gambar 9 membantu pihak terkait
dalam mengetahui kondisi kebutuhan SDM dengan melihat usia dari SDM yang
ada. Sebagian contoh pada Fakultas pertanian yang terdata memiliki SDM
kategori usia 51 – 56 tahun tertinggi dibandingkan fakultas yang lain, menjadi
bahan pertimbangan tersendiri untuk segera menambahkan SDM baru dengan usia
dibawahnya. Penetapan system rentang usia ini dimaksudkan untuk
mempermudah pengguna dalam melihat data dan memahami maknanya.
Gambar 10 membantu pengguna untuk melihat perkembangan kualitas
pendidikan SDM yang ada di setiap tahunnya. Dari hasil tersebut terlihat jumlah
SDM S3 semakin meningkat dan jumlah SDM S1 semakin berkurang. Hal ini
membantu pihak terkait dalam proses evaluasi jangka panjang.
Pada Gambar 11, persentase lebih difokuskan pada kategori dosen.
Persentase dosen dengan gelar Doktor atau S3 terdata paling besar, akan tetapi
masih terdapat juga dosen dengan tingkat pendidikan S1 yang masih harus
ditingkatkan ke jenjang yang lebih tinggi. Target selanjutnya dapat dilihat pada
Gambar 12 dengan melihat perbandingan persentase jumlah pegawai dengan
18
tingkat pendidikan D3 ke atas dengan jumlah pegawai dengan tingkat pendidikan
D3 ke bawah. Gambar 13 dapat terlihat persentase dosen dengan jabatan guru
besar dibandingkan dengan lima jabatan dosen lainnya secara fungsional.
Gambar 8 Grafik jumlah pegawai aktif berdasarkan pendidikan untuk setiap
fakultas
Gambar 9 Grafik jumlah pegawai aktif berdasarkan kategori usia untuk setiap
fakultas
19
Gambar 10 Grafik jumlah pegawai aktif berdasarkan pendidikan pada setiap
tahun
Gambar 11 Grafik persentase dosen berdasarkan tingkat pendidikan
20
Gambar 12 Grafik persentase tenaga kependidikan berdasarkan tingkat pendidikan
Gambar 13 Grafik persentase dosen berdasarkan jabatan
21
SIMPULAN DAN SARAN
Simpulan
Penelitian ini menghasilkan aplikasi data warehouse dan OLAP
Kepegawaian IPB dengan satu kubus data yaitu kubus DW_SimpegIPB. Tabel
fakta yang terbentuk yaitu, DW_FactBiodataPegawai, DW_FactPendidikan, dan
DW_FactPendidikanTime. Tabel-tabel fakta tersebut terhubung oleh sepuluh tabel
dimensi,
yaitu
DW_DimKategoriUsia,
DW_DimDepartemen,
DW_DimPendidikan,
DW_DimTime,
DW_DimStatusPekerjaan,
DW_DimStatusPegawai,
DW_DimTahunPendidikan,
DW_DimJabatan,
DW_DimBidangIlmu, dan DW_DimUniversitas. Measure dari kubus data ini
adalah jumlah pegawai. Penyajian gambar dapat dilihat dalam bentuk grafik
batang, pie chart, garis, dan jenis grafik lain yang terdapat dalam Microsoft Excel.
Operasi-operasi OLAP yang digunakan pada kubus data yang dibentuk adalah
roll-up, drill-down, slice, dan dice.
Saran
Saran untuk penelitian data warehouse dan aplikasi OLAP kepegawaian
IPB selanjutnya adalah:
1 Memperluas lingkup target yang dibentuk dengan analisis yang lebih
mendalam tentang keadaan kepegawaian IPB.
2 Meningkatkan kualitas data source, sehingga hasil yang ada merupakan
data yang benar-benar relevan dengan kondisi pegawai IPB.
3 Menyesuaikan tools untuk reporting dengan teknologi yang digunakan
oleh sistem di IPB.
DAFTAR PUSTAKA
Connolly T, Begg C. 2002. Database System: A Practical Approach to Design,
Implementation, and management. Massachusetts (US): Addison Wesley.
Han J, Kamber M. 2006. Data Mining: Concept and Techniques. San Francisco
(US): Morgan Kaufmann.
Inmon WH. 2005. Building The Data Warehouse. Indianapolis (US): Wiley
Publishing.
Malinowski, Zim’anyi. 2008. Advanced Data warehouse Design. Berlin (DE):
Springer.
Marcus T, Prijono A, Widiati J. 2004. Delphi Developer dan SQL Server 2000.
Bandung (ID): Informatika.
22
Lampiran 1 Tabel fakta dan dimensi
Tabel Dimensi bidang ilmu
Column Name
BidangIlmuKey
BidangIlmu
Data Type
int
varchar(50)
Tabel Dimensi departemen
Column Name
Data Type
DeptKey
int
KodeDepartemen
nvarchar(10)
Departemen
nvarchar(100)
KodeFakultas
nvarchar(10)
Fakultas
nvarchar(100)
Tabel Dimensi jabatan
Column Name
Data Type
JabatanKey
int
KodeJabatan
nvarchar(5)
Jabatan
nvarchar(50)
Tabel Dimensi kategori usia
Column Name
Data Type
KategoriUsiaKey
int
KategoriUsia
varchar(20)
Tabel Dimensi pendidikan
Column Name
Data Type
PendidikanKey
int
Pendidikan
varchar(50)
Tabel Dimensi status pegawai
Column Name
Data Type
StatusPegawaiKey
int
KodeStatusPegawai
nvarchar(5)
StatusPegawai
nvarchar(25)
Tabel Dimensi status pekerjaan
Column Name
Data Type
StatusPekerjaanKey
int
StatusPekerjaan
varchar(20)
Tabel Dimensi tahun pendidikan
Column Name
Data Type
TahunPendidikanKey
int
TahunPendidikan
varchar(4)
23
Lanjutan
Tabel Dimensi time
Column Name
Data Type
TimeKey
int
Tanggal
datetime
Tahun
Tabel Dimensi universitas
Column Name
Data Type
UniversitasKey
int
Universitas
varchar(50)
Tabel Fakta biodata pegawai
Column Name
Data Type
JumlahPegawai
int
KategoriUsiaKey
int
StatusPekerjaanKey
int
StatusPegawaiKey
int
PendidikanKey
int
DepartemenKey
int
TahunPendidikanKey
int
JabatanKey
int
Tabel Fakta pendidikan
Column Name
Data Type
JumlahPegawai
int
KategoriUsiaKey
int
StatusPekerjaanKey
int
PendidikanKey
int
UniversitasKey
int
BidangIlmuKey
int
DepartemenKey
int
TahunPendidikanKey
int
StatusPegawaiKey
int
Tabel Fakta pendidikan time
Column Name
Data Type
JumlahPegawai
int
TimeKey
int
PendidikanKey
int
24
24
Lampiran 2 Staging riwayat pendidikan pegawai generalisasi kode
ID
NIP
Kode Pendidikan
Pendidikan
Universitas
3796
130042185
11
S3
810
811
3312
812
3311
813
3309
3797
814
3310
3798
815
3308
3799
3800
816
3307
3801
130075890
130120138
130120138
130128209
130128209
130143845
130143845
130143845
130154833
130154833
130154833
130160307
130160307
130160307
130160323
130160326
130160326
130160326
9
9
10
9
10
9
10
11
9
10
11
9
10
11
11
9
10
11
S1
S1
S2
S1
S2
S1
S2
S3
S1
S2
S3
S1
S2
S3
S3
S1
S2
S3
North Carolina State
Univ.
Universitas Indonesia
Institut Pertanian Bogor
Institut Pertanian Bogor
Universitas Indonesia
University of Kentucky
Universitas Indonesia
University of Toronto
University of Wisconsin
Universitas Indonesia
University of Kentucky
Institut Pertanian Bogor
Institut Pertanian Bogor
University of Georgia
University of Georgia
Institut Pertanian Bogor
Universitas Indonesia
University of Kentucky
Institut Pertanian Bogor
Bidang Ilmu
Tahun
Experimental Statistics
1964
Ilmu Perpustakaan
Teknologi Pertanian
Ilmu Pangan
Pertanian
Botani
Kehutanan
Kehutanan
Plant Pathology
Kedokteran Hewan
Embriologi
Embriologi
Ilmu Tanah
Ilmu Tanah
Ilmu Konservasi Tanah
Biologi
Kedokteran Hewan
Dairy Science
Ilmu Ternak
1976
1973
1979
1961
1963
1958
1970
1974
1960
1966
1975
1961
1963
1965
1979
1960
1964
1981
25
Lampiran 3 Staging riwayat pendidikan pegawai use
NIP
KodePendidikan Pendidikan
Universitas
11
S3
North Carolina State
130042185
Univ.
9
S1
Universitas Indonesia
130075890
10
S2
Institut Pertanian Bogor
130120138
10
S2
University of Kentucky
130128209
11
S3
University of Wisconsin
130143845
11
S3
Institut Pertanian Bogor
130154833
11
S3
University of Georgia
130160307
11
S3
Institut Pertanian Bogor
130160323
11
S3
Institut Pertanian Bogor
130160326
10
S2
Institut Pertanian Bogor
130160331
11
S3
Montana State University
130168635
130176917
11
S3
130176920
130176921
130176923
11
11
11
S3
S3
S3
130176928
130183161
130183165
130183168
9
10
11
11
S1
S2
S3
S3
Oklahoma State
University
Institut Pertanian Bogor
University of Florida
North Carolina State
Univ.
Universitas Indonesia
Michigan State University
University of Wisconsin
University of Wisconsin
BidangIlmu
Experimental Statistics
Tahun
1964
Ilmu Perpustakaan
Ilmu Pangan
Botani
Plant Pathology
Embriologi
Ilmu Konservasi Tanah
Biologi
Ilmu Ternak
Ilmu Pengetahuan Hutan
Applied Economoics &
Econometrica
Entomologi
1976
1979
1963
1974
1975
1965
1979
1981
1988
1974
Ilmu Ternak
Animal Science
Forest Engineering
1981
1972
1972
Kedokteran Hewan
Ilmu Pangan
Entomologi Hasil hutan
Ilmu Nutrisi Ternak
1961
1965
1975
1976
1968
25
26
26
Lampiran 4 Contoh data yang siap dimuat
130801609
Bogor
61
61-65 Tahun
L
Islam
Tenaga
Kependidikan
STG02
Kode
Pendidi
kan
2
130808890
Bogor
61
61-65 Tahun
P
Islam
Tenaga
Kependidikan
STG02
4
1976
G01
G
130809125
Tebing
61
61-65 Tahun
P
Islam
Dosen
STG03
10
1984
F05
F
130813798
Banyuwangi
57
56-60 Tahun
L
Islam
Dosen
STG01
11
2003
E01
E
131278113
Bogor
60
56-60 Tahun
L
Islam
Tenaga
Kependidikan
STG02
4
1971
C00
C
131671606
Bukit
53
51-55 Tahun
L
Islam
Dosen
STG04
11
1995
E02
E
131681401
Magetan
51
51-55 Tahun
L
Islam
Dosen
STG03
11
1998
A03
A
131693600
Bogor
60
56-60 Tahun
L
Islam
Tenaga
Kependidikan
STG02
4
1972
G00
G
131788594
Ambon
50
46-50 Tahun
P
Protestan
Dosen
STG04
10
1990
C04
C
131855679
Ababi,Bali
50
46-50 Tahun
L
Hindu
Dosen
STG01
11
2001
G08
G
131881980
Bogor
51
51-55 Tahun
L
Islam
Tenaga
Kependidikan
STG04
7
1984
A00
A
132084932
Subang
45
41-45 Tahun
L
Islam
Dosen
STG01
11
2004
C02
C
132158757
Jakarta
41
41-45 Tahun
P
Islam
Dosen
STG04
10
2003
G06
G
NIP
TempatLahir
Usia
Kategori
Usia
Jenis
Kelamin
Agama
Status
Pekerjaan
Status
Pegawai
Tahun
Kode
Pendi
Dept
dikan
1969
B03
Kode
Fak
B
27
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 18 November 1989. Penulis
merupakan anak keempat dari pasangan Purwanto dan Nasirah. Pada tahun 2008,
penulis menamatkan pendidikan di SMA Negeri 58 Jakarta. Pada tahun yang
sama, penulis diterima menjadi mahasiswa di Institut Pertanian Bogor (IPB)
melalui jalur Undangan Seleksi Masuk IPB (USMI). Penulis menjadi mahasiswa
di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan
Alam.
Pada bulan Juli hingga Agustus 2011, penulis melaksanakan kegiatan
Praktik Kerja Lapangan di Direktorat Jenderal Hortikultura, Kementerian
Pertanian Republik Indonesia. Selain itu, penulis berkesempatan aktif dalam
organisasi kampus diantaranya, Badan Eksekutif Mahasiswa (BEM) Tingkat
Persiapan Bersama, BEM Fakultas Matematika dan Ilmu Pengetahuan Alam,
Himpunan Mahasiswa Ilmu Komputer dan BEM Keluarga Mahasiswa IPB.