Implementasi gudang data untuk keperluan akademik mahasiswa : studi kasus Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta - USD Repository
IMPLEMENTASI GUDANG DATA
UNTUK KEPERLUAN AKADEMIK MAHASISWA
Studi Kasus Fakultas Sains dan Teknologi
Universitas Sanata Dharma Yogyakarta
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Teknik
Program Studi Teknik Informatika
Oleh:
SetiawanWasito
065314065
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
IMPLEMENTATION OF DATA WAREHOUSE
FOR STUDENT’S ACADEMIC NEEDS
Case Study Faculty of Science and Technology
Sanata Dharma University Yogyakarta
A Thesis
Presented as Partial Fullfillment of The Requirements To Obtain The Sarjana Teknik Degree
In Informatics Engineering Study Program
By:
SetiawanWasito
Student Number: 065314065
INFORMATICS ENGINEERING STUDY PROGRAM
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
MOTTO
Terang akan lebih berarti di tempat
yang gelap
Keeps trying until the end
Akhir yang gemilang tak selalu dimulai dari awal yang terangPERNYATAAN KEASLIAN HASIL KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak memuat dan menggunakan hasil karya atau bagian dari hasil karya orang lain, kecuali yang telah tercantum dan disebutkan dalam kutipan serta daftar pustaka sebagaimana layaknya karya ilmiah.
Yogyakarta, 20 November 2010 Penulis
Setiawan Wasito
ABSTRAK
Gudang data merupakan sekumpulan data yang terintegrasi, basis data berorientasi subyek yang didesain untuk mendukung keputusan sistem pendukung keputusan. Penulis membuat gudang data yang diperuntukkan Dekan Fakultas Sains dan Teknologi guna memantau perkembangan mahasiswa setiap prodi. Data tersebut dibutuhkan untuk pelaporan EPSBED (Evaluasi Program Studi Berbasis Evaluasi Diri) dan pelaporan Penerimaan Mahasiswa Baru. Data yang akan dibuat gudang data adalah mengenai akademik mahasiswa yaitu jumlah SKS, angka_mutu, IPS, IPK, dan nilai test PMB. Data jumlah SKS, angka_mutu, IPS, dan IPK terletak pada Sistem Informasi Akademik dan data-data disimpan di
database tiap prodi pada tabel mhs (berisi nomor mahasiswa dan angkatan), tabel
mtk (berisi kode matakuliah, nama matakuliah, dan SKS), tabel tw (berisi matakuliah tawar yang akan ditawarkan pada semester yang bersangkutan), dan tabel kh (menghitung jumlah SKS, angka_mutu, IPS, dan IPK). Sedangkan nilai test PMB terletak pada Sistem Penerimaan Mahasiswa Baru dan data-data disimpan di database pmb pada tabel nf (berisi nilai test PMB).
Gudang data yang akan dibuat adalah menggabungkan database pada Sistem Informasi Akademik dan database pada Sistem Penerimaan Mahasiswa Baru, gudang data yang telah terbentuk selanjutnya akan diproses menjadi
database Online Analytical Processing (OLAP) menggunakan Kettle dan Star
Schema . Gudang data yang terbentuk dapat menghitung jumlah SKS tiap
mahasiswa, menghitung angka mutu, nilai IPS dan IPK mahasiswa, dan jumlah nilai test Penerimaan Mahasiswa Baru. Perhitungan yang dilakukan oleh gudang data memberikan informasi hasil yang tepat (hasil sama dengan Sistem Informasi Akademik dam Penerimaan Mahasiswa Baru).
Hasil pembuatan gudang data, nilai IPS dan IPK yaitu 50% sesuai dengan pelaporan EPSBED dan nilai test PMB yaitu 100% sesuai dengan pelaporan nilai test Penerimaan Mahasiswa Baru sehingga dapat membantu Dekan Fakultas Sains
ABSTRACT
Data warehouse is a collection of data that integrated; data basis subject oriented that design to support the decision of decision support system. The writer creates the data warehouse that is design for the Dean of the Faculty of Science and Technology to monitor academic progress of each study program. The data required for reporting EPSBED (Study Program Evaluation Based on Self Evaluation) and reporting Admissions. The data that will be use as data warehouse is student’s academic data that are the sum of SKS, grade quality, IPS, IPK, and PMB test grade. Data of the sum of SKS, grade quality, IPS, and IPK is located in Academic Information System and stored in the database of each study program on the mhs table (contains of student’s quality and force quality), mtk table (contains of course code, course name, and credits), tw table (contains of courses that available in the semester), and kh table (counting the sum of credits, grade quality, IPS, and IPK). The PMB test grade located in Student Admission System and stored in pmb database in the nf table (contains of PMB test grade).
The data warehouse that is going to be made bundles database on the Academic Information System and database on Student Admission System. After that, the formed database will be processed into Online Analytical Processing (OLAP) database using Kettle (Pentaho Data Integration) and Star Schema. The data warehouse can to calculate each student’s sum credits, grade quality, IPS and
IPK grade, and the total test grade of Student Admission. The calculation of the data warehouse gives accurate result information (the same result with Academic Information System and Student Admission System).
The results of data warehouse, making IPS and IPK grade is 50% suitable to the reporting EPSBED and PMB grade test is 100% suitable to the report of test Admissions so that it can helps Dean of the Faculty of Science and Technology to monitoring academic progress of each study program.
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma : Nama : Setiawan Wasito NIM : 065314065 Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul:
Implementasi Gudang Data Untuk Keprluan Akademik Mahasiswa Studi
Kasus Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikannya secara terbatas, dan mempublikasikannya di internet dan media lain untuk kepentingan akademis tanpa perlu meminta izin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis. Demikian pernyataan ini saya buat dengan sebenarnya. Yogyakarta, 20 November 2010
Penulis Setiawan Wasito
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa atas segala kasih dan anugerahnya sehingga penulis dapat menyelesaikan skripsi dengan judul “IMPLEMENTASI GUDANG DATA UNTUK KEPRLUAN AKADEMIK MAHASISWA STUDI KASUS FAKULTAS SAINS DAN TEKNOLOGI UNIVERITAS SANATA DHARMA YOGYAKARTA”. Skripsi ini disusun untuk memenuhi salah satu syarat tugas akhir memperoleh gelar Sarjana Teknik Universitas Sanata Dharma.
Selama menyelesaikan skripsi ini, penulis telah banyak memperoleh bimbingan, dukungan, dan bantuan dari banyak pihak. Maka kesempatan ini, penulis ingin menghaturkan banyak terima ksaih kepada:
1. Ridowati Gunawan, S.Kom., M.T., selaku dosen pembimbing skripsi, atas kesabarannya dalam membimbing penulis, memberikan waktu, dukungan,serta saran yang sangat membantu penulis.
2. Puspaningtyas Sanjoyo Adi, S.T., M.T., selaku Kaprodi Teknik Informatika selaku dosen penguji.
3. P.H. Prima Rosa, S.Si., M.Sc. dan Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T., selaku dosen penguji.
4. Seluruh staff pengajar Prodi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma.
5. Kedua orang tua penulis dan Bpk/Ibu Sudaryono yang telah begitu sabar dan setia mendampingi serta memberikan semangat yang luar biasa sehingga skripsi ini dapat terselesaikan.
6. Katarina Ika Yuniana S.Pd. yang begitu setia mendampingi penulis, memberikan semangat.
7. Agustinus Djodi S.Akt., Yohanes Hendra, semua sahabat di Teknik Informatika angkatan 2006, teman-teman dalam satu pengharapan (Paulina Silvia, Cherensia Devi, Alim Untung Widodo S.T, Widyo Sutoto, Tulus
8. Semua pihak yang telah turut membantu dan memberikan dukungan dalam penyelesaian penulisan ini.
Penulis menyadari sepenuhnya bahwa skripsi ini masih jauh dari sempurna. Oleh karena itu, penulis dengan senang hati bersedia menerima sumbangan pikiran dan saran maupun kritik untuk menyempurnakan penulisan ini.
Penulis Setiawan Wasito
DAFTAR ISI
HALAMAN JUDUL ................................................................................................ i HALAMAN PERSETUJUAN ............................................................................... iii HALAMAN PENGESAHAN ................................................................................ iv MOTTO ................................................................................................................... v PERNYATAAN KEASLIAN HASIL KARYA .................................................... vi ABSTRAK ............................................................................................................ vii
ABSTRACT ........................................................................................................... viii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPERNTINGAN AKADEMIS .............................................. ix KATA PENGANTAR ............................................................................................. x DAFTAR ISI ......................................................................................................... xii DAFTAR TABEL ................................................................................................ xvi DAFTAR GAMBAR .......................................................................................... xvii
Bab I. PENDAHULUAN ....................................................................................... 1
1.1. Latar Belakang ..................................................................................... 1
1.2. Rumusan Masalah ................................................................................ 2
1.3. Tujuan .................................................................................................. 2
1.4. Batasan Masalah .................................................................................. 2
1.5. Metodolagi Penelitian .......................................................................... 2
1.6. Sistematika Penulisan .......................................................................... 3
Bab II. LANDASAN TEORI .................................................................................. 4
2.1. Online Transaction Processing (OLTP) ............................................... 4
2.2. Gudang Data ......................................................................................... 4
2.2.1. Komponen Gudang Data ............................................................ 6
2.2.2. Karakteristik Gudang Data ......................................................... 7
2.2.3. Metadata ..................................................................................... 8
2.2.4. Format Data ................................................................................ 9
2.2.7. Data Staging ............................................................................. 11
2.2.8. Implementasi Gudang Data ...................................................... 12
2.3. Extract, Transform, dan Load (ETL) ................................................. 14
2.4. Online Analytical Processing (OLAP) ............................................... 15
2.5. Multi Dimensional Modelling ............................................................ 15
2.5.1. Cube, Dimension, Measure, and Member ................................ 15
2.5.2. Tabel Fakta dan Dimensi (Fact and Dimension Tables) ......... 15
2.5.3. Skema Bintang (Star Schema) ................................................. 16
2.5.4. Surrogate Key .......................................................................... 17
Bab III. ANALISIS DAN PERANCANGAN SISTEM ........................................ 18
3.1. Analisis Kebutuhan ......................................................................... 23
3.2. Analisis Sistem ................................................................................ 23
3.3. Langkah-langkah perancangan gudang data ................................... 23
3.3.1. Membaca Data Legacy .......................................................... 23
3.3.1.1. Sistem Informasi Akademik ..................................... 23
3.3.1.2. Sistem Informasi Penerimaan Mahasiswa Baru ....... 30
3.3.2. Menggabungkan Data Dari Sumber Terpisah ....................... 33
3.3.3. Memindahkan Data Dari Sumber Ke Server Gudang Data .. 34
3.3.4. Memecah Gudang Data Dalam Tabel Fakta Dan Dimensi ... 45
3.3.4.1. Cube khs ................................................................... 46
3.3.4.2. Cube ips .................................................................... 47
3.3.4.3. Cube ipk ................................................................... 48
3.3.4.4. Cube pmb ................................................................. 49
Bab IV. IMPLEMENTASI DAN ANALISA SISTEM ......................................... 50
4.1. Membaca Data Legacy .................................................................... 52
4.1.1. Tabel mhs Database skripsi_fisika ....................................... 52
4.1.2. Tabel mtk Database skripsi_fisika........................................ 53
4.1.3. Tabel kh Database skripsi_fisika .......................................... 53
4.1.4. Tabel tw Database skripsi_fisika .......................................... 54
4.3. Memindahkan data dari sumber ke server gudang data .................. 57
4.3.1. Tabel gabung_mhs_prodi ...................................................... 57
4.3.1.1. Tabel mhs Database skripsi_gabungan .................. 57
4.3.1.2. Tabel gabung_mhs_prodi Database skripsi_gabungan .................................... 58
4.3.1.2.1. Membaca nama tabel.............................. 58
4.3.1.2.1. Set Variabel ............................................ 58
4.3.1.2.3. Memasukkan Variabel ........................... 59
4.3.1.3. Tabel gabung_mhs_prodi Database skripsi_gabungan .................................... 59
4.3.2. Tabel gabung_mtk ................................................................. 60
4.3.3. Tabel gabung_tw_mtk ........................................................... 62
4.3.4. Tabel gabung_khs ................................................................. 63
4.3.5. Tabel ips ................................................................................ 64
4.3.6. Tabel ipk ............................................................................... 65
4.3.7. Tabel gabung_pmb ................................................................ 66
4.4. Memecah gudang data dalam tabel fakta dan tabel dimensi ........... 67
4.4.1. Tabel dimensi dim_mhs_prodi .............................................. 67
4.4.2. Tabel dimensi dim_tw_mtk .................................................. 68
4.4.3. Tabel dimensi dim_ambil ...................................................... 69
4.4.4. Tabel fakta fact_khs .............................................................. 70
4.4.5. Tabel fakta fact_ips ............................................................... 71
4.4.6. Tabel fakta fact_ipk .............................................................. 72
4.4.7. Tabel fakta fact_pmb ............................................................ 73
4.5. Pembentukan Skema Bintang ......................................................... 74
4.5.1. Skema Bintang KHS ............................................................. 74
4.5.2. Skema Bintang IPS ............................................................... 76
4.5.3. Skema Bintang IPK ............................................................... 77
4.5.4. Skema Bintang PMB ............................................................. 79
5.1.1. Hasil KHS Prodi ................................................................... 81
5.1.2. Hasil IPS Prodi ..................................................................... 82
5.1.3. Hasil IPK Prodi .................................................................... 83
5.1.4. Hasil Nilai test Prodi ............................................................ 83
5.2. Kelebihan Sistem ........................................................................... 84
5.3. Kekurangan Sistem ........................................................................ 84
Bab VI. KESIMPULAN ........................................................................................ 85
6.1. Kesimpulan .................................................................................... 85
6.2. Saran ............................................................................................... 86 Daftar Pustaka ........................................................................................................ 87
DAFTAR TABEL
Tabel 2.1. Karakteristik Gudang Data ................................................................... 7Tabel 2.2. Komponen Metadata ............................................................................. 9Tabel 3.1. mhsprodi ............................................................................................. 23Tabel 3.2. Contoh data mhsprodi ......................................................................... 25Tabel 3.3. mtkprodi .............................................................................................. 27Tabel 3.4. Contoh data mtkprodi.......................................................................... 28Tabel 3.5. khprodiangkatan .................................................................................. 29Tabel 3.6. Contoh data master khprodiangkatan .................................................. 29Tabel 3.7. Master twproditahunakademik ............................................................ 30Tabel 3.8. Contoh data master twproditahunakademik ........................................ 30Tabel 3.9. prd_std ................................................................................................. 30Tabel 3.10. Contoh data prd_std ........................................................................... 31Tabel 3.11. nftahunprodi ....................................................................................... 32Tabel 3.12. Contoh Data nftahunprodi .................................................................. 32Tabel 3.13. Tabel mhsprodi .................................................................................. 34Tabel 3.14. Tabel gabung_mhs ............................................................................. 34Tabel 3.15. Tabel gabung_mhs_prodi ................................................................... 35Tabel 3.16. Tabel mtk ........................................................................................... 36Tabel 3.17. Tabel gabung_mtk.............................................................................. 36Tabel 3.18. Tabel tw_prodi ................................................................................... 37Tabel 3.19. Tabel gabung_tw ................................................................................ 38Tabel 3.20. Tabel gabung_tw_mtk........................................................................ 39Tabel 3.21. Tabel khprodi ..................................................................................... 40Tabel 3.22. Tabel gabung_kh ................................................................................ 41Tabel 3.23. Tabel ips ............................................................................................. 42
DAFTAR GAMBAR
Gambar 2.1. Arsitektur Data Warehouse .............................................................. 10Gambar 2.2. Sistem Kerja Data Warehouse ......................................................... 14Gambar 2.3. Star Schema dari PHI-Minimart ....................................................... 17Gambar 3.1. Pelaporan EPSED ............................................................................. 17Gambar 3.2. Ilustrasi tentang studi kasus yang digunakan dalam penelitian ini................................................ 32Gambar 3.3. Star Schema dari fact_gabungan ...................................................... 45Gambar 3.4. Star Schema dari fact_khs ................................................................ 46Gambar 3.5. Star Schema dari fact_ips ................................................................. 47Gambar 3.6. Star Schema dari fact_ipk ................................................................ 48Gambar 3.7. Star Schema dari fact_pmb .............................................................. 49Gambar 4.1. Langkah pembentukan tabel pada gudang data ................................ 51Gambar 4.2. mhs3214.ktr ...................................................................................... 52Gambar 4.3. Tabel mhs3214 ................................................................................. 52Gambar 4.4. mtk3214.ktr ...................................................................................... 53Gambar 4.5. Tabel mtk3214.................................................................................. 53Gambar 4.6. kh32142004.ktr ................................................................................ 53Gambar 4.7. Tabel kh32142004 ............................................................................ 54Gambar 4.8. tw321420041.ktr .............................................................................. 54Gambar 4.9. Tabel tw321420041 .......................................................................... 54Gambar 4.10. pmb_fisika.ktr ................................................................................. 55Gambar 4.11. Tabel nf20043214 ........................................................................... 55Gambar 4.12. Arsitektur Gudang Data .................................................................. 56Gambar 4.13. mhs3214.ktr ..................................................................................... 57Gambar 4.14. Tabel mhs3214 ................................................................................ 57Gambar 4.17. set variabel.ktr ................................................................................. 58Gambar 4.18. memasukkan variabel.ktr ................................................................ 59Gambar 4.19. Tabel gabung_mhs .......................................................................... 59Gambar 4.20. gabung_mhs_prodi.ktr .................................................................... 59Gambar 4.21. Tabel gabung_mhs_prodi ................................................................ 60Gambar 4.22. mtk3214.ktr ..................................................................................... 60Gambar 4.23. Tabel mtk3214................................................................................. 61Gambar 4.24. Tabel mtk......................................................................................... 61Gambar 4.25. Tabel gabung_mtk ........................................................................... 61Gambar 4.26. Tabel tw database skripsi_fisika ..................................................... 62Gambar 4.27. Tabel tw3214 ................................................................................... 62Gambar 4.28. Tabel tw database skripsi_gabungan .............................................. 62Gambar 4.29. Tabel gabung_tw ............................................................................. 63Gambar 4.30. Gabung tw mtk.ktr .......................................................................... 63Gambar 4.31. Tabel gabung_tw_mtk ..................................................................... 63Gambar 4.32. Tabel kh database skripsi_fisika ..................................................... 63Gambar 4.33. Tabel kh database skripsi_gabungan .............................................. 64Gambar 4.34. Tabel gabung_khs ........................................................................... 64Gambar 4.35. ips.ktr ............................................................................................... 64Gambar 4.36. Tabel ips .......................................................................................... 65Gambar 4.37. ipk.ktr .............................................................................................. 65Gambar 4.38. Tabel ipk .......................................................................................... 66Gambar 4.39. Tabel nf database skripsi_pmb ....................................................... 66Gambar 4.40. Tabel gabung_pmb .......................................................................... 66Gambar 4.41. dim_mhs_prodi.ktr .......................................................................... 67Gambar 4.42. Tabel dim_mhs_pro......................................................................... 67Gambar 4.43. dim_tw_mtk.ktr ............................................................................... 68Gambar 4.44. Tabel dim_tw_mtk .......................................................................... 68Gambar 4.45. dim_ambil.ktr .................................................................................. 69Gambar 4.48. Tabel fact_khs ................................................................................. 70Gambar 4.49. fact_ips.ktr ....................................................................................... 71Gambar 4.50. Tabel fact_ips .................................................................................. 72Gambar 4.51. fact_ipk.ktr ...................................................................................... 72Gambar 4.52. Tabel ipk .......................................................................................... 72Gambar 4.53. fact_pmb.ktr .................................................................................... 73Gambar 4.54. Tabel fact_pmb ................................................................................ 73Gambar 4.55. SkemaKHS.xml ............................................................................... 74Gambar 4.56. Hasil SkemaKHS.xml ..................................................................... 75Gambar 4.57. SkemaIPS.xml ................................................................................. 76Gambar 4.58. Hasil SkemaIPS.xml........................................................................ 77Gambar 4.59. SkemaIPK.xml ................................................................................ 77Gambar 4.60. Hasil SkemaIPK.xml ....................................................................... 78Gambar 4.61. SkemaPMB.xml .............................................................................. 79Gambar 4.62. Hasil SkemaPMB.xml ..................................................................... 80Gambar 5.1. Data KHS Prodi pada OLAP ........................................................... 81Gambar 5.2. Data KHS Prodi pada Excel ............................................................ 82Gambar 5.3. Data IPS Prodi pada OLAP ............................................................. 82Gambar 5.4. Data IPK Prodi pada OLAP ............................................................. 83Gambar 5.5. Data Nilai test PMB pada OLAP ..................................................... 83Gambar 5.6. Data Nilai test PMB pada Excel ...................................................... 84BAB I PENDAHULUAN 1.1. Latar Belakang Penerimaan Mahasiswa Baru (PMB) di Universitas Sanata Dharma
dilakukan dengan menggunakan dengan Sistem Informasi PMB. Semua sudah terkomputerisasi dengan baik, semua informasi disimpan dalam
database PMB. Informasi yang disimpan meliputi profil calon mahasiswa,
pendaftaran, nilai test sampai dengan registrasi. Setelah calon mahasiswa itu registrasi maka akan menjadi mahasiswa baru di lingkungan Universitas Sanata Dharma sesuai dengan pilihan program studinya. Semua informasi pada waktu PMB akan dikirim ke Sistem Informasi Akademik. Sistem Informasi Akademik memiliki database yang berbeda, masing-masing berdiri sendiri.
Fakultas Sains dan Teknologi merupakan salah satu Fakultas di Universitas Sanata Dharma. Fakultas ini memiliki 5 buah program studi yaitu Teknik Informatika, Teknik Elektro, Teknik Mesin, Mekatronika, Fisika, dan Matematika. Semua informasi pada kelima prodi tersebut disimpan pada Sistem Informasi Akademik tiap prodi.
Berdasarkan uraian di atas penulis tertarik untuk membuat suatu gudang data guna membantu Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta dalam memantau perkembangan mahasiswa setiap prodi yang digunakan untuk pelaporan EPSBED (Evaluasi Program Studi Berbasis Evaluasi Diri) dan pelaporan nilai test Penerimaan Mahasiswa Baru, penggabungan database PMB dengan database Akademik tiap prodi. Gudang data yang sudah terbentuk akan digunakan untuk keperluan database Online Analytical Processing (OLAP) yang mencakup informasi SKS tiap tahun akademik, Indeks Prestasi Kumulatif (IPK) dan
1.2. Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan diatas, permasalahan yang dapat dirumuskan adalah: Bagaimana membuat suatu gudang data dan
database Online Analytical Processing (OLAP) akademik mahasiswa untuk
Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta dalam memantau perkembangan mahasiswa setiap prodi yang digunakan untuk pelaporan EPSBED (Evaluasi Program Studi Berbasis Evaluasi Diri) dan pelaporan nilai test Penerimaan Mahasiswa Baru.
1.3. Tujuan
Membuat database Online Analytical Processing (OLAP) dari gudang data akademik mahasiswa dan PMB, sehingga diperoleh informasi jumlah SKS, angka_mutu, nilai IPS, nilai IPK selama 4 semester, nilai test PMB yang mencakup nilai verbal, numerik, mekanik, ruang, Bahasa Inggris dan jumlah dari kelima nilai tesebut.
1.4. Batasan Masalah
Agar penulisan tugas akhir ini tidak keluar dari inti dan tujuannya serta tidak menjadi luas dan kompleks, maka perlu diberi batasan pada beberapa hal:
1. Nilai test Penerimaan Mahasiwa Baru (PMB), nilai IPS, dan nilai IPK yang diambil dari mahasiswa Fakultas Sains dan Teknologi Universitas Sanata Dharma angkatan 2004, 2005, 2006, dan 2007 selama 4 semester.
2. Implementasi dengan menggunakan Kettle (Pentaho Data Integration ).
3. Informasi yang telah terbentuk diperuntukkan Dekan Fakultas Sains dan Teknologi dalam memantau perkembangan mahasiswa setiap prodi yang digunakan untuk pelaporan EPSBED (Evaluasi Program
1.5. Metodologi Penelitian 1. Mencari dokumen teks / Excel dari database yang berbeda.
2. Merubah ke dalam gudang data (data warehouse).
3. Membuat skema bintang.
4. Merubah ke dalam database OLAP.
1.6. Sistematika Penulisan
Sistematika penulisan tugas akhir ini terdiri atas enam bab, yang diuraikan selengkapnya sebagai berikut :
BAB I : PENDAHULUAN Bab ini berisi latar belakang penulisan tugas akhir, rumusan
masalah, batasan masalah, metodologi penelitian, dan sistematika penulisan.
BAB II : LANDASAN TEORI Bab ini membahas sekilas tentang gudang data dan juga teori- teori lain yang mendukung dalam penulisan tugas akhir ini. BAB III : ANALISIS DAN PERANCANGAN SISTEM Bab ini berisi analisa dan perancangan gudang data. BAB IV : IMPLEMENTASI DAN ANALISA SISTEM Bab ini berisi pembuatan gudang data. BAB V : ANALISIS HASIL Bab ini berisi laporan dan hasil pembangunan gudang data. BAB VI : KESIMPULAN DAN SARAN Bab ini berisi beberapa kesimpulan yang didapat dan saran-saran berdasarkan hasil pembuatan gudang data.
BAB II LANDASAN TEORI
2.1. Online Transaction Processing (OLTP) Database OLTP berisi informasi sehari-hari yang dibutuhkan oleh
sebuah organisasi untuk menjalankan bisnisnya. Sebuah database OLTP biasanya mengandung data-data yang spesifik terhadap suatu proses bisnis. Beban kerja sistem informasi OLTP difokuskan pada perekaman, perubahan, dan penghapusan data secara real time. Dengan demikian sistem dan
database OLTP sangat mission critical artinya tidak boleh ada gangguan
dalam sistem ini atau operasional tidak bisa berjalan baik. Sistem informasi yang bisa dikategorikan OLTP adalah [1]:
- Enterprise Resource Planning (ERP) dengan contoh produk seperti SAP, Compiere/ Adempiere, Microsoft Dynamics, dan lain-lain.
- Human Resource Management (HRM) dengan contoh produk seperti OrangeHRM, PeopleSoft, dan lain-lain.
2.2. Gudang Data
Gudang data mengintegrasikan data yang telah disimpan dalam periode waktu tertentu dan sering digunakan untuk menambah informasi. Menurut Inmon (1992) gudang data didefinisikan sebagai sekumpulan data yang terintegrasi, basis data berorientasi subyek yang didesain untuk mendukung fungsi sistem pengambilan keputusan, dimana setiap unit dari data adalah non-volatile dan relevan untuk waktu tertentu [2]. Gudang data lebih besar dari beberapa jenis basis data, ukurannya mencapai gigabyte bahkan sampai dengan terabyte.
Secara fisik gudang data memisahkan operasional dengan diakses. Gudang data juga melakukan transformasi dari data operasional ke dalam bentuk relasional, akan tetapi tidak seluruh data yang ditransformasikan hanya data yang dibutuhkan untuk pengambilan keputusan saja. Dalam sebuah organisasi dimungkinkan untuk membuat gudang data lebih dari satu. Gudang data merupakan salah satu solusi untuk masalah akses data.
Keuntungan dari gudang data adalah sebagai berikut [2]: a. Meningkatkan produktifitas pengetahuan para pekerja.
b. Mendukung seluruh data yang diperlukan oleh pengambil keputusan.
c. Menyediakan data yang siap diakses untuk data yang penting d. Melindungi operasi basis data dari proses ad hoc.
e. Menyediakan ringkasan informasi untuk level tingkat tinggi.
f. Menyediakan kemampuan untuk penelusuran informasi lebih dalam. Hasil yang dapat diperoleh dari gudang data adalah sebagai berikut: a. Meningkatkan pengetahuan bisnis.
b. Mampu melakukan persaingan bisnis bahkan menjadi pemimpin bisnis.
c. Mempertinggi service dan kepuasan pelanggan.
d. Memberikan fasilitas pembuatan keputusan.
e. Membantu mempersingkat proses bisnis. Ada 2 asumsi yang dibuat terhadap gudang data yaitu [2]: a. Gudang data secara fisik terpisah dari seluruh sistem operasional.
b. Gudang data menggabungkan data dan data transaksi untuk manajemen dan memisahkan mereka dari yang digunakan untuk transaksi on-line.
Tidak seluruh organisasi memerlukan gudang data, gudang data sebaiknya digunakan untuk organisasi yang [2]: informasi.
c. Data besar dengan bermacam-macam jenis pengguna.
d. Memiliki data yang sama dengan representasi berbeda dalam sistem yang berbeda.
e. Format data yang tidak beraturan.
2.2.1. Komponen Gudang Data
Ada banyak komponen yang terdapat dalam gudang data, diantaranya [2]:
1. Penyimpan data Penyimpan data operasional adalah komponen yang paling umum dalam gudang data. Setiap hari organisasi akan melakukan penyimpanan data operasional dimana data yang disimpan adalah tunggal untuk suatu aplikasi tertentu. Fungsi dari penyimpanan data operasioanal dalam gudang data adalah sebagai sumber aliran data mentah. Organisasi dalam penyimpanan data ini pada umumnya berorientasi subyek, dan berfokus pada pelanggan, produk, order, kebijakan hal lain diseputarnya. Penyimpanan data ini sering juga disebut sebagai gudang data secara fisik.
2. Data pasar (mart data) Data pasar adalah bagian dari gudang data dimana hanya data yang relevan saja yang dipelihara. Data pasar sering dilihat sebagai cara untuk meningkatkan masukan ke dalam bidang dari gudang data dan membuat seluruh kesalahan menjadi kecil. Data pasarnya biasanya digunakan oleh firma untuk memperkecil biaya dan memperkecil skala.
3. Metadata Metadata merupakan salah satu contoh dari gudang data secara logikal. Yang digunakan untuk memperoleh informasi dan mengakses data secara aktual. Sistem legacy pada umumnya tidak menyimpan data dapat diakses. Metadata adalah data sederhana tentang data yaitu lebih memperhatikan informasi yang disimpan tentang gudang dari pada informasi yang disediakan oleh gudang.
4. Sistem pendukung keputusan dan sistem informasi eksekutif.
Keduanaya bukanlah bagian dari gudang data akan tetapi aplikasi- aplikasinya digunakan untuk gudang data.
2.2.2. Karakteristik Gudang Data
Karakteristik utama dari gudang data dalam dilihat pada table 2.1:
Tabel 2.1 : Karakteristik Gudang Data [2]Karakteristik Deskripsi
Subject Orientation Data diorganisir sesuai dengan kebutuhan user.
Integrated Menghilangkan kerancuan dalam hal penamaan dan kekacauan informasi. Data harus “clean”. Nonvolatile Data hanya dapat dibaca, tidak dapat diubah oleh user Time-series Data dalam rangkaian waktu, bukan hanya status saat ini. Summarized Data operasioanl dikumpulkan (diringkas), untuk mendukung keputusan. Larger Memelihara data dari waktu ke waktu selama diperlukan. Not Normalized Data dapat redundant. Metadata Data mengenai data untuk user dan personil gudang data.
Data operasioanal ditambah data eksternal yang
Input dibutuhkan.
2.2.3. Metadata
Metadata adalah data mengenai data. Ini adalah informasi tentang gudang data bukan informasi yang disediakan oleh gudang. Metadata menghasilkan 2 hal essensial yaitu staf dan user dari gudang data. Setiap grup membutuhkan informasi yang berbeda. Untuk staf gudang data, metadata mengandung [2]:
a. Sebuah direktori tentang apakah isi dari gudang data. Direktori menginformasikan dimana data disimpan. Ini adalah sebuah index yang digunakan ketika sebuah query diajukan untuk menemukan informasi yang benar.
b. Sebuah petunjuk untuk memetakan data dari bentuk operasional ke bentuk gudang. Ketika data dipindahkan ke gudang, data harus dalam format standar dan harus harus mengikuti ketentuan yang berlaku pada gudang yaitu harus bersih. Petunjuk harus menyediakan instruksi bagaimana setiap kelompok data ditransformasikan sehingga menjadi bentuk yang benar.
c. Aturan yang digunakan untuk membuat ringkasan. Bagi pengguna gudang data, metadata mengandung: a. Istilah bisnis yang digunakan untuk menggambarkan data.
b. Nama-nama teknis yang sesuai dengan istilah bisnis yang dapat digunakan untuk akses data.
c. Sumber data, aturan yang digunakan untuk mengambil data dan kapan data dibangun.
Secara konseptual, metadata dikelompokkan dalam 3 komponen dapat dilihat pada table 2.2:
Tabel 2.2 : Komponen MetadataKomponen Isi Pengguna Direktori Teknis Informasi tentang data Data warehouse administrator.
Direktori Bisnis Perspektif pengguna End user terhadap data. Petunjuk Informasi Akses ke direktori bisnis End user dan gudang data
2.2.4. Format Data
Konsep normalisasi data dalam sistem transaksi, mempunyai popularitas yang panjang dalam database relational, namun tidak dapat dipakai dalam gudang data. Dalam sistem transaksi perhatian utama adalah untuk mengeliminasi redundansi. Prinsipnya, space penyimpanan itu mahal dan tidak seharusnya diboroskan.
Filosofi dalam gudang data adalah mengatur data sehingga mudah digunakana dan dapat diperoleh kembali dengan cepat. Redundansi sangat dibenarkan.
2.2.5. Arsitektur Gudang Data Banyak sekali aritektur gudang data yang dikemukakan, akan tetapi
pada umumnya memiliki bentuk seperti pada gambar 2.1 [2]:
Visualization
Sumber Data Yang Berbeda
Metadata Extract Transform
Serves Load
OLAP Refresh
Data Warehouse Operational Databases Data Mining
Gambar 2.1 : Arsitektur Data WarehouseSetiap hari organisasi melakukan kegiatan dan melakukan perubahan terhadap basis data operasional. Data dari basis data operasioanl dan sumber data eksternal lainnya disimpulkan dengan menggunakan gateway atau standar eksternal penghubung yang lain yang mendukung DBMS seperti Open Database Connectivity (ODBC). ODBC adalah program aplikasi yang menghubungkan antara program client untuk menghasilkan pernyataan SQL agar dapat dilakukan eksekusi oleh server. Ada 3 jenis gudang data yaitu:
1. Gudang data virtual: membiarkan pemakai untuk melakukan akses secara langsung ke dalam data operasional. Disini gudang data bersifat virtual, tidak real. Gudang data virtual biasanya digunakan untuk memperkecil biaya operasional dan biasanya untuk mengetahui data apa yang sebenarnya dicari oleh pemakai. atau divisi. Gudang data terpusat ini biasanya dipilih jika ada data yang dibutuhkan secara umum dan ada sejumlah pemakai yang telah siap terhubung melalui jaringan komputer. Gudang data ini real yang berarti data yang disimpan dalam gudang data ada secara fisik dan diakses dari suatu tempat dan harus selalu dipelihara.
3. Gudang data terdistribusi. Sesuai dengan namanya, komponen- komponen dari gudang data terdistribusi melalui sejumlah penyimpanan fisik basis data.
2.2.6. Langkah Pembuatan Gudang Data
1. Membaca data legacy Memperhatikan bagian-bagian data yang perlu untuk dibersihkan
2. Menggabungkan data dari berbagai sumber terpisah Setiap jenis informasi yang diinginkan mungkin berasal dari beberapa
file yang harus digabungkan untuk digunakan pada gudang data.
3. Memindahkan data dari sumber ke server gudang data Membuat standarisasi format dan copy-kan data dari sumber sekaligus data dibuat bersih (clean).
4. Memecah gudang data dalam tabel fakta dan tabel dimensi Tabel fakta dan tabel dimensi disusun menurut kebutuhan subyek.
2.2.7. Data Staging Data staging merupakan buffer untuk mengintegrasikan data.
Dengan buffer ini proses ETL pada gudang data akan cepat. Hal lain yang menjadikan data staging sebagai solusi yang sangat baik adalah karena proses di memori (RAM) tentunya sangat terbatas dan ujung-ujungnya akan mencari space di hard drive untuk paging/ caching. Dengan batasan seperti itu, akhirnya lama kelamaan proses di merory akan penuh terus dan malah menjadi bottleneck di ETL kita. Oleh karena itu apabila terjadi
2.2.8. Implementasi Gudang Data
Ada banyak cara untuk membuat dan memelihara sebuah gudang
data yang besar. Basis data dengan skema yang baik harus didesain agar mudah melakukan integrasi dengan sekumpulan data yang sumbernya terpisah. Permasalahan yang terjadi pada saat membuat gudang data adalah masalah “integrasi semantik”. Bila sumber data berasal dari sumber yang berbeda tentunya semantiknya berbeda pula. Gudang data harus dapat melakukan proses pembersihan terhadap data. Data dengan maksud yang sama seharusnya dipandang sama. Perbedaan-perbedaan harus dihilangkan dalam gudang data.