Penerapan slowly changing dimensions untuk mendukung pembentukan dimensi dinamis pada data warehouse : studi kasus Dinas Kependudukan dan Pencatatan Sipil Kabupaten Klaten - USD Repository

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  

PENERAPAN SLOWLY CHANGING DIMENSIONS UNTUK

MENDUKUNG PEMBENTUKAN DIMENSI DINAMIS PADA DATA

WAREHOUSE

(Studi Kasus: Dinas Kependudukan dan Pencatatan Sipil Kabupaten Klaten)

Skripsi

  Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

  Program Studi Teknik Informatika Oleh:

  Gadis Pujiningtyas Rahayu NIM : 085314079

  PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2013

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  

THE IMPLEMENTATION OF SLOWLY CHANGING DIMENSIONS

FOR SUPPORTING THE FORMATION OF DYNAMIC DIMENSION IN

THE DATA WAREHOUSE

(Case Study: Dinas Kependudukan dan Pencatatan Sipil Kabupaten Klaten)

A Thesis

  Presented as Partial Fullfillment of the Requirements To Obtain the Sarjana

  

Komputer Degree

  By: Gadis Pujiningtyas Rahayu

  NIM : 085314079

  

INFORMATICS ENGINEERING STUDY PROGRAM

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2013

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

KATA PENGANTAR

  Segala puji syukur penulis panjatkan kepada Allah Bapa di Surga, karena berkat dan penyertaan-Nya penulis dapat menyelesaikan penyusunan tugas akhir yang berjudul “Penerapan Slowly Changing Dimensions untuk Mendukung Pembentukan Dimensi Dinamis Pada Data Warehouse (Studi Kasus : Dinas Kependudukan dan Pencatatan Sipil Kabupaten Klaten)”. Tugas akhir ini disusun sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu pada Program Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta. Pada saat pengerjaan tugas akhir ini penulis banyak mendapatkan bantuan dari berbagai pihak, oleh karena itu penulis ingin mengucapkan terima kasih kepada:

  1. Ibu Ridowati Gunawan, S.Kom, M.T. Ketua Prodi Teknik Informatika sekaligus dosen pembimbing. Yang telah memberikan bimbingan, arahan, saran, petunjuk-petunjuk, meluangkan waktu, dan kebaikannya sehingga penulis dapat menyelesaikan tugas akhir ini.

  2. Ibu Paulina Heruningsih Prima Rosa, SSi., MSc, selaku Dekan Fakultas Sains dan Teknologi dan dosen penguji.

  3. Ibu Sri Hartati Wijono, S.Si., M.Kom selaku dosen penguji yang telah memberikan kritik dan saran

  4. Kedua orang tua, Bapak Supriyanta dan Ibu Sri Poniyem, dan adik Betrik yang selalu memberikan dukungan, doa, perhatian, semangat, dan motivasi.

  5. Bapak Rudy Widodo, selaku Admin DISDUKCAPIL Kabupaten Klaten, yang telah mengizinkan penulis untuk melakukan studi kasus.

  6. Agustinus Agus Triyono, yang selalu memberikan dukungan pada penulis saat mengerjakan Tugas Akhir ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  viii

  7. Sahabat dan teman-teman semua, Ancel, Siska, Endra, Ika, Esy, Vava, Reza, Lie, Roy, Kevin, Angga, Surya dan semua temen-teman TI’08 yang selalu membantu penulis saat mengalami kesulitan dalam mengerjakan Tugas Akhir ini, dan selalu memberikan dukungan semangat dan doa.

  8. Serta semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis dalam menyelesaikan tugas akhir ini.

  Penulis merasa masih banyak kekurangan dalam penyusunan laporan tugas akhir ini. Untuk itu, penulis mengharapkan saran dan kritik yang membangun dari pembaca. Semoga tugas akhir ini dapat bermanfaat, khususnya pada bidang Teknik Informatika.

  Yogyakarta, 20 Februari 2013 Penulis

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  

PENERAPAN SLOWLY CHANGING DIMENSIONS UNTUK

MENDUKUNG PEMBENTUKAN DIMENSI DINAMIS PADA DATA

WAREHOUSE

(Studi Kasus : Dinas Kependudukan dan Pencatatan Sipil Kabupaten Klaten)

  Gadis Pujiningtyas Rahayu

  

ABSTRAK

  DISDUKCAPIL Kabupaten Klaten adalah instansi Pemerintah yang mengelola data penduduk di Kabupaten Klaten. Dalam pengelolaan data, utamanya bagi Pemerintah Daerah yang memiliki data penduduk dengan volume besar dan tersebar ke dalam database terpisah, dewasa ini telah ada teknologi

  

data warehouse. Data penduduk yang tersimpan dapat mengalami perubahan, hal

  ini merefleksikan aspek dinamis dari data warehouse sehingga memerlukan

  

updating beberapa dimensi . Tabel dimensi memiliki peran yang sangat penting

  dalam setiap Data Warehouse. Peran utama tabel dimensi adalah untuk mendukung catatan tabel fakta dengan deskripsi dan informasi lain tentang entitas yang terlibat pada catatan ini. Untuk mendukung pembentukan dimensi yang dinamis dalam sebuah data warehouse diimplementasikan sebuah kriteria

  

dimensional yaitu Slowly Changing Dimensions (SCD) sehingga setiap perubahan

data dapat terpelihara dengan baik.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  

THE IMPLEMENTATION OF SLOWLY CHANGING DIMENSIONS

FOR SUPPORTING THE FORMATION OF DYNAMIC DIMENSION IN

THE DATA WAREHOUSE

(Case Study : Dinas Kependudukan dan Pencatatan Sipil Kabupaten Klaten)

  Gadis Pujiningtyas Rahayu

  

ABSTRACT

  DISDUKCAPIL Kabupaten Klaten is a government agency that manages the population data around Kabupaten Klaten. Within the data management, especially for the Local Government (Pemerintah Daerah) that has a big volume of population distributed into separate database, recently there has been a warehouse technology. Since the population data that has been saved might have been changing, such matter reflects the dynamic aspect of Data Warehouse so that it might take the updating of several dimensions. The dimension table has a very important role in each of Data Warehouse. The main role of dimension table is to support the note of fact table by means of description and other entity involved in the related note. In order to support the formation of dynamic dimension within a

  

Data Warehouse , the researcher implement a dimensional criterion namely

  Slowly Changing Dimension (SCD) so that each of changes might be preserved in a well manner.

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

DAFTAR ISI

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  xii

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  xiii

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

DAFTAR GAMBAR

  

   embentukan Tabel Dimensi Agama ....................................................... 3-2

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  xv Pembentukan Tabel Dimensi Pekerjaan .................................................. 3-2 embentukan Tabel Dimensi Pendidikan ................................................ 3-2 embentukan Tabel Dimensi Golongan Darah ........................................ 3-3 Pembentukan Tabel Dimensi Jenis Kelamin ............................................ 3-3 Pembentukan Tabel Dimensi Akta Kawin ............................................... 3-3 embentukan Tabel Dimensi Akta Cerai ................................................. 3-4 embentukan Tabel Dimensi Akta Lahir ................................................. 3-4 Pembentukan Tabel Dimensi Wilayah ..................................................... 3-4 Pembentukan Tabel Dimensi penyandang cacat ...................................... 3-5 embentukan Tabel Dimensi Kelompok Umur ....................................... 3-5 embentukan Tabel tf_penduduk ............................................................. 3-6

   ms_agama.ktr ........................................................................................... 4-5

  Tabel ms_agama....................................................................................... 4-6

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  xvi

  

  

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  xvii 8

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

DAFTAR TABEL

  

  

   Tabel 4. 5 Struktur lap_aktalhtjeniskelumur.jsp…………………………………………47

  xix

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  xx

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

BAB I PENDAHULUAN

1.1 Latar Belakang

  Data dapat digunakan untuk membantu suatu instansi pemerintah, organisasi, perusahaan, maupun perorangan dalam memperoleh informasi yang dibutuhkan. Data yang ada akan menjadi lebih informatif jika dilakukan suatu proses pengolahan. Informasi tersebut dapat digunakan untuk banyak hal, antara lain adalah untuk membuat laporan Kependudukan dan Pencatatan Sipil dari setiap kota dalam rangka penyusunan Buku Data Kependudukan.

  Informasi dan data yang dikelola atau dimiliki oleh Pemerintahan Daerah salah satunya adalah dari Dinas Kependudukan dan Pencatatan Sipil (DISDUKCAPIL) Kabupaten Klaten, kini telah berubah menjadi aset berharga untuk menentukan keputusan dalam perencanaan pembangunan dan pengembangan daerah guna pengambilan kebijakan Pemerintah dalam rangka menyejahterakan penduduk. Tanpa pengelolaan dan pemanfaatan data maupun informasi tersebut secara maksimal maka boleh dikatakan Pemerintah tersebut tidak memaksimalkan salah satu potensi yang dimiliki untuk memantau kesejahteraan penduduknya.

  Selain itu untuk memutuskan kebijakan yang cepat dan tepat, data dan informasi tersebut perlu dipelihara untuk kemudahan akses jika sewaktu-waktu dibutuhkan misalnya untuk keperluan analisa pertambahan penduduk, pendukung keputusan kebijakan Pemerintah dan lain sebagainya. Kemudahan akses data-data operasional yang bersifat historical dapat dikembangkan menjadi informasi guna kebutuhan perencanaan atau kebutuhan strategis ke depan dengan tujuan memperoleh informasi yang relevan bagi kebutuhan Pemerintah yang dipakai untuk pengambilan keputusan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  2 Untuk mendukung pengelolaan data yang baik, utamanya bagi Pemerintah

  Daerah yang memiliki data penduduk dengan volume besar dan tersebar ke dalam

  database terpisah, dewasa ini telah ada teknologi Data Warehouse yang dapat

  menggabungkan data dari berbagai sumber data operasional dan sinkronisasi datanya dapat dilakukan secara periodik maupun real time, disesuaikan dengan kebutuhan yang ada. “A Data Warehouse is a Subject Oriented, Integrated, Non-

  

Volatile, and Time-variant collection of data in support of management’s

decisions” (Inmon,2005). Penerapan Data Warehouse yang baik dan sesuai

  dengan kebutuhan secara otomatis memudahkan pengelolaan data dan proses pengambilan informasi dari sumber data. Selanjutnya adalah bagaimana data tersebut dapat disajikan secara informatif.

  DISDUKCAPIL Kabupaten Klaten adalah instansi Pemerintah yang mengelola data kependudukan di Kabupaten Klaten. Dalam rangka penyusunan Buku Data Kependudukan Provinsi Jawa Tengah, pihak Pemerintah provinsi Jawa Tengah atas nama Dinas Tenaga Kerja, Transmigrasi dan Kependudukan (DINAKERTRANSDUK) meminta laporan data penduduk kepada DISDUKCAPIL Kabupaten Klaten secara periodik dalam kurun waktu 3 bulan. Sistem Administrasi Kependudukan (SIAK) belum cukup membantu dalam menyelesaikan laporan data penduduk, dikarenakan fasilitas yang disediakan SIAK belum dapat menyediakan informasi secara detail seperti yang diharapkan DINAKERTRANSDUK sehingga untuk mendapatkan informasi yang lebih detail seperti jumlah penduduk berdasar kelamin perempuan dan laki-laki ditinjau dari dimensi usia, dan lain sebagainya masih diperlukan query manual satu persatu dari data yang dibutuhkan. Dengan adanya Data Warehouse DISDUKCAPIL Kabupaten Klaten dapat terbantu dalam mengelola dan mengintegrasikan data yang ada sehingga diperoleh informasi penduduk yang dapat ditinjau dari berbagai dimensi ( jenis kelamin, agama, pekerjaan, penyandang cacat, akta

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  3 kawin, akta lahir, akta cerai, pendidikan, kecamatan, usia, wilayah dan golongan darah ).

  Admin masing-masing Kecamatan mengentrikan data penduduk yang disimpan kedalam database SIAKDB dan dapat diambil dengan mudah rangkuman datanya ketika digudangkan dalam suatu basisdata besar (Data

  Warehouse

  ) terlebih dahulu. Data yang telah disimpan dapat mengalami perubahan, hal ini menunjukkan aspek dinamis dari Data Warehouse sehingga memerlukan updating beberapa dimensi. Perubahan-perubahan dalam catatan dimensi dapat menyebabkan situasi tidak teratur jika tidak diperlakukan dengan baik. Untuk mendukung pembentukan dimensi yang dinamis dalam sebuah Data

  

Warehouse diimplementasikan sebuah kriteria Dimensional yaitu Slowly

Changing Dimensions (SCD) sehingga data Histori dapat tersimpan dan diakses

  sewaktu-waktu. Data Warehouse yang dengan teknologi OLAP (Online

  

Analytical Processing ) memungkinkan dilakukan query dengan cepat dan

menghasilkan informasi secara multidimensi.

  1.2 Rumusan masalah

  Berdasarkan latar belakang masalah tersebut maka rumusan masalah yang akan dipaparkan adalah : Bagaimana membangun sistem database OLAP (Online

  

Analytical Processing ) dengan dengan mengimplementasikan SCD type 2 yang

  mendukung pembentukan dimensi dinamis pada Data Warehouse untuk membantu DISDUKCAPIL Kabupaten Klaten dalam mengelola data penduduk.

  1.3 Tujuan

  Menerapkan SCD type 2 dalam pembentukan dimensi dinamis pada Data Warehouse untuk membangun sistem database OLAP.

  1.4 Batasan Masalah

  Penelitian ini akan dibatasi pada hal-hal berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  4

  1. Data penduduk yang digunakan adalah data penduduk yang ada di DISDUKCAPIL Kabupaten Klaten.

  2. Informasi OLAP yang terbentuk digunakan oleh DISDUKCAPIL Kabupaten Klaten dalam membantu penyusunan laporan data penduduk kepada DINAKERTRANSDUK.

  3. Dalam mendukung dimensi yang dinamis diterapkan SDC type 2 untuk menyimpan Histori data penduduk.

  4. Penerapan SDC type 2 dan pembangunan Data Warehouse menggunakan tools kettle.

  5. OLAP server yang digunakan yaitu Mondrian.

  6. Sistem OLAP yang dibangun hanya untuk melengkapi fitur SIAK dan tampilan dibuat sesederhana mungkin sesuai dengan keiinginan pihak DISDUKCAPIL Kabupaten Klaten.

1.5 Metodologi Penelitian

  Metodologi penelitian yang dilaksanakan dalam penyusunan Tugas Akhir ini adalah sebagai berikut:

1. Mengumpulkan informasi dan data

a) Metode Analisis

  Metode ini digunakan untuk mendapatkan informasi yang diperlukan untuk mencapai tujuan. Metode ini terdiri dari beberapa tahapan yaitu :

  a. Studi kepustakaan Merupakan teknik pengumpulan data untuk mendapatkan informasi dari berbagai sumber seperti media cetak, buku-buku, dan situs–situs sebagai dasar dari pengembangan, serta tesis–tesis terdahulu dengan tema serupa sebagai bahan pembanding penulisan skripsi ini.

  b. Survey terhadap kebutuhan user PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  5 Melakukan wawancara dengan bapak Rudy Widodo selaku

  Admin SIAK di DISDUKCAPIL Kabupaten Klaten pada tanggal 10 Februari 2012 untuk mengetahui hal–hal lain yang berhubungan dengan perancangan aplikasi data warehouse ini, sehingga program yang dihasilkan sesuai dengan yang diharapkan.

  c. Analisis data terhadap hasil survey Melakukan analisis secara deskriptif terhadap informasi- informasi yang telah didapatkan dari hasil wawancara dengan bapak

  Rudy Widodo selaku Admin SIAK di DISDUKCAPIL Kabupaten Klaten pada tanggal 10 Februari 2012 untuk mengindentifikasi masalah, dan mencari solusi yang tepat untuk pemecahan masalah tersebut.

  b) Metode Perancangan Metode yang dipakai untuk merancang data warehouse adalah menggunakan Nine-Step Methodology menurut Kimball (lihat 2.6).

  2. Pengujian SCD type 2.

  a. Menyiapkan data baru yang akan ditransformasi membentuk dimensi.

  b. Menyiapkan data penduduk baru yang mempunyai data dimensi baru.

  c. Melakukan transformasi implementasi SDC type 2.

  d. Melihat hasil database OLAP dan report histori data penduduk dari antar muka pengguna.

  3. Membuat kesimpulan.

  1.6 Sistematika Penulisan

  Bab I Pendahuluan Bab ini berisi tentang pembahasan latar belakang, rumusan masalah, tujuan, batasan masalah, metodologi penelitian, dan sistematika penulisan.

  Bab II Landasan Teori

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  6

  Bab ini membahas sekilas tentang Data Warehouse dan juga teori- teori lain yang mendukung dalam penulisan tugas akhir ini. Bab III Analisis dan Perancangan Sistem Bab ini membahas langkah-langkah yang akan dilakukan dalam penelitian serta proses analisa dari langkah-langkah tersebut yang kemudian akan diimplementasikan.

Bab IV Implementasi dan Analisis Sistem Bab ini memuat proses penerapan SDC type 2 yang mendukung pembentukan dimensi dinamis pada Data Warehouse. Bab V Analisis Hasil Bab ini berisi hasil implementasi sistem yang telah dibangun dan pengujian sistem. Bab VI Penutup Bab ini berisi kesimpulan dari sistem yang telah dibuat serta saran untuk pengembangan dan penyempurnaan Tugas Akhir ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

BAB II LANDASAN TEORI

  2.1 Pengertian Data Warehouse

  Menurut W.H. Inmon (1992) Data Warehouse didefinisikan sebagai sekumpulan data yang terintegrasi, basis data berorientasi subyek yang di desain untuk mendukung fungsi sistem penggambilan keputusan, dimana setiap unit dari data adalah non-volatile dan relevan untuk waktu tertentu (Connolly dkk,2008).

  2.2 Fungsi Data Warehouse Data Warehouse mempunyai kegunaan sebagai berikut [2]:

  1. Pembuatan laporan Pembuatan laporan merupakan salah satu kegunaan Data Warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari, perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.

  2. OnLine Analytical Processing (OLAP) Dengan adanya Data Warehouse, semua informasi baik detail maupun summary yang dibutuhkan dalam proses analisa mudah didapat. Fasilitas lain yang ada pada software OLAP adalah fasilitas roll – up dan drill – down. Drill

  • – down adalah kemampuan untuk melihat detail dari suatu informasi dan roll –

    up adalah kebalikannya.

  3. Data mining

  Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.

  4. Proses informasi eksekutif Dengan menggunakan Data Warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  8 mempermudah proses pengambilan keputusan. Informasi dan data pada laporan Data Warehouse menjadi target informative bagi user.

2.3 Keuntungan Data Warehouse

  Keuntungan yang dapat diambil saat menerapkan data warehouse[2] :

  1. Meningkatkan produktifitas dari pengambilan keputusan perusahaan / organisasi / instansi.

  Data warehouse meningkatkan produktifitas dari pengambil

  keputusan dengan membuat integrasi database yang konsisten, berorientasi subjek dan Histori kal data. Data warehouse mengintegrasikan data dari banyak sistem yang tidak kompatibel menjadi suatu bentuk yang menyediakan satu tampilan yang konsisten mengenai perusahaan. Dengan mentransformasikan data menjadi informasi yang berguna, data warehouse mengijinkan si pengambil keputusan untuk melakukan analisis lebih sesuai dengan kenyataan, akurat dan konsisten.

  2. Potensi ROI (Return Of Investment) yang besar.

  Suatu perusahaan akan mengeluarkan sumber daya yang cukup besar untuk mengimplementasikan data warehouse dan pengeluaran yang berbeda- beda sesuai dengan variasi solusi teknikal yang akan diterapkan pada perusahaan. Bagaimana pun juga. Suatu studi oleh International Data

  Corporation (IDC) pada tahun 1996 melaporkan bahwa rata-rata tiga tahun return of investment

  (ROI) dalam data warehouse mencapai 401% dengan lebih dari 90% dari perusahaan yang diSurvey mencapai lebih dari 40% ROI, setengah dari perusahaan mencapai lebih dari 160% ROI, dan seperempat lebih mendapat lebih dari 600% ROI (IDC, 1996).

  3. Competitive Advantage.

  Return on investment yang besar dari perusahaan yang berhasil

  mengimplementasikan suatu data warehouse adalah bukti dari sangat

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  9 besarnya competitive advantage yang dapat diperoleh dengan menggunakan teknologi ini. Competitive advantage diperoleh dengan mengijinkan si pengambil keputusan untuk mengakses data tersembunyi yang sebelumnya tidak tersedia, tidak di ketahui, dan tidak dimanfaatkan seperti data mengenai pelanggan, tren, dan permintaan.

2.4 Karakteristik Data Warehouse

  Menurut Inmon karakteristik Data Warehouse sebagai berikut[1] : 1.

   Subject Oriented (Berorientasi subject) Data Warehouse berorientasi subject artinya Data Warehouse

  didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.

  Data Warehouse diorganisasikan disekitar subjek-subjek utama dari

  perusahaan(customers, products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing, stock control dan product sales). Hal ini dikarenakan kebutuhan dari Data Warehouse untuk menyimpan data- data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.

  Di bawah ini adalah tabel 2.1 perbedaan antara sistem OLTP dan sistem data warehouse menurut Connolly dan Begg (2005).

  Tabel 2. 1 Perbandingan Sistem OLTP dan Sistem Data warehouse

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  10

  2. Integrated (Terintegrasi) Data Warehouse

  dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah- pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep Data Warehouse itu sendiri.

  Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variabel, konsisten dalam ukuran variabel, konsisten dalam struktur pengkodean, dan konsisten dalam atribut fisik dari data.

  3. Time-variant (Rentang Waktu)

  Seluruh data pada Data Warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu Data Warehouse , kita dapat menggunakan cara antara lain :

a. Cara yang paling sederhana adalah menyajikan Data Warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.

  b. Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam Data Warehouse baik implicit maupun explicit secara

  explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir

  bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  11 c. Cara yang ketiga,variasi waktu yang disajikan Data Warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.

4. Non-Volatile

  Karakteristik keempat dari Data Warehouse adalah non-volatile, maksudnya data pada Data Warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara continue menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.

  Berbeda dengan database operasional yang dapat melakukan update,

  insert dan delete terhadap data yang mengubah isi dari database sedangkan

  pada Data Warehouse hanya ada dua kegiatan memanipulasi data yaitu Load

  ing data (mengambil data) dan akses data (mengakses Data Warehouse seperti

  melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data.

2.5 Arsitektur Data Warehouse

  Arsitektur gudang data (Data Warehouse) dapat dilihat pada gambar 2.1 sebagai berikut [2]:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  12 Gambar 2. 1 Arsitektur Gudang Data

  Berikut ini adalah tiga jenis dasar sistem Data Warehouse [2]: 1.

   Functional Data Warehouse ( Data Warehouse Fungsional)

  Kata fungsional disini merupakan database yang diperoleh dari kegiatan sehari-hari. Data Warehouse dibuat lebih dari satu dan dikelompokkan berdasar fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan(financial), marketing, personalia dan lain-lain.

  Keuntungan dari bentuk Data Warehouse seperti ini adalah, sistem mudah dibangun dengan biaya relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna.

2. Centralized Data Warehouse ( Data Warehouse Terpusat )

  Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat, kemudian data disebar ke dalam fungsinya masing-masing, sesuai kebutuhan perusahaan. Data warehouse terpusat ini, biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal.

  Keuntungan dari bentuk ini adalah data benar-benar terpadu karena konsistensinya yang tinggi sedang kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup lama untuk membangunnya.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  13

3. Distributed Data Warehouse ( Data Warehouse terdistribusi)

  Pada data warehouse terdistribusi ini, digunakan gateway yang berfungsi sebagai jembatan penghubung antara data warehouse dengan

  workstation

  yang menggunakan sistem beraneka ragam. Dengan sistem terdistribusi seperti ini memungkinkan perusahaan dapat mengakses sumber data yang berada diluar lokasi perusahaan (eksternal).

  Keuntungannya adalah data tetap konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi. Kerugiannya adalah lebih kompleks untuk diterapkan karena sistem operasi dikelola secara terpisah juga biayanya yang paling mahal dibandingkan dengan dua bentuk Data Warehouse lainnya.

2.6 Tahapan Membangun Data Warehouse

  Menurut Kimball, metode yang dipakai untuk merancang data warehouse adalah Nine-Step Methodology (Connolly & Begg, 2005, p. 1187) :

  1. Choosing the process (pemilihan proses) Melakukan pemilihan proses pada materi subjek yang dibutuhkan oleh data

  mart pada tahap ini ditentukan pada proses bisnis apa data warehouse akan digunakan.

  2. Choosing the Grain (pemilihan grain) Menentukan secara tepat apa yang direpresentasikan oleh record tabel fakta.

  3. Indetifying and Conforming the Dimension (identifikasi dan konfirmasi dimensi) Membuat set dimensi yang dibutuhkan untuk menjawab seluruh pertanyaan yang diajukan pada tabel fakta.

  4. Choosing the Facts (pemilihan fakta) Pemilihan tabel fakta yang dapat diimplikasikan sesuai grain yang digunakan pada data mart.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  14

  5. Storing Pre-Calculation In the Fact Table (penyimpanan Pre- Calculation di tabel fakta) Setelah tabel fakta terpilih, setiap tabel fakta tersebut harus diperiksa ulang untuk menentukan apakah ada fakta yang dapat diterapkan pre-kalkulasi dan kemudian dilakukan penyimpanan pada tabel fakta.

  6. Rounding Out the Dimension Tables (melengkapi tabel dimensi) Pada tahap ini dilakukan pemeriksaan ulang pada tabel dimensi dan menambahkan deskripsi teks terhadap dimensi, serta menentukan hirearki atribut dimensi untuk mempermudah proses analisis.

  7. Choosing the Duration of the Database (pemilihan durasi database) Menentukan waktu periode database untuk beberapa tahun kebelakang.

  8. Tracking SCD (melacak SCD) Dimensi berubah secara perlahan seiring berjalannya waktu dan kebutuhan.

  9. Deciding the Query Priorities and the Query Modes (memutuskan prioritas

  query dan mode query )

  Pada tahap ini dilakukan pertimbangan perancangan fisikal, seperti keberadaan dari summary (ringkasan) dan aggregate (penjumlahan).

2.7 Data Staging Database Staging merupakan buffer untuk mengintegrasikan data.

  Menggunakan database Staging ini proses ETL pada Data Warehouse akan cepat. Hal lain yang menjadikan database Staging sebagai solusi yang sangat baik karena proses di memori (RAM) yang sangat terbatas dan akhirnya akan mencari

  

space di hard drive untuk paging/ caching. Dengan batasan seperti itu, lama

  kelamaan proses di memory akan penuh dan menjadi bottleneck di ETL. Apabila terjadi kondisi yang akan sangat membebani memori, maka lebih baik menggunakan strategi Data Staging[5].

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  15

2.8 Extract, Transform, dan Load (ETL)

  Untuk melakukan data warehousing maka diperlukan utilitas yang dirancang khusus untuk hal tersebut. Utilitas tersebut harus memiliki kemampuan[5]:

  1. Membaca dari dan mengirim data ke berbagai sumber (file text, excel, database relational , dan sebagainya).

  2. Mampu menyesuaikan / transformasi data.

  3. Memiliki informasi metadata pada setiap perjalanan transformasi.

  4. Memiliki audit log yang baik.

  5. Dapat ditingkatkan performanya dengan scale up dan scale out.

  6. Mudah diimplementasikan.

  Secara singkat proses tersebut dibagi dalam 3 proses besar yaitu Extract (mengambil), Transform (transformasi), dan Load (menyimpan) atau disingkat ETL dapat dilihat pada gambar 2.2.

  Gambar 2. 2 Sistem Kerja Data Warehouse

2.9 Multi Dimensional Modelling

2.9.1 Cube, Dimension, Measure , dan Member

  Teknologi OLAP menganut multi Dimensional modeling, artinya dapat melihat analisis pengukuran dengan pandangan berbagai dimensi. Di dalam konsep ini perlu mengenal berbagai istilah yang berkaitan dengan OLAP[5]:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  16

  1. Cube : adalah struktur multi Dimensional konseptual, terdiri dari Dimension dan measure dan biasanya mencakup pandangan bisnis tertentu.

  2. Dimension / dimensi : adalah struktur view / sudut pandang yang menyusun

  Cube . Dimensi dapat terdiri dari berbagai level.

  3. Measure : nilai pengukuran itu sendiri.

  4. Member : isi / anggota dari suatu Dimension / measure tertentu.

  2.9.2 Tabel Fakta dan Dimensi (Fact and Dimension Tabels)

  Tabel fakta (fact tabel) yaitu tabel yang berisi fakta numerik, jika semua data disimpan pada tabel fakta tunggal, maka hasilnya adalah tabel yang besar sekali. Tabel dimensi (Dimension tabel) yaitu tabel yang berisi petunjuk (pointer) ke tabel fakta, digunakan untuk menunjukkan darimana data dapat ditemukan dan tabel terpisah dibutuhkan untuk setiap dimensi.

  Di dalam model multi dimensional, database terdiri dari beberapa tabel fakta dan tabel dimensi saling terkait. Suatu tabel fakta berisi berbagai nilai agregasi yang menjadi dasar pengukuran (measure ) serta beberapa key yang terkait ke tabel dimensi yang akan menjadi sudut pandang dari measure tersebut.

  Dalam perkembangannya, susunan fact tabel dan Dimension tabel ini memiliki standar perancangan atau schema karena terbukti meningkatkan performa dan kemudahan dalam penerjemahan ke sistem OLAP. Schema inilah yang menjadi dasar untuk melakukan data warehousing. Dua skema yang paling umum digunakan oleh berbagai OLAP engine adalah skema bintang (star schema) dan skema butir salju (snowflake schema) [5].

2.9.3 Skema Bintang (Star schema)

  Star schema berpusat pada satu tabel fakta yang dikelilingi oleh satu atau beberapa tabel dimensi sebagai cabangnya sehingga kelihatan seperti bintang.

  Setiap percabangan berhenti pada satu tabel dimensi. Atau dengan kata lain tabel

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  17 dimensi dengan skema ini semuanya berupa leaf (daun) dan tidak ada percabangan lain dapat dilihat pada gambar 2.3 [5].

  Gambar 2. 3 Star schema dari PHI-Minimart

  2.10 Surrogate Key Surrogate Key adalah key / kolom data di tabel dimensi yang menjadi

primary key dari tabel tersebut. Nilai ini biasanya berupa nilai sekuensial dan

  tidak memiliki arti dari proses bisnis darimana sumber data berasal[4].

  2.11 Pentaho Data Integration (Kettle)

2.11.1 Pentaho Data Integration

  Pentaho Data Integration

  (PDI) atau Kettle adalah utlities ETL open source di bawah Pentaho Corp Amerika. Proyek ini awalnya merupakan inisiatif dari Matt Casters (http://www.ibridge.be), seorang programmer dan konsultan

  

Business Intelligence (BI) dari Belgia yang telah menangani berbagai proyek BI

  untuk semua perusahaan besar.[5] Saat ini Kettle merupakan utilitas ETL yang sangat popular dengan beberapa fitur sebagai berikut:

  1. Kumpulan step yang kaya ( lebih dari 100 steps ) dalam paket.

  2. Dukungan untuk proses Data Warehouse terutama untuk Slowly Changing dan Junk Dimensions.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  18

  3. Performa dan kemampuan skalabilitas yang sudah terbuka.

  4. Dapat dikembangkan dengan berbagai plugin tambahan.

2.11.2 Komponen Aplikasi Kettle

  Kettle 3.0.1 terdiri dari 4 utilitas dalam bentuk shell / batch script, yaitu:[5]

1. Spoon

  Spoon adalah utilitas grafik untuk merancang, mengeksekusi dan

  melakukan troubleshooting dari ETL melalui job dan transformasi. Porsi terbesar dari alokasi waktu pengembangan proyek Data Warehouse adalah Kettle yang melibatkan spoon di dalamnya.

  Lingkungan kerja spoon terdiri dari beberapa bagian sebagai berikut:

  a. Pulldown Menu : koleksi menu dari spoon yang terintegrasi dalam satu toolbar .

  b. Welcome Screen : merupakan halaman pembuka kettle yang berisi informasi ke situs Pentaho. Untuk mengaktifkan welcome screen pilih menu Help | Show the Welcome Screen.

  c. Toolbar : terdiri dari job / transformasi toolbar .

  d. Panel Execution Results, terdiri dari: 1) Execution Histori : Data Histori es eksekusi .

  2) Logging : Berisi detil dari eksekusi job / transformation. 3) Job Metrics : Berisi detil dari step-step yang telah dieksekusi . 4) Step Metrics : berisi detil jumlah pembacaan data ( write, update, dll) per satuan waktu detik dari step-step yang telah dieksekusi.

  5) Performance Graphs : Tampilan grafis dari pembacaan data dari Step Metrics .

  2. Pan Pan merupakan utilitas yang digunakan untuk mengeksekusi transformasi.

  Umumnya dijalankan pada saat otomatisasi terjadwal (scheduled

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  19

  automati on). Dipaketkan dengan nama file pan.bat (batch script) dan pan.sh (BASH shell script)[5].

  3. Kitchen Kitchen merupakan utilitas yang digunakan unutk mengeksekusi job .

  Umumnya dijalankan pada saat otomatisasi terjadwal (scheduled

  automation

  ). Dipaketkan dengan nama file pan.bat (batch script) dan pan.sh (BASH shell script).

  4. Carte Merupakan utilitas cluster web server yang digunakan untuk mengeksekusi

  job / transformation. Terutama digunakan untuk meningkatkan performa

  ETL dengan pembagian Load kerja pada berbagai node Carte (master dan slave ).

2.12 Slowly Changing Dimensions (SCD)

  Dapat dipastikan bahwa pada suatu saat sumber data pembentuk dimensi akan berubah. Perubahan tersebut dinamakan Slowly Changing Dimensions (SCD) atau dimensi yang berubah secara perlahan. Ada 3 macam tipe respon / penanganan SCD yaitu Tipe 1, 2, dan 3. Bagian Berikut menerangkan apa perbedaan dari tiap tipe SCD[7] :

  1. Type 1 SCD Menggunakan pendekatan timpa data yang berubah ( overwrite ). Ini dilakukan jika memang tidak ada kepentingan menyimpan data historis atau pergerakan isi data dari dimensi tersebut.

  2. Type 2 SCD Menyimpan semua historis data dengan Surrogate Key berbeda ( partitioning

  Histori ). Dapat menambahkan masa berlaku dari dimensi bersangkutan. Ini dilakukan jika memang pergerakan data historis tetap berpengaruh kepada analisis data seperti perpindahan salesman dari satu regional ke regional lain.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  20

3. Type 3 SCD

  Menyimpan satu historis data pada kolom lain (alternate realities). Sama seperti Type 2 hanya saja lebih terbatas kepada jumlah perubahan data (update) yang diijinkan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

BAB III ANALISIS DAN PERANCANGAN SISTEM

3.1 Analisis Sistem Yang Sudah Berjalan

  Pada bagian ini dijelaskan tentang proses pembuatan laporan yang sudah berjalan di DISDUKCAPIL Kabupaten Klaten selama ini. Gambaran umum proses pembuatan laporan yang sudah berjalan dapat dilihat dalam gambar 3.1.

  Gambar 3. 1 Proses pembuatan Laporan Dimulai dari Pemerintah tingkat Provinsi (DINAKERTRANSDUK) yang mengirimkan surat dinas yang meminta DISDUKCAPIL untuk memberikan laporan Data Kependudukan di setiap Kabupaten. Tools SIAK yang disediakan Pemerintah dapat sedikit membantu dalam perhitungan data penduduk secara umum, namun untuk perhitungan data secara detail belum dapat dilakukan.

  Kemudian Admin SIAK sebagai penanggung jawab penyusunan Data Kependudukan melakukan query setiap data yang akan digunakan untuk mengisi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  22 laporan yang diminta dan proses ini membutuhkan sekitar 3 hari pengerjaannya. Dari hasil query akan dibuat laporan dalam bentuk file excel dan kemudian dijadikan lampiran lalu dikirim kepada admin DINAKERTRANSDUK yang berkaitan sebelum batas waktu yang ditentukan.

3.1.1 Kelemahan Sistem yang Ada Sekarang