Pemanfaatan gudang data untuk keperluan Online Analytical Processing (OLAP) dan penambangan data studi kasus PT. ASDP Indonesia Ferry (Persero) cabang Kupang

(1)

i

PEMANFAATAN GUDANG DATA UNTUK KEPERLUAN ONLINE ANALYTICAL PROCESSING (OLAP) DAN PENAMBANGAN DATA

(Studi Kasus: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

Skripsi

Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Oleh:

Loudya Ester Rosalina Kapa 085314054

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA


(2)

ii

THE UTILIZATION OF DATA WAREHOUSE FOR ONLINE ANALYTICAL PROCESSING (OLAP) AND DATA MINING PURPOSES

(Case Study: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

A Thesis

Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree

By:

Loudya Ester Rosalina Kapa 085314054

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY YOGYAKARTA


(3)

(4)

(5)

v

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah dsebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 20 February 2013 Penulis,


(6)

vi

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma : Nama : Loudya Ester Rosalina Kapa

Nomor Mahasiswa : 08 5314 054

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul :

Pemanfaatan Gudang Data Untuk Keperluan Online Analytical Processing (OLAP) dan Penambangan Data

Studi Kasus : PT. ASDP Indonesia Ferry (Persero) Cabang Kupang beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikannya secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.

Demikian pernyataan ini yang saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada tanggal : 22 Februari 2013 Yang menyatakan


(7)

vii

HALAMAN PERSEMBAHAN

Karya ini saya persembahkan kepada :

TUHAN YESUS, tanganMU yang setia menuntun ku, Engkau Penopang dan Harapan ku

Bapa & Mama tercinta

Adik-adik ku sayang, Cory dan Anto

Keluarga Besar


(8)

viii M O T T O

~~~

Janganlah takut, sebab Aku menyertai engkau, janganlah bimbang, sebab Aku ini Allahmu;

Aku akan meneguhkan, bahkan akan menolong engkau; Aku akan memegang engkau dengan tangan kanan-Ku yang membawa kemenangan.

Yesaya 41:10

~~~

I hear no voice I feel no touch I see no glory bright

But yet I know that “GOD is near”

In the darkness as in light GOD watches ever by my side


(9)

ix

KATA PENGANTAR

Segala puji syukur penulis panjatkan kepada Allah Bapa di Surga, karena berkat dan penyertaan-Nya penulis dapat menyelesaikan penyusunan Skripsi yang

berjudul “Pemanfaatan Gudang Data untuk keperluan Online Analytical Processing (OLAP) dan Penambangan Data (Studi Kasus: PT. ASDP Indonesia

Ferry (Persero) Cabang Kupang)”.

Skripsi ini disusun sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu pada Program Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

Pada saat pengerjaan skripsi ini penulis banyak mendapatkan bantuan dari berbagai pihak, oleh karena itu penulis ingin mengucapkan terima kasih kepada : 1. Ibu Ridowati Gunawan, S.Kom, M.T. selaku Ketua Prodi Teknik Informatika

sekaligus dosen pembimbing, yang telah memberikan kebaikan, arahan, bimbingan, serta meluangkan waktu sehingga penulis dapat menyelesaikan skripsi ini.

2. Ibu P.H Prima Rosa, S.Si., M.Sc. selaku Dekan Fakultas Sains dan Teknologi dan sekaligus sebagai dosen penguji yang telah memberikan kritik dan saran untuk penyempurnaan skripsi ini

3. Ibu Sri Hartati Wijono, S.Si., M.Kom selaku dosen penguji yang bersedia memberikan kritik dan saran demi pengembangan skripsi ini


(10)

x

4. Bapak Hermin, selaku Supervisor Lintasan, yang telah mengizinkan penulis untuk melakukan studi kasus

5. Kedua orang tua, Bapak Morizon B.D Kapa dan Ibu S.Leonora Welkis yang telah memberikan dukungan doa, semangat, motivasi , perhatian, yang selalu sabar membimbing penulis sehingga penulis dapat membuktikan kepada keluarga bahwa penulis berhasil menyelesaikan skripsi ini. Kalian luar biasa. 6. Adik-adik tercinta, Cory dan Anto, yang selalu mendukung dalam doa serta

memberi semangat kepada penulis.

7. Keluarga Besar di Kupang, Opa Tom, Opa Benja, Opa Sabu, bapa Min, Be‟a Teli, bapa Herman, mama Ren, dan semua saudara yang selalu memberikan semangat dan doa bagi penulis. Kak Rose, Kak Ani, Rino, kak Adi, kak Jimmy, kak Cindi, dan semua keluarga yang selalu memberi support yang luar biasa kepada penulis.

8. Saudara sekaligus sahabat Carla R.G. Pekujawang S.Kom, Hety, Yanti, Juan,

Didi „Dircya‟, Nitha, Dirk, Ivanna „Boim‟, Ryan, Debby Kristiana Dima yang

selalu memberikan senyum, doa, dan motivasi kepada penulis.

9. Sahabat-sahabat seperjuangan, Lucy, Devi, Angga, Siska, Surya, Petra, Pucha, Endro, Ithak, Ochak, Reza, Wulan, Densi, Ilana, Suci, Roy, Linardi, Tista serta sibling Bebeth, Agnes, Gadis, dan Ade, yang membantu penulis saat mengalami kesulitan dalam pengerjaan skripsi, dan memberikan semangat, tawa, dan doa.

10. Teman-teman LASKAR TI‟08 yang telah memberikan canda, tawa, serta semangat kepada penulis.


(11)

xi

11. Teman-teman kos Intan, Ce Pipi dan Niken, yang memberikan motivasi dan doa kepada penulis. Teman-teman kos Puri Liberti, Anyho, dan semuanya yang begitu mendukung penulis dalam setiap keceriaan dan motivasi yang kalian berikan.

12. Teman-teman GSM (kak Santi, Novita, Winnie „Jaja‟, Kia, Galuh, Caca, Dea) yang mendukung dalam doa dan bersedia meluangkan waktu memberi support kepada penulis.

13. Semua pihak yang telah membantu dan memberikan dukungan kepada penulis yang tidak dapat disebutkan satu per satu.

Dengan kerendahan hati, penulis menyadari bahwa skripsi ini masih jauh dari sempurna, oleh karena itu berbagi saran, kritik, dan masukan sangat diharapkan demi perbaikan skripsi ini di kemudian hari. Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat.

Yogyakarta, 20 Februari 2013 Penulis


(12)

xii DAFTAR ISI

HALAMAN JUDUL ……….. i

HALAMAN JUDUL INGGRIS ……….... ii

HALAMAN PERSETUJUAN ……….. iii

HALAMAN PENGESAHAN ……… iv

HALAMAN KEASLIAN KARYA ………... v

LEMBAR PERNYATAAN PERSETUJUAN ……….. vi

HALAMAN PERSEMBAHAN ……….... vii

MOTTO ………. viii

KATA PENGANTAR ………... ix

DAFTAR ISI ………. xii

DAFTAR TABEL ……….. xv

DAFTAR GAMBAR ………. xi

ABSTRAK ………. xx

ABSTRACT ………... xxi

BAB I ………. 1

PENDAHULUAN ………. 1

1.1 Latar Belakang Masalah ……….. 1.2 Rumusan Masalah ……… 1.3 Tujuan Penelitian ………. 1.4 Kegunaan ………. 1.5 Batasan Masalah ……….. 1.6 Metodologi Penelitian ……….. 1.7 Sistematika Penulisan ……….. 1 3 3 4 5 5 6 BAB II ……… 9


(13)

xiii

2.1 Gudang Data ………

2.1.1 Definisi Gudang Data ……….. 2.1.2 Komponen Gudang Data ………. 2.1.3 Karakteristik Gudang Data ………. 2.1.4 Arsitektur Gudang Data ……….. 2.1.5 Manfaat Gudang Data ………. 2.1.6 Langkah Pembuatan Gudang Data ………. 2.1.7 Online Analytical Processing (OLAP) ………... 2.1.8 Extract, Transform, Load (ETL) ……….... 2.1.9 Dimensional Modeling ………

2.1.9.1 Tabel Fakta ………... 2.1.9.2 Tabel Dimensi ………... 2.1.9.3 Cube, Dimension, Measure, Member ………

2.1.9.4 Skema Bintang ……….. 2.1.9.5 Surrogate key ……….... 2.2 Penambangan Data (Data Mining) ………..

2.3 Metode Analisis Asosiasi ……….... 2.4 Algoritma Apriori ………

9 9 9 11 13 14 16 16 17 18 18 18 19 20 20 23 26

BAB III ……….. 30

ANALISIS DAN PERANCANGAN SISTEM ………. 30

3.1 Identifikasi Masalah ………. 3.2 Arsitektur Sistem ………. 3.3 Analisis Kebutuhan ………. 3.4 Pembersihan Data ……… 3.5 Transformasi Data ……… 3.6 Pembuatan Gudang Data ……….

3.6.1 Membaca data legacy ……….

3.6.2 Memindahkan data ke server gudang data ………. 3.7 Pemanfaatan Gudang Data ………..

3.7.1 Pembuatan OLAP ………... 3.7.2 Penerapan Algoritma Apriori ………..

30 31 32 32 33 33 34 35 36 36 47


(14)

xiv

3.8 Analisis Kebutuhan ………..

3.8.1 Use Case ……….

3.8.2 Narasi Use Case ………...

3.8.3 Desain Antar Muka ………

3.9 Kebutuhan Komponen dan Kebutuhan Sistem ……….

51 52 53 57 62

BAB IV ……….. 63

IMPLEMENTASI DAN ANALISIS SISTEM ……….. 63

4.1 Implementasi Arsitektur Gudang Data ……… 4.2 Langkah Pembuatan Gudang Data ………..

4.2.1 Membaca data legacy ……….

4.2.2 Memindahkan data ke server gudang data ……….

4.3 Penggunaan Gudang Data ………

4.3.1 Gudang data untuk keperluan OLAP………. 4.3.2 Gudang data untuk penerapan algoritma Apriori ……….

4.4 Implementasi Antar Muka Pengguna ………..

4.4.1 Halaman Login ……….

4.4.2 Halaman utama ……….

4.4.3 Halaman Laporan Produksi ……… 4.4.4 Halaman Laporan Pendapatan..……… 4.4.5 Halaman Transformasi Data ……….. 4.4.6 Halaman Aturan Asosiasi ………..

63 64 64 68 70 70 102 111 111 117 118 122 124 128

BAB V ……… ANALISIS HASIL ……….

135 135 5.1 Penyelesaian Rumusan Masalah ……….

5.2 Pengujian Cube ………

5.3 Kelebihan dan Kelemahan Sistem ………...

135 140 150

BAB VI ………. KESIMPULAN DAN SARAN ………. 6.1 Kesimpulan ……….. 6.2 Saran ………. DAFTAR PUSTAKA ………

152 152 152 152 153


(15)

xv

LAMPIRAN ……….. 154

DAFTAR TABEL Tabel 2.1 Tabel 3.1 Tabel 3.2 Tabel 3.3 Tabel 3.4 Tabel 3.5 Tabel 3.6 Tabel 3.7 Tabel 3.8 Tabel 3.9 Tabel 4.1 Tabel 4.2 Tabel 4.3 Tabel 4.4 Tabel 4.5 Tabel 4.6 Tabel 4.7 Tabel 4.8

Perbedaan OLTP dan OLAP ……… Rekapitulasi jenis lintasan ……… Contoh data rekapitulasi ………...

Contoh data dari atribut ……… Narasi use case login……….

Narasi use case melihat laporan rekapitulasi………

Narasi use case melihat laporan produksi ………

Narasi use case melihat laporan pendapatan ………

Narasi use case transfer data produksi dan pendapatan... Narasi use case cari aturan asosiasi ………..

Penjelasan spesifikasi pembentukan tabel master………...

Penjelasan pembentukan tabel dimensi_lintasan …………. Penjelasan pembentukan tabel dimensi_kapal ……….

Penjelasan pembentukan tabel dimensi_tiket………

Penjelasan pembentukan fact_rekapitulasi ……….. Penjelasan pembentukan fact_laporan_produksi ………... Penjelasan pembentukan fact_laporan_pendapatan ……...

Skema MDX cube Rekapitulasi Pelayanan ………..

16 34 35 48 52 53 54 55 55 56 69 71 73 75 79 83 88 99


(16)

xvi Tabel 4.9 Tabel 4.10 Tabel 4.11 Tabel 4.12 Tabel 4.13 Tabel 4.14 Tabel 4.15 Tabel 4.16 Tabel 4.17 Tabel 4.18 Tabel 4.19 Tabel 4.20 Tabel 4.21

Definisi skema LaporanRekapitulasi.xml ………

Tabel kode perintas file Automatisasi_data.bat………

Query sql untuk scanning database ………. Listing Program untuk halaman login ………

Fungsi Login pada Control.jsp ………

Fungsi Login pada kelas Login.jsp ……….

Struktur halaman Laporan Rekapitulasi.jsp ………..

Struktur halaman Laporan Produksi.jsp ………. Struktur halaman Laporan Pendapatan.jsp ………. Listing Program untuk Halaman Transformasi data…….. Fungsi Transformasi pada Control.jsp ………

Method runBat pada kelas Tools.java ………..

Listing Program halaman pola asosiasi ………..

100 102 103 112 114 115 117 119 123 124 127 128 129


(17)

xvii DAFTAR GAMBAR Gambar 2.1 Gambar 3.1 Gambar 3.2 Gambar 3.3 Gambar 3.4 Gambar 3.5 Gambar 3.6 Gambar 3.7 Gambar 3.8 Gambar 3.9 Gambar 3.10 Gambar 3.11 Gambar 3.12 Gambar 3.13 Gambar 3.14 Gambar 3.15 Gambar 3.16 Gambar 3.17 Gambar 3.18 Gambar 3.19 Gambar 4.1 Gambar 4.2 Gambar 4.3 Gambar 4.4 Gambar 4.5

Arsitektur Gudang Data ………...

Arsitektur Sistem ………..

Pembentukan master_operasional ……… Pembentukan tabel dimensi_lintasan ………... Pembentukan tabel dimensi_kapal ………... Pembentukan tabel dimensi_tiket ………. Pembentukan tabel dimensi_waktu ………..

Pembentukan tabel fact_rekapitulasi ………

Pembentukan tabel fact_laporan_produksi ……….. Pembentukan tabel fact_laporan_pendapatan ……….. Star schema laporan_rekapitulasi ……….

Star schema laporan_produksi ……….

Star schema laporan_pendapatan ……….

Diagram Use Case ………

Halaman Login ………. Halaman Home ……… Halaman Laporan Produksi ………. Halaman Laporan Pendapatan ……… Halaman Transformasi data ……… Halaman Aturan Asosiasi ………

Arsitektur Sistem ……….

Data Produksi dan Pendapatan ………. Pembacaan data dengan Kettle ……… Master_operasional.ktr ……… Tabel master_operasional ………

13 31 36 37 38 39 39 41 42 43 45 46 47 52 58 59 59 60 60 61 63 66 67 68 70


(18)

xviii Gambar 4.6 Gambar 4.7 Gambar 4.8 Gambar 4.9 Gambar 4.10 Gambar 4.11 Gambar 4.12 Gambar 4.13 Gambar 4.14 Gambar 4.15 Gambar 4.16 Gambar 4.17 Gambar 4.18 Gambar 4.19 Gambar 4.20 Gambar 4.21 Gambar 4.22 Gambar 4.23 Gambar 4.24 Gambar 4.25 Gambar 4.26 Gambar 4.27 Gambar 4.28 Gambar 4.29 Gambar 4.30 Gambar 4.31 Gambar 4.32 Gambar 4.33 Gambar 4.34 Gambar 4.35 Gambar 4.36 Dimensi_lintasan.ktr ……… Tabel dimensi_lintasan………. Dimensi_kapal.ktr ……… Tabel dimensi_kapal ……… Dimensi_tiket.ktr……….. Tabel dimensi_tiket ………. Dimensi_waktu.ktr ……….. Tabel dimensi_waktu ……….. Fact_rekapitulasi.ktr ……….. Tabel fact_rekapitulasi ………. Fact_laporan_produksi.ktr ………..

Tabel Fact_laporan_produksi ……….

Fact_laporan_pendapatan.ktr ……….. Tabel Fact_laporan_pendapatan ………. Star schema cube Rekapitulasi Pelayanan ……….

Struktur pembentukan dimensi_lintasan ……… Struktur pembentukan dimensi_kapal ……… Struktur pembentukan dimensi_tiket ……….. Struktur pembentukan dimensi_waktu ……….. Star Schema cube Laporan Produksi ……….

Struktur pembentukan dimensi_waktu ………..

Struktur pembentukan dimensi_lintasan ……… Struktur pembentukan dimensi_kapal ……… Struktur pembentukan dimensi_tiket ……….. Star Schema cube Laporan Pendapatan ………. Struktur pembentukan dimensi_lintasan ………

Struktur pembentukan dimensi_kapal ………

Struktur pembentukan dimensi_tiket ……….. Struktur pembentukan dimensi_waktu ……… Proses Transfer data ………. Hasil query data ………

71 72 73 74 75 77 77 77 78 82 82 86 87 91 92 92 93 93 94 94 95 95 96 96 97 97 98 98 99 102 103


(19)

xix Gambar 4.37 Gambar 4.38 Gambar 4.39 Gambar 4.40 Gambar 4.41 Gambar 4.42 Gambar 4.43 Gambar 4.44 Gambar 5.1 Gambar 5.2 Gambar 5.3 Gambar 5.4 Gambar 5.5 Gambar 5.6 Gambar 5.7 Gambar 5.8 Gambar 5.9 Gambar 5.10 Gambar 5.11 Gambar 5.12 Gambar 5.13 Gambar 5.14 Gambar 5.15 Gambar 5.16 Gambar 5.17 Gambar 5.18 Gambar 5.19 Gambar 5.20 Gambar 5.21

Tampilan halaman login ………..

Tampilan untuk proses login gagal ………..

Tampilan halaman utama ………. Tampilan halaman produksi ……… Tampilan halaman pendapatan ……… Tampilan halaman transformasi data………

Tampilan perhitungan asosiasi ……….

Hasil Asosiasi ………... Hasil Rekapitulasi Pelayanan Operasional……… Hasil OLAP Laporan Produksi ……… Hasil OLAP Laporan Pendapatan ……… Hasil Pengujian Cube Rekapitulasi Pelayanan ……… Sintak query SQL Pengujian 1 ……….

Hasil Sintak query SQL Pengujian 1 ………

Hasil Cube Rekapitulasi Pelayanan Pengujian 2………….. Sintak query SQL Pengujian 2 ………. Hasil Sintak query SQL Pengujian 2……… Hasil Cube Laporan Produksi Pengujian 1……….. Sintak query SQL Pengujian 1……….

Hasil query pengujian 1………..

Hasil Cube Laporan Produksi Pengujian 2……….. Sintak query SQL Pengujian 2………. Hasil query pengujian 2……….. Hasil Cube Laporan Pendapatan Pengujian 1………. Sintak query SQL Pengujian 1……….

Hasil query pengujian 1………..

Hasil Cube Laporan Pendapatan Pengujian 2………. Sintak query SQL Pengujian 2………. Hasil query pengujian 2………

112 116 117 118 122 124 128 133 135 136 137 140 141 141 142 143 143 143 144 145 145 146 146 147 147 148 148 149 149


(20)

xx ABSTRAK

PEMANFAATAN GUDANG DATA UNTUK KEPERLUAN ONLINE ANALYTICAL PROCESSING (OLAP) DAN PENAMBANGAN DATA (Studi Kasus: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

Loudya Ester Rosalina Kapa Universitas Sanata Dharma

Yogyakarta 2013

Saat ini perusahaan harus pandai dalam mengelola data yang dimiliki untuk menjadi informasi yang berguna. informasi tersebut dapat membantu perusahaan dalam upaya peningkatan kualitas. Pada proses pengolahan data dapat digunakan sebuah teknik yaitu gudang data.

Pada tugas akhir ini diimplementasikan teknik gudang data yang berfungsi untuk OLAP (Online Analytical Processing) dan penerapan algoritma data mining yakni algoritma apriori. Teknologi gudang data ini membantu Supervisor Lintasan PT. ASDP Ferry Kupang dalam pembuatan laporan bulanan produksi dan pendapatan menggunakan teknologi OLAP. Selain itu gudang data ini dimanfaatkan untuk proses penambangan data untuk menemukan asosiasi antara hari, lintasan, dan pendapatan di PT. ASDP Ferry Kupang.


(21)

xxi ABSTRACT

THE UTILIZATION OF DATA WAREHOUSE FOR ONLINE ANALYTICAL PROCESSING (OLAP) AND DATA MINING PURPOSES

(Case Study: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

Loudya Ester Rosalina Kapa Universitas Sanata Dharma

Yogyakarta 2013

Today a company should capable on managing the data to be the useful information. Based on the information, it may help the company to develop the quality. In processing of data, it could use a technique called Data Warehouse.

In this final paper, the technique of warehouse is used for OLAP and the algorithm application of data mining called Apriori Algorithm. The technology of data warehouse would help the Route Supervisor of PT. ASDP Ferry Kupang on making the month production report and the income of using technology OLAP (Online Analytical Processing). Besides, Warehouse will be applied on data mining algorithm to get the information about association between day, route, and income in PT ASDP Ferry Kupang.

Keyword : Data Warehouse, OLAP, Apriori Algorithm, Production, Income


(22)

1 BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Dewasa ini, peranan teknologi informasi sangat penting bagi banyak perusahaan dalam berbagai bidang. Perusahaan harus pandai dalam memanfaatkan sumber daya yang telah dimiliki baik itu data dan informasi. Pengolahan data menjadi informasi yang berguna ditinjau dari kualitas informasi yang dihasilkan. Proses pengolahan data dapat diterapkan di berbagai media, seperti pada database operasional, aplikasi operasional, atau menggunakan teknologi gudang data. Semakin baik kualitas informasi yang dihasilkan berpengaruh terhadap strategi dan keberhasilan perusahaan.

PT. ASDP Indonesia Ferry (Persero) cabang Kupang merupakan badan usaha milik negara yang bergerak dalam jasa angkutan penyebrangan untuk menghubungkan pulau-pulau yang ada di Nusa Tenggara Timur. Pelayanan operasional dilakukan oleh PT. ASDP Ferry Cabang Kupang di berbagai lintasan dengan pengoperasian kapal yang berbeda. Perusahaan ini memiliki data pelayanan produksi dan pendapatan yang merekap transaksi jumlah produksi dan pendapatan di setiap lintasan. Data pelayanan produksi dan pendapatan disimpan dan direkap dalam bentuk file excel. Jumlah data yang semakin besar membuat pihak Supervisor Lintasan mengalami kesulitan dalam melakukan analisa,


(23)

perolehan data dan informasi yang lengkap dan akurat. Untuk itu PT. ASDP Indonesia Ferry (Persero) cabang Kupang memerlukan sebuah teknologi informasi yang dapat mengintegrasikan, menyimpan data dalam jumlah besar serta menyediakan data dan informasi yang akurat bagi perusahaan guna menunjang proses analisa. Teknologi tersebut dinamakan Gudang Data.

Gudang data merupakan sekumpulan data yang berorientasi pada subjek, terintegrasi, memiliki rentang waktu, dan koleksi datanya tidak mengalami perubahan dalam mendukung pengambilan keputusan manajerial [2]. Gudang data memungkinkan integrasi berbagai jenis data dari berbagai macam aplikasi atau sistem. Beberapa manfaat dari gudang data adalah OLAP dan Penambangan Data [4]. OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail. Penambangan Data menggali pengetahuan dan informasi dari gudang data.

Berdasarkan hal diatas, Supervisor Lintasan PT. ASDP Ferry Cabang Kupang memerlukan teknologi gudang data untuk menemukan informasi produksi dan pendapatan di setiap lintasan dengan membuat rekap produksi dan pendapatan dari setiap lintasan yang di kelola. Gudang data yang terbentuk akan digunakan untuk keperluan database Online Analytical Processing (OLAP) dan penerapan algoritma Apriori dalam penambangan data. OLAP mencakup informasi pelayanan dari setiap lintasan, kapal yang beroperasi, jenis tiket, jumlah produksi dan besar


(24)

pendapatan yang diterima setiap bulan. Penerapan algoritma Apriori untuk menemukan asosiasi antara hari, lintasan, dan pendapatan sehingga membantu pihak Supervisor Lintasan dalam pengembangan pelayanan PT. ASDP Ferry Kupang.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan diatas, permasalahan yang diselesaikan dalam penelitian ini yakni : Bagaimana membuat gudang data yang dapat dipergunakan untuk sistem database Online Analytical Processing (OLAP) dan penambangan data dengan algoritma apriori untuk menunjang proses analisa pelayanan PT. ASDP Indonesia Ferry cabang Kupang ?

1.3 Tujuan Penelitian

Sesuai dengan rumusan masalah diatas, maka tujuan yang mendasari penelitian ini antara lain :

1. Membangun sistem database Online Analytical Processing

(OLAP) dari gudang data pelayanan ASDP sehingga diperoleh informasi pelayanan yang dapat membantu

Supervisor dalam menganalisa produksi dan pendapatan PT. ASDP Indonesia Ferry (Persero) Cabang Kupang di setiap lintasan yang dikelola.


(25)

2. Menerapkan algoritma Apriori dari gudang data yang terbentuk untuk menemukan asosiasi antara hari, lintasan, dan pendapatan di PT. ASDP Indonesia Ferry Cabang Kupang.

1.4 Kegunaan

Adapun kegunaan dari aplikasiyang akan dibangun adalah sebagai berikut :

Bagi penulis :

1. Menyelesaikan Tugas Akhir sebagai syarat kelulusan tingkat strata satu.

2. Mengetahui mengenai pelayanan operasional di PT. ASDP Indonesia Ferry (Persero) Cabang Kupang

3. Dapat membuat suatu gudang data pelayanan ASDP yang sudah terintegrasi dengan teknologi Online Analytical Processing

(OLAP) dan teknik penambangan data dengan algoritma Apriori

Bagi Supervisor Lintasan PT. ASDP Indonesia Ferry (Persero) Cabang Kupang :

1. Membantu menemukan informasi produksi dan pendapatan di setiap lintasan dengan mudah dan cepat, serta hubungan antara hari, lintasan, dan pendapatan demi pengembangan kualitas pelayanan PT. ASDP Indonesia Ferry Cabang Kupang


(26)

2. Membantu kegiatan evaluasi produksi dan pendapatan lintasan yang dikelola oleh PT. ASDP Indonesia Ferry (Persero) Cabang Kupang

1.5 Batasan Masalah

Adapun batasan-batasan masalah dalam penelitian ini adalah :

a. Penelitian ini menggunakan data produksi dan pendapatan PT. ASDP Indonesia Ferry (Persero) Cabang Kupang tahun 2010 dan 2011 b. Gudang data yang terbentuk dimanfaatkan untuk sistem On-Line

Analytical Processing (OLAP) dan teknik penambangan data dengan algoritma apriori

c. Pada proses penambangan data dengan algoritma apriori, atribut yang diambil dari tabel master dalam gudang data hanya terdiri dari hari, lintasan, dan pendapatan

1.6 Metodologi Penelitian

Bagian ini bertujuan untuk menguraikan langkah-langkah peneliti dalam melaksanakan penelitian tugas akhir. Langkah-langkahnya antara lain:

1. Identifikasi Masalah

Melakukan wawancara kepada pihak yang terkait untuk mendapatkan informasi kebutuhan yang diperlukan.


(27)

Setelah data diperoleh dari pihak PT. ASDP Ferry Kupang, data kemudian dipersiapkan untuk proses pembuatan gudang data. Pertama yang dilakukan adalah pembersihan (cleaning) data. Informasi yang tidak dibutuhkan dihapus untuk mempercepat pemrosesan.

3. Transformasi Data

Pada tahap ini dilakukan transformasi terhadap data dengan cara mengubah metadata dari setiap atribut dan menambahkan data tertentu sehingga membuat data menjadi lebih mudah untuk digunakan dan dinavigasikan.

4. Pembentukan Gudang Data (Data Warehousing)

Setelah data di transformasikan, data dari sumber dipindahkan ke gudang data. Gudang data yang terbentuk dimanfaatkan untuk 2 proses antara lain:

a. Online Analytical Processing (OLAP)

Pembuatan sistem Online Analytical Processing (OLAP) dilakukan dengan cara :

1. Memecah gudang data ke dalam tabel dimensi dan tabel fakta

2. Pembuatan cube menggunakan skema multidimensi yaitu Skema Bintang (Star Schema). Penggunaan Star Schema

digunakan karena lebih efisien dan sederhana dalam pembuatan query dan mudah diakses oleh pengguna.


(28)

b. Penerapan Algoritma Apriori

Gudang data yang terbentuk diterapkan algoritma apriori untuk menemukan keterkaitan antara hari, lintasan, dan pendapatan dalam membantu analisis pelayanan PT. ASDP Ferry Indonesia Kupang

5. Evaluasi dan Presentasi pola

Pada tahap ini hasil direpresentasikan kepada pengguna akhir dalam bentuk yang dapat dipahami.

1.7 Sistematika Penulisan

Sistematika penulisan merupakan uraian susunan penulisan Tugas Akhir yang akan dibuat secara teratur dan sistematis yang dijalankan dalam beberapa bab dan subbab sehingga pada akhir penulisan akan memberikan gambaran secara menyeluruh. Sistematika penulisan disusun dengan urutan sebagai berikut.

BAB I. PENDAHULUAN

Bab ini berisi latar belakang penulisan tugas akhir, rumusan masalah, batasan masalah, metodologi penelitian, dan sistematika penulisan.

BAB II. LANDASAN TEORI

Bab ini membahas mengenai pengetahuan yang menjadi dasar teori untuk pembuatan gudang data dan mengimplementasikan teknik


(29)

penambangan data menggunakan metode analisis asosiasi dengan algoritma Apriori.

BAB III : ANALISIS DAN PERANCANGAN SISTEM

Dalam bab ini akan diidentifikasikan masalah yang akan diselesaikan serta tahap tahap penyelesaian masalah tersebut dengan menggunakan algoritma apriori. Dalam bab ini pula akan dijelaskan pembuatan gudang data dan perancangan program implementasi penambangan data dengan algoritma apriori.

BAB IV. IMPLEMENTASI SISTEM

Bab ini berisi implementasi sistem yang meliputi implementasi data, implementasi use case, implementasi gudang data dan algoritma Apriori.

BAB V. ANALISA HASIL DAN PEMBAHASAN

Bab ini berisi analisa hasil program dan pembahasan masalah berdasarkan hasil yang telah didapat secara keseluruhan.

BAB VI. KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan dan saran dari hasil analisis serta pembahasan masalah berdasarkan hasil yang telah didapat.


(30)

BAB II

LANDASAN TEORI

2.1Gudang Data

2.1.1 Definisi Gudang Data

Gudang Data merupakan koleksi data yang mempunyai sifat berorientasi subjek, terintegrasi, rentang waktu dan tidak mengalami perubahan dari koleksi data dan mendukung proses pengambilan keputusan [1].

Menurut Connolly dan Begg, gudang data adalah koleksi data yang mempunyai sifat berorientasi pada subjek, terintegrasi, memiliki rentang waktu, dan koleksi datanya tidak mengalami perubahan dalam mendukung pengambilan keputusan ditingkatan manajerial.

Tujuan utama gudang data untuk mengintegrasi data yang dimiliki perusahaan ke dalam sebuah repository yang akan memudahkan pengguna untuk menjalankan query, menghasilkan laporan, dan menampilkan analisa sehingga memudahkan perusahaan dalam mengambil keputusan.

2.1.2 Komponen Gudang Data

Ada banyak komponen yang terdapat dalam gudang data[2], diantaranya :

1. Penyimpan data

Penyimpan data operasional adalah komponen yang paling umum dalam gudang data. Setiap hari organisasi akan melakukan


(31)

penyimpanan data operasional dimana data yang disimpan adalah tunggal untuk suatu aplikasi tertentu. Fungsi dari penyimpanan data operasional dalam gudang data adalah sebagai sumber aliran data mentah. Organisasi dalam penyimpanan data ini pada umumnya berorientasi subyek, dan berfokus pada pelanggan, produk, order, kebijakan hal lain diseputarnya. Penyimpanan data ini sering juga disebut sebagai gudang data secara fisik.

2. Data Mart

Data Mart adalah bagian dari gudang datadimana hanya data yang relevan saja yang dipelihara. Data Mart sering dilihat sebagai cara untuk meningkatkan masukan ke dalam bidang dari gudang data dan membuat seluruh kesalahan menjadi kecil. Data Mart biasanya digunakan oleh firma untuk memperkecil biaya dan memperkecil skala.

3. Metadata

Metadata merupakan salah satu contoh dari gudang data secara logikal. Yang digunakan untuk memperoleh informasi dan mengakses data secara aktual. Sistem legacy pada umumnya tidak menyimpan

record tentang karakteristik dari data, seperti berapa item data yang ada, dimana lokasi data, darimana data itu berasal, atau bagaimana data dapat diakses. Metadata adalah data sederhana tentang data yaitu


(32)

lebih memperhatikan informasi yang disimpan tentang gudang dari pada informasi yang disediakan oleh gudang.

4. Sistem pendukung keputusan dan sistem informasi eksekutif. Keduanya bukanlah bagian dari gudang data akan tetapi aplikasi - aplikasinya digunakan untuk gudang data.

2.1.3 Karakteristik Gudang Data

Karakteristik gudang data[2]

1. Subject Oriented (Berorientasi subject)

Gudang Data berorientasi subject artinya Gudang Data didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu. Gudang Data diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers, products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing,stock control dan

sales product). Hal ini dikarenakan kebutuhan dari gudang Data untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.

2. Integrated (Terintegrasi)

Gudang Data dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data


(33)

tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep gudang data itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh pengembang yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.

3. Time-variant (Rentang Waktu)

Seluruh data pada gudang data dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu dapata menggunakan variasi/perbedaan waktu yang disajikan dalam gudang data baik implicit maupun explicit. Secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.


(34)

4. Non-Volatile

Karakteristik keempat dari gudang data adalah non-volatile, maksudnya data pada gudang data tidak di-update secara real time

tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara terus-menerus menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya. Berbeda dengan database operasional yang dapat melakukan update, insert dan delete terhadap data yang mengubah isi dari database sedangkan pada gudang data hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses gudang data seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).

2.1.4 Arsitektur Gudang Data


(35)

Sumber data untuk mendukung pembuatan gudang data berupa data transaksi sehari-hari. Data tersebut dapat disimpan dalam berbagai media seperti

file excel , OLTP, dan sebagainya. Sebelum data di pindahkan ke gudang data, terlebih dahulu dilakukan proses ETL (Extract, Transform, Load). Setelah gudang data terbentuk dilanjutkan dengan proses OLAP dan Data Mining. OLAP menyediakan data secara multidimensi sehingga memudahkan pengguna dalam proses analisa dan pelaporan. Data mining menggali informasi berharga lainnya dari gudang data yang telah terbentuk.

2.1.5 Manfaat Gudang Data

Berikut ini manfaat yang bisa dilakukan dengan adanya gudang data, yaitu [4]:

a. Pembuatan laporan merupakan salah satu kegunaan gudang data yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari, perbulan, pertahun atau jangka waktu kapanpun yang diinginkan

b. On-Line Analytical Processing (OLAP).

Dengan adanya gudang data, semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat. OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi


(36)

dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill- down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya

c. Penambangan Data (Data mining)

Data mining merupakan proses untuk menggali (mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada gudang data, dengan menggunakan kecerdasan buatan (Artificial Intellegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.

d. Proses informasi executive

Gudang datadapat membuat ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan gudang datasegala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan gudang datamenjadi target informative bagi pengguna.


(37)

2.1.6 Langkah Pembuatan Gudang data

Adapun langkah-langkah dalam pembuatan gudang dataantara lain: 1. Membaca data legacy

Memperhatikan bagian-bagian data yang perlu untuk dibersihkan 2. Memindahkan data dari sumber ke server gudang data

Membuat standarisasi format dan copy-kan data dari sumber sekaligus data dibuat bersih (clean).

3. Memecah gudang data dalam tabel fakta dan tabel dimensi.

Tabel fakta dan tabel dimensi disusun menurut kebutuhan subyek

2.1.7 Online Analytical Processing (OLAP)

Online Analytical Processing (OLAP) adalah sintetis dinamis, analisis dan konsolidasi dari sekumpulan besar data multi-dimensi [3]. OLAP memungkinkan pengguna untuk mendapatkan pengertian dan pengetahuan yang mendalam mengenai berbagai aspek dari data perusahaan dengan akses yang cepat, konsisten, interaktif melalui kemungkinan variasi view

dari data. Penjelasan mengenai perbedaan OLTP dan OLAP tampak pada tabel 2.1 [7].

Tabel 2.1 Perbedaan OLTP dan OLAP

Fitur OLTP OLAP

Karakteristik Proses operasional Proses Informasi


(38)

Fungsi Menangani transaksi sehari-hari

Kebutuhan informasi jangka panjang, pendukung keputusan Desain Database Berorientasi pada aplikasi Star/Snowflake Schema

Data Data up-to-date Data histori

Unit Kerja Transaksi sederhana Complex query

2.1.8 Extract, Transform, Load (ETL)

ETL merupakan singkatan dari extract, transform, load yang berfungsi untuk melakukan ekstraksi data dari data source, dan kemudian melakukan transformasi data, sebelum mengirimkannya ke data store

tujuan. Extract adalah suatu pengambilan atau perpindahan data yang dilakukan dari suatu tempat data awal ke tempat data sementara. Kemudian transform adalah suatu perubahan bentuk yang dilakukan untuk memenuhi kebutuhan. Sedangkan load adalah suatu pengiriman atau perpindahan data dari tempat data sementara atau variabel tertentu ke tempat penampungan akhir sebelum data tersebut ditampilkan atau diolah kembali.

Hal ini dijelaskan oleh Kimball yang menyatakan bahwa Extract Transform Load (ETL) adalah kumpulan dari proses dimana sumber data operasional disiapkan untuk dimasukan kedalam data warehouse. Proses ini terdiri dari proses ekstraksi (extracting) data operasional dari sumber aplikasi, mengubah bentuknya (transforming), mengeluarkan (loading)


(39)

dan membuat index dari data itu untuk menjamin kualitas dari data lalu menerbitkannya.

2.1.9 Dimensional modeling

2.1.9.1Tabel Fakta (Fact Table)

Tabel fakta merupakan tabel utama dalam model dimensional dimana ukuran dari performa suatu bisnis disimpan [7] . Fakta berisi nilai dari sebuah kejadian atau transaksi tertentu misalnya penyimpanan uang di bank, penjualan produk, pesanan, dan sebagainya. Tabel fakta umumnya mengandung angka dan data history yang terdiri dari foreign key yang merupakan primary key dari beberapa dimension table yang saling berhubungan. Tabel fakta sering disebut juga dengan major table.

2.1.9.2Tabel Dimensi

Tabel dimensi digunakan untuk menyempurnakan data yang ada pada tabel fakta atau menjelaskannya dengan lebih detil [7]. Datanya berupa karakter. Setiap tabel dimensi menyimpan baris dari data dengan informasi berupa karakter yang menjelaskan field yang berhubungan dengan tabel fakta dengan lebih detil.

Tabel dimensi lebih kecil dan memiliki baris yang sedikit dari tabel fakta, biasanya terdiri dari ratuan atau ribuan record. Tabel dimensi menyimpan hanya satu baris data untuk setiap item data, sedangkan tabel


(40)

fakta bisa memiliki banyak baris data untuk beberapa transaksi bagi item data yang sama.

2.1.9.3Cube, Dimension, Measure, Member

Teknologi OLAP menganut multi dimensional modeling, artinya dapat melihat analisis pengukuran dengan pandangan berbagai dimensi. Di dalam konsep ini perlu mengenal berbagai istilah yang berkaitan dengan OLAP [8]:

1. Cube adalah struktur multi dimensional konseptual, terdiri dari dimension dan measure dan biasanya mencakup pandangan bisnis tertentu.

2. Dimension adalah struktur view / sudut pandang yang menyusun cube. Dimensi dapat terdiri dari berbagai level.

3. Measure : nilai pengukuran

4. Member adalah isi / anggota dari suatu dimension / measure tertentu 2.1.9.4Skema Bintang (Star Schema)

Star schema berpusat pada satu tabel fakta yang dikelilingi oleh satu atau beberapa tabel dimensi sebagai cabangnya sehingga kelihatan seperti bintang. Setiap percabangan berhenti pada satu tabel dimensi. Atau dengan kata lain tabel dimensi dengan skema ini semuanya berupa leaf (daun) dan tidak ada percabangan lain dapat dilihat pada Gambar 2.1 [9].


(41)

Gambar 2.1 Star Schema dari PHI-Minimart 2.1.9.5Surrogate key

Surrogate key adalah key / kolom data di tabel dimensi yang menjadi primary

key dari tabel tersebut. Nilai ini biasanya berupa nilai sekuensial dan tidak

memiliki arti dari proses bisnis darimana sumber data berasal [10].

2.2Penambangan Data (Data Mining)

“Penambangan data adalah proses pengolahan informasi dari sebuah database yang besar, meliputi proses ekstraksi, pengenalan, komprehensif, dan penyajian informasi sehingga dapat digunakan dalam pengambilan

keputusan bisnis yang krusial “ (Connolly dan Begg 2004, p1233).

Sedangkan menurut Han dan Kamber (2006, p7)., “Penambangan


(42)

yang sangat besar. “. Penambangan Data merupakan suatu langkah dalam

knowledge discovery in database (KDD).

Langkah-langkah dalam menemukan pengetahuan (discovery knowledge) meliputi :

1. Data cleaning

Menghilangkan noise dan data yang tidak konsisten 2. Data integration

Menggabungkan berbagai sumber data 3. Data Selection

Menerima data yang berhubungan dnegan analisa dari database 4. Data transformation

Mengubah data ke bentuk yang sesuai untuk mining dengan melakukan agregasi atau summary

5. Data mining

Melakukan proses mining untuk mengekstrak data 6. Pattern evaluation

Mengidentifikasi pola yang menggambarkan pengetahuan (knowledge) 7. Knowledge presentation


(43)

Menampilkan mined knowledge kepada pengguna

Gambar 2.3 Langkah-Langkah Discovery Knowledge

Suatu sistem atau query data mining mungkin saja menghasilkan ribuan pola, namun tidak semua pola tersebut adalah pola yang menarik atau penting. Ukuran suatu pola yang menarik atau penting adalah jika pola tersebut mudah dimengerti oleh manusia, bermanfaat, valid / benar pada data baru atau data tes dan membenarkna beberapa hipotesis.

Penambangan data berkaitan erat dengan Gudang Data dan OLAP ( On-Line Analytical Processing). Gudang Data merupakan data mentah yang akan


(44)

digunakan untuk analisa data menggunakan teknik penambangan data sedangkan OLAP adalah basisdata yang khusus digunakan untuk menunjang proses pengambilan keputusan (decision making). Teknologi yang ada di gudang data dan OLAP dimanfaatkan penuh untuk melakukan penambangan data.

Gambar 2.4 Data Mining dan teknologi basisdata lainnya

2.3Metode Analisis Asosiasi

Salah satu metode dalam penambangan data adalah metode analisis asosiasi (association analysis). Metode analisis asosiasi merupakan metode yang bertujuan untuk menemukan aturan (association rule) antar item dalam suatu himpunan data (dataset), yaitu dengan membuat korelasi antar item yang dikelompokan ke dalam transaksi kemudian mengambil kesimpulan berdasarkan hubungan yang terbentuk dari sekumpulan data tersebut. Kumpulan item data ini sering disebut itemset.

Penting tidaknya suatu aturan asosiasi dapat diketahui dengan 2 parameter yaitu support dan confidence. Support adalah persentase kombinasi item dalam basisdata sedangkan confidence adalah kuatnya hubungan antar item dalam aturan asosiasi [12]. Pencarian aturan asosiasi dengan menggunakan


(45)

analisis asosiasi bertujuan untuk menemukan semua aturan yang terdapat pada basisdata dengan minsup (minimum support) dan mincof (minimum confidence) yang melebihi batas tertentu. Suatu aturan asosiasi dirasa valid

apabila mempunyai nilai confidence / nilai kepastian ≥ 50% (Lopez-Cozar, 2000).

Support dari aturan adalah rasio dari record yang mengandung dengan total record dalam basisdata. Untuk mendapatkan nilai support

dapat menggunakan rumus :

...(2.1) Sedangkan Minsup (minimum support) menandakan ambang batas (threshold) yang menentukan apakah sebuah itemset akan digunakan pada perhitungan selanjutnya untuk pencarian aturan asosiasi.

Confidence dari aturan asosiasi adalah rasio dari record yang mengandung dengan total record yang mengandung . Untuk mendapatkan nilai confidence dapat menggunakan rumus :

.......(2.2) Atau dapat ditulis sebagai berikut:

...(2.3). Sedangkan Minconf (minimum confidence) menandakan ambang batas (threshold) dari sebuah aturan asosiasi untuk menemukan aturan asosiasi yang kuat (strong association rule).


(46)

Misalnya terdapat himpunan data transaksi D sebagai berikut [13]: Tabel 2.2 Contoh Tabel Transaksi D

TID Itemset

1 Bread, Milk

2 Bread, Diaper, beer, Eggs

3 Milk, Diaper, Beer, Coke

4 Bread, Milk, Diaper, Coke

5 Bread, Milk, Diaper, Coke

Misalkan akan dihasilkan rule : {Milk, Diaper}→Beer Maka support menjadi

Confidence menjadi

Secara umum yang dilakukan dalam proses pencarian aturan asosiasi ini dapat dibagi menjadi 2 tahapan, yang terdiri dari :

o Pencarian frequent itemset

Yaitu proses pencarian semua itemset yang memiliki nilai support ≥

minsup. Itemset ini disebut frequent itemset atau large itemset ( l-itemset). Dalam tugas akhir ini proses pencarian frequent itemset

menggunakan algoritma apriori.

o Pembentukan strong association rule

Yaitu proses mendapatkan aturan asosiasi yang kuat (strong association rule) dari kombinasi frequent itemset yang membentuk


(47)

aturan asosiasi yang memiliki nilai confidence minconf. Aturan asosiasi dapat ditemukan dari setiap frequent itemset.

2.4Algoritma Apriori

Algoritma Apriori merupakan algoritma untuk mencari frequent itemset yang berdasarkan prinsip apriori, yaitu jika suatu itemset merupakan

frequent itemset maka semua subset-nya akan berupa frequent itemset (Tan, et.al. 2006). Pembentukan frequent itemset dilakukan dengan mencari semua kombinasi item-item yang memiliki support yang lebih besar atau sama dengan minsup yang telah ditentukan. Pseudocode untuk pencarian frequent itemset menggunakan algoritma apriori adalah sebagai berikut (Gunawan, 2003) [11] :

= candidate itemset untuk ukuran k

= frequent itemset / large itemset untuk ukuran k = {candidate 1-itemset}

= {large 1-itemset}

for ( ) do begin

// new candidate

for all transaction do begin

//candidate contained in

for all candidates do

end

end


(48)

Algoritma diatas dapat dijelaskan sebagai berikut :

a. Pada iterasi pertama dihitung jumlah kemunculan setiap item dalam transaksi untuk menentukan large 1-itemset. Pada iterasi selanjutnya akan dihasilkan candidate k-itemset Ck menggunakan

frequent(k-1)-itemset yang ditemukan pada iterasi sebelumnya. Candidate generation

diimplementasikan menggunakan sebuah fungsi yang disebut apriori-gen. Apriori-gen digunakan untuk menghasilkan candidate itemset yang menyebabkan tidak seluruh itemset diolah pada proses selanjutnya, hanya yang memenuhi persyaratan saja yaitu sesuai dengan support

yang telah ditentukan. Hal ini mempersingkat waktu proses pencarian seluruh aturan asosiasi.

b. Setelah itu, dilakukan penelusuran dalam basisdata untuk menghitung

support bagi setiap candidate itemset dalam Ck . Untuk setiap transaksi

t, dicari semua candidate itemset t dalam set Ck yang terkandung dalam transaksi tersebut. Kumpulan dari semua candidate itemset dalam Ck yang terkandung dalam transaksi t disebut Ct dan ditulis dengan notasi

c. Selanjutnya nilai support dari semua candidate k-itemset dalam Ct dinaikkan. Penelusuran dilanjutkan pada transaksi berikutya sampai semua transaksi dalam basisdata ditelusuri. Lalu akan dilakukan eliminasi candidate itemset yang memiliki nilai support lebih kecil dari


(49)

disimpan dalam Lk yang akan digunakan untuk membentuk large

(k+1)-itemset. Algoritma berakhir ketika tidak ada large itemset baru yang dihasilkan.

Pencarian frequent itemset menggunakan algoritma apriori memiliki 2 karakteristik penting yaitu :

1. Apriori merupakan algoritma level-wise dimana proses pada algoritma ini membangkitkan frequent itemset per level, dimulai dari level 1-itemset sampai ke itemset terpanjang dan candidate level yang baru, dibentuk dari frequent itemset yang ditemukan di level sebelumnya lalu menentukan nilai supportnya.

2. Algoritma ini menggunakan strategi generate and test untuk menemukan frequent itemset. Pada tiap iterasi, candidate itemset

yang baru, dihasilkan dari frequent itemset yang ditemukan pada iterasi sebelumnya. Nilai support tiap candidate dihitung dan di bandingkan kembali dengan ambang batas minsupnya. Jumlah

iterasi yang dibutuhkan algoritma ini adalah , dimana kmaxmerupakan ukuran maksimum dari frequent itemset.

Algoritma apriori menggunakan arah pencarian bottom-up, dimana arah pencarian dimulai dari frequent itemset menuju itemset terpanjang. Strategi yang digunakan adalah breadth-first search dimana proses pencarian dilakukan per level dan untuk tiap level-nya ditentukan nilai


(50)

support-nya untuk menemukan frequent itemset pada level tersebut. Sedangkan strategi perhitungan nilai support dilakukan dengan horizontal counting, dengan cara membaca transaksi satu persatu, jika ditemukan

itemset yang dicari pada transaksi tersebut maka counter bertambah satu, begitu selanjutnya.


(51)

BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Identifikasi Masalah

PT. ASDP Indonesia Ferry (Persero) Cabang Kupang menangani pelayaran antar pulau di daerah Nusa Tenggara Timur. Data transaksi operasional pelayaran di tiap lintasan meliputi kapal yang beroperasi, jenis tiket yang terdiri dari tiket penumpang, tiket kendaraan, dan tiket barang serta produksi dan pendapatan. Data operasional produksi dan pendapatan yang dimiliki oleh PT. ASDP Kupang ini masih tercatat secara manual dalam bentuk file excel sehingga pihak Supervisor mengalami kesulitan dalam menganalisa data tersebut. Jadi untuk memudahkan menganalisa data tersebut maka digunakan teknik gudang data untuk merangkum transaksi sehingga mudah dianalisa.

Pada tugas akhir ini akan dibangun sebuah gudang data yang dimanfaatkan untuk keperluan OLAP dan penambangan data menggunakan algoritma Apriori. OLAP membantu pihak ASDP Kupang dalam pelaporan produksi dan pendapatan. Teknik penambangan data dengan algoritma apriori membantu pencarian pola asosiasi antara hari, lintasan, dan pendapatan. Data transaksi yang digunakan adalah data transaksi tahun 2010 dan 2011 yang diperoleh dari PT. ASDP Indonesia Ferry (Persero) Cabang Kupang.


(52)

3.2 Arsitektur Sistem

Clean Extract Transform Load Refresh

Gudang Data Pelayanan Produksi

ASDP Kupang

OLAP

Data Mining – Algoritma

Apriori Sumber data

excel Gudang data Pemanfaatan

Gudang data

Gambar 3.1 Arsitektur Sistem

Gambar 3.1 merupakan arsitektur sistem yang digunakan untuk pembangunan gudang data yang akan digunakan untuk proses OLAP dan penerapan algoritma Apriori. Pembangunan gudang data ASDP Kupang berasal dari sumber data yang berbentuk file excel yang berisi laporan produksi dan pendapatan di setiap lintasan. Sumber data yang masih berbentuk excel dilakukan proses ETL (Extract, Transform, Load) dan hasil dari proses ETL akan disimpan sebagai gudang data sehingga dapat dilakukan proses OLAP dan penerapan algoritma Apriori. Hasil dari pembentukan OLAP nantinya digunakan untuk membantu supervisor dalam memantau produksi dan pendapatan di setiap lintasan yang dikelola. Sedangkan hasil penambangan data dengan algoritma apriori digunakan untuk membantu pihak ASDP menganalisa hubungan antara hari, lintasan, dan pendapatan dari PT. ASDP Ferry Kupang demi peningkatan pelayanan perusahaan.


(53)

3.3 Analisis Kebutuhan

Supervisor Lintasan PT. ASDP Ferry Cabang Kupang ingin mengetahui informasi produksi dan pendapatan pada PT. ASDP Indonesia Ferry (Persero) Cabang Kupang. Informasi yang diinginkan meliputi informasi lintasan yang dikelola, kapal yang sering beroperasi, jenis tiket yang ditawarkan, besar produksi, dan besar pendapatan yang diterima tiap bulan. Informasi dibutuhkan untuk membuat rekap produksi dan pendapatan berbagai lintasan yang dikelola oleh PT. ASDP Kupang. Selain itu dengan teknik penambangan data menghasilkan informasi berharga mengenai keterkaitan antara hari, lintasan, pendapatan. Hasil asosiasi teknik penambangan data membantu pihak ASDP menyusun strategi untuk peningkatan kualitas pelayanan perusahaan.

3.4 Pembersihan Data

Pada tahap ini dilakukan proses menghilangkan data yang tidak konsisten atau data yang tidak relevan. Misalnya pada data transaksi pada tanggal 01 Januari 2010 lintasan Kupang-Rote tidak terdapat pencatatan produksi pembelian tiket kategori kendaraan golongan III tetapi di waktu yang sama tercatat pembelian tiket kategori penumpang ekonomi dewasa, maka dilakukan pembersihan data khusus untuk transaksi kosong seperti tiket kategori golongan III.


(54)

3.5 Transformasi Data

Pada tahap ini dilakukan pengubahan data ke dalam format yang sesuai untuk proses dalam gudang data. Terdapat pengubahan metadata dari setiap atribut sehingga mudah dinavigasikan. Atribut yang dimiliki data transaksi antara lain kode_tiket, jenis_tiket, tarif, nama_kapal, tanggal, produksi, pendapatan. Terdapat beberapa atribut yang dipecah antara lain kode_tiket dan jenis_tiket. Kode_tiket dibagi menjadi 2 antara lain id_kategori_tiket, yang menampung kategori tiket yaitu id tiket kategori penumpang, id tiket kategori kendaraan, dan id tiket kategori barang. Kategori_tiket menampung 3 kategori tiket yaitu penumpang, kendaraan, dan barang. Jenis tiket dibagi menjadi 2 yaitu id_tiket dan nama tiket. Berdasarkan pemecahan data tersebut dihasilkan atribut baru yaitu no, tanggal_opr, lintasan, kapal, id_kategori_tiket, id_tiket, kategori_tiket, tiket, produksi, dan pendapatan. Pada proses transformasi ini sebelum data dimasukkan ke gudang data akan diubah meta data dari tiap atribut sehingga memudahkan untuk proses selanjutnya.

3.6 Pembuatan Gudang Data

Berdasarkan analisis kebutuhan pihak PT. ASDP Kupang diperlukan sebuah gudang data operasional dan pendapatan. Berikut ini adalah beberapa langkah dalam pembuatan gudang data


(55)

3.6.1 Membaca data legacy

Sumber data yang ada berupa data transaksi setiap lintasan. Data transaksi ini masih berbentuk file excel. Struktur data dari rekapitulasi tiap jenis lintasan seperti pada tabel 3.1

Tabel 3.1 Rekapitulasi jenis lintasan

JenisLintasan Tabel jenis lintasan pada tiap layanan PK NO URUT NO URUT sebagai primary key

NO URUT KODE TIKET JENIS TIKET

TARIF

NAMA KAPAL NAMA LINTASAN TANGGAL

PRODUKSI PENDAPATAN

Berisi NO URUT transaksi Berisi kode tiket pelayaran

Berisi jenis tiket lintasan, yang terdiri dari tiket penumpang, tiket kendaraan, dan tiket barang Berisi tarif tiket dari lintasan

Berisi nama kapal yang beroperasi Berisi nama lintasan yang dikelola Berisi tanggal operasi kapal Berisi jumlah tiket yang dibeli

Berisi pendapatan dari penjualan jenis tiket

Tabel 3.1 merupakan struktur data rekapitulasi untuk setiap jenis lintasan. Pada tabel ini terdapat 8 field yang ada pada setiap rekapitulasi pelayaran operasional. Field NO URUT merupakan primary_key dari tabel data JenisLintasan. Terdapat pula beberapa field yaitu KODE_TIKET, JENIS_TIKET, TARIF, NAMA_KAPAL, NAMA LINTASAN,


(56)

TANGGAL, PRODUKSI, PENDAPATAN. Contoh data jenis lintasan seperti pada tabel 3.2

Tabel 3.2 Contoh data rekapitulasi Lintasan

NO URUT 1

KODE TIKET 4101010301

JENIS TIKET EKONOMI – DEWASA

TARIF 29700

NAMA KAPAL CUCUT

NAMA LINTASAN KUPANG-ROTE

TANGGAL 01/01/2010

PRODUKSI 153

PENDAPATAN 4.544.100

3.6.2 Memindahkan data dari sumber ke server gudang data

Untuk membangun gudang data data terlebih dahulu data dibersihkan dengan menghilangkan data-data yang memiliki missing value. Setelah berhasil dibersihkan data tersebut di transformasi ke server gudang data. Gudang data ini terbentuk tabel master yang akan digunakan untuk proses OLAP dan penerapan algoritma Apriori. Berikut ini pembentukan tabel master_operasional dapat dilihat pada gambar 3.2.


(57)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan

Master_operasional.xls Database gudang data

Gambar 3.2 Pembentukan master_operasional ke gudang data

Gambar 3.2 merupakan proses pembentukan tabel master_operasional. Tabel master_operasional berasal dari data operasional pada file excel. Tabel ini akan digunakan untuk proses selanjutnya yaitu OLAP dan Penambangan Data.

3.7Pemanfaatan Gudang Data

3.7.1 Pembuatan OLAP

Setelah tabel master_operasional terbentuk ke dalam gudang data maka dilanjutkan proses OLAP dan penerapan algoritma Apriori. Dalam proses pembentukan OLAP akan digunakan sebuah schema multidimensional yaitu Star Schema. Schema ini digunakan karena lebih efisien dan sederhana dalam pembuatan query serta mudah diakses oleh pengguna. Dalam star schema terdapat tiga tabel fakta dan beberapa tabel dimensi guna pemrosesan query yang lebih ringan.

Berdasarkan keperluan Laporan Bulanan Produksi dan Pendapatan diperoleh kebutuhan informasi sebagai berikut :


(58)

1. Informasi rekapitulasi jumlah produksi dan besar pendapatan yang diperoleh setiap bulannya pada tahun 2010 dan 2011 untuk setiap lintasan, kapal dan tiket.

2. Informasi jumlah produksi untuk setiap lintasan, kapal, dan tiket tiap bulannya pada tahun 2010 dan 2011.

3. Informasi besar pendapatan yang diperoleh untuk setiap lintasan, kapal, dan tiket tiap bulannya pada tahun 2010 dan 2011.

Dalam proses pembuatan OLAP, gudang data yang terbentuk dipecah menjadi beberapa tabel dimensi dan tabel fakta. Pembentukan tabel dimensi dan tabel fakta antara lain:

1. Tabel Dimensi merupakan tabel yang berisi data yang menunjukkan tinjauan dari berbagai perspektif. Penjelasan dari masing-masing tabel dimensi dijelaskan sebagai berikut:

a. Tabel dimensi_lintasan master_operasional PK no

tanggal_opr lintasan kapal

id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan

dimensi_lintasan PK sk_lintasan

lintasan

Gambar 3.3 Pembentukan tabel dimensi_lintasan

Gambar 3.3 merupakan proses pembentukan tabel dimensi_lintasan. Tabel dimensi_lintasan berasal dari tabel


(59)

master_operasional. Pada tabel dimensi_lintasan ini memiliki

primary key sk_lintasan dan field lainnya yaitu lintasan.

b. Tabel dimensi_kapal master_operasional PK no

tanggal_opr lintasan kapal

id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan

dimensi_kapal PK sk_kapal

kapal

Gambar 3.4 Pembentukan tabel dimensi_kapal

Gambar 3.4 merupakan proses pembentukan tabel dimensi_kapal. Table dimensi_kapal berasal dari tabel master_operasional. Pada tabel dimensi_kapal ini memiliki

primary key sk_kapal dan field lainnya yaitu kapal.


(60)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket

Gambar 3.5 Pembentukan tabel dimensi_tiket

Gambar 3.5 merupakan proses pembentukan tabel dimensi_tiket. Table dimensi_tiket berasal dari tabel master_operasional. Pada tabel dimensi_tiket ini memiliki primary key sk_tiket dan field lainnya yaitu id_kategori_tiket, kategori_tiket, id_tiket, dan tiket.

d. Tabel dimensi_waktu master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year


(61)

Gambar 3.6 merupakan proses pembentukan tabel dimensi_waktu. Table dimensi_waktu berasal dari tabel master_operasional. Pada tabel dimensi_tiket ini memiliki primary key sk_waktu dan field lainnya yaitu day, month, year.

2. Tabel fakta yang terbentuk dari perancangan gudang data ini merupakan tabel yang berhubungan dengan pelayanan operasional di PT. ASDP Indonesia Ferry Cabang Kupang. Pembentukan tabel fakta dapat dijelaskan sebagai berikut :

a. Tabel fact_rekapitulasi

Tabel ini berisi semua data yang berhubungan dengan pelayanan operasional produksi dan pendapatan ASDP yang terdiri dari sk_rekapitulasi, sk_waktu, sk_lintasan, sk_kapal, sk_tiket, produksi, dan pendapatan.


(62)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket dimensi_kapal PK sk_kapal kapal dimensi_lintasan PK sk_lintasan lintasan fact_rekapitulasi PK sk_rekapitulasi sk_waktu sk_lintasan sk_kapal sk_tiket produksi pendapatan Gambar 3.7 Pembentukan tabel fact_rekapitulasi b. Tabel fact_laporan_produksi

Tabel ini berisi semua data yang berhubungan dengan pelayanan operasional produksi ASDP yang terdiri dari sk_fact_laporan_produksi, sk_waktu, sk_lintasan, sk_kapal, sk_tiket, produksi.


(63)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket dimensi_kapal PK sk_kapal kapal dimensi_lintasan PK sk_lintasan lintasan fact_laporan_produksi PK sk_fact_laporan_produksi sk_waktu sk_lintasan sk_kapal sk_tiket produksi

Gambar 3.8 Pembentukan tabel fact_laporan_produksi

c. Tabel fact_laporan_pendapatan

Tabel ini berisi semua data yang berhubungan dengan pendapatan pelayanan operasional ASDP yang terdiri dari sk_fact_laporan_produksi, sk_waktu, sk_lintasan, sk_kapal, sk_tiket, pendapatan.


(64)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket dimensi_kapal PK sk_kapal kapal dimensi_lintasan PK sk_lintasan lintasan fact_laporan_pendapatan PK sk_fact_laporan_pendapatan sk_waktu sk_lintasan sk_kapal sk_tiket pendapatan

Gambar 3.9 Pembentukan tabel fact_laporan_pendapatan

Proses pembentukan OLAP ASDP ini memerlukan 3 cube yaitu

cube laporan_rekapitulasi, cube laporan_produksi, dan cube

laporan_pendapatan. Cube laporan_rekapitulasi merupakan cube yang digunakan untuk melihat hasil rekapitulasi semua data produksi dan pendapatan yang dilihat dari perspektif waktu, lintasan, kapal, dan tiket.

Cube laporan_produksi merupakan cube yang digunakan untuk melihat laporan besar produksi yang dilihat dari perspektif waktu, lintasan, kapal, dan tiket. Cube laporan_pendapatan merupakan cube yang digunakan


(65)

untuk melihat laporan besar pendapatan pelayan operasional PT. ASDP Ferry Cabang Kupang yang dilihat dari perspektif waktu, lintasan, kapal, dan tiket. Ketiga cube ini berhubungan dengan tabel dimensi. Berikut ini penjelasan mengenai cube dalam pembentukan OLAP

1. Cube laporan_rekapitulasi

Cube laporan_rekapitulasi dengan star schema laporan_rekapitulasi. Pada star schema laporan_rekapitulasi memilki tabel fakta yaitu fact_rekapitulasi dan tabel dimensi yaitu tabel dimensi_waktu, dimensi_lintasan, dimensi_kapal, dan dimensi_tiket. Nilai pengukuran dalam cube adalah jumlah produksi dan besar pendapatan pelayanan operasional PT. ASDP Ferry Cabang Kupang. Star schema


(66)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket dimensi_kapal PK sk_kapal kapal dimensi_lintasan PK sk_lintasan lintasan fact_rekapitulasi PK sk_rekapitulasi sk_waktu sk_lintasan sk_kapal sk_tiket produksi pendapatan

Gambar 3.10 Star Schema laporan_rekapitulasi 2. Cube laporan_produksi

Cube laporan_produksi dengan star schema laporan_produksi. Pada

star schema laporan_produksi memilki tabel fakta yaitu fact_laporan_produksi dan tabel dimensi yaitu tabel dimensi_waktu, dimensi_lintasan, dimensi_kapal, dan dimensi_tiket. Nilai pengukuran dalam cube adalah jumlah produksi pelayanan operasional PT. ASDP Ferry Cabang Kupang. Star schema laporan_produksi dapat dilihat pada gambar 3.11


(67)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket dimensi_kapal PK sk_kapal kapal dimensi_lintasan PK sk_lintasan lintasan fact_laporan_produksi PK sk_fact_laporan_produksi sk_waktu sk_lintasan sk_kapal sk_tiket produksi

Gambar 3.11 Star Schema laporan_produksi 3. Cube laporan_pendapatan

Cube laporan_pendapatan dengan star schema laporan_pendapatan. Pada star schema laporan_pendapatan memilki tabel fakta yaitu fact_laporan_pendapatan dan tabel dimensi yaitu tabel dimensi_waktu, dimensi_lintasan, dimensi_kapal, dan dimensi_tiket. Nilai pengukuran dalam cube adalah besar pendapatan pelayanan operasional PT. ASDP Ferry Cabang Kupang. Star schema laporan_pendapatan dapat dilihat pada gambar 3.12


(68)

master_operasional PK no tanggal_opr lintasan kapal id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan dimensi_waktu PK sk_waktu day month year dimensi_tiket PK sk_tiket id_kategori_tiket kategori_tiket id_tiket tiket dimensi_kapal PK sk_kapal kapal dimensi_lintasan PK sk_lintasan lintasan fact_laporan_pendapatan PK sk_fact_laporan_pendapatan sk_waktu sk_lintasan sk_kapal sk_tiket pendapatan

Gambar 3.12 Star Schema laporan_pendapatan

3.7.2 Penerapan Algoritma Apriori

. Association rule (aturan asosiatif) adalah salah satu teknik utama dalam penambangan data dan merupakan bentuk yang paling umum dipakai dalam menemukan pattern atau pola dari suatu kumpulan data. Salah satu algoritma yang dapat digunakan untuk menemukan association rule adalah algoritma Apriori. Ciri dari algoritma Apriori adalah jika suatu itemset termasuk dalam large itemset, maka semua himpunan bagian (subset) dari itemset tersebut juga termasuk large itemset.. Pada proses


(69)

perhitungan association rule pengguna menentukan dataset atau parameter yang akan digunakan dalam proses.

Data set yang digunakan berasal dari gudang data yang telah terbentuk yakni dari tabel master_operasional. Atribut yang dipakai untuk proses asosiasi adalah hari, lintasan, dan pendapatan.

Tabel 3.3 Contoh data dari atribut

Hari Lintasan Pendapatan

Sabtu AIMERE_KUPANG 21.324.000

Rabu AIMERE_KUPANG 11.602.000

Rabu AIMERE_KUPANG 13.336.900

Selasa AIMERE_WAINGAPU 7.835.100

Kamis AIMERE_WAINGAPU 4.457.300

Sabtu AIMERE_WAINGAPU 3.710.100

Jumat BARANUSA_KALABAHI 851.000

Minggu BARANUSA_LEWOLEBA 408.000

Senin BARANUSA_LEWOLEBA 513.000

Selasa ENDE_KUPANG 9.895.700

Senin ENDE_KUPANG 11.968.800

..dst ..dst ..dst

Data atribut pendapatan dilakukan partisi sebanyak 5 partisi antara lain SANGAT TINGGI, TINGGI, CUKUP, RENDAH, SANGAT RENDAH. Kriteria pendapatan sangat tinggi > 30 juta, tinggi berkisar antara 19 juta sampai dengan 29,9 juta, kriteria cukup berkisar antara 9 juta hingga 18,9 juta, kriteria rendah berkisar 1,2 juta hingga 8,9 juta, dan kriteria sangat rendah < 1,19 juta.

. Selanjutnya pengguna menentukan nilai minimum support dan

minimum confidence yang akan digunakan dalam proses. Nilai minimum support dan minimum confidence yang dimasukkan adalah antara 0 –


(70)

100%. Setelah menentukan nilai minimum support dan minimum confidence yang akan digunakan dalam proses, baru dilakukan proses perhitungan association rule. Setelah proses perhitungan selesai, system akan menampilkan rule yang dihasilkan dan nilai confidencenya. Rule ini menunjukkan hasil asosiasi antara hari, lintasan, dan pendapatan.

Proses perhitungan association rule terdiri dari beberapa tahap antara lain

1. Sistem men-scan database untuk mendapatkan kandidiat 1-itemset (himpunan item yang terdiri dari 1 item) dan menghitung nilai

supportnya.. Support dari suatu itemset (S) merupakan presentase dari transaksi dalam T yang mengandung S. Kemudian nilai support tersebut dibandingkan dengan minimum support yang telah ditentukan. Jika nilainya lebih besar atau sama dengan minimum support maka itemset tersebut trmasuk dalam large itemset.

2. Itemset yang tidak termasuk dalam large itemset tidak diikutkan dalam iterasi selanjutnya (di-prune)

3. Pada iterasi kedua, system akan menggunakan hasil large itemset pada iterasi pertama (L1) untuk membentuk kandidat itemset kedua (L2 ). Pada iterasi selanjutnya system akan menggunakan hasil large itemset pada iterasi sebelumnya (Lk-1 ) untuk membentuk kandidat itemset berikutnya (Lk ). System akan menggabungkan (join) Lk-1 dengan Lk-1 untuk


(71)

mendapatkan Lk seperti pada itersi sebelumnya system akan menghapus (prune) kombinasi itemset yang tidak termasuk dalam large itemset.

4. Setelah dilakukan operasi join, maka pasangan itemset baru dari hasil proses join tersebut juga dihitung supportnya.

5. Proses pembentukan kandidat yang terdiri dari proses join dan prune akan terus dilakukan hingga himpunan kandidat itemsetnya null, atau sudah tidak ada lagi kandidat yang akan dibentuk.

6. Setelah itu, dari hasil frequent itemset tersebut dibentuk association rule

yang memenuhi nilai support dan confidence yang telah ditentukan.

7. Pada pembentukan association rule nilai yang sama dianggap satu nilai

8. Association rule yang terbentuk harus memenuhi nilai minimum yang telah ditentukan

9. Untuk setiap large itemset L, dicari himpunan bagian L yang tidak kosong. Untuk setiap himpunan bagian tersebut, dihasilkan rule dengan bentuk a


(72)

3.8 Analisis Kebutuhan

3.8.1 Use Case

Diagram use case ini dapat menggambarkan kebutuhan dari Supervisor Lintasan PT. ASDP terhadap sistem yang akan dibangun. Gambar 3.13 merupakan gambar diagram use case untuk aplikasi gudang data PT. ASDP Kupang.

Melihat laporan rekapitulasi

Melihat laporan produksi <<depends on>>

Cari aturan asosiasi Supervisor Lintasan

Login

Melihat laporan pendapatan

Transfer data produksi dan pendapatan


(73)

3.8.2 Narasi Use Case

Tabel 3.4 Narasi use case login

ID Use case : Ferry_01 Nama use case Login

Aktor : Supervisor Lintasan Deskripsi Use

Case :

Use case ini menggambarkan proses dimana supervisor lintasan melakukan login sebelum masuk ke sistem. Pengguna harus memasukkan username dan password ke sistem.

Prakondisi : - Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

2. Petugas Operasional memilih

menu “Login”

4. Memasukkan username dan password

6. Menampilkan halaman utama untuk petugas opersional

1.Menampilkan halaman utama

3.Menampilkan halaman login

5.sistem mengecek validasi di database

Langkah Alternatif

-

Kesimpulan Use case ini berhenti apabila pengguna akan memilih menu lain

Tabel 3.5 Narasi use case melihat laporan rekapitulasi ID Use case : Ferry_02

Nama use case Melihat laporan rekapitulasi Aktor : Supervisor Lintasan


(74)

Case : rekapitulasi pelayanan operasional Prakondisi : -

Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

1. Supervisor Lintasan

memilih menu

“Rekapitulasi Pelayanan” 2. Sistem

menampilkan hasil OLAP rekapitulasi pelayanan

Langkah Alternatif

-

Kesimpulan Use case ini berhenti apabila supervisor lintasan akan memilih menu lain

Tabel 3.6 Narasi use case melihat laporan produksi

ID Use case : Ferry_03

Nama use case Melihat laporan produksi Aktor : Supervisor Lintasan Deskripsi Use

Case :

Use case ini berfungsi untuk melihat hasil pembentukan OLAP

Laporan Produksi dair pelayanan PT. ASDP Ferry Kupang Prakondisi : -

Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

1. Supervisor Lintasan

memilih menu “Laporan


(75)

menampilkan hasil

OLAP laporan

produksi

Langkah Alternatif

-

Kesimpulan Use case ini berhenti apabila supervisor lintasan akan memilih menu lain

Tabel 3.7 Narasi use case melihat laporan pendapatan ID Use case : Ferry_04

Nama use case Melihat laporan pendapatan Aktor : Supervisor Lintasan

Deskripsi Use Case :

Use case ini berfungsi untuk melihat hasil pembentukan OLAP

laporan pendapatan pelayanan PT. ASDP Ferry Kupang Prakondisi : -

Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

1. Supervisor Lintasan

memilih menu “Laporan

Pendapatan” 2. Sistem

menampilkan hasil

OLAP laporan

pendapatan

Langkah Alternatif

-


(76)

menu lain

Tabel 3.8 Narasi use case transfer data produksi dan pendapatan

ID Use case : Ferry_05

Nama use case Transfer data produksi dan pendapatan Aktor : Supervisor Lintasan

Deskripsi Use Case :

Use case ini berfungsi untuk melakukan transfer data produksi dan pendapatan

Prakondisi : - Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

1. Memilih menu

“Transformasi Data”

3. Supervisor Lintasan

memilih tombol “transfer data”

2. Menampilkan halaman transfer data

4. Sistem melakukan proses transfer data

Langkah Alternatif

-

Kesimpulan Use case ini berhenti apabila supervisor lintasan akan memilih menu lain

Tabel 3.9 Narasi use case Cari Aturan Asosiasi ID Use case : Ferry_06

Nama use case Cari aturan asosiasi Aktor : Supervisor Lintasan


(77)

Case : antara hari, lintasan, dan pendapatan Prakondisi : -

Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

1. Supervisor Lintasan memilih

menu “Aturan Asosiasi”

3. Supervisor lintasan memasukkan support dan confidence

2.sistem menampilkan halaman aturan asosiasi

5.Sistem melakukan proses association dengan algoritma apriori

6.Menampilkan hasil perhitungan apriori

Langkah Alternatif

-

Kesimpulan Use case ini berhenti apabila supervisor lintasan akan memilih menu lain

3.8.3 Desain Antar Muka

Aplikasi yang akan dibangun digunakan pengguna agar dapat berinteraksi dengan sistem melalui Graphical User Interface (GUI) untuk layanan login, layanan pelaporan yakni melihat laporan rekapitulasi, laporan produksi, dan laporan pendapatan PT. ASDP Ferry Kupang. Selain


(78)

itu juga GUI yang terbentuk disediakan untuk layanan perhitungan asosiasi kapal yang beoperasi di PT. ASDP Ferry Kupang. Berikut ini rancangan antar muka yang disediakan dalam aplikasi

1. Halaman Login

Halaman login digunakan untuk memasukkan username dan

password pengelola sistem ini yakni Supervisor Lintasan. Halaman ini memiliki dua tombol yaitu Login dan Batal. Tombol logi digunakan untuk melakukan proses login untuk masuk ke halaman utama sistem. Tampilan halaman login dapat dilihat pada gambar 3.14

Username

Password

Login

PT. ASDP INDONESIA FERRY KUPANG

Gudang Data Pemantauan Pelayanan Operasional

Batal

Gambar 3.14 Halaman Login

2. Rancangan layar menu

Menu yang terdapat dalam sistem antara lain Rekapitulasi Pelayanan, Laporan Produksi, Laporan Pendapatan, Transformasi Data, Perhitungan Asosiasi Kapal. Setelah pengguna berhasil melakukan login,


(1)

157

4. HALAMAN PENDAPATAN

5. HALAMAN TRANSFORMASI DATA

Pada halaman transformasi data, admin diberi kewenangan untuk

melakukan transfer data pelayanan produksi dan pendapatan dengan

memilih tombol “Transfer Data”.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI


(2)

Setelah memilih tombol “Transfer Data” maka akan muncul tampilan

dekstop yang berarti sistem sedang melakukan transformasi data.

6. FUNGSI MENU MONDRIAN a. Icon OLAP Navigator


(3)

159

Berfungsi menambahkan atau mengurangi dimensi atau

pengukuran data yang ada.

Sebagai contoh, kita bisa memindahkan atribut kapal ke dalam

kategori measure untuk melihat lebih rinci lagi mengenai kapal.

b. Icon MDX Editor

Setelah menambahkan atau mengurangi dimensi dengan

menggunakan icon olap navigator, maka klik tombol “Apply” agar

tabel mondrian diupdate.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI


(4)

c. Icon Config OLAP Table

Digunakan untuk mengurutkan data baik dari kecil ke besar

maupun dari besar ke kecil.

d. Icon Suppress Empty Rows / Columns

Digunakan untuk menghilangkan baris atau kolom yang kosong.

Klik icon Suppress Empty Rows / Columns untuk menghilangkan

baris atau kolom yang kosong.

Digunakan untuk menghilangkan baris atau kolom yang kosong.

Klik icon Suppress Empty Rows / Columns untuk

menghilangkan baris atau kolom yang kosong.


(5)

161

Digunakan untuk memunculkan dan menghilangkan icon + dan -

Klik icon drill position untuk memunculkan icon + dan -

f. Icon Show Chart

Digunakan untuk menampilkan laporan dengan menggunakan

grafik.

g. Icon Print this Page via PDF

Icon Print this Page via PDF digunakan untuk membuka atau

menyimpan data dengan tipe .pdf.

h. Icon Start Excel

Icon Start Excel digunakan untuk membuka atau menyimpan data

dengan tipe .xls.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI


(6)