Analisis Kebutuhan Pembersihan Data Transformasi Data

3.3 Analisis Kebutuhan

Supervisor Lintasan PT. ASDP Ferry Cabang Kupang ingin mengetahui informasi produksi dan pendapatan pada PT. ASDP Indonesia Ferry Persero Cabang Kupang. Informasi yang diinginkan meliputi informasi lintasan yang dikelola, kapal yang sering beroperasi, jenis tiket yang ditawarkan, besar produksi, dan besar pendapatan yang diterima tiap bulan. Informasi dibutuhkan untuk membuat rekap produksi dan pendapatan berbagai lintasan yang dikelola oleh PT. ASDP Kupang. Selain itu dengan teknik penambangan data menghasilkan informasi berharga mengenai keterkaitan antara hari, lintasan, pendapatan. Hasil asosiasi teknik penambangan data membantu pihak ASDP menyusun strategi untuk peningkatan kualitas pelayanan perusahaan.

3.4 Pembersihan Data

Pada tahap ini dilakukan proses menghilangkan data yang tidak konsisten atau data yang tidak relevan. Misalnya pada data transaksi pada tanggal 01 Januari 2010 lintasan Kupang-Rote tidak terdapat pencatatan produksi pembelian tiket kategori kendaraan golongan III tetapi di waktu yang sama tercatat pembelian tiket kategori penumpang ekonomi dewasa, maka dilakukan pembersihan data khusus untuk transaksi kosong seperti tiket kategori golongan III.

3.5 Transformasi Data

Pada tahap ini dilakukan pengubahan data ke dalam format yang sesuai untuk proses dalam gudang data. Terdapat pengubahan metadata dari setiap atribut sehingga mudah dinavigasikan. Atribut yang dimiliki data transaksi antara lain kode_tiket, jenis_tiket, tarif, nama_kapal, tanggal, produksi, pendapatan. Terdapat beberapa atribut yang dipecah antara lain kode_tiket dan jenis_tiket. Kode_tiket dibagi menjadi 2 antara lain id_kategori_tiket, yang menampung kategori tiket yaitu id tiket kategori penumpang, id tiket kategori kendaraan, dan id tiket kategori barang. Kategori_tiket menampung 3 kategori tiket yaitu penumpang, kendaraan, dan barang. Jenis tiket dibagi menjadi 2 yaitu id_tiket dan nama tiket. Berdasarkan pemecahan data tersebut dihasilkan atribut baru yaitu no, tanggal_opr, lintasan, kapal, id_kategori_tiket, id_tiket, kategori_tiket, tiket, produksi, dan pendapatan. Pada proses transformasi ini sebelum data dimasukkan ke gudang data akan diubah meta data dari tiap atribut sehingga memudahkan untuk proses selanjutnya.

3.6 Pembuatan Gudang Data