Membaca Data Legacy Menggabungkan Data dari Berbagai Sumber Terpisah

64

BAB IV IMPLEMENTASI

4.1. Spesifikasi Perangkat Keras dan Lunak

Dalam penelitian ini DBMS yang digunakan adalah Oracle 11g. Perangkat keras yang digunakan untuk melakukan pengujian query dengan spesifikasi sebagai berikut : - Processor : IntelR CoreTM i3 CPU - Memory : 6144 MB RAM - Sistem Operasi : Windows 7 Ultimate 32-bit - Browser : Mozilla Firefox

4.2. Langkah Membangun Gudang Data

4.2.1. Membaca Data Legacy

Pada tahap ini untuk menggali informasi yang ada menggunakan tahap-tahap yang ada pada data mining dan tahap yang digunakan adalah pembersihan data dan seleksi data sedangkan untuk tahap lainnya menggunakan tahap dalam membangun gudang data. Berikut ini adalah penjelasan tersebut. 1. Pembersihan data Pada tahap ini dilakukan dengan membuat data menjadi konsisten karena memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Pada tahap ini untuk memudahkan dalam mengkonversi data ke dalam basis data maka dengan data yang ada dilakukan dengan menambah kolom bulan, tahun dan menghapus data yang bukan merupakan penyakit seperti kecelakaan. Setiap tahap dapat dilihat pada Tabel 4.1 sampai 4.3 Tabel 4. 1 Preprocessing dengan menghilangkan data yang bukan penyakit 1. Melakukan preprocessing dengan menghapus data yang bukan merupakan penyakit Menghapus ke dua data tersebut karena bukan merupakan penyakit Tabel 4. 2 Preprocessing dengan menambah kolom bulan 2. Melakukan preprocessing dengan menambah kolom bulan. Agar dapat mengetahui penyakit tersebut muncul di bulan apa. Menambah kolom BULAN Tabel 4. 3 Preprocessing dengan menambah kolom tahun 3. Melakukan preprocessing dengan menambah kolom tahun. Agar dapat mengetahui penyakit terjadi pada tahun berapa. Menambah kolom TAHUN 69 2. Seleksi data Dari data yang ada dilakukan seleksi data karena tidak semua data digunakan. Pada kasus ini SP2TP tidak digunakan dan diganti dengan kolom nama penyakit. Karena SP2TP juga bukan merupakan data yang dirasa penting karena hanya berisi nomor urut dari nama penyakit yang digunakan untuk pelaporan. Untuk tahap selanjutnya setelah melakukan tahap preprocessing kemudian melakukan tahap menggabungkan data dari berbagai sumber terpisah.

4.2.2. Menggabungkan Data dari Berbagai Sumber Terpisah

Seperti yang telah diilustrasikan pada bab 3, penggabungan data perlu dilakukan karena data yang ada tidak seluruhnya berbentuk file Excel.

4.2.3. Memindahkan Data ke Server Gudang Data