64
BAB IV IMPLEMENTASI
4.1. Spesifikasi Perangkat Keras dan Lunak
Dalam penelitian ini DBMS yang digunakan adalah Oracle 11g. Perangkat keras yang digunakan untuk melakukan pengujian
query
dengan spesifikasi sebagai berikut :
- Processor
: IntelR CoreTM i3 CPU -
Memory : 6144 MB RAM
- Sistem Operasi
: Windows 7 Ultimate 32-bit -
Browser : Mozilla Firefox
4.2. Langkah Membangun Gudang Data
4.2.1. Membaca Data Legacy
Pada tahap ini untuk menggali informasi yang ada menggunakan tahap-tahap yang ada pada
data mining
dan tahap yang digunakan adalah
pembersihan data dan seleksi data sedangkan untuk tahap lainnya menggunakan tahap dalam membangun gudang data. Berikut ini adalah
penjelasan tersebut.
1. Pembersihan data
Pada tahap ini dilakukan dengan membuat data menjadi konsisten karena memiliki isian-isian yang tidak sempurna seperti data yang hilang,
data yang tidak valid atau juga hanya sekedar salah ketik. Pada tahap ini untuk memudahkan dalam mengkonversi data ke dalam basis data maka
dengan data yang ada dilakukan dengan menambah kolom bulan, tahun dan menghapus data yang bukan merupakan penyakit seperti kecelakaan. Setiap
tahap dapat dilihat pada Tabel 4.1 sampai 4.3
Tabel 4. 1 Preprocessing dengan menghilangkan data yang bukan penyakit
1. Melakukan
preprocessing
dengan menghapus data
yang bukan merupakan
penyakit
Menghapus ke dua data
tersebut karena
bukan merupakan
penyakit
Tabel 4. 2
Preprocessing
dengan menambah kolom bulan 2.
Melakukan
preprocessing
dengan menambah kolom bulan.
Agar dapat mengetahui penyakit tersebut muncul
di bulan apa. Menambah kolom BULAN
Tabel 4. 3
Preprocessing
dengan menambah kolom tahun
3. Melakukan
preprocessing
dengan menambah
kolom tahun.
Agar dapat
mengetahui penyakit
terjadi pada
tahun berapa.
Menambah kolom TAHUN
69 2.
Seleksi data Dari data yang ada dilakukan seleksi data karena tidak semua data
digunakan. Pada kasus ini SP2TP tidak digunakan dan diganti dengan kolom nama penyakit. Karena SP2TP juga bukan merupakan data yang
dirasa penting karena hanya berisi nomor urut dari nama penyakit yang digunakan untuk pelaporan. Untuk tahap selanjutnya setelah melakukan
tahap
preprocessing
kemudian melakukan tahap menggabungkan data dari berbagai sumber terpisah.
4.2.2. Menggabungkan Data dari Berbagai Sumber Terpisah
Seperti yang telah diilustrasikan pada bab 3, penggabungan data perlu dilakukan karena data yang ada tidak seluruhnya berbentuk file Excel.
4.2.3. Memindahkan Data ke Server Gudang Data