Pengolahan Data Tata Laksana

a. Suhu rata – rata dalam 1 minggu b. Curah hujan rata – rata dalam 1 minggu c. Penyinaran matahari rata – rata dalam 1 minggu d. Kelembaban rata – rata dalam 1 minggu Semua data cuaca di ambil rata – rata per minggu dengan tujuan untuk menyamakan dengan data pencatatan survailens disusun dalam rekap per minggu

3.2.3. Pengolahan Data

Langkah awal dari proses pembuatan model adalah identifikasi data yang ada. Data yang akan digunakan dalam pembuatan model penyebaran DBD adalah data kasus DBD yang dicatat per kecamatan di Jakarta per minggu pada tahun 2004-2005. Selain itu digunakan pula data cuaca di Jakarta pada tahun yang sama. Tahap selanjutnya adalah pemilihan data, jika data yang di perlukan tidak ada maka proses identifikasi data harus dilakukan kembali. Setelah data yang terpilih tersedia, maka diadakan validasi, eksplorasi dan pembersihan data dari data – data sampah yang mungkin tidak akan digunakan dan membuat data yang digunakan semakin membesar. Data terpilih yang akan digunakan juga harus di transformasikan atau disamakan satu dan lainnya, contoh, adanya ketidak seragaman dalam pencatatan data DBD dengan data cuaca, dimana data DBD di catat berdasarkan mingguan sedangkan data cuaca dicatat harian, sehingga diambil suatu keputusan untuk melakukan konversi data menjadi data perminggu. Jika dianggap data-data yang telah kita kumpulkan tersebut masih belum lengkap maka kita bisa menambahkan variabel yang bisa membantu dalam pembuatan model. Secara umum sampai pada tahap ini, arsitektur system pola penyebaran DBD dapat disajikan pada gambar 12. Gambar 12. Arsitektur system Aplikasi DBD adapatasi dari Maeda ,1995 Berdasarkan gambar diatas, pada arsitektur sistem aplikasi DBD, dapat dibagi menjadi 2 bagian besar, yaitu pembentukan aturan melalui datamining, dan pembentukan Aplikasi DBD itu sendiri. Setelah dilakukan proses menggunakan datamining dengan menggunakan metode CPAR, akan didapatkan aturan – aturan hasil dari keterkaita n antara data – data yang ada, aturan – aturan tersebut akan di implementasikan dengan sistem inferensi fuzzy dengan menggunakan software Matlab 7.0 R 14. Hasil dari model yang didapat ini nantinya akan di tampilkan dengan suatu sistem antar muka Aplikasi DBD, pengguna dapat memasukkan data tentang suhu, curah hujan, kelembaban dan penyinaran matahari dari lokasi yang akan diprediksi. Data tersebut akan memicu proses inferensi sehingga pada akhirnya sistem tersebut akan memberikan keluaran berupa prediksi tentang meledaknya DBD, dalam kondisi Hijau, Kuning atau Merah serta tata laksana Antar Muka Sistem Aplikasi DBD Aturan –aturan Hasil Datamining Sistem Inferensi Fuzzy Matlab 7.0 Antarmuka Sistem Datamining pemilihan , pembersihan ,transformasi database Prediksi DBD Penanggulanganya Data masukan dari pengguna cara penanggulannya dan untuk melakukan validasi akan digunakan prediksi metode Winters

3.3. Pembuatan Program Aplikasi

3.3.1. Data mining

Metodologi data mining didasarkan pada tiga tahapan yang dilakukan untuk mendeteksi DBD di suatu wilayah. Ketiga tahapan tersebut adalah : a menangani data yang tidak lengkap melalui ekstraksi,transformasi dan loading ETL, b merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit serta, c Pencarian aturan rule mining dan klasifikasi. Pada tahap pertama, pemrosesan awal data survailens DBD dilakukan untuk menghapus data yang tidak lengkap dan mengekstrak data yang akan digunakan untuk mengelompokkan antara DBD kondisi kuning atau merah. Pada tahap kedua setiap data yang bernilai kontinyu didiskritkan dirubah kedalam bentuk katagori. Hasil dari tahap pertama dan kedua diatas disimpan dalam working database. Pada tahap ketiga, algoritma CPAR digunakan untuk menghasilkan aturan-aturan, yang berguna dalam memprediksi kondisi DBD disuatu lokasi berdasrkan kondisi alam pada saat itu.

3.3.1.1. Menangani Data Yang Tidak Lengkap Melalui ETL

Data yang terkumpul dan akan digunakan adalah data tentang DBD dan data cuaca yang terdiri dari suhu, kelembaban, penyinaran matahari dan curah hujan. Data DBD yang dikumpulkan adalah data yang tercatat per minggu untuk tiap kecamatan di suatu wilayah, sedangkan data cuaca adalah data yang dicatat per hari disuatu wilayah. Sehingga terdapat ketidaksamaan dalam memperlakukan data tersebut, agar dapat digunakan maka data cuaca di rubah menjadi data per minggu, dimana data yang ada diambil nilai rata – ratanya dalam 1 minggu. Data yang telah sama tersebut selanjutnya akan dirubah menjadi data diskrit.

3.3.1.2. Merubah Data Kontinyu Menjadi Data Diskrit

Data sampel yang digunakan pada penelitian ini mempunyai atribut yang nilainya numerik, sedangkan algoritma data mining CPAR bekerja dengan atribut- atribut yang nilainya nominal. Untuk menggunakan algoritma tersebut atribute yang bernilai numerik tersebut diganti dengan atribute yang bernilai nominal yang menunjukkan interval nilai dengan nilai-nilai diskrit. Proses ini dikenal sebagai