Mekanisme Pengujian Pembentukan Model Dengan Data Training

BAB VI PENGUJIAN DAN PEMBAHASAN

6.1. Mekanisme Pengujian

Pengujian dilakukan terhadap model data mining yang dibangun. Tujuan pengujian adalah untuk menemukan model yang ideal. Sebelum dilakukan pengujian terlebih dahulu dilakukan pembentukan model. Pembentukan model menggunakan data training adapun pengujian model menggunakan data testing. Data training dan data testing memuat informasi tentang data input berupa suhu udara, curah hujan, penyinaran matahari, kelembaban udara dan data output berupa kondisi DBD pada kondisi hijau, kuning, atau kondisi merah. Model yang sudah terbentuk dibandingkan dengan hasil pengujian pada data testing. Semakin sama hasil perbandingan output kedua model berarti model semakin akurat. Pengujian dilakukan terhadap data training dengan mengambil data sampel berdasarkan prosentase. Pada kedua kelompok data tersebut algoritme data mining digunakan untuk mencari pola-pola dari nilai yang diprediksi. Selanjutnya model diperbaiki dengan menggunakan sampel data lain agar tidak hanya bisa bekerja dengan data training.

6.2. Pembentukan Model Dengan Data Training

Proses pembentukan model data mining menggunakan algoritme CPAR. Pembentukan dilakukan dengan mengambil sebanyak 202 sampel tahun 2004 – 2005, dari sampel tersebut 105adalah berasal dari data DBD untuk wilayah Jakarta Pusat dan 97 berasal dari data wilayah Jakarta Selatan. Data tersebut adalah kejadian DBD di suatu kecamatan di wilayah tersebut, dalam hal ini untuk wilayah Jakarta pusat terdapat 8 delapan kecamatan, sedangkan Jakarta selatan 10 sepuluh kecamatan. Dari data rata – rata ini diklasifikasikan kedalam pembagian kondisi DBD hijau, kuning dan merah yang telah disepakati bersama. Karakteristik sampel data bisa dilihat pada Tabel 13 dan 14, sedangkan pada Tabel 15 dan 16 adalah Nilai rata-rata kasus DBD per kecamatan per wilayah Tabel 13 . Data Survalaince DBD Tahun 2005 Minggu 1 - 14 Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Jakarta Pusat 25 30 42 50 54 71 98 87 67 44 35 37 44 39 Jakarta Selatan 29 49 78 74 102 140 192 149 124 110 71 69 68 58 Tabel 14. Data Survailance DBD Tahun 2004 Minggu 1 – 14 Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Jakarta Pusat 41 36 35 55 57 90 102 260 438 417 272 182 127 83 Jakarta Selatan 40 78 103 112 138 173 170 421 652 636 318 231 154 161 Tabel 15. Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2005 Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Jakarta Pusat 3 4 5 6 7 9 12 11 8 6 4 5 6 5 Jakarta Selatan 3 5 8 7 10 14 19 15 12 11 7 7 7 6 Tabel 16. Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2004 Minggu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Jakarta Pusat 5 5 4 7 7 11 13 33 55 52 34 23 16 10 Jakarta Selatan 4 8 10 11 14 17 17 42 65 64 32 23 15 16 Hasil proses data mining dari 97 sampel pada wilayah Jakarta Selatan Kecamatan Kebayoran Baru, dengan berbagai variasi gain similarity ratio GSR dapat dilihat pada Tabel 17 sampai dengan Tabel 21 Tabel 17. Aturan Data Training Dengan GSR 99 No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi basah 75 Then Merah 0.71 2 IF Penyinaran matahari sedang 35 - 70 Then Merah 0.71 3 IF Curah hujan rendah 5-20mm Then Merah 0.7 4 IF Kelembaban udara Normal 60 - 75 Then Kuning 0.64 5 IF Penyinaran matahari penuh 70 Then Kuning 0.61 6 IF Curah hujan sangat rendah 5mm Then Kuning 0.45 Data pada Tabel 17. pada Gain similarity 99 didapatkan sebanyak 6 baris aturan, data tersebut menunjukkan bahwa aturan IF Kelembaban udara tinggi basah 75 Then Merah serta IF Penyinaran matahari sedang 35 - 70 Then Merah mempunyai Akurasi Laplace yang sama tinggi pada klas merah , sebesar 71, ini berarti pada kelembaban udara tinggi basah dan pada penyinaran matahari sedang mempunyai peluang terjadi DBD dengan kondisi merah, atau suatu situasi dimana jumlah pasian perkecamatan lebih dari 5 orang, Aturan IF Kelembaban udara Normal 60 - 75 Then Kuning mempunyai Akurasi Laplace paling tinggi pada kelas kondisi DBD kuning, yaitu 64. Ini berarti pada kondisi kelembaban udara normal, kondisi DBD kuning mungkin terjadi, atau suatu kondisi dimana jumlah pasien berkisar antara 1- 5 orang per kecamatan. Pada kondisi ini kelembaban udara masih cukup disenangi oleh nyamuk Aedes Aegypti, contoh kondisi cuaca pada sore hari, dimana biasanya kelembaban udara berkisar pada 60 - 75, situasi ini masih memungkinkan nyamuk bergerak, walau tidak seaktif pada kondisi kelembaban udara 75. Tabel 18. Aturan Data Training Dengan GSR 80 No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi basah 75 and Penyinaran matahari sedang 35 - 70 Then Merah 0.71 2 IF Curah hujan rendah 5-20mm Then Merah 0.7 3 IF Kelembaban udara Normal 60 - 75 Then Kuning 0.64 4 IF Penyinaran matahari penuh 70 Then Kuning 0.61 5 IF Curah hujan sangat rendah 5mm Then Kuning 0.45 Pada tabel 18, dengan gain similarity 80 didapatkan 5 baris aturan, dari data tersebut, aturan IF Kelembaban udara tinggi basah 75 and Penyinaran matahari sedang 35 – 70 Then Merah, mempunyai tingkat keakurasian 71, ini berarti pada kondisi kelembaban udara tinggi yang disertai dengan penyinaran matahari sedang sangat memungkinkan terjadi DBD pada kondisi merah. Sedangkan pada aturan yang menhasilkan kondisi DBD kuning terdapat 3 aturan yang sama dengan gain similarity 99 Tabel 19. Aturan Data Training Dengan GSR 60 No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi basah 75 and Penyinaran matahari sedang 35 - 70 Then Merah 0.71 2 IF Curah hujan rendah 5-20mm Then Merah 0.70 3 IF Kelembaban udara Normal 60 - 75 and Penyinaran matahari penuh 70 Then kuning 0.63 Pada tabel 19, dengan gain similarity rasio 60, didapatkan aturan untuk DBD pada kondisi merah sama dengan pada gain similarity 80, akan tetapi untuk kondisi kuning, didapatkan suatu aturan IF Kelembaban udara Normal 60 - 75 and Penyinaran matahari penuh 70 Then kuning, sehingga jika pada saat kondisi kelembaban udara normal dan penyinaran matahari penuh, maka dapat terjadi DBD dengan jumlah pasien 1-5 orang per kecamatan. Tabel 20. Aturan Data Training Dengan GSR 20 No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi basah 75 and Penyinaran matahari sedang 35 - 70 and Curah hujan rendah 5-20mm Then Merah 0.71 2 IF Kelembaban udara Normal 60 - 75 and Penyinaran matahari penuh 70 Then kuning 0.63 3 IF Curah hujan sangat rendah 5mm Then Kuning 0.45 Pada Gain similarity 20 , didapatkan 3 aturan, 1 aturan untuk kondisi merah, yaitu aturan IF Kelembaban udara tinggi basah 75 and Penyinaran matahari sedang 35 - 70 and Curah hujan rendah 5-20mm Then Merah, dengan tingkat akurasian 71, sehingga menurut aturan ini pada kondisi kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah sangat mungkin terjadi DBD dengan kondisi merah, sehingga kemunginan jumlah penderita DBD pun banyak. Sedangkan pada kondisi kuning, aturan yang berlaku pada gain similarity ini adalah aturan IF Curah hujan sangat rendah 5mm Then Kuning, akan tetapi tingkat keakurasiannya hanya 45. Tabel 21. Aturan Data Training Dengan GSR 10 No. Aturan Akurasi Laplace 1 IF Kelembaban udara tinggi basah 75 and Penyinaran matahari sedang 35 - 70 and Curah hujan rendah 5-20mm Then Merah 0.71 2 IF Temperatur sedang 24 o C – 27 o C then Merah 0.65 3 IF Kelembaban udara Normal 60- 75 and Penyinaran matahari penuh 70 Then Kuning 0.63 4 IF Curah hujan sangat rendah 5mm Then Kuning 0.45 5 IF temperatur tinggi 27 o C Then Kuning 0.40 Pada gain similarity 10 didapatkan 5 baris aturan, dimana terdapat 2 aturan untuk kondisi merah dan 3 aturan untuk kondisi kuning. Untuk merah terdapat tambahan yang pada gain similarity rasio sebelumnya aturan ini tidak didapatkan, yaitu pada temperature sedang 24 o C – 27 o C juga memungkinkan untuk terjadi DBD pada kondisi merah, akan tetapi hal ini hanya akan terjadi jika kondisi sebelumnya yaitu Kelembaban udara tinggi dan penyinaran matahari sedang dan curah hujan rendah terjadi. Kemungkinan hal ini terjadi sebesar 65 . Sedangkan pada aturan untuk kondisi kuning, terdapat tambahan aturan akan terjadi jika kondisi Temperatur Tinggi 27 o C, kemungkinan hal ini terjadi dan mempengaruhi adalah sebesar 40.

6.3. Pelatihan Dengan Data Testing