Lingkungan Pengembangan Pembersihan Data Pemilihan Data

3. Pembentukan Aturan Keputusan. Aturan yang dihasilkan dari decision tree dapat ditampilkan dalam bentuk aturan IF-THEN. Aturan dibentuk dari tiap path pada pohon. Setiap node yang bukan leaf node berperan sebagai bagian IF sedangkan bagian THEN diambil dari leaf node yang merupakan konsekuen dari aturan. Aturan IF-THEN lebih mudah dipahami oleh pengguna apalagi jika pohonnya dalam ukuran besar. 5. Evaluasi Data Keluaran Pada tahap ini dilakukan evaluasi terhadap kesimpulan atau informasi yang diperoleh dari data. Informasi tersebut dapat digunakan oleh pengguna sesuai kebutuhan dengan menggunakan modul pengguna untuk menampilkan informasi yang sesuai dengan kebutuhan pengguna. Berdasar tahap evaluasi data dan keluaran mungkin dilakukan perubahan-perubahan pada tahap-tahap selanjutnya, atau pengulangan seluruh proses.

3.2 Lingkungan Pengembangan

Lingkungan pengembangan sistem dalam penelitian ini meliputi: - Perangkat lunak: Windows XP Profesional, Visual Basic 6.0 SP6, SQL Server 2000 Personal Edition, dan SPSS 13. - Perangkat keras: processor Intel Pentium IV 2.00 GHz, Memori 256 Mb, Harddisk 40 GB, Monitor 15 inchi, mouse dan keyboard. HASIL DAN PEMBAHASAN

4.1 Pembersihan Data

Data komoditas pertanian yang dimiliki oleh Departemen Pertanian, berupa basis data relasional yang disimpan dalam format data MDF. Data disimpan dalam sebuah tabel fakta fact table yang berisi kode dari beberapa subsektor pertanian, yaitu 1. tanaman pangan dan hortikultura 2. perkebunan 3. peternakan 4. penduduk dan rumah tangga 5. PDBPDRB 6. nilai tukar petani 7. struktur ongkos 8. alat mesin pertanian 9. lahan 10. iklim 11. struktur ongkos padi 12. struktur ongkos padi sawah 13. struktur ongkos padi ladang 14. struktur ongkos jagung 15. struktur ongkos ubi kayu 16. struktur ongkos ubi jalar 17. struktur ongkos kacang tanah 18. struktur ongkos kedelai. Tabel fakta yang berisi kode-kode ini akan dihubungkan dengan data pada tabel dimensi yang berisi deskripsi dari kode tersebut. Tabel -tabel yang digunakan dalam data warehouse dapat dilihat pada Lampiran 1, sedangkan karakteristik data tanaman pangan dan hortikultura dapat dilihat pada Lampiran 2. Pembersihan data dilakukan terhadap data yang memiliki nilai null, data rangkap atau tidak lengkap dalam data tanaman pangan dan hortikultura. Jumlah awal dari data basis data sektor pertanian yang dimiliki DEPTAN sebesar 468.140 record. Kemudian dilakukan pembersihan terhadap basis data sektor pertanian yang dimiliki oleh DEPTAN.

4.2 Pemilihan Data

Data yang digunakan dalam analisis adalah subsektor yang memiliki nilai yang mewakili seluruh atribut dan jumlah record yang lebih banyak dibandingkan subsektor yang lain. Subsektor tanaman pangan dan hortikultura yang memenuhi kriteria tersebut. Data subsektor tanaman pangan dan hortikultura yang digunakan adalah data subsektor tanaman pangan dan hortikultura dengan status angka berupa angka tetap dan nilai pada atribut lokasi tidak sama dengan Nasional. Dari pembersihan data tersebut, diperoleh data bersih sebanyak 109.037 record. Dari data yang telah bersih dilakukan pemilihan terhadap atribut yang ada. Pemilihan atribut dilakukan berdasarkan jumlah data dan kebergantungan antara satu atribut dengan atribut yang lain. Dari tahap ini didapatkan beberapa atribut ramal01, ramal02, ramal03, diperbaiki, perkiraan, sasaran, sgt_sementara yang tidak digunakan dengan optimal atau dibiarkan kosong sehingga atribut tersebut dapat dihilangkan. Data yang digunakan memiliki status angka berupa angka tetap yang bersumber dari Badan Pusat Statistik BPS, sehingga atribut sumber yang memiliki nilai satu nilai yaitu BPS dapat dihilangkan. Atribut-atribut yang ada pada data tanaman pangan dan hortikultura setelah pembersihan data dapat dilihat pada L ampiran 3. Setelah dilakukan pembersihan data dan pemilihan data, kemudian dilakukan modifikasi tabel untuk mempermudah dalam proses selanjutnya, yaitu penerapan algoritme decision tree. Modifikasi dilakukan pada atribut indikator dan nilai. Atribut indikator yang terdiri dari produktivitas, luas panen, dan produksi dipecah menjadi atribut yang berbeda, sedangkan atribut nilai yang merupakan nilai dari indikator dimasukkan ke dalam atribut indikator yang telah dipecah sesuai dengan nilainya masing-masing. Jumlah record test setelah tabel dimodifikasi tabel bdsp2 sebanyak 30.976. Perubahan atribut yang dilakukan dapat dilihat pada Lampiran 4.

4.3 Pengurangan Data