3. Pembentukan Aturan Keputusan. Aturan yang dihasilkan dari
decision tree dapat ditampilkan dalam bentuk aturan IF-THEN. Aturan
dibentuk dari tiap path pada pohon. Setiap node yang bukan leaf node
berperan sebagai bagian IF sedangkan bagian THEN diambil dari leaf node
yang merupakan konsekuen dari aturan. Aturan IF-THEN lebih mudah dipahami
oleh pengguna apalagi jika pohonnya dalam ukuran besar.
5. Evaluasi Data Keluaran
Pada tahap ini dilakukan evaluasi terhadap kesimpulan atau informasi
yang diperoleh dari data. Informasi tersebut dapat digunakan oleh pengguna
sesuai kebutuhan dengan menggunakan modul pengguna untuk menampilkan
informasi yang sesuai dengan kebutuhan pengguna. Berdasar tahap
evaluasi data dan keluaran mungkin dilakukan perubahan-perubahan pada
tahap-tahap selanjutnya, atau pengulangan seluruh proses.
3.2 Lingkungan Pengembangan
Lingkungan pengembangan sistem dalam penelitian ini meliputi:
- Perangkat lunak: Windows XP Profesional, Visual Basic 6.0 SP6, SQL
Server 2000 Personal Edition, dan SPSS 13.
- Perangkat keras: processor Intel Pentium IV 2.00 GHz, Memori 256 Mb, Harddisk
40 GB, Monitor 15 inchi, mouse dan keyboard.
HASIL DAN PEMBAHASAN
4.1 Pembersihan Data
Data komoditas pertanian yang dimiliki oleh Departemen Pertanian, berupa basis
data relasional yang disimpan dalam format data MDF.
Data disimpan dalam sebuah tabel fakta fact table yang berisi kode dari beberapa
subsektor pertanian, yaitu 1. tanaman pangan dan hortikultura 2. perkebunan 3.
peternakan 4. penduduk dan rumah tangga 5. PDBPDRB 6. nilai tukar petani 7. struktur
ongkos 8. alat mesin pertanian 9. lahan 10. iklim 11. struktur ongkos padi 12. struktur
ongkos padi sawah 13. struktur ongkos padi ladang 14. struktur ongkos jagung 15.
struktur ongkos ubi kayu 16. struktur ongkos ubi jalar 17. struktur ongkos kacang tanah
18. struktur ongkos kedelai. Tabel fakta yang berisi kode-kode ini akan dihubungkan
dengan data pada tabel dimensi yang berisi deskripsi dari kode tersebut. Tabel -tabel
yang digunakan dalam data warehouse dapat dilihat pada Lampiran 1, sedangkan
karakteristik data tanaman pangan dan hortikultura dapat dilihat pada Lampiran 2.
Pembersihan data dilakukan terhadap data yang memiliki nilai null, data rangkap
atau tidak lengkap dalam data tanaman pangan dan hortikultura.
Jumlah awal dari data basis data sektor pertanian yang dimiliki DEPTAN sebesar
468.140 record. Kemudian dilakukan
pembersihan terhadap basis data sektor pertanian yang dimiliki oleh DEPTAN.
4.2 Pemilihan Data
Data yang digunakan dalam analisis adalah subsektor yang memiliki nilai yang
mewakili seluruh atribut dan jumlah record yang lebih banyak dibandingkan subsektor
yang lain. Subsektor tanaman pangan dan hortikultura yang memenuhi kriteria
tersebut. Data subsektor tanaman pangan dan hortikultura yang digunakan adalah data
subsektor tanaman pangan dan hortikultura dengan status angka berupa angka tetap dan
nilai pada atribut lokasi tidak sama dengan Nasional. Dari pembersihan data tersebut,
diperoleh data bersih sebanyak 109.037 record.
Dari data yang telah bersih dilakukan pemilihan terhadap atribut yang ada.
Pemilihan atribut dilakukan berdasarkan jumlah data dan kebergantungan antara satu
atribut dengan atribut yang lain. Dari tahap ini didapatkan beberapa atribut ramal01,
ramal02, ramal03, diperbaiki, perkiraan, sasaran, sgt_sementara yang tidak
digunakan dengan optimal atau dibiarkan kosong sehingga atribut tersebut dapat
dihilangkan. Data yang digunakan memiliki status angka berupa angka tetap yang
bersumber dari Badan Pusat Statistik BPS, sehingga atribut sumber yang memiliki nilai
satu nilai yaitu BPS dapat dihilangkan. Atribut-atribut yang ada pada data tanaman
pangan dan hortikultura setelah pembersihan data dapat dilihat pada L ampiran 3.
Setelah dilakukan pembersihan data dan pemilihan data, kemudian dilakukan
modifikasi tabel untuk mempermudah dalam proses selanjutnya, yaitu penerapan
algoritme decision tree.
Modifikasi dilakukan pada atribut indikator dan nilai.
Atribut indikator yang terdiri dari produktivitas, luas panen, dan produksi
dipecah menjadi atribut yang berbeda, sedangkan atribut nilai yang merupakan nilai
dari indikator dimasukkan ke dalam atribut indikator yang telah dipecah sesuai dengan
nilainya masing-masing. Jumlah record test setelah tabel dimodifikasi tabel bdsp2
sebanyak 30.976. Perubahan atribut yang dilakukan dapat dilihat pada Lampiran 4.
4.3 Pengurangan Data