Latar Belakang Penerapan teknik klasifikasi dengan algoritme decision tree untuk data tanaman pangan dan hortikultura

PENDAHULUAN

1.1 Latar Belakang

Teknologi komputasi dan media penyimpanan telah memungkinkan manusia untuk mengumpulkan dan menyimpan data dari berbagai sumber dengan jangkauan yang amat luas. Fenomena ini terjadi dalam banyak bidang kehidupan, seperti bisnis, perbankan, pemasaran, produksi dan sains Meskipun teknologi basis data modern telah menghasilkan media penyimpanan yang ekonomis bagi data berukuran besar, teknologi untuk membantu menganalisis, memahami, atau bahkan memvisualisasikan data belum banyak tersedia. Hal inilah yang melatarbelakangi dikembangkannya konsep data m ining. Data mining merupakan proses ekstraksi informasi atau pola yang penting atau menarik dari data berukuran besar. Penumpukan data telah dialami oleh beberapa organisasi termasuk Departemen Pertanian yang telah mengumpulkan data sektor pertanian selama bertahun-tahun. Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah data tanaman pangan dan hortikultura, dan telah tersimpan sejak tahun 1963. Data yang berjumlah ratusan ribu record tersebut akan terus bertambah jumlahnya setiap saat . Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information” karena data yang terkumpul belum dieksplorasi secara optimal. Oleh karena itu, diperlukan suatu cara agar data yang ada dan kaya informasi tersebut dapat di‘tambang’ untuk mencari ‘emas’ dan ‘berlian’, yaitu informasi yang berguna bagi pihak-pihak yang membutuhkan. Data mining merupakan salah satu tahapan dalam proses Knowledge Discovery in Database KDD. Teknik-teknik yang dapat digunakan dalam data mining di antaranya klasifikasi dan prediksi, association rule, dan clustering Han Kamber 2001. Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural network. Metode klasifikasi yang terkenal dan banyak digunakan adalah decision tree. Metode lainnya adalah Bayesian, neural network, genetic algorithm , fuzzy, case- based reasoning, dan K-nearest neighbor Aziz et al. 2004. Teknik klasifikasi dapat digunakan untuk menganalisis suatu kasus yang tidak terlihat, seperti mengetahui atau memprediksi apa yang dibutuhkan atau paling diinginkan oleh pengguna.

1.2 Tujuan