PENDAHULUAN
1.1 Latar Belakang
Teknologi komputasi dan media penyimpanan telah memungkinkan manusia
untuk mengumpulkan dan menyimpan data dari berbagai sumber dengan jangkauan
yang amat luas. Fenomena ini terjadi dalam banyak bidang kehidupan, seperti bisnis,
perbankan, pemasaran, produksi dan sains Meskipun teknologi basis data modern telah
menghasilkan media penyimpanan yang ekonomis bagi data
berukuran besar,
teknologi untuk membantu menganalisis, memahami, atau bahkan memvisualisasikan
data belum banyak tersedia. Hal inilah yang melatarbelakangi dikembangkannya konsep
data m ining. Data mining merupakan proses ekstraksi informasi atau pola yang penting
atau menarik dari data berukuran besar.
Penumpukan data telah dialami oleh beberapa organisasi termasuk Departemen
Pertanian yang telah mengumpulkan data sektor pertanian selama bertahun-tahun.
Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah data tanaman
pangan dan hortikultura, dan telah tersimpan sejak tahun 1963. Data yang berjumlah
ratusan ribu record tersebut akan terus bertambah jumlahnya setiap saat .
Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering
disebut sebagai “rich of data but poor of information” karena data yang terkumpul
belum dieksplorasi secara optimal. Oleh karena itu, diperlukan suatu cara agar data
yang ada dan kaya informasi tersebut dapat di‘tambang’ untuk mencari ‘emas’ dan
‘berlian’, yaitu informasi yang berguna bagi pihak-pihak yang membutuhkan.
Data mining merupakan salah satu tahapan dalam proses Knowledge Discovery
in Database KDD. Teknik-teknik yang dapat digunakan dalam data mining di
antaranya klasifikasi
dan prediksi, association rule, dan clustering Han
Kamber 2001. Klasifikasi adalah proses untuk menemukan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri
bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural
network. Metode klasifikasi yang terkenal dan banyak digunakan adalah decision tree.
Metode lainnya adalah Bayesian, neural network, genetic algorithm , fuzzy, case-
based reasoning, dan K-nearest neighbor Aziz et al. 2004. Teknik klasifikasi dapat
digunakan untuk menganalisis suatu kasus yang tidak terlihat, seperti mengetahui atau
memprediksi apa yang dibutuhkan atau paling diinginkan oleh pengguna.
1.2 Tujuan