PENDAHULUAN
1.1 Latar Belakang
Teknologi komputasi dan media penyimpanan telah memungkinkan manusia
untuk mengumpulkan dan menyimpan data dari berbagai sumber dengan jangkauan
yang amat luas. Fenomena ini terjadi dalam banyak bidang kehidupan, seperti bisnis,
perbankan, pemasaran, produksi dan sains Meskipun teknologi basis data modern telah
menghasilkan media penyimpanan yang ekonomis bagi data
berukuran besar,
teknologi untuk membantu menganalisis, memahami, atau bahkan memvisualisasikan
data belum banyak tersedia. Hal inilah yang melatarbelakangi dikembangkannya konsep
data m ining. Data mining merupakan proses ekstraksi informasi atau pola yang penting
atau menarik dari data berukuran besar.
Penumpukan data telah dialami oleh beberapa organisasi termasuk Departemen
Pertanian yang telah mengumpulkan data sektor pertanian selama bertahun-tahun.
Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah data tanaman
pangan dan hortikultura, dan telah tersimpan sejak tahun 1963. Data yang berjumlah
ratusan ribu record tersebut akan terus bertambah jumlahnya setiap saat .
Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering
disebut sebagai “rich of data but poor of information” karena data yang terkumpul
belum dieksplorasi secara optimal. Oleh karena itu, diperlukan suatu cara agar data
yang ada dan kaya informasi tersebut dapat di‘tambang’ untuk mencari ‘emas’ dan
‘berlian’, yaitu informasi yang berguna bagi pihak-pihak yang membutuhkan.
Data mining merupakan salah satu tahapan dalam proses Knowledge Discovery
in Database KDD. Teknik-teknik yang dapat digunakan dalam data mining di
antaranya klasifikasi
dan prediksi, association rule, dan clustering Han
Kamber 2001. Klasifikasi adalah proses untuk menemukan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri
bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural
network. Metode klasifikasi yang terkenal dan banyak digunakan adalah decision tree.
Metode lainnya adalah Bayesian, neural network, genetic algorithm , fuzzy, case-
based reasoning, dan K-nearest neighbor Aziz et al. 2004. Teknik klasifikasi dapat
digunakan untuk menganalisis suatu kasus yang tidak terlihat, seperti mengetahui atau
memprediksi apa yang dibutuhkan atau paling diinginkan oleh pengguna.
1.2 Tujuan
Tujuan dari penelitia n ini adalah: 1.
Menerapkan proses Knowledge
Discovery in Database KDD untuk mengolah
data pada Departemen Pertanian, yaitu data tanaman pangan
dan hortikultura. 2.
Menerapkan teknik klasifikasi dengan menggunakan metode decision tree
yaitu algoritme C5.0 pad a data tanaman pangan dan hortikultura.
3. Membentuk suatu aturan yang berasal
dari pohon keputusan. 4.
Membuat suatu model bantu untuk mempermudah pengguna dalam
menentu-kan nilai produksi dari suatu komoditas di wilayah tertentu
berdasarkan nilai produktivitas dan luas panennya.
1.3 Ruang Lingkup
Penelitian ini dibatasi pada penggunaan teknik klasifikasi sebagai suatu teknik dalam
data mining dengan menggunakan metode decision tree yaitu algoritme C5.0. Data
yang digunakan dalam penelitian ini adalah data komoditas pertanian khususnya data
tanaman pangan dan hortikultura dengan status angka berupa angka tetap data
berasal dari Badan Pusat Statistik.
TINJAUAN PUSTAKA
2.1 Data Mining
Data mining berarti mencari informasi yang tersembunyi dari suatu data, pola ya ng
tidak diketahui dan aturan baru dalam basis data berukuran besar Thomas 2004.
Konsep ini muncul karena adanya explosion atau penumpukan data yang sangat besar
yang sering dialami oleh suatu organisasi. Secara garis besar data mining dapat
dikelompokkan menjadi 2 dua kategori utama, yaitu Tan et al. 2005:
1. Descriptive Mining, yaitu proses untuk
menemukan karakteristik penting dari data dalam suatu basis data. Teknik
data mining yang termasuk dalam descriptive mining adalah clustering,
association, dan sequential mining.
2. Predictive,
yaitu proses untuk menemukan pola dari data dengan
menggunakan beberapa variabel untuk membuat prediksi variabel lain di masa
depan. Teknik yang termasuk dalam predictive mining antara lain klasifikasi,
regresi, dan deviasi
Tujuan dari adanya data mining adalah Thomas 2004 :
1. Explanatory, yaitu untuk menjelaskan
beberapa kegiatan observasi atau suatu kondisi.
2. Confirmatory, yaitu untuk meng-
konfirmasi suatu hipotesis yang telah ada.
3. Exploratory, yaitu untuk menganalisis
data baru atau suatu relasi yang janggal.
2.2 Karakteristik Data pada Data Mining