Tujuan Ruang Lingkup Data Mining

PENDAHULUAN

1.1 Latar Belakang

Teknologi komputasi dan media penyimpanan telah memungkinkan manusia untuk mengumpulkan dan menyimpan data dari berbagai sumber dengan jangkauan yang amat luas. Fenomena ini terjadi dalam banyak bidang kehidupan, seperti bisnis, perbankan, pemasaran, produksi dan sains Meskipun teknologi basis data modern telah menghasilkan media penyimpanan yang ekonomis bagi data berukuran besar, teknologi untuk membantu menganalisis, memahami, atau bahkan memvisualisasikan data belum banyak tersedia. Hal inilah yang melatarbelakangi dikembangkannya konsep data m ining. Data mining merupakan proses ekstraksi informasi atau pola yang penting atau menarik dari data berukuran besar. Penumpukan data telah dialami oleh beberapa organisasi termasuk Departemen Pertanian yang telah mengumpulkan data sektor pertanian selama bertahun-tahun. Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah data tanaman pangan dan hortikultura, dan telah tersimpan sejak tahun 1963. Data yang berjumlah ratusan ribu record tersebut akan terus bertambah jumlahnya setiap saat . Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information” karena data yang terkumpul belum dieksplorasi secara optimal. Oleh karena itu, diperlukan suatu cara agar data yang ada dan kaya informasi tersebut dapat di‘tambang’ untuk mencari ‘emas’ dan ‘berlian’, yaitu informasi yang berguna bagi pihak-pihak yang membutuhkan. Data mining merupakan salah satu tahapan dalam proses Knowledge Discovery in Database KDD. Teknik-teknik yang dapat digunakan dalam data mining di antaranya klasifikasi dan prediksi, association rule, dan clustering Han Kamber 2001. Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural network. Metode klasifikasi yang terkenal dan banyak digunakan adalah decision tree. Metode lainnya adalah Bayesian, neural network, genetic algorithm , fuzzy, case- based reasoning, dan K-nearest neighbor Aziz et al. 2004. Teknik klasifikasi dapat digunakan untuk menganalisis suatu kasus yang tidak terlihat, seperti mengetahui atau memprediksi apa yang dibutuhkan atau paling diinginkan oleh pengguna.

1.2 Tujuan

Tujuan dari penelitia n ini adalah: 1. Menerapkan proses Knowledge Discovery in Database KDD untuk mengolah data pada Departemen Pertanian, yaitu data tanaman pangan dan hortikultura. 2. Menerapkan teknik klasifikasi dengan menggunakan metode decision tree yaitu algoritme C5.0 pad a data tanaman pangan dan hortikultura. 3. Membentuk suatu aturan yang berasal dari pohon keputusan. 4. Membuat suatu model bantu untuk mempermudah pengguna dalam menentu-kan nilai produksi dari suatu komoditas di wilayah tertentu berdasarkan nilai produktivitas dan luas panennya.

1.3 Ruang Lingkup

Penelitian ini dibatasi pada penggunaan teknik klasifikasi sebagai suatu teknik dalam data mining dengan menggunakan metode decision tree yaitu algoritme C5.0. Data yang digunakan dalam penelitian ini adalah data komoditas pertanian khususnya data tanaman pangan dan hortikultura dengan status angka berupa angka tetap data berasal dari Badan Pusat Statistik. TINJAUAN PUSTAKA

2.1 Data Mining

Data mining berarti mencari informasi yang tersembunyi dari suatu data, pola ya ng tidak diketahui dan aturan baru dalam basis data berukuran besar Thomas 2004. Konsep ini muncul karena adanya explosion atau penumpukan data yang sangat besar yang sering dialami oleh suatu organisasi. Secara garis besar data mining dapat dikelompokkan menjadi 2 dua kategori utama, yaitu Tan et al. 2005: 1. Descriptive Mining, yaitu proses untuk menemukan karakteristik penting dari data dalam suatu basis data. Teknik data mining yang termasuk dalam descriptive mining adalah clustering, association, dan sequential mining. 2. Predictive, yaitu proses untuk menemukan pola dari data dengan menggunakan beberapa variabel untuk membuat prediksi variabel lain di masa depan. Teknik yang termasuk dalam predictive mining antara lain klasifikasi, regresi, dan deviasi Tujuan dari adanya data mining adalah Thomas 2004 : 1. Explanatory, yaitu untuk menjelaskan beberapa kegiatan observasi atau suatu kondisi. 2. Confirmatory, yaitu untuk meng- konfirmasi suatu hipotesis yang telah ada. 3. Exploratory, yaitu untuk menganalisis data baru atau suatu relasi yang janggal.

2.2 Karakteristik Data pada Data Mining