8
BAB II LANDASAN TEORI
2.1 Data Mining
2.1.1 Pengertian Data Mining
Data mining adalah serangkaian proses untuk menggali nilai
tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data Pramudiono, 2007. Data mining
didefinisikan sebagai proses menemukan pola-pola dalam data. Proses ini otomatis atau seringnya semi otomatis. Pola yang ditemukan harus
penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi. Data yang dibutuhan dalam jumlah besar
Witten Frank, 2005. Secara sederhana, data mining adalah penambangan atau penemuan informasi baru dengan mencari pola
atau aturan tertentu dari sejumlah data yang sangat besar Davies Beynon, 2004. Data mining sering juga disebut knowledge discovery
in database KDD, adalah kegiatan yang meliputi pengumpulan,
pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining
ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan Santosa, 2007.
Menurut Gatner Group, data mining adalah suatu proses menemukan hubungan yang berarti, pola dan kecenderungan dengan
memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan, dengan menggunakan teknik pengenalan pola seperti
teknik statistik dan matematika. Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran
mesin, pengenalan pola, statistik, database dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang
besar Larose, 2005.
Kemajuan luar biasa yang terus berlanjut dalam bidang data mining
didorong oleh beberapa faktor antara lain Larose, 2005 : a. Pertumbuhan yang cepat dalam kumpulan data.
b. Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan memiliki akses ke dalam database yang handal.
c. Adanya peningkatan akses data melalui navigasi web dan intranet. d. Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar
dalam globalisasi ekonomi. e. Perkembangan teknologi perangkat lunak untuk data mining
ketersediaan teknologi. f. Perkembangan yang hebat dalam kemampuan komputasi dan dan
pengembangan kapasitas media penyimpanan. Hubungan yang dicari dalam data mining dapat berupa
hubungan antara dua atau lebih dalam satu dimensi, misalnya dalam dimensi produk, kita dapat melihat keterkaitan pembelian suatu
produk dengan produk yang lain. Selain itu hubungan juga dapat dilihat antara 2 atau lebih atribut dan 2 atau lebih obyek Ponniah,
2001. Pemanfaatan data yang ada di dalam sistem informasi untuk
menunjang kegiatan pengambilan keputusan, tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data
untuk menggali potensi-potensi informasi yang ada. Para pengambil keputusan berusaha untuk memanfaatkan gudang data yang sudah
dimiliki untuk menggali informasi yang berguna membantu mengambil keputusan, hal ini mendorong munculnya cabang ilmu
baru untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah besar. Data mining
adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse,
atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain seperti database system, data warehousing,
statistik, machine learning, information retrieval, dan komputasi tingkat tinggi. Selain itu data mining didukung oleh ilmu lain seperti
neural network , pengenalan pola, spatial data analysis, image
database , signal processing Han Kamber, 2006. Penggunaan
teknik data mining diharapkan dapat memberikan pengetahuan- pengetahuan yang sebelumnya tersembunyi di dalam gudang data
sehingga menjadi informasi yang berharga. Menurut Bonnie O’Neil 1997, p522, Data mining adalah suatu
proses yang mengubah data menjadi informasi dimana ini merupakan proses pencarian data dan relasi yang tersembunyi dalam data.
2.1.2 Tahap Data Mining