8
BAB II LANDASAN TEORI
2.1 Data Mining
2.1.1 Pengertian Data Mining
Data mining
adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara
manual dari suatu kumpulan data Pramudiono, 2007.
Data mining
didefinisikan sebagai proses menemukan pola-pola dalam data. Proses ini otomatis atau seringnya semi otomatis. Pola yang ditemukan harus
penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi. Data yang dibutuhan dalam jumlah besar
Witten Frank, 2005. Secara sederhana,
data mining
adalah penambangan atau penemuan informasi baru dengan mencari pola
atau aturan tertentu dari sejumlah data yang sangat besar Davies Beynon, 2004.
Data mining
sering juga disebut
knowledge discovery in database
KDD, adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau
hubungan dalam set data berukuran besar. Keluaran dari
data mining
ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan Santosa, 2007.
Menurut Gatner Group,
data mining
adalah suatu proses menemukan hubungan yang berarti, pola dan kecenderungan dengan
memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan, dengan menggunakan teknik pengenalan pola seperti
teknik statistik dan matematika.
Data mining
merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran
mesin, pengenalan pola, statistik,
database
dan visualisasi untuk penanganan permasalahan pengambilan informasi dari
database
yang besar Larose, 2005.
Kemajuan luar biasa yang terus berlanjut dalam bidang
data mining
didorong oleh beberapa faktor antara lain Larose, 2005 : a.
Pertumbuhan yang cepat dalam kumpulan data. b.
Penyimpanan data dalam
data warehouse
, sehingga seluruh perusahaan memiliki akses ke dalam
database
yang handal. c.
Adanya peningkatan akses data melalui navigasi web dan intranet. d.
Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam globalisasi ekonomi.
e. Perkembangan teknologi perangkat lunak untuk data mining
ketersediaan teknologi. f.
Perkembangan yang hebat dalam kemampuan komputasi dan dan pengembangan kapasitas media penyimpanan.
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih dalam satu dimensi, misalnya dalam
dimensi produk, kita dapat melihat keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu hubungan juga dapat
dilihat antara 2 atau lebih atribut dan 2 atau lebih obyek Ponniah, 2001.
Pemanfaatan data yang ada di dalam sistem informasi untuk menunjang kegiatan pengambilan keputusan, tidak cukup hanya
mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Para pengambil
keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi yang berguna membantu
mengambil keputusan, hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian informasi atau pola yang
penting atau menarik dari data dalam jumlah besar.
Data mining
adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam
database
,
data warehouse
, atau penyimpanan informasi lainnya.
Data mining
berkaitan dengan bidang ilmu-ilmu lain seperti
database system
,
data warehousing
,
statistik,
machine learning
,
information retrieval
, dan komputasi tingkat tinggi. Selain itu
data mining
didukung oleh ilmu lain seperti
neural network
, pengenalan pola,
spatial data analysis
,
image database
,
signal processing
Han Kamber, 2006. Penggunaan teknik
data mining
diharapkan dapat memberikan pengetahuan- pengetahuan yang sebelumnya tersembunyi di dalam gudang data
sehingga menjadi informasi yang berharga. Menurut Bonnie O’Neil 1997, p522,
Data mining
adalah suatu proses yang mengubah data menjadi informasi dimana ini merupakan
proses pencarian data dan relasi yang tersembunyi dalam data.
2.1.2 Tahap Data Mining