7
BAB II LANDASAN TEORI
2.1 Penambangan Data
2.1.1 Pengertian Penambangan Data
Penambangan data atau data miningadalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui
secara manual dari suatu kumpulan data Pramudiono, 2007. Penambangan data didefinisikan sebagai proses menemukan pola-pola dalam data. Proses
ini otomatis atau seringnya semi otomatis. Pola yang ditemukan harus penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan
secara ekonomi. Data yang dibutuhkan dalam jumlah besar Witten Frank, 2005. Secara sederhana, penambangan data adalah penambangan
atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar Davies Beynon, 2004. Penambangan
data sering juga disebut knowledge discovery in database KDD, adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk
menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari penambangan data ini bisa dipakai untuk memperbaiki
pengambilan keputusan di masa depan Santoso, 2007. Menurut Tan et.al 2006,data mining adalah teknologi yang
memadukan metode analisis data tradisional dengan algoritma yang canggih untuk memproses volume data yang besar. Dalam bukunya disebutkan
bahwa penambangan data adalah proses menemukan informasi yang berguna dari repositori data yang besar secara otomatis.
Namun tidak semua tugas menemukan informasi dapat dicari menggunakan penambangan data. Meski tugas-tugas seperti yang penting
dan mungkin melibatkan penggunaan algoritma yang canggih dan struktur data, tetap harus mengandalkan teknik ilmu komputer tradisional dan fitur
yang jelas dari data. Hal ini perlu dalam membuat struktur indeks untuk secara efisien mengatur dan mengambil informasi. Meskipun demikian,
teknik penambangan data telah digunakan untuk meningkatkan sistem pencarian informasi.
2.1.2 Teknik dalam Penambangan Data