Data Mining LANDASAN TEORI

7

BAB 2 LANDASAN TEORI

2.1 Data Mining

Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan keduanya. Secara teknis, data mining dapat disebut sebagai proses untuk menemukan korelasi atau pola dari ratusan atau ribuan field dari sebuah relasional database yang besar. [2] Kemampuan Data mining untuk mencari informasi bisnis yang berharga dari basis data yang sangat besar, dapat dianalogikan dengan penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk [2] : 1. Prediksi trend dan sifat-sifat bisnis, dimana data mining mengotomatisasi proses pencarian informasi di dalam basis data yang besar. 2. Penemuan pola-pola yang tidak diketahui sebelumnya, dimana data mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan. Data mining adalah sebuah langkah dalam proses mencari pola-pola yang terdapat dalam setiap informasi. Langkah-langkah tersebut akan dijelaskan pada gambar 2.1 [3]. 8 Gambar 2.1 Tahap penemuan Knowledge Data Discovery KDD Gambar 2.1 menggambarkan proses KDD dalam menghasilkan knowledge dan terdiri dari beberapa tahap [3]: a Data Cleaning Untuk menghapus data yang tidak dipakai dan data yang tidak konsisten. b Data Integration Berbagai sumber data dapat digabungkan. c Data Selection Data yang bersangkutan pada tugas analisis diseleksi dan diambil kembali. dari database. d Data Transformation Data diubah atau diperkuat menjadi bentuk yang seharusnya untuk diolah dengan menganalisis ringkasan atau jumlah total agregasi. 9 e Data Mining Sebuah proses penting di mana metode intelijen diterapkan dengan tujuan untuk mengolah pola-pola data. f Pattern Evaluation Untuk mengidentifikasi pola-pola menarik yang menjelaskan mengenai ukuran dasar pengetahuan yang ada. g Knowledge Presentation Visualisasi dan teknik representasi knowledge digunakan untuk menyajikan knowledge yang telah diolah untuk pengguna.

2.2 Jenis-jenis Data Mining Menurut Fungsinya