6
BAB II LANDASAN TEORI
2.1 Pengertian Data Mining
Data Mining adalah acuan untuk mengekstrak atau menambang
pengetahuan dari data yang jumlahnya sangat besar Han Kamber, 2006. Data Mining
adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang
tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika Gartner, 2007.
Selain itu, data mining juga di definisikan oleh beberapa ahli seperti Data Mining
merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan dana machine learning untuk mengekstraksi
dan mengidentifikasi informasi pengetahuan potensial dan berguna yang bermanfaat yang tersimpan dalam database besar Turban et al, 2005. Data
Mining merupakan bidang dari beberapa keilmuan yang menyatukan teknik
dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang
besar Larose, 2006. Dari pengertian-pengertian di atas, dapat di simpulkan bahwa data mining
mewarisi dari banyak bidang ilmu seperti kecerdasan buatan artificial intellegent, machine learning,
statistik, database, dan juga pemerolehan informasi information retrieval. Dengan kemajuan saat ini, Data Mining
bertujuan untuk mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat. Saat ini, hampir semua bidang membutuhkan data
mining . Hal ini di karenakan oleh terbatasnya kemampuan manusia untuk
menganalisis dan mengolah data. Istilah KDD Knowledge Discovery in Database dan Data Mining
seringkali di artikan memiliki definisi yang sama. Padahal sebenarnya ke dua
istilah tersebut memiliki konsep yang berbeda tapi berhubungan satu sama lain atau memiliki keterkaitan satu sama lain, Data Mining merupakan salah satu
tahapan yang terdapat di dalam KDD Knowledge Discovery in Database. Menurut Jiawei Han dan Kamber, langkah untuk menemukan pengetahuan
atau KDD pada data mining adalah sebagai berikut:
Gambar 2.1 Proses KDD Knowledge Discovery in Database
Langkah-langkah KDD adalah sebagai berikut: 1. Data Cleaning atau Pembersihan Data
Di dalam tahapan ini, di lakukan penghilangan noise, memeriksa data yang tidak konsisten, membuang duplikasi data dan memperbaiki kesalahan
pada data.
2. Data Integration atau Penggabungan Data Di dalam tahapan ini di lakukan penggabungan data dari berbagai sumber
data yang ada agar mudah di pilih dan di proses nantinya. 3. Data Selection atau Seleksi Data
Di dalam tahapan ini di lakukan pemilihan data yang di butuhkan dalam database
dan di gunakan untuk proses analisis. 4. Data Transformation atau Transformasi Data
Di dalam tahapan ini, di lakukan pengubahan dan penggabungan data dari berbagai macam bentuk menjadi satu bentuk yang sama agar mudah di
proses. 5. Data Mining atau Penambangan Data
Di dalam tahapan ini, merupakan proses yang sangat penting dimana metode cerdas di lakukan dan di terapkan untuk mengekstrak pola data.
6. Pattern Evaluation atau Evaluasi Pola Di dalam tahapan ini, melakukan evaluasi terhadap pattern yang telah di
proses, aspek-aspek yang di evaluasi adalah hasil output yang di dapat setelah proses data mining dilakukan.
7. Knowledge Presentation atau Presentasi Pengetahuan Di dalam tahapan ini, di lakukan penyajian hasil dari proses data mining
yang sudah di proses.
2.2 Outlier