Pengertian Penambangan Data Proses Penambangan Data

dilakukan untuk mengetahui antibodi yang dimiliki ibu hamil untuk menjaga kesehatan ibu dan janin dalam menangkal beberapa virus dan bakteri penyebab penyakit. Selain faktor-faktor yang telah dijabarkan diatas masih ada faktor- faktor lain yang dinilai dapat mendukung dalam penentuan jenis persalinan.

2.2 Penambangan Data

2.2.1 Pengertian Penambangan Data

Penambangan data data mining merupakan serangkaian kegiatan mengolah atau menambang data dalam jumlah besar yang tersimpan dalam database , gudang data atau sumber data lainnya dengan tujuan memperoleh informasi dan pengatahuan Han Kember, 2006. Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan mechine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahun potensial dan berguna yang bermanfaat yang tersimpan di dalam database besar Turban et al, 2005. Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika Larose, 2006. Berdasarkan definisi-definisi yang telah disampaikan, hal penting yang terkait dengan data mining adalah Larose, 2006 : 1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2. Data yang akan diproses berupa data yang sangat besar. 3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.

2.2.2 Proses Penambangan Data

Penambangan data dapat menjadi sebuah proses dalam memperoleh pengetahun. Metode Knowledge Discovery in Database KDD digunakan untuk memperolehan pengetahuan seperti ditunjukkan pada gambar 2.1. Berikut merupakan ilustrasi dari tahapan penambangan data : Gambar 2. 1 Tahapan Penambangan Data Han Kamber, 2006 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Karena penambangan data adalah suatu rangkaian proses, maka dibagi menjadi beberapa tahap dengan urutan sebagai berikut: 1. Pembersihan Data Data Cleaning Tahap awal dalam penambangan data adalah menghapus data yang tidak konsisten dan noise yang terdapat dalam data, seperti data yang tidak relevan, data yang salah ketik maupun data kosong yang tidak diperlukan. 2. Integrasi Data Data Integration Tahap penggabungan data dari sumber penyimpanan yang berbeda. Data-data ini akan digabungkan ke dalam suatu tempat penyimpanan data dalam suatu tabel utuh. 3. Seleksi Data Data Selection Proses pengambilan dan penyeleksian data yang relevan dari sebuah database. Atribut-atribut data akan dicek apakah relevan untuk dilakukan penambangan data. Atribut yang tidak relevan tidak akan digunakan. 4. Transformasi Data Data Transformation Tahap dimana data mengalami transformasi ke dalam bentuk yang sesuai. Tujuan tranformasi dalam proses penambangan data adalah agar bentuk yang dihasilkan lebih mudah dipahami dan dapat ditambang. 5. Penambangan Data Data Mining Merupakan proses penting dimana penambangan data diterapkan dan diaplikasikan dengan menggunakan algoritma khusus yang telah dipilih untuk mengekstrak pola. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 6. Evaluasi Pola Pattern Evaluation Pada tahap ini, dilakuakan proses identifikasi pola yang menarik. Pola tersebut akan direpresentasikan dalam bentuk pengetahuan berdasarkan beberapa pengukuran yang penting. 7. Presentasi Pengetahuan Knowledge Presentation Pada tahap akhir, pengetahuan yang diperoleh kemudian dipresentasikan kepada pengguna. Tahap 1 sampai dengan tahap 4 merupakan langkah awal dalam pemrosesan data dimana data dipersiapkan terlebih dahulu sebelum dilakukan penambangan. Pada tahap penambangan data, pengetahuan dasar akan digunakan. Pola-pola menarik akan dipresentasikan kepada pengguna dan akan disimpan sebagai pengetahuan baru. Penambangan data merupakan proses penting untuk dapat menemukan pola-pola tersembunyi yang nantinya akan dievaluasi.

2.2.3 Pengelompokan Penambangan Data