dilakukan untuk mengetahui antibodi yang dimiliki ibu hamil untuk menjaga kesehatan ibu dan janin dalam menangkal
beberapa virus dan bakteri penyebab penyakit. Selain faktor-faktor yang telah dijabarkan diatas masih ada faktor-
faktor lain yang dinilai dapat mendukung dalam penentuan jenis persalinan.
2.2 Penambangan Data
2.2.1 Pengertian Penambangan Data
Penambangan data data mining merupakan serangkaian kegiatan mengolah atau menambang data dalam jumlah besar yang tersimpan dalam
database , gudang data atau sumber data lainnya dengan tujuan
memperoleh informasi dan pengatahuan Han Kember, 2006. Data mining
merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan mechine learning
untuk mengekstraksi dan mengidentifikasi informasi pengetahun potensial dan berguna yang bermanfaat yang tersimpan di dalam database besar
Turban et al, 2005. Menurut Gartner Group data mining adalah suatu proses
menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam
penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika Larose, 2006.
Berdasarkan definisi-definisi yang telah disampaikan, hal penting yang terkait dengan data mining adalah Larose, 2006 :
1. Data mining merupakan suatu proses otomatis terhadap data
yang sudah ada. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola
yang mungkin memberikan indikasi yang bermanfaat.
2.2.2 Proses Penambangan Data
Penambangan data dapat menjadi sebuah proses dalam memperoleh pengetahun. Metode Knowledge Discovery in Database
KDD digunakan untuk memperolehan pengetahuan seperti ditunjukkan pada gambar 2.1.
Berikut merupakan ilustrasi dari tahapan penambangan data :
Gambar 2. 1 Tahapan Penambangan Data Han Kamber, 2006 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Karena penambangan data adalah suatu rangkaian proses, maka dibagi menjadi beberapa tahap dengan urutan sebagai berikut:
1. Pembersihan Data Data Cleaning
Tahap awal
dalam penambangan
data adalah
menghapus data yang tidak konsisten dan noise yang terdapat dalam data, seperti data yang tidak relevan, data yang salah
ketik maupun data kosong yang tidak diperlukan. 2.
Integrasi Data Data Integration Tahap penggabungan data dari sumber penyimpanan
yang berbeda. Data-data ini akan digabungkan ke dalam suatu tempat penyimpanan data dalam suatu tabel utuh.
3. Seleksi Data Data Selection
Proses pengambilan dan penyeleksian data yang relevan dari sebuah database. Atribut-atribut data akan dicek
apakah relevan untuk dilakukan penambangan data. Atribut yang tidak relevan tidak akan digunakan.
4. Transformasi Data Data Transformation
Tahap dimana data mengalami transformasi ke dalam bentuk yang sesuai. Tujuan tranformasi dalam proses
penambangan data adalah agar bentuk yang dihasilkan lebih mudah dipahami dan dapat ditambang.
5. Penambangan Data Data Mining
Merupakan proses penting dimana penambangan data diterapkan dan diaplikasikan dengan menggunakan algoritma
khusus yang telah dipilih untuk mengekstrak pola. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6. Evaluasi Pola Pattern Evaluation
Pada tahap ini, dilakuakan proses identifikasi pola yang menarik. Pola tersebut akan direpresentasikan dalam bentuk
pengetahuan berdasarkan beberapa pengukuran yang penting. 7.
Presentasi Pengetahuan Knowledge Presentation Pada tahap akhir, pengetahuan yang diperoleh
kemudian dipresentasikan kepada pengguna. Tahap 1 sampai dengan tahap 4 merupakan langkah awal dalam
pemrosesan data dimana data dipersiapkan terlebih dahulu sebelum dilakukan penambangan. Pada tahap penambangan data, pengetahuan
dasar akan digunakan. Pola-pola menarik akan dipresentasikan kepada pengguna dan akan disimpan sebagai pengetahuan baru. Penambangan
data merupakan proses penting untuk dapat menemukan pola-pola tersembunyi yang nantinya akan dievaluasi.
2.2.3 Pengelompokan Penambangan Data