dilakukan untuk mengetahui antibodi yang dimiliki ibu hamil untuk menjaga kesehatan ibu dan janin dalam menangkal
beberapa virus dan bakteri penyebab penyakit. Selain faktor-faktor yang telah dijabarkan diatas masih ada faktor-
faktor lain yang dinilai dapat mendukung dalam penentuan jenis persalinan.
2.2 Penambangan Data
2.2.1 Pengertian Penambangan Data
Penambangan data
data mining
merupakan serangkaian kegiatan mengolah atau menambang data dalam jumlah besar yang tersimpan dalam
database
, gudang data atau sumber data lainnya dengan tujuan memperoleh informasi dan pengatahuan Han Kember, 2006.
Data mining
merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan
mechine learning
untuk mengekstraksi dan mengidentifikasi informasi pengetahun potensial dan berguna yang bermanfaat yang tersimpan di dalam
database
besar Turban et al, 2005.
Menurut Gartner Group
data mining
adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan
memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik
statistik dan matematika Larose, 2006. Berdasarkan definisi-definisi yang telah disampaikan, hal penting
yang terkait dengan
data mining
adalah Larose, 2006 : 1.
Data mining
merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola
yang mungkin memberikan indikasi yang bermanfaat.
2.2.2 Proses Penambangan Data
Penambangan data dapat menjadi sebuah proses dalam memperoleh pengetahun. Metode
Knowledge Discovery in Database
KDD digunakan untuk memperolehan pengetahuan seperti ditunjukkan pada gambar 2.1.
Berikut merupakan ilustrasi dari tahapan penambangan data :
Gambar 2. 1 Tahapan Penambangan Data Han Kamber, 2006 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Karena penambangan data adalah suatu rangkaian proses, maka dibagi menjadi beberapa tahap dengan urutan sebagai berikut:
1. Pembersihan Data
Data Cleaning
Tahap awal
dalam penambangan
data adalah
menghapus data yang tidak konsisten dan
noise
yang terdapat dalam data, seperti data yang tidak relevan, data yang salah
ketik maupun data kosong yang tidak diperlukan. 2.
Integrasi Data
Data Integration
Tahap penggabungan data dari sumber penyimpanan yang berbeda. Data-data ini akan digabungkan ke dalam suatu
tempat penyimpanan data dalam suatu tabel utuh. 3.
Seleksi Data
Data Selection
Proses pengambilan dan penyeleksian data yang relevan dari sebuah
database
. Atribut-atribut data akan dicek apakah relevan untuk dilakukan penambangan data. Atribut
yang tidak relevan tidak akan digunakan. 4.
Transformasi Data
Data Transformation
Tahap dimana data mengalami transformasi ke dalam bentuk yang sesuai. Tujuan tranformasi dalam proses
penambangan data adalah agar bentuk yang dihasilkan lebih mudah dipahami dan dapat ditambang.
5. Penambangan Data
Data Mining
Merupakan proses penting dimana penambangan data diterapkan dan diaplikasikan dengan menggunakan algoritma
khusus yang telah dipilih untuk mengekstrak pola. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6. Evaluasi Pola
Pattern Evaluation
Pada tahap ini, dilakuakan proses identifikasi pola yang menarik. Pola tersebut akan direpresentasikan dalam bentuk
pengetahuan berdasarkan beberapa pengukuran yang penting. 7.
Presentasi Pengetahuan
Knowledge Presentation
Pada tahap akhir, pengetahuan yang diperoleh kemudian dipresentasikan kepada pengguna.
Tahap 1 sampai dengan tahap 4 merupakan langkah awal dalam pemrosesan data dimana data dipersiapkan terlebih dahulu sebelum
dilakukan penambangan. Pada tahap penambangan data, pengetahuan dasar akan digunakan. Pola-pola menarik akan dipresentasikan kepada
pengguna dan akan disimpan sebagai pengetahuan baru. Penambangan data merupakan proses penting untuk dapat menemukan pola-pola
tersembunyi yang nantinya akan dievaluasi.
2.2.3 Pengelompokan Penambangan Data