Tahapan Proses dalam penggunaan data mining yang merupakan proses Knowledge Discovery in Database KDD adalah :
1. Pembersihan Data Data Cleaning
Tahap ini merupakan tahap menghilangkan data yang tidak diperlukan dan data yang tidak konsisten.
2. Integrasi Data Data Integration
Tahap ini merupakan tahap menggabungkan data dari berbagai sumber.
3. Seleksi Data Data Selection
Tahap ini merupakan tahap untuk menganalisis data yang relevan yang diperoleh dari database.
4. Transformasi Data Data Transformation
Tahap ini merupakan proses dimana data diubah atau digabungkan sehingga menjadi tepat untuk dilakukan penambangan
data. 5.
Penambangan Data Data Mining Tahap ini merupakan proses utama dimana metode cerdas
diterapkan untuk mengekstrak pola data. 6.
Evaluasi Pola Patern Evaluation Tahap ini merupakan tahap untuk mengidentifikasi pola-pola
yang sungguh-sungguh menarik yang mewakili pengetahuan berdasarkan beberapa langkah penting.
7. Presentasi Pengetahuan Knowledge Presentation
Tahap ini merupakan teknik visualisasi dan gambaran pengetahuan yang digunakan untuk memberikan pengetahuan hasil
penambangan kepada pengguna.
2.2. Ujian Nasional UN
Ujian Nasional UN, sebagai pengganti Evaluasi Belajar Tahap Akhir Ebtanas merupakan salah satu proses pengukuran hasil belajar yang telah
dilaksanakan diberbagai jenjang pendidikan, yakni Sekolah Dasar, Sekolah Menengah Pertama, dan Sekolah Menengah Atas.
Adapun tujuan UN sebagai berikut : a
Untuk memperoleh informasi tentang mutu hasil pendidikan secara nasional
b Mengukur pencapaian hasil belajar siswa baik sekolahmadrasah negri
maupun swasta c
Memperoleh gambaran perbandingan mutu pendidikan pada sekolah madrasah, antar sekolahmadrasah, dan antar wilayah dari tahun ke
tahun. d
Menjadi bahan penentuan kebijakan pembinaan sekolahmadrasah e
Sebagai bahan pertimbangan dalam memberikan Surat Tanda Tamat Belajar dan seleksi masuk ke jenjang pendidikan yang lebih tinggi.
Kartowagiran, 2008
2.3 Analisis Cluster
2.3.1. Konsep Clustering
Clustering adalah proses mempartisi data –set menjadi beberapa sub-set
atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang dishare bersama , dengan tingkat similaritas
yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah Hermawati Astuti, 2009.
Clustering dapat dibedakan menurut struktur cluster,keanggotaan data dalam cluster, dan kekompakan data dalam cluster. Menurut struktur, clustering
terbagi menjadi dua yaitu hirarki dan partisi. Dalam pengelompokan berbasis hirarki, satu data tunggal bisa dianggap sebuah cluster, dua atau lebih cluster kecil
dapat bergabung menjadi sebuah cluster besar, begitu seterusnya hingga semua data dapat bergabung menjadi sebuah cluster. Disisi lain, pengelompokan berbasis
partisi membagi set data ke dalam sejumlah cluster yang tidak bertumpang-tindih antara satu cluster dengan cluster yang lain , artinya setiap data hanya menjadi
anggota satu cluster saja. Metode yang termasuk ke dalam kategori clustering partisi adalah K-Means, DBSCAN, dan Self Organizing Map SOM Prasetyo,
2014. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI