RUMUSAN MASALAH TUJUAN PENELITIAN

Tahapan Proses dalam penggunaan data mining yang merupakan proses Knowledge Discovery in Database KDD adalah : 1. Pembersihan Data Data Cleaning Tahap ini merupakan tahap menghilangkan data yang tidak diperlukan dan data yang tidak konsisten. 2. Integrasi Data Data Integration Tahap ini merupakan tahap menggabungkan data dari berbagai sumber. 3. Seleksi Data Data Selection Tahap ini merupakan tahap untuk menganalisis data yang relevan yang diperoleh dari database. 4. Transformasi Data Data Transformation Tahap ini merupakan proses dimana data diubah atau digabungkan sehingga menjadi tepat untuk dilakukan penambangan data. 5. Penambangan Data Data Mining Tahap ini merupakan proses utama dimana metode cerdas diterapkan untuk mengekstrak pola data. 6. Evaluasi Pola Patern Evaluation Tahap ini merupakan tahap untuk mengidentifikasi pola-pola yang sungguh-sungguh menarik yang mewakili pengetahuan berdasarkan beberapa langkah penting. 7. Presentasi Pengetahuan Knowledge Presentation Tahap ini merupakan teknik visualisasi dan gambaran pengetahuan yang digunakan untuk memberikan pengetahuan hasil penambangan kepada pengguna.

2.2. Ujian Nasional UN

Ujian Nasional UN, sebagai pengganti Evaluasi Belajar Tahap Akhir Ebtanas merupakan salah satu proses pengukuran hasil belajar yang telah dilaksanakan diberbagai jenjang pendidikan, yakni Sekolah Dasar, Sekolah Menengah Pertama, dan Sekolah Menengah Atas. Adapun tujuan UN sebagai berikut : a Untuk memperoleh informasi tentang mutu hasil pendidikan secara nasional b Mengukur pencapaian hasil belajar siswa baik sekolahmadrasah negri maupun swasta c Memperoleh gambaran perbandingan mutu pendidikan pada sekolah madrasah, antar sekolahmadrasah, dan antar wilayah dari tahun ke tahun. d Menjadi bahan penentuan kebijakan pembinaan sekolahmadrasah e Sebagai bahan pertimbangan dalam memberikan Surat Tanda Tamat Belajar dan seleksi masuk ke jenjang pendidikan yang lebih tinggi. Kartowagiran, 2008

2.3 Analisis Cluster

2.3.1. Konsep Clustering

Clustering adalah proses mempartisi data –set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang dishare bersama , dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah Hermawati Astuti, 2009. Clustering dapat dibedakan menurut struktur cluster,keanggotaan data dalam cluster, dan kekompakan data dalam cluster. Menurut struktur, clustering terbagi menjadi dua yaitu hirarki dan partisi. Dalam pengelompokan berbasis hirarki, satu data tunggal bisa dianggap sebuah cluster, dua atau lebih cluster kecil dapat bergabung menjadi sebuah cluster besar, begitu seterusnya hingga semua data dapat bergabung menjadi sebuah cluster. Disisi lain, pengelompokan berbasis partisi membagi set data ke dalam sejumlah cluster yang tidak bertumpang-tindih antara satu cluster dengan cluster yang lain , artinya setiap data hanya menjadi anggota satu cluster saja. Metode yang termasuk ke dalam kategori clustering partisi adalah K-Means, DBSCAN, dan Self Organizing Map SOM Prasetyo, 2014. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI