kelulusan yang digunakan dalam UN adalah menggunakan sistem penilaian acuan patokan PAP, yakni batas lulus purposif. Hasil UN
digunakan sebagai salah satu pertimbangan untuk PerMenDikBud No.32013:
1. Pemetaan mutu satuan danatau program pendidikan 2. Seleksi masuk jenjang berikutnya
3. Penentuan kelulusan peserta didik dari suatu satuan pendidikan 4. Akreditasi satuan pendidikan
5. Pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upaya peningkatan mutu pendidikan.
2.2.2 Knowledge Discovery in Database KDD
Knowledge Discovery in Database KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau
hubungan dalam set data berukuran besar. Data mining Penambangan data merupakan bagian dari Knowledge Discovery in Database yang merupakan
kegiatan yang meliputi pengumpulan , pemakaian data historis untuk menemukan
keteraturan, pola atau hubungan dalam data yang berukuran besar Santosa, 2007.
Istilah data mining dan KDD sering disalah artikan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu kumpulan data
yang besar. Data mining dan KDD memiliki konsep yang berbeda tetapi saling berkaitan satu sama lain. Salah satu tahapan dalam proses KDD adalah data
mining HanKamber,2006. Sebagai komponen dalam KDD, data mining berkaitan dengan ekstrasi dan penghitungan pola-pola dari data yang terdembunyi
dalam database. Tahapan KDD merupakan suatu rangkaian proses data mining dan dapat
dibagi menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif di mana
pemakai terlibat langsung atau melalui perantara knowledge base.
Gambar 2.1 Tahapan proses sebuah sistem KDD Jiawei Han Micheline Kamber,2006
Tahapan prosesnya yaitu : 1. Pembersihan data data cleaning
Pada tahap ini dilakukan untuk proses pembersihan data untuk menghilangkan noise dan data yang konsisten atau data tidak relevan. Secara
umum data yang diperoleh, memiliki data-data yang tidak sempurna seperti data yang hilang atau data yang tidak lengkap,data yang mengandung noise, data yang
tidak konsisten atau juga hanya sekedar salah ketik. 2. Integrasi data data integration
Pada tahap ini , dilakukan penggabungan data dari berbagai sumber-sember yang berbeda ke dalam satu database. Integrasi data dilakukan pada atribut-aribut
yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis produk, nomor pelanggan dan lainnya.
3. Seleksi Data Data Selection Pada proses ini , data yang ada pada database akan diseleksi dan diambil
data yang relevan atau sesuai untuk dianalisis. 4. Transformasi data Data Transformation
Pada tahap ini data diubah ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang
khusus sebelum bisa diaplikasikan. Proses ini meliputi : penghalusan, agregasi, generalisasi dari data, normalisasi dan konstruksi atribut atau fitur.
5. Proses data mining Pada tahap ini, merupakan suatu proses utama saat metode diterapkan untuk
mengekstrasi pola data, menemukan pengetahuan atau knowledge yang berharga dan tersembunyi dari data.
6. Evaluasi pola pattern evaluation, Pada tahap ini, dilakukan identifikasi pola-pola yang meresentasikan
knowledge atau berdasarkan beberapa pengukuran yang menarik atau penting. 7. Presentasi pengetahuan knowledge presentation,
Pada tahap ini, merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh
pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Dalam
presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data mining.
Tahap 1 sampai tahap 4 termasuk dalam data preprocessing, dimana data disiapkan untuk di mining. Setelah melakukan tahapan preprocessing maka
hasilnya siap di proses mining. Data yang dipakai merupakan sekumpulan obyek data dan atribut.
2.2.3 Konsep Clustering