Knowledge Discovery in Database KDD

kelulusan yang digunakan dalam UN adalah menggunakan sistem penilaian acuan patokan PAP, yakni batas lulus purposif. Hasil UN digunakan sebagai salah satu pertimbangan untuk PerMenDikBud No.32013: 1. Pemetaan mutu satuan danatau program pendidikan 2. Seleksi masuk jenjang berikutnya 3. Penentuan kelulusan peserta didik dari suatu satuan pendidikan 4. Akreditasi satuan pendidikan 5. Pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upaya peningkatan mutu pendidikan.

2.2.2 Knowledge Discovery in Database KDD

Knowledge Discovery in Database KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Data mining Penambangan data merupakan bagian dari Knowledge Discovery in Database yang merupakan kegiatan yang meliputi pengumpulan , pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data yang berukuran besar Santosa, 2007. Istilah data mining dan KDD sering disalah artikan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu kumpulan data yang besar. Data mining dan KDD memiliki konsep yang berbeda tetapi saling berkaitan satu sama lain. Salah satu tahapan dalam proses KDD adalah data mining HanKamber,2006. Sebagai komponen dalam KDD, data mining berkaitan dengan ekstrasi dan penghitungan pola-pola dari data yang terdembunyi dalam database. Tahapan KDD merupakan suatu rangkaian proses data mining dan dapat dibagi menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif di mana pemakai terlibat langsung atau melalui perantara knowledge base. Gambar 2.1 Tahapan proses sebuah sistem KDD Jiawei Han Micheline Kamber,2006 Tahapan prosesnya yaitu : 1. Pembersihan data data cleaning Pada tahap ini dilakukan untuk proses pembersihan data untuk menghilangkan noise dan data yang konsisten atau data tidak relevan. Secara umum data yang diperoleh, memiliki data-data yang tidak sempurna seperti data yang hilang atau data yang tidak lengkap,data yang mengandung noise, data yang tidak konsisten atau juga hanya sekedar salah ketik. 2. Integrasi data data integration Pada tahap ini , dilakukan penggabungan data dari berbagai sumber-sember yang berbeda ke dalam satu database. Integrasi data dilakukan pada atribut-aribut yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis produk, nomor pelanggan dan lainnya. 3. Seleksi Data Data Selection Pada proses ini , data yang ada pada database akan diseleksi dan diambil data yang relevan atau sesuai untuk dianalisis. 4. Transformasi data Data Transformation Pada tahap ini data diubah ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Proses ini meliputi : penghalusan, agregasi, generalisasi dari data, normalisasi dan konstruksi atribut atau fitur. 5. Proses data mining Pada tahap ini, merupakan suatu proses utama saat metode diterapkan untuk mengekstrasi pola data, menemukan pengetahuan atau knowledge yang berharga dan tersembunyi dari data. 6. Evaluasi pola pattern evaluation, Pada tahap ini, dilakukan identifikasi pola-pola yang meresentasikan knowledge atau berdasarkan beberapa pengukuran yang menarik atau penting. 7. Presentasi pengetahuan knowledge presentation, Pada tahap ini, merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Dalam presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data mining. Tahap 1 sampai tahap 4 termasuk dalam data preprocessing, dimana data disiapkan untuk di mining. Setelah melakukan tahapan preprocessing maka hasilnya siap di proses mining. Data yang dipakai merupakan sekumpulan obyek data dan atribut.

2.2.3 Konsep Clustering