Pra Pemrosesan Data Preprocessing Data

Tabel 3.1 Tampilan Data Set No Role Name Type 1 label IPK Nominal 2 regular Minat Belajar Numeric 3 regular Kepercayaan diri Nominal 4 regular Perilaku Belajar Nominal 5 regular Dukungan Orang tua Nominal 6 regular Waktu belajar Nominal 7 regular Agama Nominal 8 regular Jenis Kelamin Nominal 9 regular Predikat Polynomial 10 regular MB Polynomial 11 regular KPD Polynomial 12 regular PB Polynomial 13 regular DO Polynomial 14 regular WB Polynomial

3.5. Pra Pemrosesan Data Preprocessing Data

Untuk mendapatkan input yang baik dari teknik data mining, dilakukan preprocessing terhadap data yang akan digunakan. Preprocessing data merupakan tahap prapemrosesan. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan pada data yang menjadi fokus atau target KDD. Dalam kasus ini, data yang diambil sebanyak 400 mahasiswa tahun ajaran 2009-2010 dan 2010-2011 dari D3 Teknik Informatika FMIPA USU Medan. Atribut yang digunakan pada penelitian ini berupa IPK, Minat Belajar, Kepercayaan diri, Prilaku Belajar, Dukungan Orang tua, Waktu Belajar, Jenis Kelamin, Predikat. Data set penulis mensurvei mahasiswa tentang prediksi prestasi akademik dengan menggunakan kuesioner tertulis. Penulis menyebarkan instrumen survey dan termasuk pertanyaan demografis secara umum. Jumlah mahasiswa sebanyak Universitas Sumatera Utara 400 orang, dan penulis mendapatkan data sampel sebanyak 400 orang untuk data kuesioner mahasiswa. Sumber data yang dikumpulkan dari catatan kartu hasil studi akademik mahasiswa. Tabel 3.2. Tampilan data Tabel 3.2 merupakan tampilan data yang diperoleh dari sistem file D3 Teknik Informatika FMIPA USU Medan Tahun Ajaran 2009-2010 dan 2010-2011 yang terdiri dari IPK, Minat Belajar, Kepercayaan diri, Prilaku Belajar, Dukungan Orang tua, Waktu Belajar, Jenis Kelamin, Predikat. Menurut keputusan Rektor USU Nomor : 3128J05SKAK2004 Dalam Peraturan Akademik D3 Teknik Informatika FMIPA USU Medan. dipilih field- field yang akan dikategorisasi. Field yang akan dikategorisasi adalah IPK. IPK dikategorisasi menjadi 4 kategori yaitu, dengan Pujian, Sangat memuaskan, Memuaskan dan Buruk sebagaimana terlihat pada Tabel 3.3 berikut : Universitas Sumatera Utara Tabel 3.3. Kategorisasi IPK No IPK Predikat 1 2,00 Buruk 2 2,00 – 2,75 Memuaskan 3 2,76 – 3,50 Sangat Memuaskan 4 3,51 – 4,00 Dengan Pujian Setelah dikategorisasi dihasilkan sebuah tabel data dengan format xls seperti pada tabel 3.4. Tabel 3.4. Tampilan Kategorisasi Data Hasil kategorisasi data akan digunakan untuk input data pada software open source Rapidminer. Setelah itu dilakukan transformasi data dari format xls menjadi XML sehingga dihasilkan data pengujian dalam format XML. Dilakukan pengujian terhadap data yang sudah dalam XML menggunakan algoritma Kernel K-Means. Dari pengujian diperoleh cluster dari data yang telah diuji selanjutnya dilakukan analisis cluster untuk menganalisis dan mendapatkan model aturan yang digambarkan dari hasil cluster. Universitas Sumatera Utara

3.6. Clustering Kernel k-Means