Tabel 3.1 Tampilan Data Set No Role
Name Type
1 label
IPK Nominal
2 regular
Minat Belajar Numeric
3 regular
Kepercayaan diri Nominal
4 regular
Perilaku Belajar Nominal
5 regular
Dukungan Orang tua Nominal
6 regular
Waktu belajar Nominal
7 regular
Agama Nominal
8 regular
Jenis Kelamin Nominal
9 regular
Predikat Polynomial
10 regular
MB Polynomial
11 regular
KPD Polynomial
12 regular
PB Polynomial
13 regular
DO Polynomial
14 regular
WB Polynomial
3.5. Pra Pemrosesan Data Preprocessing Data
Untuk mendapatkan input yang baik dari teknik data mining, dilakukan preprocessing terhadap data yang akan digunakan. Preprocessing data merupakan
tahap prapemrosesan. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan pada data yang menjadi fokus atau
target KDD. Dalam kasus ini, data yang diambil sebanyak 400 mahasiswa tahun ajaran 2009-2010 dan 2010-2011 dari D3 Teknik Informatika FMIPA USU
Medan. Atribut yang digunakan pada penelitian ini berupa IPK, Minat Belajar, Kepercayaan diri, Prilaku Belajar, Dukungan Orang tua, Waktu Belajar, Jenis
Kelamin, Predikat. Data set penulis mensurvei mahasiswa tentang prediksi prestasi akademik
dengan menggunakan kuesioner tertulis. Penulis menyebarkan instrumen survey dan termasuk pertanyaan demografis secara umum. Jumlah mahasiswa sebanyak
Universitas Sumatera Utara
400 orang, dan penulis mendapatkan data sampel sebanyak 400 orang untuk data kuesioner mahasiswa. Sumber data yang dikumpulkan dari catatan kartu hasil
studi akademik mahasiswa. Tabel 3.2. Tampilan data
Tabel 3.2 merupakan tampilan data yang diperoleh dari sistem file D3 Teknik Informatika FMIPA USU Medan Tahun Ajaran 2009-2010 dan 2010-2011 yang
terdiri dari IPK, Minat Belajar, Kepercayaan diri, Prilaku Belajar, Dukungan Orang tua, Waktu Belajar, Jenis Kelamin, Predikat.
Menurut keputusan Rektor USU Nomor : 3128J05SKAK2004 Dalam Peraturan Akademik D3 Teknik Informatika FMIPA USU Medan. dipilih field-
field yang akan dikategorisasi. Field yang akan dikategorisasi adalah IPK. IPK dikategorisasi menjadi 4 kategori yaitu, dengan Pujian, Sangat memuaskan,
Memuaskan dan Buruk sebagaimana terlihat pada Tabel 3.3 berikut :
Universitas Sumatera Utara
Tabel 3.3. Kategorisasi IPK
No IPK
Predikat
1 2,00
Buruk 2
2,00 – 2,75 Memuaskan
3 2,76 – 3,50
Sangat Memuaskan 4
3,51 – 4,00 Dengan Pujian
Setelah dikategorisasi dihasilkan sebuah tabel data dengan format xls seperti pada
tabel 3.4. Tabel 3.4. Tampilan Kategorisasi Data
Hasil kategorisasi data akan digunakan untuk input data pada software open source Rapidminer. Setelah itu dilakukan transformasi data dari format xls
menjadi XML sehingga dihasilkan data pengujian dalam format XML. Dilakukan pengujian terhadap data yang sudah dalam XML menggunakan algoritma Kernel
K-Means. Dari pengujian diperoleh cluster dari data yang telah diuji selanjutnya dilakukan analisis cluster untuk menganalisis dan mendapatkan model aturan
yang digambarkan dari hasil cluster.
Universitas Sumatera Utara
3.6. Clustering Kernel k-Means