BAB 3
METODOLOGI PENELITIAN
3.1 Pendahuluan
Tujuan dari tesis ini adalah untuk membuat model aturan dalam memprediksi prestasi akademik mahasiswa menggunakan algoritma Kernel K-Means yang dapat digunakan
sebagai alat bantu analitis oleh manajemen untuk membuat keputusan. Pada bagian ini kita mulai dengan menggambarkan kasus data mining pada sistem penilaian akademik
di perguruan tinggi dan prosedur bagaimana mengumpulkan data yang digunakan pada penelitian ini.
3.2 Lokasi dan Waktu Penelitian
Penelitian dilakukan pada jurusan Teknik Elektro di Politeknik Negeri Medan, Jalan Almamater No. 1 Kampus USU Medan. Lamanya waktu yang dibutuhkan untuk
menyelesaikan penelitian ini yaitu 3 bulan yang dimulai pada bulan April sampai bulan Juni 2011.
3.3 Rancangan Penelitian
Rancangan penelitian ini dimulai dengan mengumpulkan data dari jurusan Teknik Elektro Politeknik Negeri Medan. Data dikumpulkan dari database akademik
mahasiswa angkatan 2008-2009.
Universitas Sumatera Utara
Variabel yang dikumpulkan adalah ipk selama 4 semester, jenis kelamin mahasiswa, agama, program studi, nilai rata-rata teori, nilai rata-rata praktek dan
absensi kehadiran. Data terdiri dari data demografi seperti jenis kelamin, agama, program studi dan variabel-variabel lain yang berkaitan dengan prestasi akademik
mahasiswa. Data yang diperoleh dalam bentuk xls dimodifikasi dan ditransformasi
sehingga menjadi bentuk XML. Selanjutnya dilakukan pengujian terhadap data dengan menggunakan algoritma Kernel K-Means yang telah tersedia pada software open
source RapidMiner. Dari pengujian diperoleh cluster dari data yang telah diuji selanjutnya dilakukan analisis cluster untuk menganalisis dan mendapatkan model
aturan.
3.4 Pra Pemrosesan Data Preprocessing Data
Untuk mendapatkan input yang baik dari teknik data mining, dilakukan preprocessing terhadap data yang akan digunakan. Preprocessing data merupakan tahap
prapemrosesan. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan pada data yang menjadi fokus atau target KDD. Dalam
kasus ini, data yang diambil sebanyak 315 mahasiswa tahun ajaran 2008-2009 dari jurusan Teknik Elektro Politeknik Negeri Medan. Atribut yang digunakan pada
penelitian ini berupa IPK, PRAKTEK, TEORI, KEHADIRAN, AGAMA, PRODI dan GENDER.
Tabel 3.1 Tampilan Data
Universitas Sumatera Utara
Tabel 3.1 merupakan tampilan data yang diperoleh dari sistem file akademik jurusan Teknik Elektro Politeknik Negeri Medan tahun ajaran 2008-2009 yang terdiri
dari rata-rata nilai teori, rata-rata nilai praktek, jenis kelamin, agama, absensi kehadiran, program studi dan IPK.
Selanjutnya dipilih field-field yang akan dikategorisasi. Field yang akan dikategorisasi adalah IPK. IPK dikategorisasi menjadi 4 kategori yaitu, Dengan
Pujian, Sangat Memuaskan, Memuaskan dan Buruk sebagaimana terlihat pada tabel 3.2 berikut :
Tabel 3.2 Kategorisasi IPK
No. IPK
Predikat 1.
2,00 Buruk
2. 2,00 - 2,75
Memuaskan 3.
2,76 - 3,50 Sangat Memuaskan
4. 3,51 - 4,00
Dengan Pujian Berikutnya field yang akan dikategorisasi adalah PRAKTEK dan TEORI.
Untuk field PRAKTEK dan TEORI dikategorisasi menjadi 3 kategori yaitu Tinggi, Sedang dan Rendah seperti pada tabel 3.3 berikut :
Tabel 3.3 Kategorisasi Nilai Praktek dan Teori
No. PRAKTEK
TEORI KATEGORI
1. Praktek 58
Teori 58 Rendah
2. 70 Praktek 58 70 Teori 58
Sedang 3.
Praktek 70 Teori 70
Tinggi Selanjutnya field yang akan dikategorisasi adalah PRODI. PRODI
dikategorisasi menjadi 3 kategori yaitu Telkom, Elektronika dan Listrik seperti pada tabel 3.4 berikut :
Tabel 3.4 Kategorisasi Prodi
No. PRODI
Progstudi 1
1 Telkom
2 2
Elektronika 3
3 Listrik
Universitas Sumatera Utara