Pendahuluan Lokasi dan Waktu Penelitian Rancangan Penelitian Pra Pemrosesan Data Preprocessing Data

BAB 3 METODOLOGI PENELITIAN

3.1 Pendahuluan

Tujuan dari tesis ini adalah untuk membuat model aturan dalam memprediksi prestasi akademik mahasiswa menggunakan algoritma Kernel K-Means yang dapat digunakan sebagai alat bantu analitis oleh manajemen untuk membuat keputusan. Pada bagian ini kita mulai dengan menggambarkan kasus data mining pada sistem penilaian akademik di perguruan tinggi dan prosedur bagaimana mengumpulkan data yang digunakan pada penelitian ini.

3.2 Lokasi dan Waktu Penelitian

Penelitian dilakukan pada jurusan Teknik Elektro di Politeknik Negeri Medan, Jalan Almamater No. 1 Kampus USU Medan. Lamanya waktu yang dibutuhkan untuk menyelesaikan penelitian ini yaitu 3 bulan yang dimulai pada bulan April sampai bulan Juni 2011.

3.3 Rancangan Penelitian

Rancangan penelitian ini dimulai dengan mengumpulkan data dari jurusan Teknik Elektro Politeknik Negeri Medan. Data dikumpulkan dari database akademik mahasiswa angkatan 2008-2009. Universitas Sumatera Utara Variabel yang dikumpulkan adalah ipk selama 4 semester, jenis kelamin mahasiswa, agama, program studi, nilai rata-rata teori, nilai rata-rata praktek dan absensi kehadiran. Data terdiri dari data demografi seperti jenis kelamin, agama, program studi dan variabel-variabel lain yang berkaitan dengan prestasi akademik mahasiswa. Data yang diperoleh dalam bentuk xls dimodifikasi dan ditransformasi sehingga menjadi bentuk XML. Selanjutnya dilakukan pengujian terhadap data dengan menggunakan algoritma Kernel K-Means yang telah tersedia pada software open source RapidMiner. Dari pengujian diperoleh cluster dari data yang telah diuji selanjutnya dilakukan analisis cluster untuk menganalisis dan mendapatkan model aturan.

3.4 Pra Pemrosesan Data Preprocessing Data

Untuk mendapatkan input yang baik dari teknik data mining, dilakukan preprocessing terhadap data yang akan digunakan. Preprocessing data merupakan tahap prapemrosesan. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan pada data yang menjadi fokus atau target KDD. Dalam kasus ini, data yang diambil sebanyak 315 mahasiswa tahun ajaran 2008-2009 dari jurusan Teknik Elektro Politeknik Negeri Medan. Atribut yang digunakan pada penelitian ini berupa IPK, PRAKTEK, TEORI, KEHADIRAN, AGAMA, PRODI dan GENDER. Tabel 3.1 Tampilan Data Universitas Sumatera Utara Tabel 3.1 merupakan tampilan data yang diperoleh dari sistem file akademik jurusan Teknik Elektro Politeknik Negeri Medan tahun ajaran 2008-2009 yang terdiri dari rata-rata nilai teori, rata-rata nilai praktek, jenis kelamin, agama, absensi kehadiran, program studi dan IPK. Selanjutnya dipilih field-field yang akan dikategorisasi. Field yang akan dikategorisasi adalah IPK. IPK dikategorisasi menjadi 4 kategori yaitu, Dengan Pujian, Sangat Memuaskan, Memuaskan dan Buruk sebagaimana terlihat pada tabel 3.2 berikut : Tabel 3.2 Kategorisasi IPK No. IPK Predikat 1. 2,00 Buruk 2. 2,00 - 2,75 Memuaskan 3. 2,76 - 3,50 Sangat Memuaskan 4. 3,51 - 4,00 Dengan Pujian Berikutnya field yang akan dikategorisasi adalah PRAKTEK dan TEORI. Untuk field PRAKTEK dan TEORI dikategorisasi menjadi 3 kategori yaitu Tinggi, Sedang dan Rendah seperti pada tabel 3.3 berikut : Tabel 3.3 Kategorisasi Nilai Praktek dan Teori No. PRAKTEK TEORI KATEGORI

1. Praktek 58

Teori 58 Rendah 2. 70 Praktek 58 70 Teori 58 Sedang 3. Praktek 70 Teori 70 Tinggi Selanjutnya field yang akan dikategorisasi adalah PRODI. PRODI dikategorisasi menjadi 3 kategori yaitu Telkom, Elektronika dan Listrik seperti pada tabel 3.4 berikut : Tabel 3.4 Kategorisasi Prodi No. PRODI Progstudi 1 1 Telkom 2 2 Elektronika 3 3 Listrik Universitas Sumatera Utara