Preprocessing Database Akademik Preprocessing Data

Pada Tabel 3.4 atribut predikat sebagai label yang merupakan tujuan dari atribut program studi, IPK, total sks lulus, total sks tidak lulus, total sks belum diambil, total sks nilai D, total sks nilai E, jumlah sks diambil, ekonomi_orang_tua, dukungan orang tua, fasilitas, motivasi, confidence, kualitas pelayanan, semester dan pendidikan orang tua,

3.5 Validitas dan Reliabilitas Keakuratan Data

Keakuratan instrumen yang digunakan pada penelitian ini adalah penting. Keakuratan mengacu apakah instrumen yang digunakan mengukur secara konsisten setiap waktu dan populasi Gall et al., 1996. Survei dalam studi ini diuji dalam jangka waktu dan ukuran internal yang terpercaya yang memiliki keterkaitan antara bagian bagian tes Brown and Alexander, 1991 . Hal ini menjamin apakah pengukuran instrumen secara akurat dimaksudkan untuk mengukur. Cronbach’s Alpha diberikan survei untuk mengukur konsistensi internal. Menurut Mitchell dan Jolley 1999, Cronbach’s Alpha pada atau di atas 0.60 diterima sebagai bukti realibilitas internal. Validitas dan Realibilitas dari kuesioner dengan jumlah data sebanyak 1235 item

3.6 Preprocessing Data

3.6.1 Preprocessing Database Akademik

Untuk mendapatkan input yang lebih baik dari teknik data mining, penulis melakukan beberapa preprocessing terhadap data yang akan digunakan. preprocessing data merupakan tahap prapemrosesan sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data yang tidak relevan itu juga lebih baik dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. Universitas Sumatera Utara Tabel mahasiswa yang mengundurkan diri yang berisi no sk berhenti, tanggal sk berhenti kuliah, tanggal berhenti, NIM, Nama, keterangan program studi, tahun ajaran, keterangan semester pindah, alasan pindah. Tabel 3.5 Mahasiswa Pindah Tabel biodata mahasiswa terdapat nim, nama mahasiswa, tempat lahir, tanggal lahir, jenis kelamin, jumlah saudara, anak keberapa, agama, kota lahir, kota orangtua, pekerjaan orang tua, pendidikan orang tua, jurusan sekolah, grade usm dll, seperti pada Table 3.6 di bawah ini. Universitas Sumatera Utara Tabel 3.6 Biodata Mahasiswa Tabel sks lulus mahasiswa seperti, NIM, nama, total sks lulus, IPK, total sks tidak lulus, total sks belum lulus, total sks nilai D, total sks nilai E. Tabel 3.7 Sks Lulus Mahasiswa Universitas Sumatera Utara Tabel 3.8 Data Penelitian Predikat IPK Total SKS Lulus Total SKS Tidak Lulus Total SKS Belum Diambil Total Sks nilai D Total Sks nilai E Jumlahsks Diambil Semester Pendidikan Orang tua …… …… ……. ……. ……. ……. ……. ……. ……. ……. Pada Tabel 3.8 data penelitian dibuat field predikat, IPK, total sks lulus, total sks tidak lulus, total sks belum diambil, total sks nilai D, total sks nilai E, Jumlahsks dambil, semester dan pendidikan orang tua. 3.6.2 Preprocessing Data Kuesioner Data survei dalam bentuk kuesioner yang dibagikan kepada mahasiswa terdiri dari beberapa field. Data yang dikumpulkan dapat dilihat pada Tabel 3.9 Tabel 3.9 Data Kuesioner Nim Nama IP Q Q Q Q R Q Q Q Q Q R Q Q Q Q Q Q R 1 2 3 4 E 5 6 7 8 9 D 10 11 12 … … 27 K … … … … … … … … … … … … … … … … … … … … … Data pada Tabel 3.9 di atas dapat dijelaskan bahwa : 1. Q1 sampai dengan Q4 adalah pertanyaan untuk ekonomi orang tua. 2. RE adalah rata-rata ekonomi dari pertanyaan Q1 sampai dengan Q4 3. Q5 sampai dengan Q9 adalah pertanyaan untuk dukungan keluarga. 4. RD adalah rata-rata dukungan keluarga dari pertanyaan Q5 sampai dengan Q9 5. Q10 sampai dengan Q14 adalah pertanyaan untuk fasilitas. 6. RF adalah rata-rata fasilitas dari pertanyaan Q10 sampai dengan Q14 7. Q15 sampai dengan Q19 adalah pertanyaan untuk motivasi 8. RM adalah rata-rata motivasi dari pertanyaan Q15 sampai dengan Q19 9. Q20 sampai dengan Q23 adalah pertanyaan untuk confidence 10. RC adalah rata-rata confidence dari pertanyaan Q15 sampai dengan Q19 11. Q24 sampai dengan Q27 adalah pertanyaan untuk kualitas pelayanan Universitas Sumatera Utara 12. RK adalah rata-rata kualitas pelayanan dari pertanyaan Q24 sampai dengan Q27 Dari keterangan Tabel 3.9 di atas, pengolahan data penelitian dibagi dua, pertama data kuesioner yaitu rata-rata ekonomi, dukungan orang tua, fasilitas, motivasi, confidence, kualitas pelajaran digunakan pada software RapidMiner sedangkan yang kedua, data nilai dari pertanyaan kuesioner digunakan pada software SPSS 18.

3.7 Alat Analisis Data