Pada Tabel 3.4 atribut predikat sebagai label yang merupakan tujuan dari atribut program studi, IPK, total sks lulus, total sks tidak lulus, total sks belum
diambil, total sks nilai D, total sks nilai E, jumlah sks diambil, ekonomi_orang_tua, dukungan orang tua, fasilitas, motivasi, confidence, kualitas pelayanan, semester dan
pendidikan orang tua,
3.5 Validitas dan Reliabilitas Keakuratan Data
Keakuratan instrumen yang digunakan pada penelitian ini adalah penting. Keakuratan mengacu apakah instrumen yang digunakan mengukur secara konsisten setiap waktu
dan populasi Gall et al., 1996. Survei dalam studi ini diuji dalam jangka waktu dan ukuran internal yang
terpercaya yang memiliki keterkaitan antara bagian bagian tes Brown and Alexander, 1991 . Hal ini menjamin apakah pengukuran instrumen secara akurat dimaksudkan
untuk mengukur. Cronbach’s Alpha diberikan survei untuk mengukur konsistensi internal.
Menurut Mitchell dan Jolley 1999, Cronbach’s Alpha pada atau di atas 0.60
diterima sebagai bukti realibilitas internal. Validitas dan Realibilitas dari kuesioner dengan jumlah data sebanyak 1235 item
3.6 Preprocessing Data
3.6.1 Preprocessing Database Akademik
Untuk mendapatkan input yang lebih baik dari teknik data mining, penulis melakukan beberapa preprocessing terhadap data yang akan digunakan. preprocessing
data merupakan tahap prapemrosesan sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan. Pada umumnya data yang diperoleh,
baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya
sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data yang tidak relevan itu juga lebih baik
dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya.
Universitas Sumatera Utara
Tabel mahasiswa yang mengundurkan diri yang berisi no sk berhenti, tanggal sk berhenti kuliah, tanggal berhenti, NIM, Nama, keterangan program studi, tahun
ajaran, keterangan semester pindah, alasan pindah. Tabel 3.5 Mahasiswa Pindah
Tabel biodata mahasiswa terdapat nim, nama mahasiswa, tempat lahir, tanggal lahir, jenis kelamin, jumlah saudara, anak keberapa, agama, kota lahir, kota orangtua,
pekerjaan orang tua, pendidikan orang tua, jurusan sekolah, grade usm dll, seperti pada Table 3.6 di bawah ini.
Universitas Sumatera Utara
Tabel 3.6 Biodata Mahasiswa
Tabel sks lulus mahasiswa seperti, NIM, nama, total sks lulus, IPK, total sks tidak lulus, total sks belum lulus, total sks nilai D, total sks nilai E.
Tabel 3.7 Sks Lulus Mahasiswa
Universitas Sumatera Utara
Tabel 3.8 Data Penelitian
Predikat IPK
Total SKS
Lulus Total
SKS Tidak
Lulus Total
SKS Belum
Diambil Total
Sks nilai D
Total Sks
nilai E Jumlahsks
Diambil Semester Pendidikan
Orang tua ……
…… ……. …….
……. …….
……. …….
……. …….
Pada Tabel 3.8 data penelitian dibuat field predikat, IPK, total sks lulus, total sks tidak lulus, total sks belum diambil, total sks nilai D, total sks nilai E, Jumlahsks
dambil, semester dan pendidikan orang tua.
3.6.2 Preprocessing Data Kuesioner
Data survei dalam bentuk kuesioner yang dibagikan kepada mahasiswa terdiri dari beberapa field. Data yang dikumpulkan dapat dilihat pada Tabel 3.9
Tabel 3.9 Data Kuesioner
Nim Nama
IP Q
Q Q
Q R
Q Q
Q Q
Q R
Q Q
Q Q
Q Q
R 1
2 3
4 E
5 6
7 8
9 D
10 11
12 …
… 27
K …
… …
… …
… … … … … …
… … …
… …
… …
… …
…
Data pada Tabel 3.9 di atas dapat dijelaskan bahwa : 1. Q1 sampai dengan Q4 adalah pertanyaan untuk ekonomi orang tua.
2. RE adalah rata-rata ekonomi dari pertanyaan Q1 sampai dengan Q4 3. Q5 sampai dengan Q9 adalah pertanyaan untuk dukungan
keluarga. 4. RD adalah rata-rata dukungan keluarga dari pertanyaan Q5 sampai
dengan Q9 5. Q10 sampai dengan Q14 adalah pertanyaan untuk fasilitas.
6. RF adalah rata-rata fasilitas dari pertanyaan Q10 sampai dengan Q14
7. Q15 sampai dengan Q19 adalah pertanyaan untuk motivasi 8. RM adalah rata-rata motivasi dari pertanyaan Q15 sampai dengan
Q19 9. Q20 sampai dengan Q23 adalah pertanyaan untuk confidence
10. RC adalah rata-rata confidence dari pertanyaan Q15 sampai dengan Q19
11. Q24 sampai dengan Q27 adalah pertanyaan untuk kualitas pelayanan
Universitas Sumatera Utara
12. RK adalah rata-rata kualitas pelayanan dari pertanyaan Q24 sampai dengan Q27
Dari keterangan Tabel 3.9 di atas, pengolahan data penelitian dibagi dua, pertama data kuesioner yaitu rata-rata ekonomi, dukungan orang tua, fasilitas,
motivasi, confidence, kualitas pelajaran digunakan pada software RapidMiner sedangkan yang kedua, data nilai dari pertanyaan kuesioner digunakan pada software
SPSS 18.
3.7 Alat Analisis Data