Validitas dan Reliabilitas Keakuratan Data Instrument Penelitian

Pada Tabel 3.4 atribut predikat sebagai label yang merupakan tujuan dari atribut program studi, IPK, total sks lulus, total sks tidak lulus, total sks belum diambil, total sks nilai D, total sks nilai E, jumlah sks diambil, ekonomi_orang_tua, dukungan orang tua, fasilitas, motivasi, confidence, kualitas pelayanan, semester dan pendidikan orang tua,

3.5 Validitas dan Reliabilitas Keakuratan Data

Keakuratan instrumen yang digunakan pada penelitian ini adalah penting. Keakuratan mengacu apakah instrumen yang digunakan mengukur secara konsisten setiap waktu dan populasi Gall et al., 1996. Survei dalam studi ini diuji dalam jangka waktu dan ukuran internal yang terpercaya yang memiliki keterkaitan antara bagian bagian tes Brown and Alexander, 1991 . Hal ini menjamin apakah pengukuran instrumen secara akurat dimaksudkan untuk mengukur. Cronbach’s Alpha diberikan survei untuk mengukur konsistensi internal. Menurut Mitchell dan Jolley 1999, Cronbach’s Alpha pada atau di atas 0.60 diterima sebagai bukti realibilitas internal. Validitas dan Realibilitas dari kuesioner dengan jumlah data sebanyak 1235 item

3.6 Preprocessing Data

3.6.1 Preprocessing Database Akademik

Untuk mendapatkan input yang lebih baik dari teknik data mining, penulis melakukan beberapa preprocessing terhadap data yang akan digunakan. preprocessing data merupakan tahap prapemrosesan sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pembersihan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data yang tidak relevan itu juga lebih baik dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. Universitas Sumatera Utara Tabel mahasiswa yang mengundurkan diri yang berisi no sk berhenti, tanggal sk berhenti kuliah, tanggal berhenti, NIM, Nama, keterangan program studi, tahun ajaran, keterangan semester pindah, alasan pindah. Tabel 3.5 Mahasiswa Pindah Tabel biodata mahasiswa terdapat nim, nama mahasiswa, tempat lahir, tanggal lahir, jenis kelamin, jumlah saudara, anak keberapa, agama, kota lahir, kota orangtua, pekerjaan orang tua, pendidikan orang tua, jurusan sekolah, grade usm dll, seperti pada Table 3.6 di bawah ini. Universitas Sumatera Utara Tabel 3.6 Biodata Mahasiswa Tabel sks lulus mahasiswa seperti, NIM, nama, total sks lulus, IPK, total sks tidak lulus, total sks belum lulus, total sks nilai D, total sks nilai E. Tabel 3.7 Sks Lulus Mahasiswa Universitas Sumatera Utara Tabel 3.8 Data Penelitian Predikat IPK Total SKS Lulus Total SKS Tidak Lulus Total SKS Belum Diambil Total Sks nilai D Total Sks nilai E Jumlahsks Diambil Semester Pendidikan Orang tua …… …… ……. ……. ……. ……. ……. ……. ……. ……. Pada Tabel 3.8 data penelitian dibuat field predikat, IPK, total sks lulus, total sks tidak lulus, total sks belum diambil, total sks nilai D, total sks nilai E, Jumlahsks dambil, semester dan pendidikan orang tua. 3.6.2 Preprocessing Data Kuesioner Data survei dalam bentuk kuesioner yang dibagikan kepada mahasiswa terdiri dari beberapa field. Data yang dikumpulkan dapat dilihat pada Tabel 3.9 Tabel 3.9 Data Kuesioner Nim Nama IP Q Q Q Q R Q Q Q Q Q R Q Q Q Q Q Q R 1 2 3 4 E 5 6 7 8 9 D 10 11 12 … … 27 K … … … … … … … … … … … … … … … … … … … … … Data pada Tabel 3.9 di atas dapat dijelaskan bahwa : 1. Q1 sampai dengan Q4 adalah pertanyaan untuk ekonomi orang tua. 2. RE adalah rata-rata ekonomi dari pertanyaan Q1 sampai dengan Q4 3. Q5 sampai dengan Q9 adalah pertanyaan untuk dukungan keluarga. 4. RD adalah rata-rata dukungan keluarga dari pertanyaan Q5 sampai dengan Q9 5. Q10 sampai dengan Q14 adalah pertanyaan untuk fasilitas. 6. RF adalah rata-rata fasilitas dari pertanyaan Q10 sampai dengan Q14 7. Q15 sampai dengan Q19 adalah pertanyaan untuk motivasi 8. RM adalah rata-rata motivasi dari pertanyaan Q15 sampai dengan Q19 9. Q20 sampai dengan Q23 adalah pertanyaan untuk confidence 10. RC adalah rata-rata confidence dari pertanyaan Q15 sampai dengan Q19 11. Q24 sampai dengan Q27 adalah pertanyaan untuk kualitas pelayanan Universitas Sumatera Utara 12. RK adalah rata-rata kualitas pelayanan dari pertanyaan Q24 sampai dengan Q27 Dari keterangan Tabel 3.9 di atas, pengolahan data penelitian dibagi dua, pertama data kuesioner yaitu rata-rata ekonomi, dukungan orang tua, fasilitas, motivasi, confidence, kualitas pelajaran digunakan pada software RapidMiner sedangkan yang kedua, data nilai dari pertanyaan kuesioner digunakan pada software SPSS 18.

3.7 Alat Analisis Data

3.7.1 Paket Statistik Untuk Ilmu Sosial

SPSS Statistical Package for the Social Sciences dianggap timer alat pengukur waktu tertua di bidang data mining. Ini awalnya dirancang untuk digunakan oleh ilmuwan sosial untuk menganalisa data dari survei. SPPS mengijinkan pengguna untuk menarik data dan menampilkan operasi analisis statistik yang rumit, seperti komputasi regresi dan menampilkan presentasi data grafis. Ini juga menggunakan inferensial yang rumit dan prosedur statistik yang multi variasi, seperti analisis varians ANOVA, analisis faktor, analisis kluster, dan analisis data katerogikal. SPSS terutama sekali sangat cocok digunakan untuk survei penelitian. SPPS 18.0 digunakan pada studi ini untuk menampilkan analisis regresi pada data set kedua yang dijelaskan pada Tabel 3.3 Keduanya merupakan langkah yang bijak dan penuh model regresi yang dijalankan untuk menentukan model yang terbaik yang sesuai dengan data.

3.7.2 Komunitas RapidMiner

RapidMiner dahulu YALE Mierswa et al. 2006 ini adalah permulaan yang bebas dan terbuka untuk KDD dan ML, yang menyediakan beraneka ragam metode yang mengizinkan bentuk dasar dari aplikasi baru. RapidMiner dahulunya YALE dan propagandanya membuktikan lebih dari 400 operator dari segala aspek data mining. Operator meta secara otomatis mengoptimalkan desain eksperimen dan pengguna tidak memerlukan waktu yang panjang untuk menentukan langkah dan parameter yang lebih panjang. Sejumlah besar teknik visualisasi dan kemungkinan untuk meletakkan breakpoints setelah masing masing operator memberikan Universitas Sumatera Utara pandangan tentang keberhasilan desain anda- bahkan untuk menjalankan percobaan http:www.rapidminer.com RapidMiner 5.0 digunakan pada studi ini untuk repository proses, data dan penanganan meta data, transformasi data, pemodelan data dan metode visualisasi data.

3.8 Instrument Penelitian

Instrumen penelitian seperti Gambar 3.1 dapat dijelaskan bahwa data penelitian berasal dari data mahasiswa yang mengundurkan diri, data kuesioner mahasiswa, data akademik dan biodata mahasiswa yang diambil dari database SIPT STMIK Mikroskil. Tahapan atau rangkaian proses data mining dapat dibagi menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif. Terdapat 6 tahapan pada data mining yaitu: Data kuesioner http: surveymonkey.com skuesioner Database SIPT STMIK MIKROSKIL Cleaning dan Integration Datawarehouse Seleksi dan transformasi data Penambangan Data Analisis Data dan evaluasi pola model yang diperoleh Knowledge model mahasiswa pindah Gambar 3.1 Proses Percobaan Universitas Sumatera Utara 1. Memberishkan data data cleaning Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik.Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki.Data yang tidak relevan itu juga lebih baik dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya 2. Integrasi data data integration Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. Tidak jarang data yang diperlukan untuk data mining tidak hanya berasal dari satu database tetapi juga berasal dari beberapa database atau file teks. Integrasi data dilakukan pada atribut- aribut yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jawaban kuesioner dan lainnya. Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang dan bahkan menyesatkan pengambilan aksi nantinya. Sebagai contoh bila integrasi data berdasarkan jenis produk ternyata menggabungkan produk dari kategori yang berbeda maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada. 3. Seleksi Data Data Selection Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. 4. Transformasi data Data Transformation Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Ddata berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini sering disebut transformasi data. 5. Penambangan data Universitas Sumatera Utara Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. 6. Evaluasi pola model aturan yang diperoleh Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model aturan rule dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining, mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat.

3.9 Diagram Aktifitas Kerja Penelitian