Data set kedua dapat dilihat pada Tabel 3.2 Tabel 3.2 Tampilan Data Set Kedua
No Role Name
Type 1
label predikat nominal
2 regular IP
nominal 3
regular ekonomi nominal
4 regular
dukungan orang tua nominal
5 regular fasilitas
belajar nominal 6
regular
semester nominal
Pada Tabel 3.2 atribut predikat sebagai label yang merupakan tujuan dari atribut IP, dukungan orang tua, ekonomi, fasilitas dan semester.
Keterhubungan data antara data set pertama dan data set kedua dapat dilihat pada Tabel 3.3
Tabel 3.3 Tampilan Data Set Pertama dan Kedua
No Role Name
Type
1 label predikat nominal
2 regular IP nominal
3 Regular ratamkb nominal
4 regular ratamkk nominal
5 regular ratampk nominal
6 regular ratambb nominal
7 regular ekonomi nominal
8 regular dukungan orang tua
nominal 9 regular fasilitas
belajar nominal 10 regular
semester nominal
Pada Tabel 3.3 atribut predikat sebagai label yang merupakan tujuan dari atribut IP, ratamkb,ratamkk,ratampk,ratambb, dukungan orang tua, ekonomi, fasilitas dan
semester.
3.5 Validitas dan Reliabilitas Keakuratan Data
Universitas Sumatera Utara
Keakuratan instrumen yang digunakan pada penelitian ini adalah penting. Keakuratan mengacu apakan instrumen yang digunakan mengukur secara
konsisten setiap waktu dan populasi Gall et al., 1996 . Survei dalam studi ini diuji dalam jangka waktu dan ukuran internal yang
terpercaya yang memiliki keterkaitan antara bagian bagian tes Brown and Alexander, 1991 . Hal ini menjamin apakah pengukuran instrumen secara akurat
dimaksudkan untuk mengukur. Cronbach’s Alpha diberikan survei untuk mengukur konsistensi internal.
Menurut Mitchell dan Jolley 1999 , Cronbach’s Alpha pada atau di atas 0.60 diterima sebagai bukti realibilitas internal. Validitas dan Realibilitas dari
kuesioner dengan jumlah data sebanyak 60 item, seperti pada Tabel 3.4 Tabel 3.4 Statistik Reliabilitas Data
No Variabel dalam Skala
Cronbachs alpha Jumlah Data
1 Faktor Ekonomi
.634 60
2 Faktor Dukungan Orang Tua
.635 60
3 Faktor Fasilitas
.629 60
Dari Tabel di atas Cronbachs alpha dari ke tiga variabel berjumlah di atas 0.60 ini menunjukkan bahwa data yang diolah adalah valid dan dipercaya.
3.6 Preprocessing Data
3.6.1 Preprocessing Database Akademik
Untuk mendapatkan input yang lebih baik dari teknik data mining, penulis melakukan beberapa preprocessing untuk data yang akan dikumpulkan. Data
disusun dalam table yang berbeda yang dihubungkan dalam tabel tunggal. Tabel yang digabungkan adalah :
1. tabel
mahasiswa 2.
tabel matakuliah
3. tabel
nilai 4.
tabel IP
Universitas Sumatera Utara
Dari ke 4 tabel di atas, dipilih data yang digunakan untuk data penelitian yang terdiri dari data predikat, IP, ratamkb, ratamkk, ratambb, ratampb dan ratampk ,
semester. Gambar 3.3 adalah sampel data dari tabel yang ada di database.
Gambar 3.3 Pra Pengolahan Data Gambar 3.3 di atas terdiri dari 4 tabel, data yang dipilih dari tabel
mahasiswa adalah nim dan nama, dari tabel matakuliah field yang dipilih sebagai field kunci adalah kdmk dan field nmmk, kemudian dari tabel nilai kode
matakuliah yang berbentuk baris diubah menjadi kolom. Field yang dipilih dari tabel nilai adalah kdmk dan huruf mutu berdasarkan nim dan yang terakhir dari
tabel IP yang dipilih adalah field IP berdasarkan IP. Dari pilihan field ke empat tabel di atas data yang dipilih dapat dilihat pada
Tabel 3.5 Tabel 3.5 Tabel Preprocessing Data Gabungan Empat Tabel
Nim Nama MKB MPK MKK MPB MBB Semester IP
…… …… ……. ……. …….
……. …….
……. …….
Data tabel 3.5 di atas kemudian disederhanakan kembali. Karena nim, nama bersifat primary key maka data tidak digunakan dalam penelitian, sehingga
data yang dipilih dalam penelitian adalah pada Tabel 3.6 dengan menambahkan field predikat berdasarkan IP dimana ketentuannya sebagai berikut :
Universitas Sumatera Utara
No IP Predikat
1 2,00
buruk 2 2,00
- 2,75
memuaskan 3 2,76
- 3.50
sangat memuaskan
4 3.51 - 4,00
dengan pujian
Tabel 3.6 Tabel Data Penelitian
Predikat IP MKB
MPK MKK
MPB MBB
Semester …… …… ……. …….
……. …….
……. …….
3.6.2 Preprocessing Data Kuesioner
Data survei dalam bentuk kuesioner yang dibagikan kepada mahasiswa terdiri dari beberapa field. Data yang dikumpulkan dapat dilihat pada Tabel 3.7
Tabel 3.7 Data Kuesioner
IP Q Q
Q Q
Q R
Q Q
Q Q
Q R
Q Q
Q Q
Q R
Nim Nama 1 2 3 4 5 E 6 7 8 9 10 O 11 12 13 14 15 F
… …
… … … … … … … … … … … … … … … … … … …
Data pada tabel 3.7 di atas dapat dijelaskan bahwa :
1. Q1
sampai dengan Q5 adalah pertanyaan untuk ekonomi orang tua. 2.
RE adalah rata‐rata ekonomi dari pertanyaan Q1 sampai dengan Q5
3. Q6 sampai dengan Q10 adalah pertanyaan untuk dukungan orang
tua. 4.
RO adalah rata‐rata dukungan orang tua dari pertanyaan Q6 sampai
dengan Q10
5. Q11
sampai dengan Q15 adalah pertanyaan untuk fasilitas belajar 6.
RF adalah rata‐rata fasilitas belajar dari pertanyaan Q11 sampai
dengan Q15
Dari keterangan tabel 3.7 di atas, pengolahan data penelitian dibagi dua, yaitu rata-rata ekonomi, dukungan orang tua dan fasilitas belajar digunakan pada
software rapidminer sedangkan nilai dari pertanyaan digunakan pada software SPSS 18.
3.7 Alat Analisis Data
3.7.1 Paket Statistik untuk Ilmu Sosial
SPSS Statistical Package for the Social Sciences dianggap timer alat pengukur waktu tertua di bidang data mining. Ini awalnya dirancang untuk digunakan oleh
Universitas Sumatera Utara
ilmuwan sosial untuk menganalisa data dari survei. SPPS mengizinkan pengguna untuk menarik data dan menampilkan operasi analisis statistik yang rumit, seperti
komputasi regresi dan menampilkan presentasi data grafis. Ini juga menggunakan inferensial yang rumit dan prosedur statistik yang multi variasi, seperti analisis
varians ANOVA, analisis faktor, analisis kluster,dan analisis data katerogikal. SPSS terutama sekali sangat cocok digunakan untuk survei penelitian.
SPPS 18.0 digunakan pada studi ini untuk menampilkan analisis regresi pada data set kedua yang dijelaskan pada Tabel 3.2 Keduanya merupakan langkah
yang bijak dan penuh model regresi yang dijalankan untuk menentukan model yang terbaik yang sesuai dengan data.
3.7.2 Komunitas Rapidminer
Rapidminer dahulu YALE Mierswa et al. 2006 ini adalah permulaan yang bebas dan terbuka untuk KDD dan ML, yang menyediakan beraneka ragam
metode yang mengizinkan bentuk dasar dari aplikasi baru. Rapidminer dahulunya YALE dan propagandanya membuktikan lebih dari 400 operator dari
segala aspek data mining. Operator meta secara otomatis mengoptimalkan desain eksperimen dan pengguna tidak memerlukan waktu yang panjang untuk
menentukan langkah dan parameter yang lebih panjang. Sejumlah besar teknik visualisasi dan kemungkinan untuk meletakkan breakpoints setelah masing
masing operator memberikan pandangan tentang keberhasilan desain anda- bahkan untuk menjalankan percobaan
http:www.rapidminer.com Rapidminer 5.0 digunakan pada studi ini untuk menampilkan kelompok
siswa pada kumpulan data dan memperlihatkan matriks presentasi yang tersebar dari kelompok data.
3.8 Instrument Penelitian
Dalam penelitian ini, penulis melakukan beberapa dataset file dalam bentuk spreadsheet file excel 2003 xls. Transformasi data ini diperlukan sebagai
masukan untuk perangkat lunak yang akan digunakan dalam penelitian ini.
Universitas Sumatera Utara
Dalam pengolahan data transformasi, penulis menggunakan perangkat lunak rapidminer versi 5.0 Instrumen penelitian seperti Gambar 3.4 dapat dijelaskan
bahwa data penelitian berasal dari data kuesioner mahasiswa dan data dari database pendidikan AMIK Tunas Bangsa. Kedua data set ini kemudian diubah
kedalam bentuk file excel .xls dan bersifat nominal. Setelah data dipilih yang berbentuk klasifikasi maka data kemudian dianalisis menggunakan software
rapidminer seperti disajikan pada Gambar 3.4
.
Gambar 3.4 Proses Percobaan
3.9 Diagram Aktifitas Kerja Penelitian
Berikut ini alur kerja yang akan dilakukan pada penelitian ini yang digambarkan dalam diagram aktivitas pada Gambar 3.5
Peneliti Software
Data Set di rubah Menjadi
Type .xls
Pengumpulan Data Dari Database
Pengumpulan Data dari Kuisioner
Transformation datasets RapidMiner
Software
KNOWLEDGE Data Analysis
Universitas Sumatera Utara
Tidak
Sesuai Tidak
Ya
Gambar 3.5 Diagram Aktivitas Kerja Penelitian
3.10 Model Decision Tree