Cross Validation TINJAUAN PUSTAKA

3.2 Analisis Sistem 3.2.1 Analisis Data Awal Data pendaftaran calon mahasiswa yang diperoleh dari BAPSI terdiri dari empat data file dengan eksistensi .xml. Jumlah record dari keseluruhan data tersebut adalah 8589, dengan atribut-atribut yang dimiliki seperti pada table 3.1 berikut : Tabel 3.1 Data Awal Nama atribut Keterangan Nilai atribut Nama_Gelombang Kategori gelombang saat calon mahasiswa melakukan pendaftaran Gelombang_1 Gelombang_2 Gelombang_3 Pilihan_1 Jurusan pertama atau program studi yang dipilih mahasiswa saat melakukan pendaftaran Semua program studi di Universitas Sanata Dharma Pilihan_2 Jurusan pertama atau program studi yang dipilih mahasiswa saat melakukan pendaftaran Semua program studi di Universitas Sanata Dharma Pilihan_3 Jurusan pertama atau program studi yang dipilih mahasiswa saat melakukan pendaftaran Semua program studi di Universitas Sanata Dharma Jenis_Kelamin Jenis Kelamin calon mahasiswa Laki-laki Perempuan KabAsal Kabupaten tempat calon mahasiswa berasal Kabupaten Asal Indonesia KabSek Kabupaten tempat calon sekola mahasiswa berasal Kabupaten Asal Indonesia Jenis_SMU Jurusan yang dipilih oleh calon mahasiswa pada waktu SMASMKSederajat IPA IPS SMF SMEA STM BUDAYA SPG_SGO Diterima_Di Program studi tempat calon mahasiswa diterima Semua program studi di Universitas Sanata Dharma Penalaran_Verbal Hasil test penalaran verbal mahasiswa 1-4 Penalaran_Numerik Hasil test penalaran mekanik mahasiswa 1-4 Penalaran_Mekanik Hasil test penalaran mekanik 1-4 mahasiswa Penalaran_Ruang Hasil test penalaran ruang mahasiswa 1-4 NilaiBahasa_Inggris Hasil test kemampuan bahasa Inggris mahasiswa 1-4

3.2.2 Pemrosesan Awal

Sebelum data digunakan untuk proses penambangan data, data mentah yang diperoleh harus melewati pemrosesan awal terlebih dahulu. Langkah- langkah yang digunakan dalam pemrosesan awal sesuai dengan empat tahapan awal dalam Knowledge discovery in databases KDD yaitu pembersihan data, integrasi data, seleksi data dan transpormasi data.

3.2.2.1 Pembersihan Data Data Cleaning

Pembersihan data Data Cleaning merupakan tahap awal dalam proses KDD. Pada data mentah terdapat beberapa record yang tidak relevan. Dalam proses pembersihan data ini data-data yang tidak relevan tersebut dibuang. Atribut-atribut lain yang dilakukan cleaning antara lain Pilihan_1, Pilihan_2 dan Pilihan_3, kabupaten sekolah, kabupaten asal. Untuk atribut Pilihan_2, jika ada kolom atribut Pilihan_2 kosong, maka akan diisikan dengan nilai “Kosong”. Demikian juga dengan Pilihan_3, jika ditemukan kolom dari atribut Pilihan_3 yang kosong, maka akan diisikan dengan nilai Kosong. Untuk kabupaten asal dan kabupaten sekolah juga diisikan dengan nila i “kosong” apabila ditemukan field yang kosong.

3.2.2.2 Integrasi Data Data Integration

Pada tahap integrasi ini, dilakukan penggabungan data dari berbagai sumber menjadi sebuah tabel yang utuh. Data pendahtaran calon mahasiswa yang terdiri dari empat file dengan eksistensi xml , yang telah melewati tahap pembersihan data, digabungkan menjadi satu tabel dengan satu file dengan ekstensi xls dan csv.

Dokumen yang terkait

Implementasi algoritma reduct based decision tree untuk mengenali pola klasifikasi mahasiswa yang terkena sisip program.

0 1 229

Pencarian karakteristik calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang dengan menggunakan algoritma pohon.

0 0 125

MANAJEMEN WAKTU MAHASISWA TERHADAP KURIK

0 1 17

Pencarian karakteristik calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang dengan menggunakan algoritma pohon - USD Repository

0 0 123

Klasifikasi Data Penerimaan Mahasiswa Baru dan Prestasi akademik mahasiswa Jurusan Teknik Informatika Universitas Sanata Dharma dengan menggunakan algoritma naive bayesian - USD Repository

0 1 145

Pencarian pola klasifikasi mahasiswa yang tidak memenuhi sisip program berdasarkan nilai tes masuk penerimaan mahasiswa baru dan latar belakang mahasiswa Universitas Sanata Dharma dengan menggunakan algoritma C4.5 - USD Repository

0 0 175

Prediksi calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang menggunakan algoritma Naive Bayessian - USD Repository

0 0 119

Pengenalan pola klasifikasi status registrasi calon mahasiswa baru Universitas Sanata Dharma dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository

0 1 151

Pencarian pola klasifikasi karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository

0 0 231

Implementasi algoritma reduct based decision tree untuk mengenali pola klasifikasi mahasiswa yang terkena sisip program - USD Repository

0 0 227