Identifikasi Sistem Pembersihan Data

40

BAB III PERANCANGAN SISTEM

A. Identifikasi Sistem

Setiap pergantian tahun akademik baru, Universitas Sanata Dharma selalu melakukan Penerimaan Mahasiswa Baru PMB. Calon mahasiswa baru ini harus melakukan serangkaian tes tertulis terlebih dahulu. Setiap tahun pula program studi menyediakan kuota untuk mahasiswa baru yang diterima. Calon mahasiswa yang diterima belum tentu melakukan daftar ulang, untuk itulah Ketua Program Studi Kaprodi harus benar-benar selektif dalam memilih mahasiswa mana yang pasti melakukan daftar ulang, sehingga kuota yang ditetapkan dapat terisi relatif tepat. Masalah tersebut dapat diatasi dengan menggunakan metode penambangan data, karena penambangan data ini dapat digunakan untuk mengenali karakteristik mahasiswa yang tidak melakukan daftar ulang. Data-data mahasiswa diambil dari data calon mahasiswa baru mulai dari angkatan tahun 2005 sampai dengan 2006. Data ini mencakup seluruh program studi yang ada di Universitas Sanata Dharma yang diperoleh dari Biro Administrasi dan Perencanaan Sistem Informasi BAPSI Universitas Sanata Dharma Yogyakarta. Seluruh data yang diambil berisi informasi tentang gelombang masuk, prioritas pilihan program studi di mana calon mahasiswa tersebut diterima, jenis kelamin, jenis sma, program studi tempat calon mahasiswa diterima dan status daftar ulang yang dilakukan serta nilai PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI finalnya. Data yang didapat akan dibagi dua secara acak, kemudian digunakan sebagai himpunan data pelatihan dan himpunan data tes dengan proporsi yang bervariasi.

B. Pembersihan Data

Data calon penerimaan mahasiswa baru yang didapat dari BAPSI, dibersihkan terlebih dahulu sebelum data tersebut ditambang. Proses pembersihan data ini berfungsi untuk menghilangkan data yang tidak konsisten dan derau seperti data tidak relevan, data yang salah ketik maupun data kosong yang tidak diperlukan. Data yang tidak konsisten ini dapat berupa jenis SMA yang mempunyai arti sama, tapi penulisannya berbeda-beda. Misalnya IPA ada yang menuliskan SMA IPA ataupun IPA, jadi dalam proses ini dilakukan penyeragaman nama terhadap data yang tidak konsisten.

C. Integrasi Data

Dokumen yang terkait

Pengenalan pola klasifikasi status registrasi calon mahasiswa baru Universitas Sanata Dharma dengan algoritma Reduct Based Decision Tree (RDT).

1 5 153

Mahasiswa Baru Sedang Mendaftar.

0 0 1

Sistem Penjadwalan Dinamis Mahasiswa Baru Menggunakan Algoritma Genetika (Studi Kasus: Registrasi Ulang Mahasiswa Baru Universitas Sumatera Utara)

0 0 11

MANAJEMEN WAKTU MAHASISWA TERHADAP KURIK

0 1 17

Pencarian karakteristik calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang dengan menggunakan algoritma pohon - USD Repository

0 0 123

Analisis faktor-faktor yang mempengaruhi keputusan peminat untuk memilih Universitas Sanata Dharma Yogyakarta dan bukan universitas Katolik yang lain : studi kasus pada calon mahasiswa baru angkatan 2008 Universitas Sanata Dharma Yogyakarta - USD Reposito

0 0 134

Klasifikasi Data Penerimaan Mahasiswa Baru dan Prestasi akademik mahasiswa Jurusan Teknik Informatika Universitas Sanata Dharma dengan menggunakan algoritma naive bayesian - USD Repository

0 1 145

Pencarian pola klasifikasi mahasiswa yang tidak memenuhi sisip program berdasarkan nilai tes masuk penerimaan mahasiswa baru dan latar belakang mahasiswa Universitas Sanata Dharma dengan menggunakan algoritma C4.5 - USD Repository

0 0 175

Prediksi calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang menggunakan algoritma Naive Bayessian - USD Repository

0 0 119

Pengenalan pola klasifikasi status registrasi calon mahasiswa baru Universitas Sanata Dharma dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository

0 1 151