Data yang Digunakan Praproses Data

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Analisis sistem yang akan dibangun meliputi data yang digunakan, praproses data, pemrosesan data, dan analisis komponen sistem. Penyelesaian berupa pencarian association rules berdasarkan association rules mining menggunakan algoritma FP- Growth. Pada tahap perancangan sistem dibahas perancangan Data Flow Diagram DFD, perancangan alur kerja sistem flowchart, dan perancangan antarmuka pemakai user interface. Proses analisis dapat dilihat pada Gambar 3.1. Praproses Data Penentuan Atribut Pemrosesan Data Pencocokan Saran Data Mining Pengelompokan Atribut Analisis Frequent Itemset menggunakan algoritma FP-Growth Pembentukan Association Rules Gambar 3.1. Proses analisis association rules

3.1 Data yang Digunakan

Data diambil dari Univeritas Sumatera Utara bagian acara akademik biro akademik sebanyak 14.884 data. Data berupa data mahasiswa yang telah lulus dari periode III tahun ajaran 20092010 sampai periode II tahun ajaran 20132014 meliputi data diri dan data akademik. Setelah data terkumpul, dilakukan analisa data yang sesuai dengan kebutuhan sistem, yaitu melakukan pencarian association rules dimana sistem menghasilkan rules dengan keterhubungan yang tinggi antar atribut dan paling sering muncul, maka dari itu dibutuhkan beberapa atribut dari data diri mahasiswa dan data akademik dari data lulusan mahasiswa. Pada awal masuk perkuliahan, mahasiswa mengisi data diri seperti nama, tempat dan tanggal lahir, asal sekolah, fakultas maupun program studi yang dimasukinya, dan lainnya. Pada masa perkuliahan mahasiswa mendapatkan nilai pada setiap semester dan akan diakumulasi menjadi IPK Indeks Prestasi Akademik yang disimpan kedalam data akademik. Mahasiswa yang telah lulus akan tersimpan pada data lulusan mahasiswa dengan menginformasikan berapa lama masa studi mahasiswa tersebut. Dari data lulusan mahasiswa, terdapat beberapa atribut yang merupakan faktor lama masa studi seorang mahasiswa, sehingga akhir pada sistem ini juga dapat memberikan bahan prediksi masa studi bagi mahasiswa. Jumlah data Lulusan Mahasiswa Universitas Sumatera Utara sebanyak 14.884 data yang terdiri dari beberapa fakultas dan jumlah yang berbeda pada setiap fakultasnya. Jumlah mahasiswa per fakultas dapat dilihat pada Tabel 3.1. Tabel 3.1. Jumlah lulusan mahasiswa per fakultas Fakultas Jumlah Lulusan Mahasiswa Kedokteran 1143 Kedokteran Gigi 627 Farmasi 262 Kesehatan Masyarakat 657 Keperawatan 254 Matematika dan Ilmu Pengetahuan Alam 818 Ilmu Komputer dan Teknologi Informasi 508 Teknik 1949 Psikologi 402 Pertanian 2292 Hukum 1281 Ilmu Budaya 1041 Ekonomi 2064 Ilmu Sosial dan Politik 1585

3.2. Praproses Data

Tahap praproses data merupakan tahap seleksi data yang bertujuan untuk mendapatkan data yang hanya digunakan dalam penelitian dengan membuang beberapa record yang tidak akan dianalisis dikarenakan tidak dapat menjadi faktor dari lama studi seorang mahasiswa. Pada data lulusan mahasiswa, terdapat beberapa record seperti nim, no alumni, nama, jenis kelamin, tempat-tanggal-lahir, agama, kota, kode pos, asal sekolah, jenis sekolah, fakultas, program studi, jalur masuk, ipk, lama studi, dan periode wisuda. Record yang tidak dianalisis adalah nim, no alumni, nama, jenis kelamin, tempat-tanggal lahir, agama, kota, kode pos, asal sekolah, program studi, dan periode wisuda. Sedangkan record yang akan dianalisis adalah jenis sekolah, fakultas, jalur masuk, ipk, dan lama studi. Tahapan selanjutnya yang dikerjakan adalah melakukan perubahan terhadap beberapa tipe data pada atribut dataset dengan tujuan untuk mempermudah pemahaman terhadap isi record. 3.2.1 Penentuan atribut Beberapa atribut yang digunakan untuk pembentukan rules adalah sebagai berikut: 1. Jenis Sekolah Sebagai tempat mendapatkan pengajaran sebelumnya sebelum masuk perguruan tinggi bagi setiap mahasiswa. Terdapat beragamnya jenis sekolah dari mahasiswa yang masuk perguruan tinggi seperti sekolah negeri maupun swasta, dan sekolah dalam maupun luar kota. 2. Jalur Masuk Sebagai jalur penyeleksian masuk perguruan tinggi yang memiliki beberapa tahapan, dimana calon mahasiswa yang berhak masuk pada tahap pertama adalah calon mahasiswa yang memiliki nilai tinggi. 3. IPK Indeks Prestasi Kumulatif, sebagai akumulasi nilai yang didapat oleh mahasiswa dari setiap semesternya. Berikut pengelompokan prestasi keberhasilan berdasarkan buku panduan mahasiswa Universitas Sumatera Utara yang dapat dilihat pada Tabel 3.2. Tabel 3.2. Pengelompokan prestasi keberhasilan Nilai Prestasi Bobot Prestasi Golongan Prestasi A 4.00 Sangat Baik B+ 3.50 Baik B 3.00 Baik C+ 2.50 Cukup C 2.00 Cukup D 1.00 Kurang E 0.00 Gagal Beragam prestasi yang dicapai setiap mahasiswa yaitu pada setiap mata kuliah yang diambil maupun setelah prestasi diakumulasi, berikut jumlah mahasiswa yang diambil secara acak ±20 dari jumlah keseluruhan data lulusan mahasiswa berdasarkan pengelompokan prestasi pada Tabel 3.3. Tabel 3.3. Jumlah lulusan mahasiswa berdasarkan prestasi Nilai Prestasi Bobot Prestasi Golongan Prestasi Jumlah Mahasiswa A 4.00 Sangat Baik 6 B+ 3.50 Baik 1012 B 3.00 Baik 1060 C+ 2.50 Cukup 920 C 2.00 Cukup 85 D 1.00 Kurang 4 E 0.00 Gagal Berdasarkan data pada Tabel 3.3. dapat dilihat kelompok prestasi dengan jumlah mahasiswa yang tinggi yaitu B+, B, dan C+ dengan nilai 3.50, 3.00, dan 2.50. 4. Lama Studi Waktu yang ditempuh oleh setiap mahasiswa sampai akhir masa perkuliahannya. Waktu standart seorang mahasiswa lulus dari perguruan tinggi adalah empat tahun, akan tetapi banyak mahasiswa yang menyelesaikan studinya lebih dari empat tahun, dan tidak sedikit pula mahasiswa yang menyelesaikan studinya kurang dari empat tahun. 3.2.2. Pengelompokan atribut Terdapat beberapa kelompok item pada setiap atribut seperti berikut: 1. Jenis Sekolah a. SMAMA Negeri Dalam Medan b. SMAMA Negeri Luar Medan c. SMAMA Swasta Dalam Medan d. SMAMA Swasta Luar Medan e. SMTA Lain-lain semua sekolah selain empat diatas 2. Jalur Masuk a. PMP b. SNMPTN c. SPMPRM d. UMB 3. IPK a. IPK 3.00 b. IPK = 3.00-3.49 c. IPK 3.49 4. Lama Studi a. 4 Tahun b. 4 Tahun c. 4 Tahun

3.3. Pemrosesan Data