Pencarian Association Rules Pada Data Lulusan Mahasiswa Perguruan Tinggi Menggunakan Algoritma FP-Growth

BAB 1 PENDAHULUAN

1.1. Latar Belakang

  

Association rules mining merupakan teknik data mining untuk menentukan hubungan

  diantara data atau bagaimana suatu kelompok data mempengaruhi suatu kelompok data lain (Ruldeviyani & Fahrian 2008). Dengan kata lain, dapat dicarinya keterhubungan antar data maupun antar kategori pada data skala besar.

  Data dengan skala besar biasanya sering terdapat pada perusahaan maupun instansi-instansi pendidikan seperti perguruan tinggi. Dari beberapa data yang ada pada suatu perguruan tinggi salah satunya adalah data lulusan mahasiswa. Pada data lulusan mahasiswa terdapat berbagai macam atribut yang ada pada data diri mahasiswa yang dikumpulkan pada masa registrasi awal masuk perguruan tinggi dan data akademik yang dikumpulkan pada masa perkuliahan hingga akhir perkuliahan. Data diri mahasiswa yang dikumpulkan pada masa registrasi awal meliputi data pribadi, data asal sekolah, data keluarga, dan data masuk program studi. Data akademik yang dikumpulkan adalah data nilai mahasiswa pada setiap semesternya dengan nama lain sebagai indeks prestasi (IP) yang nantinya akan diakumulasi menjadi indeks prestasi kumulatif (IPK).

  Dari data mahasiswa yang ada, terdapat beberapa atribut yang dapat menjadi faktor lamanya masa studi seorang mahasiswa seperti jenis sekolah, jalur masuk, fakultas, dan IPK. Jenis sekolah sebagai tempat mahasiswa itu mendapat pengajaran sebelumnya, jalur masuk sebagai suatu penyeleksian untuk masuk perguruan tinggi, fakultas sebagai pilihan konsentrasi mahasiswa yang memungkinkan mengakibatkan

  Setiap tahunnya perguruan tinggi meluluskan mahasiswa dari berbagai fakultas. Mahasiswa yang telah lulus dan mendapat gelar sarjana dari perguruan tinggi berasal dari jalur masuk dan asal pendidikan yang berbeda-beda pada awalnya, serta memiliki IPK dan lama masa studi yang berbeda-beda pula. Pencapaian gelar sarjana membutuhkan waktu normal selama empat tahun, akan tetapi dalam praktiknya banyak mahasiswa yang tidak selalu dapat menuntaskan studinya selama waktu normal yang ditentukan.

  Beragamnya atribut seperti jenis sekolah, jalur masuk, IPK, dan masa studi membuat pihak perguruan tinggi sulit mencari dan mengetahui kombinasi atribut mana yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada data lulusan mahasiswa. Maka dari itu, dibutuhkan suatu pendekatan untuk mendapatkan kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut dengan melakukan association rules mining pada data lulusan mahasiswa.

  

Association rules mining dapat menghasilkan kombinasi atribut yang memiliki

  keterhubungan tinggi antar atribut dalam bentuk rules dengan melakukan pencarian kombinasi atribut yang sering muncul terlebih dahulu.

  Terdapat beberapa penelitian pada data mahasiswa yang telah dilakukan, yaitu mengetahui keterhubungan data mahasiswa untuk meningkatkan indeks prestasi menggunakan algoritma C 4.5 (Hartama, 2011), dan pengelompokan mahasiswa potensial drop out menggunakan metode clustering (Guchi, 2013). Untuk penelitian pada kasus yang sama yang telah dilakukan yaitu : mengetahui hubungan proses masuk dengan tingkat kelulusan mahasiswa menggunakan algoritma Apriori

  (Ma’ruf, 2013) yang menghasilkan informasi tentang keberhasilan proses masuk mahasiswa itu berasal dari mana untuk menjadi acuan dalam memaksimalkan iklan pada daerah tertentu, pada penelitiannya memiliki kekurangan dari segi algoritma dan data, algoritma yang digunakan adalah algoritma apriori yang melakukan candidate

  

generate dari setiap item sehingga memerlukan banyak perulangan pencarian ke dengan algoritma regresi linier berganda (Siregar, 2011) yang menghasilkan sebanyak 61% keterhubungan antara data mahasiswa terhadap masa studi, pada penilitian ini memiliki kekurangan pada data yang masih sedikit, berdasarkan kedua penelitian sebelumnya penulis akan menganalisis data lulusan mahasiswa dengan mengambil algoritma lain pada teknik association rules mining yaitu algoritma FP-Growth sebagai algoritma yang akan digunakan pada penelitian penulis, dan menggunakan data yang lebih banyak dari penelitian sebelumnya.

  Algoritma Frequent Pattern-Growth (FP-Growth) merupakan salah satu algoritma yang dapat digunakan pada teknik association rules mining untuk menentukan himpunan item yang paling sering muncul (frequent itemset) dalam sekumpulan data (Hutasoit, 2010). Algoritma ini hanya melakukan dua kali proses

  

scanning database untuk menentukan frequent itemset dalam bentuk FP-Tree.

  Algoritma FP-Growth telah digunakan pada data mining seperti pencarian

  

association rules terhadap barang sebuah butik (Hutasoit, 2010), dan penentuan

kelayakan sertifikasi guru berdasarkan keterkaitan NUPTIK (Ramdanie, et al. 2013).

  Pada penelitian ini, penulis akan menganalisis data lulusan mahasiswa suatu perguruan tinggi yang didalamnya terdapat atribut jenis sekolah, jalur masuk, fakultas,

  IPK, dan masa studi menggunakan algoritma FP-Growth. Hasil yang didapat nantinya berupa rules yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada data lulusan mahasiswa perguruan tinggi.

1.2. Rumusan Masalah

  Beragamnya atribut pada data lulusan mahasiswa seperti jenis sekolah, jalur masuk, fakultas, IPK, dan masa studi membuat pihak perguruan tinggi sulit mencari dan mengetahui rules yang berisikan kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut. Oleh karena itu, dibutuhkan suatu pendekatan

1.3. Batasan Masalah Pada penelitian ini, penulis memberi batasan sebagai berikut.

  1. Hanya meneliti lulusan mahasiswa S1 reguler dari suatu perguruan tinggi.

  2. Parameter yang digunakan adalah jenis sekolah, jalur masuk, IPK, dan lama studi.

  3. Jalur masuk yang digunakan adalah PMP, UMB, SNMPTN, dan SPMPRM

  1.4. Tujuan Penelitian

  Tujuan dari penelitian ini adalah mendapatkan association rules atau gabungan dari kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada data lulusan mahasiswa perguruan tinggi menggunakan algoritma FP-Growth.

  1.5. Manfaat Penelitian Manfaat dari penelitian ini adalah sebagai berikut.

  1. Mendapatkan informasi tentang bagaimana lulusan mahasiswa yang sering muncul dan memiliki keterhubungan antar atribut yang tinggi berdasarkan rules yang didapat.

  2. Rules yang dihasilkan dapat digunakan sebagai bahan dasar untuk memprediksi masa studi mahasiswa, sehingga dapat membantu pihak perguruan tinggi maupun fakultas untuk dapat memberikan arahan kepada mahasiswa yang memiliki kemiripan atribut terhadap salah satu rules untuk meningkatkan pembelajaran sehingga dapat meningkatkan tingkat kelulusan.

3. Menjadi bahan rujukan pada peneliti selanjutnya dalam bidang association rules mining dan penggalian pada data kemahasiswaan.

1.6. Metodologi

  Terdapat beberapa tahapan dalam penelitian ini untuk menghasilkan suatu sistem yang sesuai dengan yang diharapkan.

  1. Studi Literatur Kegiatan mempelajari dokumentasi literatur dan teori yang berkaitan dengan penelitian. Dalam tahap ini merupakan proses pengumpulan referensi, baik buku, jurnal, tesis, makalah dan sumber-sumber lain termasuk yang diperoleh dari internet sebagai sumber data dan informasi yang berkaitan dengan data mining, association rules mining, algoritma FP-Growth, dan data lulusan mahasiswa perguruan tinggi di Sumatera Utara

  2. Analisis Permasalahan Pada tahap ini dilakukan analisis terhadap data yang telah dikumpulkan sebelumnya untuk mendapatkan pemahaman mengenai teknik association rules

  mining dan algoritma FP-Growth yang akan digunakan dalam membangun sistem data mining .

  3. Perancangan Pada tahap ini dilakukan perancangan perangkat lunak yang dibangun, seperti perancangan proses dan antarmuka.

  4. Implementasi Pada tahap ini dilakukannya pembangunan program dengan pengkodean perangkat lunak sesuai dengan alur yang ditentukan.

  5. Pengujian Pada tahap ini dilakukannya pengujian terhadap perangkat lunak yang dibangun, dan bagaimana keakuratan dari sistem yang dibuat.

  6. Penyusunan Laporan Pada tahap ini dilakukannya penulisan dokumentasi dan laporan mengenai

1.7. Sistematika Penulisan Sistematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut.

  BAB 1 : PENDAHULUAN Bab ini berisi latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan. BAB 2 : LANDASAN TEORI Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas

  pada penelitian ini. Pada bab ini dijelaskan data mining secara umum, association rules mining , dan algoritma FP-Growth.

  BAB 3 : ANALISIS DAN PERANCANGAN Bab ini membahas tentang perancangan sistem seperti data flow, dan perancangan sistem untuk melakukan pencarian association rules. BAB 4 : IMPLEMENTASI DAN PENGUJIAN Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan

  perangkat lunak yang disusun pada Bab 3 dan pengujian terhadap sistem yang dibangun.

  BAB 5 : KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dari keseluruhan uraian bab-bab sebelumnya dan saran- saran yang diajukan untuk pengembangan selanjutnya.