1
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah
Di era globalisasi pendidikan merupakan salah satu kebutuhan manusia sehingga tidak dapat dipisahkan dari kehidupan sehari-hari. Penelitian dalam
bidang pendidikan menggunakan teknik penambangan data yang telah banyak dilakukan saat ini. Penambangan data dalam bidang pendidikan berguna
untuk mengembangkan sebuah metode untuk menemukan keunikan dari sebuah data yang berasal dari sistem pendidikan tersebut, dan menggunakan
metode tersebut untuk lebih memahami mahasiswa, sehingga dapat dibuat sistem yang sesuai.
Deteksi
outlier
merupakan salah satu bidang penelitian yang penting dalam mendeteksi perilaku yang tidak normal seperti deteksi nilai mahasiswa
yang nilai tes masuk universitasnya bagus tetapi pada saat kuliah mahasiswa tersebut mendapat nilai yang rendah bahkan di keluarkan. Bermacam-macam
metode telah dikembangkan baik berdasarkan teknik seperti
distance-based
,
clustering-based
, dan
density-based
. Universitas merupakan sebuah lembaga yang dirancang untuk
pengajaran mahasiswa dibawah pengawasan dosen. Universitas Sanata Dharma merupakan sebuah lembaga pendidikan yang memiliki banyak data.
Nilai akademik mahasiswa merupakan salah satu dari data yang di miliki Universitas Sanata Dharma. Nilai tersebut meliputi nilai tes masuk PMB dan
nilai pada setiap semester. Untuk dapat menjadi mahasiswa Universitas Sanata Dharma, seorang calon mahasiswa harus mengikuti tes masuk. Dengan
nilai tes masuk tersebut seseorang akan ditentukan apakah dapat menjadi mahasiswa atau tidak.
Setiap semester IV akan dilakukan evaluasi sisip program. Mahasiswa yang nilainya tidak mencapai batas tuntas akan di keluarkan DO, tetapi jika
mahasiswa tersebut nilainya diatas batas tuntas maka mahasiswa tersebut dipertahankan dan dapat melanjutkan ke semester V.
Dalam penambangan data teknik untuk mengenali
outlier
dikenal dengan istilah Deteksi
Outlier
. Sebuah sumber data atau dataset pada umumnya mempunyai nilai-nilai pada setiap obyek yang tidak terlalu berbeda
jauh dengan obyek lain. Akan tetapi terkadang pada data tersebut juga ditemukan obyek-obyek yang mempunyai nilai atau sifat atau karakteristik
yang berbeda dibandingkan dengan obyek pada umumnya. Deteksi
oulier
adalah suatu teknik untuk mencari obyek dimana obyek tersebut mempunyai perilaku yang berbeda dibandingkan obyek-obyek pada
umumnya. Teknik data mining dapat digunakan untuk mendeteksi adanya suatu
outlier
pada sebuah dataset. Teknik data mining yang digunakan adalah
Clustering-based
,
Distance-based
dan
Density-based
. Algoritma
Local Correlation Integral LOCI
merupakan salah satu algoritma yang memiliki kemampuan untuk mendeteksi
outlier
dalam sekumpulan data. Mendeteksi
outlier
dilakukan untuk menemukan data yang tidak konsisten dengan data lainnya. Data dianggap tidak konsisten
outlier
apabila data tersebut tidak memiliki tingkat kemiripan yang sesuai dengan data lainnya Han Kamber, 2006. Algoritma
Local Correlation Integral LOCI
dapat diimplementasikan pada sekumpulan data numerik untuk mendeteksi adanya
outlier
dengan pendekatan
density-based
.
1.2 Rumusan Masalah