mahasiswa tersebut nilainya diatas batas tuntas maka mahasiswa tersebut dipertahankan dan dapat melanjutkan ke semester V.
Dalam penambangan data teknik untuk mengenali
outlier
dikenal dengan istilah Deteksi
Outlier
. Sebuah sumber data atau dataset pada umumnya mempunyai nilai-nilai pada setiap obyek yang tidak terlalu berbeda
jauh dengan obyek lain. Akan tetapi terkadang pada data tersebut juga ditemukan obyek-obyek yang mempunyai nilai atau sifat atau karakteristik
yang berbeda dibandingkan dengan obyek pada umumnya. Deteksi
oulier
adalah suatu teknik untuk mencari obyek dimana obyek tersebut mempunyai perilaku yang berbeda dibandingkan obyek-obyek pada
umumnya. Teknik data mining dapat digunakan untuk mendeteksi adanya suatu
outlier
pada sebuah dataset. Teknik data mining yang digunakan adalah
Clustering-based
,
Distance-based
dan
Density-based
. Algoritma
Local Correlation Integral LOCI
merupakan salah satu algoritma yang memiliki kemampuan untuk mendeteksi
outlier
dalam sekumpulan data. Mendeteksi
outlier
dilakukan untuk menemukan data yang tidak konsisten dengan data lainnya. Data dianggap tidak konsisten
outlier
apabila data tersebut tidak memiliki tingkat kemiripan yang sesuai dengan data lainnya Han Kamber, 2006. Algoritma
Local Correlation Integral LOCI
dapat diimplementasikan pada sekumpulan data numerik untuk mendeteksi adanya
outlier
dengan pendekatan
density-based
.
1.2 Rumusan Masalah
Berdasarkan latar belakang diatas, rumusan masalah dari penelitian ini adalah
1. Bagaimana algoritma
Local Correlation Integral LOCI
dapat mendeteksi
outlier
dari data nilai akademik mahasiswa?
1.3 Batasan Masalah
Batasan masalah pada penelitian ini adalah: 1.
Algoritma yang dipakai adalah algoritma
Local Correlation Integral LOCI
dengan pendekatan
density-based
. 2.
Data yang digunakan adalah data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma Yogyakarta tahun angkatan 2007-
2008.
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk menerapkan algoritma
Local Correlation Integral LOCI
ke dalam sebuah sistem untuk mendeteksi
outlier
dari data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma Yogyakarta.
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah sebagai berikut: 1.
Menambah wawasan tentang Algoritma
Local Correlation Integral
dalam mendeteksi
outlier
. 2.
Membantu pihak program studi dalam mendeteksi
outlier
pada data akademik mahasiswa.
1.6 Metodologi Penelitian
Metodologi yang digunakan dalam penelitian ini adalah metode KDD
Knowledge Discovery in Database
. 1.
Pembersihan Data
Data Cleaning
. Proses membersihkan data yang tidak konsisten atau yang mengganggu.
Proses Data Cleanning mencakup antara lain membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada
data. 2.
Penggabungan Data
Data Integration
Proses menggabungkan data dari berbagai sumber.
3. Seleksi Data
Data Selection
Proses menyeleksi data yang relevan. Data yang tidak sesuai akan dihilangkan.
4. Transformasi Data
Data Transformation
Data yang sudah di seleksi selanjutnya di transformasikan ke dalam bentuk yang sesuai untuk ditambang.
5. Penambangan Data
Data Mining
Proses mengekstrak informasi atau pengetahuan dari data dalam jumlah yang besar. Dalam penelitian ini, metode yang digunakan adalah metode
analisis
outlier
dengan menggunakan pendekatan
density based
. Algoritma yang digunakan adalah
Local Correlation Integral LOCI
. 6.
Evaluasi Pola
Pattern Evaluation
Proses mengidentifikasi apakah pola atau informasi yang ditemykan sesuai fakta atau hipotesa yang ada sebelumnya.
7. Presentasi Pengetahuan
Knowledge Presentation
Proses merepresentasikan pola kepada pengguna ke dalam bentuk yang mudah dimengerti.
1.7 Sistematika Penulisan