Rumusan Masalah Batasan Masalah Tujuan Penelitian Manfaat Penelitian Metodologi Penelitian

mahasiswa tersebut nilainya diatas batas tuntas maka mahasiswa tersebut dipertahankan dan dapat melanjutkan ke semester V. Dalam penambangan data teknik untuk mengenali outlier dikenal dengan istilah Deteksi Outlier. Sebuah sumber data atau dataset pada umumnya mempunyai nilai-nilai pada setiap obyek yang tidak terlalu berbeda jauh dengan obyek lain. Akan tetapi terkadang pada data tersebut juga ditemukan obyek-obyek yang mempunyai nilai atau sifat atau karakteristik yang berbeda dibandingkan dengan obyek pada umumnya. Deteksi oulier adalah suatu teknik untuk mencari obyek dimana obyek tersebut mempunyai perilaku yang berbeda dibandingkan obyek-obyek pada umumnya. Teknik data mining dapat digunakan untuk mendeteksi adanya suatu outlier pada sebuah dataset. Teknik data mining yang digunakan adalah Clustering-based, Distance-based dan Density-based. Algoritma Local Correlation Integral LOCI merupakan salah satu algoritma yang memiliki kemampuan untuk mendeteksi outlier dalam sekumpulan data. Mendeteksi outlier dilakukan untuk menemukan data yang tidak konsisten dengan data lainnya. Data dianggap tidak konsisten outlier apabila data tersebut tidak memiliki tingkat kemiripan yang sesuai dengan data lainnya Han Kamber, 2006. Algoritma Local Correlation Integral LOCI dapat diimplementasikan pada sekumpulan data numerik untuk mendeteksi adanya outlier dengan pendekatan density-based.

1.2 Rumusan Masalah

Berdasarkan latar belakang diatas, rumusan masalah dari penelitian ini adalah 1. Bagaimana algoritma Local Correlation Integral LOCI dapat mendeteksi outlier dari data nilai akademik mahasiswa?

1.3 Batasan Masalah

Batasan masalah pada penelitian ini adalah: 1. Algoritma yang dipakai adalah algoritma Local Correlation Integral LOCI dengan pendekatan density-based. 2. Data yang digunakan adalah data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma Yogyakarta tahun angkatan 2007- 2008.

1.4 Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk menerapkan algoritma Local Correlation Integral LOCI ke dalam sebuah sistem untuk mendeteksi outlier dari data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma Yogyakarta.

1.5 Manfaat Penelitian

Manfaat dari penelitian ini adalah sebagai berikut: 1. Menambah wawasan tentang Algoritma Local Correlation Integral dalam mendeteksi outlier. 2. Membantu pihak program studi dalam mendeteksi outlier pada data akademik mahasiswa.

1.6 Metodologi Penelitian

Metodologi yang digunakan dalam penelitian ini adalah metode KDD Knowledge Discovery in Database. 1. Pembersihan Data Data Cleaning. Proses membersihkan data yang tidak konsisten atau yang mengganggu. Proses Data Cleanning mencakup antara lain membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data. 2. Penggabungan Data Data Integration Proses menggabungkan data dari berbagai sumber. 3. Seleksi Data Data Selection Proses menyeleksi data yang relevan. Data yang tidak sesuai akan dihilangkan. 4. Transformasi Data Data Transformation Data yang sudah di seleksi selanjutnya di transformasikan ke dalam bentuk yang sesuai untuk ditambang. 5. Penambangan Data Data Mining Proses mengekstrak informasi atau pengetahuan dari data dalam jumlah yang besar. Dalam penelitian ini, metode yang digunakan adalah metode analisis outlier dengan menggunakan pendekatan density based. Algoritma yang digunakan adalah Local Correlation Integral LOCI. 6. Evaluasi Pola Pattern Evaluation Proses mengidentifikasi apakah pola atau informasi yang ditemykan sesuai fakta atau hipotesa yang ada sebelumnya. 7. Presentasi Pengetahuan Knowledge Presentation Proses merepresentasikan pola kepada pengguna ke dalam bentuk yang mudah dimengerti.

1.7 Sistematika Penulisan