sebuah sistem yang sesuai Barker Yacef, 2009. Salah satu metode dalam Data Mining untuk mengenali data yang bersifat
unik di sebut Deteksi Outlier. Teknik Deteksi Outlier di kategorikan menjadi beberapa
kelompok, yaitu
Statistical Approaches,
Proximity-based Approaches, Clustering-based Approaches,
dan Classification Approaches. Dan salah satu algoritma yang ada adalah algoritma Connectivity-based
Outlier Factor COF . Algoritma COF ini merupakan algoritma dengan
pendekatan Density Based. Algoritma COF digunakan untuk mendeteksi outlier
segera setelah outlier tersebut muncul dalam database. COF dapat menangani outlier atau pola yang menyimpang dari low density pattern. Ide
utama dari algoritma COF adalah untuk menentukan setiap record data yang dapat setingkat atau sederajat untuk menjadi outlier atau data yang
menyimpang dari suatu pola yang umum. Dengan demikian, dapat disimpulkan bahwa mahasiswa tersebut memiliki
pola yang menyimpang dari pola atau di kenal sebagai outlier. Data mahasiswa yang termasuk outlier ini dapat di gunakan oleh Kaprodi untuk
lebih memperhatikan mahasiswa tersebut agar prestasinya bisa naik.
1.2 Rumusan Masalah
Rumusan masalah dari penelitian ini adalah : 1.2.1 Bagaimana algoritma Connectivity-based Outlier Factor dapat mendeteksi
outlier dari data nilai akademik mahasiswa Teknik Informatika Universitas
Sanata Dharma?
1.2.2 Mahasiswa manakah yang memiliki data nilai akademik yang unik atau
menyimpang dari pola umum berdasarkan indeks prestasi semester?
1.3 Batasan Masalah
Batasan masalah dari penelitian ini adalah : 1.3.1 Algoritma deteksi outlier yang di gunakan adalah algoritma Connectivity-
based Outlier Factor COF menggunakan pendekatan Density Based.
1.3.2 Data yang di gunakan adalah data akademik mahasiswa TI Universitas Sanata Dharma angkatan 2007-2008 yang berupa hasil test penerimaan
mahasiswa baru, nilai final dan nilai Indeks Prestasi Semester IPS dari
semester satu sampai semester empat. 1.3.3 Hasil penelitian ini berupa kelompok mahasiswa outlier, jika ditemukan.
1.4 Tujuan
Tujuan dari penelitian ini adalah : 1.4.1 Melakukan deteksi outlier pada data akademik Mahasiswa Teknik
Informatika Universitas Sanata Dharma dengan menerapkan algoritma Connectivity-based Outlier Factor.
1.4.2 Menganalisis hasil deteksi outlier pada data akademik yang di hasilkan oleh algoritma Connectivity-based Outlier Factor.
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah : 1.5.1 Memberikan analisis sejauh mana algoritma Connectivity-based Outlier
Factor dapat mendeteksi sebuah outlier serta keunggulan algoritma ini
dalam mendeteksi outlier. 1.5.2 Membantu Kaprodi TI Universitas Sanata Dharma dalam mendeteksi
kejadian langka atau yang menyimpang dari pola umum data akademik mahasiswa.
1.6 Metodologi Penelitian
Metode yang di gunakan dalam penelitian ini adalah Knowledge Discovery in Database
KDD, yaitu proses yang dibantu oleh komputer untuk menggali dan menganalisis sejumlah besar himpunan data dan mengekstrak informasi
dan pengetahuan yang berguna. Langkah-langkah KDD menurut Jiawei Han adalah sebagai berikut :
1.6.1 Pembersihan Data Data Cleaning Untuk menghilangkan noise dan data yang tidak konsisten.
1.6.2 Integrasi Data Data Integration Menggabungkan data dari berbagai sumber data yang berbeda.
1.6.3 Pemilihan Data Data Selection Mengambil data yang relevan dengan tugas analisis yang di ambil dari
database. 1.6.4 Transformasi Data Data Transformation
Mentransformasi atau menggabungkan data ke dalam bentuk yang sesuai untuk penggalian lewat operasi summary atau aggregation.
1.6.5 Penambangan Data Data Mining Proses penting dimana metode cerdas di aplikasikan untuk mengekstrak
suatu pola data. 1.6.6 Evaluasi Pola Pola Evaluation
Mengidentifikasi pola yang menarik dan merepresentasikan pengetahuan berdasarkan interestingness measures.
1.6.7 Presentasi Pengetahuan Knowledge Presentation Penyajian pengetahuan yang di gali kepada pengguna dengan
menggunakan visualisasi dan teknik representasi pengetahuan.
1.7 Sistematika Penulisan