sebelumnya. Melalui sistem pendeteksi outlier akan diperoleh luaran berupa data-data outlier menggunakan algoritma Naïve Nested Loop
dan dianalisa kembali oleh pemilik data itu apakah hipotesa outlier yang mereka miliki sama atau tidak dengan hasil yang diperoleh
sistem, sehingga dapat diketahui seperti apa tingkat keberhasilan pencarian outlier tersebut.
6. Presentasi Pengetahuan Knowledge Presentation
Pada tahap ini pola yang telah didapat selanjutnya direpresentasikan kepada pengguna ke dalam bentuk sistem pendeteksi
dengan antarmuka yang lebih mudah untuk dipahami. Melalui sistem pendeteksi outlier ini diharapkan pengguna dalam hal ini pihak
internal Universitas Sanata Dharma dapat mencari tahu data-data yang bersifat langka dan berbeda dari kebanyakan data lainnya untuk
selanjutnya dianalisa mengapa data-data tersebut bisa muncul. Tidak bisa dipungkiri bahwa outlier sendiri akan didefinisikan dan dianalisa
oleh orang yang ahli dan mengerti tentang data itu.
3.3 Contoh Implementasi Deteksi Outlier dengan Algoritma Index Based
Setelah melalui proses pengumpulan dan pengolahan data, pada tahap ini akan dilakukan perhitungan menggunakan algoritma Naïve Nested Loop
kemudian melihat hasil outlier pada sekumpulan data mahasiswa tersebut. Tahap-tahap perhitungan menggunakan algoritma Naïve Nested Loop
adalah sebagai berikut ini :
1. Pencarian outlier akan dilakukan pada sekumpulan data mahasiswa
yang masuk melalui jalur tes tertulis. Dalam hal ini adalah data akademik mahasiswa program studi teknik informatika tahun angkatan
2007. Atribut yang akan digunakan terdiri dari ips1, ips2, ips3, ips4, nil11, nil12, nil13, nil14, nil15. Sehingga akan dilihat kaitan nilai tes
masuk dengan nilai indeks prestasi dari semester satu sampai 4 dan akan dicari mahasiswa dengan pola apa saja yang akan masuk sebagai
outlier .
Gambar 3.4 Data Akademik Mahasiswa
2. Menghitung jarak antar objek data mahasiswa, dalam kasus ini terdapat
13 mahasiswa sehingga akan dicari jarak satu objek terhadap dua belas objek lainnya dengan rumus euclidean distance.
Sehingga diperoleh jarak satu objek dengan objek yang lainnya dan perhitungan jarak memakai iterasi sebanyak tiga belas kali. Atribut yang
dimasukkan ke dalam perhitungan jarak ini adalah atribut nil11, nil12, nil13, nil14, nil15, ips1, ips2, ips3, dan ips4. Nilai tes masuk dikaitankan
dengan nilai indeks prestasi masing-masing semester sehingga perhitungan jarak dengan atribut ips1 dilakukan pada perhitungan semester 1, sampai
atribut ips4 pada perhitungan semester 4.
Gambar 3.5 Perhitungan jarak antar objek dengan rumus euclidean distance
3. Selanjutnya menentukan nilai dmin dan nilai M. Di mana dmin adalah
radius atau jarak maksimum ketetanggaan antar objek o. Sedangkan M merupakan jumlah maksimum tetangga objek dalam radius dmin.
Dalam kasus ini nilai dmin adalah 2 dan M adalah 4. Satu per satu objek mahasiswa akan dicari jumlah tetangganya dalam radius dmin
jika jarak kedua objek tersebut ≤ 2 dan jumlah tetangganya sudah ditemukan sebanyak M+1, maka objek tersebut adalah bukan outlier
dan pencarian tetangga dihentikan. Sebaliknya, jika tidak lebih dari M objek dalam kumpulan data ditemukan dalam ketetanggaan dmin ,
maka objek tersebut adalah outlier. Lalu, pencarian dilakukan ke objek
mahasiswa selanjutnya. Dalam simulasi ini dilakukan perhitungan jumlah tetangga hingga objek terakhir untuk memastikan jumlah total
tetangga pada masing-masing objek mahasiswa. Pada iterasi 1 dilakukan pengecekan jarak pada data mahasiswa
pertama terhadap keduabelas data mahasiswa lainnya. Dan diperoleh jumlah tetangga dalam radius dmin sebanyak 2 tetangga karena jumlah
tetangga mahasiswa pertama lebih dari M, yaitu 9 maka dapat disimpulkan mahasiswa pertama bukan outlier. Perhitungan serupa
dilakukan hingga data ke-13 dan berakhir pada iterasi 13 berlaku untuk perhitungan jarak menggunakan atribut ips1, ips2, ips3, dan ips4.
Gambar 3.6 Pencarian jumlah tetangga dalam radius D dan penentuan outlier
4. Setelah diketahui semua jumlah tetangga masing-masing objek dalam
perhitungan dari semester satu hingga semester empat, dapat diperoleh kumpulan data yang masuk ke ke dalam outlier seperti yang ada pada
gambar di bawah ini :
Gambar 3.7 Hasil Pencarian Outlier
Dari perhitungan yang telah dilakukan dapat diketahui data yang masuk ke dalam outlier dari perhitungan pada semester 1 adalah mahasiswa dengan
nomor urut 2, 8, dan 10. Untuk perhitungan pada semester 2 yang termasuk outlier adalah mahasiswa dengan nomor urut 2,8, dan 10. Untuk
perhitungan pada semester 3 yang termasuk outlier adalah mahasiswa dengan nomor urut 2,5,8, dan 10. Dan untuk perhitungan pada semester 4
diperoleh outlier mahasiswa dengan nomor urut 2,8, dan 10.
37
BAB IV ANALISIS DAN PERANCANGAN SISTEM