Pada penelitian ini peneliti menggunakan data akademik mahasiswa Prodi Teknik Informatika Universitas Sanata Dharma. Data yang digunakan ini
terbagi menjadi data akademik mahasiswa yang mengikuti jalur tes dan jalur prestasi. Beberapa atribut yang digunakan dalam data akademik tersebut dapat
dilihat pada tabel 4.1 di bawah ini.
Tabel 4.1 Tabel Nama Atribut pada Data Akademik Mahasiswa No.
Nama Atribut
Penjelasan Nilai
1. Final
Atribut ini menyimpan nilai final mahasiwa saat seleksi penerimaan mahasiswa baru
– 100 2.
Nil11 Atribut ini menyimpan hasil tes penalaran
mekanik – 10
3. Nil12
Atribut ini menyimpan hasil tes penalaran verbal
– 10 4.
Nil13 Atribut ini menyimpan hasil tes hubungan
ruang – 10
5. Nil14
Atribut ini menyimpan hasil tes Bahasa Inggris – 10
6. Nil15
Atribut ini menyimpan hasil tes kemampuan numerik
– 10 7.
Ips1 Atribut ini menyimpan nilai IPS mahasiswa
semester 1 – 4
8. Ips2
Atribut ini menyimpan nilai IPS mahasiswa semester 2
– 4 9.
Ips3 Atribut ini menyimpan nilai IPS mahasiswa
semester 3 – 4
10. Ips4
Atribut ini menyimpan nilai IPS mahasiswa semester 4
0 - 4
4.2.2 Proses Sistem
Sistem Pendeteksi Outlier Menggunakan Algoritma Block-based Nested- Loop
ini memiliki beberapa tahapan proses. Pertama, pengguna memasukkan data yang akan diolah dalam bentuk file berformat .xls atau .csv. Pengguna juga
dapat memasukkan data dari basis data. Kedua, pengguna dapat melakukan
seleksi atribut serta melihat distribusi atribut. Seleksi atribut digunakan untuk memilih atribut tertentu yang akan dihapus. Distribusi atribut digunakan untuk
melihat variasi nilai dalam setiap atribut berserta jumlahnya dalam bentuk tabel maupun grafik. Tahap kedua ini merupakan tahap pilihan sehingga tidak harus
dikerjakan. Ketiga, pengguna harus memasukkan nilai parameter M dan D sebelum proses deteksi outlier dilakukan. Kemudian sistem akan menghitung
jumlah blok yang diperlukan berdasarkan jumlah data yang dimasukkan, jumlah atribut serta kapasitas memori Java Virtual Machine JVM yang tidak terpakai.
Setelah itu data dikelompokkan ke dalam blok yang telah dibuat. Kemudian, setiap data akan dihitung jaraknya Euclidean distance dengan data lainnya. Dua
buah data dianggap sebagai tetangga apabila nilai Euclidean distance kurang dari sama dengan nilai parameter D. Saat perhitungan tetangga sebuah data telah
mencapai M+1, maka data tersebut dianggap sebagai bukan outlier. Sebaliknya jika hingga pengecekan dengan data terakhir jumlah tetangga sebuah data belum
mencapai M+1 maka data tersebut merupakan outlier. Tahapan proses di atas dapat dilihat pada gambar 4.1 di bawah ini.
Gambar 4.1 Proses Umum Sistem Pendeteksi Outlier Menggunakan Algoritma Block-based Nested-Loop
4.2.3 Output Sistem
Keluaran yang diperoleh dari sistem yang dibangun ini terbagi menjadi dua bagian sebagai berikut:
1. Proses input menampilkan :
Data dari basis data
Data tipe .csv Start
Data tipe .xls Proses seleksi
atribut
Proses distribusi atribut
Seleksi atribut?
Distribusi atribut?
Masukkan M dan D
Proses deteksi outlier
Tampilkan outlier
End Ya
Tidak
Ya
Tidak
a. Data yang dipilih dalam bentuk tabel data, jumlah data
b. Daftar nama atribut
2. Proses deteksi outlier menampilkan :
a. Outlier
beserta daftar nilai untuk setiap atribut b.
Jumlah data c.
Jumlah outlier d.
Lama deteksi outlier
4.3 Perancangan Struktur Data