Pada penelitian ini peneliti menggunakan data akademik mahasiswa Prodi Teknik Informatika Universitas Sanata Dharma. Data yang digunakan ini
terbagi menjadi data akademik mahasiswa yang mengikuti jalur tes dan jalur prestasi. Beberapa atribut yang digunakan dalam data akademik tersebut dapat
dilihat pada tabel 4.1 di bawah ini.
Tabel 4.1 Tabel Nama Atribut pada Data Akademik Mahasiswa No.
Nama Atribut
Penjelasan Nilai
1. Final
Atribut ini menyimpan nilai final mahasiwa saat seleksi penerimaan mahasiswa baru
– 100 2.
Nil11 Atribut ini menyimpan hasil tes penalaran
mekanik – 10
3. Nil12
Atribut ini menyimpan hasil tes penalaran verbal
– 10 4.
Nil13 Atribut ini menyimpan hasil tes hubungan
ruang – 10
5. Nil14
Atribut ini menyimpan hasil tes Bahasa Inggris – 10
6. Nil15
Atribut ini menyimpan hasil tes kemampuan numerik
– 10 7.
Ips1 Atribut ini menyimpan nilai IPS mahasiswa
semester 1 – 4
8. Ips2
Atribut ini menyimpan nilai IPS mahasiswa semester 2
– 4 9.
Ips3 Atribut ini menyimpan nilai IPS mahasiswa
semester 3 – 4
10. Ips4
Atribut ini menyimpan nilai IPS mahasiswa semester 4
0 - 4
4.2.2 Proses Sistem
Sistem Pendeteksi
Outlier
Menggunakan Algoritma
Block-based Nested- Loop
ini memiliki beberapa tahapan proses. Pertama, pengguna memasukkan data yang akan diolah dalam bentuk file berformat
.xls
atau
.csv
. Pengguna juga dapat memasukkan data dari basis data. Kedua, pengguna dapat melakukan
seleksi atribut serta melihat distribusi atribut. Seleksi atribut digunakan untuk memilih atribut tertentu yang akan dihapus. Distribusi atribut digunakan untuk
melihat variasi nilai dalam setiap atribut berserta jumlahnya dalam bentuk tabel maupun grafik. Tahap kedua ini merupakan tahap pilihan sehingga tidak harus
dikerjakan. Ketiga, pengguna harus memasukkan nilai parameter M dan D sebelum proses deteksi
outlier
dilakukan. Kemudian sistem akan menghitung jumlah blok yang diperlukan berdasarkan jumlah data yang dimasukkan, jumlah
atribut serta kapasitas memori
Java Virtual Machine
JVM yang tidak terpakai. Setelah itu data dikelompokkan ke dalam blok yang telah dibuat. Kemudian,
setiap data akan dihitung jaraknya
Euclidean distance
dengan data lainnya. Dua buah data dianggap sebagai tetangga apabila nilai
Euclidean distance
kurang dari sama dengan nilai parameter D. Saat perhitungan tetangga sebuah data telah
mencapai M+1, maka data tersebut dianggap sebagai bukan
outlier
. Sebaliknya jika hingga pengecekan dengan data terakhir jumlah tetangga sebuah data belum
mencapai M+1 maka data tersebut merupakan
outlier
. Tahapan proses di atas dapat dilihat pada gambar 4.1 di bawah ini.
Gambar 4.1 Proses Umum Sistem Pendeteksi
Outlier
Menggunakan Algoritma
Block-based Nested-Loop
4.2.3 Output Sistem
Keluaran yang diperoleh dari sistem yang dibangun ini terbagi menjadi dua bagian sebagai berikut:
1. Proses input menampilkan :
Data dari basis data
Data tipe .csv Start
Data tipe .xls Proses seleksi
atribut
Proses distribusi atribut
Seleksi atribut?
Distribusi atribut?
Masukkan M dan D
Proses deteksi outlier
Tampilkan outlier
End Ya
Tidak
Ya
Tidak
a. Data yang dipilih dalam bentuk tabel data, jumlah data
b. Daftar nama atribut
2. Proses deteksi
outlier
menampilkan : a.
Outlier
beserta daftar nilai untuk setiap atribut b.
Jumlah data c.
Jumlah
outlier
d. Lama deteksi
outlier
4.3 Perancangan Struktur Data