maksimum atribut
A
setelah normalisasi dan
new_min
A
= nilai minimum atribut
A
setelah normalisasi. Penelitian ini menggunakan data berupa nilai tes masuk, nilai final dan
ips. Range data nilai tes masuk dan data nilai final disamakan dengan range data ips. Contoh normalisasi data nilai final adalah sebagai berikut. Diketahui nilai
final awal
v
= 77.10, nilai minimum awal
min
A
= 0, nilai maksimum awal
max
A
= 100, nilai minimum baru
new_min
A
= 0 dan nilai maksimum baru
new_min
A
= 4, maka nilai final setelah normalisasi
v’ =
77.10 −0
100 −0
4 − 0 + 0 = 3.08 Contoh normalisasi data nilai tes masuk adalah sebagai berikut. Diketahui nilai
tes awal
v
= 8.00, nilai minimum awal
min
A
= 0, nilai maksimum awal
max
A
= 10, nilai minimum baru
new_min
A
= 0 dan nilai maksimum baru
new_min
A
= 4, maka nilai tes setelah normalisasi
v’ =
8.00 − 0
10 −0
4 − 0 + 0 = 3.20
3.2.4 Penambangan Data
Data yang telah melalui proses transformasi data selanjutnya dicari
outlier
nya menggunakan algoritma deteksi
outlier
yaitu algoritma
Block-based Nested-Loop
. Data yang diteliti akan dibatasi pada data dua tahun angkatan di Universitas Sanata Dharma yaitu tahun angkatan 2007 dan 2008. Pada tahap ini,
akan ditentukan juga variabel-variabel yang akan digunakan untuk menambang data. Variabel-variabel tersebut antara lain :
1.
Input
, yang terdiri dari : a.
Nilai hasil seleksi penerimaan mahasiswa baru.
Untuk mahasiswa yang mengikuti jalur tes, nilai hasil seleksi yang digunakan berasal dari lima jenis mata tes yaitu nilai penalaran
mekanik, nilai penalaran verbal, nilai hubungan ruang, nilai Bahasa Inggris dan nilai kemampuan numerik serta nilai final.
Untuk mahasiswa yang mengikuti jalur prestasi, nilai hasil seleksi yang digunakan berasal dari nilai final.
b. Nilai Indeks Prestasi Semester IPS pada semester 1 sampai
semester 4. 2.
Output
, yaitu sejumlah data yang masuk ke dalam kelompok
outlier
, jika ada
3.2.5 Evaluasi Pola yang Ditemukan
Pada tahap ini, pengetahuan atau pola berupa
outlier
yang didapat dari proses deteksi
outlier
akan dievaluasi dengan hipotesa yang telah dibentuk sebelumnya. Hipotesa awal mengenai mahasiswa yang masuk ke dalam kategori
outlier
yaitu mahasiswa dengan data akademik khusus atau unik dilihat dari hasil seleksi masuk dan IPS setiap semester. Kesesuaian hasil deteksi
outlier
dengan hipotesa awal menunjukan
output
yang baik dari proses penambangan data yang dilakukan.
3.2.6 Presentasi Pengetahuan
Tahap ini merupakan tahap akhir dari penelitian. Pola khusus yang dihasilkan
outlier
perlu ditampilkan ke dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Oleh sebab itu, pada tahap ini akan dilakukan
pembuatan sistem dengan antarmuka pengguna yang mudah dimengerti oleh pihak universitas.
3.3 Contoh Implementasi Algoritma