4.2.5 Proses Sistem
Setelah data dimasukkan dan dilakukan pemrosesan data. Proses yang terjadi pada sistem deteksi
outlier
adalah : 1.
Pengambilan Data
Pada tahap ini mengambil data sesuai pilihan user, dapat berupa data yang disimpan dalam bentuk file
excel .xls, .csv
atau mengambil data pada tabel dalam
database
dan selanjutnya ditampilkan pada tabel
view
. Setelah itu
user
melakukan seleksi atribut untuk melakukan proses deteksi
outlier
.
2.
Perhitungan Jarak Obyek Data
Setelah menyeleksi atribut dari data yang dimasukkan, selanjutnya melakukan perhitungan jarak antar obyek data
menggunakan rumus
eucliedean distance
. Sehingga diperoleh jarak satu obyek dengan obyek yang lainnya. Perhitungan jarak
memakai iterasi sebanyak jumlah data yang dimasukkan.
3. Pencarian
Outlier
berdasarkan parameter k dan lamda
Pada tahap ini dilakukan proses pencarian
outlier
dengan menggunakan algoritma
local outlier probability
. Sistem menerima input parameter k dan
.
Dimana k adalah jumlah maksimum tetangga yang terdekat dengan obyek. Sedangkan
inputan
adalah untuk
normalization factor
yang memberikan kontrol atas perkiraan kepadatan.
Proses umum yang ada pada sistem pendeteksi
outlier
menggunakan algoritma
Local Outlier Probability
dapat dilihat di lampiran 4 dalam tugas akhir ini.
4.2.6 Output Sistem
Sistem yang dibuat merupakan sistem yang dapat mendeteksi adanya
outlier
dalam suatu data beserta atribut yang dimiliki data tersebut. berikut ini adalah keluaran yang dihasilkan sistem :
1. Proses input akan menampilkan :
a. Sampel data yang akan dideteksi, beserta jumlah data
baris dan jumlah atributnya. b.
Daftar atribut yang akan dipakai untuk proses deteksi. 2.
Proses deteksi
outlier
akan menampilkan : a.
Hasil
outlier
untuk setiap data yang diuji beserta nilai atribut yang dimiliki.
b. Parameter
k
dan yang digunakan dalam perhitungan
algoritma
Local Outlier Probability
. c.
Jumlah data. d.
Jumlah
outlier.
e. Lama deteksi
outlier.
f. Label serta derajat LoOP yang bertujuan untuk memberikan
peringkat
outlier
dari yang nilai LoOP paling tinggi ke nilai LoOP paling rendah.
g. Ranking
outlier.
4.3 Perancangan Sistem