yang diharapkan. Sebuah obyek data yang normal yang di hasilkan oleh
model statistik Statistical Approach dan data yang tidak mengikuti model tersebut adalah outlier. Keefektivan dari metode
statistik tergantung pada asumsi apakah yang akan di pakai atau di buat untuk metode statistik yang berlaku untuk sejumlah data yang
di berikan. Han dan Kamber, 2006
2.2.1.2 Distance-based Approach Distance-based Outlier
Detection
Distance-based Outlier Detection ini merupakan salah satu
tipe dari Proximity-based Approach yang mana mengasumsikan bahwa proximity dari sebuah outlier pada tetangga terdekatnya
secara signifikan menyimpang dari proximity pada obyek untuk sebagian besar obyek pada data set. Pada Distance-based sebuah
obyek di sebut sebagai outlier jika neighborhoodnya tidak memiliki titik lain yang cukup.
Gagasan dari distance-based outlier detection adalah untuk mengatasi keterbatasan dari metode statistik. Sebuah obyek o pada
sebuah kumpulan data, D adalah Distance-basedDB outlier dengan parameter pct dan dmin yaitu DBpct;dmin-outlier, jika
setidaknya fraksi, pct, dari obyek D terletak pada jarak terbesar pada dmin dari o. Dengan kata lain, daripada mengandalkan uji
statistik, kita bisa memikirkan distance-based outlier sebagai obyek yang tidak cukup memiliki tetangga, dimana tetangga di
definisikan berdasar pada jarak pada obyek yang di berikan. Sebagai perbandingan dengan metode statistik, distance-based
outlier detection menggeneralisasikan ide di balik pengujian
discordancy untuk berbagai distribusi yang standar. Distance-
based outlier detection menghindari perhitungan yang berlebihan
yang berkaitan dengan distribusi yang cocok ke dalam distribusi standar dan dalam memilih tes discordancy. Han dan Kamber,
2006
2.2.1.3 Density-based Local Outlier Approach
Metode Density-based menyelidiki kepadatan dari sebuah obyek dan tetangganya. Sebuah obyek di identifikasi sebagai
outlier jika kepadatannya relativ lebih rendah dari tetangganya.
Asumsi dari metode Density-based adalah bahwa kepadatan di sekeliling obyek yang bukan outlier mirip dengan kepadatan di
sekeliling tetangganya, sedangkan kepadatan di sekeliling obyek outlier adalah signifikan berbeda dari jarak di sekitar tetangganya.
Metode Density-based menggunakan kepadatan relatif dari sebuah obyek terhadap tetangganya untuk menunjukan sejauh
mana sebuah obyek disebut sebagai oulier. Han dan Kamber, 2006
2.2.1.4 Deviation-based Approach