Metode Local Correlation Integral LOCI

2.3.2 Metode Local Correlation Integral LOCI

Penelitian ini menggunakan algoritma Local Correlation Integral LOCI, ide utama dari LOCI adalah menandai objek sebagai outlier jika di kepadatan lokal local density antara neighboors cukup besar. Untuk mendeteksi bahwa relative deviasi dari average local neighborhood density diperoleh. Penyimpangan ini disebut multi- granularity-deviation factor MDEF. Algoritma LOCI dalam mendeteksi outlier menghitung nilai MDEF dan nilai MDEF untuk semua objek. Kemudian LOCI akan menandai suatu objek sebagai outlier jika nilai nilai MDEF lebih besar tiga kali lipat dari nilai MDEF untuk radius yang sama Peter Cabens, 1998. Algoritma ini diusulkan dalam Spiros Papadimitriou, 2003. Algoritma LOCI tidak mempunyai parameter penting seperti k. Objek yang dinyatakan sebagai outlier adalah objek yang memiliki nilai MDEF mendekati 1. Tujuannya adalah untuk ditandai sebagai outlier jika rasio diantara MDEF dan MDEF melebihi konstanta yang diusulkan menjadi 3 Amer, 2011 Langkah –langkah untuk menemukan outlier dideskripsikan sebagai berikut:

1. Menentukan jarak antar objek.

Untuk menentukan jarak antar objek menggunakan rumus euclidean distance. √∑ � − � ̂ =

2. Menghitung jumlah r-neighbors dari p

i . Jumlah tetangga yang jaraknya kurang dari sama dengan r.

3. Menghitung jumlah r-neighbors dari p

i . Jumlah tetangga yang jaraknya kurang dari sama dengan r.

4. Menghitung rata-rata dari np, r pada r-neighbors dari p

i . n̂ � , �,  ∑ �, � � � � ,� � , �

5. Menghitung standar deviasi dari np, r pada r-neighbors.

 n̂ � , �,  √ ∑ �, � − n̂ � , �,  � � � ,� � , �

6. Menghitung Multy-granuality deviation factor untuk p

i pada radius r. ��, �, � = ̂ � , �,  − � , � ̂ � , �,  = − � , � ̂ � , , �

7. Menghitung standar deviasi Multy-granuality deviation factor.

 � , �, � =  ̂ � , �,  � , �, 

8. Menghitung LOCI.

� , �,  �   � , �, � Outlier memiliki nilai MDEF mendekati 1. Tujuannya adalah sebagai outlier jika rasio antara MDEF dan MDEF melebihi konstanta yang diusulkan dalam publikasi asli menjadi 3. Berikut adalah implementasi dari algoritma Local Correlation Integral: Pre-processing Foreach p i   Perform a range-search For Ni = {p   | dp i , p ≤ r max } From N i , construct a sorted list D i Of the critical and -critical distances of p i Post-processing Foreach p i  : For each radius r  D i ascending: Update np i , r and n̂p i , r,  From n and n̂, compute MDEFp i , r, α and MDEFp i , r, α If MDEFp i , r, α 3MDEFp i , r, α flag p i

2.4 Contoh Jalannya Algoritma