Multi-Granularity Deviation Factor MDEF

3. Tanpa LOF objek yang berada pada cluster yang berbeda dapat dianggap outlier juga.

2.2.2.4 Deviation Based

Metode deviation based tidak menggunakan pengujian statistik ataupun perbandingan jarak untuk mengidentifikasi sebuah outlier. Sebaliknya metode ini mengidentifikasi sebuah outlier dengan memeriksa karakteristik utama dari obyek dalam sebuah kumpulan. Obyek yang memiliki karakteristik diluar karakteristik utama maka akan dianggap sebagai oulier Han Kamber, 2006.

2.3 Algoritma Local Correlation Integral LOCI

2.3.1 Multi-Granularity Deviation Factor MDEF

Multi-granuality deviation factor MDEF, adalah ukuran untuk mengukur outlier-ness suatu objek pada lingkungannya neighborhood Peter Cabens, 1998. Sedangkan  adalah normalisasi standar deviasi dari MDEF. Untuk setiap objek pi, r dan  mendefinisikan Multi-granulality deviation factor MDEF pada radius r sebagai berikut: ��, �, � = ̂ � , �,  − � , � ̂ � , �,  = − � , � ̂ � , , � r-neighborhood untuk object pi selalu mengandung pi. Ini berarti ̂ � , �,  sehingga kuantitas diatas selalu di definisikan. Untuk perhitungan lebih cepat dari MDEF, kadang-kadang harus memperkirakan � , � dan ̂ � , �,  . r-neighborhood adalah neighborhood pada radius r, dimana masing-masing �, � diperkirakan. Sampling neighborhood atau r- neighborhood adalah neighborhood radius r, dimana mengumpulkan sample �, � untuk memperkirakan ̂ � , �,  . Ide pokok deteksi outlier bergantung pada standar deviasi dari jumlah r-neighborhood atas neighborhood dari p i.  � , �, � =  ̂ � , �,  � , �,  Gambar 2.3 Definisi dari n dan n̂ Definisi dari n dan n̂ dipaparkan pada gambar 2.3. Ilustrasi untuk definisi dari n dan n̂ misalnya � , � = , � , � = , � , � = , dan ̂ � , �,  = + + + = . Dimana: 1. � , � merupakan jumlah r-neighbors dari pi. 2. � , � merupakan jumlah r-neighbors dari pi. 3. ̂ � , �,  merupakan rata-rata dari �, � pada r-neighbors dari pi Spiros Papadimitriou, 2003. Setiap objek dapat dikatakan sebagai outlier dengan berdasarkan formula berikut: � , �,  �   � , �, � Tabel 2.1 merupakan tabel yang berisi simbol yang digunakan algoritma Local Correlation Integral untuk mendeteksi outlier. Tabel 2.1 Simbol dan Definisi Simbol Definisi  � Kumpulan Objek P = {p1,….,pi…..pN}. N Jumlah data |P|  N. � , � Jarak antara pi dan pj. � , � Jumlah r-neighbors dari pi. � , � Jumlah r-neighbors dari pi. n̂ � , �, Rata-rata dari �, � pada r-neighbors dari pi, n̂ � , �,  ∑ �, � � � � ,� � , �  n̂ � , �, Standar deviasi dari �, � pada r-neighbors.  n̂ � , �,  √ ∑ �, � − n̂ � , �,  � � � ,� � , � � , �,  Multi-granuality deviation factor untuk pi pada radius r.  � , �, � Standar deviasi multi-granuality deviation factor. �  � , �,  �   � , �, � �  =

2.3.2 Metode Local Correlation Integral LOCI