Menormalisasi Data Mencari Jarak Dari Tiap Data Dengan Menggunakan Fungsi Jarak Mixed Euclidian Distance

ternormalisasi. Formula menghitung DeviationT¸ NormDeviationT, KdistT , dan NormKdistT dalam Microsoft Excel adalah sebagai berikut : a. Mencari Deviation =cell1+cell2+cell3+...+celln Gambar 4.7 Contoh formula menghitung Deviation b. Mencari NormDeviationT =cell1-mincellmaxcell-mincell Gambar 4.8 Contoh formula menghitung NormDeviationT c. Mencari Kdist = cell1+cell2+cell3+...+celln Gambar 4.9 Contoh formula menghitung Kdist d. Mencari NormKDistT =cell1-mincellmaxcell-mincell Gambar 4.10 Contoh formula menghitung NormKDistT

6. Menghitung Nilai COF Class Outlier Factor

Tahap selanjutnya adalah menghitung COF Class Outlier Factor dari setiap instance yang berada di list top N. COF adalah derajat dari suatu instance T untuk dikategorikan sebagai outlier. COF dihitung berdasarkan rumus 2.4. Formula menghitung COF dalam Microsoft Excel adalah sebagai berikut : =kcell1-cell2+cell3 Gambar 4.11 Contoh formula menghitung COF Class Outlier Factor

7. Mengurutkan List Top N Secara Kecil Ke Besar Sesuai Nilai COF

Tahap terakhir adalah mengurutkan list top N secara kecil ke besar sesuai nilai COF. Misalkan masukan top N = 10, maka akan diranking 10 instance dengan nilai COF terkecil. Untuk meranking instance, digunakan fitur Sort Filter dalam Microsoft Excel. Gambar 4.12 Contoh meranking kecil ke besar berdasarkan nilai COF terkecil

D. Hasil Deteksi Outlier Berdasarkan Algoritma ECODB Dengan Microsoft

Excel Hasil deteksi outlier berdasarkan algoritma ECODB menggunakan Microsoft Excel dengan masukan k dan top N yang berubah – ubah dapat ditampilkan dalam bentuk tabel – tabel di bawah. Dimana k adalah jumlah tetangga terdekat dari suatu instances, sedangkan top N adalah jumlah instances yang dideteksi sebagai outlier yang diurutkan secara kecil ke besar berdasarkan nilai COF Class Outlier Factor. COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier. Outlier adalah data dengan nilai COF terendah. Class outlier adalah instances yang mempunyai derajat tinggi sebagai outlier. Jumlah class outlier ditentukan berdasarkan masukan top N, jika top N = 10 maka akan ada 10 instances yang yang mempunyai derajat tinggi sebagai outlier. Tabel 4.3 Hasil deteksi outlier dengan masukan k dan top N yang berubah – ubah k Top N Min COF 7 10 36, 92, 53, 96, 39, 64, 56, 24, 23, 37 20 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69,