ternormalisasi. Formula menghitung DeviationT¸ NormDeviationT, KdistT
, dan NormKdistT dalam Microsoft Excel adalah sebagai berikut :
a. Mencari Deviation =cell1+cell2+cell3+...+celln
Gambar 4.7 Contoh formula menghitung Deviation
b. Mencari NormDeviationT =cell1-mincellmaxcell-mincell
Gambar 4.8 Contoh formula menghitung NormDeviationT
c. Mencari Kdist = cell1+cell2+cell3+...+celln
Gambar 4.9 Contoh formula menghitung Kdist
d. Mencari NormKDistT =cell1-mincellmaxcell-mincell
Gambar 4.10 Contoh formula menghitung NormKDistT
6. Menghitung Nilai COF Class Outlier Factor
Tahap selanjutnya adalah menghitung COF Class Outlier Factor
dari setiap instance yang berada di list top N. COF adalah derajat dari suatu instance T untuk dikategorikan sebagai outlier. COF dihitung
berdasarkan rumus 2.4. Formula menghitung COF dalam Microsoft Excel adalah sebagai berikut :
=kcell1-cell2+cell3
Gambar 4.11 Contoh formula menghitung COF Class Outlier Factor
7. Mengurutkan List Top N Secara Kecil Ke Besar Sesuai Nilai COF
Tahap terakhir adalah mengurutkan list top N secara kecil ke besar sesuai nilai COF. Misalkan masukan top N = 10, maka akan diranking 10
instance dengan nilai COF terkecil. Untuk meranking instance, digunakan
fitur Sort Filter dalam Microsoft Excel.
Gambar 4.12 Contoh meranking kecil ke besar berdasarkan nilai COF terkecil
D. Hasil Deteksi Outlier Berdasarkan Algoritma ECODB Dengan Microsoft
Excel
Hasil deteksi outlier berdasarkan algoritma ECODB menggunakan Microsoft Excel dengan masukan k dan top N yang berubah
– ubah dapat ditampilkan dalam bentuk tabel
– tabel di bawah. Dimana k adalah jumlah tetangga terdekat dari suatu instances, sedangkan top N adalah jumlah
instances yang dideteksi sebagai outlier yang diurutkan secara kecil ke besar
berdasarkan nilai COF Class Outlier Factor. COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier. Outlier adalah data
dengan nilai COF terendah. Class outlier adalah instances yang mempunyai derajat tinggi sebagai outlier. Jumlah class outlier ditentukan berdasarkan
masukan top N, jika top N = 10 maka akan ada 10 instances yang yang mempunyai derajat tinggi sebagai outlier.
Tabel 4.3
Hasil deteksi outlier dengan masukan k dan top N yang berubah – ubah
k Top N
Min COF 7
10 36, 92, 53, 96, 39, 64, 56, 24, 23, 37
20 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69,