Pengisian Missing Value Normalisasi Data

Gambar 4.4 Contoh formula mencari jarak 3. Menghitung PCL PCLProbability of Class Label adalah nilai probabilitasbanyaknya kemunculan class label yang sama dengan instance T dibandingkan k tetangga terdekatnya. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class label yang sama termasuk instance T sendiri dengan nilai k. Formula menghitung PCL dalam Microsoft Excel adalah sebagai berikut : =cell1k Gambar 4.5 Contoh formula menghitung PCL

4. Meranking List Top N Outlier Dari Instance Dengan Nilai PCLT,K

Terkecil Setelah menghitung nilai PCL, data diranking secara kecil ke besar berdasarkan nilai PCLT,K terkecil sesuai dengan masukan top N. Top N adalah jumlah instances yang dideteksi sebagai outlier yang diurutkan secara kecil ke besar. Misalkan masukan top N = 10, maka akan diranking 10 instance dengan nilai PCLT,K terkecil. Untuk meranking instance , digunakan fitur Sort Filter dalam Microsoft Excel. Gambar 4.6 Contoh meranking kecil ke besar berdasarkan nilai PCLT,K terkecil

5. Menghitung Nilai DeviationT¸ NormDeviationT, KdistT, Dan

NormKdistT Kemudian instance yang berada di top N dihitung nilai DeviationT ¸ NormDeviationT , KdistT , dan NormKdistT berdasarkan rumus 2.1, 2.2, dan 2.3. DeviationT adalah seberapa besar nilai instance T yang menyimpang dari subset DCL. KDist adalah jarak antara instance T pada dataset D dengan K tetangga terdekat, seberapa dekat nilai K instance tetangga terdekat dengan instance T. Sedangkan NormDeviationT adalah nilai deviation yang sudah ternormalisasi dan NormKDistT adalah nilai KDist yang sudah ternormalisasi. Formula menghitung DeviationT¸ NormDeviationT, KdistT , dan NormKdistT dalam Microsoft Excel adalah sebagai berikut : a. Mencari Deviation =cell1+cell2+cell3+...+celln Gambar 4.7 Contoh formula menghitung Deviation b. Mencari NormDeviationT =cell1-mincellmaxcell-mincell Gambar 4.8 Contoh formula menghitung NormDeviationT c. Mencari Kdist = cell1+cell2+cell3+...+celln Gambar 4.9 Contoh formula menghitung Kdist d. Mencari NormKDistT =cell1-mincellmaxcell-mincell