Teknik Pengolahan Data Tahap – Tahap Penelitian

Setelah menghitung jarak dari setiap instance , tahap selanjutnya adalah mencari k tetangga terdekat, dengan asumsi k = 7. K melambangkan jangkauan suatu instance terhadap tetangganya. Maka, dicari 7 tetangga terdekat dari setiap instance . Gambar 3.4 Tujuh tetangga terdekat dari tiap instance Selanjutnya mencari nilai PCL dari tiap instance . PCL adalah nilai probabilitas class label dari instance T dengan class label dari k tetangga terdekat. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class label yang sama termasuk instance T sendiri dengan nilai k. Misalkan ada 7 tetangga terdekat dari instance T termasuk dirinya dari sebuah dataset dengan class label x dan y, dimana 5 dari tetangga terdekat mempunyai class label x dan sisanya mempunyai class label y. Instance T dengan class label y mempunyai nilai PCL 27. Class label yang digunakan adalah nilaiisi dari atribut STATUS. Tabel 3.2 Hasil perhitungan PCL tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 1 7 1.00 2 7 1.00 3 7 1.00 4 7 1.00 5 7 1.00 6 2 0.29 7 2 0.29 8 3 0.43 9 3 0.43 10 3 0.43 11 5 0.71 12 7 1.00 13 5 0.71 Kemudian meranking list top N dari instance dengan nilai PCL terkecil. Misalkan top N = 5, maka dicari 5 instance dengan nilai PCL terkecil. Ranking top N dapat dilihat pada tabel 3.3. Instance yang di- bold adalah instance dengan nilai PCL terkecil. Selanjutnya mencari nilai DeviationT dan KDistT dari instance pada top N berdasarkan rumus 2.4 dan 3.5. Tabel 3.3 Hasil perhitungan Deviation dan KDist dari tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 1 7 1.00 13.55 0.90 11.31 0.77 2 7 1.00 13.32 0.89 11.17 0.73 3 7 1.00 12.90 0.86 10.38 0.47 4 7 1.00 14.19 0.95 11.60 0.87 5 7 1.00 13.66 0.91 10.97 0.66 6 2

0.29 0.50

0.00 10.53 0.52

7 2

0.29 0.50

0.00 9.81

0.28 8

3 0.43

0.77 0.02

8.96 0.01

9 3

0.43 0.76

0.02 8.93

0.00 10

3 0.43

1.48 0.07

8.95 0.01

11 5 0.71 14.70 0.98 11.35 0.78 12 7 1.00 14.32 0.95 11.74 0.91 13 5 0.71 14.98 1.00 12.01 1.00 Setelah menghitung nilai Deviation dan KDist dari tiap instance pada top N , tahap selanjutnya adalah menghitung COF Class Outlier Factor dari instance pada top N berdasarkan rumus 2.4. Kemudian meranking tiap instance pada list top N berdasarkan nilai COF terkecil. Tabel 3.4 Hasil perhitungan COF dari tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 7 2.00 0.29

0.50 0.00

9.81 0.28

2.28 6 2.00

0.29 0.50

0.00 10.53 0.52

2.52 10 3.00

0.43 1.48

0.07 8.95

0.01 2.94

9 3.00 0.43

0.76 0.02

8.93 0.00

2.98 8 3.00

0.43 0.77

0.02 8.96

0.01 2.99

11 5.00 0.71 14.70 0.98 11.35 0.78 4.80 13 5.00 0.71 14.98 1.00 12.01 1.00 5.00 3 7.00 1.00 12.90 0.86 10.38 0.47 6.61 5 7.00 1.00 13.66 0.91 10.97 0.66 6.75 2 7.00 1.00 13.32 0.89 11.17 0.73 6.84 1 7.00 1.00 13.55 0.90 11.31 0.77 6.87 4 7.00 1.00 14.19 0.95 11.60 0.87 6.92 12 7.00 1.00 14.32 0.95 11.74 0.91 6.96 Dari tabel di 3.4, ditemukan instance yang menjadi outlier yaitu instance nomor 7, 6, 10, 9, dan 8. Dimana nasabah no. 7 dan 6 meminjam dengan jumlah cukup besar dibandingkan dengan tetangga terdekatnya dan menunggak sebanyak 6 kali. Sedangkan nasabah no. 10, 9, dan 8 mempunyai jumlah pinjaman yang terkecil tetapi mempunyai tunggakan sebanyak 4 – 5 kali.

Teknik Pengolahan Data Tahap – Tahap Penelitian

0.29 0.50

0.00 10.53 0.52

0.29 0.50

0.00 9.81

0.28 8

0.77 0.02

8.96 0.01

0.43 0.76

0.02 8.93

0.00 10

1.48 0.07

8.95 0.01

0.50 0.00

9.81 0.28

2.28 6 2.00

0.29 0.50

0.00 10.53 0.52

2.52 10 3.00

0.43 1.48

0.07 8.95

0.01 2.94

0.76 0.02

8.93 0.00

2.98 8 3.00

0.43 0.77

0.02 8.96

0.01 2.99

Parts

Dokumen yang terkait

Deteksi outlier menggunakan Algoritma Local Outlier Probability : studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma.

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor : studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma.

Deteksi outlier pada data campuran numerik dan kategorikal menggunakan algoritma Enhanced Class Outlier Distance Based (ECODB) : studi kasus data kredit BPR XYZ.

Deteksi Outlier menggunakan algoritma Block-Based Nested-Loop : studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma.

Deteksi outlier menggunakan algoritma Block-based Nested Loop (studi kasus: data akademik mahasiswa prodi PS Universitas XYZ).

Deteksi outlier menggunakan algoritma Naive Nested Loop (studi kasus : data akademik mahasiswa program studi PS Universitas XYZ).

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma

Deteksi outlier menggunakan Algoritma Local Outlier Probability studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma

Penerapan metode enhanced class outlier distance based untuk identifikasi outlier pada data hasil ujian nasional, indeks integritas dan akreditasi sekolah menengah atas

Deteksi outlier menggunakan algoritma local outlier factor : studi kasus data akademik mahasiswa TI Universitas Sanata Dharma - USD Repository

Dokumen yang Anda mencari sudah siap untuk unduhkan