Sumber Data Hasil Deteksi

Atribut ini berisi keterangan berapa kali debitur menunggak mengangsur bunga. Atribut ini bertipe numerik. k. TUNG_POKOK Atribut ini berisi jumlah total kredit yang ditunggak oleh debitur. Atribut ini bertipe numerik. l. TUNG_BUNGA Atribut ini berisi jumlah total bunga yang ditunggak oleh debitur. Atribut ini bertipe numerik. m. GAJIPENDAPATAN Atribut ini berisi jumlah gaji atau pendapatan debitur tiap bulan. Atribut ini bertipe numerik. n. JML_TANGGUNGAN Atribut ini berisi jumlah anggota keluarga yang ditanggung oleh debitur. Atribut ini bertipe numerik. o. UANG_DIBAWA Atribut ini berisi jumlah nominal uang yang dibawa pulangdiperoleh debitur setiap bulannya. Atribut ini bertipe numerik. p. STATUS_PINJAMAN Atribut ini berisi keterangan apakah debitur saat mengajukan kredit telah melakukan peminjaman kredit di bank lain atau tidak. Atribut ini bertipe kategorikal. q. JML_SETORANBULAN Atribut ini berisi besar jumlah setoran yang harus diangsur debitur di bank lain setiap bulannya jika debitur saat mengajukan kredit telah melakukan peminjaman kredit di bank lain. Atribut ini bertipe numerik. r. POKOK_BLN Atribut ini berisi jumlah kredit yang harus diangsur debitur setiap bulan. Atribut ini bertipe numerik. s. BUNGA_BLN Atribut ini berisi jumlah bunga yang harus diangsur debitur setiap bulan. Atribut ini bertipe numerik. t. KOLBI1 Atribut ini adalah atribut yang digunakan untuk menyatakan status kredit debitur. Dimana nilai 1 berarti debitur mengangsur dengan baik lancar, 2 berarti debitur sedikit tersendat dalam mengangsur kurang lancar, 3 berarti debitur cukup tersendat dalam mengangsur kredit diragukan, dan 4 berarti debitur berhenti mengangsur macet. Atribut ini merupakan class label pada data debitur tersebut. Gambar 4.1 Atribut pada data debitur setelah tahap seleksi data 2. Pengisian Missing Value Di dalam data set debitur yang telah mengalami seleksi atribut terdapat missing value pada kolom GAJIPENDAPATAN, JML_TANGGUNGAN, UANG _DIBAWA, STATUS_PINJAMAN, JML_SETORANBULAN, baris 1, 18, 37, 38, 42, 50, dan 96. Untuk mengatasi hal ini, kolom yang kosong akan diisi dengan means untuk data dengan atribut numerik dan diisi dengan mode untuk data dengan atribut kategorikal Hewahi dan M. K. Saad, 2007. Hasil pengisian missing value dapat dilihat di lampiran 3. Gambar 4.2 Isi data debitur setelah tahap pengisian missing value

3. Normalisasi Data

Setelah mengisi missing value secara manual dengan teknik means dan mode , dilakukan proses normalisasi atribut. Proses ini dilakukan karena adanya perbedaan range nilai dari tiap – tiap atribut sehingga perlu dilakukan normalisasi agar data memiliki nilai yang tepat dan sama untuk ditambang. Atribut – atribut tersebut akan dinormalisasi agar mempunyai range nilai 0 - 1. Hasil normalisasi dapat dilihat di lampiran 4. Proses normalisasi menggunakan metode min-max normalization sebagai berikut : 4.6 Dimana, v’ : nilai yang sudah ternormalisasi v : nilai lama yang belum ternormalisasi min : nilai minimum dari suatu instance max : nilai maksimum dari suatu instance NewMax : nilai minimum baru dari suatu instance NewMin : nilai maksimum baru dari suatu instance Berikut contoh proses normalisasi data : Tabel 4.1 Contoh atribut pada dataset debitur sebelum normalisasi UMUR NOM_PINJ SB JW NJOP_NT POKOK_BLN BUNGA_BLN 39 30,000,000 11.4 50 3,344,778 600,000 285,000 50 15,000,000 7.2 60 3,229,280 250,000 90,000 52 27,000,000 9.6 40 4,110,556 675,000 216,000 49 21,000,000 9.6 60 3,827,169 350,000 168,000 49 30,000,000 9.6 60 3,803,224 500,000 240,000 47 30,000,000 9.6 60 3,984,900 500,000 240,000 51 21,000,000 9.6 50 3,819,900 420,000 168,000 Tabel 4.2 Contoh atribut pada dataset debitur setelah normalisasi vumur vnom_pinj vsb vjw vnjop_nt vpokok_bln vbunga_bln 0.00 1.00 1.00 0.50 0.13 0.77 1.00 0.85 0.00 0.00 1.00 0.00 -0.31 0.00 1.00 0.80 0.57 0.00 1.00 1.00 0.65 0.77 0.40 0.57 1.00 0.68 0.00 0.40 0.77 1.00 0.57 1.00 0.65 0.46 0.77 0.62 1.00 0.57 1.00 0.86 0.46 0.77 0.92 0.40 0.57 0.50 0.67 0.22 0.40

C. Penambangan Data Dengan Microsoft Excel

Data yang telah mengalami pemrosesan akan ditambang berdasarkan algoritma ECODB . Penambangan data menggunakan Microsoft Excel. Rumus algoritma ECODB akan diterapkan dalam bentuk formula Microsoft Excel.

1. Menormalisasi Data

Sebelum ditambang, data yang telah mengalami pemrosesan awal akan dinormalisasi terlebih dahulu. Proses normalisasi ini dilakukan dengan tujuan membuat data memiliki nilai yang tepat dan sama untuk ditambang. Atribut – atribut tersebut akan dinormalisasi agar mempunyai range nilai 0 – 1. Proses normalisasi menggunakan metode min-max normalization seperti pada rumus 4.6. Formula normalisasi dalam Microsoft Excel adalah sebagai berikut : =cell1-mincellmaxcell-mincell1-0+0 Gambar 4.3 Contoh formula normalisasi data 2. Mencari Jarak Dari Tiap Data Dengan Menggunakan Fungsi Jarak Mixed Euclidian Distance Setelah menormalisasi data, dicari jarak dari tiap data dengan menggunakan fungsi jarak mixed euclidian distance . Pada fungsi ini setiap instance bertipe kategorikal akan diberi nilai 0 jika mempunyai kategori yang sama dan diberi nilai 1 jika mempunyai kategori yang berbeda, sedangkan atribut numerik akan dihitung berdasarkan rumus 5. Formula mencari jarak dalam Microsoft Excel adalah sebagai berikut : =SQRTIFcell1=cell2,0,12+cell3-cell42+cell5- cell62+cell7-cell82+cell9- cell102+IFcell11=cell12,0,12+cell13-cell142+ cell15-cell162+cell17-cell182+cell19-cell202+ cell21-cell222+cell23-cell242+cell25-cell262+ cell27-cell282+cell29-cell302+cell31-cell322+ cell33-cell342+IFcell35=cell36,0,12+cell37-cell382 Gambar 4.4 Contoh formula mencari jarak 3. Menghitung PCL PCL Probability of Class Label adalah nilai probabilitasbanyaknya kemunculan cla ss label yang sama dengan instance T dibandingkan k tetangga terdekatnya. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class label yang sama termasuk instance T sendiri dengan nilai k. Formula menghitung PCL dalam Microsoft Excel adalah sebagai berikut : =cell1k Gambar 4.5 Contoh formula menghitung PCL 4. Meranking List Top N Outlier Dari Instance Dengan Nilai PCLT,K Terkecil Setelah menghitung nilai PCL, data diranking secara kecil ke besar berdasarkan nilai PCLT,K terkecil sesuai dengan masukan top N . Top N adalah jumlah instances yang dideteksi sebagai outlier yang diurutkan secara kecil ke besar. Misalkan masukan top N = 10, maka akan diranking 10 instance dengan nilai PCLT,K terkecil. Untuk meranking instance , digunakan fitur Sort Filter dalam Microsoft Excel. Gambar 4.6 Contoh meranking kecil ke besar berdasarkan nilai PCLT,K terkecil

5. Menghitung Nilai

DeviationT ¸ NormDeviationT , KdistT , Dan NormKdistT Kemudian instance yang berada di top N dihitung nilai DeviationT ¸ NormDeviationT , KdistT , dan NormKdistT berdasarkan rumus 2.1, 2.2, dan 2.3. DeviationT adalah seberapa besar nilai instance T yang menyimpang dari subset DCL. KDist adalah jarak antara instance T pada dataset D dengan K tetangga terdekat, seberapa dekat nilai K instance tetangga terdekat dengan instance T. Sedangkan NormDeviationT adalah nilai deviation yang sudah ternormalisasi dan NormKDistT adalah nilai KDist yang sudah ternormalisasi. Formula menghitung DeviationT ¸ NormDeviationT , KdistT , dan NormKdistT dalam Microsoft Excel adalah sebagai berikut : a. Mencari Deviation =cell1+cell2+cell3+...+celln Gambar 4.7 Contoh formula menghitung Deviation b. Mencari NormDeviationT =cell1-mincellmaxcell-mincell Gambar 4.8 Contoh formula menghitung NormDeviationT c. Mencari Kdist = cell1+cell2+cell3+...+celln Gambar 4.9 Contoh formula menghitung Kdist d. Mencari NormKDistT =cell1-mincellmaxcell-mincell Gambar 4.10 Contoh formula menghitung NormKDistT

6. Menghitung Nilai COF

Class Outlier Factor Tahap selanjutnya adalah menghitung COF Class Outlier Factor dari setiap instance yang berada di list top N . COF adalah derajat dari suatu instance T untuk dikategorikan sebagai outlier . COF dihitung berdasarkan rumus 2.4. Formula menghitung COF dalam Microsoft Excel adalah sebagai berikut : =kcell1-cell2+cell3 Gambar 4.11 Contoh formula menghitung COF Class Outlier Factor

7. Mengurutkan List

Top N Secara Kecil Ke Besar Sesuai Nilai COF Tahap terakhir adalah mengurutkan list top N secara kecil ke besar sesuai nilai COF. Misalkan masukan top N = 10, maka akan diranking 10 instance dengan nilai COF terkecil. Untuk meranking instance , digunakan fitur Sort Filter dalam Microsoft Excel. Gambar 4.12 Contoh meranking kecil ke besar berdasarkan nilai COF terkecil

D. Hasil Deteksi

Outlier Berdasarkan Algoritma ECODB Dengan Microsoft Excel Hasil deteksi outlier berdasarkan algoritma ECODB menggunakan Microsoft Excel dengan masukan k dan top N yang berubah – ubah dapat ditampilkan dalam bentuk tabel – tabel di bawah. Dimana k adalah jumlah tetangga terdekat dari suatu instances , sedangkan top N adalah jumlah instances yang dideteksi sebagai outlier yang diurutkan secara kecil ke besar berdasarkan nilai COF Cla ss Outlier Factor . COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier . Outlier adalah data dengan nilai COF terendah. Class outlier adalah instances yang mempunyai derajat tinggi sebagai outlier . Jumlah class outlier ditentukan berdasarkan masukan top N , jika top N = 10 maka akan ada 10 instances yang yang mempunyai derajat tinggi sebagai outlier . Tabel 4.3 Hasil deteksi outlier dengan masukan k dan top N yang berubah – ubah k Top N Min COF 7 10 36, 92, 53, 96, 39, 64, 56, 24, 23, 37 20 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69, 87, 37, 27, 26, 25, 38 30 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69, 87, 37, 90, 27, 26, 25, 38, 55, 84, 63, 83, 15,, 70, 41, 1, 42 40 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69, 87, 37, 90, 27, 26, 25, 38, 55, 84, 63, 83, 15, 70, 41, 1, 42, 13, 46, 14, 33, 45, 60, 30, 44, 49, 32 50 36, 39, 53, 92, 96, 23, 24, 37, 56, 64, 65, 69, 73, 87, 88, 97, 25, 26, 27, 38, 55, 90, 42, 1, 15, 41, 63,70, 83,84, 13, 14, 30, 32, 33, 44, 45, 46, 49, 60, 61, 77, 80, 81, 82, 91, 94, 95, 2, 3 17 10 36,53, 39, 73, 64, 24, 56, 23, 69, 37 20 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87, 37, 96, 38, 55, 25, 26 30 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87, 37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 11, 14 40 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87, 37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 82, 70, 11, 14, 80, 19, 45, 12, 41, 16, 75, 1 50 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87, 37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 82, 70, 11, 14, 80, 19, 45, 12, 41, 16, 75, 1, 83, 50, 81, 31, 52, 34, 84, 28, 29, 35 27 10 36, 53, 92, 64, 73, 94, 97, 24, 37, 39 20 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 25, 26, 42 30 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 13, 14, 15, 16 40 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 28, 12, 1 50 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 50, 63, 31, 34, 59, 41, 45, 48, 28, 29, 35, 12, 1 37 10 36, 53, 92, 64, 73, 94, 97, 24, 37, 39 20 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 25, 26, 42 30 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 13, 14, 15, 16 40 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 28, 12, 1 50 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 50, 63, 31, 34, 59, 41, 45, 48, 28, 29, 35, 12, 1 47 10 94, 97, 36, 88, 37, 96, 53, 38, 39, 42 20 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42, 92, 73, 23, 24, 55, 25 30 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42, 92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43 40 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42, 92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43, 51, 83, 66, 70, 18, 14, 16, 3, 11, 12 50 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42, 92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43, 51, 83, 66, 70, 18, 14, 16, 63, 71, 62, 34, 44, 49, 60, 35, 3, 17, 11, 12, 19 COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier . Outlier adalah data dengan nilai COF terendah. Class outlier adalah instances yang mempunyai derajat tinggi sebagai outlier . Untuk dapat mengetahui pengaruh k dan top N dalam proses deteksi outlier menggunakan algoritma ECODB, dapat dilihat dari perubahan nilai COF berdasarkan masukan k dan top N yang berubah – ubah. Karena nilai COF bergantung pada masukan top N , maka untuk memudahkan perbandingan dari hasil deteksi, nilai COF ditampilkan dalam bentuk rata – rata means . Kolom min COF dan max COF dapat digunakan untuk melihat seberapa jauh jarak nilai means terhadap min COF dan max COF . Dari tabel 4.8, dapat dilihat bahwa semakin tinggi nilai masukan k dan top N , maka semakin tinggi pula nilai COF. Tabel 4.4 Nilai rata – rata COF berdasarkan masukan k dan top N yang berubah - ubah k Top N Min COF Max COF Means COF 7 10 0.99 2.84 1.77 20 0.99 3.14 2.06 30 0.99 4.81 2.78 40 0.99 5.55 3.445 50 0.99 6.22 3.89 17 10 2.39 5.7 4.15 20 2.39 9.95 5.6 30 2.39 33.62 12.69 40 2.39 35.93 18.31 50 2.39 38.43 21.89 27 10 3.82 8.56 6.8 20 3.82 16.31 10.13 30 3.82 84.47 31.71 40 3.82 92.06 46.02 50 3.82 92.15 55.23 37 10 10.53 16.39 14.01 20 10.53 26.66 18.51 30 10.53 163.44 59.07 40 10.53 168.64 85.81 50 10.53 168.72 102.38 47 10 13.53 27.73 22.53 20 13.53 33.78 26.44 30 13.53 254.62 93.35 40 13.53 261.42 135.35 50 13.53 268.13 161.76 COF adalah nilai probabilitasderajat sebuah insta nce dapat menjadi outlier . Outlier adalah data dengan nilai COF terendah. Nilai COF dan class outlier dengan masukan k = 7 dan top N yang berubah – ubah dapat ditampilkan dalam tabel sebagai berikut : Tabel 4.5 Nilai COF dengan k = 7 dan top N = 10 Class PCL COF 36 3 1 0.99 92 3 1 1.04 53 2 1 1.08 96 4 1 1.38 39 3 1 1.58 64 2 2 2.03 56 3 2 2.12 24 2 2 2.13 23 2 2 2.14 37 4 2 2.44 Tabel 4.6 Nilai COF dengan k = 7 dan top N = 20 Class PCL COF 36 3 1 0.99 92 3 1 1.04 53 2 1 1.08 96 4 1 1.38 65 1 2 1.44 39 3 1 1.58 64 2 2 2.03 73 2 2 2.03 97 3 2 2.11 56 3 2 2.12 24 2 2 2.13 23 2 2 2.14 88 3 2 2.14 69 2 2 2.17 87 2 2 2.18 37 4 2 2.44 27 3 3 3.12 26 3 3 3.13 25 3 3 3.14 38 4 3 3.5 Tabel 4.7 Nilai COF dengan k = 7 dan top N = 30 Class PCL COF 36 3 1 0.99 92 3 1 1.04 53 2 1 1.08 96 4 1 1.38 65 1 2 1.44 39 3 1 1.58 64 2 2 2.03 73 2 2 2.03 97 3 2 2.11 56 3 2 2.12 24 2 2 2.13 23 2 2 2.14 88 3 2 2.14 69 2 2 2.17 87 2 2 2.18 37 4 2 2.44 90 1 3 2.49 27 3 3 3.12 26 3 3 3.13 25 3 3 3.14 38 4 3 3.5 55 3 3 3.84 84 1 5 4.44 63 1 5 4.45 83 1 5 4.45 15 1 5 4.47 70 1 5 4.48 41 1 5 4.52 1 1 5 4.6 42 4 4 4.81 Tabel 4.8 Nilai COF dengan k = 7 dan top N = 40 Class PCL COF 36 3 1 0.99 92 3 1 1.04 53 2 1 1.08 96 4 1 1.38 65 1 2 1.44 39 3 1 1.58 64 2 2 2.03 73 2 2 2.03 97 3 2 2.11 56 3 2 2.12 24 2 2 2.13 23 2 2 2.14 88 3 2 2.14 69 2 2 2.17 87 2 2 2.18 37 4 2 2.44 90 1 3 2.49 27 3 3 3.12 26 3 3 3.13 25 3 3 3.14 38 4 3 3.5 55 3 3 3.84 84 1 5 4.44 63 1 5 4.45 83 1 5 4.45 15 1 5 4.47 70 1 5 4.48 41 1 5 4.52 1 1 5 4.6 42 4 4 4.81 13 1 6 5.44 46 1 6 5.44 14 1 6 5.45 33 1 6 5.47 45 1 6 5.47 60 1 6 5.47 30 1 6 5.49 44 1 6 5.49 49 1 6 5.49 32 1 6 5.55 Tabel 4.9 Nilai COF dengan k = 7 dan top N = 50 Class PCL COF 36 3 1 0.99 39 3 1 1.58 53 2 1 1.08 92 3 1 1.04 96 4 1 1.38 23 2 2 2.14 24 2 2 2.13 37 4 2 2.44 56 3 2 2.12 64 2 2 2.03 65 1 2 1.44 69 2 2 2.17 73 2 2 2.03 87 2 2 2.18 88 3 2 2.14 97 3 2 2.11 25 3 3 3.14 26 3 3 3.13 27 3 3 3.12 38 4 3 3.5 55 3 3 3.84 90 1 3 2.49 42 4 4 4.81 1 1 5 4.6 15 1 5 4.47 41 1 5 4.52 63 1 5 4.45 70 1 5 4.48 83 1 5 4.45 84 1 5 4.44 13 1 6 5.44 14 1 6 5.45 30 1 6 5.49 32 1 6 5.55 33 1 6 5.47 44 1 6 5.49 45 1 6 5.47 46 1 6 5.44 49 1 6 5.49 60 1 6 5.47 61 1 6 5.42 77 1 6 5.44 80 1 6 5.46 81 1 6 5.46 82 1 6 5.47 91 1 6 5.46 94 3 6 5.54 95 1 6 5.54 2 1 7 6.22 3 1 7 6.16 Nilai COF dengan masukan k = 17 dan top N yang berubah – ubah dapat ditampikan dalam tabel sebagai berikut : Tabel 4.10 Nilai COF dengan k = 17 dan top N = 10 Class PCL COF 36 3 1 2.38 53 2 1 2.52 39 3 1 2.98 73 2 2 4.91 64 2 2 4.92 24 2 2 5.06 56 3 2 5.06 23 2 2 5.08 69 2 2 5.12 37 4 2 5.3 Tabel 4.11 Nilai COF dengan k = 17 dan top N = 20 Class PCL COF 36 3 1 2.38 53 2 1 2.52 39 3 1 2.98 92 3 2 4.89 73 2 2 4.91 64 2 2 4.92 94 3 2 4.93 97 3 2 4.97 24 2 2 5.06 56 3 2 5.06 88 3 2 5.06 23 2 2 5.08 69 2 2 5.12 87 2 2 5.12 37 4 2 5.3 96 4 3 7.74 38 4 3 7.81 55 3 3 8.11 25 3 4 9.94 26 3 4 9.94 Tabel 4.12 Nilai COF dengan k = 17 dan top N = 30 Class PCL COF 36 3 1 2.38 53 2 1 2.52 39 3 1 2.98 92 3 2 4.89 73 2 2 4.91 64 2 2 4.92 94 3 2 4.93 97 3 2 4.97 24 2 2 5.06 56 3 2 5.06 88 3 2 5.06 23 2 2 5.08 69 2 2 5.12 87 2 2 5.12 37 4 2 5.3 96 4 3 7.74 38 4 3 7.81 55 3 3 8.11 27 3 4 9.92 25 3 4 9.94 26 3 4 9.94 42 4 4 10.57 65 1 9 21.4 90 1 10 23.86 17 1 11 26.21 18 1 11 26.22 13 1 12 28.7 15 1 12 28.72 11 1 13 31.07 14 1 13 31.13 Tabel 4.13 Nilai COF dengan k = 17 dan top N = 40 Class PCL COF 36 3 1 2.38 53 2 1 2.52 39 3 1 2.98 92 3 2 4.89 73 2 2 4.91 64 2 2 4.92 94 3 2 4.93 97 3 2 4.97 24 2 2 5.06 56 3 2 5.06 88 3 2 5.06 23 2 2 5.08 69 2 2 5.12 87 2 2 5.12 37 4 2 5.3 96 4 3 7.74 38 4 3 7.81 55 3 3 8.11 27 3 4 9.92 25 3 4 9.94 26 3 4 9.94 42 4 4 10.57 65 1 9 21.4 90 1 10 23.86 17 1 11 26.21 18 1 11 26.22 13 1 12 28.7 15 1 12 28.72 82 1 13 31.04 70 1 13 31.06 11 1 13 31.07 14 1 13 31.13 80 1 14 33.47 19 1 14 33.49 45 1 14 33.49 12 1 14 33.5 41 1 14 33.51 16 1 14 33.53 75 1 14 33.61 1 1 14 33.62 Tabel 4.14 Nilai COF dengan k = 17 dan top N = 50 Class PCL COF 36 3 1 2.38 53 2 1 2.52 39 3 1 2.98 92 3 2 4.89 73 2 2 4.91 64 2 2 4.92 94 3 2 4.93 97 3 2 4.97 24 2 2 5.06 56 3 2 5.06 88 3 2 5.06 23 2 2 5.08 69 2 2 5.12 87 2 2 5.12 37 4 2 5.3 96 4 3 7.74 38 4 3 7.81 55 3 3 8.11 27 3 4 9.92 25 3 4 9.94 26 3 4 9.94 42 4 4 10.57 65 1 9 21.4 90 1 10 23.86 17 1 11 26.21 18 1 11 26.22 13 1 12 28.7 15 1 12 28.72 82 1 13 31.04 70 1 13 31.06 11 1 13 31.07 14 1 13 31.13 80 1 14 33.47 19 1 14 33.49 45 1 14 33.49 12 1 14 33.5 41 1 14 33.51 16 1 14 33.53 75 1 14 33.61 1 1 14 33.62 83 1 15 35.89 50 1 15 35.9 81 1 15 35.9 31 1 15 35.91 52 1 15 35.91 34 1 15 35.92 84 1 15 35.92 28 1 15 35.93 29 1 15 35.93 35 1 15 35.95 Dengan masukan k = 27 dan top N yang berubah – ubah, nilai COF dapat ditampikan dalam tabel sebagai berikut : Tabel 4.15 Nilai COF dengan k = 27 dan top N = 10 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 Tabel 4.16 Nilai COF dengan k = 27 dan top N = 20 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 Tabel 4.17 Nilai COF dengan k = 27 dan top N = 30 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 56 3 4 15.63 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 27 3 5 19.51 65 1 17 65.13 90 1 19 72.86 17 1 21 80.56 11 1 21 80.57 13 1 21 80.6 14 1 21 80.61 15 1 21 80.61 16 1 21 80.61 Tabel 4.18 Nilai COF dengan k = 27 dan top N = 40 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 56 3 4 15.63 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 27 3 5 19.51 65 1 17 65.13 90 1 19 72.86 17 1 21 80.56 11 1 21 80.57 18 1 21 80.57 13 1 21 80.6 14 1 21 80.61 15 1 21 80.61 16 1 21 80.61 91 1 22 84.35 8 1 22 84.36 70 1 22 84.36 19 1 22 84.42 10 1 23 87.91 2 1 23 88.19 28 1 23 88.23 12 1 23 88.28 1 1 23 88.35 Tabel 4.19 Nilai COF dengan k = 27 dan top N = 50 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 56 3 4 15.63 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 27 3 5 19.51 65 1 17 65.13 90 1 19 72.86 17 1 21 80.56 11 1 21 80.57 18 1 21 80.57 13 1 21 80.6 14 1 21 80.61 15 1 21 80.61 16 1 21 80.61 91 1 22 84.35 8 1 22 84.36 70 1 22 84.36 19 1 22 84.42 10 1 23 87.91 2 1 23 88.19 50 1 23 88.19 63 1 23 88.19 31 1 23 88.21 34 1 23 88.21 59 1 23 88.21 41 1 23 88.22 45 1 23 88.22 48 1 23 88.22 28 1 23 88.23 29 1 23 88.23 35 1 23 88.24 12 1 23 88.28 1 1 23 88.35 Dengan masukan k = 37 dan top N yang berubah – ubah, nilai COF dapat ditampikan dalam tabel sebagai berikut : Tabel 4.20 Nilai COF dengan k = 37 dan top N = 10 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 Tabel 4.21 Nilai COF dengan k = 37 dan top N = 20 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 Tabel 4.22 Nilai COF dengan k = 37 dan top N = 30 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 56 3 4 15.63 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 27 3 5 19.51 65 1 17 65.13 90 1 19 72.86 17 1 21 80.56 11 1 21 80.57 13 1 21 80.6 14 1 21 80.61 15 1 21 80.61 16 1 21 80.61 Tabel 4.23 Nilai COF dengan k = 37 dan top N = 40 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 56 3 4 15.63 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 27 3 5 19.51 65 1 17 65.13 90 1 19 72.86 17 1 21 80.56 11 1 21 80.57 18 1 21 80.57 13 1 21 80.6 14 1 21 80.61 15 1 21 80.61 16 1 21 80.61 91 1 22 84.35 8 1 22 84.36 70 1 22 84.36 19 1 22 84.42 10 1 23 87.91 2 1 23 88.19 28 1 23 88.23 12 1 23 88.28 1 1 23 88.35 Tabel 4.24 Nilai COF dengan k = 37 dan top N = 50 Class PCL COF 36 3 1 3.81 53 2 1 3.97 92 3 2 7.76 64 2 2 7.79 73 2 2 7.79 94 3 2 7.79 97 3 2 7.83 24 2 2 7.94 37 4 2 8.14 39 3 2 8.26 88 3 3 11.77 23 2 3 11.81 69 2 3 11.84 87 2 3 11.85 96 4 3 12.03 38 4 3 12.09 55 3 3 12.4 56 3 4 15.63 25 3 4 15.67 26 3 4 15.67 42 4 4 16.31 27 3 5 19.51 65 1 17 65.13 90 1 19 72.86 17 1 21 80.56 11 1 21 80.57 18 1 21 80.57 13 1 21 80.6 14 1 21 80.61 15 1 21 80.61 16 1 21 80.61 91 1 22 84.35 8 1 22 84.36 70 1 22 84.36 19 1 22 84.42 10 1 23 87.91 2 1 23 88.19 50 1 23 88.19 63 1 23 88.19 31 1 23 88.21 34 1 23 88.21 59 1 23 88.21 41 1 23 88.22 45 1 23 88.22 48 1 23 88.22 28 1 23 88.23 29 1 23 88.23 35 1 23 88.24 12 1 23 88.28 1 1 23 88.35 Berdasarkan masukan k = 47 dan top N yang berubah – ubah, nilai COF dapat ditampikan dalam tabel sebagai berikut : Tabel 4.25 Nilai COF dengan k = 47 dan top N = 10 Class PCL COF 94 3 2 13.48 97 3 2 13.52 36 3 3 20.08 88 3 3 20.27 37 4 3 20.54 96 4 3 20.55 53 2 4 26.93 38 4 4 27.34 39 3 4 27.36 42 4 4 27.73 Tabel 4.26 Nilai COF dengan k = 47 dan top N = 20 Class PCL COF 94 3 2 13.48 97 3 2 13.52 36 3 3 20.08 88 3 3 20.27 37 4 3 20.54 96 4 3 20.55 64 2 4 26.91 53 2 4 26.93 56 3 4 27 69 2 4 27.07 87 2 4 27.07 38 4 4 27.34 39 3 4 27.36 42 4 4 27.73 92 3 5 33.6 73 2 5 33.63 23 2 5 33.73 24 2 5 33.74 55 3 5 34.4 25 3 6 40.48 Tabel 4.27 Nilai COF dengan k = 47 dan top N = 30 Class PCL COF 94 3 2 13.48 97 3 2 13.52 36 3 3 20.08 88 3 3 20.27 37 4 3 20.54 96 4 3 20.55 64 2 4 26.91 53 2 4 26.93 56 3 4 27 69 2 4 27.07 87 2 4 27.07 38 4 4 27.34 39 3 4 27.36 42 4 4 27.73 92 3 5 33.6 73 2 5 33.63 23 2 5 33.73 24 2 5 33.74 55 3 5 34.4 27 3 6 40.44 25 3 6 40.48 26 3 6 40.48 65 1 33 221.06 90 1 34 227.79 45 1 36 241.19 76 1 37 247.9 80 1 37 247.9 82 1 37 247.9 91 1 37 247.9 43 1 37 247.91 Tabel 4.28 Nilai COF dengan k = 47 dan top N = 40 Class PCL COF 94 3 2 13.48 97 3 2 13.52 36 3 3 20.08 88 3 3 20.27 37 4 3 20.54 96 4 3 20.55 64 2 4 26.91 53 2 4 26.93 56 3 4 27 69 2 4 27.07 87 2 4 27.07 38 4 4 27.34 39 3 4 27.36 42 4 4 27.73 92 3 5 33.6 73 2 5 33.63 23 2 5 33.73 24 2 5 33.74 55 3 5 34.4 27 3 6 40.44 25 3 6 40.48 26 3 6 40.48 65 1 33 221.06 90 1 34 227.79 45 1 36 241.19 76 1 37 247.9 80 1 37 247.9 82 1 37 247.9 91 1 37 247.9 43 1 37 247.91 51 1 38 254.61 83 1 38 254.61 66 1 38 254.62 70 1 38 254.62 18 1 38 254.69 14 1 38 254.71 16 1 38 254.75 3 1 39 261.39 11 1 39 261.41 12 1 39 261.41 Tabel 4.29 Nilai COF dengan k = 47 dan top N = 50 Class PCL COF 94 3 2 13.48 97 3 2 13.52 36 3 3 20.08 88 3 3 20.27 37 4 3 20.54 96 4 3 20.55 64 2 4 26.91 53 2 4 26.93 56 3 4 27 69 2 4 27.07 87 2 4 27.07 38 4 4 27.34 39 3 4 27.36 42 4 4 27.73 92 3 5 33.6 73 2 5 33.63 23 2 5 33.73 24 2 5 33.74 55 3 5 34.4 27 3 6 40.44 25 3 6 40.48 26 3 6 40.48 65 1 33 221.06 90 1 34 227.79 45 1 36 241.19 76 1 37 247.9 80 1 37 247.9 82 1 37 247.9 91 1 37 247.9 43 1 37 247.91 51 1 38 254.61 83 1 38 254.61 66 1 38 254.62 70 1 38 254.62 18 1 38 254.69 14 1 38 254.71 16 1 38 254.75 63 1 39 261.32 71 1 39 261.32 62 1 39 261.33 34 1 39 261.34 44 1 39 261.34 49 1 39 261.34 60 1 39 261.34 35 1 39 261.36 3 1 39 261.39 17 1 39 261.4 11 1 39 261.41 12 1 39 261.41 19 1 39 261.41

E. Kesimpulan Hasil Percobaan Perhitungan Dengan Masukan K dan

Top N Yang Berubah - Ubah Dari hasil percobaan perhitungan dengan masukan k dan top N yang tertera pada tabel di atas, dapat disimpulkan sebagai berikut : 1. Berdasarkan percobaan perhitungan menggunakan algoritma ECODB, dapat diketahui bahwa semakin besar nilai k, semakin tinggi pula nilai COF. Hal ini dikarenakan bertambahnya jumlah tetangga terdekat dari tiap instance yang kemudian membuat nilai Kdist bertambah. 2. Berdasarkan percobaan perhitungan menggunakan algoritma ECODB dengan masukan k dan top n yang berbeda – beda, dapat diketahui bahwa penentuan nilai k dan top n bergantung pada besarnya dataset, jumlah class label dan distribusi kelas. Semakin besar dataset dan jumlah cla ss label , semakin besar pula masukan nilai k dan top n untuk mendapatkan hasil deteksi yang optimal. 3. Nilai k yang terlalu kecil akan menyebabkan tahap pengelompokan data berdasarkan tetangga terdekat menjadi tidak optimal. Data yang termasuk tetangga terdekat suatu instances dapat ‘terbuang’ dari kelompoknya. Sedangkan nilai k yang terlalu besar akan menyebabkan data luar menjadi satu kelompok dengan suatu instances . 4. Nilai top N yang terlalu kecil akan menyebabkan data yang mempunyai derajat tinggi sebagai outlier tidak terdeteksi sebagai class outlier . Sedangkan nilai top N yang terlalu besar akan menyebabkan data yang bukan outlier ikut terdeteksi sebagai outlier . F. Kesimpulan Hasil Pengujian Review dan Validitas oleh Pengguna Berdasarkan hasil pengujian hasil percobaan perhitungan pada data yang kerap muncul sebagai outlier pada masukan k dan top N yang berbeda – beda dan hasil analisa menurut pengguna petugas BPR XYZ, dapat disimpulkan bahwa : 1. Debitur 36 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang cukup besar padahal mempunyai jaminan tanah senilai Rp 12.000.000,- dan pendapatan yang cukup besar yakni Rp 11.400.000,-. Jumlah tanggungan keluarga debitur juga kecil yaitu 1 orang. Debitur sebelumnya pernah mengajukan kredit di BPR XYZ sebanyak 3 kali dan mampu mengangsur kredit dengan lunas. Debitur 36 mengajukan kredit sebesar Rp 6.000.000,- dan tidak sedang mengangsur kredit di bank lain. 2. Debitur 92 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah senilai Rp 40.000.000,- dan pendapatan yang relatif besar yakni Rp 8.937.500,-. Jumlah tanggungan keluarga debitur 92 sebanyak 2 orang. Debitur 92 mengajukan kredit sebesar Rp 20.000.000,- dan tidak sedang mengangsur kredit di bank lain. 3. Debitur 53 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah senilai Rp 40.000.000,- dan pendapatan yang cukup besar yakni Rp 16.600.000,-. Debitur sebelumnya pernah mengajukan kredit di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 53 mengajukan kredit sebesar Rp 20.000.000,- dan tidak sedang mengangsur kredit di bank lain. 4. Debitur 73 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah senilai Rp 14.000.000,- dan pendapatan yang besar yakni Rp 24.000.000,-. Debitur sebelumnya pernah mengajukan kredit di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 73 mengajukan kredit sebesar Rp 7.000.000,- dan tidak sedang mengangsur kredit di bank lain. 5. Debitur 96 dinyatakan sebagai outlier karena memiliki tunggakan bunga yang besar sebanyak 55 kali padahal mempunyai jaminan BPKB senilai Rp 26.000.000,- dan pendapatan yang besar yakni Rp 10.500.000,-. Jumlah tanggungan keluarga debitur 96 sebanyak 2 orang. Debitur 96 mengajukan kredit sebesar Rp 13.000.000,- dan tidak sedang mengangsur kredit di bank lain. 6. Debitur 39 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah senilai Rp 70.750.000,- dan pendapatan yang besar yakni Rp 139.520.000,-. Debitur sebelumnya pernah mengajukan kredit di BPR XYZ sebanyak 3 kali dan mampu mengangsur kredit dengan lunas. Jumlah tanggungan keluarga debitur 39 sebanyak 3 orang. Debitur 39 mengajukan kredit sebesar Rp 50.000.000,-. 7. Debitur 64 dinyatakan sebagai outlier karena memiliki tunggakan pokok cukup besar padahal mempunyai jaminan tanah senilai Rp 48.000.000,- dan pendapatan yang besar yakni Rp 34.400.000,-. Debitur sebelumnya pernah mengajukan kredit di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 64 mengajukan kredit sebesar Rp 24.000.000,- dan tidak sedang mengangsur kredit di bank lain. 8. Debitur 24 dinyatakan sebagai outlier karena memiliki tunggakan pokok dan tunggakan bunga yang besar padahal mempunyai gaji tetap setiap bulan yang relatif besar yakni Rp 2.096.299,- dan jangka waktu mengangsur yang lama yaitu 40 bulan. Debitur 24 mengajukan kredit sebesar Rp 10.000.000,- dan tidak sedang mengangsur kredit di bank lain. Debitur – debitur lain yang berprofesi sebagai pegawai dan mempunyai gaji yang hampir sama cenderung mampu melunasi kredit bahkan untuk jumlah kredit yang lebih tinggi. 9. Debitur 23 dinyatakan sebagai outlier karena memiliki tunggakan pokok dan tunggakan bunga yang besar padahal mempunyai gaji tetap setiap bulan yang relatif besar gaji tetap setiap bulan yang relatif besar yakni Rp 3.043.672,- dan jangka waktu mengangsur yang lama yaitu 40 bulan. Debitur 23 mengajukan kredit sebesar Rp 10.000.000,- dan tidak sedang mengangsur kredit di bank lain. Debitur – debitur lain yang berprofesi sebagai pegawai dan mempunyai gaji yang hampir sama cenderung mampu melunasi kredit bahkan untuk jumlah kredit yang lebih tinggi. 10. Debitur 37 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang sangat besar padahal mempunyai

Dokumen yang terkait

Deteksi outlier menggunakan Algoritma Local Outlier Probability : studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma.

0 5 265

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor : studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma.

0 4 252

Deteksi outlier pada data campuran numerik dan kategorikal menggunakan algoritma Enhanced Class Outlier Distance Based (ECODB) : studi kasus data kredit BPR XYZ.

0 4 106

Deteksi Outlier menggunakan algoritma Block-Based Nested-Loop : studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma.

0 2 202

Deteksi outlier menggunakan algoritma Block-based Nested Loop (studi kasus: data akademik mahasiswa prodi PS Universitas XYZ).

1 5 6

Deteksi outlier menggunakan algoritma Naive Nested Loop (studi kasus : data akademik mahasiswa program studi PS Universitas XYZ).

0 0 4

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma

1 8 250

Deteksi outlier menggunakan Algoritma Local Outlier Probability studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma

1 9 263

Penerapan metode enhanced class outlier distance based untuk identifikasi outlier pada data hasil ujian nasional, indeks integritas dan akreditasi sekolah menengah atas

1 6 143

Deteksi outlier menggunakan algoritma local outlier factor : studi kasus data akademik mahasiswa TI Universitas Sanata Dharma - USD Repository

0 0 241