instance pada top N berdasarkan rumus 2.4. Kemudian meranking tiap
instance pada list top N berdasarkan nilai COF terkecil.
Tabel 3.4 Hasil perhitungan
COF
dari tiap instance
PCL PCL7 Dev vDev Kdist vKdist COF
7 2.00 0.29
0.50 0.00
9.81 0.28
2.28 6 2.00
0.29 0.50
0.00 10.53 0.52
2.52 10 3.00
0.43 1.48
0.07 8.95
0.01 2.94
9 3.00 0.43
0.76 0.02
8.93 0.00
2.98 8 3.00
0.43 0.77
0.02 8.96
0.01 2.99
11 5.00 0.71 14.70
0.98 11.35 0.78
4.80 13 5.00
0.71 14.98 1.00 12.01
1.00 5.00
3 7.00 1.00 12.90
0.86 10.38 0.47
6.61 5 7.00
1.00 13.66 0.91 10.97
0.66 6.75
2 7.00 1.00 13.32
0.89 11.17 0.73
6.84 1 7.00
1.00 13.55 0.90 11.31
0.77 6.87
4 7.00 1.00 14.19
0.95 11.60 0.87
6.92 12 7.00
1.00 14.32 0.95 11.74
0.91 6.96
Dari tabel di 3.4, ditemukan instance yang menjadi outlier yaitu instance
nomor 7, 6, 10, 9, dan 8. Dimana nasabah no. 7 dan 6 meminjam dengan jumlah cukup besar dibandingkan dengan tetangga terdekatnya dan
menunggak sebanyak 6 kali. Sedangkan nasabah no. 10, 9, dan 8 mempunyai jumlah pinjaman yang terkecil tetapi mempunyai tunggakan sebanyak 4
– 5 kali.
30
BAB IV HASIL DAN PEMBAHASAN
A. Sumber Data
Sumber data dalam penelitian ini adalah data debitur BPR XYZ bulan Agustus 2013 sebanyak 97 data record. Data tersebut dalam format
Microsoft Excel .xls. Data ini diperoleh setelah mendapat ijin pengambilan dan penggunaan data untuk penelitian dari Kepala Humas BPR XYZ. Data
tersebut terdiri dari 32 atribut seperti dalam tabel 3.1. Data debitur tersebut akan dihitung menggunakan algoritma ECODB
untuk mendeteksi outlier yang terdapat pada data tersebut. Setelah outlier dideteksi, pihak bank dapat menganalisa data dan outlier untuk menemukan
faktor tertentu yang berpengaruh pada keunikan data debitur tersebut. Sebelum ditambang, data akan akan mengalami pemrosesan awal terlebih
dahulu untuk menghasilkan data dengan kualitas yang baik untuk diolah.
B. Pemrosesan Awal Data
1. Seleksi Data
Tahap pertama yang dilakukan adalah seleksi atribut yang akan digunakan dalam penambangan data. Seleksi ini dilakukan untuk
mendapatkan atribut-atribut dengan nilai yang relevan terhadap proses deteksi outlier sehingga atribut-atribut yang dianggap berisi nilai yang
tidak relevan tidak lagi disertakan dalam dataset .
Berdasarkan tabel 3.1, diketahui terdapat sebanyak 32 atribut
terdapat pada dataset debitur, yaitu
NOREK, NOPK, NAMA, KODE_PEKER, J_USAHA, NAMAIBU, ALAMAT1,
T_LAHIR, TGL_LAHIR,
UMUR, IDENTITAS,
NAMA_KTR, KODE_POS, JW, NOM_PINJ, SB, JAMINAN, NJOP_NT, PINJ_KE,
TUNG_POK, TUNG_BNG,
TUNG_POKOK, TUNG_BUNGA, POKOK_BLN, BUNGA_BLN, GAJIPENDAPATAN,
JML_TANGGUNGAN,STATUS_PINJAMAN,JML_SETORANBULAN dan KOLBI1.
Atribut NOREK, NOPK, NAMA, NAMAIBU, ALAMAT1, T_LAHIR, IDENTITAS, NAMA_KTR dan KODE_POS tidak digunakan
karena dianggap tidak relevan jika digunakan pada proses deteksi outlier. Hal ini berdasarkan keterangan atribut pada tabel 3.1.
Atribut J_USAHA dan TGL_LAHIR juga tidak digunakan. Atribut
– atribut tersebut cukup relevan jika digunakan. Tetapi nilai dari atribut tersebut dapat digantikan dengan atribut lainnya dengan nilai yang
mirip atau sama maka atribut – atribut tersebut tidak digunakan dalam
penelitian. J_USAHA diganti dengan KODE_PEKER dan atribut TGL_LAHIR diganti dengan UMUR sehingga data tersebut tidak
kompleks lagi dan juga mempunyai kualitas informasi yang baik untuk ditambang.
Atribut – atribut yang tersisa adalah KODE_PEKER, UMUR
NOM_PINJ, SB, JW, JAMINAN, NJOP_NT, PINJ_KE, TUNG_POK, TUNG_BNG,
TUNG_POKOK, TUNG_BUNGA,
POKOK_BLN, BUNGA_BLN, GAJIPENDAPATAN, JML_TANGGUNGAN, UANG
_DIBAWA, STATUS_PINJAMAN, JML_SETORANBULAN, dan KOLBI1. Hasil seleksi atribut dapat dilihat di lampiran 2.
Hasil yang di peroleh dari tahap seleksi atribut telah menghasilkan sejumlah 20 atribut dan 97 instances. Berikut ini beberapa
keterangan yang berkaitan dengan atribut – atribut terpilih, yaitu :
a. KODE_PEKER Atribut ini berisi kode pekerjaan berdasarkan jenis usaha yang
dijalankan debitur. Kode pekerjaan tersebut adalah 010 dan 014. Atribut ini bertipe kategorikal.
b. UMUR Atribut ini berisi umur dari tiap debitur ketika mengajukan
kredit. Dalam atribut ini diketahui debitur paling muda berusia 18 tahun dan debitur paling tua berusia 63 tahun. Rata
– rata umur debitur ketika mengajukan kredit adalah 44, 5 tahun.
Atribut ini bertipe numerik. c. NOM_PINJ
Atribut ini berisi jumlah pinjaman kredit yang diajukan debitur dan telah disetujui oleh bankkreditur. Nominal pinjaman
ditetapkan dalam rupiah Rp. Atribut ini bertipe numerik. d. SB
Atribut ini berisi jumlah suku bunga yang diterima debitur. Suku bunga ditetapkan dalam bentuk persen .Atribut ini
bertipe numerik.
e. JW Atribut ini berisi jangka waktu kredit yang diajukan nasabah.
Jangka waktu kredit ditetapkan dalam waktu tertentu selama beberapa bulan. Atribut ini bertipe numerik.
f. JAMINAN Atribut ini berisi bentuk jaminan yang diberikan debitur
sebagai salah satu syarat pengajuan kredit. Bentuk – bentuk
jaminan tersebut adalah BPKB, GAJI, SERTIFIKAT, dan TANAH. Atribut ini bertipe kategorikal.
g. NJOP_NT Atribut ini berisi nilaiharga jaminan yang dipunyai debitur
berdasarkan hasil perkiraan bank. Nominal nilai jaminan ditetapkan dalam rupiah Rp. Atribut ini bertipe numerik.
h. PINJ_KE Atribut ini berisi keterangan sejumlah berapa kali debitur
pernah mengajukan kredit di BPR Shinta Bhakti Wedi. Atribut ini umumnya digunakan untuk mengetahui reputasi pengajuan
kredit debitur, khususnya selama mengajukan kredit di BPR Shinta Bhakti Wedi. Atribut ini bertipe numerik.
i. TUNG_POK Atribut ini berisi keterangan berapa kali debitur menunggak
mengangsur kredit. Atribut ini bertipe numerik. j. TUNG_BNG
Atribut ini berisi keterangan berapa kali debitur menunggak mengangsur bunga. Atribut ini bertipe numerik.
k. TUNG_POKOK Atribut ini berisi jumlah total kredit yang ditunggak oleh
debitur. Atribut ini bertipe numerik. l. TUNG_BUNGA
Atribut ini berisi jumlah total bunga yang ditunggak oleh debitur. Atribut ini bertipe numerik.
m. GAJIPENDAPATAN Atribut ini berisi jumlah gaji atau pendapatan debitur tiap
bulan. Atribut ini bertipe numerik. n. JML_TANGGUNGAN
Atribut ini berisi jumlah anggota keluarga yang ditanggung oleh debitur. Atribut ini bertipe numerik.
o. UANG_DIBAWA Atribut ini berisi jumlah nominal uang yang dibawa
pulangdiperoleh debitur setiap bulannya. Atribut ini bertipe numerik.
p. STATUS_PINJAMAN Atribut ini berisi keterangan apakah debitur saat mengajukan
kredit telah melakukan peminjaman kredit di bank lain atau tidak. Atribut ini bertipe kategorikal.
q. JML_SETORANBULAN