Algoritma Enhanced Class Outlier Distance Based ECODB

19

BAB III METODE PENELITIAN

A. Metodologi Penelitian

Penelitian ini dilakukan untuk menemukan outlier pada data debitur dengan data campuran numerik dan kategorikal menggunakan algoritma ECODB. Penelitian ini menggunakan data debitur dari BPR XYZ sebagai bahan studi kasus. Dengan melakukan pendeteksian outlier pada data tersebut, dapat diketahui outlier pada suatu kumpulan data yang mempunyai classs label. Penelitian dilakukan dengan cara menghitung data debitur BPR XYZ bulan Agustus 2013 berdasarkan teori algoritma ECODB dengan menggunakan Microsoft Excel. Perhitungan akan dilakukan dengan masukan k dan top N yang berbeda. Kemudian hasil perhitungan tersebut akan dibandingkan untuk mendapatkan kesimpulan dan dilakukan review hasil deteksi outlier oleh petugas bank. Hasil penelitian ini diharapkan dapat memberi gambaran apakah algoritma ECODB dapat digunakan untuk mendeteksi outlier pada data debitur dengan atribut campuran numerik dan kategorikal dengan kasus data debitur BPR XYZ dan bagaimana pengaruh nilai k dan top N dalam proses deteksi outlier menggunakan algoritma ECODB. Setelah outlier dideteksi, pihak bank dapat menganalisa data dan outlier untuk menemukan faktor tertentu yang berpengaruh pada keunikan data debitur tersebut.

B. Instrumen Penelitian

Instrumen yang digunakan untuk melakukan penelitian ini adalah sebagai berikut : 1. Microsoft Excel Microsoft Excel digunakan untuk menghitung dan menganalisa hasil penambangan data menggunakan algoritma ECODB. Data akan mengalami pemrosesan awal dahulu kemudian akan dihitung menggunakan algoritma ECODB. Rumus – rumus perhitungan pada algoritma ECODB akan diterapkan dalam bentuk formula di Microsoft Excel. Perhitungan akan dilakukan dengan masukan k dan top N yang berbeda. 2. Grafik Grafik digunakan untuk melihat persebaran dari hasil perhitungan dengan masukan k dan top N yang berbeda. Dengan memperhatikan grafik, maka dapat diambil kesimpulan tentang pengaruh nilai nilai k dan top N dalam mendeteksi outlier mengunakan algoritma ECODB.

C. Teknik Pengumpulan Data

Data yang digunakan dalam penelitian ini adalah data debitur yang mengangsur kredit di BPR XYZ bulan Agustus 2013 sebanyak 97 data record. Data tersebut dalam format Microsoft Excel .xls. Data ini diperoleh setelah mendapat ijin pengambilan dan penggunaan data untuk penelitian dari Kepala Humas BPR XYZ. Data tersebut terdiri dari 33 atribut seperti dalam tabel berikut : Tabel 3.1 Atribut – atribut pada dataset debitur Atribut Keterangan NOREK NOPK NAMA KODE_PEKER J_USAHA NAMAIBU ALAMAT1 T_LAHIR TGL_LAHIR UMUR IDENTITAS NAMA_KTR KODE_POS JW NOM_PINJ SB No rekening debitur di bank No peminjaman debitur di bank. Nama lengkap dari debitur. Kode pekerjaan atau jenis usaha yang dilakukan debitur Jenis usaha atau pekerjaan yang dilakukan debitur. Nama gadis ibu kandung debitur. Alamat lengkap yang ditinggali debitur. Tempat lahir debitur. Tanggal lahir debitur. Umur debitur ketika melakukan peminjamankredit. Nomor KTP debitur. Nama kantortempat debitur bekerja. Kode pos tempat tinggal debitur. Jangka waktu peminjaman kredit yang dipilih debitur. Nominaljumlah kredit yang diajukan debitur. Jumlah suku bunga yang diterima debitur. JAMINAN NJOP_NT PINJ_KE TUNG_POK TUNG_BNG TUNG_POKOK TUNG_BUNGA POKOK_BLN BUNGA_BLN GAJIPENDAPATAN JML_TANGGUNGAN UANG _DIBAWA STATUS_PINJAMAN JML_SETORANBULAN Jaminan yang digunakan debitur untuk mengajukan kredit. Nilai barang yang dijadikan jaminan oleh debitur. Jumlah berapa kali debitur melakukan peminjaman di BPR XYZ. Jumlah berapa kali debitur menunggak mengangsur kredit. Jumlah berapa kali debitur menunggak mengangsur bunga. Jumlah total kredit yang ditunggak oleh debitur. Jumlah total bunga yang ditunggak oleh debitur. Jumlah kredit yang harus diangsur debitur tiap bulan. Jumlah bunga yang harus diangsur debitur tiap bulan. Gaji atau pendapatan debitur tiap bulan. Jumlah anggota keluarga yang ditanggung debitur. Jumlah uang yang dibawa pulang debitur. Keterangan apakah debitur saat mengajukan kredit telah melakukan peminjaman kredit di bank lain atau tidak. Jumlah setoran yang harus diangsur debitur di bank lain tiap bulan. KOLBI1 Status peminjaman debitur baik atau bermasalah.

D. Teknik Pengolahan Data

Sampel data debitur akan diproses terlebih dahulu dengan teknik transformasi data data transformation, pembersihan data data cleaning, dan reduksi data data reduction untuk mengatasi missing value, noisy, data yang tidak konsisten, dan pemilihan atribut yang digunakan. Selanjutnya data akan dihitung berdasarkan teori algoritma ECODB dengan menerapkan rumus perhitungan pada formula Microsoft Excel. Perhitungan akan dilakukan dengan masukan k dan top N yang berbeda. Kemudian hasil perhitungan tersebut akan dibandingkan dan dilakukan review hasil deteksi outlier oleh petugas bank untuk mengetahui kebenaran data yang dianggap mempunyai derajat tinggi sebagai outlier. Untuk membandingkan hasil deteksi outlier menggunakan algoritma ECODB, data hasil perhitungan akan ditampilkan dalam bentuk grafik. Grafik digunakan untuk melihat persebaran dari hasil perhitungan masukan k dan top N yang berbeda. Dengan memperhatikan grafik, maka dapat diambil kesimpulan tentang pengaruh nilai nilai k dan top N dalam mendeteksi outlier mengunakan algoritma ECODB.

E. Tahap – Tahap Penelitian

Langkah – langkah yang akan dilakukan untuk melakukan penelitian adalah sebagai berikut : 1. Studi kepustakaan