Perbandingan Metode Diskretisasi Dalam Model Regresi Logistik (Studi Kasus : Pembentukan Model Penskoran Kredit Bank X)

PERBANDINGAN METODE DISKRETISASI DALAM
MODEL REGRESI LOGISTIK
(Studi Kasus: Pembentukan Model Penskoran Kredit Bank X)

DIAN ILMIATI ARDITA

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Perbandingan Metode
Diskretisasi Dalam Model Regresi Logistik (Studi Kasus: Pembentukan Model
Penskoran Kredit Bank X) adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juli 2014

Dian Ilmiati Ardita
NIM G14100099

ABSTRAK
DIAN ILMIATI ARDITA. Perbandingan Metode Diskretisasi Dalam Model
Regresi Logistik (Studi Kasus: Pembentukan Model Penskoran Kredit Bank X).
Dibimbing oleh AJI HAMIM WIGENA dan I MADE SUMERTAJAYA .
Jumlah nasabah KPR pada bank X mengalami penurunan sejak Februari
2012 hingga Agustus 2012. Regresi logistik yang digunakan dalam model
penskoran kredit (credit scoring model) tidak hanya untuk mengetahui faktorfaktor apa saja yang berpengaruh terhadap keputusan pengambilan KPR, tetapi
dapat diketahui pula seberapa besar nilai skor di setiap kategori peubah penjelas.
Data yang digunakan dalam model penskoran kredit haruslah data kategorik. Data
bertipe kontinu perlu didiskretisasi agar menjadi data kategorik. Proses
diskretisasi dapat menggunakan metode chimerge (model I) dan metode dengan
selang yang sama (equal with interval) (model II). Berdasarkan analisis regresi
logistik peubah yang berpengaruh terhadap respon adalah jenis kelamin, status

pekerjaan, pendidikan, tanggungan, jenis pekerjaan, usia, dan pendapatan. Hasil
tabel ketepatan klasifikasi, menunjukkan bahwa model I memiliki kemampuan
untuk pengklasifikasian yang lebih baik dibandingkan dengan model II, sehingga
kartu skor (scorecard) dibuat berdasarkan pada model I.
Kata kunci: chimerge, credit scoring, equal with interval, regresi logistik,
scorecard

ABSTRACT
DIAN ILMIATI ARDITA. Comparing Discretization Method In Logistic
Regression Model (Case Study: Establishment of Credit Scoring Model Bank X).
Supervised by AJI HAMIM WIGENA and I MADE SUMERTAJAYA.
The number of KPR customers of bank X decreased since February 2012
until August 2012. Logistic regression which is used in credit scoring model is not
only able to identify the significance factors but also to know the scoring value in
each category of explanatory variable. The data used in credit scoring model must
be categorical data. Continuous data needs to be discretized in order to get
categorical data. Discretization process can use chimerge method (model I) and
equal with interval method (model II). Based on logistic regression, the factors
that affect the respon are sex, employment status, education, occupation, age, and
income. Correct classification table, shows that model I is better to classify than

model II, therefore the scorecard is made based on model I.
Keywords: chimerge, credit scoring, equal with interval, logistic regression,
scorecard

PERBANDINGAN METODE DISKRETISASI DALAM
MODEL REGRESI LOGISTIK
(Studi Kasus: Pembentukan Model Penskoran Kredit Bank X)

DIAN ILMIATI ARDITA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR

2014

Judul Skripsi : Perbandingan Metode Diskretisasi Dalam Model Regresi Logistik
(Studi Kasus : Pembentukan Model Penskoran Kredit Bank X)
Nama
: Dian Ilmiati Ardita
NIM
: G14100099

Disetujui oleh

Dr Ir Aji Hamim Wigena, MSc
Pembimbing I

Dr Ir I Made Sumertajaya, MSi
Pembimbing II

Diketahui oleh

Dr Anang Kurnia, MSi

Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Sholawat serta
salam semoga selalu tercurahkan kepada pimpinan umat nabi Muhammad SAW
beserta keluarga, sahabat, dan umatnya.
Terima kasih penulis ucapkan kepada ayah, ibu, kakak, adik, serta semua
keluarga penulis atas doa, semangat, dan dukungannya yang tanpa henti kepada
penulis, serta Bapak Dr Ir Aji Hamim Wigena, MSc dan Bapak Dr Ir I Made
Sumertajaya, MSi selaku pembimbing, serta Bapak Bagus Sartono, M.Si yang
telah banyak memberi saran. Di samping itu, penghargaan penulis sampaikan
kepada Bapak Hendrayana Kartiman, Ibu Utami Rahayu, Ibu Nia Sofura beserta
staf SAS Institute Indonesia, serta Bapak dan Ibu dosen beserta staf Departemen
Statistika yang telah membantu selama proses pembuatan skripsi. Ungkapan
terima kasih juga disampaikan kepada rekan-rekan statistika angkatan 47 dan
angkatan 46 yang telah memberi sumbangan pikiran dan bantuannya selama ini.
Semoga karya ilmiah ini bermanfaat.


Bogor, Juli 2014
Dian Ilmiati Ardita

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN

1


Latar Belakang

1

Tujuan Penelitian

2

TINJAUAN PUSTAKA

2

Lembaga Keuangan Bank

2

Diskretisasi

2


Weight Of Evidence (WOE)

4

Information Value

4

Regresi Logistik

5

Model Penskoran Kredit (Credit Scoring Model)

6

Validasi Model

7


METODE

8

Data

8

Metode Analisis

8

HASIL DAN PEMBAHASAN
Eksplorasi Data

9
9

Deskripsi WOE Peubah Kontinu


11

Deskripsi WOE Peubah Kategorik

13

Information Value

16

Analisis Regresi Logistik

17

Perbandingan Model

18

Ilustrasi Penilaian Kredit


19

SIMPULAN DAN SARAN

20

Simpulan

20

Saran

21

DAFTAR PUSTAKA

21

LAMPIRAN

22

RIWAYAT HIDUP

34

DAFTAR TABEL
1. Tabel ketepatan klasifikasi
2. Diskretisasi chimerge peubah pendapatan
3. Diskretisasi dengan selang yang sama peubah pendapatan
4. Diskretisasi chimerge peubah usia
5. Diskretisasi dengan selang yang sama peubah usia
6. Nilai WOE peubah jenis kelamin
7. Nilai WOE peubah status pekerjaan
8. Nilai WOE peubah status pernikahan
9. Nilai WOE peubah pendidikan terakhir
10. Nilai WOE peubah Tanggungan
11. Nilai Inv didiskretisasi chimerge
12. Nilai Inv didiskretisasi dengan selang yang sama
13. Nilai statistik uji G, nilai-P
14. Nilai-P uji Wald dan dugaan koefisien parameter
15. Tabel ketepatan klasifikasi data training
16. Tabel ketepatan klasifikasi data validasi

8
12
12
13
13
13
14
14
15
15
16
16
17
17
18
18

DAFTAR GAMBAR
1. Jumlah nasabah kredit KPR (Januari-Agustus 2012)

10

DAFTAR LAMPIRAN
1.
2.
3.
4.
5.

Daftar peubah penjelas dan keterangannya
Distribusi grafik nasabah
Nilai WOE peubah jenis pekerjaan
Hasil kartu skor pada model II
Simulasi skor calon nasabah

22
23
30
31
33

PENDAHULUAN
Latar Belakang
Bank X merupakan salah satu lembaga keuangan yang ada di Indonesia.
Selama lebih dari 140 tahun bank X memberikan kontribusi dalam dunia
perbankan dan perekonomian Indonesia. Kredit Pemilikan Rumah (KPR)
merupakan suatu produk unggulan dari bank X, namun pada bulan Februari
sampai bulan Agustus tahun 2012 mengalami penurunan jumlah nasabahnya.
Bulan Januari ke Februari mengalami peningkatan sebesar 31.46%, namun saat
bulan Maret mengalami penurunan sebesar 1.96%. penurunan jumlah nsabah
pengambil KPR kian menurun disetiap bulannya. Penurunan nasabah pengambil
KPR terbesar terjadi saat bulan Juni ke bulan Juli sebesar 51.17%. Pada bulan
Agustus 2012 nasabah yang mengambil KPR hanya sebanyak 71 nasabah. Bank X
perlu melakukan suatu usaha untuk mengetahui faktor-faktor apa saja yang
mempengaruhi keputusan nasabah dalam pengambilan KPR.
Keputusan nasabah dalam mengambil KPR di bank X diduga dipengaruhi
oleh beberapa faktor. Faktor-faktor tersebut diantaranya adalah jenis kelamin,
status pekerjaan, status pernikahan, pendidikan, tanggungan, jenis pekerjaan, usia,
dan pendapatan. Model penskoran kredit (credit scoring model) dengan regresi
logistik dapat digunakan untuk mengetahui faktor-faktor apa saja yang
berpengaruh nyata terhadap keputusan nasabah dalam pengambilan KPR. Model
penskoran kredit menghasilkan suatu kartu skor (scorecard), yang berisikan nilai
skor di setiap kategori peubah penjelas. Saat menggunakan kartu skor, bank dapat
menentukan nasabah seperti apa yang akan ditawari KPR berdasarkan skor pada
kartu skor sehingga tidak perlu semua nasabah ditawari KPR. Hal tersebut
menjadikan bank dapat menghemat waktu pengerjaan aplikasi kredit dan
menghemat biaya.
Saat membangun model penskoran kredit pada data nasabah yang
digunakan haruslah bertipe kategorik. Data peubah yang ada pada penelitian ini
memiliki skala pengukuran kategorik dan numerik, sehingga data yang bertipe
numerik perlu dilakukan diskretisasi. Kelebihan dari proses diskretisasi dapat
memberikan kemudahan bagi pihak bank, karena data nasabah yang ada menjadi
kategorik, hal tersebut mempermudah bank untuk memberikan skor pada
nasabahnya sehingga mampu mengurangi waktu proses pengerjaan aplikasi kredit.
Pada penelitian ini proses diskretisasi dilakukan dengan dua metode yaitu
chimerge dan dengan selang yang sama (equal with interval). Metode diskretisasi
chimerge sebelumnya pernah dilakukan oleh Stephanie (2008) untuk
mendiskretisasi data kredit ritel. Menurut Han dan Kamber (2006) chimerge
adalah metode diskretisasi yang algoritmanya menggunakan statistik khi kuadrat
untuk mendiskretisasi peubah numerik, sedangkan metode dengan selang yang
sama membagi selang-selang kategori dengan jarak yang sama berdasarkan
subjektifitas peneliti.
Proses diskretisasi dilakukan dengan dua metode yaitu chimerge dan dengan
selang yang sama, untuk mengetahui metode diskretisasi mana yang lebih baik,
maka pada penelitian ini akan dilakukan kajian perbandingan model. Model
pertama adalah model regresi logistik saat peubah penjelas bertipe numerik

2
didiskretisasi menggunakan chimerge dibandingkan dengan model kedua adalah
model regresi logistik saat peubah penjelas bertipe numerik didiskretisasi
menggunakan dengan selang yang sama.
Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Menentukan faktor-faktor yang berpengaruh terhadap peubah respon
menggunakan regresi logistik.
2. Membandingan model hasil diskretisasi yang selanjutnya dipilih untuk
membuat kartu skor berdasarkan model yang terbaik.

TINJAUAN PUSTAKA
Lembaga Keuangan Bank
Pengertian bank menurut Undang-Undang Nomor 10 tahun 1998 tentang
perbankan (penggantian Undang-Undang Nomor 7 tahun 1997) adalah badan
usaha yang menghimpun dana dari masyarakat dalam bentuk simpanan dan
menyalurkan kepada masyarakat dalam bentuk kredit dan bentuk-bentuk lainnya
dalam rangka meningkakan taraf hidup rakyat banyak.
Berdasarkan pengertian tersebut dapat disimpulkan bahwa yang dimaksud
dengan bank adalah lembaga keuangan yang menghimpun dana dari masyarakat
yang kelebihan dana dan menyalurkan lagi kepada masyarakat yang kekurangan
dana, juga memberikan pelayanan jasa di bidang-bidang lainnya, seperti mengirim
uang (wesel/transfer), pemindah bukuan (giro), dan menyediakan jaminan bank
(bank guarantee) (Supriatna et al. 2008).
Bank memberikan bentuk layanan produk kredit. Pengertian kredit
menurut Undang-Undang No. 7 Tahun 1992 tentang perbankan adalah penyediaan
uang atau tagihan yang dapat dipersamakan dengan itu, berdasarkan persetujuan
kesepakatan pinjam-meminjam antara bank dengan pihak lain yang mewajibkan
pihak meminjam untuk melunasi hutangnya setelah jangka waktu tertentu dengan
jumlah bunga, imbalan atau pembagian hasil keuntungan. Salah satu jenis produk
kredit yang bank tawarkan adalah kredit Kepemilikan Rumah. Kredit
Kepemilikan Rumah (KPR) adalah kredit pemilikan rumah dari suatu bank yang
diberikan
kepada
perorangan
untuk
keperluan
pembelian
rumah
tinggal/apartemen/ruko/rukan yang dijual melalui pembangun (developer) atau
bukan pembangun (non developer).
Diskretisasi
Proses diskretisasi merupakan proses pengkategorian data kuantitatif.
Menurut Kotsiantis dan Kanellopoulos (2006) teknik ini digunakan untuk
mereduksi jumlah nilai suatu peubah yang berskala numerik dengan cara
memilah-milah selang nilai data peubah ke dalam sub-sub selang nilai. Empat
Tahapan diskretisasi, yaitu :

3
1. Mengurutkan nilai kontinu yang akan didiskretisasi.
2. Mengevaluasi titik potong sebagai pemisah selang atau penggabung selang
yang berdekatan.
3. Berdasarkan kriteria tertentu dilakukan pemisahan atau penyatuan selang nilai.
4. Menghentikan proses pada titik tertentu.
Salah satu metode diskretisasi adalah tersupervisi dan tidak tersupervisi. Metode
tersebut dipilih dikarenakan lebih mudah dibandingkan metode lainnya. Metode
tersupervisi menggunakan informasi kelas pada peubah respon saat melakukan
proses diskretisasi, sedangkan metode tidak tersupervisi tidak membutuhkan
peubah respon sebagai dasar diskretisasinya. Berdasarkan perbedaan itulah ingin
dilihat metode mana yang lebih baik dalam membangun model regresi logistik,
metode yang menggunakan peubah respon ataukah metode yang tidak
menggunakan peubah respon.
Metode Diskretisasi Tersupervisi
Metode tersupervisi adalah metode diskretisasi dimana algoritma metode
ini hanya bisa dijalankan jika terdapat sebuah peubah kategorik sebagai peubah
respon yang dijadikan dasar diskretisasinya. Metode ini menggunakan informasi
kelas pada peubah respon ketika memilih titik-titik potong alat pemisah antar
kategori. Contoh metode diskretisasi tersupervisi : IRD, chimerge, entropy, zeta,
ID3. Pada penelitian ini metode tersupervisi yang digunakan adalah chimerge.
Chimerge adalah metode diskretisasi peubah numerik yang menggunakan
statistik khi kuadrat. Hipotesis nol dari metode chimerge ini adalah dua selag yang
berdekatan pada peubah penjelas saling bebas terhadap peubah respon. Jika
hipotesis diterima maka selang yang berdekatan akan digabung. Menurut Han dan
Kamber (2006) proses chimerge yakni pada tahapan awal disetiap nilai pada
peubah numerik dijadikan sebagai satu interval. Uji χ2 digunakan pada setiap
pasang interval yang berdekatan. Sepasang interval yang berdekatan memilki nilai
χ2 hitung lebih kecil dari χ2 tabel maka kedua interval yang berdekatan tersebut
akan digabungkan. Proses ini dilakukan secara rekursif hingga kriteria
penghentian algoritma χ2 terjadi. Pertama, kriteria penghentian terjadi saat proses
penggabungan interval berhenti jika nilai χ2 hitung di semua pasang selang yang
berdekatan sudah lebih besar dari batas yang dipengaruhi oleh level signifikansi.
Kedua, jumlah banyaknya interval tidak boleh melebihi banyaknya maksimum
selang yang telah ditentukan. Perhitungan rumus χ2 di berikan sebagai berikut :
2

k

2

χ =∑∑

ij

i=1 j=1

K = jumlah kelas
Aij = jumlah data aktual selang ke-i, kelas ke-j
Eij = frekuensi harapan
Eij = (Rj * Cj)/N
Ri = jumlah data aktual selang ke-i
Cj = jumlah data aktual kelas ke-j
N = total data aktual

ij
ij

2

4

Metode Diskretisasi Tidak Tersupervisi
Metode diskretisasi tidak tersupervisi adalah metode yang tidak
membutuhkan peubah respon yang dijadikan sebagai dasar diskretisasinya.
Metode ini membagi interval nilai kontinu berdasarkan pertimbangan penulis.
Pertimbangan yang diambil bersifat subjektif dimana pengguna menentukan
mekanisme diskretisasinya. Contoh : dengan selang yang sama (equal with
interval) dan dengan frekuensi selang yang sama (equal frequency interval).
Menurut Kotsiantis dan Kanellopoulos (2006), metode dengan selang yang sama
membagi selang kategori dengan jarak yang sama.
Weight Of Evidence (WOE)
Perhitungan nilai Weight Of Evidence (WOE) dilakukan disetiap kategori
peubah penjelas kemudian nilai awal peubah penjelas ditransformasi ke dalam
WOE sehingga peubah penjelas yang berisikan nilai Weight Of Evidence (WOE)
yang akan dijadikan input dalam regresi logistik. Fungsi dari WOE adalah untuk
membangun model penskoran kredit. WOE untuk setiap kategori didefinisikan
sebagai berikut :
f j
j =(
)
f j
n j
= Persentase nasabah yang mengambil KPR dalam
dimana f j = 100
n

f j = 100

n j
n

kategori ke-j
= Persentase nasabah yang tidak mengambil KPR

dalam kategori ke-j
Jumlah nasabah yang mengambil KPR kategori ke-j
Total nasabah yang mengambil KPR
Jumlah nasabah yang tidak mengambil KPR kategori ke-j
Total nasabah yang tidak mengambil KPR
Information Value
Information value (Inv) digunakan untuk mengukur tingkat prediksi dan
asosiasi peubah penjelas setelah didiskretisasi terhadap peubah respon. Inv umum
digunakan untuk menyeleksi peubah penjelas yang berpotensi untuk dimasukan
kedalam model dengan nilai batas tertentu. Semakin besar nilai Inv maka semakin
besar peluang peubah penjelas untuk masuk kedalam model. Information Value
(Inv) dirumuskan sebagai berikut :
q

nv = ∑
j=1

f j f j
100

j

WOE(j) = WOE dari tiap kategori ke-j dari satu peubah penjelas
Berdasarkan SAS Institute Inc (2012) Tingkat prediksi Inv dibagi kedalam
beberapa kategori, yakni :
1. Jika Inv ≤ 0.02 maka peubah penjelas dikatakan tidak prediktif.

5
2. Jika 0.02 < nv ≤ 0.1 nv maka peubah penjelas memiliki tingkat prediksi
yang lemah.
3. Jika nilai 0.1 < Inv ≤ 0.3 maka peubah penjelas memliki tingkat prediksi
yang medium.
4. Jika Inv > 0.3 memiliki nilai prediksi yang kuat.
Regresi Logistik
Regresi logistik sebenarnya mirip dengan analisis regresi berganda, hanya
peubah responnya merupakan peubah dummy (0 dan 1). Model regresi logistik
merupakan model dasar bagi analisis data berskala biner. Peubah respon Y
mengikuti sebaran Bernouli dengan fungsi sebaran peluang sebagai berikut
(Hosmer dan Lemeshow 2000; Agresti 2002; Kantardzic 2003; ’Connell dan
Ann 2006 ) :
1 y
f =y = y 1
dengan y Є{0,1} atau bernilai ‘ya’ atau ‘tidak’ dan adalah peluang terjadinya
kejadian sukses (y=1) sedangkan (1- adalah peluang kejadian gagal. Secara
umum model respon biner pada regresi untuk p peubah bebas yang memiliki skala
kategorik atau kontinu adalah
|x
y=
dengan adalah komponen acak.
Model regresi logistik biner digunakan untuk melihat apakah peubah respon
yang berskala kategorik dipengaruhi oleh peubah penjelas yang berskala numerik
atau kategorik. Bentuk umum model peluang regresi logistik dengan p peubah di
rumuskan sebagai berikut :
exp 0
x
x
1 1
p p
x =
1 exp 0
x
x
1 1
p p
dengan
x adalah peluang suksessuatu kejadian yang ditentukan oleh x
tertentu.Transformasi logit sebagai fungsi x didefinisikan sebagai :
x
]= 0
x
x
g x = ln [
1 1
k k
1
x
dengan { x / 1- x } merupakan resiko dari y=1 untuk x tertentu.
Model regresi logistik menggunakan metode kemungkinan maksimum
untuk menduga parameter-parameternya. Fungsi kemungkinan maksimum yang
diperoleh jika antara amatan yang satu dengan amatan yang lain diasumsikan
bebas adalah :
l

=∏
i=1

xi

yi

1

xi

1 yi

Parameter i diduga dengan memaksimumkan persamaan diatas. Pendekatan
logaritma dilakukan untuk memudahkan perhitungan, sehingga fungsi logkemungkinan sebagai berikut :
L = ln l
(1 - yi ) ln[1 - xi )
= ∑ {yi ln xi

6
Nilai dugaan i dapat diperoleh dengan membuat turunan pertama L(
terhadap i kemudia disamakan dengan nol, sehingga merupakan penduga
kemungkinan maksimum bagi parameter-parameter model dengan cara metode
kuadrat terkecil terboboti secara iteratif (Hosmer dan Lemeshow 2000).
Uji yang dilakukan terhadap parameter model untuk memeriksa apakah
peubah penjelas berpengaruh terhadap model maka dilakukan statistik uji-G.
Menurut Hosmer dan Lemeshow (2000) statistik tersebut merupakan rasio
kemungkinan maksimum yang digunakan untuk melihat pengaruh peranan peubah
penjelas didalam model secara bersama-sama. Statistik uji-G didefinisikan sebagai
berikut :
L0
= 2ln
Lp
dengan L0 adalah fungsi kemungkinan tanpa peubah penjelas dan Lp adalah fungsi
kemungkinan dengan p peubah penjelas. Hipotesis yang diuji adalah :
H0: 1= 2= = p=0
H1: minimal ada satu i≠0, i=1,2, p. Hipotesis nol ditolak jika > χ2p α .
Pengujian parameter secara parsial menggunakan uji Wald. Didefinisikan sebagai
berikut :
̂
i
=
S ̂i
Hipotesis yang diuji adalah :
H0: i=0
H1: i≠0, i=1,2, p. Hipotesis nol ditolak jika | | > Zα/2.
Interpretasi koefisien untuk model regresi logistik biner dapat dilakukan dengan
menggunakan nilai rasio oddsnya. Rasio odds didefinisikan sebagai :
̂
( ̂)
Interpretasi dari rasio odds ini adalah untuk peubah penjelas X yang berskala
nominal, yaitu kecenderungan untuk =1 pada X=1 sebesar Ψ kali dibandingkan
pada X=0.
Model Penskoran Kredit (Credit Scoring Model)
Model penskoran kredit menghasilkan suatu kartu skor (scorecard), yang
berisikan nilai skor di setiap kategori peubah penjelas. Menurut Koh et al. (2006)
kelebihan dari penskoran kredit tidak hanya untuk bank saja tetapi juga untuk
nasabah, contohnya penskoran kredit mampu mereduksi diskriminasi karena
penskoran kredit memberikan analisis yang objektif. Penskoran kredit
menghasilkan suatu hasil perhitungan statistik dari setiap kategori pada setiap
peubah penjelas yang dapat digunakan untuk memisahakan apakah suatu nasabah
‘baik’ atau ‘buruk’ atau dalam penelitian ini ‘perlu ditawari KPR’ atau ‘Tidak
perlu ditawari KPR’. Saat pembentukan kartu skor diperlukan adanya teknik
penskalaan. Teknik ini mengacu pada jangkauan dan format skor dalam kartu skor
(Siddiqi 2006). Teknik penskalaan ini tidak berpengaruh terhadap tingkat prediksi
kartu skor, teknik penskalaan digunakan agar pengguna lebih mudah memahami
data yang bertipe diskret. Penskalaan dihitung dengan menggunakan persamaan
berikut :
score = offset factor ln odds

7
Nilai factor dan offset dapat diperoleh jika telah didefinisikan :
1. nilai skor yang diinginkan untuk odds tertentu
2. nilai pdo (points to double the odds), yaitu besarnya kenaikan skor yang
menyebabkan odds-nya menjadi dua kali lipat
sehingga
score = offset factor ln odds
score pdo = offset factor ln 2 odds
pdo = factor ln 2
pdo
factor =
ln 2
offset=score factor ln odds
Misal, kartu skor yang diinginkan memiliki odds of 50:1 pada nilai 600 dan oddsnya akan dua kali lipat kalau skornya bertambah 20 points (pdo = 20). Maka
diperoleh :
20
factor =
=28.853
ln 2
offset = 600

28.853

ln 50

= 487.123

Perhitungan skor untuk setiap kategori pada satu peubah penjelas, disajikan
sebagai berikut :
a
offset
factor
j
i
n
n
dengan WOE = Nilai WOE pada setiap kategori ke-j peubah penjelas.
= Koefisien regresi logistik untuk setiap peubah penjelas ke-i.
i
α
= Nilai intercept pada regresi logistik.
n
= Banyaknya peubah penjelas.
Validasi Model
Validasi model memiliki fungsi untuk mengukur sejauh mana hasil model
mendekati kondisi sebenarnya. Suatu model dapat dikatakan valid jika model
tersebut semakin dekat dengan data aktual serta mampu menggambarkan kondisi
sesungguhnya. Salah satu metode yang digunakan untuk validasi adalah tabel
ketepatan klasifikasi.
Berdasarkan SAS Inc (2012a) tabel ketepatan klasifikasi (correct
classification table) dapat digunakan untuk mengetahui ketepatan prediksi dari
model yang dibangun. Tabel ketepatan klasifikasi merupakan tabel frekuensi dua
arah antara data aktual dengan data prediksi. Tabel 1 merupakan tabel ketepatan
klasifikasi.

8
Tabel 1 Tabel Ketepatan klasifikasi
Amatan

Prediksi
0

1

0

Benar (-) Spesifisitas

Salah (+)

1

Salah (-)

Benar (+) Sensitifitas

Tabel ketepatan klasifikasi memiliki tiga jenis presisi yaitu presisi total
ketepatan klasifikasi, spesifisitas, dan sensitifitas. Presisi total ketepatan
klasifikasi adalah perbandingan jumlah spesifisitas dan sensitifitas terhadap
banyaknya contoh. spesifisitas adalah kemampuan model dalam memprediksi
nasabah tidak mengambil KPR maka diduga sebagai nasabah tidak mengambil
KPR. Sensitifitas adalah kemampuan model dalam memprediksi nasabah
pengambil KPR maka diduga sebagai nasabah pengambil KPR. Keakuratan
klasifikasi diukur berdasarkan sensitifitas dan spesifisitas sehingga perlu dicari
batasan dugaan peluang yang dapat memprediksi sensitifitas dan spesifisitas
dengan baik.

METODE
Data
Data yang digunakan dalam penelitian ini merupakan data sekunder nasabah
yang terdapat pada bank X pada tahun 2012. Total keseluruhan nasabah yang
terambil menjadi sampel adalah 499.989, sebanyak 1442 digunakan untuk data
training (data untuk membangun model regresi logistik), dan sebanyak 744
digunakan untuk validasi. Peubah penjelas yang digunakan yaitu, jenis kelamin,
status pekerjaan, status pernikahan, pendidikan, tanggungan, jenis pekerjaan, usia,
dan pendapatan. Penjelasan pada setiap peubah dapat dilihat pada Lampiran 1,
sedangkan peubah respon adalah status nasabah dalam pengambilan KPR, yakni
mengambil KPR (1) dan tidak mengambil KPR (0).
Metode Analisis
Langkah-langkah metode penelitian :
1. Membagi data menjadi 2 bagian, yakni data training dan data validasi.
Persentase untuk data training sebesar 66% dan persentase untuk data
validasi sebesar 34%. Teknik pengambilan sampel dilakukan dengan
metode penarikan contoh acak sederhana dengan memperhatikan proporsi
yang ada disetiap kategori peubah penjelas. Pada data training dilakukan
penarikan contoh sebanyak 1442 data, dengan nasabah tidak mengambil
KPR sebanyak 667 dan nasabah mengambil KPR sebanyak 775. Pada data
validasi dilakukan penarikan contoh sebanyak 744 data, dengan nasabah
tidak mengambil KPR sebanyak 371 dan nasabah mengambil KPR
sebanyak 373.

9
2. Melakukan pembersihan data. Proses pembersihan data terhadap peubah
pendapatan, mereduksi peubah penjelas yang digunakan dan
menghilangkan observasi yang terdapat data hilang didalamnya. Pada
peubah pendapatan terdapat banyak sekali nilai pendapatan suatu nasabah
yang hanya sebesar 1, karena nilai tersebut tidak logis sehingga
diperlukannya pembersihan data, selain itu data yang digunakan pada
penelitian ini adalah nasabah yang besarnya pendapatan perbulan antara 2
juta rupiah hingga 25 juta rupiah. Pereduksian peubah penjelas dilakukan
karena terdapat banyak sekali data hilang di dalam peubah-peubah
penjelas tersebut.
3. Melakukan eksplorasi data untuk data keseluruhan, data training, dan data
validasi.
4. Melakukan diskretisasi data training pada peubah penjelas yang memiliki
skala numerik dengan metode chimerge dan metode dengan selang yang
sama. Berdasarkan kedua proses diskretisasi tersebut dibangun 2 model.
Model I adalah diskretisasi data numerik dengan metode chimerge dan
model II merupakan diskretisasi data numerik dengan metode dengan
selang yang sama.
5. Berdasarkan hasil diskretisasi dilakukan perhitungan nilai WOE untuk
setiap kategori pada peubah penjelas yang berfungsi sebagai input untuk
membangun model penskoran kredit.
6. Menghitung nilai Information Value (Inv) untuk memilih peubah penjelas
hasil diskretisasi yang memiliki pengaruh besar terhadap peubah respon
7. Melihat peubah penjelas mana saja yang perlu dimasukan ke dalam model
berdasarkan nilai Inv.
8. Berdasarkan nilai WOE pada setiap peubah penjelas, digunakan untuk
membangun model regresi logistik, untuk mengetahui faktor-faktor apa
saja yang berpengaruh nyata terhadap respon.
9. Membandigkan model I dan model II dengan nilai tabel ketepatan
klasifikasi berdasarkan data training dan data validasi.
10. Berdasarkan hasil nilai tabel ketepatan klasifikasi dipilih salah satu dari
kedua model yang lebih baik untuk dilakukan perhitungan nilai kartu skor.

HASIL DAN PEMBAHASAN
Eksplorasi Data
Data yang ada pada bank X setelah dilakukan eksplorasi data untuk melihat
gambaran nasabah yang mengambil KPR di tahun 2012 dari bulan Januari hingga
Agustus disajikan pada Gambar 1. Pada Gambar 1 terlihat bahwa terjadi
penurunan nasabah yang mengambil KPR hampir disetiap bulannya. Kenaikan
jumlah pengambil KPR hanya terjadi pada bulan Februari sebesar 31.46%
sedangkan dibulan lainnya mengalami penurunan. Persentase penurunan jumlah
nasabah pengambil KPR semakin membesar dari bulan Maret hingga Mei.
Penurunan nasabah pengambil KPR terbesar terjadi saat bulan Juni ke bulan Juli
sebesar 48.82%. Pada bulan Agustus 2012 nasabah pengambil KPR hanya

10
sebanyak 71 nasabah. Sementara itu, penurunan suku bunga pinjaman yang
dilakukan oleh BI Rate yaitu sebesar 5.750% sejak Februari 2012 berdampak pada
penurunan suku bunga dasar kredit (SBDK) (Bangun 2012). Penurunan tersebut
dilakukan oleh beberapa bank salah satunya adalah bank X. Bank X menurunkan
suku bunga dasar kredit KPR namun hal ini tidak sejalan dengan bertambahnya
nasabah yang mengambil KPR sehingga perlu diadakannya suatu upaya untuk
meningkatkan kembali nasabah yang mengambil KPR. Salah satu caranya adalah
dengan melihat faktor-faktor apa saja yang mempengaruhi suatu nasabah
mengambil KPR.
350
Jumlah Nasabah

300
250
200
150
100
50
0

Bulan

Gambar 1 Jumlah nasabah kredit KPR (Januari-Agustus 2012)
Lampiran 2 menyajikan grafik untuk data keseluruhan, data training, dan
data validasi. Pola sebaran data keseluruhan, data training, dan data validasi
memiliki pola sebaran yang tidak jauh berbeda sehingga dapat dikatakan
pengambilan contoh untuk data training dan data validasi dapat
mempresentasikan data keseluruhan.
Lampiran 2 terlihat bahwa pada data awal untuk peubah jenis kelamin,
nasabah pria lebih banyak mengambil KPR dibandingkan nasabah wanita.
Sebanyak 12884 nasabah pria mengambil KPR dan nasabah wanita yang
mengambil KPR sebanyak 4936. Pada peubah status pekerjaan, nasabah yang
berstatus sebagai karyawan tetap lebih banyak mengambil KPR dibandingkan
status lainnya sebanyak 15087, sedangkan nasabah yang berstatus karyawan
honorer dan karyawan paruh waktu sedikit sekali yang mengambil KPR, masing
masing hanya sebanyak 6 nasabah dan 4 nasabah saja. Pada peubah status
pernikahan nasabah yang telah menikah memiliki jumlah terbanyak sebagai
nasabah yang mengambil KPR maupun nasabah yang tidak mengambil KPR,
masing-masing sebesar 14061 nasabah dan 359556 nasabah. Pada peubah
pendidikan terlihat bahwa disetiap kategorinya lebih banyak nasabah yang tidak
mengambil KPR dibandingkan nasabah yang mengambil KPR. Nasabah yang
berpendidikan S1 adalah nasabah terbanyak yang mengambil KPR, ada sebanyak
9265 nasabah, namun nasabah terbanyak yang tidak mngambil KPR juga berada
dikategori S1. Pada peubah tanggungan kategori nasabah yang tidak memiliki
tanggungan adalah nasabah yang paling banyak mengambil KPR ada sebanyak

11
6413 nasabah, namun ada sebanyak 205290 nasabah tersebut yang tidak
mengambil KPR. Jumlah tanggungan yang semakin besar mengindikasikan
terjadinya penurunan jumlah nasabah yang mengambil KPR.

Deskripsi WOE Peubah Kontinu
Proses diskretisasi dilakukan terlebih dahulu sebelum melakukan deskripsi
WOE pada peubah kontinu. Diskretisasi data menggunakan metode chimerge dan
dengan selang yang sama dilakukan hanya pada peubah numerik saja yakni
peubah pendapatan dan usia. Algoritma metode chimerge menggunakan statistik
khi kuadrat untuk mendiskretisasi peubah numerik. Hipotesis nol dari metode
chimerge ini adalah dua selang yang berdekatan pada peubah penjelas saling
bebas terhadap peubah respon. Selang yang berdekatan akan digabung jika
hipotesis tersebut diterima. Kriteria penghentian algoritmanya dengan nilai
maksimum interval observasi dalam kategori sebesar 20 dan taraf nyata yang
digunakan sebesar 0.05, sedangkan diskretisasi dengan dengan selang yang sama
adalah diskretisasi yang membagi jarak yang sama pada setiap kategori dalam satu
peubah penjelas.
Peubah usia hasil diskretisasi menggunakan metode chimerge diperoleh 6
kategori, agar metode dengan selang yang sama memiliki jumlah kategori yang
sama dengan chimerge maka diskretisasi metode dengan selang yang sama
membagi 6 kategori dengan jarak yang sama disetiap kategorinya. Pada peubah
pendapatan hasil diskretisasi menggunakan metode chimerge diperoleh 9 kategori
dan pada metode dengan selang yang sama
untuk peubah pendapatan
menghasilkan 9 kategori dengan jarak yang sama disetiap kategeorinya.
Setelah dilakukan diskretisasi, kemudian dilakukan perhitungan nilai Weight
Of Evidence (WOE). Setelah seluruh peubah penjelas ditransformasikan ke dalam
WOE, maka peubah penjelas dengan nilai WOE inilah yang akan dijadikan
sebagai input dalam regresi logistik. Salah satu kelebihan menggunakan WOE
adalah dengan melihat tanda nilai WOE. Nilai WOE yang negatif menunjukkan
proporsi respon yang berkategori nol jauh lebih banyak dibandingkan proporsi
respon yang berkategori satu dalam satu kategori peubah yang sama. WOE yang
memiliki nilai positif mengindikasikan bahwa kategori tersebut memiliki proporsi
respon yang berkategori satu lebih banyak dibandingkan proporsi respon yang
berkategori nol dalam satu kategori yang sama. Hasil diskretisasi pada peubah
pendapatan dan usia menggunakan metode chimerge dan dengan selang yang
sama disajikan pada Tabel 2 sampai 5.

12
Tabel 2 Diskretisasi chimerge peubah pendapatan
Kategori
WOE
Exp(WOE)
Rp2 000 000 – Rp3 700 000
-0.338
0.713
Rp3 750 000 – Rp4 850 000
0.873
2.394
Rp4 875 000 – Rp6 000 000
-0.570
0.566
Rp6 042 100 – Rp9 450 000
0.782
2.186
Rp9 500 000 – Rp10 610 000
-0.573
0.564
Rp10 645 342 – Rp15 179 100
0.577
1.780
Rp15 459 600 – Rp19 500 000
1.518
4.561
Rp19 851 000 – Rp24 000 000
0.381
1.463
Rp24 815 000 – Rp25 000 000
-0.464
0.629
Tabel 3 Diskretisasi dengan selang yang sama peubah pendapatan
Kategori
Rp2 000 000 – Rp4 555 556
Rp4 555 557 – Rp7 111 112
Rp7 111 113 – Rp9 666 668
Rp9 666 669 – Rp12 222 224
Rp12 222 224 – Rp14 777 780
Rp14 777 781 – Rp17 333 336
Rp17 333 337 – Rp19 888 892
Rp19 888 893 – Rp22 444 448
Rp22 444 449 – Rp25 000 000

WOE
-0.111
-0.266
0.826
-0.108
0.799
0.775
1.149
0.313
-0.299

Exp(WOE)
0.895
0.767
2.285
0.898
2.223
2.170
3.156
1.367
0.742

Tabel 2 kategori dengan selang [Rp15 459 600 - Rp19 500 000] memiliki
nilai dari exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut
memiliki proporsi nasabah pengambil KPR 4.561 kali dibandingkan proporsi
nasabah yang tidak mengambil KPR dalam satu kategori yang sama. Kategori
dengan selang [Rp9 500 000 – Rp10 610 000] memiliki nilai dari exp(WOE) yang
dapat diinterpretasikan bahwa kategori tersebut memiliki proporsi nasabah yang
tidak mengambil KPR 1.773 kali dibandingkan proporsi nasabah yang mengambil
KPR dalam satu kategori yang sama. Berdasarkan Tabel 2 dapat diketahui bahwa
selang [Rp15 459 600 - Rp19 500 000] memiliki proporsi nasabah yang
mengambil KPR lebih banyak dibanding yang tidak mengambil KPR, sedangkan
pada selang [Rp9 500 000 – Rp10 610 000] memiliki proporsi nasabah yang tidak
mengambil KPR lebih banyak dibanding yang mengambil KPR.
Tabel 3 nasabah yang memiliki selang pendapatan [Rp7 111 113 – Rp9 666
668] memiliki nilai dari exp(WOE) yang dapat diinterpretasikan bahwa kategori
tersebut memiliki proporsi nasabah pengambil KPR 2.285 kali dibandingkan
proporsi nasabah yang tidak mengambil KPR dalam satu kategori yang sama.
Kategori dengan selang [Rp2 244 4449 – Rp2 500 0000] memiliki nilai dari
exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah yang tidak mengambil KPR 1.347 kali dibandingkan proporsi
nasabah yang mengambil KPR dalam satu kategori yang sama. Pada selang [Rp22
444 449 – Rp25 000 000] meskipun memiliki nilai WOE terkecil, namun proporsi

13
nasabah yang mengambil KPR dengan yang tidak mengambil KPR tidak terlalu
jauh berbeda.
Tabel 4 Diskretisasi chimerge peubah usia
Kategori
22 – 29 Tahun
30 – 36 Tahun
37 – 43 Tahun
44 – 48 Tahun
49 – 57 Tahun
58 – 90 Tahun

WOE
-0.801
0.223
0.567
0.092
-0.451
-3.029

Exp(WOE)
0.449
1.250
1.763
1.097
0.637
0.048

Tabel 5 Diskretisasi dengan selang yang sama peubah usia
Kategori
22 – 33 Tahun
34 – 44 Tahun
45 – 55 Tahun
56 – 66 Tahun
67 – 77 Tahun
78 – 90 Tahun

WOE
-0.198
0.473
-0.132
-1.988
-3.488
-0.849

Exp(WOE)
0.820
1.605
0.877
0.137
0.031
0.428

Tabel 4 nasabah yang berkategori [37 – 43 Tahun] memiliki nilai dari
exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah pengambil KPR 1.763 kali dibandingkan proporsi nasabah yang
tidak mengambil KPR dalam satu kategori yang sama.
Tabel 5 nasabah yang berkategori [34 – 44 Tahun] memiliki nilai dari
exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah pengambil KPR 1.605 kali dibandingkan proporsi nasabah yang
tidak mengambil KPR dalam satu kategori yang sama.
Deskripsi WOE Peubah Kategorik
Peubah penjelas bertipe kategori pada data bank X ini tidak dilakukan
proses diskretisasi. Hasil nilai WOE peubah penjelas jenis kelamin, status
pekerjaan, status pernikahan, pendidikan, jumlah tanggungan, dan jenis pekerjaan.
Disajikan pada Tabel 6 sampai 10 dan Lampiran 3.
Tabel 6 Nilai WOE peubah jenis kelamin
Kategori
Wanita
Pria

WOE
-0.573
0.350

Exp(WOE)
0.564
1.419

Tabel 6 kategori pria memiliki nilai dari exp(WOE) yang dapat
diinterpretasikan bahwa kategori tersebut memiliki proporsi nasabah pengambil

14
KPR 1.419 kali dibandingkan proporsi nasabah yang tidak mengambil KPR dalam
satu kategori yang sama. Kategori wanita memiliki nilai dari exp(WOE) yang
dapat diinterpretasikan bahwa kategori tersebut memiliki proporsi nasabah yang
tidak mengambil KPR 1.773 kali dibandingkan proporsi nasabah yang mengambil
KPR dalam satu kategori yang sama.
Tabel 7 Nilai WOE peubah status pekerjaan
Kategori
Karyawan Honorer
Karyawan Kontrak
Karyawan Paruh Waktu
Karyawan Tetap
Tidak Diketahui
Wiraswasta

WOE
-0.842
-1.153
-1.403
0.343
-1.953
-1.888

Exp(WOE)
0.431
0.316
0.246
1.409
0.142
0.151

Berdasarkan Tabel 7 kategori nasabah yang berstatus karyawan tetap
memiliki nilai dari exp(WOE) yang dapat diinterpretasikan bahwa kategori
tersebut memiliki proporsi nasabah pengambil KPR 1.409 kali dibandingkan
proporsi nasabah yang tidak mengambil KPR dalam satu kategori yang sama.
Kategori nasabah yang status kerjanya tidak diketahui memiliki nilai dari
exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah yang tidak mengambil KPR 7.042 kali dibandingkan proporsi
nasabah yang mengambil KPR dalam satu kategori yang sama. Berdasarkan Tabel
7 dapat diketahui bahwa kategori karyawan tetap memiliki proporsi nasabah yang
mengambil KPR tidak jauh berbeda dengan proporsi yang tidak mengambil KPR,
sedangkan kategori tidak diketahui memiliki perbedaan proporsi yang cukup besar
antara nasabah yang tidak mengambil KPR dengan nasabah yang mengambil KPR.
Tabel 8 Nilai WOE peubah status pernikahan
Kategori
Belum Kawin
Duda
Janda
Kawin
Tidak Diketahui

WOE
-0.106
0.949
-0.843
0.034
0.073

Exp(WOE)
0.899
2.582
0.430
1.034
1.076

Berdasarkan Tabel 8 kategori nasabah yang berstatus duda memiliki nilai
dari exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah pengambil KPR 2.582 kali dibandingkan proporsi nasabah yang
tidak mengambil KPR dalam satu kategori yang sama. Kategori nasabah yang
berstatus janda memiliki nilai dari exp(WOE) yang dapat diinterpretasikan bahwa
kategori tersebut memiliki proporsi nasabah yang tidak mengambil KPR 2.325
kali dibandingkan proporsi nasabah yang mengambil KPR dalam satu kategori
yang sama.

15
Tabel 9 Nilai WOE peubah pendidikan terakhir
Kategori
Diploma
Lainnya
S1 Sarjana
S2/S3 Master/Doktor
SD dan Sederajat
SLTP dan Sederajat
SMU dan Sederajat

WOE
0.281
-0.524
0.131
0.080
-1.066
-1.536
-0.465

Exp(WOE)
1.324
0.592
1.140
1.084
0.344
0.215
0.628

Berdasarkan Tabel 9 kategori nasabah yang berpendidikan S1 Sarjana
memiliki nilai dari exp(WOE) yang dapat diinterpretasikan bahwa kategori
tersebut memiliki proporsi nasabah pengambil KPR 1.140 kali dibandingkan
proporsi nasabah yang tidak mengambil KPR dalam satu kategori yang sama.
Kategori nasabah yang pendidikannya SLTP dan Sederajat memiliki nilai dari
exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah yang tidak mengambil KPR 4.651 kali dibandingkan proporsi
nasabah yang mengambil KPR dalam satu kategori yang sama. Berdasarkan Tabel
9 dapat diketahui bahwa kategori S1 Sarjana memiliki proporsi nasabah yang
mengambil KPR yang tidak jauh berbeda dengan yang tidak mengambil KPR,
sedangkan kategori SLTP dan Sederajat memiliki perbedaan proporsi yang cukup
besar antara nasabah yang tidak mengambil KPR dengan nasabah yang
mengambil KPR.
Tabel 10 Nilai WOE peubah Tanggungan
Kategori
Tanggungan 1 Orang
Tanggungan 2 Orang
Tanggungan 3 Orang
Tanggungan 4 Orang
Tanggungan lebih 4 orang
Tidak Punya Tanggungan
Tidak Diketahui

WOE
0.531
0.153
-0.105
-0.473
-0.487
-0.160
-0.797

Exp(WOE)
1.701
1.166
0.901
0.623
0.615
0.852
0.451

Tabel 10 kategori nasabah yang memiliki tanggungan 1 orang memiliki nilai
dari exp(WOE) yang dapat diinterpretasikan bahwa kategori tersebut memiliki
proporsi nasabah pengambil KPR 1.701 kali dibandingkan proporsi nasabah yang
tidak mengambil KPR dalam satu kategori yang sama. Kategori nasabah yang
jumlah tanggungannya tidak diketahui memiliki nilai dari exp(WOE) yang dapat
diinterpretasikan bahwa kategori tersebut memiliki proporsi nasabah yang tidak
mengambil KPR 2.217 kali dibandingkan proporsi nasabah yang mengambil KPR
dalam satu kategori yang sama.
Peubah jenis pekerjaan nasabah, nilai WOE disajikan pada Lampiran 3.
Jenis pekerjaan polisi memiliki nilai dari exp(WOE) yang dapat diinterpretasikan
bahwa kategori tersebut memiliki proporsi nasabah pengambil KPR 5.164 kali

16
dibandingkan proporsi nasabah yang tidak mengambil KPR dalam satu kategori
yang sama.
Information Value
Information value (Inv) digunakan untuk mengukur asosiasi setiap peubah
penjelas terhadap peubah respon. Inv umum digunakan untuk menyeleksi peubah
penjelas yang berpotensi untuk dimasukan kedalam model dengan nilai batas
sebesar 0.02. Berdasarkan SAS Institute Inc (2012) jika nilai Inv kurang dari 0.02
maka peubah dikatakan tidak prediktif sehingga peubah tersebut tidak dimasukan
kedalam model. Pada Tabel 11 dan 12 merupakan urutan nilai Inv dari terbesar
hingga terkecil dengan metode chimerge dan dengan selang yang sama secara
berurutan.
Tabel 11 Nilai Inv didiskretisasi chimerge
Peubah Penjelas
Jenis pekerjaan
Usia
Status pekerjaan
Pendapatan
Jenis kelamin
Pendidikan terakhir
Tanggungan
Status pernikahan
a

Inv
0.956
0.553
0.589
0.395
0.197
0.091
0.088
0.009a

nilai information value kurang dari 0.02

Tabel 12 Nilai Inv didiskretisasi dengan selang yang sama
Peubah Penjelas
Jenis pekerjaan
Status pekerjaan
Usia
Jenis kelamin
Pendapatan
Pendidikan terakhir
Tanggungan
Status pernikahan
a

Inv
0.956
0.589
0.449
0.197
0.153
0.091
0.088
0.009a

nilai information value kurang dari 0.02

Tingkat prediksi untuk peubah pendapatan yang didiskretisasi dengan
metode chimerge dan metode dengan selang yang sama berbeda. Peubah
pendapatan yang didiskretisasi dengan selang yang sama tersebut memiliki tingkat
prediksi yang medium sedangkan saat didiskretisasi dengan chimerge memiliki
tingkat prediksi yang kuat. Tingkat prediksi untuk peubah usia yang baik yang
didiskretisasi menggunakan metode chimerge maupun dengan selang yang sama,

17
keduanya memiliki tingkat prediksi yang kuat. Berdasarkan Tabel 11 dan 12
peubah penjelas yang nilai Inv kurang dari 0.02 adalah peubah status pernikahan,
sehingga peubah status tidak dimasukkan kedalam model regresi logistik.
Analisis Regresi Logistik
Analisis regresi logistik menggunakan tujuh peubah penjelas, yakni jenis
kelamin, status pekerjaan, pendidikan, tanggungan, jenis pekerjaan, usia, dan
pendapatan. Peubah respon yang digunakan adalah nasabah yang mengambil KPR,
disimbolkan dengan 1 dan nasabah yang tidak mengambill KPR disimbolkan
dengan 0. Model regresi logistik biner digunakan untuk menduga besarnya
peluang kejadian tertentu dari kategori peubah respon.
Statistik uji G digunakan untuk melihat hubungan keseluruhan peubah
penjelas terhadap respon secara bersama-sama. Pada Tabel 13 disajikan nilai
statistik uji G untuk model I (didiskretisasi dengan metode chimerge) dan model
II (didiskretisasi dengan metode dengan selang yang sama).
Tabel 13 Nilai statistik uji G dan nilai-P
Model I
483.269
0.000

Statistik-G
Nilai-P

Model II
462.913
0.000

Statistik uji G pada kedua model menunjukkan hasil yang signifikan karena
nilai-P (0.000) lebih kecil dari α = 0.05. Hal ini menunjukkan bahwa minimal ada
satu peubah penjelas yang signifikan terhadap model baik pada model I maupun
model II. Setelah peubah penjelas diuji secara simultan dengan uji G. kemudian
peubah penjelas diuji secara parsial dengan uji Wald. Nilai-P dari uji Wald dan
dugaan koefsisien parameter disajikan pada Tabel 14.
Tabel 14 Nilai-P uji Wald dan dugaan koefisien parameter
Peubah
Jenis kelamin
Status pekerjaan
Pendidikan
Tanggungan
Jenis pekerjaan
Usia
Pendapatan
Konstanta

Model I
B
0.534
0.474
0.452
0.704
0.649
0.695
0.529
0.094

Model II
Nilai-P
0.000
0.000
0.042
0.001
0.000
0.000
0.000
0.149

B
0.610
0.526
0.479
0.665
0.701
0.789
0.456
0.092

Nilai-P
0.000
0.000
0.031
0.002
0.000
0.000
0.004
0.153

Berdasarkan Tabel 14 pada model I dan model II untuk semua peubah
penjelas menghasilkan nilai-P yang kurang dari α = 0.05. Hal ini menunjukkan
bahwa semua peubah penjelas baik pada model I maupun model II berpengaruh
nyata terhadap respon. Berdasarkan peubah-peubah yang nyata dapat dibentuk
model logit untuk model I sebagai berikut :

18
x =

exp
1 exp

Model logit untuk model II sebagai berikut :

Nilai dugaan koefisien parameter setiap peubah penjelas nantinya akan digunakan
untuk menghitung skor pada kartu skor di setiap kategori-kategori peubah
penjelas.
Perbandingan Model
Setelah pembuatan model yang dibangun dengan diskretisasi metode
chimerge dan metode dengan selang yang sama, kemudian perlu dilihat seberapa
baik kedua model tersebut dalam memprediksi. Alat statistik yang dapat
digunakan untuk melihat kebaikan model antara lain tabel ketepatan klasifikasi,
kurva ROC, c-statistik, Kolmogorov-Smirnov, dan lain sebagainya. Pada
penelitian ini tabel ketepatan klasifikasi digunakan untuk melihat kebaikan model.
Tabel ketepatan klasifikasi digunakan untuk melihat ketepatan suatu model dalam
memprediksi. Tabel 15 merupakan tabel ketepatan klasifikasi untuk model I dan
model II.
Tabel 15 Tabel ketepatan klasifikasi data training
Prediksi
Amatan
(%) Ketepatan
Tidak
Ya
Tidak
399
268
59.820
Model I
Ya
99
676
87.225
Total ketepatan klasifikasi
74.549
Tidak
396
271
59.370
Model II
Ya
103
672
86.709
Total ketepatan klasifikasi
74.063
Tabel 16 Tabel ketepatan klasifikasi data validasi
Prediksi
Amatan
(%) Ketepatan
Tidak
Ya
Tidak
248
123
66.846
Model I
Ya
75
298
79.892
Total ketepatan klasifikasi
73.387
Tidak
256
115
69.002
Model II
Ya
103
270
72.386
Total ketepatan klasifikasi
70.698

19
Tabel ketepatan klasifikasi merupakan tabel frekuensi dua arah antara nilai
amatan dengan nilai prediksi. Model dengan nilai total ketepatan klasifikasi yang
mendekati 100% merupakan model yang baik. Pada Tabel 15 dengan data
training, untuk model I memiliki nilai spesifisitas sebesar 59.820% dapat
diinterpretasikan sebagai sebesar 59.820% nasabah yang tidak mengambil KPR
diprediksi secara tepat sebagai nasabah yang tidak mengambil KPR, nilai
sensitifitas sebesar 87.225% mengindikasikan bahwa sebesar 87.225% nasabah
yang mengambil KPR diprediksi secara tepat sebagai nasabah yang mengambil
KPR, dan nilai total ketepatan klasifikasi sebesar 74.549% mengindikasikan
bahwa secara keseluruhan sebanyak 74.549% nasabah yang tidak mengambil
KPR dan yang mengambil KPR diprediksi secara tepat, nilai tersebut cukup baik
untuk memprediksi suatu data. Pada model II memiliki nilai spesifisitas sebesar
59.4%, nilai sensitifitas sebesar 86.709%, dan nilai total ketepatan klasifikasi
sebesar 74.063%. Berdasarkan tabel ketepatan klasifikasi, model I memprediksi
lebih baik dibandingkan model II karena memiliki nilai total ketepatan klasifikasi
yang lebih besar.
Tabel 16 menggunakan data validasi, nilai batas yang digunakan untuk
dugaan peluang sebesar 0.55, artinya nasabah dengan peluang lebih besar dari
0.55 diklasifikasikan sebagai nasabah yang mengambil KPR, sedangkan nasabah
dengan nilai dugaan peluang kurang dari 0.55 diklasifikasikan sebagai nasabah
yang tidak mengambil KPR. Pemilihan batas dugaan peluang sebesar 0.55
dikarenakan memiliki nilai spesifisitas dan sensitifitas yang lebih baik
dibandingkan batasan lainnya, selain itu batasan tersebut memiliki nilai total
ketepatan klasifikasi yang cukup baik. Model I memiliki nilai total ketepatan
klasifikasi sebesar 73.387%, sedangkan model II memiliki nilai total ketepatan
klasifikasi sebesar 70.698%. Berdasarkan tabel ketepatan klasifikasi. Model I
lebih baik dibandingkan model II, baik menggunakan data training maupun data
validasi.
Ilustrasi Penilaian Kredit
Model regresi logistik yang diperoleh sebenarnya dapat digunakan untuk
menghasilkan skor. Skor yang dihasilkan berupa nilai peluang seorang nasabah
untuk mengambil KPR atau nasabah yang tidak mengambil KPR dengan nilai
diatara 0 sampai 1. Skor tersebut diperoleh dengan memasukkan nilai-nilai peubah
penjelas ke dalam model regresi logistik. Apabila bank menggunakan peluang
yang ada pada regresi logistik untuk menilai skor nasabah, hal tersebut kurang
efektif, karena dapat memakan waktu yang lama sehingga dibuatlah kartu skor.
Kartu skor berguna untuk memberikan kemudahan bagi bank untuk memilih
kriteria nasabahnya. Manfaat lain dari kartu skor adalah mengurangi waktu proses
pengerjaan aplikasi kredit.
Contoh perhitungan nilai skor untuk kategori pria pada peubah penjelas
jenis kelamin dirumuskan sebagai berikut :
offset
a
factor
j
i
n
n
Diketahui nilai WOEj untuk pria adalah 0.350, nilai dugaan koefisien
parameter i sebesar 0.534, nilai intercept (a)sebesar 0.094, banyaknya peubah

20
penjelas (n) adalah 7, dan nilai factor dan offset berdasarkan hasil perhitungan
pada halaman 7 masing masing sebesar 28.853 dan 487.123 maka diperoleh :
0.094
487.123
28.853
= 75
7
7
Lampiran 4 menyajikan kartu skor untuk model I. Pembuatan kartu skor
dibangun menggunakan model I dikarenakan nilai total ketepatan klasifikasi yang
lebih besar dibandingkan model II. Hasil dari kartu skor berupa skor-skor yang
ada pada setiap kategori