Penerapan Model Regresi Logistik Biner dan Metode CHAID dalam Klasifikasi Kredit Konsumtif

ABSTRAK
MALA SEPTIANI. Penerapan Model Regresi Logistik Biner dan Metode CHAID dalam
Klasifikasi Kredit Konsumtif. Dibimbing oleh BAMBANG SUMANTRI dan I MADE
SUMERTAJAYA.
Banyak faktor yang mempengaruhi kelancaran kredit debitur sehingga perlu diketahui faktorfaktor yang berpengaruh secara signifikan terhadap hal tersebut. Analisis regresi logistik biner dan
metode CHAID
merupakan salah satu metode statistika yang dapat digunakan untuk
mengidentifikasi faktor-faktor tersebut. Model regresi logistik dapat mengetahui pengaruh dari
peubah-peubah penjelas terhadap status kredit debitur. Sedangkan analisis CHAID berupa
dendrogram yang berisi informasi mengenai hubungan (asosiasi) secara terurut antar peubah.
Penelitian ini bertujuan untuk menggambarkan karakteristik debitur kredit konsumtif secara
umum, menerapkan analisis regresi logistik biner dan metode CHAID untuk melihat hubungan
antara peubah respon dan peubah penjelas serta membandingkan interpretasi hasil masing-masing
metode.
Peubah perbandingan THP terhadap angsuran merupakan peubah yang sangat berperan pada
kedua analisis dalam menentukan status kredit debitur. Peubah-peubah lain yang signifikan hasil
dari analisis regresi logistik adalah penguasaan cash flow, kepemilikan rekening simpanan, usia,
kepemilikan tempat tinggal, lama menetap, jangka waktu dan jenis/bidang usaha. Analisis CHAID
menghasilkan 14 karakteristik debitur dengan 8 karakteristik debitur default dan 6 karakteristik
debitur non default. Secara umum hasil kedua metode yang digunakan relatif sama dalam melihat
pengaruh masing-masing peubah penjelas dalam hubungannya dengan peubah respon. Akan tetapi

apabila masalah yang dihadapi berbeda tentu tidak semua metode ini dapat digunakan, kecuali
pada masalah tertentu kedua metode ini dapat digunakan untuk saling melengkapi.

i

PENERAPAN MODEL REGRESI LOGISTIK BINER DAN METODE
CHAID DALAM KLASIFIKASI KREDIT KONSUMTIF

MALA SEPTIANI

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2008

ABSTRAK
MALA SEPTIANI. Penerapan Model Regresi Logistik Biner dan Metode CHAID dalam
Klasifikasi Kredit Konsumtif. Dibimbing oleh BAMBANG SUMANTRI dan I MADE
SUMERTAJAYA.

Banyak faktor yang mempengaruhi kelancaran kredit debitur sehingga perlu diketahui faktorfaktor yang berpengaruh secara signifikan terhadap hal tersebut. Analisis regresi logistik biner dan
metode CHAID
merupakan salah satu metode statistika yang dapat digunakan untuk
mengidentifikasi faktor-faktor tersebut. Model regresi logistik dapat mengetahui pengaruh dari
peubah-peubah penjelas terhadap status kredit debitur. Sedangkan analisis CHAID berupa
dendrogram yang berisi informasi mengenai hubungan (asosiasi) secara terurut antar peubah.
Penelitian ini bertujuan untuk menggambarkan karakteristik debitur kredit konsumtif secara
umum, menerapkan analisis regresi logistik biner dan metode CHAID untuk melihat hubungan
antara peubah respon dan peubah penjelas serta membandingkan interpretasi hasil masing-masing
metode.
Peubah perbandingan THP terhadap angsuran merupakan peubah yang sangat berperan pada
kedua analisis dalam menentukan status kredit debitur. Peubah-peubah lain yang signifikan hasil
dari analisis regresi logistik adalah penguasaan cash flow, kepemilikan rekening simpanan, usia,
kepemilikan tempat tinggal, lama menetap, jangka waktu dan jenis/bidang usaha. Analisis CHAID
menghasilkan 14 karakteristik debitur dengan 8 karakteristik debitur default dan 6 karakteristik
debitur non default. Secara umum hasil kedua metode yang digunakan relatif sama dalam melihat
pengaruh masing-masing peubah penjelas dalam hubungannya dengan peubah respon. Akan tetapi
apabila masalah yang dihadapi berbeda tentu tidak semua metode ini dapat digunakan, kecuali
pada masalah tertentu kedua metode ini dapat digunakan untuk saling melengkapi.


i

PENERAPAN MODEL REGRESI LOGISTIK BINER DAN METODE
CHAID DALAM KLASIFIKASI KREDIT KONSUMTIF

MALA SEPTIANI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2008

ii


Judul Skripsi
Nama
NRP

: Penerapan Model Regresi Logistik Biner dan Metode
CHAID dalam Klasifikasi Kredit Konsumtif
: Mala Septiani
: G14104006

Menyetujui :
Pembimbing I,

Pembimbing II,

Ir. Bambang Sumantri
NIP. 130779511

Dr. Ir. I Made Sumertajaya, MS
NIP. 132085916


Mengetahui :
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Drh. Hasim, DEA
NIP. 131578806

Tanggal Lulus :

iii

PRAKATA
Alhamdulillah. Segala puji dan syukur ke Hadirat Allah SWT atas segala rahmat dan
karunia-Nya yang telah dilimpahkan kepada penulis sehingga karya ilmiah ini dapat terselesaikan.
Karya ilmiah ini berjudul Penerapan Model Regresi Logistik Biner dan Metode CHAID dalam
Klasifikasi Kredit Konsumtif.
Pada kesempatan ini penulis mengucapkan terima kasih kepada semua pihak yang telah
banyak membantu penulis dalam penyelesaian karya ilmiah ini, antara lain kepada:
1. Bapak Ir. Bambang Sumantri dan Bapak Dr. Ir I Made Sumertajaya, MS selaku pembimbing
yang selalu memberikan arahan, saran dan kesabarannya dalam membimbing penulis.

2. Bapak Ir. Eko Susetyono, MBA yang telah memberikan data dan kesempatan bagi Penulis
untuk melakukan penelitian di BRI, pembimbing di BRI: Pak Munir, Pak Arief, Pak Widi,
Pak Soni, Pak Eko, dan seluruh staf divisi Tim Project Office Credit Risk Basel II yang telah
memberikan ilmu-ilmu yang bermanfaat kepada Penulis.
3. Bapak (Soleh Suwanda), Mama (Sri Yantini, S.Pd) dan adik (Sovi Apriliyanti) serta seluruh
keluarga besar atas segala doa, kasih sayang, serta dukungannya.
4. Seluruh dosen Departemen Statistika FMIPA IPB atas ilmu yang diajarkan dan seluruh staf
departemen Statistika (Bu Markonah, Bu Sulis, Bu Dedeh, Bu Aat, Pak Iyan, Bang Sudin,
Mang Herman, Mang Dur) yang telah membantu penulis selama belajar di Statistika IPB.
5. Deni Suhandani yang selalu memberikan semangat, kasih sayang, doa dan motivasinya.
6. Ika, Neng, Yusri, Meta, Rani Pd, Cheri, Agustina, Sevrien, Lia, Rere (terima kasih atas
persahabatannya), Tjipto (atas diskusinya tentang reglog), Niken (atas diskusi CHAID-nya),
Vinny, Ami, Zul (teman seperjuangan di tempat praktik lapang) dan teman-teman Statistika
41, terima kasih atas kebersamaan, keceriaan dan kenangan yang indah selama 4 tahun.
7. Wisma Baitussalam: Ika, Neng, Yusri, Meta, Rani Pd, Cheri, Ami; Ananda Putri 2: Ika, Teh
Tia, Teh Lira, Teh Uci, Teh Lia, Teh Tata, Teh Atik, Dila, Nina, Syifa dan Fauziah Crew:
Neng, Meta, Dara, Fuji, Nurul, Teh Euis, Kak Nugie, Kak Inang, Kak Heti, Kak Cha2n,
Intan, Diana, Tuti, Asih, Dian (terima kasih atas keceriaan dan kebersamaannya selama di
kostan).
8. Kakak-kakak kelas STK 39 dan 40 serta adik-adik kelas STK 42 dan 43.

9. Semua pihak yang telah memberikan bantuan dan dukungannya kepada penulis dalam
menyelesaikan karya ilmiah ini.
Penulis mempunyai keterbatasan ilmu sehingga karya ilmiah ini ini masih mempunyai
banyak kekurangan. Hasil karya yang sederhana ini semoga bermanfaat bagi pihak yang
memerlukan.

Bogor, Agustus 2008

Mala Septiani

iv

RIWAYAT HIDUP
Penulis dilahirkan di Tasikmalaya pada tanggal 20 September 1985 sebagai anak pertama dari
dua bersaudara, anak dari pasangan Soleh Suwanda dan Sri Yantini, S.Pd.
Setelah menyelesaikan pendidikan dasar di SDN Manonjaya 1 pada tahun 1998, studi penulis
dilanjutkan di SLTP Negeri 1 Manonjaya yang ditamatkan pada tahun 2001. Tahun 2004 penulis
lulus dari SMU Negeri 1 Tasikmalaya, dan pada tahun yang sama diterima sebagai mahasiswa di
Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB
(USMI).

Semasa menjadi mahasiswa, penulis aktif sebagai pengurus Decision Centre (DC) sebagai staf
Divisi Keilmuan dan pengurus KAMMUS sebagai staf Dankom. Praktik Lapang dilakukan penulis
di Kantor Pusat PT Bank Rakyat Indonesia (Persero),Tbk pada bulan Februari-Maret 2008.

v

DAFTAR ISI
Halaman
DAFTAR TABEL ...................................................................................................................... vii
DAFTAR GAMBAR ................................................................................................................. vii
DAFTAR LAMPIRAN .............................................................................................................. vii
PENDAHULUAN
Latar Belakang .................................................................................................................... 1
Tujuan ................................................................................................................................. 1
TINJAUAN PUSTAKA
Debitur ................................................................................................................................
Kredit ...................................................................................................................................
Default .................................................................................................................................
Regresi Logistik Biner .........................................................................................................
Metode CHAID ...................................................................................................................


1
1
1
2
3

BAHAN DAN METODE
Bahan .................................................................................................................................. 4
Metode ................................................................................................................................ 4
HASIL DAN PEMBAHASAN
Gambaran Umum Karakteristik Debitur ............................................................................. 5
Analisis Regresi Logistik Biner .......................................................................................... 6
Interpretasi Koefisien .......................................................................................................... 6
Dendrogram Hasil Pemisahan Analisis CHAID ................................................................. 7
Perbandingan Hasil .............................................................................................................. 11
KESIMPULAN .......................................................................................................................... 14
DAFTAR PUSTAKA ................................................................................................................ 14
LAMPIRAN................................................................................................................................ 15


vi

DAFTAR TABEL
Halaman
1

Karakteristik debitur .......................................................................................................... 5

2

Ketepatan prediksi model regresi logistik biner .................................................................. 6

3

Nilai rasio odds dari peubah penjelas ................................................................................. 6

4

Karakteristik debitur kredit konsumtif hasil analisis CHAID .............................................. 9


5

Ketepatan prediksi metode CHAID ..................................................................................... 11

6

Persentase kesalahan klasifikasi untuk setiap karakteristik debitur kredit konsumtif .......... 12

7

Kesesuaian klasifikasi antara regresi logistik dan metode CHAID...................................... 13

DAFTAR GAMBAR
Halaman
1

Diagram pie status kredit debitur ....................................................................................... 5

2

Diagram pie klasifikasi debitur berdasarkan jenis kelamin.................................................. 5

DAFTAR LAMPIRAN
Halaman
1

Peubah-peubah penjelas yang digunakan ........................................................................... 15

2

Deskripsi distribusi karakteristik debitur ........................................................................... 16

3

Dugaan parameter model dari peubah penjelas ................................................................... 18

4

Dendrogram hasil analisis CHAID ...................................................................................... 19

vii

Tujuan

PENDAHULUAN
Latar Belakang
Pemberian kredit merupakan pemberian
kepercayaan dari satu pihak kepada pihak
yang lain. Hal ini berarti pemberi pinjaman
kredit
yakin
bahwa
debitur
akan
mengembalikan pinjaman kredit sesuai
dengan jangka waktu yang telah ditetapkan
dan syarat-syarat yang telah disepakati
bersama oleh kedua belah pihak. Tanpa
keyakinan tersebut suatu lembaga kredit tidak
akan memberikan pinjaman kredit.
Penyaluran kredit bagi suatu bank
merupakan sumber utama penghasilan bank
sekaligus sumber resiko bisnis terbesar
dimana adanya kemungkinan kredit macet.
Kredit macet disebabkan karena debitur tidak
mengembalikan pinjaman uang, hal ini dapat
menyebabkan kerugian pada pihak bank.
Untuk mengatasi masalah ini maka sudah
seharusnya pihak bank hanya memberikan
kredit pada debitur yang layak, sehingga bank
wajib melakukan proses seleksi calon debitur.
Proses penyaringan yang dilakukan di
antaranya dengan melihat latar belakang
debitur, biasanya pihak bank sudah
menentukan peubah-peubah yang dapat
menggambarkan karakteristik dari debitur.
Analisis
statistika
telah
banyak
dikembangkan untuk membantu menyelesaikan
masalah-masalah
dalam
bidang
perbankan. Beberapa di antaranya adalah
analisis regresi logistik, analisis diskriminan,
pohon klasifikasi dan Artificial Neural
Network (ANN). Analisis yang akan dikaji
pada penelitian ini adalah analisis regresi
logistik dan metode CHAID.
Analisis regresi logistik biner digunakan
untuk melihat hubungan antara peubah respon
yang berskala kategorik dengan peubah
penjelas yang berskala kategorik atau kontinu.
Dari analisis ini juga dapat diperoleh peubahpeubah penjelas yang berpengaruh terhadap
status kredit. Sedangkan metode CHAID
umumnya dikenal sebagai metode pohon
klasifikasi (Classification Tree Methods).
Prosedur yang dilakukan dalam metode ini
adalah membagi debitur ke dalam kelompokkelompok yang lebih kecil berdasarkan
peubah respon, dimana ada peubah penjelas
yang terpilih yang digunakan untuk
pengelompokan peubah penjelas selanjutnya.
Metode ini juga dapat mengidentifikasi
segmen-segmen debitur yang potensial untuk
diberi pinjaman kredit.

1.

2.

3.

Penelitian ini memiliki tiga tujuan yaitu:
Menggambarkan karakteristik debitur
secara umum berdasarkan peubah-peubah
yang telah ditetapkan.
Menerapkan analisis regresi logistik biner
dan metode CHAID untuk melihat
hubungan antara peubah respon dan
peubah penjelas.
Membandingkan
interpretasi
hasil
masing-masing metode.

TINJAUAN PUSTAKA
Debitur
Menurut Peraturan Bank Indonesia
Nomor: 9/14/PBI/2007 tentang Sistem
Informasi Debitur BAB 1 mengenai
Ketentuan Umum pada Pasal 1, debitur adalah
perorangan, perusahaan atau badan yang
memperoleh satu atau lebih fasilitas
penyediaan dana (Anonim, 2007).
Kredit
Kredit
merupakan
suatu
fasilitas
keuangan yang memungkinkan seseorang atau
badan usaha untuk meminjam uang untuk
membeli produk dan membayarnya kembali
dalam jangka waktu yang ditentukan. UU No.
10 tahun 1998 menyebutkan bahwa kredit
adalah penyediaan uang atau tagihan yang
dapat dipersamakan dengan itu, berdasarkan
persetujuan
atau
kesepakatan
pinjam
meminjam antara bank dengan pihak lain
yang mewajibkan pihak peminjam untuk
melunasi utangnya setelah jangka waktu
tertentu dengan pemberian bunga. Jika
seseorang menggunakan jasa kredit, maka ia
akan dikenakan bunga tagihan (Wikipedia,
2008). Kredit konsumtif adalah dana yang
disalurkan oleh institusi keuangan kepada
debitur untuk tujuan-tujuan tertentu, misalnya
pembelian rumah, pembelian kendaraan
bermotor, modal usaha dan lain sebagainya.
Default
Debitur dikatakan berkategori default jika
debitur tersebut telah melewati batas waktu
pembayaran kewajiban kredit material lebih
dari 90 hari kepada bank dan cicilan akan
dianggap melewati batas waktu apabila
debitur melanggar limit yang ditetapkan atau
limit yang ditetapkan lebih kecil dari saldo

1

saat ini (Basel Committee on Banking
Supervision, 2004).
Regresi Logistik Biner
Analisis regresi logistik merupakan
suatu teknik untuk menganalisis data yang
peubah responnya memiliki dua atau lebih
kategori dengan satu atau lebih peubah bebas
yang berskala kategorik atau kontinu.
Hosmer
dan
Lemeshow
(2000)
menjelaskan bahwa model regresi logistik
dibentuk
dengan
menyatakan
nilai
P(Y  1| x) sebagai   x  , yang dinotasikan
sebagai berikut:
C  x 

exp  g  x  

1  exp  g  x  

Suatu fungsi dari   x  dicari dengan
menggunakan transformasi logit, yaitu
g (x) yang dapat dinyatakan sebagai berikut:
  x 
g ( x)  ln 
   0  1 x1  ...   p x p
1    x  

Secara umum jika sebuah peubah
berskala nominal atau ordinal mempunyai k
kemungkinan nilai, maka diperlukan k  1
peubah boneka (dummy variable). Sehingga
model transformasi logitnya menjadi:
k j 1

g (x)   0  1 x1  ...    ju D ju   p x p
u 1

dimana:
xj : peubah bebas ke-j dengan tingkatan kj
kj-1: peubah boneka
βju : koefisien peubah boneka
u : 1,2,....., kj-1
Dju: kj-1 peubah boneka
Pendugaan parameter dalam regresi
logistik menggunakan metode kemungkinan
maksimum (maximum likelihood estimation),
jika antara amatan yang satu dengan yang lain
diasumsikan bebas maka fungsi kemungkinan
yang diperoleh adalah:
n

1 yi

l (  )     xi  i 1    xi  
y

i 1

dengan:
i
= 1,2,.....,p
= pengamatan pada peubah respon ke-i
yi
π(xi) = peluang untuk peubah penjelas ke-i

Parameter i diduga dengan memaksimumkan
persamaan di atas, untuk mempermudah
perhitungan maka dilakukan pendekatan
logaritma, sehingga fungsi log-likelihoodnya
sebagai berikut:

n





L (  )   yi ln   xi    1  yi  ln 1    xi  
i 1

Nilai dugaan i

dapat diperoleh dengan

membuat turunan pertama L(  ) terhadap

i = 0, dengan i = 1,2,.....,p.
Pengujian terhadap parameter-parameter
model dilakukan baik secara simultan maupun
secara parsial. Menurut Hosmer dan
Lemeshow (2000), pengujian parameter
model secara simultan menggunakan uji
nisbah kemungkinan (Likelihood Ratio Tests),
dengan hipotesis:
H0: 1 = ... =  p = 0
H1: minimal ada satu i  0 ; i = 1,2...,p
statistik uji G dirumuskan:
L 
G  2 ln  o 
 Lp 
dengan L0 adalah fungsi kemungkinan tanpa
peubah penjelas dan Lp merupakan fungsi
kemungkinan dengan peubah penjelas.
Dengan mengasumsikan H0 benar, statistik uji
G akan mengikuti sebaran khi kuadrat dengan
derajat bebas p. Keputusan tolak H0 jika G >
 2 p ( ) .
Pengujian parameter secara parsial
menggunakan uji Wald. Hipotesis yang akan
diuji adalah:
H0 :  i  0
H1 : i  0 ; i = 1,...,p
Statistik uji yang dipakai adalah statistik W
yaitu:


W 




i



SEˆ (  i )


dengan  i sebagai penduga i dan SE(  i )
sebagai penduga galat baku i . Statistik W
akan mengikuti sebaran normal baku jika H0
benar. Keputusan tolak H0 diambil jika |W| >
Z / 2 .
Interpretasi koefisien untuk model regresi
logistik biner dapat dilakukan dengan
menggunakan nilai rasio oddsnya. Odd sendiri
dapat diartikan sebagai rasio peluang kejadian
sukses dengan kejadian tidak sukses dari

2

peubah respon. Rasio odds mengindikasikan
seberapa lebih mungkin munculnya kejadian
sukses pada suatu kelompok dibandingkan
dengan kelompok lainnya. Rasio odds
didefinisikan sebagai:

ˆ  exp( ˆ )  exp  g 1  g  0 

i


Interpretasi dari rasio odds ini adalah
kecenderungan untuk Y = 1 pada X = 1 sebesar
kali dibandingkan pada X = 0.
Metode CHAID
Chi-Squared
Automatic
Interaction
Detector (CHAID) pertama kali diperkenalkan dalam sebuah artikel berjudul “An
Exploratory Tecnique for Investigating Large
Quantities of Categorical Data” oleh Dr. G.V.
Kass pada tahun 1980. Prosedur CHAID
merupakan bagian dari teknik terdahulu yang
dikenal sebagai Automatic Interaction
Detector (AID) dan menggunakan statistik
chi-square sebagai alat utamanya (Kunto dan
Hasana, 2006). Metode CHAID digunakan
untuk menelusuri struktur keterkaitan antar
peubah respon dan peubah penjelas yang
masing-masing bertipe kategorik.
Metode CHAID merupakan teknik
eksplorasi nonparametrik untuk menganalisis
sekumpulan data yang berukuran besar dan
cukup efisien untuk menduga peubah-peubah
penjelas yang paling signifikan terhadap
peubah respon (Du toit et al., 1986). Dalam
data,
metode
CHAID
menganalisis
memisahkan data ke dalam kelompok secara
bertahap. Pada tahap pertama, data dibagi
menjadi beberapa kelompok berdasarkan satu
peubah penjelas yang pengaruhnya paling
signifikan terhadap peubah respon. Masingmasing kelompok yang diperoleh, diperiksa
secara terpisah untuk membaginya kembali
menjadi beberapa kelompok berdasarkan
peubah penjelas dan seterusnya sampai
didapat kelompok-kelompok pengamatan
yang memiliki peubah respon dan peubah
penjelas yang berkaitan.
Menurut Gallagher (2000), CHAID akan
membedakan peubah-peubah penjelasnya
menjadi tiga bentuk yang berbeda, yaitu:
1. Peubah bebas/nominal: kategori-kategori
pada peubah ini dapat digabungkan oleh
CHAID walaupun keduanya berdekatan
atau tidak satu sama lain, contohnya:
pekerjaan, kelompok etnik dan area
geografis.

2.

Peubah monotonik/ordinal: kategorikategori pada peubah ini dapat
digabungkan oleh CHAID hanya jika
keduanya berdekatan satu sama lain, yaitu
peubah yang mengikuti urutan aslinya,
contohnya: usia dan pendapatan.
3. Peubah mengambang/float: kategorikategori
pada peubah ini akan
diperlakukan seperti monotonik kecuali
untuk kategori yang terakhir (yaitu
missing value), yang dapat berkombinasi
dengan kategori manapun.
Tahapan-tahapan dalam analisis CHAID
dijelaskan pada algoritma berikut (Kass dalam
Rahmawati):
1. Membuat tabulasi silang antara kategorikategori peubah respon dengan kategorikategori dari peubah penjelas.
2. Membuat subtabel berukuran 2  d yang
mungkin tersusun, dengan d adalah
banyaknya kategori peubah respon.
Carilah nilai  2 hitung semua subtabel

3.

tersebut dengan  ditetapkan kemudian
cari  2 hitung terkecil. Jika  2 hitung   2
maka kedua kategori peubah penjelas
yang memiliki  2 hitung digabungkan
menjadi satu kategori gabungan.
Jika terdapat kategori gabungan yang
terdiri dari tiga atau lebih kategori asal
maka harus dilakukan pembagian biner
terhadap kategori gabungan tersebut. Dari
pembagian ini dicari  2 hitung terbesar, jika

 2 hitung   2

maka pembagian biner
dilakukan. Selanjutnya kembali ke tahap
2.
4. Dari setiap peubah penjelas yang telah
digabungkan secara optimal cari nilai-p
yang paling kecil dari masing-masing
subtabel tersebut. Jika nilai-p terkecil <
 maka peubah penjelas tersebut adalah
peubah penjelas yang paling signifikan
terhadap peubah respon.
5. Kembali ke tahap 1 untuk melakukan
pembagian berdasarkan peubah penjelas
yang belum terpilih.
Statistik uji yang digunakan adalah 2
dengan rumus:
r

c

2
 hitung
 
i 1 j 1

(Oij  Eij )2
Eij

Keterangan:
r = total baris
c = total kolom
i
= indeks baris
j
= indeks kolom

3

Oij = frekuensi baris ke-i kolom ke-j
Eij = frekuensi harapan baris ke-i kolom ke-j
CHAID menggunakan statistik chisquare dengan dua cara. Pertama, statistik chisquare digunakan untuk menentukan kategorikategori dalam sebuah peubah penjelas
bersifat seragam atau tidak dan kemudian
dapat digabungkan menjadi satu. Kedua,
ketika semua peubah penjelas sudah diringkas
menjadi bentuk yang signifikan dan tidak
mungkin digabung lagi, statistik chi square
digunakan untuk menentukan peubah penjelas
mana yang paling signifikan untuk membagi
atau membedakan kategori-kategori dalam
peubah respon (Gallagher, 2000).
Hasil dari metode CHAID ini adalah
suatu dendrogram pemisahan dan dari
dendrogram ini akan diperoleh tiga informasi,
yaitu (Fielding dalam Rahmawati):
1. Pengelompokan pengamatan.
Pengamatan dikelompokan ke dalam
kelompok-kelompok yang relatif lebih
homogen dalam kaitannya dengan nilai
peubah penjelas dan peubah respon.
2. Asosiasi antar peubah penjelas.
Artinya kecenderungan nilai peubah
penjelas tertentu berpadanan dengan nilai
peubah penjelas lainnya.
3. Interaksi antar peubah.
Peranan silang peubah penjelas dalam
pemisahan
pengamatan
berdasarkan
peubah respon.
Pengurangan tabel kontingensi pada
metode CHAID membutuhkan suatu uji
signifikansi. Jika tidak ada pengurangan tabel
kontingensi asal maka statistik uji chi-square
biasa dapat digunakan. Apabila terjadi
pengurangan, yaitu c kategori dari peubah asal
menjadi r kategori (r  c) maka nilai-p dari
chi-square yang baru dikalikan dengan
pengganda Bonferroni berikut sesuai dengan
tipe peubah:
1. Peubah bebas/nominal
r 1
(r  i)c
B   (1)i
i! (r  i )!
i0
2. Peubah monotonik/ordinal
 c  1

B  
 r  1
3. Peubah float
c  2 c  2
  r 

B  
 r  2  r 1 

BAHAN DAN METODE
Bahan
Data yang digunakan pada penelitian ini
merupakan data sekunder yaitu data debitur
kredit konsumtif PT Bank Rakyat Indonesia
(Persero), Tbk. Data debitur berasal dari data
yang diisikan pada formulir aplikasi kredit.
Peubah penjelas diturunkan dari data aplikasi
dan peubah respon diturunkan dari informasi
kelancaran kredit debitur. Data yang
digunakan berukuran 1000 data. Peubah
penjelas yang digunakan adalah sebagai
berikut:
X1 : Perbandingan THP terhadap angsuran
X2 : Penguasaan cash flow
X3 : Riwayat rekening pinjaman
X4 : Kepemilikan rekening simpanan
X5 : Usia
X6 : Kepemilikan tempat tinggal
X7 : Lama menetap
X8 : Lama bekerja
X9 : Status perkawinan
X10: Pendidikan terakhir
X11: Pangkat terakhir
X12: Jangka waktu
X13: Telepon rumah
X14: Status debitur
X15: Jumlah tanggungan
X16: Jenis/bidang usaha
Y : Klasifikasi debitur
0: default
1: non default
Pembentukan peubah dummy didasarkan
pada kategori terkecil sebagai kategori acuan.
Kategori dari setiap peubah penjelas dapat
dilihat pada Lampiran 1.
Metode
Langkah-langkah yang dilakukan pada
penelitian ini adalah:
1. Analisis statistika deskriptif untuk
mengetahui gambaran umum karakteristik debitur kredit konsumtif.
2. Analisis regresi logistik biner untuk
mengetahui peubah penjelas yang
signifikan terhadap status kredit dan
interpretasi hasil.
3. Analisis CHAID untuk melihat stuktur
data antara peubah penjelas dengan
peubah respon dan interpretasi hasil.
4. Membandingkan hasil keluaran dari
analisis regresi logistik biner dengan
metode CHAID dalam mengklasifikasikan debitur.

4

Software
yang
digunakan
dalam
penelitian ini adalah MS.Excell 2003,
Answertree 2.01 dan SPSS for Windows versi
15.0.

HASIL DAN PEMBAHASAN

tanggungan lebih dari atau sama dengan 3
orang, jabatan staf, dengan lama bekerja lebih
dari 10 tahun. Tabel 1 berikut ini menjelaskan
karakteristik debitur berdasarkan status kredit.
Tabel 1. Karakteristik debitur
Peubah

Gambaran Umum Karakteristik Debitur
Banyaknya debitur kredit konsumtif yang
digunakan pada penelitian ini sebanyak 1000
orang. Jumlah debitur yang termasuk kategori
default sebanyak 500 orang (50%) dan
termasuk kategori non default sebanyak 500
orang (50%). Hal ini menunjukkan bahwa
masing-masing kategori memiliki jumlah
debitur yang sama (Gambar 1).

X1

X2

X3
X4
X5
X6
X7

non default
50%

default
50%

X8
X9
X10

Gambar 1. Diagram pie status kredit debitur

X11

Gambar 2 menunjukkan klasifikasi
debitur berdasarkan jenis kelamin. Debitur
kredit yang berjenis kelamin laki-laki
sebanyak 785 orang (78%) dan debitur yang
berjenis kelamin perempuan sebanyak 215
orang (22%). Dengan demikian, sebagian
besar debitur kredit konsumtif berjenis
kelamin laki-laki.

X12

perempuan
22%

laki-laki
78%

Gambar 2. Diagram pie klasifikasi debitur
berdasarkan jenis kelamin
Mayoritas debitur yang dianalisis sudah
menikah, berpendidikan kurang dari atau
sama dengan SMA, usia kurang dari 45 tahun,
memiliki rumah milik pribadi, dengan lama
menetap lebih dari 5 tahun, jumlah

X13
X14
X15
X16

Modus
Default
Non default
THP