Metode Quest dan Chaid pada Klasifikasi Karakteristik Nasabah Kredit.

(1)

2/3/2016 E-Jurnal Matematika

http://ojs.unud.ac.id/index.php/mtk/index 4/5

Vol 5, No 1 (2016)

Table of Contents


(2)

2/3/2016 Vol 4, No 4 (2015)

http://ojs.unud.ac.id/index.php/mtk/issue/view/1664 3/5

Value at Riskbiplot futures contract multicollinearity principal component analysis

HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES EDITORIAL

TEAM CONTACT

Home

>

Arc hives

>

Vol 4, No 4 (2015)

Vol 4, No 4 (2015)

tiket keretatoko bagusberita bola terkinianton nbAneka Kreasi Resep Masakan Indonesiaresep masakanmenghilangkan jerawatvilla di puncakreceptenberita hariangame onlinehp dijualwindows gadgetjual consolevoucher onlinegosip terbaruberita terbaruwindows gadgettoko gamecerita horor

Table of Contents

Articles

KL A S I FI KA S I KA RA KT E RI S T I K KE C E L A KA A N L A L U L I N T A S D I KO T A D E N P A S A R D E N G A N P E N D E KA T A N C L A S S I FI C A T I O N A N D RE G RE S S I O N T RE E S (C A RT )

P D F

I GEDE AGUS JIWADIANA, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI 146-151

M E N E N T U KA N FO RM U L A P RE M I T A H U N A N T I D A K KO N S T A N P A D A A S U RA N S I J O I N T L I FE

P D F

I GEDE BAGUS PASEK SUBADRA, I NYOMAN WIDANA, DESAK PUTU EKA NILAKUSMAWATI

152-157

O P T I M A L I S A S I P E N J U A L A N KA I N E N D E K D E N G A N M E T O D E KA RU S H - KU H N - T U C KE R (KKT )

P D F


(3)

2/3/2016 Vol 4, No 4 (2015)

http://ojs.unud.ac.id/index.php/mtk/issue/view/1664 4/5

M E T O D E Q U E S T D A N C H A I D P A D A KL A S I FI KA S I KA RA KT E RI S T I K N A S A B A H KRE D I T P D F

NUR FAIZA, I WAYAN SUMARJAYA, I GUSTI AYU MADE SRINADI 163-168

M O D E L P E RS A M A A N S T RU KT U RA L T I N G KA T KE P U A S A N M A S Y A RA KA T T E RH A D A P KU A L I T A S P E L A Y A N A N J A L A N T O L B A L I M A N D A RA

P D F

I PUTU AGUS WIDHIANTARA, I KOMANG GDE SUKARSA, I PUTU EKA N. KENCANA 169-175

E S T I M A S I M O D E L RE G RE S I S E M I P A RA M E T RI K M E N G G U N A KA N E S T I M A T O R KE RN E L U N I FO RM (S tudi Kas us : P as ien D B D di RS P uri Raharja)

P D F

ANNA FITRIANI, I GUSTI AYU MADE SRINADI, MADE SUSILAWATI 176-180

P E RB A N D I N G A N C A P I T A L A S S E T P RI C I N G M O D E L (C A P M ) D A N T H RE E FA C T O RS M O D E L FA M A A N D FRE N C H (T FM FF) D A L A M M E N G E S T I M A S I RE T U RN S A H A M

P D F

KADEK MIRA PITRIYANTI, KOMANG DHARMAWAN, G.K. GANDHIADI 181-187

E S T I M A S I N I L A I C O N D I T I O N A L V A L U E A T RI S K M E N G G U N A KA N FU N G S I G A U S S I A N C O P U L A

P D F

HERLINA HIDAYATI, KOMANG DHARMAWAN, I WAYAN SUMARJAYA 188-194

M E N E N T U KA N P RE M I T A H U N A N U N T U K T I G A O RA N G P A D A A S U RA N S I J I WA H I D U P G A B U N G A N (J O I N T L I FE )

P D F

TRI YANA BHUANA, I NYOMAN WIDANA, LUH PUTU IDA HARINI 195-200

O P T I M A L I S A S I P E RE N C A N A A N P RO D U KS I D E N G A N P RE E M P T I V E G O A L

P RO G RA M M I N G (S T U D I KA S U S : U D . D O D O L M A D E M E RT A T E J A KU L A , S I N G A RA J A )

P D F


(4)

2/3/2016 Editorial Team

http://ojs.unud.ac.id/index.php/mtk/about/editorialTeam 3/4

Value at Riskbiplot futures contract multicollinearity principal component analysis

HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES EDITORIAL

TEAM CONTACT

Home

>

About the Journal

>

Editorial Team

Editorial Team

tiket keretatoko bagusberita bola terkinianton nbAneka Kreasi Resep Masakan Indonesiaresep masakanmenghilangkan jerawatvilla di puncakreceptenberita hariangame onlinehp dijualwindows gadgetjual consolevoucher onlinegosip terbaruberita terbaruwindows gadgettoko gamecerita horor

Chief-in-Editor

D es ak P utu E ka N ilakus umawati, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Indonesia

Associate Editor

I M ade E ka D wipayana, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia

Editorial Board

D r. T jokorda B agus O ka, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia D r. Komang D harmawan, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia D rs . G K G andhiadi, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia

I r. I Komang G de S ukars a, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia I r. I P utu E ka N ila Kenc ana, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia I G us ti A yu M ade S rinadi, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia


(5)

2/3/2016 Editorial Team

http://ojs.unud.ac.id/index.php/mtk/about/editorialTeam 4/4

M ade S us ilawati, Jurusan Matematika, Fakultas MIPA, Universitas Udayana, Bali-Indonesia


(6)

E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 163-168 ISSN: 2303-1751

163

METODE QUEST DAN CHAID PADA KLASIFIKASI

KARAKTERISTIK NASABAH KREDIT

Nur Faiza§1,I Wayan Sumarjaya2, I Gusti Ayu Made Srinadi3

1

Jurusan Matematika, FMIPA, Universitas Udayana [Email: [email protected]]

2Jurusan Matematika, FMIPA, Universitas Udayana [Email: [email protected]]

3Jurusan Matematika, FMIPA, Universitas Udayana [Email: [email protected]]

§

Corresponding Author

ABSTRACT

This aim of this research is to find out the classification results and to compare the magnitude of misclassification of QUEST and CHAID methods on the classification of customer of Adira Kredit Elektronik branch Denpasar. QUEST (Quick, Unbiased, Efficient Statistical Trees) and CHAID (Chi-squared Automatic Interaction Detection) are nonparametric methods that produce tree diagram which is easy to interpret. The QUEST and CHAID classification methods conclude that: 1) QUEST method produces three groups which predict customers into the current category, whereas CHAID method produces four groups which also predict customer into the current category; 2) both methods generate the biggest classification accuracy for customers that current categorywhich share similar characteristics; 3) both methods also have the same degree of accuracy in classifying customer data Adira Kredit Elektronik branch Denpasar.

Keywords: Classification, QUEST, CHAID, customer credit status.

1. PENDAHULUAN

Klasifikasi merupakan pengelompokan secara sistematis suatu objek atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri. Masalah klasifikasi sering dijumpai dalam kehidupan sehari-hari, baik pada bidang industri, sosial, kesehatan maupun pendidikan.

Penelitian

ini

membahas

metode

klasifikasi pohon menggunakan metode

QUEST dan CHAID dengan variabel

berskala kategorik, dengan tujuan untuk

mengetahui

hasil

klasifikasi

dan

membandingkan

besarnya

kesalahan

klasifikasi dari metode QUEST dan CHAID

pada klasifikasi data nasabah Adira Kredit

Elektronik Cabang Denpasar.

Metode QUEST merupakan algoritma

yang diperkenalkan oleh Loh dan Shih [3],

sebagai salah satu bentuk metode pohon

klasifikasi yang menghasilkan pohon biner.

QUEST diterapkan pada data dengan variabel

respon kategorik dan variabel prediktor

berupa variabel kategorik maupun numerik.

QUEST merupakan modifikasi dari analisis

diskriminan kuadratik. Analisis diskriminan

kuadratik diterapkan pada proses penentuan

simpul penyekat.

Algoritma QUEST dibagi menjadi tiga bagian yaitu, algoritma pemilihan variabel penyekat, algoritma penentuan simpul penyekat, dan algoritma penghentian pembentukan pohon [3].

Langkah-langkah algoritma pemilihan

variabel penyekat dengan variabel kategorik

adalah sebagai berikut: pertama, untuk setiap

variabel prediktor kategorik, lakukan uji

khi-kuadrat dan hitung

p-value

. Kedua, pilih

variabel prediktor yang memiliki nilai


(7)

p-Faiza, N., Sumarjaya, I W., Srinadi, I G.A.M. Metode Quest dan Chaid pada Klasifikasi Karakteristik Nasabah Kredit

164

value

terkecil atau yang paling signifikan

sebagai variabel penyekat (Loh dan Shih [3]).

Setelah terpilih variabel penyekat, langkah selanjutnya adalah menentukan simpul penyekat. Apabila variabel penyekat yang terpilih berupa variabel kategorik dan terdiri lebih dari dua kategori, maka dilakukan transformasi ke variabel numerik dan selanjutnya diterapkan analisis diskriminan kudratik untuk mencari akar dari persamaan kuadrat , dengan:

̅ ̅

̅ ̅ .

dengan ̅ dan adalah rata-rata dan ragam variabel penyekat dari pengamatan variabel respon pertama, sedangkan ̅ dan adalah rata-rata dan ragam variabel penyekat dari pengamatan variabel respon kedua[3]. Jika akar yang dihasilkan adalah akar tunggal, maka akar tersebut dipilih sebagai simpul penyekat. Tetapi jika akar yang dihasilkan terdiri dari 2 akar, maka akan dipilih akar yang mendekati rata-rata dari variabel respon pertama sebagai simpul penyekat.

Proses pemilihan simpul secara rekursif akan terhenti apabila salah satu dari aturan penghentian tercapai. Ada empat aturan penghentian pembentukan pohon yaitu: pertama, jika simpul penyekat menjadi murni yaitu apabila semua kasus masuk ke dalam salah satu kategori variabel respon. Kedua, jika semua kasus yang terdapat di dalam simpul memiliki nilai-nilai identik untuk tiap variabel prediktor. Kedua, jika kedalaman pohon sudah mencapai kedalaman pohon maksimum yang ditetapkan. Keempat, jika banyaknya kasus yang masuk ke dalam simpul sudah mencapai jumlah minimum yang ditetapkan.

Hasil analisis dari metode QUEST akan dibandingkan dengan metode pendahulunya, yaitu metode CHAID. CHAID merupakan algoritma yang diperkenalkan oleh Kass (1980), metode klasifikasi yang lebih dulu diterapkan dan menghasilkan pohon nonbiner (Kass [2]).

CHAID diterapkan pada data dengan variabel respon dan variabel prediktor berupa variabel kategorik.

CHAID membedakan variabel prediktor kategorik menjadi tiga bentuk yang berbeda, yaitu: monotonik, bebas, dan mengambang (Gallagher [1]).

Algoritma CHAID secara lengkap yaitu sebagai berikut (Kass [2]): Pertama, untuk setiap variabel prediktor, buat tabulasi silang kategori variabel prediktor dengan kategori-kategori variabel respon. Kedua, untuk setiap tabulasi silang yang diperoleh (susun subtabel yang berukuran yang mungkin, adalah banyaknya kategori variabel respon) cari pasangan kategori variabel prediktor yang memiliki angka uji paling kecil. Jika angka uji tidak mencapai nilai kritis, gabungkan kedua kategori tersebut menjadi satu kategori campuran. Ulangi langkah ini sampai angka uji kategori campuran melampaui nilai kritis. Ketiga, untuk setiap kategori gabungan yang terbentuk dari 3 atau lebih kategori asal, temukan pemisahan biner yang memiliki angka uji yang paling besar (pemisahan berdasarkan tipe variabel prediktor). Jika angka uji ini lebih besar dari nilai kritis, buatlah pemisahan tersebut dan kembali ke langkah 2 di atas. Keempat, untuk setiap tabulasi silang variabel prediktor yang telah digabungkan secara optimal, pilih yang memiliki angka uji paling besar. Jika angka uji ini lebih besar dari nilai kritis, bagilah data menurut kategori–kategori yang telah digabungkan dari variabel prediktor yang telah dipilih. Pada tahap ini apabila terjadi pengurangan tabel kontingensi dari tabel asal maka gunakan uji koreksi Bonferoni dan jika tidak maka lakukan uji khi-kuadrat untuk uji signifikansi. Kelima, untuk setiap pembagian data yang belum dianalisis, kembali ke langkah 1.

Dalam menyeleksi apakah seseorang layak mendapatkan pinjaman kredit, dibutuhkan suatu analisis statistika salah satunya dengan metode klasifikasi. Dalam hal ini, metode klasifikasi digunakan untuk membagi suatu nasabah ke dalam kelompok yang lebih kecil kelompoknya berdasarkan status pembayaran kredit lancar atau


(8)

E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 163-168 ISSN: 2303-1751

165

macet. Kelompok-kelompok yang terbentuk tersebut akan digunakan oleh Adira Kredit Elektronik Cabang Denpasar sebagai acuan untuk menentukan sasaran utama pemasaran dengan mempertimbangkan status kredit. Dengan penentuan kelompok sasaran kredit yang tepat, diharapkan risiko kredit macet bisa diminimalkan.

Adanya kesamaan karakteristik dari metode QUEST dan CHAID yaitu dapat diterapkan pada data variabel kategorik dan dalam pemilihan variabel penyekat menggunakan uji khi-kuadrat. Sehingga penulis tertarik untuk melakukan penelitian dengan metode QUEST dan CHAID yang akan diterapkan pada data nasabah Adira Kredit Elektronik Cabang Denpasar. Penelitian ini membandingkan hasil klasifikasi dari kedua metode tersebut untuk dapat dijadikan bahan analisis perusahaan dalam menentukan calon nasabah pada masa yang akan datang.

2. METODE PENELITIAN

Penelitian ini mengambil data nasabah Adira Kredit Elektronik Cabang Denpasar sebagai study kasus. Data diperoleh dari hasil pengisian formulir aplikasi permohonan kredit nasabah Adira Kredit Elektronik Cabang Denpasar yang sebelumnya sudah pernah mengajukan kredit dan melakukan pengajuan kembali pada bulan September sampai dengan Oktober 2014.

Adapun Variabel yang digunakan dalam penelitian ini berupa variabel kategori yaitu meliputi status kredit ( ), jenis kelamin ( ), status pernikahan ( ), jenis pekerjaan ( ), dan status tempat tinggal ( ), pendidikan terakhir ( ), jabatan nasabah ( ), lama angsuran ( ), dan pendapatan per bulan ( ).

Langkah-langkah yang dilakukan dalam metode penelitian ini adalah:

1. Mengumpulkan dan menyeleksi data. 2. Meringkas dan menyajikan data. 3. Pembentukan pohon klasifikasi. 4. Menginterpretasi hasil klasifikasi.

5. Perbandingan persentase kesalahan klasifikasi.

3. HASIL DAN PEMBAHASAN 3.1. Klasifikasi dengan Metode QUEST

Gambar 1 menunjukkan bahwa dari 626 sampel yang diteliti, hasil yang didapatkan adalah nasabah dengan status lancar sebanyak 550 orang (87,9%) dan nasabah dengan status macet sebanyak 76 orang (12,1%). Variabel pendapatan per bulan ( ) adalah variabel prediktor yang paling signifikan, sehingga variabel tersebut dipilih sebagai variabel penyekat. Variabel pendapatan per bulan ( ) disekat menjadi 2 simpul, yaitu simpul ke-1 dengan kategori nasabah yang memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 menjadi satu simpul, dan simpul ke-2 dengan kategori nasabah yang memiliki pendapatan per bulan >Rp5.000.000 menjadi satu simpul. Pada simpul ke-1 proses penyekatan dilanjutkan dan menjadi simpul dalam, karena variabel status tempat tinggal ( ) merupakan variabel prediktor kedua yang signifikan untuk membagi kategori pada simpul ke-1. Sementara pada simpul ke-2 proses penyekatan dihentikan karena semua kasus yang terdapat di dalam simpul memiliki nilai-nilai identik untuk tiap variabel prediktor, sehingga simpul ke-2 menjadi simpul akhir.

Variabel status tempat tinggal ( ) disekat menjadi 2 simpul, yaitu simpul ke-3 dengan kategori nasabah yang status tempat tinggal milik mertua, kontrak, dan kos menjadi satu kelompok, dan simpul ke-4 dengan kategori nasabah yang status tempat tinggal milik sendiri, keluarga, orang tua, dan perusahaan menjadi satu kelompok. Pada simpul ke-3 dan simpul ke-4 proses penyekatan dihentikan karena semua kasus yang terdapat di dalam simpul ke-3 dan simpul ke-4 memiliki nilai-nilai identik untuk tiap variabel prediktor, sehingga simpul ke-3 dan simpul ke-4 menjadi simpul akhir. Dengan demikian, analisis dengan metode QUEST menghasilkan tiga simpul akhir.


(9)

Faiza, N., Sumarjaya, I W., Srinadi, I G.A.M. Metode Quest dan Chaid pada Klasifikasi Karakteristik Nasabah Kredit

166

Gambar 1. Diagram Pohon Klasifikasi QUEST untuk Data Nasabah

Hasil metode QUEST berdasarkan Gambar 1 mendapatkan 3 kelompok, yang diringkas dalam Tabel 1 dan Tabel 2 berikut:

Tabel 1. Hasil Klasifikasi Dari Diagram Pohon QUEST

Kelompok 1 Nasabah yang memiliki

pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 dengan status tempat tinggal milik mertua, kontrak, dan kos.

Kelompok 2 Nasabah yang memiliki

pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 dengan status tempat tinggal milik sendiri, keluarga, orang tua.

Kelompok 3 Nasabah dengan pendapatan per

bulan >Rp5.000.000.

Tabel 2. Status Kredit Nasabah Pada Setiap Kelompok

Kelompok

Lancar Macet Prediksi

status kredit

N % N %

1 173 75,9 55 24,1 Lancar

2 174 92,1 15 7,9 Lancar

3 203 97,1 6 2,9 Lancar

Sumber: Data diolah, 2015

3.2. Klasifikasi dengan Metode CHAID

Gambar 2 menunjukkan bahwa variabel status tempat tinggal ( ) adalah variabel prediktor yang paling signifikan terhadap variabel status kredit ( ). Setelah dikoreksi dengan pengali Bonferroni diperoleh nilai khi-kuadrat variabel status tempat tinggal ( ) sebesar 32,661, sehingga variabel tersebut dipilih sebagai variabel penyekat.

Variabel status tempat tinggal ( ) disekat menjadi 2 simpul, yaitu simpul ke-1 dan simpul ke-2. Pada simpul ke-1 terjadi penggabungan antara kategori status tempat tinggal milik sendiri, keluarga, orang tua, dan perusahaan karena jumlah nasabah berstatus lancar dan macet pada status tempat tinggal tersebut hampir seimbang atau hal ini berarti bahwa kategori status tempat tinggal milik sendiri, keluarga, orang tua, dan perusahaan memenuhi syarat kesignifikanan khi-kuadrat untuk bisa digabung menjadi satu simpul kategori campuran.Pada simpul ke-2 juga terjadi penggabungan antara kategori status tempat tinggal milik mertua, kos, dan kontrak menjadi satu simpul kategori campuran. Pada simpul ke-1 dan simpul ke-2 proses penyekatan dilanjutkan dan merupakan simpul dalam.

Variabel pendapatan per bulan ( ) merupakan variabel prediktor kedua yang signifikan untuk menyekat kategori pada simpul ke-1 dan simpul ke-2. Variabel pendapatan per bulan ( ) pada simpul ke-1 disekat menjadi 2 simpul, yaitu simpul ke-3 dan simpul ke-4. Pada simpul ke-3 terjadi penggabungan antara kategori nasabah yang memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 menjadi satu simpul kategori campuran dan simpul ke-4 dengan kategori nasabah yang memiliki pendapatan per bulan >Rp5.000.000 menjadi satu simpul. Pada simpul ke-3 dan simpul ke-4 proses penyekatan dihentikan karena tidak ada lagi variabel prediktor yang signifikan untuk membagi kategori pada simpul ke-3 dan simpul 4, sehingga simpul 3 dan simpul ke-4 menjadi simpul akhir. Selanjutnya untuk simpul ke-2 disekat menjadi 2 simpul, yaitu simpul ke-5 dan simpul ke-6. Pada simpul ke-5 terjadi penggabungan antara kategori nasabah yang


(10)

E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 163-168 ISSN: 2303-1751

167

memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 menjadi satu simpul kategori campuran dan simpul ke-6 dengan kategori nasabah yang memiliki pendapatan per bulan >Rp5.000.000 menjadi satu simpul. Pada simpul ke-5 dan simpul ke-6 proses penyekatan dihentikan karena tidak ada lagi variabel prediktor yang signifikan untuk membagi kategori pada simpul ke-5 dan simpul ke-6, sehingga simpul ke-5 dan simpul ke-6 menjadi simpul akhir. Dengan demikian, analisis dengan metode CHAID menghasilkan empat simpul akhir.

Gambar 2. Diagram Pohon Klasifikasi CHAID untuk Data Nasabah

Hasil metode CHAID berdasarkan Gambar 2 mendapatkan 4 kelompok, yang diringkas dalam Tabel 3 dan Tabel 4.

Tabel 3. Hasil Klasifikasi Dari Diagram Pohon CHAID

Kelompok 1 Nasabah yang memiliki status

tempat tinggal milik sendiri, keluarga, orang tua dan perusahaan dengan pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000.

Kelompok 2 Nasabah yang memiliki status

tempat tinggal milik sendiri, keluarga, orang tua dan perusahaan dengan pendapatan per bulan >Rp5.000.000.

Kelompok 3 Nasabah yang memiliki status

tempat tinggal milik mertua, kontrak, dan kos dengan pendapatan per bulan <Rp2.000.000 dan

Rp2.000.000-Rp5.000.000.

Kelompok 4 Nasabah yang memiliki status

tempat tinggal milik mertua, kontrak, dan kos dengan pendapatan per bulan >Rp5.000.000

Tabel 4. Status Kredit Nasabah Pada Setiap Kelompok

Kelompok

Lancar Macet Prediksi

status kredit

N % N %

1 174 92,1 15 7,9 Lancar

2 134 99,3 1 0,7 Lancar

3 173 75,9 55 24,1 Lancar

4 69 93,2 5 6,8 Lancar

Sumber: Data diolah, 2015

3.3. Perbandingan Klasifikasi dengan Metode QUEST dan CHAID

Gambar 1 dan 2 menunjukkan bahwa metode QUEST dan CHAID memiliki kedalaman pohon yang sama yaitu sebanyak 2, namun memiliki jumlah simpul dan simpul akhir yang berbeda. Metode QUEST memiliki 5 simpul dengan 3 simpul akhir, sementara CHAID memiliki 7 simpul dengan 4 simpul akhir.

Pohon yang dihasilkan metode QUEST adalah pohon biner, karena QUEST hanya menghasilkan dua ketegori baru pada tiap penyekatan. Metode CHAID juga menghasilkan pohon biner, namun dengan alasan yang berbeda. Ini karena p-value pasangan-pasangan kategori variabel prediktor selalu lebih besar dari nilai α = 0,05, sehingga pada akhirnya hanya tertinggal


(11)

Faiza, N., Sumarjaya, I W., Srinadi, I G.A.M. Metode Quest dan Chaid pada Klasifikasi Karakteristik Nasabah Kredit

168

dua ketegori baru pada tiap penyekatan.

Pada metode QUEST dan CHAID persentase terbesar nasabah yang berstatus lancar memiliki karakteristik yang hampir sama. Metode QUEST dengan persentase 97,1%, yaitu nasabah dengan pendapatan per bulan >Rp5.000.000. Sementara untuk metode CHAID dengan persentase 99,3%, yaitu nasabah yang memiliki status tempat tinggal milik sendiri, keluarga, orang tua dan perusahaan dengan pendapatan per bulan >Rp5.000.000.Dan kesalahan klasifikasi terbesar dari kedua metode tersebut memiliki karakteristik yang sama, yaitu nasabah yang memiliki status tempat tinggal milik mertua, kontrak, dan kos dengan pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 dengan persentase 24,1%.

Hasil klasifikasi menunjukkan bahwa metode QUEST dan CHAID cukup baik digunakan untuk mengklasifikasi nasabah Adira Kredit Elektronik Cabang Denpasar, hal ini dilihat dari persentase keakuratan klasifikasi untuk status kredit dengan metode QUEST maupun CHAID, yaitu sebesar 87,9%. Kedua metode tersebut memiliki tingkat akurasi yang sama, hal ini dilihat dari kesalahan klasifikasi yang sama besar yaitu 12,1% seperti pada Tabel 5.

Tabel 5. Perbandingan Kesalahan Klasifikasi Metode Kesalahan

klasifikasi

Keakuratan klasifikasi

QUEST 12.1% 87,9%

CHAID 12,1% 87,9%

4. KESIMPULAN DAN SARAN

Berdasarkan hasil analisis dan pembahasan yang dilakukan maka diperoleh kesimpulan: (1) Semua kelompok yang dihasilkan oleh metode QUEST dan metode CHAID menghasilkan kelompok dengan prediksi nasabah masuk ke dalam kategori lancar; (2) Pada metode QUEST dan CHAID persentase keakuratan klasifikasi terbesar nasabah yang berstatus lancar memiliki karakteristik yang hampir sama; (3) Metode QUEST dan CHAID memiliki tingkat akurasi yang sama, hal ini dilihat dari kesalahan klasifikasi dalam mengklasifikasikan data nasabah Adira Kredit Elektronik Cabang

Denpasar yang sama besar yaitu: 12,1%.

Saran yang diberikan yaitu, untuk penelitian berikutnya metode QUEST dapat dikembangkan untuk variabel respon berupa variabel kategori yang memiliki lebih dari dua kategori dan untuk variabel prediktor dapat digunakan variabel numerik, serta dapat dilanjutkan dengan proses pemangkasan yang dilakukan untuk memilih pohon terbaik.

DAFTAR PUSTAKA

[1] Gallagher, C.A. 2000. An Iterative Approach to Classification Analysis. www.casact.org/library/ratemaking/90dp23 7.pdf [Februari 2014].

[2] Kass, G.V. 1980. An Exploratory Technique for Investigating Large Quantities of categorical Data. Applied Statistics, Vol. 29 (2):119-127.

http://www4.stat.ncsu.edu/~dickey/Analyti cs/Datamine/Reference%20Papers/kass80.p df [Februari 2014].

[3] Loh W.Y. dan Shih, Y.S. 1997. Split Selection Methods for Classfication Trees. Stastistica Sinica7; 815-840.

http://www3.stat.sinica.edu.tw/statistica/old pdf/A7n41.pdf [Agustus 2014].


(1)

METODE QUEST DAN CHAID PADA KLASIFIKASI

KARAKTERISTIK NASABAH KREDIT

Nur Faiza§1,I Wayan Sumarjaya2, I Gusti Ayu Made Srinadi3

1

Jurusan Matematika, FMIPA, Universitas Udayana [Email: [email protected]]

2Jurusan Matematika, FMIPA, Universitas Udayana [Email: [email protected]]

3Jurusan Matematika, FMIPA, Universitas Udayana [Email: [email protected]] §

Corresponding Author

ABSTRACT

This aim of this research is to find out the classification results and to compare the magnitude of misclassification of QUEST and CHAID methods on the classification of customer of Adira Kredit Elektronik branch Denpasar. QUEST (Quick, Unbiased, Efficient Statistical Trees) and CHAID (Chi-squared Automatic Interaction Detection) are nonparametric methods that produce tree diagram which is easy to interpret. The QUEST and CHAID classification methods conclude that: 1) QUEST method produces three groups which predict customers into the current category, whereas CHAID method produces four groups which also predict customer into the current category; 2) both methods generate the biggest classification accuracy for customers that current categorywhich share similar characteristics; 3) both methods also have the same degree of accuracy in classifying customer data Adira Kredit Elektronik branch Denpasar.

Keywords: Classification, QUEST, CHAID, customer credit status.

1. PENDAHULUAN

Klasifikasi merupakan pengelompokan secara sistematis suatu objek atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri. Masalah klasifikasi sering dijumpai dalam kehidupan sehari-hari, baik pada bidang industri, sosial, kesehatan maupun pendidikan.

Penelitian

ini

membahas

metode

klasifikasi pohon menggunakan metode

QUEST dan CHAID dengan variabel

berskala kategorik, dengan tujuan untuk

mengetahui

hasil

klasifikasi

dan

membandingkan

besarnya

kesalahan

klasifikasi dari metode QUEST dan CHAID

pada klasifikasi data nasabah Adira Kredit

Elektronik Cabang Denpasar.

Metode QUEST merupakan algoritma

yang diperkenalkan oleh Loh dan Shih [3],

sebagai salah satu bentuk metode pohon

klasifikasi yang menghasilkan pohon biner.

QUEST diterapkan pada data dengan variabel

respon kategorik dan variabel prediktor

berupa variabel kategorik maupun numerik.

QUEST merupakan modifikasi dari analisis

diskriminan kuadratik. Analisis diskriminan

kuadratik diterapkan pada proses penentuan

simpul penyekat.

Algoritma QUEST dibagi menjadi tiga bagian yaitu, algoritma pemilihan variabel penyekat, algoritma penentuan simpul penyekat, dan algoritma penghentian pembentukan pohon [3].

Langkah-langkah algoritma pemilihan

variabel penyekat dengan variabel kategorik

adalah sebagai berikut: pertama, untuk setiap

variabel prediktor kategorik, lakukan uji

khi-kuadrat dan hitung

p-value

. Kedua, pilih

variabel prediktor yang memiliki nilai


(2)

p-value

terkecil atau yang paling signifikan

sebagai variabel penyekat (Loh dan Shih [3]).

Setelah terpilih variabel penyekat, langkah selanjutnya adalah menentukan simpul penyekat. Apabila variabel penyekat yang terpilih berupa variabel kategorik dan terdiri lebih dari dua kategori, maka dilakukan transformasi ke variabel numerik dan selanjutnya diterapkan analisis diskriminan kudratik untuk mencari akar dari persamaan kuadrat , dengan:

̅ ̅

̅ ̅ . dengan ̅ dan adalah rata-rata dan ragam variabel penyekat dari pengamatan variabel respon pertama, sedangkan ̅ dan adalah rata-rata dan ragam variabel penyekat dari pengamatan variabel respon kedua[3]. Jika akar yang dihasilkan adalah akar tunggal, maka akar tersebut dipilih sebagai simpul penyekat. Tetapi jika akar yang dihasilkan terdiri dari 2 akar, maka akan dipilih akar yang mendekati rata-rata dari variabel respon pertama sebagai simpul penyekat.

Proses pemilihan simpul secara rekursif akan terhenti apabila salah satu dari aturan penghentian tercapai. Ada empat aturan penghentian pembentukan pohon yaitu: pertama, jika simpul penyekat menjadi murni yaitu apabila semua kasus masuk ke dalam salah satu kategori variabel respon. Kedua, jika semua kasus yang terdapat di dalam simpul memiliki nilai-nilai identik untuk tiap variabel prediktor. Kedua, jika kedalaman pohon sudah mencapai kedalaman pohon maksimum yang ditetapkan. Keempat, jika banyaknya kasus yang masuk ke dalam simpul sudah mencapai jumlah minimum yang ditetapkan.

Hasil analisis dari metode QUEST akan dibandingkan dengan metode pendahulunya, yaitu metode CHAID. CHAID merupakan algoritma yang diperkenalkan oleh Kass (1980), metode klasifikasi yang lebih dulu diterapkan dan menghasilkan pohon nonbiner (Kass [2]).

CHAID diterapkan pada data dengan variabel respon dan variabel prediktor berupa variabel kategorik.

CHAID membedakan variabel prediktor kategorik menjadi tiga bentuk yang berbeda, yaitu: monotonik, bebas, dan mengambang (Gallagher [1]).

Algoritma CHAID secara lengkap yaitu sebagai berikut (Kass [2]): Pertama, untuk setiap variabel prediktor, buat tabulasi silang kategori variabel prediktor dengan kategori-kategori variabel respon. Kedua, untuk setiap tabulasi silang yang diperoleh (susun subtabel yang berukuran yang mungkin, adalah banyaknya kategori variabel respon) cari pasangan kategori variabel prediktor yang memiliki angka uji paling kecil. Jika angka uji tidak mencapai nilai kritis, gabungkan kedua kategori tersebut menjadi satu kategori campuran. Ulangi langkah ini sampai angka uji kategori campuran melampaui nilai kritis. Ketiga, untuk setiap kategori gabungan yang terbentuk dari 3 atau lebih kategori asal, temukan pemisahan biner yang memiliki angka uji yang paling besar (pemisahan berdasarkan tipe variabel prediktor). Jika angka uji ini lebih besar dari nilai kritis, buatlah pemisahan tersebut dan kembali ke langkah 2 di atas. Keempat, untuk setiap tabulasi silang variabel prediktor yang telah digabungkan secara optimal, pilih yang memiliki angka uji paling besar. Jika angka uji ini lebih besar dari nilai kritis, bagilah data menurut kategori–kategori yang telah digabungkan dari variabel prediktor yang telah dipilih. Pada tahap ini apabila terjadi pengurangan tabel kontingensi dari tabel asal maka gunakan uji koreksi Bonferoni dan jika tidak maka lakukan uji khi-kuadrat untuk uji signifikansi. Kelima, untuk setiap pembagian data yang belum dianalisis, kembali ke langkah 1.

Dalam menyeleksi apakah seseorang layak mendapatkan pinjaman kredit, dibutuhkan suatu analisis statistika salah satunya dengan metode klasifikasi. Dalam hal ini, metode klasifikasi digunakan untuk membagi suatu nasabah ke dalam kelompok yang lebih kecil kelompoknya berdasarkan status pembayaran kredit lancar atau


(3)

macet. Kelompok-kelompok yang terbentuk tersebut akan digunakan oleh Adira Kredit Elektronik Cabang Denpasar sebagai acuan untuk menentukan sasaran utama pemasaran dengan mempertimbangkan status kredit. Dengan penentuan kelompok sasaran kredit yang tepat, diharapkan risiko kredit macet bisa diminimalkan.

Adanya kesamaan karakteristik dari metode QUEST dan CHAID yaitu dapat diterapkan pada data variabel kategorik dan dalam pemilihan variabel penyekat menggunakan uji khi-kuadrat. Sehingga penulis tertarik untuk melakukan penelitian dengan metode QUEST dan CHAID yang akan diterapkan pada data nasabah Adira Kredit Elektronik Cabang Denpasar. Penelitian ini membandingkan hasil klasifikasi dari kedua metode tersebut untuk dapat dijadikan bahan analisis perusahaan dalam menentukan calon nasabah pada masa yang akan datang.

2. METODE PENELITIAN

Penelitian ini mengambil data nasabah Adira Kredit Elektronik Cabang Denpasar sebagai study kasus. Data diperoleh dari hasil pengisian formulir aplikasi permohonan kredit nasabah Adira Kredit Elektronik Cabang Denpasar yang sebelumnya sudah pernah mengajukan kredit dan melakukan pengajuan kembali pada bulan September sampai dengan Oktober 2014.

Adapun Variabel yang digunakan dalam penelitian ini berupa variabel kategori yaitu meliputi status kredit ( ), jenis kelamin ( ), status pernikahan ( ), jenis pekerjaan ( ), dan status tempat tinggal ( ), pendidikan terakhir ( ), jabatan nasabah ( ), lama angsuran ( ), dan pendapatan per bulan ( ).

Langkah-langkah yang dilakukan dalam metode penelitian ini adalah:

1. Mengumpulkan dan menyeleksi data. 2. Meringkas dan menyajikan data. 3. Pembentukan pohon klasifikasi. 4. Menginterpretasi hasil klasifikasi.

5. Perbandingan persentase kesalahan klasifikasi.

3. HASIL DAN PEMBAHASAN

3.1. Klasifikasi dengan Metode QUEST

Gambar 1 menunjukkan bahwa dari 626 sampel yang diteliti, hasil yang didapatkan adalah nasabah dengan status lancar sebanyak 550 orang (87,9%) dan nasabah dengan status macet sebanyak 76 orang (12,1%). Variabel pendapatan per bulan ( ) adalah variabel prediktor yang paling signifikan, sehingga variabel tersebut dipilih sebagai variabel penyekat. Variabel pendapatan per bulan ( ) disekat menjadi 2 simpul, yaitu simpul ke-1 dengan kategori nasabah yang memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 menjadi satu simpul, dan simpul ke-2 dengan kategori nasabah yang memiliki pendapatan per bulan >Rp5.000.000 menjadi satu simpul. Pada simpul ke-1 proses penyekatan dilanjutkan dan menjadi simpul dalam, karena variabel status tempat tinggal ( ) merupakan variabel prediktor kedua yang signifikan untuk membagi kategori pada simpul ke-1. Sementara pada simpul ke-2 proses penyekatan dihentikan karena semua kasus yang terdapat di dalam simpul memiliki nilai-nilai identik untuk tiap variabel prediktor, sehingga simpul ke-2 menjadi simpul akhir.

Variabel status tempat tinggal ( ) disekat menjadi 2 simpul, yaitu simpul ke-3 dengan kategori nasabah yang status tempat tinggal milik mertua, kontrak, dan kos menjadi satu kelompok, dan simpul ke-4 dengan kategori nasabah yang status tempat tinggal milik sendiri, keluarga, orang tua, dan perusahaan menjadi satu kelompok. Pada simpul ke-3 dan simpul ke-4 proses penyekatan dihentikan karena semua kasus yang terdapat di dalam simpul ke-3 dan simpul ke-4 memiliki nilai-nilai identik untuk tiap variabel prediktor, sehingga simpul ke-3 dan simpul ke-4 menjadi simpul akhir. Dengan demikian, analisis dengan metode QUEST menghasilkan tiga simpul akhir.


(4)

Gambar 1. Diagram Pohon Klasifikasi QUEST untuk Data Nasabah

Hasil metode QUEST berdasarkan Gambar 1 mendapatkan 3 kelompok, yang diringkas dalam Tabel 1 dan Tabel 2 berikut:

Tabel 1. Hasil Klasifikasi Dari Diagram Pohon QUEST

Kelompok 1 Nasabah yang memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 dengan status tempat tinggal milik mertua, kontrak, dan kos. Kelompok 2 Nasabah yang memiliki

pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 dengan status tempat tinggal milik sendiri, keluarga, orang tua.

Kelompok 3 Nasabah dengan pendapatan per bulan >Rp5.000.000.

Tabel 2. Status Kredit Nasabah Pada Setiap Kelompok

Kelompok

Lancar Macet Prediksi status kredit

N % N %

1 173 75,9 55 24,1 Lancar 2 174 92,1 15 7,9 Lancar 3 203 97,1 6 2,9 Lancar Sumber: Data diolah, 2015

3.2. Klasifikasi dengan Metode CHAID

Gambar 2 menunjukkan bahwa variabel status tempat tinggal ( ) adalah variabel prediktor yang paling signifikan terhadap variabel status kredit ( ). Setelah dikoreksi dengan pengali Bonferroni diperoleh nilai khi-kuadrat variabel status tempat tinggal ( ) sebesar 32,661, sehingga variabel tersebut dipilih sebagai variabel penyekat.

Variabel status tempat tinggal ( ) disekat menjadi 2 simpul, yaitu simpul ke-1 dan simpul ke-2. Pada simpul ke-1 terjadi penggabungan antara kategori status tempat tinggal milik sendiri, keluarga, orang tua, dan perusahaan karena jumlah nasabah berstatus lancar dan macet pada status tempat tinggal tersebut hampir seimbang atau hal ini berarti bahwa kategori status tempat tinggal milik sendiri, keluarga, orang tua, dan perusahaan memenuhi syarat kesignifikanan khi-kuadrat untuk bisa digabung menjadi satu simpul kategori campuran.Pada simpul ke-2 juga terjadi penggabungan antara kategori status tempat tinggal milik mertua, kos, dan kontrak menjadi satu simpul kategori campuran. Pada simpul ke-1 dan simpul ke-2 proses penyekatan dilanjutkan dan merupakan simpul dalam.

Variabel pendapatan per bulan ( ) merupakan variabel prediktor kedua yang signifikan untuk menyekat kategori pada simpul ke-1 dan simpul ke-2. Variabel pendapatan per bulan ( ) pada simpul ke-1 disekat menjadi 2 simpul, yaitu simpul ke-3 dan simpul ke-4. Pada simpul ke-3 terjadi penggabungan antara kategori nasabah yang memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 menjadi satu simpul kategori campuran dan simpul ke-4 dengan kategori nasabah yang memiliki pendapatan per bulan >Rp5.000.000 menjadi satu simpul. Pada simpul ke-3 dan simpul ke-4 proses penyekatan dihentikan karena tidak ada lagi variabel prediktor yang signifikan untuk membagi kategori pada simpul ke-3 dan simpul 4, sehingga simpul 3 dan simpul ke-4 menjadi simpul akhir. Selanjutnya untuk simpul ke-2 disekat menjadi 2 simpul, yaitu simpul ke-5 dan simpul ke-6. Pada simpul ke-5 terjadi penggabungan antara kategori nasabah yang


(5)

memiliki pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 menjadi satu simpul kategori campuran dan simpul ke-6 dengan kategori nasabah yang memiliki pendapatan per bulan >Rp5.000.000 menjadi satu simpul. Pada simpul ke-5 dan simpul ke-6 proses penyekatan dihentikan karena tidak ada lagi variabel prediktor yang signifikan untuk membagi kategori pada simpul ke-5 dan simpul ke-6, sehingga simpul ke-5 dan simpul ke-6 menjadi simpul akhir. Dengan demikian, analisis dengan metode CHAID menghasilkan empat simpul akhir.

Gambar 2. Diagram Pohon Klasifikasi CHAID untuk Data Nasabah

Hasil metode CHAID berdasarkan Gambar 2 mendapatkan 4 kelompok, yang diringkas dalam Tabel 3 dan Tabel 4.

Tabel 3. Hasil Klasifikasi Dari Diagram Pohon CHAID

Kelompok 1 Nasabah yang memiliki status tempat tinggal milik sendiri, keluarga, orang tua dan perusahaan dengan pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000. Kelompok 2 Nasabah yang memiliki status

tempat tinggal milik sendiri, keluarga, orang tua dan perusahaan dengan pendapatan per bulan >Rp5.000.000. Kelompok 3 Nasabah yang memiliki status

tempat tinggal milik mertua, kontrak, dan kos dengan pendapatan per bulan <Rp2.000.000 dan

Rp2.000.000-Rp5.000.000. Kelompok 4 Nasabah yang memiliki status

tempat tinggal milik mertua, kontrak, dan kos dengan pendapatan per bulan >Rp5.000.000

Tabel 4. Status Kredit Nasabah Pada Setiap Kelompok

Kelompok

Lancar Macet Prediksi status kredit

N % N %

1 174 92,1 15 7,9 Lancar 2 134 99,3 1 0,7 Lancar 3 173 75,9 55 24,1 Lancar 4 69 93,2 5 6,8 Lancar Sumber: Data diolah, 2015

3.3. Perbandingan Klasifikasi dengan Metode QUEST dan CHAID

Gambar 1 dan 2 menunjukkan bahwa metode QUEST dan CHAID memiliki kedalaman pohon yang sama yaitu sebanyak 2, namun memiliki jumlah simpul dan simpul akhir yang berbeda. Metode QUEST memiliki 5 simpul dengan 3 simpul akhir, sementara CHAID memiliki 7 simpul dengan 4 simpul akhir.

Pohon yang dihasilkan metode QUEST adalah pohon biner, karena QUEST hanya menghasilkan dua ketegori baru pada tiap penyekatan. Metode CHAID juga menghasilkan pohon biner, namun dengan alasan yang berbeda. Ini karena p-value pasangan-pasangan kategori variabel prediktor selalu lebih besar dari nilai α = 0,05, sehingga pada akhirnya hanya tertinggal


(6)

dua ketegori baru pada tiap penyekatan.

Pada metode QUEST dan CHAID persentase terbesar nasabah yang berstatus lancar memiliki karakteristik yang hampir sama. Metode QUEST dengan persentase 97,1%, yaitu nasabah dengan pendapatan per bulan >Rp5.000.000. Sementara untuk metode CHAID dengan persentase 99,3%, yaitu nasabah yang memiliki status tempat tinggal milik sendiri, keluarga, orang tua dan perusahaan dengan pendapatan per bulan >Rp5.000.000.Dan kesalahan klasifikasi terbesar dari kedua metode tersebut memiliki karakteristik yang sama, yaitu nasabah yang memiliki status tempat tinggal milik mertua, kontrak, dan kos dengan pendapatan per bulan <Rp2.000.000 dan Rp2.000.000-Rp5.000.000 dengan persentase 24,1%.

Hasil klasifikasi menunjukkan bahwa metode QUEST dan CHAID cukup baik digunakan untuk mengklasifikasi nasabah Adira Kredit Elektronik Cabang Denpasar, hal ini dilihat dari persentase keakuratan klasifikasi untuk status kredit dengan metode QUEST maupun CHAID, yaitu sebesar 87,9%. Kedua metode tersebut memiliki tingkat akurasi yang sama, hal ini dilihat dari kesalahan klasifikasi yang sama besar yaitu 12,1% seperti pada Tabel 5.

Tabel 5. Perbandingan Kesalahan Klasifikasi Metode Kesalahan

klasifikasi

Keakuratan klasifikasi

QUEST 12.1% 87,9%

CHAID 12,1% 87,9%

4. KESIMPULAN DAN SARAN

Berdasarkan hasil analisis dan pembahasan yang dilakukan maka diperoleh kesimpulan: (1) Semua kelompok yang dihasilkan oleh metode QUEST dan metode CHAID menghasilkan kelompok dengan prediksi nasabah masuk ke dalam kategori lancar; (2) Pada metode QUEST dan CHAID persentase keakuratan klasifikasi terbesar nasabah yang berstatus lancar memiliki karakteristik yang hampir sama; (3) Metode QUEST dan CHAID memiliki tingkat akurasi yang sama, hal ini dilihat dari kesalahan klasifikasi dalam mengklasifikasikan data nasabah Adira Kredit Elektronik Cabang

Denpasar yang sama besar yaitu: 12,1%.

Saran yang diberikan yaitu, untuk penelitian berikutnya metode QUEST dapat dikembangkan untuk variabel respon berupa variabel kategori yang memiliki lebih dari dua kategori dan untuk variabel prediktor dapat digunakan variabel numerik, serta dapat dilanjutkan dengan proses pemangkasan yang dilakukan untuk memilih pohon terbaik.

DAFTAR PUSTAKA

[1] Gallagher, C.A. 2000. An Iterative Approach to Classification Analysis. www.casact.org/library/ratemaking/90dp23 7.pdf [Februari 2014].

[2] Kass, G.V. 1980. An Exploratory Technique for Investigating Large Quantities of categorical Data. Applied Statistics, Vol. 29 (2):119-127.

http://www4.stat.ncsu.edu/~dickey/Analyti cs/Datamine/Reference%20Papers/kass80.p df [Februari 2014].

[3] Loh W.Y. dan Shih, Y.S. 1997. Split Selection Methods for Classfication Trees. Stastistica Sinica7; 815-840.

http://www3.stat.sinica.edu.tw/statistica/old pdf/A7n41.pdf [Agustus 2014].