PENERAPAN ALGORITMA QUEST (QUICK, UNBIASED, EFFICIENT STATISTICAL TREE) PADA PEMBENTUKAN POHON KLASIFIKASI MINAT MASYARAKAT KABUPATEN PURWAKARTA TERHADAP BANK SYARIAH.

(1)

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

PENERAPAN ALGORITMA QUEST (QUICK, UNBIASED, EFFICIENT STATISTICAL TREE) PADA PEMBENTUKAN POHON KLASIFIKASI MINAT MASYARAKAT KABUPATEN PURWAKARTA TERHADAP

BANK SYARIAH

SKRIPSI

Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Sarjana Sains

Program Studi Matematika Konsentrasi Statistika

Oleh

Riski Sulistiawati Handayani 0907260

JURUSAN PENDIDIKAN MATEMATIKA

FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA


(2)

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu


(3)

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah


(4)

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

PENERAPAN ALGORITMA QUEST(QUICK, UNBIASED, EFFICIENT STATISTICAL TREE) PADA PEMBENTUKAN POHON KLASIFIKASI

MINAT MASYARAKAT KABUPATEN PURWAKARTA TERHADAP BANK SYARIAH

Oleh

Riski Sulistiawati Handayani

Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana pada Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam

© Riski Sulistiawati Handayani 2013 Universitas Pendidikan Indonesia

Juli 2013

Hak Cipta dilindungi undang-undang.

Skripsi ini tidak boleh diperbanyak seluruhya atau sebagian, dengan dicetak ulang, difoto kopi, atau cara lainnya tanpa ijin dari penulis.


(5)

1

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

PENERAPAN ALGORITMA QUEST (QUICK, UNBIASED, EFFICIENT STATISTICAL TREE) PADA PEMBENTUKAN POHON KLASIFIKASI MINAT MASYARAKAT KABUPATEN PURWAKARTA TERHADAP

BANK SYARIAH

Riski Sulistiawati Handayani1, Nar Herrhyanto2, dan Elah Nurlaelah3 1 Mahasiswa Program Studi Matematika, Universitas Pendidikan Indonesia

2 Dosen Program Studi Matematika, Universitas Pendidikan Indonesia 3 Dosen Program Studi Matematika, Universitas Pendidikan Indonesia

ABSTRAK

Berdasarkan data Kajian Ekonomi Regional Jawa Barat triwulan I-2013, perkembangan aset perbankan kinerja intermediasi perbankan syariah pada periode ini sedikit mengalamai kenaikan dari 95,34% menjadi 98,94%. Sementara itu, penyaluran pembiayaan sedikit meningkat, namun penghimpunan dana mengalami perlambatan. Meskipun demikian, rasio Non Performing Financing perbankan syariah di Jawa Barat triwulan I-2013 sebesar 2,71% lebih tinggi daripada periode sebelumnya sebesar 2,35%. Perkembangan perbankan syariah sangat prospektif dan penyebarannya semakin luas tidak hanya dikota-kota besar tetapi juga telah menyebar ke daerah-daerah termasuk Kabupaten Purwakarta. Motivasi masyarakat terhadap bank syariah dapat diteliti dari beberapa faktor, yaitu pendidikan (�1), usia (�2), jenis kelamin �3 , pekerjaan �4 , pendapatan/bulan (�5), pengeluaran/bulan (�6), aksesibilitas (�7), pengetahuan terhadap produk dan mekanisme Bank Syariah �8 , dan pendapat mengenai bunga bank adalah riba (�9). Faktor paling signifikan yang mempengaruhi motivasi masyarakat dapat ditunjukkan dengan metode pohon klasifikasi, karena dapat memperoleh informasi kualitatif. Salah satu algoritma yang dapat digunakan dalam pembentukan pohon klasifikasi adalah algoritma QUEST. QUEST (Quick, Unbiased and Efficient Statistical Tree) dikembangkan oleh Wei-Yin Loh dan Yu-Shan Shih. Algoritma ini memiliki kecepatan dalam hal komputasi (Quick), menghasilkan pemilihan variabel bebas yang tak bias (Unbiased), dan efisien (Efficient) untuk data kompleks, yakni variabel prediktor terdiri dari kategorik dan numerik. QUEST merupakan modifikasi analisis diskriminan kuadratik. Algoritma QUEST dibagi menjadi tiga bagian, yakni algoritma pemilihan variabel prediktor penyekat, algoritma penentuan simpul penyekat, dan algoritma penghentian pembentukan pohon. Berdasarkan analisis dengan algoritma QUEST diperoleh kesimpulan bahwa faktor pengetahuan terhadap produk dan mekanisme bank syariah merupakan faktor yang paling signifikan mempengaruhi minat masyarakat Purwakarta terhadap bank syariah.

Kata kunci : Klasifikasi, Pohon Klasifikasi, QUEST, Analisis Diskriminan, Minat, Bank Syariah.


(6)

v Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

DAFTAR ISI

Halaman

LEMBAR PERNYATAAN ... i

ABSTRAK ... ii

KATA PENGANTAR ... iii

UCAPAN TERIMA KASIH ... iv

DAFTAR ISI ... v

DAFTAR TABEL ... vii

DAFTAR GAMBAR ... ix

DAFTAR lAMPIRAN ... x

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Rumusan Masalah ... 3

1.3 Batasan Masalah ... 3

1.4 Tujuan Penulisan ... 4

1.5 Manfaat Penulisan ... 4

1.5.1 Aspek Teoritis ... 4

1.5.2 Aspek Praktis ... 4

1.6 Sistematika Penulisan ... 4

BAB II KAJIAN PUSTAKA ... 6

2.1 Jenis Data... 6

2.2 Variabel ... 7

2.3 Uji Kebebasan �2 ... 8

2.4 Uji Levene ... 10

2.5 Uji ANOVA... 11

2.6 Klasifikasi ... 13

2.7 Aljabar Matriks ... 14


(7)

vi Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Halaman

2.7.2 Matriks ... 14

2.7.3 Vektor Rata-rata ... 15

2.7.4 Matriks Varians-Kovarians ... 17

2.7.5 Nilai Eigen dan Vektor Eigen ... 19

2.8 Analisis Diskriminan Kuadratik ... 19

BAB III METODE POHON KLASIFIKASI QUEST ... 23

3.1 Metode Berstruktur Pohon ... 23

3.2 Pohon Klasifikasi... 27

3.3 Metode Pohon Klasifikasi QUEST ... 27

3.4 Algoritma QUEST ... 29

BAB IV STUDI KASUS ... 35

4.1 Perbankan Syariah ... 35

4.1.1 Bunga Bank dan Riba ... 35

4.1.2 Produk dan Mekanisme Bank Syariah ... 36

4.2 Metodologi Penelitian ... 40

4.2.1 Populasi dan Sampel ... 41

4.2.2 Jenis dan Sumber Data ... 42

4.3 Analisis Data ... 46

4.3.1 Deskripsi Data ... 46

4.3.2 Penerapan Algoritma QUEST Dalam Pembentukan Pohon Klasifikasi ... 52

BAB V PENUTUP ... 74

5.1 Kesimpulan ... 74

5.2 Saran ... 75

DAFTAR PUSTAKA ... 77

LAMPIRAN ... 80


(8)

vii Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

DAFTAR TABEL

Halaman

Tabel 2.1 Daftar Kontingensi �� Untuk Hasil Pengamatan Dua Variabel ... 9

Tabel 2.2 Struktur Data untuk Uji ANOVA ... 12

Tabel 2.3 ANOVA ... 13

Tabel 2.4 Struktur Data Untuk Analisis Diskriminan ... 20

Tabel 4.1 Perbedaan Antara Bunga dan Bagi Hasil ... 36

Tabel 4.2 Faktor-Faktor Yang Mempengaruhi Minat Berhubungan Dengan Bank Syariah Berdasarkan Beberapa Sumber ... 43

Tabel 4.3 Faktor-faktor yang Digunakan dalam Penelitian ... 44

Tabel 4.4 Tabulasi Silang antara Sikap dan Pendidikan ... 46

Tabel 4.5 Deskriptif Variabel Usia ... 47

Tabel 4.6 Tabulasi Silang antara Sikap dan Jenis Kelamin ... 48

Tabel 4.7 Tabulasi Silang antara Sikap dan Pekerjaan ... 48

Tabel 4.8 Deskriptif Variabel Pendapatan/bulan ... 49

Tabel 4.9 Deskriptif Variabel Pengeluaran/bulan ... 50

Tabel 4.10 Tabulasi Silang antara Sikap dan Aksesibilitas ... 50

Tabel 4.11 Tabulasi Silang antara Sikap dan Produk Mekanisme ... 51

Tabel 4.12 Tabulasi Silang antara Sikap dan Pendapat Riba ... 51

Tabel 4.13 Kriteria Untuk Pemilihan Variabel Penyekat Pertama ... 53

Tabel 4.14 Tabulasi Silang Antara Sikap dan Produk Mekanisme ... 54

Tabel 4.15 Kriteria Untuk Pemilihan Variabel Penyekat Pada Simpul 1 ... 54

Tabel 4.16 Uji Levene untuk Variabel Numerik ... 55

Tabel 4.17 Kriteria Untuk Pemilihan Variabel Penyekat Pada Simpul 2 ... 56

Tabel 4.18 Tabulasi Silang Untuk Transformasi Variabel Kategorik... 57

Tabel 4.19 Tabulasi Silang Dengan Koordinat Diskriminan ... 61

Tabel 4.20 Kriteria Untuk Pemilihan Variabel Penyekat Pada Simpul 3 ... 64


(9)

viii Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Tabel 4.22 Kriteria Untuk Pemilihan Variabel Penyekat Pada Simpul 4 ... 66

Halaman Tabel 4.23 Deskriptif Statistik Variabel Usia ... 66

Tabel 4.24 Kriteria Untuk Pemilihan Variabel Penyekat Pada Simpul 5 ... 69

Tabel 4.25 Uji Levene Untuk Variabel Numerik ... 70

Tabel 4.26 Kriteria Untuk Pemilihan Variabel Penyekat Pada Simpul 6 ... 70


(10)

ix Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

DAFTAR GAMBAR

Halaman

Gambar 3.1 Contoh Pohon Keputusan ... 24

Gambar 3.2 Ilustrasi Pohon Biner ... 25

Gambar 3.3 Ilustrasi Pohon Non-biner ... 26

Gambar 4.1 Persentase Sikap Responden ... 46

Gambar 4.2 Pohon Kalsifikasi Minat Masyarakat Terhadap Bank Syariah dengan Algoritma QUEST ... 72


(11)

x Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

DAFTAR LAMPIRAN

Halaman

Lampiran 1 Diagram Algoritma Pemilihan Variabel Penyekat ... 79

Lampiran 2 Diagram Algoritma Penentuan Titik Penyekat ... 80

Lampiran 3 Bukti Rumus ... 81

Lampiran 4 Lembar Isian Kuisioner ... 85

Lampiran 5 Tabel Rekapitulasi Hasil Penelitian ... 87

Lampiran 6 Tabel Pengkodean untuk Setiap Data ... 92

Lampiran 7 Output SPSS untuk Uji Chi-Kuadrat dan ANOVA pada Simpul 0 ... 95

Lampiran 8 Output SPSS untuk Uji Chi-Kuadrat, ANOVA, dan Levene pada Simpul 1 ... 97

Lampiran 9 Output SPSS untuk Uji Chi-Kuadrat dan ANOVA pada Simpul 2 ... 101

Lampiran 10 Output SPSS untuk Uji Chi-Kuadrat, ANOVA, dan Levene pada Simpul 3 ... 105

Lampiran 11 Output SPSS untuk Uji Chi-Kuadrat dan ANOVA pada Simpul 4 ... 109

Lampiran 12 Output SPSS untuk Uji Chi-Kuadrat, ANOVA, dan Levene pada Simpul 5 ... 120

Lampiran 13 Output SPSS untuk Uji Chi-Kuadrat, ANOVA, dan Levene pada Simpul 6 ... 128


(12)

1 Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

BAB I PENDAHULUAN

1.1Latar Belakang Masalah

Kehadiran bank syariah di Indonesia didorong oleh keinginan masyarakat Indonesia (terutama masyarakat Islam) yang berpandangan bahwa bunga merupakan hal yang haram. Walaupun demikian, sebenarnya prinsip bagi hasil dalam lembaga keuangan telah dikenal luas, baik di negara Islam maupun non Islam. Jadi bank syariah tidak berkaitan dengan kegiatan ritual keagamaan (Islam), tetapi lebih merupakan konsep pembagian hasil usaha antara pemilik modal dengan pihak pengelola modal. Dengan demikian pengelolaan bank dengan prinsip syariah dapat diakses dan dikelola oleh seluruh masyarakat yang berminat tidak terbatas pada masyarakat Islam, walaupun tidak dipungkiri sampai saat ini bank syariah di Indonesia baru berkembang pada kalangan masyarakat Islam. Dilihat dari aspek ini, peluang pengembangan bank syariah di Indonesia cukup besar, karena jumlah penduduk Indonesia yang mayoritas beragama Islam (Ratnawati et.al, 2000).

Berdasarkan data Kajian Ekonomi Regional Jawa Barat triwulan I-2013, perkembangan aset perbankan kinerja intermediasi perbankan syariah pada periode ini sedikit mengalami kenaikan dari 95,34% menjadi 98,94%. Sementara itu, penyaluran pembiayaan sedikit meningkat, yakni tumbuh 43,35% menjadi Rp.17,99 triliun. Disisi lain, penghimpunan dana mengalami perlambatan dari 35,79% menjadi 36,28%. Meski intermediasi perbankan syariah sedikit turun, namun rasio Non Performing Financing perbankan syariah di Jawa Barat triwulan I-2013 sebesar 2,71% lebih tinggi daripada periode sebelumnya sebesar 2,35%.

Perkembangan perbankan syariah sangat prospektif dan penyebarannya semakin luas tidak hanya dikota-kota besar tetapi juga telah menyebar ke daerah-daerah termasuk Kabupaten Purwakarta. Motivasi masyarakat terhadap bank syariah dapat diteliti dari beberapa faktor. Dari faktor-faktor tersebut dapat dilihat


(13)

2

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

faktor paling signifikan yang mempengaruhi motivasi masyarakat, dengan menggunakan pohon klasifikasi, karena dapat memperoleh informasi kualitatif mengenai data klasifikasi minat masyarakat terhadap bank syariah yang sudah berminat dan belum berminat terhadap bank syariah. Metode klasifikasi berstruktur pohon dibagi kedalam dua kelompok. Kelompok pertama menghasilkan pohon biner (pohon yang menghasilkan dua simpul baru dari hasil penyekatan), yaitu Classification and Regression Tree (CART) yang diperkenalkan oleh Breiman et.al. tahun 1984 dan Quick, Unbiased, Efficient, Statistical Tree (QUEST) yang diperkenalkan oleh Loh dan Shih tahun 1997. Kelompok kedua menghasilkan pohon non-biner (pohon yang menghasilkan lebih dari dua simpul baru dari hasil penyekatan) yaitu Chi-Squared Automatic Interaction Detection (CHAID) yang diperkenalkan oleh Kass tahun 1980, Factor Analysis Classification Tree (FACT) yang diperkenalkan oleh Loh & Vanichestakul tahun 1988, dan Classification Rule with Unbiased Interation Selection and Estimation (CRUISE) yang diperkenalkan oleh Kim dan Loh tahun 2001.

Algoritma QUEST ini cocok diterapkan untuk metode klasifikasi dengan variabel respon dua kategori sama halnya pada analisis diskriminan dan regresi logistik. Penggunaan metode konvensional (parametrik), seperti analisis diskriminan dan regresi logistik membutuhkan beberapa asumsi yang harus dipenuhi, seperti matriks varians-kovarians kedua populasi harus sama dan berdistribusi normal multivariat.

Penggunaan metode klasifikasi berstruktur pohon merupakan pendekatan nonparametrik yang digunakan sebagai salah satu pemecahan dalam mengatasi keterbatasan metode-metode konvensional. Metode klasifikasi berstruktur pohon adalah salah satu metode klasifikasi yang tidak bergantung pada asumsi tertentu, mampu mengeksplorasi struktur data yang kompleks dengan variabel yang banyak. Struktur data dapat dilihat secara visual dan proses pengelompokan nilai respon mudah dilakukan dengan menelusuri pohon klasifikasi yang diperoleh sehingga memberikan kemudahan dalam menginterpretasikan hasil (Lewis, 2000).


(14)

3

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Dari uraian di atas penulis tertarik untuk meneliti faktor-faktor yang mempengaruhi minat masyarakat terhadap bank syariah berdasarkan klasifikasi minat masyrakat yang berminat dan belum berminat dengan pembentukan pohon klasifikasi dengan menerapkan algoritma QUEST sebagai alternatif penyelesaian permasalahan klasifikasi. Untuk penyusunan skripsi ini judul yang dikaji yakni

“Penerapan Algoritma QUEST (Quick, Unbiased, Efficient Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah. Metode ini akan diterapkan pada studi kasus mengenai minat masyarakat Kabupaten Purwakarta terhadap Bank Syariah.

1.2Rumusan Masalah

Berdasarkan uraian, permasalahan yang akan diangkat dalam skripsi ini adalah :

1. Bagaimana penerapan algoritma QUEST dalam pembentukan pohon klasifikasi minat masyarakat Kabupaten Purwakarta terhadap bank syariah?

2. Faktor apa yang paling signifikan dalam mempengaruhi minat masyarakat Kabupaten Purwakarta dalam hubungannya dengan bank syariah?

1.3Batasan Masalah

Terdapat dua macam metode pohon klasifikasi biner yaitu dengan algoritma CART dan QUEST. Namun pada penulisan ini hanya akan membahas pembentukan pohon klasifikasi biner dengan algoritma QUEST.

1.4 Tujuan Penulisan

Tujuan penulisan skripsi ini adalah

1. Menerapkan algoritma QUEST dalam pembentukan pohon klasifikasi minat masyarakat Kabupaten Purwakarta terhadap bank syariah.


(15)

4

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

2. Mengetahui faktor yang paling signifikan dalam mempengaruhi minat masyarakat Kabupaten Purwakarta dalam hubungannya dengan bank syariah.


(16)

5

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

1.5 Manfaat Penulisan 1.5.1 AspekTeoritis

Melalui penulisan skripsi ini diharapkan dapat memperkaya dan memperluas wawasan serta pengetahuan tentang metode klasifikasi yang menggunakan analisis statistika dengan pendekatan nonparametrik yaitu dengan metode pohon klasifikasi QUEST.

1.5.2 Aspek Praktis

Melalui penulisan skripsi ini diharapkan dapat digunakan sebagai referensi dalam menggunakan metode pengklasifikasian sehingga dapat dijadikan bahan pertimbangan dalam penerapan masalah pengklasifikasian.

1.6 Sistematika Penulisan

Adapun sistematika penulisan dalam skripsi ini adalah:

BAB I PENDAHULUAN

Bab ini mengemukakan latar belakang masalah, rumusan masalah, batasan masalah, tujuan penulisan, manfaat penulisan dan sistematika penulisan.

BAB II KAJIAN PUSTAKA

Bab ini mengemukakan beberapa materi yang mendukung Bab III

BAB III METODE POHON KLASIFIKASI DENGAN ALGORITMA

QUEST (QUICK, UNBIASED, EFFICIENT STATISTICAL TREE)

Mengemukakan kajian teoritis tentang metode pohon klasifikasi dengan algoritma QUEST (Quick, Unbiased, Efficient Statistical Tree)


(17)

6

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Menerapkan metode pohon klasifikasi denagn algoritma QUEST pada klasifikasi minat msyarakat Kabupaten Purwakarta terhadap Bank Syariah.

BAB V KESIMPULAN DAN SARAN

Berisi kesimpulan dan saran hasil dari pembahasan materi.

DAFTAR PUSTAKA LAMPIRAN


(18)

23 Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

BAB III

METODE POHON KLASIFIKASI QUEST

3.1Metode Berstruktur Pohon

Istilah pohon dalam matematika dikenal dalam teori graf. Pertama kali konsep pohon digunakan oleh Gustav Kirchhoff (1824-1887) dalam bidang jaringan listrik. Berikutnya konsep pohon dikembangkan oleh Arthur Cayley (1821-1895). Pada tahun 1857 Cayley menggunakan konsep ini untuk menghitung banyaknya isomer-isomer yang berlainan dari CnH2n+2. Sebuah graf

merupakan himpunan terhingga tak kosong yang memuat objek-objek yang disebut simpul, dan himpunan pasangan tak terurut antara simpul-simpul berlainan yang disebut sisi. Sebuah graf dikatakan pohon, jika graf tersebut merupakan graf terhubung dan tidak mengandung siklus (Kusumah, 1998:20). Selanjutnya istilah pohon dikenal juga dalam teori keputusan, yakni pohon keputusan. Sebuah pohon keputusan merupakan sebuah penyekatan yang dinyatakan sebagai sebuah penyekatan berulang. Struktur hirarkis sebuah pohon terdiri dari simpul dan sisi. Beberapa bagian dalam sebuah pohon keputusan:

 Simpul akar, simpul yang tidak mempunyai sisi yang masuk tetapi memiliki sisi yang keluar.

 Simpul dalam, simpul yang memiliki satu sisi yang masuk dan dua atau lebih sisi yang keluar

 Simpul terminal atau simpul akhir, simpul yang mempunyai sisi yang masuk dan tidak ada sisi yang keluar. Simpul akhir dinyatakan sebagai label kelas.

Contoh :

Identifikasi pembeli komputer (dari pohon keputusan dibawah ini ternyata salah satu kelompok yang potensial adalah orang yang berusia < 30 dan pelajar)


(19)

24

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Metode berstruktur pohon merupakan salah satu teknik utama dalam data mining. Teknik ini memiliki banyak kesamaan dengan metode-metode yang lebih konvensional, seperti analisis regresi, analisis diskriminan, dan analisis klaster. Metode berstruktur pohon merupakan metodologi statistik dengan pendekatan non-parametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk variabel respon berupa nominal atau numerik.

Penggunaan metode berstruktur pohon (tree-structured methods) sebagai alternatif terhadap metode-metode konvensional telah menyebar luas di berbagai bidang dalam beberapa tahun terakhir. Bidang terapan yang menggunakan metode tersebut, antara lain riset pemasaran (dalam segmentasi pasar), kedokteran (untuk diagnosa kategori penyakit berbahaya ataukah tidak), ilmu komputer (untuk menyelidiki struktur data), biologi (dalam hal klasifikasi makhluk hidup dengan ciri-ciri tertentu), psikologi (teori pengambilan keputusan), dan lain lain.

Kelinearan hubungan antara variabel respon dan prediktor seringkali menjadi kendala dalam penggunaan metode-metode konvensional (parametrik). Metode berstruktur pohon sering digunakan sebagai alternatif bila beberapa asumsi pada metode parametrik tidak dapat dipenuhi. Hasil analisis utama metode berupa grafik pohon yang memudahkan pengguna terutama yang bukan statistisi dalam hal interpretasi data.

Usia

Pelajar

Membeli Tidak membeli

30tahun > 30 tahun

bukan ya

Tingkat kredit

Tidak membeli Membeli

tinggi wajar


(20)

25

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Metode berstruktur pohon dapat dibagi kedalam dua kelompok. Kelompok pertama, metode yang menghasilkan pohon biner yaitu sebuah pohon yang setiap simpul disekat menjadi dua simpul yang saling terpisah. Kelompok kedua, metode yang menghasilkan pohon non-biner yaitu sebuah pohon yang setiap simpul disekat menjadi dua atau lebih simpul yang terpisah.

Kelompok pohon biner yaitu CART (Classification and Regression Tree) yang diperkenalkan oleh Breiman et.al. tahun 1984 dan QUEST (Quick, Unbiased, Efficient Statistical Tree) yang diperkenalkan oleh Loh dan Shih tahun 1997. Kelompok pohon non-biner, diantaranya CHAID (Chi-Squared Automatic Interaction Detection) yang diperkenalkan oleh Kass tahun 1980, FACT (Factor Analysis Classification Tree) yang diperkenalkan oleh Loh & Vanichestakul tahun 1988, dan CRUISE (Classification Rule with Unbiased Iteration Selected and Estimation) yang diperkenalkan oleh Kim & Loh tahun 2001. Berikut akan ditunjukan ilustrasi visualisasi dua jenis pohon tersebut.

Pada Gambar 3.2 ditunjukkan struktur pohon biner yang memiliki satu simpul akar yang dinyatakan dengan t1 yang mengandung semua gugus data.

Simpul dalam adalah simpul yang bisa disekat menjadi simpul anak. Karena masih bisa disekat maka simpul ini dilambangkan dengan lingkaran yaitu t2, t3, t7.

Sedangkan simpul akhir dilambangkan dengan kotak yaitu t4, t5, t6, t8, t9.

t2

t1

t3

t4 t5 t6 t7

t8 t9


(21)

26

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Pada Gambar 3.3 ditunjukkan struktur pohon yang memiliki satu simpul akar yang dinyatakan dengan t1 yang mengandung semua gugus data. Dari simpul

akar diperoleh hasil penyekatan berupa 3 simpul baru, yaitu t2, t3, t4. Karena

terdapat simpul yang menghasilkan penyekatan lebih dari dua simpul, maka struktur pohon seperti ini dinamakan pohon non-biner. Seperti pada pohon biner, simpul dalam pada pohon ini dilambangkan oleh lingkaran yaitu t3, t4, t7 dan

simpul akhir dilambangkan dengan kotak yaitu t2, t5, t6, t8, t9, t10.

Berdasarkan tipe peubah responnya, ada dua tipe metode berstruktur pohon, yaitu pohon klasifikasi jika peubah responnya kategorik, dan pohon regresi jika peubah responnya numerik. Salah satu keuntungan penggunaan metode berstruktur pohon adalah tampilan grafisnya sehingga lebih mudah untuk diinterpretasikan. Selain itu metode tersebut juga lebih fleksibel karena mampu memeriksa pengaruh variabel prediktor satu persatu (tidak memeriksa secara langsung keseluruhan variabel yang pada umumnya digunakan pada metode-metode konvensional) (Lewis, 2000).

Sartono (Berk, 2008) mengemukakan bahwa meskipun metode pohon telah banyak memberikan hasil memuaskan diberbagai bidang terapan, adapun kelemahan pohon klasifikasi dan regresi yaitu sifatnya yang tidak stabil. Jika diambil sampel berbeda dari populasi yang sama, kemungkinan diperoleh pohon dengan bentuk yang berbeda.

t1

t3

t2

t5 t6

t4

t9 t10

t7 t8


(22)

27

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

3.2Pohon Klasifikasi

Sebuah pengklasifikasian berstruktur pohon merupakan sebuah pohon keputusan yang digunakan untuk memprediksi sebuah kelas variabel dari satu atau lebih variabel. Pohon klasifikasi (classification tree) merupakan metode statistika yang digunakan untuk memperkirakan keanggotaan objek dalam kelas-kelas variabel prediktor kategorik. Keanggotaan ini ditaksir dari pengukuran objek pada satu variabel prediktor atau lebih. Pohon ini dibentuk melalui penyekatan secara berulang (rekursif), dimana kelas dan nilai-nilai variabel prediktor setiap objek telah diketahui. Setiap penyekatan pada pohon yang dibentuk dinyatakan sebagai node atau simpul.

Pada metode ini objek dinyatakan sebagai vektor � yang merupakan ukuran untuk karakteristik tertentu. Sebagaimana dikemukakan oleh Breiman (Susanti, 2007: 25) bahwa misalkan terdapat buah karakteristik, maka vektor � dapat dituliskan sebagai �= 1, 2,…, . Definisikan � sebagai ruang

pengamatan yang memuat semua vektor yang mungkin, atau dengan kata lain � merupakan himpunan dari vektor-vektor yang ada. Misalkan terdapat buah vektor, maka � dapat ditulis sebagai �= { 1, 2,…, }. Suatu objek

dikelompokan kedalam kelas/kelompok yang diberi nomor 1, 2,…, dan misalkan adalah himpunan dari kelas-kelas tersebut sehingga dapat ditulis = {1, 2,…, }. Menurut Breiman (Susanti, 2007: 26), suatu pengklasifikasian merupakan fungsi ( ) yang didefinisikan pada � sedemikian rupa sehingga untuk setiap , = untuk suatu ∈ . Pengklasifikasian tidak dibentuk secara acak, melainkan berdasarkan pada pengalaman yang telah lalu/data sebelumnya. Dalam pembentukan klasifikasi yang sistematis, data sebelumnya dinamakan dengan learning sample.

3.3Metode Pohon Klasifikasi QUEST

QUEST merupakan kepanjangan dari Quick, Unbiased and Efficient Statistical Tree. QUEST merupakan sebuah algoritma pohon keputusan biner untuk analisis klasifikasi dan data mining yang dikembangkan oleh Wei-Yin Loh


(23)

28

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

(University of Wisconsin-Madison) dan Yu-Shan Shih (National Chung Cheng University, Taiwan) pada tahun 1997 dari metode pohon klasifikasi non-biner FACT yang memiliki kecepatan tinggi (Loh & Vanichsetakul, 2000). Algoritma ini memiliki kecepatan dalam hal komputasi (Quick), menghasilkan pemilihan variabel bebas yang tak bias (Unbiased), dan efisien (Efficient) untuk data kompleks, yakni variabel prediktor terdiri dari kategorik dan numerik.

Tujuan dari QUEST mirip dengan algoritma CART yang dijelaskan dalam buku Classification and Regression Trees oleh Breiman, Friedman, Olshen dan Stone pada tahun 1984. Perbedaan yang utamanya adalah

QUEST menggunakan teknik pemilihan variabel berdasarkan standar yang

ditetapkan.

QUEST menggunakan teknik penyekat pengganti untuk mengatasi nilai

pengamatan yang hilang.

QUEST dapat dengan mudah mengatasi variabel prediktor kategori dengan

banyak kategori dengan mentransformasi.

QUEST merupakan modifikasi analisis diskriminan kuadratik rekursif sebagai alternatif bagi metode-metode berstruktur pohon lain yang menggunakan pendekatan exhaustive search. Dalam metode QUEST, dapat ditetapkan taraf kepercayaan untuk simpul penyekat. Sebuah variabel bebas tidak dapat digunakan sebagai simpul penyekat, bila taraf signifikansinya kurang dari atau sama dengan nilai yang ditetapkan yakni minimal 0 dan maksimal 1. Umumnya taraf signifikansi yang digunakan adalah 0,05.

Algoritma FACT melakukan pemilihan variabel penyekat dan simpul penyekat dilakukan secara terpisah, ini juga yang dilakukan pada algoritma QUEST. Pada setiap variabel numerik hitung statistik-F pada uji ANOVA dan untuk setiap variabel kategori hitung �2 pada uji kebebasan dua variabel. Variabel yang memiliki kelompok dengan tingkat kehomogenan yang paling besar dipilih sebagai variabel penyekat. Analisis diskriminan kuadratik diterapkan pada proses pemilihan simpul penyekat. Jika variabel penyekat yang terpilih berupa variabel


(24)

29

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

kategorik, maka dilakukan transformasi ke peubah numerik dan selanjutnya diterapkan analisis diskriminan kuadratik.

3.4Algoritma QUEST

Menurut Loh dan Shih (1997), algoritma QUEST dibagi menjadi tiga bagian yakni, algoritma pemilihan variabel prediktor penyekat, algoritma penentuan simpul penyekat, dan algoritma penghentian pembentukan pohon.

1. Algoritma Pemilihan Variabel Penyekat

a. Untuk setiap variabel prediktor numerik, lakukan uji ANOVA F yang menguji semua kelas berbeda dari variabel terikat memiliki rata-rata yang sama dari , dan hitung nilai p-value berdasarkan statistik uji F. Untuk setiap variabel prediktor kategori, lakukan uji chi-kuadrat dari dan yang bebas dan hitung p-value berdasarkan statistik uji chi-kuadrat.

b. Cari prediktor dengan p-value terkecil dan notasikan dengan ∗.

c. Bandingkan p-value tersebut dengan taraf �/ 1, dimana �� (0,1)

merupakan taraf signifikansi dan 1 merupakan banyaknya variabel prediktor .

Jika p-value kurang dari �/ 1, maka variabel yang bersesuaian

dengan ∗ dipilih sebagai variabel penyekat. Kemudian lanjutkan ke langkah (e)

Jika p-value lebih dari �/ 1, maka lanjutkan ke langkah (d)

d. Untuk setiap variabel prediktor yang numerik,

 Hitung statistik Lavene F untuk menguji homogenitas varians dari untuk kelas yang berbeda dari Y, dan hitung p-value dari pengujian tersebut.

Cari prediktor yang memiliki p-value terkecil dan notasikan dengan ∗∗

Bandingkan p-value dari uji Lavene tersebut dengan taraf � 1+ 2, dimana 2 merupakan banyaknya variabel prediktor numerik.


(25)

30

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

 Jika ∗∗ kurang dari � 1+ 2

, maka variabel yang bersesuaian dengan ∗∗ dipilih sebagai variabel penyekat.

 Jika ∗∗ lebih dari �

1+ 2, maka variabel tersebut tidak dipilih menjadi variabel penyekat.

e. Misalkan ∗ adalah variabel penyekat yang diperoleh pada langkah (c) atau (d), lanjutkan ke algoritma penentuan simpul penyekat.

2. Algoritma Penentuan Simpul Penyekat

Setelah terpilih variabel penyekat, langkah selanjutnya adalah menentukan simpul penyekat. Algoritma penentuan simpul penyekat dijelaskan sebagai berikut:

a. Prediktor Penyekat Kategorik

Jika variabel prediktor yang terpilih adalah nominal dan biner, maka simpul penyekat jelas. Namun jika variabel prediktor yang terpilih adalah nominal dengan lebih dari dua kategori, QUEST pertama-tama mentransformasi ini kedalam variabel numerik (sebut saja �) dengan menetapkan koordinat diskriminan yang paling besar untuk mengategorikan prediktor. QUEST kemudian menggunakan algoritma pemilihan simpul penyekat untuk prediktor numerik pada � untuk menentukan simpul penyekat.

Langkah pemetaan kategori nominal kedalam nilai koordinat diskriminan (dengan kata lain, variabel nominal ditransformasi menjadi variabel numerik) dilakukan untuk mendefinisikan jarak dan urutan nilai-nilai yang telah ditransformasi. Hal ini ditujukan untuk memaksimumkan perbedaan antara kategori variabel respon (Loh & Shih, 1997). QUEST menggunakan analisis diskriminan kuadratik yang telah dimodifikasi untuk menangani varians yang tidak homogen antar kategori peubah respon.


(26)

31

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Misalkan merupakan variabel prediktor kategori dengan kategori

1, 2,…, . akan ditransformasi menjadi variabel numerik � untuk setiap kelas

dengan langkah-langkah sebagai berikut :

1. Transformasi setiap nilai dari kedalam sebuah vektor dummy -dimensi �= (�1,�2,…,�) , dimana � =

1 =

0 ≠ , = 1,2,…,

2. Hitung rata-rata keseluruahan kelas dari �

� = =1� � (3.1)

� ( ) = =1� �

,

(3.2) dengan

� : pengamatan ke-

� : rata-rata untuk semua pengamatan pada simpul

� ( ) : rata-rata untuk semua pengamatan pada simpul kelompok respon

� : jumlah pengamatan pada simpul untuk �

� : jumlah pengamatan pada simpul kelompok respon untuk � : jumlah pengamatan pada simpul

, : jumlah pengamatan pada simpul kelompok respon

3. Hitung matriks × berikut

�= , (� − � )(� − � )′

=1

(3.3)

� = �(�− � )(�− � )′

=

(3.4) 4. Lakukan singular value decomposition pada � untuk memperoleh �=

���′, dimana � adalah sebuah matriks ortogonal, �= diag( 1, 2,…, )

sehingga 1 2 ⋯ 0. Misalkan �−1/2 =diag 1∗, 2∗,…, ∗

dimana ∗=

−1 2

> 0 0 ��


(27)

32

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

5. Lakukan singular value decomposition pada �−1/2 ′ �−1/2 untuk memperoleh vektor eigen � yang berhubungan dengan nilai eigen yang terbesar.

6. Koordinat diskriminan terbesar dari � merupakan proyeksi

�= �′�−1/2 ′� (3.5)

b. Prediktor Penyekat Numerik

Variabel respon terdiri dari dua kategori, yaitu dan , dan variabel prediktor terpilih berupa numerik. Langkah penentuan prediktor penyekat sebagai berikut :

1. Misalkan dan 2 merupakan rata-rata dan varians ∗ dari pengamatan variabel respon kategori pertama, sedangkan dan 2 merupakan rata-rata dan varians ∗ dari pengamatan variabel respon kategori kedua. Misalkan

= , merupakan peluang dari masing-masing ketegori pada variabel

respon, dengan adalah jumlah pengamatan pada simpul awal kelompok respon .

2. Jika min 2 , 2 = 0, maka urutkan kedua kelas dengan urutan varians yang meningkat kemudian notasikan varians tersebut dengan 12 22, dan bersesuaian dengan rata-rata nya 1, 2. Misalkan � merupakan bilangan

positif yang sangat kecil nilainya, sebut saja � = 10−12. Jika 1 < 2, maka = 1(1 +�), selain itu = 1(1− �).

3. Jika min 2 , 2 ≠0, maka analisis diskriminan kuadratik diterapkan untuk menghitung simpul penyekat .

Analisis diskriminan kuadratik tradisional menaksir fungsi kepadatan dari kelas dengan fungsi kepadatan normal dengan rata-rata dan varians ditaksir dari sampel. Misalkan ( ) dan 2 merupakan rata-rata dan varians sampel kelas untuk kelas ke- = 1,2 . Misalkan � = 2� −1/2exp(− 2

2)

merupakan fungsi kepadatan normal baku. Analisis diskriminan kuadratik menyekat sumbu menjadi tiga interval yaitu −∞, 1 , 1, 2 dan


(28)

33

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

−1= −1(3.6)

Kedua ruas diberi log untuk memperoleh persamaan kuadrat 2+ + = 0, dimana

= 2− 2 (3.7)

= 2( 2− 2) (3.8)

= 2− 2+ 2 2 2log

(3.9)

Jika = 0 dan ≠ , hanya terdapat satu akar

=( + )

2 −

2

+ log

( | ) (3.10)

Persamaan tidak memiliki akar jika = 0 dan = .

4. Sebuah simpul dipisah pada ∗ = , dimana didefinisikan sebagai berikut : a. Jika = 0, maka

= =

( + )

2 −

2

+ log

( | ) , ≠ , =

(3.11)

b. Untuk ≠0

Jika 2−4 < 0, maka

= ( + )

2 (3.12)

Jika 2−4 0, maka definisikan

= − ±

2−4 2

(3.13) yang lebih mendekati , dengan syarat menghasilkan dua simpul yang tak kosong. QUEST hanya menggunakan satu dari kedua akar persamaan tersebut, yaitu akar yang nilainya paling mendekati rata-rata sampel dari tiap kelas.


(29)

34

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Proses penyekatan diulang terhadap simpul anak. Proses rekursif dilakukan sampai simpul tidak bisa disekat lagi dengan aturan penghentian proses pembentukan pohon ditentukan sebagai berikut :

1. Jika sebuah simpul menjadi murni, yaitu semua objek/kasus masuk kedalam kelas variabel terikat yang sama pada simpul tersebut, maka simpul tidak akan disekat.

2. Jika semua objek/kasus dalam sebuah simpul memiliki nilai-nilai identik untuk tiap variabel prediktor, maka simpul tidak akan disekat.

3. Jika kedalaman pohon pada saat tersebut mencapai nilai batas kedalaman pohon maksimum yang ditetapkan, maka proses pertumbuhan pohon akan berhenti.

4. Jika penyekat dari simpul menghasilkan simpul anak yang ukuran simpulnya kurang dari nilai ukuran simpul anak minimum yang ditetapkan, simpul tidak akan disekat.


(30)

74 Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

BAB V PENUTUP

5.1 Kesimpulan

1. QUEST merupakan kepanjangan dari Quick, Unbiased and Efficient Statistical Tree. QUEST merupakan sebuah algoritma pohon keputusan biner untuk analisis klasifikasi dan data mining yang dikembangkan oleh Wei-Yin Lohdan Yu-Shan Shih pada tahun 1997. Algoritma ini memiliki kecepatan dalam hal komputasi (Quick), menghasilkan pemilihan variabel bebas yang tak bias (Unbiased), dan efisien (Efficient) untuk data kompleks yakni variabel prediktor terdiri dari kategorik dan numerik.

Algoritma QUEST dibagi menjadi tiga bagian yakni, algoritma pemilihan variabel prediktor penyekat, algoritma penentuan simpul penyekat, dan algoritma penghentian pembentukan pohon. Pada setiap variabel numerik hitung statistik-F pada uji ANOVA dan untuk setiap variabel kategori hitung �2 pada uji kebebasan dua variabel. Variabel yang memiliki kelompok

dengan tingkat kehomogenan yang paling besar dipilih sebagai variabel penyekat. Analisis diskriminan kuadratik diterapkan pada proses pemilihan simpul penyekat. Jika variabel penyekat yang terpilih berupa variabel kategorik, maka dilakukan transformasi ke peubah numerik dan selanjutnya diterapkan analisis diskriminan kuadratik.

2. Pada studi kasus mengenai karakteristik masyarakat Purwakarta terhadap minat berhubungan dengan bank syariah, dapat disimpulkan sebagai berikut :

a. Kelas pertama yaitu responden yang mengetahui produk serta mekanisme bank syariah. Mereka berminat berhubungan dengan bank syariah.

b. Kelas kedua yaitu responden yang memiliki penghasilan dari usaha baik itu wiraswasta, wirausaha, ibu rumah tangga dan lainnya yang tidak


(31)

75

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

mengetahui produk serta mekanisme bank syariah. Mereka belum berminat untuk berhubungan dengan bank syariah.

c. Kelas ketiga yaitu responden yang berusia kurang dari sama dengan 38,8 tahun dan bekerja sebagai buruh atau pegawai dan tidak mengetahui produk serta mekanisme bank syariah. Mereka berminat untuk berhubungan dengan bank syariah.

d. Kelas keempat yaitu responden yang berusia lebih dari 38,8 tahun dan bekerja sebagai buruh atau pegawai yang tidak mengetahui produk serta mekanisme bank syariah, mereka belum berminat berhubungan dengan bank syariah.

Faktor yang paling signifikan dalam mempengaruhi minat masyarakat Kabupaten Purwakarta dalam hubungannya dengan bank syariah adalah faktor pengetahuan produk serta mekanisme bank syariah.

5.2 Saran

1. Pihak bank-bank syariah di Purwakarta diharapkan dapat memberikan informasi produk dan mekanisme bank syariah untuk menarik minat masyarakat Purwakarta dalam berhubungan dengan bank syariah karena pengetahuan terhadap produk dan mekanisme bank syariah merupakan faktor yang paling signifikan dalam menentukan minat masyarakat terhadap bank syariah.

2. Selain metode pohon klasifikasi dengan Algoritma QUEST (Quick, Unbiased, Efficient Statistical Tree) dapat digunakan pula metode pohon klasifikasi untuk penyekatan biner yang lain yaitu pohon klasifikasi dengan Algoritma CART (Classification and Regression Tree).

3. Kebanyakan variabel dengan skala ordinal dan nominal pada studi kasus yang diberikan dalam penulisan ini memiliki 2 kategori. Untuk penelitian selanjutnya dapat dikembangkan untuk variabel respon berupa variabel ordinal atau nominal yang memiliki lebih dari dua kategori.


(32)

76

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

4. Untuk penelitian selanjutnya dapat menggunakan algoritma penyekatan non-biner seperti CHAID (Chi-Squared Automatic Interaction Detection), FACT (Factor Analysis Classification Tree), dan CRUISE (Classification Rule with Unbiased Iteration Selected and Estimation).

5. Dalam penulisan ini hanya menjelaskan variabel terikat berupa data kategori, untuk penelitian selanjutnya dapat digunakan variabel terikat berupa data numerik/kontinu yang menghasilkan pohon regresi. Selain itu dapat diperluas untuk model pohon regresi data tersensor, dan model pohon regresi untuk desain eksperimen.


(33)

77 Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

DAFTAR PUSTAKA

Ali, L. et al. (2008). Kamus Besar Bahasa Indonesia Pusat Bahasa Edisi Keempat. Jakarta : Gramedia.

Anton, H. and Rorres, C. (2004). Aljabar Linear Elementer. Jakarta: Erlangga. Antonio, M.S. (2009). Bank Syariah Dari Teori Ke Praktik. Depok: Gema Insani Bank Indonesia. (2013). Kajian Ekonomi Regional Jawa Barat Triwulan I-2013.

[Online]. Tersedia: http://www.bi.go.id/NR/rdonlyres/DD708751-1397-

4C47-9E4D-85CD937B2FB9/29102/KERJabarProvinsiJawaBaratTriwulanI2013.pdf [15 Juli 2013]

Furqon. (2011). Statistika Terapan Untuk Penelitian. Bandung : Alfabeta

Johnson, R.A. and Wichern, D.W. (2007). Applied Multivariate Statistical Analysis Sixth Edition. New Jersey: Prentice Hall.

Kamarani, N. (2012). Faktor-Faktor yang Mempengaruhi Minat Masyarakat Dalam Berhubungan Dengan Bank Syariah di Kota Padang. Jurnal Manajemen dan Kewirausahaan. 3. (1), 31 halaman. [Online]. Tersedia:

http://jurnal.unitas-pdg.ac.id/files/31/Jurnal%20Manajemen/Vol%203%20Jan%202012/2.%20 Faktor2%20yang%20mempengaruhi%20minat%20masyarakat%20dalam% 20berhubungan%20dengan%20bank%20syariah.pdf [11 Mei 2013]

Kartiko, S.H. (1988). Metode Statistika Multivariat. Jakarta : Karunika Universitas Terbuka

Kusumah, Y.S. (1998). Matematika Diskrit. Bandung : CV. Andira

Lim, T.S., Loh, W.Y. and Shih, Y.S. (2000). A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-three Old and New Classification Algorithms. Machine Learning. 40, (3), 203-228. [Online]. Tersedia: http://www.stat.wisc.edu/~loh/treeprogs/quest1.7/mach1317.pdf [31 Maret 2013]

Loh, W.Y. and Shih, Y.S. (1997). Split Selection Methods for Classification

Trees. Statistica Sinica. 7, 815-840. [Online]. Tersedia:


(34)

78

Riski Sulistiawati Handayani, 2013

Penerapan Algoritma QUEST (Quick, Unbiased, Efficient, Statistical Tree) Pada Pembentukan Pohon Klasifikasi Minat Masyarakat Kabupaten Purwakarta Terhadap Bank Syariah

Universitas Pendidikan Indonesia | repository.upi.edu

Lewis, R.J. (2000). An Introduction to Classification and Regression Tree (CART) Analysis. 2000 Annual Meeting of the Society for Academic Emergency Medicine in Sn Fransisco. [Online]. Tersedia:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.95.4103&rep=rep 1&type=pdf [22 Februari 2013]

Malani, Y. (2011). Pembentukan Pohon Klasifikasi Biner dengan Algoritma QUEST. Skripsi pada Jurusan Matematika FMIPA Universitas Andalas. [Online].Tersedia:

http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&v ed=0CCkQFjAA&url=http%3A%2F%2Frepository.unand.ac.id%2F16794 %2F1%2FSkripsi_Yona_Malani.pdf&ei=la_SUaqnF8jwrQfnkYHIBg&usg =AFQjCNF1dyq8dXlRep2P_ReVs0A4v5Y8cw&sig2=Mqaauc59M3_Bimr 0xx4nTg&bvm=bv.48705608,d.bmk [24 Februari 2013]

Narimawati, U. (2008). Teknik-teknik Analisis Multivariat untuk Riset Ekonomi. Yogyakarta : Graha Ilmu.

Ratnawati, A. et al. (2000). Bank Syariah, Potensi, Preferensi, & Perilaku Masyarakat di Wilayah Jawa Barat. Lembaga Penelitian IPB dengan BI. [Online]. Tersedia: http://www.bi.go.id/NR/rdonlyres/BD5DD30E-41F1-4473-B6B5-D08D15DB7AD0/13437/BPSESJabarindonesia.pdf [20 Mei 2013]

Sartono, B. dan Syafitri, U.D. (2010). Metode Pohon Gabungan: Solusi Pilihan Untuk Mengatasi Kelemahan Pohon Regresi dan Klasifikasi Tunggal. Forum Statistika dan Komputasi. 15, (1), 1-7. [Online]. Tesedia: http://journal.ipb.ac.id/index.php/statistika/article/view/4895 [22 Februari 2013]

Sudjana. (2005). Metoda Statistika. Bandung : Tarsito

Sugiyono. (2012). Metode Penelitian Kuantitatif, Kualitatif Dan R&D. Bandung : Alfabeta

Susanti, I. (2007). Analisis Hubungan Jenis Kejahatan Dengan Karakteristik Wajah dan Profil Sosial Ekonomi Seorang Narapidana Menggunakan Metode Analisis Diskriminan dan Pohon Klasifikasi. Skripsi pada FMIPA

Universitas Indonesia. [Online]. Tersedia: http://

lontar.ui.ac.id/file?file=digital/20180930-023-07-Analisis%20hubungan.pdf [31 Maret 2013]


(1)

34

Proses penyekatan diulang terhadap simpul anak. Proses rekursif dilakukan sampai simpul tidak bisa disekat lagi dengan aturan penghentian proses pembentukan pohon ditentukan sebagai berikut :

1. Jika sebuah simpul menjadi murni, yaitu semua objek/kasus masuk kedalam kelas variabel terikat yang sama pada simpul tersebut, maka simpul tidak akan disekat.

2. Jika semua objek/kasus dalam sebuah simpul memiliki nilai-nilai identik untuk tiap variabel prediktor, maka simpul tidak akan disekat.

3. Jika kedalaman pohon pada saat tersebut mencapai nilai batas kedalaman pohon maksimum yang ditetapkan, maka proses pertumbuhan pohon akan berhenti.

4. Jika penyekat dari simpul menghasilkan simpul anak yang ukuran simpulnya kurang dari nilai ukuran simpul anak minimum yang ditetapkan, simpul tidak akan disekat.


(2)

74 BAB V PENUTUP

5.1 Kesimpulan

1. QUEST merupakan kepanjangan dari Quick, Unbiased and Efficient

Statistical Tree. QUEST merupakan sebuah algoritma pohon keputusan biner

untuk analisis klasifikasi dan data mining yang dikembangkan oleh Wei-Yin Lohdan Yu-Shan Shih pada tahun 1997. Algoritma ini memiliki kecepatan dalam hal komputasi (Quick), menghasilkan pemilihan variabel bebas yang tak bias (Unbiased), dan efisien (Efficient) untuk data kompleks yakni variabel prediktor terdiri dari kategorik dan numerik.

Algoritma QUEST dibagi menjadi tiga bagian yakni, algoritma pemilihan variabel prediktor penyekat, algoritma penentuan simpul penyekat, dan algoritma penghentian pembentukan pohon. Pada setiap variabel numerik hitung statistik-F pada uji ANOVA dan untuk setiap variabel kategori hitung �2 pada uji kebebasan dua variabel. Variabel yang memiliki kelompok

dengan tingkat kehomogenan yang paling besar dipilih sebagai variabel penyekat. Analisis diskriminan kuadratik diterapkan pada proses pemilihan simpul penyekat. Jika variabel penyekat yang terpilih berupa variabel kategorik, maka dilakukan transformasi ke peubah numerik dan selanjutnya diterapkan analisis diskriminan kuadratik.

2. Pada studi kasus mengenai karakteristik masyarakat Purwakarta terhadap minat berhubungan dengan bank syariah, dapat disimpulkan sebagai berikut :

a. Kelas pertama yaitu responden yang mengetahui produk serta mekanisme bank syariah. Mereka berminat berhubungan dengan bank syariah.

b. Kelas kedua yaitu responden yang memiliki penghasilan dari usaha baik itu wiraswasta, wirausaha, ibu rumah tangga dan lainnya yang tidak


(3)

75

mengetahui produk serta mekanisme bank syariah. Mereka belum berminat untuk berhubungan dengan bank syariah.

c. Kelas ketiga yaitu responden yang berusia kurang dari sama dengan 38,8 tahun dan bekerja sebagai buruh atau pegawai dan tidak mengetahui produk serta mekanisme bank syariah. Mereka berminat untuk berhubungan dengan bank syariah.

d. Kelas keempat yaitu responden yang berusia lebih dari 38,8 tahun dan bekerja sebagai buruh atau pegawai yang tidak mengetahui produk serta mekanisme bank syariah, mereka belum berminat berhubungan dengan bank syariah.

Faktor yang paling signifikan dalam mempengaruhi minat masyarakat Kabupaten Purwakarta dalam hubungannya dengan bank syariah adalah faktor pengetahuan produk serta mekanisme bank syariah.

5.2 Saran

1. Pihak bank-bank syariah di Purwakarta diharapkan dapat memberikan informasi produk dan mekanisme bank syariah untuk menarik minat masyarakat Purwakarta dalam berhubungan dengan bank syariah karena pengetahuan terhadap produk dan mekanisme bank syariah merupakan faktor yang paling signifikan dalam menentukan minat masyarakat terhadap bank syariah.

2. Selain metode pohon klasifikasi dengan Algoritma QUEST (Quick,

Unbiased, Efficient Statistical Tree) dapat digunakan pula metode pohon

klasifikasi untuk penyekatan biner yang lain yaitu pohon klasifikasi dengan Algoritma CART (Classification and Regression Tree).

3. Kebanyakan variabel dengan skala ordinal dan nominal pada studi kasus yang diberikan dalam penulisan ini memiliki 2 kategori. Untuk penelitian selanjutnya dapat dikembangkan untuk variabel respon berupa variabel


(4)

76

4. Untuk penelitian selanjutnya dapat menggunakan algoritma penyekatan non-biner seperti CHAID (Chi-Squared Automatic Interaction Detection), FACT (Factor Analysis Classification Tree), dan CRUISE (Classification Rule with

Unbiased Iteration Selected and Estimation).

5. Dalam penulisan ini hanya menjelaskan variabel terikat berupa data kategori, untuk penelitian selanjutnya dapat digunakan variabel terikat berupa data numerik/kontinu yang menghasilkan pohon regresi. Selain itu dapat diperluas untuk model pohon regresi data tersensor, dan model pohon regresi untuk desain eksperimen.


(5)

DAFTAR PUSTAKA

Ali, L. et al. (2008). Kamus Besar Bahasa Indonesia Pusat Bahasa Edisi

Keempat. Jakarta : Gramedia.

Anton, H. and Rorres, C. (2004). Aljabar Linear Elementer. Jakarta: Erlangga. Antonio, M.S. (2009). Bank Syariah Dari Teori Ke Praktik. Depok: Gema Insani Bank Indonesia. (2013). Kajian Ekonomi Regional Jawa Barat Triwulan I-2013.

[Online]. Tersedia: http://www.bi.go.id/NR/rdonlyres/DD708751-1397-

4C47-9E4D-85CD937B2FB9/29102/KERJabarProvinsiJawaBaratTriwulanI2013.pdf [15 Juli 2013]

Furqon. (2011). Statistika Terapan Untuk Penelitian. Bandung : Alfabeta

Johnson, R.A. and Wichern, D.W. (2007). Applied Multivariate Statistical

Analysis Sixth Edition. New Jersey: Prentice Hall.

Kamarani, N. (2012). Faktor-Faktor yang Mempengaruhi Minat Masyarakat

Dalam Berhubungan Dengan Bank Syariah di Kota Padang. Jurnal

Manajemen dan Kewirausahaan. 3. (1), 31 halaman. [Online]. Tersedia:

http://jurnal.unitas-pdg.ac.id/files/31/Jurnal%20Manajemen/Vol%203%20Jan%202012/2.%20 Faktor2%20yang%20mempengaruhi%20minat%20masyarakat%20dalam% 20berhubungan%20dengan%20bank%20syariah.pdf [11 Mei 2013]

Kartiko, S.H. (1988). Metode Statistika Multivariat. Jakarta : Karunika Universitas Terbuka

Kusumah, Y.S. (1998). Matematika Diskrit. Bandung : CV. Andira

Lim, T.S., Loh, W.Y. and Shih, Y.S. (2000). A Comparison of Prediction

Accuracy, Complexity, and Training Time of Thirty-three Old and New Classification Algorithms. Machine Learning. 40, (3), 203-228. [Online].

Tersedia: http://www.stat.wisc.edu/~loh/treeprogs/quest1.7/mach1317.pdf [31 Maret 2013]

Loh, W.Y. and Shih, Y.S. (1997). Split Selection Methods for Classification

Trees. Statistica Sinica. 7, 815-840. [Online]. Tersedia: http://www.math.ccu.edu.tw/~yshih/papers/sinica.pdf [31 Maret 2013]


(6)

78

Lewis, R.J. (2000). An Introduction to Classification and Regression Tree (CART)

Analysis. 2000 Annual Meeting of the Society for Academic Emergency

Medicine in Sn Fransisco. [Online]. Tersedia:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.95.4103&rep=rep 1&type=pdf [22 Februari 2013]

Malani, Y. (2011). Pembentukan Pohon Klasifikasi Biner dengan Algoritma

QUEST. Skripsi pada Jurusan Matematika FMIPA Universitas Andalas.

[Online].Tersedia:

http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&v ed=0CCkQFjAA&url=http%3A%2F%2Frepository.unand.ac.id%2F16794 %2F1%2FSkripsi_Yona_Malani.pdf&ei=la_SUaqnF8jwrQfnkYHIBg&usg =AFQjCNF1dyq8dXlRep2P_ReVs0A4v5Y8cw&sig2=Mqaauc59M3_Bimr 0xx4nTg&bvm=bv.48705608,d.bmk [24 Februari 2013]

Narimawati, U. (2008). Teknik-teknik Analisis Multivariat untuk Riset Ekonomi. Yogyakarta : Graha Ilmu.

Ratnawati, A. et al. (2000). Bank Syariah, Potensi, Preferensi, & Perilaku

Masyarakat di Wilayah Jawa Barat. Lembaga Penelitian IPB dengan BI.

[Online]. Tersedia: http://www.bi.go.id/NR/rdonlyres/BD5DD30E-41F1-4473-B6B5-D08D15DB7AD0/13437/BPSESJabarindonesia.pdf [20 Mei 2013]

Sartono, B. dan Syafitri, U.D. (2010). Metode Pohon Gabungan: Solusi Pilihan

Untuk Mengatasi Kelemahan Pohon Regresi dan Klasifikasi Tunggal.

Forum Statistika dan Komputasi. 15, (1), 1-7. [Online]. Tesedia: http://journal.ipb.ac.id/index.php/statistika/article/view/4895 [22 Februari 2013]

Sudjana. (2005). Metoda Statistika. Bandung : Tarsito

Sugiyono. (2012). Metode Penelitian Kuantitatif, Kualitatif Dan R&D. Bandung : Alfabeta

Susanti, I. (2007). Analisis Hubungan Jenis Kejahatan Dengan Karakteristik

Wajah dan Profil Sosial Ekonomi Seorang Narapidana Menggunakan Metode Analisis Diskriminan dan Pohon Klasifikasi. Skripsi pada FMIPA

Universitas Indonesia. [Online]. Tersedia: http:// lontar.ui.ac.id/file?file=digital/20180930-023-07-Analisis%20hubungan.pdf [31 Maret 2013]