Studi Algoritma CART dengan Induksi Fuzzy dalam Mengklasifikasikan Data

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA

SKRIPSI

OKTAVIYANI DASWATI
1308230003

PROGRAM STUDI S-1 EKSTENSI MATEMATIKA
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2016

Universitas Sumatera Utara

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA

SKRIPSI


Diajukan kepada tim penguji skripsi Departemen Matematika sebagai salah satu
persyaratan guna memperoleh gelar Sarjana Sains

OKTAVIYANI DASWATI
1308230003

PROGRAM STUDI S-1 EKSTENSI MATEMATIKA
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2016

Universitas Sumatera Utara

PERSETUJUAN
Judul

: Studi Algoritma CART dengan Induksi Fuzzy

dalam Mengklasifikasikan Data

Kategori

: Skripsi

Nama

: Oktaviyani Daswati

Nomor Induk Mahasiswa

: 130823003

Program Studi

: Sarjana (S1) Matematika

Departemen


: Matematika

Fakultas

: Matematika

dan

Ilmu

Pengetahuan

Alam

(FMIPA) Universitas Sumatera Utara

Disetujui di
Medan,

Agustus 2016


Komisi Pembimbing :
Pembimbing 2

Pembimbing 1

Drs. Pangarapen Bangun, M.Si
NIP. 19530303 198303 1 002

Drs. Partano Siagian, M.Si
NIP.19511227 198003 1 001

Diketahui / Disetujui oleh
Departemen Matematika FMIPA USU
Ketua

Prof. Dr. Tulus, M.Si
NIP.19620901 198803 1 002
ii


Universitas Sumatera Utara

PERNYATAAN

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan, data dan ringkasan yang masing-masing disebut sumbernya.

Medan,

Agustus 2016

Oktaviyani Daswati
130823003

iii


Universitas Sumatera Utara

PENGHARGAAN

Puji dan syukur ke hadirat Allah SWT yang senantiasa memberikan
rahmat dan karunia-Nya, sehingga akhirnya penulis dapat menyelesaikan
penulisan skripsi yang berjudul “Studi Algoritma CART dengan induksi Fuzzy
dalam Mengklasifikasikan Data” ini. Salawat dan salam selalu terarah kepada
junjungan kita Nabi besar Muhammad SAW.
Dengan rasa hormat, penulis mengucapkan terima kasih kepada Bapak
Partano Siagian , M.Sc dan Bapak Pangarapen Bangun , M.Si, selaku pembimbing
yang telah meluangkan waktu dan menyumbangkan pikiran, saran, nasehat, serta
arahan sehingga penulis dapat menyelesaikan skripsi ini. Terimakasih juga
kepada Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si selaku Ketua
Departemen Matematika dan Sekretaris Departemen Matematika FMIPA USU,
Dekan dan Pembantu Dekan FMIPA USU, seluruh dosen dan civitas akademika
Matematika FMIPA USU.
Terima kasih kepada kedua orangtua yang sangat luar biasa, terima kasih
buat segala dukungan doa, motivasi, harapan serta kesabarannya. Terima kasih

juga buat dukungan kakak satu-satunya, yang tak lupa mengingatkan agar tetap
semangat dan tak pernah menyerah. Tak lupa pula untuk sahabat yang bukan
kerabat, Rahmyuti, terima kasih untuk dukungannya selalu.
Selanjutnya terima kasih untuk teman seperjuangan di Ekstensi Matematika
2013 dan 2014, terima kasih untuk semua waktu dan dukungannya. Akhir kata,
atas perhatian pembaca yang budiman penulis ucapkan terima kasih.

Penulis

Oktaviyani Daswati
iv

Universitas Sumatera Utara

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA
ABSTRAK

Metode pohon keputusan digunakan untuk mengekstraksi informasi tentang
himpunan data dalam masalah klasifikasi, meskipun tidak dapat menangani

ketidakpastian yang tertanam dalam data terkait dengan pemikiran dan persepsi
manusia. Makalah ini menjelaskan pengembangan algoritma induksi pohon yang
meningkatkan akurasi klasifikasi induksi pohon keputusan. Penelitian ini
dirancang dengan mengintegrasikan prinsip Algoritma CART (Classification and
Regressin Tree) dan konsep himpunan Fuzzy, memungkinkan model untuk
menangani data yang tidak pasti dan tidak tepat, serta untuk melunakkan batas
keputusan tajam yang melekat dalam algoritma pohon keputusan tegas. CART
adalah algoritma pohon keputusan dengan fitur utama pengujian Indeks Gini
(indeks keragaman) pada setiap tingkat, yang mengarah ke pembentukan pohon
dengan proses pemangkasan untuk menemukan pohon yang optimal. Penerapan
logika fuzzy untuk pohon keputusan CART dapat memperlihatkan pengetahuan
klasifikasi yang lebih alami dan sejalan dengan pemikiran manusia, serta lebih
kuat ketika menangani informasi yang tidak tepat. Hasil penerapan logika fuzzy
untuk pohon keputusan CART disajikan dalam makalah ini. Hasil penelitian ini
diperoleh dari database nyata, dan menunjukkan bahwa algoritma inferensi fuzzy
baru meningkatkan akurasi lebih dari pohon CART tegas.

Kata kunci : Pohon Keputusan, Klasifikasi, CART, Fuzzy

v


Universitas Sumatera Utara

STUDY OF CART ALGORITHM WITH FUZZY INDUCTION
IN CLASSIFYING DATA
ABSTRACT

Decision tree methods used for extracting information about dataset in
classification problems, although unable to deal with uncertainties embedded
within the data associated with human thinking and perception. This paper
describes the development of a tree induction algorithm which improves the
classification accuracy of decision tree induction. The research is designed by
integrating the principles of CART (Classification and Regression Tree) algorithm
and the fuzzy set-theoretic concepts, enabling the model to handle uncertain and
imprecise data, and in order to soften the sharp decision boundaries which are
inherent in crisp decision tree algorithms. CART is a decision tree algorithm with
the main feature of Gini Index testing (homogenity index) at each level, leading to
the production of trees with pruning process to find the optimal tree. The
application of fuzzy logic to CART decision trees can represent classification
knowledge more naturally and inline with human thinking, and are more robust

when it comes to handling imprecise information. The results of applying fuzzy
logic to CART decision trees are presented in this paper. These have been
obtained from sets of real data, and show that the new fuzzy inference algorithm
improves the accuracy over crisp CART trees.

Keywords : Decision Tree, Classification, CART, Fuzzy

vi

Universitas Sumatera Utara

DAFTAR ISI
Halaman
PERSETUJUAN ............................................................................................... ii
PERNYATAAN ................................................................................................ iii
PENGHARGAAN ............................................................................................ iv
ABSTRAK ......................................................................................................... v
ABSTRACT ...................................................................................................... vi
DAFTAR ISI .................................................................................................... vii
DAFTAR TABEL .............................................................................................. x

DAFTAR GAMBAR ........................................................................................ xi
DAFTAR LAMPIRAN .................................................................................... xii
BAB I PENDAHULUAN
1.1 Latar Belakang ................................................................................ 1
1.2 Rumusan Masalah ........................................................................... 4
1.3 Batasan Masalah.............................................................................. 4
1.4 Tujuan Penelitian............................................................................. 4
1.5 Kontribusi Penelitian ....................................................................... 4
1.6 Tinjauan Pustaka ............................................................................. 5
1.7 Metodologi Penelitian ..................................................................... 7
1.7.1 Jenis dan Data Penelitian ....................................................... 7
1.7.2 Teknik Penelitian ................................................................... 7
BAB II LANDASAN TEORI
2.1 Data ................................................................................................. 9
vii

Universitas Sumatera Utara

2.2 Data Mining................................................................................... 13
2.3 Klasifikasi Data ............................................................................. 14
2.4 Teori Graf ...................................................................................... 15
2.5 Struktur Pohon............................................................................... 16
2.5.1 Pohon Berakar...................................................................... 17
2.5.2 Terminologi Pohon Berakar................................................. 18
2.5.3 Pohon Keputusan (Decision Tree) ....................................... 20
2.6 Probabilitas .................................................................................... 21
2.7 Algoritma CART ........................................................................... 22
2.7.1 Partisi Berulang Biner (Binary Recursive Partitioning) ...... 23
2.7.2 Langkah Kerja CART .......................................................... 24
2.8 Logika Fuzzy ................................................................................. 29
2.8.1 Fungsi Keanggotaan ............................................................ 31
2.8.2 Operator Dasar Fuzzy .......................................................... 34
2.8.3 Fungsi Implikasi .................................................................. 35
2.9 Fuzzy Inference System ................................................................. 36
2.9.1 Komposisi Aturan ................................................................ 37
2.9.2 Metode Mamdani ................................................................. 38
2.9.3 Defuzzifikasi ........................................................................ 38
2.10 Akurasi Klasifikasi ....................................................................... 39
BAB III HASIL DAN PEMBAHASAN
3.1 Fuzzy CART ................................................................................. 41
3.2 Uji coba pada Database ................................................................. 43
viii

Universitas Sumatera Utara

3.3 Pembahasan ................................................................................... 62
BAB IV PENUTUP
4.1 Kesimpulan.................................................................................... 65
4.2 Saran .............................................................................................. 65
DAFTAR PUSTAKA
LAMPIRAN

ix

Universitas Sumatera Utara

DAFTAR TABEL

Tabel

Halaman
1.

Confusion Matrix ............................................................................. 40

2.

Variabel Kategorik Pasien Kanker .................................................. 44

3.

Kombinasi Kategori Usia Pertama .................................................. 46

4.

Kombinasi Kategori Usia Kedua ..................................................... 46

5.

Kombinasi Kategori Tsize Pertama ................................................. 47

6.

Decrease Impurity Variabel Data Pasien Kanker ............................ 47

7.

Proses Penghentian Pemecahan Node ............................................. 50

8.

Variabel dalam Induksi Fuzzy Pasien Kanker ................................. 55

9.

Prediksi Indikator Sensor berdasarkan FCART .............................. 62

10. Akurasi Klasifikasi FCART ............................................................ 62

x

Universitas Sumatera Utara

DAFTAR GAMBAR

Gambar

Halaman

1.

Pohon Berakar ................................................................................. 19

2.

Terminologi Pohon Berakar ............................................................ 20

3.

Subtree Pohon Berakar .................................................................... 20

4.

Level dalam Pohon Berakar ............................................................ 21

5.

Struktur Decision Tree..................................................................... 23

6.

Representasi Kurva Naik ................................................................. 31

7.

Representasi Kurva Turun ............................................................... 32

8.

Representasi Kurva Segitiga ............................................................ 32

9.

Representasi Kurva Trapesium ........................................................ 33

10. Representasi Kurva Bahu ................................................................ 34
11. Pemecahan Root Node ..................................................................... 49
12. Proses Pelabelan Node ..................................................................... 50
13. Node 13 dan Kedua Child Node ...................................................... 51
14. Pohon Klasifikasi CART ................................................................. 52
15. Fungsi Keanggotaan Variabel Usia Pasien ...................................... 55
16. Fungsi Keanggotaan Variabel Progesteron ..................................... 56
17. Fungsi Keanggotaan Variabel Sensor.............................................. 57
18. Fungsi Keanggotaan Data Testing .................................................... 57
19. Aplikasi Fungsi Implikasi ................................................................. 59
20. Daerah Solusi Fuzzy ......................................................................... 60
xi

Universitas Sumatera Utara

DAFTAR LAMPIRAN

Lampiran
1. Tabulasi Silang Variabel Independen dan Dependen
2.

Pohon Klasifikasi Maksimal Pasien Kanker

3.

Pohon Klasifikasi Maksimal dengan Label

4.

Output CART dari SPSS Data Pasien Kanker

5.

Output MATLAB Fungsi Keanggotaan

6.

Contoh Output MATLAB Data Testing

xii

Universitas Sumatera Utara