commit to user 11
Dengan mendefinisikan =
� =
t ∈ �
. Jika dipunyai nilai
| = 1 ≠
| = 0 untuk = maka diperoleh
| | = | . Berdasarkan persamaan 2.3 maka diperoleh
| | = 1 − | sehingga
= min | | = min
1 − | . Nilai
min 1 − | akan diperoleh apabila | maksimum, sehingga dapat
dituliskan pula = 1 − max | , yang identik dengan definisi 2.4.
Berdasarkan hasil di atas, definisi 2.5 adalah resubstitution estimate dalam
sebuah node t apabila semua nilai | = 1 atau sama untuk semua ≠ .
2.1.4 Algoritma CART
Algoritma CART adalah sebuah metode statistik nonparametrik yang digunakan untuk melakukan analisis klasifikasi. Algoritma CART pertama kali
diperkenalkan pada tahun 1993 oleh ilmuwan Amerika Serikat yaitu Breiman, et al. Algoritma CART terdiri dari dua analisis yaitu pohon klasifikasi dan pohon regresi.
Jika variabel dependen yang dimiliki bertipe kategorik nominal atau ordinal, maka CART menghasilkan pohon klasifikasi sedangkan jika variabel dependen yang
dimiliki bertipe kontinu atau numerik interval atau rasio maka CART akan menghasilkan pohon regresi. Pohon CART dikatakan binary decision tree karena
merupakan algoritma pohon keputusan yang dibangun dengan memisahkan node ke
commit to user 12
dalam dua child nodes secara berulang-ulang diawali dengan root node. Dalam skripsi ini pembahasan dikhususkan pada pohon klasifikasi.
Menurut Lewis [3] beberapa keunggulan CART dibanding dengan metode statistik yang lain khususnya parametrik diantaranya adalah
1. variabel-variabel dalam CART baik variabel independen maupun dependen tidak mendasarkan atau mengasumsikan distribusi populasinya pada distribusi
probabilitas tertentu. Sehingga CART termasuk dalam kelompok metode statistik nonparametrik.
2. variabel –variabel independen dalam CART bisa bertipe kategorik nominal atau
ordinal tanpa diperlukannya pembuatan variabel dummy ataupun juga bisa bertipe kontinu.
3. CART mampu untuk mengatasi missing value. 4. CART tidak terpengaruh oleh adanya outlier, kolinearitas, dan heteroskedastisitas
diantara variabel independennya. 5. dalam CART tidak berlaku adanya transformasi data. Data-data asli yang dirubah
ke dalam bentuk apapun tidak akan mempengaruhi dalam pembentukan pohon klasifikasinya.
6. interpretasi dari pohon klasifikasi yang dihasilkan oleh CART sangat mudah dipahami oleh para pengguna.
2.1.5 Struktur atau Bentuk Pohon Klasifikasi CART