Algoritma CART Tinjauan Pustaka

commit to user 11 Dengan mendefinisikan = � = t ∈ � . Jika dipunyai nilai | = 1 ≠ | = 0 untuk = maka diperoleh | | = | . Berdasarkan persamaan 2.3 maka diperoleh | | = 1 − | sehingga = min | | = min 1 − | . Nilai min 1 − | akan diperoleh apabila | maksimum, sehingga dapat dituliskan pula = 1 − max | , yang identik dengan definisi 2.4. Berdasarkan hasil di atas, definisi 2.5 adalah resubstitution estimate dalam sebuah node t apabila semua nilai | = 1 atau sama untuk semua ≠ .

2.1.4 Algoritma CART

Algoritma CART adalah sebuah metode statistik nonparametrik yang digunakan untuk melakukan analisis klasifikasi. Algoritma CART pertama kali diperkenalkan pada tahun 1993 oleh ilmuwan Amerika Serikat yaitu Breiman, et al. Algoritma CART terdiri dari dua analisis yaitu pohon klasifikasi dan pohon regresi. Jika variabel dependen yang dimiliki bertipe kategorik nominal atau ordinal, maka CART menghasilkan pohon klasifikasi sedangkan jika variabel dependen yang dimiliki bertipe kontinu atau numerik interval atau rasio maka CART akan menghasilkan pohon regresi. Pohon CART dikatakan binary decision tree karena merupakan algoritma pohon keputusan yang dibangun dengan memisahkan node ke commit to user 12 dalam dua child nodes secara berulang-ulang diawali dengan root node. Dalam skripsi ini pembahasan dikhususkan pada pohon klasifikasi. Menurut Lewis [3] beberapa keunggulan CART dibanding dengan metode statistik yang lain khususnya parametrik diantaranya adalah 1. variabel-variabel dalam CART baik variabel independen maupun dependen tidak mendasarkan atau mengasumsikan distribusi populasinya pada distribusi probabilitas tertentu. Sehingga CART termasuk dalam kelompok metode statistik nonparametrik. 2. variabel –variabel independen dalam CART bisa bertipe kategorik nominal atau ordinal tanpa diperlukannya pembuatan variabel dummy ataupun juga bisa bertipe kontinu. 3. CART mampu untuk mengatasi missing value. 4. CART tidak terpengaruh oleh adanya outlier, kolinearitas, dan heteroskedastisitas diantara variabel independennya. 5. dalam CART tidak berlaku adanya transformasi data. Data-data asli yang dirubah ke dalam bentuk apapun tidak akan mempengaruhi dalam pembentukan pohon klasifikasinya. 6. interpretasi dari pohon klasifikasi yang dihasilkan oleh CART sangat mudah dipahami oleh para pengguna.

2.1.5 Struktur atau Bentuk Pohon Klasifikasi CART