Maksimum Tree Classification and Regression Tree CART
20
Pada proses klasifikasi dengan tahapan proses pembentukan model pada CART diperlukan learning sample data percobaan yang merupakan
sekumpulan data yang digunakan untuk membentuk sebuah model tree dan biasanya learning sample berukuran besar agar dapat membentuk
pengklasifikasian yang baik. Ketika model tree sudah terbentuk maka model itu dapat digunakan untuk mengklasifikasian data yang belum diketahui.
Tujuan klasifikasi ini adalah menentukan aturan pada variabel yang lain yang memprediksi variabel kelas. Untuk menguji keakuratan model yang dibuat
dapat digunakan test sample data uji di mana test sample tersebut biasanya berukuran lebih kecil dibandingkan dengan data percobaan yang sebenarnya.
Pada pembentukan model, data percobaan yang digunakan akan dipisah menjadi dua buah node secara rekursif atau bertingkat hingga mencapai
terminal node dengan menggunakan algoritma tertentu. Seperti yang telah dibahas dalam subbab sebelumnya, ada beberapa jenis algoritma yang dapat
digunakan sebagai alat pemisah dalam pembentukan model. Seperti yang sudah dijelaskan sebelumnya, pada penelitian kali ini, akan digunakan algoritma
pemisah yaitu Twoing Splitting Rule. Pertumbuhan tree dari data percobaan akan menghasilkan level dari suatu
node yang paling besar dibandingkan dengan model tree lainnya, serta memiliki jumlah terminal node simpul akhir yang paling banyak. Tree yang
paling besar seperti ini disebut dengan maksimum tree.
21