23
2.7.1. Partisi Berulang Biner Binary Recursive Partitioning
Teknik atau proses kerja dari CART dalam membuat sebuah pohon klasifikasi dikenal dengan istilah Binary Recursive Partitioning. Proses disebut
binary karena setiap parent node akan selalu mengalami pemecahan ke dalam tepat dua child node. Sedangkan recursive berarti bahwa proses pemecahan
tersebut akan diulang kembali pada setiap child nodes hasil pemecahan terdahulu, sehingga child nodes tersebut sekarang menjadi parent nodes. Proses pemecahan
ini akan terus dilakukan sampai tidak ada kesempatan lagi untuk melakukan pemecahan berikutnya. Dan istilah partitioning mengartikan bahwa learning
sample yang dimiliki dipecah ke dalam bagian-bagian atau partisi-partisi yang lebih kecil Damayanti, 2011.
Kriteria pemecahan didasarkan pada nilai-nilai dari variabel independen yang dimiliki. Misalkan dimiliki variabel dependen yang bertipe kategorik dan
variabel-variabel independen
1
,
2
, ⋯ ,
�
. Proses binary recursive partitioning bisa diilustrasikan sebagai proses pembagian dari ruang berdimensi
� dari variabel-variabel independen ke dalam partisi-partisi yang berbentuk persegi
panjang dan tidak saling bertumpang tindih. Idenya adalah membagi ruang berdimensi
� dari variabel-variabel independen tadi ke dalam beberapa partisi yang mana masing-masing partisi berisi objek-objek yang homogen atau seragam.
Homogen di sini maksudnya adalah objek-objek tersebut merupakan anggota satu kelas yang sama. Walaupun pada kenyataannya keadaan seperti ini tidaklah
mutlak diperoleh. Proses splitting akan berlanjut sampai didapatkan pohon
Universitas Sumatera Utara
24
klasifikasi yang paling besar atau maksimal proses splitting tidak bisa dilakukan lagi Damayanti, 2011.
2.7.2. Langkah Kerja CART
Menurut Lewis 2000 pada dasarnya dalam membuat sebuah pohon klasifikasi, CART bekerja dalam empat langkah utama. Langkah pertama adalah
tree building process yaitu proses pembentukan dan pembuatan pohon klasifikasi. Terdiri dari proses splitting nodes yaitu proses pemecahan parent nodes menjadi
dua buah child node melalui aturan pemecahan tertentu dan dilakukan secara berulang-ulang serta proses pelabelan kelas yaitu proses mengidentifikasi node-
node yang terbentuk pada suatu kelas tertentu melalui aturan pengidentifikasian. Langkah kedua adalah proses penghentian pembuatan atau pembentukan pohon
klasifikasi stopping the trees building process. Pada tahap ini pohon terakhir atau maximal tree
�
��
telah terbentuk. Langkah ketiga adalah pruning yaitu proses pemangkasan atau pemotongan
�
��
menjadi pohon yang lebih kecil T. Sehingga proses tersebut menghasilkan optimal tree atau pohon klasifikasi yang
optimal.
a. Proses Pemecahan Node