Partisi Berulang Biner Binary Recursive Partitioning Langkah Kerja CART

23

2.7.1. Partisi Berulang Biner Binary Recursive Partitioning

Teknik atau proses kerja dari CART dalam membuat sebuah pohon klasifikasi dikenal dengan istilah Binary Recursive Partitioning. Proses disebut binary karena setiap parent node akan selalu mengalami pemecahan ke dalam tepat dua child node. Sedangkan recursive berarti bahwa proses pemecahan tersebut akan diulang kembali pada setiap child nodes hasil pemecahan terdahulu, sehingga child nodes tersebut sekarang menjadi parent nodes. Proses pemecahan ini akan terus dilakukan sampai tidak ada kesempatan lagi untuk melakukan pemecahan berikutnya. Dan istilah partitioning mengartikan bahwa learning sample yang dimiliki dipecah ke dalam bagian-bagian atau partisi-partisi yang lebih kecil Damayanti, 2011. Kriteria pemecahan didasarkan pada nilai-nilai dari variabel independen yang dimiliki. Misalkan dimiliki variabel dependen yang bertipe kategorik dan variabel-variabel independen 1 , 2 , ⋯ , � . Proses binary recursive partitioning bisa diilustrasikan sebagai proses pembagian dari ruang berdimensi � dari variabel-variabel independen ke dalam partisi-partisi yang berbentuk persegi panjang dan tidak saling bertumpang tindih. Idenya adalah membagi ruang berdimensi � dari variabel-variabel independen tadi ke dalam beberapa partisi yang mana masing-masing partisi berisi objek-objek yang homogen atau seragam. Homogen di sini maksudnya adalah objek-objek tersebut merupakan anggota satu kelas yang sama. Walaupun pada kenyataannya keadaan seperti ini tidaklah mutlak diperoleh. Proses splitting akan berlanjut sampai didapatkan pohon Universitas Sumatera Utara 24 klasifikasi yang paling besar atau maksimal proses splitting tidak bisa dilakukan lagi Damayanti, 2011.

2.7.2. Langkah Kerja CART

Menurut Lewis 2000 pada dasarnya dalam membuat sebuah pohon klasifikasi, CART bekerja dalam empat langkah utama. Langkah pertama adalah tree building process yaitu proses pembentukan dan pembuatan pohon klasifikasi. Terdiri dari proses splitting nodes yaitu proses pemecahan parent nodes menjadi dua buah child node melalui aturan pemecahan tertentu dan dilakukan secara berulang-ulang serta proses pelabelan kelas yaitu proses mengidentifikasi node- node yang terbentuk pada suatu kelas tertentu melalui aturan pengidentifikasian. Langkah kedua adalah proses penghentian pembuatan atau pembentukan pohon klasifikasi stopping the trees building process. Pada tahap ini pohon terakhir atau maximal tree � �� telah terbentuk. Langkah ketiga adalah pruning yaitu proses pemangkasan atau pemotongan � �� menjadi pohon yang lebih kecil T. Sehingga proses tersebut menghasilkan optimal tree atau pohon klasifikasi yang optimal.

a. Proses Pemecahan Node