27
�� Hal ini berarti splitting pemecahan dilakukan untuk membuat dua buah
node baru yang keragamannya lebih kecil homogen apabila dibandingkan dengan node awalnya parent node. Misalkan sebuah
pohon klasifikasi telah terbentuk dan memiliki sekumpulan atau himpunan terminal nodes
�̃ , didefinisikan impurity node It, dengan
Didefinisikan pula tree impurity � , dengan
� ∑
̃
∑
̃
sehingga didapatkan hasil sebagai berikut
b. Pelabelan Kelas
Pelabelan kelas adalah proses pengidentifikasian tiap nodes pada suatu kelas tertentu. Pelabelan kelas tidak hanya diberlakukan untuk
terminal nodes saja, non-terminal nodes bahkan root node mengalami proses ini. Hal ini dikarenakan setiap non-terminal nodes memiliki
kesempatan untuk menjadi terminal nodes. Sehingga proses pelabelan kelas akan terus dilakukan selama proses splitting masih berlanjut
Breiman, et al., 1993. Misalkan sebuah pohon klasifikasi telah terbentuk dan memiliki
terminal nodes �̃. Class assignment rule mengidentifikasikan sebuah kelas
⋯ pada setiap terminal node �̃. Kelas yang diidentifikasikan pada node
�̃ dinotasikan dengan . Aturan
Universitas Sumatera Utara
28
pelabelan kelas sebagai berikut ; apabila ��
maka Breiman et al, 1993.
c. Proses Penghentian Pemecahan
Menurut Lewis 2000, proses splitting atau pembuatan pohon klasifikasi akan berhenti apabila sudah tidak dimungkinkan lagi dilakukan
proses pemecahan. Proses pemecahan akan berhenti apabila hanya tersisa satu objek saja yang ada dalam node terakhir atau semua objek yang
berada di dalam sebuah node merupakan anggota kelas yang sama homogen. Kemudian
bernilai 0 atau 1. � , dan resubstitution estimate
�� untuk nilai misclassification sama dengan 0. Node-node terakhir atau yang tidak mengalami pemecahan lagi sebagai
akibat dari kondisi di atas akan menjadi terminal nodes dan diidentifikasikan pada suatu kelas tertentu sesuai dengan class assignment
rule yang telah dijelaskan sebelum ini. Pohon klasifikasi yang terbentuk sebagai hasil dari proses ini dinamakan “maximal tree” �
��
.
d. Proses Pemangkasan Pohon
Resubstitution estimate � adalah probabilitas terjadinya
misclassification yang dialami beberapa objek-objek tersebut pada node t tertentu. Proses splitting pada node t menyatakan
� yang kecil pada kedua node baru yang terbentuk. Hal ini dibuktikan melalui proposisi
berikut Breiman, et al, 1993; untuk setiap pemecahan node t menjadi
�
dan
�
berlaku � �
� .
Universitas Sumatera Utara
29
Pohon klasifikasi yang terbentuk dapat berukuran besar dan kompleks dalam mengambarkan struktur data. Sehingga perlu dilakukan
suatu pemangkasan, yaitu suatu penilaian ukuran sebuah pohon tanpa mengorbankan kebaikan ketepatan melalui pengurangan simpul pohon
sehingga dicapai penghematan gambaran. Pemangkasan dilakukan dengan memangkas bagian pohon yang kurang penting sehingga didapat pohon
optimal Breiman, et al., 1993. Proses pemangkasan pohon klasifikasi dimulai dengan mengambil
�
yang merupakan right child node dan
�
yang merupakan left child node dari
�
��
yang dihasilkan dari parent node t. Jika diperoleh dua child node dan parent node yang memenuhi persamaan
� � �
maka hild node
�
dan
�
dipangkas. Dimana � dan
�� . Hasilnya adalah pohon �
1
yang memenuhi kriteria ��
1
= ��
��
. Proses tersebut diulang sampai tidak ada lagi pemangkasan yang mungkin terjadi.
2.8. Logika Fuzzy