Pelabelan Kelas Proses Penghentian Pemecahan Proses Pemangkasan Pohon

27 �� Hal ini berarti splitting pemecahan dilakukan untuk membuat dua buah node baru yang keragamannya lebih kecil homogen apabila dibandingkan dengan node awalnya parent node. Misalkan sebuah pohon klasifikasi telah terbentuk dan memiliki sekumpulan atau himpunan terminal nodes �̃ , didefinisikan impurity node It, dengan Didefinisikan pula tree impurity � , dengan � ∑ ̃ ∑ ̃ sehingga didapatkan hasil sebagai berikut

b. Pelabelan Kelas

Pelabelan kelas adalah proses pengidentifikasian tiap nodes pada suatu kelas tertentu. Pelabelan kelas tidak hanya diberlakukan untuk terminal nodes saja, non-terminal nodes bahkan root node mengalami proses ini. Hal ini dikarenakan setiap non-terminal nodes memiliki kesempatan untuk menjadi terminal nodes. Sehingga proses pelabelan kelas akan terus dilakukan selama proses splitting masih berlanjut Breiman, et al., 1993. Misalkan sebuah pohon klasifikasi telah terbentuk dan memiliki terminal nodes �̃. Class assignment rule mengidentifikasikan sebuah kelas ⋯ pada setiap terminal node �̃. Kelas yang diidentifikasikan pada node �̃ dinotasikan dengan . Aturan Universitas Sumatera Utara 28 pelabelan kelas sebagai berikut ; apabila �� maka Breiman et al, 1993.

c. Proses Penghentian Pemecahan

Menurut Lewis 2000, proses splitting atau pembuatan pohon klasifikasi akan berhenti apabila sudah tidak dimungkinkan lagi dilakukan proses pemecahan. Proses pemecahan akan berhenti apabila hanya tersisa satu objek saja yang ada dalam node terakhir atau semua objek yang berada di dalam sebuah node merupakan anggota kelas yang sama homogen. Kemudian bernilai 0 atau 1. � , dan resubstitution estimate �� untuk nilai misclassification sama dengan 0. Node-node terakhir atau yang tidak mengalami pemecahan lagi sebagai akibat dari kondisi di atas akan menjadi terminal nodes dan diidentifikasikan pada suatu kelas tertentu sesuai dengan class assignment rule yang telah dijelaskan sebelum ini. Pohon klasifikasi yang terbentuk sebagai hasil dari proses ini dinamakan “maximal tree” � �� .

d. Proses Pemangkasan Pohon

Resubstitution estimate � adalah probabilitas terjadinya misclassification yang dialami beberapa objek-objek tersebut pada node t tertentu. Proses splitting pada node t menyatakan � yang kecil pada kedua node baru yang terbentuk. Hal ini dibuktikan melalui proposisi berikut Breiman, et al, 1993; untuk setiap pemecahan node t menjadi � dan � berlaku � � � . Universitas Sumatera Utara 29 Pohon klasifikasi yang terbentuk dapat berukuran besar dan kompleks dalam mengambarkan struktur data. Sehingga perlu dilakukan suatu pemangkasan, yaitu suatu penilaian ukuran sebuah pohon tanpa mengorbankan kebaikan ketepatan melalui pengurangan simpul pohon sehingga dicapai penghematan gambaran. Pemangkasan dilakukan dengan memangkas bagian pohon yang kurang penting sehingga didapat pohon optimal Breiman, et al., 1993. Proses pemangkasan pohon klasifikasi dimulai dengan mengambil � yang merupakan right child node dan � yang merupakan left child node dari � �� yang dihasilkan dari parent node t. Jika diperoleh dua child node dan parent node yang memenuhi persamaan � � � maka hild node � dan � dipangkas. Dimana � dan �� . Hasilnya adalah pohon � 1 yang memenuhi kriteria �� 1 = �� �� . Proses tersebut diulang sampai tidak ada lagi pemangkasan yang mungkin terjadi.

2.8. Logika Fuzzy