17
2.1.5.2 Algoritma CBA-CBClassifier Builder
CBA-CB adalah sebuah classifier builder menggunakan CARs atau prCARs. Untuk memproduksi classifier yang paling baik dari set rules akan mengevaluasi
semua possible subset di data training dan memilih subset dengan rule sequence yang tepat yaitu yang mempunyai error paling sedikit. Rizky Kartika Putri,2013.
Tahapan Algoritma CBA-CB Classification Based on Association-Classifier Builder :
Definisi: Mengingat dua rules, r
i
dan r
j
, r
i
precedence r
j
juga disebut r
i
mendahului r
j
atau r
i
memiliki prioritas lebih tinggi daripada r
j
jika 1
confidence r
i
adalah lebih besar dari r
j
, atau 2
confidence mereka adalah sama, tetapi support dari r
i
adalah lebih besar dari r
j
, atau
3 baik confidence dan support dari r
i
dan r
j
adalah sama, tetapi r
i
dihasilkan lebih awal dari r
j
; Biarkan R menjadi seperangkat rules yang dihasilkan yaitu, CAR atau CAR,
dan D data pelatihan. Ide dasar dari algoritma ini adalah untuk memilih satu set rules didahulukan tinggi di R untuk menutupi D. classifier kami adalah dari format
berikut: r
1
, r
2
, ...,
rn,
kelas default, di mana r
i
R, r
a
precedence r
b
, jika b a. kelas default adalah kelas default. Dalam mengklasifikasikan kasus yang tak terlihat, rules pertama yang memenuhi kasus ini
akan mengklasifikasikan. Jika tidak ada rules yang berlaku untuk kasus ini, dibutuhkan pada kelas standar seperti di C4.5.
Tahap membangun classifier builder seperti berikut ini Liu,Bing, 1998:
18
Langkah 1 : Urutkan seperangkat rules “r” yang dihasilkan menurut hubungan
precedence. Hal ini untuk memastikan bahwa kita akan memilih rules hak tertinggi untuk classifier kami.
Langkah 2 : Pilih rules untuk classifier dari R mengikuti urutan yang telah diurutkan. Untuk setiap rules r, kita melalui D untuk mencari kasus-
kasus yang dicakup oleh r mereka memenuhi kondisi r. Kami menandai r jika benar mengklasifikasikan kasus d. d.id adalah nomor
identifikasi unik d. Jika r benar dapat mengklasifikasikan setidaknya satu kasus yaitu, jika r ditandai, itu akan menjadi rules potensial dalam
classifier kami. Kasus-kasus itu mencakup kemudian dikeluarkan dari D. Sebuah kelas default juga dipilih kelas mayoritas dalam data yang
tersisa, yang berarti bahwa jika kita berhenti memilih rules untuk classifier C kelas ini akan menjadi kelas default C. Kami kemudian
menghitung dan mencatat jumlah kesalahan yang dibuat oleh C saat ini dan kelas default. Ini adalah jumlah jumlah kesalahan yang telah dibuat
oleh semua rules yang dipilih di C dan jumlah kesalahan yang dibuat oleh kelas default dalam data pelatihan. Ketika tidak ada rules atau tidak
ada kasus pelatihan kiri, proses seleksi rules selesai.
2.1.8 Metode Pengembangan Perangkat Lunak Waterfall