5. Untuk memprediksi label kelas X maka P dievaluasi untuk setiap
kelas . Classifier memprediksi label kelas dari record X adalah kelas
jika dan hanya jika
PX P
PX P
untuk 1 j m, j i
Dengan kata lain, nilai prediksi kelas untuk record X adalah kelas dimana PX
P adalah maksimum.Han dan Kamber, 2006, pp310-313
2.1.15 Pengukuran Error dan Akurasi Model Pre diktif
2.1.15.1 Pengukuran akurasi classifiers
Akurasi dari dari sebuah classifier, model prediktif yang memprediksi nilai categorical, untuk sebuah kumpulan data tes adalah persentase dari
record data tes yang dengan benar diklasifikasikan oleh classifier. Dalam literatur pattern recognition, ini disebut juga sebagai overall recognition rate
dari classifier, yang mana merefleksikan seberapa baik classifier mengenali record dari kelas-kelas yang berbeda.
Error rate atau misclassification rate untuk classifier, M , didefinisikan
sebagai 1 - AccM , dimana AccM merupakan akurasi dari M . Jika kita hendak menggunakan training set untuk mengestimasi error rate dari model,
nilai ini dikenal dengan resubstituion error. Perhitungan error ini optimistis pada true error rate karena model tidak di tes pada data sampel yang belum
pernah dilihat sebelumnya. Confusion matrix
merupakan alat pengukuran yang dapat digunakan untuk menganalisa seberapa baik classifier dapat mengenali record dari kelas-
kelas yang berbeda. Jika diberikan m kelas, confusion matrix adalah sebuah tabel yang minimal berukuran m kali m. Sebuah nilai,
, di baris pertama m
dan kolom m mengindikasikan jumlah record pada class I yang diberi label oleh classifier sebagai class j. Jika classifier memiliki akurasi yang baik,
idealnya semua record akan direpresentasikan sepanjang garis diagonal confusion matrix, dari
, sampai , dimana nilai pada kolom lainnya
bernilai nol. Confusion matrix dapat memiliki baris atau kolom tambahan untuk menyedikiakan informasi nilai total atau recognition rate untuk setiap
class. Gambar 2.15 menunjukkan struktur confusion matrix untuk 2 nilai class positive
dan negatif.
Gambar 2.16
Struktur Confusion Matrix untuk 2 nilai class Jika classifier memprediksi 2 nilai class, yaitu positive dan negatif. M aka
true positive menunjukkan jumlah record positive yang dengan benar diberi
label oleh classifier, sedangkan true negative adalah record negative yang dengan benar diberi label oleh classifier. False positive adalah record dimana
label kelas diprediksi diprediksi positive dimana sebenarnya negative. False negative
adalah record dimana label kelas diprediksi diprediksi negative dimana sebenarnya positive. Contoh confusion matrix untuk 2 nilai kelas
ditunjukkan seperti pada tabel 2.1. Han dan Kamber,2006,pp360-362; Witten dan Frank, 2005, p162
Tabel 2.1
Contoh Confusion M atrix Classes buys=yes
buys=no total
Recognition Buys=yes
Buys=no 6,954
412 46
2,588 7,000
3,000 99.34
86.27 Total 7,366
2,634 10,000
95.52
2.1.15.2 Pengukuran Error Predictor