Pengukuran akurasi classifiers Pengukuran Error dan Akurasi Model Pre diktif

5. Untuk memprediksi label kelas X maka P dievaluasi untuk setiap kelas . Classifier memprediksi label kelas dari record X adalah kelas jika dan hanya jika PX P PX P untuk 1 j m, j i Dengan kata lain, nilai prediksi kelas untuk record X adalah kelas dimana PX P adalah maksimum.Han dan Kamber, 2006, pp310-313

2.1.15 Pengukuran Error dan Akurasi Model Pre diktif

2.1.15.1 Pengukuran akurasi classifiers

Akurasi dari dari sebuah classifier, model prediktif yang memprediksi nilai categorical, untuk sebuah kumpulan data tes adalah persentase dari record data tes yang dengan benar diklasifikasikan oleh classifier. Dalam literatur pattern recognition, ini disebut juga sebagai overall recognition rate dari classifier, yang mana merefleksikan seberapa baik classifier mengenali record dari kelas-kelas yang berbeda. Error rate atau misclassification rate untuk classifier, M , didefinisikan sebagai 1 - AccM , dimana AccM merupakan akurasi dari M . Jika kita hendak menggunakan training set untuk mengestimasi error rate dari model, nilai ini dikenal dengan resubstituion error. Perhitungan error ini optimistis pada true error rate karena model tidak di tes pada data sampel yang belum pernah dilihat sebelumnya. Confusion matrix merupakan alat pengukuran yang dapat digunakan untuk menganalisa seberapa baik classifier dapat mengenali record dari kelas- kelas yang berbeda. Jika diberikan m kelas, confusion matrix adalah sebuah tabel yang minimal berukuran m kali m. Sebuah nilai, , di baris pertama m dan kolom m mengindikasikan jumlah record pada class I yang diberi label oleh classifier sebagai class j. Jika classifier memiliki akurasi yang baik, idealnya semua record akan direpresentasikan sepanjang garis diagonal confusion matrix, dari , sampai , dimana nilai pada kolom lainnya bernilai nol. Confusion matrix dapat memiliki baris atau kolom tambahan untuk menyedikiakan informasi nilai total atau recognition rate untuk setiap class. Gambar 2.15 menunjukkan struktur confusion matrix untuk 2 nilai class positive dan negatif. Gambar 2.16 Struktur Confusion Matrix untuk 2 nilai class Jika classifier memprediksi 2 nilai class, yaitu positive dan negatif. M aka true positive menunjukkan jumlah record positive yang dengan benar diberi label oleh classifier, sedangkan true negative adalah record negative yang dengan benar diberi label oleh classifier. False positive adalah record dimana label kelas diprediksi diprediksi positive dimana sebenarnya negative. False negative adalah record dimana label kelas diprediksi diprediksi negative dimana sebenarnya positive. Contoh confusion matrix untuk 2 nilai kelas ditunjukkan seperti pada tabel 2.1. Han dan Kamber,2006,pp360-362; Witten dan Frank, 2005, p162 Tabel 2.1 Contoh Confusion M atrix Classes buys=yes buys=no total Recognition Buys=yes Buys=no 6,954 412 46 2,588 7,000 3,000 99.34 86.27 Total 7,366 2,634 10,000 95.52

2.1.15.2 Pengukuran Error Predictor