Cross Validation Akurasi dengan Matrixs Confusion

2.4 Cross Validation

Pada pendekatan cross validation, setiap data digunakan dalam jumlah yang sama untuk pelatihan dan tepat satu kali untuk pengujian. Bentuk umum pendekatan ini disebut dengan k-fold cross validation, yang memecah set data menjadi k bagian set data dengan ukuran yang sama. Setiap kali berjalan, satu pecahan berperan sebagai set data uji sedangkan pecahan lainnya menjadi set data latih. Prosedur tersebut dilakukan sebanyak k kali sehingga setiap data berkesempatan menjadi data uji tepat satu kali dan menjadi data latih sebanyak k-1 kali. Total error didapatkan dengan menjumlahkan semua error yang didapatkan dari k kali proses Prasetyo,2014.

2.5 Akurasi dengan Matrixs Confusion

Matrixs confusion merupakan tabel yang mencatat hasil kerja klasifikasi. Contoh matrixs confusion ditunjukkan pada tabel berikut : TABEL 2.1 TABEL MATRIXS CONFUSION f ij kelas hasil prediksi j kelas = 1 kelas = 0 kelas aslii kelas = 1 f 11 f 10 kelas = 0 f 01 f 00 Tabel 2.1 merupakan contoh matrixs confusion yang melakukan klasifikasi masalah biner dua kelas untuk dua kelas, misalnya kelas 0 dan 1. Setiap sel f ij dalam matrix menyatakan jumlah recorddata dari kelas i yang hasil prediksinya masuk ke kelas j. Misalnya sel f 11 adalah jumlah data dalam kelas 1 yang secara benar dipetakan ke kelas 1, dan f 10 adalah data dalam kelas 1 yang dipetakan secara salah ke kelas 0. Berdasarkan isi matrixs confusion, maka dapat diketahui jumlah data dari masing-masing kelas yang diprediksi secara benar yaitu f11 + f00 dan data yang diklasifikasi secara salah yaitu f10 + f01 . Kuantitas matrixs confusion dapat PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI diringkas menjadi dua nilai, yaitu akurasi dan laju error. Dengan mengetahui jumlah data yang diklasifikasikan secara benar, maka dapat diketahui akurasi hasil prediksi, dan dengan mengetahui jumlah data yang diklasifikasikan secara salah maka dapat diketahui laju error dari prediksi yang dilakukan. Dua kuantitas ini digunakan sebagai matrix kinerja klasifikasi. Untuk menghitung akurasi digunakan formula sebagai berikut : Prasetyo, 2014 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22 BAB III METODOLOGI PENELITIAN Pada bab ini akan dijelaskan analisa data dan analisa sistem yang akan dibuat untuk identifikasi penyakit tuberkulosis TB pada manusia menggunakan metode Naïve Bayesian.

3.1 Data