2.4 Cross Validation
Pada pendekatan cross validation, setiap data digunakan dalam jumlah yang sama untuk pelatihan dan tepat satu kali untuk pengujian.
Bentuk umum pendekatan ini disebut dengan k-fold cross validation, yang memecah set data menjadi k bagian set data dengan ukuran yang sama.
Setiap kali berjalan, satu pecahan berperan sebagai set data uji sedangkan pecahan lainnya menjadi set data latih. Prosedur tersebut dilakukan
sebanyak k kali sehingga setiap data berkesempatan menjadi data uji tepat satu kali dan menjadi data latih sebanyak k-1 kali. Total error didapatkan
dengan menjumlahkan semua error yang didapatkan dari k kali proses Prasetyo,2014.
2.5 Akurasi dengan Matrixs Confusion
Matrixs confusion merupakan tabel yang mencatat hasil kerja klasifikasi. Contoh matrixs confusion ditunjukkan pada tabel berikut :
TABEL 2.1 TABEL MATRIXS CONFUSION
f
ij
kelas hasil prediksi j kelas = 1
kelas = 0 kelas aslii
kelas = 1 f
11
f
10
kelas = 0 f
01
f
00
Tabel 2.1 merupakan contoh matrixs confusion yang melakukan klasifikasi masalah biner dua kelas untuk dua kelas, misalnya kelas 0 dan 1. Setiap
sel f
ij
dalam matrix menyatakan jumlah recorddata dari kelas i yang hasil prediksinya masuk ke kelas j. Misalnya sel f
11
adalah jumlah data dalam kelas 1 yang secara benar dipetakan ke kelas 1, dan f
10
adalah data dalam kelas 1 yang dipetakan secara salah ke kelas 0. Berdasarkan isi matrixs
confusion, maka dapat diketahui jumlah data dari masing-masing kelas yang diprediksi secara benar yaitu f11 + f00 dan data yang diklasifikasi
secara salah yaitu f10 + f01 . Kuantitas matrixs confusion dapat PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
diringkas menjadi dua nilai, yaitu akurasi dan laju error. Dengan mengetahui jumlah data yang diklasifikasikan secara benar, maka dapat
diketahui akurasi hasil prediksi, dan dengan mengetahui jumlah data yang diklasifikasikan secara salah maka dapat diketahui laju error dari prediksi
yang dilakukan. Dua kuantitas ini digunakan sebagai matrix kinerja klasifikasi. Untuk menghitung akurasi digunakan formula sebagai berikut :
Prasetyo, 2014 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
BAB III
METODOLOGI PENELITIAN
Pada bab ini akan dijelaskan analisa data dan analisa sistem yang akan dibuat untuk identifikasi penyakit tuberkulosis TB pada manusia menggunakan
metode Naïve Bayesian.
3.1 Data