Spesifikasi Software dan Hardware Desain Pengujian

3.2 Spesifikasi Software dan Hardware

Spesifikasi software dan hardware yang digunakan dalam implementasi sistem ini adalah : Bahasa pemrograman : MATLAB R2012b Processor : AMD E-300 APU with Radeontm HD Graphics 1.30 GHz Memory : 2,00 GB Operating System OS : Windows 7 Ultimate SP1 32 bit

3.3 Desain Alat Uji

Berikut ini adalah alur atau tahapan proses yang dilakukan pada alat uji : pasien 1. preprocessing Data gejala, hasil lab dan rontgen 4. modeling naive bayesian 2. pembagian data dengan k- fold validation Data gejala, hasil lab dan rontgen Data Testing Data Training Label Hasil Prediksi Data Testing 5. akurasi confusion matrix akurasi Data hasil preprocessing 3. Pemisah Data Label Data Testing Data Testing Data gejala, hasil lab dan rontgen Label data Testing GAMBAR 3.1 DIAGRAM ALUR PROSES ALAT UJI

3.3.1 Preprocessing

Pada tahap pre-processing akan dilakukan tahap pembersihan data, integrasi data,seleksi data dan transformasi data. Data mentah akan diubah menjadi data dalam bentuk angka atau dalam bentuk label dengan keterangan seperti berikut : 1. Untuk kolom satu sampai lima a. Tidak = 1 b. Ya = 2 2. Untuk kolom enam sampai delapan a. Negatif = 0 b. Jika nilai tidak negatif maka akan tetap diisi dengan angka sesuai dengan data. 3. Untuk kolom sembilan a. Positif = 1 b. Negatif = 0 4. Untuk kolom 10 a. Tidak = 1 b. Paru = 2 c. Ekstra Paru = 3 Pada tahap pre-processing ini juga dilakukan tahap mengisi data yang tidak diketahui nilainya. Untuk setiap data yang tidak diketahui nilainya akan diberi label 0. Dan untuk setiap data yang tidak memiliki kelas akan dihapus. Tabel 3.2 adalah contoh data yang sudah melewati tahap pre-processing. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI TABEL 3.2 CONTOH DATA SETELAH TAHAP PRE-PROCESSING batuk2 minggu demam BB turun sesak napas batuk darah A B C Rontgen Kelas 2 2 2 2 1 3 3 3 2 2 1 1 1 2 2 2 1 2 1 3 3 3 2 2 1 1 1 1 1 3 2 2 2 1 1 1 2 1 2 2 1 2 2 1 2 2 2 1 1 1 1 2 1 1 1 1 1 2 1 1 1 1 1 2 2 2 2 1 3 3 3 2 2 1 2 2 1 1 1 2 2 1 1 2 1 1 3 2 1 1 1 2 1 1 2

3.3.2 Pembagian Data

Pada tahap ini dilakukan pembagian data yaitu data training dan data testing menggunakan cross validation yaitu k-fold validation. Percobaan yang dilakukan menggunakan 4 jenis k-fold yaitu 3, 5, 7 dan 9 fold. Data akan dibagi sesuai dengan jumlah k, dengan jumlah data yang sama rata. Data yang sudah dibagi nanti akan menjadi data testing dan data training. Setiap percobaan akan mengambil 1 data testing dan data yang lainnya akan digunakan sebagai data training, pada percobaan selanjutnya data testing akan menjadi data training dan sebaliknya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

3.3.3 Pemisah Data

Pada tahap ini data testing akan dipisah menjadi 2 bagian. Bagian pertama adalah bagian data yang memiliki isi semua data gejala, data laboratorium dan hasil rontgen. Bagian kedua adalah label data atau kelas akhir yang berisi TB Paru, TB Ekstra Paru dan tidak TB. Data bagian pertama akan di uji pada proses modeling dan akan menghasilkan label baru hasil prediksi. Setelah itu, label testing asli dengan label testing hasil prediksi akan di bandingkan dengan confusion matrix pada proses 5.

3.3.4 Modeling

Pada tahap ini dilakukan proses penambangan data menggunakan algoritma Naïve Bayesian. Data yang sudah diolah pada tahap sebelumnya akan diolah menggunakan perhitungan algoritma. Data yang akan diolah adalah data testing berdasarkan data training. Berikut adalah tahap yang akan dilakukan untuk mengolah data TB menggunakan metode Naïve Bayesian. Data yang akan digunakan adalah data yang sudah melewati proses preprocessing dan proses pembagian data. 1. Data yang digunakan adalah data training dan data testing. Data testing adalah data yang dicari hasil akhirnya sedangkan data training adalah data yang akan digunakan untuk menentukan hasil akhir atau label dari data testing. 2. Data testing yang sudah siap akan dipisahkan dari labelnya, sehingga terdapat 2 kelompok untuk data testing yaitu kumpulan data gejala, hasil laboratorium dan hasil rontgen sedangkan kelompok yang kedua yaitu kelompok label dari data training yang asli dengan isian TB paru, TB Ekstra Paru atau tidak TB. 3. Data Testing yang tidak memiliki label akan melakukan perulangan untuk dihitung nilai probabilitas dari setiap data PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI dengan berdasarkan data training. Di bawah ini merupakan contoh perhitungan untuk mencari nilai probabilitas dari setiap data, data testing yang akan dihitung dilambangkan dengan X. Tabel 3.3 adalah contoh data training. TABEL 3.3 CONTOH DATA TRAINING batuk2 minggu demam BB turun sesak napas batuk darah A B C Rontgen Kelas 2 2 2 2 1 3 3 3 2 2 1 1 1 2 2 2 1 2 1 3 3 3 2 2 2 2 1 1 1 2 1 2 2 1 2 2 1 2 2 2 1 1 1 1 2 1 1 2 1 1 2 1 1 1 1 1 2 1 1 2 1 1 3 2 1 2 1 1 3 Tabel 3.3 memperlihatkan data training dengan atribut batuk 2minggu, demam, berat badan turun, sesak napas, batuk berdarah, hasil pemeriksaan laboratorium dengan atribut A, B, C, rontgensedangkan atribut kelas adalah pasien memiliki penyakit TB Paru, TB Ekstra Paru dan tidak TB. Berikut ini adalah penyelesaian contoh kasus menggunakan algoritma Naïve Bayesian: Terdapat dua kelas dari klasifikasi yang dibentuk yaitu : Y1 =TB Paru Y2 =TB Ekstra Paru Y3 = tidak TB PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Data yang akan diklasifikasikan adalah X = batuk 2 minggu = ya, demam = tidak, berat badan turun = tidak, sesak napas = ya, batuk berdarah = tidak, A = negatif, B = negatif, C = negatif, rontgen = negatif. Langkah-langkah perhitungan sebagai berikut : a. Mencari PY, sebagai berikut : PY merupakan prior probability untuk setiap kelas berdasarkan data yaitu :     b. Menghitung probabilitas  Probabilitas untuk TB Paru PTB Paru Pbatuk2 minggu = ya|TB Paru Pdemam = tidak|TB Paru pberat badan turun = tidak|TB paru Psesak napas = ya|TB paru Pbatuk berdarah = tidak|TB Paru PA=negatif|TB Paru PB=negatif|TB Paru PC=negatif|TB Paru Prontgen=negatif|TB Paru= 0.001536  Probabilitas untuk TB Ekstra Paru PTB Ekstra Paru Pbatuk2 minggu = ya| TB Ekstra Paru Pdemam = tidak| TB Ekstra Paru Pberat badan turun = tidak|TB Ekstra Paru Psesak napas = ya| TB Ekstra Paru Pbatuk berdarah = tidak| TB Ekstra Paru PA=negatif| TB EkstraParu PB=negatif| TB Ekstra Paru PC=negatif| TB PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI EkstraParuProntgen=negatif| TB Ekstra Paru= 0.025  Probabilitas untuk tidak TB Ptidak TB Pbatuk2 minggu = ya| tidak TB Pdemam = tidak| tidak TB Pberat badan turun = tidak| tidak TB Psesak napas = ya| tidak TB Pbatuk berdarah = tidak| tidak TB PA=negatif| tidak TB PB=negatif| tidak TB PC=negatif| tidak TB= 0.6 c. Setelah melakukan perhitungan probabilitas, akan dibandingkan hasil yang lebih besar antara TB Paru, TB Ekstra Paru dan tidak TB. Berdasarkan perhitungan data X termasuk data pasien tidak TB dengan nilai probabilitas sebesar 0,6. Berdasarkan hasil perhitungan probabilitas diatas, maka hasil dari data X adalah tidak TB sehingga label yang akan muncul yaitu angka 1 untuk data X. 4. Hasil yang didapat dari langkah 3 akan dimasukkan pada label baru. Setelah semua data testing dihitung dan diprediksi maka akan terbentuk label baru yang berisi hasil prediksi dari data testing. 5. Label hasil prediksi akan dibandingkan dengan label asli dari data X.Hasil perbandingan akan masuk ke tahap akurasi dengan menggunakan confusion matrix.

3.3.5 Akurasi

Setelah dilakukan proses modeling, maka akan dilakukan proses menghitung akurasimenggunakan confusion matrix, yaitu dengan menjumlahkan data yang benar dan membaginya dengan semua data baik yang benar maupun yang salah dan dikalikan dengan 100. Berikut adalah tabel contoh hasil confusion matrix. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI TABEL 3.4 TABEL CONTOH HASIL CONFUSION MATRIX KELAS TB PARU TB EKSTRA PARU TIDAK TB TB PARU A B C TB EKSTRA PARU D E F TIDAK TB G H I Berdasarkan Tabel 3.4 diatas, jumlah akurasi dari setiap percobaan dapat dihitung menggunakan rumus akurasi sebagai berikut. Jumlah data yang diprediksi secara benar adalah data yang terletak pada garis diagonal yaitu data A+E+I. Jumlah prediksi yang dilakukan adalah jumlah semua hasil perhitungan confusion matrix yaitu A+B+C+D+E+F+G+H+I. Setelah itu nilai akurasi dapat dikalikan dengan 100.

3.4 Desain Pengujian

Setiap data yang sudah melalui proses pembagian data akan diuji pada proses modeling dengan metode Naïve Bayesian. Berikut ini adalah tahap proses pengujian : PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Label data training hasil prediksi akurasi confusion matrix akurasi modeling naive bayesian Pemisah data Data Testing Label Data Testing Data Training Data Testing Data gejala, lab dan rontgen label GAMBAR 3.2 DIAGRAM ALUR PENGUJIAN alur pengujian akan dilakukan sebanyak jumlah k sesuai dengan k-fold yang digunakan. Di bawah ini merupakan tabel pengujian dengan menggunakan data training dan data testing sesuai dengan jumlah k yang digunakan. TABEL 3.5 PEMBAGIAN 3 FOLD Pengujian Training Testing 1 1, 2 3 2 1, 3 2 3 2, 3 1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Tabel 3.5 merupakan tabel pembagian data berdasarkan 3 fold. Semua data akan dibagi 3 sama rata dan akan digunakan secara bergantian sebagai data training dan data testing sesuai dengan Tabel 3.5. TABEL 3.6 PEMBAGIAN 5 FOLD Pengujian Training Testing 1 1, 2, 3, 4 5 2 1, 2, 3, 5 4 3 1, 2, 4, 5 3 4 1, 3, 4, 5 2 5 2, 3, 4, 5 1 Tabel 3.6 merupakan tabel pembagian data berdasarkan 5 fold. Semua data akan dibagi 5 sama rata dan akan digunakan secara bergantian sebagai data training dan data testing sesuai dengan Tabel 3.6. TABEL 3.7 PEMBAGIAN 7 FOLD Pengujian Training Testing 1 1, 2, 3, 4, 5, 6 7 2 1, 2, 3 , 4, 5, 7 6 3 1, 2, 3, 4, 6, 7 5 4 1, 2, 3, 5, 6, 7 4 5 1, 2, 4, 5, 6, 7 3 6 1, 3, 4, 5, 6, 7, 2 7 2, 3, 4, 5, 6, 7, 1 Tabel 3.7 merupakan tabel pembagian data berdasarkan 7 fold. Semua data akan dibagi 7 sama rata dan akan digunakan secara bergantian sebagai data training dan data testing sesuai dengan Tabel 3.7. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI TABEL 3.8 PEMBAGIAN 9 FOLD Pengujian Training Testing 1 1, 2, 3, 4, 5, 6, 7, 8 9 2 1, 2, 3, 4, 5, 6, 7, 9 8 3 1, 2, 3, 4, 5, 6, 8, 9 7 4 1, 2, 3, 4, 5, 7, 8, 9 6 5 1, 2, 3, 4, 6, 7, 8, 9 5 6 1, 2, 3, 5, 6, 7, 8, 9 4 7 1, 2, 4, 5, 6, 7, 8, 9 3 8 1, 3, 4, 5, 6, 7, 8, 9 2 9 2, 3, 4, 5, 6, 7, 8, 9 1 Tabel 3.8 merupakan tabel pembagian data berdasarkan 9 fold. Semua data akan dibagi 9 sama rata dan akan digunakan secara bergantian sebagai data training dan data testing sesuai dengan Tabel 3.8. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 36 BAB IV ANALISA HASIL DAN IMPLEMENTASI SISTEM Pada bab ini akan dibahas hal-hal yang berkaitan dengan implementasi sistem, hasil yang didapatkan dari pengujian-pengujian yang akan dilakukan, serta analisis dari hasil pengujian.

4.1 Analisis Hasil