3.2 Spesifikasi Software dan Hardware
Spesifikasi software dan hardware yang digunakan dalam implementasi sistem ini adalah :
Bahasa pemrograman : MATLAB R2012b
Processor : AMD E-300 APU with Radeontm HD
Graphics 1.30 GHz Memory
: 2,00 GB Operating System OS
: Windows 7 Ultimate SP1 32 bit
3.3 Desain Alat Uji
Berikut ini adalah alur atau tahapan proses yang dilakukan pada alat uji :
pasien 1. preprocessing
Data gejala, hasil lab dan rontgen
4. modeling naive bayesian
2. pembagian data dengan k-
fold validation Data gejala, hasil lab dan
rontgen
Data Testing Data Training
Label Hasil Prediksi Data Testing
5. akurasi confusion matrix
akurasi Data hasil
preprocessing
3. Pemisah Data
Label Data Testing Data Testing
Data gejala, hasil lab dan rontgen
Label data Testing
GAMBAR 3.1 DIAGRAM ALUR PROSES ALAT UJI
3.3.1 Preprocessing
Pada tahap
pre-processing akan
dilakukan tahap
pembersihan data, integrasi data,seleksi data dan transformasi data. Data mentah akan diubah menjadi data dalam bentuk angka atau
dalam bentuk label dengan keterangan seperti berikut : 1.
Untuk kolom satu sampai lima a.
Tidak = 1 b.
Ya = 2 2.
Untuk kolom enam sampai delapan a.
Negatif = 0 b.
Jika nilai tidak negatif maka akan tetap diisi dengan angka sesuai dengan data.
3. Untuk kolom sembilan
a. Positif = 1
b. Negatif = 0
4. Untuk kolom 10
a. Tidak = 1
b. Paru = 2
c. Ekstra Paru = 3
Pada tahap pre-processing ini juga dilakukan tahap mengisi data yang tidak diketahui nilainya. Untuk setiap data yang tidak
diketahui nilainya akan diberi label 0. Dan untuk setiap data yang tidak memiliki kelas akan dihapus. Tabel 3.2 adalah contoh data
yang sudah melewati tahap pre-processing. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
TABEL 3.2 CONTOH DATA SETELAH TAHAP PRE-PROCESSING
batuk2 minggu
demam BB
turun sesak
napas batuk
darah A
B C
Rontgen Kelas 2
2 2
2 1
3 3
3 2
2 1
1 1
2 2
2 1
2 1
3 3
3 2
2 1
1 1
1 1
3 2
2 2
1 1
1 2
1 2
2 1
2 2
1 2
2 2
1 1
1 1
2 1
1 1
1 1
2 1
1 1
1 1
2 2
2 2
1 3
3 3
2 2
1 2
2 1
1 1
2 2
1 1
2 1
1 3
2 1
1 1
2 1
1 2
3.3.2 Pembagian Data
Pada tahap ini dilakukan pembagian data yaitu data training dan data testing menggunakan cross validation yaitu k-fold
validation. Percobaan yang dilakukan menggunakan 4 jenis k-fold yaitu 3, 5, 7 dan 9 fold. Data akan dibagi sesuai dengan jumlah k,
dengan jumlah data yang sama rata. Data yang sudah dibagi nanti akan menjadi data testing dan data training. Setiap percobaan akan
mengambil 1 data testing dan data yang lainnya akan digunakan sebagai data training, pada percobaan selanjutnya data testing akan
menjadi data training dan sebaliknya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.3.3 Pemisah Data
Pada tahap ini data testing akan dipisah menjadi 2 bagian. Bagian pertama adalah bagian data yang memiliki isi semua data
gejala, data laboratorium dan hasil rontgen. Bagian kedua adalah label data atau kelas akhir yang berisi TB Paru, TB Ekstra Paru dan
tidak TB. Data bagian pertama akan di uji pada proses modeling dan akan menghasilkan label baru hasil prediksi. Setelah itu, label
testing asli dengan label testing hasil prediksi akan di bandingkan dengan confusion matrix pada proses 5.
3.3.4 Modeling
Pada tahap ini dilakukan proses penambangan data menggunakan algoritma Naïve Bayesian. Data yang sudah diolah
pada tahap sebelumnya akan diolah menggunakan perhitungan algoritma. Data yang akan diolah adalah data testing berdasarkan
data training. Berikut adalah tahap yang akan dilakukan untuk mengolah data TB menggunakan metode Naïve Bayesian. Data
yang akan digunakan adalah data yang sudah melewati proses preprocessing dan proses pembagian data.
1. Data yang digunakan adalah data training dan data testing.
Data testing adalah data yang dicari hasil akhirnya sedangkan data training adalah data yang akan digunakan
untuk menentukan hasil akhir atau label dari data testing. 2.
Data testing yang sudah siap akan dipisahkan dari labelnya, sehingga terdapat 2 kelompok untuk data testing yaitu
kumpulan data gejala, hasil laboratorium dan hasil rontgen sedangkan kelompok yang kedua yaitu kelompok label dari
data training yang asli dengan isian TB paru, TB Ekstra Paru atau tidak TB.
3. Data Testing yang tidak memiliki label akan melakukan
perulangan untuk dihitung nilai probabilitas dari setiap data PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
dengan berdasarkan data training. Di bawah ini merupakan contoh perhitungan untuk mencari nilai probabilitas dari
setiap data, data testing yang akan dihitung dilambangkan dengan X. Tabel 3.3 adalah contoh data training.
TABEL 3.3 CONTOH DATA TRAINING
batuk2 minggu
demam BB
turun sesak
napas batuk
darah A
B C
Rontgen Kelas 2
2 2
2 1
3 3
3 2
2 1
1 1
2 2
2 1
2 1
3 3
3 2
2 2
2 1
1 1
2 1
2 2
1 2
2 1
2 2
2 1
1 1
1 2
1 1
2 1
1 2
1 1
1 1
1 2
1 1
2 1
1 3
2 1
2 1
1 3
Tabel 3.3 memperlihatkan data training dengan atribut batuk 2minggu, demam, berat badan turun, sesak napas, batuk berdarah,
hasil pemeriksaan laboratorium dengan atribut A, B, C, rontgensedangkan atribut kelas adalah pasien memiliki penyakit
TB Paru, TB Ekstra Paru dan tidak TB. Berikut ini adalah penyelesaian contoh kasus menggunakan algoritma Naïve
Bayesian: Terdapat dua kelas dari klasifikasi yang dibentuk yaitu :
Y1 =TB Paru Y2 =TB Ekstra Paru
Y3 = tidak TB PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Data yang akan diklasifikasikan adalah X = batuk 2 minggu = ya, demam = tidak, berat badan turun = tidak, sesak napas = ya,
batuk berdarah = tidak, A = negatif, B = negatif, C = negatif, rontgen = negatif. Langkah-langkah perhitungan sebagai berikut :
a. Mencari PY, sebagai berikut :
PY merupakan prior probability untuk setiap kelas berdasarkan data yaitu :
b. Menghitung probabilitas
Probabilitas untuk TB Paru PTB Paru Pbatuk2 minggu = ya|TB Paru
Pdemam = tidak|TB Paru pberat badan turun = tidak|TB paru Psesak napas = ya|TB paru Pbatuk
berdarah = tidak|TB Paru PA=negatif|TB Paru PB=negatif|TB
Paru PC=negatif|TB
Paru Prontgen=negatif|TB Paru=
0.001536
Probabilitas untuk TB Ekstra Paru PTB Ekstra Paru Pbatuk2 minggu = ya| TB
Ekstra Paru Pdemam = tidak| TB Ekstra Paru Pberat badan turun = tidak|TB Ekstra Paru Psesak
napas = ya| TB Ekstra Paru Pbatuk berdarah = tidak| TB Ekstra Paru PA=negatif| TB EkstraParu
PB=negatif| TB Ekstra Paru PC=negatif| TB PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
EkstraParuProntgen=negatif| TB Ekstra Paru= 0.025
Probabilitas untuk tidak TB Ptidak TB Pbatuk2 minggu = ya| tidak TB
Pdemam = tidak| tidak TB Pberat badan turun = tidak| tidak TB Psesak napas = ya| tidak TB
Pbatuk berdarah = tidak| tidak TB PA=negatif| tidak TB PB=negatif| tidak TB PC=negatif| tidak
TB= 0.6
c. Setelah melakukan perhitungan probabilitas, akan
dibandingkan hasil yang lebih besar antara TB Paru, TB Ekstra Paru dan tidak TB. Berdasarkan perhitungan data X
termasuk data pasien tidak TB dengan nilai probabilitas sebesar 0,6.
Berdasarkan hasil perhitungan probabilitas diatas, maka hasil dari data X adalah tidak TB sehingga label yang akan muncul yaitu
angka 1 untuk data X. 4.
Hasil yang didapat dari langkah 3 akan dimasukkan pada label baru. Setelah semua data testing dihitung dan diprediksi maka akan
terbentuk label baru yang berisi hasil prediksi dari data testing. 5.
Label hasil prediksi akan dibandingkan dengan label asli dari data X.Hasil perbandingan akan masuk ke tahap akurasi dengan
menggunakan confusion matrix.
3.3.5 Akurasi
Setelah dilakukan proses modeling, maka akan dilakukan proses menghitung akurasimenggunakan confusion matrix, yaitu
dengan menjumlahkan data yang benar dan membaginya dengan semua data baik yang benar maupun yang salah dan dikalikan
dengan 100. Berikut adalah tabel contoh hasil confusion matrix. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
TABEL 3.4 TABEL CONTOH HASIL CONFUSION MATRIX
KELAS TB PARU
TB EKSTRA PARU
TIDAK TB TB PARU
A B
C TB EKSTRA
PARU D
E F
TIDAK TB G
H I
Berdasarkan Tabel 3.4 diatas, jumlah akurasi dari setiap percobaan dapat dihitung menggunakan rumus akurasi sebagai berikut.
Jumlah data yang diprediksi secara benar adalah data yang terletak pada garis diagonal yaitu data A+E+I. Jumlah prediksi
yang dilakukan adalah jumlah semua hasil perhitungan confusion matrix yaitu A+B+C+D+E+F+G+H+I. Setelah itu nilai akurasi
dapat dikalikan dengan 100.
3.4 Desain Pengujian
Setiap data yang sudah melalui proses pembagian data akan diuji pada proses modeling dengan metode Naïve Bayesian. Berikut ini adalah
tahap proses pengujian : PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Label data training hasil prediksi
akurasi confusion matrix
akurasi modeling naive
bayesian Pemisah data
Data Testing
Label Data Testing Data Training
Data Testing Data gejala, lab dan rontgen
label
GAMBAR 3.2 DIAGRAM ALUR PENGUJIAN
alur pengujian akan dilakukan sebanyak jumlah k sesuai dengan k-fold yang digunakan. Di bawah ini merupakan tabel pengujian dengan
menggunakan data training dan data testing sesuai dengan jumlah k yang digunakan.
TABEL 3.5 PEMBAGIAN 3 FOLD
Pengujian Training Testing
1 1, 2
3 2
1, 3 2
3 2, 3
1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 3.5 merupakan tabel pembagian data berdasarkan 3 fold. Semua data akan dibagi 3 sama rata dan akan digunakan secara bergantian sebagai data
training dan data testing sesuai dengan Tabel 3.5. TABEL 3.6
PEMBAGIAN 5 FOLD Pengujian
Training Testing 1
1, 2, 3, 4 5
2 1, 2, 3, 5
4 3
1, 2, 4, 5 3
4 1, 3, 4, 5
2 5
2, 3, 4, 5 1
Tabel 3.6 merupakan tabel pembagian data berdasarkan 5 fold. Semua data akan dibagi 5 sama rata dan akan digunakan secara bergantian sebagai data
training dan data testing sesuai dengan Tabel 3.6.
TABEL 3.7 PEMBAGIAN 7 FOLD
Pengujian Training
Testing 1
1, 2, 3, 4, 5, 6 7
2 1, 2, 3 , 4, 5, 7
6 3
1, 2, 3, 4, 6, 7 5
4 1, 2, 3, 5, 6, 7
4 5
1, 2, 4, 5, 6, 7 3
6 1, 3, 4, 5, 6, 7,
2 7
2, 3, 4, 5, 6, 7, 1
Tabel 3.7 merupakan tabel pembagian data berdasarkan 7 fold. Semua data akan dibagi 7 sama rata dan akan digunakan secara bergantian sebagai data
training dan data testing sesuai dengan Tabel 3.7. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
TABEL 3.8 PEMBAGIAN 9 FOLD
Pengujian Training
Testing 1
1, 2, 3, 4, 5, 6, 7, 8 9
2 1, 2, 3, 4, 5, 6, 7, 9
8 3
1, 2, 3, 4, 5, 6, 8, 9 7
4 1, 2, 3, 4, 5, 7, 8, 9
6 5
1, 2, 3, 4, 6, 7, 8, 9 5
6 1, 2, 3, 5, 6, 7, 8, 9
4 7
1, 2, 4, 5, 6, 7, 8, 9 3
8 1, 3, 4, 5, 6, 7, 8, 9
2 9
2, 3, 4, 5, 6, 7, 8, 9 1
Tabel 3.8 merupakan tabel pembagian data berdasarkan 9 fold. Semua data akan dibagi 9 sama rata dan akan digunakan secara bergantian sebagai data
training dan data testing sesuai dengan Tabel 3.8. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
BAB IV
ANALISA HASIL DAN IMPLEMENTASI SISTEM
Pada bab ini akan dibahas hal-hal yang berkaitan dengan implementasi sistem, hasil yang didapatkan dari pengujian-pengujian yang akan dilakukan, serta
analisis dari hasil pengujian.
4.1 Analisis Hasil