Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid Chapter III V
BAB 3
METODOLOGI PENELITIAN
3.1. Diagram Blok Penelitian
Adapun diagram blok penelitian secara keseluruhan dapat dilihat pada gambar 3.1.
Data Collection
Pre Prosessing
Data Cleaning
Data Tranformation
Proses
Analisis Data
Metode Rough Set
Algoritma Apriori
Akurasi
Identifikasi Pola
Penyakit Tifoid
Gambar 3.1. Diagram Blok Penelitian
Universitas Sumatera Utara
21
3.2. Data Collection
Berdasarkan hasil pengamatan kasus Tifoid adalah kasus terbanyak rawat inap di RS
Grand Medistra Lubuk Pakam. Jumlah kasus Demam Tifoid pada pasien BPJS RS
Grand Medistra Lubuk Pakam bulan Januari sampai April tahun 2014 adalah
berjumlah 500 kasus. Data ini diambil dari indeks penyakit kasus Demam Tifoid
Januari 2012 sampai Desember tahun 2014. Terdapat 5 atribut yang harus diisi yang
ada pada rekam medis yaitu :
Nama
:
Umur
:
Jenis kelamin
:
Pekerjaan
:
Keluhan
:
Tabel 3.1. Data Primer
No
Nama
Umur
JK
Pekerjaan
Keluhan Pasien
1
A
47
L
Wiraswasta
demam, sakit kepala, pusing, …..
2
S
20
L
Mahasiswa
demam, sakit kepala, pusing, …..
3
P
20
L
Mahasiswa
demam, muntah, badan lemas, …..
4
A
21
L
Mahasiswa
sakit kepala, sakit perut, muntah, …..
5
D
23
P
PNS
demam, pusing, sakit perut, …..
.
.
.
.
.
.
.
.
.
.
.
.
500
….
….
….
….
….
503
KR
34
L
sakit perut, diare, nafsu makan
3.3. Tabulasi Data Penelitian
Berdasarkan hasil pengumpulan data menggunakan instrumen pada tabel 3.1. Data
Primer dilakukan proses tabulasi data hasil pengumpulan data seperti pada tabel 3.2
berikut:
Tabel 3.2. Hasil Tabulasi Data Penelitian
Attribut Data
No
Hasil Diagnosa
Umur
JK
DM
SK
PS
SP
MUN
BTK
NMM
1
47
L
Y
Y
Y
Y
Y
Y
Y
Positif
2
20
L
Y
Y
Y
Y
Y
Y
Y
Positif
Universitas Sumatera Utara
22
Tabel 3.2. Hasil Tabulasi Data Penelitian
(Lanjutan)
Attribut Data
No
Hasil Diagnosa
Umur
JK
DM
SK
PS
SP
MUN
BTK
NMM
3
20
L
0
Y
0
0
0
Y
0
Negatif
4
21
L
Y
0
Y
0
Y
Y
Y
Positif
5
23
P
Y
Y
0
Y
Y
0
0
Positif
…
…
…
…
…
…
…
…
…
…
…
500
32
L
Y
Y
Y
Y
Y
Y
Y
Positif
3.4. Pre Prosessing
3.4.1. Data Cleaning
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga dilakukan proses encrichment, yaitu proses “memperkaya” data yang sudah ada
dengan data atau infomasi lain yang relevan dan diperlukan untuk KDD, seperti data
atau informasi eksternal, proses cleaning ini dilakukan secara manual, seperti terlihat
pada gambar berikut:
Gambar 3.2. Data Awal
Pada gambar 3.2 diatas terdapat duplikasi data dan missing value yang dianggap
sebagai noise, dalam penelitian ini atribut yang digunakan untuk pengolahan data
selanjutnya yaitu umur, jenis kelamin dan keluhan pasien. berikut gambar hasil proses
dari cleaning data.
Universitas Sumatera Utara
23
Gambar 3.3. Hasil Cleaning Data
3.4.2. Data Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan
proses kreatif dan sangat tegantung pada jenis atau pola informasi yang akan dicari
dalam basis data.
Tabel. 3.3. Tabel Data Transformation
Atribut
Nilai
Umur
2 – 50
Jenis Kelamin
0 = Laki-Laki, 1 = Perempuan
Demam
0 = Tidak, 1 = Ya
Sakit kepala
0 = Tidak, 1 = Ya
Pusing
0 = Tidak, 1 = Ya
Sakit perut
0 = Tidak, 1 = Ya
Muntah
0 = Tidak, 1 = Ya
Batuk
0 = Tidak, 1 = Ya
Nafsu makan menurun
0 = Tidak, 1 = Ya
Diagnosa
1 = Positif, 2 = Negatif
Universitas Sumatera Utara
24
Berikut contoh gambar setelah dilakukan data transformasi
Gambar 3.4. Hasil Tranformasi Data
3.5. Analisa Metode Rough Set
Dengan merancang sistem keputusan ini maka dihasilkan suatu Rules/Knowledge
untuk pengambilan keputusan, yaitu dengan melakukan proses :
1. Merepresentasikan data atau objek dengan membentuk tabel Information
System (IS) dan Decision System (DS)
2. Indicernibility Relation, menghubungankan antar atribut yang tidak dapat
dipisahkan.
3. Equivalen Class, mengelompokkan objek-objek yang memiliki atribut kondisi
yang sama.
4. Discernibility Matrix / discernibility matrix modulo, sekumpulan atribut yang
berbeda antara objek.
5. Reduction, penyelesaian atribut minimal dari sekumpulan atribut kondisi
dengan menggunakan prime implicant fungsi boolean.
6. Generating Rules, membangkitkan aturan-aturan (rules) dari pengetahuan yang
didapat dalam proses ekstrak data.
3.5.1. Representasi Data
Terdapat dua bentuk representasi data yaitu Information System (IS) dan Decision
System (DS). Sebuah Information System (IS) terdiri dari : IS = {U, A}, dimana U =
{e1, e2, …, en} dan A = {a1, a2, …, an} yang merupakan sekumpulan example dan
attribute kondisi secara berurutan. Information System yang ditampilkan pada
penelitian ini terlihat pada tabel berikut:
Universitas Sumatera Utara
25
Tabel 3.4. Information System
Nama
Umur
Jenis
Demam
Sakit
Kelamin
Pusing
Sakit
kepala
Muntah
Batuk
perut
nafsu
makan
menurun
P1
47
0
1
1
1
1
1
1
1
P2
20
0
1
1
1
1
1
1
1
P3
20
0
1
0
0
0
1
0
0
P4
21
1
0
1
0
1
1
1
1
P5
23
1
1
0
1
1
0
0
1
P6
23
1
1
0
0
1
0
0
0
P7
18
0
1
0
0
0
1
0
0
P8
20
0
1
0
0
0
0
0
0
P9
27
1
1
1
1
1
1
1
1
P10
31
1
1
0
0
1
0
0
0
…..
…..
…..
…..
…..
…..
…..
…..
…..
…..
500
32
1
1
1
1
1
1
1
1
Tabel 3.4 memperlihatkan sebuah information system dimana tiap-tiap baris
mempresentasikan objek (pasien) sedangkan tiap-tiap kolom mempresentasikan
atribut kondisi (gejala).
Dalam sebuah Information System (IS) juga dipresentasikan dengan sebuah
Decision Attribute (atribut keputusan), C = {C1, C2, …, Cn. sehingga information
system menjadi IS = (U, {A,C}). Pada tabel 3.4 dapat dilihat sebuah information
system yang di dalamnya terdapat objek (U), atribut kondisi (A) dan Atribut keputusan
(C).
Tabel 3.5. Decision System (DS)
Nama
Umur
Pasien
Jenis
Demam
Kelamin
Sakit
Pusing
kepala
Sakit
Muntah
Batuk
perut
nafsu
Keputusan
makan
menurun
P1
47
0
1
1
1
1
1
1
1
Positif
P2
20
0
1
1
1
1
1
1
1
Positif
P3
20
0
1
0
0
0
1
0
0
Negatif
P4
21
1
0
1
0
1
1
1
1
Negatif
P5
23
1
1
0
1
1
0
0
1
Negatif
P6
23
1
1
0
0
1
0
0
0
Positif
Universitas Sumatera Utara
26
Tabel 3.5. Decision System (DS)
(Lanjutan)
Nama
Umur
Pasien
Jenis
Demam
Kelamin
Sakit
Pusing
kepala
Sakit
Muntah
Batuk
perut
nafsu
Keputusan
makan
menurun
P7
18
0
1
0
0
0
1
0
0
Negatif
P8
20
0
1
0
0
0
0
0
0
Positif
P9
27
1
1
1
1
1
1
1
1
Positif
P10
31
1
1
0
0
1
0
0
0
Positif
…..
…..
…..
…..
…..
…..
…..
…..
…..
…..
…..
P500
32
1
1
1
1
1
1
1
1
Positif
Tabel 3.5 memperlihatkan sebuah Decision System (DS) yang terdiri dari P1, P2, P3,
P4, P5, P6, P7, P8, P9, P10 …., n. Delapan atribut kondisi yaitu demam, sakit kepala,
pusing, sakit perut, muntah, batuk dan nafsu makan menurun, serta 1 atribut
keputusan. Jika seluruh seluruh variabel gejala Ya maka keputusan = Positif
(Adeyemo, et al. 2015)
3.5.2. Indicernibility Relation
Dalam decision system, sebuah objek dapat memiliki nilai yang sama untuk sebuah
atribut kondisionalnya, hubungan tersebut disebut dengan indiscernibility (tidak dapat
dipisahkan.
Berdasarkan tabel 3.5 maka didapatkan
Indicernibility Relation sebagai
berikut:
IND (Demam)
= {P1, P2, P3, P5, P6, P7, P8, P9, P10, …..}
IND (Sakit Kepala)
= {P1, P2, P4, P9, …..}
IND (Pusing)
= {P1, P2, P5, P9, …..}
IND (Sakit Perut)
= {P1, P2, P4, P5, P6, P9, P10, …..}
IND (Muntah)
= {P1, P2, P3, P4, P7, P9, …..}
IND (Batuk)
= {P1, P2, P4, P9, …..)
IND (Nafsu Makan Menurun = {P1, P2, P4, P5, P9, …..}
Kelas-kelas yang telah dikelompokkan disebut dengan equivalence class.
Universitas Sumatera Utara
27
3.5.3. Equivalence Class
Mengelompokkan objek-objek yang mempunyai nilai atribut yang sama menjadi satu
bagian. Variabel Gejala terdiri dari 7 atribut, yaitu: demam (A), sakit kepala (B),
pusing (C), sakit perut (D), muntah (E), batuk (F), nafsu makan menurun (G).
Ya
=1
Tidak = 0
Variabel Keputusan (H) terdiri dari :
Positif
=1
Negatif
=2
Kemudian masing-masing objek dikelompokkan dalam bentuk Equivalence Class
disederhanakan berdasarkan atribut kondisi dan keputusan menjadi EC1, EC2, EC3,
EC4, EC5, EC6, EC7 dan EC8 sehingga hasilnya dapat dilihat seperti pada tabel 3.5
berikut:
Tabel 3.6. Equivalence Class
Equivalence
Demam
Sakit
Pusing
Sakit
Muntah
Batuk
nafsu
Keputusan
(A)
kepala
(C)
perut
(E)
(F)
makan
(H)
Class
(B)
(D)
menurun
Number
Object
(G)
EC1
Ya
Ya
Ya
Ya
ya
ya
Ya
Positif
437
EC2
Ya
EC3
Tidak
Ya
Ya
Tidak
ya
ya
Ya
Negatif
1
Ya
Tidak
Ya
ya
ya
Ya
Negatif
5
EC4
Ya
Tidak
Ya
Ya
tidak
tidak
Ya
Negatif
5
EC5
Tidak
Tidak
Tidak
Ya
tidak
ya
Ya
Negatif
16
EC6
Ya
Tidak
Tidak
Ya
tidak
tidak
Tidak
Positif
21
EC7
Ya
Tidak
Tidak
Tidak
ya
tidak
Tidak
Negatif
12
EC8
Ya
Tidak
Tidak
Tidak
tidak
tidak
Tidak
Negatif
2
3.5.4. Discernibility Matrix
Dalam Discernibility Matrix maka variabel-variabel kondisi yang terdiri dari umur,
jenis kelamin, demam, sakit kepala, pusing, sakit perut, muntah, batuk, nafsu makan
menurun. Dalam proses perbandingan ini yang diperhatikan hanya atribut kondisinya
saja, jika nilai atribut kondisinya sama maka tidak menghasilkan nilai dan jika
terdapat kondisi atribut yang berbeda maka akan menghasilkan nilai.
Dari proses perbandingan ini dihasilkan tabel Discernibility Matrix seperti tabel 3.7
Universitas Sumatera Utara
28
Tabel 3.7. Discernibility Matrix
EC1
EC2
EC3
EC4
EC5
EC6
EC7
EC8
EC1
-
D
AC
AEF
ABCE
BCEFG
BCDFG
BCDEFG
EC2
D
-
ACD
BDEF
ABCDE
BCDEFG
BCFG
BCEFG
EC3
AC
ACD
-
ABCEF
BE
ABEFG
ABDFG
ABDEFG
EC4
AEF
BDEF
ABCEF
-
ACF
CG
CDEG
CDG
EC5
ABCE
ABCDE
BE
ACF
-
AF
ADEFG
ADFG
EC6
BCEFG
BCDEFG
ABEFG
CG
AF
-
DE
D
EC7
BCDFG
BCFG
ABDFG
CDG
ADFG
D
-
E
BCEFG
ABDEFG
CDG
ADFG
D
E
-
EC8
BCDEF
G
3.5.5. Discernibility Matrix Modulo D
Dari hasil pengolahan data dengan cara Discernibility Matrix sesuai tabel 3.6 maka
selanjutnya data diolah dengan cara Discernibility Matrix Modulo D, pengolahan
dengan cara ini variabel kondisi dan keputusannya harus dibandingkan. Sehingga jika
variabel keputusan juga dibandingkan maka hasilnya menjadi seperti pada tabel 3.8
Tabel 3.8. Discernibility Matrix Module D
EC1
EC2
EC3
EC4
EC5
EC6
EC7
EC8
EC1
-
D
AC
AEF
ABCE
-
BCDFG
BCDEFG
EC2
D
-
-
-
-
BCDEFG
-
-
EC3
AC
-
-
-
-
ABEFG
-
-
EC4
AEF
-
-
-
-
CG
-
-
EC5
ABCE
-
-
-
-
AF
-
-
EC6
-
BCDEFG
ABEFG
CG
AF
-
DE
D
EC7
BCDFG
-
-
-
-
D
-
-
-
-
-
-
D
-
-
EC8
BCDEF
G
Keterangan : Jika nilai decision Atribut sama
= kosong
decision Atribut berbeda = terisi
Universitas Sumatera Utara
29
3.5.6. Reduct
Teknik yang dapat diterapkan untuk mendapatkan representasi data set yang lebih
kecil dengan Reduct, namun tetap mempertahankan integritas data asli, artinya
pertambangan data set berkurang harus lebih efisien atau sama dengan hasil analisis.
Proses reduct yang dilakukan berdasarkan tabel 3.8. Dicernibility Matrix Mod D
dengan penyeleksian variabel minimal dari sekumpulan variabel kondisi dengan cara
Prime Implicant fungsi Boolean, sebagai berikut:
A+1=1+A=1
AA=A
Tabel 3.9. Reduct
Class
CNF of Boolean Function
Prime Implicant
Reducts
EC1
D ^ (AvC) ^ (AvEvF) ^ (AvBvCvE)
B^D^F
{B}, {D}, {F}
^ (BvCvDvFvG) ^ (BvCvDvEvFvG)
EC2
D ^ (BvCvDvEvFvG)
B^D^G
{B}, {D}, {G}
EC3
(AvC) ^ (AvBvEvFvG)
A^ B ^ C ^ E ^
{A}, {B}, {C},
G
{E}, {G}
EC4
(AvEvF) ^ (CvG)
C^F^G
{C}, {F}, {G}
EC5
(AvBvCvE) ^ (AvF)
A^B
{A}, {B}
EC6
(BvCvDvEvFvG) ^ (AvBvEvFvG) ^
A^B^E^F^
{A}, {B}, {E},
(CvG) ^ (AvF)
G
{F}, {G}
EC7
(BvCvDvFvG) ^ (D)
D
{D}
EC8
(BvCvDvEvFvG) ^ (D)
B^D^G
{B}, {D}, {G}
3.5.7. Generating Rules
Setelah mendapatkan reduce, maka dapat ditarik kesimpulan atau ditentukan rule
dengan menyesuaikan reduce setiap equivalen class terhadap tabel 3.6 (Equivalen
Class). Berdasarkan data hasil reduct yang telah didapatkan, maka data-data tersebut
akan diolah sehingga menghasilkan suatu rules / knowledge yang dapat dipahami
untuk pengambilan suatu keputusan. Berikut akan ditarik kesimpulan untuk semua
kelas :
A. Class EC1 menghasilkan reduct {B}, {D}, {F} Rulenya adalah:
Universitas Sumatera Utara
30
Jika sakit kepala = ya dan sakit perut = ya dan batuk = ya, maka diagnosa =
positif.
B. Class EC2 menghasilkan reduct {B}, {D}, {G}, Rulenya adalah:
Jika sakit kepala = ya dan sakit perut = tidak dan nafsu makan menurun =
ya, maka diagnosa = negatif.
C. Class EC3 menghasilkan reduct {A}, {B}, {C}, {E}, {G} Rulenya adalah:
Jika demam = tidak dan sakit kepala = ya dan pusing = tidak dan nafsu
makan menurun = ya, maka diagnosa = negatif.
D. Class EC4 menghasilkan reduct {C}, {F}, {G}, Rulenya adalah:
Jika pusing = ya dan batuk = tidak dan nafsu makan menurun = ya, maka
diagnosa = negatif
E. Class EC5 menghasilkan reduct {A}, {B}, Rulenya adalah:
Jika demam = tidak dan sakit kepala = tidak, maka diagnosa = negatif.
F. Class EC6 menghasilkan reduct {A}, {B}, {E}, {F}, {G}, Rulenya adalah:
Jika demam = ya dan sakit kepala = tidak dan muntah = tidak dan batuk =
tidak dan nafsu makan menurun = tidak, maka diagnosa = positif
G. Class EC7 menghasilkan reduct {D}, Rulenya adalah:
Jika sakit perut = tidak, maka diagnosa = negatif.
H. Class EC8 menghasilkan reduct {B}, {D}, {G}, Rulenya adalah:
Jika sakit kepala = tidak dan sakit perut = tidak dan nafsu makan menurun =
tidak, maka diagnosa = negatif
3.6. Analisa Penerapan Algoritma Apriori
Algoritma apriori adalah algoritma paling terkenal untuk menemukan pola frekuensi
tinggi. Pola frekuensi tinggi adalah pola-pola item di dalam suatu database yang
memiliki frekuensi atau support di atas ambang batas tertentu yang disebut dengan
istilah minimum support. Algoritma apriori dibagi menjadi beberapa tahap yang
disebut iterasi atau pass yaitu:
1. Pembentukan kandidat itemset , kandidat kitemset dibentuk dari kombinasi (k1) itemset yang didapat dari iterasi sebelumnya. Satu cara dari algoritma
apriori adalah adanya pemangkasan kandidat k-itemset yang subsetnya yang
berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.
Universitas Sumatera Utara
31
2. Penghitungan support dari tiap kandidat kitemset. Support dari tiap kandidat kitemset didapat dengan menscan database untuk menghitung jumlah transaksi
yang memuat semua item di dalam kandidat k-itemset tersebut. Ini adalah juga
ciri dari algoritma apriori dimana diperlukan penghitungan dengan scan
seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau
k-itemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dari
minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan.
Bila tidak, maka k ditambah satu dan kemabali ke bagian 1.
3.6.1. Pola Gejala Penyakit Demam Tifoid
Berdasarkan pola gejala penyakit demam tifoid yang diperoleh dari beberapa
sampel data pada tabel 3.10 berikut:
Tabel 3.10. Pola Gejala Penyakit Demam Tifoid
Itemset
Pasien
P1
Diagnosa
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
P2
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
P3
demam, muntah, badan lemas, keringat malam hari
Negatif
P4
sakit kepala, sakit perut, muntah, batuk, nafsu makan
Negatif
menurun
P5
demam, pusing, sakit perut, nafsu makan menurun
Negatif
P6
demam, sakit perut, badan pegal-pegal, keringat malam hari
Positif
P7
demam, sakit perut, badan lemas
Negatif
P8
demam, keringat malam hari, badan lemas
Positif
P9
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
P10
demam, sakit perut
Positif
…..
…..
…..
Universitas Sumatera Utara
32
P500
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
A. Pembentukan Itemset
Berikut ini penyelesaian berdasarkan data yang sudah disediakan pada tabel 3.10,
proses pembentukan Combinasi (C1) atau disebut 1 itemset dengan jumlah
minimum support = 90%, dengan rumus sebagai berikut:
=
�
�
�
�
�
�
� �
�
X 100%
Tabel 3.11. Support dari Tiap Item
Itemset
Count
Support
Demam
479
95.8%
Sakit kepala
443
88.6%
Pusing
443
88.6%
Sakit perut
484
96.8%
Muntah
455
91.0%
Batuk
458
91.6%
Nafsu makan menurun
463
92.6%
B. Kombinasi 2 Itemset
Proses pembentukan C2 atau disebut dengan 2 itemset dengan jumlah minimum
support = 90%, dapat diselesaikan dengan rumus sebagai berikut:
,
=
�
�
�
�
�
�
�
�
�
�
X 100%
Tabel 3.12. Pola Kombinasi 2 Itemset
Itemset
Count
Support
Demam, sakit kepala
438
87,6%
Demam, pusing
443
88,6%
Demam, sakit perut
464
92,8%
Demam, muntah
451
90,2%
Universitas Sumatera Utara
33
Demam, batuk
438
87,6%
Demam, nafsu makan menurun
443
88,6%
Sakit kepala, pusing
438
87,6%
Sakit kepala, sakit perut
443
88,6%
Sakit kepala, muntah
443
88,6%
Sakit kepala, batuk
443
88,6%
Sakit kepala, nafsu makan menurun
443
88,6%
Pusing, sakit perut
442
88,4%
Pusing, muntah
438
87,6%
Pusing, batuk
438
87,6%
Pusing, nafsu makan menurun
443
88,6%
Sakit perut, muntah
443
88,6%
Sakit perut, batuk
458
91,6%
Sakit perut, nafsu makan menurun
463
92,6%
Muntah, batuk
443
88,6%
Muntah, nafsu makan menurun
443
88,6%
Batuk, nafsu makan menurun
459
91,8%
Minimal support yang ditentukan adalah 90%, jadi kombinasi 2 itemset yang tidak
memenuhi minimal support akan dihilangkan, terlihat seperti tabel berikut ini :
Tabel 3.13. Tabel Kombinasi 2 Itemset memenuhi minimal Support
Itemset
Count
Support
Demam, sakit perut
464
92,8%
Demam, muntah
451
90,2%
Sakit Perut, batuk
458
91,6%
Sakit perut, nafsu makan menurun
463
92,6%
Batuk, nafsu makan menurun
459
91,8%
C. Kombinasi 3 Itemset
Proses pembentukan C 3 atau disebut dengan 3 itemset dengan jumlah minimum
support = 90%, dapat diselesaikan dengan rumus berikut:
Universitas Sumatera Utara
34
,
�
=
�
�
�
�
�
�
�
� �
,
�
X 100%
Tabel 3.14. Pola Kombinasi 3 Itemset
Itemset
Count
Support
Demam, sakit kepala, pusing
438
87,6%
Demam, sakit kepala, sakit perut
437
87,4%
Demam, sakit kepala, muntah
438
87,6%
Demam, sakit kepala, batuk
438
87,6%
Demam, sakit kepala, nafsu makan menurun
438
87,6%
Demam, pusing, sakit perut
442
88,4%
Demam, pusing, muntah
438
87,6%
Demam, pusing, batuk
438
87,6%
Demam, pusing, nafsu makan menurun
443
88,6%
Demam, sakit perut, muntah
437
87,4%
Demam, sakit perut, batuk
437
87,4%
Demam, sakit perut, nafsu makan menurun
442
88,4%
Demam, muntah, batuk
438
87,6%
Demam, muntah, nafsu makan menurun
438
87,6%
Demam, batuk, nafsu makan menurun
438
87,6%
Sakit kepala, pusing, sakit perut
437
87,4%
Sakit kepala, pusing, muntah
438
87,6%
Sakit kepala, pusing, batuk
438
87,6%
Sakit kepala, pusing, nafsu makan menurun
438
87,6%
Sakit kepala, sakit perut, muntah
442
88,4%
Sakit kepala, sakit perut, batuk
442
88,4%
Sakit kepala, sakit perut, nafsu makan menurun
442
88,4%
Sakit kepala, muntah, batuk
443
88,6%
Sakit kepala, muntah, nafsu makan menurun
443
88,6%
Sakit kepala, batuk, nafsu makan menurun
443
88,6%
Pusing, sakit perut, muntah
437
87,4%
Pusing, sakit perut, batuk
437
87,4%
Pusing, sakit perut, nafsu makan menurun
442
88,4%
Pusing, muntah, batuk
438
87,6%
Universitas Sumatera Utara
35
Pusing, muntah, nafsu makan menurun
438
87,6%
Pusing, batuk, nafsu makan menurun
438
87,6%
Sakit perut, muntah, batuk
442
88,4%
Sakit perut, muntah, nafsu makan menurun
442
88,4%
Sakit perut, batuk, nafsu makan menurun
458
91,6%
Muntah, batuk, nafsu makan menurun
443
88,6%
Minimal support yang ditentukan adalah 90%, jadi kombinasi 3 itemset yang tidak
memenuhi minimal support akan dihilangkan, terlihat seperti tabel berikut ini :
Tabel 3.15. Tabel Kombinasi 3 Itemset memenuhi minimal Support
Itemset
Sakit perut, batuk, nafsu makan
Count
Support
458
91,6%
menurun
D. Kombinasi 4 Itemset
Proses pembentukan C4 atau disebut dengan 4 itemset dengan jumlah minimum
support = 50%, dapat diselesaikan dengan rumus berikut:
, ,
�
=
�
�
�
�
�
�
�
�
, ,
�
�
X 100%
Tabel 3.16. Pola Kombinasi 4 Itemset
Itemset
Count
Support
Demam, sakit kepala, pusing, sakit perut
437
87,4%
Demam, sakit kepala, pusing, muntah
438
87,6%
Demam, sakit kepala, pusing, batuk
438
87,6%
Demam, sakit kepala, pusing, nafsu makan menurun
438
87,6%
Demam, sakit kepala, sakit perut, muntah
437
87,4%
Demam, sakit kepala, sakit perut, batuk
437
87,4%
Demam, sakit kepala, sakit perut, nafsu makan menurun
437
87,4%
Demam, sakit kepala, muntah, batuk
438
87,6%
Demam, sakit kepala, batuk, nafsu makan menurun
438
87,6%
Demam, pusing, sakit perut, muntah
437
87,4%
Universitas Sumatera Utara
36
Demam, pusing, sakit perut, batuk
437
87,4%
Demam, pusing, sakit perut, nafsu makan menurun
442
88,4%
Demam, pusing, muntah, batuk
438
87,6%
Demam, pusing, muntah, nafsu makan menurun
438
87,6%
Demam, sakit perut, muntah, batuk
437
87,4%
Demam, sakit perut, batuk, nafsu makan menurun
437
87,4%
Demam, muntah, batuk, nafsu makan menurun
438
87,6%
Sakit kepala, pusing, sakit perut, muntah
437
87,4%
Sakit kepala, pusing, sakit perut, batuk
437
87,4%
Sakit kepala, pusing, sakit perut, nafsu makan menurun
437
87,4%
Sakit kepala, pusing, muntah, batuk
438
87,6%
Sakit kepala, pusing, muntah, nafsu makan menurun
438
87,6%
Sakit kepala, pusing, batuk, nafsu makan menurun
438
87,6%
Sakit kepala, sakit perut, muntah, batuk
442
88,4%
Sakit kepala, sakit perut, batuk, nafsu makan menurun
442
88,4%
Sakit kepala, muntah, batuk, nafsu makan menurun
443
88,6%
Pusing, sakit perut, muntah, batuk
437
87,4%
Pusing, sakit perut, muntah, nafsu makan menurun
437
87,4%
Pusing, sakit perut, batuk, nafsu makan menurun
437
87,4%
Pusing, muntah, batuk, nafsu makan menurun
438
87,6%
Sakit perut, muntah, batuk, nafsu makan menurun
437
87,4%
Karena kombinasi 4 itemset tidak ada yang memenuhi minimal support, maka 3
kombinasi yang memenuhi untuk pembentukan asosiasi.
3.6.2. Pembentukan Aturan Asosiasi
Setelah semua pola frekuensi tinggi ditemukan, kemudian dicari aturan asosiasi
yang memenuhi syarat minimum untuk confidence dengan menghitung confidence
aturan asosiatif A C.
Nilai confidence dari aturan A C diperoleh dengan rumus :
=
�
�
�
�
�
�
�
�
�
,
�
X 100%
Universitas Sumatera Utara
37
Dari kombinasi 2 itemset yang telah ditemukan dapat dilihat besarnya nilai support
dan confidence dari calon aturan asosiasi seperti tampak pada tabel berikut:
Tabel 3.17. Aturan Asosiasi
Confidence
Aturan
Jika sakit perut dan batuk, maka nafsu
458/484
94,6%
makan menurun
3.6.3. Pembentukan Aturan Asosiasi Final
Aturan asosiasi final berdasarkan minimal support dan confidence yang telah
ditentukan dapat dilihat pada tabel berikut ini :
Tabel 3.18. Aturan Asosiasi Final
Aturan Assosiasi
Jika sakit perut dan batuk, maka nafsu
Support
Confidence
91,6%
94,6%
makan menurun
Pada aturan tabel 3.18 dapat dijelaskan bahwa Jika sakit perut dan batuk, maka
nafsu makan menurun adalah gejala demam tifoid dengan nilai support 91,6% dan
confidence 94,6%.
Universitas Sumatera Utara
BAB 4
HASIL DAN PEMBAHASAN
4.1. Pendahuluan
Pengujian yang dilakukan peneliti menggunakan data berjumlah 500. Penerapan
metode rough set dan algoritma apriori bertujuan untuk mendapatkan akurasi terbaik
dari kinerja kedua metode tersebut dalam identifikasi pola penyakit demam tifoid
dengan membentuk item-item yang saling berhubungan dalam bentuk rule. Adapun
pengujian yang dilakukan menggunakan software rosetta versi 1.4.41 untuk pengujian
metode rough set, software weka versi 3.6.9 untuk pengujian algoritma apriori.
Spesifikasi hardware yang digunakan sebagai berikut:
1. Prosesor Core i5 2,49 GHz
2. RAM 3 GB
3. Operating System Windows 7 Ultimate
4.2. Pra Pengolahan Data
Proses pengujian dilakukan untuk mendapatkan rule dari demam tifoid menggunkan
metode rough set dan mendapatkan akurasi dari rule tersebut. Proses pengujian ini
dilakukan menggunakan alat bantu perangkat lunak Rosetta. Dalam menggunakan
sofware Rosetta data dalam bentuk Decision System disimpan ke dalam Software
Microsof Excel seperti gambar 4.1:
Universitas Sumatera Utara
39
Gambar 4.1. Data Dalam Bentuk Excel
4.3. Hasil Implementasi Menggunakan Metode Rough Set
Untuk menguji kebenaran dari hasil pengolahan data yang dikerjakan secara manual
pada bab sebelumnya, dapat digunakan salah satu software aplikasi Rough Set, yaitu
Rosetta. Tampilan hasil import data excel ke dalam software rosetta dapat dilihat
seperti pada gambar 4.2
Gambar 4.2. Tampilan Hasil Import Data Rosetta
Universitas Sumatera Utara
40
4.3.1. Reduct
Reduct adalah penyeleksian atribut minimal (interesting attribute) dari sekumpulan
atribut kondisi dengan menggunakan Prime Implicant fungsi Boolean. Tampilan hasil
reduct pada Rosetta dapat dilihat seperti pada Gambar 4.3.
Gambar 4.3. Hasil Reduct
Dari hasil pencarian Software Rosetta dihasilkan delapan Reduct yang merupakan
dasar dalam pembuatan Rule-rule. Reduct ini adalah hasil atribut minimal dari atribut
kondisi yang sebelumnya telah disederhanakan menggunakan prime implicant fungsi
boolean. Delapan reduct ini akan dicari rulenya disesuaikan data yang diimportkan
awalnya. Support merupakan banyaknya kondisi reduct yang sesuai dengan data yang
awalnya dimasukkan sedangkan length adalah panjang Reduct.
4.3.2. Generating Rules
Generating Rules adalah suatu metode rough set untuk menghasilkan rules/
knowledge berdasarkan equivalence class dan reduct. Tampilan Generating rules
dapat dilihat seperti pada gambar 4.4.
Universitas Sumatera Utara
41
Gambar 4.4. Hasil Generating Rules
Hasil pengolahan data yang dilakukan dengan menggunakan Software Rosetta
menghasilkan rule sebanyak 57 rule. Dari rule yang dihasilkan, maka dipilih 8 rule
terbaik yang memberikan hasil akurasi prediksi yang sebesar 87,4%, dapat dilihat
pada tabel berikut:
Tabel 4.1. Akurasi Rule Rough Set
No
1
2
3
4
5
6
7
Rule
Accuracy
Jika Demam(ya) AND Sakit Kepala(ya) AND Pusing(ya)
AND Sakit Perut(ya) => Diagnosa(positif)
Jika Demam(ya) AND Pusing(ya) AND Sakit Perut(ya)
AND Muntah(ya) => Diagnosa(positif)
Jika Demam(ya) AND Sakit Kepala(ya) AND Sakit
Perut(ya) AND Nafsu Makan Menurun(ya) =>
Diagnosa(positif)
Jika Demam(ya) AND Sakit Perut(ya) AND Muntah(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
Jika Demam(ya) AND Sakit Perut(ya) AND Batuk(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
Jika Pusing (ya) AND Sakit Perut(ya) AND Batuk(ya) =>
Diagnosa(positif)
Jika Sakit Kepala(ya) AND Pusing(ya) AND Sakit
Perut(ya) AND Nafsu Makan Menurun(ya) =>
diagnosa(positif)
87,4%
87,4%
87,4%
87,4%
87,4%
87,4%
87,4%
Universitas Sumatera Utara
42
Tabel 4.1. Akurasi Rule Roughset
(Lanjutan)
Rule
No
8
Accuracy
Jika Pusing(ya) AND Sakit Perut(ya) AND Muntah(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
87,4%
87,4%
Rata-rata
Dari tabel 4.1 dengan menggunakan 500 data dapat dijelaskan, sebagai berikut:
Delapan rule yang telah dihasilkan masing-masing memiliki akurasi 87,4%, yang
didapat dari jumlah data yang diprediksi benar (diagnosa positif) = 437, dibagi jumlah
data yang di uji = 500.
4.4. Analisa Penerapan Algoritma Apriori
Pembuatan kandidat kombinasi item yang mungkin berdasar pada aturan tertentu lalu
diuji apakah kombinasi item tersebut memenuhi syarat support minimum. Kombinasi
item yang memenuhi syarat tersebut disebut frequent itemset, yang nantinya dipakai
untuk membuat aturan aturan yang memenuhi syarat minimum confidence. Pada
pengujian ini peneliti menggunakan software weka versi 3.6.9, sebelum diolah proses
import dilakukan itemset dibentuk dalam format *.csv tanpa attribut keputusan, seperti
pada gambar berikut:
Gambar 4.5. Data Dalam Bentuk Excel
Universitas Sumatera Utara
43
Gambar 4.6. Hasil Rules Apriori
Dari hasil pembentukan rule pada gambar 4.5 dapat ditarik keputusan sebagai berikut:
1. Jika pasien mengalami gejala Batuk (ya) maka kemungkinan nafsu makan
pasien menurun (ya) mempunyai nilai confidence sebesar (1) yang artinya
gejala batuk dan nafsu makan menurun adalah gejala pertama yang paling
sering diderita oleh pasien penderita demam tifoid.
2. Jika pasien mengalami gejala Sakit Perut (ya), maka kemungkinan nafsu
makan pasien menurun (ya) mempunyai nilai confidence sebesar (1) yang
artinya gejala sakit perut dan nafsu makan menurun adalah gejala gejala kedua
yang paling sering diderita oleh pasien penderita demam tifoid.
3. Jika pasien mengalami gejala batuk (ya), maka kemungkinan pasien
mengalami sakit perut mempunyai nilai confidence sebesar (1) yang artinya
gejala batuk dan sakit perut adalah gejala ketiga yang paling sering diderita
oleh pasien penderita demam tifoid.
4. Jika pasien mengalami gejala batuk (ya) dan nafsu makan menurun (ya), maka
kemungkinan pasien mengalami sakit perut (ya) mempunyai nilai confidence
sebesar (1) yang artinya gejala batuk, nafsu makan menurun dan sakit perut
Universitas Sumatera Utara
44
adalah gejala keempat yang paling sering diderita oleh pasien penderita
demam tifoid.
5. Jika pasien mengalami gejala muntah (ya), maka kemungkinan pasien
mengalami demam mempunyai nilai confidence sebesar (0,99) yang artinya
gejala muntah dan demam adalah gejala kelima yang paling sering diderita
oleh pasien penderita demam tifoid.
Tabel 4.2. Akurasi Rule Apriori
Rule
Support
Confidence
Accuracy
Jika Gejala Batuk (ya) dan
Nafsu Makan (ya), maka
diagnosa positif
90%
100%
87,4%
Jika Sakit Perut (ya) dan Nafsu
Makan Menurun (ya), maka
diagnosa positif
Jika Batuk (ya) dan Sakit Perut
(ya), maka diagnosa positif
90%
100%
87,4%
90%
100%
87,4%
Jika Batuk (ya) dan Sakit Perut
(ya) dan Nafsu Makan
Menurun (ya), maka diagnosa
positif
Jika Muntah (ya) dan Demam
(ya), maka diagnosa positif
90 %
99%
87,4%
90%
99%
87,4%
Rata-rata
87,4%
Dari tabel 4.2 dengan menggunakan 500 data dapat dijelaskan, sebagai berikut: Lima
rule yang telah dihasilkan masing-masing memiliki akurasi 87,4%, yang didapat dari
jumlah data yang diprediksi benar (diagnosa positif) = 437, dibagi jumlah data yang di
uji = 500.
Universitas Sumatera Utara
BAB 5
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Berdasarkan analisa kinerja metode rough set dan algoritma apriori pada kasus
penyakit demam tifoid di RS Grand Medistra Lubuk Pakam menggunakan 500
dataset, maka dapat diambil kesimpulan sebagai berikut:
1. Hasil akurasi kinerja metode rough set dalam identifikasi penyakit demam
tifoid sebesar 87,4%, sedangkan untuk kinerja algoritma apriori hasil akurasi
yang didapat sebesar 87,4%.
2. Aturan prediksi yang dihasilkan oleh metode rough set terdiri dari 4 gejala
sedangkan aturan yang dihasilkan algoritma apriori terdiri dari 3 gejala.
5.2. Saran
Saran peneliti untuk kelanjutan penelitian ini adalah:
1. Pada penelitian ini tingkat akurasi yang dihasilkan dinilai cukup baik,
penelitian ini masih dapat dikembangkan menggunakan metode lain untuk
mendapatkan nilai akurasi yang lebih baik, dengan menambah attribut gejala
penyakit demam tifoid.
2. Penelitian ini masih membuka peluang untuk membandingkan metode rough
set dengan metode prediksi lainnya menggunakan tren data tertentu pada kasus
yang berbeda.
Universitas Sumatera Utara
METODOLOGI PENELITIAN
3.1. Diagram Blok Penelitian
Adapun diagram blok penelitian secara keseluruhan dapat dilihat pada gambar 3.1.
Data Collection
Pre Prosessing
Data Cleaning
Data Tranformation
Proses
Analisis Data
Metode Rough Set
Algoritma Apriori
Akurasi
Identifikasi Pola
Penyakit Tifoid
Gambar 3.1. Diagram Blok Penelitian
Universitas Sumatera Utara
21
3.2. Data Collection
Berdasarkan hasil pengamatan kasus Tifoid adalah kasus terbanyak rawat inap di RS
Grand Medistra Lubuk Pakam. Jumlah kasus Demam Tifoid pada pasien BPJS RS
Grand Medistra Lubuk Pakam bulan Januari sampai April tahun 2014 adalah
berjumlah 500 kasus. Data ini diambil dari indeks penyakit kasus Demam Tifoid
Januari 2012 sampai Desember tahun 2014. Terdapat 5 atribut yang harus diisi yang
ada pada rekam medis yaitu :
Nama
:
Umur
:
Jenis kelamin
:
Pekerjaan
:
Keluhan
:
Tabel 3.1. Data Primer
No
Nama
Umur
JK
Pekerjaan
Keluhan Pasien
1
A
47
L
Wiraswasta
demam, sakit kepala, pusing, …..
2
S
20
L
Mahasiswa
demam, sakit kepala, pusing, …..
3
P
20
L
Mahasiswa
demam, muntah, badan lemas, …..
4
A
21
L
Mahasiswa
sakit kepala, sakit perut, muntah, …..
5
D
23
P
PNS
demam, pusing, sakit perut, …..
.
.
.
.
.
.
.
.
.
.
.
.
500
….
….
….
….
….
503
KR
34
L
sakit perut, diare, nafsu makan
3.3. Tabulasi Data Penelitian
Berdasarkan hasil pengumpulan data menggunakan instrumen pada tabel 3.1. Data
Primer dilakukan proses tabulasi data hasil pengumpulan data seperti pada tabel 3.2
berikut:
Tabel 3.2. Hasil Tabulasi Data Penelitian
Attribut Data
No
Hasil Diagnosa
Umur
JK
DM
SK
PS
SP
MUN
BTK
NMM
1
47
L
Y
Y
Y
Y
Y
Y
Y
Positif
2
20
L
Y
Y
Y
Y
Y
Y
Y
Positif
Universitas Sumatera Utara
22
Tabel 3.2. Hasil Tabulasi Data Penelitian
(Lanjutan)
Attribut Data
No
Hasil Diagnosa
Umur
JK
DM
SK
PS
SP
MUN
BTK
NMM
3
20
L
0
Y
0
0
0
Y
0
Negatif
4
21
L
Y
0
Y
0
Y
Y
Y
Positif
5
23
P
Y
Y
0
Y
Y
0
0
Positif
…
…
…
…
…
…
…
…
…
…
…
500
32
L
Y
Y
Y
Y
Y
Y
Y
Positif
3.4. Pre Prosessing
3.4.1. Data Cleaning
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga dilakukan proses encrichment, yaitu proses “memperkaya” data yang sudah ada
dengan data atau infomasi lain yang relevan dan diperlukan untuk KDD, seperti data
atau informasi eksternal, proses cleaning ini dilakukan secara manual, seperti terlihat
pada gambar berikut:
Gambar 3.2. Data Awal
Pada gambar 3.2 diatas terdapat duplikasi data dan missing value yang dianggap
sebagai noise, dalam penelitian ini atribut yang digunakan untuk pengolahan data
selanjutnya yaitu umur, jenis kelamin dan keluhan pasien. berikut gambar hasil proses
dari cleaning data.
Universitas Sumatera Utara
23
Gambar 3.3. Hasil Cleaning Data
3.4.2. Data Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan
proses kreatif dan sangat tegantung pada jenis atau pola informasi yang akan dicari
dalam basis data.
Tabel. 3.3. Tabel Data Transformation
Atribut
Nilai
Umur
2 – 50
Jenis Kelamin
0 = Laki-Laki, 1 = Perempuan
Demam
0 = Tidak, 1 = Ya
Sakit kepala
0 = Tidak, 1 = Ya
Pusing
0 = Tidak, 1 = Ya
Sakit perut
0 = Tidak, 1 = Ya
Muntah
0 = Tidak, 1 = Ya
Batuk
0 = Tidak, 1 = Ya
Nafsu makan menurun
0 = Tidak, 1 = Ya
Diagnosa
1 = Positif, 2 = Negatif
Universitas Sumatera Utara
24
Berikut contoh gambar setelah dilakukan data transformasi
Gambar 3.4. Hasil Tranformasi Data
3.5. Analisa Metode Rough Set
Dengan merancang sistem keputusan ini maka dihasilkan suatu Rules/Knowledge
untuk pengambilan keputusan, yaitu dengan melakukan proses :
1. Merepresentasikan data atau objek dengan membentuk tabel Information
System (IS) dan Decision System (DS)
2. Indicernibility Relation, menghubungankan antar atribut yang tidak dapat
dipisahkan.
3. Equivalen Class, mengelompokkan objek-objek yang memiliki atribut kondisi
yang sama.
4. Discernibility Matrix / discernibility matrix modulo, sekumpulan atribut yang
berbeda antara objek.
5. Reduction, penyelesaian atribut minimal dari sekumpulan atribut kondisi
dengan menggunakan prime implicant fungsi boolean.
6. Generating Rules, membangkitkan aturan-aturan (rules) dari pengetahuan yang
didapat dalam proses ekstrak data.
3.5.1. Representasi Data
Terdapat dua bentuk representasi data yaitu Information System (IS) dan Decision
System (DS). Sebuah Information System (IS) terdiri dari : IS = {U, A}, dimana U =
{e1, e2, …, en} dan A = {a1, a2, …, an} yang merupakan sekumpulan example dan
attribute kondisi secara berurutan. Information System yang ditampilkan pada
penelitian ini terlihat pada tabel berikut:
Universitas Sumatera Utara
25
Tabel 3.4. Information System
Nama
Umur
Jenis
Demam
Sakit
Kelamin
Pusing
Sakit
kepala
Muntah
Batuk
perut
nafsu
makan
menurun
P1
47
0
1
1
1
1
1
1
1
P2
20
0
1
1
1
1
1
1
1
P3
20
0
1
0
0
0
1
0
0
P4
21
1
0
1
0
1
1
1
1
P5
23
1
1
0
1
1
0
0
1
P6
23
1
1
0
0
1
0
0
0
P7
18
0
1
0
0
0
1
0
0
P8
20
0
1
0
0
0
0
0
0
P9
27
1
1
1
1
1
1
1
1
P10
31
1
1
0
0
1
0
0
0
…..
…..
…..
…..
…..
…..
…..
…..
…..
…..
500
32
1
1
1
1
1
1
1
1
Tabel 3.4 memperlihatkan sebuah information system dimana tiap-tiap baris
mempresentasikan objek (pasien) sedangkan tiap-tiap kolom mempresentasikan
atribut kondisi (gejala).
Dalam sebuah Information System (IS) juga dipresentasikan dengan sebuah
Decision Attribute (atribut keputusan), C = {C1, C2, …, Cn. sehingga information
system menjadi IS = (U, {A,C}). Pada tabel 3.4 dapat dilihat sebuah information
system yang di dalamnya terdapat objek (U), atribut kondisi (A) dan Atribut keputusan
(C).
Tabel 3.5. Decision System (DS)
Nama
Umur
Pasien
Jenis
Demam
Kelamin
Sakit
Pusing
kepala
Sakit
Muntah
Batuk
perut
nafsu
Keputusan
makan
menurun
P1
47
0
1
1
1
1
1
1
1
Positif
P2
20
0
1
1
1
1
1
1
1
Positif
P3
20
0
1
0
0
0
1
0
0
Negatif
P4
21
1
0
1
0
1
1
1
1
Negatif
P5
23
1
1
0
1
1
0
0
1
Negatif
P6
23
1
1
0
0
1
0
0
0
Positif
Universitas Sumatera Utara
26
Tabel 3.5. Decision System (DS)
(Lanjutan)
Nama
Umur
Pasien
Jenis
Demam
Kelamin
Sakit
Pusing
kepala
Sakit
Muntah
Batuk
perut
nafsu
Keputusan
makan
menurun
P7
18
0
1
0
0
0
1
0
0
Negatif
P8
20
0
1
0
0
0
0
0
0
Positif
P9
27
1
1
1
1
1
1
1
1
Positif
P10
31
1
1
0
0
1
0
0
0
Positif
…..
…..
…..
…..
…..
…..
…..
…..
…..
…..
…..
P500
32
1
1
1
1
1
1
1
1
Positif
Tabel 3.5 memperlihatkan sebuah Decision System (DS) yang terdiri dari P1, P2, P3,
P4, P5, P6, P7, P8, P9, P10 …., n. Delapan atribut kondisi yaitu demam, sakit kepala,
pusing, sakit perut, muntah, batuk dan nafsu makan menurun, serta 1 atribut
keputusan. Jika seluruh seluruh variabel gejala Ya maka keputusan = Positif
(Adeyemo, et al. 2015)
3.5.2. Indicernibility Relation
Dalam decision system, sebuah objek dapat memiliki nilai yang sama untuk sebuah
atribut kondisionalnya, hubungan tersebut disebut dengan indiscernibility (tidak dapat
dipisahkan.
Berdasarkan tabel 3.5 maka didapatkan
Indicernibility Relation sebagai
berikut:
IND (Demam)
= {P1, P2, P3, P5, P6, P7, P8, P9, P10, …..}
IND (Sakit Kepala)
= {P1, P2, P4, P9, …..}
IND (Pusing)
= {P1, P2, P5, P9, …..}
IND (Sakit Perut)
= {P1, P2, P4, P5, P6, P9, P10, …..}
IND (Muntah)
= {P1, P2, P3, P4, P7, P9, …..}
IND (Batuk)
= {P1, P2, P4, P9, …..)
IND (Nafsu Makan Menurun = {P1, P2, P4, P5, P9, …..}
Kelas-kelas yang telah dikelompokkan disebut dengan equivalence class.
Universitas Sumatera Utara
27
3.5.3. Equivalence Class
Mengelompokkan objek-objek yang mempunyai nilai atribut yang sama menjadi satu
bagian. Variabel Gejala terdiri dari 7 atribut, yaitu: demam (A), sakit kepala (B),
pusing (C), sakit perut (D), muntah (E), batuk (F), nafsu makan menurun (G).
Ya
=1
Tidak = 0
Variabel Keputusan (H) terdiri dari :
Positif
=1
Negatif
=2
Kemudian masing-masing objek dikelompokkan dalam bentuk Equivalence Class
disederhanakan berdasarkan atribut kondisi dan keputusan menjadi EC1, EC2, EC3,
EC4, EC5, EC6, EC7 dan EC8 sehingga hasilnya dapat dilihat seperti pada tabel 3.5
berikut:
Tabel 3.6. Equivalence Class
Equivalence
Demam
Sakit
Pusing
Sakit
Muntah
Batuk
nafsu
Keputusan
(A)
kepala
(C)
perut
(E)
(F)
makan
(H)
Class
(B)
(D)
menurun
Number
Object
(G)
EC1
Ya
Ya
Ya
Ya
ya
ya
Ya
Positif
437
EC2
Ya
EC3
Tidak
Ya
Ya
Tidak
ya
ya
Ya
Negatif
1
Ya
Tidak
Ya
ya
ya
Ya
Negatif
5
EC4
Ya
Tidak
Ya
Ya
tidak
tidak
Ya
Negatif
5
EC5
Tidak
Tidak
Tidak
Ya
tidak
ya
Ya
Negatif
16
EC6
Ya
Tidak
Tidak
Ya
tidak
tidak
Tidak
Positif
21
EC7
Ya
Tidak
Tidak
Tidak
ya
tidak
Tidak
Negatif
12
EC8
Ya
Tidak
Tidak
Tidak
tidak
tidak
Tidak
Negatif
2
3.5.4. Discernibility Matrix
Dalam Discernibility Matrix maka variabel-variabel kondisi yang terdiri dari umur,
jenis kelamin, demam, sakit kepala, pusing, sakit perut, muntah, batuk, nafsu makan
menurun. Dalam proses perbandingan ini yang diperhatikan hanya atribut kondisinya
saja, jika nilai atribut kondisinya sama maka tidak menghasilkan nilai dan jika
terdapat kondisi atribut yang berbeda maka akan menghasilkan nilai.
Dari proses perbandingan ini dihasilkan tabel Discernibility Matrix seperti tabel 3.7
Universitas Sumatera Utara
28
Tabel 3.7. Discernibility Matrix
EC1
EC2
EC3
EC4
EC5
EC6
EC7
EC8
EC1
-
D
AC
AEF
ABCE
BCEFG
BCDFG
BCDEFG
EC2
D
-
ACD
BDEF
ABCDE
BCDEFG
BCFG
BCEFG
EC3
AC
ACD
-
ABCEF
BE
ABEFG
ABDFG
ABDEFG
EC4
AEF
BDEF
ABCEF
-
ACF
CG
CDEG
CDG
EC5
ABCE
ABCDE
BE
ACF
-
AF
ADEFG
ADFG
EC6
BCEFG
BCDEFG
ABEFG
CG
AF
-
DE
D
EC7
BCDFG
BCFG
ABDFG
CDG
ADFG
D
-
E
BCEFG
ABDEFG
CDG
ADFG
D
E
-
EC8
BCDEF
G
3.5.5. Discernibility Matrix Modulo D
Dari hasil pengolahan data dengan cara Discernibility Matrix sesuai tabel 3.6 maka
selanjutnya data diolah dengan cara Discernibility Matrix Modulo D, pengolahan
dengan cara ini variabel kondisi dan keputusannya harus dibandingkan. Sehingga jika
variabel keputusan juga dibandingkan maka hasilnya menjadi seperti pada tabel 3.8
Tabel 3.8. Discernibility Matrix Module D
EC1
EC2
EC3
EC4
EC5
EC6
EC7
EC8
EC1
-
D
AC
AEF
ABCE
-
BCDFG
BCDEFG
EC2
D
-
-
-
-
BCDEFG
-
-
EC3
AC
-
-
-
-
ABEFG
-
-
EC4
AEF
-
-
-
-
CG
-
-
EC5
ABCE
-
-
-
-
AF
-
-
EC6
-
BCDEFG
ABEFG
CG
AF
-
DE
D
EC7
BCDFG
-
-
-
-
D
-
-
-
-
-
-
D
-
-
EC8
BCDEF
G
Keterangan : Jika nilai decision Atribut sama
= kosong
decision Atribut berbeda = terisi
Universitas Sumatera Utara
29
3.5.6. Reduct
Teknik yang dapat diterapkan untuk mendapatkan representasi data set yang lebih
kecil dengan Reduct, namun tetap mempertahankan integritas data asli, artinya
pertambangan data set berkurang harus lebih efisien atau sama dengan hasil analisis.
Proses reduct yang dilakukan berdasarkan tabel 3.8. Dicernibility Matrix Mod D
dengan penyeleksian variabel minimal dari sekumpulan variabel kondisi dengan cara
Prime Implicant fungsi Boolean, sebagai berikut:
A+1=1+A=1
AA=A
Tabel 3.9. Reduct
Class
CNF of Boolean Function
Prime Implicant
Reducts
EC1
D ^ (AvC) ^ (AvEvF) ^ (AvBvCvE)
B^D^F
{B}, {D}, {F}
^ (BvCvDvFvG) ^ (BvCvDvEvFvG)
EC2
D ^ (BvCvDvEvFvG)
B^D^G
{B}, {D}, {G}
EC3
(AvC) ^ (AvBvEvFvG)
A^ B ^ C ^ E ^
{A}, {B}, {C},
G
{E}, {G}
EC4
(AvEvF) ^ (CvG)
C^F^G
{C}, {F}, {G}
EC5
(AvBvCvE) ^ (AvF)
A^B
{A}, {B}
EC6
(BvCvDvEvFvG) ^ (AvBvEvFvG) ^
A^B^E^F^
{A}, {B}, {E},
(CvG) ^ (AvF)
G
{F}, {G}
EC7
(BvCvDvFvG) ^ (D)
D
{D}
EC8
(BvCvDvEvFvG) ^ (D)
B^D^G
{B}, {D}, {G}
3.5.7. Generating Rules
Setelah mendapatkan reduce, maka dapat ditarik kesimpulan atau ditentukan rule
dengan menyesuaikan reduce setiap equivalen class terhadap tabel 3.6 (Equivalen
Class). Berdasarkan data hasil reduct yang telah didapatkan, maka data-data tersebut
akan diolah sehingga menghasilkan suatu rules / knowledge yang dapat dipahami
untuk pengambilan suatu keputusan. Berikut akan ditarik kesimpulan untuk semua
kelas :
A. Class EC1 menghasilkan reduct {B}, {D}, {F} Rulenya adalah:
Universitas Sumatera Utara
30
Jika sakit kepala = ya dan sakit perut = ya dan batuk = ya, maka diagnosa =
positif.
B. Class EC2 menghasilkan reduct {B}, {D}, {G}, Rulenya adalah:
Jika sakit kepala = ya dan sakit perut = tidak dan nafsu makan menurun =
ya, maka diagnosa = negatif.
C. Class EC3 menghasilkan reduct {A}, {B}, {C}, {E}, {G} Rulenya adalah:
Jika demam = tidak dan sakit kepala = ya dan pusing = tidak dan nafsu
makan menurun = ya, maka diagnosa = negatif.
D. Class EC4 menghasilkan reduct {C}, {F}, {G}, Rulenya adalah:
Jika pusing = ya dan batuk = tidak dan nafsu makan menurun = ya, maka
diagnosa = negatif
E. Class EC5 menghasilkan reduct {A}, {B}, Rulenya adalah:
Jika demam = tidak dan sakit kepala = tidak, maka diagnosa = negatif.
F. Class EC6 menghasilkan reduct {A}, {B}, {E}, {F}, {G}, Rulenya adalah:
Jika demam = ya dan sakit kepala = tidak dan muntah = tidak dan batuk =
tidak dan nafsu makan menurun = tidak, maka diagnosa = positif
G. Class EC7 menghasilkan reduct {D}, Rulenya adalah:
Jika sakit perut = tidak, maka diagnosa = negatif.
H. Class EC8 menghasilkan reduct {B}, {D}, {G}, Rulenya adalah:
Jika sakit kepala = tidak dan sakit perut = tidak dan nafsu makan menurun =
tidak, maka diagnosa = negatif
3.6. Analisa Penerapan Algoritma Apriori
Algoritma apriori adalah algoritma paling terkenal untuk menemukan pola frekuensi
tinggi. Pola frekuensi tinggi adalah pola-pola item di dalam suatu database yang
memiliki frekuensi atau support di atas ambang batas tertentu yang disebut dengan
istilah minimum support. Algoritma apriori dibagi menjadi beberapa tahap yang
disebut iterasi atau pass yaitu:
1. Pembentukan kandidat itemset , kandidat kitemset dibentuk dari kombinasi (k1) itemset yang didapat dari iterasi sebelumnya. Satu cara dari algoritma
apriori adalah adanya pemangkasan kandidat k-itemset yang subsetnya yang
berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.
Universitas Sumatera Utara
31
2. Penghitungan support dari tiap kandidat kitemset. Support dari tiap kandidat kitemset didapat dengan menscan database untuk menghitung jumlah transaksi
yang memuat semua item di dalam kandidat k-itemset tersebut. Ini adalah juga
ciri dari algoritma apriori dimana diperlukan penghitungan dengan scan
seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau
k-itemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dari
minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan.
Bila tidak, maka k ditambah satu dan kemabali ke bagian 1.
3.6.1. Pola Gejala Penyakit Demam Tifoid
Berdasarkan pola gejala penyakit demam tifoid yang diperoleh dari beberapa
sampel data pada tabel 3.10 berikut:
Tabel 3.10. Pola Gejala Penyakit Demam Tifoid
Itemset
Pasien
P1
Diagnosa
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
P2
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
P3
demam, muntah, badan lemas, keringat malam hari
Negatif
P4
sakit kepala, sakit perut, muntah, batuk, nafsu makan
Negatif
menurun
P5
demam, pusing, sakit perut, nafsu makan menurun
Negatif
P6
demam, sakit perut, badan pegal-pegal, keringat malam hari
Positif
P7
demam, sakit perut, badan lemas
Negatif
P8
demam, keringat malam hari, badan lemas
Positif
P9
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
P10
demam, sakit perut
Positif
…..
…..
…..
Universitas Sumatera Utara
32
P500
demam, sakit kepala, pusing, sakit perut, muntah, batuk,
Positif
nafsu makan menurun
A. Pembentukan Itemset
Berikut ini penyelesaian berdasarkan data yang sudah disediakan pada tabel 3.10,
proses pembentukan Combinasi (C1) atau disebut 1 itemset dengan jumlah
minimum support = 90%, dengan rumus sebagai berikut:
=
�
�
�
�
�
�
� �
�
X 100%
Tabel 3.11. Support dari Tiap Item
Itemset
Count
Support
Demam
479
95.8%
Sakit kepala
443
88.6%
Pusing
443
88.6%
Sakit perut
484
96.8%
Muntah
455
91.0%
Batuk
458
91.6%
Nafsu makan menurun
463
92.6%
B. Kombinasi 2 Itemset
Proses pembentukan C2 atau disebut dengan 2 itemset dengan jumlah minimum
support = 90%, dapat diselesaikan dengan rumus sebagai berikut:
,
=
�
�
�
�
�
�
�
�
�
�
X 100%
Tabel 3.12. Pola Kombinasi 2 Itemset
Itemset
Count
Support
Demam, sakit kepala
438
87,6%
Demam, pusing
443
88,6%
Demam, sakit perut
464
92,8%
Demam, muntah
451
90,2%
Universitas Sumatera Utara
33
Demam, batuk
438
87,6%
Demam, nafsu makan menurun
443
88,6%
Sakit kepala, pusing
438
87,6%
Sakit kepala, sakit perut
443
88,6%
Sakit kepala, muntah
443
88,6%
Sakit kepala, batuk
443
88,6%
Sakit kepala, nafsu makan menurun
443
88,6%
Pusing, sakit perut
442
88,4%
Pusing, muntah
438
87,6%
Pusing, batuk
438
87,6%
Pusing, nafsu makan menurun
443
88,6%
Sakit perut, muntah
443
88,6%
Sakit perut, batuk
458
91,6%
Sakit perut, nafsu makan menurun
463
92,6%
Muntah, batuk
443
88,6%
Muntah, nafsu makan menurun
443
88,6%
Batuk, nafsu makan menurun
459
91,8%
Minimal support yang ditentukan adalah 90%, jadi kombinasi 2 itemset yang tidak
memenuhi minimal support akan dihilangkan, terlihat seperti tabel berikut ini :
Tabel 3.13. Tabel Kombinasi 2 Itemset memenuhi minimal Support
Itemset
Count
Support
Demam, sakit perut
464
92,8%
Demam, muntah
451
90,2%
Sakit Perut, batuk
458
91,6%
Sakit perut, nafsu makan menurun
463
92,6%
Batuk, nafsu makan menurun
459
91,8%
C. Kombinasi 3 Itemset
Proses pembentukan C 3 atau disebut dengan 3 itemset dengan jumlah minimum
support = 90%, dapat diselesaikan dengan rumus berikut:
Universitas Sumatera Utara
34
,
�
=
�
�
�
�
�
�
�
� �
,
�
X 100%
Tabel 3.14. Pola Kombinasi 3 Itemset
Itemset
Count
Support
Demam, sakit kepala, pusing
438
87,6%
Demam, sakit kepala, sakit perut
437
87,4%
Demam, sakit kepala, muntah
438
87,6%
Demam, sakit kepala, batuk
438
87,6%
Demam, sakit kepala, nafsu makan menurun
438
87,6%
Demam, pusing, sakit perut
442
88,4%
Demam, pusing, muntah
438
87,6%
Demam, pusing, batuk
438
87,6%
Demam, pusing, nafsu makan menurun
443
88,6%
Demam, sakit perut, muntah
437
87,4%
Demam, sakit perut, batuk
437
87,4%
Demam, sakit perut, nafsu makan menurun
442
88,4%
Demam, muntah, batuk
438
87,6%
Demam, muntah, nafsu makan menurun
438
87,6%
Demam, batuk, nafsu makan menurun
438
87,6%
Sakit kepala, pusing, sakit perut
437
87,4%
Sakit kepala, pusing, muntah
438
87,6%
Sakit kepala, pusing, batuk
438
87,6%
Sakit kepala, pusing, nafsu makan menurun
438
87,6%
Sakit kepala, sakit perut, muntah
442
88,4%
Sakit kepala, sakit perut, batuk
442
88,4%
Sakit kepala, sakit perut, nafsu makan menurun
442
88,4%
Sakit kepala, muntah, batuk
443
88,6%
Sakit kepala, muntah, nafsu makan menurun
443
88,6%
Sakit kepala, batuk, nafsu makan menurun
443
88,6%
Pusing, sakit perut, muntah
437
87,4%
Pusing, sakit perut, batuk
437
87,4%
Pusing, sakit perut, nafsu makan menurun
442
88,4%
Pusing, muntah, batuk
438
87,6%
Universitas Sumatera Utara
35
Pusing, muntah, nafsu makan menurun
438
87,6%
Pusing, batuk, nafsu makan menurun
438
87,6%
Sakit perut, muntah, batuk
442
88,4%
Sakit perut, muntah, nafsu makan menurun
442
88,4%
Sakit perut, batuk, nafsu makan menurun
458
91,6%
Muntah, batuk, nafsu makan menurun
443
88,6%
Minimal support yang ditentukan adalah 90%, jadi kombinasi 3 itemset yang tidak
memenuhi minimal support akan dihilangkan, terlihat seperti tabel berikut ini :
Tabel 3.15. Tabel Kombinasi 3 Itemset memenuhi minimal Support
Itemset
Sakit perut, batuk, nafsu makan
Count
Support
458
91,6%
menurun
D. Kombinasi 4 Itemset
Proses pembentukan C4 atau disebut dengan 4 itemset dengan jumlah minimum
support = 50%, dapat diselesaikan dengan rumus berikut:
, ,
�
=
�
�
�
�
�
�
�
�
, ,
�
�
X 100%
Tabel 3.16. Pola Kombinasi 4 Itemset
Itemset
Count
Support
Demam, sakit kepala, pusing, sakit perut
437
87,4%
Demam, sakit kepala, pusing, muntah
438
87,6%
Demam, sakit kepala, pusing, batuk
438
87,6%
Demam, sakit kepala, pusing, nafsu makan menurun
438
87,6%
Demam, sakit kepala, sakit perut, muntah
437
87,4%
Demam, sakit kepala, sakit perut, batuk
437
87,4%
Demam, sakit kepala, sakit perut, nafsu makan menurun
437
87,4%
Demam, sakit kepala, muntah, batuk
438
87,6%
Demam, sakit kepala, batuk, nafsu makan menurun
438
87,6%
Demam, pusing, sakit perut, muntah
437
87,4%
Universitas Sumatera Utara
36
Demam, pusing, sakit perut, batuk
437
87,4%
Demam, pusing, sakit perut, nafsu makan menurun
442
88,4%
Demam, pusing, muntah, batuk
438
87,6%
Demam, pusing, muntah, nafsu makan menurun
438
87,6%
Demam, sakit perut, muntah, batuk
437
87,4%
Demam, sakit perut, batuk, nafsu makan menurun
437
87,4%
Demam, muntah, batuk, nafsu makan menurun
438
87,6%
Sakit kepala, pusing, sakit perut, muntah
437
87,4%
Sakit kepala, pusing, sakit perut, batuk
437
87,4%
Sakit kepala, pusing, sakit perut, nafsu makan menurun
437
87,4%
Sakit kepala, pusing, muntah, batuk
438
87,6%
Sakit kepala, pusing, muntah, nafsu makan menurun
438
87,6%
Sakit kepala, pusing, batuk, nafsu makan menurun
438
87,6%
Sakit kepala, sakit perut, muntah, batuk
442
88,4%
Sakit kepala, sakit perut, batuk, nafsu makan menurun
442
88,4%
Sakit kepala, muntah, batuk, nafsu makan menurun
443
88,6%
Pusing, sakit perut, muntah, batuk
437
87,4%
Pusing, sakit perut, muntah, nafsu makan menurun
437
87,4%
Pusing, sakit perut, batuk, nafsu makan menurun
437
87,4%
Pusing, muntah, batuk, nafsu makan menurun
438
87,6%
Sakit perut, muntah, batuk, nafsu makan menurun
437
87,4%
Karena kombinasi 4 itemset tidak ada yang memenuhi minimal support, maka 3
kombinasi yang memenuhi untuk pembentukan asosiasi.
3.6.2. Pembentukan Aturan Asosiasi
Setelah semua pola frekuensi tinggi ditemukan, kemudian dicari aturan asosiasi
yang memenuhi syarat minimum untuk confidence dengan menghitung confidence
aturan asosiatif A C.
Nilai confidence dari aturan A C diperoleh dengan rumus :
=
�
�
�
�
�
�
�
�
�
,
�
X 100%
Universitas Sumatera Utara
37
Dari kombinasi 2 itemset yang telah ditemukan dapat dilihat besarnya nilai support
dan confidence dari calon aturan asosiasi seperti tampak pada tabel berikut:
Tabel 3.17. Aturan Asosiasi
Confidence
Aturan
Jika sakit perut dan batuk, maka nafsu
458/484
94,6%
makan menurun
3.6.3. Pembentukan Aturan Asosiasi Final
Aturan asosiasi final berdasarkan minimal support dan confidence yang telah
ditentukan dapat dilihat pada tabel berikut ini :
Tabel 3.18. Aturan Asosiasi Final
Aturan Assosiasi
Jika sakit perut dan batuk, maka nafsu
Support
Confidence
91,6%
94,6%
makan menurun
Pada aturan tabel 3.18 dapat dijelaskan bahwa Jika sakit perut dan batuk, maka
nafsu makan menurun adalah gejala demam tifoid dengan nilai support 91,6% dan
confidence 94,6%.
Universitas Sumatera Utara
BAB 4
HASIL DAN PEMBAHASAN
4.1. Pendahuluan
Pengujian yang dilakukan peneliti menggunakan data berjumlah 500. Penerapan
metode rough set dan algoritma apriori bertujuan untuk mendapatkan akurasi terbaik
dari kinerja kedua metode tersebut dalam identifikasi pola penyakit demam tifoid
dengan membentuk item-item yang saling berhubungan dalam bentuk rule. Adapun
pengujian yang dilakukan menggunakan software rosetta versi 1.4.41 untuk pengujian
metode rough set, software weka versi 3.6.9 untuk pengujian algoritma apriori.
Spesifikasi hardware yang digunakan sebagai berikut:
1. Prosesor Core i5 2,49 GHz
2. RAM 3 GB
3. Operating System Windows 7 Ultimate
4.2. Pra Pengolahan Data
Proses pengujian dilakukan untuk mendapatkan rule dari demam tifoid menggunkan
metode rough set dan mendapatkan akurasi dari rule tersebut. Proses pengujian ini
dilakukan menggunakan alat bantu perangkat lunak Rosetta. Dalam menggunakan
sofware Rosetta data dalam bentuk Decision System disimpan ke dalam Software
Microsof Excel seperti gambar 4.1:
Universitas Sumatera Utara
39
Gambar 4.1. Data Dalam Bentuk Excel
4.3. Hasil Implementasi Menggunakan Metode Rough Set
Untuk menguji kebenaran dari hasil pengolahan data yang dikerjakan secara manual
pada bab sebelumnya, dapat digunakan salah satu software aplikasi Rough Set, yaitu
Rosetta. Tampilan hasil import data excel ke dalam software rosetta dapat dilihat
seperti pada gambar 4.2
Gambar 4.2. Tampilan Hasil Import Data Rosetta
Universitas Sumatera Utara
40
4.3.1. Reduct
Reduct adalah penyeleksian atribut minimal (interesting attribute) dari sekumpulan
atribut kondisi dengan menggunakan Prime Implicant fungsi Boolean. Tampilan hasil
reduct pada Rosetta dapat dilihat seperti pada Gambar 4.3.
Gambar 4.3. Hasil Reduct
Dari hasil pencarian Software Rosetta dihasilkan delapan Reduct yang merupakan
dasar dalam pembuatan Rule-rule. Reduct ini adalah hasil atribut minimal dari atribut
kondisi yang sebelumnya telah disederhanakan menggunakan prime implicant fungsi
boolean. Delapan reduct ini akan dicari rulenya disesuaikan data yang diimportkan
awalnya. Support merupakan banyaknya kondisi reduct yang sesuai dengan data yang
awalnya dimasukkan sedangkan length adalah panjang Reduct.
4.3.2. Generating Rules
Generating Rules adalah suatu metode rough set untuk menghasilkan rules/
knowledge berdasarkan equivalence class dan reduct. Tampilan Generating rules
dapat dilihat seperti pada gambar 4.4.
Universitas Sumatera Utara
41
Gambar 4.4. Hasil Generating Rules
Hasil pengolahan data yang dilakukan dengan menggunakan Software Rosetta
menghasilkan rule sebanyak 57 rule. Dari rule yang dihasilkan, maka dipilih 8 rule
terbaik yang memberikan hasil akurasi prediksi yang sebesar 87,4%, dapat dilihat
pada tabel berikut:
Tabel 4.1. Akurasi Rule Rough Set
No
1
2
3
4
5
6
7
Rule
Accuracy
Jika Demam(ya) AND Sakit Kepala(ya) AND Pusing(ya)
AND Sakit Perut(ya) => Diagnosa(positif)
Jika Demam(ya) AND Pusing(ya) AND Sakit Perut(ya)
AND Muntah(ya) => Diagnosa(positif)
Jika Demam(ya) AND Sakit Kepala(ya) AND Sakit
Perut(ya) AND Nafsu Makan Menurun(ya) =>
Diagnosa(positif)
Jika Demam(ya) AND Sakit Perut(ya) AND Muntah(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
Jika Demam(ya) AND Sakit Perut(ya) AND Batuk(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
Jika Pusing (ya) AND Sakit Perut(ya) AND Batuk(ya) =>
Diagnosa(positif)
Jika Sakit Kepala(ya) AND Pusing(ya) AND Sakit
Perut(ya) AND Nafsu Makan Menurun(ya) =>
diagnosa(positif)
87,4%
87,4%
87,4%
87,4%
87,4%
87,4%
87,4%
Universitas Sumatera Utara
42
Tabel 4.1. Akurasi Rule Roughset
(Lanjutan)
Rule
No
8
Accuracy
Jika Pusing(ya) AND Sakit Perut(ya) AND Muntah(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
87,4%
87,4%
Rata-rata
Dari tabel 4.1 dengan menggunakan 500 data dapat dijelaskan, sebagai berikut:
Delapan rule yang telah dihasilkan masing-masing memiliki akurasi 87,4%, yang
didapat dari jumlah data yang diprediksi benar (diagnosa positif) = 437, dibagi jumlah
data yang di uji = 500.
4.4. Analisa Penerapan Algoritma Apriori
Pembuatan kandidat kombinasi item yang mungkin berdasar pada aturan tertentu lalu
diuji apakah kombinasi item tersebut memenuhi syarat support minimum. Kombinasi
item yang memenuhi syarat tersebut disebut frequent itemset, yang nantinya dipakai
untuk membuat aturan aturan yang memenuhi syarat minimum confidence. Pada
pengujian ini peneliti menggunakan software weka versi 3.6.9, sebelum diolah proses
import dilakukan itemset dibentuk dalam format *.csv tanpa attribut keputusan, seperti
pada gambar berikut:
Gambar 4.5. Data Dalam Bentuk Excel
Universitas Sumatera Utara
43
Gambar 4.6. Hasil Rules Apriori
Dari hasil pembentukan rule pada gambar 4.5 dapat ditarik keputusan sebagai berikut:
1. Jika pasien mengalami gejala Batuk (ya) maka kemungkinan nafsu makan
pasien menurun (ya) mempunyai nilai confidence sebesar (1) yang artinya
gejala batuk dan nafsu makan menurun adalah gejala pertama yang paling
sering diderita oleh pasien penderita demam tifoid.
2. Jika pasien mengalami gejala Sakit Perut (ya), maka kemungkinan nafsu
makan pasien menurun (ya) mempunyai nilai confidence sebesar (1) yang
artinya gejala sakit perut dan nafsu makan menurun adalah gejala gejala kedua
yang paling sering diderita oleh pasien penderita demam tifoid.
3. Jika pasien mengalami gejala batuk (ya), maka kemungkinan pasien
mengalami sakit perut mempunyai nilai confidence sebesar (1) yang artinya
gejala batuk dan sakit perut adalah gejala ketiga yang paling sering diderita
oleh pasien penderita demam tifoid.
4. Jika pasien mengalami gejala batuk (ya) dan nafsu makan menurun (ya), maka
kemungkinan pasien mengalami sakit perut (ya) mempunyai nilai confidence
sebesar (1) yang artinya gejala batuk, nafsu makan menurun dan sakit perut
Universitas Sumatera Utara
44
adalah gejala keempat yang paling sering diderita oleh pasien penderita
demam tifoid.
5. Jika pasien mengalami gejala muntah (ya), maka kemungkinan pasien
mengalami demam mempunyai nilai confidence sebesar (0,99) yang artinya
gejala muntah dan demam adalah gejala kelima yang paling sering diderita
oleh pasien penderita demam tifoid.
Tabel 4.2. Akurasi Rule Apriori
Rule
Support
Confidence
Accuracy
Jika Gejala Batuk (ya) dan
Nafsu Makan (ya), maka
diagnosa positif
90%
100%
87,4%
Jika Sakit Perut (ya) dan Nafsu
Makan Menurun (ya), maka
diagnosa positif
Jika Batuk (ya) dan Sakit Perut
(ya), maka diagnosa positif
90%
100%
87,4%
90%
100%
87,4%
Jika Batuk (ya) dan Sakit Perut
(ya) dan Nafsu Makan
Menurun (ya), maka diagnosa
positif
Jika Muntah (ya) dan Demam
(ya), maka diagnosa positif
90 %
99%
87,4%
90%
99%
87,4%
Rata-rata
87,4%
Dari tabel 4.2 dengan menggunakan 500 data dapat dijelaskan, sebagai berikut: Lima
rule yang telah dihasilkan masing-masing memiliki akurasi 87,4%, yang didapat dari
jumlah data yang diprediksi benar (diagnosa positif) = 437, dibagi jumlah data yang di
uji = 500.
Universitas Sumatera Utara
BAB 5
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Berdasarkan analisa kinerja metode rough set dan algoritma apriori pada kasus
penyakit demam tifoid di RS Grand Medistra Lubuk Pakam menggunakan 500
dataset, maka dapat diambil kesimpulan sebagai berikut:
1. Hasil akurasi kinerja metode rough set dalam identifikasi penyakit demam
tifoid sebesar 87,4%, sedangkan untuk kinerja algoritma apriori hasil akurasi
yang didapat sebesar 87,4%.
2. Aturan prediksi yang dihasilkan oleh metode rough set terdiri dari 4 gejala
sedangkan aturan yang dihasilkan algoritma apriori terdiri dari 3 gejala.
5.2. Saran
Saran peneliti untuk kelanjutan penelitian ini adalah:
1. Pada penelitian ini tingkat akurasi yang dihasilkan dinilai cukup baik,
penelitian ini masih dapat dikembangkan menggunakan metode lain untuk
mendapatkan nilai akurasi yang lebih baik, dengan menambah attribut gejala
penyakit demam tifoid.
2. Penelitian ini masih membuka peluang untuk membandingkan metode rough
set dengan metode prediksi lainnya menggunakan tren data tertentu pada kasus
yang berbeda.
Universitas Sumatera Utara