Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid Chapter III V

BAB 3
METODOLOGI PENELITIAN

3.1. Diagram Blok Penelitian
Adapun diagram blok penelitian secara keseluruhan dapat dilihat pada gambar 3.1.
Data Collection

Pre Prosessing
Data Cleaning
Data Tranformation

Proses
Analisis Data
Metode Rough Set
Algoritma Apriori

Akurasi
Identifikasi Pola
Penyakit Tifoid

Gambar 3.1. Diagram Blok Penelitian


Universitas Sumatera Utara

21

3.2. Data Collection
Berdasarkan hasil pengamatan kasus Tifoid adalah kasus terbanyak rawat inap di RS
Grand Medistra Lubuk Pakam. Jumlah kasus Demam Tifoid pada pasien BPJS RS
Grand Medistra Lubuk Pakam bulan Januari sampai April tahun 2014 adalah
berjumlah 500 kasus. Data ini diambil dari indeks penyakit kasus Demam Tifoid
Januari 2012 sampai Desember tahun 2014. Terdapat 5 atribut yang harus diisi yang
ada pada rekam medis yaitu :
Nama

:

Umur

:


Jenis kelamin

:

Pekerjaan

:

Keluhan

:

Tabel 3.1. Data Primer
No

Nama

Umur

JK


Pekerjaan

Keluhan Pasien

1

A

47

L

Wiraswasta

demam, sakit kepala, pusing, …..

2

S


20

L

Mahasiswa

demam, sakit kepala, pusing, …..

3

P

20

L

Mahasiswa

demam, muntah, badan lemas, …..


4

A

21

L

Mahasiswa

sakit kepala, sakit perut, muntah, …..

5

D

23

P


PNS

demam, pusing, sakit perut, …..

.

.

.

.

.

.

.

.


.

.

.

.

500

….

….

….

….

….


503

KR

34

L

sakit perut, diare, nafsu makan

3.3. Tabulasi Data Penelitian
Berdasarkan hasil pengumpulan data menggunakan instrumen pada tabel 3.1. Data
Primer dilakukan proses tabulasi data hasil pengumpulan data seperti pada tabel 3.2
berikut:
Tabel 3.2. Hasil Tabulasi Data Penelitian
Attribut Data
No

Hasil Diagnosa


Umur

JK

DM

SK

PS

SP

MUN

BTK

NMM

1


47

L

Y

Y

Y

Y

Y

Y

Y

Positif


2

20

L

Y

Y

Y

Y

Y

Y

Y

Positif

Universitas Sumatera Utara

22

Tabel 3.2. Hasil Tabulasi Data Penelitian
(Lanjutan)
Attribut Data
No

Hasil Diagnosa

Umur

JK

DM

SK

PS

SP

MUN

BTK

NMM

3

20

L

0

Y

0

0

0

Y

0

Negatif

4

21

L

Y

0

Y

0

Y

Y

Y

Positif

5

23

P

Y

Y

0

Y

Y

0

0

Positif























500

32

L

Y

Y

Y

Y

Y

Y

Y

Positif

3.4. Pre Prosessing
3.4.1. Data Cleaning
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga dilakukan proses encrichment, yaitu proses “memperkaya” data yang sudah ada
dengan data atau infomasi lain yang relevan dan diperlukan untuk KDD, seperti data
atau informasi eksternal, proses cleaning ini dilakukan secara manual, seperti terlihat
pada gambar berikut:

Gambar 3.2. Data Awal

Pada gambar 3.2 diatas terdapat duplikasi data dan missing value yang dianggap
sebagai noise, dalam penelitian ini atribut yang digunakan untuk pengolahan data
selanjutnya yaitu umur, jenis kelamin dan keluhan pasien. berikut gambar hasil proses
dari cleaning data.

Universitas Sumatera Utara

23

Gambar 3.3. Hasil Cleaning Data

3.4.2. Data Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan
proses kreatif dan sangat tegantung pada jenis atau pola informasi yang akan dicari
dalam basis data.

Tabel. 3.3. Tabel Data Transformation
Atribut

Nilai

Umur

2 – 50

Jenis Kelamin

0 = Laki-Laki, 1 = Perempuan

Demam

0 = Tidak, 1 = Ya

Sakit kepala

0 = Tidak, 1 = Ya

Pusing

0 = Tidak, 1 = Ya

Sakit perut

0 = Tidak, 1 = Ya

Muntah

0 = Tidak, 1 = Ya

Batuk

0 = Tidak, 1 = Ya

Nafsu makan menurun

0 = Tidak, 1 = Ya

Diagnosa

1 = Positif, 2 = Negatif

Universitas Sumatera Utara

24

Berikut contoh gambar setelah dilakukan data transformasi

Gambar 3.4. Hasil Tranformasi Data

3.5. Analisa Metode Rough Set
Dengan merancang sistem keputusan ini maka dihasilkan suatu Rules/Knowledge
untuk pengambilan keputusan, yaitu dengan melakukan proses :
1. Merepresentasikan data atau objek dengan membentuk tabel Information
System (IS) dan Decision System (DS)
2. Indicernibility Relation, menghubungankan antar atribut yang tidak dapat
dipisahkan.
3. Equivalen Class, mengelompokkan objek-objek yang memiliki atribut kondisi
yang sama.
4. Discernibility Matrix / discernibility matrix modulo, sekumpulan atribut yang
berbeda antara objek.
5. Reduction, penyelesaian atribut minimal dari sekumpulan atribut kondisi
dengan menggunakan prime implicant fungsi boolean.
6. Generating Rules, membangkitkan aturan-aturan (rules) dari pengetahuan yang
didapat dalam proses ekstrak data.

3.5.1. Representasi Data
Terdapat dua bentuk representasi data yaitu Information System (IS) dan Decision
System (DS). Sebuah Information System (IS) terdiri dari : IS = {U, A}, dimana U =
{e1, e2, …, en} dan A = {a1, a2, …, an} yang merupakan sekumpulan example dan
attribute kondisi secara berurutan. Information System yang ditampilkan pada
penelitian ini terlihat pada tabel berikut:

Universitas Sumatera Utara

25

Tabel 3.4. Information System
Nama

Umur

Jenis

Demam

Sakit

Kelamin

Pusing

Sakit

kepala

Muntah

Batuk

perut

nafsu
makan
menurun

P1

47

0

1

1

1

1

1

1

1

P2

20

0

1

1

1

1

1

1

1

P3

20

0

1

0

0

0

1

0

0

P4

21

1

0

1

0

1

1

1

1

P5

23

1

1

0

1

1

0

0

1

P6

23

1

1

0

0

1

0

0

0

P7

18

0

1

0

0

0

1

0

0

P8

20

0

1

0

0

0

0

0

0

P9

27

1

1

1

1

1

1

1

1

P10

31

1

1

0

0

1

0

0

0

…..

…..

…..

…..

…..

…..

…..

…..

…..

…..

500

32

1

1

1

1

1

1

1

1

Tabel 3.4 memperlihatkan sebuah information system dimana tiap-tiap baris
mempresentasikan objek (pasien) sedangkan tiap-tiap kolom mempresentasikan
atribut kondisi (gejala).
Dalam sebuah Information System (IS) juga dipresentasikan dengan sebuah
Decision Attribute (atribut keputusan), C = {C1, C2, …, Cn. sehingga information
system menjadi IS = (U, {A,C}). Pada tabel 3.4 dapat dilihat sebuah information
system yang di dalamnya terdapat objek (U), atribut kondisi (A) dan Atribut keputusan
(C).
Tabel 3.5. Decision System (DS)
Nama

Umur

Pasien

Jenis

Demam

Kelamin

Sakit

Pusing

kepala

Sakit

Muntah

Batuk

perut

nafsu

Keputusan

makan
menurun

P1

47

0

1

1

1

1

1

1

1

Positif

P2

20

0

1

1

1

1

1

1

1

Positif

P3

20

0

1

0

0

0

1

0

0

Negatif

P4

21

1

0

1

0

1

1

1

1

Negatif

P5

23

1

1

0

1

1

0

0

1

Negatif

P6

23

1

1

0

0

1

0

0

0

Positif

Universitas Sumatera Utara

26

Tabel 3.5. Decision System (DS)
(Lanjutan)
Nama

Umur

Pasien

Jenis

Demam

Kelamin

Sakit

Pusing

kepala

Sakit

Muntah

Batuk

perut

nafsu

Keputusan

makan
menurun

P7

18

0

1

0

0

0

1

0

0

Negatif

P8

20

0

1

0

0

0

0

0

0

Positif

P9

27

1

1

1

1

1

1

1

1

Positif

P10

31

1

1

0

0

1

0

0

0

Positif

…..

…..

…..

…..

…..

…..

…..

…..

…..

…..

…..

P500

32

1

1

1

1

1

1

1

1

Positif

Tabel 3.5 memperlihatkan sebuah Decision System (DS) yang terdiri dari P1, P2, P3,
P4, P5, P6, P7, P8, P9, P10 …., n. Delapan atribut kondisi yaitu demam, sakit kepala,
pusing, sakit perut, muntah, batuk dan nafsu makan menurun, serta 1 atribut
keputusan. Jika seluruh seluruh variabel gejala Ya maka keputusan = Positif
(Adeyemo, et al. 2015)

3.5.2. Indicernibility Relation
Dalam decision system, sebuah objek dapat memiliki nilai yang sama untuk sebuah
atribut kondisionalnya, hubungan tersebut disebut dengan indiscernibility (tidak dapat
dipisahkan.
Berdasarkan tabel 3.5 maka didapatkan

Indicernibility Relation sebagai

berikut:
IND (Demam)

= {P1, P2, P3, P5, P6, P7, P8, P9, P10, …..}

IND (Sakit Kepala)

= {P1, P2, P4, P9, …..}

IND (Pusing)

= {P1, P2, P5, P9, …..}

IND (Sakit Perut)

= {P1, P2, P4, P5, P6, P9, P10, …..}

IND (Muntah)

= {P1, P2, P3, P4, P7, P9, …..}

IND (Batuk)

= {P1, P2, P4, P9, …..)

IND (Nafsu Makan Menurun = {P1, P2, P4, P5, P9, …..}
Kelas-kelas yang telah dikelompokkan disebut dengan equivalence class.

Universitas Sumatera Utara

27

3.5.3. Equivalence Class
Mengelompokkan objek-objek yang mempunyai nilai atribut yang sama menjadi satu
bagian. Variabel Gejala terdiri dari 7 atribut, yaitu: demam (A), sakit kepala (B),
pusing (C), sakit perut (D), muntah (E), batuk (F), nafsu makan menurun (G).
Ya

=1

Tidak = 0
Variabel Keputusan (H) terdiri dari :
Positif

=1

Negatif

=2

Kemudian masing-masing objek dikelompokkan dalam bentuk Equivalence Class
disederhanakan berdasarkan atribut kondisi dan keputusan menjadi EC1, EC2, EC3,
EC4, EC5, EC6, EC7 dan EC8 sehingga hasilnya dapat dilihat seperti pada tabel 3.5
berikut:

Tabel 3.6. Equivalence Class
Equivalence

Demam

Sakit

Pusing

Sakit

Muntah

Batuk

nafsu

Keputusan

(A)

kepala

(C)

perut

(E)

(F)

makan

(H)

Class

(B)

(D)

menurun

Number
Object

(G)
EC1

Ya

Ya

Ya

Ya

ya

ya

Ya

Positif

437

EC2

Ya

EC3

Tidak

Ya

Ya

Tidak

ya

ya

Ya

Negatif

1

Ya

Tidak

Ya

ya

ya

Ya

Negatif

5

EC4

Ya

Tidak

Ya

Ya

tidak

tidak

Ya

Negatif

5

EC5

Tidak

Tidak

Tidak

Ya

tidak

ya

Ya

Negatif

16

EC6

Ya

Tidak

Tidak

Ya

tidak

tidak

Tidak

Positif

21

EC7

Ya

Tidak

Tidak

Tidak

ya

tidak

Tidak

Negatif

12

EC8

Ya

Tidak

Tidak

Tidak

tidak

tidak

Tidak

Negatif

2

3.5.4. Discernibility Matrix
Dalam Discernibility Matrix maka variabel-variabel kondisi yang terdiri dari umur,
jenis kelamin, demam, sakit kepala, pusing, sakit perut, muntah, batuk, nafsu makan
menurun. Dalam proses perbandingan ini yang diperhatikan hanya atribut kondisinya
saja, jika nilai atribut kondisinya sama maka tidak menghasilkan nilai dan jika
terdapat kondisi atribut yang berbeda maka akan menghasilkan nilai.
Dari proses perbandingan ini dihasilkan tabel Discernibility Matrix seperti tabel 3.7

Universitas Sumatera Utara

28

Tabel 3.7. Discernibility Matrix
EC1

EC2

EC3

EC4

EC5

EC6

EC7

EC8

EC1

-

D

AC

AEF

ABCE

BCEFG

BCDFG

BCDEFG

EC2

D

-

ACD

BDEF

ABCDE

BCDEFG

BCFG

BCEFG

EC3

AC

ACD

-

ABCEF

BE

ABEFG

ABDFG

ABDEFG

EC4

AEF

BDEF

ABCEF

-

ACF

CG

CDEG

CDG

EC5

ABCE

ABCDE

BE

ACF

-

AF

ADEFG

ADFG

EC6

BCEFG

BCDEFG

ABEFG

CG

AF

-

DE

D

EC7

BCDFG

BCFG

ABDFG

CDG

ADFG

D

-

E

BCEFG

ABDEFG

CDG

ADFG

D

E

-

EC8

BCDEF
G

3.5.5. Discernibility Matrix Modulo D
Dari hasil pengolahan data dengan cara Discernibility Matrix sesuai tabel 3.6 maka
selanjutnya data diolah dengan cara Discernibility Matrix Modulo D, pengolahan
dengan cara ini variabel kondisi dan keputusannya harus dibandingkan. Sehingga jika
variabel keputusan juga dibandingkan maka hasilnya menjadi seperti pada tabel 3.8

Tabel 3.8. Discernibility Matrix Module D
EC1

EC2

EC3

EC4

EC5

EC6

EC7

EC8

EC1

-

D

AC

AEF

ABCE

-

BCDFG

BCDEFG

EC2

D

-

-

-

-

BCDEFG

-

-

EC3

AC

-

-

-

-

ABEFG

-

-

EC4

AEF

-

-

-

-

CG

-

-

EC5

ABCE

-

-

-

-

AF

-

-

EC6

-

BCDEFG

ABEFG

CG

AF

-

DE

D

EC7

BCDFG

-

-

-

-

D

-

-

-

-

-

-

D

-

-

EC8

BCDEF
G

Keterangan : Jika nilai decision Atribut sama

= kosong

decision Atribut berbeda = terisi

Universitas Sumatera Utara

29

3.5.6. Reduct
Teknik yang dapat diterapkan untuk mendapatkan representasi data set yang lebih
kecil dengan Reduct, namun tetap mempertahankan integritas data asli, artinya
pertambangan data set berkurang harus lebih efisien atau sama dengan hasil analisis.
Proses reduct yang dilakukan berdasarkan tabel 3.8. Dicernibility Matrix Mod D
dengan penyeleksian variabel minimal dari sekumpulan variabel kondisi dengan cara
Prime Implicant fungsi Boolean, sebagai berikut:


A+1=1+A=1



AA=A

Tabel 3.9. Reduct
Class

CNF of Boolean Function

Prime Implicant

Reducts

EC1

D ^ (AvC) ^ (AvEvF) ^ (AvBvCvE)

B^D^F

{B}, {D}, {F}

^ (BvCvDvFvG) ^ (BvCvDvEvFvG)

EC2

D ^ (BvCvDvEvFvG)

B^D^G

{B}, {D}, {G}

EC3

(AvC) ^ (AvBvEvFvG)

A^ B ^ C ^ E ^

{A}, {B}, {C},

G

{E}, {G}

EC4

(AvEvF) ^ (CvG)

C^F^G

{C}, {F}, {G}

EC5

(AvBvCvE) ^ (AvF)

A^B

{A}, {B}

EC6

(BvCvDvEvFvG) ^ (AvBvEvFvG) ^

A^B^E^F^

{A}, {B}, {E},

(CvG) ^ (AvF)

G

{F}, {G}

EC7

(BvCvDvFvG) ^ (D)

D

{D}

EC8

(BvCvDvEvFvG) ^ (D)

B^D^G

{B}, {D}, {G}

3.5.7. Generating Rules
Setelah mendapatkan reduce, maka dapat ditarik kesimpulan atau ditentukan rule
dengan menyesuaikan reduce setiap equivalen class terhadap tabel 3.6 (Equivalen
Class). Berdasarkan data hasil reduct yang telah didapatkan, maka data-data tersebut
akan diolah sehingga menghasilkan suatu rules / knowledge yang dapat dipahami
untuk pengambilan suatu keputusan. Berikut akan ditarik kesimpulan untuk semua
kelas :
A. Class EC1 menghasilkan reduct {B}, {D}, {F} Rulenya adalah:

Universitas Sumatera Utara

30

Jika sakit kepala = ya dan sakit perut = ya dan batuk = ya, maka diagnosa =
positif.
B. Class EC2 menghasilkan reduct {B}, {D}, {G}, Rulenya adalah:
Jika sakit kepala = ya dan sakit perut = tidak dan nafsu makan menurun =
ya, maka diagnosa = negatif.
C. Class EC3 menghasilkan reduct {A}, {B}, {C}, {E}, {G} Rulenya adalah:
Jika demam = tidak dan sakit kepala = ya dan pusing = tidak dan nafsu
makan menurun = ya, maka diagnosa = negatif.
D. Class EC4 menghasilkan reduct {C}, {F}, {G}, Rulenya adalah:
Jika pusing = ya dan batuk = tidak dan nafsu makan menurun = ya, maka
diagnosa = negatif
E. Class EC5 menghasilkan reduct {A}, {B}, Rulenya adalah:
Jika demam = tidak dan sakit kepala = tidak, maka diagnosa = negatif.
F. Class EC6 menghasilkan reduct {A}, {B}, {E}, {F}, {G}, Rulenya adalah:
Jika demam = ya dan sakit kepala = tidak dan muntah = tidak dan batuk =
tidak dan nafsu makan menurun = tidak, maka diagnosa = positif
G. Class EC7 menghasilkan reduct {D}, Rulenya adalah:
Jika sakit perut = tidak, maka diagnosa = negatif.
H. Class EC8 menghasilkan reduct {B}, {D}, {G}, Rulenya adalah:
Jika sakit kepala = tidak dan sakit perut = tidak dan nafsu makan menurun =
tidak, maka diagnosa = negatif

3.6. Analisa Penerapan Algoritma Apriori
Algoritma apriori adalah algoritma paling terkenal untuk menemukan pola frekuensi
tinggi. Pola frekuensi tinggi adalah pola-pola item di dalam suatu database yang
memiliki frekuensi atau support di atas ambang batas tertentu yang disebut dengan
istilah minimum support. Algoritma apriori dibagi menjadi beberapa tahap yang
disebut iterasi atau pass yaitu:
1. Pembentukan kandidat itemset , kandidat kitemset dibentuk dari kombinasi (k1) itemset yang didapat dari iterasi sebelumnya. Satu cara dari algoritma
apriori adalah adanya pemangkasan kandidat k-itemset yang subsetnya yang
berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.

Universitas Sumatera Utara

31

2. Penghitungan support dari tiap kandidat kitemset. Support dari tiap kandidat kitemset didapat dengan menscan database untuk menghitung jumlah transaksi
yang memuat semua item di dalam kandidat k-itemset tersebut. Ini adalah juga
ciri dari algoritma apriori dimana diperlukan penghitungan dengan scan
seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau
k-itemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dari
minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan.
Bila tidak, maka k ditambah satu dan kemabali ke bagian 1.

3.6.1. Pola Gejala Penyakit Demam Tifoid
Berdasarkan pola gejala penyakit demam tifoid yang diperoleh dari beberapa
sampel data pada tabel 3.10 berikut:

Tabel 3.10. Pola Gejala Penyakit Demam Tifoid
Itemset

Pasien
P1

Diagnosa

demam, sakit kepala, pusing, sakit perut, muntah, batuk,

Positif

nafsu makan menurun
P2

demam, sakit kepala, pusing, sakit perut, muntah, batuk,

Positif

nafsu makan menurun
P3

demam, muntah, badan lemas, keringat malam hari

Negatif

P4

sakit kepala, sakit perut, muntah, batuk, nafsu makan

Negatif

menurun
P5

demam, pusing, sakit perut, nafsu makan menurun

Negatif

P6

demam, sakit perut, badan pegal-pegal, keringat malam hari

Positif

P7

demam, sakit perut, badan lemas

Negatif

P8

demam, keringat malam hari, badan lemas

Positif

P9

demam, sakit kepala, pusing, sakit perut, muntah, batuk,

Positif

nafsu makan menurun
P10

demam, sakit perut

Positif

…..

…..

…..

Universitas Sumatera Utara

32

P500

demam, sakit kepala, pusing, sakit perut, muntah, batuk,

Positif

nafsu makan menurun

A. Pembentukan Itemset
Berikut ini penyelesaian berdasarkan data yang sudah disediakan pada tabel 3.10,
proses pembentukan Combinasi (C1) atau disebut 1 itemset dengan jumlah
minimum support = 90%, dengan rumus sebagai berikut:

=












� �



X 100%

Tabel 3.11. Support dari Tiap Item
Itemset

Count

Support

Demam

479

95.8%

Sakit kepala

443

88.6%

Pusing

443

88.6%

Sakit perut

484

96.8%

Muntah

455

91.0%

Batuk

458

91.6%

Nafsu makan menurun

463

92.6%

B. Kombinasi 2 Itemset
Proses pembentukan C2 atau disebut dengan 2 itemset dengan jumlah minimum
support = 90%, dapat diselesaikan dengan rumus sebagai berikut:

,

=


















X 100%

Tabel 3.12. Pola Kombinasi 2 Itemset
Itemset

Count

Support

Demam, sakit kepala

438

87,6%

Demam, pusing

443

88,6%

Demam, sakit perut

464

92,8%

Demam, muntah

451

90,2%

Universitas Sumatera Utara

33

Demam, batuk

438

87,6%

Demam, nafsu makan menurun

443

88,6%

Sakit kepala, pusing

438

87,6%

Sakit kepala, sakit perut

443

88,6%

Sakit kepala, muntah

443

88,6%

Sakit kepala, batuk

443

88,6%

Sakit kepala, nafsu makan menurun

443

88,6%

Pusing, sakit perut

442

88,4%

Pusing, muntah

438

87,6%

Pusing, batuk

438

87,6%

Pusing, nafsu makan menurun

443

88,6%

Sakit perut, muntah

443

88,6%

Sakit perut, batuk

458

91,6%

Sakit perut, nafsu makan menurun

463

92,6%

Muntah, batuk

443

88,6%

Muntah, nafsu makan menurun

443

88,6%

Batuk, nafsu makan menurun

459

91,8%

Minimal support yang ditentukan adalah 90%, jadi kombinasi 2 itemset yang tidak
memenuhi minimal support akan dihilangkan, terlihat seperti tabel berikut ini :

Tabel 3.13. Tabel Kombinasi 2 Itemset memenuhi minimal Support
Itemset

Count

Support

Demam, sakit perut

464

92,8%

Demam, muntah

451

90,2%

Sakit Perut, batuk

458

91,6%

Sakit perut, nafsu makan menurun

463

92,6%

Batuk, nafsu makan menurun

459

91,8%

C. Kombinasi 3 Itemset
Proses pembentukan C 3 atau disebut dengan 3 itemset dengan jumlah minimum
support = 90%, dapat diselesaikan dengan rumus berikut:

Universitas Sumatera Utara

34

,



=














� �

,



X 100%

Tabel 3.14. Pola Kombinasi 3 Itemset
Itemset

Count

Support

Demam, sakit kepala, pusing

438

87,6%

Demam, sakit kepala, sakit perut

437

87,4%

Demam, sakit kepala, muntah

438

87,6%

Demam, sakit kepala, batuk

438

87,6%

Demam, sakit kepala, nafsu makan menurun

438

87,6%

Demam, pusing, sakit perut

442

88,4%

Demam, pusing, muntah

438

87,6%

Demam, pusing, batuk

438

87,6%

Demam, pusing, nafsu makan menurun

443

88,6%

Demam, sakit perut, muntah

437

87,4%

Demam, sakit perut, batuk

437

87,4%

Demam, sakit perut, nafsu makan menurun

442

88,4%

Demam, muntah, batuk

438

87,6%

Demam, muntah, nafsu makan menurun

438

87,6%

Demam, batuk, nafsu makan menurun

438

87,6%

Sakit kepala, pusing, sakit perut

437

87,4%

Sakit kepala, pusing, muntah

438

87,6%

Sakit kepala, pusing, batuk

438

87,6%

Sakit kepala, pusing, nafsu makan menurun

438

87,6%

Sakit kepala, sakit perut, muntah

442

88,4%

Sakit kepala, sakit perut, batuk

442

88,4%

Sakit kepala, sakit perut, nafsu makan menurun

442

88,4%

Sakit kepala, muntah, batuk

443

88,6%

Sakit kepala, muntah, nafsu makan menurun

443

88,6%

Sakit kepala, batuk, nafsu makan menurun

443

88,6%

Pusing, sakit perut, muntah

437

87,4%

Pusing, sakit perut, batuk

437

87,4%

Pusing, sakit perut, nafsu makan menurun

442

88,4%

Pusing, muntah, batuk

438

87,6%

Universitas Sumatera Utara

35

Pusing, muntah, nafsu makan menurun

438

87,6%

Pusing, batuk, nafsu makan menurun

438

87,6%

Sakit perut, muntah, batuk

442

88,4%

Sakit perut, muntah, nafsu makan menurun

442

88,4%

Sakit perut, batuk, nafsu makan menurun

458

91,6%

Muntah, batuk, nafsu makan menurun

443

88,6%

Minimal support yang ditentukan adalah 90%, jadi kombinasi 3 itemset yang tidak
memenuhi minimal support akan dihilangkan, terlihat seperti tabel berikut ini :

Tabel 3.15. Tabel Kombinasi 3 Itemset memenuhi minimal Support
Itemset
Sakit perut, batuk, nafsu makan

Count

Support

458

91,6%

menurun
D. Kombinasi 4 Itemset
Proses pembentukan C4 atau disebut dengan 4 itemset dengan jumlah minimum
support = 50%, dapat diselesaikan dengan rumus berikut:

, ,



=
















, ,




X 100%

Tabel 3.16. Pola Kombinasi 4 Itemset
Itemset

Count

Support

Demam, sakit kepala, pusing, sakit perut

437

87,4%

Demam, sakit kepala, pusing, muntah

438

87,6%

Demam, sakit kepala, pusing, batuk

438

87,6%

Demam, sakit kepala, pusing, nafsu makan menurun

438

87,6%

Demam, sakit kepala, sakit perut, muntah

437

87,4%

Demam, sakit kepala, sakit perut, batuk

437

87,4%

Demam, sakit kepala, sakit perut, nafsu makan menurun

437

87,4%

Demam, sakit kepala, muntah, batuk

438

87,6%

Demam, sakit kepala, batuk, nafsu makan menurun

438

87,6%

Demam, pusing, sakit perut, muntah

437

87,4%

Universitas Sumatera Utara

36

Demam, pusing, sakit perut, batuk

437

87,4%

Demam, pusing, sakit perut, nafsu makan menurun

442

88,4%

Demam, pusing, muntah, batuk

438

87,6%

Demam, pusing, muntah, nafsu makan menurun

438

87,6%

Demam, sakit perut, muntah, batuk

437

87,4%

Demam, sakit perut, batuk, nafsu makan menurun

437

87,4%

Demam, muntah, batuk, nafsu makan menurun

438

87,6%

Sakit kepala, pusing, sakit perut, muntah

437

87,4%

Sakit kepala, pusing, sakit perut, batuk

437

87,4%

Sakit kepala, pusing, sakit perut, nafsu makan menurun

437

87,4%

Sakit kepala, pusing, muntah, batuk

438

87,6%

Sakit kepala, pusing, muntah, nafsu makan menurun

438

87,6%

Sakit kepala, pusing, batuk, nafsu makan menurun

438

87,6%

Sakit kepala, sakit perut, muntah, batuk

442

88,4%

Sakit kepala, sakit perut, batuk, nafsu makan menurun

442

88,4%

Sakit kepala, muntah, batuk, nafsu makan menurun

443

88,6%

Pusing, sakit perut, muntah, batuk

437

87,4%

Pusing, sakit perut, muntah, nafsu makan menurun

437

87,4%

Pusing, sakit perut, batuk, nafsu makan menurun

437

87,4%

Pusing, muntah, batuk, nafsu makan menurun

438

87,6%

Sakit perut, muntah, batuk, nafsu makan menurun

437

87,4%

Karena kombinasi 4 itemset tidak ada yang memenuhi minimal support, maka 3
kombinasi yang memenuhi untuk pembentukan asosiasi.

3.6.2. Pembentukan Aturan Asosiasi
Setelah semua pola frekuensi tinggi ditemukan, kemudian dicari aturan asosiasi
yang memenuhi syarat minimum untuk confidence dengan menghitung confidence
aturan asosiatif A  C.
Nilai confidence dari aturan A  C diperoleh dengan rumus :

=
















,



X 100%

Universitas Sumatera Utara

37

Dari kombinasi 2 itemset yang telah ditemukan dapat dilihat besarnya nilai support
dan confidence dari calon aturan asosiasi seperti tampak pada tabel berikut:

Tabel 3.17. Aturan Asosiasi
Confidence

Aturan
Jika sakit perut dan batuk, maka nafsu

458/484

94,6%

makan menurun
3.6.3. Pembentukan Aturan Asosiasi Final
Aturan asosiasi final berdasarkan minimal support dan confidence yang telah
ditentukan dapat dilihat pada tabel berikut ini :

Tabel 3.18. Aturan Asosiasi Final
Aturan Assosiasi
Jika sakit perut dan batuk, maka nafsu

Support

Confidence

91,6%

94,6%

makan menurun
Pada aturan tabel 3.18 dapat dijelaskan bahwa Jika sakit perut dan batuk, maka
nafsu makan menurun adalah gejala demam tifoid dengan nilai support 91,6% dan
confidence 94,6%.

Universitas Sumatera Utara

BAB 4
HASIL DAN PEMBAHASAN

4.1. Pendahuluan
Pengujian yang dilakukan peneliti menggunakan data berjumlah 500. Penerapan
metode rough set dan algoritma apriori bertujuan untuk mendapatkan akurasi terbaik
dari kinerja kedua metode tersebut dalam identifikasi pola penyakit demam tifoid
dengan membentuk item-item yang saling berhubungan dalam bentuk rule. Adapun
pengujian yang dilakukan menggunakan software rosetta versi 1.4.41 untuk pengujian
metode rough set, software weka versi 3.6.9 untuk pengujian algoritma apriori.
Spesifikasi hardware yang digunakan sebagai berikut:
1. Prosesor Core i5 2,49 GHz
2. RAM 3 GB
3. Operating System Windows 7 Ultimate

4.2. Pra Pengolahan Data
Proses pengujian dilakukan untuk mendapatkan rule dari demam tifoid menggunkan
metode rough set dan mendapatkan akurasi dari rule tersebut. Proses pengujian ini
dilakukan menggunakan alat bantu perangkat lunak Rosetta. Dalam menggunakan
sofware Rosetta data dalam bentuk Decision System disimpan ke dalam Software
Microsof Excel seperti gambar 4.1:

Universitas Sumatera Utara

39

Gambar 4.1. Data Dalam Bentuk Excel

4.3. Hasil Implementasi Menggunakan Metode Rough Set
Untuk menguji kebenaran dari hasil pengolahan data yang dikerjakan secara manual
pada bab sebelumnya, dapat digunakan salah satu software aplikasi Rough Set, yaitu
Rosetta. Tampilan hasil import data excel ke dalam software rosetta dapat dilihat
seperti pada gambar 4.2

Gambar 4.2. Tampilan Hasil Import Data Rosetta

Universitas Sumatera Utara

40

4.3.1. Reduct
Reduct adalah penyeleksian atribut minimal (interesting attribute) dari sekumpulan
atribut kondisi dengan menggunakan Prime Implicant fungsi Boolean. Tampilan hasil
reduct pada Rosetta dapat dilihat seperti pada Gambar 4.3.

Gambar 4.3. Hasil Reduct
Dari hasil pencarian Software Rosetta dihasilkan delapan Reduct yang merupakan
dasar dalam pembuatan Rule-rule. Reduct ini adalah hasil atribut minimal dari atribut
kondisi yang sebelumnya telah disederhanakan menggunakan prime implicant fungsi
boolean. Delapan reduct ini akan dicari rulenya disesuaikan data yang diimportkan
awalnya. Support merupakan banyaknya kondisi reduct yang sesuai dengan data yang
awalnya dimasukkan sedangkan length adalah panjang Reduct.

4.3.2. Generating Rules
Generating Rules adalah suatu metode rough set untuk menghasilkan rules/
knowledge berdasarkan equivalence class dan reduct. Tampilan Generating rules
dapat dilihat seperti pada gambar 4.4.

Universitas Sumatera Utara

41

Gambar 4.4. Hasil Generating Rules
Hasil pengolahan data yang dilakukan dengan menggunakan Software Rosetta
menghasilkan rule sebanyak 57 rule. Dari rule yang dihasilkan, maka dipilih 8 rule
terbaik yang memberikan hasil akurasi prediksi yang sebesar 87,4%, dapat dilihat
pada tabel berikut:

Tabel 4.1. Akurasi Rule Rough Set
No
1
2
3

4
5
6
7

Rule

Accuracy

Jika Demam(ya) AND Sakit Kepala(ya) AND Pusing(ya)
AND Sakit Perut(ya) => Diagnosa(positif)
Jika Demam(ya) AND Pusing(ya) AND Sakit Perut(ya)
AND Muntah(ya) => Diagnosa(positif)
Jika Demam(ya) AND Sakit Kepala(ya) AND Sakit
Perut(ya) AND Nafsu Makan Menurun(ya) =>
Diagnosa(positif)
Jika Demam(ya) AND Sakit Perut(ya) AND Muntah(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
Jika Demam(ya) AND Sakit Perut(ya) AND Batuk(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)
Jika Pusing (ya) AND Sakit Perut(ya) AND Batuk(ya) =>
Diagnosa(positif)
Jika Sakit Kepala(ya) AND Pusing(ya) AND Sakit
Perut(ya) AND Nafsu Makan Menurun(ya) =>
diagnosa(positif)

87,4%
87,4%
87,4%

87,4%
87,4%
87,4%
87,4%

Universitas Sumatera Utara

42

Tabel 4.1. Akurasi Rule Roughset
(Lanjutan)
Rule

No
8

Accuracy

Jika Pusing(ya) AND Sakit Perut(ya) AND Muntah(ya)
AND Nafsu Makan Menurun(ya) => Diagnosa(positif)

87,4%
87,4%

Rata-rata

Dari tabel 4.1 dengan menggunakan 500 data dapat dijelaskan, sebagai berikut:
Delapan rule yang telah dihasilkan masing-masing memiliki akurasi 87,4%, yang
didapat dari jumlah data yang diprediksi benar (diagnosa positif) = 437, dibagi jumlah
data yang di uji = 500.

4.4. Analisa Penerapan Algoritma Apriori
Pembuatan kandidat kombinasi item yang mungkin berdasar pada aturan tertentu lalu
diuji apakah kombinasi item tersebut memenuhi syarat support minimum. Kombinasi
item yang memenuhi syarat tersebut disebut frequent itemset, yang nantinya dipakai
untuk membuat aturan aturan yang memenuhi syarat minimum confidence. Pada
pengujian ini peneliti menggunakan software weka versi 3.6.9, sebelum diolah proses
import dilakukan itemset dibentuk dalam format *.csv tanpa attribut keputusan, seperti
pada gambar berikut:

Gambar 4.5. Data Dalam Bentuk Excel

Universitas Sumatera Utara

43

Gambar 4.6. Hasil Rules Apriori
Dari hasil pembentukan rule pada gambar 4.5 dapat ditarik keputusan sebagai berikut:
1. Jika pasien mengalami gejala Batuk (ya) maka kemungkinan nafsu makan
pasien menurun (ya) mempunyai nilai confidence sebesar (1) yang artinya
gejala batuk dan nafsu makan menurun adalah gejala pertama yang paling
sering diderita oleh pasien penderita demam tifoid.

2. Jika pasien mengalami gejala Sakit Perut (ya), maka kemungkinan nafsu
makan pasien menurun (ya) mempunyai nilai confidence sebesar (1) yang
artinya gejala sakit perut dan nafsu makan menurun adalah gejala gejala kedua
yang paling sering diderita oleh pasien penderita demam tifoid.
3. Jika pasien mengalami gejala batuk (ya), maka kemungkinan pasien
mengalami sakit perut mempunyai nilai confidence sebesar (1) yang artinya
gejala batuk dan sakit perut adalah gejala ketiga yang paling sering diderita
oleh pasien penderita demam tifoid.
4. Jika pasien mengalami gejala batuk (ya) dan nafsu makan menurun (ya), maka
kemungkinan pasien mengalami sakit perut (ya) mempunyai nilai confidence
sebesar (1) yang artinya gejala batuk, nafsu makan menurun dan sakit perut

Universitas Sumatera Utara

44

adalah gejala keempat yang paling sering diderita oleh pasien penderita
demam tifoid.
5. Jika pasien mengalami gejala muntah (ya), maka kemungkinan pasien
mengalami demam mempunyai nilai confidence sebesar (0,99) yang artinya
gejala muntah dan demam adalah gejala kelima yang paling sering diderita
oleh pasien penderita demam tifoid.
Tabel 4.2. Akurasi Rule Apriori
Rule

Support

Confidence

Accuracy

Jika Gejala Batuk (ya) dan
Nafsu Makan (ya), maka
diagnosa positif

90%

100%

87,4%

Jika Sakit Perut (ya) dan Nafsu
Makan Menurun (ya), maka
diagnosa positif
Jika Batuk (ya) dan Sakit Perut
(ya), maka diagnosa positif

90%

100%

87,4%

90%

100%

87,4%

Jika Batuk (ya) dan Sakit Perut
(ya) dan Nafsu Makan
Menurun (ya), maka diagnosa
positif
Jika Muntah (ya) dan Demam
(ya), maka diagnosa positif

90 %

99%

87,4%

90%

99%

87,4%

Rata-rata

87,4%

Dari tabel 4.2 dengan menggunakan 500 data dapat dijelaskan, sebagai berikut: Lima
rule yang telah dihasilkan masing-masing memiliki akurasi 87,4%, yang didapat dari
jumlah data yang diprediksi benar (diagnosa positif) = 437, dibagi jumlah data yang di
uji = 500.

Universitas Sumatera Utara

BAB 5
KESIMPULAN DAN SARAN

5.1. Kesimpulan
Berdasarkan analisa kinerja metode rough set dan algoritma apriori pada kasus
penyakit demam tifoid di RS Grand Medistra Lubuk Pakam menggunakan 500
dataset, maka dapat diambil kesimpulan sebagai berikut:
1. Hasil akurasi kinerja metode rough set dalam identifikasi penyakit demam
tifoid sebesar 87,4%, sedangkan untuk kinerja algoritma apriori hasil akurasi
yang didapat sebesar 87,4%.
2. Aturan prediksi yang dihasilkan oleh metode rough set terdiri dari 4 gejala
sedangkan aturan yang dihasilkan algoritma apriori terdiri dari 3 gejala.
5.2. Saran
Saran peneliti untuk kelanjutan penelitian ini adalah:
1. Pada penelitian ini tingkat akurasi yang dihasilkan dinilai cukup baik,
penelitian ini masih dapat dikembangkan menggunakan metode lain untuk
mendapatkan nilai akurasi yang lebih baik, dengan menambah attribut gejala
penyakit demam tifoid.
2. Penelitian ini masih membuka peluang untuk membandingkan metode rough
set dengan metode prediksi lainnya menggunakan tren data tertentu pada kasus
yang berbeda.

Universitas Sumatera Utara