Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid

ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID

TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika

BENY IRAWAN
137038012

PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2016

Universitas Sumatera Utara

ii


PERSETUJUAN

Judul

: ANALISIS KINERJA METODE ROUGH SET DAN
ALGORITMA APRIORI DALAM IDENTIFIKASI
POLA PENYAKIT DEMAM TIFOID

Kategori

: TESIS

Nama

: BENY IRAWAN

Nomor induk mahasiswa

: 137038012


Program studi

: MAGISTER (S2) TEKNIK INFORMATIKA

Fakultas

: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
:

Komisi pembimbing

Pembimbing II,

Pembimbing I,

Dr. Erna Budhiarti Nababan, M.IT

Prof. Dr. Opim Salim Sitompul,M.Sc


Diketahui/disetujui Oleh
Program Studi S2 Teknik Informatika
Ketua,

Prof. Dr. Muhammad Zarlis, M.Sc
NIP. 19570701 198601 1 003

Universitas Sumatera Utara

iii

PERNYATAAN

ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.


Medan, 23 Agustus 2016

Beny Irawan
NIM. 137038012

Universitas Sumatera Utara

iv

PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS

Sebagai civitas akademik Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini :
Nama
Nim
Program Studi


: Beny Irawan
: 137038012
: Magister (S2) Teknik Informatika

Demi pengembangan ilmu pengetahuan, menyetujui memberikan kepada Universitas
Sumatera Utara Hak Bebas Royaliti Non-Ekslusif (Non-Exclusive Royality Free
Right) atas tesis saya yang berjudul :
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID

Beserta perangkat yang ada (jika diperlukan). Dengan hak bebas Royaliti NonExclusive ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 23 Agustus 2016

Beny Irawan
NIM. 137038012


Universitas Sumatera Utara

v

Telah di uji pada
Tanggal: 23 Agustus 2016

PANITIA PENGUJI TESIS
Ketua

: Prof. Dr. Opim Salim Sitompul, M.Sc

Anggota

: 1. Dr. Erna Budhiarti Nababan, M.IT
2. Prof. Dr. Tulus, Vor.Dipl.Math, M.Si
4. Prof. Dr. Muhammad Zarlis, M.Sc

Universitas Sumatera Utara


vi

DAFTAR RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap
Tempat dan Tanggal Lahir
Alamat Rumah
Telp/Fax/HP
E-mail
Instansi Tempat Bekerja
Alamat Kantor

: Beny Irawan
: Peureulak, 29 Agustus 1987
: Dsn Tanjung Tani Desa Paya Palas Kec.Ranto
Peureulak Aceh Timur
: 08126454174
: benyirawan77@gmail.com

: Medistra Lubuk Pakam
: Jl. Sudirman No.38 Lubuk Pakam Kab. Deli
Serdang 20512 Sumatera Utara – Indonesia

DATA PENDIDIKAN

SD
SLTP
SLTA
S1
S2

: SD Negeri 1 Tanjung Tani
: MTSs Nurul Ulum Aceh Timur
: SMA Negeri 15 Medan
: Teknik Informatika STT Harapan Medan
: Teknik Informatika USU

TAMAT : 1999
TAMAT : 2002

TAMAT : 2005
TAMAT : 2010
TAMAT : 2016

Universitas Sumatera Utara

vii

KATA PENGANTAR

Pertama-tama penulis panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas
segala rahmat, berkat dan karunia-Nya berupa pengetahuan, kesehatan dan
kesempatan yang diberikan kepada penulis sehingga dapat menyelesaikan tesis ini
dengan baik. Tesis penulis yang berjudul : “Analisis Kinerja Metode Rough Set Dan
Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid” merupakan salah
satu syarat akademik penulis sebagai mahasiswa S2, Program Studi Teknik
Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI),
Universitas Sumatera Utara (USU), Medan dalam menyelesaikan jenjang pendidikan
S2.
Dalam kesempatan ini, penulis hendak memberikan penghargaan dan ucapan

terima kasih yang sebesar-besarnya kepada :
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH,
M.Hum atas kesempatan yang diberikan kepada penulis untuk mengikuti dan
menyelesaikan pendidikan Program Pascasarjana.
2. Dekan Fakultas Ilmu Komputer Universitas Sumatera Utara Bapak Prof. Dr.
Opim Salim Sitompul, M.Sc, Ketua Program Studi Magister (S2) Teknik
Informatika, Bapak Prof. Dr. Muhammad Zarlis, M.Sc dan Sekretaris Program
Studi Magister (S2) Teknik Informatika, Bapak M. Andri Budiman, S.T,
M.Comp.Sc., M.E.M beserta seluruh dosen yang telah banyak memberikan
ilmu pengetahuan selama masa perkuliahan serta seluruh staf pegawai pada
Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
3. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Opim Salim Sitompul, M.Sc, selaku

pembimbing utama dan Ibu Dr. Erna Budhiarti Nababan, M.IT, selaku
pembimbing kedua yang telah banyak memberikan bimbingan, tuntunan,
masukan serta motivasi kepada penulis hingga selesainya tesis ini.

Universitas Sumatera Utara


viii

4. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Tulus, Vor.Dipl.Math, M.Si dan Bapak Prof.
Dr. Muhammad Zarlis, M.Sc selaku pembanding/penguji tesis yang senantiasa
memberikan saran, masukan dan arahan kepada penulis dalam penyelesaian
penulisan tesis ini.

Secara khusus penulis mengucapkan rasa terima kasih sedalam-dalamnya
kepada orang tua penulis tercinta dan tersayang, Ayahanda Munzir, Ibunda Fatimah,
kakak penulis Sri Mutia, AMK, S.ARS dan adik-adik penulis Aida Muliana, S.Pd,
Muzirullah, Aulia Syahputra yang telah memberikan perhatian, kasih sayang, motivasi
serta dukungan berupa material dan spiritual kepada penulis.
Penulis juga meyampaikan rasa terima kasih kepada Yuzra Yahya, S.Kep yang
telah membantu dalam pengumpulan data penelitian beserta seluruh keluarga dan
berbagai pihak yang telah banyak membantu, memberikan motivasi, perhatian serta
dukungan kepada penulis. Tak lupa untuk rekan-rekan penulis selama menempuh
pendidikan Magister yang sudah penulis anggap sebagai keluarga yaitu kelas Kom-B
2013, terima kasih untuk kekompakan, keakraban, dan kerjasama selama ini. Penulis
pasti sangat merindukan kalian.
Penulis menyadari bahwa masih terdapat kekurangan dalam penyusunan tesis
ini. Oleh karena itu, penulis mengharapkan kritik dan saran dari pembaca demi
kesempurnaan penelitian selanjutnya.
Akhir kata, penulis berharap semoga tesis ini dapat dikembangkan lagi
menjadi lebih baik dan bermanfaat bagi semua pihak khususnya dalam dunia
pendidikan dan teknologi.

Medan, 23 Agustus 2016

Beny Irawan
NIM 137038012

Universitas Sumatera Utara

ix

ABSTRAK

Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah
sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat tidaklah
mudah, penelitian ini dapat membantu para pengambil keputusan serta menjadikan
sebagai perbandingan. peneliti melakukan teknik data mining untuk analisa kinerja
metode rough set dan algoritma apriori, kegunaan dari metode rough set yaitu
mendapat perkiraan aturan yang singkat dengan fungsi reduksi, sedangkan algoritma
apriori dapat mencari kombinasi item set yang sering muncul dalam basis data dengan
memperhatikan minimum support (minsup), proses utama yang dilakukan algoritma
apriori adalah join (penggabungan) dan prune (pemangkasan). Tujuan penelitian ini
meningkatkan akurasi metode rough set dan algoritma apriori untuk mendapatkan
akurasi identifikasi penyakit demam tifoid. Variabel input awal yang digunakan
sebanyak tujuh varibel. Dari hasil penelitian yang dilakukan pada dataset penyakit
demam tifoid, metode rough set menghasilkan empat panjang rule dan algoritma
apriori menghasilkan tiga panjang rule, sedangkan nilai rata-rata akurasi yang
dihasilkan sebesar 87,4% dari kedua metode yang digunakan.

Kata Kunci : Metode Rough Set, Algoritma Apriori, Demam Tifoid

Universitas Sumatera Utara

x

PERFORMANCE ANALYSIS ROUGH SET METHOD AND APRIORI
ALGORITHM IN IDENTIFICATION PATTERN OF
TYPHOID FEVER DIASEASE

ABSTRACT

An element that is very important and everyday needs at this time is an information, to
get a right and accurate information is not easy, this research can help the decision
maker and to make a comparison. The Researcher did the data mining techniques for
make analysis rough sets methods and apriori algorithms, the usefulness of rough set
method that got a brief estimate of the rules with the reduction function, whereas the
Apriori algorithm can find the combination of set items that often appear in the
database by taking into account the minimum support (minsup), the main process has
been done apriori algorithm was join and prune. The purpose of this research to
increases the accuracy of the rough set methods and apriori algorithms to obtain
accurate identification of typhoid fever. Initial input variables used seven variables.
From the results of this research was conducted on a dataset of typhoid fever, rough
set method produces four long rule and apriori algorithm produced three long rule,
while the average value of the resulting accuracy of 87.4% from the second method is
used.

Keywords : Rough Set Method, Apriori Algorithm, Typhoid Fever

Universitas Sumatera Utara

xi

DAFTAR ISI

Hal
HALAMAN JUDUL TESIS
LEMBAR PERSETUJUAN
LEMBAR PERNYATAAN ORISINALITAS
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI
LEMBAR PENITIA PENGUJI TESIS
RIWAYAT HIDUP
KATA PENGANTAR
ABSTRAK
ABSTRACT
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
BAB I PENDAHULUAN
1.1. Latar Belakang
1.2. Rumusan Masalah
1.3. Batasan Masalah
1.4. Tujuan Penelitian
1.5. Manfaat Penelitian
BAB II TINJAUAN PUSTAKA
2.1. Data Mining
2.1.1. Data Cleaning
2.2.2. Data Transformation
2.2. Teori Rough Set
2.2.1. Information System dan Decision System
2.2.2. Indicernibility Relation
2.2.3. Equvalence Class
2.2.4. Discernibility Matrix
2.2.5. Discernibility Matrix Modulo D
2.2.6. Reduct
2.2.7. Generating Rules
2.3. Algoritma Apriori
2.3.1. Classification-Based Association
2.4. Penelitian Terdahulu

i
ii
iii
iv
v
vi
vii
ix
x
xi
xiii
xiv
1
1
3
3
4
4
5
5
5
7
8
10
11
12
12
12
13
13
14
16
17

Universitas Sumatera Utara

xii

2.5. Perbedaan dengan Penelitian Sebelumnya

29

BAB III METODOLOGI PENELITIAN
3.1. Diagram Blok Penelitian
3.2. Data Collection
3.3. Tabulasi Data Penelitian
3.4. Pre Prosessing
3.4.1. Data Cleaning
3.4.2. Data Transformation
3.5. Analisis Metode Rough Set
3.5.1. Representasi Data
3.5.2. Indicernibility Relation
3.5.3. Equivalence Class
3.5.4. Discernibility Matrix
3.5.5. Discernibility Matrix Mod D
3.5.6. Reduct
3.5.7. Generating Rules
3.6. Analisis Penerapan Algoritma Apriori
3.6.1. Pola Gejala Penyakit Demam Tifoid
3.6.2. Pembentukan Aturan Asosiasi
3.6.3. Pembentukan Aturan Asosiasi Final

20
21
21
22
22
23
23
24
24
26
27
27
28
29
29
30
31
36
37

BAB IV HASIL DAN PEMBAHASAN
4.1. Pendahuluan
4.2. Pra Pengolahan Data
4.3. Hasil Implementasi Menggunakan Metode Rough Set
4.3.1. Reduct
4.3.2. Generating Rules
4.4. Analisa Penerapan Algoritma Apriori

38
38
38
39
40
40
42

BAB V KESIMPULAN DAN SARAN
5.1. Kesimpulan
5.2. Saran
DAFTAR PUSTAKA
LAMPIRAN 1

45
45
45
46
48

Universitas Sumatera Utara

xiii

DAFTAR TABEL

Hal
TABEL 2.1.
TABEL 2.2.
TABEL 2.3.
TABEL 2.4.
TABEL 2.5.
TABEL 2.6.
TABEL 2.7.
TABEL 2.8.
TABEL 2.9.
TABEL 2.10.
TABEL 2.11.
TABEL 3.1.
TABEL 3.2.
TABEL 3.3.
TABEL 3.4.
TABEL 3.5.
TABEL 3.6.
TABEL 3.7.
TABEL 3.8.
TABEL 3.9.
TABEL 3.10.
TABEL 3.11.
TABEL 3.12.
TABEL 3.13.
TABEL 3.14.
TABEL 3.15.
TABEL 3.16.
TABEL 3.17.
TABEL 3.18.
TABEL 4.1.
TABEL 4.2.

Data Tidak Lengkap
Data Lengkap
Data Transformasi
Hasil Data Transformasi
Information System
Information System dengan Atribut Keputusan
Equivalence Class
Discernibility Matrix
Discernibility Matrix Mod D
Reduct
Penelitian Terdahulu
Data Primer
Hasil Tabulasi Data Penelitian
Tabel Data Transformation
Information System
Decision System
Equivalence Class
Discernibility Matrix
Discernibility Matrix Mod D
Reduct
Pola Gejala Penyakit Demam Tifoid
Support Dari Tiap Item
Pola Kombinasi 2 Itemset
Tabel Kombinasi 2 Itemset Memenuhi Minimal Support
Pola Kombinasi 3 Itemset
Tabel Kombinasi 3 Itemset memenuhi Minimal Support
Pola Kombinasi 4 Itemset
Aturan Asosiasi
Aturan Asosiasi Final
Akurasi Rule Rough Set
Akurasi Rule Apriori

6
6
7
7
10
11
12
12
13
13
18
21
21
23
25
25
27
28
28
29
31
32
32
33
34
35
35
37
37
41
44

Universitas Sumatera Utara

xiv

DAFTAR GAMBAR

Hal
GAMBAR 3.1.
GAMBAR 3.2.
GAMBAR 3.3.
GAMBAR 3.4.
GAMBAR 4.1.
GAMBAR 4.2.
GAMBAR 4.3.
GAMBAR 4.4.
GAMBAR 4.5.
GAMBAR 4.6.

Diagram Blok Penelitian
Data Awal
Hasil Data Cleaning
Hasil Transformasi Data
Data Dalam Bentuk Excel
Tampilan Hasil Import Data Rosetta
Hasil Reduct
Hasil Generating Rule
Data dalam Bentuk Excel
Hasil Rules Apriori

20
22
23
24
39
39
40
41
42
43

Universitas Sumatera Utara