Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
BENY IRAWAN
137038012
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2016
Universitas Sumatera Utara
ii
PERSETUJUAN
Judul
: ANALISIS KINERJA METODE ROUGH SET DAN
ALGORITMA APRIORI DALAM IDENTIFIKASI
POLA PENYAKIT DEMAM TIFOID
Kategori
: TESIS
Nama
: BENY IRAWAN
Nomor induk mahasiswa
: 137038012
Program studi
: MAGISTER (S2) TEKNIK INFORMATIKA
Fakultas
: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
:
Komisi pembimbing
Pembimbing II,
Pembimbing I,
Dr. Erna Budhiarti Nababan, M.IT
Prof. Dr. Opim Salim Sitompul,M.Sc
Diketahui/disetujui Oleh
Program Studi S2 Teknik Informatika
Ketua,
Prof. Dr. Muhammad Zarlis, M.Sc
NIP. 19570701 198601 1 003
Universitas Sumatera Utara
iii
PERNYATAAN
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 23 Agustus 2016
Beny Irawan
NIM. 137038012
Universitas Sumatera Utara
iv
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai civitas akademik Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini :
Nama
Nim
Program Studi
: Beny Irawan
: 137038012
: Magister (S2) Teknik Informatika
Demi pengembangan ilmu pengetahuan, menyetujui memberikan kepada Universitas
Sumatera Utara Hak Bebas Royaliti Non-Ekslusif (Non-Exclusive Royality Free
Right) atas tesis saya yang berjudul :
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
Beserta perangkat yang ada (jika diperlukan). Dengan hak bebas Royaliti NonExclusive ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 23 Agustus 2016
Beny Irawan
NIM. 137038012
Universitas Sumatera Utara
v
Telah di uji pada
Tanggal: 23 Agustus 2016
PANITIA PENGUJI TESIS
Ketua
: Prof. Dr. Opim Salim Sitompul, M.Sc
Anggota
: 1. Dr. Erna Budhiarti Nababan, M.IT
2. Prof. Dr. Tulus, Vor.Dipl.Math, M.Si
4. Prof. Dr. Muhammad Zarlis, M.Sc
Universitas Sumatera Utara
vi
DAFTAR RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap
Tempat dan Tanggal Lahir
Alamat Rumah
Telp/Fax/HP
E-mail
Instansi Tempat Bekerja
Alamat Kantor
: Beny Irawan
: Peureulak, 29 Agustus 1987
: Dsn Tanjung Tani Desa Paya Palas Kec.Ranto
Peureulak Aceh Timur
: 08126454174
: benyirawan77@gmail.com
: Medistra Lubuk Pakam
: Jl. Sudirman No.38 Lubuk Pakam Kab. Deli
Serdang 20512 Sumatera Utara – Indonesia
DATA PENDIDIKAN
SD
SLTP
SLTA
S1
S2
: SD Negeri 1 Tanjung Tani
: MTSs Nurul Ulum Aceh Timur
: SMA Negeri 15 Medan
: Teknik Informatika STT Harapan Medan
: Teknik Informatika USU
TAMAT : 1999
TAMAT : 2002
TAMAT : 2005
TAMAT : 2010
TAMAT : 2016
Universitas Sumatera Utara
vii
KATA PENGANTAR
Pertama-tama penulis panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas
segala rahmat, berkat dan karunia-Nya berupa pengetahuan, kesehatan dan
kesempatan yang diberikan kepada penulis sehingga dapat menyelesaikan tesis ini
dengan baik. Tesis penulis yang berjudul : “Analisis Kinerja Metode Rough Set Dan
Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid” merupakan salah
satu syarat akademik penulis sebagai mahasiswa S2, Program Studi Teknik
Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI),
Universitas Sumatera Utara (USU), Medan dalam menyelesaikan jenjang pendidikan
S2.
Dalam kesempatan ini, penulis hendak memberikan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada :
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH,
M.Hum atas kesempatan yang diberikan kepada penulis untuk mengikuti dan
menyelesaikan pendidikan Program Pascasarjana.
2. Dekan Fakultas Ilmu Komputer Universitas Sumatera Utara Bapak Prof. Dr.
Opim Salim Sitompul, M.Sc, Ketua Program Studi Magister (S2) Teknik
Informatika, Bapak Prof. Dr. Muhammad Zarlis, M.Sc dan Sekretaris Program
Studi Magister (S2) Teknik Informatika, Bapak M. Andri Budiman, S.T,
M.Comp.Sc., M.E.M beserta seluruh dosen yang telah banyak memberikan
ilmu pengetahuan selama masa perkuliahan serta seluruh staf pegawai pada
Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
3. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Opim Salim Sitompul, M.Sc, selaku
pembimbing utama dan Ibu Dr. Erna Budhiarti Nababan, M.IT, selaku
pembimbing kedua yang telah banyak memberikan bimbingan, tuntunan,
masukan serta motivasi kepada penulis hingga selesainya tesis ini.
Universitas Sumatera Utara
viii
4. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Tulus, Vor.Dipl.Math, M.Si dan Bapak Prof.
Dr. Muhammad Zarlis, M.Sc selaku pembanding/penguji tesis yang senantiasa
memberikan saran, masukan dan arahan kepada penulis dalam penyelesaian
penulisan tesis ini.
Secara khusus penulis mengucapkan rasa terima kasih sedalam-dalamnya
kepada orang tua penulis tercinta dan tersayang, Ayahanda Munzir, Ibunda Fatimah,
kakak penulis Sri Mutia, AMK, S.ARS dan adik-adik penulis Aida Muliana, S.Pd,
Muzirullah, Aulia Syahputra yang telah memberikan perhatian, kasih sayang, motivasi
serta dukungan berupa material dan spiritual kepada penulis.
Penulis juga meyampaikan rasa terima kasih kepada Yuzra Yahya, S.Kep yang
telah membantu dalam pengumpulan data penelitian beserta seluruh keluarga dan
berbagai pihak yang telah banyak membantu, memberikan motivasi, perhatian serta
dukungan kepada penulis. Tak lupa untuk rekan-rekan penulis selama menempuh
pendidikan Magister yang sudah penulis anggap sebagai keluarga yaitu kelas Kom-B
2013, terima kasih untuk kekompakan, keakraban, dan kerjasama selama ini. Penulis
pasti sangat merindukan kalian.
Penulis menyadari bahwa masih terdapat kekurangan dalam penyusunan tesis
ini. Oleh karena itu, penulis mengharapkan kritik dan saran dari pembaca demi
kesempurnaan penelitian selanjutnya.
Akhir kata, penulis berharap semoga tesis ini dapat dikembangkan lagi
menjadi lebih baik dan bermanfaat bagi semua pihak khususnya dalam dunia
pendidikan dan teknologi.
Medan, 23 Agustus 2016
Beny Irawan
NIM 137038012
Universitas Sumatera Utara
ix
ABSTRAK
Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah
sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat tidaklah
mudah, penelitian ini dapat membantu para pengambil keputusan serta menjadikan
sebagai perbandingan. peneliti melakukan teknik data mining untuk analisa kinerja
metode rough set dan algoritma apriori, kegunaan dari metode rough set yaitu
mendapat perkiraan aturan yang singkat dengan fungsi reduksi, sedangkan algoritma
apriori dapat mencari kombinasi item set yang sering muncul dalam basis data dengan
memperhatikan minimum support (minsup), proses utama yang dilakukan algoritma
apriori adalah join (penggabungan) dan prune (pemangkasan). Tujuan penelitian ini
meningkatkan akurasi metode rough set dan algoritma apriori untuk mendapatkan
akurasi identifikasi penyakit demam tifoid. Variabel input awal yang digunakan
sebanyak tujuh varibel. Dari hasil penelitian yang dilakukan pada dataset penyakit
demam tifoid, metode rough set menghasilkan empat panjang rule dan algoritma
apriori menghasilkan tiga panjang rule, sedangkan nilai rata-rata akurasi yang
dihasilkan sebesar 87,4% dari kedua metode yang digunakan.
Kata Kunci : Metode Rough Set, Algoritma Apriori, Demam Tifoid
Universitas Sumatera Utara
x
PERFORMANCE ANALYSIS ROUGH SET METHOD AND APRIORI
ALGORITHM IN IDENTIFICATION PATTERN OF
TYPHOID FEVER DIASEASE
ABSTRACT
An element that is very important and everyday needs at this time is an information, to
get a right and accurate information is not easy, this research can help the decision
maker and to make a comparison. The Researcher did the data mining techniques for
make analysis rough sets methods and apriori algorithms, the usefulness of rough set
method that got a brief estimate of the rules with the reduction function, whereas the
Apriori algorithm can find the combination of set items that often appear in the
database by taking into account the minimum support (minsup), the main process has
been done apriori algorithm was join and prune. The purpose of this research to
increases the accuracy of the rough set methods and apriori algorithms to obtain
accurate identification of typhoid fever. Initial input variables used seven variables.
From the results of this research was conducted on a dataset of typhoid fever, rough
set method produces four long rule and apriori algorithm produced three long rule,
while the average value of the resulting accuracy of 87.4% from the second method is
used.
Keywords : Rough Set Method, Apriori Algorithm, Typhoid Fever
Universitas Sumatera Utara
xi
DAFTAR ISI
Hal
HALAMAN JUDUL TESIS
LEMBAR PERSETUJUAN
LEMBAR PERNYATAAN ORISINALITAS
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI
LEMBAR PENITIA PENGUJI TESIS
RIWAYAT HIDUP
KATA PENGANTAR
ABSTRAK
ABSTRACT
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
BAB I PENDAHULUAN
1.1. Latar Belakang
1.2. Rumusan Masalah
1.3. Batasan Masalah
1.4. Tujuan Penelitian
1.5. Manfaat Penelitian
BAB II TINJAUAN PUSTAKA
2.1. Data Mining
2.1.1. Data Cleaning
2.2.2. Data Transformation
2.2. Teori Rough Set
2.2.1. Information System dan Decision System
2.2.2. Indicernibility Relation
2.2.3. Equvalence Class
2.2.4. Discernibility Matrix
2.2.5. Discernibility Matrix Modulo D
2.2.6. Reduct
2.2.7. Generating Rules
2.3. Algoritma Apriori
2.3.1. Classification-Based Association
2.4. Penelitian Terdahulu
i
ii
iii
iv
v
vi
vii
ix
x
xi
xiii
xiv
1
1
3
3
4
4
5
5
5
7
8
10
11
12
12
12
13
13
14
16
17
Universitas Sumatera Utara
xii
2.5. Perbedaan dengan Penelitian Sebelumnya
29
BAB III METODOLOGI PENELITIAN
3.1. Diagram Blok Penelitian
3.2. Data Collection
3.3. Tabulasi Data Penelitian
3.4. Pre Prosessing
3.4.1. Data Cleaning
3.4.2. Data Transformation
3.5. Analisis Metode Rough Set
3.5.1. Representasi Data
3.5.2. Indicernibility Relation
3.5.3. Equivalence Class
3.5.4. Discernibility Matrix
3.5.5. Discernibility Matrix Mod D
3.5.6. Reduct
3.5.7. Generating Rules
3.6. Analisis Penerapan Algoritma Apriori
3.6.1. Pola Gejala Penyakit Demam Tifoid
3.6.2. Pembentukan Aturan Asosiasi
3.6.3. Pembentukan Aturan Asosiasi Final
20
21
21
22
22
23
23
24
24
26
27
27
28
29
29
30
31
36
37
BAB IV HASIL DAN PEMBAHASAN
4.1. Pendahuluan
4.2. Pra Pengolahan Data
4.3. Hasil Implementasi Menggunakan Metode Rough Set
4.3.1. Reduct
4.3.2. Generating Rules
4.4. Analisa Penerapan Algoritma Apriori
38
38
38
39
40
40
42
BAB V KESIMPULAN DAN SARAN
5.1. Kesimpulan
5.2. Saran
DAFTAR PUSTAKA
LAMPIRAN 1
45
45
45
46
48
Universitas Sumatera Utara
xiii
DAFTAR TABEL
Hal
TABEL 2.1.
TABEL 2.2.
TABEL 2.3.
TABEL 2.4.
TABEL 2.5.
TABEL 2.6.
TABEL 2.7.
TABEL 2.8.
TABEL 2.9.
TABEL 2.10.
TABEL 2.11.
TABEL 3.1.
TABEL 3.2.
TABEL 3.3.
TABEL 3.4.
TABEL 3.5.
TABEL 3.6.
TABEL 3.7.
TABEL 3.8.
TABEL 3.9.
TABEL 3.10.
TABEL 3.11.
TABEL 3.12.
TABEL 3.13.
TABEL 3.14.
TABEL 3.15.
TABEL 3.16.
TABEL 3.17.
TABEL 3.18.
TABEL 4.1.
TABEL 4.2.
Data Tidak Lengkap
Data Lengkap
Data Transformasi
Hasil Data Transformasi
Information System
Information System dengan Atribut Keputusan
Equivalence Class
Discernibility Matrix
Discernibility Matrix Mod D
Reduct
Penelitian Terdahulu
Data Primer
Hasil Tabulasi Data Penelitian
Tabel Data Transformation
Information System
Decision System
Equivalence Class
Discernibility Matrix
Discernibility Matrix Mod D
Reduct
Pola Gejala Penyakit Demam Tifoid
Support Dari Tiap Item
Pola Kombinasi 2 Itemset
Tabel Kombinasi 2 Itemset Memenuhi Minimal Support
Pola Kombinasi 3 Itemset
Tabel Kombinasi 3 Itemset memenuhi Minimal Support
Pola Kombinasi 4 Itemset
Aturan Asosiasi
Aturan Asosiasi Final
Akurasi Rule Rough Set
Akurasi Rule Apriori
6
6
7
7
10
11
12
12
13
13
18
21
21
23
25
25
27
28
28
29
31
32
32
33
34
35
35
37
37
41
44
Universitas Sumatera Utara
xiv
DAFTAR GAMBAR
Hal
GAMBAR 3.1.
GAMBAR 3.2.
GAMBAR 3.3.
GAMBAR 3.4.
GAMBAR 4.1.
GAMBAR 4.2.
GAMBAR 4.3.
GAMBAR 4.4.
GAMBAR 4.5.
GAMBAR 4.6.
Diagram Blok Penelitian
Data Awal
Hasil Data Cleaning
Hasil Transformasi Data
Data Dalam Bentuk Excel
Tampilan Hasil Import Data Rosetta
Hasil Reduct
Hasil Generating Rule
Data dalam Bentuk Excel
Hasil Rules Apriori
20
22
23
24
39
39
40
41
42
43
Universitas Sumatera Utara
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
BENY IRAWAN
137038012
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2016
Universitas Sumatera Utara
ii
PERSETUJUAN
Judul
: ANALISIS KINERJA METODE ROUGH SET DAN
ALGORITMA APRIORI DALAM IDENTIFIKASI
POLA PENYAKIT DEMAM TIFOID
Kategori
: TESIS
Nama
: BENY IRAWAN
Nomor induk mahasiswa
: 137038012
Program studi
: MAGISTER (S2) TEKNIK INFORMATIKA
Fakultas
: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
:
Komisi pembimbing
Pembimbing II,
Pembimbing I,
Dr. Erna Budhiarti Nababan, M.IT
Prof. Dr. Opim Salim Sitompul,M.Sc
Diketahui/disetujui Oleh
Program Studi S2 Teknik Informatika
Ketua,
Prof. Dr. Muhammad Zarlis, M.Sc
NIP. 19570701 198601 1 003
Universitas Sumatera Utara
iii
PERNYATAAN
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 23 Agustus 2016
Beny Irawan
NIM. 137038012
Universitas Sumatera Utara
iv
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai civitas akademik Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini :
Nama
Nim
Program Studi
: Beny Irawan
: 137038012
: Magister (S2) Teknik Informatika
Demi pengembangan ilmu pengetahuan, menyetujui memberikan kepada Universitas
Sumatera Utara Hak Bebas Royaliti Non-Ekslusif (Non-Exclusive Royality Free
Right) atas tesis saya yang berjudul :
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
Beserta perangkat yang ada (jika diperlukan). Dengan hak bebas Royaliti NonExclusive ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 23 Agustus 2016
Beny Irawan
NIM. 137038012
Universitas Sumatera Utara
v
Telah di uji pada
Tanggal: 23 Agustus 2016
PANITIA PENGUJI TESIS
Ketua
: Prof. Dr. Opim Salim Sitompul, M.Sc
Anggota
: 1. Dr. Erna Budhiarti Nababan, M.IT
2. Prof. Dr. Tulus, Vor.Dipl.Math, M.Si
4. Prof. Dr. Muhammad Zarlis, M.Sc
Universitas Sumatera Utara
vi
DAFTAR RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap
Tempat dan Tanggal Lahir
Alamat Rumah
Telp/Fax/HP
Instansi Tempat Bekerja
Alamat Kantor
: Beny Irawan
: Peureulak, 29 Agustus 1987
: Dsn Tanjung Tani Desa Paya Palas Kec.Ranto
Peureulak Aceh Timur
: 08126454174
: benyirawan77@gmail.com
: Medistra Lubuk Pakam
: Jl. Sudirman No.38 Lubuk Pakam Kab. Deli
Serdang 20512 Sumatera Utara – Indonesia
DATA PENDIDIKAN
SD
SLTP
SLTA
S1
S2
: SD Negeri 1 Tanjung Tani
: MTSs Nurul Ulum Aceh Timur
: SMA Negeri 15 Medan
: Teknik Informatika STT Harapan Medan
: Teknik Informatika USU
TAMAT : 1999
TAMAT : 2002
TAMAT : 2005
TAMAT : 2010
TAMAT : 2016
Universitas Sumatera Utara
vii
KATA PENGANTAR
Pertama-tama penulis panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas
segala rahmat, berkat dan karunia-Nya berupa pengetahuan, kesehatan dan
kesempatan yang diberikan kepada penulis sehingga dapat menyelesaikan tesis ini
dengan baik. Tesis penulis yang berjudul : “Analisis Kinerja Metode Rough Set Dan
Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid” merupakan salah
satu syarat akademik penulis sebagai mahasiswa S2, Program Studi Teknik
Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI),
Universitas Sumatera Utara (USU), Medan dalam menyelesaikan jenjang pendidikan
S2.
Dalam kesempatan ini, penulis hendak memberikan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada :
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH,
M.Hum atas kesempatan yang diberikan kepada penulis untuk mengikuti dan
menyelesaikan pendidikan Program Pascasarjana.
2. Dekan Fakultas Ilmu Komputer Universitas Sumatera Utara Bapak Prof. Dr.
Opim Salim Sitompul, M.Sc, Ketua Program Studi Magister (S2) Teknik
Informatika, Bapak Prof. Dr. Muhammad Zarlis, M.Sc dan Sekretaris Program
Studi Magister (S2) Teknik Informatika, Bapak M. Andri Budiman, S.T,
M.Comp.Sc., M.E.M beserta seluruh dosen yang telah banyak memberikan
ilmu pengetahuan selama masa perkuliahan serta seluruh staf pegawai pada
Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
3. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Opim Salim Sitompul, M.Sc, selaku
pembimbing utama dan Ibu Dr. Erna Budhiarti Nababan, M.IT, selaku
pembimbing kedua yang telah banyak memberikan bimbingan, tuntunan,
masukan serta motivasi kepada penulis hingga selesainya tesis ini.
Universitas Sumatera Utara
viii
4. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Tulus, Vor.Dipl.Math, M.Si dan Bapak Prof.
Dr. Muhammad Zarlis, M.Sc selaku pembanding/penguji tesis yang senantiasa
memberikan saran, masukan dan arahan kepada penulis dalam penyelesaian
penulisan tesis ini.
Secara khusus penulis mengucapkan rasa terima kasih sedalam-dalamnya
kepada orang tua penulis tercinta dan tersayang, Ayahanda Munzir, Ibunda Fatimah,
kakak penulis Sri Mutia, AMK, S.ARS dan adik-adik penulis Aida Muliana, S.Pd,
Muzirullah, Aulia Syahputra yang telah memberikan perhatian, kasih sayang, motivasi
serta dukungan berupa material dan spiritual kepada penulis.
Penulis juga meyampaikan rasa terima kasih kepada Yuzra Yahya, S.Kep yang
telah membantu dalam pengumpulan data penelitian beserta seluruh keluarga dan
berbagai pihak yang telah banyak membantu, memberikan motivasi, perhatian serta
dukungan kepada penulis. Tak lupa untuk rekan-rekan penulis selama menempuh
pendidikan Magister yang sudah penulis anggap sebagai keluarga yaitu kelas Kom-B
2013, terima kasih untuk kekompakan, keakraban, dan kerjasama selama ini. Penulis
pasti sangat merindukan kalian.
Penulis menyadari bahwa masih terdapat kekurangan dalam penyusunan tesis
ini. Oleh karena itu, penulis mengharapkan kritik dan saran dari pembaca demi
kesempurnaan penelitian selanjutnya.
Akhir kata, penulis berharap semoga tesis ini dapat dikembangkan lagi
menjadi lebih baik dan bermanfaat bagi semua pihak khususnya dalam dunia
pendidikan dan teknologi.
Medan, 23 Agustus 2016
Beny Irawan
NIM 137038012
Universitas Sumatera Utara
ix
ABSTRAK
Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah
sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat tidaklah
mudah, penelitian ini dapat membantu para pengambil keputusan serta menjadikan
sebagai perbandingan. peneliti melakukan teknik data mining untuk analisa kinerja
metode rough set dan algoritma apriori, kegunaan dari metode rough set yaitu
mendapat perkiraan aturan yang singkat dengan fungsi reduksi, sedangkan algoritma
apriori dapat mencari kombinasi item set yang sering muncul dalam basis data dengan
memperhatikan minimum support (minsup), proses utama yang dilakukan algoritma
apriori adalah join (penggabungan) dan prune (pemangkasan). Tujuan penelitian ini
meningkatkan akurasi metode rough set dan algoritma apriori untuk mendapatkan
akurasi identifikasi penyakit demam tifoid. Variabel input awal yang digunakan
sebanyak tujuh varibel. Dari hasil penelitian yang dilakukan pada dataset penyakit
demam tifoid, metode rough set menghasilkan empat panjang rule dan algoritma
apriori menghasilkan tiga panjang rule, sedangkan nilai rata-rata akurasi yang
dihasilkan sebesar 87,4% dari kedua metode yang digunakan.
Kata Kunci : Metode Rough Set, Algoritma Apriori, Demam Tifoid
Universitas Sumatera Utara
x
PERFORMANCE ANALYSIS ROUGH SET METHOD AND APRIORI
ALGORITHM IN IDENTIFICATION PATTERN OF
TYPHOID FEVER DIASEASE
ABSTRACT
An element that is very important and everyday needs at this time is an information, to
get a right and accurate information is not easy, this research can help the decision
maker and to make a comparison. The Researcher did the data mining techniques for
make analysis rough sets methods and apriori algorithms, the usefulness of rough set
method that got a brief estimate of the rules with the reduction function, whereas the
Apriori algorithm can find the combination of set items that often appear in the
database by taking into account the minimum support (minsup), the main process has
been done apriori algorithm was join and prune. The purpose of this research to
increases the accuracy of the rough set methods and apriori algorithms to obtain
accurate identification of typhoid fever. Initial input variables used seven variables.
From the results of this research was conducted on a dataset of typhoid fever, rough
set method produces four long rule and apriori algorithm produced three long rule,
while the average value of the resulting accuracy of 87.4% from the second method is
used.
Keywords : Rough Set Method, Apriori Algorithm, Typhoid Fever
Universitas Sumatera Utara
xi
DAFTAR ISI
Hal
HALAMAN JUDUL TESIS
LEMBAR PERSETUJUAN
LEMBAR PERNYATAAN ORISINALITAS
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI
LEMBAR PENITIA PENGUJI TESIS
RIWAYAT HIDUP
KATA PENGANTAR
ABSTRAK
ABSTRACT
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
BAB I PENDAHULUAN
1.1. Latar Belakang
1.2. Rumusan Masalah
1.3. Batasan Masalah
1.4. Tujuan Penelitian
1.5. Manfaat Penelitian
BAB II TINJAUAN PUSTAKA
2.1. Data Mining
2.1.1. Data Cleaning
2.2.2. Data Transformation
2.2. Teori Rough Set
2.2.1. Information System dan Decision System
2.2.2. Indicernibility Relation
2.2.3. Equvalence Class
2.2.4. Discernibility Matrix
2.2.5. Discernibility Matrix Modulo D
2.2.6. Reduct
2.2.7. Generating Rules
2.3. Algoritma Apriori
2.3.1. Classification-Based Association
2.4. Penelitian Terdahulu
i
ii
iii
iv
v
vi
vii
ix
x
xi
xiii
xiv
1
1
3
3
4
4
5
5
5
7
8
10
11
12
12
12
13
13
14
16
17
Universitas Sumatera Utara
xii
2.5. Perbedaan dengan Penelitian Sebelumnya
29
BAB III METODOLOGI PENELITIAN
3.1. Diagram Blok Penelitian
3.2. Data Collection
3.3. Tabulasi Data Penelitian
3.4. Pre Prosessing
3.4.1. Data Cleaning
3.4.2. Data Transformation
3.5. Analisis Metode Rough Set
3.5.1. Representasi Data
3.5.2. Indicernibility Relation
3.5.3. Equivalence Class
3.5.4. Discernibility Matrix
3.5.5. Discernibility Matrix Mod D
3.5.6. Reduct
3.5.7. Generating Rules
3.6. Analisis Penerapan Algoritma Apriori
3.6.1. Pola Gejala Penyakit Demam Tifoid
3.6.2. Pembentukan Aturan Asosiasi
3.6.3. Pembentukan Aturan Asosiasi Final
20
21
21
22
22
23
23
24
24
26
27
27
28
29
29
30
31
36
37
BAB IV HASIL DAN PEMBAHASAN
4.1. Pendahuluan
4.2. Pra Pengolahan Data
4.3. Hasil Implementasi Menggunakan Metode Rough Set
4.3.1. Reduct
4.3.2. Generating Rules
4.4. Analisa Penerapan Algoritma Apriori
38
38
38
39
40
40
42
BAB V KESIMPULAN DAN SARAN
5.1. Kesimpulan
5.2. Saran
DAFTAR PUSTAKA
LAMPIRAN 1
45
45
45
46
48
Universitas Sumatera Utara
xiii
DAFTAR TABEL
Hal
TABEL 2.1.
TABEL 2.2.
TABEL 2.3.
TABEL 2.4.
TABEL 2.5.
TABEL 2.6.
TABEL 2.7.
TABEL 2.8.
TABEL 2.9.
TABEL 2.10.
TABEL 2.11.
TABEL 3.1.
TABEL 3.2.
TABEL 3.3.
TABEL 3.4.
TABEL 3.5.
TABEL 3.6.
TABEL 3.7.
TABEL 3.8.
TABEL 3.9.
TABEL 3.10.
TABEL 3.11.
TABEL 3.12.
TABEL 3.13.
TABEL 3.14.
TABEL 3.15.
TABEL 3.16.
TABEL 3.17.
TABEL 3.18.
TABEL 4.1.
TABEL 4.2.
Data Tidak Lengkap
Data Lengkap
Data Transformasi
Hasil Data Transformasi
Information System
Information System dengan Atribut Keputusan
Equivalence Class
Discernibility Matrix
Discernibility Matrix Mod D
Reduct
Penelitian Terdahulu
Data Primer
Hasil Tabulasi Data Penelitian
Tabel Data Transformation
Information System
Decision System
Equivalence Class
Discernibility Matrix
Discernibility Matrix Mod D
Reduct
Pola Gejala Penyakit Demam Tifoid
Support Dari Tiap Item
Pola Kombinasi 2 Itemset
Tabel Kombinasi 2 Itemset Memenuhi Minimal Support
Pola Kombinasi 3 Itemset
Tabel Kombinasi 3 Itemset memenuhi Minimal Support
Pola Kombinasi 4 Itemset
Aturan Asosiasi
Aturan Asosiasi Final
Akurasi Rule Rough Set
Akurasi Rule Apriori
6
6
7
7
10
11
12
12
13
13
18
21
21
23
25
25
27
28
28
29
31
32
32
33
34
35
35
37
37
41
44
Universitas Sumatera Utara
xiv
DAFTAR GAMBAR
Hal
GAMBAR 3.1.
GAMBAR 3.2.
GAMBAR 3.3.
GAMBAR 3.4.
GAMBAR 4.1.
GAMBAR 4.2.
GAMBAR 4.3.
GAMBAR 4.4.
GAMBAR 4.5.
GAMBAR 4.6.
Diagram Blok Penelitian
Data Awal
Hasil Data Cleaning
Hasil Transformasi Data
Data Dalam Bentuk Excel
Tampilan Hasil Import Data Rosetta
Hasil Reduct
Hasil Generating Rule
Data dalam Bentuk Excel
Hasil Rules Apriori
20
22
23
24
39
39
40
41
42
43
Universitas Sumatera Utara