Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid
BAB 1
PENDAHULUAN
1.1. Latar Belakang
Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah
adalah sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat
tidaklah mudah. Informasi yang tersedia dalam jumlah yang besar terkadang masih
harus kita gali terlebih dahulu agar informasi tersebut dapat menyajikan informasi
yang tepat dan sesuai dengan kebutuhan. Untuk dapat menggali informasi yang
berpotensi dari gudang data tidak bisa hanya mengandalkan data operasional saja,
namun diperlukan suatu analisis data yang tepat sehingga menghasilkan informasi
yang akurat dan berharga bagi yang membutuhkannya, untuk membantu para
pengambil keputusan serta menjadikan perbandingan, peneliti melakukan teknik data
mining untuk analisa kinerja metode rough set dan algoritma apriori.
Data mining merupakan teknik yang menggabungkan teknik analisis data
tradisional dengan algoritma untuk pemrosesan data dalam jumlah yang besar.
Data mining dapat digunakan untuk melakukan analisis data dan menemukan polapola penting pada data. Secara sederhana, data mining atau penambangan data
dapat didefinisikan sebagai proses seleksi, eksplorasi dan pemodelan dari sejumlah
besar data untuk menemukan pola atau kecenderungan yang biasanya tidak
disadari keberadaannya (Turban, et al. 2005). Dalam data mining, data disimpan
secara elektronik dan diproses secara otomatis oleh komputer mengunakan teknik dan
perhitungan tertentu (Berry & Linoff, 2004). Data mining tersebut akan menjadi
acuan untuk mengambil keputusan. Pengolahan data mining dapat dilakukan dengan
beberapa teknik diantaranya adalah Metode Rough set, Fuzzy, Algoritma Apriori dan
lain - lain.
Universitas Sumatera Utara
2
Beberapa penelitian terdahulu terkait dengan analisis kinerja metode rough set dan
algoritma apriori dari berbagai kasus antara lain yaitu penelitian yang dilakukan oleh
(Adeyemo, et al. 2015), melakukan penelitian tentang diagnosa demam tifoid
menggunakan tiga metode yaitu ID3, C45 dan Multilayer Perceptron (MLP), dari hasil
penelitian tersebut MLP memiliki tinggi akurasi terbaik dibandingkan dengan kedua
metode lainnya, akan tetapi dalam hal kecepatan algoritma C45 ditemukan menjadi
yang terbaik dalam data training; (Oguntimilehin, et al. 2013), melakukan sebuah
pendekatan untuk diagnosa demam tifoid menggunakan teknik machine learning yang
dikembangkan dalam penelitian ini dan kinerja sistem diukur pada kedua set
pelatihan dan pengujian; (Budiono, et al. 2014) dalam penelitiannya melakukan
identifikasi dan pencarian informasi mengenai pola penyakit radang sendi dengan
teknik data mining association rule menggunakan algoritma apriori, penelitian ini
menampilkan informasi berupa nilai support dan confidence hubungan antara pola
penyakit radang sendi dengan atribut umur, jenis kelamin, pekerjaan dan gejala.
Metode Rough set adalah sebuah teknik matematik yang dikembangkan sejak
tahun 1980. Teknik ini digunakan untuk menangani masalah Uncertainty, Imprecision
dan Vagueness dalam aplikasi Artificial Intelligence (AI) (Listiana, et al. 2012).
Rough set menawarkan dua bentuk representasi data yaitu:
1. Information Systems (IS) adalah tabel yang terdiri dari baris yang
merepresentasikan data dan kolom yang merepresentasikan atribut atau
variabel dari data. Information system pada data mining dikenal dengan nama
dataset. Information system dapat direpresentasikan sebagai fungsi A = (U,
A),
dimana
U adalah
himpunan tidak
kosong dari
objek
yang
direpresentasikan dan A adalah himpunan tidak kosong dari atribut atau
variabel.
2. Decision Systems (DS) information system dengan atribut tambahan yang
dinamakan dengan decision atribute, dalam data mining dikenal dengan
nama kelas atau target. Atribut ini merepresentasikan hasil dari klasifikasi
yang diketahui. Information System (IS) menjadi IS = (U, {A,C}), contoh
Information System (IS) yang didalamnya terdapat objek (U), atribut kondisi
(A) dan atribut keputusan (C). (Hakim & Rusli, 2013)
Universitas Sumatera Utara
3
Kelebihan utama menggunakan roughset adalah bahwa roughset tidak membutuhkan
data awal atau data tambahan seperti probabilitas pada teori probabilitas, tingkat
keanggotaan pada teori fuzzy (Li, et al. 2007). Dalam rough set, kumpulan objek
disebut sebagai information system (IS). Dari IS tersebut objek-objek diklasifikasikan
kedalam area-area tertentu yang disebut dengan lower approximation,
region, dan
boundary
outside region. Dari pengelompokan area tersebut, dapat dilakukan
perhitungan dependensi antar atribut, reduksi atribut, rule generation sehingga dapat
diperoleh rule dari data set yang digunakan. Untuk mendapatkan hasil identifikasi
tentang asosiasi antar pola dari suatu penyakit demam tifoid, peneliti menggunakan
algoritma apriori.
Algoritma Apriori merupakan sebuah algoritma untuk mencari kombinasi item
set yang mempunyai suatu nilai keseringan tertentu sesuai kriteria atau filter yang
diinginkan dengan cara memperhatikan minimum support (minsup). Adapun dua
proses utama yang dilakukan algoritma Apriori (Jiawei & Kamber, 2006), yaitu join
(penggabungan) dan prune (pemangkasan). Pada proses penggabungan setiap item
dikombinasikan dengan item yang lainnya sampai tidak terbentuk kombinasi lagi.
Sedangkan pada proses pemangkasan hasil dari item yang telah dikombinasikan tadi
dipangkas dengan menggunakan minimum support yang telah ditentukan oleh user.
Berdasarkan permasalahan diatas peneliti termotivasi untuk menganalisa kinerja
metode rough set dan algoritma apriori dalam identifikasi penyakit demam tifoid,
dalam penelitian ini diharapkan peneliti mendapatkan akurasi yang terbaik dari kedua
metode tersebut.
1.2. Rumusan Masalah
Berdasarkan latar belakang di atas maka permasalahan yang dibahas dalam penelitian
ini adalah kurangnya akurasi dalam identifikasi penyakit demam tifoid kepada pasien
sering kali terjadi di rumah sakit, sehingga diperlukan suatu pendekatan untuk
mengatasi permasalahan akurasi identifikasi pada kasus penyakit demam tifoid.
1.3. Batasan Masalah
Rumusan masalah diatas dibatasi beberapa hal sebagai berikut :
1. Penelitian ini hanya membahas mengenai akurasi dalam identifikasi pola
penyakit demam tifoid.
Universitas Sumatera Utara
4
2. Pengambilan data hanya sebatas pada data laporan rekam medik pasien yang
didiagnosa terkena demam tifoid sebanyak 500 kasus pada RS. Grand
Medistra Lubuk Pakam periode tahun 2012, 2013 dan 2014.
1.4. Tujuan Penelitian
Tujuan penelitian ini adalah menganalisis kinerja metode rough set dan algoritma
apriori untuk mendapatkan akurasi identifikasi penyakit demam tifoid.
1.5. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat bagi pihak-pihak yang terkait
dengan adanya sistem tersebut, yakni:
1. Dapat mengetahui kinerja metode rough set dan algoritma apriori dalam
mengukur akurasi identifikasi penyakit demam tifoid.
2. Mengetahui penggunaan metode rough set dan algoritma apriori.
3. Meningkatkan akurasi hasil identifikasi demam tifoid.
Universitas Sumatera Utara
PENDAHULUAN
1.1. Latar Belakang
Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah
adalah sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat
tidaklah mudah. Informasi yang tersedia dalam jumlah yang besar terkadang masih
harus kita gali terlebih dahulu agar informasi tersebut dapat menyajikan informasi
yang tepat dan sesuai dengan kebutuhan. Untuk dapat menggali informasi yang
berpotensi dari gudang data tidak bisa hanya mengandalkan data operasional saja,
namun diperlukan suatu analisis data yang tepat sehingga menghasilkan informasi
yang akurat dan berharga bagi yang membutuhkannya, untuk membantu para
pengambil keputusan serta menjadikan perbandingan, peneliti melakukan teknik data
mining untuk analisa kinerja metode rough set dan algoritma apriori.
Data mining merupakan teknik yang menggabungkan teknik analisis data
tradisional dengan algoritma untuk pemrosesan data dalam jumlah yang besar.
Data mining dapat digunakan untuk melakukan analisis data dan menemukan polapola penting pada data. Secara sederhana, data mining atau penambangan data
dapat didefinisikan sebagai proses seleksi, eksplorasi dan pemodelan dari sejumlah
besar data untuk menemukan pola atau kecenderungan yang biasanya tidak
disadari keberadaannya (Turban, et al. 2005). Dalam data mining, data disimpan
secara elektronik dan diproses secara otomatis oleh komputer mengunakan teknik dan
perhitungan tertentu (Berry & Linoff, 2004). Data mining tersebut akan menjadi
acuan untuk mengambil keputusan. Pengolahan data mining dapat dilakukan dengan
beberapa teknik diantaranya adalah Metode Rough set, Fuzzy, Algoritma Apriori dan
lain - lain.
Universitas Sumatera Utara
2
Beberapa penelitian terdahulu terkait dengan analisis kinerja metode rough set dan
algoritma apriori dari berbagai kasus antara lain yaitu penelitian yang dilakukan oleh
(Adeyemo, et al. 2015), melakukan penelitian tentang diagnosa demam tifoid
menggunakan tiga metode yaitu ID3, C45 dan Multilayer Perceptron (MLP), dari hasil
penelitian tersebut MLP memiliki tinggi akurasi terbaik dibandingkan dengan kedua
metode lainnya, akan tetapi dalam hal kecepatan algoritma C45 ditemukan menjadi
yang terbaik dalam data training; (Oguntimilehin, et al. 2013), melakukan sebuah
pendekatan untuk diagnosa demam tifoid menggunakan teknik machine learning yang
dikembangkan dalam penelitian ini dan kinerja sistem diukur pada kedua set
pelatihan dan pengujian; (Budiono, et al. 2014) dalam penelitiannya melakukan
identifikasi dan pencarian informasi mengenai pola penyakit radang sendi dengan
teknik data mining association rule menggunakan algoritma apriori, penelitian ini
menampilkan informasi berupa nilai support dan confidence hubungan antara pola
penyakit radang sendi dengan atribut umur, jenis kelamin, pekerjaan dan gejala.
Metode Rough set adalah sebuah teknik matematik yang dikembangkan sejak
tahun 1980. Teknik ini digunakan untuk menangani masalah Uncertainty, Imprecision
dan Vagueness dalam aplikasi Artificial Intelligence (AI) (Listiana, et al. 2012).
Rough set menawarkan dua bentuk representasi data yaitu:
1. Information Systems (IS) adalah tabel yang terdiri dari baris yang
merepresentasikan data dan kolom yang merepresentasikan atribut atau
variabel dari data. Information system pada data mining dikenal dengan nama
dataset. Information system dapat direpresentasikan sebagai fungsi A = (U,
A),
dimana
U adalah
himpunan tidak
kosong dari
objek
yang
direpresentasikan dan A adalah himpunan tidak kosong dari atribut atau
variabel.
2. Decision Systems (DS) information system dengan atribut tambahan yang
dinamakan dengan decision atribute, dalam data mining dikenal dengan
nama kelas atau target. Atribut ini merepresentasikan hasil dari klasifikasi
yang diketahui. Information System (IS) menjadi IS = (U, {A,C}), contoh
Information System (IS) yang didalamnya terdapat objek (U), atribut kondisi
(A) dan atribut keputusan (C). (Hakim & Rusli, 2013)
Universitas Sumatera Utara
3
Kelebihan utama menggunakan roughset adalah bahwa roughset tidak membutuhkan
data awal atau data tambahan seperti probabilitas pada teori probabilitas, tingkat
keanggotaan pada teori fuzzy (Li, et al. 2007). Dalam rough set, kumpulan objek
disebut sebagai information system (IS). Dari IS tersebut objek-objek diklasifikasikan
kedalam area-area tertentu yang disebut dengan lower approximation,
region, dan
boundary
outside region. Dari pengelompokan area tersebut, dapat dilakukan
perhitungan dependensi antar atribut, reduksi atribut, rule generation sehingga dapat
diperoleh rule dari data set yang digunakan. Untuk mendapatkan hasil identifikasi
tentang asosiasi antar pola dari suatu penyakit demam tifoid, peneliti menggunakan
algoritma apriori.
Algoritma Apriori merupakan sebuah algoritma untuk mencari kombinasi item
set yang mempunyai suatu nilai keseringan tertentu sesuai kriteria atau filter yang
diinginkan dengan cara memperhatikan minimum support (minsup). Adapun dua
proses utama yang dilakukan algoritma Apriori (Jiawei & Kamber, 2006), yaitu join
(penggabungan) dan prune (pemangkasan). Pada proses penggabungan setiap item
dikombinasikan dengan item yang lainnya sampai tidak terbentuk kombinasi lagi.
Sedangkan pada proses pemangkasan hasil dari item yang telah dikombinasikan tadi
dipangkas dengan menggunakan minimum support yang telah ditentukan oleh user.
Berdasarkan permasalahan diatas peneliti termotivasi untuk menganalisa kinerja
metode rough set dan algoritma apriori dalam identifikasi penyakit demam tifoid,
dalam penelitian ini diharapkan peneliti mendapatkan akurasi yang terbaik dari kedua
metode tersebut.
1.2. Rumusan Masalah
Berdasarkan latar belakang di atas maka permasalahan yang dibahas dalam penelitian
ini adalah kurangnya akurasi dalam identifikasi penyakit demam tifoid kepada pasien
sering kali terjadi di rumah sakit, sehingga diperlukan suatu pendekatan untuk
mengatasi permasalahan akurasi identifikasi pada kasus penyakit demam tifoid.
1.3. Batasan Masalah
Rumusan masalah diatas dibatasi beberapa hal sebagai berikut :
1. Penelitian ini hanya membahas mengenai akurasi dalam identifikasi pola
penyakit demam tifoid.
Universitas Sumatera Utara
4
2. Pengambilan data hanya sebatas pada data laporan rekam medik pasien yang
didiagnosa terkena demam tifoid sebanyak 500 kasus pada RS. Grand
Medistra Lubuk Pakam periode tahun 2012, 2013 dan 2014.
1.4. Tujuan Penelitian
Tujuan penelitian ini adalah menganalisis kinerja metode rough set dan algoritma
apriori untuk mendapatkan akurasi identifikasi penyakit demam tifoid.
1.5. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat bagi pihak-pihak yang terkait
dengan adanya sistem tersebut, yakni:
1. Dapat mengetahui kinerja metode rough set dan algoritma apriori dalam
mengukur akurasi identifikasi penyakit demam tifoid.
2. Mengetahui penggunaan metode rough set dan algoritma apriori.
3. Meningkatkan akurasi hasil identifikasi demam tifoid.
Universitas Sumatera Utara