Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means ( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta ) SKRIPSI Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Jurusan Teknik Info
Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means ( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta ) SKRIPSI Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun Oleh : RAFAELA ROSI PRIHANINGRUM (095314012) JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA
Clustering Hepatitis Disease Using Fuzzy C-Means (Case Study HepatitisDataat Panti Rapih Hospital Yogyakarta) A Thesis
Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree
In Study Program of Informatics Engineering
By Rafaela Rosi Prihaningrum 095314012
INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY
HALAMAN PERSEMBAHAN
Skripsi ini saya persembahkan untuk : Tuhan Yesus Kristus, Keluarga tercinta dan Sahabat terkasih Terima kasih untuk segalanya.
“Be faithful in small things because it’s in them that your strength lies”
- -Mother Theresa-
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidakmemuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalamkutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 23 Agustus 2013 Penulis Rafaela Rosi Prihaningrum
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Univer sitas Sanata Dharma : Nama :Rafaela Rosi Prihaningrum NIM :095314012
Demi pengembangan pengetahuan, saya memberikan kepada perpustakaanUniversitas Sanata Dharma karya ilmiah yang berjudul :
Pengelompokan Penyakit Hepatitis
dengan Menggunakan Metode Fuzzy C-Means
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikankepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan,mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalandata mendistribusikan secara terbatas, dan mempublikasikan di internet ataumedia lain untuk kepentingan akademis tanpa perlu meminta ijin dari sayamaupun memberikan royalti kepada saya selama tetap mencantumkan nama sayasebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya. Yogyakarta, 23 Agustus 2013 Yang menyatakan, Rafaela Rosi Prihaningrum
Pengelompokan Penyakit Hepatitis
dengan Menggunakan Metode Fuzzy C-Means
ABSTRAKKesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan kematian. Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik.
Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakanFuzzy C-
Means dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu
percobaan dengan data anamnesa dokter menghasilkan akurasi sebe sar50% , percobaan yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar 83.871%, yang ketiga yaitu percobaan dengan data anamnesa dokter yang telah di PCA (
Principal Component Analysis ) menghasilkan akurasi sebesar 40.6504% dan yang terakhir
adalah percobaan dengan data anamnesa yang telah digabung dengan data laboratorium menghasilkan akurasi sebesar 66.371%.
ABSTRACT
Health is the most important factor in a person's life. If health has disrupted the activities of a person will be disturbed. Currently, there are many diseases that can lead to death. Liver disease can increase the risk of death for patients and can also be triggers of other diseases that cause death. Grouping analysis or cluster analysis is one of the data analysis that aims to determine which group or groups from a group of data based on similar characteristics.
In the research, the process of grouping hepatitis disease using Fuzzy C-Means in the process of testing the system four experiments conducted, first experiments with the anamnesa the data which produce an accuracy of 50%, a second trial is an experiment with laboratory data which produced 83.871% accuracy, the third experiment with anamnesa the data that has been in the PCA (Principal Component Analysis) produces an accuracy of 40.6504% and the last experiment is anamnesa which has been in the pca combined with laboratory data produced 66 371% accuracy.
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas kebaikan dan kehendak-Nya saya dapat menyelesaikan tugas akhir yang berjudul
“Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means ”. Tugas akhir ini
ditulis sebagai salah satu syarat memperoleh gelarsarjana program studi Teknik Informatika, Fakultas Sains dan TeknologiUniversitas Sanata Dharma.
Dalam proses penulisan tugas akhir ini , penulis mengucapkan terima kasihyang sebesar- besarnya kepada :
1. Ibu PH.Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.
2. Ibu Ridowati Gunawan, S.Kom.,M.T., selaku Dosen Pembimbing sekaligus ketua program studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta, terimakasih atas segala bimbingan, kesabaran dan mengarahkan serta membimbing penulis dalam menyelesaikan tugas akhir ini.
3. Ibu Sri Hartati Wijono, S.Si.,M.Kom.dan Bapak Albert Agung Hadhiatma,S.T.,M.T. selaku dosen penguji yang telah memberikan banyak kritik dansaran untuk tugas akhir saya.
4. Bapak Iwan Binanto, M.Cs., selaku Dosen Pembimbing Akademik Teknik Informatika Tahun 2009.
5. Seluruh staff dosen Teknik Informatika Universitas Sanata Dharma yang telah banyak memberikan bekal ilmu, arahan dan pengalaman selama sayamenempuh studi.
6. Seluruh staff Sekretariat Teknik, yang banyak membantu saya dalam urusanadministrasi akademik terutama menjelang ujian tugas akhir.
7. Kedua orang tua dan kakak saya, terima kasih atas semua yang telah dilakukan untukku, doa, semangat,dukungan dan cintanya sehingga saya bisa menyelesaikan studi denganlancar.
8. Estu Karunianingtyas, terimakasih atas bantuan yang diberikan dalam penyusunan tugas akhir ini.
10. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhirini yang tidak bisa saya sebutkan satu per satu.
Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh darisempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat penulis harapkan.Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak.Terima kasih.
Yogyakarta, 23 Agustus 2013 Penulis Rafaela Rosi Prihaningrum
Daftar Isi
HALAMAN PERSETUJUAN ..............................
ERROR! BOOKMARK NOT DEFINED.
DAFTAR GAMBAR
Gambar Keterangan Halaman36
4.7 Akurasi
37
4.6 Fungsi Objektif
37
4.5 Nilai derajat keanggotaan iterasi terakhir
36
inisialisasi data
4.4
36
4.3 Data awal
dialog box untuk memilih data
2.1 (Kohavi&Provost,1998) : Confusion Matrix
4.2
35
4.1 Halaman Pengelompokkan Penyakit Hepatitis
26
3.3 Perancangan Antarmuka
26
3.2 Use Case Diagram
25
3.1 Flowchart Sistem
10
37
DAFTAR TABEL Tabel Keterangan Halaman
4.4 Communalities
4.9 Fungsi FFCM_InitV
34
4.8 Component Score Coefficient Matrix
34
4.7 Score Faktor
33
4.6 Conponent Matrix
32
4.5 Total Variance Explained
31
31
2.1 Nilai normal pemeriksaan laboratorium
4.3 KMO and Bartlett;s Test
29
4.2 Deskripsi data gejala Laboratorium
28
4.1 Deskripsi data gejala anamnesis
15
2.3 Jenis Hepatitis
14
2.2 Kegunaan pemeriksaan labratorium
14
34
4.11 Hasil Pengujian data laboratorium
39
4.12 Hasil Pengujian data anamnesa dokter(PCA)
40
4.13 Hasil Pengujian data anamnesa dokter(PCA) dan
data laboratorium
41
BAB I PENDAHULUAN Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta
pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.
1.1 Latar Belakang
Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian.Salah satunya adalah penyakit hepatitis.Indonesia merupakan Negara ketiga dengan penderita hepatitis terbanyak setelah China dan India.Penderita hepatitis B dan C di Indonesia diperkirakan mencapai 30 juta orang.( Dimyati, Vien, 2011).
Hepatitis merupakan salah satu penyakit yang membahayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.Fungsi utama dari hati atau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.
Ada 5 macam virushepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virushepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D (VHD) dan virus hepatitis E (VHE). Virus-virus ini terus berkembang dan bahkan
Penyakit hepatitisdipilih dalam penelitian ini karena banyaknya orang tidak sadar jika sudah terkena penyakit hepatitissehingga menyebabkan keterlambatan penanganan dan dapat berakibat fatal.Di harapkan dengan adanya penelitian ini dapat membantu dalam pendeteksian penyakit hepatitis agar dapat di lakukan penanganan lebih lanjut dan supaya orang mengenal status kesehatan lebih dini.
Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik. Analisis ini sudah banyak digunakan untuk menyelesaikan permasalahan dan penelitian dalam beberapa disiplin ilmu, seperti bidang akademik, bidang kesehatan,bidang kewilayahan dan bidang marketing.
Perkembangan analisis kelompok dimulai dari metode hirarki yang secara garis besar membentuk sebuah tree diagram yang biasa disebut dendogram. Sedangkan metode nonhirarki lebih dikenal dengan cara partisi, contohnya K-means, metode ini menentukan terlebih dahulu jumlah kelompok yang akan dibentuk. Perkembangan lebih lanjut dari analisa kelompok adalah dengan mempertimbangkan tingkat keanggotaan yang mencangkup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokkan yang disebut dengan fuzzy
clustering.
Dalam teknik fuzzy clustering, terdapat beberapa algoritma salah satunya adalah Fuzzy
C-Means.Fuzzy C-Meansadalah salah satu teknik pengelompokkan data yang mana
keberadaan tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat keanggotan.Metode Fuzzy C-Meanstermasuk metode supervised clusteringdimana jumlah pusat clusterditentukan di dalam proses clustering.
Konsep dasar Fuzzy C-Means adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimalisasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.
Algoritma Fuzzy C-Means sering dipakai dalam berbagai bidang baik bisnis,kesehatan atau pendidikan. Beberapa penelitian yang menggunakan algoritma Fuzzy C-Means misalnya penelitian dalam pengelompokkan wilayah kecamatan menurut partisipasi sekolah, pengembangan algoritma Fuzzy C-means untuk brain medical image analysis, dan penelitian lainnya.
Pada penelitian ini algoritma Fuzzy C-means digunakan untuk mengelompokan orang yang terkena penyakit hepatitis A, hepatitis B, hepatitis C. Algoritma Fuzzy C-means ini di pilih karena metode ini dapat memberikan hasil yang cukup baik dalam hal meningkatkan homogenitas tiap kelompok yang dihasilkan.
Pendeteksian penyakit hepatitis sudah pernah dilakukan oleh Estu Karunianingtyas (Karunianingtyas,2011) menggunakan metode naïve Bayesiandengan 26 atribut dari data
anamnesis dokter, namun tingkat keakuratan yang didapat masih rendah karena hanya
mencapai 51.11% maka dari itu penulis ingin melanjutkan penelitian dengan menggunakan metode Fuzzy C-means.
1.2 Rumusan Masalah
Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan adalah :
1. Apakah metode Fuzzy C-means dapat dipergunakan untuk mengelompokkan orang berpenyakit hepatitis dengan memberikan keakuratan yang baik ?
1.3 Tujuan
Tujuan yang ingin dicapai dalam penelitian ini adalah :
1. Menganalisis, mendisain, mengimplementasikan metode Fuzzy C-Means untuk mengelompokkan penyakit hepatitis.
2. Mengetahui tingkat keakuratan metode Fuzzy C-Means dalam mengelompokkan orang yang berpenyakit hepatitis.
1.4 Batasan Masalah
Batasan masalah dalam penelitian ini adalah :
1. Data set yang di gunakan adalah data hasil pemeriksaan laboratorium rumah sakit dan data hasil anamnesa.
2. Jenis hepatitis yang akan diteliti hanya 3 jenis yaitu hepatitis A, hepatitis B, dan hepatitis C karena jenis hepatitis D dan hepatitis E jarang ditemukan.
1.5 Manfaat
Manfaat yang diproleh dalam penelitian ini antara lain :
1. Memberikan gambaran tentang langkah
- – langkah analisis, design dan implementasi metodeFuzzy C-means dalam mengelompokkan orang yang berpenyakit hepatitis.
2. Sebagai referensi untuk penelitian yang berhubungan dengan clustering penyakit hepatitis yang lebih lanjut lagi.
1.6 Metodologi Penelitian
Metodologi yang digunakan adalah sebagai berikut: 1. Melakukan pengumpulan data.
2. Melakukan normalisasi pada data laboratorium.
3. Mengekstrak data anamnesis dokter menggunakan metode PCA ( Principal Component Analysis).
4. Menggabungkan data laboratorium yang sudah di normalisasi dengan data anamnesis yang sudah di ekstraks.
5. Menghitung data dengan menggunakan metode FCM ( Fuzzy C-Means).
6. Menghitung nilai keakuratan hasil pengelompokkan dengan menggunakan Confusion Matrix.
1.7 Sistematika Penulisan
Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematikapenulisan sebagai berikut :
BAB I PENDAHULUAN Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya
penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.
BAB II LANDASAN TEORI Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan
tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada
bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy
clustering dan Fuzzy C-means. Kemudian menjelaskan tentang permasalahan penyakit
hepatitis dan yang terakhir mengenai pengujian keakuratan metode
BAB III Desain dan Analisis SISTEM Bab ini berisi tentang desain dan analisis system meliputi contoh perhitungan, perancangan antarmuka, dan usecase. BAB IV IMPLEMENTASI SISTEM DAN HASIL Bab ini berisi implementasi program dari sistem yang akan dibuat, pembahasan penerapan algoritma Fuzzy C-Means, implemantasi antarmuka dan hasil implementasi. BAB V PENUTUP Bab ini berisi kesimpulan dari sistem yang telah dibuat, serta saran untuk pengembangan dan penyampurnaan Tugas Akhir yang dibuat.
BAB II TINJAUAN PUSTAKA Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini
untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy C-
means.Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir
mengenai pengujian keakuratan metode.2.1 Fuzzy Logic
Teori Himpunan Fuzzyakan memberikan jawaban terhadap suatu masalah yangmengandung ketidak pastian. Aplikasi logika fuzzy untuk mendukung keputusan semakindiperlukan ketika semakin banyak kondisi yang menuntut adanya keputusan yang tidakhanya bisa dijawab dengan „Ya‟ atau „Tidak‟.Fuzzy Logic memberikan rata-rata dariperhitungan angka, yang terletak antara nilai benar mutlak dan nilai salah mutlak, yangberupa range antara 0.0 dan 1.0. Dengan Fuzzy Logic, pengguna dimungkinkan untukmenghitung derajat keanggotaan dari sebuah data. Fuzzy Logic berurusan dengan kondisiyang tidak pasti, dimana benar dan salah tidak dapat ditentukan secara mutlak.
Konsep dari Fuzzy Logic diperkenalkan oleh Professor Lotfi A. Zadeh, di Barkley pada Universitas California (University of California) pada 1960an.Logika Fuzzy dikatakan sebagai logika baru yang lama, sebab ilmu tentang logika Fuzzy modern dan metodis baru ditemukan beberapa tahun yang lalu, padahal sebenarnya konsep tentang logika fuzzy itu sendiri sudah ada sejak lama.
Ada beberapa alasan mengapa orang menggunakan logika Fuzzy, antara lain :
1. Konsep logika Fuzzy mudah dimengerti. Konsep matematis yang mendasari penalaran Fuzzy sangat sederhana dan mudah dimengerti.
2. Logika Fuzzy sangat fleksibel.
3. Logika Fuzzy memiliki toleransi terhadap data-data yang tidak tepat.
2.2 Himpunan Fuzzy
2.2.1 Himpunan Tegas (Crisp)
Pada himpunan tegas, nilai keanggotaan suatu item (x) dalam suatu himpunan
A, sering ditulis dengan µA(x), memiliki dua kemungkinan yaitu :
a. 1 (satu), yang bearti suatu item menjadi anggota dalam suatu himpunan b. 0 (nol), yang bearti suatu item tidak menjadi anggota himpunan tersebut.
2.1.1 Himpunanfuzzy Pada himpunan fuzzy nilai keanggotaan terletak pada rentang 0 sampai 1.
Apabila x memiliki nilai keanggotaan fuzzy µA(x)=0 bearti x tidak menjadi anggota himpunan A. demikian pula, apabila x memiliki nilai keanggotaan µA(x)=1 bearti x menjadi anggota penuh himpunan A.
2.3 Fuzzy Clustering
Fuzzy clustering adalah salah satu teknik menentukan cluster optimal dalam suatu ruang
vektor yang didasarkan pada bentuk normal euclidean untuk jarak antar vektor (Kusumadewi,2004).
Metode ini merupakan pengembangan dari metode partitioning data dengan pembobotan fuzzy. Keunggulan utama fuzzy clustering adalah dapat memberikan hasil pengelompokkan objek
- – objek yang tersebar tidak teratur, karena jika terdapat suatu data yang penyebarannya tidak teratur maka terdapat kemungkinan suatu titik data mempunyai sifat atau karakteristik dari cluster lain sehingga diperlukan pembobotan kecenderungan titik data terhadap suatu cluster.
Dalam teori logika fuzzy suatu nilai bisa bernilai benar atau salah secara bersama.Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot keanggotaan yang dimilikinya.Logika fuzzy memiliki derajat keanggotaan dalam rentang 0 hingga 1. keanggotaan dan derajat dari kebenaran. Oleh sebab itu sesuatu dapat dikatakan sebagian benar dan sebagian salah pada waktu yang sama (Kusumadewi. 2004).
1.4 Fuzzy C-Means
Dalam teknik clustering data terdapat beberapa algoritma, salah satunya adalah Fuzzy
C-means. Fuzzy C-means merupakan pengembangan dari metode K-mean clustering karena
pada awalnya ditentukan dulu jumlah kelompok atau cluster yang akan dibentuk. Kemudian dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut.
Konsep dasar Fuzzy C-means, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.
Algoritma pengelompokan Fuzzy C-means menurut Kusumadewi diberikan sebagai berikut : i. Tentukan :
1. Matriks X berukuran n x m dengan n = jumlah data yang akan di cluster dan m= jumlah variabel (criteria)
2. Jumlah cluter yang akan di bentuk = C 3. w> 1 adalah tingkat ke fuzzy-an dari hasil pengelompokkan. Parameter ini disebut dengan fuzzier, nilai dari w yang sering dipakai dan dianggap paling halus adalah w=2 (Klawoon dan Hopper,2001)
4. Iterasi tertinggi
5. Kriteria penghentian = e (nilai positif yang sangat kecil) 6.
Iterasi awal t=1,dan ∆=1 ii. Bentuk matriks partisi awal U ik seperti rumus (2,1) sebagai berikut Matrik partisi U mempunyai komponen i= banyaknya data, k = banyaknya
ik cluster. Matrik ini random dengan kisaran nilai 0 sampai 1.
iii. Hitung pusat cluster dengan menggunakan rumus (2,2) : ∑
(2,2)
∑ iv. Hitung fungsi objektif pada iterasi ke
- –i dengan menggunakan rumus (2,3)
(2,3) ∑ ∑
d merupakan ukuran jarak untuk jarak Euclidean antara pusat cluster ke-i
ik
dengan data ke-k. untuk menghitung d ik digunakan rumus (2,4) :
(2,4)
[∑ ]
v. Perbaiki drajat keanggotaan tiap data pada tiap cluster dengan menggunakan rumus (2,5)
(2,5) [∑ ]
vi. Cek kondisi berhenti jika : a) Jika: (|Pi-Pi-1 |<e) atau (t>MaxIter) maka berhenti.
b) Jika tidak: t=t+1, ulangi langkah iii. Dari algoritma tersebut dapat disimpulkan bahwa langkah pertama yang dilakukan adalah menentukan matriks derajat keanggotaan secara acak yang kemudian dijadikan acuan
cluster bergerak menuju lokasi yang tepat. Langkah ini dilakukan berdasarkan minimisasi
fungsi objektif.Output dari Fuzzy C-means merupakan matriks pusat cluster berukuran c x p dan matriks derajat keanggotaan untuk tiap
- – tiap data berbentuk n x c. Pengelompokkan cluster dapat dilihat dari kedua output ini. Matriks pusat cluster menunjukkan pusat cluster untuk tiap
- – tiap variabel yang diamati dalam setiap cluster-nya. Matriks derajat keanggotaan menunjukkan kecenderungan suatu data untuk masuk kedalam cluster tertentu. Semakin besar nilai derajat keanggotaannya, maka semakin besar peluang data tersebut masuk kedalamclustertertentu.
2.5 Confusion Matrix
Validasi merupakan proses untuk menilai hasil metode cluster. Oleh karena itu, proses ini bertujuan untuk menjamin bahwa solusi cluster yang di hasilkan dalam analisis
cluster dapat menggambarkan populasi sebenarnya.
Confusion Matrix merupakan bagian dari uji validasi dengan metode external test.Uji
validasi external test ini digunakan untuk mengukur sejauh mana label pada cluster dengan label pada class yang disediakan.
Menurut Kohavi dan Provost (Kohavi dan Provost,1998) confusion Matrix berisi informasi tentang actual (fakta)dan predicted (prediksi). Confusion matrix pada gambar 2.1 berbentuk matrix 2 x 2 yang digunakan untuk mendapatkan jumlah ketepatan yang didapat dengan menggunakan algoritma tertentu
Predicted Negative Positif
Negative A B Actual
Positive C D
Gambar 2.1 (Kohavi&Provost,1998) : Confusion MatrixKeterangan : A, jikaactual dan predicted bernilai negative.
B, jika actual bernilai negative dan predicted bernilai positive.
C, jika actual bernilai positive dan predicted bernilai negative D, jika actual dan predicted bernilai positive.
Rumus yang digunakan untuk menghitung akurasi dengan confusion
matrix,yaitu : (2,6)
2.6 Data Preparation
Proses preparasi ini dilakukan sehingga data dapat lebih mudah untuk diolah. Terdapat 3 hal dalam data preparationyaitu :
1. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam
proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses data mining.
2. Data Preprocessing: Memastikan kualitas data yang telah dipilih pada tahap dataselection, pada tahap ini masalah yang harus dihadapi adalah noisy data dan missing values. Proses pembersihan data (cleansing) dilakukan dengan melakukan
metode-metode query sederhana untuk menemukan anomali-anomali data yang bisa saja masih terdapat pada sistem.
3. Data Transformation: Mengelompokkan atribut-atribut atau field-yang telah terpilih menjadi 1 tabel dengan cara melakukan denormalisasi.
2.7 PCA (Principal Component Analysis)
Terdapat dua metode Dimensionality Reduction yang paling sering digunakan yaitu
Feature Selection dan Feature Extraction.Feature selection merupakan sebuah proses
pemilihan subset feature dari feature asli, sedangkan feature extraction adalah proses mengekstrak feature baru dari feature asli melalui pemetaan fungsional.
Salah satu metode feature extraction adalah PCA ( Principal Component Analysis ). Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan principal component
Analisis Komponen Utama (Principal Component Analysis) atau PCA adalah suatu metodeyang melibatkan prosedur matematika yangmengubah dan mentransformasikan sejumlah besarvariabel yang berkorelasi menjadi sejumlah kecilvariabel yang tidak berkorelasi, tanpa menghilangkaninformasi penting di dalamnya
2.8 Hepatitis
Hepatitis telah menjadi masalah global. Saat ini diperkirakan 400 juta orang di dunia terinfeksi hepatitis B kronis, bahkan sekitar 1 juta orang meninggal setiap tahun karena penyakit ini (Wening,2008).
Hepatitis adalah istilah umum yang berarti radang hati.“Hepa” berarti kaitan dengan hati, sementara “itis” berarti radang.Hepatitis atau peradangan hati dapat diartikan sebagai suatu proses peradangan yang menimpa sel-sel hati (Cahyono,2008). Secara objektif, adanya hepatitis dibuktikan melalui biopsi jaringan hati (pengambilan sedikit jaringan hati menggunankan jarum).Namun, secara sederhana pemeriksaan dapat digantikan dengan pemeriksaan darah.
upakan salah satu penyakit yang membayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.
Hati adalah organ yang terbesar dalam tubuh. Kurang lebih sama besar dengan buah pepaya, dan terletak di perut kanan-atas.Fungsi utama dari hatiatau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.
Ada 5 macam virus hepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virus hepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D(VHD), virus hepatitis E (VHE).
Diagnosis hepatitis dapat dipastikan melalui anamnesis dengan dokter serta pemeriksaan fisik dan laboratorium. Dokter akan menanyakan hal
- – hal yang terkait dengan penularan hepatitis karena hepatitis jenis A, B, C, dan jenis lainnya memberikan gejala yang hampir sama.
Pemeriksaan laboratorium pada pasien yang diduga mengidap penyakit hepatitis dilakukan untuk memastikan diagnosis, mengetahui penyebab dan menilai fungsi hati.Secara garis besar, pemeriksaan laboratorium dibadakan menjadi dua yaitu, tes seralogi dan biokimia hati.
Tes seralogi dilakukan dengan cara memeriksa kadar antigen maupun antibodi terhadap virus penyebab hepatitis. Tes ini bertujuan untuk memastikan diagnosis serta mengetahui jenis virus penyebabnya. Tes biokimia hati dilakukan dengan cara memeriksa parameter zat
- – zat kimia maupun enzim yang dihasilkan atau diproses oleh jaringan hati. Tes biokimia hati dapat dipergunakan untuk mengetahui derajat keparahan atau kerusakan sel sehingga dapat menilai fungsi hati.
Penderita penyakit hati secara umum termasuk hepatitis, akan diperiksa darahnya untuk beberapa jenis pemeriksaan parameter biokimia, seperti AST, ALT (alanin
aminotransferase), alkaline fosfatase,bilirubin, albumin, dan protombin (Wening, 2008).
Tabel 2.1 : Nilai normal pemeriksaan laboratoriumParameter Biokimia Hati Rentang Nilai Normal ≥ 37 U/L (Pria) | ≥ 31 U/L (wanita)
AST / SGOT ≥ 42 U/L (Pria) | ≥ 32 U/L (wanita)
ALT / SGPT NEGATIF : < 1,0 S/CO
HBsAg atau < 1,0 COI (ECLIA) NEGATIF : < 1,0 COI
Anti HAV POSITIF : >= 1,0 COI (EIA) NEGATIF : < 1,0 S/CO
Anti HCV atau < 1,0 COI (EIA)
Tabel 2.2 : Kegunaan Pemeriksaan Laboratorium Jenis Pemeriksaan KegunaanSGOT Untuk mengetahui fungsi hati , membantu mendiagnosis kelainan hati SPGT Untuk mengetahui fungsi hati, membantu mendiagnosis kelainan hati
HBsAg Untuk mengetahui adanya infeksi virus Hepatitis B. Jika HBsAg positif maka terinfeksi virus hepatitis B. Jika HBsAg positif selama lebih dari 6 bulan, berarti pasien menderita Hepatitis B kronis dan disarankan untuk rutin memeriksakan fungsi hati (SGOT, SGPT,
Protein Total, Albumin, AFP) paling tidak 6 bulan
- – 1 tahun sekali Anti HAV/ IgM Untuk mengetahui adanya antibody terhadap virus Hepatitis A Anti HAV
- – obatan, alkohol, dan lain – lain. Pada saat ini penyakit hepatitis yang sering menjadi masalah adalah hepatitis virus, terutama akibat virus hepatitis B dan C sebab kedua jenis hepatitis ini sering menimbulkan hepatitis kronis yang dapat berakhir menjadi sironishati dan kanker hati (Cahyono,2008).
Pada fase awal hepatitis, penderita belum merasakan gejala yang spesifik. Keluhan yang dirasakan antara lain mual, muntah, tidak nafsu makan, badan terasa lemas, dan mudah lelah.
Penularan Mulut (Peroral)
Calici Virus
diliputi HBsAg
DefectiveVirus
Picorna Virus HepadnaVirus Flavi Virus
Tidak Ya Ya Ya Tidak Penyebab
Carrier Kronik
Tidak Ya Ya Ya Tidak
Cronisitas
Darah (Parental) Oral (Peroral)
Darah (Parental)
Darah (Parental)
15
4
5
40
15
- – 80 hari
Masa Tunas
D Virus Hepatitis E
Virus Hepatitis A Virus Hepatitis B Virus Hepatitis
C
Virus Hepatitis Tabel 2.3 : Jenis Hepatitis SifatMenurut Cahyono (2008), perbedaan dari setiap jenis hepatitis dapat dilihat pada tabel 2 dibawah ini :
2.8.2 Jenis dan Gejala Hepatitis
Penyebab hepatitis sendiri sangat banyak,misalnya hepatitis akibat virus, bahan kimia, obat
2.8.1 Penyebab Hepatitis
- – 45 hari
- – 12 minggu
- – 20 minggu
- – 40 hari
Hepatitis A merupakan jenis hepatitis yang paling ringan. Hal ini disebabkan infeksi virus hepatitis A (VHA) umumnya tidak sampai menyebabkan kerusakan jaringan hati (Wening, 2008). Mereka yang terinfeksi virus ini dapat pulih sepenuhnya. Hepatitis A ini menular melalui makanan atau minuman yang telah terkontaminasi oleh virus VHA.
Hepatitis B merupakan jenis hepatitis yang paling berbahaya.Penyakit ini lebih sering menular dibandingkan dengan jenis hepatitis lainnya. Hepatitis B menular melalui kontak darah atau cairan tubuh yang mengandung virus hepatitis B (VHB) maupun material lain yang terinfeksi, seperti jarum suntik, alat bedah, jarum akupuntur, dan alat
- – alat yang dapat menimbulkan luka lecet milik individu yang terinfeksi .Hepatitis B kronis memberikan gejala yang lebih serius yaitu mudah lelah, cemas, tidak nafsu makan, mual, muntah dan merasa lemas.Hepatitis B kronis dapat membuat penumpukan cairan dalam rongga perut sehingga perut terlihat membuncit.Seseorang dapat mengidap virus ini tetapi tidak disertai dengan gejala klinik atau tidak tampak adanya kelainan atau gangguan kesehatan. Orang tersebut merupakan pembawa atau biasa disebut carrier.
Carrier dapat terjadi karena individu tersebut memiliki pertahanan tubuh yang baik
atau karena virus VHB mengalami perubahan sifat yang tidak aktif (Wening, 2008).Virus yang tidak aktif ini akan membuat pertahanan tubuh tidak dapat mengenalinya sebagai “musuh” sehingga sistem imun tidak mengadakan perlawanan, suatu saat ketika pertahanan tubuh dalam kondisi lemah maka virus akan aktif dan akan muncul gejala hepatitis. Carrier jumlahnya relatif banyak dan berpotensi menularkan.
Hepatitis C juga menyebabkan peradangan hati yang cukup berat. Hepatitis C menular melalui darah, biasanya karena transfusi atau jarum suntik yang terkontaminasi virus hepatitis C (VHC).Pada penderita hepatitis C keluhan yang dirasakan adalah merasalemas, mual, muntah, hilang nafsu makan, demam, mual, dan nyeri ulu hati. Sebagian dari penderita mengeluh bahwa urin berwarna gelap, feses berwarna putih, serta kulit, kuku dan bola mata bagian putih berwarna kuning. Jika diraba, perut bagian atas kanan membesar karena terjadi pembesaran hati maupun terasa adanya tegangan didaerah hati.
2.8 Contoh Penggunaan Fuzzy C-Means
Terdapat data gejala yang telah dirubah kedalam bentuk biner
Pegal NyeriSendi Normal Linu-linu
1
1
1
1
1
1
1
1
1
1
1
1 Data tersebut akan dibagi dalam tiga kelompok. Pertama tentukan : banyaknya cluster c
3 Pembobot w
2 maksimum iterasi maxiter 5 error e 0.01 fungsi objektif P0
Iterasi awal iter
1 Kemudian bentuk matriks partisi U ik dengan i=banyaknya data dan k=banyaknya cluster. i k1 k2 k3 1 0.440986528 0.490279156 0.069 2 0.555826368 0.384816328 0.059 3 0.156206358 0.306739378 0.537 4 0.460986631 0.075301468 0.464 5 0.426768818 0.216412813 0.357 6 0.095909122 0.285092664 0.619 7 0.32906622 0.398552921 0.272 8 0.019634378 0.466853598 0.514 9 0.311402432 0.347649768 0.341
10 0.321789912 0.537765533
11
25
24
20 21 22 23
19
18
17
16 0.883904 0.48318 0.933401 0.336406 0.756065 0.123037 0.1054 0.001321 0.710058 0.647889 0.730909 0.086154 0.889208 0.004009 0.0331 0.007138 0.94078 0.484568 0.508542 0.083062 0.409287 0.093653 0.0555 0.315987
15
14
13
12
10
0.14 11 0.695747687 0.031368532 0.273 12 0.047758847 0.100471348 0.852
9
8
0 0.106082
7 1 0.00532574 0.001543791 0.712869 0.280262 0.934722 0 0.161594 2 0.05747037 0.161248551 0.780585 0.000696 0.738046 0 0.118575 3 0.1668799 0.430836171 0.369851 0.032433 0.824529
6
5
4
3
2
1
Langkah selanjutnya adalah menghitung pusat kluster V ij dan didapat hasil : vij
26
0.014127 0.644569 0.355431 0.752799 0.638885 0.412827 0.059952236 0.805538
0.066529 0.57227 0.42773 0.740745 0.563643 0.650965 0.204483286 0.369964
0.125621 0.608367 0.391633 0.656525 0.33848 0.522367 0.008590829 0.35201 Lalu hitung fungsi objektif pada iterasi ke-i Pk1 0.425421188
0.400981585 0.097718459 0.878426136 0.739858999 0.050045697 0.314062712
0.00157452 0.449803355 0.569634953 1.205474338 0.013652833 pk2
0.569272 0.332846 0.341193 0.024486 0.206732 0.377365
0.31748 0.700377 0.520319 0.965603 0.004561 0.056323 pk3 p kluster
0.015653 1.010346315
0.011176 0.745003756
1.127077 1.565988973
0.905885 1.808796982
0.647684 1.594275499
1.617009 2.044419013
0.211604 0.843146995
0.82873 1.530682167
0.618954 1.589076395
0.106368 1.641606159
0.34855 1.558585765
1.911485 1.981460854
total 17.91338887
Kemudian setelah fungsi objektif diperoleh, yang dilakukan adalah memperbaiki derajat keanggotaan dan diperoleh derajatkeanggotaan yang baru sebagai berikut :
K1 K2 K3
0.28
0.34
0.30
0.32
0.38
6
0.38
0.33
0.30
5
0.33
0.33
0.30
4
0.34
0.31
1
3
0.47
0.33
0.19
2
0.42
0.35
8
0.42
5
14.23399458
4
14.261227
3
14.52300538
2
17.91338887
1
Iterasi Fungsi Objektif
Setelah mengalami 6 kali iterasi maka diperoleh fungsi objektif sebagai berikut :