Pengelompokan penyakit hepatitis dengan metode Fuzzy C-Means.
Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means
( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta )
SKRIPSI
Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer
Jurusan Teknik Informatika
Disusun Oleh :
RAFAELA ROSI PRIHANINGRUM (095314012)
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
(2)
Clustering Hepatitis Disease Using Fuzzy C-Means
(Case Study HepatitisDataat Panti Rapih Hospital Yogyakarta)
A Thesis
Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree In Study Program of Informatics Engineering
By
Rafaela Rosi Prihaningrum 095314012
INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY YOGYAKARTA
(3)
(4)
(5)
HALAMAN PERSEMBAHAN
Be faithful i s all thi gs e ause it’s i the that your stre gth lies
-Mother Theresa-
Skripsi ini saya persembahkan untuk : Tuhan Yesus Kristus, Keluarga tercinta dan Sahabat terkasih
Terima kasih untuk segalanya.
(6)
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidakmemuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalamkutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 23 Agustus 2013 Penulis
(7)
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Univer sitas Sanata Dharma : Nama :Rafaela Rosi Prihaningrum
NIM :095314012
Demi pengembangan pengetahuan, saya memberikan kepada perpustakaanUniversitas Sanata Dharma karya ilmiah yang berjudul :
Pengelompokan Penyakit Hepatitis
dengan Menggunakan Metode Fuzzy C-Means
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikankepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan,mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalandata mendistribusikan secara terbatas, dan mempublikasikan di internet ataumedia lain untuk kepentingan akademis tanpa perlu meminta ijin dari sayamaupun memberikan royalti kepada saya selama tetap mencantumkan nama sayasebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya. Yogyakarta, 23 Agustus 2013
Yang menyatakan,
(8)
Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means
ABSTRAK
Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan kematian. Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik.
Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakanFuzzy C-Means dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu percobaan dengan data anamnesa dokter menghasilkan akurasi sebe sar50% , percobaan yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar 83.871%, yang ketiga yaitu percobaan dengan data anamnesa dokter yang telah di PCA (
Principal Component Analysis ) menghasilkan akurasi sebesar 40.6504% dan yang terakhir adalah percobaan dengan data anamnesa yang telah digabung dengan data laboratorium menghasilkan akurasi sebesar 66.371%.
(9)
ABSTRACT
Health is the most important factor in a person's life. If health has disrupted the activities of a person will be disturbed. Currently, there are many diseases that can lead to death. Liver disease can increase the risk of death for patients and can also be triggers of other diseases that cause death. Grouping analysis or cluster analysis is one of the data analysis that aims to determine which group or groups from a group of data based on similar characteristics.
In the research, the process of grouping hepatitis disease using Fuzzy C-Means in the process of testing the system four experiments conducted, first experiments with the anamnesa the data which produce an accuracy of 50%, a second trial is an experiment with laboratory data which produced 83.871% accuracy, the third experiment with anamnesa the data that has been in the PCA (Principal Component Analysis) produces an accuracy of 40.6504% and the last experiment is anamnesa which has been in the pca combined with laboratory data produced 66 371% accuracy.
(10)
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas kebaikan dan kehendak-Nya saya dapat menyelesaikan tugas akhir yang berjudul“Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means”. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelarsarjana program studi Teknik Informatika, Fakultas Sains dan TeknologiUniversitas Sanata Dharma.
Dalam proses penulisan tugas akhir ini , penulis mengucapkan terima kasihyang sebesar-besarnya kepada :
1. Ibu PH.Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.
2. Ibu Ridowati Gunawan, S.Kom.,M.T., selaku Dosen Pembimbing sekaligus ketua program studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta, terimakasih atas segala bimbingan, kesabaran dan mengarahkan serta membimbing penulis dalam menyelesaikan tugas akhir ini.
3. Ibu Sri Hartati Wijono, S.Si.,M.Kom.dan Bapak Albert Agung Hadhiatma,S.T.,M.T. selaku dosen penguji yang telah memberikan banyak kritik dansaran untuk tugas akhir saya.
4. Bapak Iwan Binanto, M.Cs., selaku Dosen Pembimbing Akademik Teknik Informatika Tahun 2009.
5. Seluruh staff dosen Teknik Informatika Universitas Sanata Dharma yang telah banyak memberikan bekal ilmu, arahan dan pengalaman selama sayamenempuh studi.
6. Seluruh staff Sekretariat Teknik, yang banyak membantu saya dalam urusanadministrasi akademik terutama menjelang ujian tugas akhir.
7. Kedua orang tua dan kakak saya, terima kasih atas semua yang telah dilakukan untukku, doa, semangat,dukungan dan cintanya sehingga saya bisa menyelesaikan studi denganlancar.
8. Estu Karunianingtyas, terimakasih atas bantuan yang diberikan dalam penyusunan tugas akhir ini.
9. Teman-teman Teknik Informatika : Mirella Tri Ratnasari, Christina Wienda Asrini, Ratna Yani Astuti, Astriana Krisma Rizki, dan semua teman-teman TI lainnya.
(11)
10. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhirini yang tidak bisa saya sebutkan satu per satu.
Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh darisempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat penulis harapkan.Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak.Terima kasih.
Yogyakarta, 23 Agustus 2013 Penulis
(12)
Daftar Isi
HALAMAN PERSETUJUAN ... ERROR! BOOKMARK NOT DEFINED. HALAMAN PERSEMBAHAN ... IV PERNYATAAN KEASLIAN KARYA ... VI LEMBAR PERNYATAAN PERSETUJUAN ... VII PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... VII ABSTRAK ... VIII ABSTRACT ... IX KATA PENGANTAR ... X DAFTAR GAMBAR ... XIV DAFTAR TABEL ... XV
PENDAHULUAN ... 1
1.1 LATAR BELAKANG ... 1
1.2 RUMUSAN MASALAH ... 3
1.3 TUJUAN ... 3
1.4 BATASAN MASALAH ... 4
1.5 MANFAAT ... 4
1.6 METODOLOGI PENELITIAN ... 4
1.7 SISTEMATIKA PENULISAN ... 5
TINJAUAN PUSTAKA ... 6
2.1 FUZZY LOGIC ... 6
2.2 HIMPUNANFUZZY ... 7
2.2.1 Himpunan Tegas (Crisp) ... 7
2.1.1 Himpunanfuzzy ... 7
2.3 FUZZY CLUSTERING ... 7
1.4 FUZZY C-MEANS ... 8
2.5 CONFUSION MATRIX ... 10
2.6 DATA PREPARATION ... 11
2.7 PCA(PRINCIPAL COMPONENT ANALYSIS) ... 12
2.8 HEPATITIS ... 12
2.8.1 Penyebab Hepatitis ... 15
2.8.2 Jenis dan Gejala Hepatitis ... 15
2.8 CONTOH PENGGUNAAN FUZZY C-MEANS ... 17
ANALISIS DAN DESAIN SISTEM ... 24
3.1 DATA ... 24
3.2 GAMBARAN UMUM SISTEM ... 25
(13)
3.4 PERANCANGAN ANTARMUKA ... 26
3.5 SPESIFIKASI PERANGKAT LUNAK DAN PERANGKAT KERAS ... 27
IMPLEMENTASI DAN ANALISIS HASIL ... 28
4.1HASIL PENGUMPULAN DATA ... 28
4.2PERANCANGAN FUZZY C-MEANS ... 29
4.2.1 Pembersihan Data ... 30
4.2.2 Normalisasi data laboratorium ... 30
4.2.3 PCA ( Principal Component Analysis) ... 30
4.2.4Membentuk derajat Keanggotaan ( Matriks Uik) ... 34
5.3 IMPLEMENTASI USER INTERFACE ... 35
5.4 HASIL PENGUJIAN ... 38
5.5 ANALISIS ... 41
PENUTUP ... 43
5.1KESIMPULAN ... 43
5.2SARAN ... 44
DAFTAR PUSTAKA ... 45
(14)
DAFTAR GAMBAR
Gambar Keterangan Halaman
2.1 (Kohavi&Provost,1998) : Confusion Matrix 10
3.1 Flowchart Sistem 25
3.2 Use Case Diagram 26
3.3 Perancangan Antarmuka 26
4.1 Halaman Pengelompokkan Penyakit Hepatitis 35
4.2 dialog box untuk memilih data 36
4.3 Data awal 36
4.4 inisialisasi data 36
4.5 Nilai derajat keanggotaan iterasi terakhir 37
4.6 Fungsi Objektif 37
(15)
DAFTAR TABEL
Tabel Keterangan Halaman
2.1 Nilai normal pemeriksaan laboratorium 14
2.2 Kegunaan pemeriksaan labratorium 14
2.3 Jenis Hepatitis 15
4.1 Deskripsi data gejala anamnesis 28
4.2 Deskripsi data gejala Laboratorium 29
4.3 KMO and Bartlett;s Test 31
4.4 Communalities 31
4.5 Total Variance Explained 32
4.6 Conponent Matrix 33
4.7 Score Faktor 34
4.8 Component Score Coefficient Matrix 34
4.9 Fungsi FFCM_InitV 34
(16)
4.11 Hasil Pengujian data laboratorium 39
4.12 Hasil Pengujian data anamnesa dokter(PCA) 40
4.13 Hasil Pengujian data anamnesa dokter(PCA) dan data laboratorium
(17)
BAB I
PENDAHULUAN
Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.
1.1 Latar Belakang
Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian.Salah satunya adalah penyakit hepatitis.Indonesia merupakan Negara ketiga dengan penderita hepatitis terbanyak setelah China dan India.Penderita hepatitis B dan C di Indonesia diperkirakan mencapai 30 juta orang.( Dimyati, Vien, 2011).
Hepatitis merupakan salah satu penyakit yang membahayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.Fungsi utama dari hati atau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.
Ada 5 macam virushepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virushepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D (VHD) dan virus hepatitis E (VHE). Virus-virus ini terus berkembang dan bahkan diperkirakan sedikitnya masih ada 3 virus lagi yang dapat menyebabkan hepatitis.
(18)
Penyakit hepatitisdipilih dalam penelitian ini karena banyaknya orang tidak sadar jika sudah terkena penyakit hepatitissehingga menyebabkan keterlambatan penanganan dan dapat berakibat fatal.Di harapkan dengan adanya penelitian ini dapat membantu dalam pendeteksian penyakit hepatitis agar dapat di lakukan penanganan lebih lanjut dan supaya orang mengenal status kesehatan lebih dini.
Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik. Analisis ini sudah banyak digunakan untuk menyelesaikan permasalahan dan penelitian dalam beberapa disiplin ilmu, seperti bidang akademik, bidang kesehatan,bidang kewilayahan dan bidang marketing.
Perkembangan analisis kelompok dimulai dari metode hirarki yang secara garis besar membentuk sebuah tree diagram yang biasa disebut dendogram. Sedangkan metode nonhirarki lebih dikenal dengan cara partisi, contohnya K-means, metode ini menentukan terlebih dahulu jumlah kelompok yang akan dibentuk. Perkembangan lebih lanjut dari analisa kelompok adalah dengan mempertimbangkan tingkat keanggotaan yang mencangkup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokkan yang disebut dengan fuzzy clustering.
Dalam teknik fuzzy clustering, terdapat beberapa algoritma salah satunya adalah Fuzzy C-Means.Fuzzy C-Meansadalah salah satu teknik pengelompokkan data yang mana keberadaan tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat keanggotan. Metode Fuzzy C-Meanstermasuk metode supervised clusteringdimana jumlah pusat
clusterditentukan di dalam proses clustering.
Konsep dasar Fuzzy C-Means adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimalisasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut. Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data (Arifatno,2010).
(19)
Algoritma Fuzzy C-Means sering dipakai dalam berbagai bidang baik bisnis,kesehatan atau pendidikan. Beberapa penelitian yang menggunakan algoritma Fuzzy C-Means misalnya penelitian dalam pengelompokkan wilayah kecamatan menurut partisipasi sekolah, pengembangan algoritma Fuzzy C-means untuk brain medical image analysis, dan penelitian lainnya.
Pada penelitian ini algoritma Fuzzy C-means digunakan untuk mengelompokan orang yang terkena penyakit hepatitis A, hepatitis B, hepatitis C. Algoritma Fuzzy C-means ini di pilih karena metode ini dapat memberikan hasil yang cukup baik dalam hal meningkatkan homogenitas tiap kelompok yang dihasilkan.
Pendeteksian penyakit hepatitis sudah pernah dilakukan oleh Estu Karunianingtyas (Karunianingtyas,2011) menggunakan metode naïve Bayesiandengan 26 atribut dari data
anamnesis dokter, namun tingkat keakuratan yang didapat masih rendah karena hanya mencapai 51.11% maka dari itu penulis ingin melanjutkan penelitian dengan menggunakan metode Fuzzy C-means.
1.2 Rumusan Masalah
Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan adalah :
1. Apakah metode Fuzzy C-means dapat dipergunakan untuk mengelompokkan orang berpenyakit hepatitis dengan memberikan keakuratan yang baik ?
1.3 Tujuan
Tujuan yang ingin dicapai dalam penelitian ini adalah :
1. Menganalisis, mendisain, mengimplementasikan metode Fuzzy C-Means untuk mengelompokkan penyakit hepatitis.
2. Mengetahui tingkat keakuratan metode Fuzzy C-Means dalam mengelompokkan orang yang berpenyakit hepatitis.
(20)
1.4 Batasan Masalah
Batasan masalah dalam penelitian ini adalah :
1. Data set yang di gunakan adalah data hasil pemeriksaan laboratorium rumah sakit dan data hasil anamnesa.
2. Jenis hepatitis yang akan diteliti hanya 3 jenis yaitu hepatitis A, hepatitis B, dan hepatitis C karena jenis hepatitis D dan hepatitis E jarang ditemukan.
1.5 Manfaat
Manfaat yang diproleh dalam penelitian ini antara lain :
1. Memberikan gambaran tentang langkah – langkah analisis, design dan implementasi metodeFuzzy C-means dalam mengelompokkan orang yang berpenyakit hepatitis.
2. Sebagai referensi untuk penelitian yang berhubungan dengan clustering penyakit hepatitis yang lebih lanjut lagi.
1.6 Metodologi Penelitian
Metodologi yang digunakan adalah sebagai berikut: 1. Melakukan pengumpulan data.
2. Melakukan normalisasi pada data laboratorium.
3. Mengekstrak data anamnesis dokter menggunakan metode PCA ( Principal Component Analysis).
4. Menggabungkan data laboratorium yang sudah di normalisasi dengan data anamnesis
yang sudah di ekstraks.
5. Menghitung data dengan menggunakan metode FCM ( Fuzzy C-Means).
6. Menghitung nilai keakuratan hasil pengelompokkan dengan menggunakan Confusion Matrix.
(21)
1.7 Sistematika Penulisan
Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematikapenulisan sebagai berikut :
BAB I PENDAHULUAN
Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.
BAB II LANDASAN TEORI
Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy C-means. Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir mengenai pengujian keakuratan metode
BAB III Desain dan Analisis SISTEM
Bab ini berisi tentang desain dan analisis system meliputi contoh perhitungan, perancangan antarmuka, dan usecase.
BAB IV IMPLEMENTASI SISTEM DAN HASIL
Bab ini berisi implementasi program dari sistem yang akan dibuat, pembahasan penerapan algoritma Fuzzy C-Means, implemantasi antarmuka dan hasil implementasi.
BAB V PENUTUP
Bab ini berisi kesimpulan dari sistem yang telah dibuat, serta saran untuk pengembangan dan penyampurnaan Tugas Akhir yang dibuat.
(22)
BAB II
TINJAUAN PUSTAKA
Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy C-means.Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir mengenai pengujian keakuratan metode.
2.1 Fuzzy Logic
Teori Himpunan Fuzzyakan memberikan jawaban terhadap suatu masalah yangmengandung ketidak pastian. Aplikasi logika fuzzy untuk mendukung keputusan semakindiperlukan ketika semakin banyak kondisi yang menuntut adanya keputusan yang
tidakhanya bisa dijawab dengan „Ya‟ atau „Tidak‟.Fuzzy Logic memberikan rata-rata dariperhitungan angka, yang terletak antara nilai benar mutlak dan nilai salah mutlak, yangberupa range antara 0.0 dan 1.0. Dengan Fuzzy Logic, pengguna dimungkinkan untukmenghitung derajat keanggotaan dari sebuah data. Fuzzy Logic berurusan dengan kondisiyang tidak pasti, dimana benar dan salah tidak dapat ditentukan secara mutlak.
Konsep dari Fuzzy Logic diperkenalkan oleh Professor Lotfi A. Zadeh, di Barkley pada Universitas California (University of California) pada 1960an.Logika Fuzzy dikatakan sebagai logika baru yang lama, sebab ilmu tentang logika Fuzzy modern dan metodis baru ditemukan beberapa tahun yang lalu, padahal sebenarnya konsep tentang logika fuzzy itu sendiri sudah ada sejak lama.
Ada beberapa alasan mengapa orang menggunakan logika Fuzzy, antara lain :
1. Konsep logika Fuzzy mudah dimengerti. Konsep matematis yang mendasari penalaran Fuzzy sangat sederhana dan mudah dimengerti.
2. Logika Fuzzy sangat fleksibel.
3. Logika Fuzzy memiliki toleransi terhadap data-data yang tidak tepat.
4. Logika Fuzzy mampu memodelkan fungsi-fungsi non-linear yang sangat kompleks.
(23)
2.2 Himpunan Fuzzy
2.2.1 Himpunan Tegas (Crisp)
Pada himpunan tegas, nilai keanggotaan suatu item (x) dalam suatu himpunan A, sering ditulis dengan µA(x), memiliki dua kemungkinan yaitu :
a. 1 (satu), yang bearti suatu item menjadi anggota dalam suatu himpunan b. 0 (nol), yang bearti suatu item tidak menjadi anggota himpunan tersebut.
2.1.1 Himpunanfuzzy
Pada himpunan fuzzy nilai keanggotaan terletak pada rentang 0 sampai 1. Apabila x memiliki nilai keanggotaan fuzzy µA(x)=0 bearti x tidak menjadi anggota himpunan A. demikian pula, apabila x memiliki nilai keanggotaan µA(x)=1 bearti x menjadi anggota penuh himpunan A.
2.3 Fuzzy Clustering
Fuzzy clustering adalah salah satu teknik menentukan cluster optimal dalam suatu ruang vektor yang didasarkan pada bentuk normal euclidean untuk jarak antar vektor (Kusumadewi,2004).
Metode ini merupakan pengembangan dari metode partitioning data dengan pembobotan fuzzy. Keunggulan utama fuzzy clustering adalah dapat memberikan hasil pengelompokkan objek – objek yang tersebar tidak teratur, karena jika terdapat suatu data yang penyebarannya tidak teratur maka terdapat kemungkinan suatu titik data mempunyai sifat atau karakteristik dari cluster lain sehingga diperlukan pembobotan kecenderungan titik data terhadap suatu cluster.
Dalam teori logika fuzzy suatu nilai bisa bernilai benar atau salah secara bersama.Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot keanggotaan yang dimilikinya.Logika fuzzy memiliki derajat keanggotaan dalam rentang 0 hingga 1.
Logika fuzzy adalah suatu cara yang tepat untuk memetakan suatu ruang input kedalam suatu ruang output, mempunyai nilai kontinyu. Fuzzy dinyatakan dalam derajat dari suatu
(24)
keanggotaan dan derajat dari kebenaran. Oleh sebab itu sesuatu dapat dikatakan sebagian benar dan sebagian salah pada waktu yang sama (Kusumadewi. 2004).
1.4 Fuzzy C-Means
Dalam teknik clustering data terdapat beberapa algoritma, salah satunya adalah Fuzzy C-means. Fuzzy C-means merupakan pengembangan dari metode K-mean clustering karena pada awalnya ditentukan dulu jumlah kelompok atau cluster yang akan dibentuk. Kemudian dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut.
Konsep dasar Fuzzy C-means, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.
Algoritma pengelompokan Fuzzy C-means menurut Kusumadewi diberikan sebagai berikut :
i. Tentukan :
1. Matriks X berukuran n x m dengan n = jumlah data yang akan di cluster dan m= jumlah variabel (criteria)
2. Jumlah cluter yang akan di bentuk = C
3. w> 1 adalah tingkat ke fuzzy-an dari hasil pengelompokkan. Parameter ini disebut dengan fuzzier, nilai dari w yang sering dipakai dan dianggap paling halus adalah w=2 (Klawoon dan Hopper,2001)
4. Iterasi tertinggi
5. Kriteria penghentian = e (nilai positif yang sangat kecil) 6. Iterasi awal t=1,dan ∆=1
ii. Bentuk matriks partisi awal Uik seperti rumus (2,1) sebagai berikut
[
(25)
Matrik partisi Uik mempunyai komponen i= banyaknya data, k = banyaknya cluster. Matrik ini random dengan kisaran nilai 0 sampai 1.
iii. Hitung pusat cluster dengan menggunakan rumus (2,2) :
iv. Hitung fungsi objektif pada iterasi ke –i dengan menggunakan rumus (2,3)
dik merupakan ukuran jarak untuk jarak Euclidean antara pusat cluster ke-i dengan data ke-k. untuk menghitung dik digunakan rumus (2,4) :
v. Perbaiki drajat keanggotaan tiap data pada tiap cluster dengan menggunakan rumus (2,5)
vi. Cek kondisi berhenti jika :
a) Jika: (|Pi-Pi-1 |<e) atau (t>MaxIter) maka berhenti. b) Jika tidak: t=t+1, ulangi langkah iii.
Dari algoritma tersebut dapat disimpulkan bahwa langkah pertama yang dilakukan adalah menentukan matriks derajat keanggotaan secara acak yang kemudian dijadikan acuan terhadap perhitungan pusat cluster. Pada kondisi awal pusat cluster masih belum akurat, yang ditunjukkan dengan besarnya selisih nilai objektif, sehingga dilakukan langkah iteratif dengan cara memperbaiki pusat cluster. Dengan langkah iteratif ini dapat dilihat bahwa pusat
∑∑
∑ ∑
[∑
]
(2,2)
(2,3)
(2,4)
(2,5) [∑
]
(26)
cluster bergerak menuju lokasi yang tepat. Langkah ini dilakukan berdasarkan minimisasi fungsi objektif.
Output dari Fuzzy C-means merupakan matriks pusat cluster berukuran c x p dan matriks derajat keanggotaan untuk tiap – tiap data berbentuk n x c. Pengelompokkan cluster
dapat dilihat dari kedua output ini. Matriks pusat cluster menunjukkan pusat cluster untuk tiap – tiap variabel yang diamati dalam setiap cluster-nya. Matriks derajat keanggotaan menunjukkan kecenderungan suatu data untuk masuk kedalam cluster tertentu. Semakin besar nilai derajat keanggotaannya, maka semakin besar peluang data tersebut masuk kedalamclustertertentu.
2.5 Confusion Matrix
Validasi merupakan proses untuk menilai hasil metode cluster. Oleh karena itu, proses ini bertujuan untuk menjamin bahwa solusi cluster yang di hasilkan dalam analisis
cluster dapat menggambarkan populasi sebenarnya.
Confusion Matrix merupakan bagian dari uji validasi dengan metode external test.Uji validasi external test ini digunakan untuk mengukur sejauh mana label pada cluster dengan label pada class yang disediakan.
Menurut Kohavi dan Provost (Kohavi dan Provost,1998) confusion Matrix berisi informasi tentang actual (fakta)dan predicted (prediksi). Confusion matrix pada gambar 2.1 berbentuk matrix 2 x 2 yang digunakan untuk mendapatkan jumlah ketepatan yang didapat dengan menggunakan algoritma tertentu
Predicted
Negative Positif
Actual
Negative A B
(27)
Gambar 2.1 (Kohavi&Provost,1998) : Confusion Matrix
Keterangan :
A, jikaactual dan predicted bernilai negative.
B, jika actual bernilai negative dan predicted bernilai positive.
C, jika actual bernilai positive dan predicted bernilai negative
D, jika actual dan predicted bernilai positive.
Rumus yang digunakan untuk menghitung akurasi dengan confusion matrix,yaitu :
2.6 Data Preparation
Proses preparasi ini dilakukan sehingga data dapat lebih mudah untuk diolah. Terdapat 3 hal dalam data preparationyaitu :
1. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses
data mining.
2. Data Preprocessing: Memastikan kualitas data yang telah dipilih pada tahap
dataselection, pada tahap ini masalah yang harus dihadapi adalah noisy data dan
missing values. Proses pembersihan data (cleansing) dilakukan dengan melakukan metode-metode query sederhana untuk menemukan anomali-anomali data yang bisa saja masih terdapat pada sistem.
3. Data Transformation: Mengelompokkan atribut-atribut atau field-yang telah terpilih menjadi 1 tabel dengan cara melakukan denormalisasi.
(28)
2.7
PCA (Principal Component Analysis)
Terdapat dua metode Dimensionality Reduction yang paling sering digunakan yaitu
Feature Selection dan Feature Extraction.Feature selection merupakan sebuah proses pemilihan subset feature dari feature asli, sedangkan feature extraction adalah proses mengekstrak feature baru dari feature asli melalui pemetaan fungsional.
Salah satu metode feature extraction adalah PCA ( Principal Component Analysis ). Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan principal component
Analisis Komponen Utama (Principal Component Analysis) atau PCA adalah suatu metodeyang melibatkan prosedur matematika yangmengubah dan mentransformasikan sejumlah besarvariabel yang berkorelasi menjadi sejumlah kecilvariabel yang tidak berkorelasi, tanpa menghilangkaninformasi penting di dalamnya
2.8 Hepatitis
Hepatitis telah menjadi masalah global. Saat ini diperkirakan 400 juta orang di dunia terinfeksi hepatitis B kronis, bahkan sekitar 1 juta orang meninggal setiap tahun karena penyakit ini (Wening,2008).
Hepatitis adalah istilah umum yang berarti radang hati.“Hepa” berarti kaitan dengan
hati, sementara “itis” berarti radang.Hepatitis atau peradangan hati dapat diartikan sebagai suatu proses peradangan yang menimpa sel-sel hati (Cahyono,2008). Secara objektif, adanya hepatitis dibuktikan melalui biopsi jaringan hati (pengambilan sedikit jaringan hati menggunankan jarum).Namun, secara sederhana pemeriksaan dapat digantikan dengan pemeriksaan darah.
Hepatitismerupakan salah satu penyakit yang membayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.
(29)
Hati adalah organ yang terbesar dalam tubuh. Kurang lebih sama besar dengan buah pepaya, dan terletak di perut kanan-atas.Fungsi utama dari hatiatau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.
Ada 5 macam virus hepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virus hepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D(VHD), virus hepatitis E (VHE).
Diagnosis hepatitis dapat dipastikan melalui anamnesis dengan dokter serta pemeriksaan fisik dan laboratorium. Dokter akan menanyakan hal – hal yang terkait dengan penularan hepatitis karena hepatitis jenis A, B, C, dan jenis lainnya memberikan gejala yang hampir sama.
Pemeriksaan laboratorium pada pasien yang diduga mengidap penyakit hepatitis dilakukan untuk memastikan diagnosis, mengetahui penyebab dan menilai fungsi hati.Secara garis besar, pemeriksaan laboratorium dibadakan menjadi dua yaitu, tes seralogi dan biokimia hati.
Tes seralogi dilakukan dengan cara memeriksa kadar antigen maupun antibodi terhadap virus penyebab hepatitis. Tes ini bertujuan untuk memastikan diagnosis serta mengetahui jenis virus penyebabnya. Tes biokimia hati dilakukan dengan cara memeriksa parameter zat – zat kimia maupun enzim yang dihasilkan atau diproses oleh jaringan hati. Tes biokimia hati dapat dipergunakan untuk mengetahui derajat keparahan atau kerusakan sel sehingga dapat menilai fungsi hati.
Penderita penyakit hati secara umum termasuk hepatitis, akan diperiksa darahnya untuk beberapa jenis pemeriksaan parameter biokimia, seperti AST, ALT (alanin aminotransferase), alkaline fosfatase,bilirubin, albumin, dan protombin (Wening, 2008). Adapun nilai normal untuk pemeriksaan laboratorium disajikan dalam tabel 2.1 dan kegunaan dari jenis pemeriksaan laboratorium akan disajikan dalam table 2.2.
(30)
Tabel 2.1 : Nilai normal pemeriksaan laboratorium
Parameter Biokimia Hati Rentang Nilai Normal
AST / SGOT ≥ 37 U/L (Pria) | ≥ 31 U/L (wanita)
ALT / SGPT ≥ 42 U/L (Pria) | ≥ 32 U/L (wanita)
HBsAg
NEGATIF : < 1,0 S/CO atau < 1,0 COI (ECLIA)
Anti HAV
NEGATIF : < 1,0 COI POSITIF : >= 1,0 COI (EIA)
Anti HCV
NEGATIF : < 1,0 S/CO atau < 1,0 COI (EIA)
Tabel 2.2 : Kegunaan Pemeriksaan Laboratorium
Jenis Pemeriksaan Kegunaan
SGOT Untuk mengetahui fungsi hati , membantu mendiagnosis kelainan hati
SPGT Untuk mengetahui fungsi hati, membantu mendiagnosis kelainan hati
HBsAg Untuk mengetahui adanya infeksi virus Hepatitis B. Jika HBsAg positif maka terinfeksi virus hepatitis B. Jika HBsAg positif selama
lebih dari 6 bulan, berarti pasien menderita Hepatitis B kronis dan disarankan untuk rutin memeriksakan fungsi hati (SGOT, SGPT, Protein Total, Albumin, AFP) paling tidak 6 bulan – 1 tahun sekali
Anti HAV/ IgM Anti HAV
Untuk mengetahui adanya antibody terhadap virus Hepatitis A
Anti HCV Untuk mengetahui adanya antibody terhadap virus Hepatitis C. Anti HCV positif berarti pasien menderita Hepatitis C.
(31)
2.8.1 Penyebab Hepatitis
Penyebab hepatitis sendiri sangat banyak,misalnya hepatitis akibat virus, bahan kimia, obat – obatan, alkohol, dan lain – lain. Pada saat ini penyakit hepatitis yang sering menjadi masalah adalah hepatitis virus, terutama akibat virus hepatitis B dan C sebab kedua jenis hepatitis ini sering menimbulkan hepatitis kronis yang dapat berakhir menjadi sironishati dan kanker hati (Cahyono,2008).
2.8.2 Jenis dan Gejala Hepatitis
Menurut Cahyono (2008), perbedaan dari setiap jenis hepatitis dapat dilihat pada tabel 2 dibawah ini :
Tabel 2.3 : Jenis Hepatitis
Sifat Virus Hepatitis A Virus Hepatitis B Virus Hepatitis C
Virus Hepatitis D Virus Hepatitis E Masa Tunas
15 – 45 hari
40 – 80 hari 5 – 12 minggu
4 – 20 minggu 15 – 40 hari Penularan Mulut (Peroral) Darah (Parental) Darah (Parental)
Darah (Parental) Oral (Peroral)
Cronisitas
Tidak Ya Ya Ya Tidak
Carrier Kronik
Tidak Ya Ya Ya Tidak
Penyebab Picorna Virus HepadnaVirus Flavi Virus DefectiveVirus diliputi HBsAg Calici Virus
Pada fase awal hepatitis, penderita belum merasakan gejala yang spesifik. Keluhan yang dirasakan antara lain mual, muntah, tidak nafsu makan, badan terasa lemas, dan mudah lelah. Kelelahan adalah keluhan yang paling sering terjadi pada penderita hepatitis.
(32)
Hepatitis A merupakan jenis hepatitis yang paling ringan. Hal ini disebabkan infeksi virus hepatitis A (VHA) umumnya tidak sampai menyebabkan kerusakan jaringan hati (Wening, 2008). Mereka yang terinfeksi virus ini dapat pulih sepenuhnya. Hepatitis A ini menular melalui makanan atau minuman yang telah terkontaminasi oleh virus VHA.
Hepatitis B merupakan jenis hepatitis yang paling berbahaya.Penyakit ini lebih sering menular dibandingkan dengan jenis hepatitis lainnya. Hepatitis B menular melalui kontak darah atau cairan tubuh yang mengandung virus hepatitis B (VHB) maupun material lain yang terinfeksi, seperti jarum suntik, alat bedah, jarum akupuntur, dan alat – alat yang dapat menimbulkan luka lecet milik individu yang terinfeksi .Hepatitis B kronis memberikan gejala yang lebih serius yaitu mudah lelah, cemas, tidak nafsu makan, mual, muntah dan merasa lemas.Hepatitis B kronis dapat membuat penumpukan cairan dalam rongga perut sehingga perut terlihat membuncit.Seseorang dapat mengidap virus ini tetapi tidak disertai dengan gejala klinik atau tidak tampak adanya kelainan atau gangguan kesehatan. Orang tersebut merupakan pembawa atau biasa disebut carrier.
Carrier dapat terjadi karena individu tersebut memiliki pertahanan tubuh yang baik atau karena virus VHB mengalami perubahan sifat yang tidak aktif (Wening, 2008).Virus yang tidak aktif ini akan membuat pertahanan tubuh tidak dapat mengenalinya sebagai
“musuh” sehingga sistem imun tidak mengadakan perlawanan, suatu saat ketika pertahanan
tubuh dalam kondisi lemah maka virus akan aktif dan akan muncul gejala hepatitis. Carrier
jumlahnya relatif banyak dan berpotensi menularkan.
Hepatitis C juga menyebabkan peradangan hati yang cukup berat. Hepatitis C menular melalui darah, biasanya karena transfusi atau jarum suntik yang terkontaminasi virus hepatitis C (VHC).Pada penderita hepatitis C keluhan yang dirasakan adalah merasalemas, mual, muntah, hilang nafsu makan, demam, mual, dan nyeri ulu hati. Sebagian dari penderita mengeluh bahwa urin berwarna gelap, feses berwarna putih, serta kulit, kuku dan bola mata bagian putih berwarna kuning. Jika diraba, perut bagian atas kanan membesar karena terjadi pembesaran hati maupun terasa adanya tegangan didaerah hati.
(33)
2.8 Contoh Penggunaan Fuzzy C-Means
Terdapat data gejala yang telah dirubah kedalam bentuk biner
Pegal NyeriSendi Normal Linu-linu
0 0 1 0
0 0 1 0
0 0 1 0
0 0 1 0
0 0 1 0
0 1 0 0
0 0 1 0
1 0 0 0
0 0 1 0
0 0 1 0
0 0 1 0
0 0 1 0
Data tersebut akan dibagi dalam tiga kelompok. Pertama tentukan :
banyaknya cluster c 3
Pembobot w 2
maksimum iterasi maxiter 5
error e 0.01
fungsi objektif P0 0
Iterasi awal iter 1
(34)
i k1 k2 k3
1 0.440986528 0.490279156 0.069
2 0.555826368 0.384816328 0.059
3 0.156206358 0.306739378 0.537
4 0.460986631 0.075301468 0.464
5 0.426768818 0.216412813 0.357
6 0.095909122 0.285092664 0.619
7 0.32906622 0.398552921 0.272
8 0.019634378 0.466853598 0.514
9 0.311402432 0.347649768 0.341
10 0.321789912 0.537765533 0.14
11 0.695747687 0.031368532 0.273
12 0.047758847 0.100471348 0.852
Langkah selanjutnya adalah menghitung pusat kluster Vij dan didapat hasil :
vij 1 2 3 4 5 6 7
1 0.00532574 0.001543791 0.712869 0.280262 0.934722 0 0.161594 2 0.05747037 0.161248551 0.780585 0.000696 0.738046 0 0.118575 3 0.1668799 0.430836171 0.369851 0.032433 0.824529 0 0.106082
8 9 10 11 12 13 14 15 16
0.883904 0.48318 0.933401 0.336406 0.756065 0.123037 0 0.1054 0.001321 0.710058 0.647889 0.730909 0.086154 0.889208 0.004009 0 0.0331 0.007138 0.94078 0.484568 0.508542 0.083062 0.409287 0.093653 0 0.0555 0.315987
17 18 19 20 21 22 23 24 25 26
0.014127 0.644569 0.355431 0.752799 0.638885 0.412827 0 0 0.059952236 0.805538 0.066529 0.57227 0.42773 0.740745 0.563643 0.650965 0 0 0.204483286 0.369964 0.125621 0.608367 0.391633 0.656525 0.33848 0.522367 0 0 0.008590829 0.35201
(35)
Lalu hitung fungsi objektif pada iterasi ke-i Pk1 0.425421188 0.400981585 0.097718459 0.878426136 0.739858999 0.050045697 0.314062712 0.00157452 0.449803355 0.569634953 1.205474338 0.013652833 pk2 0.569272 0.332846 0.341193 0.024486 0.206732 0.377365 0.31748 0.700377 0.520319 0.965603 0.004561 0.056323
pk3 p kluster 0.015653 1.010346315 0.011176 0.745003756 1.127077 1.565988973 0.905885 1.808796982 0.647684 1.594275499 1.617009 2.044419013 0.211604 0.843146995 0.82873 1.530682167 0.618954 1.589076395 0.106368 1.641606159 0.34855 1.558585765 1.911485 1.981460854 total 17.91338887
Kemudian setelah fungsi objektif diperoleh, yang dilakukan adalah memperbaiki derajat keanggotaan dan diperoleh derajatkeanggotaan yang baru sebagai berikut :
K1 K2 K3
1 0.28 0.30 0.42
2 0.19 0.33 0.47
3 0.35 0.31 0.34
4 0.33 0.34 0.33
5 0.30 0.33 0.38
6 0.38 0.32 0.30
(36)
8 0.39 0.31 0.30
9 0.33 0.30 0.37
10 0.39 0.23 0.38
11 0.21 0.39 0.40
12 0.42 0.39 0.19
Setelah dibentuk derajat keanggotaan yang baru kemudian cek kondisi berhenti apakah (|Pi-Pi-1 |<e) atau (t>MaxIter) ? Jika tidak: t=t+1, ulangi langkah dari menghitung pusat kluster.
Setelah mengalami 6 kali iterasi maka diperoleh fungsi objektif sebagai berikut :
Iterasi Fungsi Objektif
1 17.91338887
2 14.52300538
3 14.261227
4 14.23399458
5 14.22633765
(37)
Dan derajat keanggotaan yang diperoleh pada iterasi keenam adalah :
K1 K2 K3
0.35 0.33 0.32 0.35 0.32 0.33 0.35 0.33 0.32 0.33 0.34 0.33 0.34 0.33 0.32 0.32 0.34 0.34 0.31 0.35 0.34 0.34 0.33 0.33 0.32 0.34 0.34 0.32 0.34 0.34 0.34 0.33 0.33 0.33 0.33 0.34
(38)
dari matriks derajat keanggotaan diatas maka dapat disimpulkan pengelompokkan data setelah iterasi keenam :
K1 K2 K3
X
X
X
X
X
X
X
X
X X
X X
X
(39)
Setelah data dikelompokkan dengan menggunakan Fuzzy C-Means maka hasil pengelompokkan tersebut dihitung dengan menggunkana confusion matrix sebagai berikut
Hepatitis\Kelompok a b c
K1 3 2 1
K2 1 2 2
K3 0 0 3
(40)
BAB III
ANALISIS dan DESAIN SISTEM
Bab ini berisi tentang desain dan analisis sistem meliputi perancangan antarmuka,
flowchartdan usecase.
3.1 Data
Penyakit hepatitis merupakan penyakit peradangan hati. Terdapat beberapa jenis hepatitis yaitu hepatitis A, B, C, D, E. Hepatitis tipe A dan E masih dapat untuk di sembuhkan, namun untuk hepatitis tipe B dan C biasanya menjadi penyakit yang kronis.Dalam penelitian ini penyakit hepatitis yang akan digunakan adalah hepatitis A, B, dan C karena tipe tersebut yang paling banyak ditemui dibandingkan dengan tipe yang lainnya.
Rumah sakit Panti Rapih Yogyakarta merupakan sebuah rumah sakit besar yang setiap harinya didatangi pasien hepatitis untuk berobat. Data yang didapat dari Rumah sakit Panti Rapih merupakan data set yang bertipe record, berupa data hasil laboratorium dan data dari hasil pemeriksaan dari dokter(anamnesis).Semua keterangan tentang status data pasien tersebut dikumpulkan dan didokumentasikan oleh pihak rekam medis.
Data anamnesis yang didapat sebanyak 130 data yang merupakan data pasien penyakit hepatitis tahun 2000 hingga 2010 yang diambil tanggal 10 Januari 2011 oleh Estu Karunianingtyas. Dari data anamnesis didapat lima gejala yaitu gejala otot, gejala perut, gejala kulit, gejala mata, dan gejala mirip flu. Masing –masing gejala tersebut memiliki beberapa sub gejala.
Data laboratorium yang didapat sebanyak 66 data pasien hepatitis A, 48 pasien hepatitis B, dan 30 pasien hepatitis C. Dari data laboratorium didapat lima gejala yaitu SGPT, SGOT, antiHAV, HbsAg, dan antiHCV.
Gejala otot memiliki sub gejala pegal dan nyeri sendi. Gejala perut memiliki sub gejala muntah, diare, kencing berwarna gelap, nafsu makan berkurang, mual,nyeri perut sebelah kanan, Illeus obstructive,Haemotomesis. Gejala kulit memiliki sub gejala kulit berwarna kuning dan kulit berwarna normal. Gejala mata memiliki subgejala mata berwarna kuning
(41)
dan mata berwarna normal. Gejala mirip flu memiliki sub gejala demam, lesu, pusing, mialgia, lelah, dan menggigil.
Data anamnesispasien yang telah didapat dilakukan binerisasi yaitu konversi sub gejala menjadi 0 atau 1 dengan ketentuan 0 jika pasien tidak mengalami gejala tersebut dan 1 jika pasien mengalami gejala tersebut.
3.2 Gambaran Umum Sistem
Sistem ini digunakan untuk melakukan pengelompokkan jenis penyakit hepatitis berdasarkan dengan gejala anamnesis dan gejala laboratorium dengan menggunakan metode
Fuzzy C-Means.Sistem ini juga digunakan untuk menghitung keakuratan dari metode Fuzzy C-Means dalam mengelompokkan penyakit hepatitis.Pengelompokkan dilakukan untuk memberikaninformasi mengenai anggota masing-masing cluster/kelompok.
Flowchartsistem pengelompokkan penyakit hepatitis sebagai berikut :
1. User memasukkan data yang akan diproses
2. Usermenginputkan inisialisasi awal berupa bobot, maksimum iterasi, nilai error minimal, iterasi awal, dan fungsi objektif awal.
3. Proses pengelompokkan data dengan FCM dan perhitungan akurasi 4. Output berupa hasil clustering dan besar nilai akurasi.
(42)
3.3 Use Case Diagram
Diagram use case digunakan untuk menggambarkan interaksi antara pengguna dengan sistem. Pada system ini yang menjadi actor adalahuser. User dapat memilih data yang akan dikelompokkan dan dapat melakukan pengelompokkan data.Fungsi yang dapat dijalankan oleh pengguna sistem ini adalah fungsi memasukkan data dalam bentuk file .csv. Fungsi berikutnya adalah fungsi memasukkan data inisialisasi awal.Fungsi terakhir yaitu fungsi mengelompokkan data dengan metode FCM. Diagram use case dari sistem pengelompokkan penyakit hepatitis dengan menggunakan metode Fuzzy C-Means ini dapat dilihat pada gambar 3.2 di bawah ini
Gambar 3.2 : Use Case Diagram
3.4 Perancangan Antarmuka
Gambar 3.3 : Perancangan Antarmuka Cari data rekam medis
Proses Pengelompokkan dengan metode FCM
input inisialisasi awal
(43)
Desain Tampilan sistem pengelompokkan penyakit hepatitis dengan metode Fuzzy C-Means ini hanya mempunyai satu tampilan utama. Pada tampilan ini terdapat fasilitas untuk mencari data rekam medis yang akan dihitung dan data yang dipilih akan ditampilkan di tabel
“Data Awal” , selain itu juga user harus mengisikan inisialisasi awal pada tampilan ini
sebelum tombol “Hitung” ditekan. Nilai dari tabel “Derajat Keanggotaan” dan tabel “Akurasi” serta nilai akurasi akan otomatis terisi ketika tombol “Hitung” ditekan.
3.5 Spesifikasi Perangkat Lunak dan Perangkat Keras
Spesifikasi software dan hardware yang digunakan dalam implementasi sistem diagnosa penyakit hepatitis menggunakan Fuzzy C-Meansadalah sebagai berikut:
1. Software :
XP SP 2
2. Hardware :
Processor : Intel(R) Core(TM) i3 CPU M370 @2.40GHz
Memory : 2 GB.
(44)
BAB IV
Implementasi dan Analisis Hasil
Pada bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari implementasi system yang telah dibuat. Hasil penelitian yang terpenting berupa perbandingan akurasi yang diperoleh dari pengujian metode Fuzzy C-Means. Pada bab ini juga dibahas mengenai user interface yang dibangun berdasarkan algoritma yang telah dirancang.
4.1 Hasil Pengumpulan Data
Pada penelitian yang telah dilakukan di Rumah Sakit Panti Rapih Yogyakarta, diperoleh 144 data laboratorium dari pasien yang mengidap penyakit hepatitis A, hepatitis B dan hepatitis C yang masing – masing 66 data pasien hepatitis A, 48 data pasien hepatitis B, dan 30 data pasien hepatitis C. Dari 130 data anamnesis terdiri dari 50 data hepatitis A, 50 data hepatitis B dan 30 data hepatitis C dan merupakan data pasien penyakit hepatitis tahun 2000 hingga 2010 yang diambil tanggal 10 Januari 2011 oleh Estu Karunianingtyas. Untuk masing – masing gejala anamnesis terdiri atas beberapa kriteria seperti pada tabel 4.1 dan untuk data laboratorium terdiri atas beberapa feature seperti pada tabel 4.2 dibawah ini :
Tabel 4.1 : Deskripsi data gejala anamnesis
NO Gejala Feature
1 Otot Pegal, nyeri sendi, normal dan linu -linu
2 Perut Muntah, diare, kencing berwarna gelap, mual, nyeri perut sebelah kanan, nafsu makan berkurang dan perut acites(perut membuncit)
(45)
4 Mata Normal, kuning
5 Mirip Flu Demam, pusing, lesu, mialgia, lelah, menggigil, batuk
Tabel 4.2 : Deskripsi data gejala Laboratorium
NO Feature
1 SGOT
2 SGPT
3 Igm
4 HbsAg
5 Anti HCV
Data anamnesis dan data laboratorium pasien hepatitis digabungkan menjadi satu berupa teks yang disimpan dalam format excel (.xls), masing-masing disimpan secara terpisah baik data hepatitis A, B maupun C. Terdiri 40 data hepatitis A, 40 data hepatitis B dan 30 data hepatitis C.
4.2 Perancangan Fuzzy C- Means
Data yang digunakan dalam penelitian ini adalah data hasil diagnosa akhir dan data laboratorium pasien hepatitis yang diperoleh dari Rekam Medis Rumah Sakit Panti Rapih.Data diberikan dalam bentuk manual, yaitu berupa map yang berisi lembaran data pasien, baik hasil pencatatan anamnesa/ gejala penyakit dan hasil laboratorium serta data
(46)
diagnosa keperawatan yang mana pasien telah dirawat inap.Peneliti melakukan pencatatan data laboratorium pasien dalam format ekstensi xls.
4.2.1 Pembersihan Data
Pembersihan Data (data cleaning) merupakan tahap awal dalam proses penambangan data. Pada data anamnesisdan data laboratorium yang diperoleh terdapat beberapa data yang tidak lengkap, seperti misalnya ada beberapa pasien yang tidak menjalani pemeriksaan laboratorium sehingga tidak didapat data laborataoriumnya dan terdapat juga pasien yang menjalani pemeriksaan laboratorium yang tidak menyeluruh sehingga menyebabkan data tidak lengkap.Data yang tidak lengkap tersebut kemudian dibuang sehingga diperoleh 110 data laboratorium dan 110 data anamnesis.
4.2.2 Normalisasi data laboratorium
Pada data hasil pemeriksaan laboratorium didapat nilai hasil pemeriksaan yang mempunyai satuan yang berbeda – beda. Hal ini disebabkan karena alat pemeriksaanyang digunakan untuk memeriksa penyakit hepatitis berbeda antara pasien satu dengan pasien yang lain sehingga menyebabkan rentang nilai normal yang berbeda.Perbedaan jenis kelamin juga berpengaruh pada rentang nilai normal pemeriksaan laboratorium.Data pemeriksaan laboratorium dinormalisasi dengan menggunakan nilai rentang normal dari pemeriksaan laboratorium sesuai dengan jenis alat yang digunakan dan jenis kelamin pasien.
4.2.3 PCA ( Principal Component Analysis)
PCA merupakan salah satu dari metode dimensional reduction yang digunakan untuk menyederhanakan variabel.Pada penelitian ini, data yang diolah dengan menggunakan metode PCA adalah data anamnesa yang mempunyai 26 variabel.
Data anamnesa ini akan diolah dengan bantuan SPSS 17untuk mereduksi variabel bebas yang berkorelasi tinggi sehingga dapat diketahui variabel mana saja yang dianggap layak untuk dimasukkan ke analisis berikutnya.
(47)
Langkah – langkah yang dilakukan dalam prosedur PCA dengan menggunakan SPSS 17 pada data anamnesa pasien penyakit hepatitis adalah sebagai berikut :
a. Barlett Test
Tabel 4.3: KMO and Bartlett;s Test
.236 Approx.
Chi-Square
1168.660
df 325
Sig. .000
KMO and Bartlett's Test Kaiser-Meyer-Olkin
Bartlett's Test of Sphericity
Barlett Test merupakan tes statistik untuk menguji apakah betul variabel-variabel bebas yang dilibatkan berkorelasi.
Ho :Tidak ada korelasi antarvariabel bebas
H1 :Ada korelasi antarvariabel bebas
Kriteria uji dengan melihat p-value (signifikansi) : Terima Ho jika Sig. > 0,05 atau tolak Ho jika Sig. < 0,05. Pada tabel 4.3 di atas dapat dilihat bahwa nilai Chi-Square adalah 1168.660, dengan derajat bebas sebesar 325, dan p-value (sig) sebesar 0,000. Karena p-value (0,000) < 0,05 maka Ho di tolak. Artinya, benar-benar terdapat korelasi antarvariabel bebas
b. Communalities
Tabel 4.4: Communalities
Initial Extraction
Pegal 1.000 .715
NyeriSend i
1.000 .867
Norm aloto t
1.000 .912
Linulinu 1.000 .709
Muntah 1.000 .700
Diare 1.000 .721
Kem bung 1.000 .610
m ual 1.000 .641
nps k 1.000 .665
(48)
Communalities menunjukkan berapa varians yang dapat dijelaskan oleh factor yang diekstrak (faktor yang terbentuk).Cara memperolehnya adalah dengan mengkuadratkan nilai korelasi yang terdapat pada tabel 4.6Component Matrix.Setiap variabel berkorelasi dengan faktor-faktor yang terbentuk.Misalkan untuk variabel pegal diperoleh nilai sebesar 0.715. Hal ini berarti sekitar 71,5% variabel pegal dapat dijelaskan oleh faktor yang terbentuk. Untuk variabel nyeri sendi, diperoleh nilai sebesar 0,867. Hal ini berarti sekitar 86,7% variabel nyeri sendi dapat dijelaskan oleh faktor yang terbentuk.
c. Total Variance Explained
Tabel 4.5: Total Variance Explained
Total
% of Variance
Cumulativ
e % Total
% of Variance
Cumulativ e %
1 2.978 11.454 11.454 2.978 11.454 11.454
2 2.414 9.284 20.739 2.414 9.284 20.739
3 2.255 8.672 29.410 2.255 8.672 29.410
4 1.692 6.508 35.919 1.692 6.508 35.919
5 1.551 5.967 41.885 1.551 5.967 41.885
6 1.450 5.578 47.464 1.450 5.578 47.464
7 1.320 5.077 52.540 1.320 5.077 52.540
8 1.168 4.493 57.033 1.168 4.493 57.033
9 1.121 4.313 61.346 1.121 4.313 61.346
10 1.070 4.115 65.461 1.070 4.115 65.461
11 1.028 3.954 69.415 1.028 3.954 69.415
12 .987 3.796 73.211
13 .927 3.564 76.775
Compone nt
Initial Eigenvalues
Extraction Sums of Squared Loadings
Kemampuan setiap factor mewakili variabel-variabel yang dianalisis ditunjukkan oleh besarnya varians yang dijelaskan, yang disebut dengan
eigenvalue.Varians yang dimaksud adalah varians variabel-variabel yang sudah distandardisasi.Dengan standardisasi, nilai rata-rata setiap variabel menjadi nol dan variansnya menjadi satu.Karena varians setiap variabel adalah satu, maka varians totalnya ada 26 karena dalam kasus ini ada 26 variabel bebas.
Eigenvalues menunjukkan kepentingan relatif masing-masing factor dalam menghitung varians ketiga variabel yang dianalisis. Susunan eigenvalues selalu diurutkan dari yang terbesar sampai ke yang terkecil, dengan kriteria bahwa angka
eigenvalues di bawah 1 tidak digunakan dalam menghitung jumlah faktor yang terbentuk Dari tabel 4.5 di atas terlihat bahwa hanya 11 factor yang terbentuk, karena
(49)
angka eigenvalues memiliki nilai di atas 1. Sehingga proses factoring seharusnya berhenti pada 11 faktor saja. Faktor 1 memiliki eigenvalue sebesar 2,978 artinya faktor 1 ini dapat menjelaskan 2,978 atau 11,454% dari total communalities
d. Component Matrix
Tabel 4.6: Conponent Matrix
1 2 3 4 5 6 7 8 9 10 11
Pegal -.144 .369 -.204 -.207 .430 .414 -.277 .022 .128 -.148 -.049 NyeriSendi .022 .724 .000 .022 -.174 -.292 .377 .212 .114 -.109 -.124 Normalotot -.037 -.834 .193 -.077 -.121 -.236 -.231 -.114 -.102 .112 .112 Linulinu .274 .087 -.131 .376 -.006 .507 .239 -.208 -.226 .237 -.057
Muntah .148 .102 .459 -.145 -.181 .076 .170 .156 .406 -.045 .422
Diare .080 .040 .112 -.727 -.254 .126 .037 -.074 -.101 .208 -.175 Kembung -.229 -.086 .042 -.225 .421 -.013 .317 -.246 .156 .061 .363
mual .065 -.226 .237 .423 -.093 .206 .262 .438 .042 .194 -.009
Component
Tabel ini berisikan factor loading (nilai korelasi) antara variabel-variabel analisis dengan faktor yang terbentuk.Berdasarkan tabel 4.6 di atas, terlihat bahwa ada 11 faktor yang terbentuk dari 26 variabel.Hal ini menunjukkan bahwa 11 factor adalah jumlah yang paling optimal untuk mereduksi ketiga variabel bebas tersebut.
e. Component Score Coefficient Matrix
Setelah mendapatkan faktor yang terbentuk melalui proses reduksi, maka perlu dicari persamannya. Dengan persaman tersebut, dapat diperoleh skor setiap faktor secara manual.Persamaan yang dibuat mirip dengan regresi linier berganda, hanya dalam persamaan faktornya tidak terdapat konstanta.Skor-skor faktor yang dihasilkan dapat digunakan untuk menggantikan skor-skor pada varibel bebas yang asli. Hasil skor faktor yang diperoleh ditunjukkan pada tabel 4.7 dan hasilComponent Score Coefficient Matrix ditunjukkan pada tabel 4.8 dibawah ini :
(50)
Tabel 4.7: Score Faktor
FC1 FC2 FC3 FC4 FC5 FC6 FC7 FC8 FC9 FC10 FC11
-0.0649 -0.11 1.665 0.12 0.4 0.1013 -0.13 0.183 1.005 0.48 -0
1.07655 0.051 1.419 0.55 -0.4 0.3197 -0.46 -0.21 0.129 0.51 0.22
-1.04707 -0.9 1.1 0.21 0.03 -1.239 1.115 -1.97 1.861 2.49 -0.5
-1.16246 -0.99 0.862 0.17 0.35 0.6079 0.022 1.279 0.035 -0.53 0.26
1.11325 0.918 0.687 0.71 0.04 -0.571 0.845 0.457 0.124 -1.12 0.35
0.83123 -0.55 0.624 0.09 0.65 -0.531 0.143 -0.76 0.512 -0 0.54
0.98196 -0.05 1.311 0.73 0.47 -0.469 -0.81 -0.63 -0.78 0.31 -0.5
-1.40938 -0.44 0.474 0.17 -0.8 -0.249 -0.57 0.108 -0.47 -0.18 -0.8
Tabel 4.8: Component Score Coefficient Matrix
1 2 3 4 5 6 7 8 9 10 11
Pegal -.048 .153 -.091 -.122 .277 .285 -.210 .018 .114 -.138 -.048
NyeriSendi .007 .300 .000 .013 -.112 -.201 .286 .181 .101 -.102 -.120
Normalotot -.012 -.345 .086 -.046 -.078 -.163 -.175 -.097 -.091 .105 .109
Linulinu .092 .036 -.058 .222 -.004 .350 .181 -.178 -.201 .222 -.056
Muntah .050 .042 .203 -.086 -.116 .052 .129 .134 .362 -.042 .410
Diare .027 .017 .050 -.430 -.164 .087 .028 -.063 -.090 .194 -.170
Kembung -.077 -.036 .018 -.133 .271 -.009 .240 -.210 .139 .057 .353
Component
4.2.4Membentuk derajat Keanggotaan ( Matriks Uik)
Langkah pertama dalam perhitungan Fuzzy C-Means (FCM) adalah membentuk matriks derajat keanggotaan awal atau matriks partisi awal Uik.Matrik partisi Uik mempunyai komponen i= banyaknya data, k = banyaknya cluster. Matrik ini random dengan kisaran nilai 0 sampai 1. Pembentukan matrik Uik ini dilakukan dengan menggunakan fungsi seperti tabel 4.9
Tabel 4.9: Fungsi FFCM_InitV
function V = FFCM_InitV (c, p) V = rand(c, p);
col_sum = sum(V);
(51)
Matriks Uik yang terbentuk dari fungsi FFCM_initV disimpan ke dalam hepatitis.mat.Jika dijumlahkan maka nilai perbaris dari matriks Uik yang terbentuk tidak lebih dari 1. Setelah nilai matriks partisi awal disimpan maka proses FCM dilakukan pertama kali dengan memilih data yang akan diolah, kemudian data tersebut akan dihitung dengan menggunakan fungsi FFCM yang terdapat pada halaman lampiran. Perhitungan FCM ini akan dilakukan berulang kali untuk memperbaiki lokasi pusat cluster. Langkah iterative ini akan dilakukan berdasarkan minimisasi fungsi objektif.
5.3 Implementasi User Interface
Implementasi sistem pengelompokkan penyakit hepatitis dengan menggunakan Fuzzy C-Meansini dibangun dengan menggunakan program MATLAB R2010a. Source code program terdapat pada halaman Lampiran.
Gambar 4.1 : Halaman Pengelompokkan Penyakit Hepatitis
Pada gambar 4.1 ditunjukkan halaman pengelompokkan penyakit hepatitis dengan menggunakan metode FCM. Di halaman ini user memilih data rekam medis yang akan dihitung dengan menekan tombol cari maka akan muncul dialog box seperti gambar 4.2 dibawah ini.
(52)
Gambar 4.2 :dialog box untuk memilih data
Kemudian user memilih nama file berformat .csv yang akan dihitung.setelah tombol open ditekan maka data yang dipilih akan tampil pada tabel data awal seperti gambar 4.3
Gambar 4.3 :Data awal
Kemudian user memasukkan inisialisasi awal untuk bobot (w), maximum iterasi, nilai error, iterasi awal dan fungsi objektif awal pada kolom inisialisasi awal seperti gambar 4.4. Untuk nilai bobot (w) nilai yang diinputkan tidak boleh kurang dari 1 karena nilai perhitungan akan menjadi 0 jika menginputkan bobot bernilai 1.
(53)
Setelah memasukkan nilai inisialisasi awal tekan tombol “Hitung” untuk menjalankan program. Selanjutnya akan ditampilkan derajat keanggotaan terakhir dan nilai akurasinya.
Ketika tombol “Hitung” ditekan maka secara otomatis nilai derajat keanggotaan terakhir dan nilai fungsi objektif akhir akan tersimpan pada uikAkhir.xls dan FungsiObjektif.xls. Hasil nilai derajat keanggotaan pada iterasi terakhir yang didapat, nilai fungsi objektif akhir dan hasil akurasi akan tampak seperti gambar 4.5, gambar 4.6 dan gambar 4.7 dibawah ini
Gambar 4.5 :Nilai derajat keanggotaan iterasi terakhir
1.258421 0.077375 0.030552 0.016056 0.010787 0.00726 0.004815 0.003175 0.002089 0.001373 0.000901 0.000592 0.000389 0.000255 0.000168 0.00011 7.22E-05
Gambar 4.6: Fungsi Objektif
(54)
Nilai derajat keanggotaan akhir pada gambar 4.6 merupakan hasil dari perhitungan metode FCM.Nilai derajat keanggotaan akhir ini yang menentukan pengelompokkan dari data pasien penyakit hepatitis.Cara mengelompokkan pasien berpenyakit hepatitis ini dengan melihat nilai tertinggi dari derajat keanggotaan akhir yang didapat.
Fungsi objektif pada gambar 4.6 dapat memberitahu banyak iterasi yang dilakukan untuk mengolah data dengan menggunakan metode FCM dan nilai minimasi fungsi objektif yang didapat.Pada gambar 4.6 dilakukan 17 kali iterasi dengan nilai minimasi fungsi objektif sebesar -3.77768E-05.
Pada gambar 4.7 diatas ditunjukkan hasil pengelompokkan dengan menggunakan metode FCM, akurasi yang diperoleh dari hasil percobaan tersebut sebesar 46.5517%. Nilai akurasi tersebut didapatkan dengan cara :
Akurasi=
.
Jika dibandingkan dengan penelitian sebelumnya akurasi yang diperoleh dari penelitian ini lebih buruk, karena penelitian sebelumnya akurasi yang diperoleh sebesar 51.11%.
5.4 Hasil Pengujian
Pengujian yang dilakukan pada sistem pengelompokkan penyakit hepatitis ini dilakukan dengan menggunakan data anamnesisyang belum di PCA, data anamnesa sudah di PCA, data anamnesa sudah di PCA digabungkan dengan data laboratorium dan percobaan yang terakhir dilakukan pada data laboratorium. Data anamnesa yang digunakan memiliki 110 data dan 26 atribut berbentuk biner, sedangkan data laboratorium yang digunakan memiliki 110 data dan 5 atribut. Data anamnesa yang sudah dilakukan proses PCA terdiri dari 110 data dan 11 atribut dan pada data anamnesa yang sudah di PCA dan digabung dengan data laboratorium terdiri dari 110 data dan 16 atribut.
Tabel 4.10 menunjukkan hasil percobaan pada data anamnesa dokter yang didalamnya terdiri dari nilai inisialisasi awal yang diinputkan dan nilai akurasi yang didapat dari percobaan tersebut.Sedangkan tabel 4.11 menunjukkan hasil percobaan pada data laboratorium yang didalamnya terdiri dari nilai inisialisasi awal yang diinputkan dan nilai akurasi serta perrcobaan dengan menggunakan data laboratorium yang sudah di normalisasi. Hasil percobaan pada data anamnesa yang sudah dilakukan proses PCA ditunjukkan pada
(55)
tabel 4.12 dan hasil percobaan pada data anamnesa yang sudah dilakukan proses PCA dan digabung dengan data laboratorium ditunjukkan pada tabel 4.13
Tabel 4.10 Hasil Pengujian data anamnesa dokter
NO Nilai inisialisasi awal akurasi
1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
46.5517%
2 Bobot(w)=2; maksimum iterasi =10; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
45.6897%
3 Bobot(w)=6; maksimum iterasi =18; error = 0.002; iterasi awal =1; fungsi objektif awal = 0
50%
4 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0
43.1034%
5 Bobot(w)=8; maksimum iterasi =50; error = 0.000005; iterasi awal =1; fungsi objektif awal = 0
47.4138%
Tabel 4.11 Hasil Pengujian data laboratorium
NO Nilai inisialisasi awal akurasi
1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
82.3529%
2 Bobot(w)=2; maksimum iterasi =10; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
(56)
3 Bobot(w)=5; maksimum iterasi =40; error = 0.00600; iterasi awal =1; fungsi objektif awal = 0
78.1818%
4 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0
83.871%
5 Bobot(w)=8; maksimum iterasi =50; error = 0.000005; iterasi awal =1; fungsi objektif awal = 0
74.5455%
6 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0 ( dengan menggunakan data laboratorium yang sudah di normalisasi ).
100%
Tabel 4.12Hasil Pengujian data anamnesa dokter(PCA)
NO Nilai inisialisasi awal akurasi
1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
38.2114%
2 Bobot(w)=2; maksimum iterasi =10; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
39.0244%
3 Bobot(w)=6; maksimum iterasi =18; error = 0.02; iterasi awal =1; fungsi objektif awal = 0
40.6504%
4 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0
(57)
Tabel 4.13 Hasil Pengujian data anamnesa dokter(PCA) dan data laboratorium
NO Nilai inisialisasi awal akurasi
1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0
64.6018%
2 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0
57.4468%
3 Bobot(w)=2; maksimum iterasi =10; error = 1e-10; iterasi awal =1; fungsi objektif awal = 0
66.3717%
4 Bobot(w)=2; maksimum iterasi =20; error = 0.0009; iterasi awal =1; fungsi objektif awal = 0
65.4867%
5.5 Analisis
Pada tabel 4.10, 4.11, 4.12 dan 4.13 diatas ditunjukkan beberapa hasil percobaan hepatitis A, B, dan C dengan menggunakan metode Fuzzy C-Means. Dari hasil percobaan data anamnesa dokter yang telah dilakukan dapat diketahui nilai akurasi terbaik yang didapat adalah 50%. Pada data laboratorium didapat nilai akurasi terbaik sebesar 83.871% pada data laboratorium yang belum di normalisasi dan didapat nilai akurasi 100% pada data laboratorium yang sudah dinormalisasi. Pada data anamnesa yang sudah dilakukan proses PCA hasil akurasi terbaik yang dihasilkan sebesar 40.6504%. Pada data anamnesa yang sudah dilakukan proses PCA dan digabungkan dengan data laboratorium, hasil akurasi terbaik yang didapat sebesar 66.3717%.
Pada percobaan yang telah dilakukan dapat diketahui bahwa metode Fuzzy C-Means
tidak cocok untuk menghitung data laboratorium pada pasien hepatitis karena nilai derajat keanggotaan yang dihasilkan tidak menimbulkan kekaburan atau keragu – raguan dalam mengelompokkan data. Data anamnesa dokter cocok dihitung dengan menggunakan metode
(58)
namun nilai akurasi yangrendah membuat metode Fuzzy C-Means dengan menggunakan data pasien penyakit hepatitis ini tidak dapat digunakan untuk mengambil keputusan.
Pada data anamnesa yang sudah dilakukan proses PCA nilai akurasi yang di hasilkan sangat rendah karena berkisar antara 30 – 40%, hal ini di karenakan beberapa atribut yang dapat menimbulkan kekaburan tereduksi saat terjadi proses PCA. Pada data anamnesa yang sudah dilakukan proses PCA dan telah digabung dengan data laboratorium akurasi yang dihasilkan cukup baik diatas 50%, hal ini dikarenakan data laboratorium menghasilkan data yang akurat tentang penyakit hepatitis dan ketika digabungkan dengan data anamnesa yang sudah tereduksi maka akan memunculkan beberapa nilai derajat keanggotaan yang kabur.
(1)
Tabel 4.20 Hasil Nilai derajat keangotaan akhir percobaan data anamnesa dokter
0.333337 0.333326 0.333337 0.333317 0.33337 0.333313 0.333343 0.333313 0.333345 0.333346 0.333306 0.333348 0.333319 0.333365 0.333316 0.333321 0.333362 0.333318 0.333318 0.333367 0.333315 0.333351 0.333294 0.333355 0.333335 0.333329 0.333336 0.333318 0.333368 0.333314 0.333321 0.33336 0.333319 0.333346 0.333305 0.333349 0.333349 0.333299 0.333352 0.333324 0.333355 0.333322 0.333326 0.33335 0.333324 0.333353 0.333288 0.333358 0.333315 0.333374 0.333311 0.333348 0.333301 0.333351 0.333342 0.333314 0.333344 0.333324 0.333355 0.333321 0.333338 0.333323 0.333339 0.333331 0.33334 0.33333 0.333321 0.33336 0.333318 0.333337 0.333326 0.333337 0.333346 0.333306 0.333349 0.333318 0.333367 0.333315 0.333338 0.333323 0.333339 0.333319 0.333366 0.333315 0.333319 0.333366 0.333315 0.333348 0.333301 0.333351 0.333327 0.333347 0.333326 0.333342 0.333313 0.333345 0.333336 0.333328 0.333336 0.333319 0.333365 0.333316 0.333351 0.333294 0.333355 0.333322 0.333358 0.33332 0.33332 0.333363 0.333317 0.333339 0.333321 0.33334 0.333338 0.333323 0.333339 0.333338 0.333324 0.333339
0.333341 0.333316 0.333343 0.333323 0.333356 0.333321 0.333314 0.333377 0.333309 0.333336 0.333327 0.333337 0.333322 0.333358 0.333319 0.333336 0.333328 0.333336 0.333322 0.333358 0.33332 0.333343 0.333311 0.333346 0.333353 0.33329 0.333358 0.333348 0.333301 0.333351 0.33332 0.333363 0.333317 0.333317 0.333371 0.333313 0.333349 0.333298 0.333353 0.333347 0.333304 0.33335 0.333327 0.333347 0.333326 0.333347 0.333303 0.33335 0.333338 0.333323 0.333339 0.333347 0.333303 0.33335 0.333346 0.333305 0.333349 0.333349 0.333298 0.333353 0.333343 0.333312 0.333345 0.333329 0.333342 0.333329 0.33335 0.333296 0.333354 0.33334 0.333318 0.333342 0.333345 0.333308 0.333347 0.333337 0.333326 0.333337 0.333337 0.333326 0.333337 0.333343 0.333312 0.333345 0.333324 0.333355 0.333322 0.333337 0.333325 0.333338 0.333344 0.33331 0.333346 0.333329 0.333342 0.333328 0.333344 0.333309 0.333347 0.333351 0.333295 0.333355 0.33333 0.333341 0.333329 0.333339 0.333321 0.33334 0.33333 0.333342 0.333329 0.333344 0.33331 0.333346 0.333345 0.333307 0.333348 0.333341 0.333316 0.333343
0.333323 0.333357 0.33332 0.333323 0.333356 0.333321 0.333323 0.333356 0.333321 0.33333 0.333341 0.333329 0.333323 0.333357 0.33332 0.333325 0.333352 0.333323 0.333343 0.333313 0.333345 0.333341 0.333317 0.333343 0.333321 0.333362 0.333317 0.333342 0.333313 0.333345 0.333323 0.333357 0.33332 0.333322 0.333358 0.33332 0.333318 0.333368 0.333314 0.333329 0.333343 0.333328 0.333322 0.33336 0.333319 0.333322 0.333358 0.33332 0.333322 0.333358 0.33332 0.333325 0.333353 0.333322 0.333318 0.333368 0.333314 0.333318 0.333367 0.333315 0.333316 0.333373 0.333311 0.333344 0.333309 0.333347 0.333318 0.333368 0.333314 0.333338 0.333322 0.33334 0.33333 0.333341 0.333329 0.333338 0.333323 0.333339 0.333339 0.333321 0.33334 0.333318 0.333367 0.333315 0.33332 0.333364 0.333316 0.333315 0.333374 0.333311 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0
(2)
Tabel 4.21Hasil Nilai derajat keangotaan akhir percobaan data anamnesa dokter (PCA)
0.33333 0.333332 0.333338 0.333336 0.333334 0.33333 0.333332 0.333333 0.333335 0.333321 0.333327 0.333351 0.333342 0.333337 0.333321 0.333348 0.333339 0.333314 0.333339 0.333336 0.333325 0.333315 0.333326 0.333359 0.333331 0.33333 0.333339 0.333337 0.333334 0.333329 0.333335 0.333334 0.333331 0.333327 0.333331 0.333341 0.33332 0.333327 0.333353 0.333338 0.333336 0.333326 0.33333 0.333331 0.33334 0.33332 0.333328 0.333352 0.333334 0.333333 0.333333 0.333319 0.333327 0.333354 0.333322 0.333327 0.333351 0.333336 0.333335 0.333329 0.333332 0.333333 0.333335 0.333337 0.333335 0.333327 0.333343 0.333337 0.333319 0.333335 0.333335 0.33333 0.333316 0.333326 0.333359 0.33334 0.333335 0.333325 0.333323 0.333329 0.333348 0.333341 0.333336 0.333323 0.333337 0.333334 0.333329 0.333322 0.333328 0.33335 0.333335 0.333333 0.333332 0.333334 0.333334 0.333332 0.333331 0.333333 0.333337 0.333337 0.333334 0.333329 0.333318 0.333327 0.333356 0.333338 0.333336 0.333326 0.333343 0.333337 0.33332 0.333337 0.333335 0.333328 0.333326 0.333329 0.333344 0.333334 0.333334 0.333332
0.333334 0.333333 0.333333 0.333339 0.333336 0.333325 0.33334 0.333335 0.333325 0.333329 0.333332 0.333339 0.333341 0.333337 0.333322 0.333333 0.333333 0.333334 0.333337 0.333336 0.333327 0.33333 0.333333 0.333338 0.33332 0.333327 0.333353 0.333327 0.33333 0.333342 0.333347 0.333339 0.333313 0.333334 0.333333 0.333333 0.333324 0.333329 0.333347 0.333318 0.333326 0.333356 0.333338 0.333336 0.333326 0.33332 0.333327 0.333353 0.333332 0.333333 0.333335 0.333326 0.333331 0.333343 0.333327 0.333331 0.333342 0.333325 0.333329 0.333346 0.333314 0.333325 0.333361 0.333337 0.333335 0.333328 0.333319 0.333326 0.333354 0.333335 0.333335 0.333329 0.333334 0.333334 0.333332 0.33333 0.333331 0.333339 0.33333 0.333331 0.333339 0.333334 0.333334 0.333332 0.333342 0.333338 0.333321 0.333334 0.333333 0.333333 0.333333 0.333334 0.333333 0.333335 0.333334 0.333331 0.333335 0.333334 0.333331 0.333325 0.333329 0.333346 0.333334 0.333334 0.333333 0.333328 0.33333 0.333342 0.333337 0.333335 0.333328 0.333332 0.333333 0.333335 0.333334 0.333333 0.333333 0.333334 0.333334 0.333333
0.333337 0.333335 0.333329 0.333336 0.333334 0.33333 0.333334 0.333334 0.333332 0.333334 0.333334 0.333332 0.333339 0.333337 0.333324 0.33334 0.333336 0.333324 0.333331 0.333332 0.333336 0.333333 0.333333 0.333334 0.333334 0.333334 0.333332 0.333332 0.333333 0.333334 0.333334 0.333334 0.333333 0.333338 0.333335 0.333328 0.333341 0.333336 0.333323 0.333334 0.333334 0.333332 0.333334 0.333334 0.333332 0.333337 0.333335 0.333328 0.333337 0.333335 0.333328 0.333339 0.333336 0.333325 0.333334 0.333333 0.333333 0.333341 0.333336 0.333323 0.333342 0.333336 0.333322 0.333331 0.333333 0.333336 0.333337 0.333334 0.333329 0.333336 0.333335 0.333329 0.333335 0.333334 0.333331 0.333332 0.333333 0.333335 0.333333 0.333333 0.333334 0.333342 0.333336 0.333322 0.333337 0.333334 0.333329 0.333338 0.333334 0.333329 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0
(3)
Tabel 4.22 Hasil Nilai derajat keangotaan akhir percobaan data anamnesa dokter
(PCA) + data laboratorium
0.333299 0.333335 0.333366 0.3333 0.333335 0.333365 0.333321 0.333334 0.333345 0.333311 0.333335 0.333354 0.333317 0.333334 0.333349 0.333306 0.333334 0.33336 0.333307 0.333334 0.333358 0.333309 0.333335 0.333356 0.333313 0.333334 0.333353 0.33332 0.333334 0.333346 0.333321 0.333334 0.333345 0.333322 0.333334 0.333343 0.333311 0.333335 0.333354 0.333319 0.333334 0.333347 0.33331 0.333335 0.333356 0.333317 0.333334 0.333348 0.333305 0.333334 0.33336 0.333312 0.333335 0.333353 0.333312 0.333335 0.333354 0.333321 0.333334 0.333345 0.333316 0.333334 0.33335 0.333307 0.333335 0.333358 0.333325 0.333334 0.333341 0.33332 0.333334 0.333346 0.333306 0.333335 0.333359 0.333319 0.333334 0.333347 0.3333 0.333335 0.333365 0.333317 0.333334 0.333349 0.333313 0.333334 0.333353 0.333312 0.333335 0.333353 0.333315 0.333334 0.333351 0.333329 0.333334 0.333337 0.333304 0.333335 0.333361 0.333308 0.333334 0.333357 0.333323 0.333334 0.333343 0.333322 0.333334 0.333344 0.333314 0.333334 0.333352 0.333321 0.333334 0.333345 0.333306 0.333335 0.333359 0.333316 0.333334 0.33335
0.333334 0.333334 0.333333 0.333347 0.333333 0.33332 0.333346 0.333333 0.333321 0.333339 0.333334 0.333328 0.333338 0.333333 0.333328 0.333343 0.333333 0.333324 0.333342 0.333333 0.333325 0.333339 0.333333 0.333328 0.33334 0.333334 0.333326 0.33335 0.333333 0.333317 0.333348 0.333333 0.333319 0.333334 0.333334 0.333333 0.333343 0.333334 0.333323 0.333336 0.333334 0.33333 0.33334 0.333333 0.333327 0.333344 0.333333 0.333323 0.333345 0.333333 0.333322 0.333344 0.333333 0.333323 0.333333 0.333334 0.333334 0.333351 0.333333 0.333316 0.33334 0.333334 0.333326 0.333349 0.333333 0.333319 0.333343 0.333333 0.333324 0.33335 0.333333 0.333317 0.333345 0.333333 0.333322 0.333346 0.333333 0.333321 0.333346 0.333333 0.333321 0.333337 0.333333 0.33333 0.333341 0.333333 0.333326 0.333341 0.333333 0.333325 0.333342 0.333333 0.333324 0.333351 0.333333 0.333317 0.333341 0.333333 0.333326 0.333345 0.333333 0.333322 0.333338 0.333333 0.333329 0.333345 0.333333 0.333322 0.333343 0.333333 0.333324 0.333341 0.333333 0.333326 0.333338 0.333333 0.333328 0.333337 0.333333 0.33333
0.333339 0.333333 0.333328 0.333337 0.333333 0.33333 0.333334 0.333333 0.333333 0.333341 0.333333 0.333326 0.333346 0.333332 0.333322 0.333344 0.333332 0.333324 0.33334 0.333333 0.333327 0.333338 0.333333 0.333329 0.333341 0.333333 0.333327 0.33334 0.333333 0.333327 0.333335 0.333333 0.333332 0.333347 0.333332 0.333321 0.333342 0.333332 0.333326 0.333339 0.333333 0.333328 0.333336 0.333333 0.333331 0.333349 0.333332 0.333319 0.333339 0.333333 0.333328 0.33334 0.333332 0.333328 0.333345 0.333332 0.333323 0.333342 0.333332 0.333326 0.333346 0.333332 0.333322 0.333344 0.333333 0.333323 0.333345 0.333332 0.333323 0.33334 0.333333 0.333327 0.333344 0.333332 0.333324 0.33334 0.333333 0.333328 0.333339 0.333333 0.333328 0.333344 0.333332 0.333323 0.333347 0.333332 0.333321 0.333347 0.333332 0.333321 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0
(4)
Tabel 4.23 Hasil Nilai derajat keangotaan akhir percobaan data laboratorium
0.023489 0.681399 0.295112 0.015626 0.23652 0.747853 0.581901 0.32679 0.091309 0.02197 0.629151 0.348879 0.008073 0.093374 0.898553 0.005196 0.051822 0.942982 0.02138 0.442289 0.536332 0.02231 0.517148 0.460542 0.00281 0.027292 0.969898 0.002701 0.025967 0.971333 0.017564 0.843057 0.139378 0.017308 0.239637 0.743055 0.937934 0.044994 0.017073 0.67237 0.249722 0.077908 0.010454 0.916514 0.073033 0.015219 0.901729 0.083052 0.008186 0.089796 0.902018 0.01004 0.125204 0.864757 0.015193 0.226441 0.758366 0.001555 0.993304 0.005141 0.016707 0.223303 0.759991 0.001178 0.010921 0.987901 0.937774 0.041231 0.020995 0.949022 0.034406 0.016573 0.000884 0.007987 0.991129 0.744659 0.193936 0.061405 0.018481 0.776157 0.205361 0.51668 0.352216 0.131104 0.347899 0.537057 0.115044 0.020111 0.90117 0.078718 0.120418 0.77251 0.107072 0.878655 0.079086 0.042259 0.18935 0.690256 0.120394 0.661422 0.259541 0.079037 0.854102 0.093663 0.052235 0.880763 0.08625 0.032987 0.020072 0.335807 0.644121 0.215083 0.669401 0.115516 0.00282 0.019238 0.977942 0.001541 0.992139 0.00632
0.226357 0.420511 0.353132 0.002662 0.018102 0.979236 0.00271 0.018461 0.978829 0.01654 0.195992 0.787468 0.03328 0.879431 0.087289 0.003467 0.023127 0.973406 0.002661 0.018098 0.979241 0.024119 0.18955 0.786331 0.010762 0.133539 0.855699 0.004051 0.040187 0.955762 0.01609 0.154401 0.829509 0.914177 0.056476 0.029347 0.000704 0.005337 0.993959 0.00166 0.012091 0.986249 0.003514 0.023946 0.972539 0.000542 0.004125 0.995332 0.001313 0.009436 0.989251 0.011455 0.125046 0.863499 0.875876 0.080307 0.043818 0.000836 0.00638 0.992785 0.481472 0.399843 0.118685 0.004581 0.045734 0.949686 0.000973 0.00897 0.990057 0.016576 0.263609 0.719814 0.002433 0.020039 0.977528 0.000565 0.004269 0.995166 0.017286 0.868608 0.114105 0.047643 0.269908 0.68245 0.025876 0.90733 0.066795 0.003638 0.023974 0.972387 0.055476 0.453775 0.490749 0.003535 0.023714 0.972751 0.066166 0.817239 0.116595 6.93E-05 0.000561 0.99937 0.000393 0.003012 0.996595 0.015529 0.104993 0.879478 0.908917 0.065705 0.025378 0.012076 0.085272 0.902652 0.000398 0.003493 0.996109 0.00267 0.018129 0.9792
0.003167 0.021153 0.97568 0.004786 0.030714 0.9645 0.004347 0.02813 0.967523 0.0072 0.070393 0.922407 0.002432 0.017326 0.980242 0.004347 0.02813 0.967523 0.003494 0.023146 0.973359 0.003665 0.024124 0.972211 0.003068 0.020612 0.976321 0.020761 0.129962 0.849276 0.00292 0.019944 0.977136 0.00679 0.077746 0.915464 0.012138 0.163121 0.824741 0.001011 0.007553 0.991436 0.004121 0.033641 0.962238 0.00292 0.019944 0.977136 0.003068 0.020612 0.976321 0.00101 0.007549 0.99144 0.00045 0.003457 0.996093 0.001547 0.011377 0.987076 0.001071 0.007953 0.990976 0.000842 0.006809 0.992349 0.000833 0.006741 0.992427 0.003167 0.021153 0.97568 0.004315 0.028073 0.967612 0.0072 0.070393 0.922407 0.002432 0.017326 0.980242 0.004347 0.02813 0.967523 0.000817 0.006606 0.992578 0.003665 0.024124 0.972211 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0
(5)
Pengelompokan Penyakit Hepatitis
dengan Menggunakan Metode Fuzzy C-Means
ABSTRAK
Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah
terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang
dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi
penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan
kematian. Analisis pengelompokkan atau
cluster analysis
adalah salah satu analisis data yang
bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan
kesamaan karakteristik.
Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakan
Fuzzy
C-Means
dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu
percobaan dengan data
anamnesa
dokter menghasilkan akurasi sebe sar50% , percobaan
yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar
83.871%, yang ketiga yaitu percobaan dengan data
anamnesa
dokter yang telah di PCA (
Principal Component Analysis
) menghasilkan akurasi sebesar 40.6504% dan yang terakhir
adalah percobaan dengan data
anamnesa
yang telah digabung dengan data laboratorium
menghasilkan akurasi sebesar 66.371%.
(6)