Pengelompokan penyakit hepatitis dengan metode Fuzzy C-Means.

(1)

Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means

( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta )

SKRIPSI

Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Jurusan Teknik Informatika

Disusun Oleh :

RAFAELA ROSI PRIHANINGRUM (095314012)

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA


(2)

Clustering Hepatitis Disease Using Fuzzy C-Means

(Case Study HepatitisDataat Panti Rapih Hospital Yogyakarta)

A Thesis

Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree In Study Program of Informatics Engineering

By

Rafaela Rosi Prihaningrum 095314012

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY YOGYAKARTA


(3)

(4)

(5)

HALAMAN PERSEMBAHAN

Be faithful i s all thi gs e ause it’s i the that your stre gth lies

-Mother Theresa-

Skripsi ini saya persembahkan untuk : Tuhan Yesus Kristus, Keluarga tercinta dan Sahabat terkasih

Terima kasih untuk segalanya.


(6)

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidakmemuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalamkutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 23 Agustus 2013 Penulis


(7)

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Univer sitas Sanata Dharma : Nama :Rafaela Rosi Prihaningrum

NIM :095314012

Demi pengembangan pengetahuan, saya memberikan kepada perpustakaanUniversitas Sanata Dharma karya ilmiah yang berjudul :

Pengelompokan Penyakit Hepatitis

dengan Menggunakan Metode Fuzzy C-Means

Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikankepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan,mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalandata mendistribusikan secara terbatas, dan mempublikasikan di internet ataumedia lain untuk kepentingan akademis tanpa perlu meminta ijin dari sayamaupun memberikan royalti kepada saya selama tetap mencantumkan nama sayasebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya. Yogyakarta, 23 Agustus 2013

Yang menyatakan,


(8)

Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means

ABSTRAK

Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan kematian. Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik.

Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakanFuzzy C-Means dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu percobaan dengan data anamnesa dokter menghasilkan akurasi sebe sar50% , percobaan yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar 83.871%, yang ketiga yaitu percobaan dengan data anamnesa dokter yang telah di PCA (

Principal Component Analysis ) menghasilkan akurasi sebesar 40.6504% dan yang terakhir adalah percobaan dengan data anamnesa yang telah digabung dengan data laboratorium menghasilkan akurasi sebesar 66.371%.


(9)

ABSTRACT

Health is the most important factor in a person's life. If health has disrupted the activities of a person will be disturbed. Currently, there are many diseases that can lead to death. Liver disease can increase the risk of death for patients and can also be triggers of other diseases that cause death. Grouping analysis or cluster analysis is one of the data analysis that aims to determine which group or groups from a group of data based on similar characteristics.

In the research, the process of grouping hepatitis disease using Fuzzy C-Means in the process of testing the system four experiments conducted, first experiments with the anamnesa the data which produce an accuracy of 50%, a second trial is an experiment with laboratory data which produced 83.871% accuracy, the third experiment with anamnesa the data that has been in the PCA (Principal Component Analysis) produces an accuracy of 40.6504% and the last experiment is anamnesa which has been in the pca combined with laboratory data produced 66 371% accuracy.


(10)

KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas kebaikan dan kehendak-Nya saya dapat menyelesaikan tugas akhir yang berjudul“Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means”. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelarsarjana program studi Teknik Informatika, Fakultas Sains dan TeknologiUniversitas Sanata Dharma.

Dalam proses penulisan tugas akhir ini , penulis mengucapkan terima kasihyang sebesar-besarnya kepada :

1. Ibu PH.Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

2. Ibu Ridowati Gunawan, S.Kom.,M.T., selaku Dosen Pembimbing sekaligus ketua program studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta, terimakasih atas segala bimbingan, kesabaran dan mengarahkan serta membimbing penulis dalam menyelesaikan tugas akhir ini.

3. Ibu Sri Hartati Wijono, S.Si.,M.Kom.dan Bapak Albert Agung Hadhiatma,S.T.,M.T. selaku dosen penguji yang telah memberikan banyak kritik dansaran untuk tugas akhir saya.

4. Bapak Iwan Binanto, M.Cs., selaku Dosen Pembimbing Akademik Teknik Informatika Tahun 2009.

5. Seluruh staff dosen Teknik Informatika Universitas Sanata Dharma yang telah banyak memberikan bekal ilmu, arahan dan pengalaman selama sayamenempuh studi.

6. Seluruh staff Sekretariat Teknik, yang banyak membantu saya dalam urusanadministrasi akademik terutama menjelang ujian tugas akhir.

7. Kedua orang tua dan kakak saya, terima kasih atas semua yang telah dilakukan untukku, doa, semangat,dukungan dan cintanya sehingga saya bisa menyelesaikan studi denganlancar.

8. Estu Karunianingtyas, terimakasih atas bantuan yang diberikan dalam penyusunan tugas akhir ini.

9. Teman-teman Teknik Informatika : Mirella Tri Ratnasari, Christina Wienda Asrini, Ratna Yani Astuti, Astriana Krisma Rizki, dan semua teman-teman TI lainnya.


(11)

10. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhirini yang tidak bisa saya sebutkan satu per satu.

Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh darisempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat penulis harapkan.Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak.Terima kasih.

Yogyakarta, 23 Agustus 2013 Penulis


(12)

Daftar Isi

HALAMAN PERSETUJUAN ... ERROR! BOOKMARK NOT DEFINED. HALAMAN PERSEMBAHAN ... IV PERNYATAAN KEASLIAN KARYA ... VI LEMBAR PERNYATAAN PERSETUJUAN ... VII PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... VII ABSTRAK ... VIII ABSTRACT ... IX KATA PENGANTAR ... X DAFTAR GAMBAR ... XIV DAFTAR TABEL ... XV

PENDAHULUAN ... 1

1.1 LATAR BELAKANG ... 1

1.2 RUMUSAN MASALAH ... 3

1.3 TUJUAN ... 3

1.4 BATASAN MASALAH ... 4

1.5 MANFAAT ... 4

1.6 METODOLOGI PENELITIAN ... 4

1.7 SISTEMATIKA PENULISAN ... 5

TINJAUAN PUSTAKA ... 6

2.1 FUZZY LOGIC ... 6

2.2 HIMPUNANFUZZY ... 7

2.2.1 Himpunan Tegas (Crisp) ... 7

2.1.1 Himpunanfuzzy ... 7

2.3 FUZZY CLUSTERING ... 7

1.4 FUZZY C-MEANS ... 8

2.5 CONFUSION MATRIX ... 10

2.6 DATA PREPARATION ... 11

2.7 PCA(PRINCIPAL COMPONENT ANALYSIS) ... 12

2.8 HEPATITIS ... 12

2.8.1 Penyebab Hepatitis ... 15

2.8.2 Jenis dan Gejala Hepatitis ... 15

2.8 CONTOH PENGGUNAAN FUZZY C-MEANS ... 17

ANALISIS DAN DESAIN SISTEM ... 24

3.1 DATA ... 24

3.2 GAMBARAN UMUM SISTEM ... 25


(13)

3.4 PERANCANGAN ANTARMUKA ... 26

3.5 SPESIFIKASI PERANGKAT LUNAK DAN PERANGKAT KERAS ... 27

IMPLEMENTASI DAN ANALISIS HASIL ... 28

4.1HASIL PENGUMPULAN DATA ... 28

4.2PERANCANGAN FUZZY C-MEANS ... 29

4.2.1 Pembersihan Data ... 30

4.2.2 Normalisasi data laboratorium ... 30

4.2.3 PCA ( Principal Component Analysis) ... 30

4.2.4Membentuk derajat Keanggotaan ( Matriks Uik) ... 34

5.3 IMPLEMENTASI USER INTERFACE ... 35

5.4 HASIL PENGUJIAN ... 38

5.5 ANALISIS ... 41

PENUTUP ... 43

5.1KESIMPULAN ... 43

5.2SARAN ... 44

DAFTAR PUSTAKA ... 45


(14)

DAFTAR GAMBAR

Gambar Keterangan Halaman

2.1 (Kohavi&Provost,1998) : Confusion Matrix 10

3.1 Flowchart Sistem 25

3.2 Use Case Diagram 26

3.3 Perancangan Antarmuka 26

4.1 Halaman Pengelompokkan Penyakit Hepatitis 35

4.2 dialog box untuk memilih data 36

4.3 Data awal 36

4.4 inisialisasi data 36

4.5 Nilai derajat keanggotaan iterasi terakhir 37

4.6 Fungsi Objektif 37


(15)

DAFTAR TABEL

Tabel Keterangan Halaman

2.1 Nilai normal pemeriksaan laboratorium 14

2.2 Kegunaan pemeriksaan labratorium 14

2.3 Jenis Hepatitis 15

4.1 Deskripsi data gejala anamnesis 28

4.2 Deskripsi data gejala Laboratorium 29

4.3 KMO and Bartlett;s Test 31

4.4 Communalities 31

4.5 Total Variance Explained 32

4.6 Conponent Matrix 33

4.7 Score Faktor 34

4.8 Component Score Coefficient Matrix 34

4.9 Fungsi FFCM_InitV 34


(16)

4.11 Hasil Pengujian data laboratorium 39

4.12 Hasil Pengujian data anamnesa dokter(PCA) 40

4.13 Hasil Pengujian data anamnesa dokter(PCA) dan data laboratorium


(17)

BAB I

PENDAHULUAN

Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.

1.1 Latar Belakang

Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian.Salah satunya adalah penyakit hepatitis.Indonesia merupakan Negara ketiga dengan penderita hepatitis terbanyak setelah China dan India.Penderita hepatitis B dan C di Indonesia diperkirakan mencapai 30 juta orang.( Dimyati, Vien, 2011).

Hepatitis merupakan salah satu penyakit yang membahayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.Fungsi utama dari hati atau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.

Ada 5 macam virushepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virushepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D (VHD) dan virus hepatitis E (VHE). Virus-virus ini terus berkembang dan bahkan diperkirakan sedikitnya masih ada 3 virus lagi yang dapat menyebabkan hepatitis.


(18)

Penyakit hepatitisdipilih dalam penelitian ini karena banyaknya orang tidak sadar jika sudah terkena penyakit hepatitissehingga menyebabkan keterlambatan penanganan dan dapat berakibat fatal.Di harapkan dengan adanya penelitian ini dapat membantu dalam pendeteksian penyakit hepatitis agar dapat di lakukan penanganan lebih lanjut dan supaya orang mengenal status kesehatan lebih dini.

Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik. Analisis ini sudah banyak digunakan untuk menyelesaikan permasalahan dan penelitian dalam beberapa disiplin ilmu, seperti bidang akademik, bidang kesehatan,bidang kewilayahan dan bidang marketing.

Perkembangan analisis kelompok dimulai dari metode hirarki yang secara garis besar membentuk sebuah tree diagram yang biasa disebut dendogram. Sedangkan metode nonhirarki lebih dikenal dengan cara partisi, contohnya K-means, metode ini menentukan terlebih dahulu jumlah kelompok yang akan dibentuk. Perkembangan lebih lanjut dari analisa kelompok adalah dengan mempertimbangkan tingkat keanggotaan yang mencangkup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokkan yang disebut dengan fuzzy clustering.

Dalam teknik fuzzy clustering, terdapat beberapa algoritma salah satunya adalah Fuzzy C-Means.Fuzzy C-Meansadalah salah satu teknik pengelompokkan data yang mana keberadaan tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat keanggotan. Metode Fuzzy C-Meanstermasuk metode supervised clusteringdimana jumlah pusat

clusterditentukan di dalam proses clustering.

Konsep dasar Fuzzy C-Means adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimalisasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut. Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data (Arifatno,2010).


(19)

Algoritma Fuzzy C-Means sering dipakai dalam berbagai bidang baik bisnis,kesehatan atau pendidikan. Beberapa penelitian yang menggunakan algoritma Fuzzy C-Means misalnya penelitian dalam pengelompokkan wilayah kecamatan menurut partisipasi sekolah, pengembangan algoritma Fuzzy C-means untuk brain medical image analysis, dan penelitian lainnya.

Pada penelitian ini algoritma Fuzzy C-means digunakan untuk mengelompokan orang yang terkena penyakit hepatitis A, hepatitis B, hepatitis C. Algoritma Fuzzy C-means ini di pilih karena metode ini dapat memberikan hasil yang cukup baik dalam hal meningkatkan homogenitas tiap kelompok yang dihasilkan.

Pendeteksian penyakit hepatitis sudah pernah dilakukan oleh Estu Karunianingtyas (Karunianingtyas,2011) menggunakan metode naïve Bayesiandengan 26 atribut dari data

anamnesis dokter, namun tingkat keakuratan yang didapat masih rendah karena hanya mencapai 51.11% maka dari itu penulis ingin melanjutkan penelitian dengan menggunakan metode Fuzzy C-means.

1.2 Rumusan Masalah

Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan adalah :

1. Apakah metode Fuzzy C-means dapat dipergunakan untuk mengelompokkan orang berpenyakit hepatitis dengan memberikan keakuratan yang baik ?

1.3 Tujuan

Tujuan yang ingin dicapai dalam penelitian ini adalah :

1. Menganalisis, mendisain, mengimplementasikan metode Fuzzy C-Means untuk mengelompokkan penyakit hepatitis.

2. Mengetahui tingkat keakuratan metode Fuzzy C-Means dalam mengelompokkan orang yang berpenyakit hepatitis.


(20)

1.4 Batasan Masalah

Batasan masalah dalam penelitian ini adalah :

1. Data set yang di gunakan adalah data hasil pemeriksaan laboratorium rumah sakit dan data hasil anamnesa.

2. Jenis hepatitis yang akan diteliti hanya 3 jenis yaitu hepatitis A, hepatitis B, dan hepatitis C karena jenis hepatitis D dan hepatitis E jarang ditemukan.

1.5 Manfaat

Manfaat yang diproleh dalam penelitian ini antara lain :

1. Memberikan gambaran tentang langkah – langkah analisis, design dan implementasi metodeFuzzy C-means dalam mengelompokkan orang yang berpenyakit hepatitis.

2. Sebagai referensi untuk penelitian yang berhubungan dengan clustering penyakit hepatitis yang lebih lanjut lagi.

1.6 Metodologi Penelitian

Metodologi yang digunakan adalah sebagai berikut: 1. Melakukan pengumpulan data.

2. Melakukan normalisasi pada data laboratorium.

3. Mengekstrak data anamnesis dokter menggunakan metode PCA ( Principal Component Analysis).

4. Menggabungkan data laboratorium yang sudah di normalisasi dengan data anamnesis

yang sudah di ekstraks.

5. Menghitung data dengan menggunakan metode FCM ( Fuzzy C-Means).

6. Menghitung nilai keakuratan hasil pengelompokkan dengan menggunakan Confusion Matrix.


(21)

1.7 Sistematika Penulisan

Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematikapenulisan sebagai berikut :

BAB I PENDAHULUAN

Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy C-means. Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir mengenai pengujian keakuratan metode

BAB III Desain dan Analisis SISTEM

Bab ini berisi tentang desain dan analisis system meliputi contoh perhitungan, perancangan antarmuka, dan usecase.

BAB IV IMPLEMENTASI SISTEM DAN HASIL

Bab ini berisi implementasi program dari sistem yang akan dibuat, pembahasan penerapan algoritma Fuzzy C-Means, implemantasi antarmuka dan hasil implementasi.

BAB V PENUTUP

Bab ini berisi kesimpulan dari sistem yang telah dibuat, serta saran untuk pengembangan dan penyampurnaan Tugas Akhir yang dibuat.


(22)

BAB II

TINJAUAN PUSTAKA

Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy C-means.Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir mengenai pengujian keakuratan metode.

2.1 Fuzzy Logic

Teori Himpunan Fuzzyakan memberikan jawaban terhadap suatu masalah yangmengandung ketidak pastian. Aplikasi logika fuzzy untuk mendukung keputusan semakindiperlukan ketika semakin banyak kondisi yang menuntut adanya keputusan yang

tidakhanya bisa dijawab dengan „Ya‟ atau „Tidak‟.Fuzzy Logic memberikan rata-rata dariperhitungan angka, yang terletak antara nilai benar mutlak dan nilai salah mutlak, yangberupa range antara 0.0 dan 1.0. Dengan Fuzzy Logic, pengguna dimungkinkan untukmenghitung derajat keanggotaan dari sebuah data. Fuzzy Logic berurusan dengan kondisiyang tidak pasti, dimana benar dan salah tidak dapat ditentukan secara mutlak.

Konsep dari Fuzzy Logic diperkenalkan oleh Professor Lotfi A. Zadeh, di Barkley pada Universitas California (University of California) pada 1960an.Logika Fuzzy dikatakan sebagai logika baru yang lama, sebab ilmu tentang logika Fuzzy modern dan metodis baru ditemukan beberapa tahun yang lalu, padahal sebenarnya konsep tentang logika fuzzy itu sendiri sudah ada sejak lama.

Ada beberapa alasan mengapa orang menggunakan logika Fuzzy, antara lain :

1. Konsep logika Fuzzy mudah dimengerti. Konsep matematis yang mendasari penalaran Fuzzy sangat sederhana dan mudah dimengerti.

2. Logika Fuzzy sangat fleksibel.

3. Logika Fuzzy memiliki toleransi terhadap data-data yang tidak tepat.

4. Logika Fuzzy mampu memodelkan fungsi-fungsi non-linear yang sangat kompleks.


(23)

2.2 Himpunan Fuzzy

2.2.1 Himpunan Tegas (Crisp)

Pada himpunan tegas, nilai keanggotaan suatu item (x) dalam suatu himpunan A, sering ditulis dengan µA(x), memiliki dua kemungkinan yaitu :

a. 1 (satu), yang bearti suatu item menjadi anggota dalam suatu himpunan b. 0 (nol), yang bearti suatu item tidak menjadi anggota himpunan tersebut.

2.1.1 Himpunanfuzzy

Pada himpunan fuzzy nilai keanggotaan terletak pada rentang 0 sampai 1. Apabila x memiliki nilai keanggotaan fuzzy µA(x)=0 bearti x tidak menjadi anggota himpunan A. demikian pula, apabila x memiliki nilai keanggotaan µA(x)=1 bearti x menjadi anggota penuh himpunan A.

2.3 Fuzzy Clustering

Fuzzy clustering adalah salah satu teknik menentukan cluster optimal dalam suatu ruang vektor yang didasarkan pada bentuk normal euclidean untuk jarak antar vektor (Kusumadewi,2004).

Metode ini merupakan pengembangan dari metode partitioning data dengan pembobotan fuzzy. Keunggulan utama fuzzy clustering adalah dapat memberikan hasil pengelompokkan objek – objek yang tersebar tidak teratur, karena jika terdapat suatu data yang penyebarannya tidak teratur maka terdapat kemungkinan suatu titik data mempunyai sifat atau karakteristik dari cluster lain sehingga diperlukan pembobotan kecenderungan titik data terhadap suatu cluster.

Dalam teori logika fuzzy suatu nilai bisa bernilai benar atau salah secara bersama.Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot keanggotaan yang dimilikinya.Logika fuzzy memiliki derajat keanggotaan dalam rentang 0 hingga 1.

Logika fuzzy adalah suatu cara yang tepat untuk memetakan suatu ruang input kedalam suatu ruang output, mempunyai nilai kontinyu. Fuzzy dinyatakan dalam derajat dari suatu


(24)

keanggotaan dan derajat dari kebenaran. Oleh sebab itu sesuatu dapat dikatakan sebagian benar dan sebagian salah pada waktu yang sama (Kusumadewi. 2004).

1.4 Fuzzy C-Means

Dalam teknik clustering data terdapat beberapa algoritma, salah satunya adalah Fuzzy C-means. Fuzzy C-means merupakan pengembangan dari metode K-mean clustering karena pada awalnya ditentukan dulu jumlah kelompok atau cluster yang akan dibentuk. Kemudian dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut.

Konsep dasar Fuzzy C-means, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.

Algoritma pengelompokan Fuzzy C-means menurut Kusumadewi diberikan sebagai berikut :

i. Tentukan :

1. Matriks X berukuran n x m dengan n = jumlah data yang akan di cluster dan m= jumlah variabel (criteria)

2. Jumlah cluter yang akan di bentuk = C

3. w> 1 adalah tingkat ke fuzzy-an dari hasil pengelompokkan. Parameter ini disebut dengan fuzzier, nilai dari w yang sering dipakai dan dianggap paling halus adalah w=2 (Klawoon dan Hopper,2001)

4. Iterasi tertinggi

5. Kriteria penghentian = e (nilai positif yang sangat kecil) 6. Iterasi awal t=1,dan ∆=1

ii. Bentuk matriks partisi awal Uik seperti rumus (2,1) sebagai berikut

[


(25)

Matrik partisi Uik mempunyai komponen i= banyaknya data, k = banyaknya cluster. Matrik ini random dengan kisaran nilai 0 sampai 1.

iii. Hitung pusat cluster dengan menggunakan rumus (2,2) :

iv. Hitung fungsi objektif pada iterasi ke –i dengan menggunakan rumus (2,3)

dik merupakan ukuran jarak untuk jarak Euclidean antara pusat cluster ke-i dengan data ke-k. untuk menghitung dik digunakan rumus (2,4) :

v. Perbaiki drajat keanggotaan tiap data pada tiap cluster dengan menggunakan rumus (2,5)

vi. Cek kondisi berhenti jika :

a) Jika: (|Pi-Pi-1 |<e) atau (t>MaxIter) maka berhenti. b) Jika tidak: t=t+1, ulangi langkah iii.

Dari algoritma tersebut dapat disimpulkan bahwa langkah pertama yang dilakukan adalah menentukan matriks derajat keanggotaan secara acak yang kemudian dijadikan acuan terhadap perhitungan pusat cluster. Pada kondisi awal pusat cluster masih belum akurat, yang ditunjukkan dengan besarnya selisih nilai objektif, sehingga dilakukan langkah iteratif dengan cara memperbaiki pusat cluster. Dengan langkah iteratif ini dapat dilihat bahwa pusat

∑ ∑

[∑

]

(2,2)

(2,3)

(2,4)

(2,5) [∑

]


(26)

cluster bergerak menuju lokasi yang tepat. Langkah ini dilakukan berdasarkan minimisasi fungsi objektif.

Output dari Fuzzy C-means merupakan matriks pusat cluster berukuran c x p dan matriks derajat keanggotaan untuk tiap – tiap data berbentuk n x c. Pengelompokkan cluster

dapat dilihat dari kedua output ini. Matriks pusat cluster menunjukkan pusat cluster untuk tiap – tiap variabel yang diamati dalam setiap cluster-nya. Matriks derajat keanggotaan menunjukkan kecenderungan suatu data untuk masuk kedalam cluster tertentu. Semakin besar nilai derajat keanggotaannya, maka semakin besar peluang data tersebut masuk kedalamclustertertentu.

2.5 Confusion Matrix

Validasi merupakan proses untuk menilai hasil metode cluster. Oleh karena itu, proses ini bertujuan untuk menjamin bahwa solusi cluster yang di hasilkan dalam analisis

cluster dapat menggambarkan populasi sebenarnya.

Confusion Matrix merupakan bagian dari uji validasi dengan metode external test.Uji validasi external test ini digunakan untuk mengukur sejauh mana label pada cluster dengan label pada class yang disediakan.

Menurut Kohavi dan Provost (Kohavi dan Provost,1998) confusion Matrix berisi informasi tentang actual (fakta)dan predicted (prediksi). Confusion matrix pada gambar 2.1 berbentuk matrix 2 x 2 yang digunakan untuk mendapatkan jumlah ketepatan yang didapat dengan menggunakan algoritma tertentu

Predicted

Negative Positif

Actual

Negative A B


(27)

Gambar 2.1 (Kohavi&Provost,1998) : Confusion Matrix

Keterangan :

A, jikaactual dan predicted bernilai negative.

B, jika actual bernilai negative dan predicted bernilai positive.

C, jika actual bernilai positive dan predicted bernilai negative

D, jika actual dan predicted bernilai positive.

Rumus yang digunakan untuk menghitung akurasi dengan confusion matrix,yaitu :

2.6 Data Preparation

Proses preparasi ini dilakukan sehingga data dapat lebih mudah untuk diolah. Terdapat 3 hal dalam data preparationyaitu :

1. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses

data mining.

2. Data Preprocessing: Memastikan kualitas data yang telah dipilih pada tahap

dataselection, pada tahap ini masalah yang harus dihadapi adalah noisy data dan

missing values. Proses pembersihan data (cleansing) dilakukan dengan melakukan metode-metode query sederhana untuk menemukan anomali-anomali data yang bisa saja masih terdapat pada sistem.

3. Data Transformation: Mengelompokkan atribut-atribut atau field-yang telah terpilih menjadi 1 tabel dengan cara melakukan denormalisasi.


(28)

2.7

PCA (Principal Component Analysis)

Terdapat dua metode Dimensionality Reduction yang paling sering digunakan yaitu

Feature Selection dan Feature Extraction.Feature selection merupakan sebuah proses pemilihan subset feature dari feature asli, sedangkan feature extraction adalah proses mengekstrak feature baru dari feature asli melalui pemetaan fungsional.

Salah satu metode feature extraction adalah PCA ( Principal Component Analysis ). Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan principal component

Analisis Komponen Utama (Principal Component Analysis) atau PCA adalah suatu metodeyang melibatkan prosedur matematika yangmengubah dan mentransformasikan sejumlah besarvariabel yang berkorelasi menjadi sejumlah kecilvariabel yang tidak berkorelasi, tanpa menghilangkaninformasi penting di dalamnya

2.8 Hepatitis

Hepatitis telah menjadi masalah global. Saat ini diperkirakan 400 juta orang di dunia terinfeksi hepatitis B kronis, bahkan sekitar 1 juta orang meninggal setiap tahun karena penyakit ini (Wening,2008).

Hepatitis adalah istilah umum yang berarti radang hati.“Hepa” berarti kaitan dengan

hati, sementara “itis” berarti radang.Hepatitis atau peradangan hati dapat diartikan sebagai suatu proses peradangan yang menimpa sel-sel hati (Cahyono,2008). Secara objektif, adanya hepatitis dibuktikan melalui biopsi jaringan hati (pengambilan sedikit jaringan hati menggunankan jarum).Namun, secara sederhana pemeriksaan dapat digantikan dengan pemeriksaan darah.

Hepatitismerupakan salah satu penyakit yang membayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.


(29)

Hati adalah organ yang terbesar dalam tubuh. Kurang lebih sama besar dengan buah pepaya, dan terletak di perut kanan-atas.Fungsi utama dari hatiatau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.

Ada 5 macam virus hepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virus hepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D(VHD), virus hepatitis E (VHE).

Diagnosis hepatitis dapat dipastikan melalui anamnesis dengan dokter serta pemeriksaan fisik dan laboratorium. Dokter akan menanyakan hal – hal yang terkait dengan penularan hepatitis karena hepatitis jenis A, B, C, dan jenis lainnya memberikan gejala yang hampir sama.

Pemeriksaan laboratorium pada pasien yang diduga mengidap penyakit hepatitis dilakukan untuk memastikan diagnosis, mengetahui penyebab dan menilai fungsi hati.Secara garis besar, pemeriksaan laboratorium dibadakan menjadi dua yaitu, tes seralogi dan biokimia hati.

Tes seralogi dilakukan dengan cara memeriksa kadar antigen maupun antibodi terhadap virus penyebab hepatitis. Tes ini bertujuan untuk memastikan diagnosis serta mengetahui jenis virus penyebabnya. Tes biokimia hati dilakukan dengan cara memeriksa parameter zat – zat kimia maupun enzim yang dihasilkan atau diproses oleh jaringan hati. Tes biokimia hati dapat dipergunakan untuk mengetahui derajat keparahan atau kerusakan sel sehingga dapat menilai fungsi hati.

Penderita penyakit hati secara umum termasuk hepatitis, akan diperiksa darahnya untuk beberapa jenis pemeriksaan parameter biokimia, seperti AST, ALT (alanin aminotransferase), alkaline fosfatase,bilirubin, albumin, dan protombin (Wening, 2008). Adapun nilai normal untuk pemeriksaan laboratorium disajikan dalam tabel 2.1 dan kegunaan dari jenis pemeriksaan laboratorium akan disajikan dalam table 2.2.


(30)

Tabel 2.1 : Nilai normal pemeriksaan laboratorium

Parameter Biokimia Hati Rentang Nilai Normal

AST / SGOT ≥ 37 U/L (Pria) | ≥ 31 U/L (wanita)

ALT / SGPT ≥ 42 U/L (Pria) | ≥ 32 U/L (wanita)

HBsAg

NEGATIF : < 1,0 S/CO atau < 1,0 COI (ECLIA)

Anti HAV

NEGATIF : < 1,0 COI POSITIF : >= 1,0 COI (EIA)

Anti HCV

NEGATIF : < 1,0 S/CO atau < 1,0 COI (EIA)

Tabel 2.2 : Kegunaan Pemeriksaan Laboratorium

Jenis Pemeriksaan Kegunaan

SGOT Untuk mengetahui fungsi hati , membantu mendiagnosis kelainan hati

SPGT Untuk mengetahui fungsi hati, membantu mendiagnosis kelainan hati

HBsAg Untuk mengetahui adanya infeksi virus Hepatitis B. Jika HBsAg positif maka terinfeksi virus hepatitis B. Jika HBsAg positif selama

lebih dari 6 bulan, berarti pasien menderita Hepatitis B kronis dan disarankan untuk rutin memeriksakan fungsi hati (SGOT, SGPT, Protein Total, Albumin, AFP) paling tidak 6 bulan – 1 tahun sekali

Anti HAV/ IgM Anti HAV

Untuk mengetahui adanya antibody terhadap virus Hepatitis A

Anti HCV Untuk mengetahui adanya antibody terhadap virus Hepatitis C. Anti HCV positif berarti pasien menderita Hepatitis C.


(31)

2.8.1 Penyebab Hepatitis

Penyebab hepatitis sendiri sangat banyak,misalnya hepatitis akibat virus, bahan kimia, obat – obatan, alkohol, dan lain – lain. Pada saat ini penyakit hepatitis yang sering menjadi masalah adalah hepatitis virus, terutama akibat virus hepatitis B dan C sebab kedua jenis hepatitis ini sering menimbulkan hepatitis kronis yang dapat berakhir menjadi sironishati dan kanker hati (Cahyono,2008).

2.8.2 Jenis dan Gejala Hepatitis

Menurut Cahyono (2008), perbedaan dari setiap jenis hepatitis dapat dilihat pada tabel 2 dibawah ini :

Tabel 2.3 : Jenis Hepatitis

Sifat Virus Hepatitis A Virus Hepatitis B Virus Hepatitis C

Virus Hepatitis D Virus Hepatitis E Masa Tunas

15 – 45 hari

40 – 80 hari 5 – 12 minggu

4 – 20 minggu 15 – 40 hari Penularan Mulut (Peroral) Darah (Parental) Darah (Parental)

Darah (Parental) Oral (Peroral)

Cronisitas

Tidak Ya Ya Ya Tidak

Carrier Kronik

Tidak Ya Ya Ya Tidak

Penyebab Picorna Virus HepadnaVirus Flavi Virus DefectiveVirus diliputi HBsAg Calici Virus

Pada fase awal hepatitis, penderita belum merasakan gejala yang spesifik. Keluhan yang dirasakan antara lain mual, muntah, tidak nafsu makan, badan terasa lemas, dan mudah lelah. Kelelahan adalah keluhan yang paling sering terjadi pada penderita hepatitis.


(32)

Hepatitis A merupakan jenis hepatitis yang paling ringan. Hal ini disebabkan infeksi virus hepatitis A (VHA) umumnya tidak sampai menyebabkan kerusakan jaringan hati (Wening, 2008). Mereka yang terinfeksi virus ini dapat pulih sepenuhnya. Hepatitis A ini menular melalui makanan atau minuman yang telah terkontaminasi oleh virus VHA.

Hepatitis B merupakan jenis hepatitis yang paling berbahaya.Penyakit ini lebih sering menular dibandingkan dengan jenis hepatitis lainnya. Hepatitis B menular melalui kontak darah atau cairan tubuh yang mengandung virus hepatitis B (VHB) maupun material lain yang terinfeksi, seperti jarum suntik, alat bedah, jarum akupuntur, dan alat – alat yang dapat menimbulkan luka lecet milik individu yang terinfeksi .Hepatitis B kronis memberikan gejala yang lebih serius yaitu mudah lelah, cemas, tidak nafsu makan, mual, muntah dan merasa lemas.Hepatitis B kronis dapat membuat penumpukan cairan dalam rongga perut sehingga perut terlihat membuncit.Seseorang dapat mengidap virus ini tetapi tidak disertai dengan gejala klinik atau tidak tampak adanya kelainan atau gangguan kesehatan. Orang tersebut merupakan pembawa atau biasa disebut carrier.

Carrier dapat terjadi karena individu tersebut memiliki pertahanan tubuh yang baik atau karena virus VHB mengalami perubahan sifat yang tidak aktif (Wening, 2008).Virus yang tidak aktif ini akan membuat pertahanan tubuh tidak dapat mengenalinya sebagai

“musuh” sehingga sistem imun tidak mengadakan perlawanan, suatu saat ketika pertahanan

tubuh dalam kondisi lemah maka virus akan aktif dan akan muncul gejala hepatitis. Carrier

jumlahnya relatif banyak dan berpotensi menularkan.

Hepatitis C juga menyebabkan peradangan hati yang cukup berat. Hepatitis C menular melalui darah, biasanya karena transfusi atau jarum suntik yang terkontaminasi virus hepatitis C (VHC).Pada penderita hepatitis C keluhan yang dirasakan adalah merasalemas, mual, muntah, hilang nafsu makan, demam, mual, dan nyeri ulu hati. Sebagian dari penderita mengeluh bahwa urin berwarna gelap, feses berwarna putih, serta kulit, kuku dan bola mata bagian putih berwarna kuning. Jika diraba, perut bagian atas kanan membesar karena terjadi pembesaran hati maupun terasa adanya tegangan didaerah hati.


(33)

2.8 Contoh Penggunaan Fuzzy C-Means

Terdapat data gejala yang telah dirubah kedalam bentuk biner

Pegal NyeriSendi Normal Linu-linu

0 0 1 0

0 0 1 0

0 0 1 0

0 0 1 0

0 0 1 0

0 1 0 0

0 0 1 0

1 0 0 0

0 0 1 0

0 0 1 0

0 0 1 0

0 0 1 0

Data tersebut akan dibagi dalam tiga kelompok. Pertama tentukan :

banyaknya cluster c 3

Pembobot w 2

maksimum iterasi maxiter 5

error e 0.01

fungsi objektif P0 0

Iterasi awal iter 1


(34)

i k1 k2 k3

1 0.440986528 0.490279156 0.069

2 0.555826368 0.384816328 0.059

3 0.156206358 0.306739378 0.537

4 0.460986631 0.075301468 0.464

5 0.426768818 0.216412813 0.357

6 0.095909122 0.285092664 0.619

7 0.32906622 0.398552921 0.272

8 0.019634378 0.466853598 0.514

9 0.311402432 0.347649768 0.341

10 0.321789912 0.537765533 0.14

11 0.695747687 0.031368532 0.273

12 0.047758847 0.100471348 0.852

Langkah selanjutnya adalah menghitung pusat kluster Vij dan didapat hasil :

vij 1 2 3 4 5 6 7

1 0.00532574 0.001543791 0.712869 0.280262 0.934722 0 0.161594 2 0.05747037 0.161248551 0.780585 0.000696 0.738046 0 0.118575 3 0.1668799 0.430836171 0.369851 0.032433 0.824529 0 0.106082

8 9 10 11 12 13 14 15 16

0.883904 0.48318 0.933401 0.336406 0.756065 0.123037 0 0.1054 0.001321 0.710058 0.647889 0.730909 0.086154 0.889208 0.004009 0 0.0331 0.007138 0.94078 0.484568 0.508542 0.083062 0.409287 0.093653 0 0.0555 0.315987

17 18 19 20 21 22 23 24 25 26

0.014127 0.644569 0.355431 0.752799 0.638885 0.412827 0 0 0.059952236 0.805538 0.066529 0.57227 0.42773 0.740745 0.563643 0.650965 0 0 0.204483286 0.369964 0.125621 0.608367 0.391633 0.656525 0.33848 0.522367 0 0 0.008590829 0.35201


(35)

Lalu hitung fungsi objektif pada iterasi ke-i Pk1 0.425421188 0.400981585 0.097718459 0.878426136 0.739858999 0.050045697 0.314062712 0.00157452 0.449803355 0.569634953 1.205474338 0.013652833 pk2 0.569272 0.332846 0.341193 0.024486 0.206732 0.377365 0.31748 0.700377 0.520319 0.965603 0.004561 0.056323

pk3 p kluster 0.015653 1.010346315 0.011176 0.745003756 1.127077 1.565988973 0.905885 1.808796982 0.647684 1.594275499 1.617009 2.044419013 0.211604 0.843146995 0.82873 1.530682167 0.618954 1.589076395 0.106368 1.641606159 0.34855 1.558585765 1.911485 1.981460854 total 17.91338887

Kemudian setelah fungsi objektif diperoleh, yang dilakukan adalah memperbaiki derajat keanggotaan dan diperoleh derajatkeanggotaan yang baru sebagai berikut :

K1 K2 K3

1 0.28 0.30 0.42

2 0.19 0.33 0.47

3 0.35 0.31 0.34

4 0.33 0.34 0.33

5 0.30 0.33 0.38

6 0.38 0.32 0.30


(36)

8 0.39 0.31 0.30

9 0.33 0.30 0.37

10 0.39 0.23 0.38

11 0.21 0.39 0.40

12 0.42 0.39 0.19

Setelah dibentuk derajat keanggotaan yang baru kemudian cek kondisi berhenti apakah (|Pi-Pi-1 |<e) atau (t>MaxIter) ? Jika tidak: t=t+1, ulangi langkah dari menghitung pusat kluster.

Setelah mengalami 6 kali iterasi maka diperoleh fungsi objektif sebagai berikut :

Iterasi Fungsi Objektif

1 17.91338887

2 14.52300538

3 14.261227

4 14.23399458

5 14.22633765


(37)

Dan derajat keanggotaan yang diperoleh pada iterasi keenam adalah :

K1 K2 K3

0.35 0.33 0.32 0.35 0.32 0.33 0.35 0.33 0.32 0.33 0.34 0.33 0.34 0.33 0.32 0.32 0.34 0.34 0.31 0.35 0.34 0.34 0.33 0.33 0.32 0.34 0.34 0.32 0.34 0.34 0.34 0.33 0.33 0.33 0.33 0.34


(38)

dari matriks derajat keanggotaan diatas maka dapat disimpulkan pengelompokkan data setelah iterasi keenam :

K1 K2 K3

X

X

X

X

X

X

X

X

X X

X X

X


(39)

Setelah data dikelompokkan dengan menggunakan Fuzzy C-Means maka hasil pengelompokkan tersebut dihitung dengan menggunkana confusion matrix sebagai berikut

Hepatitis\Kelompok a b c

K1 3 2 1

K2 1 2 2

K3 0 0 3


(40)

BAB III

ANALISIS dan DESAIN SISTEM

Bab ini berisi tentang desain dan analisis sistem meliputi perancangan antarmuka,

flowchartdan usecase.

3.1 Data

Penyakit hepatitis merupakan penyakit peradangan hati. Terdapat beberapa jenis hepatitis yaitu hepatitis A, B, C, D, E. Hepatitis tipe A dan E masih dapat untuk di sembuhkan, namun untuk hepatitis tipe B dan C biasanya menjadi penyakit yang kronis.Dalam penelitian ini penyakit hepatitis yang akan digunakan adalah hepatitis A, B, dan C karena tipe tersebut yang paling banyak ditemui dibandingkan dengan tipe yang lainnya.

Rumah sakit Panti Rapih Yogyakarta merupakan sebuah rumah sakit besar yang setiap harinya didatangi pasien hepatitis untuk berobat. Data yang didapat dari Rumah sakit Panti Rapih merupakan data set yang bertipe record, berupa data hasil laboratorium dan data dari hasil pemeriksaan dari dokter(anamnesis).Semua keterangan tentang status data pasien tersebut dikumpulkan dan didokumentasikan oleh pihak rekam medis.

Data anamnesis yang didapat sebanyak 130 data yang merupakan data pasien penyakit hepatitis tahun 2000 hingga 2010 yang diambil tanggal 10 Januari 2011 oleh Estu Karunianingtyas. Dari data anamnesis didapat lima gejala yaitu gejala otot, gejala perut, gejala kulit, gejala mata, dan gejala mirip flu. Masing –masing gejala tersebut memiliki beberapa sub gejala.

Data laboratorium yang didapat sebanyak 66 data pasien hepatitis A, 48 pasien hepatitis B, dan 30 pasien hepatitis C. Dari data laboratorium didapat lima gejala yaitu SGPT, SGOT, antiHAV, HbsAg, dan antiHCV.

Gejala otot memiliki sub gejala pegal dan nyeri sendi. Gejala perut memiliki sub gejala muntah, diare, kencing berwarna gelap, nafsu makan berkurang, mual,nyeri perut sebelah kanan, Illeus obstructive,Haemotomesis. Gejala kulit memiliki sub gejala kulit berwarna kuning dan kulit berwarna normal. Gejala mata memiliki subgejala mata berwarna kuning


(41)

dan mata berwarna normal. Gejala mirip flu memiliki sub gejala demam, lesu, pusing, mialgia, lelah, dan menggigil.

Data anamnesispasien yang telah didapat dilakukan binerisasi yaitu konversi sub gejala menjadi 0 atau 1 dengan ketentuan 0 jika pasien tidak mengalami gejala tersebut dan 1 jika pasien mengalami gejala tersebut.

3.2 Gambaran Umum Sistem

Sistem ini digunakan untuk melakukan pengelompokkan jenis penyakit hepatitis berdasarkan dengan gejala anamnesis dan gejala laboratorium dengan menggunakan metode

Fuzzy C-Means.Sistem ini juga digunakan untuk menghitung keakuratan dari metode Fuzzy C-Means dalam mengelompokkan penyakit hepatitis.Pengelompokkan dilakukan untuk memberikaninformasi mengenai anggota masing-masing cluster/kelompok.

Flowchartsistem pengelompokkan penyakit hepatitis sebagai berikut :

1. User memasukkan data yang akan diproses

2. Usermenginputkan inisialisasi awal berupa bobot, maksimum iterasi, nilai error minimal, iterasi awal, dan fungsi objektif awal.

3. Proses pengelompokkan data dengan FCM dan perhitungan akurasi 4. Output berupa hasil clustering dan besar nilai akurasi.


(42)

3.3 Use Case Diagram

Diagram use case digunakan untuk menggambarkan interaksi antara pengguna dengan sistem. Pada system ini yang menjadi actor adalahuser. User dapat memilih data yang akan dikelompokkan dan dapat melakukan pengelompokkan data.Fungsi yang dapat dijalankan oleh pengguna sistem ini adalah fungsi memasukkan data dalam bentuk file .csv. Fungsi berikutnya adalah fungsi memasukkan data inisialisasi awal.Fungsi terakhir yaitu fungsi mengelompokkan data dengan metode FCM. Diagram use case dari sistem pengelompokkan penyakit hepatitis dengan menggunakan metode Fuzzy C-Means ini dapat dilihat pada gambar 3.2 di bawah ini

Gambar 3.2 : Use Case Diagram

3.4 Perancangan Antarmuka

Gambar 3.3 : Perancangan Antarmuka Cari data rekam medis

Proses Pengelompokkan dengan metode FCM

input inisialisasi awal


(43)

Desain Tampilan sistem pengelompokkan penyakit hepatitis dengan metode Fuzzy C-Means ini hanya mempunyai satu tampilan utama. Pada tampilan ini terdapat fasilitas untuk mencari data rekam medis yang akan dihitung dan data yang dipilih akan ditampilkan di tabel

“Data Awal” , selain itu juga user harus mengisikan inisialisasi awal pada tampilan ini

sebelum tombol “Hitung” ditekan. Nilai dari tabel “Derajat Keanggotaan” dan tabel “Akurasi” serta nilai akurasi akan otomatis terisi ketika tombol “Hitung” ditekan.

3.5 Spesifikasi Perangkat Lunak dan Perangkat Keras

Spesifikasi software dan hardware yang digunakan dalam implementasi sistem diagnosa penyakit hepatitis menggunakan Fuzzy C-Meansadalah sebagai berikut:

1. Software :

XP SP 2

2. Hardware :

Processor : Intel(R) Core(TM) i3 CPU M370 @2.40GHz

Memory : 2 GB.


(44)

BAB IV

Implementasi dan Analisis Hasil

Pada bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari implementasi system yang telah dibuat. Hasil penelitian yang terpenting berupa perbandingan akurasi yang diperoleh dari pengujian metode Fuzzy C-Means. Pada bab ini juga dibahas mengenai user interface yang dibangun berdasarkan algoritma yang telah dirancang.

4.1 Hasil Pengumpulan Data

Pada penelitian yang telah dilakukan di Rumah Sakit Panti Rapih Yogyakarta, diperoleh 144 data laboratorium dari pasien yang mengidap penyakit hepatitis A, hepatitis B dan hepatitis C yang masing – masing 66 data pasien hepatitis A, 48 data pasien hepatitis B, dan 30 data pasien hepatitis C. Dari 130 data anamnesis terdiri dari 50 data hepatitis A, 50 data hepatitis B dan 30 data hepatitis C dan merupakan data pasien penyakit hepatitis tahun 2000 hingga 2010 yang diambil tanggal 10 Januari 2011 oleh Estu Karunianingtyas. Untuk masing – masing gejala anamnesis terdiri atas beberapa kriteria seperti pada tabel 4.1 dan untuk data laboratorium terdiri atas beberapa feature seperti pada tabel 4.2 dibawah ini :

Tabel 4.1 : Deskripsi data gejala anamnesis

NO Gejala Feature

1 Otot Pegal, nyeri sendi, normal dan linu -linu

2 Perut Muntah, diare, kencing berwarna gelap, mual, nyeri perut sebelah kanan, nafsu makan berkurang dan perut acites(perut membuncit)


(45)

4 Mata Normal, kuning

5 Mirip Flu Demam, pusing, lesu, mialgia, lelah, menggigil, batuk

Tabel 4.2 : Deskripsi data gejala Laboratorium

NO Feature

1 SGOT

2 SGPT

3 Igm

4 HbsAg

5 Anti HCV

Data anamnesis dan data laboratorium pasien hepatitis digabungkan menjadi satu berupa teks yang disimpan dalam format excel (.xls), masing-masing disimpan secara terpisah baik data hepatitis A, B maupun C. Terdiri 40 data hepatitis A, 40 data hepatitis B dan 30 data hepatitis C.

4.2 Perancangan Fuzzy C- Means

Data yang digunakan dalam penelitian ini adalah data hasil diagnosa akhir dan data laboratorium pasien hepatitis yang diperoleh dari Rekam Medis Rumah Sakit Panti Rapih.Data diberikan dalam bentuk manual, yaitu berupa map yang berisi lembaran data pasien, baik hasil pencatatan anamnesa/ gejala penyakit dan hasil laboratorium serta data


(46)

diagnosa keperawatan yang mana pasien telah dirawat inap.Peneliti melakukan pencatatan data laboratorium pasien dalam format ekstensi xls.

4.2.1 Pembersihan Data

Pembersihan Data (data cleaning) merupakan tahap awal dalam proses penambangan data. Pada data anamnesisdan data laboratorium yang diperoleh terdapat beberapa data yang tidak lengkap, seperti misalnya ada beberapa pasien yang tidak menjalani pemeriksaan laboratorium sehingga tidak didapat data laborataoriumnya dan terdapat juga pasien yang menjalani pemeriksaan laboratorium yang tidak menyeluruh sehingga menyebabkan data tidak lengkap.Data yang tidak lengkap tersebut kemudian dibuang sehingga diperoleh 110 data laboratorium dan 110 data anamnesis.

4.2.2 Normalisasi data laboratorium

Pada data hasil pemeriksaan laboratorium didapat nilai hasil pemeriksaan yang mempunyai satuan yang berbeda – beda. Hal ini disebabkan karena alat pemeriksaanyang digunakan untuk memeriksa penyakit hepatitis berbeda antara pasien satu dengan pasien yang lain sehingga menyebabkan rentang nilai normal yang berbeda.Perbedaan jenis kelamin juga berpengaruh pada rentang nilai normal pemeriksaan laboratorium.Data pemeriksaan laboratorium dinormalisasi dengan menggunakan nilai rentang normal dari pemeriksaan laboratorium sesuai dengan jenis alat yang digunakan dan jenis kelamin pasien.

4.2.3 PCA ( Principal Component Analysis)

PCA merupakan salah satu dari metode dimensional reduction yang digunakan untuk menyederhanakan variabel.Pada penelitian ini, data yang diolah dengan menggunakan metode PCA adalah data anamnesa yang mempunyai 26 variabel.

Data anamnesa ini akan diolah dengan bantuan SPSS 17untuk mereduksi variabel bebas yang berkorelasi tinggi sehingga dapat diketahui variabel mana saja yang dianggap layak untuk dimasukkan ke analisis berikutnya.


(47)

Langkah – langkah yang dilakukan dalam prosedur PCA dengan menggunakan SPSS 17 pada data anamnesa pasien penyakit hepatitis adalah sebagai berikut :

a. Barlett Test

Tabel 4.3: KMO and Bartlett;s Test

.236 Approx.

Chi-Square

1168.660

df 325

Sig. .000

KMO and Bartlett's Test Kaiser-Meyer-Olkin

Bartlett's Test of Sphericity

Barlett Test merupakan tes statistik untuk menguji apakah betul variabel-variabel bebas yang dilibatkan berkorelasi.

Ho :Tidak ada korelasi antarvariabel bebas

H1 :Ada korelasi antarvariabel bebas

Kriteria uji dengan melihat p-value (signifikansi) : Terima Ho jika Sig. > 0,05 atau tolak Ho jika Sig. < 0,05. Pada tabel 4.3 di atas dapat dilihat bahwa nilai Chi-Square adalah 1168.660, dengan derajat bebas sebesar 325, dan p-value (sig) sebesar 0,000. Karena p-value (0,000) < 0,05 maka Ho di tolak. Artinya, benar-benar terdapat korelasi antarvariabel bebas

b. Communalities

Tabel 4.4: Communalities

Initial Extraction

Pegal 1.000 .715

NyeriSend i

1.000 .867

Norm aloto t

1.000 .912

Linulinu 1.000 .709

Muntah 1.000 .700

Diare 1.000 .721

Kem bung 1.000 .610

m ual 1.000 .641

nps k 1.000 .665


(48)

Communalities menunjukkan berapa varians yang dapat dijelaskan oleh factor yang diekstrak (faktor yang terbentuk).Cara memperolehnya adalah dengan mengkuadratkan nilai korelasi yang terdapat pada tabel 4.6Component Matrix.Setiap variabel berkorelasi dengan faktor-faktor yang terbentuk.Misalkan untuk variabel pegal diperoleh nilai sebesar 0.715. Hal ini berarti sekitar 71,5% variabel pegal dapat dijelaskan oleh faktor yang terbentuk. Untuk variabel nyeri sendi, diperoleh nilai sebesar 0,867. Hal ini berarti sekitar 86,7% variabel nyeri sendi dapat dijelaskan oleh faktor yang terbentuk.

c. Total Variance Explained

Tabel 4.5: Total Variance Explained

Total

% of Variance

Cumulativ

e % Total

% of Variance

Cumulativ e %

1 2.978 11.454 11.454 2.978 11.454 11.454

2 2.414 9.284 20.739 2.414 9.284 20.739

3 2.255 8.672 29.410 2.255 8.672 29.410

4 1.692 6.508 35.919 1.692 6.508 35.919

5 1.551 5.967 41.885 1.551 5.967 41.885

6 1.450 5.578 47.464 1.450 5.578 47.464

7 1.320 5.077 52.540 1.320 5.077 52.540

8 1.168 4.493 57.033 1.168 4.493 57.033

9 1.121 4.313 61.346 1.121 4.313 61.346

10 1.070 4.115 65.461 1.070 4.115 65.461

11 1.028 3.954 69.415 1.028 3.954 69.415

12 .987 3.796 73.211

13 .927 3.564 76.775

Compone nt

Initial Eigenvalues

Extraction Sums of Squared Loadings

Kemampuan setiap factor mewakili variabel-variabel yang dianalisis ditunjukkan oleh besarnya varians yang dijelaskan, yang disebut dengan

eigenvalue.Varians yang dimaksud adalah varians variabel-variabel yang sudah distandardisasi.Dengan standardisasi, nilai rata-rata setiap variabel menjadi nol dan variansnya menjadi satu.Karena varians setiap variabel adalah satu, maka varians totalnya ada 26 karena dalam kasus ini ada 26 variabel bebas.

Eigenvalues menunjukkan kepentingan relatif masing-masing factor dalam menghitung varians ketiga variabel yang dianalisis. Susunan eigenvalues selalu diurutkan dari yang terbesar sampai ke yang terkecil, dengan kriteria bahwa angka

eigenvalues di bawah 1 tidak digunakan dalam menghitung jumlah faktor yang terbentuk Dari tabel 4.5 di atas terlihat bahwa hanya 11 factor yang terbentuk, karena


(49)

angka eigenvalues memiliki nilai di atas 1. Sehingga proses factoring seharusnya berhenti pada 11 faktor saja. Faktor 1 memiliki eigenvalue sebesar 2,978 artinya faktor 1 ini dapat menjelaskan 2,978 atau 11,454% dari total communalities

d. Component Matrix

Tabel 4.6: Conponent Matrix

1 2 3 4 5 6 7 8 9 10 11

Pegal -.144 .369 -.204 -.207 .430 .414 -.277 .022 .128 -.148 -.049 NyeriSendi .022 .724 .000 .022 -.174 -.292 .377 .212 .114 -.109 -.124 Normalotot -.037 -.834 .193 -.077 -.121 -.236 -.231 -.114 -.102 .112 .112 Linulinu .274 .087 -.131 .376 -.006 .507 .239 -.208 -.226 .237 -.057

Muntah .148 .102 .459 -.145 -.181 .076 .170 .156 .406 -.045 .422

Diare .080 .040 .112 -.727 -.254 .126 .037 -.074 -.101 .208 -.175 Kembung -.229 -.086 .042 -.225 .421 -.013 .317 -.246 .156 .061 .363

mual .065 -.226 .237 .423 -.093 .206 .262 .438 .042 .194 -.009

Component

Tabel ini berisikan factor loading (nilai korelasi) antara variabel-variabel analisis dengan faktor yang terbentuk.Berdasarkan tabel 4.6 di atas, terlihat bahwa ada 11 faktor yang terbentuk dari 26 variabel.Hal ini menunjukkan bahwa 11 factor adalah jumlah yang paling optimal untuk mereduksi ketiga variabel bebas tersebut.

e. Component Score Coefficient Matrix

Setelah mendapatkan faktor yang terbentuk melalui proses reduksi, maka perlu dicari persamannya. Dengan persaman tersebut, dapat diperoleh skor setiap faktor secara manual.Persamaan yang dibuat mirip dengan regresi linier berganda, hanya dalam persamaan faktornya tidak terdapat konstanta.Skor-skor faktor yang dihasilkan dapat digunakan untuk menggantikan skor-skor pada varibel bebas yang asli. Hasil skor faktor yang diperoleh ditunjukkan pada tabel 4.7 dan hasilComponent Score Coefficient Matrix ditunjukkan pada tabel 4.8 dibawah ini :


(50)

Tabel 4.7: Score Faktor

FC1 FC2 FC3 FC4 FC5 FC6 FC7 FC8 FC9 FC10 FC11

-0.0649 -0.11 1.665 0.12 0.4 0.1013 -0.13 0.183 1.005 0.48 -0

1.07655 0.051 1.419 0.55 -0.4 0.3197 -0.46 -0.21 0.129 0.51 0.22

-1.04707 -0.9 1.1 0.21 0.03 -1.239 1.115 -1.97 1.861 2.49 -0.5

-1.16246 -0.99 0.862 0.17 0.35 0.6079 0.022 1.279 0.035 -0.53 0.26

1.11325 0.918 0.687 0.71 0.04 -0.571 0.845 0.457 0.124 -1.12 0.35

0.83123 -0.55 0.624 0.09 0.65 -0.531 0.143 -0.76 0.512 -0 0.54

0.98196 -0.05 1.311 0.73 0.47 -0.469 -0.81 -0.63 -0.78 0.31 -0.5

-1.40938 -0.44 0.474 0.17 -0.8 -0.249 -0.57 0.108 -0.47 -0.18 -0.8

Tabel 4.8: Component Score Coefficient Matrix

1 2 3 4 5 6 7 8 9 10 11

Pegal -.048 .153 -.091 -.122 .277 .285 -.210 .018 .114 -.138 -.048

NyeriSendi .007 .300 .000 .013 -.112 -.201 .286 .181 .101 -.102 -.120

Normalotot -.012 -.345 .086 -.046 -.078 -.163 -.175 -.097 -.091 .105 .109

Linulinu .092 .036 -.058 .222 -.004 .350 .181 -.178 -.201 .222 -.056

Muntah .050 .042 .203 -.086 -.116 .052 .129 .134 .362 -.042 .410

Diare .027 .017 .050 -.430 -.164 .087 .028 -.063 -.090 .194 -.170

Kembung -.077 -.036 .018 -.133 .271 -.009 .240 -.210 .139 .057 .353

Component

4.2.4Membentuk derajat Keanggotaan ( Matriks Uik)

Langkah pertama dalam perhitungan Fuzzy C-Means (FCM) adalah membentuk matriks derajat keanggotaan awal atau matriks partisi awal Uik.Matrik partisi Uik mempunyai komponen i= banyaknya data, k = banyaknya cluster. Matrik ini random dengan kisaran nilai 0 sampai 1. Pembentukan matrik Uik ini dilakukan dengan menggunakan fungsi seperti tabel 4.9

Tabel 4.9: Fungsi FFCM_InitV

function V = FFCM_InitV (c, p) V = rand(c, p);

col_sum = sum(V);


(51)

Matriks Uik yang terbentuk dari fungsi FFCM_initV disimpan ke dalam hepatitis.mat.Jika dijumlahkan maka nilai perbaris dari matriks Uik yang terbentuk tidak lebih dari 1. Setelah nilai matriks partisi awal disimpan maka proses FCM dilakukan pertama kali dengan memilih data yang akan diolah, kemudian data tersebut akan dihitung dengan menggunakan fungsi FFCM yang terdapat pada halaman lampiran. Perhitungan FCM ini akan dilakukan berulang kali untuk memperbaiki lokasi pusat cluster. Langkah iterative ini akan dilakukan berdasarkan minimisasi fungsi objektif.

5.3 Implementasi User Interface

Implementasi sistem pengelompokkan penyakit hepatitis dengan menggunakan Fuzzy C-Meansini dibangun dengan menggunakan program MATLAB R2010a. Source code program terdapat pada halaman Lampiran.

Gambar 4.1 : Halaman Pengelompokkan Penyakit Hepatitis

Pada gambar 4.1 ditunjukkan halaman pengelompokkan penyakit hepatitis dengan menggunakan metode FCM. Di halaman ini user memilih data rekam medis yang akan dihitung dengan menekan tombol cari maka akan muncul dialog box seperti gambar 4.2 dibawah ini.


(52)

Gambar 4.2 :dialog box untuk memilih data

Kemudian user memilih nama file berformat .csv yang akan dihitung.setelah tombol open ditekan maka data yang dipilih akan tampil pada tabel data awal seperti gambar 4.3

Gambar 4.3 :Data awal

Kemudian user memasukkan inisialisasi awal untuk bobot (w), maximum iterasi, nilai error, iterasi awal dan fungsi objektif awal pada kolom inisialisasi awal seperti gambar 4.4. Untuk nilai bobot (w) nilai yang diinputkan tidak boleh kurang dari 1 karena nilai perhitungan akan menjadi 0 jika menginputkan bobot bernilai 1.


(53)

Setelah memasukkan nilai inisialisasi awal tekan tombol “Hitung” untuk menjalankan program. Selanjutnya akan ditampilkan derajat keanggotaan terakhir dan nilai akurasinya.

Ketika tombol “Hitung” ditekan maka secara otomatis nilai derajat keanggotaan terakhir dan nilai fungsi objektif akhir akan tersimpan pada uikAkhir.xls dan FungsiObjektif.xls. Hasil nilai derajat keanggotaan pada iterasi terakhir yang didapat, nilai fungsi objektif akhir dan hasil akurasi akan tampak seperti gambar 4.5, gambar 4.6 dan gambar 4.7 dibawah ini

Gambar 4.5 :Nilai derajat keanggotaan iterasi terakhir

1.258421 0.077375 0.030552 0.016056 0.010787 0.00726 0.004815 0.003175 0.002089 0.001373 0.000901 0.000592 0.000389 0.000255 0.000168 0.00011 7.22E-05

Gambar 4.6: Fungsi Objektif


(54)

Nilai derajat keanggotaan akhir pada gambar 4.6 merupakan hasil dari perhitungan metode FCM.Nilai derajat keanggotaan akhir ini yang menentukan pengelompokkan dari data pasien penyakit hepatitis.Cara mengelompokkan pasien berpenyakit hepatitis ini dengan melihat nilai tertinggi dari derajat keanggotaan akhir yang didapat.

Fungsi objektif pada gambar 4.6 dapat memberitahu banyak iterasi yang dilakukan untuk mengolah data dengan menggunakan metode FCM dan nilai minimasi fungsi objektif yang didapat.Pada gambar 4.6 dilakukan 17 kali iterasi dengan nilai minimasi fungsi objektif sebesar -3.77768E-05.

Pada gambar 4.7 diatas ditunjukkan hasil pengelompokkan dengan menggunakan metode FCM, akurasi yang diperoleh dari hasil percobaan tersebut sebesar 46.5517%. Nilai akurasi tersebut didapatkan dengan cara :

Akurasi=

.

Jika dibandingkan dengan penelitian sebelumnya akurasi yang diperoleh dari penelitian ini lebih buruk, karena penelitian sebelumnya akurasi yang diperoleh sebesar 51.11%.

5.4 Hasil Pengujian

Pengujian yang dilakukan pada sistem pengelompokkan penyakit hepatitis ini dilakukan dengan menggunakan data anamnesisyang belum di PCA, data anamnesa sudah di PCA, data anamnesa sudah di PCA digabungkan dengan data laboratorium dan percobaan yang terakhir dilakukan pada data laboratorium. Data anamnesa yang digunakan memiliki 110 data dan 26 atribut berbentuk biner, sedangkan data laboratorium yang digunakan memiliki 110 data dan 5 atribut. Data anamnesa yang sudah dilakukan proses PCA terdiri dari 110 data dan 11 atribut dan pada data anamnesa yang sudah di PCA dan digabung dengan data laboratorium terdiri dari 110 data dan 16 atribut.

Tabel 4.10 menunjukkan hasil percobaan pada data anamnesa dokter yang didalamnya terdiri dari nilai inisialisasi awal yang diinputkan dan nilai akurasi yang didapat dari percobaan tersebut.Sedangkan tabel 4.11 menunjukkan hasil percobaan pada data laboratorium yang didalamnya terdiri dari nilai inisialisasi awal yang diinputkan dan nilai akurasi serta perrcobaan dengan menggunakan data laboratorium yang sudah di normalisasi. Hasil percobaan pada data anamnesa yang sudah dilakukan proses PCA ditunjukkan pada


(55)

tabel 4.12 dan hasil percobaan pada data anamnesa yang sudah dilakukan proses PCA dan digabung dengan data laboratorium ditunjukkan pada tabel 4.13

Tabel 4.10 Hasil Pengujian data anamnesa dokter

NO Nilai inisialisasi awal akurasi

1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0

46.5517%

2 Bobot(w)=2; maksimum iterasi =10; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0

45.6897%

3 Bobot(w)=6; maksimum iterasi =18; error = 0.002; iterasi awal =1; fungsi objektif awal = 0

50%

4 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0

43.1034%

5 Bobot(w)=8; maksimum iterasi =50; error = 0.000005; iterasi awal =1; fungsi objektif awal = 0

47.4138%

Tabel 4.11 Hasil Pengujian data laboratorium

NO Nilai inisialisasi awal akurasi

1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0

82.3529%

2 Bobot(w)=2; maksimum iterasi =10; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0


(56)

3 Bobot(w)=5; maksimum iterasi =40; error = 0.00600; iterasi awal =1; fungsi objektif awal = 0

78.1818%

4 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0

83.871%

5 Bobot(w)=8; maksimum iterasi =50; error = 0.000005; iterasi awal =1; fungsi objektif awal = 0

74.5455%

6 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0 ( dengan menggunakan data laboratorium yang sudah di normalisasi ).

100%

Tabel 4.12Hasil Pengujian data anamnesa dokter(PCA)

NO Nilai inisialisasi awal akurasi

1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0

38.2114%

2 Bobot(w)=2; maksimum iterasi =10; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0

39.0244%

3 Bobot(w)=6; maksimum iterasi =18; error = 0.02; iterasi awal =1; fungsi objektif awal = 0

40.6504%

4 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0


(57)

Tabel 4.13 Hasil Pengujian data anamnesa dokter(PCA) dan data laboratorium

NO Nilai inisialisasi awal akurasi

1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4; iterasi awal =1; fungsi objektif awal = 0

64.6018%

2 Bobot(w)=8; maksimum iterasi =10; error = 0.5; iterasi awal =1; fungsi objektif awal = 0

57.4468%

3 Bobot(w)=2; maksimum iterasi =10; error = 1e-10; iterasi awal =1; fungsi objektif awal = 0

66.3717%

4 Bobot(w)=2; maksimum iterasi =20; error = 0.0009; iterasi awal =1; fungsi objektif awal = 0

65.4867%

5.5 Analisis

Pada tabel 4.10, 4.11, 4.12 dan 4.13 diatas ditunjukkan beberapa hasil percobaan hepatitis A, B, dan C dengan menggunakan metode Fuzzy C-Means. Dari hasil percobaan data anamnesa dokter yang telah dilakukan dapat diketahui nilai akurasi terbaik yang didapat adalah 50%. Pada data laboratorium didapat nilai akurasi terbaik sebesar 83.871% pada data laboratorium yang belum di normalisasi dan didapat nilai akurasi 100% pada data laboratorium yang sudah dinormalisasi. Pada data anamnesa yang sudah dilakukan proses PCA hasil akurasi terbaik yang dihasilkan sebesar 40.6504%. Pada data anamnesa yang sudah dilakukan proses PCA dan digabungkan dengan data laboratorium, hasil akurasi terbaik yang didapat sebesar 66.3717%.

Pada percobaan yang telah dilakukan dapat diketahui bahwa metode Fuzzy C-Means

tidak cocok untuk menghitung data laboratorium pada pasien hepatitis karena nilai derajat keanggotaan yang dihasilkan tidak menimbulkan kekaburan atau keragu – raguan dalam mengelompokkan data. Data anamnesa dokter cocok dihitung dengan menggunakan metode


(58)

namun nilai akurasi yangrendah membuat metode Fuzzy C-Means dengan menggunakan data pasien penyakit hepatitis ini tidak dapat digunakan untuk mengambil keputusan.

Pada data anamnesa yang sudah dilakukan proses PCA nilai akurasi yang di hasilkan sangat rendah karena berkisar antara 30 – 40%, hal ini di karenakan beberapa atribut yang dapat menimbulkan kekaburan tereduksi saat terjadi proses PCA. Pada data anamnesa yang sudah dilakukan proses PCA dan telah digabung dengan data laboratorium akurasi yang dihasilkan cukup baik diatas 50%, hal ini dikarenakan data laboratorium menghasilkan data yang akurat tentang penyakit hepatitis dan ketika digabungkan dengan data anamnesa yang sudah tereduksi maka akan memunculkan beberapa nilai derajat keanggotaan yang kabur.


(1)

Tabel 4.20 Hasil Nilai derajat keangotaan akhir percobaan data anamnesa dokter

0.333337 0.333326 0.333337 0.333317 0.33337 0.333313 0.333343 0.333313 0.333345 0.333346 0.333306 0.333348 0.333319 0.333365 0.333316 0.333321 0.333362 0.333318 0.333318 0.333367 0.333315 0.333351 0.333294 0.333355 0.333335 0.333329 0.333336 0.333318 0.333368 0.333314 0.333321 0.33336 0.333319 0.333346 0.333305 0.333349 0.333349 0.333299 0.333352 0.333324 0.333355 0.333322 0.333326 0.33335 0.333324 0.333353 0.333288 0.333358 0.333315 0.333374 0.333311 0.333348 0.333301 0.333351 0.333342 0.333314 0.333344 0.333324 0.333355 0.333321 0.333338 0.333323 0.333339 0.333331 0.33334 0.33333 0.333321 0.33336 0.333318 0.333337 0.333326 0.333337 0.333346 0.333306 0.333349 0.333318 0.333367 0.333315 0.333338 0.333323 0.333339 0.333319 0.333366 0.333315 0.333319 0.333366 0.333315 0.333348 0.333301 0.333351 0.333327 0.333347 0.333326 0.333342 0.333313 0.333345 0.333336 0.333328 0.333336 0.333319 0.333365 0.333316 0.333351 0.333294 0.333355 0.333322 0.333358 0.33332 0.33332 0.333363 0.333317 0.333339 0.333321 0.33334 0.333338 0.333323 0.333339 0.333338 0.333324 0.333339

0.333341 0.333316 0.333343 0.333323 0.333356 0.333321 0.333314 0.333377 0.333309 0.333336 0.333327 0.333337 0.333322 0.333358 0.333319 0.333336 0.333328 0.333336 0.333322 0.333358 0.33332 0.333343 0.333311 0.333346 0.333353 0.33329 0.333358 0.333348 0.333301 0.333351 0.33332 0.333363 0.333317 0.333317 0.333371 0.333313 0.333349 0.333298 0.333353 0.333347 0.333304 0.33335 0.333327 0.333347 0.333326 0.333347 0.333303 0.33335 0.333338 0.333323 0.333339 0.333347 0.333303 0.33335 0.333346 0.333305 0.333349 0.333349 0.333298 0.333353 0.333343 0.333312 0.333345 0.333329 0.333342 0.333329 0.33335 0.333296 0.333354 0.33334 0.333318 0.333342 0.333345 0.333308 0.333347 0.333337 0.333326 0.333337 0.333337 0.333326 0.333337 0.333343 0.333312 0.333345 0.333324 0.333355 0.333322 0.333337 0.333325 0.333338 0.333344 0.33331 0.333346 0.333329 0.333342 0.333328 0.333344 0.333309 0.333347 0.333351 0.333295 0.333355 0.33333 0.333341 0.333329 0.333339 0.333321 0.33334 0.33333 0.333342 0.333329 0.333344 0.33331 0.333346 0.333345 0.333307 0.333348 0.333341 0.333316 0.333343

0.333323 0.333357 0.33332 0.333323 0.333356 0.333321 0.333323 0.333356 0.333321 0.33333 0.333341 0.333329 0.333323 0.333357 0.33332 0.333325 0.333352 0.333323 0.333343 0.333313 0.333345 0.333341 0.333317 0.333343 0.333321 0.333362 0.333317 0.333342 0.333313 0.333345 0.333323 0.333357 0.33332 0.333322 0.333358 0.33332 0.333318 0.333368 0.333314 0.333329 0.333343 0.333328 0.333322 0.33336 0.333319 0.333322 0.333358 0.33332 0.333322 0.333358 0.33332 0.333325 0.333353 0.333322 0.333318 0.333368 0.333314 0.333318 0.333367 0.333315 0.333316 0.333373 0.333311 0.333344 0.333309 0.333347 0.333318 0.333368 0.333314 0.333338 0.333322 0.33334 0.33333 0.333341 0.333329 0.333338 0.333323 0.333339 0.333339 0.333321 0.33334 0.333318 0.333367 0.333315 0.33332 0.333364 0.333316 0.333315 0.333374 0.333311 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0


(2)

Tabel 4.21Hasil Nilai derajat keangotaan akhir percobaan data anamnesa dokter (PCA)

0.33333 0.333332 0.333338 0.333336 0.333334 0.33333 0.333332 0.333333 0.333335 0.333321 0.333327 0.333351 0.333342 0.333337 0.333321 0.333348 0.333339 0.333314 0.333339 0.333336 0.333325 0.333315 0.333326 0.333359 0.333331 0.33333 0.333339 0.333337 0.333334 0.333329 0.333335 0.333334 0.333331 0.333327 0.333331 0.333341 0.33332 0.333327 0.333353 0.333338 0.333336 0.333326 0.33333 0.333331 0.33334 0.33332 0.333328 0.333352 0.333334 0.333333 0.333333 0.333319 0.333327 0.333354 0.333322 0.333327 0.333351 0.333336 0.333335 0.333329 0.333332 0.333333 0.333335 0.333337 0.333335 0.333327 0.333343 0.333337 0.333319 0.333335 0.333335 0.33333 0.333316 0.333326 0.333359 0.33334 0.333335 0.333325 0.333323 0.333329 0.333348 0.333341 0.333336 0.333323 0.333337 0.333334 0.333329 0.333322 0.333328 0.33335 0.333335 0.333333 0.333332 0.333334 0.333334 0.333332 0.333331 0.333333 0.333337 0.333337 0.333334 0.333329 0.333318 0.333327 0.333356 0.333338 0.333336 0.333326 0.333343 0.333337 0.33332 0.333337 0.333335 0.333328 0.333326 0.333329 0.333344 0.333334 0.333334 0.333332

0.333334 0.333333 0.333333 0.333339 0.333336 0.333325 0.33334 0.333335 0.333325 0.333329 0.333332 0.333339 0.333341 0.333337 0.333322 0.333333 0.333333 0.333334 0.333337 0.333336 0.333327 0.33333 0.333333 0.333338 0.33332 0.333327 0.333353 0.333327 0.33333 0.333342 0.333347 0.333339 0.333313 0.333334 0.333333 0.333333 0.333324 0.333329 0.333347 0.333318 0.333326 0.333356 0.333338 0.333336 0.333326 0.33332 0.333327 0.333353 0.333332 0.333333 0.333335 0.333326 0.333331 0.333343 0.333327 0.333331 0.333342 0.333325 0.333329 0.333346 0.333314 0.333325 0.333361 0.333337 0.333335 0.333328 0.333319 0.333326 0.333354 0.333335 0.333335 0.333329 0.333334 0.333334 0.333332 0.33333 0.333331 0.333339 0.33333 0.333331 0.333339 0.333334 0.333334 0.333332 0.333342 0.333338 0.333321 0.333334 0.333333 0.333333 0.333333 0.333334 0.333333 0.333335 0.333334 0.333331 0.333335 0.333334 0.333331 0.333325 0.333329 0.333346 0.333334 0.333334 0.333333 0.333328 0.33333 0.333342 0.333337 0.333335 0.333328 0.333332 0.333333 0.333335 0.333334 0.333333 0.333333 0.333334 0.333334 0.333333

0.333337 0.333335 0.333329 0.333336 0.333334 0.33333 0.333334 0.333334 0.333332 0.333334 0.333334 0.333332 0.333339 0.333337 0.333324 0.33334 0.333336 0.333324 0.333331 0.333332 0.333336 0.333333 0.333333 0.333334 0.333334 0.333334 0.333332 0.333332 0.333333 0.333334 0.333334 0.333334 0.333333 0.333338 0.333335 0.333328 0.333341 0.333336 0.333323 0.333334 0.333334 0.333332 0.333334 0.333334 0.333332 0.333337 0.333335 0.333328 0.333337 0.333335 0.333328 0.333339 0.333336 0.333325 0.333334 0.333333 0.333333 0.333341 0.333336 0.333323 0.333342 0.333336 0.333322 0.333331 0.333333 0.333336 0.333337 0.333334 0.333329 0.333336 0.333335 0.333329 0.333335 0.333334 0.333331 0.333332 0.333333 0.333335 0.333333 0.333333 0.333334 0.333342 0.333336 0.333322 0.333337 0.333334 0.333329 0.333338 0.333334 0.333329 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0


(3)

Tabel 4.22 Hasil Nilai derajat keangotaan akhir percobaan data anamnesa dokter

(PCA) + data laboratorium

0.333299 0.333335 0.333366 0.3333 0.333335 0.333365 0.333321 0.333334 0.333345 0.333311 0.333335 0.333354 0.333317 0.333334 0.333349 0.333306 0.333334 0.33336 0.333307 0.333334 0.333358 0.333309 0.333335 0.333356 0.333313 0.333334 0.333353 0.33332 0.333334 0.333346 0.333321 0.333334 0.333345 0.333322 0.333334 0.333343 0.333311 0.333335 0.333354 0.333319 0.333334 0.333347 0.33331 0.333335 0.333356 0.333317 0.333334 0.333348 0.333305 0.333334 0.33336 0.333312 0.333335 0.333353 0.333312 0.333335 0.333354 0.333321 0.333334 0.333345 0.333316 0.333334 0.33335 0.333307 0.333335 0.333358 0.333325 0.333334 0.333341 0.33332 0.333334 0.333346 0.333306 0.333335 0.333359 0.333319 0.333334 0.333347 0.3333 0.333335 0.333365 0.333317 0.333334 0.333349 0.333313 0.333334 0.333353 0.333312 0.333335 0.333353 0.333315 0.333334 0.333351 0.333329 0.333334 0.333337 0.333304 0.333335 0.333361 0.333308 0.333334 0.333357 0.333323 0.333334 0.333343 0.333322 0.333334 0.333344 0.333314 0.333334 0.333352 0.333321 0.333334 0.333345 0.333306 0.333335 0.333359 0.333316 0.333334 0.33335

0.333334 0.333334 0.333333 0.333347 0.333333 0.33332 0.333346 0.333333 0.333321 0.333339 0.333334 0.333328 0.333338 0.333333 0.333328 0.333343 0.333333 0.333324 0.333342 0.333333 0.333325 0.333339 0.333333 0.333328 0.33334 0.333334 0.333326 0.33335 0.333333 0.333317 0.333348 0.333333 0.333319 0.333334 0.333334 0.333333 0.333343 0.333334 0.333323 0.333336 0.333334 0.33333 0.33334 0.333333 0.333327 0.333344 0.333333 0.333323 0.333345 0.333333 0.333322 0.333344 0.333333 0.333323 0.333333 0.333334 0.333334 0.333351 0.333333 0.333316 0.33334 0.333334 0.333326 0.333349 0.333333 0.333319 0.333343 0.333333 0.333324 0.33335 0.333333 0.333317 0.333345 0.333333 0.333322 0.333346 0.333333 0.333321 0.333346 0.333333 0.333321 0.333337 0.333333 0.33333 0.333341 0.333333 0.333326 0.333341 0.333333 0.333325 0.333342 0.333333 0.333324 0.333351 0.333333 0.333317 0.333341 0.333333 0.333326 0.333345 0.333333 0.333322 0.333338 0.333333 0.333329 0.333345 0.333333 0.333322 0.333343 0.333333 0.333324 0.333341 0.333333 0.333326 0.333338 0.333333 0.333328 0.333337 0.333333 0.33333

0.333339 0.333333 0.333328 0.333337 0.333333 0.33333 0.333334 0.333333 0.333333 0.333341 0.333333 0.333326 0.333346 0.333332 0.333322 0.333344 0.333332 0.333324 0.33334 0.333333 0.333327 0.333338 0.333333 0.333329 0.333341 0.333333 0.333327 0.33334 0.333333 0.333327 0.333335 0.333333 0.333332 0.333347 0.333332 0.333321 0.333342 0.333332 0.333326 0.333339 0.333333 0.333328 0.333336 0.333333 0.333331 0.333349 0.333332 0.333319 0.333339 0.333333 0.333328 0.33334 0.333332 0.333328 0.333345 0.333332 0.333323 0.333342 0.333332 0.333326 0.333346 0.333332 0.333322 0.333344 0.333333 0.333323 0.333345 0.333332 0.333323 0.33334 0.333333 0.333327 0.333344 0.333332 0.333324 0.33334 0.333333 0.333328 0.333339 0.333333 0.333328 0.333344 0.333332 0.333323 0.333347 0.333332 0.333321 0.333347 0.333332 0.333321 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0


(4)

Tabel 4.23 Hasil Nilai derajat keangotaan akhir percobaan data laboratorium

0.023489 0.681399 0.295112 0.015626 0.23652 0.747853 0.581901 0.32679 0.091309 0.02197 0.629151 0.348879 0.008073 0.093374 0.898553 0.005196 0.051822 0.942982 0.02138 0.442289 0.536332 0.02231 0.517148 0.460542 0.00281 0.027292 0.969898 0.002701 0.025967 0.971333 0.017564 0.843057 0.139378 0.017308 0.239637 0.743055 0.937934 0.044994 0.017073 0.67237 0.249722 0.077908 0.010454 0.916514 0.073033 0.015219 0.901729 0.083052 0.008186 0.089796 0.902018 0.01004 0.125204 0.864757 0.015193 0.226441 0.758366 0.001555 0.993304 0.005141 0.016707 0.223303 0.759991 0.001178 0.010921 0.987901 0.937774 0.041231 0.020995 0.949022 0.034406 0.016573 0.000884 0.007987 0.991129 0.744659 0.193936 0.061405 0.018481 0.776157 0.205361 0.51668 0.352216 0.131104 0.347899 0.537057 0.115044 0.020111 0.90117 0.078718 0.120418 0.77251 0.107072 0.878655 0.079086 0.042259 0.18935 0.690256 0.120394 0.661422 0.259541 0.079037 0.854102 0.093663 0.052235 0.880763 0.08625 0.032987 0.020072 0.335807 0.644121 0.215083 0.669401 0.115516 0.00282 0.019238 0.977942 0.001541 0.992139 0.00632

0.226357 0.420511 0.353132 0.002662 0.018102 0.979236 0.00271 0.018461 0.978829 0.01654 0.195992 0.787468 0.03328 0.879431 0.087289 0.003467 0.023127 0.973406 0.002661 0.018098 0.979241 0.024119 0.18955 0.786331 0.010762 0.133539 0.855699 0.004051 0.040187 0.955762 0.01609 0.154401 0.829509 0.914177 0.056476 0.029347 0.000704 0.005337 0.993959 0.00166 0.012091 0.986249 0.003514 0.023946 0.972539 0.000542 0.004125 0.995332 0.001313 0.009436 0.989251 0.011455 0.125046 0.863499 0.875876 0.080307 0.043818 0.000836 0.00638 0.992785 0.481472 0.399843 0.118685 0.004581 0.045734 0.949686 0.000973 0.00897 0.990057 0.016576 0.263609 0.719814 0.002433 0.020039 0.977528 0.000565 0.004269 0.995166 0.017286 0.868608 0.114105 0.047643 0.269908 0.68245 0.025876 0.90733 0.066795 0.003638 0.023974 0.972387 0.055476 0.453775 0.490749 0.003535 0.023714 0.972751 0.066166 0.817239 0.116595 6.93E-05 0.000561 0.99937 0.000393 0.003012 0.996595 0.015529 0.104993 0.879478 0.908917 0.065705 0.025378 0.012076 0.085272 0.902652 0.000398 0.003493 0.996109 0.00267 0.018129 0.9792

0.003167 0.021153 0.97568 0.004786 0.030714 0.9645 0.004347 0.02813 0.967523 0.0072 0.070393 0.922407 0.002432 0.017326 0.980242 0.004347 0.02813 0.967523 0.003494 0.023146 0.973359 0.003665 0.024124 0.972211 0.003068 0.020612 0.976321 0.020761 0.129962 0.849276 0.00292 0.019944 0.977136 0.00679 0.077746 0.915464 0.012138 0.163121 0.824741 0.001011 0.007553 0.991436 0.004121 0.033641 0.962238 0.00292 0.019944 0.977136 0.003068 0.020612 0.976321 0.00101 0.007549 0.99144 0.00045 0.003457 0.996093 0.001547 0.011377 0.987076 0.001071 0.007953 0.990976 0.000842 0.006809 0.992349 0.000833 0.006741 0.992427 0.003167 0.021153 0.97568 0.004315 0.028073 0.967612 0.0072 0.070393 0.922407 0.002432 0.017326 0.980242 0.004347 0.02813 0.967523 0.000817 0.006606 0.992578 0.003665 0.024124 0.972211 Bobot (w)=2;maksimum iterasi=100;error=1e-4; iterasi awal=1; fungsi objektif awal =0


(5)

Pengelompokan Penyakit Hepatitis

dengan Menggunakan Metode Fuzzy C-Means

ABSTRAK

Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah

terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang

dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi

penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan

kematian. Analisis pengelompokkan atau

cluster analysis

adalah salah satu analisis data yang

bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan

kesamaan karakteristik.

Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakan

Fuzzy

C-Means

dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu

percobaan dengan data

anamnesa

dokter menghasilkan akurasi sebe sar50% , percobaan

yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar

83.871%, yang ketiga yaitu percobaan dengan data

anamnesa

dokter yang telah di PCA (

Principal Component Analysis

) menghasilkan akurasi sebesar 40.6504% dan yang terakhir

adalah percobaan dengan data

anamnesa

yang telah digabung dengan data laboratorium

menghasilkan akurasi sebesar 66.371%.


(6)

ABSTRACT

Health is the most important factor in a person's life. If health has disrupted the activities

of a person will be disturbed. Currently, there are many diseases that can lead to death. Liver

disease can increase the risk of death for patients and can also be triggers of other diseases

that cause death. Grouping analysis or cluster analysis is one of the data analysis that aims to

determine which group or groups from a group of data based on similar characteristics.

In the research, the process of grouping hepatitis disease using Fuzzy C-Means in the

process of testing the system four experiments conducted, first experiments with the

anamnesa the data which produce an accuracy of 50%, a second trial is an experiment with

laboratory data which produced 83.871% accuracy, the third experiment with anamnesa the

data that has been in the PCA (Principal Component Analysis) produces an accuracy of

40.6504% and the last experiment is anamnesa which has been in the pca combined with

laboratory data produced 66 371% accuracy.