Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means ( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta ) SKRIPSI Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Jurusan Teknik Info

  Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means ( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta ) SKRIPSI Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun Oleh : RAFAELA ROSI PRIHANINGRUM (095314012) JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA

  Clustering Hepatitis Disease Using Fuzzy C-Means (Case Study HepatitisDataat Panti Rapih Hospital Yogyakarta) A Thesis

  Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree

  In Study Program of Informatics Engineering

  By Rafaela Rosi Prihaningrum 095314012

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY

HALAMAN PERSEMBAHAN

  Skripsi ini saya persembahkan untuk : Tuhan Yesus Kristus, Keluarga tercinta dan Sahabat terkasih Terima kasih untuk segalanya.

  “Be faithful in small things because it’s in them that your strength lies”

  • -Mother Theresa-

PERNYATAAN KEASLIAN KARYA

  Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidakmemuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalamkutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

  Yogyakarta, 23 Agustus 2013 Penulis Rafaela Rosi Prihaningrum

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

  Yang bertanda tangan dibawah ini, saya mahasiswa Univer sitas Sanata Dharma : Nama :Rafaela Rosi Prihaningrum NIM :095314012

  Demi pengembangan pengetahuan, saya memberikan kepada perpustakaanUniversitas Sanata Dharma karya ilmiah yang berjudul :

  

Pengelompokan Penyakit Hepatitis

dengan Menggunakan Metode Fuzzy C-Means

  Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikankepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan,mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalandata mendistribusikan secara terbatas, dan mempublikasikan di internet ataumedia lain untuk kepentingan akademis tanpa perlu meminta ijin dari sayamaupun memberikan royalti kepada saya selama tetap mencantumkan nama sayasebagai penulis.

  Demikian pernyataan ini saya buat dengan sebenarnya. Yogyakarta, 23 Agustus 2013 Yang menyatakan, Rafaela Rosi Prihaningrum

  

Pengelompokan Penyakit Hepatitis

dengan Menggunakan Metode Fuzzy C-Means

ABSTRAK

  Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan kematian. Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik.

  Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakanFuzzy C-

  

Means dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu

  percobaan dengan data anamnesa dokter menghasilkan akurasi sebe sar50% , percobaan yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar 83.871%, yang ketiga yaitu percobaan dengan data anamnesa dokter yang telah di PCA (

  

Principal Component Analysis ) menghasilkan akurasi sebesar 40.6504% dan yang terakhir

  adalah percobaan dengan data anamnesa yang telah digabung dengan data laboratorium menghasilkan akurasi sebesar 66.371%.

  ABSTRACT

  Health is the most important factor in a person's life. If health has disrupted the activities of a person will be disturbed. Currently, there are many diseases that can lead to death. Liver disease can increase the risk of death for patients and can also be triggers of other diseases that cause death. Grouping analysis or cluster analysis is one of the data analysis that aims to determine which group or groups from a group of data based on similar characteristics.

  In the research, the process of grouping hepatitis disease using Fuzzy C-Means in the process of testing the system four experiments conducted, first experiments with the anamnesa the data which produce an accuracy of 50%, a second trial is an experiment with laboratory data which produced 83.871% accuracy, the third experiment with anamnesa the data that has been in the PCA (Principal Component Analysis) produces an accuracy of 40.6504% and the last experiment is anamnesa which has been in the pca combined with laboratory data produced 66 371% accuracy.

KATA PENGANTAR

  Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas kebaikan dan kehendak-Nya saya dapat menyelesaikan tugas akhir yang berjudul

  “Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means ”. Tugas akhir ini

  ditulis sebagai salah satu syarat memperoleh gelarsarjana program studi Teknik Informatika, Fakultas Sains dan TeknologiUniversitas Sanata Dharma.

  Dalam proses penulisan tugas akhir ini , penulis mengucapkan terima kasihyang sebesar- besarnya kepada :

  1. Ibu PH.Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

  2. Ibu Ridowati Gunawan, S.Kom.,M.T., selaku Dosen Pembimbing sekaligus ketua program studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta, terimakasih atas segala bimbingan, kesabaran dan mengarahkan serta membimbing penulis dalam menyelesaikan tugas akhir ini.

  3. Ibu Sri Hartati Wijono, S.Si.,M.Kom.dan Bapak Albert Agung Hadhiatma,S.T.,M.T. selaku dosen penguji yang telah memberikan banyak kritik dansaran untuk tugas akhir saya.

  4. Bapak Iwan Binanto, M.Cs., selaku Dosen Pembimbing Akademik Teknik Informatika Tahun 2009.

  5. Seluruh staff dosen Teknik Informatika Universitas Sanata Dharma yang telah banyak memberikan bekal ilmu, arahan dan pengalaman selama sayamenempuh studi.

  6. Seluruh staff Sekretariat Teknik, yang banyak membantu saya dalam urusanadministrasi akademik terutama menjelang ujian tugas akhir.

  7. Kedua orang tua dan kakak saya, terima kasih atas semua yang telah dilakukan untukku, doa, semangat,dukungan dan cintanya sehingga saya bisa menyelesaikan studi denganlancar.

  8. Estu Karunianingtyas, terimakasih atas bantuan yang diberikan dalam penyusunan tugas akhir ini.

  10. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhirini yang tidak bisa saya sebutkan satu per satu.

  Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh darisempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat penulis harapkan.Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak.Terima kasih.

  Yogyakarta, 23 Agustus 2013 Penulis Rafaela Rosi Prihaningrum

  

Daftar Isi

HALAMAN PERSETUJUAN ..............................

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  ERROR! BOOKMARK NOT DEFINED.

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

DAFTAR GAMBAR

Gambar Keterangan Halaman

  36

  4.7 Akurasi

  37

  4.6 Fungsi Objektif

  37

  4.5 Nilai derajat keanggotaan iterasi terakhir

  36

  inisialisasi data

  4.4

  36

  4.3 Data awal

  dialog box untuk memilih data

  2.1 (Kohavi&Provost,1998) : Confusion Matrix

  4.2

  35

  4.1 Halaman Pengelompokkan Penyakit Hepatitis

  26

  3.3 Perancangan Antarmuka

  26

  3.2 Use Case Diagram

  25

  3.1 Flowchart Sistem

  10

  37

  DAFTAR TABEL Tabel Keterangan Halaman

  4.4 Communalities

  4.9 Fungsi FFCM_InitV

  34

  4.8 Component Score Coefficient Matrix

  34

  4.7 Score Faktor

  33

  4.6 Conponent Matrix

  32

  4.5 Total Variance Explained

  31

  31

  2.1 Nilai normal pemeriksaan laboratorium

  4.3 KMO and Bartlett;s Test

  29

  4.2 Deskripsi data gejala Laboratorium

  28

  4.1 Deskripsi data gejala anamnesis

  15

  2.3 Jenis Hepatitis

  14

  2.2 Kegunaan pemeriksaan labratorium

  14

  34

  4.11 Hasil Pengujian data laboratorium

  39

  4.12 Hasil Pengujian data anamnesa dokter(PCA)

  40

  4.13 Hasil Pengujian data anamnesa dokter(PCA) dan

  data laboratorium

  41

BAB I PENDAHULUAN Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta

  pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.

1.1 Latar Belakang

  Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang dapat mengakibatkan kematian.Salah satunya adalah penyakit hepatitis.Indonesia merupakan Negara ketiga dengan penderita hepatitis terbanyak setelah China dan India.Penderita hepatitis B dan C di Indonesia diperkirakan mencapai 30 juta orang.( Dimyati, Vien, 2011).

  Hepatitis merupakan salah satu penyakit yang membahayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.Fungsi utama dari hati atau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.

  Ada 5 macam virushepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virushepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D (VHD) dan virus hepatitis E (VHE). Virus-virus ini terus berkembang dan bahkan

  Penyakit hepatitisdipilih dalam penelitian ini karena banyaknya orang tidak sadar jika sudah terkena penyakit hepatitissehingga menyebabkan keterlambatan penanganan dan dapat berakibat fatal.Di harapkan dengan adanya penelitian ini dapat membantu dalam pendeteksian penyakit hepatitis agar dapat di lakukan penanganan lebih lanjut dan supaya orang mengenal status kesehatan lebih dini.

  Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan kesamaan karakteristik. Analisis ini sudah banyak digunakan untuk menyelesaikan permasalahan dan penelitian dalam beberapa disiplin ilmu, seperti bidang akademik, bidang kesehatan,bidang kewilayahan dan bidang marketing.

  Perkembangan analisis kelompok dimulai dari metode hirarki yang secara garis besar membentuk sebuah tree diagram yang biasa disebut dendogram. Sedangkan metode nonhirarki lebih dikenal dengan cara partisi, contohnya K-means, metode ini menentukan terlebih dahulu jumlah kelompok yang akan dibentuk. Perkembangan lebih lanjut dari analisa kelompok adalah dengan mempertimbangkan tingkat keanggotaan yang mencangkup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokkan yang disebut dengan fuzzy

  clustering.

  Dalam teknik fuzzy clustering, terdapat beberapa algoritma salah satunya adalah Fuzzy

  

C-Means.Fuzzy C-Meansadalah salah satu teknik pengelompokkan data yang mana

keberadaan tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat keanggotan.

  Metode Fuzzy C-Meanstermasuk metode supervised clusteringdimana jumlah pusat clusterditentukan di dalam proses clustering.

  Konsep dasar Fuzzy C-Means adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimalisasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.

  Algoritma Fuzzy C-Means sering dipakai dalam berbagai bidang baik bisnis,kesehatan atau pendidikan. Beberapa penelitian yang menggunakan algoritma Fuzzy C-Means misalnya penelitian dalam pengelompokkan wilayah kecamatan menurut partisipasi sekolah, pengembangan algoritma Fuzzy C-means untuk brain medical image analysis, dan penelitian lainnya.

  Pada penelitian ini algoritma Fuzzy C-means digunakan untuk mengelompokan orang yang terkena penyakit hepatitis A, hepatitis B, hepatitis C. Algoritma Fuzzy C-means ini di pilih karena metode ini dapat memberikan hasil yang cukup baik dalam hal meningkatkan homogenitas tiap kelompok yang dihasilkan.

  Pendeteksian penyakit hepatitis sudah pernah dilakukan oleh Estu Karunianingtyas (Karunianingtyas,2011) menggunakan metode naïve Bayesiandengan 26 atribut dari data

  

anamnesis dokter, namun tingkat keakuratan yang didapat masih rendah karena hanya

  mencapai 51.11% maka dari itu penulis ingin melanjutkan penelitian dengan menggunakan metode Fuzzy C-means.

  1.2 Rumusan Masalah

  Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan adalah :

  1. Apakah metode Fuzzy C-means dapat dipergunakan untuk mengelompokkan orang berpenyakit hepatitis dengan memberikan keakuratan yang baik ?

  1.3 Tujuan

  Tujuan yang ingin dicapai dalam penelitian ini adalah :

  1. Menganalisis, mendisain, mengimplementasikan metode Fuzzy C-Means untuk mengelompokkan penyakit hepatitis.

  2. Mengetahui tingkat keakuratan metode Fuzzy C-Means dalam mengelompokkan orang yang berpenyakit hepatitis.

  1.4 Batasan Masalah

  Batasan masalah dalam penelitian ini adalah :

  1. Data set yang di gunakan adalah data hasil pemeriksaan laboratorium rumah sakit dan data hasil anamnesa.

  2. Jenis hepatitis yang akan diteliti hanya 3 jenis yaitu hepatitis A, hepatitis B, dan hepatitis C karena jenis hepatitis D dan hepatitis E jarang ditemukan.

  1.5 Manfaat

  Manfaat yang diproleh dalam penelitian ini antara lain :

  1. Memberikan gambaran tentang langkah

  • – langkah analisis, design dan implementasi metodeFuzzy C-means dalam mengelompokkan orang yang berpenyakit hepatitis.

  2. Sebagai referensi untuk penelitian yang berhubungan dengan clustering penyakit hepatitis yang lebih lanjut lagi.

  1.6 Metodologi Penelitian

  Metodologi yang digunakan adalah sebagai berikut: 1. Melakukan pengumpulan data.

  2. Melakukan normalisasi pada data laboratorium.

  3. Mengekstrak data anamnesis dokter menggunakan metode PCA ( Principal Component Analysis).

  4. Menggabungkan data laboratorium yang sudah di normalisasi dengan data anamnesis yang sudah di ekstraks.

  5. Menghitung data dengan menggunakan metode FCM ( Fuzzy C-Means).

  6. Menghitung nilai keakuratan hasil pengelompokkan dengan menggunakan Confusion Matrix.

1.7 Sistematika Penulisan

  Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematikapenulisan sebagai berikut :

BAB I PENDAHULUAN Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya

  penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.

  BAB II LANDASAN TEORI Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan

  tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada

  bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy

  clustering dan Fuzzy C-means. Kemudian menjelaskan tentang permasalahan penyakit

  hepatitis dan yang terakhir mengenai pengujian keakuratan metode

  BAB III Desain dan Analisis SISTEM Bab ini berisi tentang desain dan analisis system meliputi contoh perhitungan, perancangan antarmuka, dan usecase. BAB IV IMPLEMENTASI SISTEM DAN HASIL Bab ini berisi implementasi program dari sistem yang akan dibuat, pembahasan penerapan algoritma Fuzzy C-Means, implemantasi antarmuka dan hasil implementasi. BAB V PENUTUP Bab ini berisi kesimpulan dari sistem yang telah dibuat, serta saran untuk pengembangan dan penyampurnaan Tugas Akhir yang dibuat.

BAB II TINJAUAN PUSTAKA Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini

  untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy C-

  

means.Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir

mengenai pengujian keakuratan metode.

2.1 Fuzzy Logic

  Teori Himpunan Fuzzyakan memberikan jawaban terhadap suatu masalah yangmengandung ketidak pastian. Aplikasi logika fuzzy untuk mendukung keputusan semakindiperlukan ketika semakin banyak kondisi yang menuntut adanya keputusan yang tidakhanya bisa dijawab dengan „Ya‟ atau „Tidak‟.Fuzzy Logic memberikan rata-rata dariperhitungan angka, yang terletak antara nilai benar mutlak dan nilai salah mutlak, yangberupa range antara 0.0 dan 1.0. Dengan Fuzzy Logic, pengguna dimungkinkan untukmenghitung derajat keanggotaan dari sebuah data. Fuzzy Logic berurusan dengan kondisiyang tidak pasti, dimana benar dan salah tidak dapat ditentukan secara mutlak.

  Konsep dari Fuzzy Logic diperkenalkan oleh Professor Lotfi A. Zadeh, di Barkley pada Universitas California (University of California) pada 1960an.Logika Fuzzy dikatakan sebagai logika baru yang lama, sebab ilmu tentang logika Fuzzy modern dan metodis baru ditemukan beberapa tahun yang lalu, padahal sebenarnya konsep tentang logika fuzzy itu sendiri sudah ada sejak lama.

  Ada beberapa alasan mengapa orang menggunakan logika Fuzzy, antara lain :

  1. Konsep logika Fuzzy mudah dimengerti. Konsep matematis yang mendasari penalaran Fuzzy sangat sederhana dan mudah dimengerti.

  2. Logika Fuzzy sangat fleksibel.

  3. Logika Fuzzy memiliki toleransi terhadap data-data yang tidak tepat.

2.2 Himpunan Fuzzy

  2.2.1 Himpunan Tegas (Crisp)

  Pada himpunan tegas, nilai keanggotaan suatu item (x) dalam suatu himpunan

  A, sering ditulis dengan µA(x), memiliki dua kemungkinan yaitu :

  a. 1 (satu), yang bearti suatu item menjadi anggota dalam suatu himpunan b. 0 (nol), yang bearti suatu item tidak menjadi anggota himpunan tersebut.

  2.1.1 Himpunanfuzzy Pada himpunan fuzzy nilai keanggotaan terletak pada rentang 0 sampai 1.

  Apabila x memiliki nilai keanggotaan fuzzy µA(x)=0 bearti x tidak menjadi anggota himpunan A. demikian pula, apabila x memiliki nilai keanggotaan µA(x)=1 bearti x menjadi anggota penuh himpunan A.

2.3 Fuzzy Clustering

  Fuzzy clustering adalah salah satu teknik menentukan cluster optimal dalam suatu ruang

  vektor yang didasarkan pada bentuk normal euclidean untuk jarak antar vektor (Kusumadewi,2004).

  Metode ini merupakan pengembangan dari metode partitioning data dengan pembobotan fuzzy. Keunggulan utama fuzzy clustering adalah dapat memberikan hasil pengelompokkan objek

  • – objek yang tersebar tidak teratur, karena jika terdapat suatu data yang penyebarannya tidak teratur maka terdapat kemungkinan suatu titik data mempunyai sifat atau karakteristik dari cluster lain sehingga diperlukan pembobotan kecenderungan titik data terhadap suatu cluster.

  Dalam teori logika fuzzy suatu nilai bisa bernilai benar atau salah secara bersama.Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot keanggotaan yang dimilikinya.Logika fuzzy memiliki derajat keanggotaan dalam rentang 0 hingga 1. keanggotaan dan derajat dari kebenaran. Oleh sebab itu sesuatu dapat dikatakan sebagian benar dan sebagian salah pada waktu yang sama (Kusumadewi. 2004).

1.4 Fuzzy C-Means

  Dalam teknik clustering data terdapat beberapa algoritma, salah satunya adalah Fuzzy

  

C-means. Fuzzy C-means merupakan pengembangan dari metode K-mean clustering karena

  pada awalnya ditentukan dulu jumlah kelompok atau cluster yang akan dibentuk. Kemudian dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut.

  Konsep dasar Fuzzy C-means, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.

  Algoritma pengelompokan Fuzzy C-means menurut Kusumadewi diberikan sebagai berikut : i. Tentukan :

  1. Matriks X berukuran n x m dengan n = jumlah data yang akan di cluster dan m= jumlah variabel (criteria)

  2. Jumlah cluter yang akan di bentuk = C 3. w> 1 adalah tingkat ke fuzzy-an dari hasil pengelompokkan. Parameter ini disebut dengan fuzzier, nilai dari w yang sering dipakai dan dianggap paling halus adalah w=2 (Klawoon dan Hopper,2001)

  4. Iterasi tertinggi

  5. Kriteria penghentian = e (nilai positif yang sangat kecil) 6.

  Iterasi awal t=1,dan ∆=1 ii. Bentuk matriks partisi awal U ik seperti rumus (2,1) sebagai berikut Matrik partisi U mempunyai komponen i= banyaknya data, k = banyaknya

  ik cluster. Matrik ini random dengan kisaran nilai 0 sampai 1.

  iii. Hitung pusat cluster dengan menggunakan rumus (2,2) : ∑

  (2,2)

  ∑ iv. Hitung fungsi objektif pada iterasi ke

  • –i dengan menggunakan rumus (2,3)

  (2,3) ∑ ∑

  d merupakan ukuran jarak untuk jarak Euclidean antara pusat cluster ke-i

  ik

  dengan data ke-k. untuk menghitung d ik digunakan rumus (2,4) :

  (2,4)

[∑ ]

  v. Perbaiki drajat keanggotaan tiap data pada tiap cluster dengan menggunakan rumus (2,5)

  (2,5) [∑ ]

  vi. Cek kondisi berhenti jika : a) Jika: (|Pi-Pi-1 |<e) atau (t>MaxIter) maka berhenti.

  b) Jika tidak: t=t+1, ulangi langkah iii. Dari algoritma tersebut dapat disimpulkan bahwa langkah pertama yang dilakukan adalah menentukan matriks derajat keanggotaan secara acak yang kemudian dijadikan acuan

  

cluster bergerak menuju lokasi yang tepat. Langkah ini dilakukan berdasarkan minimisasi

fungsi objektif.

  Output dari Fuzzy C-means merupakan matriks pusat cluster berukuran c x p dan matriks derajat keanggotaan untuk tiap

  • – tiap data berbentuk n x c. Pengelompokkan cluster dapat dilihat dari kedua output ini. Matriks pusat cluster menunjukkan pusat cluster untuk tiap
  • – tiap variabel yang diamati dalam setiap cluster-nya. Matriks derajat keanggotaan menunjukkan kecenderungan suatu data untuk masuk kedalam cluster tertentu. Semakin besar nilai derajat keanggotaannya, maka semakin besar peluang data tersebut masuk kedalamclustertertentu.

2.5 Confusion Matrix

  Validasi merupakan proses untuk menilai hasil metode cluster. Oleh karena itu, proses ini bertujuan untuk menjamin bahwa solusi cluster yang di hasilkan dalam analisis

  cluster dapat menggambarkan populasi sebenarnya.

  Confusion Matrix merupakan bagian dari uji validasi dengan metode external test.Uji

  validasi external test ini digunakan untuk mengukur sejauh mana label pada cluster dengan label pada class yang disediakan.

  Menurut Kohavi dan Provost (Kohavi dan Provost,1998) confusion Matrix berisi informasi tentang actual (fakta)dan predicted (prediksi). Confusion matrix pada gambar 2.1 berbentuk matrix 2 x 2 yang digunakan untuk mendapatkan jumlah ketepatan yang didapat dengan menggunakan algoritma tertentu

  Predicted Negative Positif

  Negative A B Actual

  Positive C D

Gambar 2.1 (Kohavi&Provost,1998) : Confusion Matrix

  Keterangan : A, jikaactual dan predicted bernilai negative.

  B, jika actual bernilai negative dan predicted bernilai positive.

  C, jika actual bernilai positive dan predicted bernilai negative D, jika actual dan predicted bernilai positive.

  Rumus yang digunakan untuk menghitung akurasi dengan confusion

  matrix,yaitu : (2,6)

2.6 Data Preparation

  Proses preparasi ini dilakukan sehingga data dapat lebih mudah untuk diolah. Terdapat 3 hal dalam data preparationyaitu :

  1. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam

  proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses data mining.

  2. Data Preprocessing: Memastikan kualitas data yang telah dipilih pada tahap dataselection, pada tahap ini masalah yang harus dihadapi adalah noisy data dan missing values. Proses pembersihan data (cleansing) dilakukan dengan melakukan

  metode-metode query sederhana untuk menemukan anomali-anomali data yang bisa saja masih terdapat pada sistem.

  3. Data Transformation: Mengelompokkan atribut-atribut atau field-yang telah terpilih menjadi 1 tabel dengan cara melakukan denormalisasi.

  2.7 PCA (Principal Component Analysis)

  Terdapat dua metode Dimensionality Reduction yang paling sering digunakan yaitu

  

Feature Selection dan Feature Extraction.Feature selection merupakan sebuah proses

  pemilihan subset feature dari feature asli, sedangkan feature extraction adalah proses mengekstrak feature baru dari feature asli melalui pemetaan fungsional.

  Salah satu metode feature extraction adalah PCA ( Principal Component Analysis ). Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan principal component

  Analisis Komponen Utama (Principal Component Analysis) atau PCA adalah suatu metodeyang melibatkan prosedur matematika yangmengubah dan mentransformasikan sejumlah besarvariabel yang berkorelasi menjadi sejumlah kecilvariabel yang tidak berkorelasi, tanpa menghilangkaninformasi penting di dalamnya

  2.8 Hepatitis

  Hepatitis telah menjadi masalah global. Saat ini diperkirakan 400 juta orang di dunia terinfeksi hepatitis B kronis, bahkan sekitar 1 juta orang meninggal setiap tahun karena penyakit ini (Wening,2008).

  Hepatitis adalah istilah umum yang berarti radang hati.“Hepa” berarti kaitan dengan hati, sementara “itis” berarti radang.Hepatitis atau peradangan hati dapat diartikan sebagai suatu proses peradangan yang menimpa sel-sel hati (Cahyono,2008). Secara objektif, adanya hepatitis dibuktikan melalui biopsi jaringan hati (pengambilan sedikit jaringan hati menggunankan jarum).Namun, secara sederhana pemeriksaan dapat digantikan dengan pemeriksaan darah.

  upakan salah satu penyakit yang membayakan jika tidak segera ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya yang tidak selalu tampak.

  Hati adalah organ yang terbesar dalam tubuh. Kurang lebih sama besar dengan buah pepaya, dan terletak di perut kanan-atas.Fungsi utama dari hatiatau liver adalah menyaring racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh darah.

  Ada 5 macam virus hepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virus hepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D(VHD), virus hepatitis E (VHE).

  Diagnosis hepatitis dapat dipastikan melalui anamnesis dengan dokter serta pemeriksaan fisik dan laboratorium. Dokter akan menanyakan hal

  • – hal yang terkait dengan penularan hepatitis karena hepatitis jenis A, B, C, dan jenis lainnya memberikan gejala yang hampir sama.

  Pemeriksaan laboratorium pada pasien yang diduga mengidap penyakit hepatitis dilakukan untuk memastikan diagnosis, mengetahui penyebab dan menilai fungsi hati.Secara garis besar, pemeriksaan laboratorium dibadakan menjadi dua yaitu, tes seralogi dan biokimia hati.

  Tes seralogi dilakukan dengan cara memeriksa kadar antigen maupun antibodi terhadap virus penyebab hepatitis. Tes ini bertujuan untuk memastikan diagnosis serta mengetahui jenis virus penyebabnya. Tes biokimia hati dilakukan dengan cara memeriksa parameter zat

  • – zat kimia maupun enzim yang dihasilkan atau diproses oleh jaringan hati. Tes biokimia hati dapat dipergunakan untuk mengetahui derajat keparahan atau kerusakan sel sehingga dapat menilai fungsi hati.

  Penderita penyakit hati secara umum termasuk hepatitis, akan diperiksa darahnya untuk beberapa jenis pemeriksaan parameter biokimia, seperti AST, ALT (alanin

  

aminotransferase), alkaline fosfatase,bilirubin, albumin, dan protombin (Wening, 2008).

Tabel 2.1 : Nilai normal pemeriksaan laboratorium

  Parameter Biokimia Hati Rentang Nilai Normal ≥ 37 U/L (Pria) | ≥ 31 U/L (wanita)

  AST / SGOT ≥ 42 U/L (Pria) | ≥ 32 U/L (wanita)

  ALT / SGPT NEGATIF : < 1,0 S/CO

  HBsAg atau < 1,0 COI (ECLIA) NEGATIF : < 1,0 COI

  Anti HAV POSITIF : >= 1,0 COI (EIA) NEGATIF : < 1,0 S/CO

  Anti HCV atau < 1,0 COI (EIA)

Tabel 2.2 : Kegunaan Pemeriksaan Laboratorium Jenis Pemeriksaan Kegunaan

  SGOT Untuk mengetahui fungsi hati , membantu mendiagnosis kelainan hati SPGT Untuk mengetahui fungsi hati, membantu mendiagnosis kelainan hati

  HBsAg Untuk mengetahui adanya infeksi virus Hepatitis B. Jika HBsAg positif maka terinfeksi virus hepatitis B. Jika HBsAg positif selama lebih dari 6 bulan, berarti pasien menderita Hepatitis B kronis dan disarankan untuk rutin memeriksakan fungsi hati (SGOT, SGPT,

  Protein Total, Albumin, AFP) paling tidak 6 bulan

  • – 1 tahun sekali Anti HAV/ IgM Untuk mengetahui adanya antibody terhadap virus Hepatitis A Anti HAV
  • – obatan, alkohol, dan lain – lain. Pada saat ini penyakit hepatitis yang sering menjadi masalah adalah hepatitis virus, terutama akibat virus hepatitis B dan C sebab kedua jenis hepatitis ini sering menimbulkan hepatitis kronis yang dapat berakhir menjadi sironishati dan kanker hati (Cahyono,2008).

  Pada fase awal hepatitis, penderita belum merasakan gejala yang spesifik. Keluhan yang dirasakan antara lain mual, muntah, tidak nafsu makan, badan terasa lemas, dan mudah lelah.

  Penularan Mulut (Peroral)

  Calici Virus

  diliputi HBsAg

  DefectiveVirus

  Picorna Virus HepadnaVirus Flavi Virus

  Tidak Ya Ya Ya Tidak Penyebab

  Carrier Kronik

  Tidak Ya Ya Ya Tidak

  Cronisitas

  Darah (Parental) Oral (Peroral)

  Darah (Parental)

  Darah (Parental)

  15

  4

  5

  40

  15

  • – 80 hari

  Masa Tunas

  D Virus Hepatitis E

  Virus Hepatitis A Virus Hepatitis B Virus Hepatitis

C

Virus Hepatitis

Tabel 2.3 : Jenis Hepatitis Sifat

  Menurut Cahyono (2008), perbedaan dari setiap jenis hepatitis dapat dilihat pada tabel 2 dibawah ini :

  2.8.2 Jenis dan Gejala Hepatitis

  Penyebab hepatitis sendiri sangat banyak,misalnya hepatitis akibat virus, bahan kimia, obat

  2.8.1 Penyebab Hepatitis

  • – 45 hari
  • – 12 minggu
  • – 20 minggu
  • – 40 hari

  Hepatitis A merupakan jenis hepatitis yang paling ringan. Hal ini disebabkan infeksi virus hepatitis A (VHA) umumnya tidak sampai menyebabkan kerusakan jaringan hati (Wening, 2008). Mereka yang terinfeksi virus ini dapat pulih sepenuhnya. Hepatitis A ini menular melalui makanan atau minuman yang telah terkontaminasi oleh virus VHA.

  Hepatitis B merupakan jenis hepatitis yang paling berbahaya.Penyakit ini lebih sering menular dibandingkan dengan jenis hepatitis lainnya. Hepatitis B menular melalui kontak darah atau cairan tubuh yang mengandung virus hepatitis B (VHB) maupun material lain yang terinfeksi, seperti jarum suntik, alat bedah, jarum akupuntur, dan alat

  • – alat yang dapat menimbulkan luka lecet milik individu yang terinfeksi .Hepatitis B kronis memberikan gejala yang lebih serius yaitu mudah lelah, cemas, tidak nafsu makan, mual, muntah dan merasa lemas.Hepatitis B kronis dapat membuat penumpukan cairan dalam rongga perut sehingga perut terlihat membuncit.Seseorang dapat mengidap virus ini tetapi tidak disertai dengan gejala klinik atau tidak tampak adanya kelainan atau gangguan kesehatan. Orang tersebut merupakan pembawa atau biasa disebut carrier.

  Carrier dapat terjadi karena individu tersebut memiliki pertahanan tubuh yang baik

  atau karena virus VHB mengalami perubahan sifat yang tidak aktif (Wening, 2008).Virus yang tidak aktif ini akan membuat pertahanan tubuh tidak dapat mengenalinya sebagai “musuh” sehingga sistem imun tidak mengadakan perlawanan, suatu saat ketika pertahanan tubuh dalam kondisi lemah maka virus akan aktif dan akan muncul gejala hepatitis. Carrier jumlahnya relatif banyak dan berpotensi menularkan.

  Hepatitis C juga menyebabkan peradangan hati yang cukup berat. Hepatitis C menular melalui darah, biasanya karena transfusi atau jarum suntik yang terkontaminasi virus hepatitis C (VHC).Pada penderita hepatitis C keluhan yang dirasakan adalah merasalemas, mual, muntah, hilang nafsu makan, demam, mual, dan nyeri ulu hati. Sebagian dari penderita mengeluh bahwa urin berwarna gelap, feses berwarna putih, serta kulit, kuku dan bola mata bagian putih berwarna kuning. Jika diraba, perut bagian atas kanan membesar karena terjadi pembesaran hati maupun terasa adanya tegangan didaerah hati.

2.8 Contoh Penggunaan Fuzzy C-Means

  Terdapat data gejala yang telah dirubah kedalam bentuk biner

  Pegal NyeriSendi Normal Linu-linu

  1

  1

  1

  1

  1

  1

  1

  1

  1

  1

  1

  1 Data tersebut akan dibagi dalam tiga kelompok. Pertama tentukan : banyaknya cluster c

  3 Pembobot w

  2 maksimum iterasi maxiter 5 error e 0.01 fungsi objektif P0

  Iterasi awal iter

  1 Kemudian bentuk matriks partisi U ik dengan i=banyaknya data dan k=banyaknya cluster. i k1 k2 k3 1 0.440986528 0.490279156 0.069 2 0.555826368 0.384816328 0.059 3 0.156206358 0.306739378 0.537 4 0.460986631 0.075301468 0.464 5 0.426768818 0.216412813 0.357 6 0.095909122 0.285092664 0.619 7 0.32906622 0.398552921 0.272 8 0.019634378 0.466853598 0.514 9 0.311402432 0.347649768 0.341

  10 0.321789912 0.537765533

  11

  25

  24

  20 21 22 23

  19

  18

  17

  16 0.883904 0.48318 0.933401 0.336406 0.756065 0.123037 0.1054 0.001321 0.710058 0.647889 0.730909 0.086154 0.889208 0.004009 0.0331 0.007138 0.94078 0.484568 0.508542 0.083062 0.409287 0.093653 0.0555 0.315987

  15

  14

  13

  12

  10

  0.14 11 0.695747687 0.031368532 0.273 12 0.047758847 0.100471348 0.852

  9

  8

  0 0.106082

  7 1 0.00532574 0.001543791 0.712869 0.280262 0.934722 0 0.161594 2 0.05747037 0.161248551 0.780585 0.000696 0.738046 0 0.118575 3 0.1668799 0.430836171 0.369851 0.032433 0.824529

  6

  5

  4

  3

  2

  1

  Langkah selanjutnya adalah menghitung pusat kluster V ij dan didapat hasil : vij

  26

0.014127 0.644569 0.355431 0.752799 0.638885 0.412827 0.059952236 0.805538

0.066529 0.57227 0.42773 0.740745 0.563643 0.650965 0.204483286 0.369964

0.125621 0.608367 0.391633 0.656525 0.33848 0.522367 0.008590829 0.35201 Lalu hitung fungsi objektif pada iterasi ke-i Pk1 0.425421188

  0.400981585 0.097718459 0.878426136 0.739858999 0.050045697 0.314062712

  0.00157452 0.449803355 0.569634953 1.205474338 0.013652833 pk2

  0.569272 0.332846 0.341193 0.024486 0.206732 0.377365

  0.31748 0.700377 0.520319 0.965603 0.004561 0.056323 pk3 p kluster

0.015653 1.010346315

  

0.011176 0.745003756

1.127077 1.565988973

0.905885 1.808796982

0.647684 1.594275499

1.617009 2.044419013

0.211604 0.843146995

  

0.82873 1.530682167

0.618954 1.589076395

0.106368 1.641606159

0.34855 1.558585765

1.911485 1.981460854

total 17.91338887

  Kemudian setelah fungsi objektif diperoleh, yang dilakukan adalah memperbaiki derajat keanggotaan dan diperoleh derajatkeanggotaan yang baru sebagai berikut :

K1 K2 K3

  0.28

  0.34

  0.30

  0.32

  0.38

  6

  0.38

  0.33

  0.30

  5

  0.33

  0.33

  0.30

  4

  0.34

  0.31

  1

  3

  0.47

  0.33

  0.19

  2

  0.42

  0.35

  8

  0.42

  5

  14.23399458

  4

  

14.261227

  3

  14.52300538

  2

  17.91338887

  1

  Iterasi Fungsi Objektif

  Setelah mengalami 6 kali iterasi maka diperoleh fungsi objektif sebagai berikut :