Confusion matrix Deskripsi data gejala hepatitis Deskripsi data laboratorium Penanda hepatitis sebelum dan Confusion matrix complete linkage Confusion matrix single linkage Confusion matrix complete linkage Hasil akurasi dengan normalisasi Confusion matri

xvi DAFTAR TABEL Gambar Keterangan Halaman

2.1 Contoh data klasifikasi

11 2.2 Contoh data clustering 12 2.3 Contoh data 20 2.4 Contoh matrik similiarity 20

2.5 Cluster Evaluation

34

3.1 Data gejala hepatitis

40

3.2 Contoh matrik jarak dengan

Euclidean distance 43 3.3 Hasilcluster 45

3.4 Confusion matrix

46

4.1 Deskripsi data gejala hepatitis

51

4.2 Deskripsi data laboratorium

hepatitis 52 4.3 SGOT dan SGPT sebelum dan sesudah normalisasi 54

4.4 Penanda hepatitis sebelum dan

sesudah normalisasi 55 4.5 Hasil tanpa normalisasi 59 4.6 Confusion matrix complete linkage 61

4.7 Confusion matrix complete linkage

62

4.8 Confusion matrix single linkage

63

4.9 Confusion matrix complete linkage

64 4.10 Confusion matrix complete linkage 65

4.11 Hasil akurasi dengan normalisasi

[0-1] 66

4.12 Confusion matrix single linkage,

average lnkage, complete linkage 69 4.13 Confusion matrix complete linkage 70

4.14 Confusion matrix complete linkage

72

4.15 Confusion matrix complete linkage

74

4.16 Hasil akurasi dengan normalisasi

zscore 75 4.17 Confusion matrix single linkage 77

4.18 Confusion matrix complete linkage

78

4.19 Confusion matrix complete linkage

79

4.20 Confusion matrix complete linkage

80

4.21 Hasil pengelompokkan dengan

agglomerative hierarchical clustering 83 1

BAB I PENDAHULUAN

Pada bab ini menjelaskan latar belakang yang menjadi landasan dalam penelitian ini. Kemudian dari latar belakang yang ada dirumuskan permasalahan untuk diselesaikan beserta batasan masalah yang diberikan pada penelitian ini. Pada bab ini juga menjelaskan mengenai tujuan dari penelitian dan manfaat penelitian

1.1 Latar Belakang

Kesehatan merupakan hal yang sangat penting dan perlu dijaga oleh masyarakat. Dewasa ini, masyarakat mudah terserang penyakit karena perubahan cuaca yang ekstrim, kondisi lingkungan yang tidak bersih, dan pola hidup yang tidak teratur. Selain itu, penyakityang ada kinimemiliki beragam tipe. Penyakit tersebut mulai mengalami perubahan mutasi sehingga menghasilkan tipe penyakit baru, seperti flu burung dengan tipe baru yang lebih ganas dari tipe sebelumnya. Penyakit yang sudah lama pun ada yang memiliki beragam tipe seperti hepatitis, jantung dan diabetes. Penyakit hepatitis merupakan salah satu penyakit yang sekarang ini mulai banyak diderita terutama hepatitis B dan C Abas, 2011. Penyakit hepatitis mempunyai tipe-tipe yang berbeda, antara lain hepatitis A, hepatitis B, hepatitis C, hepatitis D, hepatitis E, hepatitis F dan hepatitis G. Hepatitis A merupakan tipe hepatitis yang paling ringan, sedangkan hepatitis B merupakan tipe hepatitis yang berbahaya. Ada 15 juta penderita atau sebanyak 50 persen penderita hepatitis B dan C di Indonesia akan menjadi penyakit hati kronik, sedangkan 10 persen penderita menjadi penyakit liver fibrosis dan kanker hati Dimyati, 2011. Istilah hepatitisberasal dari bahasa latin yang dipakai untuk semua jenis peradangan pada hati Wening Sari, 2008:10. Penyakit inimemiliki penyebab antara lain, virus, komplikasi dari penyakit lain, alkohol, obat-obatan atau zat kimia sampai karena penyakit autoimun Wening Sari, 2008:16. Proses pemeriksaan yang dilakukan dokter dengan cara melakukan pemeriksaan fisik dananamnesisserta pemeriksaan laboratorium. Pemilihan penyakit hepatitis dilakukan karena banyak orang yang tidak sadar terkena penyakit hepatitis tipe tertentu karena gejalanya yang mirip. Hal ini dapat dijadikan studi kasus pada data mining. Data mining adalah bagian dari knowledge discovery in databasesyang merupakan keseluruhan proses konversi data mentah menjadi pengetahuan yang bermanfaat yang terdiri dari serangkaian tahap transformasi meliputi data preprocessing dan postprocessing. Pengertian data mining itu merujuk pada “extracting” atau “mining” pengetahuan dari sekumpulan besar data HanKamber,2004. Data mining memiliki beberapa metode, antara lain classification, association dan clustering. Penelitian terkait hepatitis sudah pernah dilakukan sebelumnya, yaitu “Sistem Diagnosa Penyakit Hepatitis dengan menggunakan Metode Naïve Bayesian” oleh EstuKarunianingtyas. Penelitian tersebut menggunakan data mining untuk menentukan pasien tertentu masuk pada kelas hepatitis A, B atau C berdasarkan gejala. Akurasi pada penelitian sebelumnya tergolong rendah karena hanya mendapatkan 51,11 persen untuk kombinasi gejala dan 44,44 persen untuk per gejala. Penelitian ini akan memasukkan pemeriksaan laboratorium dalam proses analisis. Metode clustering digunakan karena dengan menggunakan pendekatan yang berbeda dan menambah feature yang lebih lengkap maka dapat memberikan hasil pengelompokan yang berbeda dan lebih baik.Data gejala dan data hasil laboratoriumhepatitis akan dikelompokkan sesuai dengan tipe hepatitisnya dengan menemukan kemiripan antar data, maka akan terbentuk kelompok yang berisi data pasien yang terkena hepatitis A, hepatitis B dan hepatitis C. Algoritmayang digunakandengan pendekatan hirarki yaituagglomerative hierarchical clustering. Algoritma tersebut mengelompokkan data gejala yang mirip ke dalam cluster yang sama, sedangkan yang jauh dikelompokkan pada hirarki yang berbeda. Proses yang dikerjakan mulai dari Ncluster menjadi satu kesatuan cluster, dimana N adalah jumlah data. Perbedaan penelitian ini dengan penelitian sebelumnya adalah metode yang digunakan. Selain itu, penelitian ini juga menambahkan data hasil laboratorium sehingga akurasi pengelompokkannya dapat lebih tinggi.Penelitian ini penting untuk dilakukan karena dapat membantu dalam mengelompokkan data gejala pasien menurut tipe penyakit hepatitisnyasehingga dapat memberikan penanganan yang tepat.

1.2 Rumusan Masalah