xvi
DAFTAR TABEL
Gambar Keterangan
Halaman
2.1 Contoh data klasifikasi
11
2.2
Contoh data clustering 12
2.3
Contoh data 20
2.4
Contoh matrik similiarity 20
2.5 Cluster Evaluation
34
3.1 Data gejala hepatitis
40
3.2 Contoh matrik jarak dengan
Euclidean distance 43
3.3
Hasilcluster 45
3.4 Confusion matrix
46
4.1 Deskripsi data gejala hepatitis
51
4.2 Deskripsi data laboratorium
hepatitis 52
4.3
SGOT dan SGPT sebelum dan sesudah normalisasi
54
4.4 Penanda hepatitis sebelum dan
sesudah normalisasi 55
4.5
Hasil tanpa normalisasi 59
4.6
Confusion matrix complete linkage 61
4.7 Confusion matrix complete linkage
62
4.8 Confusion matrix single linkage
63
4.9 Confusion matrix complete linkage
64
4.10
Confusion matrix complete linkage 65
4.11 Hasil akurasi dengan normalisasi
[0-1] 66
4.12 Confusion matrix single linkage,
average lnkage, complete linkage 69
4.13
Confusion matrix complete linkage 70
4.14 Confusion matrix complete linkage
72
4.15 Confusion matrix complete linkage
74
4.16 Hasil akurasi dengan normalisasi
zscore 75
4.17
Confusion matrix single linkage 77
4.18 Confusion matrix complete linkage
78
4.19 Confusion matrix complete linkage
79
4.20 Confusion matrix complete linkage
80
4.21 Hasil pengelompokkan dengan
agglomerative hierarchical clustering
83
1
BAB I PENDAHULUAN
Pada bab ini menjelaskan latar belakang yang menjadi landasan dalam penelitian ini. Kemudian dari latar belakang yang ada dirumuskan permasalahan untuk
diselesaikan beserta batasan masalah yang diberikan pada penelitian ini. Pada bab ini juga menjelaskan mengenai tujuan dari penelitian dan manfaat penelitian
1.1 Latar Belakang
Kesehatan merupakan hal yang sangat penting dan perlu dijaga oleh masyarakat.
Dewasa
ini, masyarakat mudah terserang penyakit karena perubahan cuaca yang ekstrim, kondisi lingkungan yang tidak bersih, dan pola hidup yang
tidak teratur. Selain itu, penyakityang ada kinimemiliki beragam tipe. Penyakit tersebut mulai mengalami perubahan mutasi sehingga menghasilkan tipe
penyakit baru, seperti flu burung dengan tipe baru yang lebih ganas dari tipe sebelumnya. Penyakit yang sudah lama pun ada yang memiliki beragam tipe
seperti hepatitis, jantung dan diabetes. Penyakit hepatitis merupakan salah satu penyakit yang sekarang ini mulai
banyak diderita terutama hepatitis B dan C Abas, 2011. Penyakit hepatitis mempunyai tipe-tipe yang berbeda, antara lain hepatitis A, hepatitis B, hepatitis C,
hepatitis D, hepatitis E, hepatitis F dan hepatitis G. Hepatitis A merupakan tipe hepatitis yang paling ringan, sedangkan hepatitis B merupakan tipe hepatitis yang
berbahaya. Ada 15 juta penderita atau sebanyak 50 persen penderita hepatitis B
dan C di Indonesia akan menjadi penyakit hati kronik, sedangkan 10 persen penderita menjadi penyakit liver fibrosis dan kanker hati Dimyati, 2011. Istilah
hepatitisberasal dari bahasa latin yang dipakai untuk semua jenis peradangan pada hati Wening Sari, 2008:10. Penyakit inimemiliki penyebab antara lain, virus,
komplikasi dari penyakit lain, alkohol, obat-obatan atau zat kimia sampai karena penyakit autoimun Wening Sari, 2008:16. Proses pemeriksaan yang dilakukan
dokter dengan cara melakukan pemeriksaan fisik dananamnesisserta pemeriksaan laboratorium.
Pemilihan penyakit hepatitis dilakukan karena banyak orang yang tidak sadar terkena penyakit hepatitis tipe tertentu karena gejalanya yang mirip. Hal ini
dapat dijadikan studi kasus pada data mining. Data mining adalah bagian dari knowledge discovery in databasesyang merupakan keseluruhan proses konversi
data mentah menjadi pengetahuan yang bermanfaat yang terdiri dari serangkaian tahap transformasi meliputi data preprocessing dan postprocessing. Pengertian
data mining itu merujuk pada “extracting” atau “mining” pengetahuan dari
sekumpulan besar data HanKamber,2004. Data mining memiliki beberapa metode, antara lain classification, association dan clustering.
Penelitian terkait hepatitis sudah pernah dilakukan sebelumnya, yaitu “Sistem Diagnosa Penyakit Hepatitis dengan menggunakan Metode Naïve
Bayesian” oleh EstuKarunianingtyas. Penelitian tersebut menggunakan data mining untuk menentukan pasien tertentu masuk pada kelas hepatitis A, B atau C
berdasarkan gejala. Akurasi pada penelitian sebelumnya tergolong rendah karena hanya mendapatkan 51,11 persen untuk kombinasi gejala dan 44,44 persen untuk
per gejala. Penelitian ini akan memasukkan pemeriksaan laboratorium dalam proses analisis. Metode clustering digunakan karena dengan menggunakan
pendekatan yang berbeda dan menambah feature yang lebih lengkap maka dapat memberikan hasil pengelompokan yang berbeda dan lebih baik.Data gejala dan
data hasil laboratoriumhepatitis akan dikelompokkan sesuai dengan tipe hepatitisnya dengan menemukan kemiripan antar data, maka akan terbentuk
kelompok yang berisi data pasien yang terkena hepatitis A, hepatitis B dan hepatitis C.
Algoritmayang digunakandengan pendekatan hirarki yaituagglomerative hierarchical clustering. Algoritma tersebut mengelompokkan data gejala yang
mirip ke dalam cluster yang sama, sedangkan yang jauh dikelompokkan pada hirarki yang berbeda. Proses yang dikerjakan mulai dari Ncluster menjadi satu
kesatuan cluster, dimana N adalah jumlah data. Perbedaan penelitian ini dengan penelitian sebelumnya adalah metode yang digunakan. Selain itu, penelitian ini
juga menambahkan data hasil laboratorium sehingga akurasi pengelompokkannya dapat lebih tinggi.Penelitian ini penting untuk dilakukan karena dapat membantu
dalam mengelompokkan
data gejala
pasien menurut
tipe penyakit
hepatitisnyasehingga dapat memberikan penanganan yang tepat.
1.2 Rumusan Masalah