Hasil UjiClustering dan Akurasi

dengan mempertahankan variasi dari data yang ada. Dari data gejala hasil dikelompokkan menurut gejala masing-masing seperti gejala otot, gejala perut, gejala kulit, gejala mata dan gejala mirip flu. Gejala otot terdiri dari pegal, nyeri sendi dan normal. Gejala perut terdiri dari mual, muntah, diare, nyeri perut sebelah kanan, kencing berwarna gelap, nafsu makan berkurang dan perut acites. Gejala kulit terdiri dari normal, kuning, lembab, gatal, kemerahan, kering. Gejala mata terdiri dari normal dan kuning untuk gejala mata. Sedangkan gejala mirip flu terdiri dari demam, pusing, lesu, mialgia, lelah, menggigil, dan batuk. Adapula hasil laboratorium yang meliputi SGOT, SGPT, anti HAV, HBsAg, dan anti HCV. Gejala-gejala ini digabungkan dengan hasil laboratorium sehingga total atribut ada 31 atribut. Kemudian, 31 atribut dilakukan preprocessing dengan principal component analysis, maka 31 atribut tersebut akan berkurang sesuai dengan parameter principal component yang akan dimasukan. Hasilfeature baru yang akan digunakan adalah yang memiliki nilai eigenvalue tertinggi yang diurutkan dari besar ke kecil.

4.3 Hasil UjiClustering dan Akurasi

Sebelum masuk pada tahap clustering, ada tahap perhitungan jarak dengan menggunakan memilih euclidean distance untuk menghitung jarak antar obyek.Perhitungan jarak dengan jaccard coefficient tidak menghasilkan pengelompokkan yang baik sehingga pilihan pengukuran jarak dengan euclidean distance.Hasil pengelompokan data pasien hepatitis A, B dan C dibagi berdasarkan empat percobaan, yaitu : 1. Data laboratorium. Data laboratorium yang akan dikelompokkan menggunakan 5 atribut, yaitu SGOT, SGPT, anti HAV, HBsAg, dan anti HCV. 2. Data gejala Data gejala yang akan dikelompokkan berjumlah 26 atribut. Gejala mual, muntah, diare, nyeri perut sebelah kanan, kencing berwarna gelap, nafsu makan berkurang dan perut acites untuk gejala perut. Gejala normal, kuning, lembab, gatal, kemerahan, kering untuk gejala kulit. Gejala normal dan kuning untuk gejala mata. Sedangkan gejala demam, pusing, lesu, mialgia, lelah, menggigil, dan batuk untuk gejala mirip flu. 3. Data gejala dengan data laboratorium Data yang dipakai merupakan gabungan antara data gejala yang sudah digabungkan dengan data laboratorium. Total atribut yang digunakan berjumlah 31 atribut, 26 atribut dari data gejala dan 5 dari data laboratorium. 4. Data laboratorium dengan data gejala yang sudah diproses denganprincipal component analysis Perbedaan dengan percobaan sebelumnya adalah dilengkapi dengan principal component analysis. Principal component yang digunakan pada percobaan ini adalah 25principalcomponent. Alasan digunakan 25 principal component adalah karena menghasilkan akurasi yang lebih baik dibandingkan dengan jumlah principal component yang lain. 5. Data laboratorium dan data gejala hasil dariprincipal component analysis. Data gejala dilakukan dengan proses principal component analysis dan menggunakan atribut baru dari 12 principal component. Hal itu karena 12 principal component menghasilkan akurasi yang baik dibandingkan yang lain. Setelah itu data feature baru tersebut digabungkan dengan data laboratorium sehingga total atribut data berjumlah 17. Percobaan ini dilakukan dengan melakukan normalisasi 0-1, zscore dan tanpa normalisasi terhadap 110 data. Berikut ini percobaan dengan menggunakan algoritmaagglomerative hierarchical clustering. 1 Percobaan tanpa normalisasi dengan hasil pada tabel 4.5, dibawah ini. Tabel 4.5 hasil tanpa normalisasi No Feature Pengukuran Kemiripan Akurasi 1. Data Laboratorium Single Linkage 41,81 2. Data Laboratorium Average Linkage 40,90

3. Data Laboratorium

Complete Linkage 42,72

4. Data Gejala

Single Linkage 37,27 5. Data Gejala Average Linkage 42,72

6. Data Gejala

Complete Linkage 49,09 7. Data gejala dan Laboratorium Single Linkage 41,81 8. Data gejala dan Laboratorium Average Linkage 40,90 9. Data gejala dan Laboratorium Complete Linkage 40,90 10. Data gejala pca + laboratorium pca Single Linkage 40,90 11. Data gejala pca + laboratorium pca Average Linkage 40,90 12. Data gejala pca + laboratorium pca Complete Linkage 42,72 13. Data gejala pca + laboratorium Single Linkage 41,81 14. Data gejala pca + laboratorium Average Linkage 40,90 15. Data gejala pca + laboratorium Complete Linkage 42,72 a Hasil akurasi yang paling besar dari data laboratorium adalah complete linkage dengan akurasi 42,72 . Berikut ini gambar dendrogram pada 4.1 dan confusion matrix pada tabel 4.6. a. Dendrogram dari complete linkage. Gambar 4.1 Dendrogramcomplete linkage b. Confusion matrix dari complete linkage. Tabel 4.6 Confusion matrix complete linkage � = 47 110 100 = 42,72 b Hasil akurasi yang paling besar dari data gejala adalah dengan pengukuran kemiripan complete linkagedengan 49,09 . Berikut ini gambar 4.2 dendrogram dan confusion matrix pada tabel 4.7. a. Dendrogram dari complete linkage. Gambar 4.2 Dendrogram complete linkage Cluster Hepatitis 1 2 3 A 9 6 B 20 30 30 C 11 4 c. Confusion matrix dari complete linkage. Tabel 4.7 Confusion matrix complete linkage � = 54 110 100 = 49,09 c Hasil akurasi yang paling besar dari data gejala dan laboratoriumadalah single linkage dengan akurasi 41,81 . Berikut ini gambar dendrogram pada 4.3 dan confusion matrix pada tabel 4.8. a. Dendrogram dari single linkage. Gambar 4.3 Dendrogram single linkage Cluster Hepatitis 1 2 3 A 16 5 9 B 6 12 15 C 18 23 6 b. Confusion matrix dari single linkage. Tabel 4.8Confusion matrixsingle linkage Cluster Hepatitis 1 2 3 A 27 36 30 B 10 3 C 3 1 � = 46 110 100 = 41,81 d Hasil akurasi yang paling besar dari data laboratorium dengan data gejala yang sudah diproses dengan principal component analysisadalah complete linkage dengan akurasi 42,72 . Berikut ini gambar dendrogram pada 4.4 dan confusion matrix pada tabel 4.9. a. Dendrogram dari complete linkage. Gambar 4.4 Dendrogram complete linkage b. Confusion matrix dari complete linkage. Tabel 4.9 Confusion matrixcomplete linkage Cluster Hepatitis 1 2 3 A 10 6 B 19 30 30 C 11 4 � = 47 110 100 = 42,72 e Hasil akurasi yang paling besar dari data laboratorium dan data gejala hasil dariprincipal component analysisadalah complete linkage dengan akurasi 42,72 . Berikut ini gambar dendrogram pada 4.5 dan confusion matrix pada tabel 4.10. a. Dendrogram dari complete linkage. Gambar 4.5 Dendrogram complete linkage b. Confusion matrix dari complete linkage. Tabel 4.10Confusion matrixcomplete linkage Cluster Hepatitis 1 2 3 A 10 6 B 19 30 30 C 11 4 � = 47 110 100 = 42,72 Berdasarkan grafik 4.6, dari ketiga jenis perhitungan kemiripan diatas yang memiliki akurasi paling besaradalah complete linkagedengan 42,72 walaupun hasil akurasinya tidak sampai 50 hanya 42,72 . Hal ini membuktikan bahwa data yang digunakan ini perlu dinormalisasi dahulu sebelum dilakukan pengelompokkan. Gambar 4.6: Grafik akurasi tanpa normalisasi 2 Percobaan dengan normalisasi [0-1] dengan hasil pada tabel 4.11, dibawah ini. Tabel 4.11 hasil akurasi dengan normalisasi [0-1] No Feature Pengukuran Kemiripan Akurasi 1. Data Laboratorium Single Linkage 100 2. Data Laboratorium Average Linkage 100 3. Data Laboratorium Complete Linkage 100 41.810 37.270 41.810 40.900 41.810 40.900 42.720 40.900 40.900 40.900 42.720 49.090 40.900 42.720 42.720 .000 10.000 20.000 30.000 40.000 50.000 60.000 Grafik Akurasi single average complete

4. Data gejala dan

Laboratorium Single Linkage 38,18 5. Data gejala dan Laboratorium Average Linkage 41,81

6. Data gejala dan

Laboratorium Complete Linkage 82,72 7. Data gejala pca + laboratorium pca Single Linkage 38,18 8. Data gejala pca + laboratorium pca Average Linkage 36,36 9. Data gejala pca + laboratorium pca Complete Linkage 80,90 10. Data gejala pca + laboratorium Single Linkage 37,27 11. Data gejala pca + laboratorium Average Linkage 39,09 12. Data gejala pca + laboratorium Complete Linkage 100 a Hasil akurasi yang paling besar dari data laboratorium adalah single linkage, average linkage dan complete linkage dengan akurasi 100 . Berikut ini gambar dendrogram pada 4.7, 4.8, dan 4.9 dan confusion matrix pada tabel 4.12. a. Dendrogram dari single linkage, average linkage dan complete linkage. Gambar 4.7 Dendrogram Single Linkage Gambar 4.8 Dendrogram Average Linkage Gambar 4.9 Dendrogram Complete Linkage b. Confusion matrix dari single linkage, average linkage dan complete linkage. Tabel 4.12Confusion matrix dari single linkage, average linkage dan complete linkage. Cluster Hepatitis 1 2 3 A 40 B 40 C 30 � = 110 110 100 = 100 b Hasil akurasi yang paling besar dari data gejala dan data laboratorium adalah complete linkage dengan akurasi 82,72 . Berikut ini gambar dendrogram pada 4.10 dan confusion matrix pada tabel 4.13. a. Dendrogram dari single linkage, average linkage dan complete linkage. Gambar 4.10 Dendrogram Complete Linkage b. Confusion matrix dari complete linkage. Tabel 4.13Confusion matrix complete linkage. Cluster Hepatitis 1 2 3 A 36 1 3 B 1 29 10 C 4 26 � = 91 110 100 = 82,72 c Hasil akurasi yang paling besar dari data gejala dan data laboratorium dengan menggunakan principal component analysisadalah complete linkage dengan akurasi 80,90 . Berikut ini gambar dendrogram pada 4.11 dan confusion matrix pada tabel 4.14. a. Dendrogram daricomplete linkage. Gambar 4.11 Dendrogram Complete linkage b. Confusion matrix dari complete linkage. Tabel 4.14Confusion matrixdaricomplete linkage. Cluster Hepatitis 1 2 3 A 35 1 4 B 1 28 11 C 4 26 Akurasi = 89 110 100 = 80,90 d Hasil akurasi yang paling besar dari data laboratorium dan data gejala hasil dari principal component analysisadalah single linkage, average linkage dan complete linkage dengan akurasi 100 . Berikut ini gambar dendrogram pada 4.12, 4.13, 4.14 dan confusion matrix pada tabel 4.15. a. Dendrogram darisingle linkage, average linkage dan complete linkage. Gambar 4.12 Dendrogramsingle linkage Gambar 4.13 Dendrogram average linkage Gambar 4.14 Dendrogram complete linkage b. Confusion matrix dari complete linkage. Tabel 4.15Confusion matrix daricomplete linkage. Cluster Hepatitis 1 2 3 A 40 B 40 C 30 Akurasi = 110 110 100 = 100 Berdasarkan grafik 4.15, dari ketiga jenis perhitungan kemiripan diatas, semua menghasilkan akurasi yang besar dengan 100 . Gambar 4.15 : Hasil akurasi data dengan normalisasi [ 0-1]. 3 Percobaan dengan normalisasi zscoredengan hasil pada tabel 4.16, dibawah ini. Tabel 4.16 hasil akurasi dengan normalisasi zscore No Feature Pengukuran Kemiripan Akurasi 1. Data Laboratorium Single Linkage 100 2. Data Laboratorium Average Linkage 45,45

3. Data Laboratorium

Complete Linkage 45,45 4. Data gejala dan Laboratorium Single Linkage 39,09

5. Data gejala dan

Laboratorium Average Linkage 39,09 6. Data gejala dan Laboratorium Complete Linkage 53,63 7. Data gejala pca + laboratorium pca Single Linkage 39,09 100.000 38.180 38.180 100.000 100.000 41.810 36.360 100.000 100.000 82.720 80.900 100.000 .000 20.000 40.000 60.000 80.000 100.000 120.000 Grafik Akurasi single average complete 8. Data gejala pca + laboratorium pca Average Linkage 39,09 9. Data gejala pca + laboratorium pca Complete Linkage 40,90 10. Data gejala pca + laboratorium Single Linkage 36,36 11. Data gejala pca + laboratorium Average Linkage 37,27 12. Data gejala pca + laboratorium Complete Linkage 69,09 a Hasil akurasi yang paling besar dari data laboratoriumadalah single linkage dengan akurasi 100 . Berikut ini gambar dendrogram pada 4.16 dan confusion matrix pada tabel 4.17. a. Dendrogram dari single linkage. Gambar 4.16 Dendrogram single linkage b. Confusion matrix dari single linkage. Tabel 4.17 Confusion matrix darisingle linkage. Cluster Hepatitis 1 2 3 A 40 B 40 C 30 Akurasi = 110 110 100 = 100 b Hasil akurasi yang paling besar dari data laboratorium dan gejala adalah complete linkage dengan akurasi 53,63 . Berikut ini gambar dendrogram pada 4.17 dan confusion matrix pada tabel 4.18. a. Dendrogram daricomplete linkage. Gambar 4.17 Dendrogram complete linkage b. Confusion matrix dari complete linkage. Tabel 4.18Confusion matrix daricomplete linkage. Cluster Hepatitis 1 2 3 A 35 17 10 B 5 23 19 C 1 Akurasi = 59 110 100 = 53,63 c Hasil akurasi yang paling besar dari data laboratorium yang ditambah dengan data gejala yang sudah dilakukan proses principal component analysisadalah complete linkage dengan akurasi 40,90 . Berikut ini gambar dendrogram pada 4.18 dan confusion matrix pada tabel 4.19. a. Dendrogram daricomplete linkage. Gambar 4.18 Dendrogram complete linkage b. Confusion matrix dari complete linkage. Tabel 4.19Confusion matrix daricomplete linkage. Cluster Hepatitis 1 2 3 A 19 15 19 B 21 25 10 C 1 Akurasi = 45 110 100 = 40,90 d Hasil akurasi yang paling besar dari data laboratorium dandata gejala hasil dariprincipal component analysisadalahcomplete linkage dengan akurasi 69,09 . Berikut ini gambar dendrogram pada 4.19 dan confusion matrix pada tabel 4.20. a. Dendrogram daricomplete linkage. Gambar 4.19 Dendrogram complete linkage b. Confusion matrix dari complete linkage. Tabel 4.20Confusion matrix daricomplete linkage. Cluster Hepatitis 1 2 3 A 23 37 B 8 30 C 9 3 Akurasi = 56 110 100 = 50,90 Pada gambar grafik 4.20, hasil akurasi data dengan menggunakan normalisasi zscore tersebut dapat dilihat bahwa dari ketiga jenis perhitungan kemiripan tersebut yang paling baik adalah complete linkage. Single linkage hanya baik dalam hal mengelompokkan data laboratorium karena dapat memberikan akurasi sebesar 100, sedangkan average linkagememberikan hasil yang buruk dibawah 50 . Gambar 4.20Hasil akurasi data dengan normalisasi zscore Berdasarkan tabel 4.20, data yang tidak dinormalisasi menghasilkan akurasi dibawah 50 untuk semua pengukuran jarak kemiripan. Pada percobaan dengan data gejala saja hanya menghasilkan akurasi paling besar 49,09 . Pada data yang diberikan normalisasi [0-1], mendapatkan hasil yang lebih bagus pada complete linkage dengan akurasi yang lebih dari 80 dibandingkan dengan single linkage dan average linkage yang hasilnya hanya dibawah 50 . Hal 100.000 39.090 39.090 36.360 45.450 39.090 39.090 37.270 45.450 53.630 40.900 69.090 .000 20.000 40.000 60.000 80.000 100.000 120.000 Grafik Akurasi Zscore single average complete tersebut membuktikan bahwa dengan maupun tanpa principal component analysis dapat memberikan hasil yang baik karena menghasilkan akurasi yang lebih dari 80 dengan adanya data laboratorium. Pada data yang diberikan normalisasi zscore, akurasi yang didapat beragam. Ada hasil akurasi yang bagus dengan pengukurancomplete linkage adapula dengansingle linkage.Single linkage menghasilkan akurasi yang baik dalam mengelompokkan data laboratorium, sedangkan complete linkage baik dalam mengelompokkan ketiga percobaan selain data laboratorium dengan normalisasi zscore. Percobaan menggunakan data gejala yang diberikan proses principal component analysis dan digabung dengan data laboratorium dapat menghasilkan akurasi yang cukup baik jika dibandingkan dengan tidak menggunakan principal component analysis. Secara keseluruhan normalisasi dengan zscore tidak menghasilkan akurasi yang baik karena hasil paling tingginya tidak lebih dari 70 . Persamaan antara normalisasi [0-1] dan zscore adalah dapat memberikan hasil akurasi 100 pada data laboratorium. Hasil dari penelitian ini membuktikan bahwa data laboratorium sangat berperan penting dalam menentukan seseorang terkena hepatitis atau tidak. Hal tersebut terbukti dengan adanya penanda hepatitis A, B dan C sehingga pasien dapat dengan tepat terdiagnosa. Hasil akurasi yang didapatkan juga membuktikan bahwa data laboratorium mampu meningkatkan akurasi hasil pengelompokkan. Hasil akurasi tersebut lebih baik jika dibandingkan dengan hasil penelitian sebelumnya yang hanya memakai data gejala dan hanya menghasilkan akurasi sebesar 51,11 . Hal itu karena data gejala masih berupa perkiraanumumsementara dan belum pasti dapat disimpulkan bahwa pasien tersebut terkena hepatitis jenis tertentu sehingga hasil akurasinya rendah. Tabel 4.21 Hasil pengelompokkan dengan agglomerative hierarchical clustering Feature Pengukuran Kemiripan Tanpa Normalisasi single average complete Laboratorium 41.81 40.90 42.72 Gejala 37.27 42.72 49.09 Laboratorium+gejala 41.81 40.90 40.90 LaboratoriumPCA+gejalaPCA 40.90 40.90 42.72 Laboratorium+gejalaPCA 41.81 40.90 42.72 Normalisasi [0,1] single average complete Laboratorium 100.00 100.00 100.00 Laboratorium+gejala 38.18 41.81 82.72 LaboratoriumPCA+gejalaPCA 38.18 36.36 80.90 Laboratorium+gejalaPCA 100.00 100.00 100.00 Normalisasi zscore single average complete Laboratorium 100.00 45.45 45.45 Laboratorium+gejala 39.09 39.09 53.63 LaboratoriumPCA+gejalaPCA 39.09 39.09 40.90 Laboratorium+gejalaPCA 36.36 37.27 69.09

4.4 Implementasi User Interface