dengan mempertahankan variasi dari data yang ada. Dari data gejala hasil dikelompokkan menurut gejala masing-masing seperti gejala otot, gejala
perut, gejala kulit, gejala mata dan gejala mirip flu. Gejala otot terdiri dari pegal, nyeri sendi dan normal. Gejala perut terdiri dari mual, muntah, diare,
nyeri perut sebelah kanan, kencing berwarna gelap, nafsu makan berkurang dan perut acites. Gejala kulit terdiri dari normal, kuning, lembab,
gatal, kemerahan, kering. Gejala mata terdiri dari normal dan kuning untuk gejala mata. Sedangkan gejala mirip flu terdiri dari demam, pusing, lesu,
mialgia, lelah, menggigil, dan batuk. Adapula hasil laboratorium yang meliputi SGOT, SGPT, anti HAV, HBsAg, dan anti HCV. Gejala-gejala
ini digabungkan dengan hasil laboratorium sehingga total atribut ada 31 atribut. Kemudian, 31 atribut dilakukan preprocessing dengan principal
component analysis, maka 31 atribut tersebut akan berkurang sesuai dengan parameter principal component yang akan dimasukan. Hasilfeature
baru yang akan digunakan adalah yang memiliki nilai eigenvalue tertinggi yang diurutkan dari besar ke kecil.
4.3 Hasil UjiClustering dan Akurasi
Sebelum masuk pada tahap clustering, ada tahap perhitungan jarak dengan menggunakan memilih euclidean distance untuk menghitung jarak antar
obyek.Perhitungan jarak dengan jaccard coefficient tidak menghasilkan pengelompokkan yang baik sehingga pilihan pengukuran jarak dengan euclidean
distance.Hasil pengelompokan data pasien hepatitis A, B dan C dibagi berdasarkan empat percobaan, yaitu :
1. Data laboratorium.
Data laboratorium yang akan dikelompokkan menggunakan 5 atribut, yaitu SGOT, SGPT, anti HAV, HBsAg, dan anti HCV.
2. Data gejala
Data gejala yang akan dikelompokkan berjumlah 26 atribut. Gejala mual, muntah, diare, nyeri perut sebelah kanan, kencing berwarna gelap, nafsu
makan berkurang dan perut acites untuk gejala perut. Gejala normal, kuning, lembab, gatal, kemerahan, kering untuk gejala kulit. Gejala
normal dan kuning untuk gejala mata. Sedangkan gejala demam, pusing, lesu, mialgia, lelah, menggigil, dan batuk untuk gejala mirip flu.
3. Data gejala dengan data laboratorium
Data yang dipakai merupakan gabungan antara data gejala yang sudah digabungkan dengan data laboratorium. Total atribut yang digunakan
berjumlah 31 atribut, 26 atribut dari data gejala dan 5 dari data laboratorium.
4. Data laboratorium dengan data gejala yang sudah diproses
denganprincipal component analysis Perbedaan dengan percobaan sebelumnya adalah dilengkapi dengan
principal component analysis. Principal component yang digunakan pada percobaan ini adalah 25principalcomponent. Alasan digunakan 25
principal component adalah karena menghasilkan akurasi yang lebih baik dibandingkan dengan jumlah principal component yang lain.
5. Data laboratorium dan data gejala hasil dariprincipal component
analysis. Data gejala dilakukan dengan proses principal component analysis dan
menggunakan atribut baru dari 12 principal component. Hal itu karena 12 principal component menghasilkan akurasi yang baik dibandingkan
yang lain. Setelah itu data feature baru tersebut digabungkan dengan data laboratorium sehingga total atribut data berjumlah 17.
Percobaan ini dilakukan dengan melakukan normalisasi 0-1, zscore dan tanpa normalisasi terhadap 110 data. Berikut ini percobaan dengan menggunakan
algoritmaagglomerative hierarchical clustering. 1
Percobaan tanpa normalisasi dengan hasil pada tabel 4.5, dibawah ini. Tabel 4.5 hasil tanpa normalisasi
No Feature
Pengukuran Kemiripan
Akurasi 1.
Data Laboratorium Single Linkage
41,81
2.
Data Laboratorium Average Linkage
40,90
3. Data Laboratorium
Complete Linkage 42,72
4. Data Gejala
Single Linkage 37,27
5.
Data Gejala Average Linkage
42,72
6. Data Gejala
Complete Linkage 49,09
7.
Data gejala dan Laboratorium
Single Linkage
41,81 8.
Data gejala dan Laboratorium
Average Linkage 40,90
9.
Data gejala dan Laboratorium
Complete Linkage 40,90
10. Data gejala pca +
laboratorium pca Single Linkage
40,90
11.
Data gejala pca + laboratorium pca
Average Linkage 40,90
12. Data gejala pca +
laboratorium pca Complete Linkage
42,72 13.
Data gejala pca + laboratorium
Single Linkage 41,81
14. Data gejala pca +
laboratorium Average Linkage
40,90
15. Data gejala pca +
laboratorium Complete Linkage
42,72
a Hasil akurasi yang paling besar dari data laboratorium adalah
complete linkage dengan akurasi 42,72 . Berikut ini gambar dendrogram pada 4.1 dan confusion matrix pada tabel 4.6.
a. Dendrogram dari complete linkage.
Gambar 4.1 Dendrogramcomplete linkage
b. Confusion matrix dari complete linkage.
Tabel 4.6 Confusion matrix complete linkage
� = 47
110 100 = 42,72
b Hasil akurasi yang paling besar dari data gejala adalah dengan
pengukuran kemiripan complete linkagedengan 49,09 . Berikut ini gambar 4.2 dendrogram dan confusion matrix pada tabel 4.7.
a. Dendrogram dari complete linkage.
Gambar 4.2 Dendrogram complete linkage
Cluster Hepatitis
1 2
3 A
9 6
B
20 30
30
C 11
4
c. Confusion matrix dari complete linkage.
Tabel 4.7 Confusion matrix complete linkage
� = 54
110 100 = 49,09
c Hasil akurasi yang paling besar dari data gejala dan
laboratoriumadalah single linkage dengan akurasi 41,81 . Berikut ini gambar dendrogram pada 4.3 dan confusion matrix pada tabel
4.8. a.
Dendrogram dari single linkage.
Gambar 4.3 Dendrogram single linkage
Cluster Hepatitis
1 2
3 A
16 5
9
B
6 12
15
C 18
23 6
b. Confusion matrix dari single linkage.
Tabel 4.8Confusion matrixsingle linkage
Cluster Hepatitis
1 2
3
A 27
36 30
B
10 3
C 3
1
� = 46
110 100 = 41,81
d Hasil akurasi yang paling besar dari data laboratorium dengan data
gejala yang sudah diproses dengan principal component analysisadalah complete linkage dengan akurasi 42,72 . Berikut
ini gambar dendrogram pada 4.4 dan confusion matrix pada tabel 4.9.
a. Dendrogram dari complete linkage.
Gambar 4.4 Dendrogram complete linkage b.
Confusion matrix dari complete linkage. Tabel 4.9 Confusion matrixcomplete linkage
Cluster Hepatitis
1 2
3
A
10 6
B 19
30 30
C
11 4
� = 47
110 100 = 42,72
e Hasil akurasi yang paling besar dari data laboratorium dan data
gejala hasil dariprincipal component analysisadalah complete
linkage dengan akurasi 42,72 . Berikut ini gambar dendrogram pada 4.5 dan confusion matrix pada tabel 4.10.
a. Dendrogram dari complete linkage.
Gambar 4.5 Dendrogram complete linkage b.
Confusion matrix dari complete linkage. Tabel 4.10Confusion matrixcomplete linkage
Cluster Hepatitis
1 2
3 A
10 6
B 19
30 30
C 11
4
� = 47
110 100 = 42,72
Berdasarkan grafik 4.6, dari ketiga jenis perhitungan kemiripan diatas yang memiliki akurasi paling besaradalah complete linkagedengan 42,72
walaupun hasil akurasinya tidak sampai 50 hanya 42,72 . Hal ini membuktikan bahwa data yang digunakan ini perlu dinormalisasi dahulu
sebelum dilakukan pengelompokkan.
Gambar 4.6: Grafik akurasi tanpa normalisasi
2 Percobaan dengan normalisasi [0-1] dengan hasil pada tabel 4.11, dibawah
ini. Tabel 4.11 hasil akurasi dengan normalisasi [0-1]
No Feature
Pengukuran Kemiripan
Akurasi 1.
Data Laboratorium Single Linkage
100 2.
Data Laboratorium Average Linkage
100 3.
Data Laboratorium Complete Linkage
100
41.810 37.270
41.810 40.900
41.810 40.900
42.720 40.900
40.900 40.900 42.720
49.090 40.900
42.720 42.720
.000 10.000
20.000 30.000
40.000 50.000
60.000
Grafik Akurasi
single average
complete
4. Data gejala dan
Laboratorium Single Linkage
38,18
5.
Data gejala dan Laboratorium
Average Linkage 41,81
6. Data gejala dan
Laboratorium Complete Linkage
82,72 7.
Data gejala pca + laboratorium pca
Single Linkage 38,18
8. Data gejala pca +
laboratorium pca Average Linkage
36,36
9. Data gejala pca +
laboratorium pca Complete Linkage
80,90 10.
Data gejala pca + laboratorium
Single Linkage 37,27
11. Data gejala pca +
laboratorium Average Linkage
39,09
12. Data gejala pca +
laboratorium Complete Linkage
100
a Hasil akurasi yang paling besar dari data laboratorium adalah
single linkage, average linkage dan complete linkage dengan akurasi 100 . Berikut ini gambar dendrogram pada 4.7, 4.8, dan
4.9 dan confusion matrix pada tabel 4.12. a.
Dendrogram dari single linkage, average linkage dan complete linkage.
Gambar 4.7 Dendrogram Single Linkage
Gambar 4.8 Dendrogram Average Linkage
Gambar 4.9 Dendrogram Complete Linkage
b. Confusion matrix dari single linkage, average linkage dan
complete linkage. Tabel 4.12Confusion matrix dari single linkage, average
linkage dan complete linkage.
Cluster Hepatitis
1 2
3
A
40
B 40
C
30
� = 110
110
100 = 100
b Hasil akurasi yang paling besar dari data gejala dan data
laboratorium adalah complete linkage dengan akurasi 82,72 . Berikut ini gambar dendrogram pada 4.10 dan confusion matrix
pada tabel 4.13. a.
Dendrogram dari single linkage, average linkage dan complete linkage.
Gambar 4.10 Dendrogram Complete Linkage
b. Confusion matrix dari complete linkage.
Tabel 4.13Confusion matrix complete linkage.
Cluster Hepatitis
1 2
3
A 36
1 3
B
1 29
10
C 4
26
� = 91
110 100 = 82,72
c Hasil akurasi yang paling besar dari data gejala dan data
laboratorium dengan
menggunakan principal
component analysisadalah complete linkage dengan akurasi 80,90 . Berikut
ini gambar dendrogram pada 4.11 dan confusion matrix pada tabel 4.14.
a. Dendrogram daricomplete linkage.
Gambar 4.11 Dendrogram Complete linkage
b. Confusion matrix dari complete linkage.
Tabel 4.14Confusion matrixdaricomplete linkage. Cluster
Hepatitis 1
2 3
A
35 1
4
B 1
28 11
C
4 26
Akurasi = 89
110 100 = 80,90
d Hasil akurasi yang paling besar dari data laboratorium dan data
gejala hasil dari principal component analysisadalah single linkage, average linkage dan complete linkage dengan akurasi 100 .
Berikut ini gambar dendrogram pada 4.12, 4.13, 4.14 dan confusion matrix pada tabel 4.15.
a. Dendrogram darisingle linkage, average linkage dan
complete linkage.
Gambar 4.12 Dendrogramsingle linkage
Gambar 4.13 Dendrogram average linkage
Gambar 4.14 Dendrogram complete linkage b.
Confusion matrix dari complete linkage.
Tabel 4.15Confusion matrix daricomplete linkage. Cluster
Hepatitis 1
2 3
A 40
B 40
C
30
Akurasi = 110
110 100 = 100
Berdasarkan grafik 4.15, dari ketiga jenis perhitungan kemiripan diatas, semua menghasilkan akurasi yang besar dengan 100 .
Gambar 4.15 : Hasil akurasi data dengan normalisasi [ 0-1].
3 Percobaan dengan normalisasi zscoredengan hasil pada tabel 4.16,
dibawah ini. Tabel 4.16 hasil akurasi dengan normalisasi zscore
No Feature
Pengukuran Kemiripan
Akurasi
1.
Data Laboratorium Single Linkage
100 2.
Data Laboratorium Average Linkage
45,45
3. Data Laboratorium
Complete Linkage 45,45
4.
Data gejala dan Laboratorium
Single Linkage 39,09
5. Data gejala dan
Laboratorium Average Linkage
39,09
6.
Data gejala dan Laboratorium
Complete Linkage
53,63 7.
Data gejala pca + laboratorium pca
Single Linkage 39,09
100.000
38.180 38.180
100.000 100.000
41.810 36.360
100.000 100.000
82.720 80.900 100.000
.000 20.000
40.000 60.000
80.000 100.000
120.000
Grafik Akurasi
single average
complete
8. Data gejala pca +
laboratorium pca Average Linkage
39,09
9.
Data gejala pca + laboratorium pca
Complete Linkage
40,90 10.
Data gejala pca + laboratorium
Single Linkage 36,36
11.
Data gejala pca + laboratorium
Average Linkage 37,27
12. Data gejala pca +
laboratorium Complete Linkage
69,09
a Hasil akurasi yang paling besar dari data laboratoriumadalah single
linkage dengan akurasi 100 . Berikut ini gambar dendrogram pada 4.16 dan confusion matrix pada tabel 4.17.
a. Dendrogram dari single linkage.
Gambar 4.16 Dendrogram single linkage
b. Confusion matrix dari single linkage.
Tabel 4.17 Confusion matrix darisingle linkage. Cluster
Hepatitis 1
2 3
A
40
B 40
C
30
Akurasi = 110
110 100 = 100
b Hasil akurasi yang paling besar dari data laboratorium dan gejala
adalah complete linkage dengan akurasi 53,63 . Berikut ini gambar dendrogram pada 4.17 dan confusion matrix pada tabel
4.18.
a. Dendrogram daricomplete linkage.
Gambar 4.17 Dendrogram complete linkage
b. Confusion matrix dari complete linkage.
Tabel 4.18Confusion matrix daricomplete linkage. Cluster
Hepatitis 1
2 3
A 35
17 10
B 5
23 19
C
1
Akurasi = 59
110 100 = 53,63
c Hasil akurasi yang paling besar dari data laboratorium yang ditambah
dengan data gejala yang sudah dilakukan proses principal component analysisadalah complete linkage dengan akurasi 40,90 . Berikut ini
gambar dendrogram pada 4.18 dan confusion matrix pada tabel 4.19.
a. Dendrogram daricomplete linkage.
Gambar 4.18 Dendrogram complete linkage
b. Confusion matrix dari complete linkage.
Tabel 4.19Confusion matrix daricomplete linkage. Cluster
Hepatitis 1
2 3
A 19
15 19
B
21 25
10
C 1
Akurasi = 45
110 100 = 40,90
d Hasil akurasi yang paling besar dari data laboratorium dandata
gejala hasil dariprincipal component analysisadalahcomplete linkage dengan akurasi 69,09 . Berikut ini gambar dendrogram
pada 4.19 dan confusion matrix pada tabel 4.20. a.
Dendrogram daricomplete linkage.
Gambar 4.19 Dendrogram complete linkage
b. Confusion matrix dari complete linkage.
Tabel 4.20Confusion matrix daricomplete linkage.
Cluster Hepatitis
1 2
3
A
23 37
B 8
30
C 9
3
Akurasi = 56
110 100 = 50,90
Pada gambar grafik 4.20, hasil akurasi data dengan menggunakan normalisasi zscore tersebut dapat dilihat bahwa dari ketiga jenis perhitungan
kemiripan tersebut yang paling baik adalah complete linkage. Single linkage hanya baik dalam hal mengelompokkan data laboratorium karena dapat
memberikan akurasi sebesar 100, sedangkan average linkagememberikan hasil yang buruk dibawah 50 .
Gambar 4.20Hasil akurasi data dengan normalisasi zscore
Berdasarkan tabel 4.20, data yang tidak dinormalisasi menghasilkan akurasi dibawah 50 untuk semua pengukuran jarak kemiripan. Pada percobaan
dengan data gejala saja hanya menghasilkan akurasi paling besar 49,09 . Pada data yang diberikan normalisasi [0-1], mendapatkan hasil yang lebih bagus pada
complete linkage dengan akurasi yang lebih dari 80 dibandingkan dengan single linkage dan average linkage yang hasilnya hanya dibawah 50 . Hal
100.000
39.090 39.090
36.360 45.450
39.090 39.090
37.270 45.450
53.630 40.900
69.090
.000 20.000
40.000 60.000
80.000 100.000
120.000
Grafik Akurasi Zscore
single average
complete
tersebut membuktikan bahwa dengan maupun tanpa principal component analysis dapat memberikan hasil yang baik karena menghasilkan akurasi yang lebih dari
80 dengan adanya data laboratorium. Pada data yang diberikan normalisasi zscore, akurasi yang didapat beragam. Ada hasil akurasi yang bagus dengan
pengukurancomplete linkage adapula dengansingle linkage.Single linkage menghasilkan akurasi yang baik dalam mengelompokkan data laboratorium,
sedangkan complete linkage baik dalam mengelompokkan ketiga percobaan selain data laboratorium dengan normalisasi zscore.
Percobaan menggunakan data gejala yang diberikan proses principal component analysis dan digabung dengan data laboratorium dapat menghasilkan
akurasi yang cukup baik jika dibandingkan dengan tidak menggunakan principal component analysis. Secara keseluruhan normalisasi dengan zscore tidak
menghasilkan akurasi yang baik karena hasil paling tingginya tidak lebih dari 70 . Persamaan antara normalisasi [0-1] dan zscore adalah dapat memberikan
hasil akurasi 100 pada data laboratorium. Hasil dari penelitian ini membuktikan bahwa data laboratorium sangat
berperan penting dalam menentukan seseorang terkena hepatitis atau tidak. Hal tersebut terbukti dengan adanya penanda hepatitis A, B dan C sehingga pasien
dapat dengan tepat terdiagnosa. Hasil akurasi yang didapatkan juga membuktikan bahwa data laboratorium mampu meningkatkan akurasi hasil pengelompokkan.
Hasil akurasi tersebut lebih baik jika dibandingkan dengan hasil penelitian sebelumnya yang hanya memakai data gejala dan hanya menghasilkan akurasi
sebesar 51,11
. Hal
itu karena
data gejala
masih berupa
perkiraanumumsementara dan belum pasti dapat disimpulkan bahwa pasien tersebut terkena hepatitis jenis tertentu sehingga hasil akurasinya rendah.
Tabel 4.21 Hasil pengelompokkan dengan agglomerative hierarchical clustering
Feature Pengukuran Kemiripan
Tanpa Normalisasi single
average complete
Laboratorium 41.81
40.90 42.72
Gejala 37.27
42.72 49.09
Laboratorium+gejala 41.81
40.90 40.90
LaboratoriumPCA+gejalaPCA 40.90
40.90 42.72
Laboratorium+gejalaPCA 41.81
40.90 42.72
Normalisasi [0,1] single
average complete
Laboratorium 100.00 100.00
100.00 Laboratorium+gejala
38.18 41.81
82.72 LaboratoriumPCA+gejalaPCA
38.18 36.36
80.90 Laboratorium+gejalaPCA
100.00 100.00 100.00
Normalisasi zscore single
average complete
Laboratorium 100.00
45.45 45.45
Laboratorium+gejala 39.09
39.09 53.63
LaboratoriumPCA+gejalaPCA 39.09
39.09 40.90
Laboratorium+gejalaPCA 36.36
37.27 69.09
4.4 Implementasi User Interface