Optimasi Fuzzy Decision Tree Menggunakan Algoritme Genetika pada Data Diabetes

(1)

ABSTRAK

WELLYA SEPTIN. Optimasi Fuzzy Decision Tree Menggunakan Algoritme Genetika pada Data Diabetes. Dibimbing oleh IMAS S. SITANGGANG dan IRMAN HERMADI.

Hasil survey Organisasi Kesehatan Dunia (WHO) pada tahun 2004, menyatakan Indonesia menempati urutan keempat terbesar dalam jumlah penderita kencing manis (diabetes melitus) di dunia setelah India, Cina, dan Amerika Serikat. Data diabetes terkait hasil pemeriksaan laboratorium dari pasien di rumah sakit dibiarkan menggunung tanpa digunakan secara maksimal. Oleh karena itu, penelitian dengan mengaplikasikan teknik data mining pada data diabetes perlu dilakukan agar diperoleh informasi mengenai karakteristik pasien yang dinyatakan positif diabetes atau negatif diabetes. Salah satu output dari teknik data mining adalah pohon keputusan (decision tree) yang dapat digunakan untuk memprediksi apakah seseorang menderita diabetes atau tidak. Penelitian ini menggunakan salah satu teknik data mining yaitu teknik klasifikasi dengan menggunakan metode fuzzy decision tree. Algoritme decision tree yang digunakan yaitu fuzzy ID3 (Iterative Dichotomiser 3). Algoritme genetika digunakan sebagai teknik optimasi terhadap fuzzy decision tree (FDT) sehingga diperoleh genetically optimized fuzzy decision tree (G-DT). Bagian FDT yang dioptimasi dengan algoritme genetika adalah fungsi keanggotaan fuzzy.

Hasil penelitian ini berupa model (classifier), fungsi keanggotaan fuzzy yang telah dioptimasi, dan nilai akurasi G-DT yang lebih baik daripada nilai akurasi FDT. Model yang dihasilkan dari proses training G-DT mengandung 27 aturan yang terdiri atas 25 aturan mengandung kelas target negatif diabetes dan dua aturan mengandung kelas target positif diabetes. Model yang dihasilkan dari proses training FDT mengandung 30 aturan yang terdiri atas 29 aturan mengandung kelas target negatif diabetes dan satu aturan mengandung kelas target positif diabetes. Fungsi keanggotaan yang digunakan dalam pembentukan G-DT berbeda dengan FDT. Pada FDT, fungsi keanggotaan fuzzy telah ditentukan dari awal. Sedangkan pada G-DT, fungsi keanggotaan diperoleh selama pembelajaran. Rata-rata nilai akurasi G-DT meningkat sebesar 4.83% dari rata-rata nilai akurasi FDT. Rata-rata akurasi FDT adalah sebesar 90.69%, sedangkan rata-rata akurasi G-DT adalah sebesar 95.52%.

Kata kunci: klasifikasi, decision tree, optimasi fuzzy decision tree, algoritme genetika, genetically optimized fuzzy decision tree

(2)

OPTIMASI FUZZY DECISION TREE MENGGUNAKAN ALGORITME GENETIKA

PADA DATA DIABETES

WELLYA SEPTIN

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR 2008

(3)

DAFTAR PUSTAKA

Cox E. 2005. Fuzzy Modeling and Genetic Algorithms for Data Mining and Exploration. USA: Morgan Kaufman Publishers.

Fu L. 1994. Neural Network In Computer Intelligence. Singapura: McGraw Hill. Han J, Kamber M. 2006. Data Mining:

Concepts and Techniques. USA: Morgan Kaufman Publishers.

Jang JSR, Sun CT, Mizutani Eiji. 1997. Neuro-Fuzzy and Soft Computing. London: Prentice-Hall International, Inc.

Kantardzic M. 2003. Data Mining: Concepts, Models, Methods, and Algorithms. Wiley-Interscience.

Lawrence D. 1991. Handbook of Genetic Algorithms. New york: Van Nostrand Reinhold.

Liang G. 2005. A Comparative Study of Three Decision Tree Algorithms: ID3, Fuzzy ID3 and Probabilistic Fuzzy ID3. Rotterdam: Informatic & Ecosnomics Eramus University Rotterdam.

Marsala C. 1998. Application of Fuzzy Rule Induction to Data Mining. France: University Pierre et Marie Curie. Michalewicz Z. 1996. Genetic Algorithms +

Data Structure = Evolution Programs. New York: Springer-Verlag Berlin Heidelberg.

Pedryez W, Sosnowski ZA. 2005. Genetically Optimized Fuzzy Decision Trees. IEEE Transactions on Systems, Man, and Cybernetics vol.35 no.3.

Romansyah F. 2007. Penerapan Teknik Klasifikasi dengan Metode Fuzzy Decision Tree dengan Algoritme ID3 pada Data Diabetes [Skripsi]. Bogor: Departemen Ilmu Komputer FMIPA IPB.

(4)

Lingkup Pengembangan Sistem

Perangkat keras yang digunakan berupa notebook dengan spesifikasi:

• processor: Intel Core 2 Duo 1.66 GHz,

• memori: 1,512 GB, dan

• harddisk: 80GB.

Perangkat lunak yang digunakan yaitu:

• sistem operasi: Window XP,

• Matlab 7.0.1 sebagai bahasa pemrograman, dan

• Microsoft Excel 2003 sebagai tempat penyimpanan data.

HASIL DAN PEMBAHASAN

Pemilihan Training Set dan Testing Set

Pembagian data menggunakan 10-fold cross validation menghasilkan sepuluh training sets dan 10 testing sets. Untuk percobaan mencari parameter algoritme genetika yang optimal digunakan hanya satu training set saja. Pemilihan training set ini berdasarkan hasil eksekusi program G-DT dengan menggunakan sepuluh training sets dan sepuluh testing sets serta persebaran data pada masing-masing training set dan testing set. Parameter algoritme genetika yang digunakan dalam pemilihan training set yaitu: fitness threshold = 0.05, ukuran populasi = 10, maksimum generasi = 50, tingkat rekombinasi = 50%, dan tingkat mutasi = 1%. Hasil eksekusi program G-DT menggunakan sepuluh training sets dan sepuluh testing sets dapat dilihat pada Tabel 3.

Tabel 3 Hasil eksekusi program G-DT menggunakan 10 training sets dan 10 testing sets

Dari total data sebanyak 290 record, terdapat data negatif diabetes sebanyak 273

record dan data positif diabetes sebanyak 17 record. Dengan 10-fold cross validation, data sebanyak 290 record dibagi menjadi training set dan testing set. Training set berjumlah 261 record dan testing set berjumlah 29 record. Persebaran data negatif dan positif diabetes pada setiap training set dan testing set dapat dilihat pada Tabel 4.

Tabel 4 Persebaran data negatif dan positif diabetes pada setiap training set dan testing set

Dari hasil eksekusi program G-DT menggunakan sepuluh training sets dan sepuluh testing sets terlihat bahwa hanya training set 2 dan 3 yang belum memperoleh akurasi 100%. Dengan menggunakan parameter algoritme genetika yang optimal diharapkan akurasi pada training set 2 dan 3 meningkat. Sehingga, training set 2 dan 3 menjadi calon training set yang akan digunakan dalam percobaan mencari parameter algoritme genetika yang optimal.

Untuk menentukan satu training set yang akan digunakan dalam percobaan, persebaran data pada training set dan testing set 2 dan 3 dilihat. Pada Tabel 4, dapat dilihat bahwa 13 record data positif diabetes dari total 17 record positif diabetes ada pada testing set 2. Hanya 4 record data positif diabetes yang ada pada training set 2. Sedangkan pada training set 3 terdapat 13 record data positif diabetes dan pada testing set 3 terdapat 4 record data positif diabetes. Hal ini menunjukkan bahwa persebaran data pada training set dan testing set 3 lebih baik daripada training set dan testing set 2. Sehingga, percobaan mencari parameter algoritme genetika yang optimal dilakukan dengan menggunakan training set dan testing set 3.

Set Akurasi Jumlah Aturan

Waktu Total (detik)

Jumlah Iterasi

1 100.00% 20 14,906 1

2 58.62% 17 209,562 50

3 89.66% 25 320,938 50

4 100.00% 20 15,031 1

5 100.00% 21 15,109 1

6 100.00% 21 14,937 1

7 100.00% 22 14,578 1

8 100.00% 19 14,985 1

9 100.00% 22 14,938 1

10 100.00% 21 15,344 1

Rataan 94.83% 20.8

Training Set Testing Set Set

Negatif Positif Negatif Positif

1 244 17 29 0

2 257 4 16 13

3 248 13 25 4

4 244 17 29 0

5 244 17 29 0

6 244 17 29 0

7 244 17 29 0

8 244 17 29 0

9 244 17 29 0

10 244 17 29 0

(5)

Percobaan untuk Mencari Parameter Algoritme Genetika yang Optimal

Setelah memilih training set yang akan digunakan untuk percobaan, percobaan untuk mencari parameter algoritme genetika yang optimal dapat dilakukan. Pertama, percobaan dengan ukuran populasi sebesar 10 dilakukan. Selanjutnya, percobaan dengan ukuran populasi sebesar 30 dan 50 dilakukan. Parameter algoritme genetika yang optimal ditentukan berdasarkan hasil percobaan.

• Ukuran populasi sebesar 10

Pada percobaan dengan ukuran populasi sebesar 10, dilakukan dengan variasi tingkat rekombinasi (50%, 60%, 70%, 80%, 90%, dan 100%), tingkat mutasi (1%, 5%, dan 10%), dan maksimum generasi (50, 100, 150, 200, 250). Total percobaan yang dilakukan adalah 90 percobaan. Hasil dari 90 percobaan ini dapat dilihat pada Lampiran 1. Alur pemilihan parameter yang optimal bagi ukuran populasi sebesar 10 dapat dilihat pada Gambar 10.

Gambar 10 Alur pemilihan parameter yang optimal bagi ukuran populasi sebesar 10.

Dari 90 percobaan, diperoleh 58 kombinasi parameter dengan nilai fitness yang terbaik sebesar 0.0690. Dari 58 kombinasi parameter, hanya 12 kombinasi parameter yang memiliki waktu eksekusi kurang dari 360 detik. Dua belas kombinasi parameter tersebut adalah nilai yang dicetak tebal pada Lampiran 1.

Dua belas kombinasi parameter tersebut merupakan parameter algoritme genetika yang baik. Dua belas kombinasi parameter ini dapat digunakan sebagai parameter algoritme genetika untuk training G-DT. Untuk mencari parameter algoritme genetika yang paling optimal diantara 12 kombinasi parameter tersebut, dilakukan percobaan sebanyak 10 kali untuk masing-masing 12 kombinasi parameter. Total percobaan yang dilakukan

adalah 120 percobaan. Hasil percobaan untuk 12 kombinasi parameter dapat dilihat pada Lampiran 2.

Dari 12 kombinasi parameter dan masing-masing dilakukan 10 iterasi, hanya tiga kombinasi parameter yang menghasilkan nilai fitness relatif lebih stabil dengan menghasilkan nilai fitness sebesar 0.0690 sebanyak sembilan buah dan nilai fitness sebesar 0.1034 sebanyak satu buah. Tiga kombinasi parameter tersebut yaitu:

a. tingkat rekombinasi = 80%, tingkat mutasi = 10%, dan maksimum generasi = 50, b. tingkat rekombinasi = 90%, tingkat mutasi

= 10%, dan maksimum generasi = 50, dan c. tingkat rekombinasi = 100%, tingkat

mutasi = 1%, dan maksimum generasi = 50.

Tiga kombinasi parameter di atas merupakan kombinasi parameter yang terbaik bagi training set dan testing set 3. Untuk memperoleh parameter yang lebih optimal lagi, dilakukan percobaan untuk masing-masing tiga kombinasi parameter itu dengan menggunakan training set dan testing set 2. Training set 2 digunakan karena training set 2 merupakan training set yang memiliki akurasi masih di bawah 100% selain training set 3. Percobaan untuk tiga kombinasi parameter ini juga dilakukan masing-masing 10 kali percobaan. Total percobaan yang dilakukan adalah 30 percobaan. Hasil dari 30 kali percobaan ini dapat dilihat pada Lampiran 3.

Dari 30 percobaan, kombinasi parameter yang terdiri dari tingkat rekombinasi sebesar 90%, tingkat mutasi sebesar 10%, dan maksimum generasi sebesar 50 generasi merupakan kombinasi parameter yang terbaik bagi training set dan testing set 2. Parameter ini menghasilkan nilai fitness yang stabil dengan menghasilkan nilai fitness sebesar 0.3793 pada 10 percobaan yang dilakukan. Sehingga, parameter algoritme yang optimal dengan ukuran populasi sebesar 10 yaitu: a tingkat rekombinasi: 90%,

b tingkat mutasi: 10%, dan c maksimum generasi: 50.

• Ukuran populasi sebesar 30 dan 50 Pada percobaan dengan ukuran populasi sebesar 30 dan 50, juga dilakukan dengan variasi tingkat rekombinasi (50%, 60%, 70%, 80%, 90%, dan 100%), tingkat mutasi (1%, 5%, dan 10%), dan maksimum generasi (50, 100, 150, 200, 250). Total percobaan untuk

58 kombinasi parameter dengan nilai fitness terbaik

12 kombinasi parameter dengan nilai fitness terbaik dan waktu eksekusi < 360 detik

3 kombinasi parameter yang terbaik untuk training set 3 (pengulangan 10 kali)

1 kombinasi parameter yang terbaik untuk training set 3 dan 2 Æ parameter AG

(6)

masing-masing ukuran populasi adalah 90 percobaan.

Waktu eksekusi dengan ukuran populasi sebesar 30 dan 50 relatif lama (lebih dari 900 detik), sehingga percobaan dengan ukuran populasi sebesar 30 dan 50 ini tidak dilakukan untuk semua kombinasi parameter. Percobaan dilakukan hanya dengan kombinasi parameter yang optimal pada ukuran populasi sebesar 10 yaitu kombinasi parameter yang terdiri dari tingkat rekombinasi sebesar 90% dan tingkat mutasi sebesar 10%. Percobaan dilakukan dengan variasi nilai maksimum generasi (50, 100, 150, 200, dan 250). Total percobaan yang dilakukan adalah 10 percobaan. Hasil percobaan ini dapat dilihat pada Lampiran 4.

Dari hasil percobaan tersebut, besar nilai fitness dengan maksimum generasi sebesar 250 sama dengan nilai fitness dengan maksimum generasi sebesar 50 yaitu sebesar 0.0690. Sehingga, maksimum generasi sebesar 50 merupakan maksimum generasi yang baik bagi ukuran populasi sebesar 30 dan 50.

• Penentuan parameter yang optimal Total percobaan yang dilakukan adalah 250 percobaan. Dari 250 percobaan, dapat disimpulkan hasil percobaan ke dalam dua kelompok yaitu:

a percobaan dengan variasi tingkat rekombinasi dan tingkat mutasi, dan

b percobaan dengan variasi ukuran populasi dan maksimum generasi.

Hasil percobaan dengan variasi tingkat rekombinasi dan tingkat mutasi dapat dilihat pada Tabel 5. Percobaan ini dilakukan pada ukuran populasi sebesar 10 dan maksimum generasi sebesar 50 generasi.

Tabel 5 Hasil percobaan dengan variasi tingkat rekombinasi dan tingkat mutasi

Tabel 5 Lanjutan

Dari Tabel 5, ada 12 kombinasi parameter yang baik yaitu kombinasi parameter yang memiliki nilai fitness sebesar 0.0690. Dari 12 kombinasi parameter ini, telah disimpulkan parameter yang optimal yaitu:

a tingkat rekombinasi: 90%, dan b tingkat mutasi: 10%.

Hasil percobaan dengan variasi ukuran populasi dan maksimum generasi dapat dilihat pada Tabel 6. Percobaan ini dilakukan dengan tingkat rekombinasi sebesar 90% dan tingkat mutasi sebesar 10%.

Tabel 6 Hasil percobaan dengan variasi ukuran populasi dan maksimum generasi

Dari Tabel 6, besar nilai fitness terbaik pada ukuran populasi sebesar 30 dan 50 tidak lebih rendah daripada nilai fitness terbaik pada ukuran populasi sebesar 10. Waktu eksekusi percobaan dengan ukuran populasi sebesar 30 dan 50 lebih lama daripada ukuran populasi sebesar 10. Pada ukuran populasi sebesar 10, 30, dan 50, besar nilai fitness terbaik pada maksimum generasi sebesar 250 tidak lebih Tingkat

Rekombinasi

Tingkat

Mutasi Akurasi

Fitness Terbaik 1% 89.66% 0.1034 5% 93.10% 0.0690 50%

10% 89.66% 0.1034 1% 93.10% 0.0690 5% 93.10% 0.0690 60%

10% 93.10% 0.0690 1% 89.66% 0.1034 5% 93.10% 0.0690 70%

10% 86.21% 0.1379 1% 93.10% 0.0690 5% 89.66% 0.1034 80%

10% 93.10% 0.0690

Tingkat Rekombinasi

Tingkat

Mutasi Akurasi

Fitness Terbaik 1% 93.10% 0.0690 5% 93.10% 0.0690 90%

10% 93.10% 0.0690 1% 93.10% 0.0690 5% 93.10% 0.0690 100%

10% 89.66% 0.1034

Ukuran Popu

lasi

Maks. Gene

Rasi

Akurasi Fitness Terbaik

Waktu (detik) 50 93.10% 0.0690 331,344 100 93.10% 0.0690 621,937 150 93.10% 0.0690 989,718 200 93.10% 0.0690 1168,190 10

250 93.10% 0.0690 1453,800 50 93.10% 0.0690 1014,110 100 93.10% 0.0690 2406,530 150 93.10% 0.0690 3140,270 200 93.10% 0.0690 4502,950 30

250 93.10% 0.0690 5732,880 50 93.10% 0.0690 1809,130 100 93.10% 0.0690 3866,530 150 93.10% 0.0690 5677,980 200 93.10% 0.0690 7172,590 50

(7)

rendah daripada nilai fitness terbaik pada maksimum generasi sebesar 50. Waktu eksekusi percobaan dengan maksimum generasi sebesar 250 lebih lama daripada maksimum generasi sebesar 50.

Peningkatan ukuran populasi dan maksimum generasi tidak menghasilkan nilai fitness yang lebih rendah dari 0.0690 dan akurasi lebih tinggi dari 93.10%. Berdasarkan hasil percobaan tersebut ditetapkan bahwa ukuran populasi yang baik adalah 10 dan maksimum generasi yang baik adalah 50 generasi.

Setelah menganalisis hasil percobaan, diperoleh parameter algoritme genetika yang optimal bagi kasus ini. Parameter algoritme genetika yang optimal bagi kasus ini yaitu: a tingkat rekombinasi: 90%,

b tingkat mutasi: 10%, c ukuran populasi: 10, dan d maksimum generasi: 50.

Training G-DT

Setelah parameter algoritme genetika yang optimal diperoleh, proses training G-DT dapat dilakukan. Proses training ini menggunakan sepuluh training sets yang sebelumnya telah dibagi dengan metode 10-fold cross validation. Untuk setiap training set dilakukan 10 kali iterasi. Satu hasil training yang mewakili 10 hasil training dari suatu training set ditentukan dengan kriteria berikut yang diurutkan berdasarkan prioritas:

1 nilai akurasi yang paling tinggi,

2 jumlah aturan yang dihasil yang paling sering muncul (modus), dan

3 waktu eksekusi yang paling cepat.

Hasil training untuk training set 2 dapat dilihat pada Tabel 7. Hasil training set 3 dapat dilihat pada Tabel 8.

Tabel 7 Hasil training untuk training set 2

Tabel 8 Hasil training untuk training set 3

Hasil training dari training set 2 yaitu dari 10 iterasi yang dilakukan diperoleh nilai akurasi yang sama yaitu 62.07%. Jumlah aturan yang paling sering dihasilkan adalah 17 aturan dan 18 aturan. Empat iterasi dari 10 iterasi yang dilakukan menghasilkan aturan yang berjumlah 17 aturan. Empat iterasi menghasilkan aturan yang berjumlah 18 aturan. Tujuh belas dan delapan belas aturan yang dihasilkan ini masing-masing memiliki 1 aturan mengandung kelas target positif diabetes. Dari delapan iterasi ini, yang memiliki waktu eksekusi paling cepat adalah iterasi ke-5 yaitu 200,547 detik. Sehingga, hasil training yang mewakili hasil training dari training set 2 adalah hasil training pada iterasi ke-5.

Hasil training dari training set 3 yaitu dari 10 iterasi yang dilakukan diperoleh nilai akurasi sebesar 93.10% sebanyak 9 iterasi dan nilai akurasi sebesar 89.66% sebanyak 1 iterasi. Jumlah aturan yang paling sering dihasilkan adalah 21 aturan. Tiga iterasi dari 10 iterasi yang dilakukan menghasilkan aturan yang berjumlah 21 aturan. Dua puluh satu aturan yang dihasilkan ini terdiri dari 20 aturan mengandung kelas target negatif diabetes dan 1 aturan mengandung kelas target positif diabetes. Dari tiga iterasi yang menghasilkan 21 aturan ini, yang memiliki waktu eksekusi paling cepat adalah iterasi ke-9 yaitu 264,85ke-9detik. Sehingga, hasil training yang mewakili hasil training dari training set 3 adalah hasil training pada iterasi ke-9.

Hasil training set 1, training set 4, training set 5, training set 6, training set 7, training set 8, training set 9, dan training set 10 dapat dilihat pada Lampiran 5. Pemilihan satu hasil training untuk mewakili 10 hasil training suatu training set ini juga dilakukan Set Akurasi Waktu

(detik)

Jumlah Aturan 1 62.07% 231,344 18 (17 negatif, 1 positif) 2 62.07% 216,141 17 (16 negatif, 1 positif) 3 62.07% 220,281 17 (16 negatif, 1 positif) 4 62.07% 199,360 16 (15 negatif, 1 positif) 5 62.07% 200,547 17 (16 negatif, 1 positif) 6 62.07% 213,359 18 (17 negatif, 1 positif) 7 62.07% 227,078 18 (17 negatif, 1 positif) 8 62.07% 204,969 17 (16 negatif, 1 positif) 9 62.07% 240,250 19 (18 negatif, 1 positif) 10 62.07% 223,735 18 (17 negatif, 1 positif)

Set Akurasi Waktu (detik)

Jumlah Aturan 1 93.10% 324,594 28 (26 negatif, 2 positif) 2 93.10% 328,766 26 (25 negatif, 1 positif) 3 93.10% 310,985 21 (20 negatif, 1 positif) 4 93.10% 321,031 25 (23 negatif, 2 positif) 5 89.66% 302,500 20 (19 negatif, 1 positif) 6 93.10% 306,156 22 (20 negatif, 2 positif) 7 93.10% 317,187 25 (24 negatif, 1 positif) 8 93.10% 306,375 21 (20 negatif, 1 positif) 9 93.10% 264,859 21 (20 negatif, 1 positif) 10 93.10% 319,531 24 (23 negatif, 1 positif)

(8)

untuk 8 training sets ini. Record yang dicetak tebal pada Lampiran 5 merupakan wakil hasil training dari training set tersebut. Hasil training untuk setiap training set dapat dilihat pada Tabel 9.

Tabel 9 Hasil training G-DT untuk setiap training set

Dari Tabel 9, terlihat bahwa nilai akurasi pada training set 2 dan training set 3 mengalami peningkatan dengan menggunakan parameter algoritme genetika yang optimal. Hasil dari training set menggunakan parameter algoritme genetika yang tidak optimal dapat dilihat pada Tabel 3. Dengan menggunakan parameter yang tidak optimal, untuk training set 2 diperoleh nilai akurasi sebesar 58.62% dan training set 3 diperoleh nilai akurasi sebesar 89.66%. Setelah menggunakan parameter yang optimal, nilai akurasi training set 2 dari 58.62% naik menjadi 62.07%. Pada training set 3, nilai akurasi dari 89.66% naik menjadi 93.10%.

Rata-rata akurasi yang diperoleh dengan menggunakan parameter yang tidak optimal adalah sebesar 94.83%. Rata-rata akurasi yang diperoleh dengan menggunakan parameter yang optimal adalah sebesar 95.52%. Hal ini menunjukkan bahwa terjadi peningkatan rata-rata akurasi dengan menggunakan parameter yang optimal sebesar 0.69%.

Sebagian besar jumlah aturan yang dihasilkan dengan menggunakan parameter

yang optimal mengalami peningkatan dari jumlah aturan yang dihasilkan dengan menggunakan parameter yang tidak optimal. Tujuh dari sepuluh aturan yang dihasilkan mengalami peningkatan dalam hal jumlah. Tiga aturan dihasilkan dengan jumlah yang sama. Hal ini disebabkan perbedaan bilangan acak yang dibangkitkan untuk membentuk populasi awal dan penggunaan parameter yang berbeda. Kedua hal ini menyebabkan solusi yang dihasilkan akan berbeda sehingga tree yang dihasilkan akan berbeda. Parameter yang menghasilkan nilai akurasi tertinggi merupakan parameter yang terbaik.

Rata-rata jumlah aturan yang dihasilkan dengan menggunakan parameter yang tidak optimal adalah 20.8. Rata-rata aturan yang dihasilkan dengan menggunakan parameter yang optimal adalah 22.6. Hal ini menunjukkan bahwa terjadi peningkatan rata-rata jumlah aturan yang dihasilkan dengan menggunakan parameter yang optimal. Representasi Pengetahuan

Model yang dihasilkan dari proses training digunakan untuk mengetahui label kelas pada data yang baru. Model tersebut dipilih berdasarkan tiga kriteria berikut yang diurutkan berdasarkan prioritas:

1 Model yang mencakup semua kelas target yang mungkin muncul dalam testing set, dalam penelitian ini kelas target yang mungkin muncul yaitu kelas target 1 (negatif diabetes) dan kelas target 2 (positif diabetes).

2 Model dengan akurasi yang paling tinggi, semakin tinggi akurasinya maka semakin baik model tersebut.

3 Model dengan jumlah aturan yang paling banyak.

Berdasarkan kriteria tersebut maka model yang dipilih adalah hasil training dari pasangan training set dan testing set keenam dengan jumlah aturan sebanyak 27 aturan. Dari 27 aturan tersebut hanya 2 aturan yang mengandung kelas target positif diabetes. Model yang dihasilkan adalah sebagai berikut: 1 IF GPOST rendah THEN Negatif

Diabetes

2 IF GPOST sedang AND GLUN rendah AND TG rendah AND HDL rendah THEN Negatif Diabetes

3 IF GPOST sedang AND GLUN rendah AND TG rendah AND HDL sedang THEN Negatif Diabetes

Set Akurasi Jumlah Aturan

Waktu Total (detik)

1 100.00% 26

(24 negatif, 2 positif) 15,031

2 62.07% 17

(16 negatif, 1 positif) 207,204

3 93.10% 21

(20 negatif, 1 positif) 271,484

4 100.00% 25

(24 negatif, 1 positif) 15,563

5 100.00% 23

(20 negatif, 3 positif) 15,188

6 100.00% 27

(25 negatif, 2 positif) 15,063

7 100.00% 22

(22 negatif, 0 positif) 14,797

8 100.00% 20

(19 negatif, 1 positif) 14,625

9 100.00% 22

(22 negatif, 0 positif) 15,016

10 100.00% 23

(21 negatif, 2 positif) 15,485

(9)

4 IF GPOST sedang AND GLUN rendah AND TG rendah AND HDL tinggi THEN Negatif Diabetes

5 IF GPOST sedang AND GLUN rendah AND TG sedang AND HDL rendah THEN Negatif Diabetes

6 IF GPOST sedang AND GLUN rendah AND TG sedang AND HDL sedang THEN Negatif Diabetes

7 IF GPOST sedang AND GLUN rendah AND TG tinggi THEN Negatif Diabetes 8 IF GPOST sedang AND GLUN sedang

AND TG rendah AND HDL rendah THEN Negatif Diabetes

9 IF GPOST sedang AND GLUN sedang AND TG rendah AND HDL sedang THEN Negatif Diabetes

10 IF GPOST sedang AND GLUN sedang AND TG rendah AND HDL tinggi THEN Negatif Diabetes

11 IF GPOST sedang AND GLUN sedang AND TG sedang AND HDL rendah THEN Negatif Diabetes

12 IF GPOST sedang AND GLUN sedang AND TG sedang AND HDL sedang THEN Negatif Diabetes

13 IF GPOST sedang AND GLUN sedang AND TG tinggi AND HDL rendah THEN Negatif Diabetes

14 IF GPOST sedang AND GLUN sedang AND TG tinggi AND HDL sedang THEN Negatif Diabetes

15 IF GPOST sedang AND GLUN tinggi AND TG rendah AND HDL rendah THEN Negatif Diabetes

16 IF GPOST sedang AND GLUN tinggi AND TG rendah AND HDL sedang THEN Negatif Diabetes

17 IF GPOST sedang AND GLUN tinggi AND TG sedang AND HDL rendah THEN Negatif Diabetes

18 IF GPOST sedang AND GLUN tinggi AND TG sedang AND HDL sedang THEN Positif Diabetes

19 IF GPOST sedang AND GLUN tinggi AND TG tinggi THEN Negatif Diabetes 20 IF GPOST tinggi AND TG rendah AND

GLUN sedang THEN Negatif Diabetes 21 IF GPOST tinggi AND TG rendah AND

GLUN tinggi THEN Negatif Diabetes 22 IF GPOST tinggi AND TG sedang AND

HDL rendah AND GLUN rendah THEN Negatif Diabetes

23 IF GPOST tinggi AND TG sedang AND HDL rendah AND GLUN sedang THEN Negatif Diabetes

24 IF GPOST tinggi AND TG sedang AND HDL rendah AND GLUN tinggi THEN Negatif Diabetes

25 IF GPOST tinggi AND TG sedang AND HDL sedang AND GLUN rendah THEN Negatif Diabetes

26 IF GPOST tinggi AND TG sedang AND HDL sedang AND GLUN sedang THEN Negatif Diabetes

27 IF GPOST tinggi AND TG sedang AND HDL sedang AND GLUN tinggi THEN Positif Diabetes

Perbandingan G-DT dan FDT • Proses pembentukan tree

Proses pembentukan G-DT berbeda dengan FDT. Sehingga, tree dan aturan yang dihasilkan G-DT berbeda dengan FDT. Untuk melihat tree dan aturan yang dihasilkan oleh FDT dan G-DT, dilakukan pembentukan FDT dan G-DT menggunakan data training set dan testing set 1. Contoh sebagian data training set dan testing set 1 dapat dilihat pada Lampiran 6. Contoh sebagian data training set 1 hasil fuzzikasi untuk membentuk FDT dapat dilihat pada Lampiran 7. Contoh sebagian data training set 1 hasil fuzzikasi untuk membentuk G-DT dapat dilihat pada Lampiran 8.

Pembentukan FDT menggunakan algoritme FID3. Langkah-langkah dalam pembentukan FDT yaitu:

1 Membuat root node dari semua data training yang ada.

2 Menghitung fuzzy entropy dari training set yang ada. Nilai fuzzy entropy ini akan digunakan untuk menghitung nilai information gain dari masing-masing atribut.

3 Menghitung information gain dari atribut-atribut. Atribut yang memiliki nilai information gain paling tinggi akan dipilih untuk digunakan dalam mengekspansi tree atau menjadi root node, tetapi pada sub-node selanjutnya atribut ini tidak dapat digunakan untuk mengekspansi tree. 4 Ekspansi data training berdasarkan atribut

terpilih. Nilai derajat keanggotaan yang baru masing-masing record pada sub-node diperoleh dari hasil perkalian antara derajat keanggotaan pada root node dan derajat keanggotaan atribut yang digunakan untuk mengekspansi tree.

(10)

5 Menghitung proporsi dari setiap kelas yang ada pada setiap node.

6 Periksa threshold. Jika proporsi himpunan data dari kelas Ck lebih besar atau sama

dengan nilai fuzziness control threshold (FCT / θr), maka ekspansi tree dihentikan.

Jika banyaknya anggota himpunan data pada suatu node lebih kecil dari leaf decision threshold (LDT / θn), maka

ekspansi tree dihentikan.

7 Ekspansi sub-node terus dilakukan sampai tidak ada lagi data yang dapat diekspansi atau tidak ada lagi atribut yang dapat digunakan untuk mengekspansi tree yaitu ketika tree yang terbentuk sudah mencapai kedalaman maksimum atau sub-node tidak memenuhi syarat dari threshold yang diberikan. Jika sub-node sudah tidak dapat diekspansi maka nilai proporsi kelas terbesar merupakan kesimpulan dari sekumpulan aturan yang diperoleh dengan menghubungkan setiap node yang dilewati dari root node hingga leaf node.

Berdasarkan langkah-langkah algoritme FID3 di atas, diperoleh fuzzy decision tree seperti Lampiran 9 dan sebuah model yang terdiri dari 29 buah aturan dengan menggunakan training set 1. Model atau aturan klasifikasi yang diperoleh dapat dilihat pada Lampiran 10.

Pembentukan G-DT menggunakan algoritme genetika dan algoritme FID3. Langkah-langkah dalam pembentukan G-DT yaitu:

1 Membangkitkan populasi awal berdasarkan data training.

2 Menghitung nilai fitness dengan langkah-langkah berikut:

a Bentuk fungsi keanggotaan fuzzy untuk setiap atribut dan hitung derajat keanggotaan setiap data masing-masing atribut. Nilai derajat keanggotaan fuzzy setiap data akan digunakan untuk membentuk tree. b Bentuk tree dengan menggunakan

algoritme fuzzy ID3, sehingga diperoleh aturan-aturan. Aturan-aturan dan fungsi keanggotaan fuzzy setiap atribut digunakan untuk membentuk FIS Mamdani.

c Melakukan testing dengan menggunakan FIS Mamdani, sehingga diperoleh nilai galat (error). Nilai galat ini merupakan nilai fitness.

3 Mengevaluasi fitness dengan cara memeriksa fitness dengan fitness threshold. Jika fitness lebih kecil daripada fitness threshold, maka parameter fungsi keanggotaan yang terbaik telah diperoleh dan dapat dibentuk tree dengan cara: a Bentuk fungsi keanggotaan fuzzy

untuk setiap atribut dan hitung derajat keanggotaan setiap data masing-masing atribut. Nilai derajat keanggotaan fuzzy setiap data akan digunakan untuk membentuk tree. b Bentuk tree dengan menggunakan

algoritme fuzzy ID3, sehingga diperoleh model.

Jika fitness lebih besar daripada fitness threshold, maka lakukan elitisme, seleksi, rekombinasi, dan mutasi untuk membentuk populasi baru.

4 Melakukan elitisme, seleksi, rekombinasi, dan mutasi sehingga terbentuk populasi baru.

5 Menghitung nilai fitness populasi baru. 6 Evaluasi nilai fitness populasi baru.

7 Iterasi akan terus dilakukan hingga diperoleh solusi yang memenuhi nilai fitness threshold atau telah mencapai maksimum generasi. Jika parameter fungsi keanggotaan yang terbaik telah diperoleh, maka tree dapat dibentuk. Tree yang dihasilkan ini merupakan genetically optimized fuzzy decision tree (G-DT).

Berdasarkan langkah-langkah dalam pembentukan G-DT di atas, diperoleh genetically optimized fuzzy decision tree seperti Lampiran 11 dan sebuah model yang terdiri dari 26 buah aturan dengan menggunakan training set 1. Model atau aturan klasifikasi yang diperoleh dapat dilihat pada Lampiran 12.

• Hasil training

Hasil G-DT dapat dilihat pada Tabel 10. Hasil FDT yang merupakan hasil penelitian sebelumnya dapat dilihat pada Tabel 11. Tabel 10 Hasil training G-DT

Set Akurasi Waktu (detik)

Waktu Total (detik)

Jumlah Aturan

1 100.00% 8,390 15,031 26 (24 negatif,

2 positif) 2 62.07% 200,547 207,204

17 (16 negatif,

(11)

Tabel 10 Lanjutan

Tabel 11 Hasil training FDT

Tabel 11 Lanjutan

Dari Tabel 10 dan Tabel 11, terlihat bahwa nilai akurasi G-DT lebih tinggi daripada nilai akurasi FDT. Hal ini menunjukkan bahwa G-DT berhasil meningkatkan nilai akurasi. Nilai akurasi training set 2 dari 55.17% naik menjadi 62.07%. Nilai akurasi training set 3 juga naik dari 82.76% menjadi 93.10%. Nilai akurasi training set 7, trainng set 8, dan training set 10 naik menjadi 100%. FDT hanya menghasilkan 5 nilai akurasi sebesar 100%. Sedangkan G-DT menghasilkan 8 nilai akurasi sebesar 100%.

Rata-rata akurasi yang dihasilkan G-DT juga lebih tinggi daripada rata-rata akurasi yang dihasilkan FDT. Rata-rata nilai akurasi yang dihasilkan FDT adalah sebesar 90.69%. Sedangkan, rata-rata nilai akurasi yang dihasilkan G-DT adalah sebesar 95.52%. Hal ini menunjukkan bahwa G-DT berhasil meningkatkan nilai rata-rata akurasi sebesar

4.83%.

Sebagian besar jumlah aturan yang dihasilkan G-DT untuk setiap training set lebih rendah dari jumlah aturan yang dihasilkan FDT. Sembilan dari sepuluh model yang dihasilkan G-DT memiliki jumlah aturan lebih rendah daripada jumlah aturan yang dihasilkan FDT. Satu model yang dihasilkan G-DT memiliki jumlah aturan yang lebih tinggi daripada jumlah aturan yang dihasilkan FDT. Pada training set 2, jumlah aturan yang dihasilkan FDT adalah sebanyak 9 aturan dan jumlah aturan yang dihasilkan G-DT adalah sebanyak 17 aturan.

Perbedaan jumlah aturan yang dihasilkan ini disebabkan oleh perbedaan proses pembentukan tree pada G-DT dan FDT. Rendahnya jumlah aturan yang dihasilkan G-DT ini disebabkan oleh perbedaan jumlah himpunan fuzzy untuk atribut GLUN dan GPOST yang digunakan dalam pembentukan G-DT dan FDT. Pada FDT, jumlah himpunan fuzzy untuk atribut GLUN dan GPOST adalah sebanyak 4 himpunan fuzzy (rendah, sedang, tinggi, sangat tinggi). Pada G-DT, jumlah himpunan fuzzy untuk atribut GLUN dan GPOST adalah sebanyak 3 himpunan fuzzy Set Akurasi Waktu

(detik)

Waktu Total (detik)

Jumlah Aturan

3 93.10% 264,859 271,484 21 (20 negatif,

1 positif) 4 100.00% 8,953 15,563

25 (24 negatif,

1 positif) 5 100.00% 8,235 15,188

23 (20 negatif,

3 positif) 6 100.00% 8,453 15,063

27 (25 negatif,

2 positif) 7 100.00% 8,281 14,797

22 (22 negatif,

0 positif) 8 100.00% 7,938 14,625

20 (19 negatif,

1 positif) 9 100.00% 8,250 15,016

22 (22 negatif,

0 positif) 10 100.00% 8,813 15,485

23 (21 negatif,

2 positif)

Rataan 95.52% 22.6

Set Akurasi Waktu (detik)

Waktu Total (detik)

Jumlah Aturan

1 100.00% 0,750 21,625 29 (29 negatif,

0 positif) 2 55.17% 0,219 21,375

9 (9 negatif,

0 positif) 3 82.76% 0,562 21,500

23 (22 negatif,

1 positif) 4 100.00% 0,735 21,657

29 (29 negatif,

0 positif) 5 100.00% 0,782 21,703

30 (30 negatif,

0 positif) 6 100.00% 0,828 21,906

31 (31 negatif,

0 positif) 7 86.66% 0,766 21,828

29 (27 negatif,

2 positif) 8 89.66% 0,766 21,719

29 (28 negatif,

1 positif) 9 100.00% 0,750 21,797

29 (29 negatif,

0 positif)

Set Akurasi Waktu (detik)

Waktu Total (detik)

Jumlah Aturan

10 93.10% 0,782 21,750 30 (29 negatif,

1 positif)

(12)

(rendah, sedang, tinggi). Oleh karena itu, sebagian besar jumlah aturan yang dihasilkan G-DT lebih rendah daripada jumlah aturan yang dihasilkan FDT. Pada umumnya, jika nilai akurasi semakin naik maka jumlah aturan yang dihasilkan semakin turun.

Rata-rata jumlah aturan yang dihasilkan G-DT juga lebih rendah daripada rata-rata jumlah aturan yang dihasilkan FDT. Rata-rata jumlah aturan yang dihasilkan FDT adalah 27 aturan. Sedangkan, rata-rata jumlah aturan yang dihasilkan G-DT adalah 22.6 aturan.

Model yang dihasilkan G-DT juga berbeda dengan model yang dihasilkan FDT. Dengan menggunakan sepuluh training sets, G-DT menghasilkan 8 model yang memiliki aturan yang mengandung kelas target positif diabetes. Sedangkan FDT hanya menghasilkan 4 model yang memiliki aturan yang mengandung kelas target positif diabetes.

Model yang dihasilkan dari proses training FDT mengandung 30 aturan yang terdiri atas 29 aturan mengandung kelas target negatif diabetes dan 1 aturan mengandung kelas target positif diabetes. Model yang dihasilkan dari proses training G-DT mengandung 27 aturan yang terdiri atas 25 aturan mengandung kelas target negatif diabetes dan 2 aturan mengandung kelas target positif diabetes.

Waktu untuk membentuk G-DT lebih lama daripada waktu untuk membentuk FDT. Hal ini disebabkan dalam pembentukan G-DT, FDT dibentuk beberapa kali tergantung besarnya ukuran populasi dan maksimum generasi. Jika besar ukuran populasi dan maksimum generasi semakin besar, maka waktu pembentukan G-DT akan semakin lama. Akan tetapi, jika hasil G-DT diperoleh pada iterasi pertama, waktu total untuk menjalankan program G-DT lebih cepat daripada waktu total untuk menjalankan program FDT. Hal ini terlihat dari waktu eksekusi untuk training set 1, 4, 5, 6, 7, 8, 9, dan 10 pada Tabel 10.

Jumlah himpunan fuzzy dan fungsi keanggotaan yang digunakan dalam pembentukan G-DT berbeda dengan FDT. Pada FDT, fungsi keanggotaan fuzzy telah ditetapkan dari awal. Sedangkan pada G-DT, fungsi keanggotaan diperoleh dari hasil pembelajaran dengan algoritme genetika. Berikut jumlah himpunan fuzzy dan fungsi keanggotaan yang digunakan dalam

pembentukan G-DT dengan menggunakan training set 6.

a Atribut GLUN

Atribut GLUN dibagi menjadi 3 kelompok yaitu rendah, sedang, dan tinggi. Fungsi keanggotaan untuk atribut GLUN yaitu:

( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − − < = 126 ; 0 126 70 ; 56 126 70 ; 1 x x x x x rendah μ ( ) ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ≥ < ≤ −

− ≤ <

< ≤ − < = 282 ; 0 282 202 ; 80 282 202 126 ; 1 126 70 ; 56 70 70 ; 0 x x x x x x x x sedang μ ( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − < = 282 ; 1 282 202 ; 80 202 202 ; 0 x x x x x tinggi μ

Himpunan fuzzy menggunakan kurva dengan bentuk trapesium seperti Gambar 11.

Gambar 11 Himpunan fuzzy atribut GLUN. b Atribut GPOST

Atribut GPOST dibagi menjadi 3 kelompok yaitu rendah, sedang, dan tinggi. Fungsi keanggotaan untuk atribut GPOST yaitu: ( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − − < = 154 ; 0 154 97 ; 57 154 97 ; 1 x x x x x rendah μ ( ) ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ≥ < ≤ −

− ≤ <

< ≤ − < = 378 ; 0 378 272 ; 106 378 272 154 ; 1 154 97 ; 57 97 97 ; 0 x x x x x x x x sedang μ ( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − < = 378 ; 1 378 272 ; 106 272 272 ; 0 x x x x x tinggi μ

0 100 200 300 400 500 600

0 0.2 0.4 0.6 0.8 1 GLUN D eraj at Keangg iot aan

(13)

Himpunan fuzzy menggunakan kurva dengan bentuk trapesium seperti Gambar 12.

Gambar 12 Himpunan fuzzy atribut GPOST. c Atribut HDL

Atribut HDL dibagi menjadi 3 kelompok yaitu rendah, sedang, dan tinggi. Fungsi keanggotaan untuk atribut HDL yaitu:

( )

⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − − < = 61 ; 0 61 35 ; 26 61 35 ; 1 x x x x x rendah μ ( ) ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ≥ < ≤ −

− ≤ <

< ≤ − < = 135 ; 0 135 77 ; 58 135 77 61 ; 1 61 35 ; 26 35 35 ; 0 x x x x x x x x sedang μ ( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − < = 135 ; 1 135 77 ; 58 77 77 ; 0 x x x x x tinggi μ

Himpunan fuzzy menggunakan kurva dengan bentuk trapesium seperti Gambar 13.

Gambar 13 Himpunan fuzzy atribut HDL.

d Atribut TG

Atribut TG dibagi menjadi 3 kelompok yaitu rendah, sedang, dan tinggi. Fungsi keanggotaan untuk atribut TG yaitu:

( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − − < = 168 ; 0 168 109 ; 59 168 109 ; 1 x x x x x rendah μ ( ) ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ≥ < ≤ −

− ≤ <

< ≤ − < = 471 ; 0 471 324 ; 147 471 324 168 ; 1 168 109 ; 59 109 109 ; 0 x x x x x x x x sedang μ ( ) ⎪ ⎩ ⎪ ⎨ ⎧ ≥ < ≤ − < = 471 ; 1 471 324 ; 147 471 324 ; 0 x x x x x tinggi μ

Himpunan fuzzy menggunakan kurva dengan bentuk trapesium seperti Gambar 14.

Gambar 14 Himpunan fuzzy atribut TG. Untuk training set 1, 2, 3, 4, 5, 7, 8, 9, dan 10 dapat dilihat pada Lampiran 13. Sedangkan, jumlah himpunan fuzzy dan fungsi keanggotaan yang digunakan dalam pembentukan FDT yang digunakan pada penelitian sebelumnya dapat dilihat pada Lampiran 14.

Evaluasi Kinerja G-DT

Evaluasi kinerja G-DT dapat diketahui dari akurasi yang dihasilkan pada proses pembentukan G-DT pada training set dan testing set yang berbeda dan rata-rata akurasi keseluruhan training set. Hal ini dapat dilihat pada Tabel 10. Dari tabel 10 terlihat bahwa bahwa rata-rata akurasi G-DT lebih tinggi daripada rata-rata akurasi FDT. Hal ini menunjukkan telah terjadi peningkatan rata-rata akurasi sebesar 4.83% dari rata-rata-rata-rata akurasi FDT.

Dari sepuluh training sets, hanya dua training sets yang tidak memperoleh akurasi 0 100 200 300 400 500 600 700

0 0.2 0.4 0.6 0.8 1 GPOST D eraj at Keangg iot aan

Rendah Sedang Tinggi

0 100 200 300 400 500 600 700 0 0.2 0.4 0.6 0.8 1 TG D eraj at Keangg iot aan

Rendah Sedang Tinggi

0 20 40 60 80 100 120 140 160 180 200 0 0.2 0.4 0.6 0.8 1 D eraj at Keangg iot aan

Rendah Sedang _Tinggi

(14)

100%. Untuk training set dan testing set 2 diperoleh akurasi sebesar 62.07%. Untuk training set dan testing set 3 diperoleh akurasi sebesar 93.10%. Hal ini disebabkan pada testing set 2 dan testing set 3 mengandung data positif diabetes. Sedangkan testing set yang lain tidak mengandung data positif diabetes. Sementara itu, total data positif diabetes berjumlah kecil yaitu hanya 17 record dan total data negatif diabetes berjumlah besar yaitu 273 record. Data ini kurang representatif. Hal ini mengakibatkan jumlah aturan yang dihasilkan yang mengandung kelas target positif diabetes lebih rendah daripada aturan yang mengandung kelas target negatif diabetes. Sehingga, data dengan kelas target positif diabetes sulit untuk dikenali. Oleh karena itu, data testing set 2 dan testing set 3 agak sulit dikenali dan nilai akurasinya relatif lebih rendah.

Untuk melakukan proses pembentukan G-DT telah dibangun sebuah aplikasi sederhana dengan menggunakan Matlab 7.0.1. Salah satu antarmuka grafis dari aplikasi tersebut dapat dilihat pada Gambar 15.

Gambar 15 Antarmuka grafis aplikasi G-DT.

KESIMPULAN DAN SARAN

Kesimpulan

Dari berbagai percobaan yang dilakukan terhadap data diabetes diperoleh kesimpulan sebagai berikut:

1 Algoritme genetika dapat digunakan untuk optimasi fuzzy decision tree (FDT)

sehingga diperoleh genetically optimized fuzzy decison tree (G-DT).

2 Rata-rata nilai akurasi G-DT meningkat sebesar 4.83% dari rata-rata nilai akurasi FDT. Rata-rata akurasi FDT adalah sebesar 90.69%, sedangkan rata-rata akurasi G-DT adalah sebesar 95.52%. 3 Parameter algoritme genetika yang

optimal yaitu:

a fitness threshold: 0.05, b tingkat rekombinasi: 90%, c tingkat mutasi: 10%, d ukuran populasi: 10, dan e maksimum generasi: 50.

4 Dengan menggunakan parameter algoritme genetika yang optimal, nilai akurasi meningkat sebesar 0.69%. Rata-rata akurasi yang diperoleh dengan menggunakan parameter yang tidak optimal adalah 94.83%. Rata-rata akurasi yang diperoleh dengan menggunakan parameter yang optimal adalah 95.52%. 5 Jumlah aturan yang diperoleh oleh G-DT

adalah sebanyak 27 aturan yang terdiri atas 25 aturan mengandung kelas target negatif diabetes dan 2 aturan mengandung kelas target positif diabetes.

6 Jumlah aturan yang diperoleh G-DT lebih rendah daripada jumlah aturan yang diperoleh FDT. Jumlah aturan yang diperoleh FDT adalah 30 aturan. Jumlah aturan yang diperoleh G-DT adalah 27 aturan.

7 Penelitian ini menghasilkan aplikasi sederhana yang dapat digunakan untuk membuat classifier berdasarkan algoritme genetika dan FID3 dengan menggunakan Matlab 7.0.1.

Saran

Pada penelitian ini masih terdapat kekurangan yang dapat diperbaiki pada penelitian selanjutnya. Pada penelitian ini, data yang digunakan kurang representatif karena jumlah data untuk positif diabetes hanya 17 record, sedangkan untuk negatif diabetes sebanyak 273 record. Penelitian selanjutnya diharapkan menggunakan data yang lebih representatif dengan perbandingan jumlah data positif dan negatif diabetes yang sama besar, sehingga aturan klasifikasi yang dihasilkan memiliki akurasi yang lebih baik.

(15)

(16)

Lampiran 1 Hasil percobaan untuk 90 kombinasi parameter pada ukuran populasi sebesar 10 Tingkat

Crossover

Tingkat Mutasi

Maks.

Generasi Akurasi

Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik 50 89,66% 320,938 50 25 (0) 0,1034 100 89,66% 533,547 100 20 (1) 0,1034 150 93,10% 762,656 150 21 (1) 0,0690 200 89,66% 1197,000 200 24 (1) 0,1034 1%

250 93,10% 1792,580 250 28 (1) 0,0690 50 93,10% 284,406 50 22 (1) 0,0690 100 89,66% 585,859 100 24 (1) 0,1034 150 93,10% 845,891 150 24 (1) 0,0690 200 89,66% 1063,630 200 18 (1) 0,1034 5%

250 93,10% 1271,020 250 20 (1) 0,0690 50 89,66% 301,875 50 24 (3) 0,1034 100 89,66% 522,672 100 22 (1) 0,1034 150 93,10% 981,672 150 27 (1) 0,0690 200 93,10% 1292,670 200 25 (1) 0,0690 50%

10%

250 93,10% 1451,640 250 23 (1) 0,0690 50 93,10% 315,610 50 25 (2) 0,0690 100 93,10% 597,734 100 23 (1) 0,0690 150 89,66% 802,297 150 22 (1) 0,1034 200 89,66% 1028,450 200 20 (1) 0,1034 1%

250 93,10% 1275,480 250 20 (1) 0,0690 50 93,10% 329,094 50 27 (`1) 0,0690 100 89,66% 549,875 100 23 (1) 0,1034 150 89,66% 1104,130 150 29 (2) 0,1034 200 93,10% 1229,920 200 24 (1) 0,0690 5%

250 93,10% 1238,810 250 18 (1) 0,0690 50 93,10% 280,547 50 21 (1) 0,0690 100 93,10% 678,875 100 27 (1) 0,0690 150 93,10% 744,406 150 18 (1) 0,0690 200 93,10% 1002,200 200 22 (1) 0,0690 60%

10%

250 93,10% 1283,950 250 20 (1) 0,0690 50 89,66% 294,219 50 21 (1) 0,1034 100 93,10% 684,062 100 27 (1) 0,0690 150 93,10% 929,750 150 23 (1) 0,0690 200 89,66% 1157,770 200 23 (1) 0,1034 1%

250 89,66% 1426,420 250 23 (1) 0,1034 50 93,10% 308,328 50 22 (1) 0,0690 100 93,10% 552,813 100 19 (1) 0,0690 150 89,66% 935,766 150 24 (1) 0,1034 200 93,10% 1016,780 200 17 (1) 0,0690 5%

250 93,10% 1348,020 250 21 (1) 0,0690 50 86,21% 249,718 50 19 (1) 0,1379 100 93,10% 698,156 100 32 (2) 0,0690 150 93,10% 918,813 150 28 (1) 0,0690 200 93,10% 1219,940 200 25 (1) 0,0690 70%

10%

(17)

Lanjutan Tingkat Crossover

Tingkat Mutasi

Maks.

Generasi Akurasi

Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik 50 93,10% 339,532 50 26 (1) 0,0690 100 89,66% 509,110 100 21 (1) 0,1034 150 89,66% 980,109 150 24 (1) 0,1034 200 93,10% 1322,890 200 26 (1) 0,0690 1%

250 93,10% 1643,280 250 27 (1) 0,0690 50 89,66% 313,047 50 25 (1) 0,1034 100 93,10% 620,031 100 25 (1) 0,0690 150 93,10% 964,328 150 26 (1) 0,0690 200 93,10% 1249,340 200 23 (1) 0,0690 5%

250 89,66% 1374,340 250 21 (1) 0,1034 50 93,10% 285,296 50 22 (1) 0,0690 100 93,10% 513,906 100 21 (1) 0,0690 150 93,10% 1005,910 150 27 (1) 0,0690 200 93,10% 1207,580 200 26 (1) 0,0690 80%

10%

250 89,66% 1236,940 50 19(1) 0,1034 50 93,10% 278,891 50 21 (1) 0,0690 100 89,66% 518,094 100 22 (1) 0,1034 150 89,66% 891,500 150 23 (1) 0,1034 200 89,66% 1088,890 200 22 (1) 0,1034 1%

250 93,10% 1240,310 250 20 (1) 0,0690 50 93,10% 322,313 50 26 (3) 0,0690 100 93,10% 706,078 100 28 (1) 0,0690 150 93,10% 800,484 150 22 (2) 0,0690 200 93,10% 1122,440 200 22 (1) 0,0690 5%

250 89,66% 1466,860 250 24 (1) 0,1034 50 93,10% 331,344 50 28 (2) 0,0690 100 93,10% 621,937 100 25 (1) 0,0690 150 93,10% 989,718 150 23 (1) 0,0690 200 93,10% 1168,190 200 21 (1) 0,0690 90%

10%

250 93,10% 1453,800 250 24 (1) 0,0690 50 93,10% 296,625 50 23 (1) 0,0690 100 89,66% 619,860 100 22 (1) 0,1034 150 93,10% 883,781 150 23 (1) 0,0690 200 93,10% 1354,590 200 26 (1) 0,0690 1%

250 89,66% 1522,090 250 24 (2) 0,1034 50 93,10% 278,891 50 25 (2) 0,0690 100 89,66% 591,531 100 24 (1) 0,1034 150 89,66% 904,672 150 24 (3) 0,1034 200 93,10% 1167,970 200 21 (1) 0,0690 5%

250 89,66% 1476,840 250 23 (1) 0,1034 50 89,66% 321,093 50 25 (1) 0,1034 100 89,66% 674,547 100 27 (1) 0,1034 150 93,10% 827,235 150 21 (1) 0,0690 200 93,10% 1500,420 200 25 (1) 0,0690 100%

10%

250 93,10% 1651,530 250 28 (1) 0,0690 Ket : angka di dalam kurung pada kolom “jumlah aturan” menunjukkan jumlah aturan yang mengandung kelas target positif diabetes.

(18)

Lampiran 2 Hasil percobaan untuk 12 kombinasi parameter pada ukuran populasi sebesar 10 Tingkat rekombinasi = 50%

Tingkat mutasi = 5%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 284,406 50 22 (1) 0,0690 2 89,66% 331,953 50 26 (1) 0,1034 3 93,10% 276,828 50 21 (1) 0,0690 4 93,10% 282,782 50 23 (1) 0,0690 5 89,66% 302,062 50 24 (1) 0,1034 6 93,10% 276,922 50 21 (1) 0,0690 7 93,10% 278,406 50 23 (1) 0,0690 8 89,66% 307,843 50 24 (1) 0,1034 9 89,66% 274,890 50 20 (1) 0,1034 10 93,10% 295,157 50 22 (1) 0,0690 Tingkat rekombinasi= 60%

Tingkat mutasi = 1%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 315,610 50 25 (2) 0,0690 2 93,10% 315,422 50 26 (1) 0,0690 3 93,10% 307,375 50 24 (1) 0,0690 4 93,10% 271,719 50 20 (1) 0,0690 5 89,66% 315,547 50 25 (1) 0,1034 6 89,66% 306,218 50 24 (2) 0,1034 7 89,66% 265,594 50 20 (1) 0,1034 8 93,10% 308,453 50 23 (1) 0,0690 9 93,10% 332,000 50 25 (1) 0,0690 10 89,66% 285,907 50 23 (1) 0,1034 Tingkat rekombinasi = 60%

Tingkat mutasi = 5%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 329,094 50 27 (`1) 0,0690 2 93,10% 344,547 50 28 (1) 0,0690 3 93,10% 344,297 50 27 (2) 0,0690 4 93,10% 284,531 50 22 (1) 0,0690 5 89,66% 349,375 50 26 (1) 0,1034 6 93,10% 317,188 50 25 (1) 0,0690 7 89,66% 331,188 50 25 (1) 0,1034 8 93,10% 329,078 50 28 (2) 0,0690 9 93,10% 300,906 50 23 (1) 0,0690 10 93,10% 331,234 50 25 (1) 0,0690

(19)

Lanjutan

Tingkat rekombinasi = 60% Tingkat mutasi = 10%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 280,547 50 21 (1) 0,0690

2 89,66% 319,500 50 26 (1) 0,1034

3 93,10% 285,125 50 22 (1) 0,0690

4 93,10% 330,547 50 25 (1) 0,0690

5 93,10% 293,546 50 21 (1) 0,0690

6 93,10% 260,922 50 21 (1) 0,0690

7 93,10% 315,672 50 23 (1) 0,0690

8 89,66% 282,031 50 21 (1) 0,1034

9 93,10% 271,829 50 22 (1) 0,0690

10 93,10% 257,641 50 21 (1) 0,0690

Tingkat rekombinasi = 70% Tingkat mutasi = 5%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 308,328 50 22 (1) 0,0690

2 93,10% 318,000 50 25 (1) 0,0690

3 93,10% 334,156 50 25 (1) 0,0690

4 93,10% 344,797 50 27 (1) 0,0690

5 93,10% 310,969 50 24 (1) 0,0690

6 93,10% 337,328 50 26 (1) 0,0690

7 93,10% 336,156 50 27 (1) 0,0690

8 89,66% 315,890 50 24 (1) 0,1034

9 93,10% 311,938 50 23 (1) 0,0690

10 89,66% 364,765 50 28 (2) 0,1034

Tingkat rekombinasi = 80% Tingkat mutasi = 1%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 339,532 50 26 (1) 0,0690

2 93,10% 360,234 50 29 (5) 0,0690

3 89,66% 287,625 50 22 (1) 0,1034

4 93,10% 322,375 50 25 (2) 0,0690

5 89,66% 325,172 50 26 (1) 0,1034

6 89,66% 307,922 50 23 (1) 0,1034

7 93,10% 297,297 50 23 (1) 0,0690

8 89,66% 331,016 50 26 (1) 0,1034

9 93,10% 313,687 50 25 (1) 0,0690

(20)

Lanjutan

Tingkat rekombinasi= 80% Tingkat mutasi = 10%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 285,296 50 22 (1) 0,0690

2 93,10% 326,329 50 25 (1) 0,0690

3 93,10% 337,750 50 27 (2) 0,0690

4 93,10% 277,985 50 21 (1) 0,0690

5 93,10% 298,187 50 22 (1) 0,0690

6 93,10% 323,641 50 25 (1) 0,0690

7 93,10% 329,125 50 22 (1) 0,0690

8 93,10% 348,125 50 27 (1) 0,0690

9 89,66% 340,657 50 26 (1) 0,1034

10 93,10% 291,610 50 21 (1) 0,0690

Tingkat rekombinasi = 90% Tingkat mutasi = 1%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 278,891 50 21 (1) 0,0690

2 93,10% 322,578 50 25 (1) 0,0690

3 93,10% 282,781 50 21 (1) 0,0690

4 93,10% 263,531 50 20 (1) 0,0690

5 89,66% 282,594 50 22 (1) 0,1034

6 93,10% 341,031 50 27 (2) 0,0690

7 89,66% 270,093 50 20 (1) 0,1034

8 89,66% 315,000 50 25 (2) 0,1034

9 93,10% 287,782 50 22 (1) 0,0690

10 93,10% 295,766 50 23 (1) 0,0690

Tingkat rekombinasi = 90% Tingkat mutasi = 5%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 322,313 50 26 (3) 0,0690

2 89,66% 317,047 50 24 (1) 0,1034

3 93,10% 293,438 50 26 (1) 0,0690

4 93,10% 296,734 50 24 (1) 0,0690

5 93,10% 276,937 50 21 (1) 0,0690

6 93,10% 300,235 50 23 (1) 0,0690

7 93,10% 285,062 50 21 (1) 0,0690

8 89,66% 262,234 50 20 (1) 0,1034

9 93,10% 292,860 50 23 (1) 0,0690

(21)

Lanjutan

Tingkat rekombinasi = 90% Tingkat mutasi = 10%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 331,344 50 28 (2) 0,0690

2 93,10% 335,422 50 26 (1) 0,0690

3 93,10% 317,735 50 21 (1) 0,0690

4 93,10% 327,796 50 25 (2) 0,0690

5 89,66% 309,219 50 20 (1) 0,1034

6 93,10% 312,890 50 22 (2) 0,0690

7 93,10% 328,078 50 25 (1) 0,0690

8 93,10% 313,047 50 21 (1) 0,0690

9 93,10% 271,484 50 21 (1) 0,0690

10 93,10% 326,250 50 24 (1) 0,0690

Tingkat rekombinasi = 100% Tingkat mutasi = 1%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 296,625 50 23 (1) 0,0690

2 93,10% 303,406 50 22 (1) 0,0690

3 93,10% 351,344 50 28 (1) 0,0690

4 93,10% 353,968 50 27 (1) 0,0690

5 93,10% 337,781 50 27 (2) 0,0690

6 93,10% 302,250 50 23 (1) 0,0690

7 93,10% 266,562 50 20 (1) 0,0690

8 93,10% 322,969 50 24 (1) 0,0690

9 93,10% 302,344 50 23 (1) 0,0690

10 89,66% 296,406 50 22 (1) 0,1034

Tingkat rekombinasi = 100% Tingkat mutasi = 5%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 93,10% 278,891 50 25 (2) 0,0690

2 89,66% 318,203 50 23 (1) 0,1034

3 93,10% 331,234 50 25 (1) 0,0690

4 89,66% 276,297 50 21 (1) 0,1034

5 93,10% 297,719 50 23 (1) 0,0690

6 93,10% 266,204 50 20 (1) 0,0690

7 93,10% 330,297 50 25 (1) 0,0690

8 93,10% 298,750 50 23 (1) 0,0690

9 93,10% 342,594 50 27 (2) 0,0690

10 89,66% 260,390 50 19 (1) 0,1034

Ket : angka di dalam kurung pada kolom “jumlah aturan” menunjukkan jumlah aturan yang mengandung kelas target positif diabetes.

(22)

Lampiran 3 Hasil percobaan untuk 3 kombinasi parameter menggunakan training set 2 pada ukuran populasi sebesar 10

Tingkat rekombinasi = 80% Tingkat mutasi = 10%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 62,07% 202,969 50 15 (1) 0,3793

2 62,07% 223,484 50 18 (1) 0,3793

3 62,07% 216,125 50 17 (1) 0,3793

4 62,07% 228,938 50 18 (1) 0,3793

5 62,07% 216,360 50 16 (1) 0,3793

6 62,07% 236,109 50 18 (1) 0,3793

7 55,17% 143,484 50 10 (1) 0,4483

8 62,07% 213,875 50 17 (1) 0,3793

9 62,07% 220,172 50 15 (1) 0,3793

10 62,07% 241,578 50 18 (1) 0,3793

Tingkat rekombinasi = 90% Tingkat mutasi = 10%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 62,07% 238,188 50 18 (1) 0,3793

2 62,07% 223,031 50 17 (1) 0,3793

3 62,07% 226,906 50 17 (1) 0,3793

4 62,07% 206,625 50 16 (1) 0,3793

5 62,07% 207,204 50 17 (1) 0,3793

6 62,07% 220,187 50 18 (1) 0,3793

7 62,07% 233,735 50 18 (1) 0,3793

8 62,07% 211,954 50 17(1) 0,3793

9 62,07% 247,094 50 19 (1) 0,3793

10 62,07% 230,625 50 18 (1) 0,3793

Tingkat rekombinasi = 100% Tingkat mutasi = 1%

No. Akurasi Waktu (detik)

Jumlah Iterasi

Jumlah Aturan

Fitness Terbaik

1 62,07% 228,172 50 18 (1) 0,3793

2 62,07% 236,594 50 19 (1) 0,3793

3 55,17% 210,282 50 16 (0) 0,4483

4 55,17% 117,047 50 16 (0) 0,4483

5 58,62% 217,188 50 17 (1) 0,4138

6 62,07% 226,297 50 18 (1) 0,3793

7 62,07% 228,563 50 18 (1) 0,3793

8 62,07% 256,375 50 20 (1) 0,3793

9 62,07% 213,062 50 17 (1) 0,3793

10 62,07% 233,719 50 18 (1) 0,3793

Ket : angka di dalam kurung pada kolom “jumlah aturan” menunjukkan jumlah aturan yang mengandung kelas target positif diabetes.

(1)

GLUN

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

112 ;

112 91 ; 21 112

91 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

281 ;

281 204 ; 77 281

204 112 ; 1

112 91 ; 21

91 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

281 ;

281 204 ; 77

204

204 ;

x x x

x x

tinggi

GPOST

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

155 ;

155 97 ; 58 155

97 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

394 ;

394 275 ; 119

394

275 155 ; 1

155 97 ; 58

97 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

394 ;

394 275 ; 119

275

275 ;

x x x

x x

tinggi

HDL

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

51 ;

51 33 ; 18

33 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

137 ;

137 76 ; 61 137

76 51 ; 1

51 33 ; 18

33 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

137 ;

137 76 ; 61

76 ;

x x x

x x

tinggi

TG

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

158 ;

158 94 ; 64 158

94 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

475 ;

475 304 ; 171

475

304 158 ; 1

158 94 ; 64

94 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

475 ;

475 304 ; 171

304

304 ;

x x x

x x

tinggi

TRAINING

5 GLUN

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

129 ;

129 83 ; 46 129

83 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

302 ;

302 192 ; 110

302

192 129 ; 1

129 83 ; 46

83 ;

x x x

sedang

( )

⎪⎨ ⎧

< ≤

− <

= 192 ; 192 302

192 ;

x x

tinggi

GPOST

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

168 ;

168 88 ; 80 168

88 ;

x x x

x x

rendah μ

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

402 ;

402 290 ; 112

402

290 168 ; 1

168 88 ; 80

88 ;

x x x

sedang

( )

⎪⎨ ⎧

< ≤

− <

= 290 ; 290 402

290 ;

x x

tinggi

(2)

Lanjutan

HDL

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

66 ;

66 41 ; 25

41 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

144 ;

144 93 ; 51 144

93 66 ; 1

66 41 ; 25

41 ;

x x x

sedang μ

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

144 ;

144 93 ; 51

93 ;

x x x

x x

tinggi

TG

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

162 ;

162 104 ; 58 162

104 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

464 ;

464 311 ; 153

464

311 162 ; 1

162 104 ; 58

104

104 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

464 ;

464 311 ; 153

311

311 ;

x x x

x x

tinggi

TRAINING

7 GLUN

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

112 ;

112 73 ; 39 112

73 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

290 ;

290 197 ; 97 290

197 112 ; 1

112 73 ; 39

73 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

290 ;

290 197 ; 97

197

197 ;

x x x

x x

tinggi

GPOST

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

156 ;

156 92 ; 64 156

92 ;

x x x

x x

rendah μ

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

394 ;

394 263 ; 131

394

263 156 ; 1

156 92 ; 64

92 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

394 ;

394 263 ; 131

263

263 ;

x x x

x x

tinggi

HDL

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

52 ;

52 29 ; 23

29 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

145 ;

145 91 ; 54 145

91 52 ; 1

52 29 ; 23

29 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

145 ;

145 91 ; 54

91 ;

x x x

x x

tinggi

TG

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

141 ;

141 96 ; 45 141

96 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

328 ;

328 224 ; 104

328

224 141 ; 1

141 96 ; 45

96 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

328 ;

328 224 ; 104

224

224 ;

x x x

x x

tinggi μ

(3)

GLUN

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

120 ;

120 88 ; 32 120

88 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

302 ;

302 209 ; 93 302

209 120 ; 1

120 88 ; 32

88 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

302 ;

302 209 ; 93

209

209 ;

x x x

x x

tinggi

GPOST

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

157 ;

157 103 ; 54 157

103 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

394 ;

394 271 ; 123

394

271 157 ; 1

157 103 ; 54

103

103 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

394 ;

394 271 ; 123

271

271 ;

x x x

x x

tinggi

HDL

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

53 ;

53 41 ; 12

41 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

137 ;

137 84 ; 53 137

84 53 ; 1

53 41 ; 12

41 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

137 ;

137 84 ; 53

84 ;

x x x

x x

tinggi

TG

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

154 ;

154 105 ; 49 154

105 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

468 ;

468 311 ; 157

468

311 154 ; 1

154 105 ; 49

105

105 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

468 ;

468 311 ; 157

311

311 ;

x x x

x x

tinggi

TRAINING

9 GLUN

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

119 ;

119 78 ; 41 119

78 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

308 ;

308 201 ; 107

308

201 119 ; 1

119 78 ; 41

78 ;

x x x

sedang

( )

⎪⎨ ⎧

< ≤

− <

= 201 ; 201 308

201 ;

x x

GPOST

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

170 ;

170 103 ; 67 170

103 ;

x x x

x x

rendah μ

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

395 ;

395 278 ; 117

395

278 170 ; 1

170 103 ; 67

103

103 ;

x x x

sedang μ

( )

⎪ ⎪ ⎨ ⎧

< ≤

− <

= ; 278 395

117 278

278 ;

x x

tinggi

(4)

Lanjutan

HDL

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

60 ;

60 34 ; 26

34 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

152 ;

152 81 ; 71 152

81 60 ; 1

60 34 ; 26

34 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

152 ;

152 81 ; 71

81 ;

x x x

x x

tinggi

TG

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

157 ;

157 90 ; 67 157

90 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

341 ;

341 247 ; 94 341

247 157 ; 1

157 90 ; 67

90 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

341 ;

341 247 ; 94

247

247 ;

x x x

x x

tinggi

TRAINING

10 GLUN

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

108 ;

108 70 ; 38 108

70 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

312 ;

312 203 ; 109

312

203 108 ; 1

108 70 ; 38

70 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

312 ;

312 203 ; 109

203

203 ;

x x x

x x

tinggi

GPOST

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

153 ;

153 98 ; 55 153

98 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

369 ;

369 256 ; 113

369

256 153 ; 1

153 98 ; 55

98 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

369 ;

369 256 ; 113

256

256 ;

x x x

x x

tinggi

HDL

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

61 ;

61 37 ; 24

37 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

136 ;

136 92 ; 44 136

92 61 ; 1

61 37 ; 24

37 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

136 ;

136 92 ; 44

92 ;

x x x

x x

tinggi

TG

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

155 ;

155 93 ; 62 155

93 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

470 ;

470 318 ; 152

470

318 155 ; 1

155 93 ; 62

93 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

470 ;

470 318 ; 152

318

318 ;

x x x

x x

tinggi μ

(5)

Atribut GLUN dibagi menjadi 4 kelompok yaitu rendah, sedang, tinggi, dan sangat tinggi.

Fungsi keanggotaan untuk atribut GLUN yaitu:

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

75 ;

75 65 ; 10

65 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

115 ;

115 105 ; 10 115

105 75 ; 1

75 65 ; 10

65 ;

x x x

sedang

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

145 ;

145 135 ; 10 145

135 115 ; 1

115 105 ; 10

105

105 ;

x x x

tinggi

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

145 ;

145 135 ; 10

135

135 ;

x x x

x x

gi sangatTing

Himpunan

fuzzy

menggunakan kurva dengan bentuk trapesium seperti gambar di bawah ini.

b

Atribut GPOST

Atribut GPOST dibagi menjadi 4 kelompok yaitu rendah, sedang, tinggi, dan sangat tinggi.

Fungsi keanggotaan untuk atribut GPOST yaitu:

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

105 ;

105 95 ; 10 105

95 ;

x x x

x x

rendah μ

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

145 ;

145 135 ; 10 145

135 105 ; 1

105 95 ; 10

95 ;

x x x

sedang

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

205 ;

205 195 ; 10 205

195 145 ; 1

145 135 ; 10

135

135 ;

x x x

tinggi

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

205 ;

205 195 ; 10

195

195 ;

x x x

x x

gi sangatTing

Himpunan

fuzzy

menggunakan kurva dengan bentuk trapesium seperti gambar di bawah ini.

0 100 200 300 400 500 600

0 0.2 0.4 0.6 0.8 1

Der

aja

t K

ean

ggo

taa

RendahSedangTinggi Sangat Tinggi

0 100 200 300 400 500 600 700

0 0.2 0.4 0.6 0.8 1

Dera

t K

ean

(6)

Lanjutan

c

Atribut HDL

Atribut HDL dibagi menjadi 3 kelompok yaitu rendah, sedang, dan tinggi. Fungsi keanggotaan

untuk atribut HDL yaitu:

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

45 ;

45 35 ; 10

35 ;

x x x

x x

rendah

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

65 ;

65 55 ; 10

55 45 ; 1

45 35 ; 10

35 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

65 ;

65 55 ; 10

55 ;

x x x

x x

tinggi

Himpunan

fuzzy

menggunakan kurva dengan bentuk trapesium seperti gambar di bawah ini.

d

Atribut TG

Atribut TG dibagi menjadi 3 kelompok yaitu rendah, sedang, dan tinggi. Fungsi keanggotaan

untuk atribut TG yaitu:

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤ −

− <

55 ;

55 45 ; 10

45 ;

x x x

x x

rendah μ

( )

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧

≥ < ≤ −

− ≤ <

< ≤

− <

155 ;

155 145 ; 10 155

145 55 ; 1

55 45 ; 10

45 ;

x x x

sedang

( )

⎪ ⎩ ⎪ ⎨ ⎧

≥ < ≤

− <

155 ;

155 145 ; 10

145

145 ;

x x x

x x

tinggi

Himpunan

fuzzy

menggunakan kurva dengan bentuk trapesium seperti gambar di bawah ini.

0 20 40 60 80 100 120 140 160 180 200

0 0.2 0.4 0.6 0.8 1

Der

aja

t K

ean

ggo

taa

Rendah Sedang Tinggi

0 100 200 300 400 500 600 700

0 0.2 0.4 0.6 0.8 1

Der

aja

t K

ean

ggo

taa