Tabel 3. 4 Tabel Interval
nK3 nK13
k
� �
1
� ≤ �
2
�
3 ....
d. Setiap nilai atribut akan dicocokkan dengan nilai
interval yang telah dibuat di tabel 3.4 di atas. Masukkan data pada varibel x, maka ditemukanlah
hasil diskretisasi datanya sebagai berikut :
Tabel 3. 5 Hasil Diskretisasi
K3 K13
menjadi dK3
dK13
83 360
2 2
69 312
2 2
51 352
1 2
30 125
1 1
40 222
1 2
4. Transformasi pada kolom K25 :
a. DM = 2
b. DM_Hiperglikemia = 3
c. HT_DM = 4
d. Ulkus_DM = 5
e. DM_Neuropati = 6
3.2.4. Penerapan Teknik Mining
Pada tahap ini data yang telah ditransformasi dan menjadi data yang sangat relevan data setelah cleaning, data gejala
Diabetes Millitus tersebut akan diklasifikasikan ke tipe dari diabetes
tersebut dengan algoritma naive bayes. Data-data tersebut akan diolah dengan variabel input dan output, variabel input meliputi
atribut gejala sakit dan data lab. dan outputya adalah kelas dari diabetes yang diderita.
Gambar 3. 2 Alur Kerja Naive Bayes
Berikut ini merupakan pengerjaan metode Naive Bayes pada data Diabetes Milletus :
a Setelah melakukan preprosesing pada data, selanjutnya
lakukan mining terhadap data. Yang pertama-tama dikerjakan adalah membuat kelas training pada langkah-
langkah dibawah ini. b
Hitung jumlah
kelaslabel. Untuk
percontohan pengerjaan gunakan data sbb, yang mana data diambil
secara acak dan memakai data berdasarkan hasil transformasi data :
Tabel 3. 6 Contoh Tabel Training
K1 K2 K3 K14 K15 K25
1 1
2 3
1 2
2 3
2 4
2 2
2 3
2 3
1 2
2 2
2 3
1 2
2 2
1 4
1 3
2 3
1 4
1 3
1 3
1 3
1 3
2 3
1 4
1 3
1 3
2 3
3 4
1 3
1 4
1 4
2 3
2 5
1 4
1 2
2 4
1 4
2 3
1 5
1 5
2 2
2 5
1 5
1 3
2 5
2 5
2 2
2 4
3 5
2 4
2 5
1 5
1 3
1 5
1 6
1 4
1 5
1 6
2 2
1 5
1 6
� � =
� |
�
� � �
Probabilitas kelas : � �
= =
= . , � �
= =
= . , � �
= =
= . , � �
= =
= . , � �
= =
= .
Probabilitas K1 banding K25 � �
| = = , , � � | = = ,
� � | = = , , � �
| = = , � �
| = = , , � � | = = ,
� � | = = , , � �
| = = , PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
� � | = = , , � �
| = = ,
Probabilitas K2 banding K25 � �
| = = , ,� � | = = ,
� � | = = , , � �
| = � �
| = � �
| = ,� � | = = ,
� � | = = , , � �
| = � �
| = � �
| = , � � | = = ,
� � | = = , , � �
| = � �
| = � �
| = ,� � | = = ,
� � | = = , , � �
| = = , � �
| = � �
| = ,� � | = = ,
� � | = = , , � �
| = = , � �
| =
Probabilitas K3 banding K25 � �
| = ,� � | = =
� � | = = ,� �
| = � �
| = = , ,� � | = = ,
� � | = = ,� �
| = = , � �
| = = ,� � | =
Probabilitas K14 banding K25 � �
| = ,� � | =
� � | = . , � �
| = = . , � �
| = � �
| = , � � | =
� � | = = . , � �
| = . � �
| = � �
| = ,� � | =
� � | = = . , � �
| = . � �
| = . � �
| = ,� � | =
� � | = , � �
| = . � �
| = . � �
| = ,� � | =
� � | = , � �
| = � �
| =
Probabilitas K15 banding K25 � �
| = = , � �
| = = , � �
| = , � � | =
� � | =
� � | = = , � �
| = � �
| = , � � | =
� � | =
� � | = = , , � �
| = � �
| = = , , � � | =
� � | =
� � | = = , , � �
| = = , PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
� � | = = , , � �
| = � �
| = � �
| = = , � � | =
� � | = = , , � �
| = � �
| =
c Setelah data training selesai diolah, dilakukanlah
suatu testing terhadap data. Data testing disini penulis mencoba membuat suatu data baru. Setelah
itu lakukan penghitungan probabilitas dari masing- masing kelas dan ditentukan bahwa probabilitas
terbesarlah yang menjadi jawaban dari kelas yang dicari.
Tabel 3. 7 Contoh Data Tabel Testing
K1 K2 K3 K14 K15 K25
1 1
2 1
1 ?
Cari probabilitas pada hitungan dengan mencocokkan pada tabel 3.7
� � | = , , � �
| = , , � �
| = , , � � | = , ,
� � | = ,
� � | = ,
� � | = , � �
| = , � �
| = , � � | = ,
� � | = ,� �
| = , PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
� � | = , , � �
| = , , � �
| = , � �
| = . , � � | = .
� � | = . , � �
| = � �
| = � �
| = , , � � | =
� � | = , , � �
| = , � �
| = Lalu semua hasil dikalikan terhadap hasil
probabilitas berdasarkan pengelompokan kelasnya. �
= , × , × × . × ,
= ,
� = , × × × . ×
=
� = , × × , × . × ,
=
� = , × × , × × ,
=
� = , × × × ×
=
Setelah itu bandingkan keenam nilai tersebut, cari nilai terbesarnya. Dan dapat diketahui nilai
probabilitas terbesar terdapat pada P2 dengan nilai probabilitas 0,03516. Maka dapat disimpulkan
bahwa data test tersebut termasuk kelas 2 yang artinya pasien yang bersangkutan menderita
Diabetes Mellitus saja, tanpa ada penyakit
komplikasinya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.2.5. Evaluasi Data