Penerapan Teknik Mining Analisa Pengolahan Data

Tabel 3. 4 Tabel Interval nK3 nK13 k � � 1 � ≤ � 2 � 3 .... d. Setiap nilai atribut akan dicocokkan dengan nilai interval yang telah dibuat di tabel 3.4 di atas. Masukkan data pada varibel x, maka ditemukanlah hasil diskretisasi datanya sebagai berikut : Tabel 3. 5 Hasil Diskretisasi K3 K13 menjadi dK3 dK13 83 360 2 2 69 312 2 2 51 352 1 2 30 125 1 1 40 222 1 2 4. Transformasi pada kolom K25 : a. DM = 2 b. DM_Hiperglikemia = 3 c. HT_DM = 4 d. Ulkus_DM = 5 e. DM_Neuropati = 6

3.2.4. Penerapan Teknik Mining

Pada tahap ini data yang telah ditransformasi dan menjadi data yang sangat relevan data setelah cleaning, data gejala Diabetes Millitus tersebut akan diklasifikasikan ke tipe dari diabetes tersebut dengan algoritma naive bayes. Data-data tersebut akan diolah dengan variabel input dan output, variabel input meliputi atribut gejala sakit dan data lab. dan outputya adalah kelas dari diabetes yang diderita. Gambar 3. 2 Alur Kerja Naive Bayes Berikut ini merupakan pengerjaan metode Naive Bayes pada data Diabetes Milletus : a Setelah melakukan preprosesing pada data, selanjutnya lakukan mining terhadap data. Yang pertama-tama dikerjakan adalah membuat kelas training pada langkah- langkah dibawah ini. b Hitung jumlah kelaslabel. Untuk percontohan pengerjaan gunakan data sbb, yang mana data diambil secara acak dan memakai data berdasarkan hasil transformasi data : Tabel 3. 6 Contoh Tabel Training K1 K2 K3 K14 K15 K25 1 1 2 3 1 2 2 3 2 4 2 2 2 3 2 3 1 2 2 2 2 3 1 2 2 2 1 4 1 3 2 3 1 4 1 3 1 3 1 3 1 3 2 3 1 4 1 3 1 3 2 3 3 4 1 3 1 4 1 4 2 3 2 5 1 4 1 2 2 4 1 4 2 3 1 5 1 5 2 2 2 5 1 5 1 3 2 5 2 5 2 2 2 4 3 5 2 4 2 5 1 5 1 3 1 5 1 6 1 4 1 5 1 6 2 2 1 5 1 6 � � = � | � � � � Probabilitas kelas : � � = = = . , � � = = = . , � � = = = . , � � = = = . , � � = = = . Probabilitas K1 banding K25 � � | = = , , � � | = = , � � | = = , , � � | = = , � � | = = , , � � | = = , � � | = = , , � � | = = , PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI � � | = = , , � � | = = , Probabilitas K2 banding K25 � � | = = , ,� � | = = , � � | = = , , � � | = � � | = � � | = ,� � | = = , � � | = = , , � � | = � � | = � � | = , � � | = = , � � | = = , , � � | = � � | = � � | = ,� � | = = , � � | = = , , � � | = = , � � | = � � | = ,� � | = = , � � | = = , , � � | = = , � � | = Probabilitas K3 banding K25 � � | = ,� � | = = � � | = = ,� � | = � � | = = , ,� � | = = , � � | = = ,� � | = = , � � | = = ,� � | = Probabilitas K14 banding K25 � � | = ,� � | = � � | = . , � � | = = . , � � | = � � | = , � � | = � � | = = . , � � | = . � � | = � � | = ,� � | = � � | = = . , � � | = . � � | = . � � | = ,� � | = � � | = , � � | = . � � | = . � � | = ,� � | = � � | = , � � | = � � | = Probabilitas K15 banding K25 � � | = = , � � | = = , � � | = , � � | = � � | = � � | = = , � � | = � � | = , � � | = � � | = � � | = = , , � � | = � � | = = , , � � | = � � | = � � | = = , , � � | = = , PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI � � | = = , , � � | = � � | = � � | = = , � � | = � � | = = , , � � | = � � | = c Setelah data training selesai diolah, dilakukanlah suatu testing terhadap data. Data testing disini penulis mencoba membuat suatu data baru. Setelah itu lakukan penghitungan probabilitas dari masing- masing kelas dan ditentukan bahwa probabilitas terbesarlah yang menjadi jawaban dari kelas yang dicari. Tabel 3. 7 Contoh Data Tabel Testing K1 K2 K3 K14 K15 K25 1 1 2 1 1 ? Cari probabilitas pada hitungan dengan mencocokkan pada tabel 3.7 � � | = , , � � | = , , � � | = , , � � | = , , � � | = , � � | = , � � | = , � � | = , � � | = , � � | = , � � | = ,� � | = , PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI � � | = , , � � | = , , � � | = , � � | = . , � � | = . � � | = . , � � | = � � | = � � | = , , � � | = � � | = , , � � | = , � � | = Lalu semua hasil dikalikan terhadap hasil probabilitas berdasarkan pengelompokan kelasnya. � = , × , × × . × , = , � = , × × × . × = � = , × × , × . × , = � = , × × , × × , = � = , × × × × = Setelah itu bandingkan keenam nilai tersebut, cari nilai terbesarnya. Dan dapat diketahui nilai probabilitas terbesar terdapat pada P2 dengan nilai probabilitas 0,03516. Maka dapat disimpulkan bahwa data test tersebut termasuk kelas 2 yang artinya pasien yang bersangkutan menderita Diabetes Mellitus saja, tanpa ada penyakit komplikasinya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

3.2.5. Evaluasi Data