Manfaat Penelitian Batasan Masalah
Untuk menghitung nilai kelas yang akan dibandingkan ya atau tidak, dilakukan perhitungan probabilitas PVj:
PVj= |docj| |Contoh|
Dimana docj adalah banyaknya dokumen yang memiliki kategori j dalam pelatihan, sedangkan Contoh banyaknya dokumen dalam contoh yang digunakan untuk
pelatihan. Untuk nilai PWk|Vj , yaitu probabilitas kata wk dalam kategori j ditentukan dengan :
PWk|Vj= Nk+1 N+|vocabulary|
Dimana nk adalah frekuensi munculnya kata wk dalam dokumen yang ber kategori vj ditambah 1, hal ini berfungsi untuk menghindari angka 0 dalam data atau
biasa disebut Laplace Smoothing, sedangkan nilai n adalah banyaknya seluruh kata dalam dokumen berkategori vj, dan vocabulary adalah banyaknya kata dalam contoh
pelatihan.
Contoh Naïve Bayesian
Berikut contoh kasus yang akan diselesaikan dengan metode Naïve Bayes Classifier:
Tabel 2.1 Data buys computer RID
Age Income
Student Credit_Rating Class
1. 29
High No
Fair No
2. 29
High No
Excelent No
3. 31..40
High No
Fair Yes
4. 41
Medium No
Fair Yes
5. 41
Low Yes
Fair Yes
6. 41
Low Yes
Excelent No
7. 31..40
Low Yes
Excelent Yes
8. 29
Medium No
Fair No
9. 29
Low Yes
Fair Yes
10. 41
Medium Yes
Fair Yes
11. 29
Medium Yes
Excelent Yes
12. 31..40
Medium No
Excelent Yes
13. 31..40
High Yes
Fair Yes
14. 41
Medium No
Excelent No
Berdasarkan data pada tabel 2.1., model Naïve Bayes Classifier adalah sebagai berikut:
1. Tentukan Pyes sebagai probabilitas orang yang membeli komputer dan
Pno sebagai probabilitas orang yang tidak membeli komputer dengan rumus sebagai berikut:
Pyesno = |doc j| |Contoh|
Dimana doc j adalah banyaknya dokumen yang memiliki kategori j dalam pelatihan, sedangkan Contoh banyaknya dokumen dalam contoh yang digunakan untuk
pelatihan. Berikut perhitungannya :
a. Tabel data
Tabel 2.2 Tabel data teks buys_computer
No Age
=30 Age
31..40 Age
40 Income
= low Income=
medium Income=
high Student
=yes Studen
t=no Credit_
Rating= fair
Credit_ Rating=
excelent Class
1. 1
1 1
1 No
2. 1
1 1
1 No
3. 1
1 1
1 Yes
4. 1
1 1
1 Yes
5. 1
1 1
1 Yes
6. 1
1 1
1 No
7. 1
1 1
1 Yes
8. 1
1 1
1 No
9. 1
1 1
1 Yes