Makalah Nomor: KNSI-72
PEMBANGUNAN SPAM E-MAIL FILTERING SYSTEM
DENGAN METODE NAIVE BAYESIAN
Indrastanti R. Widiasari
.1
, Teguh Indra Bayu
2
1, 2
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
1
indrastantistaff.uksw.edu,
2
t.indra.bayugmail.com
1. Pendahuluan populer yaitu Naive Bayesian filtering. Metode ini
memanfaatkan teorema probabilitas yaitu teorema Bayes
dan fungsionalitas data mining yaitu klasifikasi Naive Bayesian
. Kelebihan Naive Bayesian filtering adalah tingkat akurasi yang tinggi dan error rate
yang minimum. Electronic mail
e-mail merupakan media komunikasi dalam jaringan intranet maupun internet
untuk berdiskusi maillist, transfer informasi berupa file
mail attachment bahkan dapat digunakan untuk media iklan suatu perusahaan atau produk tertentu
[1]. Mengingat fasilitas e-mail yang murah dan kemudahan untuk mengirimkan ke berapapun jumlah
penerimanya, maka beberapa pihak tertentu memanfaatkannya dengan mengirimkan e-mail berisi
promosi produk atau jasa, pornografi, virus, dan hal-hal yang tidak penting ke ribuan pengguna
e-mail
. E-mail inilah yang biasanya disebut dengan spam mail
. Dampak buruk yang paling utama dari adanya spam mail adalah terbuangnya waktu dengan
percuma untuk menghapus spam mail dari inbox satu persatu. Meskipun berbagai perangkat lunak e-mail
filtering banyak tersedia, namun masalah spam mail
juga semakin berkemba
2. Spam
Spam muncul pertama kali pada bulan Mei tahun
1978. Spam tersebut bersifat iklan yang dikirimkan oleh Digital Equipment Corporation DEC tentang
product DecSystem-20 , kemudian pada April 1994,
spam menyebar melalui USENET news merupakan
forum diskusi yang paling populer pada masa itu dengan jumlah group mencapai ribuan dan semua
group menerima iklan dari forum diskusi tersebut.
Spam merupakan unsolicited e-mail e-mail yang
tidak diminta yang dikirim ke banyak orang [2]. Spam
juga dapat diartikan sebagai e-mail yang berisi promosi produk atau jasa, pornografi, virus, dan hal-
hal yang tidak penting yang dikirim ke ribuan pengguna e-mail.
ng. Berdasarkan permasalahan yang ada, maka hal yang
harus dilakukan untuk mem-filter spam sehingga penggunaan spam dapat dicegah secara optimal oleh
e-mail filtering . Metode yang digunakan merupakan
salah satu metode e-mail filtering yang paling Metode Bayesian filtering merupakan metode anti
spam filtering terbaru. Metode ini mengenali spam
284
285
berdasarkan kata-kata token yang terkandung pada sebuah e-mail [3]. Metode filter pada saat pertama
kali dijalankan harus dilakukan proses training menggunakan dua koleksi e-mail, satu koleksi
merupakan spam mail dan koleksi yang lain merupakan good mail. Proses training ini digunakan
sebagai data pembanding terhadap e-mail yang masuk. Dengan cara seperti ini, pada setiap e-mail
baru
yang diterima,
Bayesian filter
dapat memperkirakan
probabilitas prediksi
spam berdasarkan kata-kata yang sering muncul di koleksi
spam mail atau di koleksi good mail.
3. Email