Pendahuluan populer yaitu Naive Bayesian filtering. Metode ini Spam

Makalah Nomor: KNSI-72 PEMBANGUNAN SPAM E-MAIL FILTERING SYSTEM DENGAN METODE NAIVE BAYESIAN Indrastanti R. Widiasari .1 , Teguh Indra Bayu 2 1, 2 Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana 1 indrastantistaff.uksw.edu, 2 t.indra.bayugmail.com

1. Pendahuluan populer yaitu Naive Bayesian filtering. Metode ini

memanfaatkan teorema probabilitas yaitu teorema Bayes dan fungsionalitas data mining yaitu klasifikasi Naive Bayesian . Kelebihan Naive Bayesian filtering adalah tingkat akurasi yang tinggi dan error rate yang minimum. Electronic mail e-mail merupakan media komunikasi dalam jaringan intranet maupun internet untuk berdiskusi maillist, transfer informasi berupa file mail attachment bahkan dapat digunakan untuk media iklan suatu perusahaan atau produk tertentu [1]. Mengingat fasilitas e-mail yang murah dan kemudahan untuk mengirimkan ke berapapun jumlah penerimanya, maka beberapa pihak tertentu memanfaatkannya dengan mengirimkan e-mail berisi promosi produk atau jasa, pornografi, virus, dan hal-hal yang tidak penting ke ribuan pengguna e-mail . E-mail inilah yang biasanya disebut dengan spam mail . Dampak buruk yang paling utama dari adanya spam mail adalah terbuangnya waktu dengan percuma untuk menghapus spam mail dari inbox satu persatu. Meskipun berbagai perangkat lunak e-mail filtering banyak tersedia, namun masalah spam mail juga semakin berkemba

2. Spam

Spam muncul pertama kali pada bulan Mei tahun 1978. Spam tersebut bersifat iklan yang dikirimkan oleh Digital Equipment Corporation DEC tentang product DecSystem-20 , kemudian pada April 1994, spam menyebar melalui USENET news merupakan forum diskusi yang paling populer pada masa itu dengan jumlah group mencapai ribuan dan semua group menerima iklan dari forum diskusi tersebut. Spam merupakan unsolicited e-mail e-mail yang tidak diminta yang dikirim ke banyak orang [2]. Spam juga dapat diartikan sebagai e-mail yang berisi promosi produk atau jasa, pornografi, virus, dan hal- hal yang tidak penting yang dikirim ke ribuan pengguna e-mail. ng. Berdasarkan permasalahan yang ada, maka hal yang harus dilakukan untuk mem-filter spam sehingga penggunaan spam dapat dicegah secara optimal oleh e-mail filtering . Metode yang digunakan merupakan salah satu metode e-mail filtering yang paling Metode Bayesian filtering merupakan metode anti spam filtering terbaru. Metode ini mengenali spam 284 285 berdasarkan kata-kata token yang terkandung pada sebuah e-mail [3]. Metode filter pada saat pertama kali dijalankan harus dilakukan proses training menggunakan dua koleksi e-mail, satu koleksi merupakan spam mail dan koleksi yang lain merupakan good mail. Proses training ini digunakan sebagai data pembanding terhadap e-mail yang masuk. Dengan cara seperti ini, pada setiap e-mail baru yang diterima, Bayesian filter dapat memperkirakan probabilitas prediksi spam berdasarkan kata-kata yang sering muncul di koleksi spam mail atau di koleksi good mail.

3. Email