39
BAB 3 PERANCANGAN SISTEM
3.1. Gambaran Umum Sistem
Secara umum, sistem yang akan dibangun dalam penelitian ini adalah sebuah sistem dengan fungsi utama untuk melakukan klasifikasi surat. Surat yang akan
diklasifikasi adalah surat masuk dan surat keputusan pada Fakultas Sains dan Teknologi, Universitas Sanata Dharma. Dalam melakukan proses klasifikasi,
sistem ini akan menggunakan algoritma Multinomial Naïve Bayes sebagai metodenya. User dari sistem ini adalah pihak sekretariat dan pejabat fakultas yang
bersangkutan. Dalam praktiknya, surat-surat yang akan diklasifikasi akan di-scan terlebih dahulu untuk menjadikannya sebagai arsip digital. Hasil scan tersebut
kemudian dikonversi menjadi file teks. File teks inilah yang nantinya akan diproses oleh sistem melalui proses indexing, pembobotan, training, hingga
testing. Proses-proses tersebut dapat dilihat pada Gambar 3.1.
Gambar 3.1 Diagram Blok untuk proses klasifikasi.
index
Indexing
Data testing Tokenizing
Stop word removal
Normalization
Matching Pangkatkan Nilai
Conditional Probabilities Hitung Probabilitas
Tiap Kelas
Testing
index Data training
Tokenizing
Stopword removal
Normalization Tentukan
kategori
Indexing
Hitung Prior Probabilities
Hitung Conditional Probabilities
Laplace Smoothing
Model
Training
Modeling
Classification
Stemming Sorting
Grouping Stemming
Sorting Grouping
Hasil Klasifikasi
Pada
Gambar 3.1
, proses indexing pada tahap modeling menghasilkan inverted index yang adalah kumpulan term yang telah terseleksi beserta dengan
term frequency dari masing – masing term. Inverted index inilah yang kemudian akan diolah melalui proses training dari algoritma Multinomial Naïve Bayes
untuk mendapatkan model yang digunakan dalam klasifikasi. Pada tahap testing klasifikasi, surat yang akan diklasifikasi akan melalui
proses indexing namun tanpa diketahui kategorinya. Setelah melalui proses indexing tersebut, maka akan dihasilkan pula sebuah inverted index untuk proses
testing. Dari inverted index tersebut kemudian dilakukan proses matching untuk mendapatkan daftar term yang sama-sama muncul pada inverted index dan model.
Hasil proses matching kemudian digunakan untuk menjalankan proses klasifikasi dari Multinomial Naïve Bayes.
3.2. Analisis Masalah