Gambaran Umum Sistem PERANCANGAN SISTEM

39

BAB 3 PERANCANGAN SISTEM

3.1. Gambaran Umum Sistem

Secara umum, sistem yang akan dibangun dalam penelitian ini adalah sebuah sistem dengan fungsi utama untuk melakukan klasifikasi surat. Surat yang akan diklasifikasi adalah surat masuk dan surat keputusan pada Fakultas Sains dan Teknologi, Universitas Sanata Dharma. Dalam melakukan proses klasifikasi, sistem ini akan menggunakan algoritma Multinomial Naïve Bayes sebagai metodenya. User dari sistem ini adalah pihak sekretariat dan pejabat fakultas yang bersangkutan. Dalam praktiknya, surat-surat yang akan diklasifikasi akan di-scan terlebih dahulu untuk menjadikannya sebagai arsip digital. Hasil scan tersebut kemudian dikonversi menjadi file teks. File teks inilah yang nantinya akan diproses oleh sistem melalui proses indexing, pembobotan, training, hingga testing. Proses-proses tersebut dapat dilihat pada Gambar 3.1. Gambar 3.1 Diagram Blok untuk proses klasifikasi. index Indexing Data testing Tokenizing Stop word removal Normalization Matching Pangkatkan Nilai Conditional Probabilities Hitung Probabilitas Tiap Kelas Testing index Data training Tokenizing Stopword removal Normalization Tentukan kategori Indexing Hitung Prior Probabilities Hitung Conditional Probabilities Laplace Smoothing Model Training Modeling Classification Stemming Sorting Grouping Stemming Sorting Grouping Hasil Klasifikasi Pada Gambar 3.1 , proses indexing pada tahap modeling menghasilkan inverted index yang adalah kumpulan term yang telah terseleksi beserta dengan term frequency dari masing – masing term. Inverted index inilah yang kemudian akan diolah melalui proses training dari algoritma Multinomial Naïve Bayes untuk mendapatkan model yang digunakan dalam klasifikasi. Pada tahap testing klasifikasi, surat yang akan diklasifikasi akan melalui proses indexing namun tanpa diketahui kategorinya. Setelah melalui proses indexing tersebut, maka akan dihasilkan pula sebuah inverted index untuk proses testing. Dari inverted index tersebut kemudian dilakukan proses matching untuk mendapatkan daftar term yang sama-sama muncul pada inverted index dan model. Hasil proses matching kemudian digunakan untuk menjalankan proses klasifikasi dari Multinomial Naïve Bayes.

3.2. Analisis Masalah