untuk mengubah hasil scanning yang dapat berupa PDF atau file gambar menjadi file teks. File teks dibutuhkan untuk mengekstrak informasi di dalam surat.
Informasi tersebut kemudian digunakan dalam menghasilkan klasifikasi dan melakukan pencarian surat. PDF dari hasil scanning akan berguna sebagai view
untuk menampilkan isi surat. Sistem yang hendak dibangun akan menerapkan teknik klasifikasi teks
menggunakan algoritma Multinomial Naïve Bayes. Klasifikasi teks adalah proses mengelompokkan dokumen ke dalam kategori-kategori atau kelas-kelas yang
berbeda Joachims, 1997. Beberapa penggunaan teknik klasifikasi teks misalnya untuk menyaring e-mail, memprediksi keinginan user, dan pengorganisasian
konten isi web Schneider, 2004. Algoritma Multinomial Naïve Bayes adalah pengembangan dari algoritma Naïve Bayes yang memiliki keunggulan dalam
memproses teks. Naive Bayes Witten Frank, 2005 yaitu salah satu teknik klasifikasi yang banyak digunakan untuk klasifikasi teks karena metode ini sangat
cepat dan cukup akurat.
1.2. Rumusan Masalah
1. Bagaimana membangun sebuah sistem yang dapat mengelompokkan surat
masuk dan surat keputusan ke dalam kategori – kategori tertentu secara otomatis, kemudian menyimpan file surat tersebut dan metadatanya ke
dalam database. 2.
Melakukan pencarian file surat yang telah tersimpan di database dengan memanfaatkan metadata dari file surat maupun berdasarkan kategori surat
untuk mempercepat proses pencarian surat. 3.
Menerapkan metode Naive Bayes dengan multinomial model dalam proses klasifikasi teks surat.
1.3. Batasan Masalah
Batasan dari sistem pemerolehan informasi surat masuk dan surat keputusan yang hendak dibangun adalah sebagai berikut :
1. Tipe surat yang dikelola adalah surat masuk.
2. Bentuk surat yang diproses adalah hasil scan yang kemudian dikonversi
menjadi file text .txt. 3.
User dari sistem adalah sekretariat dan pejabat fakultas. 4.
Proses - proses utama yang dimiliki sistem: a.
Mengelompokkan surat masuk dan surat keputusan yang dimiliki sekretariat ke dalam kategori – kategori tertentu yang kemudian disimpan
ke dalam database. b.
Mencari surat yang telah disimpan di dalam database berdasarkan suatu kategori tertentu atau berdasarkan kata kunci dari user.
1.4. Tujuan Penelitian
Tujuan dari penelitian ini adalah membangun sebuah sistem yang dapat membantu pihak sekretariat dan pejabat fakultas dalam mengelola surat masuk
yang telah digitalisasi berbentuk file digital.
1.5. Metodologi Penelitian
Langkah-langkah dari metodologi penelitian yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Studi Pustaka
Studi pustaka dilakukan untuk mempelajari dan memahami lebih lanjut tentang surat, pemrosesan dan klasifikasi teks, algoritma Multinomial Naïve
Bayes dan teknik penerapan dari semua ilmu tersebut untuk mencapai tujuan akhir dari penelitian.
2. Observasi
Observasi bertujuan untuk mengetahui segala sesuatu mengenai sistem pengelolaan surat yang sedang berjalan di Fakultas Sains dan Teknologi.
Seperti untuk mengetahui bagaimana cara kerjanya, siapa yang bertugas mengelola dan bertanggung jawab, dan apa saja yang benar – benar
dibutuhkan untuk memaksimalkan pengelolaan surat tersebut.
3. Analisis dan Perancangan Sistem
Melakukan analisis terhadap masalah dan kebutuhan sistem yang akan dibangun. Kemudian dilakukan perancangan umum sistem sesuai dengan
kebutuhan user. Metode yang akan digunakan dalam merancang sistem pengklasifikasian surat ini adalah metode FAST Framework for the
Application of Sistem Thinking yang meliputi : a.
Fase Definisi Ruang Lingkup Scope Definition Phase Pada fase ini akan dilakukan analisis terhadap batasan – batasan sistem,
yaitu menentukan kebutuhan – kebutuhan yang dapat ditangani oleh sistem. Fase ini juga akan menganalisis siapa saja yang akan menjadi user
dari sistem. b.
Fase Analisis Masalah Problem Analysis Phase Mempelajari sistem yang telah ada dan sedang berjalan untuk menemukan
masalah – masalah dan solusi dari sistem yang sedang berjalan tersebut. c.
Fase Analisis Kebutuhan Requirements Analysis Phase Mendefinisikan kemampuan yang akan disediakan sistem kepada usernya.
Mengalisis kebutuhan user atau yang diharapkan user dari sistem yang baru.
d. Fase Desain Logikal Logical Design Phase
Menerjemahkan kebutuhan user dari fase sebelumnya ke dalam sebuah model atau diagram yang meliputi desain basis data Entity Relationship
Model, diagram arus data DAD, diagram konteks, dan diagram dekomposisi dari sistem.
e. Fase Desain Fisikal Physical Design Phase
Menerjemahkan Desain Logikal yang menggambarkan kebutuhan pengguna ke dalam sebuah model yang menggambarkan implementasi
teknis dari sistem yang akan dibuat. f.
Fase pembangunan dan pengujian Construction Testing Phase Membangun dan menguji sistem yang telah dirancang melalui fase – fase
terdahulu dalam memenuhi kebutuhan pengguna. Membuat dokumetasi dari sistem yang berguna untuk membantu user memahami sistem baru.
4. Pembuatan Sistem
Pembuatan sistem akan berdasarkan hasil analisis dan perancangan sistem yang telah dilakukan pada tahap sebelumnya.
5. Implementasi dan pengujian
Sistem yang telah dibuat kemudian dijalankan dan dilakukan uji coba untuk mengetahui kinerja sistem secara khusus yang meliputi keakuratan klasifikasi
dan keberhasilan melakukan pencarian. Kinerja sistem secara umum meliputi berjalan atau tidaknya setiap fungsi dan keberhasilan setiap fungsi tersebut
menjalankan tugasnya.
6. Evaluasi
Menganalisis hasil implementasi dan pengujian untuk kemudian disimpulkan sejauh mana sistem telah mengakomodasi kebutuhan user secara keseluruhan.
1.6. Sistematika Penulisan