33
BAB III ANALISIS DAN PERANCANGAN SISTEM
3.1 Gambaran Sistem Penelitian
Pada penelitian ini akan dibangun sistem peringkasan teks otomatis pada dokumen berbahasa Jawa. Sistem ini bertujuan untuk menghasilkan sebuah
ringkasan yang berisi bagian penting dari keseluruhan dokumen berbahasa Jawa. Ringkasan tersebut akan membantu pembaca dalam memahami isi dari dokumen
tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Untuk arsitektur sistem ini ditunjukan pada Gambar 3.1. Pada sistem ini
terdapat 2 aktor yaitu admin dan pengguna. Admin bertujuan untuk memasukkan data dokumen. Data dokumen tersebut akan ditampilkan pada halaman utama
sebagai data koleksi dokumen. Sedangkan pengguna dapat melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa
Jawa. Data dokumen tersebut akan diproses oleh sistem menjadi sebuah ringkasan. Untuk menjadi sebuah ringkasan, sistem akan memprosesnya dengan
melakukan preprocessing yaitu pemisahan kata tokenizing, penghapusan kata umum stopword, pengembalian kata dasar stemming. Kemudian sistem akan
melakukan perhitungan TF-IDF untuk mendapatkan jumlah bobot kalimat. Bobot kalimat dengan score tinggi merupakan kalimat penting dalam sebuah dokumen
berbahasa Jawa. Berdasarkan perhitungan TF-IDF, kalimat-kalimat tersebut yang akan dijadikan sebagai sebuah ringkasan.
34 Ringkasan adalah suatu teks yang dihasilkan dari satu atau lebih teks yang
berisi bagian informasi yang signifikan dalam teks asal, dan yang tidak lebih dari setengah teks aslinya Hovy, Mitkov, 2005. Maka pada penelitian ini kalimat-
kalimat yang diambil untuk dijadikan sebuah ringkasan adalah sebesar 40 dari total kalimat yang ada dalam sebuah dokumen. Misalkan ada 50 kalimat dalam
sebuah dokumen, maka dalam penelitian ini akan diambil sekitar 20 kalimat yang memiliki score tinggi. Karena jika kalimat yang diambil dalam sebuah dokumen
terlalu sedikit maka hasil ringkasan menjadi tidak sesuai dengan isi dokumen, hal ini yang menyebabkan ringkasan tidak relevan.
Pengguna Sistem
Admin
Pengguna Admin
Gambar 3.1 Gambaran Sistem Keseluruhan
Koleksi Data Dokumen
Prepocessing : Tokenizing.
Stopword, Stemming
Perhitungan TF-IDF
Hasil Ringkasan
Input Data Dokumen
Input Data Dokumen
35
3.2 Analisis Kebutuhan