Gambaran Sistem Penelitian ANALISIS DAN PERANCANGAN SISTEM

33

BAB III ANALISIS DAN PERANCANGAN SISTEM

3.1 Gambaran Sistem Penelitian

Pada penelitian ini akan dibangun sistem peringkasan teks otomatis pada dokumen berbahasa Jawa. Sistem ini bertujuan untuk menghasilkan sebuah ringkasan yang berisi bagian penting dari keseluruhan dokumen berbahasa Jawa. Ringkasan tersebut akan membantu pembaca dalam memahami isi dari dokumen tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Untuk arsitektur sistem ini ditunjukan pada Gambar 3.1. Pada sistem ini terdapat 2 aktor yaitu admin dan pengguna. Admin bertujuan untuk memasukkan data dokumen. Data dokumen tersebut akan ditampilkan pada halaman utama sebagai data koleksi dokumen. Sedangkan pengguna dapat melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa Jawa. Data dokumen tersebut akan diproses oleh sistem menjadi sebuah ringkasan. Untuk menjadi sebuah ringkasan, sistem akan memprosesnya dengan melakukan preprocessing yaitu pemisahan kata tokenizing, penghapusan kata umum stopword, pengembalian kata dasar stemming. Kemudian sistem akan melakukan perhitungan TF-IDF untuk mendapatkan jumlah bobot kalimat. Bobot kalimat dengan score tinggi merupakan kalimat penting dalam sebuah dokumen berbahasa Jawa. Berdasarkan perhitungan TF-IDF, kalimat-kalimat tersebut yang akan dijadikan sebagai sebuah ringkasan. 34 Ringkasan adalah suatu teks yang dihasilkan dari satu atau lebih teks yang berisi bagian informasi yang signifikan dalam teks asal, dan yang tidak lebih dari setengah teks aslinya Hovy, Mitkov, 2005. Maka pada penelitian ini kalimat- kalimat yang diambil untuk dijadikan sebuah ringkasan adalah sebesar 40 dari total kalimat yang ada dalam sebuah dokumen. Misalkan ada 50 kalimat dalam sebuah dokumen, maka dalam penelitian ini akan diambil sekitar 20 kalimat yang memiliki score tinggi. Karena jika kalimat yang diambil dalam sebuah dokumen terlalu sedikit maka hasil ringkasan menjadi tidak sesuai dengan isi dokumen, hal ini yang menyebabkan ringkasan tidak relevan. Pengguna Sistem Admin Pengguna Admin Gambar 3.1 Gambaran Sistem Keseluruhan Koleksi Data Dokumen Prepocessing : Tokenizing. Stopword, Stemming Perhitungan TF-IDF Hasil Ringkasan Input Data Dokumen Input Data Dokumen 35

3.2 Analisis Kebutuhan