3
untuk melakukan optimasi bobot fitur ekstraksi pada peringkasan teks Bahasa Indonesia dikarenakan permasalahan bobot fitur ekstraksi tersebut dapat
direpresentasikan dalam bentuk kromosom. Evaluasi hasil peringkasan teks menggunakan Recall-Oriented Understudy
for Gisting Evaluation atau ROUGE Steinberger Jezek, 2009. ROUGE adalah toolkit evaluasi oleh Lin 2004 yang telah menjadi standar untuk evaluasi
peringkasan otomatis. ROUGE membandingkan ringkasan yang dihasilkan oleh program dengan ringkasan yang dihasilkan manusia. Evaluasi dilakukan dengan
menggunakan peraturan ROUGE n-gram. Menurut Suanmali et al 2009, ROUGE-1 memiliki korelasi tertinggi dengan penilaian manusia dengan tingkat
kepercayaan 95. Hal ini menyatakan bahwa ROUGE-1 secara konsisten sangat berkorelasi dengan penilaian manusia.
1.2 Rumusan Masalah
Adapun rumusan masalah yang dapat diambil dalam penulisan penelitian ini adalah:
a. Bagaimana membangun sistem yang mampu melakukan proses
peringkasan teks otomatis dokumen Bahasa Indonesia? b.
Bagaimana penggunaan algoritma genetika dalam mengoptimasi bobot tiap fitur teks peringkasan otomatis dokumen Bahasa Indonesia?
1.3 Batasan Masalah
Batasan masalah dalam penelitian ini adalah sebagai berikut. 1.
Sistem yang dibangun adalah sistem berbasis web. 2.
Pembuatan ringkasan sistem berdasarkan teknik ekstraksi. Tidak ada perubahan struktur kalimat dalam ringkasan. Ringkasan berupa gabungan
kalimat-kalimat terpenting dari teks asli. 3.
Pembuatan ringkasan hanya berlaku pada single-document tidak berlaku pada multi-document.
4. Dokumen teks yang digunakan adalah dokumen Bahasa Indonesia dari
penelitian Ridha 2002 dengan tema politik. 5.
Pengujian hasil ringkasan sistem menggunakan kompresi 30 dari jumlah kalimat dokumen asli.
4
6. Dokumen ringkasan manual yang digunakan untuk pengujian hasil
ringkasan sistem adalah ringkasan manual yang dibuat oleh dua orang pakar dalam bidang Sastra Indonesia.
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah merancang dan mengimplementasikan sebuah sistem peringkasan teks otomatis untuk dokumen berbahasa Indonesia
dengan algoritma genetika.
1.5 Manfaat Penelitian
Dengan menerapkan algoritma genetika dalam peringkasan teks otomatis dokumen Bahasa Indonesia diharapkan dapat menghasilkan ringkasan yang berisi
intisari dari keseluruhan dokumen sehingga pengguna sistem dapat membuat keputusan untuk melanjutkan membaca keseluruhan dokumen atau cukup dengan
membaca ringkasan.
1.6 Metodologi Penelitian
Pada sub bab metodologi penelitian ini akan menjelaskan langkah-langkah yang akan dilalui untuk melakukan perancangan sistem. Adapun sub bab bahasan
yang akan dijelaskan adalah desain penelitian, pengumpulan data, pengolahan data awal, dan metode yang digunakan.
1.6.1 Desain Penelitian
Penelitian ini mengambil judul “Peringkasan Teks Otomatis Dokumen Bahasa Indonesia dengan Algoritma Genetika
”. Desain penelitian yang digunakan dalam penelitian ini adalah riset eksperimental. Untuk menggambarkan
riset eksperimental bisa dilakukan pada dua kelompok dimana kelompok satu disebut control tanpa diberi perlakukan apapun sedangkan pada kelompok ke dua
diberikan perlakuan treatment Hasibuan 2007.
1.6.2 Pengumpulan Data
Jenis data yang digunakan pada penelitian ini adalah data sekunder, yaitu data yang didapat tidak secara langsung dari objek penelitian. Data sudah
dikumpulkan oleh pihak lain dengan berbagai cara atau metode. Dataset berasal dari penelitian Ridha 2002 yang diambil dari media online kompas.com dengan
tema politik dari tanggal 11 Maret 2002 sampai 11 April 2002. Dataset berjumlah
5
150 dokumen, 100 dokumen digunakan untuk tahap training dan 50 dokumen digunakan untuk tahap testing.
Dataset menggunakan dokumen dalam bentuk format XML sederhana, dan jenis dokumen yang digunakan bertipe teks. Gambar 1.1 merupakan contoh
format dokumen asli yang digunakan pada tahap pelatihan dan pengujian.
?xml version=1.0? ROOT
DOCUMENT TITLETim Koneksitas Kasus 27 Juli Hendaknya TransparanTITLE
TEXTJakarta, Kompas - Tim Pembela Demokrasi Indonesia TPDI selaku kuasa hukum Dewan Pimpinan Pusat Partai Demokrasi Indonesia Perjuangan DPP PDI-P meminta tim koneksitas yang menyidik kasus penyerbuan Kantor DPP PDI
Jalan Diponegoro Nomor 58 Jakarta tanggal 27 Juli 1996 Kasus 27 Juli bersikap transparan dan obyektif dalam mengungkap kasus tersebut. Para tersangka yang diajukan adalah bawahan yang sengaja dikorbankan, sementara pucuk
pimpinan pemegang komando diselamatkan tanpa proses hukum. Hal itu diungkapkan Koordinator TPDI Petrus Selestinus dalam surat yang ditujukan kepada Ketua Tim Koneksitas
Penyidikan Peristiwa 27 Juli 1996. Surat itu diperoleh Kompas hari Selasa 94. TPDI mengonstantir adanya kekuatan dan pengaruh dari pihak-pihak tertentu yang berhasil mempengaruhi dan membelokkan target penyidikan kasus 27 Juli, baik
untuk menentukan jumlah tersangka maupun untuk memperlemah bukti-bukti materiil dalam penuntutan dan persidangan pengadilan.
Indikasinya, kata Selestinus, hingga saat ini tim koneksitas belum berhasil memenuhi petunjuk jaksa penuntut umum untuk menyempurnakan hasil pemeriksaan tim koneksitas meskipun pengembalian berkas perkara telah sering dilakukan jaksa
kepada tim koneksitas. Selestinus menjelaskan, dalam penyidikan yang dilakukan Korps Reserse Mabes Polri ditemukan bukti bahwa yang terlibat dalam peristiwa 27 Juli 1996 itu adalah institusi dan oknum-oknum dari kalangan TNI, Polri, dan
sipil. Atas desakan Komisi II DPR dibentuk Tim Koneksitas selaku penyidik peristiwa 27 Juli 1996. Tim itu diketuai oleh Kepala Korps Reserse Mabes Polri dan Komandan Pusat Polisi Militer Puspom-sebagai wakil ketua.
Mengutip laporan polisi No Pol: LP1939VII1996 tanggal 7 Agustus 1996 dan No 106A-106VII1998 tanggal 31 Juli 1998, Selestinus mengatakan, nama Jenderal Purn Feisal Tanjung dan Jenderal Pol Purn Dibyo Widodo dilaporkan
untuk diperiksa dan diminta pertanggungjawabannya. Akan tetapi, dalam perkembangan penyidikan Tim Koneksitas, kedua nama tersebut hilang begitu saja tanpa diadakan penyidikan secara lebih mendalam mengenai keterlibatan kedua
jenderal dimaksud.TEXT DOCUMENT
ROOT
Gambar 1.1 Format Dokumen Asli
Dokumen yang sudah dikumpulkan kemudian akan diringkas secara manual oleh dua orang pakar Bahasa Indonesia. Peringkasan manual ini bertujuan
untuk mengevaluasi hasil ringkasan sistem dengan cara membandingkan hasil
6
ringkasan sistem dengan hasil ringkasan manual. Ringkasan manual juga disimpan dalam format xml.
1.6.3 Pengolahan Data Awal
Proses yang dilakukan setelah mendapatkan data terkait dengan penelitian yaitu pengolahan data sehingga data tersebut diubah dan menjadi informasi yang
berguna. Data-data yang diperoleh tersebut, selanjutnya akan diolah sesuai
kebutuhan sistem. Untuk dapat melakukan proses perhitungan selanjutnya, maka data dokumen yang telah dikumpulkan perlu dilakukan proses awal atau disebut
sebagai text preprocessing.
1.6.4 Metode yang Digunakan
Pada sistem peringkasan teks otomatis dokumen Bahasa Indonesia ini menggunakan algoritma genetika untuk menghitung nilai fitness yang tertinggi
dalam menentukan kromosom dalam kasus ini bobot fitur-fitur ekstraksi teks.
7
BAB II TINJAUAN PUSTAKA
2.1 Peringkasan Teks Otomatis
Peringkasan teks otomatis adalah proses mengurangi teks pada dokumen dengan menggunakan program komputer untuk membuat ringkasan yang
berisikan poin-poin penting dimana hasil ringkasan tidak lebih dari setengah dokumen asli Radev et al, 2002. Terdapat dua bagian dari kriteria peringkasan
teks yaitu ekstraksi dan abstraksi Suanmali et al, 2009. Teknik ekstraksi yaitu teknik peringkasan secara lengkap yang terdiri dari urutan-urutan kalimat yang
disalin dan memilih bagian-bagian kalimat penting dari dokumen asli. Sedangkan teknik abstraksi adalah teknik peringkasan dengan mengambil informasi penting
dari dokumen kemudian menghasilkan ringkasan yang menggunakan kalimat baru yang tidak terdapat pada dokumen asli.
2.2 Kalimat