Rumusan Masalah Batasan Masalah Tujuan Penelitian Manfaat Penelitian Peringkasan Teks Otomatis

3 untuk melakukan optimasi bobot fitur ekstraksi pada peringkasan teks Bahasa Indonesia dikarenakan permasalahan bobot fitur ekstraksi tersebut dapat direpresentasikan dalam bentuk kromosom. Evaluasi hasil peringkasan teks menggunakan Recall-Oriented Understudy for Gisting Evaluation atau ROUGE Steinberger Jezek, 2009. ROUGE adalah toolkit evaluasi oleh Lin 2004 yang telah menjadi standar untuk evaluasi peringkasan otomatis. ROUGE membandingkan ringkasan yang dihasilkan oleh program dengan ringkasan yang dihasilkan manusia. Evaluasi dilakukan dengan menggunakan peraturan ROUGE n-gram. Menurut Suanmali et al 2009, ROUGE-1 memiliki korelasi tertinggi dengan penilaian manusia dengan tingkat kepercayaan 95. Hal ini menyatakan bahwa ROUGE-1 secara konsisten sangat berkorelasi dengan penilaian manusia.

1.2 Rumusan Masalah

Adapun rumusan masalah yang dapat diambil dalam penulisan penelitian ini adalah: a. Bagaimana membangun sistem yang mampu melakukan proses peringkasan teks otomatis dokumen Bahasa Indonesia? b. Bagaimana penggunaan algoritma genetika dalam mengoptimasi bobot tiap fitur teks peringkasan otomatis dokumen Bahasa Indonesia?

1.3 Batasan Masalah

Batasan masalah dalam penelitian ini adalah sebagai berikut. 1. Sistem yang dibangun adalah sistem berbasis web. 2. Pembuatan ringkasan sistem berdasarkan teknik ekstraksi. Tidak ada perubahan struktur kalimat dalam ringkasan. Ringkasan berupa gabungan kalimat-kalimat terpenting dari teks asli. 3. Pembuatan ringkasan hanya berlaku pada single-document tidak berlaku pada multi-document. 4. Dokumen teks yang digunakan adalah dokumen Bahasa Indonesia dari penelitian Ridha 2002 dengan tema politik. 5. Pengujian hasil ringkasan sistem menggunakan kompresi 30 dari jumlah kalimat dokumen asli. 4 6. Dokumen ringkasan manual yang digunakan untuk pengujian hasil ringkasan sistem adalah ringkasan manual yang dibuat oleh dua orang pakar dalam bidang Sastra Indonesia.

1.4 Tujuan Penelitian

Tujuan dari penelitian ini adalah merancang dan mengimplementasikan sebuah sistem peringkasan teks otomatis untuk dokumen berbahasa Indonesia dengan algoritma genetika.

1.5 Manfaat Penelitian

Dengan menerapkan algoritma genetika dalam peringkasan teks otomatis dokumen Bahasa Indonesia diharapkan dapat menghasilkan ringkasan yang berisi intisari dari keseluruhan dokumen sehingga pengguna sistem dapat membuat keputusan untuk melanjutkan membaca keseluruhan dokumen atau cukup dengan membaca ringkasan.

1.6 Metodologi Penelitian

Pada sub bab metodologi penelitian ini akan menjelaskan langkah-langkah yang akan dilalui untuk melakukan perancangan sistem. Adapun sub bab bahasan yang akan dijelaskan adalah desain penelitian, pengumpulan data, pengolahan data awal, dan metode yang digunakan.

1.6.1 Desain Penelitian

Penelitian ini mengambil judul “Peringkasan Teks Otomatis Dokumen Bahasa Indonesia dengan Algoritma Genetika ”. Desain penelitian yang digunakan dalam penelitian ini adalah riset eksperimental. Untuk menggambarkan riset eksperimental bisa dilakukan pada dua kelompok dimana kelompok satu disebut control tanpa diberi perlakukan apapun sedangkan pada kelompok ke dua diberikan perlakuan treatment Hasibuan 2007.

1.6.2 Pengumpulan Data

Jenis data yang digunakan pada penelitian ini adalah data sekunder, yaitu data yang didapat tidak secara langsung dari objek penelitian. Data sudah dikumpulkan oleh pihak lain dengan berbagai cara atau metode. Dataset berasal dari penelitian Ridha 2002 yang diambil dari media online kompas.com dengan tema politik dari tanggal 11 Maret 2002 sampai 11 April 2002. Dataset berjumlah 5 150 dokumen, 100 dokumen digunakan untuk tahap training dan 50 dokumen digunakan untuk tahap testing. Dataset menggunakan dokumen dalam bentuk format XML sederhana, dan jenis dokumen yang digunakan bertipe teks. Gambar 1.1 merupakan contoh format dokumen asli yang digunakan pada tahap pelatihan dan pengujian. ?xml version=1.0? ROOT DOCUMENT TITLETim Koneksitas Kasus 27 Juli Hendaknya TransparanTITLE TEXTJakarta, Kompas - Tim Pembela Demokrasi Indonesia TPDI selaku kuasa hukum Dewan Pimpinan Pusat Partai Demokrasi Indonesia Perjuangan DPP PDI-P meminta tim koneksitas yang menyidik kasus penyerbuan Kantor DPP PDI Jalan Diponegoro Nomor 58 Jakarta tanggal 27 Juli 1996 Kasus 27 Juli bersikap transparan dan obyektif dalam mengungkap kasus tersebut. Para tersangka yang diajukan adalah bawahan yang sengaja dikorbankan, sementara pucuk pimpinan pemegang komando diselamatkan tanpa proses hukum. Hal itu diungkapkan Koordinator TPDI Petrus Selestinus dalam surat yang ditujukan kepada Ketua Tim Koneksitas Penyidikan Peristiwa 27 Juli 1996. Surat itu diperoleh Kompas hari Selasa 94. TPDI mengonstantir adanya kekuatan dan pengaruh dari pihak-pihak tertentu yang berhasil mempengaruhi dan membelokkan target penyidikan kasus 27 Juli, baik untuk menentukan jumlah tersangka maupun untuk memperlemah bukti-bukti materiil dalam penuntutan dan persidangan pengadilan. Indikasinya, kata Selestinus, hingga saat ini tim koneksitas belum berhasil memenuhi petunjuk jaksa penuntut umum untuk menyempurnakan hasil pemeriksaan tim koneksitas meskipun pengembalian berkas perkara telah sering dilakukan jaksa kepada tim koneksitas. Selestinus menjelaskan, dalam penyidikan yang dilakukan Korps Reserse Mabes Polri ditemukan bukti bahwa yang terlibat dalam peristiwa 27 Juli 1996 itu adalah institusi dan oknum-oknum dari kalangan TNI, Polri, dan sipil. Atas desakan Komisi II DPR dibentuk Tim Koneksitas selaku penyidik peristiwa 27 Juli 1996. Tim itu diketuai oleh Kepala Korps Reserse Mabes Polri dan Komandan Pusat Polisi Militer Puspom-sebagai wakil ketua. Mengutip laporan polisi No Pol: LP1939VII1996 tanggal 7 Agustus 1996 dan No 106A-106VII1998 tanggal 31 Juli 1998, Selestinus mengatakan, nama Jenderal Purn Feisal Tanjung dan Jenderal Pol Purn Dibyo Widodo dilaporkan untuk diperiksa dan diminta pertanggungjawabannya. Akan tetapi, dalam perkembangan penyidikan Tim Koneksitas, kedua nama tersebut hilang begitu saja tanpa diadakan penyidikan secara lebih mendalam mengenai keterlibatan kedua jenderal dimaksud.TEXT DOCUMENT ROOT Gambar 1.1 Format Dokumen Asli Dokumen yang sudah dikumpulkan kemudian akan diringkas secara manual oleh dua orang pakar Bahasa Indonesia. Peringkasan manual ini bertujuan untuk mengevaluasi hasil ringkasan sistem dengan cara membandingkan hasil 6 ringkasan sistem dengan hasil ringkasan manual. Ringkasan manual juga disimpan dalam format xml.

1.6.3 Pengolahan Data Awal

Proses yang dilakukan setelah mendapatkan data terkait dengan penelitian yaitu pengolahan data sehingga data tersebut diubah dan menjadi informasi yang berguna. Data-data yang diperoleh tersebut, selanjutnya akan diolah sesuai kebutuhan sistem. Untuk dapat melakukan proses perhitungan selanjutnya, maka data dokumen yang telah dikumpulkan perlu dilakukan proses awal atau disebut sebagai text preprocessing.

1.6.4 Metode yang Digunakan

Pada sistem peringkasan teks otomatis dokumen Bahasa Indonesia ini menggunakan algoritma genetika untuk menghitung nilai fitness yang tertinggi dalam menentukan kromosom dalam kasus ini bobot fitur-fitur ekstraksi teks. 7 BAB II TINJAUAN PUSTAKA

2.1 Peringkasan Teks Otomatis

Peringkasan teks otomatis adalah proses mengurangi teks pada dokumen dengan menggunakan program komputer untuk membuat ringkasan yang berisikan poin-poin penting dimana hasil ringkasan tidak lebih dari setengah dokumen asli Radev et al, 2002. Terdapat dua bagian dari kriteria peringkasan teks yaitu ekstraksi dan abstraksi Suanmali et al, 2009. Teknik ekstraksi yaitu teknik peringkasan secara lengkap yang terdiri dari urutan-urutan kalimat yang disalin dan memilih bagian-bagian kalimat penting dari dokumen asli. Sedangkan teknik abstraksi adalah teknik peringkasan dengan mengambil informasi penting dari dokumen kemudian menghasilkan ringkasan yang menggunakan kalimat baru yang tidak terdapat pada dokumen asli.

2.2 Kalimat