Pembobotan Fitur Ekstraksi Teks Evaluasi Hasil Ringkasan Sistem

18 Tabel 2.5 Data Matriks Kemiripan S1 S2 S3 Total Skor S1 1 0.178555 0.326131 S2 1 0.12832 0.31223 S3 0.178555 0.12832 1 0.36164 Jumlah 1.178555 1.12832 1.306875 3.613749

2.5 Pembobotan Fitur Ekstraksi Teks

Pembobotan fitur ekstraksi teks adalah sebuah pendekatan yang dilakukan untuk menentukan kepentingan suatu fitur dari fitur-fitur yang akan diteliti dengan cara mengalikan bobot dengan skor fitur ekstraksi Berker Gungor, 2012. Pembobotan ini sangat berpengaruh terhadap akurasi hasil ringkasan sistem nantinya. Pembobotan fitur pada tugas akhir ini menggunakan algoritma genetika untuk memperoleh bobot yang optimal untuk tiap-tiap fiturnya. Skor untuk tiap kalimat dapat dihitung dengan menggunakan rumus 2.6: 2.6 Diasumsikan w i adalah bobot fitur ke-i dan f i adalah fitur ekstraksi ke-i.

2.6 Evaluasi Hasil Ringkasan Sistem

Secara garis besar, metode evaluasi peringkasan teks otomatis dapat dikategorikan menjadi dua, yaitu metode intrinsik dan metode ekstrinsik Steinberger Jezek, 2009. Metode intrinsik yaitu menguji kualitas ringkasan yang dihasilkan. Metode ekstrinsik menguji performansi hasil ringkasan dalam memenuhi tugas-tugas tertentu, misalnya penggunaan hasil ringkasan pada information retrieval. Taksonomi evaluasi peringkasan teks dapat dilihat pada Gambar 2.4. Metode evaluasi yang sering dilakukan pada penelitian peringkasan teks adalah metode intrinsik. Pendekatan dalam evaluasi intrinsik yang dilakukan adalah membandingkan hasil peringkasan sistem dengan ringkasan ideal. Ringkasan ideal dapat dibuat khusus oleh pakar atau dengan menggabungkan ringkasan-ringkasan yang dibuat oleh manusia menjadi sebuah ringkasan ideal. 19 Gambar 2.4 Taksonomi pengujian peringkasan teks Penelitian ini menggunakan metode evaluasi Recall-Oriented Understudy for Gisting Evaluation ROUGE. ROUGE menghitung jumlah n-gram kata yang overlap antara ringkasan sistem dengan ringkasan referensi Adapun teknik penghitungan ROUGE-N antara sebuah ringkasan sistem dan sekumpulan ringkasan manual terdapat pada persamaan 2.7. 2.7 Dimana n adalah panjang dari n-gram, Count match gram n adalah jumlah n- gram yang sama antara sebuah ringkasan sistem dan sebuah ringkasan referensi, Countgram n adalah jumlah n-gram dalam ringkasan referensi. Tabel 2.6 menunjukkan contoh perhitungan ROUGE-N pada Document Understanding Conference 2003 Lin, 2004. C1 adalah kalimat ringkasan sistem. R1 dan R2 adalah kalimat dalam sebuah ringkasan referensi. Asumsikan bahwa C1, R1 dan R2 sudah melewati proses text preprocessing. Ada 20 unigram, 19 bigram, 18 trigram, dan 17 4-gram token dari R1 dan R2 yang tercantum dalam kolom total. Kolom match adalah jumlah kecocokan dari setiap ringkasan referensi. Skor akhir adalah perbandingan antara nilai Match dengan Total.  C1 : pulses may ease schizophrenic voices  R1 : magnetic pulse series sent through brain may ease schizophrenic voices 20  R2 : yale finds magnetic stimulation some relief to schizophrenics imaginary voices Tabel 2.6 Contoh Perhitungan ROUGE n R1 R2 Match Total Score ROUGE 1 may, ease, schizophrenic, voices Voices 5 20 0.25 ROUGE 2 may ease, ease schizophrenic, schizophrenic voices - 3 19 0.16 ROUGE 3 may ease schizophrenic, ease schizophrenic voices - 2 18 0.11 ROUGE 4 may ease schizophrenic, ease schizophrenic voices - 1 17 0.05 Studi awal dari Lin dan Hovy tahun 2003 Steinberger Jezek, 2009 menunjukkan bahwa evaluasi otomatis menggunakan versi unigram dari dari ROUGE-N, yaitu ROUGE-1 berkolerasi baik dengan evaluasi manusia berdasarkan berbagai statistik. Oleh karena itu penelitian ini menggunakan evaluasi hasil ringkasan sistem dengan ROUGE-1.

2.7 Algoritma Genetika