2
Peringkasan teks otomatis automatic text summarization adalah proses menghasilkan teks yang lebih pendek daripada teks aslinya menggunakan perangkat
berbasis komputer. Banyak instansi yang bergerak dalam penyaluran informasi masyarakat atau berita yang pada awalnya menyampaikan berita melalui media
Televisi, Surat Kabar, Majalah atau Radio sudah mulai menggunakan sistem berbasis web untuk menyampaikan beritanya secara up to date Fajar, 2008. Aplikasi
peringkasan teks otomatis merupakan teknologi yang menawarkan solusi untuk mencari informasi dengan menghasilkan ringkasan summary berita.
Term frequency inverse document frequency TF-IDF adalah salah satu metode yang dapat digunakan untuk melakukan peringkasan teks. Metode TF-IDF
adalah cara pemberian bobot hubungan suatu kata term terhadap dokumen. Untuk dokumen tunggal tiap kalimat dianggap sebagai dokumen. Metode ini
menggabungkan dua konsep untuk penghitungan bobot, yaitu Term Frequency TF merupakan frekuensi kemunculan kata t pada kalimat d. Document Frequency
DF adalah banyaknya kalimat dimana suatu kata t muncul. Berdasarkan dari uraian latar belakang diatas, maka penulis memilih judul
“peringkasan teks berita secara otomatis menggunakan term frequency inverse document frequency“.
1.2. Rumusan Masalah
Berdasarkan latar belakang di atas maka rumusan masalah pada penelitian ini adalah bagaimana mendapatkan ringkasan pada sebuah berita secara otomatis.
1.3. Tujuan Penelitian
Tujuan dari penelitian ini adalah penggunaan TF-IDF term frequency inverse document frequency untuk memperoleh ringkasan berita secara otomatis dan
mengetahui ringkasan dari suatu berita dengan cepat.
1.4. Manfaat Penelitian
Manfaat yang dapat diperoleh dari penelitian ini adalah: 1. Memberikan efisiensi waktu bagi para pembaca berita dalam memahami berita
melalui ringkasan berita.
Universitas Sumatera Utara
3
2. Mengetahui kemampuan TF-IDF term frequency inverse document frequency untuk memperoleh ringkasan berita secara otomatis.
3. Menambah ilmu pengetahuan serta menjadi bahan referensi dan perbandingan untuk penelitian yang berkaitan dengan penggunaan term frequency inverse
document frequency.
1.5. Batasan Masalah
Guna mencegah meluasnya cakupan permasalahan yang akan dibahas dalam studi ini dan untuk membuat studi ini lebih terarah, maka dilakukan pembatasan masalah
sebagai berikut: 1. Algoritma yang digunakan dalam peringkasan ini adalah term frequency
inverse document frequency. 2. Data yang digunakan adalah berita politik
3. Jumlah data yang digunakan 50 berita 4. Berita yang digunakan dalam penelitian ini hanya berita berbahasa Indonesia.
5. Berita yang dimasukkan ke dalam sistem peringkasan adalah berita yang sudah dinyatakan layak untuk dipublikasikan.
6. Penelitian ini tidak melakukan perbandingan algoritma. 7. Perancangan program aplikasi sistem peringkas teks berita ini menggunakan
bahasa pemrograman PHP. 8. Sistem ini dibangun tidak disatukan dengan media berita yang sudah ada tetapi
dengan membuat homepage sendiri dan mengunakan jaringan offline.
1.6. Metodologi Penelitian
Dalam penelitian ini, penulis melakukan beberapa metode untuk memperoleh data atau informasi dalam menyelesaikan permasalahan. Metode yang dilakukan tersebut
antara lain : 1. Studi Literatur
Dilakukan studi literatur atau studi pustaka yaitu mengumpulkan bahan-bahan referensi baik dari buku, artikel, paper, jurnal, makalah, maupun situs internet.
2. Analisis Hal-hal yang dilakukan tahap ini adalah :
Universitas Sumatera Utara
4
a. Menganalisis tahap demi tahap dari proses peringkasan teks. b. Cara kerja dari algoritma term frequency invers document frequency dalam
meringkas teks. 3. Perancangan
Pada tahap ini dilakukan perancangan arsitektur, perancangan data, dan perancangan antarmuka.
4. Pengkodean Pada tahap ini akan dilakukan proses implementasi pengkodean program
dalam aplikasi komputer menggunakan bahasa pemrograman yang telah ditentukan.
5. Pengujian Pada tahap ini dilakukan proses pengujian dan percobaan terhadap sistem
sesuai dengan spesifikasi yang ditentukan sebelumnya serta memastikan program yang dibuat dapat berjalan seperti yang diharapkan.
6. Penyusunan Laporan Pada tahap ini dilakukan penulisan dokumentasi hasil analisis dan
implementasi.
1.7. Sistematika Penulisan