I PENDAHULUAN
1.1 Latar Belakang
Sebuah bahan bacaan atau dokumen yang berupa wacana biasanya terdiri atas beberapa
lembar yang isinya berupa rincian tentang bahan bacaan. Bahan bacaan tersebut
memiliki poin-poin penting di dalamnya. Poin ini disebut juga intisari bacaan. Untuk
mencari intisari bahan bacaan, si pembaca harus membaca keseluruhan bahan bacaan
dan baru dapat menyimpulkan intisari bacaan.
Menurut Febriatmoko
2011, cara
termudah untuk mendapatkan informasi dari sebuah teks adalah dengan meringkasnya,
karena membaca sebuah ringkasan tidak memerlukan
waktu lama
dibandingkan dengan membaca keseluruhan teks. Salah
satu cara meringkas adalah text summary, yaitu mengambil kalimat utama atau sebagian
kalimat dari setiap paragraf di dalam teks.
Dalam penelitian Febriatmoko 2011, dokumen berbahasa Indonesia dianalisis
menggunakan teori knowledge graph secara menyeluruh pada setiap dokumen untuk
mendapatkan abstraksi teks, tetapi ada beberapa kekurangan atau kelemahan pada
aturannya, seperti: pengubahan dokumen berbahasa Indonesia secara utuh ke dalam
bentuk word graph membutuhkan waktu komputasi lebih lama daripada melakukan
pengubahan dokumen berbahasa Indonesia dalam bentuk ringkasan atau hanya berisi
poin-poin penting saja, serta penggunaan relasi PAR yang bersifat subjektif yang
berdampak sukarnya mengimplementasikan aturan yang dibuat ke dalam aturan
komputasi yang terstruktur.
Dengan maksud yang sama dengan Febriatmoko 2011, penelitian ini juga
bertujuan mendapatkan informasi penting dari suatu teks, tetapi dengan menggunakan
cara yang berbeda. Cara yang digunakan, yaitu: mengombinasikan teknik pengambilan
kalimat tertentu dalam suatu teks dengan teori knowledge graph. Dengan cara ini, hasil
abstraksi teks
diharapkan dapat
merepresentasikan keseluruhan teks yang tidak berbeda jauh dengan cara Febriatmoko
2011. Knowledge graph adalah suatu metode
baru di bidang natural language processing NLP. NLP adalah suatu proses yang
menggunakan sistem spesial yang digunakan untuk mengekspresikan ide-ide manusia
dalam bentuk informasi menjadi suatu pengetahuan Wulandari 2008.
Metode knowledge graph pertama kali muncul pada tahun 1982 di Belanda. Pada
awal pengembangan teori knowledge graph dalam
aspek linguistik,
teori ini
dikembangkan dalam bahasa Inggris. Dengan demikian untuk bahasa Indonesia diperlukan
suatu proses penstrukturan yang disesuaikan dengan bahasa Indonesia Hoede Nurdiati
2008b.
Selanjutnya ringkasan
didefinisikan sebagai sebuah teks yang dihasilkan dari satu
atau lebih teks, mengandung informasi penting dari teks sumber dan panjangnya
tidak lebih dari setengah teks sumber. Sistem peringkas teks otomatis diberi masukan
berupa teks, dan melakukan peringkasan, lalu menghasilkan keluaran berupa teks yang
lebih
singkat dari
teks sumber
dan mengandung informasi utama dari teks
sumber Hovy 2001. Kombinasi dari text summary
dan teori
knowledge graph
diharapkan menghasilkan teknik pembuatan abstraksi teks yang baik dan efisien.
1.2 Tujuan