Latar Belakang Implementasi Knowledge Graph untuk Abstraksi Teks

I PENDAHULUAN

1.1 Latar Belakang

Sebuah bahan bacaan atau dokumen yang berupa wacana biasanya terdiri atas beberapa lembar yang isinya berupa rincian tentang bahan bacaan. Bahan bacaan tersebut memiliki poin-poin penting di dalamnya. Poin ini disebut juga intisari bacaan. Untuk mencari intisari bahan bacaan, si pembaca harus membaca keseluruhan bahan bacaan dan baru dapat menyimpulkan intisari bacaan. Menurut Febriatmoko 2011, cara termudah untuk mendapatkan informasi dari sebuah teks adalah dengan meringkasnya, karena membaca sebuah ringkasan tidak memerlukan waktu lama dibandingkan dengan membaca keseluruhan teks. Salah satu cara meringkas adalah text summary, yaitu mengambil kalimat utama atau sebagian kalimat dari setiap paragraf di dalam teks. Dalam penelitian Febriatmoko 2011, dokumen berbahasa Indonesia dianalisis menggunakan teori knowledge graph secara menyeluruh pada setiap dokumen untuk mendapatkan abstraksi teks, tetapi ada beberapa kekurangan atau kelemahan pada aturannya, seperti: pengubahan dokumen berbahasa Indonesia secara utuh ke dalam bentuk word graph membutuhkan waktu komputasi lebih lama daripada melakukan pengubahan dokumen berbahasa Indonesia dalam bentuk ringkasan atau hanya berisi poin-poin penting saja, serta penggunaan relasi PAR yang bersifat subjektif yang berdampak sukarnya mengimplementasikan aturan yang dibuat ke dalam aturan komputasi yang terstruktur. Dengan maksud yang sama dengan Febriatmoko 2011, penelitian ini juga bertujuan mendapatkan informasi penting dari suatu teks, tetapi dengan menggunakan cara yang berbeda. Cara yang digunakan, yaitu: mengombinasikan teknik pengambilan kalimat tertentu dalam suatu teks dengan teori knowledge graph. Dengan cara ini, hasil abstraksi teks diharapkan dapat merepresentasikan keseluruhan teks yang tidak berbeda jauh dengan cara Febriatmoko 2011. Knowledge graph adalah suatu metode baru di bidang natural language processing NLP. NLP adalah suatu proses yang menggunakan sistem spesial yang digunakan untuk mengekspresikan ide-ide manusia dalam bentuk informasi menjadi suatu pengetahuan Wulandari 2008. Metode knowledge graph pertama kali muncul pada tahun 1982 di Belanda. Pada awal pengembangan teori knowledge graph dalam aspek linguistik, teori ini dikembangkan dalam bahasa Inggris. Dengan demikian untuk bahasa Indonesia diperlukan suatu proses penstrukturan yang disesuaikan dengan bahasa Indonesia Hoede Nurdiati 2008b. Selanjutnya ringkasan didefinisikan sebagai sebuah teks yang dihasilkan dari satu atau lebih teks, mengandung informasi penting dari teks sumber dan panjangnya tidak lebih dari setengah teks sumber. Sistem peringkas teks otomatis diberi masukan berupa teks, dan melakukan peringkasan, lalu menghasilkan keluaran berupa teks yang lebih singkat dari teks sumber dan mengandung informasi utama dari teks sumber Hovy 2001. Kombinasi dari text summary dan teori knowledge graph diharapkan menghasilkan teknik pembuatan abstraksi teks yang baik dan efisien.

1.2 Tujuan