Latar Belakang Masalah PENDAHULUAN

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Pada saat ini telah berkembang cabang ilmu bahasa komputasi berupa teknologi Natural Language Processing NLP. Teknologi NLP adalah teknologi yang memungkinkan untuk melakukan transaksi bahasa alami, yaitu bahasa yang biasa disampaikan oleh manusia. Beberapa di antara kategori aplikasi NLP adalah natural language translator, translator, dan text summarization Arman 2004. Kategori terakhir telah menghasilkan suatu sistem yang melakukan ringkasan dari puluhan bahkan ratusan teks dengan tema yang sama untuk kemudian menjadi rangkuman sehingga dihasilkan pengetahuan baru. Salah satu metode baru NLP yang sedang diteliti adalah knowledge graph KG. Metode ini mencoba melakukan tinjauan dalam menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru Zhang 2002. Setiap orang dalam menganalisis teks pasti berbeda-beda dan bersifat subjektif. Perbedaan inilah yang menyebabkan ambiguitas dalam memahami sebuah naskah, oleh karenanya diperlukan kejelasan dalam penggunaan bahasa. Menurut Zhang, sudut pandang suatu masalah bagi setiap orang sangat subjektif, orang yang berbeda akan menggambarkan pengalaman yang ditemui ke dalam konsep secara berbeda; artinya, satu konsep dengan bahasa yang sama belum tentu diinterpretasikan dengan pemahaman yang sama pula. Beberapa penelitian sebelumnya telah membahas proses ekstraksi teks, di antaranya bagaimana meringkas teks dari dokumen yang panjang menjadi beberapa paragraf sehingga didapat pengetahuan baru yang lebih sederhana tanpa mengurangi informasi yang terkandung dalam teks tersebut. Tentunya, hal ini sangat menguntungkan dan memudahkan bagi pengguna dalam memahami teks yang banyak. Salah satu metode yang digunakan pada proses pemangkasan teks tersebut adalah text summarization yang lebih dulu diteliti. Pada penelitian selanjutnya, metode knowledge graph menjadi objek pembahasan yang penting, karena cara menganalisisnya memperhatikan teks berdasarkan semantik arti kata. Meskipun pada prinsipnya metode knowledge graph hampir sama dengan text summarization, namun sudut pandang dan dasar analisisnya berbeda. Penelitian tentang KG telah dilakukan oleh beberapa orang, di antaranya: Hulliyah 2007 yang menganalisis teks dengan tema pendidikan nasional, Ikhwati 2007 menganalisis teks dengan tema kemiskinan, Berri 2008 memodifikasi kalimat sembarang menjadi kalimat efektif kemudian menransformasi menjadi text graph dan merancang algoritme dari text graph tersebut, Wulandari 2008 meneliti perancangan algoritme dari combined graph dan simplified graph, serta Rusiyamti 2008 yang membangun prosedur chunk indicator kemudian membuat chunk graph dan menggabungkan beberapa chunk graph menjadi sentence graph. Masing-masing penelitian di atas, belum sepenuhnya menyentuh secara spesifik aturan bagaimana merumuskan word graph kata benda, kata kerja, kata sifat, maupun preposisi. Perancangan aturan untuk semua jenis kata agar terbangun word graph bukanlah sesuatu yang mudah dan cepat, melainkan perlu waktu yang relatif lama dan kerja keras. Oleh karena itu, penulis tertarik melakukan penelitian tentang KG dan membatasinya pada aturan pembentukan word graph kata kerja.

1.2 Tujuan dan Manfaat Penelitian