Latar Belakang Masalah Kontraksi pola graf klausa Bahasa Indonesia menggunakan metode knowledge graph

1 PENDAHULUAN

1.1 Latar Belakang Masalah

Bahasa alami atau bahasa natural adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia. Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan tertentu, misalnya bahasa pemrograman komputer Arman 2004. Komunikasi antara komputer dan manusia hanya mungkin jika ada pendekatan yang mampu menjembatani bahasa alami dan bahasa komputer. Beberapa metode yang sudah dikenal adalah natural language processing NLP, natural language understanding, atau computational linguistics Zhang 2002. NLP mencoba membuat komputer mampu memahami suatu perintah yang dituliskan dalam bentuk bahasa sehari-hari. Saat ini sudah ada penelitian mengenai NLP. Salah satu metode yang digunakan dalam NLP adalah Knowledge Graph KG yang merupakan metode baru dalam metode representasi pengetahuan. Metode ini membuat model penjelasan semantik untuk persepsi manusia dan pengolahan informasi berdasarkan filsafat dan psikologi Zhang 2002. Penelitian tentang KG pada mulanya dipelopori oleh Hoede dan Stokman pada tahun 1982 yang menyarikan pengetahuan dari teks bidang medis dan sosiologi. Pada tahun 2002, Zhang meneliti tentang teori KG dan structural parsing. Structural parsing adalah pemetaan suatu kalimat pada suatu semantic sentence graph Zhang 2002. Prinsipnya, setiap kata mempunyai word graph dan setiap kalimat mempunyai sentence graph, sedangkan sentence graph terbentuk dari word graph yang ada pada kalimat. Saat itu, Zhang sudah meneliti tentang penerapan metode KG untuk dokumen berbahasa Inggris dan Cina. Pengembangan metode KG untuk dokumen berbahasa Indonesia sebenarnya sudah dimulai dan dipelopori oleh Sri Nurdiati dan beberapa mahasiswa bimbingannya. Hulliyah 2007 menganalisis teks dari dokumen tsunami. Ikhwati 2007 menganalisis teks dari dokumen kemiskinan. Berri 2008 mengubah kalimat sembarang menjadi kalimat efektif kemudian ditransformasi menjadi text graph dan merancang algoritme pembentukan text graph. Wulandari 2008 merancang algoritme combined graph dan simplified graph. Rusiyamti 2008 menentukan chunk indicators yang digunakan sebagai petunjuk dalam menganalisis teks berbahasa Indonesia yang akan ditampilkan dalam bentuk graf. Saleh 2009 merancang aturan dan menyusun word graph kata benda. Muslik 2009 merancang aturan dan menyusun word graph kata kerja. Rahmat 2009 merancang aturan dan menyusun word graph kata sifat. Anggraeni 2009 merancang aturan dan menyusun word graph preposisi. Samba 2010 merancang aturan dan menyusun word graph kata keterangan, dan Mahmuda 2010 merancang aturan dan menyusun graf frasa bahasa Indonesia. Aturan dan kamus word graph tersebut belum juga dapat digunakan untuk menganalisis suatu kalimat. Analisis suatu kalimat membutuhkan aturan pembentukan satuan sintaksis di bawah kalimat yaitu klausa. Konstruksi pola graf klausa bahasa Indonesia bukanlah sesuatu yang mudah dan cepat, melainkan perlu waktu yang relatif lama. Begitu juga dengan klausa bahasa Indonesia yang terlalu luas dan kompleks, karena klausa berpotensi menjadi sebuah kalimat, baik kalimat sederhana maupun kalimat majemuk. Kalimat majemuk terbagi lagi menjadi kalimat majemuk setara dan kalimat majemuk bertingkat. Kalimat majemuk bertingkat terbentuk oleh dua bagian klausa, yaitu klausa utama atau induk kalimat dan klausa subordinatif atau anak kalimat. Oleh karena itu, penulis tertarik melakukan penelitian tentang KG dan membatasinya pada aturan pembentukan graf klausa bahasa Indonesia, khususnya untuk klausa subordinatif.

1.2 Tujuan dan Manfaat Penelitian