Penambahan modul pembentukan Word Graph kata kerja pada aplikasi BogorDelftConstruct
ii
ABSTRACT
CHRISTIAN HENRY. The development of verb word graph module in BogorDelftConstruct appplication. Directed by SRI NURDIATI.
Knowledge Graph (KG) is one of natural language processing methods that is able to represent the result of semantic analysis of a text in a graph form. Until now, there are only a few researches using KG to do semantic analysis for texts in Indonesian language. They were mainly focus on analyzing text, constructing rules to analyze text and engineering to understand the text. Some other researches have done semantic analysis from various part-of-speech. Nevertheless, the results of the research have not been implemented yet. To realize a long term goal of doing text abstraction automatically, BogorDelftConstruct has been developed as an early stage prototype. In line with that, this research implemented semantic analysis for one part-of-speech in BogorDelftConstruct.
The objective of the research is to develop a module dictionary of verb word graph taken from the result of previous research in BogorDelftConstruct system. The verb to be analyzed has 10 patterns of word graph which formed by affixation. Word graph pattern formation process begins by knowing the basic word and affix using stemming. This stemming process refers to the adjusted Kamus Besar Bahasa Indonesia (KBBI). Basic word and affixe from the result of stemming will be used to determine appropriate pattern of the verb word graph. Appropriate pattern of the verb word graph will be generated and displayed on the system.
Development of a verb word graph module has been able to identify 10 patterns of the verb word graph. The system however can only recognize one-word-verb so each entry is assumed to be intransitive verb that does not need to be followed by an object. The results of testing with 171 entries from overall yield was 98.83% accuracy. Despite of having a good accuracy, this system still has some short comings, such as could not process input with more than one words. This problem is expected to be the focus of the following research.
(2)
1
PENDAHULUAN
Latar Belakang
Bahasa alami yang digunakan manusia untuk berkomunikasi satu sama lain sangat bermanfaat dan penting dalam penyampaian informasi secara langsung. Di lain pihak, komputer masih sulit untuk memahami bahasa alami manusia. Dalam ilmu komputer bidang yang secara spesifik mempelajari cara komunikasi antara manusia dan komputer adalah Natural Language Processing (NLP). Sebuah kalimat dalam bahasa alami dapat dianalisis dari sudut pandang semantik atau sintaksis. Knowledge Graph merupakan salah satu metode dalam NLP yang menganalisis bahasa alami dengan lebih berfokus pada semantik daripada sintaksis.
Pengimplementasian metode Knowledge Graph pada bahasa alami diharapkan mampu memberikan abstraksi dari informasi atau pengetahuan yang terkandung di dalamnya ke dalam bentuk graf. Salah satu penelitian yang telah berhasil mengimplementasikan metode
Knowladge Graph pada suatu bahasa alami adalah DelftConstruct yang dikembangkan oleh Mark Van Koningsveld pada tahun 2003-2008.
DelfConStruct merupakan sebuah prototype
aplikasi untuk menganalisis Bahasa Inggris dan disajikan ke dalam bentuk graf dengan menggunakan metode Knowladge Graph. DelftConstruct dibangun menggunakan bahasa pemrograman MATLAB yang dapat membentuk suatu graf antara suatu kata dengan kata lainnya (word graph), namun belum sesuai dengan konsep Knowladge Graph (Romadoni 2009). Selain itu, DelftConstruct memiliki beberapa kekurangan antara lain:
• Belum memiliki fitur Dictionary untuk menyimpan, menampilkan dan mengubah graf.
• Ketidakjelasan arah relasi antar token, karena tidak adanya tanda panah yang menunjuk dari dan/atau ke suatu token.
• Belum memiliki kemampuan untuk membuat graf baru. Hanya mampu mengubah graf yang sedang ditampilkan.
• Belum mampu untuk menghapus token dan/atau teks.
• Tidak memiliki mekanisme untuk menampilkan graf lain yang sudah dibuat.
Dengan keterbatasan DelfConStruct yang hanya mampu menganalisis teks berbahasa Inggris maka dikembangkan BogorDelftConstruct yang nantinya mampu
menganalisis teks bahasa Indonesia dengan visualisasi graf sesuai yang dengan konsep
Knowledge Graph. Dengan pembentukan modul
word graph yang ada pada Bogor
DelfConStruct maka akan dikembangkan modul
word graph untuk kata kerja. Analisis bentuk dan makna dari kata kerja telah dilakukan pada penelitian sebelumnya oleh Ahmad Muslik (2009) yang menghasilkan pola aturan dari kata kerja. Penelitian ini mengembangkan modul pembentukan word graph kata kerja pada aplikasi BogorDelftConstruct berdasarkan aturan tersebut.
Tujuan
Penelitian ini bertujuan untuk menambahkan modul pembentukan word graph pada sistem aplikasi Bogor DelfConStruct. Hasil dari penelitian ini berupa word graph yang merepresentasikan kata kerja berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup
Penelitian ini dibatasi pada pengembangan modul pembentukan word graph untuk kata kerja pada sistem BogorDelftConstruct dengan menggunakan pola aturan dari hasil penelitian sebelumnya oleh Ahmad Muslik (2009). Berikut ini merupakan batasan-batasan sistem, pada pengembangan yang dilakukan:
a. Pada sistem ini yang menjadi masukan hanyalah kata dan posisi kata dalam kalimat tidak diperhatikan.
b. Makna semantik dari kata kerja tidak diperhatikan.
c. Pada saat proses pengecekan kata, sifat atau label dari kata dasar berdasarkan kamus. Manfaat
Manfaat jangka panjang penelitian ini adalah dibentuknya suatu sistem yang mampu membaca input berupa teks Bahasa Indonesia dan menghasilkan output berupa ringkasan atau informasi tentang teks tersebut secara otomatis. Selain itu dalam jangka pendek, sistem ini diharapkan mampu memberikan pengetahuan atau mengekspresikan makna kata kerja dalam bentuk word graph.
TINJAUAN PUSTAKA
Knowledge Graph (KG)
Knowledge Graph adalah cara pandang baru untuk menggambarkan bahasa manusia dengan difokuskan pada aspek semantik dari pada
(3)
1
PENDAHULUAN
Latar Belakang
Bahasa alami yang digunakan manusia untuk berkomunikasi satu sama lain sangat bermanfaat dan penting dalam penyampaian informasi secara langsung. Di lain pihak, komputer masih sulit untuk memahami bahasa alami manusia. Dalam ilmu komputer bidang yang secara spesifik mempelajari cara komunikasi antara manusia dan komputer adalah Natural Language Processing (NLP). Sebuah kalimat dalam bahasa alami dapat dianalisis dari sudut pandang semantik atau sintaksis. Knowledge Graph merupakan salah satu metode dalam NLP yang menganalisis bahasa alami dengan lebih berfokus pada semantik daripada sintaksis.
Pengimplementasian metode Knowledge Graph pada bahasa alami diharapkan mampu memberikan abstraksi dari informasi atau pengetahuan yang terkandung di dalamnya ke dalam bentuk graf. Salah satu penelitian yang telah berhasil mengimplementasikan metode
Knowladge Graph pada suatu bahasa alami adalah DelftConstruct yang dikembangkan oleh Mark Van Koningsveld pada tahun 2003-2008.
DelfConStruct merupakan sebuah prototype
aplikasi untuk menganalisis Bahasa Inggris dan disajikan ke dalam bentuk graf dengan menggunakan metode Knowladge Graph. DelftConstruct dibangun menggunakan bahasa pemrograman MATLAB yang dapat membentuk suatu graf antara suatu kata dengan kata lainnya (word graph), namun belum sesuai dengan konsep Knowladge Graph (Romadoni 2009). Selain itu, DelftConstruct memiliki beberapa kekurangan antara lain:
• Belum memiliki fitur Dictionary untuk menyimpan, menampilkan dan mengubah graf.
• Ketidakjelasan arah relasi antar token, karena tidak adanya tanda panah yang menunjuk dari dan/atau ke suatu token.
• Belum memiliki kemampuan untuk membuat graf baru. Hanya mampu mengubah graf yang sedang ditampilkan.
• Belum mampu untuk menghapus token dan/atau teks.
• Tidak memiliki mekanisme untuk menampilkan graf lain yang sudah dibuat.
Dengan keterbatasan DelfConStruct yang hanya mampu menganalisis teks berbahasa Inggris maka dikembangkan BogorDelftConstruct yang nantinya mampu
menganalisis teks bahasa Indonesia dengan visualisasi graf sesuai yang dengan konsep
Knowledge Graph. Dengan pembentukan modul
word graph yang ada pada Bogor
DelfConStruct maka akan dikembangkan modul
word graph untuk kata kerja. Analisis bentuk dan makna dari kata kerja telah dilakukan pada penelitian sebelumnya oleh Ahmad Muslik (2009) yang menghasilkan pola aturan dari kata kerja. Penelitian ini mengembangkan modul pembentukan word graph kata kerja pada aplikasi BogorDelftConstruct berdasarkan aturan tersebut.
Tujuan
Penelitian ini bertujuan untuk menambahkan modul pembentukan word graph pada sistem aplikasi Bogor DelfConStruct. Hasil dari penelitian ini berupa word graph yang merepresentasikan kata kerja berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup
Penelitian ini dibatasi pada pengembangan modul pembentukan word graph untuk kata kerja pada sistem BogorDelftConstruct dengan menggunakan pola aturan dari hasil penelitian sebelumnya oleh Ahmad Muslik (2009). Berikut ini merupakan batasan-batasan sistem, pada pengembangan yang dilakukan:
a. Pada sistem ini yang menjadi masukan hanyalah kata dan posisi kata dalam kalimat tidak diperhatikan.
b. Makna semantik dari kata kerja tidak diperhatikan.
c. Pada saat proses pengecekan kata, sifat atau label dari kata dasar berdasarkan kamus. Manfaat
Manfaat jangka panjang penelitian ini adalah dibentuknya suatu sistem yang mampu membaca input berupa teks Bahasa Indonesia dan menghasilkan output berupa ringkasan atau informasi tentang teks tersebut secara otomatis. Selain itu dalam jangka pendek, sistem ini diharapkan mampu memberikan pengetahuan atau mengekspresikan makna kata kerja dalam bentuk word graph.
TINJAUAN PUSTAKA
Knowledge Graph (KG)
Knowledge Graph adalah cara pandang baru untuk menggambarkan bahasa manusia dengan difokuskan pada aspek semantik dari pada
(4)
2 sintatik. KG memiliki beberapa keuntungan
yang sangat besar. KG memiliki kemampuan menyatakan lapisan semantik yang paling dalam dengan hanya menggunakan sejumlah terbatas jenis relasi yang berguna dalam pemahaman bahasa manusia.
Pada prinsipnya, komposisi dari KG mencakup concept (banyak token dan type) serta relationship (binary dan multivariate relation) (Zhang 2002).
Concept (konsep)
Token
Dalam KG, token dinyatakan dengan simbol . Token menyatakan segala sesuatu yang dialami di dunia nyata atau sebuah konsep yang dialami menurut cara pandang masing-masing (Zhang 2002).
Type
Type adalah sebuah konsep yang bersifat umum dan objektif. Type memberi pandangan yang bersifat objektif karena membagi token
yang berbeda ke dalam kelas yang sama. Aspek Ontologi
Menurut Zhang (2002), ontologi word graph
terdiri atas 8 binary relationships dan 4 frame relationships. Delapan binary relationships
tersebut adalah :
1. Similarity of sets, alikeness : ALI
2. Causality : CAU
3. Equality : EQU
4. Subset relationship : SUB
5. Disparateness : DIS
6. Attribution : PAR
7. Ordering : ORD
8. Information dependency : SKO
Berikut penjelasan dari masing-masing
binary relationship tersebut: 1.Relasi ALI
Digunakan di antara type dan token dengan panah ke arah token untuk penamaan konsep. Contoh: jeruk, dinyatakan dengan
word graph:
Gambar 1 Contoh relasi ALI 2.Relasi CAU
Dilambangkan dengan anak panah berlabel CAU antara dua token yang menyatakan hubungan sebab akibat atau sesuatu yang mempengaruhi sesuatu yang lain. Contoh:
adik beli jeruk, dinyatakan dengan word graph:
Gambar 2 Contoh relasi CAU 3.Relasi EQU
Ada dua macam relasi EQU. Relasi EQU antara dua token menyatakan bahwa kedudukan kedua token tersebut sama, contoh: jeruk adalah buah. Relasi EQU yang dilambangkan dengan arah panah dari type
menuju konsep dapat diartikan penetapan sesuatu, contoh: kuning adalah nilai yang ditetapkan untuk warna. Relasi EQU dapat dinyatakan dengan word graph:
Gambar 3 Contoh relasi EQU 4.Relasi SUB
Digunakan jika dua token dinyatakan berturut-turut serta token yang satu merupakan subset dari token yang lain. Contoh: daun merupakan bagian dari pohon, dinyatakan dengan word graph:
Gambar 4 Contoh relasi SUB 5.Relasi DIS
Digunakan untuk menyatakan dua token
yang berbeda satu sama lain. Contoh: air berbeda dengan api, dinyatakan dengan
word graph:
Gambar 5 Contoh relasi DIS 6.Relasi PAR
Digunakan untuk menyatakan sesuatu merupakan atribut dari sesuatu yang lain. Contoh: air dingin, dinyatakan dengan word graph:
(5)
3 7.Relasi ORD
Digunakan untuk menunjukkan dua hal yang saling berurutan dalam hal waktu dan tempat. Contoh: dari pagi hingga malam, dinyatakan dengan word graph:
pagi
ALI ORD ALI
malam Gambar 7 Contoh relasi ORD 8.Relasi SKO
Relasi SKO digunakan berdasarkan konsep tentang ketergantungan informasi. Contoh: besar gaji ditentukan dari pangkat, dinyatakan dengan word graph:
pangkat
ALI SKO ALI
gaji Gambar 8 Contoh relasi SKO Di samping 8 binary relationships, ada ontologi F (Focus) yang digunakan untuk menunjukkan fokus dari suatu graf (Nurdiati & Hoede 2009). Ontologi F untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti). Contoh: gunung meletus, dinyatakan dengan word graph:
CAU ALI gunung meletus ALI F PAR
Gambar 9 Contoh relasi Focus
Kemudian empat frame relationships terdiri atas:
1. Focusing on a situation : FPAR
2. Negation on a situation : NEGPAR
3. Possibility on a situation : POSPAR
4. Necessityon a situation : NECPAR
Frame relationship merupakan verteks berlabel yang digunakan untuk mengelompokkan beberapa graf. Adakalanya suatu objek tidak cukup direpresentasikan dengan sebuah token, sehingga diperlukan sebuah frame untuk pengelompokan tersebut. Berikut penjelasan dari masing-masing frame relationship. Relasi FPAR menyatakan sesuatu memiliki properti dari sesuatu yang lain. Relasi NEGPAR menyatakan negasi dari isi frame. Relasi POSPAR menyatakan kemungkinan dari isi frame. Relasi NECPAR menyatakan keharusan terjadinya isi dari frame.
Gambar 10 Frame relationship Verba (kata kerja)
Kata kerja atau verba merupakan kelas kata yang menyatakan suatu tindakan, keberadaan, pengalaman, atau pengertian dinamis lainnya. Menurut Alwi et. al (2003) yang diacu dalam Ahmad Muslik (2009), ciri kata kerja dapat diketahui dengan mengamati perilaku semantis, perilaku sintaksis, dan bentuk morfologinya. Kata kerja secara umum mempunyai ciri sebagai berikut:
1.Kata kerja sebagai predikat atau inti predikat. Contoh : pencuri itu lari, adik
sedang belajar di kamar. Kata lari
merupakan predikat, sedangkan sedang belajar merupakan inti predikat.
2.Ada makna perbuatan (aksi), proses, atau keadaan yang bukan sifat atau kualitas. 3.Kata kerja yang bermakna keadaan tidak
dapat diberi prefiks ter yang artinya paling. Contoh: mati atau suka tidak dapat menjadi
termati atau tersuka.
4.Secara umum, kata kerja tidak dapat bersatu dengan kata-kata yang maknanya kesangatan seperti agak belajar, agak lari,
belanja sekali.
Kata Kerja dari segi bentuknya
Dari segi bentuk, kata kerja terbagi atas kata kerja dasar dan kata kerja turunan. Contoh kata kerja dasar: ada, bangun, cinta, naik, tamat, paham, rasa, yakin, dan sebagainya. Kata kerja turunan dibentuk dari transposisi, pengafiksan, pengulangan (reduplikasi), dan pemaduan dengan penjelasan sebagai berikut:
a.Transposisi
Transposisi merupakan suatu proses penurunan kata dari kategori sintaksis yang satu ke kategori sintaksis yang lain tanpa mengubah bentuknya (Alwi et al. 2003 dalam Muslik 2009). Contoh: telepon, cangkul, sikat.
b.Pengafiksan
Pengafiksan adalah penambahan afiks pada kata dasar. Kata dasar dapat berupa kata kerja, kata benda, ataupun kata sifat. Contoh: membeli, mendarat, bertemu, merestui, memperbesar.
(6)
4 c.Reduplikasi
Kata-kata yang mengalami proses ini disebut kata berulang, artinya kata kerja yang telah direduplikasi disebut juga kata kerja berulang. Contoh: lari-lari, makan-makan, tembak-menembak, menari-nari. d.Pemaduan
Pemaduan merupakan penggabungan dua kata dasar atau lebih sehingga menjadi beberapa kata yang memiliki satu makna. Contoh: jual beli, jatuh bangun, salah sangka.
METODE PENELITIAN
Pada penelitian ini akan ditambahkan modul pembentukan word graph untuk kata kerja. Tahapan yang dilakukan pada penelitian ini secara garis besar dapat dilihat pada Gambar 11.
Gambar 11 Tahapan penelitian Studi Literatur
Pada tahap ini dilakukan pengumpulan materi-materi yang dapat digunakan sebagai bahan rujukan yang relevan dengan topik penelitian. Penelitian ini didasarkan pada
penelitian sebelumnya, yaitu tesis Ahmad Muslik (2009) “Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode
Knowledge Graph” serta skripsi Deni Romadoni (2009) “Pengembangan Sistem Pembentukan Word Graph Untuk Teks Berbahasa Indonesia”.
Pembentukan Pola Word Graph Kata Kerja Pembentukan pola word graph kata kerja harus sesuai dengan aturan-aturan pembentukan kata kerja dari hasil analisis Muslik (2009). Pada penelitian Muslik (2009) diperoleh 30 aturan dengan 10 daftar pola kata kerja berdasarkan afiks dan maknanya.
Penambahan Modul Pembentukan Word Graph Kata Kerja
1. Praposes
Pada tahap ini ditentukan apakah kata kerja yang dimasukkan bersifat tunggal, mengandung numerik/karakter atau tidak. Jika tidak maka proses akan dilanjutkan ke tahap berikutnya. Selain itu, tahap ini juga bertujuan untuk memeriksa nilai masukan, dimana masukan yang akan dapat diproses harus berupa karakter.
2. Stemming
Pada tahap ini kata kerja akan dipecah untuk mendapatkan afiks (imbuhan) dan kata dasar. Program stemming dibuat dalam bahasa pemrograman MATLAB akan menghasilkan kata dasar serta imbuhan yang dapat berupa prefiks (awalan), sufiks (akhiran), atau infiks (sisipan).
Stemming ini mengacu pada Kamus Besar Bahasa Indonesia (KBBI) yang disesuaikan. Pada KBBI asli terdapat 3 (tiga) field yaitu, ‘Kata’, ‘Sifat’, dan ‘Subkata’. Field ‘Kata’ berisi kata dasar, field ‘Sifat’ berisi sifat kata seperti v (verba), n (nomina), dan sebagainya.
Field ‘Subkata’ berisi kata turunan yang terbentuk dari turunan kata dasar yang mengandung imbuhan. Satu kata dasar dapat memiliki lebih dari satu subkata. Untuk penelitian ini, basis data KBBI dibuat dalam tabel Entry.
Penentuan Pola Hasil (Pengujian)
Pada tahap ini hasil dari stemming yang berupa kata dasar dan imbuhan (afiks) akan dicocokkan dengan pola word graph kata kerja yang telah disimpan. Jika pengenalan polanya sesuai dengan pola word graph kata kerja yang telah disimpan, maka akan ditampilkan graph
(7)
4 c.Reduplikasi
Kata-kata yang mengalami proses ini disebut kata berulang, artinya kata kerja yang telah direduplikasi disebut juga kata kerja berulang. Contoh: lari-lari, makan-makan, tembak-menembak, menari-nari. d.Pemaduan
Pemaduan merupakan penggabungan dua kata dasar atau lebih sehingga menjadi beberapa kata yang memiliki satu makna. Contoh: jual beli, jatuh bangun, salah sangka.
METODE PENELITIAN
Pada penelitian ini akan ditambahkan modul pembentukan word graph untuk kata kerja. Tahapan yang dilakukan pada penelitian ini secara garis besar dapat dilihat pada Gambar 11.
Gambar 11 Tahapan penelitian Studi Literatur
Pada tahap ini dilakukan pengumpulan materi-materi yang dapat digunakan sebagai bahan rujukan yang relevan dengan topik penelitian. Penelitian ini didasarkan pada
penelitian sebelumnya, yaitu tesis Ahmad Muslik (2009) “Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode
Knowledge Graph” serta skripsi Deni Romadoni (2009) “Pengembangan Sistem Pembentukan Word Graph Untuk Teks Berbahasa Indonesia”.
Pembentukan Pola Word Graph Kata Kerja Pembentukan pola word graph kata kerja harus sesuai dengan aturan-aturan pembentukan kata kerja dari hasil analisis Muslik (2009). Pada penelitian Muslik (2009) diperoleh 30 aturan dengan 10 daftar pola kata kerja berdasarkan afiks dan maknanya.
Penambahan Modul Pembentukan Word Graph Kata Kerja
1. Praposes
Pada tahap ini ditentukan apakah kata kerja yang dimasukkan bersifat tunggal, mengandung numerik/karakter atau tidak. Jika tidak maka proses akan dilanjutkan ke tahap berikutnya. Selain itu, tahap ini juga bertujuan untuk memeriksa nilai masukan, dimana masukan yang akan dapat diproses harus berupa karakter.
2. Stemming
Pada tahap ini kata kerja akan dipecah untuk mendapatkan afiks (imbuhan) dan kata dasar. Program stemming dibuat dalam bahasa pemrograman MATLAB akan menghasilkan kata dasar serta imbuhan yang dapat berupa prefiks (awalan), sufiks (akhiran), atau infiks (sisipan).
Stemming ini mengacu pada Kamus Besar Bahasa Indonesia (KBBI) yang disesuaikan. Pada KBBI asli terdapat 3 (tiga) field yaitu, ‘Kata’, ‘Sifat’, dan ‘Subkata’. Field ‘Kata’ berisi kata dasar, field ‘Sifat’ berisi sifat kata seperti v (verba), n (nomina), dan sebagainya.
Field ‘Subkata’ berisi kata turunan yang terbentuk dari turunan kata dasar yang mengandung imbuhan. Satu kata dasar dapat memiliki lebih dari satu subkata. Untuk penelitian ini, basis data KBBI dibuat dalam tabel Entry.
Penentuan Pola Hasil (Pengujian)
Pada tahap ini hasil dari stemming yang berupa kata dasar dan imbuhan (afiks) akan dicocokkan dengan pola word graph kata kerja yang telah disimpan. Jika pengenalan polanya sesuai dengan pola word graph kata kerja yang telah disimpan, maka akan ditampilkan graph
(8)
5 yang sesuai dengan pola tersebut. Di lain pihak,
jika hasil dari stemming berupa pola kata dasar dan imbuhan yang tidak ada dalam pola kata kerja menurut Ahmad Muslik (2009) dan gagal dalam proses pengenalan, maka akan ditampilkan peringatan bahwa masukan bukan merupakan kata kerja. Tahapan penambahan kamus word graph kata kerja secara detail dapat dilihat pada Lampiran 1.
Analisis Hasil
Pada tahap ini pola kata kerja yang telah terbentuk akan dianalisis, apakah sudah sesuai dengan penelitian Muslik (2009) atau belum. Skenario pengujian dilakukan dengan memasukkan beberapa kata kerja kemudian dihitung akurasinya. Penghitungan akurasi dilakukan dengan cara menghitung berapa banyak kata yang dikenali dari beberapa masukkan kata kerja dan sesuai dengan pola
word graph.
=∑
∑ × 100%
Dokumentasi dan Laporan
Pada tahap ini akan dibahas hasil perhitungan keakuratan dari pengujian dari setiap pola. Jika didapati hasil akurasi yang rendah maka akan dicari sumber permasalahannya. Di lain pihak jika masalah yang dihadapi tidak dapat diatasi, maka akan dimasukkan ke dalam saran untuk penelitian selanjutnya.
HASIL DAN PEMBAHASAN
Pemahaman Bidang Kajian dan Identifikasi Masalah
Pengkajian mengenai pembentukan kamus
word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Muslik (2009) dan skripsi Romadoni (2009). Berdasarkan penelitian Muslik (2009) didapat 10 pola word graph yang dibentuk dari 30 aturan kata kerja. Sepuluh pola tersebut diberi nama sesuai dengan nama variabel dalam sistem. Pola pembentukan word graph dapat dilihat pada Tabel 1 dan lebih detail pada Lampiran 2.
Pengidentifikasian masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian, antara lain pembatasan penelitian berdasarkan ruang lingkup, program
stemming, penggunaan KBBI dalam penelitian,
pembentukan pola word graph, pengujian pola
word graph, analisis hasil pengujian.
Tabel 1 Pola pembentukan word graph kata kerja
Pola Pembentuk Kata Kerja
Nama Variabel Pola Dalam
Sistem Kata Kerja Dasar (KKD)
Ber-KK Pola-vdasar
Meng-/mem-/me-Kata Kerja (KK)
Meng-/mem-/me-KK-kan Meng-/mem-/me-Kata Benda (KB)-kan Meng-/mem-/me-Kata Sifat (KS)-kan Meng-/mem-/me-KK-I Meng-/mem-/me-KS-i Meng-/mem-/me-KB-i Memper-KB
Memper-KS
Memper-KK-kan/i
Pola-mekani
Di-KKtransitif-(-i/-kan) Ter-KKtransitif(-i)
Di-KB-i Diper-KS
Pola-diter
Meng-/mem-/me-Kata
Ulang (KU) Pola-meku
Ber-KB
Ber-KS
Ber-KKan
Pola-beran
Ber-KB-kan Ber-KK-an
Meng-/mem-/me-KS
Meng-/mem-/me-KB
Meng-/mem-/me-Kata Dasar Terikat
Ke-KK/KB/KS-an
Pola-bermeke
Ter-KKintransitif(-i) Pola-teri Kata Kerja Dasar Ulang Pola-kkdu KK-meng-/mem-/me-KK Pola-fixku
(9)
5 yang sesuai dengan pola tersebut. Di lain pihak,
jika hasil dari stemming berupa pola kata dasar dan imbuhan yang tidak ada dalam pola kata kerja menurut Ahmad Muslik (2009) dan gagal dalam proses pengenalan, maka akan ditampilkan peringatan bahwa masukan bukan merupakan kata kerja. Tahapan penambahan kamus word graph kata kerja secara detail dapat dilihat pada Lampiran 1.
Analisis Hasil
Pada tahap ini pola kata kerja yang telah terbentuk akan dianalisis, apakah sudah sesuai dengan penelitian Muslik (2009) atau belum. Skenario pengujian dilakukan dengan memasukkan beberapa kata kerja kemudian dihitung akurasinya. Penghitungan akurasi dilakukan dengan cara menghitung berapa banyak kata yang dikenali dari beberapa masukkan kata kerja dan sesuai dengan pola
word graph.
=∑
∑ × 100%
Dokumentasi dan Laporan
Pada tahap ini akan dibahas hasil perhitungan keakuratan dari pengujian dari setiap pola. Jika didapati hasil akurasi yang rendah maka akan dicari sumber permasalahannya. Di lain pihak jika masalah yang dihadapi tidak dapat diatasi, maka akan dimasukkan ke dalam saran untuk penelitian selanjutnya.
HASIL DAN PEMBAHASAN
Pemahaman Bidang Kajian dan Identifikasi Masalah
Pengkajian mengenai pembentukan kamus
word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Muslik (2009) dan skripsi Romadoni (2009). Berdasarkan penelitian Muslik (2009) didapat 10 pola word graph yang dibentuk dari 30 aturan kata kerja. Sepuluh pola tersebut diberi nama sesuai dengan nama variabel dalam sistem. Pola pembentukan word graph dapat dilihat pada Tabel 1 dan lebih detail pada Lampiran 2.
Pengidentifikasian masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian, antara lain pembatasan penelitian berdasarkan ruang lingkup, program
stemming, penggunaan KBBI dalam penelitian,
pembentukan pola word graph, pengujian pola
word graph, analisis hasil pengujian.
Tabel 1 Pola pembentukan word graph kata kerja
Pola Pembentuk Kata Kerja
Nama Variabel Pola Dalam
Sistem Kata Kerja Dasar (KKD)
Ber-KK Pola-vdasar
Meng-/mem-/me-Kata Kerja (KK)
Meng-/mem-/me-KK-kan Meng-/mem-/me-Kata Benda (KB)-kan Meng-/mem-/me-Kata Sifat (KS)-kan Meng-/mem-/me-KK-I Meng-/mem-/me-KS-i Meng-/mem-/me-KB-i Memper-KB
Memper-KS
Memper-KK-kan/i
Pola-mekani
Di-KKtransitif-(-i/-kan) Ter-KKtransitif(-i)
Di-KB-i Diper-KS
Pola-diter
Meng-/mem-/me-Kata
Ulang (KU) Pola-meku
Ber-KB
Ber-KS
Ber-KKan
Pola-beran
Ber-KB-kan Ber-KK-an
Meng-/mem-/me-KS
Meng-/mem-/me-KB
Meng-/mem-/me-Kata Dasar Terikat
Ke-KK/KB/KS-an
Pola-bermeke
Ter-KKintransitif(-i) Pola-teri Kata Kerja Dasar Ulang Pola-kkdu KK-meng-/mem-/me-KK Pola-fixku
(10)
6 Praproses
Praproses merupakan tahap awal pengembangan Kamus Word Graph Kata Kerja. Praproses dilakukan untuk membatasi nilai masukan pada sistem. Masukan harus berupa kata tunggal atau tidak mengandung spasi (‘ ’). Fungsi untuk memeriksa hal ini didokumentasikan pada checkPlural yang jika bernilai ‘benar’ maka proses tidak akan dilanjutkan pada tahap berikutnya. Selain itu, jika nilai masukan berupa numerik maka sistem akan menampilkan peringatan pada user untuk memasukkan input yang berupa kata bukan numerik. Untuk memeriksa apakah masukan kata berupa numerik atau bukan digunakan fungsi checkNum.
Stemming
Program stemming dibuat sesuai kebutuhan penelitian sehingga mampu membuang awalan, akhiran, sisipan atau gabungan antara awalan dan akhiran yang sesuai dengan pola pembentuk kata kerja dengan keluaran berupa kata dasar. Selain itu, keluaran dari program stemming juga berupa imbuhan yang terkandung dalam kata masukan.
Program stemming terdokumentasi dalam fungsi getStem yang terdiri atas fungsi stemFix
dan stemm. Fungsi stemFix untuk kata masukan yang mengandung imbuhan yang terdapat pada tabel Fixations. Fungsi stemm untuk imbuhan asing dan untuk menanggulangi kata yang tidak terdapat dalam KBBI yang disesuaikan.
Proses stemming dengan KBBI yang disesuaikan dilakukan dengan langkah-langkah berikut:
1.Kata masukan dicari apakah terdapat pada KBBI atau tidak.
2.Jika ada pada KBBI yang disesuaikan, kata masukan diperiksa apakah mengandung imbuhan yang terdapat pada tabel Fixations atau tidak. Jika ya, dilakukan proses pemotongan berurut sesuai imbuhan-imbuhan yang dikenali pada tabel Fixations. Jika tidak, untuk imbuhan asing akan dilakukan proses
stemming. Selainnya, kata masukan yang dikenali pada KBBI yang disesuaikan dikembalikan kata dasarnya dan langsung dicari sifat kata dasarnya dalam KBBI yang disesuaikan.
3.Jika tidak terdapat pada KBBI yang disesuaikan maka dilakukan proses
stemming.
4.Kata masukan diproses dengan pemotongan bertahap untuk setiap kondisi. Setiap yang menghasilkan hasil stemming
dimasukkan dalam daftar kandidat kata dan diperiksa apakah terdapat pada KBBI yang disesuaikan atau tidak. Jika tidak ada satu kata yang ditemukan maka dikembalikan kata sebelum di-stemm. Pengenalan Pola Word Graph Kata Kerja
Setelah didapat kata dasar, sifat kata dasar dan imbuhannya akan digunakan untuk mengenali pola word graph pembentuk kata kerja menggunakan fungsi checkPatternVerb. Untuk mengetahui sifat kata dasar hasil
stemming dilakukan pengecekan terhadap kata dasar pada database ‘kamus’ menggunakan fungsi cekKata.
Fungsi checkPatternVerb akan membandingkan apakah kata dasar dan alternatif kata dasar (jika ada) serta imbuhan yang terkandung dari kata masukan sesuai dengan pola word graph yang ada. Jika ya, maka fungsi akan mengembalikan salah satu nama pola dari 10 daftar pola word graph yang memenuhi kondisi. Misalnya, kata masukan ‘memulai’ jika dilakukan stemming akan menghasilkan kata dasar ‘mulai’, ‘pulai’ sebagai kata dasar alternatif dan imbuhan ‘mem’ dikenali sebagai pola word graph ‘mem-kata kerja’. Pola ‘mem-‘mem-kata kerja’ termasuk salah satu pola word graph kata kerja. Fungsi
checkPatternVerb akan memeriksa apakah kata dasar ‘mulai’ memiliki sifat kata kerja (verba) atau kata dasar alternatif ‘pulai’ yang bersifat sebagai kata kerja. Jika salah satunya terpenuhi maka kata tersebut dianggap sebagai kata dasar dari kata masukan ‘memulai’.
Pembentukan Pola Word Graph Kata Kerja Hasil tahap penentuan pola word graph kata kerja akan menampilkan word graph dari pola yang membentuknya. Kata masukan yang memenuhi kondisi pola word graph kata kerja tertentu akan memanggil fungsi yang membuat pola word graph kata masukan.
Jika kata masukan tidak memenuhi semua kondisi pola pembentukan word graph kata kerja, maka kata tersebut bukan kata kerja bentuk turunan dan akan dicari jenis kata dasar dari kata masukan serta akan menampilkan peringatan bahwa kata masukan bukan kata kerja.
Penelitian ini juga dibatasi untuk pola word graph kata kerja dasar’ intransitif dan ‘ter-kata kerja dasar’ transitif, karena sulitnya
(11)
7 membedakan kedua pola tersebut hanya dari
maknanya. Pembedaan kedua pola tersebut dapat dilakukan dengan melihat posisi kata kerja dengan pola word graph ‘ter-kata kerja’ intransitif ataupun transitif dalam kalimat. Pola
word graph ‘ter-kata kerja dasar’ intransitif dipilih untuk dimasukkan ke dalam modul Kamus Word Graph karena pola tersebut memiliki makna yang lebih umum serta tidak perlu membutuhkan objek dalam konteks kalimat. Semua tahapan mulai dari praproses hingga tahap ini digabung dalam sebuah modul
indVerbDict yang memproses pembentukan kamus word graph kata kerja.
Analisis Hasil Pengujian
Analisis hasil pengujian akan disajikan dalam bentuk persentase akurasi yang dihasilkan dari pengujian modul kamus word graph kata kerja dengan penjelasan untuk setiap variabel pola. Hasil akurasi pengujian secara umum disajikan pada Tabel 2.
Tabel 2 Akurasi hasil pengujian Variabel
Pola Word graph Kata
Kerja Jumlah Input Jumlah Input yang Sesuai Akurasi
Pola-vdasar 20 20 100,00 Pola-mekani 20 20 100,00 Pola-diter 25 25 100,00 Pola-meku 12 10 100,00 Pola-beran 12 10 83,33
Pola-bermeke 36 36 100,00 Pola-teri 12 12 100,00 Pola-kkdu 10 10 100,00 Pola-fixku 12 12 100,00 Pola-berku 12 12 100,00
Total 171 169 98,83
Pola-vdasar
Variabel pola-vdasar terdiri atas pola Kata Kerja Dasar (KKD) dengan 10 masukan dan pola ber-KKD dengan 10 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-vdasar. Hasil pengujian dapat dilihat pada Lampiran 3.
Pola-mekani
Variabel pola-mekani terdiri atas pola (meng/me/mem/memper)- Kata Kerja -(kan/i) dengan 10 masukan dan pola meng-/me-/mem-/memper-Kata Benda/Kata Sifat-kan/-i dengan 10 masukan. Semua masukan menghasilkan
stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph
kata kerja dengan variabel pola-mekani. Hasil pengujian dapat dilihat pada Lampiran 4.
Pola-diter
Variabel pola-diter terdiri atas pola di-Kata Kerja/Kata Benda/Kata Sifat(-i/-kan) dengan 15 masukan dan pola diper-Kata Benda/Kata Sifat(-kan) dengan 10 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-mekani. Hasil pengujian dapat dilihat pada Lampiran 5 sedangkan contoh graf hasil pengujian untuk kata ‘digarami’ dapat dilihat pada Gambar 12.
Gambar 12 Graf hasil pengujian kata ‘digarami’
Pola-meku
Variabel pola-bermeku terdiri atas pola meng-/mem-/me-Kata Ulang dengan 12 masukan. Semua masukan menghasilkan
stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph
kata kerja dengan variabel pola-bermeku. Hasil pengujian dapat dilihat pada Lampiran 6 sedangkan contoh hasil pengujian untuk kata ‘menari-nari’ dapat dilihat dalam Gambar 13.
Gambar 13 Graf hasil pengujian kata ‘menari-nari’
(12)
8 Pola-beran
Variabel pola-beran terdiri atas pola ber-Kata Benda/ber-Kata Sifat dengan 12 masukan. Untuk pola ber-KKan (kata kerja yg sudah diimbuhi akhiran an, contoh: ‘hubungan’) tidak dapat ditampilkan pada pola-beran. Untuk aturan ber-KKan setelah di stemming
menghasilkan ber-kata kerja-an. Hal ini disebabkan oleh KBBI yang belum lengkap. Hasil pengujian dapat dilihat pada Lampiran 7.
Pola-bermeke
Variabel pola-bermeke terdiri atas pola ber-Kata Benda-kan dan ber-ber-Kata Kerja/ber-Kata Sifat-an dengSifat-an 12 masukSifat-an, pola meng-/mem-/me-Kata Benda/meng-/mem-/me-Kata Sifat dengan 12 masukan, dan pola ke-Kata Kerja/Kata Benda/Kata Sifat-an dengan 12 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-bermeke. Hasil pengujian dapat dilihat pada Lampiran 8.
Pola-teri
Variabel pola-teri terdiri atas pola ter-Kata Kerja Dasar(-i) dengan 12 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-teri. Hasil pengujian dapat dilihat pada Tabel 3 atau Lampiran 9 untuk lebih lengkap.
Pola-kkdu
Variabel pola-kkdu terdiri atas pola Kata Kerja Dasar Ulang dengan 10 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-kkdu. Hasil pengujian dapat dilihat pada Lampiran 10.
Pola-fixku
Variabel pola-fixku terdiri atas pola Kata Kerja-meng-/mem-/me-Kata Kerja dengan 12 masukan. Semua masukan menghasilkan
stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph
kata kerja dengan variabel pola-fixku. Hasil pengujian dapat dilihat pada Lampiran 11.
Pola-berku
Variabel pola-berku terdiri atas pola ber-Kata Ulang dengan 12 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar
sesuai pola word graph kata kerja dengan variabel pola-berku. Hasil pengujian dapat dilihat pada Lampiran 12.
Tabel 3 Hasil Pengujian word graph kata kerja Pola-teri
Kata
Masukan Hasil Pengujian Terduduk sesuai dengan variabel word
graph pola-teri
Terantuk sesuai dengan variabel word
graph pola-teri
Terbangun sesuai dengan variabel word
graph pola-teri
Tertidur sesuai dengan variabel word
graph pola-teri
Terbenam sesuai dengan variabel word
graph pola-teri
Terjatuh sesuai dengan variabel word
graph pola-teri
Terlampaui sesuai dengan variabel word
graph pola-teri
Tersaingi sesuai dengan variabel word
graph pola-teri
Tertanami sesuai dengan variabel word
graph pola-teri
Tersirami sesuai dengan variabel word
graph pola-teri
Teraliri sesuai dengan variabel word
graph pola-teri
Terhalangi sesuai dengan variabel word
graph pola-teri
Analisis Hasil Pengujian Keseluruhan Hasil pengujian untuk word graph kata kerja dengan masukan 171 kata kerja menghasilkan akurasi 98,83%. Secara umum modul pembentukan word graph kata kerja sudah cukup baik. Masalah utama dari pengembangan modul pembentukan word graph kata kerja adalah tidak lengkapnya KBBI.
Analisis Kekurangan dan Kelebihan Pengembangan Modul Pembentukan Word Graph Kata Kerja
Kekurangan modul pembentukan word graph kata kerja adalah hanya mampu menampilkan graf yang sesuai dengan pola aturan word graph kata kerja hasil penelitian sebelumnya oleh Muslik (2009). Keterbatasan dalam segi pengembangannya adalah karena masukan dari sistem ini hanya satu kata maka untuk kata kerja transitif yang harus bergantung pada subjek dan objek tidak dapat dibangkitkan. Dengan demikian harus diasumsikan bahwa setiap kata kerja transitif merupakan kata kerja
(13)
9 intransitif. Di samping itu untuk beberapa pola
yang telah dibangkitkan, tidak ada keterangan pada antarmuka ketika mengklik token.
Beberapa pola word graph kata kerja yang telah berhasil dibuat dalam modul tidak persis sama dengan word graph yang ada pada penelitian Muslik (2009). Misalnya, pada pola-meku (kata ulang dengan imbuhan me-/meng-/mem-) menggunakan relasi ALI ke satu token secara berulang untuk menyatakan pengulangan kata, yang disimbolkan dengan . Pada sistem, word graph tidak menghasilkan relasi seperti simbol tersebut melainkan hanya menampilkan teks ‘ali’ pada token yang memiliki makna memunyai pengulangan kata.
Kelebihan pengembangan modul pembentukan word graph kata kerja adalah telah berhasil mengimplementasikan 10 pola
wordgraph kata kerja sesuai dengan penelitian Muslik (2009). Aplikasi BogorDelftConstruct telah mampu mengenali pola word graph kata kerja dengan tingkat akurasi 98,83%.
KESIMPULAN DAN SARAN
Kesimpulan
Pengembangan modul pembentukan word graph kata kerja telah mampu mengenali 10 pola aturan word graph kata kerja sesuai dengan penelitian Muslik (2009). Pola kata kerja yang menjadi masukan hanya satu kata sehingga setiap masukan diasumsikan kata kerja intransitif yang tidak perlu terikat dengan objek. Pengujian modul untuk pola word graph
kata kerja secara keseluruhan menghasilkan akurasi 98,83%. Meskipun memiliki akurasi yang cukup baik sistem ini masih memiliki kekurangan. Salah satunya adalah sistem ini hanya mampu mengenali masukan sepanjang 1 kata.
Di lain hal, sistem ini secara garis besar telah cukup berhasil karena telah mampu membangkitkan pola aturan word graph kata kerja yang sesuai dengan hasil penelitian yang dilakukan Muslik (2009).
Saran
Sebagai pengembangan dari penelitian ini beberapa hal yang dapat disarankan adalah:
1.Penambahan bagian atau fungsi dalam modul agar dapat membedakan pola kata kerja intransitif atau transitif.
2. Pengembangan modul serupa untuk aturan lain dalam Bahasa Indonesia selain kata kerja, seperti kata tugas, frasa kata, atau klausa.
3. Pengembangan sistem BogorDelftConstruct berbasis web sehingga bersifat dinamis dan dapat diakses secara real time.
(14)
9 intransitif. Di samping itu untuk beberapa pola
yang telah dibangkitkan, tidak ada keterangan pada antarmuka ketika mengklik token.
Beberapa pola word graph kata kerja yang telah berhasil dibuat dalam modul tidak persis sama dengan word graph yang ada pada penelitian Muslik (2009). Misalnya, pada pola-meku (kata ulang dengan imbuhan me-/meng-/mem-) menggunakan relasi ALI ke satu token secara berulang untuk menyatakan pengulangan kata, yang disimbolkan dengan . Pada sistem, word graph tidak menghasilkan relasi seperti simbol tersebut melainkan hanya menampilkan teks ‘ali’ pada token yang memiliki makna memunyai pengulangan kata.
Kelebihan pengembangan modul pembentukan word graph kata kerja adalah telah berhasil mengimplementasikan 10 pola
wordgraph kata kerja sesuai dengan penelitian Muslik (2009). Aplikasi BogorDelftConstruct telah mampu mengenali pola word graph kata kerja dengan tingkat akurasi 98,83%.
KESIMPULAN DAN SARAN
Kesimpulan
Pengembangan modul pembentukan word graph kata kerja telah mampu mengenali 10 pola aturan word graph kata kerja sesuai dengan penelitian Muslik (2009). Pola kata kerja yang menjadi masukan hanya satu kata sehingga setiap masukan diasumsikan kata kerja intransitif yang tidak perlu terikat dengan objek. Pengujian modul untuk pola word graph
kata kerja secara keseluruhan menghasilkan akurasi 98,83%. Meskipun memiliki akurasi yang cukup baik sistem ini masih memiliki kekurangan. Salah satunya adalah sistem ini hanya mampu mengenali masukan sepanjang 1 kata.
Di lain hal, sistem ini secara garis besar telah cukup berhasil karena telah mampu membangkitkan pola aturan word graph kata kerja yang sesuai dengan hasil penelitian yang dilakukan Muslik (2009).
Saran
Sebagai pengembangan dari penelitian ini beberapa hal yang dapat disarankan adalah:
1.Penambahan bagian atau fungsi dalam modul agar dapat membedakan pola kata kerja intransitif atau transitif.
2. Pengembangan modul serupa untuk aturan lain dalam Bahasa Indonesia selain kata kerja, seperti kata tugas, frasa kata, atau klausa.
3. Pengembangan sistem BogorDelftConstruct berbasis web sehingga bersifat dinamis dan dapat diakses secara real time.
(15)
CHRISTIAN HENRY
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
(16)
10
DAFTAR PUSTAKA
Alwi H, Dardjowidjojo S, Lapowila H, Moeliono AM. 2003. Tata Bahasa Baku Bahasa Indonesia. Ed ke-3. Jakarta: Balai Pustaka.
Muslik A. 2009. Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode Knowledge Graph. [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Nurdiati S, and C Hoede. 2009. Word Graph
Construction of Certain Aspects of Indonesian Language. Supplementary Proceedings of The 17th International Conference on Conceptual Structures. Moscow, Russia.
Rusiyamti. 2008. Analisis Teks Berbahasa Indonesia Menggunakan Metode
Knowledge Graph. [tesis]. Bogor: Sekolah Pascasarjana, Institut Pertanian Bogor. Romadoni D. 2009. Pengembangan Sistem
Pembentukan Word Graph Untuk Teks Berbahasa Indonesia. [skripsi]. Bogor: Program Sarjana, Institut Pertanian Bogor Zhang L. 2002. Knowledge Graph Theory and
Structural Parsing. [disertasi]. ISBN 9036518350. Netherlands: Twente University
(17)
CHRISTIAN HENRY
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
(18)
ii
ABSTRACT
CHRISTIAN HENRY. The development of verb word graph module in BogorDelftConstruct appplication. Directed by SRI NURDIATI.
Knowledge Graph (KG) is one of natural language processing methods that is able to represent the result of semantic analysis of a text in a graph form. Until now, there are only a few researches using KG to do semantic analysis for texts in Indonesian language. They were mainly focus on analyzing text, constructing rules to analyze text and engineering to understand the text. Some other researches have done semantic analysis from various part-of-speech. Nevertheless, the results of the research have not been implemented yet. To realize a long term goal of doing text abstraction automatically, BogorDelftConstruct has been developed as an early stage prototype. In line with that, this research implemented semantic analysis for one part-of-speech in BogorDelftConstruct.
The objective of the research is to develop a module dictionary of verb word graph taken from the result of previous research in BogorDelftConstruct system. The verb to be analyzed has 10 patterns of word graph which formed by affixation. Word graph pattern formation process begins by knowing the basic word and affix using stemming. This stemming process refers to the adjusted Kamus Besar Bahasa Indonesia (KBBI). Basic word and affixe from the result of stemming will be used to determine appropriate pattern of the verb word graph. Appropriate pattern of the verb word graph will be generated and displayed on the system.
Development of a verb word graph module has been able to identify 10 patterns of the verb word graph. The system however can only recognize one-word-verb so each entry is assumed to be intransitive verb that does not need to be followed by an object. The results of testing with 171 entries from overall yield was 98.83% accuracy. Despite of having a good accuracy, this system still has some short comings, such as could not process input with more than one words. This problem is expected to be the focus of the following research.
(19)
iii
PENAMBAHAN MODUL PEMBENTUKAN
WORD GRAPH
KATA KERJA
PADA APLIKASI BOGORDELFTCONSTRUCT
CHRISTIAN HENRY
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada
Program Studi Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
(20)
iv Judul skripsi :Penambahan Modul Pembentukan Word Graph Kata Kerja pada Aplikasi
BogorDelftConstruct Nama : Christian Henry NRP : G64104103
Menyetujui,
Dr. Ir. Sri Nurdiati, M.Sc Pembimbing
Mengetahui, Ketua Departemen
Dr. Ir. Sri Nurdiati, M.Sc NIP: 196011261986012001
(21)
v
RIWAYAT HIDUP
Penulis dilahirkan di Tulungagung, Jawa Timur pada tanggal 21 Desember 1985 dari Bapak Enantius Prihantoro dan Ibu Wiwik Dwi Astuti. Penulis merupakan putra pertama dari dua bersaudara.
Penulis lulus dari SMA Negeri 1 Tangerang pada tahun 2004 dan pada tahun yang sama penulis lulus seleksi masuk IPB melalui jalur Ujian Masuk Perguruan Tinggi Nasional (UMPTN). Penulis memilih Program Studi S1 Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Pada tahun 2007 penulis melakukan Praktek Kerja Lapangan di PT. Indosat, Tbk., Jakarta selama 2 bulan.
(22)
vi
PRAKATA
Puji dan hormat penulis panjatkan kepada Tuhan YME atas segala berkat dan kasih sayangNya sehingga karya ilmiah ini berhasil diselesaikan. Syukur juga penulis panjatkan kepada Yesus Kristus atas segala teladan dan penyertaan-Nya dalam setiap kehidupan penulis. Tema yang dipilih dalam penelitian ini adalah pengimplementasian metode Knowledge Graph pada pengembangan kamus kata kerja, dengan judul Penambahan Modul Pembentukan Word Graph Kata Kerja pada Aplikasi BogorDelftConstruct. Penelitian dilakukan sejak Januari 2010 sampai dengan Maret 2011.
Terima kasih penulis ucapkan kepada
1. Papi dan Mami untuk doa, kasih sayang dan dukungan motivasi yang tak terhingga. Ungkapan terima kasih juga penulis sampaikan untuk adik, Rizal atas diskusi dan dukungannya. Terima kasih juga tak lupa penulis sampaikan kepada keluarga besar penulis. 2. Ibu Dr. Ir. Sri Nurdiati M.Sc selaku pembimbing atas waktu, kesempatan, saran, bimbingan
dan pengertian yang selalu diberikan.
3. Bapak Ahmad Ridha, S.Kom, MS. dan Bapak Sony Hartono Wijaya, S.Kom, M.Kom. selaku penguji yang telah memberikan kritik dan saran selama penelitian ini hingga sidang tugas akhir.
4. Annissa untuk ilmu, diskusi dan dukungan bagi penulis.
5. Felly Iglesia untuk dukungan dan motivasi baik secara moral maupun spiritual.
6. Beberapa teman dari ILKOM S1 angkatan 41 yang selalu memberikan dukungan dan semangat.
7. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu penulis dalam menyelesaikan penelitian ini.
Karya ilmiah ini masih jauh dari sempurna, dengan segala kerendahan hati penulis mengharapkan kritik dan saran yang membangun bagi karya ilmiah ini. Penulis berharap semoga karya ilmiah ini dapat memberikan manfaat bagi sang pembaca.
Bogor, Mei 2011 Christian Henry
(23)
vii
DAFTAR ISI
Halaman DAFTAR ISI ... vii DAFTAR GAMBAR... viii DAFTAR TABEL ... viii DAFTAR LAMPIRAN ... ix PENDAHULUAN ... 1 Latar Belakang ... 1 Tujuan... 1 Ruang Lingkup ... 1 Manfaat... 1 TINJAUAN PUSTAKA ... 1
Knowledge Graph (KG) ... 1
Concept (konsep) ... 2 Aspek Ontologi... 2 Verba (kata kerja) ... 3 METODE PENELITIAN ... 4 HASIL DAN PEMBAHASAN ... 5 KESIMPULAN DAN SARAN ... 9 Kesimpulan ... 9 Saran. ... 9 DAFTAR PUSTAKA ... 10 LAMPIRAN ... 11
(24)
viii
DAFTAR GAMBAR
Halaman Gambar 1 Contoh relasi ALI ... 2 Gambar 2 Contoh relasi CAU ... 2 Gambar 3 Contoh relasi EQU ... 2 Gambar 4 Contoh relasi SUB ... 2 Gambar 5 Contoh relasi DIS ... 2 Gambar 6 Contoh relasi PAR ... 2 Gambar 7 Contoh relasi ORD ... 3 Gambar 8 Contoh relasi SKO ... 3 Gambar 9 Contoh relasi Focus ... 3 Gambar 10 Frame relationship ... 3 Gambar 11 Tahapan penelitian ... 4 Gambar 12 Graf hasil pengujian kata ‘digarami’ ... 7 Gambar 13 Graf hasil pengujian kata ‘menari-nari’ ... 7
DAFTAR TABEL
Halaman Tabel 1 Pola pembentukan word graph kata kerja ... 5 Tabel 2 Akurasi hasil pengujian ... 7 Tabel 3 Hasil Pengujian word graph kata kerja Pola-teri ... 8
(25)
ix
DAFTAR LAMPIRAN
Halaman Lampiran 1 Diagram Alir Penambahan Modul Word Graph Kata Kerja ... 12 Lampiran 2 Pola Word Graph Kata Kerja ... 13 Lampiran 3 Pengujian Pola-vdasar ... 15 Lampiran 4 Pengujian Pola-mekani ... 17 Lampiran 5 Pengujian Pola-diter ... 19 Lampiran 6 Pengujian Pola-meku ... 21 Lampiran 7 Pengujian Pola-beran ... 22 Lampiran 8 Pengujian Pola-bermeke ... 23 Lampiran 9 Pengujian Pola-teri ... 26 Lampiran 10 Pengujian Pola-kkdu ... 27 Lampiran 11 Pengujian Pola-fixku ... 28 Lampiran 12 Pengujian Pola-berku ... 29
(26)
1
PENDAHULUAN
Latar Belakang
Bahasa alami yang digunakan manusia untuk berkomunikasi satu sama lain sangat bermanfaat dan penting dalam penyampaian informasi secara langsung. Di lain pihak, komputer masih sulit untuk memahami bahasa alami manusia. Dalam ilmu komputer bidang yang secara spesifik mempelajari cara komunikasi antara manusia dan komputer adalah Natural Language Processing (NLP). Sebuah kalimat dalam bahasa alami dapat dianalisis dari sudut pandang semantik atau sintaksis. Knowledge Graph merupakan salah satu metode dalam NLP yang menganalisis bahasa alami dengan lebih berfokus pada semantik daripada sintaksis.
Pengimplementasian metode Knowledge Graph pada bahasa alami diharapkan mampu memberikan abstraksi dari informasi atau pengetahuan yang terkandung di dalamnya ke dalam bentuk graf. Salah satu penelitian yang telah berhasil mengimplementasikan metode
Knowladge Graph pada suatu bahasa alami adalah DelftConstruct yang dikembangkan oleh Mark Van Koningsveld pada tahun 2003-2008.
DelfConStruct merupakan sebuah prototype
aplikasi untuk menganalisis Bahasa Inggris dan disajikan ke dalam bentuk graf dengan menggunakan metode Knowladge Graph. DelftConstruct dibangun menggunakan bahasa pemrograman MATLAB yang dapat membentuk suatu graf antara suatu kata dengan kata lainnya (word graph), namun belum sesuai dengan konsep Knowladge Graph (Romadoni 2009). Selain itu, DelftConstruct memiliki beberapa kekurangan antara lain:
• Belum memiliki fitur Dictionary untuk menyimpan, menampilkan dan mengubah graf.
• Ketidakjelasan arah relasi antar token, karena tidak adanya tanda panah yang menunjuk dari dan/atau ke suatu token.
• Belum memiliki kemampuan untuk membuat graf baru. Hanya mampu mengubah graf yang sedang ditampilkan.
• Belum mampu untuk menghapus token dan/atau teks.
• Tidak memiliki mekanisme untuk menampilkan graf lain yang sudah dibuat.
Dengan keterbatasan DelfConStruct yang hanya mampu menganalisis teks berbahasa Inggris maka dikembangkan BogorDelftConstruct yang nantinya mampu
menganalisis teks bahasa Indonesia dengan visualisasi graf sesuai yang dengan konsep
Knowledge Graph. Dengan pembentukan modul
word graph yang ada pada Bogor
DelfConStruct maka akan dikembangkan modul
word graph untuk kata kerja. Analisis bentuk dan makna dari kata kerja telah dilakukan pada penelitian sebelumnya oleh Ahmad Muslik (2009) yang menghasilkan pola aturan dari kata kerja. Penelitian ini mengembangkan modul pembentukan word graph kata kerja pada aplikasi BogorDelftConstruct berdasarkan aturan tersebut.
Tujuan
Penelitian ini bertujuan untuk menambahkan modul pembentukan word graph pada sistem aplikasi Bogor DelfConStruct. Hasil dari penelitian ini berupa word graph yang merepresentasikan kata kerja berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup
Penelitian ini dibatasi pada pengembangan modul pembentukan word graph untuk kata kerja pada sistem BogorDelftConstruct dengan menggunakan pola aturan dari hasil penelitian sebelumnya oleh Ahmad Muslik (2009). Berikut ini merupakan batasan-batasan sistem, pada pengembangan yang dilakukan:
a. Pada sistem ini yang menjadi masukan hanyalah kata dan posisi kata dalam kalimat tidak diperhatikan.
b. Makna semantik dari kata kerja tidak diperhatikan.
c. Pada saat proses pengecekan kata, sifat atau label dari kata dasar berdasarkan kamus. Manfaat
Manfaat jangka panjang penelitian ini adalah dibentuknya suatu sistem yang mampu membaca input berupa teks Bahasa Indonesia dan menghasilkan output berupa ringkasan atau informasi tentang teks tersebut secara otomatis. Selain itu dalam jangka pendek, sistem ini diharapkan mampu memberikan pengetahuan atau mengekspresikan makna kata kerja dalam bentuk word graph.
TINJAUAN PUSTAKA
Knowledge Graph (KG)
Knowledge Graph adalah cara pandang baru untuk menggambarkan bahasa manusia dengan difokuskan pada aspek semantik dari pada
(27)
2 sintatik. KG memiliki beberapa keuntungan
yang sangat besar. KG memiliki kemampuan menyatakan lapisan semantik yang paling dalam dengan hanya menggunakan sejumlah terbatas jenis relasi yang berguna dalam pemahaman bahasa manusia.
Pada prinsipnya, komposisi dari KG mencakup concept (banyak token dan type) serta relationship (binary dan multivariate relation) (Zhang 2002).
Concept (konsep)
Token
Dalam KG, token dinyatakan dengan simbol . Token menyatakan segala sesuatu yang dialami di dunia nyata atau sebuah konsep yang dialami menurut cara pandang masing-masing (Zhang 2002).
Type
Type adalah sebuah konsep yang bersifat umum dan objektif. Type memberi pandangan yang bersifat objektif karena membagi token
yang berbeda ke dalam kelas yang sama. Aspek Ontologi
Menurut Zhang (2002), ontologi word graph
terdiri atas 8 binary relationships dan 4 frame relationships. Delapan binary relationships
tersebut adalah :
1. Similarity of sets, alikeness : ALI
2. Causality : CAU
3. Equality : EQU
4. Subset relationship : SUB
5. Disparateness : DIS
6. Attribution : PAR
7. Ordering : ORD
8. Information dependency : SKO
Berikut penjelasan dari masing-masing
binary relationship tersebut: 1.Relasi ALI
Digunakan di antara type dan token dengan panah ke arah token untuk penamaan konsep. Contoh: jeruk, dinyatakan dengan
word graph:
Gambar 1 Contoh relasi ALI 2.Relasi CAU
Dilambangkan dengan anak panah berlabel CAU antara dua token yang menyatakan hubungan sebab akibat atau sesuatu yang mempengaruhi sesuatu yang lain. Contoh:
adik beli jeruk, dinyatakan dengan word graph:
Gambar 2 Contoh relasi CAU 3.Relasi EQU
Ada dua macam relasi EQU. Relasi EQU antara dua token menyatakan bahwa kedudukan kedua token tersebut sama, contoh: jeruk adalah buah. Relasi EQU yang dilambangkan dengan arah panah dari type
menuju konsep dapat diartikan penetapan sesuatu, contoh: kuning adalah nilai yang ditetapkan untuk warna. Relasi EQU dapat dinyatakan dengan word graph:
Gambar 3 Contoh relasi EQU 4.Relasi SUB
Digunakan jika dua token dinyatakan berturut-turut serta token yang satu merupakan subset dari token yang lain. Contoh: daun merupakan bagian dari pohon, dinyatakan dengan word graph:
Gambar 4 Contoh relasi SUB 5.Relasi DIS
Digunakan untuk menyatakan dua token
yang berbeda satu sama lain. Contoh: air berbeda dengan api, dinyatakan dengan
word graph:
Gambar 5 Contoh relasi DIS 6.Relasi PAR
Digunakan untuk menyatakan sesuatu merupakan atribut dari sesuatu yang lain. Contoh: air dingin, dinyatakan dengan word graph:
(28)
3 7.Relasi ORD
Digunakan untuk menunjukkan dua hal yang saling berurutan dalam hal waktu dan tempat. Contoh: dari pagi hingga malam, dinyatakan dengan word graph:
pagi
ALI ORD ALI
malam Gambar 7 Contoh relasi ORD 8.Relasi SKO
Relasi SKO digunakan berdasarkan konsep tentang ketergantungan informasi. Contoh: besar gaji ditentukan dari pangkat, dinyatakan dengan word graph:
pangkat
ALI SKO ALI
gaji Gambar 8 Contoh relasi SKO Di samping 8 binary relationships, ada ontologi F (Focus) yang digunakan untuk menunjukkan fokus dari suatu graf (Nurdiati & Hoede 2009). Ontologi F untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti). Contoh: gunung meletus, dinyatakan dengan word graph:
CAU ALI gunung meletus ALI F PAR
Gambar 9 Contoh relasi Focus
Kemudian empat frame relationships terdiri atas:
1. Focusing on a situation : FPAR
2. Negation on a situation : NEGPAR
3. Possibility on a situation : POSPAR
4. Necessityon a situation : NECPAR
Frame relationship merupakan verteks berlabel yang digunakan untuk mengelompokkan beberapa graf. Adakalanya suatu objek tidak cukup direpresentasikan dengan sebuah token, sehingga diperlukan sebuah frame untuk pengelompokan tersebut. Berikut penjelasan dari masing-masing frame relationship. Relasi FPAR menyatakan sesuatu memiliki properti dari sesuatu yang lain. Relasi NEGPAR menyatakan negasi dari isi frame. Relasi POSPAR menyatakan kemungkinan dari isi frame. Relasi NECPAR menyatakan keharusan terjadinya isi dari frame.
Gambar 10 Frame relationship Verba (kata kerja)
Kata kerja atau verba merupakan kelas kata yang menyatakan suatu tindakan, keberadaan, pengalaman, atau pengertian dinamis lainnya. Menurut Alwi et. al (2003) yang diacu dalam Ahmad Muslik (2009), ciri kata kerja dapat diketahui dengan mengamati perilaku semantis, perilaku sintaksis, dan bentuk morfologinya. Kata kerja secara umum mempunyai ciri sebagai berikut:
1.Kata kerja sebagai predikat atau inti predikat. Contoh : pencuri itu lari, adik
sedang belajar di kamar. Kata lari
merupakan predikat, sedangkan sedang belajar merupakan inti predikat.
2.Ada makna perbuatan (aksi), proses, atau keadaan yang bukan sifat atau kualitas. 3.Kata kerja yang bermakna keadaan tidak
dapat diberi prefiks ter yang artinya paling. Contoh: mati atau suka tidak dapat menjadi
termati atau tersuka.
4.Secara umum, kata kerja tidak dapat bersatu dengan kata-kata yang maknanya kesangatan seperti agak belajar, agak lari,
belanja sekali.
Kata Kerja dari segi bentuknya
Dari segi bentuk, kata kerja terbagi atas kata kerja dasar dan kata kerja turunan. Contoh kata kerja dasar: ada, bangun, cinta, naik, tamat, paham, rasa, yakin, dan sebagainya. Kata kerja turunan dibentuk dari transposisi, pengafiksan, pengulangan (reduplikasi), dan pemaduan dengan penjelasan sebagai berikut:
a.Transposisi
Transposisi merupakan suatu proses penurunan kata dari kategori sintaksis yang satu ke kategori sintaksis yang lain tanpa mengubah bentuknya (Alwi et al. 2003 dalam Muslik 2009). Contoh: telepon, cangkul, sikat.
b.Pengafiksan
Pengafiksan adalah penambahan afiks pada kata dasar. Kata dasar dapat berupa kata kerja, kata benda, ataupun kata sifat. Contoh: membeli, mendarat, bertemu, merestui, memperbesar.
(29)
4 c.Reduplikasi
Kata-kata yang mengalami proses ini disebut kata berulang, artinya kata kerja yang telah direduplikasi disebut juga kata kerja berulang. Contoh: lari-lari, makan-makan, tembak-menembak, menari-nari. d.Pemaduan
Pemaduan merupakan penggabungan dua kata dasar atau lebih sehingga menjadi beberapa kata yang memiliki satu makna. Contoh: jual beli, jatuh bangun, salah sangka.
METODE PENELITIAN
Pada penelitian ini akan ditambahkan modul pembentukan word graph untuk kata kerja. Tahapan yang dilakukan pada penelitian ini secara garis besar dapat dilihat pada Gambar 11.
Gambar 11 Tahapan penelitian Studi Literatur
Pada tahap ini dilakukan pengumpulan materi-materi yang dapat digunakan sebagai bahan rujukan yang relevan dengan topik penelitian. Penelitian ini didasarkan pada
penelitian sebelumnya, yaitu tesis Ahmad Muslik (2009) “Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode
Knowledge Graph” serta skripsi Deni Romadoni (2009) “Pengembangan Sistem Pembentukan Word Graph Untuk Teks Berbahasa Indonesia”.
Pembentukan Pola Word Graph Kata Kerja Pembentukan pola word graph kata kerja harus sesuai dengan aturan-aturan pembentukan kata kerja dari hasil analisis Muslik (2009). Pada penelitian Muslik (2009) diperoleh 30 aturan dengan 10 daftar pola kata kerja berdasarkan afiks dan maknanya.
Penambahan Modul Pembentukan Word Graph Kata Kerja
1. Praposes
Pada tahap ini ditentukan apakah kata kerja yang dimasukkan bersifat tunggal, mengandung numerik/karakter atau tidak. Jika tidak maka proses akan dilanjutkan ke tahap berikutnya. Selain itu, tahap ini juga bertujuan untuk memeriksa nilai masukan, dimana masukan yang akan dapat diproses harus berupa karakter.
2. Stemming
Pada tahap ini kata kerja akan dipecah untuk mendapatkan afiks (imbuhan) dan kata dasar. Program stemming dibuat dalam bahasa pemrograman MATLAB akan menghasilkan kata dasar serta imbuhan yang dapat berupa prefiks (awalan), sufiks (akhiran), atau infiks (sisipan).
Stemming ini mengacu pada Kamus Besar Bahasa Indonesia (KBBI) yang disesuaikan. Pada KBBI asli terdapat 3 (tiga) field yaitu, ‘Kata’, ‘Sifat’, dan ‘Subkata’. Field ‘Kata’ berisi kata dasar, field ‘Sifat’ berisi sifat kata seperti v (verba), n (nomina), dan sebagainya.
Field ‘Subkata’ berisi kata turunan yang terbentuk dari turunan kata dasar yang mengandung imbuhan. Satu kata dasar dapat memiliki lebih dari satu subkata. Untuk penelitian ini, basis data KBBI dibuat dalam tabel Entry.
Penentuan Pola Hasil (Pengujian)
Pada tahap ini hasil dari stemming yang berupa kata dasar dan imbuhan (afiks) akan dicocokkan dengan pola word graph kata kerja yang telah disimpan. Jika pengenalan polanya sesuai dengan pola word graph kata kerja yang telah disimpan, maka akan ditampilkan graph
(30)
5 yang sesuai dengan pola tersebut. Di lain pihak,
jika hasil dari stemming berupa pola kata dasar dan imbuhan yang tidak ada dalam pola kata kerja menurut Ahmad Muslik (2009) dan gagal dalam proses pengenalan, maka akan ditampilkan peringatan bahwa masukan bukan merupakan kata kerja. Tahapan penambahan kamus word graph kata kerja secara detail dapat dilihat pada Lampiran 1.
Analisis Hasil
Pada tahap ini pola kata kerja yang telah terbentuk akan dianalisis, apakah sudah sesuai dengan penelitian Muslik (2009) atau belum. Skenario pengujian dilakukan dengan memasukkan beberapa kata kerja kemudian dihitung akurasinya. Penghitungan akurasi dilakukan dengan cara menghitung berapa banyak kata yang dikenali dari beberapa masukkan kata kerja dan sesuai dengan pola
word graph.
=∑
∑ × 100%
Dokumentasi dan Laporan
Pada tahap ini akan dibahas hasil perhitungan keakuratan dari pengujian dari setiap pola. Jika didapati hasil akurasi yang rendah maka akan dicari sumber permasalahannya. Di lain pihak jika masalah yang dihadapi tidak dapat diatasi, maka akan dimasukkan ke dalam saran untuk penelitian selanjutnya.
HASIL DAN PEMBAHASAN
Pemahaman Bidang Kajian dan Identifikasi Masalah
Pengkajian mengenai pembentukan kamus
word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Muslik (2009) dan skripsi Romadoni (2009). Berdasarkan penelitian Muslik (2009) didapat 10 pola word graph yang dibentuk dari 30 aturan kata kerja. Sepuluh pola tersebut diberi nama sesuai dengan nama variabel dalam sistem. Pola pembentukan word graph dapat dilihat pada Tabel 1 dan lebih detail pada Lampiran 2.
Pengidentifikasian masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian, antara lain pembatasan penelitian berdasarkan ruang lingkup, program
stemming, penggunaan KBBI dalam penelitian,
pembentukan pola word graph, pengujian pola
word graph, analisis hasil pengujian.
Tabel 1 Pola pembentukan word graph kata kerja
Pola Pembentuk Kata Kerja
Nama Variabel Pola Dalam
Sistem Kata Kerja Dasar (KKD)
Ber-KK Pola-vdasar
Meng-/mem-/me-Kata Kerja (KK)
Meng-/mem-/me-KK-kan Meng-/mem-/me-Kata Benda (KB)-kan Meng-/mem-/me-Kata Sifat (KS)-kan Meng-/mem-/me-KK-I Meng-/mem-/me-KS-i Meng-/mem-/me-KB-i Memper-KB
Memper-KS
Memper-KK-kan/i
Pola-mekani
Di-KKtransitif-(-i/-kan) Ter-KKtransitif(-i)
Di-KB-i Diper-KS
Pola-diter
Meng-/mem-/me-Kata
Ulang (KU) Pola-meku
Ber-KB
Ber-KS
Ber-KKan
Pola-beran
Ber-KB-kan Ber-KK-an
Meng-/mem-/me-KS
Meng-/mem-/me-KB
Meng-/mem-/me-Kata Dasar Terikat
Ke-KK/KB/KS-an
Pola-bermeke
Ter-KKintransitif(-i) Pola-teri Kata Kerja Dasar Ulang Pola-kkdu KK-meng-/mem-/me-KK Pola-fixku
(31)
6 Praproses
Praproses merupakan tahap awal pengembangan Kamus Word Graph Kata Kerja. Praproses dilakukan untuk membatasi nilai masukan pada sistem. Masukan harus berupa kata tunggal atau tidak mengandung spasi (‘ ’). Fungsi untuk memeriksa hal ini didokumentasikan pada checkPlural yang jika bernilai ‘benar’ maka proses tidak akan dilanjutkan pada tahap berikutnya. Selain itu, jika nilai masukan berupa numerik maka sistem akan menampilkan peringatan pada user untuk memasukkan input yang berupa kata bukan numerik. Untuk memeriksa apakah masukan kata berupa numerik atau bukan digunakan fungsi checkNum.
Stemming
Program stemming dibuat sesuai kebutuhan penelitian sehingga mampu membuang awalan, akhiran, sisipan atau gabungan antara awalan dan akhiran yang sesuai dengan pola pembentuk kata kerja dengan keluaran berupa kata dasar. Selain itu, keluaran dari program stemming juga berupa imbuhan yang terkandung dalam kata masukan.
Program stemming terdokumentasi dalam fungsi getStem yang terdiri atas fungsi stemFix
dan stemm. Fungsi stemFix untuk kata masukan yang mengandung imbuhan yang terdapat pada tabel Fixations. Fungsi stemm untuk imbuhan asing dan untuk menanggulangi kata yang tidak terdapat dalam KBBI yang disesuaikan.
Proses stemming dengan KBBI yang disesuaikan dilakukan dengan langkah-langkah berikut:
1.Kata masukan dicari apakah terdapat pada KBBI atau tidak.
2.Jika ada pada KBBI yang disesuaikan, kata masukan diperiksa apakah mengandung imbuhan yang terdapat pada tabel Fixations atau tidak. Jika ya, dilakukan proses pemotongan berurut sesuai imbuhan-imbuhan yang dikenali pada tabel Fixations. Jika tidak, untuk imbuhan asing akan dilakukan proses
stemming. Selainnya, kata masukan yang dikenali pada KBBI yang disesuaikan dikembalikan kata dasarnya dan langsung dicari sifat kata dasarnya dalam KBBI yang disesuaikan.
3.Jika tidak terdapat pada KBBI yang disesuaikan maka dilakukan proses
stemming.
4.Kata masukan diproses dengan pemotongan bertahap untuk setiap kondisi. Setiap yang menghasilkan hasil stemming
dimasukkan dalam daftar kandidat kata dan diperiksa apakah terdapat pada KBBI yang disesuaikan atau tidak. Jika tidak ada satu kata yang ditemukan maka dikembalikan kata sebelum di-stemm. Pengenalan Pola Word Graph Kata Kerja
Setelah didapat kata dasar, sifat kata dasar dan imbuhannya akan digunakan untuk mengenali pola word graph pembentuk kata kerja menggunakan fungsi checkPatternVerb. Untuk mengetahui sifat kata dasar hasil
stemming dilakukan pengecekan terhadap kata dasar pada database ‘kamus’ menggunakan fungsi cekKata.
Fungsi checkPatternVerb akan membandingkan apakah kata dasar dan alternatif kata dasar (jika ada) serta imbuhan yang terkandung dari kata masukan sesuai dengan pola word graph yang ada. Jika ya, maka fungsi akan mengembalikan salah satu nama pola dari 10 daftar pola word graph yang memenuhi kondisi. Misalnya, kata masukan ‘memulai’ jika dilakukan stemming akan menghasilkan kata dasar ‘mulai’, ‘pulai’ sebagai kata dasar alternatif dan imbuhan ‘mem’ dikenali sebagai pola word graph ‘mem-kata kerja’. Pola ‘mem-‘mem-kata kerja’ termasuk salah satu pola word graph kata kerja. Fungsi
checkPatternVerb akan memeriksa apakah kata dasar ‘mulai’ memiliki sifat kata kerja (verba) atau kata dasar alternatif ‘pulai’ yang bersifat sebagai kata kerja. Jika salah satunya terpenuhi maka kata tersebut dianggap sebagai kata dasar dari kata masukan ‘memulai’.
Pembentukan Pola Word Graph Kata Kerja Hasil tahap penentuan pola word graph kata kerja akan menampilkan word graph dari pola yang membentuknya. Kata masukan yang memenuhi kondisi pola word graph kata kerja tertentu akan memanggil fungsi yang membuat pola word graph kata masukan.
Jika kata masukan tidak memenuhi semua kondisi pola pembentukan word graph kata kerja, maka kata tersebut bukan kata kerja bentuk turunan dan akan dicari jenis kata dasar dari kata masukan serta akan menampilkan peringatan bahwa kata masukan bukan kata kerja.
Penelitian ini juga dibatasi untuk pola word graph kata kerja dasar’ intransitif dan ‘ter-kata kerja dasar’ transitif, karena sulitnya
(1)
7 Memburuk sesuai dengan variabel word graph
pola-bermeke Buruk a (kata sifat)
8 Menguning sesuai dengan variabel word graph
pola-bermeke Kuning a (kata sifat)
9 Mencair sesuai dengan variabel word graph
pola-bermeke Cair a (kata sifat)
10 Membaik sesuai dengan variabel word graph
pola-bermeke Baik a (kata sifat)
11 Menguat sesuai dengan variabel word graph
pola-bermeke Kuat a (kata sifat)
12 Mengecil sesuai dengan variabel word graph
pola-bermeke Kecil a (kata sifat)
3. Pola ke-Kata Kerja/Kata Benda/Kata Sifat-an
No Kata Masukan Hasil Pengujian Kata Dasar Sifat Kata
Dasar
1 Kenamaan sesuai dengan variabel word graph
pola-bermeke Darat n (kata benda)
2 Ketempatan sesuai dengan variabel word graph
pola-bermeke Batu n (kata benda)
3 Kehujanan sesuai dengan variabel word graph
pola-bermeke Laut n (kata benda)
4 Ketakwaan sesuai dengan variabel word graph
pola-bermeke Utara n (kata benda)
5 Ketumpahan sesuai dengan variabel word graph
pola-bermeke Tumpah v (kata kerja)
6 Kejatuhan sesuai dengan variabel word graph
pola-bermeke Kopi v (kata kerja)
7 Kelihatan sesuai dengan variabel word graph
pola-bermeke Buruk v (kata kerja)
8 Kemasukan sesuai dengan variabel word graph
pola-bermeke Kuning v (kata kerja)
9 Kemahalan sesuai dengan variabel word graph
(2)
4. Contoh graf pola-bermeke Kata
masukan
Word graph yang ditampilkan Hasil
pengujian
(3)
Lampiran 9 Pengujian Pola-teri
1. Pola ter-Kata Kerja Dasar intransitif(-i)
No Kata
Masukan Hasil Pengujian Kata Dasar Sifat Kata Dasar
1 Terduduk sesuai dengan variabel word graph pola-teri Duduk v (kata kerja)
2 Terantuk sesuai dengan variabel word graph pola-teri Antuk v (kata kerja)
3 Terbangun sesuai dengan variabel word graph pola-teri Bangun v (kata kerja)
4 Tertidur sesuai dengan variabel word graph pola-teri Tidur v (kata kerja)
5 Terbenam sesuai dengan variabel word graph pola-teri Benam v (kata kerja)
6 Terjatuh sesuai dengan variabel word graph pola-teri Jatuh v (kata kerja)
7 Terlampaui sesuai dengan variabel word graph pola-teri Lampau v (kata kerja)
8 Tersaingi sesuai dengan variabel word graph pola-teri Saing v (kata kerja)
9 Tertanami sesuai dengan variabel word graph pola-teri Tanam v (kata kerja)
10 Tersirami sesuai dengan variabel word graph pola-teri Siram v (kata kerja)
11 Teraliri sesuai dengan variabel word graph pola-teri Alir v (kata kerja)
12 Terhalangi sesuai dengan variabel word graph pola-teri Halang v (kata kerja)
2. Contoh graf pola-teri Kata
masukan
Word graph yang ditampilkan Hasil
pengujian
(4)
Lampiran 10 Pengujian Pola-kkdu
1. Pola Kata Kerja Dasar Ulang
No Kata Masukan Hasil Pengujian Kata
Dasar
Sifat Kata Dasar
1 Lari-lari sesuai dengan variabel word graph pola-kkdu Lari v (kata kerja)
2 Jalan-jalan sesuai dengan variabel word graph pola-kkdu Jalan v (kata kerja)
3 Lihat-lihat sesuai dengan variabel word graph pola-kkdu Lihat v (kata kerja)
4 Duduk-duduk sesuai dengan variabel word graph pola-kkdu Duduk v (kata kerja)
5 Datang-datang sesuai dengan variabel word graph pola-kkdu Datang v (kata kerja)
6 Minta-minta sesuai dengan variabel word graph pola-kkdu Minta v (kata kerja)
7 Pekik-pekik sesuai dengan variabel word graph pola-kkdu Pekik v (kata kerja)
8 Putar-putar sesuai dengan variabel word graph pola-kkdu Putar v (kata kerja)
9 Tidur-tidur sesuai dengan variabel word graph pola-kkdu Tidur v (kata kerja)
10 Naik-naik sesuai dengan variabel word graph pola-kkdu Naik v (kata kerja)
2. Contoh graf pola-kkdu
Kata masukan
Word graph yang ditampilkan Hasil
pengujian
(5)
Lampiran 11 Pengujian Pola-fixku
1. Pola Kata Kerja-meng-/mem-/me-Kata Kerja
N
o Kata Masukan Hasil Pengujian
Kata Dasar
Sifat Kata Dasar
1 Tusuk-menusuk sesuai dengan variabel word graph pola-fixku Tusuk v (kata kerja)
2 Tikam-menikam sesuai dengan variabel word graph pola-fixku Tikam v (kata kerja)
3 Tiup-meniup sesuai dengan variabel word graph pola-fixku Tiup v (kata kerja)
4 Tinjau-meninjau sesuai dengan variabel word graph pola-fixku Tinjau v (kata kerja)
5 Tolak-menolak sesuai dengan variabel word graph pola-fixku Tolak v (kata kerja)
6
Tolong-menolong sesuai dengan variabel word graph pola-fixku Tolong v (kata kerja)
7 Tukar-menukar sesuai dengan variabel word graph pola-fixku Tukar v (kata kerja)
8
Anyam-menganyam sesuai dengan variabel word graph pola-fixku Anyam v (kata kerja)
9 Cabik-mencabik sesuai dengan variabel word graph pola-fixku Cabik v (kata kerja)
10
Pinjam-meminjam sesuai dengan variabel word graph pola-fixku Pinjam v (kata kerja)
11
Pasang-memasang sesuai dengan variabel word graph pola-fixku Pasang v (kata kerja)
12
Senggol-menyenggol sesuai dengan variabel word graph pola-fixku Senggol v (kata kerja)
2. Contoh graf pola-fixku
Kata masukan
Word graph yang ditampilkan Hasil
(6)
Lampiran 12 Pengujian Pola-berku
1. Pola ber-Kata Ulang
N
o Kata Masukan Hasil Pengujian
Kata Dasar
Sifat Kata Dasar
1 Berlari-lari sesuai dengan variabel word graph pola-berku Lari v (kata kerja)
2 Berenang-renang sesuai dengan variabel word graph pola-berku Renang v (kata kerja)
3 Bersakit-sakit sesuai dengan variabel word graph pola-berku Sakit a (kata sifat)
4 Berangguk-angguk sesuai dengan variabel word graph pola-berku Angguk v (kata kerja)
5 Berbayang-bayang sesuai dengan variabel word graph pola-berku Bayang v (kata kerja)
6 Berbincang-bincang sesuai dengan variabel word graph pola-berku Bincang v (kata kerja)
7 Bersenang-senang sesuai dengan variabel word graph pola-berku Senang a (kata sifat)
8 Berdebar-debar sesuai dengan variabel word graph pola-berku Debar v (kata kerja)
9 Berfoya-foya sesuai dengan variabel word graph pola-berku Foya v (kata kerja)
10 Berhati-hati sesuai dengan variabel word graph pola-berku Hati n (kata benda)
11 Berjaga-jaga sesuai dengan variabel word graph pola-berku Jaga v (kata kerja)
12
Berjingkrak-jingkrak sesuai dengan variabel word graph pola-berku Jingkrak v (kata kerja)
2. Contoh graf pola-berku
Kata masukan
Word graph yang ditampilkan Hasil
pengujian