Modul Word Graph Frasa Kata pada BogorDelftConstruct

MODUL WORD GRAPH FRASA KATA
PADA BOGORDELFTCONSTRUCT

BENEDIKA FERDIAN HUTABARAT

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

MODUL WORD GRAPH FRASA KATA
PADA BOGORDELFTCONSTRUCT

BENEDIKA FERDIAN HUTABARAT

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer


DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

ABSTRACT
BENEDIKA FERDIAN HUTABARAT. Phrase word graph module in BogorDelftConstruct.
Supervised by SRI NURDIATI.
BogorDelftConStruct is the first KG application developed in Indonesia using MATLAB.
BogorDelftConstruct has been developed as an early stage. In line with that, this research
implemented semantic analysis for one part-of-speech in BogorDelftConstruct. The objective of
this research is to develop a phrase word graph module in BogorDelftConstruct system. The phrase
has 40 word graph patterns formed by affixation. The process of forming word graph starts by
acquiring root word and affix within input word using stemming based on Kamus Besar Bahasa
Indonesia (KBBI). Root word is used to search part-of-speech in KBBI. Part-of-speech of root
word and affix are used as parameters to determine which pattern of phrase word graph is
appropriate. The appropriate pattern which contains the meaning of the word is generated in the
system. The process of determining the appropriate pattern can be considered as a testing stage. In
this module, from 40 patterns of phrase word graph, all of them can be identified according to the

results of testing for patterns of phrase word graph module with a total of 265 tested phrases.
Keyword : phrase word graph, Knowledge Graph, stemming, Kamus Besar Bahasa Indonesia
(KBBI).

Judul skripsi
Nama
NIM

: Modul Word Graph Frasa Kata pada BogorDelftConstruct
: Benedika Ferdian Hutabarat
: G64051906

Menyetujui,
Dosen Pembimbing,

Dr. Ir. Sri Nurdiati, M.Sc
NIP. 19601126198601 2 001

Mengetahui:
Ketua Departemen,


Dr. Ir. Agus Buono, M.Si, M.Kom
NIP. 196607021993021001

Tanggal lulus:

i

KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Allah Yang Maha Kasih atas segala cinta dan kasih
sayang-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini
adalah penerapan metode Knowledge Graph pada pembentukan modul word graph frasa kata, dengan
judul Pengembangan Modul Word Graph Frasa Kata pada Sistem aplikasi BogorDelftConstruct.
Penelitian dilakukan sejak Oktober 2010 sampai dengan September 2011.
Terima kasih penulis ucapkan kepada:
1 Papa dan Mama untuk doa, kasih sayang dan dukungan yang tak pernah putus;
2 Ibu Dr. Ir. Sri Nurdiati M.Sc. selaku pembimbing atas waktu, saran, bimbingan dan
pengertian yang diberikan;
3 Bapak Ahmad Ridha, S.Kom, MS. dan Bapak Sony Hartono Wijaya, S.Kom, M.Kom.
selaku penguji yang telah memberikan kritik dan saran selama penulis mulai melakukan

penelitian hingga sidang tugas akhir;
4 Teman-teman seperjuangan angkatan 42 Ilkom IPB;
5 Sahabat-sahabat Perwira 43;
6 Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu penulis
dalam menyelesaikan penelitian ini;
Penulis berharap hasil dari penelitian ini dapat bermanfaat dan dapat menjadi acuan bagi penelitian
selanjutnya.
Bogor, Februari 2012

Benedika Ferdian Hutabarat

ii

RIWAYAT HIDUP
Penulis dilahirkan di Jambi pada tanggal 2 Februari 1987 dari ayah P.M.Hutabarat dan ibu Stella
Havelina. Penulis merupakan putra ketiga dari empat bersaudara.
Penulis lulus dari SMA Negeri 1 Kota Jambi pada tahun 2005 dan pada tahun yang sama penulis
lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB. Penulis memilih Program Studi
Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Pada
tahun 2008 penulis melakukan Praktik Kerja Lapangan di Pusat Data dan Informasi Departemen

Pertanian, Bogor selama 35 hari.

iii

DAFTAR ISI
Halaman
DAFTAR GAMBAR ........................................................................................................................ v
DAFTAR LAMPIRAN..................................................................................................................... v
PENDAHULUAN
Latar Belakang ......................................................................................................................... 1
Tujuan ...................................................................................................................................... 1
Ruang Lingkup ......................................................................................................................... 2
Manfaat .................................................................................................................................... 2
TINJAUAN PUSTAKA
Natural Language Processing (NLP) ...................................................................................... 2
Stemming .................................................................................................................................. 2
Knowledge Graph (KG) ........................................................................................................... 2
Concept .................................................................................................................................... 2
Token ....................................................................................................................................... 2
Type .......................................................................................................................................... 2

Word Graph ............................................................................................................................. 2
Aspek Ontologi ........................................................................................................................ 3
Ekspresi Semantik dengan KG................................................................................................. 4
Frasa Kata ................................................................................................................................ 5
METODE PENELITIAN
Studi Literatur .......................................................................................................................... 7
Penambahan Modul Frasa Kata................................................................................................ 7
Penentuan Pola Hasil (Pengujian) ............................................................................................ 8
Analisis Hasil ........................................................................................................................... 8
Dokumentasi dan Laporan ....................................................................................................... 8
HASIL DAN PEMBAHASAN
Batasan Sistem ......................................................................................................................... 8
Penambahan Modul Frasa Kata................................................................................................ 8
Proses Pengenalan Pola ............................................................................................................ 9
Pola Word Graph Frasa Kata ................................................................................................... 9
Implementasi Antarmuka ....................................................................................................... 10
Analisis Hasil ......................................................................................................................... 10
Analisis Hasil Pengujian Keseluruhan ................................................................................... 14
Analisis Kekurangan dan Kelebihan Pengembangan Modul Word Graph Frasa Kata .......... 15
KESIMPULAN DAN SARAN

Kesimpulan ............................................................................................................................ 15
Saran ...................................................................................................................................... 15
DAFTAR PUSTAKA ..................................................................................................................... 15
LAMPIRAN ................................................................................................................................... 17

iv

DAFTAR GAMBAR
Halaman
1 Contoh penggunaan relasi ALI .................................................................................................... 3
2 Contoh penggunaan relasi CAU .................................................................................................. 3
3 Contoh penggunaan relasi EQU................................................................................................... 3
4 Contoh penggunaan relasi SUB .................................................................................................. 3
5 Contoh penggunaan relasi DIS ................................................................................................... 3
6 Contoh penggunaan relasi ORD ................................................................................................. 3
7 Contoh penggunaan relasi PAR .................................................................................................. 4
8 Contoh penggunaan relasi SKO .................................................................................................. 4
9 Contoh penggunaan frame FPAR ............................................................................................... 4
10 Contoh penggunaan frame NEGPAR .......................................................................................... 4
11 Contoh penggunaan frame POSPAR ........................................................................................... 4

12 Contoh penggunaan frame NECPAR .......................................................................................... 4
13 Diagram proses penambahan modul frasa kata ............................................................................ 6
14 Contoh word graph yang dibentuk dalam workspace .................................................................. 8
15 Menu frasa dictionary ................................................................................................................ 10
16 Input box .................................................................................................................................... 10
17 Contoh sebuah word graph frasa kata yang polanya sesuai....................................................... 10

DAFTAR LAMPIRAN
Halaman
1 Splash Screen Delftconstruct ....................................................................................................... 18
2 Tampilan Menu Modul Word Graph Frasa Kata ......................................................................... 18
3 Diagram Alir Pengembangan Modul Word Graph Frasa Kata .................................................... 19
4 Pola word graph frasa kata .......................................................................................................... 20
5 Hasil Pengujian Pola Word Graph Frasa Kata ............................................................................. 30
6 Contoh Frasa Kata Masukan dan Tampilan Word Graph ............................................................ 36

v

1


PENDAHULUAN
Latar Belakang
Bahasa alami tumbuh secara alami untuk
memenuhi kebutuhan komunikasi antar
manusia. Bahasa alami tidak dirancang dengan
memperhatikan berbagai kendala untuk
kemudahan
pemrosesan.
Berkembangnya
teknologi komputer menarik minat para
ilmuwan untuk menggunakan bahasa alami
(bahasa manusia) untuk melakukan komunikasi
dengan komputer atau mesin. Selama ini bahasa
alami tidak dikenali dan diproses oleh
komputer. Bahasa yang lazim digunakan untuk
komunikasi antara manusia dan komputer
selama ini adalah “Bahasa Buatan”. Bahasa
buatan membutuhkan perangkat lunak yang
dapat mengonversi bahasa buatan tersebut
menjadi bahasa mesin. Perangkat lunak tersebut

disebut compiler. Akan tetapi dalam praktiknya,
penggunaan bahasa buatan tersebut perlu waktu
dan usaha untuk mempelajarinya, sehingga
tidak setiap orang dapat menggunakannya.
Oleh karena itu, usaha untuk mewujudkan
bahasa alami sebagai bahasa yang dikenali
komputer terus dilakukan agar memudahkan
banyak orang untuk berkomunikasi dengan
komputer.
Penelitian dalam bahasa alami melahirkan
bidang ilmu Natural Language Processing
(NLP). Penelitian tersebut terus dikembangkan
oleh para insan ilmiah. Masalah yang harus
diselesaikan dalam NLP adalah adanya
ambiguitas dalam bahasa alami. Hal ini
membuat komputer tidak dapat dengan pasti
memberikan output yang diharapkan. Banyak
variabel yang harus dipertimbangkan untuk
memahami bahasa alami sehingga sulit
diinterpretasikan untuk dijadikan bahasa

komunikasi antara manusia dan komputer.
Selain itu terdapat masalah lain yaitu jumlah
kosakata dalam bahasa alami sangat besar dan
berkembang dari waktu ke waktu. Untuk
berkomunikasi dengan komputer tentunya
manusia menggunakan kata atau rangkaian kata
berupa kalimat yang sederhana dan tidak
ambigu.
Penelitian yang dilakukan dilatarbelakangi
oleh permasalahan di atas. Penelitian yang akan
dilakukan adalah mengembangkan perangkat
lunak yang telah dibangun oleh Mark van
Koningsveld pada tahun 2008. Perangkat lunak
tersebut
bernama
“DelftConstruct”.
DelftConstruct adalah tools yang menganalisis
teks bahasa Inggris dan menampilkan
visualisasi dalam bentuk graph dengan
menggunakan metode Knowledge Graph.

DelftConstruct dibangun dengan menggunakan
bahasa pemograman Matlab. Antarmuka
DelftConstruct dapat dilihat pada Lampiran 1.
DelftConstruct yang telah dibuat oleh Mark
van Koningsveld mengimplementasikan sistem
yang dapat menganalisis suatu kata dan
membentuk suatu graph antara satu kata dengan
kata lainnya (word graph).
Kekurangan
perangkat
lunak
ini
adalah
belum
mengimplementasikan fungsi untuk membuat
suatu penyederhanaan kalimat dari kalimat yang
tidak efektif menjadi kalimat yang sederhana
dan efektif. Oleh karena itu, diperlukan fitur
atau menu tambahan untuk bisa membaca
masukan teks berupa kalimat dan melakukan
penyederhanaan kalimat sehingga dapat
menampilkan informasi berupa graph. Metode
yang dilakukan dalam merepresentasikan teks
ke dalam bentuk graph adalah Knowledge
Graph (KG).
KG adalah salah satu jenis dari representasi
NLP, yang mengarah pada cara baru dalam
menjelaskan dan memodelkan NLP dan juga
sebagai langkah besar ke depan
untuk
memahami semantik (Zhang 2002). Hal ini
dilakukan dengan cara menganalisis teks yang
diharapkan
dapat
menghasilkan
sebuah
pengetahuan baru. Berbagai penelitian KG yang
dilakukan diharapkan mampu merancang suatu
sistem yang dapat melakukan pembacaan
terhadap sembarang dokumen yang diinginkan
dan menginterpretasikan informasi yang didapat
dalam bentuk graph. Penelitian yang akan
dilakukan merupakan langkah awal dari
sebagian proses
yang
panjang
untuk
mewujudkan harapan tersebut.
Aplikasi ini masih memiliki keterbatasan
dalam menganalisis frasa kata. Hal ini
disebabkan oleh belum adanya modul yang
tersedia. Untuk mengatasi hal tersebut, pada
penelitian ini akan ditambahkan sebuah modul
yang dapat menampilkan word graph frasa kata.
Modul
ini
nantinya
berfungsi
untuk
menampilkan setiap frasa kata yang ditemukan
pada input frasa menjadi word graph frasa kata.
Karena adanya fitur pembentukan kamus word
graph pada BogorDelftConstruct, maka
dikembangkan modul word graph frasa kata.
Penelitian ini membuat modul word graph frasa
kata pada sistem aplikasi BogorDelftConstruct
berdasarkan aturan tersebut (Romadoni 2009).
Tujuan
Penelitian ini bertujuan mengembangkan
modul word graph frasa kata pada sistem

2

aplikasi BogorDelftConstruct berdasarkan hasil
analisis aturan dari penelitian sebelumnya.
Ruang Lingkup
Ruang lingkup untuk penelitian ini dibatasi
pada pengembangan modul sistem aplikasi
BogorDelftConstruct untuk membuat modul
word graph frasa kata sesuai aturan-aturan
pembentukan kata dari hasil analisis penelitian
sebelumnya yang dilakukan oleh Mahmuda
(2010). Berikut ini merupakan batasan – batasan
sistem pada pengembangan yang dilakukan:
a

Pada sistem ini yang menjadi masukan
adalah 2 sampai 3 kata.

b

Makna semantik dari frasa kata tidak
diperhatikan.

c

Penggambaran graph disesuaikan dengan
sistem
BogorDelftConstruct
Deni
Romadoni (2009).

Manfaat
Penelitian ini diharapkan dapat memberikan
manfaat agar dapat memvisualisasikan makna
suatu frasa kata yang direpresentasikan dalam
bentuk word graph sehingga tidak terjadi
ambiguitas.

TINJAUAN PUSTAKA
Natural Language Processing (NLP)
Secara umum, natural language atau bahasa
alami (yang digunakan manusia) adalah metode
dan sistem simbol yang paling banyak
digunakan untuk mengekspresikan pikiran
manusia dan pertukaran informasi. Terdapat
sebuah pemisah antara bahasa formal atau
bahasa buatan (yang digunakan oleh komputer)
dan bahasa alami. Komunikasi antara komputer
dan manusia hanya dimungkinkan ketika
banyak penelitian yang bertujuan untuk
menjembatani pemisah di antara keduanya
(Zhang 2002). Secara alami menggambarkan
dan memodelkan bahasa alami adalah dasar
untuk perkembangan dari proses memaknai
bahasa alami dan menentukan arah proses
penelitian dari bahasa alami.
Proses memahami bahasa alami disebut
parsing. Dalam melakukan parsing terhadap
sebuah kalimat, diperlukan tata bahasa untuk
menggambarkan bagian-bagian dari kalimat
tersebut. Ada dua faktor yang diperhatikan
dalam menganalisis sebuah kalimat, yaitu
sintaksis dan semantik. Perbedaan sintaksis dan
semantik adalah sintaksis melakukan analisis

berdasarkan bentuk dari sebuah kalimat
sedangkan semantik menganalisis bagaimana
mengartikan suatu kalimat (Hulliyah 2007).
Stemming
Stemming merupakan proses menemukan
kata dasar dari suatu kata berimbuhan dengan
membuang awalan (prefiks) dan akhiran
(sufiks). Tujuannya adalah untuk menghemat
media penyimpanan dan mempercepat proses
pencarian kata (Liddy 2001).
Knowledge Graph (KG)
Teori KG adalah jenis sudut pandang baru,
yang digunakan untuk menggambarkan bahasa
manusia saat lebih memfokuskan pada aspek
semantik daripada aspek sintatik. KG
mempunyai kemampuan lebih kuat untuk
mengekspresikan dan menggambarkan lebih
dalam semantic layers. KG juga dapat
meminimumkan penggunaan relation set dan
menirukan pengertian dari jalan pikiran manusia
(Zhang 2002).
KG sebagai bagian dari metode baru yang
merepresentasikan pengetahuan, tergolong pada
kategori semantic network. Dalam prinsipnya,
KG tersusun dari concept (tokens dan types) dan
relationship (binary dan multivariate relation)
(Zhang 2002).
Concept
Representasi
pemikiran
yang
dapat
dimodelkan dengan KG disebut dengan mind
graph. Concept merupakan komponen dari
mind graph yang menerangkan persepsi
mengenai sesuatu (Zhang 2002).
Token
Token merupakan node dalam KG, yang
dinyatakan dengan simbol □. Token
menyatakan segala sesuatu yang kita alami
dalam dunia nyata atau bahkan mengenai
sebuah konsep dalam pikiran kita. Dalam
metode
KG
segala
sesuatu
akan
direpresentasikan atau digambarkan sebagai
sebuah token (Zhang 2002) .
Type
Type adalah konsep yang berisi informasi
umum. Type bersifat objektif karena merupakan
hasil kesepakatan bersama (Zhang 2002).
Word Graph
Word Graph adalah unit dasar dari NLP.
Word graph dibangun dari kata depan dan kata
tambahan (seperti kata sifat dan kata
keterangan) (Zhang
2002). Word graph

3

merupakan graph dari kata atau serangkaian
kata. Dalam metode KG, setiap kata
berhubungan dengan sebuah word graph,
menyatakan arti kata yang disebut dengan
semantic word graph. Gabungan semantic word
graph dalam sebuah kalimat akan membentuk
sentence graph. Graf yang merepresentasikan
gabungan dari sentence graph dalam sebuah
teks disebut text graph yang terdapat
pengetahuan di dalamnya (Hoede & Nurdiati
2008).

3 EQU (Equality)
Relasi ini digunakan di antara dua token
yang mengekspresikan keduanya adalah sama
dan sederajat. Contoh: “anjing bernama Pluto”.
Pernyataan tersebut dapat dilihat pada Gambar
3.
anjing

EQU

ALI

Pluto

EQU

Aspek Ontologi
Ontologi adalah ilmu untuk menggambarkan
beberapa konsep dan relasi-relasi diantaranya
dengan maksud memberikan definisi yang
cukup terhadap ide-ide yang dituangkan dengan
komputer untuk merepresentasikan ide-ide
tersebut dan logikanya (Hulliyah
2007).
Berdasarkan ontologi yang dimiliki inilah KG
dapat membangun sebuah model yang dapat
digunakan untuk memahami bahasa alami. Hal
ini diperlukan agar arti dari suatu kalimat dapat
diekspresikan. Arti dari kata harus terlebih
dahulu diketahui untuk dapat mengartikan
sebuah kalimat (Rusiyamti 2008).
Ontologi word graph sampai saat ini
direpresentasikan dengan sebuah node, 8 types
binary relationship, dan 4 types n-ary
relationship
atau
disebut juga
frame
relationship serta Ontologi F (Focus). Berikut
ini adalah gambaran dari 8 types relationship
(Zhang 2002) dan Ontologi F (Focus):
1 ALI (Alikeness)
Relasi ALI digunakan di antara dua token
yang memilki unsur-unsur yang sama. Contoh
penggunaan relasi ALI dapat dilihat pada
Gambar 1.

Gambar 3 Contoh penggunaan relasi EQU.
4 SUB (Subset)
Bila
terdapat
dua
token
yang
mengekspresikan
dua
rangkaian
secara
berurutan dan satu token merupakan bagian dari
token yang lainnya, di antara kedua token
tersebut terdapat relasi SUB. Contoh: “ekor
merupakan bagian dari kucing”. Pernyataan
tersebut dapat dilihat pada Gambar 4.
ALI

ekor

SUB

ALI

kucing

Gambar 4 Contoh penggunaan relasi SUB.
5 DIS (Dissparatness)
Relasi
DIS
digunakan
untuk
mengekspresikan bahwa dua token tidak
memiliki hubungan satu dengan yang lainnya.
Contoh relasi DIS digunakan untuk menunjukan
kata “berbeda”, misalnya: “air berbeda dengan
minyak” dapat dinyatakan dengan graph yang
diperlihatkan pada Gambar 5.
air

ALI

DIS

ALI

minyak

ALI

tumbuhan

Gambar 5 Contoh penggunaan relasi DIS.
Gambar 1 Contoh penggunaan relasi ALI.
2 CAU (Causality)
Relasi CAU mengekspresikan hubungan
antara sebab dan akibat, atau sesuatu hal yang
memengaruhi sesuatu yang lain. Contoh: “Ibu
makan nasi”. Kalimat tersebut dapat dilihat
pada Gambar 2.
ibu

ALI

CAU

CAU

ALI

nasi

ALI

makan
Gambar 2 Contoh penggunaan relasi CAU.

6 ORD (Ordering)
Relasi ORD mengekspresikan bahwa dua
hal mempunyai urutan satu sama lain. Contoh
penggunaan relasi ORD untuk menyatakan
“pagi sampai sore”, ditunjukkan pada Gambar
6.
pagi

ALI

ORD

ALI

sore

Gambar 6 Contoh penggunaan relasi ORD.

4

7 PAR (Attribute)
Relasi PAR mengekspresikan bahwa sebuah
token adalah sebuah atribut dari token yang
lain. Contohnya untuk menyatakan frasa “apel
merah” . Pernyataan tersebut dapat dilihat pada
Gambar 7.
apel ALI

PAR

ALI

merah

Gambar 7 Contoh penggunaan relasi PAR.
8 SKO (Informational Dependency)
Relasi skolem (SKO) digunakan jika suatu
token informasinya bergantung pada token
yang
lainnya.
Contoh:
pernyataan

∀x ∈ N, ∃ y ∈ N (x 2 = y) yang memuat

pada Gambar 10 menunjukkan bahwa adik tidak
bahagia.

Gambar 10 Contoh penggunaan frame
NEGPAR.
3 POSPAR : Possibility of a situation
POSPAR mengekspresikan kemungkinan
terjadi dari isi frame. Misalkan diketahui a:
“Adik Bahagia”. Frame pada Gambar 11
menunjukkan bahwa mungkin saja adik
bahagia.

universal quantifiers. Pada pernyataan tersebut
nilai y bergantung pada x . Bentuk grafnya
dapat dilihat pada Gambar 8.

x

ALI

SKO

ALI

y

Gambar 8 Contoh penggunaan relasi SKO.
9 Ontologi F (Focus)
Ontologi F digunakan untuk menunjukkan
fokus dari suatu graf (Nurdiati & Hoede 2009).
Ontologi F digunakan untuk menunjukkan kata
atau kalimat yang diterangkan dalam suatu
pernyataan (inti).
Sebuah frame adalah sebuah node yang
diberikan label (Zhang 2002). Adapun untuk
empat frame relationship dapat dijelaskan
sebagai berikut:
1 FPAR: Focusing on a situation
FPAR mengekspresikan bahwa sekumpulan
subgraph dari graph adalah bagian dari seluruh
graph yang telah dibentuk. Misalkan dinyatakan
bahwa a: “Adik Bahagia”. Pernyataan tersebut
dapat dilihat pada Gambar 9.

Gambar 9 Contoh penggunaan frame FPAR.
2 NEGPAR: Negation of a situation
NEGPAR mengekspresikan peniadaan atau
pengingkaran terjadinya isi dari frame.
Misalkan diketahui a: “Adik Bahagia”. Frame

Gambar 11 Contoh penggunaan frame
POSPAR.
4 NECPAR : Necessity of a situation
NECPAR mengekspresikan perlu, butuh
atau keharusan terjadi dari isi frame. Misalkan
diketahui a: “Adik Bahagia”. Frame pada
Gambar 12 menunjukkan bahwa seharusnya
adik bahagia.

Gambar 12 Contoh penggunaan frame
NECPAR.
Ekspresi Semantik dengan KG
Dalam metode KG untuk membangun
model pemahaman bahasa alami dibutuhkan
kemampuan untuk menyatakan makna kata atau
kalimat. Kemampuan untuk memahami makna
kalimat harus disertai pemahaman makna setiap
kata. Kemudian makna setiap kata disusun
menjadi makna suatu kalimat secara
keseluruhan (Zhang 2002).
Pemaknaan setiap kata menjadi dasar
pembentukan word graph. Pemaknaan kata
dinyatakan dalam bentuk hubungan antar
konsep. Makna kata dalam metode KG
membangun struktur arti sehingga dapat
mengatasi ambiguitas.

5

Frasa Kata
Pike (1977) menyatakan bahwa frasa adalah
perluasan kata. Wujudnya dua kata atau lebih.
Tataran frasa urutannya ada di bawah klausa
dan di atas kata (Cook 1969). Frasa dibentuk
dari beberapa kata dan mengisi gatra pada
tataran klausa. Jadi, beda kata dari frasa
hanyalah kenyataan bahwa frasa merupakan
perluasan dari kata atau dengan kata lain frasa
adalah bentuk bahasa dimana kata menjadi
unsur pembentuknya. Dalam frasa tunggal, kata
adalah unsur langsungnya.
Frasa adalah satuan gramatikal berupa
gabungan
kata
dengan
kata
bersifat
nonprediktif. Menurut hubungan unsur dalam
strukturnya, frasa dapat dibedakan atas:
1 Frasa Eksosentris
Sebuah frasa bersifat eksosentris bila hasil
gabungan itu berlainan kelasnya dari unsur yang
membentuknya (Keraf 1991). Konstruksi ini
dapat dibedakan atas :


Frasa eksosentris direktif

Dalam bentuk semacam ini sebuah
unsur pembentuk frasa akan bertindak sebagai
partikel, sedang unsur lainnya merupakan
sumbu
(aksis).
Misalnya:
mengalami
penurunan dan pemerasan kopra.


Frasa eksosentris konektif

Dalam bentuk ini salah satu unsurnya
adalah konektor yang berfungsi sebagai
penghubung antar unsur pembentuk frasa yang
menjadi atribut predikat dengan subjeknya
(Keraf 1991). Dalam hal ini atribut predikat
tidak menerangkan konektornya, tetapi
menerangkan subjeknya. Misalnya: menjadi
tepung dan adalah keberagaman.
2 Frasa Endosentris
Sebuah frasa bersifat endosentris bila
gabungan dua kata atau lebih yang
menunjukkan bahwa kelas kata dari perpaduan
itu sama dengan kelas kata dari salah satu (atau
lebih) unsur pembentuknya (Keraf 1991). Kata
yang kelas katanya sama dengan kelas kata
penggabungan itu disebut inti atau pusat. Frasa
endosentris dapat dibedakan menjadi:


Misalnya: kebun petani dan pendapatan
petani.


Frasa koordinatif

Frasa koordinatif adalah frasa yang
unsur-unsur
pembentuknya
sama
kedudukannya. Dalam tipe frasa ini, kelas dari
gabungan itu sama dengan kedua atau lebih
unsurnya. Misalnya: masuk keluar dan manis
pahit.
Di samping berdasarkan hubungan unsur
dalam strukturnya, frasa juga dapat dibedakan
berdasarkan kelas kata yang menjadi inti frasa
(Keraf 1991). Jenis frasa koordinatif adalah:
1 Frasa Nominal (FN)
Frasa nominal atau frasa kata benda adalah
kelompok kata yang menyatakan atau menunjuk
suatu benda. Inti frasa nominal adalah kata
benda. Misalnya: modal bersama dan mutu
tepung jagung.
2 Frasa Verbal
Frasa verbal atau frasa kata kerja adalah
kelompok kata yang menyatakan tindakan atau
perbuatan. Inti frasa verbal adalah kata kerja.
Misalnya: dihadapi petani dan meningkatkan
biaya pengendalian.
3 Frasa Adjektival
Frasa adjektival atau frasa kata sifat adalah
kelompok kata yang menyatakan sifat atau
keadaan. Inti frasa adjektival adalah kata sifat.
Misalnya: tahan kekeringan dan putih bening.
4 Frasa Preposisional
Frasa Preposisional atau frasa kata depan
adalah kelompok kata yang terdiri dari preposisi
sebagai inti diikuti oleh kata atau kelompok kata
lain terutama kata benda. Fungsi frasa preposisi
antara lain menunjuk arah, tempat, dan waktu.
Misalnya: di lapangan dan dari pangkal daun.
Gabungan antara kata dengan kata yang
membentuk
sebuah
frasa
menimbulkan
pengertian baru atau mendukung sebuah relasi
tertentu (Keraf 1991). Hubungan makna antar
unsur yang membentuk frasa dapat berupa:
1

Relasi posesif adalah relasi yang
menunjukkan hubungan pemilik. Kata
kedua (pembatas) adalah pemilik kata
pertama. Frasa ini dapat dipisahkan
dengan kata milik dan kepunyaan.
Misalnya: ”kemampuan petani” dan
kandungan nutrisi jagung.

2

Relasi subjektif adalah relasi yang
pembatasnya adalah pelaku dari kata yang

Frasa atribut atau subordinatif

Frasa atribut atau subordinatif adalah
frasa yang salah satu dari unsur pembentuknya
bertindak sebagai inti. Adapun unsur yang
lainnya bertindak sebagai atribut dari inti.

6

dibatasi. Frasa ini dapat dipecahkan
dengan menyisipkan kata oleh dan yang
dilakukan oleh. Misalnya: dihadapi petani
dan ditampung pihak swasta.
3

Relasi objektif adalah relasi yang kata
keduanya sebenarnya menjadi objek dari
kata pertama. Frasa ini sebenarnya hasil
substantivasi frasa objektif direktif. Frasa
ini dapat dipecahkan dengan menggunakan
kata akan, kepada, dan tentang. Misalnya:
menghasilkan tekstur dan memenuhi
kebutuhan pangan.

4

Relasi tujuan adalah relasi yang
pembatasnya merupakan tujuan dari kata
yang dibatasi. Frasa ini dapat dipecahkan
dengan kata bagi, buat, guna, dan untuk.
Misalnya: makanan rakyat dan untuk
membeli solar.

5

Relasi keahlian adalah relasi yang
pembatasnya merupakan keahlian dari kata
yang dibatasi. Dapat digunakan kata dalam
bidang untuk memisahkan frasa itu.
Misalnya: petani kelapa dan dokter ahli
saraf.

6

7

8

9

10

Relasi asal adalah relasi yang pembatasnya
merupakan asal dari kata yang dibatasi.
Frasa ini dapat dipecahkan dengan
menyisipkan kata dari dan yang berasal
dari. Misalnya: tenaga mesin dan dari
pangkal daun.
Relasi partitif adalah relasi yang
pembatasnya merupakan keseluruhan dari
kata yang dibatasi atau kata yang dibatasi
merupakan bagian dari pembatasnya.
Parafrasa bentuk ini dapat dilakukan
dengan menyisipkan kata dari. Misalnya:
biji jagung.
Relasi material adalah relasi yang
pembatasnya menyatakan materi yang
dipakai untuk kata yang dibatasi. Dalam
hal ini dapat digunakan kata dari dan
dibuat dari untuk menyatakan hubungan
itu secara eksplisit. Misalnya: tepung
jagung dan minyak kelapa.
Relasi perbandingan adalah relasi yang
pembatasnya merupakan perbandingan
bagi kata yang dibatasi. Frasa ini
dipisahkan dengan kata seperti dan
bagaikan. Misalnya: berakar serabut dan
putih susu.
Relasi instrumental adalah relasi yang
pembatasnya merupakan alat bagi kata
yang dibatasi. Relasi ini dapat dinyatakan
dengan menggunakan kata dengan.

Misalnya: tumbuh baik
kehidupan masyarakat.
11

dan

dengan

Relasi lokatif adalah relasi yang
pembatasnya merupakan tempat atau
tempat bekerja dari kata yang dibatasi.
Kata yang dapat disisipkan untuk
menyatakan hubungan ini secara eksplisit
adalah di, pada, dan dalam. Misalnya:
masyarakat Papua dan di kebun petani.

METODE PENELITIAN
Pada bab ini dibahas tahapan penelitian
dalam proses pembentukan modul word graph
frasa kata. Diagram proses penambahan modul
word graph frasa kata dapat dilihat pada
Gambar 13.
Mulai

Studi Literatur

Penambahan Modul
Frasa Kata

Penentuan Pola Hasil
(Pengujian)

Analisis Hasil

Dokumentasi &
Laporan

Selesai
Gambar 13 Diagram proses penambahan
modul frasa kata.

7

Studi Literatur
Penelitian
ini
diawali
dengan
mengumpulkan bahan-bahan pustaka yang
relevan dengan topik kajian penelitian.
Penelitian ini mengkaji pembentukan modul
word graph frasa kata sebagai bagian dari
sistem aplikasi BogorDelftConstruct. Penelitian
ini didasarkan pada penelitian sebelumnya, di
antaranya skripsi Deni Romadoni (2009) yang
berjudul “Pengembangan Sistem Pembentukan
Word Graph untuk Teks Berbahasa Indonesia”
dan Tesis Mahmuda (2010) yang berjudul
“Konstruksi Pola Word Graph Frasa Kata
Menggunakan Metode Knowledge Graph”.
Hasil kajian dua penelitian sebelumnya
digunakan untuk mengembangkan modul word
graph frasa kata.
Penambahan Modul Frasa Kata
Terdapat beberapa tahapan pada proses
penambahan modul frasa kata yaitu:
a

Praproses

Tahapan praproses dilakukan untuk
membatasi nilai input. Pertama akan dilakukan
proses tokenisasi pada frasa kata yang berguna
untuk memecah frasa kata. Setelah itu, frasa
kata yang telah dipecah akan disimpan dalam
array sementara
yang
akan dihitung
panjangnya. Setelah frasa kata melalui tahap
tokenisasi, frasa kata tersebut akan diperiksa
panjang array-nya apakah panjang array sama
dengan satu atau tidak. Jika panjang array frasa
kata sama dengan satu, berarti input bukan
merupakan frasa kata dan akan muncul pesan
peringatan yang menyatakan bahwa input tidak
akan diproses ke tahap selanjutnya. Jika panjang
array lebih dari satu, frasa kata yang telah
ditokenisasi akan diperiksa satu per satu apakah
kata-kata tersebut mengandung nilai masukan
selain karakter. Jika kata-kata tersebut
mengandung nilai masukan selain karakter,
akan muncul pesan peringatan dan frasa kata
tidak akan diproses ke tahap selanjutnya.
b

Ekstraksi Data Frasa Kata

Frasa kata yang telah melewati tahap
praproses akan diekstraksi datanya yang
berguna untuk pencarian pola frasa kata.
Ekstraksi data frasa kata adalah proses
pengambilan data frasa kata yang telah
ditokenisasi berupa jenis kata, kata dasar, jenis
kata dasar, dan imbuhan.
Pertama, array kata dari hasil tokenisasi
akan diperiksa satu per satu ke dalam database
kamus. Data yang dapat diambil dari database
kamus adalah jenis kata dan kata dasar. Setiap

kata yang berhasil diekstraksi datanya akan
disimpan dalam array StorageType{n} untuk
jenis kata dan StorageBase{n} untuk kata dasar
dengan indeks n sebagai penunjuk kata ke-n.
Jika kata ke-n adalah kata dasar, kata tersebut
langsung dikembalikan sebagai output-nya. Jika
kata ke-n adalah kata berimbuhan, kata tersebut
harus melalui proses stemming terlebih dahulu.
Proses stemming yang digunakan pada
penelitian ini mengadopsi proses stemming yang
telah dilakukan oleh Iqbal (2010). Proses
stemming yang dilakukan Iqbal (2010)
menggunakan KBBI yang telah disesuaikan.
KBBI digunakan untuk memeriksa kata dasar
hasil stemming. Pada penelitian ini KBBI selain
digunakan untuk memeriksa kata dasar hasil
stemming, juga digunakan untuk mengenali
label dari kata dasar yang didapat dari hasil
stemming.
Pada KBBI yang digunakan dalam
penelitian ini dilakukan beberapa perubahan.
Pada awalnya di dalam KBBI asli terdapat tiga
field, yaitu: ‘Kata’, ‘Sifat’, dan ’Subkata’. Field
‘Kata’ berisi kata dasar sedangkan field
‘Subkata’ berisi kata turunan, yang terdiri dari
kata berimbuhan dan kata berulang. Satu kata
dasar dapat memiliki lebih dari satu subkata.
Kata-kata tersebut disusun berdasarkan susunan
alfabetis. Tiap-tiap kata ditulis dengan
pemenggalan kata berdasarkan Pedoman Umum
Ejaan Bahasa Indonesia yang Disempurnakan.
Misalnya kata ‘mengandalkan’, dipenggal
menjadi ‘meng.an.dal.kan’. Field ‘Sifat’ berisi
label dari kata yang sesuai dengan konteks dan
keperluannya. Label ragam bahasa, label kelas
kata,
label
penggunaan
bahasa
yang
menunjukkan dalam dialek mana kata yang
bersangkutan digunakan, serta label bidang
kehidupan dan bidang ilmu yang menunjukkan
dalam bidang apa kata tersebut digunakan.
Misalnya, label ‘n komp’ merupakan nomina
(kata benda) yang digunakan pada bidang
kehidupan dan bidang ilmu komputer.
Seluruh kata yang dimuat dalam KBBI
beserta labelnya (seperti kelas kata, ragam
bahasa dan sebagainya) disusun dalam tabel
Entry (Iqbal 2010). Tabel Entry terdiri dari
empat field, yaitu ‘EntryID’, ‘Word’,
‘Category’, dan ‘Stem’. Field ‘EntryID’ berisi
nomor identifikasi kata. Field ‘Word’ berisi
kata dasar dan kata turunan sedangkan field
‘Stem’ berisi kata dasar. Field ‘Category’ berisi
label dari kata yang diambil kelas kata secara
umumnya saja. Misalnya, label ‘n komp’ diubah
menjadi ‘n’ (nomina) saja.

8

Kata yang telah melalui proses stemming
akan disimpan output-nya, yang berupa
imbuhan (awalan dan akhiran), ke dalam array
StorageFix{n} dengan indeks n sebagai
penunjuk kata ke-n.
Penentuan Pola Hasil (Pengujian)
Pada tahap ini, hasil dari stemming yang
berupa kata dasar dan imbuhan (afiks) akan
dicocokkan dengan pola word graph frasa kata
yang telah disimpan. Jika pengenalan polanya
sesuai dengan pola word graph frasa kata yang
telah disimpan, graph akan ditampilkan.
Pembentukan pola frasa kata disesuaikan
dengan aturan-aturan pembentukan frasa kata
yang telah dianalisis dalam penelitian Mahmuda
(2010). Berdasarkan penelitian yang dilakukan,
terdapat 69 aturan pembentukan pola word
graph
frasa
kata.
Pola-pola
tersebut
digolongkan berdasarkan makna semantik dan
bentuk imbuhan yang terdapat pada kata
tersebut sedangkan berdasarkan bentuk word
graph yang sama terdapat 40 bentuk pola frasa
kata. Gambar 14 memperlihatkan contoh sebuah
word graph yang berhasil dibentuk pada
workspace, yang menyatakan
pernyataan
“umur panen”.

diamati apakah hasil dari unit itu sesuai dengan
proses yang diinginkan.
Dokumentasi dan Laporan
Pada tahap ini akan dibahas hasil
perhitungan keakuratan dari pengujian setiap
pola. Jika didapati hasil akurasi yang rendah,
akan dicari sumber permasalahannya. Di lain
pihak, jika masalah yang dihadapi tidak dapat
diatasi, masalah tersebut akan dimasukkan ke
dalam saran untuk penelitian selanjutnya.
Tahapan pengembangan modul word graph
frasa kata dapat dilihat secara rinci pada
Lampiran 3.

HASIL DAN PEMBAHASAN
BogorDelftConstruct merupakan perangkat
lunak yang dikembangkan dengan berbagai fitur
tambahan yang mendukung terbentuknya word
graph
sesuai
dengan
konsep
KG.
BogorDelftConstruct dikembangkan dengan
bahasa
pemrograman
MATLAB.
Pengembangan yang dilakukan pada penelitian
ini dengan menambahkan modul frasa kata pada
BogorDelftConstruct.
Batasan Sistem
Berikut ini merupakan batasan-batasan
sistem pada pengembangan yang dilakukan:

Gambar 14 Contoh word graph yang dibentuk
dalam workspace.
Analisis Hasil
Pada tahap ini pola frasa kata yang telah
terbentuk akan dianalisis, apakah telah sesuai
dengan penelitian yang telah dilakukan oleh
Mahmuda (2010) atau tidak. Sejumlah frasa
kata dimasukkan untuk dijadikan skenario
pengujian kemudian dihitung akurasinya.
Penghitungan akurasi dilakukan dengan cara
menghitung berapa banyak kata yang benar
dalam pengujian dibagi dengan berapa banyak
kata yang diuji.
akurasi =

∑ kata yang benar
∑ kata yang diuji

x100%

Pengujian dilakukan dengan menggunakan
metode pengujian black box. Pada metode
pengujian black box, cara pengujian hanya
dilakukan
dengan
menjalankan
atau
mengeksekusi unit atau modul. Kemudian

a Pada sistem ini yang menjadi masukan
hanyalah frasa kata yang terdiri atas dua
sampai tiga kata.
b Sistem hanya mampu mengenali 40 pola dari
60 pola frasa kata berdasarkan bentuk word
graph.
c Panel relationship inward dan outward
hanya muncul pada beberapa pola tertentu.
Karena tidak muncul untuk semua pola,
maka panel relationship inward dan outward
dihilangkan.
d Label dari kata dasar berdasarkan kamus.
Penambahan Modul Frasa Kata
Di dalam modul frasa kata terdapat
beberapa proses, diantaranya:
a

Praproses

Frasa kata yang dimasukkan akan
ditokenisasi.
Tokenisasi
adalah
proses
pemecahan frasa kata dan disimpan ke dalam
array bernama word{n} dengan indeks n
sebagai penunjuk kata ke-n. Array word{n}
akan dihitung panjangnya dan diperiksa dengan
menggunakan fungsi CheckInputFrasaKata.m.
Fungsi ini berguna untuk memeriksa frasa kata

9

yang telah ditokenisasi. Jika panjang array
word{n} sama dengan satu, muncul pesan
peringatan bahwa input tidak dapat diproses ke
tahap selanjutnya. Jika panjang input tidak sama
dengan satu, diperiksa apakah kata ke-n
mengandung nilai masukan selain karakter. Jika
kata ke-n mengandung nilai masukan selain
karakter, muncul pesan peringatan bahwa input
tidak dapat diproses ke tahap selanjutnya. Jika
kata ke-n tidak mengandung selain karakter,
frasa kata diproses ke tahap ekstraksi data.
b

Ekstraksi Data Frasa Kata

Frasa kata yang telah melalui tahap
praproses diperiksa ke dalam database kamus
untuk diambil datanya. Database kamus yang
digunakan adalah database KBBI yang telah
disesuaikan. Data frasa kata berupa jenis kata,
kata dasar, jenis kata dasar, dan imbuhan.
Pertama, diperiksa setiap kata yang ada di array
word{n}. Data jenis kata diambil dari tabel
Entry pada field ’Category’ sedangkan data kata
dasar diambil dari tabel Entry pada field
’Stem’. Jika kata ke-n merupakan kata dasar,
output yang berupa jenis kata, kata dasar, jenis
kata
dasar,
dan
imbuhan
langsung
dikembalikan. Jika kata ke-n adalah kata
berimbuhan, kata tersebut harus melalui proses
stemming terlebih dahulu untuk mendapatkan
data imbuhan.
Proses stemming yang digunakan pada
penelitian ini mengadopsi proses stemming yang
telah dilakukan oleh Iqbal (2010). Proses
stemming tersebut mampu menangani masalah
overstem dan understem dengan baik.
Proses stemming dengan KBBI dilakukan
dengan langkah-langkah berikut:
1 Kata yang akan di-stem dicari apakah
terdapat dalam KBBI atau tidak.
2 Jika kata tersebut ditemukan pada KBBI,
akan diambil kata dasarnya pada field ‘Stem’
dan dimasukkan ke dalam daftar kandidat
kata.
3 Jika kata tersebut tidak terdapat pada KBBI
yang disesuaikan, kata tersebut akan
diperiksa apakah mengandung imbuhan
yang terdapat pada tabel Fixations atau
tidak. Untuk setiap imbuhan yang terdapat
pada tabel Fixations dilakukan proses
pemotongan berurut sesuai dengan imbuhanimbuhan yang terdapat pada tabel tersebut.
Jika imbuhan tidak terdapat pada tabel
Fixations, dilakukan proses stemming.
4 Setiap
hasil
pemotongan
imbuhan
dimasukkan pada sebuah daftar kandidat
kata. Setiap kata yang terdapat dalam

kandidat kata diperiksa apakah terdapat
dalam KBBI yang disesuaikan atau tidak.
Jika tidak ada satupun kata yang terdapat
dalam KBBI yang disesuaikan, kata
masukan sebelum di-stem dikembalikan.
Jika terdapat lebih dari satu kandidat kata,
semua kata yang ditemukan dikembalikan.
Kata yang dikembalikan disertai label dari
kata dasar hasil stemming.
Proses stemming dilakukan untuk semua
kata pada array word{n} dan disimpan dalam
array StorageFix{n} dengan indeks n adalah
imbuhan kata ke-n. Array StorageFix{n}
digunakan sebagai salah satu data untuk
pencarian pola frasa kata.
Proses Pengenalan Pola
Setelah mendapatkan data yang diperlukan
untuk pencarian pola frasa kata seperti array
word{n}, StorageType{n}, StorageBase{n},
StorageFix{n}, dan bt{n}, frasa kata ditentukan
pola word graph-nya. Penentuan pola word
graph ini disesuaikan dengan aturan-aturan
pembentukan frasa kata yang telah dianalisis
dalam penelitian Mahmuda (2010).
Pola Word Graph Frasa Kata
Berdasarkan
penelitian
yang
telah
dilakukan oleh Mahmuda (2010), pola frasa
kata berdasarkan bentuknya terdiri atas 60 pola.
Namun, yang digunakan dalam penelitian ini
hanya 40 pola saja. Dari 40 pola bentuk frasa
kata terdapat 69 jenis aturan frasa kata.
Beberapa pola dan aturan frasa kata dapat
dilihat pada Tabel 1.
Tabel 1 Daftar pola dan aturan frasa kata
Pola

Aturan

1

(N1+N2)1

2

(N1+N2 (pe-KB))

3

(N+V (ber-KS))

4

(N1 (ke-KS-an)+N2)

5

(N1 (pe-KK-an)+N2(pe-KB))

6

(N1 + (N2 + N3))

7

(N1 + (N2(pe-KB) + N3))

8

((N1 + V) + N2)

9

(N1 + (KB-an) + N2) + N3)

10

Daftar pola dan aturan frasa kata Tabel 1
dirujuk dari daftar pola yang terdapat pada
Lampiran 5. Terdapat beberapa pola yang
memiliki kemiripan aturan seperti (N1 + N2)1,
(N1 + N2)2, dan (N1 + N2)3. Perbedaan ketiga
pola tersebut terdapat pada relasinya. Jika pola
tersebut ditandai dengan 1, relasi yang
digunakan adalah PAR. Jika ditandai dengan 2,
relasi yang digunakan adalah SUB. Jika ditandai
dengan 3, digunakan relasi EQU. Suatu pola
dikatakan cocok jika pola yang didapat pada
pencarian pola sesuai dengan aturan frasa kata.
Untuk memeriksa apakah frasa kata yang
dimasukkan sesuai dengan aturan frasa kata
diperlukan pengujian.

fokus dari suatu token maka token tersebut
diberi warna yang berbeda dari token lainnya.
Gambar 17 memperlihatkan contoh sebuah
word graph frasa kata yang polanya sesuai
dengan aturan-aturan frasa kata yang telah
diteliti oleh Mahmuda (2010). Pada Gambar 17
terdapat fokus pada sebuah token yang
ditunjukkan oleh perbedaan warna. Word graph
yang ditampilkan pada modul dapat dilihat
secara rinci pada Lampiran 6.

Implementasi Antarmuka
Perancangan antarmuka sistem aplikasi
BogorDelftConstruct yang dikembangkan tidak
memiliki perbedaan signifikan. Gambar 15
memperlihatkan
gambar
menu
Frasa
Dictionary. Jika menu Frasa Dictionary ditekan,
maka akan muncul input box. Gambar 16
memperlihatkan gambar input box, ketika menu
Frasa Dictionary ditekan. Frasa kata yang akan
dicari dimasukkan ke dalam input box. Setelah
itu frasa kata tersebut akan diproses. Tampilan
menu modul word graph frasa kata dapat dilihat
pada Lampiran 2.

Gambar 17 Contoh sebuah word graph frasa
kata yang polanya sesuai.
Analisis Hasil
Hasil word graph frasa kata yang terbentuk
secara otomatis dianalisis kesesuaiannya dengan
pola berdasarkan aturan frasa kata pada
penelitian Mahmuda (2010). Hasil pengujian
dapat dilihat pada Tabel 2.
Tabel 2 Hasil pengujian aturan frasa kata

Gambar 15 Menu frasa dictionary.

Gambar 16 Input box.
Proses yang pertama adalah praproses.
Dalam praproses, frasa kata akan dipecah
melalui proses tokenisasi dan input akan
diperiksa apakah sebuah frasa kata atau bukan
dan mengandung selain karakter atau tidak.
Setelah
dilakukan
praproses,
dilakukan
ekstraksi data frasa kata. Ekstraksi data frasa
kata menghasilkan beberapa array yaitu
word{n}, StorageType{n}, StorageBase{n},
StorageFix{n}, dan bt{n}. Kemudian dilakukan
pencarian pola frasa kata. Dalam modul frasa
kata, jika ada input kata yang kata dasarnya
tidak ada dalam database kamus, akan muncul
pesan peringatan bahwa kata tidak ada dalam
database. Pada graf yang ditampilkan, jika ada

Pola
Word
Graph

Jumlah
Input

Jumlah
Input
Benar

Akurasi

Pola 1

23

23

100%

Pola 2

18

18

100%

Pola 3

6

6

100%

Pola 4

21

21

100%

Pola 5

10

10

100%

Pola 6

5

5

100%

Pola 7

5

5

100%

Pola 8

5

5

100%

Pola 9

5

5

100%

Pola 10

5

5

100%

Pola 11

5

5

100%

Pola 12

4

4

100%

Pola 13

5

5

100%

Pola 14

5

5

100%

11

1

Tabel 2 (lanjutan)

Pengujian Pola 1

Pola 15

5

5

100%

Pola 16

4

4

100%

Pola 17

7

7

100%

Pola 18

5

5

100%

Pola 19

5

5

100%

Pola 20

3

3

100%

Pola 21

4

4

100%

Pola 22

3

3

100%

Frasa kata yang diuji untuk Pola 1 (N1 +
N2) adalah uang logam, umur manusia, isu
politik, isu sosial, dan umur panen. Frasa kata
yang diuji untuk Pola 1 (N + V) adalah daya
beli, daya juang, dan jarak tanam. Frasa kata
yang diuji untuk Pola 1(V + Adj) adalah bangkit
mandiri, jalan santai, kerja baik, dan tumbuh
baik. Frasa kata yang diuji untuk Pola 1 (N +
Adj) adalah pihak swasta, gedung murah, kultur
lokal, dan negara agraris. Frasa kata yang diuji
untuk Pola 1 (Adj + N) adalah putih susu,
kuning langsat, dan hitam manis. Frasa kata
yang diuji untuk Pola 1 (Adj + Adj) adalah
putih bening dan coklat masam. Total akurasi
keseluruhan untuk Pola 1 adalah 100%.

Pola 23

4

4

100%

2

Pola 24

3

3

100%

Pola 25

4

4

100%

Pola 26

12

12

100%

Pola 27

4

4

100%

Pola 28

3

3

100%

Pola 29

28

28

100%

Pola 30

7

7

100%

Pola 31

6

6

100%

Pola 32

3

3

100%

Pola 33

4

4

100%

Pola 34

3

3

100%

Pola 35

4

4

100%

Frasa kata yang diuji untuk Pola 2 (N1 +
N2(pe-KB)) adalah kebun peternak, lahan
petani, rumah petani, tali pengikat, tali pengait,
dan bahan pengikat. Sementara itu, untuk Pola
2 (N1 + N2(pe-KB-an)) frasa kata yang diuji
adalah
modal
pengendalian,
biaya
pemanfaatan,
dan
modal
pemanfaatan
sedangkan untuk Pola 2 (N1 + N2(pe-KS-an)
frasa kata yang diuji adalah modal penelitian,
biaya pemenuhan, dan biaya pengosongan.
Sementara itu, untuk Pola 2 (N1 + N2(pe-KKan)) frasa kata yang diuji adalah uang
pemerasan, biaya pengolahan, dan modal
pengalaman sedangkan untuk Pola 2 (Adj +
N(ke-KS-an)) frasa kata yang diuji adalah tahan
kekeringan, tahan kekuatan, dan suka
kelemahan. Total akurasi keseluruhan untuk
Pola 2 adalah 100%.

Pola 36

8

8

100%

3

Pola 37

4

4

100%

Pola 38

3

3

100%

Pola 39

4

4

100%

Pola 40

3

3

100%

Frasa kata yang diuji untuk Pola 3 (N +
V(ber-KS)) adalah modal bersama, modal
berbeda, lahan bersama, lahan berbeda,
komunikasi berbeda, dan tenaga bersama. Total
akurasi keseluruhan untuk Pola 3 adalah 100%.

Pola
Word
Graph

Jumlah
Input

Jumlah
Input
Benar

Akurasi

4
Kolom “Jumlah Input” pada Tabel 2 adalah
sejumlah frasa kata yang dimasukkan pada
pengujian sedangkan kolom “Jumlah Input
Benar” adalah input yang mengeluarkan output
pola word graph yang sesuai dengan aturannya.
Kolom “Akurasi” adalah hasil perhitungan
ketepatan pengenalan pola frasa kata seperti
yang telah dijelaskan pada bab metode
penelitian.
Penjelasan detail mengenai pengujian
masing-masing pola adalah sebagai berikut:

Pengujian Pola 2

Pengujian Pola 3

Pengujian Pola 4

Frasa kata yang diuji untuk Pola 4 (N1(keKS-an) + N2) adalah kekuatan otot, kelemahan
otot, dan kemampuan keras. Sementara itu,
untuk Pola 4 (N1(KB-an) + N2) frasa kata yang
diuji adalah kandungan gizi, kandungan keras,
dan kandungan jagung sedangkan untuk Pola 4
(N1(ke-KK-an) + N2) frasa kata yang diuji
adalah kebutuhan beras, kebutuhan nasi, dan
kebutuhan jagung. Sementara itu untuk Pola 4
(N1(ke-KB-an) + N2) frasa kata yang diuji
adalah keragaman beras, keragaman manusia,
dan keragaman jagung sedangkan untuk Pola 4

12

kelemahan. Total akurasi untuk Pola 10 ada