Representasi Word Graph Frasa Keterangan Bahasa Indonesia Menggunakan XML
REPRESENTASI WORD GRAPH FRASA KETERANGAN
BAHASA INDONESIA MENGGUNAKAN XML
CIPTA WIRASWASTA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
REPRESENTASI WORD GRAPH FRASA KETERANGAN
BAHASA INDONESIA MENGGUNAKAN XML
CIPTA WIRASWASTA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
ABSTRACT
CIPTA WIRASWASTA. Representation of Word Graph for Indonesian Adverb Phrases Using
XML. Supervised by SRI NURDIATI and AHMAD RIDHA.
Knowledge graph (KG) is one of the methods representing knowledge in the form of a
graph. One part of knowledge graph is word graph that describes the semantic of a word. In this
research, we present word graph for Indonesian adverb phrases using extensible markup language
(XML). The general pattern in adverb phrases word graph consists of 29 patterns generated from
the previous research done by Zikri Sulistiawan. The steps of this research are literature study,
pattern analysis, XML design, testing, and documentating. From analysis, we have 9 duplicate
patterns, so that there are 20 patterns which will be formed in XML. All of them have been
successfully represented in XML. We conclud that the word graph of Indonesian adverb phrases
could be represented as XML documents.
Keywords: Indonesian adverb phrases, knowledge graph, word graph, XML.
Judul Skripsi
Nama
NIM
: Representasi Word Graph Frasa Keterangan Bahasa Indonesia
Menggunakan XML
: Cipta Wiraswasta
: G64080032
Menyetujui:
Pembimbing 1,
Pembimbing 2,
Dr. Ir. Sri Nurdiati, M.Sc
NIP. 19601126 198601 2 001
Ahmad Ridha, S.Kom, MS
NIP. 19800507 200501 1 001
Mengetahui:
Ketua Departemen,
Dr. Ir. Agus Buono, M.Si, M.Kom
NIP. 19660702 199302 1 001
Tanggal lulus:
KATA PENGANTAR
Puji syukur senantiasa penulis panjatkan ke hadirat Ilahi Rabbi, Allah Subhanahu Wata’ala
atas limpahan berkah dan karunia-Nya, penulis dapat menyelesaikan skripsi ini. Shalawat serta
salam tercurah kepada Baginda Rasulullah, Nabi Muhammad Shallallahu ‘Alaihi Wassalam,
keluarga, para sahabat, dan kaum muslimin seluruh penjuru alam hingga akhir zaman.
Terselesaikannya penulisan skripsi ini tidak terlepas dari bantuan berbagai pihak, untuk itu penulis
ingin menyampaikan terima kasih kepada:
1 Ibunda Herlina dan Ayahanda Wawan Hermawan atas limpahan kasih sayang tiada tara.
2 Ibu Sri Nurdiati dan Bapak Ahmad Ridha selaku pembimbing yang senantiasa memberikan
arahan dan motivasi.
3 Bapak Sony Hartono Wijaya selaku penguji sidang tugas akhir.
4 Bapak Toto Haryanto selaku dosen pembimbing akademik dan Ibu Annisa selaku
pembimbing praktik kerja lapang.
5 Bapak Suratman selaku pembimbing praktik kerja lapang, Bapak Sirojul Munir, Ibu
Rohmah, Ibu Intan, dan segenap karyawan Pusat Pengembangan Informatika NuklirBATAN.
6 Para dosen dan staf tata usaha Departemen Ilmu Komputer FMIPA IPB.
7 Para guru dan staf tata usaha SD Negeri Cilendek Timur 1, SMP Negeri 6 Bogor, dan SMA
Negeri 9 Bogor.
8 A Heri, A Luki, dan Widi.
9 Teman-teman satu bimbingan Indra, Rifky, Rizka, Yuli, Neri, dan Nia.
10 Teman-teman PKL Arief dan Tedi.
11 Teman-teman seperjuangan Sri Rahayu, Kirana, Tice, Radini, Agessty, Santia, Ade Nelvia,
Hutomo, Nanda, Panji, dan teman-teman Ilkomerz 45.
12 Teman-teman panitia Pesta Sains Nasional 2010, The 5th Journalistic Fair, Kominfo BEM
FMIPA IPB 2010, dan Kominfo BEM KM IPB 2011.
13 Teman-teman Studenta Jurnal Bogor, Agri FM, SPECTRUM, dan Salemba Group.
Semoga hasil penelitian ini dapat membantu perkembangan dunia teknologi dan informasi
di Indonesia.
Bogor, Desember 2012
Cipta Wiraswasta
DAFTAR RIWAYAT HIDUP
Penulis lahir di Bogor pada tanggal 11 Januari 1991 sebagai anak ketiga dari empat
bersaudara, putra dari pasangan Wawan Hermawan dan Herlina. Masa kecil penulis banyak
dihabiskan di Bogor. Penulis menjalani pendidikan dasar di SD Negeri Cilendek Timur 1 pada
tahun 1996-2002. Pendidikan menengah dilanjutkan pada tahun 2002-2005 di SMP Negeri 6
Bogor. Pada Tahun 2008, penulis lulus dari SMA Negeri 9 Bogor dan melanjutkan pendidikan ke
Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) pada
Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA).
Berbagai organisasi pernah penulis ikuti, di antaranya volley ball club dan English club
SMP Negeri 6 Bogor, OSIS dan Pramuka SMA Negeri 9 Bogor, Badan Eksekutif Mahasiswa
(BEM) FMIPA IPB 2010, serta BEM Keluarga Mahasiswa (KM) IPB 2011. Penulis sempat
menjadi project officer beberapa kegiatan, seperti Exhibition of Stamps 2007, Pesta Sains Nasional
2010, dan The 5th Journalistic Fair. Selain itu, sebagai bentuk pengembangan diri, penulis pernah
menjadi freelancer di Agri FM IPB sebagai announcer dan divisi produksi, Studenta Jurnal Bogor
sebagai repoter dan redaktur eksekutif, bimbingan belajar SPECTRUM dan Salemba Group
sebagai pengajar matematika. Praktik Kerja Lapang (PKL) penulis laksanakan di Pusat
Pengembangan Informatika Nuklir-Badan Tenaga Nuklir Nasional (PPIN-BATAN), Kawasan
Puspiptek, Serpong, Tangerang selama 35 hari kerja pada bulan Juli - Agustus 2011.
DAFTAR ISI
Halaman
DAFTAR TABEL ......................................................................................................................vi
DAFTAR GAMBAR..................................................................................................................vi
DAFTAR LAMPIRAN ............................................................................................................ vii
PENDAHULUAN
Latar Belakang ........................................................................................................................ 1
Tujuan...................................................................................................................................... 1
Ruang Lingkup ........................................................................................................................ 1
TINJAUAN PUSTAKA
Frasa Keterangan ..................................................................................................................... 1
Knowledge Graph.................................................................................................................... 2
Concept.................................................................................................................................... 2
Word Graph ............................................................................................................................. 2
Aspek Ontologi........................................................................................................................ 2
XML ........................................................................................................................................ 4
METODE PENELITIAN
Studi Literatur.......................................................................................................................... 4
Analisis Pola Pembentukan Word Graph Frasa Keterangan Bahasa Indonesia ...................... 5
Perancangan XML ................................................................................................................... 5
Pengujian dan Analisis Hasil ................................................................................................... 6
Dokumentasi ............................................................................................................................ 6
HASIL DAN PEMBAHASAN
Analisis Pola Pembentukan Word Graph Frasa Keterangan Bahasa Indonesia ...................... 6
Perancangan XML ................................................................................................................... 6
Pengujian dan Analisis Hasil ................................................................................................. 15
SIMPULAN DAN SARAN
Simpulan ................................................................................................................................ 15
Saran ...................................................................................................................................... 15
LAMPIRAN .............................................................................................................................. 16
v
DAFTAR TABEL
1
2
3
4
5
6
7
Halaman
Tag-tag XML hasil penelitian Astriratma (2012) .................................................................. 5
Komponen-komponen pembentuk word graph pola 1 .......................................................... 7
Hubungan relasi antarkomponen word graph pola 1............................................................. 8
Komponen-komponen pembentuk word graph pola 3 ........................................................ 10
Hubungan relasi antarkomponen word graph pola 3........................................................... 10
Komponen-komponen pembentuk word graph pola 11 ...................................................... 13
Hubungan relasi antarkomponen word graph pola 11 ......................................................... 13
DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Halaman
Contoh penggunaan relasi ALI. ............................................................................................. 2
Contoh penggunaan relasi EQU. ........................................................................................... 3
Contoh penggunaan relasi EQU untuk makna kesetaraan. .................................................... 3
Contoh penggunaan relasi CAU. ........................................................................................... 3
Contoh penggunaan relasi SUB. ............................................................................................ 3
Contoh penggunaan relasi DIS. ............................................................................................. 3
Contoh penggunaan relasi ORD. ........................................................................................... 3
Contoh penggunaan relasi PAR. ............................................................................................ 3
Contoh penggunaan relasi SKO. ........................................................................................... 3
Contoh penggunaan ontologi F. ............................................................................................. 3
Graph untuk pernyataan p. .................................................................................................... 4
Graph dengan frame relasi NEGPAR. .................................................................................. 4
Graph dengan frame relasi POSPAR. ................................................................................... 4
Graph dengan frame relasi NECPAR.................................................................................... 4
Tahapan penelitian. ................................................................................................................ 5
Struktur XML untuk components. ......................................................................................... 6
Struktur XML untuk relationships. ....................................................................................... 7
Word graph pola 1. ................................................................................................................ 7
Identifikasi komponen pembentuk word graph pola 1. ......................................................... 7
File XML bagian components pola 1. ................................................................................... 8
File XML bagian relationships pola 1................................................................................... 8
Word graph frasa keterangan amat sangat. ........................................................................... 8
File XML bagian components frasa keterangan amat sangat................................................ 9
File XML bagian relationships frasa keterangan amat sangat. ............................................. 9
Word graph pola 3. ................................................................................................................ 9
Identifikasi komponen pembentuk word graph pola 3. ......................................................... 9
Aturan perancangan XML untuk tag ............................................ 10
File XML bagian components pola 3. ................................................................................. 11
File XML bagian relationships pola 3................................................................................. 11
Word graph frasa keterangan paling baik. .......................................................................... 11
File XML bagian components frasa keterangan paling baik. .............................................. 12
File XML bagian relationships frasa keterangan paling baik. ............................................ 12
Word graph pola 11. ............................................................................................................ 13
Identifikasi komponen pembentuk word graph pola 11. ..................................................... 13
File XML bagian components pola 11. ............................................................................... 13
File XML bagian relationships pola 11.............................................................................. 14
Word graph frasa keterangan acapkali. ............................................................................... 14
File XML bagian components frasa keterangan acapkali. .................................................. 14
File XML bagian relationships frasa keterangan acapkali.................................................. 14
vi
DAFTAR LAMPIRAN
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Halaman
Pola aturan word graph frasa keterangan bahasa Indonesia ................................................ 17
Struktur XML sebuah word graph hasil penelitian Astriratma (2012) ................................ 21
File XML pola 1 .................................................................................................................. 22
File XML pola 2 .................................................................................................................. 23
File XML pola 3 .................................................................................................................. 24
File XML pola 4 .................................................................................................................. 25
File XML pola 5 .................................................................................................................. 26
File XML pola 6 .................................................................................................................. 27
File XML pola 7 .................................................................................................................. 28
File XML pola 8 .................................................................................................................. 29
File XML pola 9 .................................................................................................................. 30
File XML pola 10 ................................................................................................................ 31
File XML pola 11 ................................................................................................................ 32
File XML pola 12 ................................................................................................................ 33
File XML pola 13 ................................................................................................................ 34
File XML pola 14 ................................................................................................................ 35
File XML pola 15 ................................................................................................................ 36
File XML pola 16 ................................................................................................................ 37
File XML pola 17 ................................................................................................................ 38
File XML pola 18 ................................................................................................................ 38
File XML pola 19 ................................................................................................................ 38
File XML pola 20 ................................................................................................................ 39
Dokumen XSD .................................................................................................................... 40
Tabel pencocokan word graph frasa keterangan bahasa Indonesia ..................................... 43
vii
1
PENDAHULUAN
Latar Belakang
Adanya ambiguitas pemaknaan bahasa
alami menyebabkan komputer tidak mampu
memberikan keluaran yang diharapkan oleh
pengguna. Jenis bahasa alami dalam bentuk
tulisan dinamakan teks. Salah satu metode
untuk merepresentasikan pengetahuan dalam
teks adalah knowledge graph (KG). Melalui
KG, pengguna dapat melihat graph kata dan
hubungannya dengan kata yang lain sehingga
ambiguitas pemaknaan dapat dihindari.
Implementasi metode KG dalam analisis
semantik diharapkan dapat membantu
menghasilkan abstraksi teks secara otomatis.
BogorDefltConstruct merupakan editor
pembentuk graph untuk kata dalam bahasa
Indonesia (Romadoni & Nurdiati 2010).
Pengembangan BogorDefltConstruct yang
menggunakan MATLAB dapat memicu
masalah lisensi karena software tersebut
berbayar. Oleh karena itu, dibutuhkan sistem
open source yang bisa didapatkan dengan
mudah tanpa terbentur masalah lisensi.
Solusi yang dihasilkan dari permasalahan
tersebut ialah dikembangkannya knowledge
graph viewer (KGV) hasil penelitian
Ramadhan
(2012).
Meskipun
masih
sederhana, KGV dapat menampilkan graph
dari sebuah kata atau file XML yang
dimasukan. Pengembangan KGV selanjutnya
dilakukan oleh Lesmana (2012). Terdapat
penambahan fungsi, seperti zoom in, zoom
out, pergeseran, mengunggah dan mengunduh
file XML, serta modifikasi graph secara
sederhana. Saat ini, masukan dari KGV ialah
kata, frasa, atau file XML dengan keluaran
yang diharapkan berupa graph.
Analisis pembentukan word graph frasa
keterangan bahasa Indonesia menggunakan
metode KG telah dihasilkan melalui penelitian
Sulistiawan (2011). Namun, belum ada
implementasinya berupa sistem open source.
Oleh karena itu, pada penelitian ini akan
direpresentasikan
word
graph
frasa
keterangan bahasa Indonesia menggunakan
XML agar graph yang diharapkan dapat
ditampikan dalam KGV.
Tujuan
Penelitian ini bertujuan merepresentasikan
pola word graph frasa keterangan bahasa
Indonesia menggunakan XML sesuai dengan
aturan pembentukan word graph frasa
keterangan bahasa Indonesia.
Ruang Lingkup
Ruang lingkup dari penelitian ini ialah
representasi word graph frasa keterangan
bahasa Indonesia hasil penelitian Sulistiawan
(2011). Hasil penelitian tersebut mencakup
delapan makna frasa keterangan yang
menghasilkan 29 pola pembentukan word
graph frasa keterangan bahasa Indonesia. File
yang dibentuk berformat XML dan dapat
diimpelementasikan dalam KGV (Lesmana
2012).
TINJAUAN PUSTAKA
Frasa Keterangan
1 Definisi Frasa Keterangan
Frasa adalah kesatuan yang terdiri atas dua
kata atau lebih yang masing-masing
mempertahankan makna kata dasarnya,
sementara gabungan itu menghasilkan suatu
relasi tertentu, dan tiap kata pembentuknya
tidak bisa berfungsi sebagai subjek atau
predikat dalam konstruksi itu (Keraf 1991).
Frasa keterangan pada bahasa Indonesia baku
merupakan
pengembangan
dari
kata
keterangan (Alwi et al. 2003).
2 Struktur Frasa Keterangan
Frasa keterangan merupakan kelompok
kata yang berfungsi menerangkan predikat
yang berupa kata kerja dan kata sifat. Selain
itu, frasa keterangan dapat menerangkan frasa
preposisional dan seluruh kalimat (Alwi et al.
2003). Terdapat delapan jenis makna frasa
keterangan berdasarkan perilaku semantiknya
(Alwi et al. 2003), yaitu:
Makna kualitatif
Makna kualitatif menggambarkan makna
yang berhubungan dengan tingkat, derajat,
atau mutu dari inti frasa keterangan.
Contoh: amat sangat, lebih kurang, dan
paling banyak.
Makna kuantitatif
Makna kuantitatif menggambarkan makna
yang berhubungan dengan jumlah. Contoh:
belum cukup, paling banyak, dan sedikit
sekali.
Makna limitatif
Makna limitatif menggambarkan makna
yang berhubungan dengan pembatasan dari
inti frasa keterangan. Contoh: baru saja
dan hanya saja.
2
Makna frekuentatif
Makna
frekuentatif
menggambarkan
makna yang berhubungan dengan tingkat
kekerapan terjadinya sesuatu yang
diterangkan kata keterangan. Contoh:
seringkali, hampir selalu, dan sangat
jarang.
Makna kewaktuan
Makna kewaktuan menggambarkan makna
yang berhubungan dengan saat terjadinya
peristiwa
yang
diterangkan
kata
keterangan. Contoh: sore hari, nanti siang,
dan saat ini.
Makna kecaraan
Makna kecaraan menggambarkan makna
yang menjelaskan suatu peristiwa karena
tanggapan pembicara atas terjadinya suatu
peristiwa. Contoh: barangkali, tidak
mungkin, dan sudah pasti.
Makna kontrastif
Makna
kontrastif
menggambarkan
pertentangan dengan makna kata atau hal
yang dinyatakan sebelumnya. Contoh:
justru dapat dan lagi pula.
Makna keniscayaan
Makna
keniscayaan
menggambarkan
makna
yang
berhubungan
dengan
kepastian tentang kelangsungan terjadinya
hal atau peristiwa yang dijelaskan oleh
kata keterangan. Contoh: begitu penting
dan belum tentu.
Knowledge Graph
Metode KG merupakan cara pandang baru
dalam menggambarkan bahasa alami. Adanya
aspek ontologi menjadi pembeda antara
metode KG dan metode representasi yang
lain. KG mempunyai kemampuan dalam
menyatakan aspek semantik dengan lebih
mendalam, menggunakan jenis relasi yang
terbatas, dan dapat digunakan untuk meniru
pemahaman
manusia.
Komposisi
KG
mencakup concept (token dan type) dan
relationship (binary dan multivariative
relation) (Zhang 2002).
Concept
Concept merupakan komponen dari mind
graph yang menerangkan persepsi mengenai
sesuatu. Representasi pemikiran yang dapat
dimodelkan oleh KG disebut mind graph
(Zhang 2002). Concept terdiri atas token dan
type. Token adalah node dalam KG yang
disimbolkan dengan persegi “
”. Token
menyatakan konsep hasil persepsi manusia
(Zhang 2002). Token bersifat subjektif karena
dipahami oleh bahasa manusia menurut
persepsi masing-masing. Contoh token
menurut Rusiyamti (2008) ialah “apel”.
Seseorang dapat menghubungkan hal ini
dengan informasi bentuk, warna, atau rasa.
Demikian juga dengan orang lain dapat
menghubungkannya dengan hal yang berbeda.
Type adalah suatu konsep yang bersifat
umum. Type bersifat objektif karena
merupakan hasil kesepakatan bersama (Zhang
2002). Contoh type ialah buah dan binatang.
Suatu konsep yang spesifik dikategorikan ke
dalam sebuah name. Fuji merupakan name
dari apel. Type dan name dibedakan oleh jenis
relasi yang menghubungkannya dengan token.
Word Graph
Word graph merupakan graph dari kata.
Dalam metode KG, setiap kata yang
berhubungan dengan sebuah word graph
menyatakan arti kata yang disebut dengan
semantic word graph. Gabungan semantic
word graph dalam sebuah kalimat membentuk
sentence
graph.
Graph
yang
merepresentasikan gabungan dari sentence
graph dalam sebuah teks disebut text graph
yang terdapat pengetahuan di dalamnya
(Hoede & Nurdiati 2008).
Aspek Ontologi
Ontologi adalah keterangan untuk
menggambarkan beberapa konsep dan relasi
dengan maksud untuk memberikan definisi
yang cukup terhadap ide-ide yang dituangkan
ke
dalam
komputer
agar
dapat
merepresentaikan ide-ide tersebut dengan
disertai logikanya (Hulliyah 2007). Sampai
saat
ini,
ontologi
word
graph
direpresentasikan dengan sebuah node,
delapan binary relationships, sebuah ontologi
F, dan empat frame relationships. Delapan
types relation menurut Zhang (2002), yaitu:
1 ALI (alikeness)
Relasi
ALI
digunakan
untuk
menghubungkan token dengan type. Makna
dari relasi ini ialah sama atau mirip. Contoh
type ialah binatang. Word graph yang
terbentuk dapat dilihat pada Gambar 1.
ALI
binatang
Gambar 1 Contoh penggunaan relasi ALI.
3
2 EQU (equality)
Relasi
EQU
digunakan
untuk
menghubungkan token dengan name. Contoh
name ialah Cipta. Word graph yang terbentuk
dapat dilihat pada Gambar 2.
EQU
Cipta
Gambar 2 Contoh penggunaan relasi EQU.
Relasi EQU juga dapat digunakan untuk
menjelaskan makna kesetaraan, contohnya X
sama dengan Y. Word graph yang terbentuk
dapat dilihat pada Gambar 3.
ALI
EQU
ALI
X
Y
Gambar 3 Contoh penggunaan relasi EQU
untuk makna kesetaraan.
3 CAU (causality)
Relasi
CAU
digunakan
untuk
menghubungkan dua buah token yang
memiliki hubungan sebab akibat, contohnya
Cipta makan. Word graph yang terbentuk
dapat dilihat pada Gambar 4.
ALI
CAU
ALI
orang
makan
ALI
Cipta
Gambar 4 Contoh penggunaan relasi CAU.
4 SUB (subset)
Relasi
SUB
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna token satu merupakan bagian
dari token yang lain, contohnya roda
merupakan bagian dari kendaraan. Word
graph yang terbentuk dapat dilihat pada
Gambar 5.
ALI
roda
SUB
ALI
kendaraan
Gambar 5 Contoh penggunaan relasi SUB.
5 DIS (disparateness)
Relasi
DIS
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna token satu berbeda dengan
token yang lain, contohnya radio berbeda
dengan koran. Word graph yang terbentuk
dapat dilihat pada Gambar 6.
ALI
DIS
ALI
radio
koran
Gambar 6 Contoh penggunaan relasi DIS.
6 ORD (ordering)
Relasi
ORD
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna adanya urutan, contohnya
dari muda sampai tua. Word graph yang
terbentuk dapat dilihat pada Gambar 7.
ALI
ORD
ALI
muda
tua
Gambar 7 Contoh penggunaan relasi ORD.
7 PAR (attribute)
Relasi
PAR
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna token satu berkaitan dan
memiliki sifat dengan token yang lain,
contohnya mobil baru. Word graph yang
terbentuk dapat dilihat pada Gambar 8.
ALI
PAR
ALI
baru
mobil
Gambar 8 Contoh penggunaan relasi PAR.
8 SKO (informational dependency)
Relasi
SKO
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna hubungan kebergantungan,
contohnya besarnya nilai 2X bergantung pada
nilai X. Word graph yang terbentuk dapat
dilihat pada Gambar 9.
ALI
SKO
ALI
X
2X
Gambar 9 Contoh penggunaan relasi SKO.
Selain kedelapan binary relationships,
terdapat ontologi F (focus) yang digunakan
untuk menunjukkan focus dari suatu graph.
Ontologi F dilambangkan dengan “
”.
Contohnya Cipta minum. Cipta sebagai focus,
maka word graph yang terbentuk dapat dilihat
pada Gambar 10.
ALI
CAU
orang
ALI
minum
ALI
Cipta
Gambar 10 Contoh penggunaan ontologi F.
4
Empat
frame
relationships
yang
merupakan bagian dari ontologi KG, yaitu:
1
2
3
4
Focusing on a situation
Negation of a situation
Possibility of a situation
Necessity of a situation
: FPAR
: NEGPAR
: POSPAR
: NECPAR
Misalkan p merupakan suatu pernyataan
yang dinyatakan dengan frame dan
disimbolkan dengan persegi bergaris putusputus “
”, maka graph dari negasi p dapat
dinyatakan dengan graph yang sama dan
diberi frame relasi NEGPAR, possibility
graph dari p dapat dinyatakan dengan graph
yang sama dan diberi frame relasi POSPAR,
dan necessity graph dari p dapat dinyatakan
dengan graph yang sama dan diberi frame
relasi NECPAR (Zhang 2002). Graph yang
terbentuk dapat dilihat pada Gambar 11,
Gambar 12, Gambar 13, dan Gambar 14.
Gambar 11 Graph untuk pernyataan p.
Gambar 12 Graph dengan frame relasi
NEGPAR.
Gambar 13 Graph dengan frame relasi
POSPAR.
XML
Extensible markup language (XML)
merupakan
bentuk
baku
untuk
merepresentasikan struktur dokumen teks dan
data yang memberikan kemudahan dalam
publikasi dan pertukaran data (Benz & Durant
2003). XML digunakan untuk memudahkan
pembacaan data oleh komputer. Tag XML
dapat dibuat oleh pengguna sesuai dengan
kebutuhan yang dikehendaki. Tag pembuka
dalam file XML harus disertakan tag
penutupnya.
Kelebihan yang dimiliki oleh XML, yaitu
(Goldberg & Castro 2009):
1 digunakan untuk penyimpanan dan
pertukaran data,
2 memiliki tags, attributes, dan values
seperti HTML,
3 sederhana, mudah dimengerti, mudah
diuraikan dan dimanipulasi, serta dianggap
human readable,
4 mudah untuk dikembangkan dan
diadaptasi,
5 merupakan bahasa untuk menyimpan dan
membawa informasi,
6 markup language dapat dibuat sendiri oleh
pengguna sehingga dapat digunakan untuk
menyimpan informasi, dan
7 dapat digunakan untuk menukarkan data
antarsistem atau organisasi yang berbeda.
METODE PENELITIAN
Penelitian ini terdiri atas beberapa tahap,
yaitu
studi
literatur,
analisis
pola
pembentukan word graph frasa keterangan
bahasa Indonesia, perancangan XML,
pengujian
dan
analisis
hasil,
serta
dokumentasi. Tahapan yang dilakukan dalam
penelitian ini dapat dilihat pada Gambar 15.
Studi Literatur
Gambar 14 Graph dengan frame relasi
NECPAR.
Misalkan p menyatakan hari ini hujan,
maka secara berurutan Gambar 11, Gambar
12, Gambar 13, dan Gambar 14 menunjukkan
graph dari pernyataan hari ini hujan, tidak
benar hari ini hujan, mungkin hari ini hujan,
dan seharusnya hari ini hujan (Sulistiawan
2011).
Referensi-referensi terkait knowledge
graph dan frasa keterangan bahasa Indonesia
dikumpulkan, dipahami, dan dipelajari guna
mendapatkan
pengetahuan
tentang
pembentukan word graph frasa keterangan
bahasa Indonesia. Referensi yang digunakan,
yaitu disertasi Zhang tahun 2002, jurnal
internasional Hoede & Nurdiati tahun 2008,
tesis Hulliyah tahun 2007, tesis Rusiyamti
tahun 2008, dan tesis Sulistiawan tahun 2011.
5
Mulai
Tabel 1 Tag-tag XML hasil penelitian
Astriratma (2012)
Tag
Studi Literatur
Analisis Pola Pembentukan Word Graph
Frasa Keterangan Bahasa Indonesia
Perancangan XML
Pengujian dan Analisis Hasil
Dokumentasi
Selesai
Gambar 15 Tahapan penelitian.
Analisis Pola Pembentukan Word Graph
Frasa Keterangan Bahasa Indonesia
Tahap ini menganalisis pola pembentukan
word graph frasa keterangan hasil penelitian
Sulistiawan (2011) yang berjudul “Analisis
Pembentukan Word Graph Frasa Keterangan
Menggunakan Metode Knowledge Graph“.
Analisis dilakukan dengan mencocokkan
kesesuaian pola word graph frasa keterangan
bahasa Indonesia dengan pola frasa
keterangan bahasa Indonesia. Hasil dari
analisis ini digunakan untuk perancangan file
XML pada pembentukan pola word graph
frasa keterangan bahasa Indonesia.
Perancangan XML
Perancangan
XML
dilakukan
menggunakan tag-tag dan skema perancangan
XML dalam dokumen XML schema
definition (XSD) hasil penelitian Astriratma
(2012). Penambahan tag-tag baru dan
penyesuaian kebutuhan dalam dokumen XSD
dilakukan guna menunjang penelitian. Tagtag hasil penelitian Astriratma (2012) dapat
dilihat pada Tabel 1.
Definisi
mewakili dokumen
pola atau root
mewakili keseluruhan
komponen pembentuk
pola
mewakili keseluruhan
arah yang
menghubungkan
antarkomponen
menunjukkan suatu
focus
menunjukkan sebuah
token
menunjukkan text
menunjukkan
hubungan yang
digunakan
menunjukkan suatu
frame
menunjukkan id suatu
tag
menunjukkan suatu
nilai
menunjukkan nilai
yang dapat diubah atau
tidak
menunjukkan jenis
relasi atau frame
relation yang
digunakan
menunjukkan arah
panah masuk
menunjukkan arah
panah keluar
menunjukkan focus
sesuai id yang
digunakan
menunjukkan token
sesuai id yang
digunakan
menunjukkan text
sesuai id yang
digunakan
menunjukkan
hubungan sesuai id
yang digunakan
menunjukkan frame
sesuai id yang
digunakan
6
Pengujian dan Analisis Hasil
Tahap pengujian dan analisis hasil
dimaksudkan guna mengetahui kesesuaian file
XML dengan graph yang tergambar. Tingkat
keberhasilan dari pola word graph frasa
keterangan bahasa Indonesia yang tergambar
didapat melalui perhitungan sebagai berikut:
∑ pola yang ber asil tergambar
∑ total pola yang diujikan
100
Dokumentasi
Dokumentasi dilakukan dengan cara
pembuatan laporan hasil dari penelitian
disertai keterangan dan penjelasan terkait
penelitian yang telah dilaksanakan.
HASIL DAN PEMBAHASAN
Analisis Pola Pembentukan Word Graph
Frasa Keterangan Bahasa Indonesia
Sebelum dilakukan perancangan XML,
analisis pola pembentukan word graph frasa
keterangan bahasa Indonesia perlu dilakukan
dengan langkah-langkah sebagai berikut:
1 mengecek keberadaan pola yang sama,
2 mengidentifikasi komponen-komponen
pembentuk pola, dan
3 melihat relasi antarkomponen pembentuk
pola.
Hasil analisis menunjukkan terdapat
sembilan pola yang sama dari 29 pola
pembentukan word graph frasa keterangan
bahasa Indonesia. Pola-pola pembentukan
word graph frasa keterangan bahasa Indonesia
dapat di lihat pada Lampiran 1. Frasa
keterangan
bahasa
Indonesia
dalam
Sulistiawan (2011) yang memiliki pola word
graph yang sama, yaitu:
1
2
3
4
5
6
7
8
9
amat sangat dengan nanti+waktu,
paling baik dengan paling+adv/adj,
acapkali dengan hampir selalu,
acapkali dengan sering kali,
sekarang juga dengan saat ini,
sudah pasti dengan begitu penting,
waktu+hari dengan kemarin+waktu,
waktu+hari dengan lagi pula, dan
barangkali dengan belum tentu.
Perancangan XML
Tag-tag
yang
digunakan
dalam
perancangan XML merupakan hasil penelitian
Astriratma (2012). Setiap word graph diawali
tag pembuka dan ditutup dengan tag
penutup . Pada tag-tag tersebut
terdapat tag
yang menyatakan komponen pembentuk word
graph
dan
tag
yang
menyatakan
hubungan antarkomponen disertai relasinya.
Komponen-komponen pembentuk word
graph yang terdapat pada tag
, di antaranya focus dengan
tag , token dengan tag
, text dengan tag
, relasi dengan tag
, dan frame dengan tag
. Masing-masing tag memiliki tag
untuk mengetahui identitasnya.
Struktur XML untuk bagian components dapat
dilihat pada Gambar 16.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Gambar 16 Struktur XML untuk components.
Pada Gambar 16, tag
memiliki elemen tambahan, yaitu tag
dan tag
.
Tag
menyatakan kebutuhan suatu nilai yang dapat
diubah atau tidak, berisikan YES untuk nilai
yang dapat diubah atau NO untuk nilai yang
tidak dapat diubah. Tag
menyatakan nilai atau isi dari tag
. Pada tag
terdapat elemen tambahan, yaitu tag
yang menyatakan jenis relasi atau
frame relation yang digunakan.
Tag
terdiri atas 3 elemen, yaitu tag
, tag , dan
tag
.
Tag
menyatakan relasi sesuai id
yang digunakan. Pada tag
7
terdapat 2 elemen, yaitu tag
yang menyatakan asal arah
panah relasi menuju tag sebagai
tujuan. Struktur XML untuk bagian
relationships dapat dilihat pada Gambar 17.
Struktur XML sebuah word graph hasil
penelitian Astriratma (2012) dapat dilihat
pada Lampiran 2.
1
2
3
4
5
6
Gambar 17 Struktur XML untuk
relationships.
Setelah struktur lengkap file XML sebuah
word graph didapatkan, proses perancangan
file XML untuk pola 1, 3, dan 11 frasa
keterangan bahasa Indonesia hasil penelitian
Sulistiawan (2011) dijelaskan. Word graph
pola 1 frasa keterangan bahasa Indonesia
merepresentasikan frasa keterangan jenis
makna kualitatif dan makna kewaktuan.
Tampilan word graph untuk pola 1 frasa
keterangan bahasa Indonesia dapat dilihat
pada Gambar 18. Identifikasi terhadap
komponen-komponen pembentuk word graph
pola 1 dapat dilihat pada Gambar 19.
Keterangan:
1
2
3
4
text id: 1
relasi id: 1
frame id: 1
text id: 2
5
6
7
8
relasi id: 2
token id: 1
relasi id: 3
focus id: 1
Word graph pola 1 frasa keterangan
memiliki delapan komponen pembentuk, yaitu
sebuah focus, sebuah token, dua buah text, tiga
buah relasi, dan sebuah frame. Komponenkomponen pembentuk word graph pola 1
frasa keterangan dapat dilihat pada Tabel 2.
Tabel 2 Komponen-komponen pembentuk
word graph pola 1
Komponen
Jumlah
Id
Focus
1
1
Token
1
1
Text
2
1
Keterangan
Value: amat
sangat/
nanti+waktu
Replace: YES
2
Value:
adj/waktu
Replace: YES
Relation
Frame
3
1
1
Type: ALI
2
Type: ALI
3
Type: ORD
1
Focus id: 1
Token id: 1
Text id: 2
Gambar 18 Word graph pola 1.
Relation id: 2
dan 3
Word graph pola 1 frasa keterangan
memiliki sebuah focus dan token dengan id
masing-masing 1. Jumlah text yang
dibutuhkan ialah dua. Text dengan id 1
memiliki value amat sangat/nanti+waktu.
Amat sangat merupakan contoh frasa
keterangan kualitatif, sedangkan nanti+waktu
merupakan salah satu pola sintaksis pada frasa
keterangan dengan makna kewaktuan,
contohnya nanti siang. File XML untuk
bagian components pola 1 dapat dilihat pada
Gambar 20.
Gambar 19 Identifikasi komponen pembentuk
word graph pola 1.
8
1
2
3
4
5
6
7
8
9
10
1
1
1
amatsangat/nanti+waktu
YES
2
sangat/waktu
YES
1
ALI
2
ALI
3
ORD
1
1
1
2
2
3
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
Gambar 20 File XML bagian components
pola 1.
berasal dari text dengan id 2 menuju token
dengan id 1. Pada relasi ORD dengan id 1,
panah relasi berasal dari token dengan id 1
menuju focus dengan id 1. Jumlah frame yang
diperlukan untuk membentuk word graph
pola 1 frasa keterangan ialah satu yang
meliputi focus, token, relasi dengan id 2 dan 3,
serta text dengan id 2. File XML untuk bagian
relationships pola 1 frasa keterangan dapat
dilihat pada Gambar 21. Gabungan file XML
untuk bagian components dan relationships
pola 1 dapat dilihat pada Lampiran 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
1
1
2
2
1
3
1
1
Gambar 21 File XML bagian relationships
pola 1.
Contoh frasa keterangan untuk pola 1 ialah
amat sangat. Amat sangat merupakan frasa
keterangan bahasa Indonesia jenis makna
kualitatif. Tampilan word graph untuk frasa
keterangan amat sangat dapat dilihat pada
Gambar 22.
Gambar 20, tag
untuk text dalam file XML pola 1
frasa keterangan berisi YES yang artinya
value untuk text tersebut dapat diubah.
Hubungan relasi antarkomponen word graph
pola 1 frasa keterangan dapat dilihat pada
Tabel 3.
Pada
Tabel 3 Hubungan relasi antarkomponen
word graph pola 1
Id
Relation
From
To
1
ALI
Text id: 1
Frame id: 1
2
ALI
Text id: 2
Token id: 1
3
ORD
Token id: 1
Focus id: 1
Relasi
yang
digunakan
dalam
pembentukan word graph pola 1 frasa
keterangan ada tiga buah, yaitu ALI untuk
relasi dengan id 1 dan 2 serta ORD untuk
relasi dengan id 3. Relasi ALI dengan id 1
berasal dari text dengan id 1 menuju frame
dengan id 1, sedangkan relasi ALI dengan id 2
Gambar 22 Word graph frasa keterangan
amat sangat.
Gambar 22 menunjukkan frasa keterangan
amat sangat yang mempunyai relasi ORD,
yaitu relasi yang menunjukkan adanya urutan.
Amat sangat dapat diartikan sebagai lebih
dari. Kata sangat direpresentasikan oleh
sebuah token dengan relasi ALI. Karena relasi
yang digunakan amat sangat ialah ORD,
maka dibutuhkan token lain sebagai
pembanding. Panah relasi ORD berasal dari
token kata sangat menuju focus. File XML
untuk bagian components frasa keterangan
amat sangat dapat dilihat pada Gambar 23.
9
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
1
1
1
amatsangat
YES
2
sangat/waktu
YES
1 ALI
2 ALI
3 ORD
1
1
1
2
2
3
Word graph pola 3 frasa keterangan
bahasa Indonesia merepresentasikan frasa
keterangan jenis makna kualitatif dan
kuantitatif. Tampilan word graph untuk pola 3
frasa keterangan bahasa Indonesia dapat
dilihat pada Gambar 25. Identifikasi terhadap
komponen-komponen pembentuk word graph
pola 3 dapat dilihat pada Gambar 26.
Gambar 25 Word graph pola 3.
Gambar 23 File XML bagian components
frasa keterangan amat sangat.
Jumlah frame yang diperlukan pada
pembentukan word graph frasa keterangan
amat sangat ialah satu yang meliputi focus
dengan id 1, token dengan id 1, text dengan id
2 yang memiliki value sangat, relasi dengan
id 2 type ALI, dan relasi dengan id 3 type
ORD. File XML untuk bagian relationships
frasa keterangan amat sangat dapat dilihat
pada Gambar 24.
42
43
44
45
46
47
48
49
50
51
52
53
54
55
1
1
1
2
2
1
3
1
1
Gambar 24 File XML bagian relationships
frasa keterangan amat sangat.
Pola 2 frasa keterangan bahasa Indonesia
merepresentasikan frasa keterangan lebih
kurang atau kurang lebih yang bermakna kirakira. Frasa ini merupakan frasa keterangan
jenis makna kualitatif yang menunjukkan
adanya tingkat, derajat, atau mutu. File XML
untuk pola 2 dapat dilihat pada Lampiran 4.
Gambar 26 Identifikasi komponen pembentuk
word graph pola 3.
Keterangan:
1
2
3
4
5
6
7
text id: 1
relasi id: 1
frame id: 1
text id: 2
text id: 3
text id: 4
relasi id: 2
8
9
10
11
12
13
14
relasi id: 3
relasi id: 4
token id: 1
relasi id: 5
token id: 2
relasi id: 6
focus id: 1
Terdapat
empat
belas
komponen
pembentuk word graph pola 3, yaitu sebuah
focus, dua buah token, empat buah text, enam
buah relasi, dan sebuah frame. Text dengan id
1 memiliki value paling+adv/adj. Text dengan
id 2 memiliki value adv/adj. Adv ialah adverb
atau kata keterangan, sedangkan adj ialah
adjektive atau kata sifat. Komponenkomponen pembentuk word graph pola 3
frasa keterangan dapat dilihat pada Tabel 4.
10
Tabel 4 Komponen-komponen pembentuk
word graph pola 3
Komponen
Jumlah
Id
Focus
1
1
Token
1
1
Text
2
1
Keterangan
Value: paling
+adv/adj
Replace: YES
2
Value:
adv/adj
3
Value:
adv/adj
cloneid: 2
4
Value:
adv/adj
cloneid: 2
Relation
Frame
3
1
1
Type: ALI
2
Type: ALI
3
Type: ALI
4
Type: ALI
5
Type: ORD
6
Type: ORD
1
Focus id: 1
dan 2
Token id: 1
Text id: 2, 3,
dan 4
Relation id:
2, 3, 4, 5, dan
6
Word graph pola 3 frasa keterangan
merupakan contoh word graph dengan value
dari setiap tag yang saling
terintegrasi satu sama lain. Jika terdapat value
dari sebuah text yang dibuah, maka value dari
text-text yang lain harus berubah. Hal tersebut
bertujuan agar makna dari word graph yang
ditampilkan tetap terjaga. Misalnya, jika text
id 2 memiliki value baik, maka secara
otomatis value untuk text id 3 dan 4 ialah baik
dan value untuk text id 1 menjadi paling baik.
Begitu pula jika value untuk text id 3 diubah
menjadi lucu, maka value untuk text id 2 dan
4 harus mengikuti value text id 3, yaitu lucu.
Value untuk text id 1 menjadi paling lucu.
Oleh karena itu, tag baru diperlukan untuk
mengakomodasikan kebutuhan tersebut. Tag
dibuat untuk
menunjukkan id dari sebuah text dengan value
yang dapat digandakan. Jika sebuah text
memiliki tag , maka
tag tidak diperlukan
kembali. Tag dan tag
bersifat optional,
tag-tag tersebut harus dipilih salah satu dan
tidak diperkenankan muncul bersamaan. Jika
sebuah text memiliki tag
maka secara otomatis tag
bernilai NO. Aturan
perancangan XML untuk tag
dalam dokumen XSD dapat
dilihat pada Gambar 27. Hubungan relasi
antarkomponen word graph pola 3 frasa
keterangan dapat dilihat pada Tabel 5.
Gambar 27 Aturan perancangan XML untuk
tag
Apabila value untuk text id 2 adalah baik,
maka pada text id 3 dan 4 cukup ditambahkan
tag
2
yang
menunjukkan value untuk text id 3 dan 4 sama
dengan value untuk text id 2, yaitu baik.
Begitu juga jika value untuk text id 3 diubah
menjadi lucu, maka pada text id 2 dan 4 cukup
ditambahkan tag 3.
Tabel 5 Hubungan relasi antarkomponen
word graph pola 3
Id
Relation
From
To
1
ALI
Text id: 1
Frame id: 1
2
ALI
Text id: 2
Token id: 1
3
ALI
Text id: 3
Token id: 2
4
ALI
Text id: 4
Focus id: 1
5
ORD
Token id: 1
Token id: 2
6
ORD
Token id: 2
Focus id: 1
11
Jenis relasi yang digunakan dalam
pembentukan word graph pola 3 ada dua,
yaitu ALI dan ORD. Relasi ALI pada word
graph pola 3 menghubungkan text dengan
focus, token, atau frame. Relasi ORD
digunakan untuk menghubungkan token
dengan token atau token dengan focus. File
XML untuk bagian components dan
relationships pola 3 frasa keterangan bahasa
Indonesia dapat dilihat pada Gambar 28 dan
Gambar 29. Gabungan keduanya dapat dilihat
pada Lampiran 5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
1
1
2
1
paling+adv/adj
YES
2
adv/adj
YES
3
2
4
2
1 ALI
2 ALI
3 ALI
4 ALI
5 ORD
6 ORD
1
1
1
2
2
3
4
2
3
4
5
6
Gambar 28 File XML bagian components
pola 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
1
1
1
2
2
1
3
3
2
4
4
1
5
1
2
6
2
1
Gambar 29 File XML bagian relationships
pola 3.
Panah relasi ALI dengan id 1 berasal dari
text dengan id 1 menuju frame dengan id 1.
Panah relasi ALI dengan id 2 dan 3 berasal
dari text dengan id 2 dan 3 menuju token
dengan id 1 dan 2. Pada relasi ALI dengan id
4, panah relasi berasal dari text dengan id 4
menuju focus dengan id 1. Panah relasi ORD
dengan id 1 berasal dari token dengan id 1
menuju token dengan id 2, sedangkan token
dengan id 2 dan focus dengan id 1
dihubungkan oleh relasi ORD dengan id 2.
Contoh frasa keterangan untuk pola 3 ialah
paling baik. Paling baik merupakan frasa
keterangan bahasa Indonesia jenis makna
kualitatif. Tampilan word graph untuk frasa
keterangan paling baik dapat dilihat pada
Gambar 30.
Gambar 30 Word graph frasa keterangan
paling baik.
Gambar 30 menunjukkan frasa keterangan
paling baik yang dapat diartikan terbaik.
Karena relasi yang digunakan frasa
keterangan ini adalah ORD, maka token yang
berada di sisi kanan memiliki makna lebih
dari token sebelumnya. Begitu juga dengan
12
token yang berada
BAHASA INDONESIA MENGGUNAKAN XML
CIPTA WIRASWASTA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
REPRESENTASI WORD GRAPH FRASA KETERANGAN
BAHASA INDONESIA MENGGUNAKAN XML
CIPTA WIRASWASTA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
ABSTRACT
CIPTA WIRASWASTA. Representation of Word Graph for Indonesian Adverb Phrases Using
XML. Supervised by SRI NURDIATI and AHMAD RIDHA.
Knowledge graph (KG) is one of the methods representing knowledge in the form of a
graph. One part of knowledge graph is word graph that describes the semantic of a word. In this
research, we present word graph for Indonesian adverb phrases using extensible markup language
(XML). The general pattern in adverb phrases word graph consists of 29 patterns generated from
the previous research done by Zikri Sulistiawan. The steps of this research are literature study,
pattern analysis, XML design, testing, and documentating. From analysis, we have 9 duplicate
patterns, so that there are 20 patterns which will be formed in XML. All of them have been
successfully represented in XML. We conclud that the word graph of Indonesian adverb phrases
could be represented as XML documents.
Keywords: Indonesian adverb phrases, knowledge graph, word graph, XML.
Judul Skripsi
Nama
NIM
: Representasi Word Graph Frasa Keterangan Bahasa Indonesia
Menggunakan XML
: Cipta Wiraswasta
: G64080032
Menyetujui:
Pembimbing 1,
Pembimbing 2,
Dr. Ir. Sri Nurdiati, M.Sc
NIP. 19601126 198601 2 001
Ahmad Ridha, S.Kom, MS
NIP. 19800507 200501 1 001
Mengetahui:
Ketua Departemen,
Dr. Ir. Agus Buono, M.Si, M.Kom
NIP. 19660702 199302 1 001
Tanggal lulus:
KATA PENGANTAR
Puji syukur senantiasa penulis panjatkan ke hadirat Ilahi Rabbi, Allah Subhanahu Wata’ala
atas limpahan berkah dan karunia-Nya, penulis dapat menyelesaikan skripsi ini. Shalawat serta
salam tercurah kepada Baginda Rasulullah, Nabi Muhammad Shallallahu ‘Alaihi Wassalam,
keluarga, para sahabat, dan kaum muslimin seluruh penjuru alam hingga akhir zaman.
Terselesaikannya penulisan skripsi ini tidak terlepas dari bantuan berbagai pihak, untuk itu penulis
ingin menyampaikan terima kasih kepada:
1 Ibunda Herlina dan Ayahanda Wawan Hermawan atas limpahan kasih sayang tiada tara.
2 Ibu Sri Nurdiati dan Bapak Ahmad Ridha selaku pembimbing yang senantiasa memberikan
arahan dan motivasi.
3 Bapak Sony Hartono Wijaya selaku penguji sidang tugas akhir.
4 Bapak Toto Haryanto selaku dosen pembimbing akademik dan Ibu Annisa selaku
pembimbing praktik kerja lapang.
5 Bapak Suratman selaku pembimbing praktik kerja lapang, Bapak Sirojul Munir, Ibu
Rohmah, Ibu Intan, dan segenap karyawan Pusat Pengembangan Informatika NuklirBATAN.
6 Para dosen dan staf tata usaha Departemen Ilmu Komputer FMIPA IPB.
7 Para guru dan staf tata usaha SD Negeri Cilendek Timur 1, SMP Negeri 6 Bogor, dan SMA
Negeri 9 Bogor.
8 A Heri, A Luki, dan Widi.
9 Teman-teman satu bimbingan Indra, Rifky, Rizka, Yuli, Neri, dan Nia.
10 Teman-teman PKL Arief dan Tedi.
11 Teman-teman seperjuangan Sri Rahayu, Kirana, Tice, Radini, Agessty, Santia, Ade Nelvia,
Hutomo, Nanda, Panji, dan teman-teman Ilkomerz 45.
12 Teman-teman panitia Pesta Sains Nasional 2010, The 5th Journalistic Fair, Kominfo BEM
FMIPA IPB 2010, dan Kominfo BEM KM IPB 2011.
13 Teman-teman Studenta Jurnal Bogor, Agri FM, SPECTRUM, dan Salemba Group.
Semoga hasil penelitian ini dapat membantu perkembangan dunia teknologi dan informasi
di Indonesia.
Bogor, Desember 2012
Cipta Wiraswasta
DAFTAR RIWAYAT HIDUP
Penulis lahir di Bogor pada tanggal 11 Januari 1991 sebagai anak ketiga dari empat
bersaudara, putra dari pasangan Wawan Hermawan dan Herlina. Masa kecil penulis banyak
dihabiskan di Bogor. Penulis menjalani pendidikan dasar di SD Negeri Cilendek Timur 1 pada
tahun 1996-2002. Pendidikan menengah dilanjutkan pada tahun 2002-2005 di SMP Negeri 6
Bogor. Pada Tahun 2008, penulis lulus dari SMA Negeri 9 Bogor dan melanjutkan pendidikan ke
Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) pada
Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA).
Berbagai organisasi pernah penulis ikuti, di antaranya volley ball club dan English club
SMP Negeri 6 Bogor, OSIS dan Pramuka SMA Negeri 9 Bogor, Badan Eksekutif Mahasiswa
(BEM) FMIPA IPB 2010, serta BEM Keluarga Mahasiswa (KM) IPB 2011. Penulis sempat
menjadi project officer beberapa kegiatan, seperti Exhibition of Stamps 2007, Pesta Sains Nasional
2010, dan The 5th Journalistic Fair. Selain itu, sebagai bentuk pengembangan diri, penulis pernah
menjadi freelancer di Agri FM IPB sebagai announcer dan divisi produksi, Studenta Jurnal Bogor
sebagai repoter dan redaktur eksekutif, bimbingan belajar SPECTRUM dan Salemba Group
sebagai pengajar matematika. Praktik Kerja Lapang (PKL) penulis laksanakan di Pusat
Pengembangan Informatika Nuklir-Badan Tenaga Nuklir Nasional (PPIN-BATAN), Kawasan
Puspiptek, Serpong, Tangerang selama 35 hari kerja pada bulan Juli - Agustus 2011.
DAFTAR ISI
Halaman
DAFTAR TABEL ......................................................................................................................vi
DAFTAR GAMBAR..................................................................................................................vi
DAFTAR LAMPIRAN ............................................................................................................ vii
PENDAHULUAN
Latar Belakang ........................................................................................................................ 1
Tujuan...................................................................................................................................... 1
Ruang Lingkup ........................................................................................................................ 1
TINJAUAN PUSTAKA
Frasa Keterangan ..................................................................................................................... 1
Knowledge Graph.................................................................................................................... 2
Concept.................................................................................................................................... 2
Word Graph ............................................................................................................................. 2
Aspek Ontologi........................................................................................................................ 2
XML ........................................................................................................................................ 4
METODE PENELITIAN
Studi Literatur.......................................................................................................................... 4
Analisis Pola Pembentukan Word Graph Frasa Keterangan Bahasa Indonesia ...................... 5
Perancangan XML ................................................................................................................... 5
Pengujian dan Analisis Hasil ................................................................................................... 6
Dokumentasi ............................................................................................................................ 6
HASIL DAN PEMBAHASAN
Analisis Pola Pembentukan Word Graph Frasa Keterangan Bahasa Indonesia ...................... 6
Perancangan XML ................................................................................................................... 6
Pengujian dan Analisis Hasil ................................................................................................. 15
SIMPULAN DAN SARAN
Simpulan ................................................................................................................................ 15
Saran ...................................................................................................................................... 15
LAMPIRAN .............................................................................................................................. 16
v
DAFTAR TABEL
1
2
3
4
5
6
7
Halaman
Tag-tag XML hasil penelitian Astriratma (2012) .................................................................. 5
Komponen-komponen pembentuk word graph pola 1 .......................................................... 7
Hubungan relasi antarkomponen word graph pola 1............................................................. 8
Komponen-komponen pembentuk word graph pola 3 ........................................................ 10
Hubungan relasi antarkomponen word graph pola 3........................................................... 10
Komponen-komponen pembentuk word graph pola 11 ...................................................... 13
Hubungan relasi antarkomponen word graph pola 11 ......................................................... 13
DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Halaman
Contoh penggunaan relasi ALI. ............................................................................................. 2
Contoh penggunaan relasi EQU. ........................................................................................... 3
Contoh penggunaan relasi EQU untuk makna kesetaraan. .................................................... 3
Contoh penggunaan relasi CAU. ........................................................................................... 3
Contoh penggunaan relasi SUB. ............................................................................................ 3
Contoh penggunaan relasi DIS. ............................................................................................. 3
Contoh penggunaan relasi ORD. ........................................................................................... 3
Contoh penggunaan relasi PAR. ............................................................................................ 3
Contoh penggunaan relasi SKO. ........................................................................................... 3
Contoh penggunaan ontologi F. ............................................................................................. 3
Graph untuk pernyataan p. .................................................................................................... 4
Graph dengan frame relasi NEGPAR. .................................................................................. 4
Graph dengan frame relasi POSPAR. ................................................................................... 4
Graph dengan frame relasi NECPAR.................................................................................... 4
Tahapan penelitian. ................................................................................................................ 5
Struktur XML untuk components. ......................................................................................... 6
Struktur XML untuk relationships. ....................................................................................... 7
Word graph pola 1. ................................................................................................................ 7
Identifikasi komponen pembentuk word graph pola 1. ......................................................... 7
File XML bagian components pola 1. ................................................................................... 8
File XML bagian relationships pola 1................................................................................... 8
Word graph frasa keterangan amat sangat. ........................................................................... 8
File XML bagian components frasa keterangan amat sangat................................................ 9
File XML bagian relationships frasa keterangan amat sangat. ............................................. 9
Word graph pola 3. ................................................................................................................ 9
Identifikasi komponen pembentuk word graph pola 3. ......................................................... 9
Aturan perancangan XML untuk tag ............................................ 10
File XML bagian components pola 3. ................................................................................. 11
File XML bagian relationships pola 3................................................................................. 11
Word graph frasa keterangan paling baik. .......................................................................... 11
File XML bagian components frasa keterangan paling baik. .............................................. 12
File XML bagian relationships frasa keterangan paling baik. ............................................ 12
Word graph pola 11. ............................................................................................................ 13
Identifikasi komponen pembentuk word graph pola 11. ..................................................... 13
File XML bagian components pola 11. ............................................................................... 13
File XML bagian relationships pola 11.............................................................................. 14
Word graph frasa keterangan acapkali. ............................................................................... 14
File XML bagian components frasa keterangan acapkali. .................................................. 14
File XML bagian relationships frasa keterangan acapkali.................................................. 14
vi
DAFTAR LAMPIRAN
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Halaman
Pola aturan word graph frasa keterangan bahasa Indonesia ................................................ 17
Struktur XML sebuah word graph hasil penelitian Astriratma (2012) ................................ 21
File XML pola 1 .................................................................................................................. 22
File XML pola 2 .................................................................................................................. 23
File XML pola 3 .................................................................................................................. 24
File XML pola 4 .................................................................................................................. 25
File XML pola 5 .................................................................................................................. 26
File XML pola 6 .................................................................................................................. 27
File XML pola 7 .................................................................................................................. 28
File XML pola 8 .................................................................................................................. 29
File XML pola 9 .................................................................................................................. 30
File XML pola 10 ................................................................................................................ 31
File XML pola 11 ................................................................................................................ 32
File XML pola 12 ................................................................................................................ 33
File XML pola 13 ................................................................................................................ 34
File XML pola 14 ................................................................................................................ 35
File XML pola 15 ................................................................................................................ 36
File XML pola 16 ................................................................................................................ 37
File XML pola 17 ................................................................................................................ 38
File XML pola 18 ................................................................................................................ 38
File XML pola 19 ................................................................................................................ 38
File XML pola 20 ................................................................................................................ 39
Dokumen XSD .................................................................................................................... 40
Tabel pencocokan word graph frasa keterangan bahasa Indonesia ..................................... 43
vii
1
PENDAHULUAN
Latar Belakang
Adanya ambiguitas pemaknaan bahasa
alami menyebabkan komputer tidak mampu
memberikan keluaran yang diharapkan oleh
pengguna. Jenis bahasa alami dalam bentuk
tulisan dinamakan teks. Salah satu metode
untuk merepresentasikan pengetahuan dalam
teks adalah knowledge graph (KG). Melalui
KG, pengguna dapat melihat graph kata dan
hubungannya dengan kata yang lain sehingga
ambiguitas pemaknaan dapat dihindari.
Implementasi metode KG dalam analisis
semantik diharapkan dapat membantu
menghasilkan abstraksi teks secara otomatis.
BogorDefltConstruct merupakan editor
pembentuk graph untuk kata dalam bahasa
Indonesia (Romadoni & Nurdiati 2010).
Pengembangan BogorDefltConstruct yang
menggunakan MATLAB dapat memicu
masalah lisensi karena software tersebut
berbayar. Oleh karena itu, dibutuhkan sistem
open source yang bisa didapatkan dengan
mudah tanpa terbentur masalah lisensi.
Solusi yang dihasilkan dari permasalahan
tersebut ialah dikembangkannya knowledge
graph viewer (KGV) hasil penelitian
Ramadhan
(2012).
Meskipun
masih
sederhana, KGV dapat menampilkan graph
dari sebuah kata atau file XML yang
dimasukan. Pengembangan KGV selanjutnya
dilakukan oleh Lesmana (2012). Terdapat
penambahan fungsi, seperti zoom in, zoom
out, pergeseran, mengunggah dan mengunduh
file XML, serta modifikasi graph secara
sederhana. Saat ini, masukan dari KGV ialah
kata, frasa, atau file XML dengan keluaran
yang diharapkan berupa graph.
Analisis pembentukan word graph frasa
keterangan bahasa Indonesia menggunakan
metode KG telah dihasilkan melalui penelitian
Sulistiawan (2011). Namun, belum ada
implementasinya berupa sistem open source.
Oleh karena itu, pada penelitian ini akan
direpresentasikan
word
graph
frasa
keterangan bahasa Indonesia menggunakan
XML agar graph yang diharapkan dapat
ditampikan dalam KGV.
Tujuan
Penelitian ini bertujuan merepresentasikan
pola word graph frasa keterangan bahasa
Indonesia menggunakan XML sesuai dengan
aturan pembentukan word graph frasa
keterangan bahasa Indonesia.
Ruang Lingkup
Ruang lingkup dari penelitian ini ialah
representasi word graph frasa keterangan
bahasa Indonesia hasil penelitian Sulistiawan
(2011). Hasil penelitian tersebut mencakup
delapan makna frasa keterangan yang
menghasilkan 29 pola pembentukan word
graph frasa keterangan bahasa Indonesia. File
yang dibentuk berformat XML dan dapat
diimpelementasikan dalam KGV (Lesmana
2012).
TINJAUAN PUSTAKA
Frasa Keterangan
1 Definisi Frasa Keterangan
Frasa adalah kesatuan yang terdiri atas dua
kata atau lebih yang masing-masing
mempertahankan makna kata dasarnya,
sementara gabungan itu menghasilkan suatu
relasi tertentu, dan tiap kata pembentuknya
tidak bisa berfungsi sebagai subjek atau
predikat dalam konstruksi itu (Keraf 1991).
Frasa keterangan pada bahasa Indonesia baku
merupakan
pengembangan
dari
kata
keterangan (Alwi et al. 2003).
2 Struktur Frasa Keterangan
Frasa keterangan merupakan kelompok
kata yang berfungsi menerangkan predikat
yang berupa kata kerja dan kata sifat. Selain
itu, frasa keterangan dapat menerangkan frasa
preposisional dan seluruh kalimat (Alwi et al.
2003). Terdapat delapan jenis makna frasa
keterangan berdasarkan perilaku semantiknya
(Alwi et al. 2003), yaitu:
Makna kualitatif
Makna kualitatif menggambarkan makna
yang berhubungan dengan tingkat, derajat,
atau mutu dari inti frasa keterangan.
Contoh: amat sangat, lebih kurang, dan
paling banyak.
Makna kuantitatif
Makna kuantitatif menggambarkan makna
yang berhubungan dengan jumlah. Contoh:
belum cukup, paling banyak, dan sedikit
sekali.
Makna limitatif
Makna limitatif menggambarkan makna
yang berhubungan dengan pembatasan dari
inti frasa keterangan. Contoh: baru saja
dan hanya saja.
2
Makna frekuentatif
Makna
frekuentatif
menggambarkan
makna yang berhubungan dengan tingkat
kekerapan terjadinya sesuatu yang
diterangkan kata keterangan. Contoh:
seringkali, hampir selalu, dan sangat
jarang.
Makna kewaktuan
Makna kewaktuan menggambarkan makna
yang berhubungan dengan saat terjadinya
peristiwa
yang
diterangkan
kata
keterangan. Contoh: sore hari, nanti siang,
dan saat ini.
Makna kecaraan
Makna kecaraan menggambarkan makna
yang menjelaskan suatu peristiwa karena
tanggapan pembicara atas terjadinya suatu
peristiwa. Contoh: barangkali, tidak
mungkin, dan sudah pasti.
Makna kontrastif
Makna
kontrastif
menggambarkan
pertentangan dengan makna kata atau hal
yang dinyatakan sebelumnya. Contoh:
justru dapat dan lagi pula.
Makna keniscayaan
Makna
keniscayaan
menggambarkan
makna
yang
berhubungan
dengan
kepastian tentang kelangsungan terjadinya
hal atau peristiwa yang dijelaskan oleh
kata keterangan. Contoh: begitu penting
dan belum tentu.
Knowledge Graph
Metode KG merupakan cara pandang baru
dalam menggambarkan bahasa alami. Adanya
aspek ontologi menjadi pembeda antara
metode KG dan metode representasi yang
lain. KG mempunyai kemampuan dalam
menyatakan aspek semantik dengan lebih
mendalam, menggunakan jenis relasi yang
terbatas, dan dapat digunakan untuk meniru
pemahaman
manusia.
Komposisi
KG
mencakup concept (token dan type) dan
relationship (binary dan multivariative
relation) (Zhang 2002).
Concept
Concept merupakan komponen dari mind
graph yang menerangkan persepsi mengenai
sesuatu. Representasi pemikiran yang dapat
dimodelkan oleh KG disebut mind graph
(Zhang 2002). Concept terdiri atas token dan
type. Token adalah node dalam KG yang
disimbolkan dengan persegi “
”. Token
menyatakan konsep hasil persepsi manusia
(Zhang 2002). Token bersifat subjektif karena
dipahami oleh bahasa manusia menurut
persepsi masing-masing. Contoh token
menurut Rusiyamti (2008) ialah “apel”.
Seseorang dapat menghubungkan hal ini
dengan informasi bentuk, warna, atau rasa.
Demikian juga dengan orang lain dapat
menghubungkannya dengan hal yang berbeda.
Type adalah suatu konsep yang bersifat
umum. Type bersifat objektif karena
merupakan hasil kesepakatan bersama (Zhang
2002). Contoh type ialah buah dan binatang.
Suatu konsep yang spesifik dikategorikan ke
dalam sebuah name. Fuji merupakan name
dari apel. Type dan name dibedakan oleh jenis
relasi yang menghubungkannya dengan token.
Word Graph
Word graph merupakan graph dari kata.
Dalam metode KG, setiap kata yang
berhubungan dengan sebuah word graph
menyatakan arti kata yang disebut dengan
semantic word graph. Gabungan semantic
word graph dalam sebuah kalimat membentuk
sentence
graph.
Graph
yang
merepresentasikan gabungan dari sentence
graph dalam sebuah teks disebut text graph
yang terdapat pengetahuan di dalamnya
(Hoede & Nurdiati 2008).
Aspek Ontologi
Ontologi adalah keterangan untuk
menggambarkan beberapa konsep dan relasi
dengan maksud untuk memberikan definisi
yang cukup terhadap ide-ide yang dituangkan
ke
dalam
komputer
agar
dapat
merepresentaikan ide-ide tersebut dengan
disertai logikanya (Hulliyah 2007). Sampai
saat
ini,
ontologi
word
graph
direpresentasikan dengan sebuah node,
delapan binary relationships, sebuah ontologi
F, dan empat frame relationships. Delapan
types relation menurut Zhang (2002), yaitu:
1 ALI (alikeness)
Relasi
ALI
digunakan
untuk
menghubungkan token dengan type. Makna
dari relasi ini ialah sama atau mirip. Contoh
type ialah binatang. Word graph yang
terbentuk dapat dilihat pada Gambar 1.
ALI
binatang
Gambar 1 Contoh penggunaan relasi ALI.
3
2 EQU (equality)
Relasi
EQU
digunakan
untuk
menghubungkan token dengan name. Contoh
name ialah Cipta. Word graph yang terbentuk
dapat dilihat pada Gambar 2.
EQU
Cipta
Gambar 2 Contoh penggunaan relasi EQU.
Relasi EQU juga dapat digunakan untuk
menjelaskan makna kesetaraan, contohnya X
sama dengan Y. Word graph yang terbentuk
dapat dilihat pada Gambar 3.
ALI
EQU
ALI
X
Y
Gambar 3 Contoh penggunaan relasi EQU
untuk makna kesetaraan.
3 CAU (causality)
Relasi
CAU
digunakan
untuk
menghubungkan dua buah token yang
memiliki hubungan sebab akibat, contohnya
Cipta makan. Word graph yang terbentuk
dapat dilihat pada Gambar 4.
ALI
CAU
ALI
orang
makan
ALI
Cipta
Gambar 4 Contoh penggunaan relasi CAU.
4 SUB (subset)
Relasi
SUB
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna token satu merupakan bagian
dari token yang lain, contohnya roda
merupakan bagian dari kendaraan. Word
graph yang terbentuk dapat dilihat pada
Gambar 5.
ALI
roda
SUB
ALI
kendaraan
Gambar 5 Contoh penggunaan relasi SUB.
5 DIS (disparateness)
Relasi
DIS
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna token satu berbeda dengan
token yang lain, contohnya radio berbeda
dengan koran. Word graph yang terbentuk
dapat dilihat pada Gambar 6.
ALI
DIS
ALI
radio
koran
Gambar 6 Contoh penggunaan relasi DIS.
6 ORD (ordering)
Relasi
ORD
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna adanya urutan, contohnya
dari muda sampai tua. Word graph yang
terbentuk dapat dilihat pada Gambar 7.
ALI
ORD
ALI
muda
tua
Gambar 7 Contoh penggunaan relasi ORD.
7 PAR (attribute)
Relasi
PAR
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna token satu berkaitan dan
memiliki sifat dengan token yang lain,
contohnya mobil baru. Word graph yang
terbentuk dapat dilihat pada Gambar 8.
ALI
PAR
ALI
baru
mobil
Gambar 8 Contoh penggunaan relasi PAR.
8 SKO (informational dependency)
Relasi
SKO
digunakan
untuk
menghubungkan dua buah token yang
memiliki makna hubungan kebergantungan,
contohnya besarnya nilai 2X bergantung pada
nilai X. Word graph yang terbentuk dapat
dilihat pada Gambar 9.
ALI
SKO
ALI
X
2X
Gambar 9 Contoh penggunaan relasi SKO.
Selain kedelapan binary relationships,
terdapat ontologi F (focus) yang digunakan
untuk menunjukkan focus dari suatu graph.
Ontologi F dilambangkan dengan “
”.
Contohnya Cipta minum. Cipta sebagai focus,
maka word graph yang terbentuk dapat dilihat
pada Gambar 10.
ALI
CAU
orang
ALI
minum
ALI
Cipta
Gambar 10 Contoh penggunaan ontologi F.
4
Empat
frame
relationships
yang
merupakan bagian dari ontologi KG, yaitu:
1
2
3
4
Focusing on a situation
Negation of a situation
Possibility of a situation
Necessity of a situation
: FPAR
: NEGPAR
: POSPAR
: NECPAR
Misalkan p merupakan suatu pernyataan
yang dinyatakan dengan frame dan
disimbolkan dengan persegi bergaris putusputus “
”, maka graph dari negasi p dapat
dinyatakan dengan graph yang sama dan
diberi frame relasi NEGPAR, possibility
graph dari p dapat dinyatakan dengan graph
yang sama dan diberi frame relasi POSPAR,
dan necessity graph dari p dapat dinyatakan
dengan graph yang sama dan diberi frame
relasi NECPAR (Zhang 2002). Graph yang
terbentuk dapat dilihat pada Gambar 11,
Gambar 12, Gambar 13, dan Gambar 14.
Gambar 11 Graph untuk pernyataan p.
Gambar 12 Graph dengan frame relasi
NEGPAR.
Gambar 13 Graph dengan frame relasi
POSPAR.
XML
Extensible markup language (XML)
merupakan
bentuk
baku
untuk
merepresentasikan struktur dokumen teks dan
data yang memberikan kemudahan dalam
publikasi dan pertukaran data (Benz & Durant
2003). XML digunakan untuk memudahkan
pembacaan data oleh komputer. Tag XML
dapat dibuat oleh pengguna sesuai dengan
kebutuhan yang dikehendaki. Tag pembuka
dalam file XML harus disertakan tag
penutupnya.
Kelebihan yang dimiliki oleh XML, yaitu
(Goldberg & Castro 2009):
1 digunakan untuk penyimpanan dan
pertukaran data,
2 memiliki tags, attributes, dan values
seperti HTML,
3 sederhana, mudah dimengerti, mudah
diuraikan dan dimanipulasi, serta dianggap
human readable,
4 mudah untuk dikembangkan dan
diadaptasi,
5 merupakan bahasa untuk menyimpan dan
membawa informasi,
6 markup language dapat dibuat sendiri oleh
pengguna sehingga dapat digunakan untuk
menyimpan informasi, dan
7 dapat digunakan untuk menukarkan data
antarsistem atau organisasi yang berbeda.
METODE PENELITIAN
Penelitian ini terdiri atas beberapa tahap,
yaitu
studi
literatur,
analisis
pola
pembentukan word graph frasa keterangan
bahasa Indonesia, perancangan XML,
pengujian
dan
analisis
hasil,
serta
dokumentasi. Tahapan yang dilakukan dalam
penelitian ini dapat dilihat pada Gambar 15.
Studi Literatur
Gambar 14 Graph dengan frame relasi
NECPAR.
Misalkan p menyatakan hari ini hujan,
maka secara berurutan Gambar 11, Gambar
12, Gambar 13, dan Gambar 14 menunjukkan
graph dari pernyataan hari ini hujan, tidak
benar hari ini hujan, mungkin hari ini hujan,
dan seharusnya hari ini hujan (Sulistiawan
2011).
Referensi-referensi terkait knowledge
graph dan frasa keterangan bahasa Indonesia
dikumpulkan, dipahami, dan dipelajari guna
mendapatkan
pengetahuan
tentang
pembentukan word graph frasa keterangan
bahasa Indonesia. Referensi yang digunakan,
yaitu disertasi Zhang tahun 2002, jurnal
internasional Hoede & Nurdiati tahun 2008,
tesis Hulliyah tahun 2007, tesis Rusiyamti
tahun 2008, dan tesis Sulistiawan tahun 2011.
5
Mulai
Tabel 1 Tag-tag XML hasil penelitian
Astriratma (2012)
Tag
Studi Literatur
Analisis Pola Pembentukan Word Graph
Frasa Keterangan Bahasa Indonesia
Perancangan XML
Pengujian dan Analisis Hasil
Dokumentasi
Selesai
Gambar 15 Tahapan penelitian.
Analisis Pola Pembentukan Word Graph
Frasa Keterangan Bahasa Indonesia
Tahap ini menganalisis pola pembentukan
word graph frasa keterangan hasil penelitian
Sulistiawan (2011) yang berjudul “Analisis
Pembentukan Word Graph Frasa Keterangan
Menggunakan Metode Knowledge Graph“.
Analisis dilakukan dengan mencocokkan
kesesuaian pola word graph frasa keterangan
bahasa Indonesia dengan pola frasa
keterangan bahasa Indonesia. Hasil dari
analisis ini digunakan untuk perancangan file
XML pada pembentukan pola word graph
frasa keterangan bahasa Indonesia.
Perancangan XML
Perancangan
XML
dilakukan
menggunakan tag-tag dan skema perancangan
XML dalam dokumen XML schema
definition (XSD) hasil penelitian Astriratma
(2012). Penambahan tag-tag baru dan
penyesuaian kebutuhan dalam dokumen XSD
dilakukan guna menunjang penelitian. Tagtag hasil penelitian Astriratma (2012) dapat
dilihat pada Tabel 1.
Definisi
mewakili dokumen
pola atau root
mewakili keseluruhan
komponen pembentuk
pola
mewakili keseluruhan
arah yang
menghubungkan
antarkomponen
menunjukkan suatu
focus
menunjukkan sebuah
token
menunjukkan text
menunjukkan
hubungan yang
digunakan
menunjukkan suatu
frame
menunjukkan id suatu
tag
menunjukkan suatu
nilai
menunjukkan nilai
yang dapat diubah atau
tidak
menunjukkan jenis
relasi atau frame
relation yang
digunakan
menunjukkan arah
panah masuk
menunjukkan arah
panah keluar
menunjukkan focus
sesuai id yang
digunakan
menunjukkan token
sesuai id yang
digunakan
menunjukkan text
sesuai id yang
digunakan
menunjukkan
hubungan sesuai id
yang digunakan
menunjukkan frame
sesuai id yang
digunakan
6
Pengujian dan Analisis Hasil
Tahap pengujian dan analisis hasil
dimaksudkan guna mengetahui kesesuaian file
XML dengan graph yang tergambar. Tingkat
keberhasilan dari pola word graph frasa
keterangan bahasa Indonesia yang tergambar
didapat melalui perhitungan sebagai berikut:
∑ pola yang ber asil tergambar
∑ total pola yang diujikan
100
Dokumentasi
Dokumentasi dilakukan dengan cara
pembuatan laporan hasil dari penelitian
disertai keterangan dan penjelasan terkait
penelitian yang telah dilaksanakan.
HASIL DAN PEMBAHASAN
Analisis Pola Pembentukan Word Graph
Frasa Keterangan Bahasa Indonesia
Sebelum dilakukan perancangan XML,
analisis pola pembentukan word graph frasa
keterangan bahasa Indonesia perlu dilakukan
dengan langkah-langkah sebagai berikut:
1 mengecek keberadaan pola yang sama,
2 mengidentifikasi komponen-komponen
pembentuk pola, dan
3 melihat relasi antarkomponen pembentuk
pola.
Hasil analisis menunjukkan terdapat
sembilan pola yang sama dari 29 pola
pembentukan word graph frasa keterangan
bahasa Indonesia. Pola-pola pembentukan
word graph frasa keterangan bahasa Indonesia
dapat di lihat pada Lampiran 1. Frasa
keterangan
bahasa
Indonesia
dalam
Sulistiawan (2011) yang memiliki pola word
graph yang sama, yaitu:
1
2
3
4
5
6
7
8
9
amat sangat dengan nanti+waktu,
paling baik dengan paling+adv/adj,
acapkali dengan hampir selalu,
acapkali dengan sering kali,
sekarang juga dengan saat ini,
sudah pasti dengan begitu penting,
waktu+hari dengan kemarin+waktu,
waktu+hari dengan lagi pula, dan
barangkali dengan belum tentu.
Perancangan XML
Tag-tag
yang
digunakan
dalam
perancangan XML merupakan hasil penelitian
Astriratma (2012). Setiap word graph diawali
tag pembuka dan ditutup dengan tag
penutup . Pada tag-tag tersebut
terdapat tag
yang menyatakan komponen pembentuk word
graph
dan
tag
yang
menyatakan
hubungan antarkomponen disertai relasinya.
Komponen-komponen pembentuk word
graph yang terdapat pada tag
, di antaranya focus dengan
tag , token dengan tag
, text dengan tag
, relasi dengan tag
, dan frame dengan tag
. Masing-masing tag memiliki tag
untuk mengetahui identitasnya.
Struktur XML untuk bagian components dapat
dilihat pada Gambar 16.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Gambar 16 Struktur XML untuk components.
Pada Gambar 16, tag
memiliki elemen tambahan, yaitu tag
dan tag
.
Tag
menyatakan kebutuhan suatu nilai yang dapat
diubah atau tidak, berisikan YES untuk nilai
yang dapat diubah atau NO untuk nilai yang
tidak dapat diubah. Tag
menyatakan nilai atau isi dari tag
. Pada tag
terdapat elemen tambahan, yaitu tag
yang menyatakan jenis relasi atau
frame relation yang digunakan.
Tag
terdiri atas 3 elemen, yaitu tag
, tag , dan
tag
.
Tag
menyatakan relasi sesuai id
yang digunakan. Pada tag
7
terdapat 2 elemen, yaitu tag
yang menyatakan asal arah
panah relasi menuju tag sebagai
tujuan. Struktur XML untuk bagian
relationships dapat dilihat pada Gambar 17.
Struktur XML sebuah word graph hasil
penelitian Astriratma (2012) dapat dilihat
pada Lampiran 2.
1
2
3
4
5
6
Gambar 17 Struktur XML untuk
relationships.
Setelah struktur lengkap file XML sebuah
word graph didapatkan, proses perancangan
file XML untuk pola 1, 3, dan 11 frasa
keterangan bahasa Indonesia hasil penelitian
Sulistiawan (2011) dijelaskan. Word graph
pola 1 frasa keterangan bahasa Indonesia
merepresentasikan frasa keterangan jenis
makna kualitatif dan makna kewaktuan.
Tampilan word graph untuk pola 1 frasa
keterangan bahasa Indonesia dapat dilihat
pada Gambar 18. Identifikasi terhadap
komponen-komponen pembentuk word graph
pola 1 dapat dilihat pada Gambar 19.
Keterangan:
1
2
3
4
text id: 1
relasi id: 1
frame id: 1
text id: 2
5
6
7
8
relasi id: 2
token id: 1
relasi id: 3
focus id: 1
Word graph pola 1 frasa keterangan
memiliki delapan komponen pembentuk, yaitu
sebuah focus, sebuah token, dua buah text, tiga
buah relasi, dan sebuah frame. Komponenkomponen pembentuk word graph pola 1
frasa keterangan dapat dilihat pada Tabel 2.
Tabel 2 Komponen-komponen pembentuk
word graph pola 1
Komponen
Jumlah
Id
Focus
1
1
Token
1
1
Text
2
1
Keterangan
Value: amat
sangat/
nanti+waktu
Replace: YES
2
Value:
adj/waktu
Replace: YES
Relation
Frame
3
1
1
Type: ALI
2
Type: ALI
3
Type: ORD
1
Focus id: 1
Token id: 1
Text id: 2
Gambar 18 Word graph pola 1.
Relation id: 2
dan 3
Word graph pola 1 frasa keterangan
memiliki sebuah focus dan token dengan id
masing-masing 1. Jumlah text yang
dibutuhkan ialah dua. Text dengan id 1
memiliki value amat sangat/nanti+waktu.
Amat sangat merupakan contoh frasa
keterangan kualitatif, sedangkan nanti+waktu
merupakan salah satu pola sintaksis pada frasa
keterangan dengan makna kewaktuan,
contohnya nanti siang. File XML untuk
bagian components pola 1 dapat dilihat pada
Gambar 20.
Gambar 19 Identifikasi komponen pembentuk
word graph pola 1.
8
1
2
3
4
5
6
7
8
9
10
1
1
1
amatsangat/nanti+waktu
YES
2
sangat/waktu
YES
1
ALI
2
ALI
3
ORD
1
1
1
2
2
3
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
Gambar 20 File XML bagian components
pola 1.
berasal dari text dengan id 2 menuju token
dengan id 1. Pada relasi ORD dengan id 1,
panah relasi berasal dari token dengan id 1
menuju focus dengan id 1. Jumlah frame yang
diperlukan untuk membentuk word graph
pola 1 frasa keterangan ialah satu yang
meliputi focus, token, relasi dengan id 2 dan 3,
serta text dengan id 2. File XML untuk bagian
relationships pola 1 frasa keterangan dapat
dilihat pada Gambar 21. Gabungan file XML
untuk bagian components dan relationships
pola 1 dapat dilihat pada Lampiran 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
1
1
2
2
1
3
1
1
Gambar 21 File XML bagian relationships
pola 1.
Contoh frasa keterangan untuk pola 1 ialah
amat sangat. Amat sangat merupakan frasa
keterangan bahasa Indonesia jenis makna
kualitatif. Tampilan word graph untuk frasa
keterangan amat sangat dapat dilihat pada
Gambar 22.
Gambar 20, tag
untuk text dalam file XML pola 1
frasa keterangan berisi YES yang artinya
value untuk text tersebut dapat diubah.
Hubungan relasi antarkomponen word graph
pola 1 frasa keterangan dapat dilihat pada
Tabel 3.
Pada
Tabel 3 Hubungan relasi antarkomponen
word graph pola 1
Id
Relation
From
To
1
ALI
Text id: 1
Frame id: 1
2
ALI
Text id: 2
Token id: 1
3
ORD
Token id: 1
Focus id: 1
Relasi
yang
digunakan
dalam
pembentukan word graph pola 1 frasa
keterangan ada tiga buah, yaitu ALI untuk
relasi dengan id 1 dan 2 serta ORD untuk
relasi dengan id 3. Relasi ALI dengan id 1
berasal dari text dengan id 1 menuju frame
dengan id 1, sedangkan relasi ALI dengan id 2
Gambar 22 Word graph frasa keterangan
amat sangat.
Gambar 22 menunjukkan frasa keterangan
amat sangat yang mempunyai relasi ORD,
yaitu relasi yang menunjukkan adanya urutan.
Amat sangat dapat diartikan sebagai lebih
dari. Kata sangat direpresentasikan oleh
sebuah token dengan relasi ALI. Karena relasi
yang digunakan amat sangat ialah ORD,
maka dibutuhkan token lain sebagai
pembanding. Panah relasi ORD berasal dari
token kata sangat menuju focus. File XML
untuk bagian components frasa keterangan
amat sangat dapat dilihat pada Gambar 23.
9
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
1
1
1
amatsangat
YES
2
sangat/waktu
YES
1 ALI
2 ALI
3 ORD
1
1
1
2
2
3
Word graph pola 3 frasa keterangan
bahasa Indonesia merepresentasikan frasa
keterangan jenis makna kualitatif dan
kuantitatif. Tampilan word graph untuk pola 3
frasa keterangan bahasa Indonesia dapat
dilihat pada Gambar 25. Identifikasi terhadap
komponen-komponen pembentuk word graph
pola 3 dapat dilihat pada Gambar 26.
Gambar 25 Word graph pola 3.
Gambar 23 File XML bagian components
frasa keterangan amat sangat.
Jumlah frame yang diperlukan pada
pembentukan word graph frasa keterangan
amat sangat ialah satu yang meliputi focus
dengan id 1, token dengan id 1, text dengan id
2 yang memiliki value sangat, relasi dengan
id 2 type ALI, dan relasi dengan id 3 type
ORD. File XML untuk bagian relationships
frasa keterangan amat sangat dapat dilihat
pada Gambar 24.
42
43
44
45
46
47
48
49
50
51
52
53
54
55
1
1
1
2
2
1
3
1
1
Gambar 24 File XML bagian relationships
frasa keterangan amat sangat.
Pola 2 frasa keterangan bahasa Indonesia
merepresentasikan frasa keterangan lebih
kurang atau kurang lebih yang bermakna kirakira. Frasa ini merupakan frasa keterangan
jenis makna kualitatif yang menunjukkan
adanya tingkat, derajat, atau mutu. File XML
untuk pola 2 dapat dilihat pada Lampiran 4.
Gambar 26 Identifikasi komponen pembentuk
word graph pola 3.
Keterangan:
1
2
3
4
5
6
7
text id: 1
relasi id: 1
frame id: 1
text id: 2
text id: 3
text id: 4
relasi id: 2
8
9
10
11
12
13
14
relasi id: 3
relasi id: 4
token id: 1
relasi id: 5
token id: 2
relasi id: 6
focus id: 1
Terdapat
empat
belas
komponen
pembentuk word graph pola 3, yaitu sebuah
focus, dua buah token, empat buah text, enam
buah relasi, dan sebuah frame. Text dengan id
1 memiliki value paling+adv/adj. Text dengan
id 2 memiliki value adv/adj. Adv ialah adverb
atau kata keterangan, sedangkan adj ialah
adjektive atau kata sifat. Komponenkomponen pembentuk word graph pola 3
frasa keterangan dapat dilihat pada Tabel 4.
10
Tabel 4 Komponen-komponen pembentuk
word graph pola 3
Komponen
Jumlah
Id
Focus
1
1
Token
1
1
Text
2
1
Keterangan
Value: paling
+adv/adj
Replace: YES
2
Value:
adv/adj
3
Value:
adv/adj
cloneid: 2
4
Value:
adv/adj
cloneid: 2
Relation
Frame
3
1
1
Type: ALI
2
Type: ALI
3
Type: ALI
4
Type: ALI
5
Type: ORD
6
Type: ORD
1
Focus id: 1
dan 2
Token id: 1
Text id: 2, 3,
dan 4
Relation id:
2, 3, 4, 5, dan
6
Word graph pola 3 frasa keterangan
merupakan contoh word graph dengan value
dari setiap tag yang saling
terintegrasi satu sama lain. Jika terdapat value
dari sebuah text yang dibuah, maka value dari
text-text yang lain harus berubah. Hal tersebut
bertujuan agar makna dari word graph yang
ditampilkan tetap terjaga. Misalnya, jika text
id 2 memiliki value baik, maka secara
otomatis value untuk text id 3 dan 4 ialah baik
dan value untuk text id 1 menjadi paling baik.
Begitu pula jika value untuk text id 3 diubah
menjadi lucu, maka value untuk text id 2 dan
4 harus mengikuti value text id 3, yaitu lucu.
Value untuk text id 1 menjadi paling lucu.
Oleh karena itu, tag baru diperlukan untuk
mengakomodasikan kebutuhan tersebut. Tag
dibuat untuk
menunjukkan id dari sebuah text dengan value
yang dapat digandakan. Jika sebuah text
memiliki tag , maka
tag tidak diperlukan
kembali. Tag dan tag
bersifat optional,
tag-tag tersebut harus dipilih salah satu dan
tidak diperkenankan muncul bersamaan. Jika
sebuah text memiliki tag
maka secara otomatis tag
bernilai NO. Aturan
perancangan XML untuk tag
dalam dokumen XSD dapat
dilihat pada Gambar 27. Hubungan relasi
antarkomponen word graph pola 3 frasa
keterangan dapat dilihat pada Tabel 5.
Gambar 27 Aturan perancangan XML untuk
tag
Apabila value untuk text id 2 adalah baik,
maka pada text id 3 dan 4 cukup ditambahkan
tag
2
yang
menunjukkan value untuk text id 3 dan 4 sama
dengan value untuk text id 2, yaitu baik.
Begitu juga jika value untuk text id 3 diubah
menjadi lucu, maka pada text id 2 dan 4 cukup
ditambahkan tag 3.
Tabel 5 Hubungan relasi antarkomponen
word graph pola 3
Id
Relation
From
To
1
ALI
Text id: 1
Frame id: 1
2
ALI
Text id: 2
Token id: 1
3
ALI
Text id: 3
Token id: 2
4
ALI
Text id: 4
Focus id: 1
5
ORD
Token id: 1
Token id: 2
6
ORD
Token id: 2
Focus id: 1
11
Jenis relasi yang digunakan dalam
pembentukan word graph pola 3 ada dua,
yaitu ALI dan ORD. Relasi ALI pada word
graph pola 3 menghubungkan text dengan
focus, token, atau frame. Relasi ORD
digunakan untuk menghubungkan token
dengan token atau token dengan focus. File
XML untuk bagian components dan
relationships pola 3 frasa keterangan bahasa
Indonesia dapat dilihat pada Gambar 28 dan
Gambar 29. Gabungan keduanya dapat dilihat
pada Lampiran 5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
1
1
2
1
paling+adv/adj
YES
2
adv/adj
YES
3
2
4
2
1 ALI
2 ALI
3 ALI
4 ALI
5 ORD
6 ORD
1
1
1
2
2
3
4
2
3
4
5
6
Gambar 28 File XML bagian components
pola 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
1
1
1
2
2
1
3
3
2
4
4
1
5
1
2
6
2
1
Gambar 29 File XML bagian relationships
pola 3.
Panah relasi ALI dengan id 1 berasal dari
text dengan id 1 menuju frame dengan id 1.
Panah relasi ALI dengan id 2 dan 3 berasal
dari text dengan id 2 dan 3 menuju token
dengan id 1 dan 2. Pada relasi ALI dengan id
4, panah relasi berasal dari text dengan id 4
menuju focus dengan id 1. Panah relasi ORD
dengan id 1 berasal dari token dengan id 1
menuju token dengan id 2, sedangkan token
dengan id 2 dan focus dengan id 1
dihubungkan oleh relasi ORD dengan id 2.
Contoh frasa keterangan untuk pola 3 ialah
paling baik. Paling baik merupakan frasa
keterangan bahasa Indonesia jenis makna
kualitatif. Tampilan word graph untuk frasa
keterangan paling baik dapat dilihat pada
Gambar 30.
Gambar 30 Word graph frasa keterangan
paling baik.
Gambar 30 menunjukkan frasa keterangan
paling baik yang dapat diartikan terbaik.
Karena relasi yang digunakan frasa
keterangan ini adalah ORD, maka token yang
berada di sisi kanan memiliki makna lebih
dari token sebelumnya. Begitu juga dengan
12
token yang berada