a. Token
Dalam teori knowledge graph, token merupakan konsep yang dipahami oleh
seseorang menurut cara pandang masing- masing, sehingga token ini bersifat subjektif.
Setiap persepsi selalu berhubungan dengan token
. Sebuah konsep berhubungan dengan arti dari kata Zhang 2002. Contoh sebuah
token adalah: misalkan seseorang menemukan
kata “apel”, orang tersebut dapat menghubungkan hal ini dengan informasi
bentuk, warna, dan rasa demikian juga orang lain akan menghubungkan dengan hal yang
berbeda.
Token dalam teori knowledge graph
dinyatakan dengan simbol “ “. Seseorang
dalam mengamati sesuatu, pada kenyataannya akan selalu dibandingkan dengan dunia nyata.
Dengan demikian dalam teori knowledge graph
segala sesuatu akan dihubungkan dengan token.
b. Type
Type adalah konsep yang berupa informasi
umum dan bersifat objektif karena merupakan kesepakatan yang dibuat sebelumnya. Contoh
type misalnya buah, binatang dan sebagainya.
c. Name
Name adalah sesuatu yang bersifat
individual, sebagai contoh: “Fuji” adalah sebuah name yaitu nama dari sebuah apel.
Sesuatu dapat dikelompokkan ke dalam beberapa type yang berbeda. Demikian juga
name
, sesuatu dapat diberi name dengan banyak cara.
Type dan name dalam teori knowledge
graph direpresentasikan dengan cara yang
hampir sama. Namun demikian bukan berarti bahwa keduanya tidak bisa dibedakan. Type
dan name dibedakan oleh jenis relasi yang menghubungkannya dengan token Rusiyamti
2008. 2.7 Aspek-aspek Ontologi
Ontologi merupakan gambaran dari beberapa konsep dan relasi antarkonsep yang
bertujuan mendefinisikan ide-ide yang merepresentasikan konsep, relasi dan
logikanya. Berdasarkan ontologi yang dimiliki inilah knowledge graph dapat membangun
sebuah model yang dapat digunakan untuk memahami bahasa alami natural language.
Hal ini diperlukan agar arti dari suatu kalimat dapat diekspresikan. Arti dari kata terlebih
dahulu harus diketahui untuk dapat mengartikan sebuah kalimat Ikhwati 2007.
Ontologi word graph sampai saat ini terdiri atas token yang dinyatakan dengan
node , 8 binary relationships, dan 4 frame
relationships . Delapan binary relationships
tersebut ialah: 1
Causality :
CAU 2
Equality : EQU
3 Subset : SUB
4 Alikeness
: ALI 5
Disparateness : DIS 6
Ordering : ORD
7 Attribution
: PAR 8
Informational dependency : SKO
Menurut Zhang 2002, penjelasan dari ontologi dalam teori knowledge graph tersebut
dapat diberikan sebagai berikut:
1. Relasi ALI Alikeness
Relasi ALI digunakan untuk menghubungkan sebuah type dengan token.
Contoh: buah adalah type, maka dapat dinyatakan dengan word graph berikut:
Gambar 2 Contoh penggunaan relasi ALI.
2. Relasi CAU Causality
Relasi kausal antara 2 buah token digambarkan dengan anak panah berlabel
CAU. Relasi CAU digunakan untuk menghubungkan dua token yang memiliki
hubungan sebab akibat atau bisa juga untuk menghubungkan dua konsep yang terdiri dari
kata benda dan kata kerja atau untuk menghubungkan subjek dengan predikat atau
predikat dengan objek. Contoh: kucing makan nasi. Kalimat tersebut dapat dinyatakan
sebagai berikut:
Gambar 3 Contoh penggunaan relasi CAU.
3. Relasi EQU Equality
Relasi EQU digunakan untuk menghubungkan sebuah name dengan token.
Contoh: “Fuji” adalah name dari apel, word graph-
nya seperti gambar berikut:
Gambar 4 Contoh penggunaan relasi EQU.
Relasi ini biasa juga untuk menyatakan kata hubung seperti “adalah” dan
“merupakan”, word graph-nya dapat dilihat pada gambar berikut:
Gambar 5 Contoh penggunaan relasi EQU yang menyatakan “adalah” dan
“merupakan”.
4. Relasi SUB Subset
Jika dua token menyatakan word graph, dan word graph yang satu merupakan bagian
dari word graph yang lain, maka kedua token dihubungkan dengan relasi SUB. Tetapi untuk
konsep yang dinyatakan dengan graf, dapat dikatakan bahwa graf A subgraf dari graf B,
sehingga antara A dan B digunakan relasi FPAR. Contoh: ekor merupakan bagian dari
kucing, dapat dinyatakan dengan word graph berikut:
Gambar 6 Contoh penggunaan relasi SUB. 5. Relasi DIS
Disparateness
Dalam logika matematika, relasi DIS digunakan untuk menyatakan bahwa dua
token tidak mempunyai satu elemen pun yang
sama, sehingga dapat diformulasikan sebagai berikut: A DIS B berarti bahwa
A B
∩ = ∅
. Relasi ini juga dapat digunakan untuk
menyatakan kata “berbeda”, misalnya air berbeda dengan minyak
yang dapat dinyatakan dengan graf berikut:
Gambar 7 Contoh penggunaan relasi DIS.
6. Relasi ORD Ordering
Relasi ORD menyatakan bahwa dua hal memiliki ururan tertentu, baik urutan waktu
maupun urutan tempat. Contoh penggunaan relasi ORD, misalnya untuk menyatakan word
graph “dari permukaan sampai dasar”, yaitu:
Gambar 8 Contoh penggunaan relasi ORD.
7. Relasi PAR Attribute
Relasi PAR digunakan untuk menyatakan bahwa sesuatu mempunyai sifat sesuatu yang
lain. Hal ini dapat dilihat pada contoh “baju biru”. Kata biru merupakan warna dari baju,
atau dengan kata lain biru adalah attribute dari baju. Frasa “baju biru” dapat dinyatakan
dengan knowledge graph sebagai berikut:
Gambar 9 Contoh penggunaan relasi PAR.
8. Relasi SKO Skolem
Dua buah token dalam teori knowledge graph
dihubungkan dengan relasi SKO, jika informasi token yang satu bergantung pada
token yang lain. Menurut Berg 1993, relasi
SKO dalam teori knowledge graph menyatakan informasi yang bergantung dan
mampu menggambarkan kuantifikasi. Relasi ini digunakan dalam logika predikat yang
memuat
existential quantifiers maupun
universal quantifiers . Perhatikan pernyataan
2
, ,
x N
y N
x y
∀ ∈ ∃ ∈
=
yang memuat
universal quantifiers . Pada pernyataan
tersebut pemilihan y bergantung pada x, dan word graph
-nya dapat dinyatakan sebagai berikut:
Gambar 10 Contoh penggunaan relasi SKO. Empat frame relationships yang dimaksud
dalam ontologi word graph adalah: 1
Focusing on a situation: FPAR 2
Negation of a situation: NEGPAR 3
Possibility of a situation: POSPAR 4
Necessity of a situation: NECPAR Jika suatu graf merepresentasikan suatu
pernyataan, p: “Hari hujan”, yang dinyatakan dengan frame. Negasi dari p dinyatakan
dengan graf yang sama dan diberi frame dengan relasi NEGPAR, sedangkan modal
preposisi dinyatakan dengan graf yang sama dan diberi frame dengan relasi POSPAR atau
NECPAR Zhang 2002. Untuk lebih jelasnya lihat gambar berikut:
Gambar 11 Contoh penggunaan frame FPAR a, NEGPAR b, POSPAR c,
dan NECPAR d. Gambar tersebut secara berurutan
menunjukkan graf dari pernyataan bahwa a hari ini hujan
, b tidak benar bahwa hari ini hujan
, c mungkin hari ini hujan, dan d seharusnya hari ini hujan
.
Ontology Focus F
Ontologi F digunakan untuk menunjukkan focus
dari suatu graf Hoede Nurdiati 2008a. Penggunaan ontologi ini, misalnya
untuk menyatakan word graph “banjir melanda kampung” yang dapat dinyatakan
sebagai berikut:
Gambar 12 Contoh penggunaan ontologi F.
2.8 Chunk Indicator
Chunk merupakan potongan kalimat atau
potongan ucapan pada waktu seseorang berbicara. Menurut Rusiyamti 2008 chunk
indicator yang digunakan untuk menganalisis
teks berbahasa Indonesia dengan teori knowledge graph
antara lain: 1.
Koma atau titik tanda baca Contoh: tanda titik ., tanda koma ,,
tanda titik dua :, tanda tanya ?, tanda seru , tanda kurung ….
2. Kata penunjuk dan kata penghubung
konjungsi, yaitu kata tugas yang menghubungkan dua klausa, kalimat, atau
paragraf. Contoh: dan, lagi, atau, maupun, apabila,
tetapi, kecuali, sebab, jika, kalau, bahwa, yakni, akan.
3. Kata kerja bantu, yaitu kata kerja yang
menduduki fungsi khusus terhadap sebuah kata kerja utama.
Contoh: harus, mesti, sanggup, mampu, boleh, bisa, ingin, mau, suka.
4. Kata depan preposisi, yaitu kata tugas
yang berfungsi sebagai unsur pembentuk frasa preposisional.
Contoh: di, ke, dari, hingga, mulai, serta, karena, sebab, oleh, bagi, guna, terhadap.
5. Lompatan jump, yaitu kata berurutan
yang tidak dapat digolongkan dalam satu chunk
. 6.
Kata-kata dalam logika logic word Contoh penggunaan chunk indicator pada
kalimat yang berbunyi “Gelombang tsunami berbeda dengan gelombang yang dibangkitkan
oleh angin.” Pemotongan kalimat chunking tersebut adalah sebagai berikut:
“Gelombang tsunami |
5
berbeda |
2
dengan |
4
gelombang |
5
yang |
4
dibangkitkan |
5
oleh|
4
angin. |
1
”
III METODOLOGI PENELITIAN
Pada bab ini dibahas beberapa tahapan yang dilakukan dalam penelitian ini.
1. Studi Kepustakaan Dokumen Berbahasa Indonesia
Kegiatan ini dilakukan untuk mengumpulkan dokumen yang dibutuhkan
dalam penelitian, yaitu tiga buah dokumen berbahasa Indonesia bertema ketahanan
pangan, dan satu dokumen berbeda yang akan digunakan sebagai bahan uji.
2. Penentuan Kata Benda sebagai Konsep
Kata benda dipilih dari setiap teks berbahasa Indonesia berdasarkan ciri-cirinya.
Kemudian kata benda yang telah dipilih dihitung kemunculannya dan dikelompokkan
berdasarkan kesamaan makna kata atau bentuk kata umumnya.
Kata benda yang telah dikelompokkan dan disusun berdasarkan kemunculannya akan
dipilih sebagai konsep. Tetapi tidak seluruh kata benda akan digunakan sebagai konsep,
melainkan hanya kata benda yang kemunculannya pada teks minimal sama
dengan threshold yang ditentukan. Threshold digunakan untuk membatasi banyaknya
konsep yang akan digunakan dalam analisis. Threshold
dapat ditentukan sesuai dengan kebutuhan.
3. Pembuatan Graf
Kata benda yang telah ditentukan sebagai konsep akan diberi label dan digunakan
sebagai verteks untuk membuat graf berarah sesuai dengan hubungan antarverteks yang
terjadi pada setiap kalimat berdasarkan metode knowledge graph.
4. Analisis Graf
Pada tahap ini akan dilakukan suatu analisis pada setiap teks dengan
membandingkan keseluruhan graf yang terbentuk pada setiap kalimat dan
mempertimbangkan hubungan yang terjadi antarverteks yang ada untuk menentukan
keterkaitan antargraf.
5. Menentukan Aturan
Pada tahap ini akan ditentukan aturan yang digunakan untuk meringkas sebuah teks
berbahasa Indonesia. Setiap langkah dalam aturan dibuat berdasarkan hasil penelitian
pada tiga teks awal.
6. Pengujian Aturan
Selanjutnya aturan yang telah ditentukan harus diuji pada teks lainnya untuk
menentukan kelayakan dari aturan yang ada.
IV PEMBAHASAN
4.1 Studi Kepustakaan Dokumen Berbahasa Indonesia
Dari hasil studi kepustakaan dokumen berbahasa Indonesia diperoleh 3 dokumen
dengan tema ketahanan pangan yang dipilih sebagai bahan dalam penelitian. Dokumen
tersebut diperoleh dari berbagai media elektronik internet. Ketiga dokumen tersebut
yaitu: 1.
Teks A: “Solidaritas Nasional Ketahanan Pangan” oleh: Martaja www.gizi.netcgi-
binberita. 2.
Teks B: “Politik Ketahanan Pangan Indonesia 1950-2005” oleh: Jonatan Lassa
id.shvoong.comhumanities. 3.
Teks C: “Mencermati Kebijakan Ketahanan Pangan” oleh: Gutomo Bayu
Aji jawabali.comblog. Teks dapat dilihat dalam Lampiran 1, 2,
dan 3.
4.2 Penentuan Kata Benda sebagai Konsep
Konsep yang digunakan dalam penelitian ini berupa kata benda. Kata benda yang
digunakan diambil dari setiap kalimat dengan mempertimbangkan makna kata dari struktur
kalimat yang terbentuk. Kata benda seperti kata ganti orang contoh: kami, mereka, saya,
dan nama orang contoh: Andi, Rika, Tuti tidak akan dipakai sebagai konsep. Jika
terdapat kata ganti orang atau nama orang, maka akan dilihat jabatan atau makna dari
kata tersebut. Kata benda yang terdapat dalam kalimat langsung, dan berada di dalam tanda
kurung … dan tanda petik “..” yang berarti penegasan atau informasi tambahan,
tidak diperhitungkan.
Dari sudut bentuk kata, semua kata yang mengandung morfem terikat imbuhan ke-an,
per-an, pe-, -an, misalnya perumahan, perbuatan, kecantikan, pelari, dan jembatan
dicalonkan sebagai kata benda Keraf 1991, sehingga kata yang memiliki morfem tersebut
akan digunakan sebagai kata benda.
Setiap kata benda dalam setiap dokumen dihitung kemunculannya, kemudian kata
benda yang telah didapat akan dikelompokkan berdasarkan kesamaan makna kata atau
sinonim, dan juga berdasarkan bentuk kata umumnya. Pengelompokan kata benda
berdasarkan sinonim dilakukan secara subjektif, karena mempertimbangkan makna
kata dalam bahasa Indonesia yang dapat diperluas atau dipersempit dalam kalimat.
Setelah dikelompokkan, kata benda diurutkan berdasarkan jumlah kemunculannya.
Proses penghitungan dan pengelompokan ini dilakukan pada setiap dokumen, dan
didapatkan data sebagai berikut:
Tabel 1 Daftar pengelompokan kata benda dan jumlah kemunculannya pada Teks A
Kata Total Kata Total
Kata Total
pangan, beras, gabah 41 jasa 2
konsumen 1
ketahanan 20 keamanan
2 konteks
1 masyarakat, keluarga, penduduk,
rumah tangga 18 kecukupan
2 lembaga swadaya
masyarakat 1
pemerintah, birokrat, legislatif 9
kesejahteraan 2
luar 1
harga 7
kesinambungan 2
manusia 1
jumlah, kuantitas, kebanyakan, rata-rata, tiga, Rp 100.000;
7 konsep, model
2 martabat
1 petani, kelompok tani
7 konsumsi
2 parameter
1 barang, stok, materi, unsur,
komponen 6
lembaga penelitian, perguruan tinggi
2 partisipasi 1
kebutuhan 6 lumbung
desa 2
pemanfaatan 1
kemiskinan 6
masalah, kasus 2
pemasar 1
ketersediaan 6
optimalisasi, pemantapan 2
pembentukan 1
nasional 6
pembinaan, penyuluhan 2
pemenuhan 1
kenaikan, peningkatan 5
anggota 1
Pendekatan 1
sistem, subsistem 5
bantuan tunai langsung 1
pendidikan 1
tingkat 5
busung lapar 1
penetapan 1
akses, aksesibilitas 4
demplot 1
pengaruhnya 1
BBM, bahan bakar minyak 4
depan 1
pengelola 1
daerah, wilayah, sektor 4
distribusi 1
pengelolaan 1
gerakan, aktivitas 4
Indonesia 1
pengusaha 1
kebijakan 4
informasi 1
peran 1
kerawanan 4
jeritan 1
perbandingan 1
basis, dasar 3
kedaulatan 1
pihak-pihak 1
jangka waktu, masagenerasi, 1 Oktober 2005
3 kelaparan
1 potensi
1 kualitas, manfaat
3 kemandirian
1 produk
1 penanganan, penanggulangan
3 kemungkinan
1 produksi
1 pendapatan 3
kepedulian 1
produsen 1
perluasan, pengembangan 3
keragaman 1
solidaritas 1
pertanian 3
kerja sama 1
sumber daya 1
program 3
kesehatan 1
swasembada 1
cadangan 2
kesempatan 1
titik berat 1
desa, pedesaan 2
kesuksesan 1
tokoh 1
ekonomi 2 komitmen
1 tujuan
1 eksistensi 2
komunitas 1
World Bank 1
gizi 2
kondisi 1
Tabel 2 Daftar pengelompokan kata benda dan jumlah kemunculannya pada Teks B
Kata Total Kata Total
Kata Total
beras, singkong, gandum, gula pasir, jagung, kedelai,
makanan, pangan 77
era, jaman, masa ke masa, masa, 1952, 1967, 300
tahun, akhir 1980, tahun 1984, tahun ke tahun
14 Pemerintah,
pemerintahan, presiden, Bulog, Badan
Urusan Logistik 12
Indonesia, Kalimantan, Maluku, Nusantara, Papua,
Timor 15 ketahanan
12 swasembada 12
Tabel 2 Daftar pengelompokan kata benda dan jumlah kemunculannya pada Teks B lanjutan
Kata Total Kata Total
Kata Total
harga 11 militer, TNI
2 konsumsi
1 tingkat, level
8 pejabat
2 kontrol
1 kebijakan
7 pembangunan
2 malnutrisi
1 keluarga, masyarakat, rakyat
5 penganekaragaman
2 management
1 nasional
5 PNS, pegawai negeri
2 menu
1 basis, dasar
4 politisasi
2 mitos
1 dua, 40, 60
4 revitalisasi
2 negara
1 kolonial
4 sumber
2 nilai tambah
1 pemenuhan, pencapaian,
pengadaan 4
tujuan, target 2
Order Baru 1
perdagangan 4
alat politik 1
orientasi 1
perkotaan, kota 4
bagian integral 1
panitia 1
pertanian 4
Belanda 1
paradoks 1
akses 3
beras tekad 1
pasar 1
daerah, sektor 3
bulanan 1
pendapatan 1
kaum 3
buruh 1
penggunaan 1
ketergantungan, kebutuhan 3
contoh 1
pengontrol 1
komoditas 3
dampak 1
penguatan 1
petani 3
dilema 1
pengutamaan 1
produksi 3
diskriminasi 1
perberasan 1
soal, persoalan 3
distribusi 1
pola 1
upaya 3
dunia 1
politik 1
agribisnis 2
globalisasi 1
Project Applied Nutrition Program
1 bahan
2 gudang
1 provinsi
1 barometer, Indikator
2 hasil
1 pulau
1 domestik
2 ilustrasi
1 Repelita 3 dan 4
1 ekonomi
2 impor
1 sejarah
1 fakta, peristiwa
2 istri
1 slogan
1 faktor penentu, penyebab
2 kabupaten
1 stabilisasi
1 global
2 kampanye
1 tempat
1 investasi
2 kelahiran
1 tuduhan
1 kelaparan
2 kemiskinan
1 urbanisasi
1 Malaysia
2 kerangka
1 mekanisme, cara
2 ketersediaan
1 Tabel 3 Daftar pengelompokan kata benda dan jumlah kemunculannya pada Teks C
Kata Total Kata Total
Kata Total
pangan, beras, padi 18
Pemerintah, Mentan, Menteri Pertanian, Presiden
13 nasional 8
pertanian, agraria 17 kekurangan, kelangkaan, krisis
9 modernisasi
6 lahan, lahan
gambut, lahan kering
15 jumlah, rata-rata, kisaran, 0,3
hektare, 3,1 juta ha, sejuta hektare, 1.000 dolar AS per ton,
500 dolar AS per ton 8 program
6
Tabel 3 Daftar pengelompokan kata benda dan jumlah kemunculannya pada Teks C lanjutan
Kata Total Kata Total
Kata Total
dunia, internasioal 5 perubahan, reformasi
2 liberalisasi 1
Indonesia, Kalimantan, Palangkaraya, dalam negeri,
negeri ini 5 petani
2 media cetak 1
ketahanan 5 pilihan
2 negara 1
produksi 5 political will
2 nonliberal 1
waktu, 1980-an, akhir 1960-an, akhir tahun, awal 1970-an
5 artikel 1 obat
1 daerah, sektor
4 AS 1 pembangunan
1 desa-desa, perdesaan
4 berita 1 pembukaan
1 harga
4 bidang 1 peningkatan
1 pemanfaatan, penggunaan
4 Bimas 1 perkebunan
1 perluasan
4 diferensiasi 1 persepsi
1 situasi
4 gelombang 1 perusahaan
1 bencana alam, banjir, kekeringan
3 global 1 pidato
1 bibit, bibit hibrida, bibit unggul
3 hasil 1 potensi
1 ide
3 iklim 1 proporsional
1 kelompok, kalangan
3 Inmas 1 proses
1 masyarakat, penduduk
3 intensifikasi 1 pupuk
1 respons, sikap
3 jalan 1 rasional
1 alih fungsi
2 kecukupan 1 rekayasa genetik
1 busung lapar
2 kehutanan 1 restrukturisasi
1 fasilitas
2 kejadian 1 revitalisasi
1 gizi buruk
2 kelaparan 1 silence tsunami
1 keberhasilan
2 kemungkinan 1 solusi
1 kebijakan, kearifan
2 ketimpangan 1 sosial
1 kecepatan, laju
2 keyakinan 1 stok
1 kegagalan
2 kombinasi 1 strategi
1 keterbatasan
2 konflik 1 swasembada
1 kredit
2 konteks 1 teknologi
1 optimalisasi
2 kunjungan 1 terobosan
1 penguasaan
2 level 1 tumpuan
1 persoalan
2 liberal 1 tuntutan
1
Terdapat beberapa kata dalam tabel yang bermakna kata sifat dalam kamus bahasa
Indonesia, tetapi dipergunakan sebagai kata benda dalam penelitian ini. Seperti kata
nasional dan internasional digunakan sebagai kata benda karena dalam beberapa
struktur kalimat, kata tersebut berperan sebagai kata benda, jika dihilangkan maka
akan menghilangkan beberapa makna kata yang menyertainya.
4.3 Penentuan Threshold