I PENDAHULUAN
1.1 Latar Belakang
Sebuah bahan bacaan atau dokumen yang berupa wacana biasanya terdiri atas beberapa
lembar yang isinya berupa rincian tentang bahan bacaan. Bahan bacaan tersebut
memiliki poin-poin penting di dalamnya. Poin ini disebut juga intisari bacaan. Untuk
mencari intisari bahan bacaan, si pembaca harus membaca keseluruhan bahan bacaan
dan baru dapat menyimpulkan intisari bacaan.
Menurut Febriatmoko
2011, cara
termudah untuk mendapatkan informasi dari sebuah teks adalah dengan meringkasnya,
karena membaca sebuah ringkasan tidak memerlukan
waktu lama
dibandingkan dengan membaca keseluruhan teks. Salah
satu cara meringkas adalah text summary, yaitu mengambil kalimat utama atau sebagian
kalimat dari setiap paragraf di dalam teks.
Dalam penelitian Febriatmoko 2011, dokumen berbahasa Indonesia dianalisis
menggunakan teori knowledge graph secara menyeluruh pada setiap dokumen untuk
mendapatkan abstraksi teks, tetapi ada beberapa kekurangan atau kelemahan pada
aturannya, seperti: pengubahan dokumen berbahasa Indonesia secara utuh ke dalam
bentuk word graph membutuhkan waktu komputasi lebih lama daripada melakukan
pengubahan dokumen berbahasa Indonesia dalam bentuk ringkasan atau hanya berisi
poin-poin penting saja, serta penggunaan relasi PAR yang bersifat subjektif yang
berdampak sukarnya mengimplementasikan aturan yang dibuat ke dalam aturan
komputasi yang terstruktur.
Dengan maksud yang sama dengan Febriatmoko 2011, penelitian ini juga
bertujuan mendapatkan informasi penting dari suatu teks, tetapi dengan menggunakan
cara yang berbeda. Cara yang digunakan, yaitu: mengombinasikan teknik pengambilan
kalimat tertentu dalam suatu teks dengan teori knowledge graph. Dengan cara ini, hasil
abstraksi teks
diharapkan dapat
merepresentasikan keseluruhan teks yang tidak berbeda jauh dengan cara Febriatmoko
2011. Knowledge graph adalah suatu metode
baru di bidang natural language processing NLP. NLP adalah suatu proses yang
menggunakan sistem spesial yang digunakan untuk mengekspresikan ide-ide manusia
dalam bentuk informasi menjadi suatu pengetahuan Wulandari 2008.
Metode knowledge graph pertama kali muncul pada tahun 1982 di Belanda. Pada
awal pengembangan teori knowledge graph dalam
aspek linguistik,
teori ini
dikembangkan dalam bahasa Inggris. Dengan demikian untuk bahasa Indonesia diperlukan
suatu proses penstrukturan yang disesuaikan dengan bahasa Indonesia Hoede Nurdiati
2008b.
Selanjutnya ringkasan
didefinisikan sebagai sebuah teks yang dihasilkan dari satu
atau lebih teks, mengandung informasi penting dari teks sumber dan panjangnya
tidak lebih dari setengah teks sumber. Sistem peringkas teks otomatis diberi masukan
berupa teks, dan melakukan peringkasan, lalu menghasilkan keluaran berupa teks yang
lebih
singkat dari
teks sumber
dan mengandung informasi utama dari teks
sumber Hovy 2001. Kombinasi dari text summary
dan teori
knowledge graph
diharapkan menghasilkan teknik pembuatan abstraksi teks yang baik dan efisien.
1.2 Tujuan
Tujuan penelitian ini adalah membuat suatu aturan untuk memperoleh abstraksi dari
suatu teks yang merupakan implementasi dalam penggunaan teori knowledge graph.
1.3 Ruang Lingkup
Ruang lingkup penelitian ini adalah teks berbahasa Indonesia dengan tema ketahanan
pangan yang diambil dari berbagai sumber.
II TINJAUAN PUSTAKA
2.1 Kelas Kata
Semantik Yunani : Semanein = berarti, bermaksud; semanticos = makna adalah
cabang ilmu bahasa yang meneliti makna dalam bahasa tertentu, mencari asal-usul dan
perkembangan arti
kata, mempelajari
klasifikasi perubahan kata-kata atau bentuk bahasa
sebagai indikator
dalam perkembangan bahasa.
Berdasarkan struktur bentuk, morfologi, dan kelompok kata frasaologi, kata dibagi
menjadi 4 kelas besar, yaitu:
1
kelas kata benda yang memuat subkelas
kata ganti dan kata sandang, 2
kelas kata kerja,
3
kelas kata sifat yang memuat subkelas
kata bilangan, 4
kelas kata tugas yang memuat subkelas
kata depan, kata sambung, kata keterangan Keraf 1982.
2.1.1 Kata Benda KB
Kata benda adalah semua kata yang dapat diterangkan atau diperluas dengan yang +
kata sifat. Contohnya: perumahan, kesadaran, dan udara adalah kata benda karena dapat
diperluas dengan “yang + kata sifat” yaitu: perumahan yang baru, kesadaran yang tinggi
dan udara yang rendah. Kata ganti dimasukkan dalam subkelas
kata benda karena kata-kata ini dipakai untuk mengganti kata benda atau yang dibendakan
pada posisi tertentu. Menurut sifat dan fungsinya, kata ganti dibedakan menjadi: kata
ganti orang, kata ganti milik, kata ganti penunjuk, kata ganti penghubung, kata ganti
penanya, dan kata ganti taktentu. Kata ganti milik
adalah kata
yang berfungsi
menggantikan orang
dalam kedudukan
sebagai pemilik. Oleh karena itu dalam bahasa Indonesia sebenarnya tidak ada kata
ganti milik. Kata sandang dimasukkan ke dalam
subkelas kata benda karena kata-kata ini merupakan bagian dari kata benda yang
berfungsi sebagai penentu kata benda tersebut. Contoh kata sandang adalah kata
yang. Mula-mula kata yang berfungsi sebagai penentu. Fungsi yang lain sebagai alat
nominalisasi yaitu kata yang bersama-sama kata lainnya menduduki posisi kata benda
Keraf 1982. 2.2 Kata Majemuk
Pengertian kata
majemuk atau
kompositum dapat diungkapkan sebagai berikut: gabungan dari dua kata atau lebih
yang membentuk satu kesatuan arti. Contoh: sapu tangan, matahari, orang tua, kaki
tangan, dan lainnya Keraf 1982. 2.3 Frasa
Frasa adalah suatu konstruksi yang terdiri atas dua kata atau lebih yang membentuk
suatu kesatuan.
Kesatuan itu
dapat menimbulkan suatu makna baru yang
sebelumnya tidak ada. Misalnya dalam frasa rumah ayah muncul makna baru yang
menyatakan milik Keraf 1982.
2.3.1 Frasa Nominal Benda
Frasa nominal FN adalah frasa yang dapat mengisi fungsi subjek atau objek di
dalam klausa. Menurut strukturnya dapat dibedakan adanya frasa nominal koordinatif
FNK dan frasa nominal subordinatif FNS Chaer 2009.
2.3.1.1 Penyusunan Frasa Nominal
Koordinatif FNK
Frasa nominal koordinatif dapat disusun dari:
i dua buah kata berkategori nomina yang
merupakan pasangan
dari antonim
relasional. Contoh: -
ayah ibu -
pembeli penjual -
guru murid ii
dua buah kata berkategori nomina yang merupakan anggota dari suatu medan
makna. Contoh: -
sawah ladang -
kampung halaman -
cabe bawang Chaer 2009.
2.3.1.2 Penyusunan Frasa Nominal Subordinatif FNS
Frasa nominal subordinatif dapat disusun dari:
i Nomina + Nomina N + N
ii Nomina + Verba N + V
iii Nomina + Adjektiva N + A
iv Nomina + Adverbia N + Adv
v Adverbia + Nomina Adv + N
vi Nomina + Numeralia N + Num
vii Numeralia + Nomina Num + N
viii Nomina + Demonstratifa N + Dem
Chaer 2009. 2.4 Struktur Kalimat Sederhana
Menurut strukturnya adanya subjek, predikat, objek, dan keterangan sebuah
kalimat sederhana dalam bahasa Indonesia memiliki pola, sebagai berikut:
1 Subjek + Predikat, atau S+P
2 Subjek + Predikat + Objek, atau S+P+O
3 Subjek + Predikat + Objek + Keterangan,
atau S+P+O+K 4
Subjek + Predikat + Objek + Objek, atau S+P+O+O
Chaer 2006. 2.4.1 Pola Dasar Kalimat Sederhana
Pola dasar kalimat sederhana adalah tinjauan terhadap fungsi subjek dan predikat
kalimat berdasarkan
kelas kata
yang menduduki kedua fungsi tersebut. Pola dasar
kalimat bahasa Indonesia adalah sebagai berikut:
1 Kata Frasa Benda + Kata Frasa Benda
2 Kata Frasa Benda + Kata Frasa Kerja
3 Kata Frasa Benda + Kata Frasa Sifat
4 Kata Frasa Benda + Kata Frasa Kerja +
Kata Frasa Benda Chaer 2006.
2.5 Wacana
Wacana sebagai satuan tertinggi dalam hierarki sintaksis mempunyai pengertian
yang lengkap atau utuh, dan dibangun oleh kalimat atau kalimat-kalimat. Artinya, sebuah
wacana mungkin hanya terdiri dari sebuah kalimat, mungkin juga terdiri dari sejumlah
kalimat.
Dalam pembentukan sebuah wacana yang utuh, kalimat itu dipadukan oleh alat-alat
pemanduan yang dapat berupa unsur leksikal, unsur gramatikal, ataupun unsur semantik
Chaer 2009. 2.6 Paragraf
Satuan wacana terkecil yang dibangun oleh
sejumlah kalimat
adalah sebuah
paragraf. Setiap paragraf memiliki sebuah pikiran pokok, dan sejumlah pikiran penjelas
mengenai pikiran pokok. Pikiran pokok direalisasikan dalam sebuah kalimat utama
atau kalimat pokok, yang selalu berwujud kalimat
sedangkan pikiran
penjelas direalisasikan
dalam kalimat-kalimat
penjelas, yang wujudnya berupa kalimat terikat Chaer 2009.
Menurut Aryamdini 2003, kalimat pokok memiliki ciri sebagai berikut:
a mengandung permasalahan yang potensial
untuk diuraikan lebih lanjut, b
merupakan kalimat lengkap yang dapat berdiri sendiri,
c mempunyai arti yang jelas tanpa
dihubungkan dengan kalimat lain, d
dapat dibentuk tanpa kata sambung atau kata transisi.
Sedangkan ciri kalimat penjelas sebagai berikut:
a sering merupakan kalimat yang tidak dapat
berdiri sendiri, b
arti kalimatnya baru jelas setelah dihubungkan dengan kalimat lain dalam
satu alinea, c
pembentukannya sering memerlukan bantuan
kata sambung
atau frasa
penghubung atau kata transisi, d
isinya berupa rincian, keterangan, contoh, dan data lain yang bersifat mendukung
kalimat topik.
2.6.1 Macam Paragraf
Nero 2007 mendefinisikan paragraf berdasarkan letak kalimat pokoknya menjadi
4 macam: 1
Kalimat pokok berada di kalimat pertama paragraf deduksi.
2 Kalimat pokok berada di kalimat terakhir
paragraf induksi. 3
Kalimat pokok berada di kalimat pertama dan terakhir paragraf deduksi-induksi.
4 Kalimat pokok berada di semua kalimat
paragraf deskriptif-naratif.
2.7 Peringkasan Teks Otomatis
Ringkasan teks dapat disajikan dalam dua bentuk umum yaitu ekstrak dan abstrak
Hovy 2001. Ekstrak merupakan ringkasan teks yang hanya mengambil bagian-bagian
tulisan yang dianggap penting saja tanpa mengubah kalimat-kalimat yang terambil,
sedangkan abstrak merupakan ringkasan teks yang
menyajikan ringkasan
dengan menciptakan kalimat-kalimat baru yang
merepresentasikan teks sumber dalam bentuk lain.
Suatu ringkasan dapat bersifat general, yaitu ringkasan yang mengambil sebanyak
mungkin informasi penting di dalam teks yang dapat menggambarkan keseluruhan
teks. Selain itu ringkasan dapat bersifat query-oriented dengan kueri pengguna dan
menampilkannya dalam bentuk ringkasan Zikra 2009.
Panjang ringkasan
biasanya diukur
berdasarkan persentase dari panjang teks sumber, misalnya 10, 20, atau 50 dari
panjang teks sumber. Selain itu panjang ringkasan dapat juga diukur berdasarkan
banyaknya
kata, misalnya
ditentukan ringkasan sepanjang 100 kata Zikra 2009.
2.8 Hubungan Antarmakna a
Hipernimi dan Hiponimi
Hipernimi adalah kata-kata atau ungkapan yang maknanya melingkupi makna kata-kata
atau ungkapan lain. Misalnya kata burung maknanya melingkupi makna kata-kata
seperti merpati, kepodang, tekukur, perkutut dan cucakrawa.
Hiponimi adalah kata-kata atau ungkapan yang maknanya termasuk di dalam makna
kata atau ungkapan lain. Umpamanya makna kata merpati termasuk di dalam makna kata
burung dan makna kata kuning termasuk di dalam makna kata warna Chaer 2006.
b Sinonimi
Sinonimi adalah dua buah kata atau lebih yang
maknanya kurang
lebih sama,
contohnya kata mati sinonim dengan kata meninggal Chaer 2006.
2.9 Graf