2. Proses komputasi yaitu proses
pengujian antara dokumen-dokumen yang sesuai dengan permintaan
informasi. 3. Koleksi dokumen corpus yaitu
kumpulan dokumen yang berbasis vektor, yang menjadi objek pencarian
dari sistem temu kembali informasi.
Salton 1989 dalam Kartika 2005
2.3.2 Stoplist
Stoplist merupakan kumpulan kata buang yang tidak akan digunakan sebagai
istilah indeks. Kata-kata buang tersebut merupakan kata-kata yang tidak memiliki
kemampuan dalam membedakan dokumen yang satu dengan yang lainnya. Misalnya
kata depan, kata sambung, dan lainnya. Tujuan pemakaian stoplist adalah
mengurangi banyaknya kata dalam suatu kalimat dengan membuang kata-kata yang
tidak perlu.
Yates Neto 1999 dalam Kartika 2005
2.4 Konsep
Konsep merupakan komponen terpenting dalam pemikiran manusia.
Konsep mampu menjadi prosedur dalam membentuk suatu pengertian dari khusus ke
umum atau bahkan sebaliknya.
Konsep terdiri dari kata benda dan kata kerja. Tiap frase kata benda yang terhubung
dengan kata kerja membentuk suatu relasi, sehingga hubungan itu disebut sebagai case.
Zhang Hoede 2002 dalam Hulliyah 2007
2.4 Graf dan Word Graph
2.5 Definisi 2.5.1 Graf
Suatu graf adalah pasangan terurut , V E
dengan V adalah himpunan berhingga dan takkosong dari elemen-elemen graf yang
disebut simpul node, vertex dan E adalah
himpunan pasangan takterurut dari simpul- simpul berbeda di V. Setiap
{ , } p q
E ∈ dengan
, p q
V ∈ disebut sisi
edge dan dikatakan menghubungkan simpul- simpul p dan q.
Foulds, 1992
Definisi 2.5.2 Word Graph
Word graph adalah konsep dan relasi yang direpresentasikan dalam bentuk graf.
Zhang Hoede 2002 dalam Hulliyah 2007
2.6 Knowledge Graph dan Analisis Teks
Definisi 2.6.1 Knowledge Graph
Knowledge graph adalah sebuah teks yang diekstrak yang merepresentasikan pengetahuan
dalam teks tersebut dan disajikan dalam bentuk graf untuk menjelaskan persepsi manusia dan
pembentukan informasi.
Zhang Hoede 2002 dalam Ikhwati 2002 Menurut Kramer 1996 dalam Ikhwati
2007 teori knowledge graph adalah suatu instrumen yang merepresentasikan struktur
terkonsep yang sudah tertentu. Dengan instrumen ini relasi-relasi antara suatu
rangkaian dapat diminimalisir dan dibatasi. Menurut Vries 1989 dalam Ikhwati 2007,
tujuan dari knowledge graph adalah secara sistematis mengekstrak relasi-relasi dari suatu
teks yang menerangkan tentang suatu subjek pada bidang tertentu untuk dituangkan dalam
suatu graf.
Definisi 2.6.2 Analisis Teks
Ekstraksi informasi dari teks disebut analisis teks.
Zhang Hoede 2002 dalam Ikhwati 2002
2.7 Relasi
Menurut teori
knowledge graph, relasi- relasi dasar yang digunakan dalam melakukan
analisis teks yaitu:
1. Relasi kausalitas causality
Dalam relasi causality cau selalu terdapat sebab dan akibat sehingga
sesuatu memengaruhi sesuatu yang lain. Relasi ini adalah hubungan yang paling
sering diungkapkan dalam metode- metode ilmiah terutama dalam
mendiagnosis sesuatu. Contoh kata yang menggunakan relasi cau yaitu: sebab,
karena, dan akibat.
2. Relasi yang bertautan subset
Relasi subset sub menggambarkan dua
rangkaian secara bertautan yaitu sesuatu merupakan bagian dari sesuatu yang
lain. Jika A sub B, maka dituliskan A
⊂ B. Contoh kata yang menggunakan
relasi sub yaitu: meliputi.
3. Relasi kesamaan
alikeness Relasi
alikeness ali digunakan bila
antara dua token terdapat elemen- elemen yang sama. Logika matematika
ali diformulasikan dengan: jika A ali B, maka A
B φ
∩ ≠ . Contoh kata yang
menggunakan relasi ali yaitu: adalah, merupakan, dan yaitu.
4. Relasi attributive
Relasi attributive par digunakan untuk
menjelaskan bahwa satu elemen berkaitan dan memiliki sifat elemen
lainnya. Contohnya: dan, dengan, dari, atau, yang, dan serta.
5. Relasi kesederajatan equality Relasi
equality equ digunakan untuk
menjelaskan konsep yang sederajat atau sama, mengekspresikan dua hal yang
identik. Logika matematika equ diformulasikan dengan: jika A equ B, maka
A=B.
Equ digunakan untuk
menghubungkan A dan B. 6.
Relasi perbedaan disparateness Relasi
disparateness dis digunakan untuk
menggambarkan bahwa antara 2 token tidak ada hubungannya. Logika matematika
dis diformulasikan dengan: jika A dis B, maka A
B φ
∩ = . 7.
Relasi yang berurutan ordering Hubungan relasi ordering
ord
menjelaskan bahwa 2 benda memiliki urutan satu sama lain. Umumnya urutan ini
berkaitan dengan waktu dan tempat, tetapi juga bisa digunakan untuk mengungkapkan
hubungan “” yang dikenal dalam matematika A B A lebih kecil daripada
B.
8. Relasi ketergantungan informasi skolen
Relasi skolen sko, bila konsep-konsep di atas tidak bisa digunakan dalam
menghubungkan hal-hal, diperlukan satu hal lagi hubungan yang disebut dengan
hubungan yang lebih mengacu pada hubungan sintaksis daripada semantik.
Relasi-relasi di atas disebut delapan tipe hubungan biner,
Kramer 1996 dalam Ikhwati 2007
III METODE PENELITIAN
Pada bab ini akan dibahas mengenai beberapa tahapan yang dilakukan dalam
penelitian ini. Tahapan-tahapan tersebut terdiri atas:
1. studi literatur awal
2. perancangan algoritme kalimat efektif
3. perancangan algoritme word graph
4. pengujian rancangan algoritme kalimat
efektif dan algoritme word graph. Keempat tahapan di atas akan dijelaskan
sebagai berikut: 1. Studi literatur awal
Studi literatur awal dilakukan untuk mengumpulkan bahan pustaka yang
relevan dengan topik penelitian ini seperti contoh-contoh kalimat yang
terdapat di media cetak seperti koran, majalah, buku, dan karya ilmiah
mengenai knowledge graph serta buku panduan.
2. Perancangan algoritme kalimat efektif Hal-hal yang diperlukan dalam
merancang algoritme kalimat efektif yang pertama adalah mengumpulkan
berbagai contoh kalimat berbahasa Indonesia. Kata demi kata yang terdapat
dalam kalimat tersebut kemudian dianalisis satu persatu. Pada saat
dianalisis, koleksi dokumen corpus digunakan untuk memeriksa kata-kata
yang terdapat dalam kalimat tersebut terdapat dalam daftar kata atau tidak.
Kemudian, dilakukan proses pemeriksaan untuk menguji setiap kata
yang terdapat dalam kalimat berbahasa Indonesia. Jika terdapat kata-kata yang
dapat dihilangkan dalam kalimat berbahasa Indonesia tetapi tidak
mengubah arti kalimat sebenarnya maka kata-kata tersebut dapat dihilangkan.
Kata-kata yang dihilangkan kemudian dimasukkan ke dalam daftar kata buang
yang dinamakan stoplist. Kedua, ambil contoh kalimat berbahasa Indonesia
dengan tipe yang sama dari contoh kalimat sebelumnya. Jika terdapat kata-
kata yang dapat dihilangkan dalam kalimat berbahasa Indonesia tetapi tidak
mengubah arti kalimat sebenarnya maka kata-kata tersebut dapat dihilangkan.
Dari kedua analisis di atas dapat dibuat aturan kalimat efektif. Ketiga, melakukan
analisis kalimat berbahasa Indonesia secara berulang-ulang dengan tipe kalimat
berbahasa Indonesia yang berbeda sehingga didapatkan aturan kalimat efektif yang
baku dan berlaku umum. Dari aturan kalimat efektif maka dibuat algoritme dan
flowchartnya. Flowchart hasil rancangan algoritme pembentukan kalimat efektif
dapat dilihat pada Gambar 1.
3. Perancangan algoritme
word graph Langkah
pertama yang
dilakukan dalam
merancang algoritme word graph adalah mempelajari jenis-jenis relasi dasar dalam
knowledge graph yang akan diterapkan pada kalimat efektif sehingga dapat
meminimalisir kata-kata yang terdapat dalam kalimat efektif tersebut. Setelah
jenis-jenis relasi dipelajari, kemudian ditentukan jenis relasi yang akan digunakan
dalam karya ilmiah ini. Relasi-relasi yang telah ditentukan akan dimasukkan ke dalam
kalimat efektif sehingga terdapat relasi antarkonsep dalam kalimat efektif tersebut.
Flowchart
hasil rancangan algoritme pembentukan word graph dapat dilihat
pada Gambar 2. 4. Pengujian rancangan algoritme kalimat
efektif dan algoritme word graph Untuk menguji keakuratan rancangan
algoritme kalimat efektif, maka dibuat contoh-contoh kalimat berbahasa Indonesia
yang diubah menjadi kalimat efektif berdasarkan rancangan algoritme kalimat
efektif.
Gambar 1 Flowchart metode penelitian pembentukan kalimat efektif.
Gambar 2 Flowchart metode penelitian pembentukan word graph.
IV HASIL DAN PEMBAHASAN
Pada bab ini diberikan pembahasan dari metode penelitian di bab tiga.
4.1 Studi Literatur Awal