Rekayasa memahami teks menggunakan metode knowledge graph

REKAYASA MEMAHAMI TEKS MENGGUNAKAN
METODE KNOWLEDGE GRAPH

KHODIJAH HULLIYAH

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2007

SURAT PERNYATAAN
Saya menyatakan dengan sebenar-benarnya bahwa segala pernyataan dalam
tesis berjudul: Rekayasa Memahami Teks Menggunakan Metode Knowledge

Graph, merupakan gagasan atau hasil penelitian tesis saya sendiri, dengan arahan
Komisi Pembimbing, kecuali yang dengan jelas ditunjukkan rujukannya. Tesis ini
belum pernah diajukan untuk memperoleh gelar atau pencapaian akademik
lainnya pada program sejenis ini di perguruan tinggi lain. Semua data dan
informasi yang digunakan telah dinyatakan secara jelas dan dapat diperiksa
kebenarannya.


Jakarta, Januari 2007
Yang Membuat Pernyataan
Khodijah Hulliyah

ABSTRACT

One of the advanced characteristics of computer in the future is its ability
to verbally interact with its users by using daily natural language instead of
sophisticated language.The question then wheather the advance computer
technology in the future deals with such expectation. Regarding the swift
development of software technology, it could possible be. The determining
component is its capacity to process language whose software element attribute to
language verbally. Computing world acknowledges two languages; natural
languages and programming languages.
The technology Natural Language Processing (NLP) is a technology
enable natural language processing commonly delivered by human. The system
generally processes input and output in text format. One of NLP applications is
text summarization which is a system that summarizes or concludes hundred texts
having similar things and produces a new knowledge. The system turns out to be
important, especially if someone envisages a problem and aims to take a

conclusion from several available texts. Knowledge Graph (KG) is a new method
in this NLP application.
Hence, researcher conducts the research and uses KG method in reading a
text to achieve a new summarized knowledge which is beneficial to decision
making. In this research, researcher undertakes case study by analyzing text
compilation dealing with National Education System (Sisdiknas). Concept and
relation of the available text compilation is identified. The identification result is
then formatted to textual summarized graph from previously rary graph. The
textual summarized graph still requires process to get combined graph. After
having the sequential fase, simplified graph will be accomplished. The simplified
graph is the final result to acquire new information in comprehensing the text
compilation.

Keyword: Knowledge Graph, Combined Graph, Simplified Graph, Text Analysis,
Concept, Relationship, Text Transfornzation, Concept Identification
and Link Iintegration.

RINGKASAN

KHODIJAH HULLIYAH Rekayasa Memahami Teks Menggunakan Metode

Knowledge Graph. Dibimbing oleh JULIO ADISANTOSO dan SRI NURDIATI
Salah satu ciri komputer masa depan adalah kemampuan untuk
berinteraksi secara lisan dengan pemakainya menggunakan ucapan sehari-hari
dengan bahasa alami (natural language) bukan bahasa yang rumit. Pertanyaannya
sekarang adalah mampukah teknologi komputer masa depan melakukan ha1
tersebut? Jika melihat perkembangan teknologi perangkat lunak yang pesat, ha1
tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan
mengolah bahasa, dimana sebagian komponen perangkat lunaknya akan bersifat
language dependent, yaitu perangkat lunak yang melakukan pemrosesan bahasa
alami secara lisan. Dalam ilmu komputer kita mengenal ada dua bahasa, yaitu:
bahasa alami dan bahasa buatan.
.

Teknologi Natural Language Processing (NLP) adalah teknologi yang

memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang
biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan
keluaran berupa bahasa tuiisan (teks). Salah satu dari aplikasi NLP adalah Text
Summarization, yaitu suatu sistem yang akan melakukan ringkasan atau
kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi

sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini
menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah
persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang
ada. Metode Knowledge Graph (KG), adalah suatu metode baru dari aplikasi NLP
ini.
Untuk itu, penulis melakukan penelitian untuk mengunakan metode KG
dalam membaca suatu teks guna mendapatkan sebuah ringkasan (knowledge) baru
yang dapat dijadikan pengetahuan dalam rangka pengambilan keputusan. Pada
penelitian ini, penulis melakukan studi kasus dengan cara menganalisis kumpulan
teks yang berhubungan dengan Sistem Pendidikan Nasional (Sisdiknas).
Kumpulan teks yang ada diidentifikasi konsep dan relasinya. Hasil
identifikasi tersebut kemudian diformat dalam bentuk graf menjadi teks graf. Teks

graf yang dihasilkan masih harus diproses kembali untuk mendapatkan combined
graph. Melalui tahapan selanjutnya, akan dihasilkan simplified graph. Graf yang

sederhana tersebut merupakan hasil akhir untuk mendapatkan sebuah informasi
baru dalam memahami kumpulan teks tersebut di atas.
Kata Kunci:


Knowledge Graph, Combined Grsph, Simpl~Jed Graph, analisis

teks, konsep,
integrasi link.

relasi, transformasi teks, identifikasi teks dan

REKAYASA MEMAHAMI TEKS MENGGUNAKAN
METODE KNOWLEDGE GRAPH

KHODIJAH HULLIYAH G651024054

Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR

2007

Judul Tesis

: Rekayasa Melnahalni Teks dengan Menggunakan Metode

Nama
NRP
Program Studi

: Khodijah Hulliyah
: G65 1024054
: Ilmu Komputer

Knowledge Graph

Disetujili,
Komisi Penlbimbing

r. Ir. Sri Nurdiati, M.Sc

Anggota

Diketahui.

Tanggal Ujian : 3 1 Januari 2007

Tanggal Lulus :

v

1 4 FEB 2007

PRAKATA

Alhamdulillahirabbil'alamin, puji dan syukur penulis panjatkan kepada
Allah SWT atas hidayah dan karuniaNya sehingga penulis dapat menyelesaikan
tugas penelitian

ini dengan judul


"Rekayasa

Mernahami Teks Dengan

Meiiggunakan Metode Knowledge Graph ". Penelitian ini dibuat untuk memenuhi
salali satu persyaratan penyelesaian studi pada Progratii Studi Iltiiu Kornputer,
Sekolah Pascasarjana lnstitut Pertanian Bogor (I PB).
Penelitian ini dapat terselesaikan atas bantuan dari berbagai pihak. Oleh
karena itu penulis ingin menyampaikan teritna kasih yang sebesar-besarnya
kepada:

I . Bapak Ir. Julio Adisantoso, M.Kom dan Ibu Dr. Ir. Sri Nurdiati, MSc, selaku
dosen pembimbing yang telah banyak menibimbing dan tiiengarahkan
penulis.

2. Bapak Dr. Sugi Guritman, selaku Ketua Prograin Studi Illnu IComputer,
Sekolah Pascasarjana IPB.

3. Ayahanda dan Ibunda (Almh.) yang tak lienti-henti ~nemberikando'a dan
kasih sayangnya.

4. Suami beserta anak-anak tercinta yang me~iiberikandorongan, niotivasi dan

semangat kepada penulis untuk menyelesaikan tesis.
5 . Indah Mathar dan Nana yang banyak tne~iibantu daiam ~iienyelesaika~i
penelitian ini.

6. Rekan-rakan mahasiswa yang telah banyak meniberikan masukan dan saran.
7. Semua pihak yang membantu namun tiak dapat penulis sebutkan satu-persatu.
Berbagai usaha telah penulis upayakan guna terselesaikannya tugas
penelitian ini dengan baik, namun penulis menyadari akan kekurangan dan
keterbatasan penulis. Oleh karena itu kritik dan saran yang membangun penulis
harapkan. Akhir kata penulis berharap semoga tesis ini bermanfaat.

Bogor, Januari 2007
Penulis

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta, pada tanggal 2 April 1973 sebagai anak ketiga
dari ayah bernama Drs. HM. Nadjid Muchtar, MA dan ibu Asiyah Thohir (Almh).

Penulis menempuh pendidikan MI Pembangunan Ciputat, SMP Puteri Khadijah
Surabaya, SMUN 34 Pondok Labu Jakarta dan kuliah di Universitas Gunadarma
Depok Jurusan Manajemen Informatika (S-1) lulus tahun 1996. Setelah kuliah,
penulis menjadi tenaga pengajar pada STMIK Husni Thamrin pada tahun 20002001. Pada tahun 2001 hingga sekarang penulis bergabung sebagai Pegawai
Negeri Sipil (PNS) yang ditempatkan di Universitas Islam Negeri (UIN) Syarif
Hidayatullah Jakarta, sebagai Tenaga Pengajar pada Fakultas Sains dan
Teknologi. Penulis memulai pendidikan pascasarjana di Program Studi llmu
Komputer, Sekolah Pascasarjana IPB pada tahun 2002.

vii

DAFTAR IS1
DAFTAR TABEL.......................................................................................... x
DAFTAR GAMBAR ...................................................................................... xi
DAFTAR LAMPIRAN ...............................................................xiv

BAB I PENDAHULUAN
I .1 . Latar Belakang Masalah ................................................................ 1

1.2. Identifikasi Masalah.......................................................................4

1.3. Batasan Masalah ........................................................................... 4

....................................................................... 4
1.5. Tujuan dan Kegunaan Penelitian ................................................... 5 .
1.6. Metodologi Penelitian ................................................................... 5
1.4. Perumusan Masalah

1.7. Sistematika Penelitian ....................................................................
6
BAB I1 TINJAUAN PUSTAKA
2.1. Pendahuluan ................................................................................. 7
2.2. Graf ..............................................................................................8
2.3. Knowledge Graph ........................................................................
8
2.3.1. Deskripsi Formal dari Knowledge Graph .........................10
2.3.2. Aspek-aspek Ontologi........................................................ 10
2.3.3. Natural Language Processing (NLP) ........................16

.....16

2.3.4. Semantik dalam Natural Language Processing (NLP)

2.4. Struktural Parsing ....................................................................... 18
2.5. Bagaimana Mengubah Teks Menggunakan
Metode Knowledge Graph ..........................................................18
2.5.1. Analisis Teks ..................................................................... 19
2.5.2. Latar Belakang Pengetahuan..............................................20
2.6. Contoh Transformasi Teks ke dalam Knowledge Graph ............21

viii

BAB I11 METODOLOGI PENELITIAN
3.1. Kerangka Pe~nikiran.................................................................... 23
3.2. Analisis Knowledge Graph..........................................................25
3.2.1. Transfor~nasiTeks ke dalarn Knowledge Graph................26
3.2.2. Penyederhanaan Graf pada Knowledge Graph..................27
3.3. lnterpretasi Knowledge Graph.................................................... 30
3.3.1 . Integrasi Link ...................................................................... 30
3.3.2. Identifikasi Konsep-konsep Penting ........................ 31
3.3.3. Klasifikasi Konsep .............................................................. 32
3.3.4. Pengujian Konsep ............................................................... 32
3.4. Penyusunan Piranti Lunak ............................................. 34
3.4.1. Metode Penyusunan Piranti Lunak ............................34
3.4.2. Bahan dan Alat

...................................................
34

BAB IV ANALISIS: STUD1 KASUS
4.1. Pendahuluan ..................................................................................
36
4.2. Analisis: Translasi Teks Siste~nPendidikan Nasional ..................38
4.3. Combined Gruph dari Sistem Pendidikan Nasional ......................
51
4.4. Penyederhanaan Graf (Siwiplified Graph)..................................... 52
4.4.1. Proses Penyederhanaan Graf I
(Siniplified Gruph I)............................................................ 52
4.4.2. Proses Penyederhanaan Graf I 1
(Sinlpllfied Gruph II) ........................................................... 53
4.5. Hasil dari lnterpretasi Knowledge Gruph .................................... 54
Sistem Pendidikan Nasional .........................................................54
4.5.1. Identifikasi Konsep yang Penting .......................................
54

..

4.5.2. Penguj an Neighhour ..........................................................
55

BAB V PERANCANGAN DAN
IMPLEMENTASI SISTEM .......................................61
5.1. Perancangan Siste~n.................................................... 61
5.1 .1 . Perancangan Proses ...........................................61

.......................................63
5.1.3. Perancangan Menu .............................................63
5.2. Implementasi Sistem ..................................................65
5.2.1. Dokumen Masukan ............................................65
5.2.2. Modul Program ................................................66
5.3. Hasil .....................................................................69
5.1.2. Perancangan Basis Data

BAB VI SIMPULAN DAN SARAN
5.1 . Simpulan......................................................................................
69

5.2. Saran............................................................................................
70

DAFTAR TABEL

Halaman
1.

Dua Belas Notasi Dasar pada Graf Ontologi menurut Kant ............. 10

2.

Simbol Relasi Dasar dari Metode KG ................................................. 13

3.

Serial Link Integration .....................................................

30

4.

Tabel yang Digunakan untuk Pengujian Neighbour

32

6.

...........................
Contoh Pengujian Neighbour .....................................................
Bahan dan Alat .................................................................................

7.

Teks-teks Pendidikan yang akan diimplementasikan ke dalam teks

41

5.

....................................................................................................
8 . Hasil Relasi dar Knowledge Gaph ......................................................

33
35

graf

59

DAFTAR GAMBAR
Halarnan
Ekspresi Semantik ............................................................ 17

.................................
Terjemahan ke KG ...........................................................
Kerangka Pemikiran Analisis Teks dengan Metode KG ...............
Metodologi Analisis Teks dengan Metode KG ...................................
Proses Analisis Teks ............................................................................
Proses Penyederhanaan Graf ...............................................................
Contoh sebuah Konstruksi (construct) ................................................
Serial Link Integration ........................................................................
Parellel Link Integration .....................................................................
Neighbours ..........................................................................................
Contoh Pengujian Neighbours ............................................................
Subgraf Tabel no .1 ..............................................................................
Combined Graph dari Subgraf Tabel no . 1 .........................................
Subgraf Tabel no.2 ..............................................................................
Subgraf Tabel no.3 ..............................................................................
Combined Graph dari Subgraf Tabel no.1 ..........................................
Subgraf Tabel no.4 ..............................................................................
Subgraf Tabel 110.5 ..............................................................................
Subgraf Tabel no.6 ..............................................................................
Subgraf Tabel no.7 ..............................................................................
Subgraf Tabel no.8 ..............................................................................
Subgraf Tabel no.9 ..............................................................................
Text Representation menggunakan frame

Subgraf Tabel no .10.............................................................................

20
21
23
25
26
27
28
30
30
32
33
46
46
46
47
47
47
48
48
48
49
49
49

Subgraf Tabel no .11 ............................................................................. 50
Subgraf Tabel no.12 ............................................................................. 50
Subgraf Tabel no.13............................................................................. 50
xii

Subgraf Tabel no .1 I ...............................................................
Subgraf Tabel no . 12...............................................................
Subgraf Tabel no .13 ...............................................................
Subgraf Tabel no . 14...............................................................

Combined Graph Sisdiknas ......................................................
Simpl$ed Graph 1 Sisdiknas ....................................................
Simplified Graph I1 Sisdiknas ...................................................
I"' Degree Neighbours Sisdiknas ...............................................

.

I"' 2'ld dan 3rd~ e ~ r Neighbours
ee
Sisdiknas ...............................
Terjemahan Tabel 17 ke dalam bentuk Graf ..................................
Diagram alur Perancangan Proses ..............................................
Perancangan Menu

...............................................................

...............................................................
Tainpilan menu manajemen teks ................................................
Urutan Proses Tiga Modul

....................................
Tampilan Vertex-Detail .........................................................
Tabel Count VertexDetail ........................................................
Hasil Akl~irlinpleinentasi Sistein berupa Graf ...............................
Tampilan Memasukkan data vertex-detuil

BAB I
PENDAHULUAN
1.

LATAR BELAKANG MASALAH

llmu komputer memiliki dua komponen utama; pertama, model dan
gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk
perancangan sistem komputasi yang meliputi piranti keras dan piranti lunak,
khususnya penerapan rancangan dan teori. Secara teoritis ilmu komputer diawali
dari sejumlah disiplin ilmu yang berbeda, ahli biologi mempelajari neural
network, ahli elektro mengembangkan switching sebagai alat untuk mendesain
piranti keras, ahli matematika bekerja berdasarkan logika, dan ahli bahasa
menyelidiki bahasa untuk natural language [Utdirartatmo, 200 11.
Dalam teknologi komputer, telah dikenal ada teknologi komputer analog
dan teknologi komputer digital. Saat ini teknologi komputer telah mampu
memanfaatkan keduanya sehingga menjadi teknologi handal, yang mampu
menggantikan sebagian pekerjaan manusia atau bahkan pekerjaan yang tidak
mampu dilakukan oleh manusia. Dalam konteks penggolongan generasi komputer,
diprediksi akan lahir komputer berbasis masa depan yang memiliki memori tanpa
batas, kompatibel dengan teknologi lain, memiliki kemampuan analisis dan
teknis yang luar biasa yang memberikan kemudahan dan kenyamanan bagi
manusia.
Salah satu ciri komputer masa depan adalah memiliki kemampuan
berinteraksi secara lisan dengan pemakainya dengan menggunakan ucapan seharihari dalam bahasa alami (natural language), bukan bahasa yang rumit'.
Pertanyaannya sekarang, mampukah teknologi komputer masa depan melakukan
ha1 tersebut? Jika melihat perkembangan teknologi piranti lunak yang pesat, ha1
tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan
mengolah bahasa, dimana sebagian koinponen piranti lunaknya akan bersifat
language dependent, yaitu piranti lunak yang melakukan pemrosesan bahasa

I

2004

Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus

alami secara lisan. Dalam ilmu komputer dikenal ada dua bahasa, yaitu bahasa
alami2 dan bahasa buatan3.
Chomsky adalah orang yang pertama kali merepresentasikan bahasa dalam
rangkaian simbol. Chomsky berhasil memperlihatkan bahwa bahasa apapun dapat
direpresentasikan dalam bentuk yang universal. Pemikiran Chomsky yang
merepresentasikan bahasa sebagai kumpulan simbol-simbol dan aturan yang
mengatur susunan simbol-simbol tersebut telah membuka peluang untuk
melakukan pemrosesan bahasa secara simbolik dengan teknologi komputer,
sehingga melahirkan bidang ilmu Natural Language Processing (NLP) dalam
cabang ilmu bahasa komputasi (computational linguistic) [Arman, 20041.
Teknologi NLP adalah teknologi yang memungkinkan untuk melakukan
berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia.
Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tulisan
(teks). Beberapa di antara berbagai kategori aplikasi NLP adalah [Arman, 20041:
1. Natural Language Translator, yaitu translator dari bahasa alami ke

bahasa alami lainnya.
2. Translator dari bahasa alami ke bahasa buatan, yaitu translator yang
mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan
yang dilakukan oleh mesin atau komputer.

3. Text Summarization, yaitu sistem yang dapat "membuat ringkasan" halha1 yang penting dari suatu wacana yang diberikan.

Text Summarization menarik untuk diteliti lebih lanjut karena sangat
berkaitan erat dengan proses analisis teks dalam ilmu computational linguistic.

Text Summerization adalah suatu sistern yang akan melakukan ringkasan atau
kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi
sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini
menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah
persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang
ada.
2

Bahasa alami adalah suatu bentuk representasi dari pesan yang ingin dikomunikasikan
antar manusia
Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan
tertentu misalnya bahasa pemodelan atau bahasa pemrograman tertentu.

Menganalisis teks menjadi sebuah persoalan tersendiri bagi setiap orang,
karena bisa jadi masing-masing akan memiliki pemahaman sendiri terhadap teks
tersebut, sehingga bisa jadi akan muncul ambiguitashalam mengartikan kalimat5.
Suatu masalah akan mudah dipahami apabila kita mampu membahasakannya
dalam format redaksi penulisan dengan bahasa jelas. Penulisan redaksi tentu akan
bersifat subjektif tergantung dari masing-masing orang yang menulis dan
menganalisisnya. Titik pandang masalah sangat subjektif bagi setiap individu,
orang yang berbeda akan menggambarkan pengalaman yang ditemui ke dalam
konsep yang berbeda pula [Zhang, 20021. Dengan kata lain, konsep dengan bahasa
yang sama bisa jadi akan diinterpretasikan dengan arti yang berbeda-beda. Hal ini
akan melahirkan beragam konsep, yang kemudian akan direlasikan dengan
masalah-masalah yang ada, sehingga melahirkan sebuah pengetahuan. Menurut
Suriasumantri [1995], pengetahuan mampu dikembangkan manusia disebabkan
dua ha1 yaitu, manusia mempunyai bahasa yang mampu mengkomunikasikan
informasi, dan jalan pikiran yang melatarbelakangi informasi tersebut

.

Pada beberapa penelitian sebelumnya banyak dibahas tentang ekstraksi
teks, antara lain bagaimana melakukan pemangkasan teks yang panjang dalam
satu paragraf sehingga menjadi lebih sederhana, tanpa menghilangkan informasi
yang terkandung di dalamnya. Hasil penelitian ini sangat berarti bagi pengguna
dalam memahami sebuah teks. Jika ingin merangkum banyak teks yang ada
sehingga menjadi sederhana dan mudah dipahami perlu dilakukan penelitian
lanjutan.
Metode Knowledge Graph (KG) adalah suatu metode baru dari NLP yang
merupakan sebuah tinjauan untuk menggambarkan atau menjelaskan bahasa
dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang
pengetahuannya sehingga menghasilkan sebuah pengetahuan baru [Zhang,2002].
Pengembangan metode KG yang akan diteliti lebih lanjut apakah dia mampu
menjawab persoalan-persoalan tersebut.
Untuk itu, penulis melakukan penelitian untuk menganalisis dan
mengembangkan metode KG dalam membaca suatu teks untuk mendapatkan
4

keraguan dalam mengartikansesuatu, memiliki kemiripan arti
Dalam natural language, terdapat beberapa kasus yang memiliki ambiguitas dalam arti sebuah kalimat (Lei
Zhang, h.37)

sebuah ringkasan (knowledge) baru yang dapat dijadikan pengetahuan dalam
rangka pengambilan keputusan. Pada penelitian ini, penulis melakukan studi kasus
dengan cara menganalisis teks-teks yang berhubungan dengan Sistem Pendidikan
Nasional (Sisdiknas). Hal ini karena pendidikan sangat erat kaitannya dengan
sumber daya manusia (SDM). SDM yang berkualitas menjadi suatu yang harus
dimiliki sebagai aset negara jika tidak ingin menjadi tamu di rumah sendiri di era
globalisasi ini.
1.2. IDENTIFIKASI MASALAH
Metode

KG

bertujuan

agar

mampu

merepresentasikan

seluruh

pengetahuan yang dapat diekspresikan ke dalam bahasa alami. Dalam ha1 ini
penulis akan mengumpulkan data berupa teks yang berkaitan dengan Sisdiknas.
Teks-teks tersebut memiliki konsep-konsep dan link yang merelasikan antar
konsep. Proses mendapatkan konsep dan relasi dilakukan dengan cara
menganalisis teks sesuai aturan main dari metode tersebut. Dengan cara demikian
akan didapat sebuah graf sederhana yang mampu memberikan informasi penting
yang menjadi sebuah pengetahuan.

1.3. BATASAN MASALAH
Batasan masalah dari penelitian ini adalah menganalisis teks-teks yang
dipilih6 yang berkaitan dengan sisdiknas di Indonesia untuk menentukan konsep
dan link-nya, menentukan relasi yang sesuai dengan aturan (rule) dari metode KG
dalam bentuk graf berarah. Kemudian graf tersebut diolah menjadi combined
graph sampai didapatkan graf yang sederhana (simpl?fiedgraph).
1.4. PERUMUSAN MASALAH

Penelitian ini melakukan pemetaan masalah pendidikan yang ada di
Indonesia dengan menjelaskan relasi antara konsep dengan simbol dan obyeknya
(triangle meaning), serta menguraikan keterkaitan konsep tersebut dengan konsep
lainnya. Dengan kata lain, pemetaan tersebut memposisikan sebuah konsep umum
(generale concepts) untuk dianalisis menjadi beberapa konsep turunan (sub
Teks-teks yang dipilih terlampir

concepts) dalam satu bagian, serta menunjukkan hubungan konsep turunan
tersebut dengan konsep turunan yang lain dalam bagian lain sehingga muncul
pengertian baru.
Perumusan masalah pada penelitian adalah:
1. Dapatkah metode KG digunakan sebagai instrumen untuk menganalisis

bagaimana memahami banyak teks sehingga mampu memberikan suatu
informasi baru?
2. Bagaimana metode KG mampu menyederhanakan masalah yang ada dalam
bentuk graf?
1.5. TUJUAN DAN MANFAAT PENELITIAN
Tujuan penelitian ini adalah mengembangkan metode KG sebagai
instrumen yang berdayaguna untuk menganalisis teks-teks dengan tema yang
sama dalam jumlah yang besar yang kemudian hasilnya menjadi sederhana dalam
bentuk graf sehingga dapat dijadikan sebagai pengetahuan baru.
Kegunaan penelitian ini adalah dapat mensosialisasikan dan menunjukkan
bahwa metode KG mampu memberikan tambahan pengetahuan sebagai informasi
penting yang dapat digunakan dalam pengambilan keputusan.

1.6. METODOLOGI PENELITIAN
Metodologi penelitian ini meliputi:
1. Identifikasi Konsep (concept ident~jcation).
Pada tahapan ini dilakukan pengumpulan data yang berupa teks dengan
mengkombinasikan konsep-konsep yang mirip, kemudian konsep-konsep
tersebut didefinisikan untuk mencari konsep mana yang lebih penting dan
layak untuk dipilih.
2.

Integrasi Link (link integration).
Tahapan ini digunakan untuk melakukan penambahan atau penggandaan
relasi-relasi dari hasil kombinasi dari hubungan antar konsep.

3. Penggabungan graf (Merging of Graphs).

Tahapan ini melakukan pemetaan masalah-masalah dengan acuan aturan yang
ada pada metode KG. Apabila ada dua atau lebih kombinasi graf, dapat
dijadikan satu graf baru (combined graph).
4. Pembagian graf menjadi subgraph.
Tahapan ini melakukan penajaman dari graf yang paling penting untuk
mendapatkan graf yang sederhana (simplified graph) agar lebih mudah untuk
diinterpretasikan.
1.7. SISTEMATIKA PENULISAN
Tulisan sebagai dokumentasi pada penelitian in dibagi ke dalam beberapa
bagian dengan susunan sebagai berikut:
Bab I, membahas hal-ha1 yang menjadi latar belakang sampai pada tujuan
yang diinginkan pada penelitian ini.
Bab 11, berisi landasan teori yang menjadi rujukan untuk melakukan
penelitian ini.
Bab 111, menguraikan metodologi yang dilakukan dalam penelitian ini.
Bab IV, berisi tentang pembahasan proses analisis teks, studi kasus
analisis teks dengan tema sistem pendidikan nasional.
Bab

V,

berisi

tentang

penjabaran

perancangan

sistem

dan

implementasinya.
Bab V1, berisi kesimpulan dari penelitian yang merupakan jawaban dari
hasil pembahasan dan saran.

BAB I1
TINJAUAN PUSTAKA
2.1. PENDAHULUAN

Metode KG merupakan suatu metode barn dalarn bidang ilmu NLP. Penelitian
tentang metode ini diawali oleh para peneliti yang berbasis di Universitas Twente dan
Universitas Groningen sekitar lima belas tahun yang lalu, yang kemudian dilanjutkan
oleh Prof.dr.C.Hoede (Universitas Twente) dengan fokus utamanya adalah aplikasi
knowledge graph untuk menganalisis sebuah teks [Blok, 19971.

KG adalah salah satu dari beberapa metode yang ada dalam Knowledge
~e~resentation'(KR), dimana KR ini merupakan topik sentral dari

Artijkial

Intelligence (AI), salah satu cabang ilmu komputer yang digunakan untuk

memecahkan masalah berbasis pengetahuan [Zhang, 20021.
Tujuan KG digunakan untuk merepresentasikan sebuah pengetahuan yang
dapat diekspresikan dalam bahasa natural [Kramer, 19961. KG dibangun untuk
menjelaskan persepsi manusia ke dalam model semantik dan pemrosesan informasi
[Zhang, 20021. Semantik lebih dekat dengan logika dan merupakan bagian dari
formal language (sama dengan natural language) dan sebagai langkah besar untuk

memahami semantik menjadi

"know it and know why" dan bagaimana

menggambarkan "thinking and linking something " [Hoede, 20051.
Metode KG melakukan ekstraksi sebuah teks dimana hasil yang dikeluarkan
dalam bentuk graf berarah2 [Hoede, 20051. Ekstraksi teks ini melalui proses analisis
teks bahasa dengan menitikberatkan lebih pada aspek semantik3 daripada sintaksis4.
I

Sebuah jalurlpath atau berupa graf yang berisi inforrnasi-informasi yang telah disepakati
'~ipakaiuntuk rnelukiskan ketergantungan antara atribut-atribut
'~ilsafat bahasa lebih berkenaan dengan arti kata atau arti bahasa (semantic). Salliyanti: Peranan
Filsafat Bahasa Dalam Pengembangan llmu Bahasa, 2004, USU Repository 2006
4

Sintaksis diartikan sebagai bidang ilmu bahasa yang mengkaji bentuk, struktur, dan binaan atau
konstruksi ayat. la juga ialah kajian mengenai hukum atau rumus tatabahasa yang mendasari kaedah
penggabungan dan penyusunan perkataan atau kelompok perkataan untuk membentuk ayat dalam bahasa.

Teori ini secara luas biasa diaplikasikan pada information sistem modeling,
natural language processing, information retrieval dan case base reasoning serta
pembelajaran teknik dan kasus-kasus yang berhubungan dengan logika [Sowa,
19921.
KG merupakan sebuah instrumen untuk mewakili Conceptual Structure
tertentu dan dengan KG, relasi-relasi antar suatu rangkaian dapat diminimalisir
karena sifatnya terbatas [Kramer, 19961.
2.2. GRAF
Suatu graf yang dinotasikan dengan G

=

(V , E) adalah himpunan vertex-

vertex V dan himpunan edge E, dimana E dibentuk dari VxV. Dengan kata lain graf
adalah kumpulan vertex dan edge yang menghubungkan vertex tersebut [Cormen,
et.al, 19901. Ditinjau dari arahnya, graf dibagi menjadi dua yaitu, graf berarah
(directed graph) dan graf tidak berarah (undirected graph).
Dalam graf, lintasan (path) adalah urutan vertex ata edge yang dibentuk
untuk bergerak dari satu vertex ke vertex yang lain. Pada graf berarah, arah sisi atau
urutan ikut diperhatikan. Titik akhir dari suatu lintasan akan menjadi titik awal dari
lintasan berikutnya [Utdirartatmo, 200 11.
2.3. KNOWLEDGE GRAPH
Metode KG muncul pada tahun 1982 di Departement of Sosiology di
Groningen dan the Departemen of Applied Mathematics di Enschede, Belanda,
yang kemudian penelitian ini diteruskan oleh Prof.dr.C.Hoede pada Universitas
Twente. KG berupa graf berarah yang terdiri dari vertex untuk merepresentasikan
konsep dan link untuk merepresentasikan relasi antar konsep dengan himpunan
relasi yang terbatas [Lehmann, 19921. Tujuan metode KG adalah untuk
mendapatkan gambaran berbagai informasi atau pengetahuan dengan konsep dan
relasi-relasi yang saling terhubung, sehingga dapat dibuat sebuah tafsiran baru dan
diperoleh pengetahuan lebih lanjut untuk ditarik sebuah kesimpulan. KG diperoleh
dengan cara mengkombinasikan berbagai variasi graf dengan berbagai teks yang

berbeda ke dalam sebuah graf yang terintegrasi, yang mampu menggambarkan
konsep dan relasinya dengan cara disederhanakan atau diekstrak kembali. Informasi
yang diekstrak dari teksnya disebut text analysis [Vries, 19891.
Ada beberapa prinsip penting dalam KG untuk dibangun ke dalam bentuk
tipe relasi yang sederhana, yaitu:
Relasi par, digunakan untuk menyatakan bahwa konsep A sama dengan
konsep B
Relasi sub, digunakan untuk menyatakan bahwa konsep A adalah contoh
dari atau bagian dari konsep B
Relasi cau, digunakan untuk menyatakan bahwa ada hubungan sebab akibat
dari konsep A dengan konsep B. Relasi cau ini ada yang cau+ (korelasi
positif) ada juga cau- (korelasi negatif)
Salah satu konsep yang paling penting dari teori KG ini adalah kemiripan.
Jika ada dua persepsi yang mirip, bisa digunakan satu simbol yang sama untuk
mengekspresikan persepsi yang mirip itu, atau kedua ha1 itu dapat merupakan
bagian dari simbol tersebut sehingga membentuk sebuah struktur. Struktur-struktur
dari gabungan simbol itu disebutframe.

2.3.1. DISKRIPSI FORMAL DARI KNOWLEDGE GRAPH
Pada prinsipnya komposisi dari KG terdiri dari Concept (tokens dan types)
dan relationship (binary dan multivariate relution) [Zhang, 20021. Dalam KG,
seluruh ha1 mengenai konsep memiliki keterkaitan dengan ha1 lainnya.
Konsep dalam graf dinyatakan sebagai node, dan konsep bisa sebagai token
(simbol, tanda, karakteristik, dsb) atau sebagai type. Token adalah konsep yang
dipahami oleh seseorang menurut cara pandangnya masing-masing sehingga token
bersifat sangat subjektif. Di sisi lain, type adalah konsep yang berupa informasi
urnum dan bersifat objektif karena merupakan suatu kesepakatan yang dibuat
sebelumnya.

Dalam KG kita bisa membedakan tiga tanda:
3. ~ i m b o l u menandakan adanya sebuah konsep dan dapat disejajarkan

dengan fungsi argument dalam logika.
4. Tipe digunakan untuk memberikan nama pada sebuah konsep yang umum.
5. Instantiation

(pemberian contoh) digunakan untuk

menambahkan

model/contoh untuk memperjelas sebuah konsep.
Untuk memahami pengertian suatu pernyataan, perlu dibedakan
relasi-relasi

yang

mungkin

terjadi

antara

beberapa

konsep.

Relasi

mengekspresikan hubungan yang memiliki sebab akibat dan efek dari hubungan
keduanya, atau yang saling mempengaruhi satu dengan yang lainnya. Relasi
dasar dari KG adalah relasi cause (cau) yang merelasikan tipe yang memiliki
daya tarik di dalamnya
2.3.2. ASPEK-ASPEK ONTOLOGI
Ontologi adalah untuk menggambarkan beberapa konsep dan relasi-relasi
di antaranya, dengan maksud untuk memberikan definisi yang cukup terhadap ideide yang dituangkan dengan komputer untuk merepresentasikan ide-ide tersebut
dan logikanya.

Ontologi Kant
Menurut Kant [Zhang, 20021, ada 12 notasi dasar pada graph ontology
yang difokuskan pada aspek logika, yaitu:
Tabel 1. Dua Belas Notasi IDasar pada graph ontology menurut Kant

QUANTITY

QUALITY

RELATION

MODALITY

Unity

Reality

Inherence

Possibility

Plurality

Negation

Causality

Existence

Totality

Limitation

Commonness

Necessity

Peirce

Konsep Peirce menggambarkan logika dengan graph, yang disebut

existential graph. Ide awalnya dengan menyederhanakan notasi and (A) dan

notasi negation

untuk dua .frume atau type yang berbeda. Konsep Peirce

(
1
)

sebenarnya bisa dijadikan "guide" untuk ontologi Kant, dengan memperkenalkan
tiga notasi, yaitu: konsep Jirstness, secondness dan thirdness. Menurut Sowa
[1994], definisi Pierce tersebut dapat dijelaskan sebagai berikut:

Firstness

: konsepsi yang ada secara independen atas sesuatu yang lain

Secondness

: konsepsi relatif ada atas dasar reaksi dengan sesuatu

Thidness

: konsepsi mediasi, konsep satu dengan yang lain memiliki

hubungan
Hubungan ontologi Kant dan Peirce, menimbulkan suatu triple atas metode
KG, yaitu:

concept, foreground

knowledge dan background knowledge.

Berdasarkan kedua ontologi tersebut di atas, maka didapat ontologi yang dijadikan
simbol dalam merode KG, yang terdiri dari delapan type binary relationship dan
empat type n-ary relationship (yang juga disebutframe relationship).
Delapan binary type relationship adalah:
1 . Equality

: equ

2. Subset relationship

: sub

3. Similarityofsets, alikeness

: ali

4. Disparateness

: dis

5. Causality

: cau

6 . Ordering

: ord

7. Attribution

: par

8. Informational dependency

: sko

Empat n-ary relationship terdiri dari:
1. Focusing on a situation

: fpar

2. Negation of a situation

: negpar

3. Possibility of a situation

: pospar

4. Necessity of a situation

: negpar

Berikut penjelasan dari ontologi yang digunakan sebagai simbol dalam
metode KG adalah sebagai berikut:

1. Relasi Kausalitas (CAUSALITY)
Dalam relasi causalitas (cau) selalu terdapat sebab dan akibat dimana sesuatu
mempengaruhi sesuatu yang lain. Relasi ini adalah hubungan yang paling sering
diungkapkan dalam metode-metode ilmiah terutama dalam mendiagnosis
sesuatu.
2. Relasi Kesederajatan (EQUALITY)
Relasi equality (equ) digunakan untuk menjelaskan konsep yang sederajatlsama,
mengekspresikan 2 ha1 yang identik. Logika matematika equ diformulasikan
dengan: jika A equ B, maka A = B. Equ digunakan untuk menghubungkan A &
B.

3. Relasi yang Bertautan (SUBSET)
Relasi subset (sub) bila digambarkan adalah sebagai berikut, bila ada dua token
yang mengekspresikan dua rangkaian secara bertautan yaitu sesuatu yang
merupakan bagian dari sesuatu yang lain, maka dapat digunakan relasi sub.
logika matematika sub diformulasikan dengan: jika A sub B, maka A C B
Dalarn relasi, ada 2 tipe relasi sub yang penting diingat:
a. Konsep A lebih luas daripada konsep B, contoh: "Mamalia sub kucing"
b. Konsep B lebih luas daripada konsep A, contoh: "Ekor sub Kucing
Relasi sub pada dasarnya adalah menggambarkan satu bagian dari sebuah
konsep yang utuh sehingga fungsi sub berkaitan erat dengan konsep
kepemilikan, artinya A adalah milik atau bagian dari B.
4. Relasi KemiripanIKesamaan (ALIKENESS)
Relasi alikeness (ali) digunakan bila antara dua token terdapat elemen-elemen
yang sama. Logika matematika ali diformulasikan dengan: jika A ali B, maka A
nB#O.
5. Relasi PerbedaanIKetidaksamaan (DISPARATENESS)

+ DIS

Relasi dispareteness (dis) digunakan untuk menggambarkan bahwa antara 2
token tidak ada hubungannya. Logika matematika dis diformulasikan dengan:
jika A dis B, maka A fl B = 0.

6. Relasi Attributive
Relasi attributive (par) ini digunakan untuk menjelaskan bahwa satu elemen
berkaitan dan memiliki sifat elemen lainnya.
7.

Relasi yang berurutan (ORDERING)
Hubungan relasi ordering (ord) menjelaskan bahwa 2 benda memiliki urutan
satu sama lain. Umumnya urutan ini berkaitan dengan waktu dan tempat, tapi
juga bisa digunakan untuk mengungkapkan hubungan "