Ontologi Populasi Teks Tentang Penyakit Tanaman

i

ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN
TESIS

SUFIANTO
117038084

PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2014

Universitas Sumatera Utara

i

ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN

TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika

SUFIANTO
117038084

PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2014

Universitas Sumatera Utara

ii

PERSETUJUAN

Judul Tesis


: Ontologi Populasi Teks Tentang Penyakit Tanaman

Kategori

: Tesis

Nama Mahasiswa

: Sufianto

NIM

: 117038084

Program Studi

: Magister Teknik Informatika

Fakultas


: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA

Pembimbing 2

Pembimbing 1

(Dr. Mahyuddin K.M. Nasution, M.IT)

(Prof. Dr. Tulus,M.Si)

Diketahui/disetujui oleh:
Program Studi S2 Teknik Informatika
Ketua,

(Prof. Dr. Muhammad Zarlis)
NIP. 19570701 198601 1003

Universitas Sumatera Utara


iii

PERNYATAAN ORIGINALITAS

ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 3 Januari 2014

Sufianto
117038084

Universitas Sumatera Utara

iv


PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini:
Nama

: Sufianto

NIM

: 117038084

Program Studi

: Teknik Informatika

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:

ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/ atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 3 Januari 2014

Sufianto
117038084

Universitas Sumatera Utara

v

Telah diuji pada

Tanggal : 3 Januari 2014

PANITIA PENGUJI TESIS
Ketua

: Prof. Dr. Tulus, M.Si.

Anggota

: 1. Dr. Mahyuddin K.M. Nasution, M.IT.
2. Prof. Dr. Herman Mawengkang.
3. Prof. Dr. Muhammad Zarlis.
4. Dr. Syahril Efendi, M.IT.

Universitas Sumatera Utara

vi

RIWAYAT HIDUP


DATA PRIBADI
Nama Lengkap (berikut gelar): Ir. Sufianto
Tempat dan Tanggal Lahir

: Medan, 10 Nopember 1957

Alamat Rumah

: Jl. Kemenyan II No. 1 Blok-H, P. Simalingkar
Kel. Mangga, Kec. Medan Tuntungan – 20141

Telepon/HP

: (061)-8362916 – 0852.6201.2345

Email

: sufi_anto@yahoo.com

Instansi Tempat Bekerja


: Sekolah Tinggi Teknik Harapan

Alamt Kantor

: Jl. HM Joni No.70 Medan

DATA PENDIDIKAN
SD

: SD Neg 2/36 Medan

TAMAT: tahun 1971

SLTP : SMP Tamansiswa Medan,

TAMAT: tahun 1974

SLTA : SMA Tamansiswa Medan,


TAMAT: tahun 1977

S1

: FP UISU

TAMAT: tahun 1986

S2

: Teknik Informatika USU

TAMAT: tahun 2014

Universitas Sumatera Utara

vii

KATA PENGANTAR


Syukur Alhamdulillah penulis persembahkan kepada Tuhan Yang Maha Suci dan
Maha Tinggi atas segala limpahan Rahmat dan Hidayah-Nya, sehingga penulis dapat
mempersiapkan tesis Magister (S2) Teknik Informatika sebagaimana yang telah
ditentukan. Tesis ini berjudul: “ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN”. Tesis ini merupakan persyaratan tugas akhir pada
Program Studi Magister (S2) Teknik Informatika - Fakultas Ilmu Komputer dan
Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU).
Pada kesempatan ini, penulis menyampaikan ucapan terimakasih dan
penghargaan yang setinggi-tingginya kepada:
1. Prof. Dr. Syahril Pasaribu, DTM&H, M.Sc.(CTM), Sp.A(K), selaku Rektor
Universitas Sumatera Utara.
2. Prof. Dr. Muhammad Zarlis, selaku Dekan Fakultas Ilmu Komputer dan
Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU),
yang juga sebagai Ketua Program Studi Magister (S2) Teknik Informatika di
Fasilkom-TI USU.
3. Prof. Dr. Tulus, M.Si., selaku dosen pembimbing I dalam penyelesaian tesis
ini, penulis mengucapkan terimakasih

yang setinggi-tingginya atas

bimbingan yang telah diberikan kepada penulis. Semoga Allah SWT,
memberikan balasan yang tiada batasnya.
4. Dr. Mahyuddin K.M. Nasution, M.IT, selaku dosen pembimbing II dalam
penyelesaian tesis ini, penulis menyampaikan terimakasih yang tiada
berhingga. Semoga pula Allah SWT, memberikan kemurahanNya kepada
beliau dalam segala hal.
5. Seluruh Staf Pengajar pada Fasilkom-TI USU yang telah dengan sungguhsungguh berupaya memberikan ilmu dan pengetahuannya kepada penulis
selama mengikuti perkuliahan di Program Studi Magister (S2) Teknik
Informatika di Fasilkom-TI USU. Demikian pula kepada seluruh pegawai
administrasi di Program Studi Magister (S2) Teknik Informatika di
Fasilkom-TI USU yang telah memberikan bantuan dan pelayanan yang

Universitas Sumatera Utara

viii

sangat baik kepada penulis. Mudah-mudah Allah SWT memberikan ganjaran
yang berlipat ganda. Amin.
6. Kepada teman-teman sekelas di Kom-C angkatan 2011/2012 yang telah
demikian akrab, penulis mengucapkan terimakasih yang sebesar-besarnya
atas kerjasama yang diberikan kepada penulis. Mudah-mudahan keakraban
ini terus berlanjut.
7. Kepada istri dan keluargaku tercinta semua, yang senantiasa setia
memberikan spirit dalam menyelesaikan pendidikan di Program Studi
Magister

(S2)

Teknik

Informatika

di

Fasilkom-TI

USU,

penulis

mengucapkan terimakasih yang tiada berhingga. Semoga Allah SWT,
memberikan ganjaran yang berlipat ganda. Amin.
Demikian hal ini penulis sampaikan, semoga tesis ini bermanfaat kelak bagi kita
semua khususnya bagi penulis.

Medan, 3 Januari 2014
Penulis,

Sufianto

Universitas Sumatera Utara

ix

ABSTRAK

Populasi teks adalah sekumpulan teks atau kata yang mempunyai sifat yang sama dan
menjadi obyek konsep pengetahuan dan berperan sebagai inferensi. Ontologi
merupakan jenis metode pemodelan yang digunakan untuk menguraikan antara
hubungan kata dengan melibatkan penyusunan aturan hubungan dengan melibatkan
perlengkapan grafis yang dikenali sebagai TBox. Enam jenis dokumen yang memiliki
hubungan semantik dan rule baru berasal dari hubungan semantik awal. Studi ini
sangat membantu untuk memiliki latar belakang pengetahuan tentang domain sebelum
menemukan pola word. Dengan memetakan enam hubungan semantik dan aturanaturan (rule) untuk dokumen lainnya dalam corpus (teks) untuk mengekstrak
pengetahuan pada penyakit tanaman kakao yang relevan yang dilakukan secara
manual akan berkurang. Pendekatan pada penyakit busuk buah pada tanaman kakao
mempunyai word ke- 6 di dalam dokumen uji nilai indeks semantik web 0.09677419,
penyakit vascular streak dieback (VSD) pada tanaman kakao mempunyai word ke-8
di dalam dokumen uji nilai indeks semantik web 0.00428571, penyakit antraknosa pada
tanaman kakao mempunyai word ke-5 uji nilai indeks semantik web 0.0003139,
penyakit jamur upas pada tanaman kakao mempunyai word ke-6 uji nilai indeks
semantik web 0.00061798, penyakit busuk akar mempunyai word ke-6 uji nilai indeks
semantik web 0.99044586, sedangkan penyakit layu pentil buah word ke 217 uji nilai
indeks semantik web 0.05882353. Penelitian selanjutnya diharapkan jumlah kapasitas
pada sebuah dokumen uji dapat lebih besar di dalam pendekatan untuk uji dokumen
lainnya.

Kata kunci: Ontologi, Kakao, Penyakit, Tbox, Semantic Web

Universitas Sumatera Utara

x

ONTOLOGY POPULATION TEXT
OF PLANT DISEASE

ABSTRACT

The population is a set of text or text the word which has the same properties and
become the object of the concept of knowledge and serve as inference . Ontology is a
kind of modeling method is used to describe the relationship between words by
involving the preparation of equipment rules involving graphical relationships that are
recognized as TBox . Study domain is a plant cacao (chocolate) and diseases related to
it . Six types of documents that have semantic relations and the new rule is derived
from the initial semantic relationships. By mapping six semantic relationships and
rules (rule) to other documents in the corpus (text) to extract knowledge on cocoa
plant diseases relevant is done manually will be reduced . Approach to fruit rot disease
on cocoa crops have the 6th word in the test document semantic web index value
0.09677419 , vascular disease streak dieback (VSD) in cocoa plant has the 8th word in
the test document semantic web index value 0.00428571 , anthracnose disease the
cocoa plant has the 5th word test semantic web index value 0.0003139 , fungal
diseases in plants policeman cocoa - 6 has a word to test the semantic web index value
0.00061798 , word root rot has the 6th test semantic web index value 0.99044586 ,
whereas disease withered teat pieces to 217 word test semantic web index value
0.05882353 . Future studies are expected to total capacity on a test document can be
greater in the approach to test other documents

Kata kunci: Ontologi, Kakao, Penyakit, Tbox, Semantic Web

Universitas Sumatera Utara

xi

DAFTAR ISI

Halaman
HALAMAN JUDUL

i

PERSETUJUAN

ii

PERNYATAAN ORIGINALITAS

iii

PERSETUJUAN PUBLIKASI

iv

PANITIA PENGUJI

v

RIWAYAT HIDUP

vi

KATA PENGANTAR

vii

ABSTRAK

ix

ABSTRACT

x

DAFTAR ISI

xi

DAFTAR GAMBAR

xiii

DAFTAR TABEL

xiv

PENDAHULUAN

1

1.1

Latar Belakang

1

1.2

Rumusan Masalah

2

1.3

Tujuan Penelitian

3

1.4

Batasan Masalah/Ruang Lingkup Kajian

5

TINJAUAN PUSTAKA

6

Ontologi

6

2.1.1 TBox dan ABox

7

Sistem Pendukung Keputusan

8

BAB 1

BAB 2
2.1

2.2

Universitas Sumatera Utara

xii

2.3

Pemaknaan Teks

9

2.3.1 Korpus

9

2.3.2 Sampel dan Populasi teks

10

2.4

Text Mining

10

2.5

Recall dan Presisi

11

METODOLOGI PENELITIAN

12

3.1

Rancangan Penelitian

12

3.2

Analisis Ontologi Penyakit

15

3.2.1 Flowchat proses tokenizing

15

3.2.2 Flowchat pemotongan kata demi kata

16

3.2.3 Flowchat Mencari vocabulary kata

17

3.2.4 Pemilihan dokumen

21

3.2.5 Proses Tokenizing

21

3.2.6 Proses Filtering

22

3.2.7 Proses Stemming

22

3.2.8 Proses Analizing

22

Rule

23

HASIL DAN PEMBAHASAN

24

Indeks semantic web dari mesin pencarian yahoo

24

4.1.1 Indeks Populasi teks dengan kata “Penyakit”

24

4.1.2 Indeks Populasi teks dengan kata “busuk buah”

25

BAB 3

3.3
BAB 4
4.1

4.1.3 Indeks Populasi teks dengan kata “penyakit busuk buah pada
tanaman kakao”

26

4.1.4 Indeks Populasi teks dengan kata "vascular streak dieback"

26

4.1.5 Indeks Populasi teks dengan kata "penyakit vascular streak
dieback pada tanaman kakao"

27

4.1.6 Indeks Populasi teks dengan kata "busuk akar"

27

4.1.7 Indeks Populasi teks dengan kata "penyakit busuk akar pada
tanaman kakao"

28

4.1.8 Indeks Populasi teks dengan kata "antraknosa"

28

Universitas Sumatera Utara

xiii

4.1.9 Indeks Populasi teks dengan kata "penyakit antraknosa pada
tanaman kakao"

29

4.1.10 Indeks Populasi teks dengan kata "jamur upas"

29

Pengujian dokumen populasi teks

30

4.2.1 Tampilan Hasil pencarian kata pada populasi teks

30

4.2.2 Hasil penemuan kata penyakit pada tanaman kakao

31

Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao

31

4.2.3 Hasil pencarian populasi teks dari indeks semantik web

31

KESIMPULAN DAN SARAN

33

5.1

Kesimpulan

33

5.2

Saran

34

4.2

BAB 5

DAFTAR PUSTAKA

35

LAMPIRAN 1 Daftar Publikasi Ilmiah

38

LAMPIRAN 2 Dokumen Uji

39

Universitas Sumatera Utara

xiv

DAFTAR GAMBAR

Gambar 3. 1

Ilustrasi Proses Penelitian Secara Garis Besar

13

Gambar 3. 2 Tahap Pemotongan String Input Kata Yang Menyusunnya

16

Gambar 3. 3 Pemotongan Data Demi Kata

17

Gambar 3. 4 Mencari Vocabulary Kata

18

Gambar 3. 5 Tbox Ontologi Penyakit Pada Tanaman Kakao

19

Gambar 3. 6 Step Pada Semantic Identifikasi Relasi

20

Gambar 3. 7 Total Dokumen Uji Yang Dilakukan

21

Gambar 4. 1

Indeks pencarian kata “penyakit”dari yahoo

25

Gambar 4. 2

Indeks Pencarian Kata “Busuk Buah”Dari Yahoo

25

Gambar 4. 3 Pencarian Kata “Penyakit Busuk Buah Pada Kakao”Dari Yahoo

26

Gambar 4. 4

Indeks Pencarian Kata "Vascular Streak Dieback"Dari Yahoo

26

Gambar 4. 5

Pencarian Kata "Penyakit Vascular Streak Dieback Pada Tanaman

27

Gambar 4. 6

Indeks Pencarian Kata "Busuk Akar" Dari Yahoo

27

Gambar 4. 7

Pencarian Kata"Penyakit Busuk Akar Tanaman Kakao"Dari Yahoo 28

Gambar 4. 8

Pencarian Kata"Antraknosa"Dari Yahoo

28

Gambar 4. 9

Pencarian Kata"Penyakit Antraknosa Tanaman Kakao"Dari Yahoo

29

Gambar 4. 10 Indeks Pencarian Kata"Jamur Upas"Dari Yahoo

29

Gambar 4. 11 Hasil Pencarian Kata Pada Populasi Teks Dengan Dokumen Uji

30

Universitas Sumatera Utara

xv

DAFTAR TABEL

Tabel 4. 1 Populasi teks

24

Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao

31

Tabel 4. 3 Hasil pencarian populasi teks dari indeks semantik web

32

Universitas Sumatera Utara