Ontologi Populasi Teks Tentang Penyakit Tanaman

1

BAB 1
PENDAHULUAN

1.1

Latar Belakang

Populasi teks adalah sekumpulan teks atau kata yang mempunyai sifat yang sama dan
menjadi obyek konsep pengetahuan dan secara statistik dapat berperan sebagai
inferensi (Cimiano, 2006). Secara literal, sekumpulan kata dengan berbagai konsep
hubungan dapat melahirkan pengetahuan tentang sesuatu obyek (Nasution, 2011),
seperti pola hubungan antara penyakit dengan tumbuhan-tumbuhan yang masingmasing diwakili oleh teks secara harfiah.
Pengetahuan, yang berupa sains atau teknologi, dapat diungkapkan melalui
sekumpulan kata, dalam wacana tertentu, yang secara harfiah disajikan dalam banyak
dokumen (Nasution dan Noah, 2011; Nasution et al., 2010). Dalam hal ini, ontologi
secara asal merupakan konsep filosofis yang mengkaji persoalan hakikat keberadaan
sesuatu objek sebagai pengetahuan (Hu dan Zhang, 2010). Dengan kata lain, ontologi
populasi teks tentang sesuatu domain secara kecerdasan buatan adalah alat pemodelan
yang dapat menguraikan model-model konsep sistem informasi secara semantik.

Suatu bentuk kajian yang digunakan untuk menggali pengetahuan dari beragam
sumber.
Sebagai sumber pengetahuan, kumpulan dokumentasi tidaklah terstruktur dan
pada umumnya kurang semantik. Tidak terdapat pemaknaan yang mungkin diperoleh
secara tegas dari beragam dokumen yang tidak sama baik isi maupun tulisan (Lee et
al., 2007). Pengertian dan pemahaman hanya dapat dikenali dengan baik oleh
manusia, namun manusia mempunyai kemampuan terbatas dalam ruang dan waktu
tertentu, sedangkan komputer sebagai alat bantu tidak dapat mengenali sesuatu yang
tidak terstruktur dengan baik walaupun mampu mengolah sejumlah informasi dalam
ruang dan waktu yang ditentukan. Oleh karena itu, untuk mendapatkan pengetahuan

Universitas Sumatera Utara

2

tentang sesuatu obyek dalam populasi teks yang besar, diperlukan transformasi
kecerdasan manusia terhadap komputer dalam satu model, metode, dan proses
analisis.
Satu alasan penggunaan model dalam hal ini, adalah untuk melahirkan konsep
formal secara matematis tentang ontologi populasi teks, yang kemudian digunakan

untuk mewakili uraian-uraian hubungan antara teks secara kompak dan sistematis
(Kolli dan Boufaida, 2011). Metode formal untuk menggambarkan populasi teks
berdasarkan sejumlah dokumen tertentu adalah perwakilan matematis yang
memperkenankan komputer untuk menganalisis secara langsung populasi teks
dimaksudkan. Dalam bidang pengolahan bahasa alamiah (natural language
processing), kandungan satu dokumen dapat dibeda-bedakan ke dalam susunan kata
(kalimat), tata bahasa, dan pertimbangan statistik perkataan (Morneau et al., 2006).
Selain itu, hubungan antara kata juga dapat diuraikan selain melibatkan tata bahasa
juga melibatkan okkurensi dan ko-okkurensi, namun demikian diperlukan satu aturan
agar hubungan dalam teks dapat disajikan oleh jaringan semantik (hubungan antara
kata) berdasarkan ontologi teks karena jenis perwakilan pengetahuan dapat berbedabeda (Formica, 2006).
Jaringan semantik adalah sesuatu bentuk hubungan yang melibatkan
karakteristik atribut dari kata dan garis antara kata, tetapi konsep dan hubungan
kurang dipercaya apabila tidak didukung oleh satu penilaian, dan begitu rumit sewaktu
analisis dilakukan (Alexandridis dan Maru, 2012). Ontologi merupakan jenis metode
pemodelan yang digunakan untuk menguraikan antara hubungan kata itu dengan
melibatkan penyusunan aturan hubungan dengan melibatkan perlengkapan grafis yang
dikenali sebagai Tbox (Haarslev et al., 2008).
1.2


Rumusan Masalah

Secara logis, konsep-konsep dan hubungan yang dapat dirujuk dan dibandingkan oleh
komputer adalah seragam dan bahkan tanpa kendali. Kecerdasan buatan dijadikan
sebagai perangkat untuk mengungkapkan kemungkinan kendala dapat diuraikan dan
dirumuskan, yaitu:

Universitas Sumatera Utara

3

1. Ontologi diterapkan dalam menggali pengetahaun dari populasi teks. Beberapa
metode telah diterapkan untuk menganalisis populasi teks. Terdapat metode
pengklasifikasian dan metode penggugusan yang secara klasik berfungsi dalam
dua kumpulan data yang berbeda tabiatnya.
2. Pendekatan klasifikasi hanya mampu mengungkapkan pengetahuan yang terkait
dengan sekumpulan dokumen secara terbatas tetapi dapat menghadirkan sesuatu
yang lebih rinci berdasarkan informasi definitif yang telah dinyatakan.
3. Pendekatan penggugusan bersifat adaptasi terhadap sekumpulan dokumen yang
tidak dapat diprediksi dan ditentukan batasannya, tetapi harus melibatkan aturan

yang sesuai atau kerangka acuan.
4. Hubungan antara kata dalam populasi teks yang berkaitan dengan domain penyakit
tanaman, pemodelan dengan menerapkan satu metode akan mengungkapkan
hubungan antara kata dalam satu populasi apabila metode itu melingkupi dua
pendekatan yang berbeda.
5. Kajian ini melibatkan pertanyaan penelitian untuk membuktikan bagaimana
melibatkan penggunaan ontologi untuk menguraikan populasi teks yang berkaitan
dengan domain penyakit tanaman?
1.3

Tujuan Penelitian

Tujuan utama dari penelitian ini adalah untuk menentukan model yang dapat
mengungkapkan aturan hubungan antara penyakit dan tanaman secara harfiah dalam
satu populasi teks. Untuk mencapai objektif itu, berikut digariskan beberapa maksud
sebagai berikut:
1. Membangun ontologi dalam populasi teks.
2. Menganotasikan kata dan hubungan antara mereka yang memungkinkan
secara semantik pengetahuan diperoleh.
3. Melakukan penilaian terhadap ontologi populasi teks.

Berdasarkan itu, penelitian ini akan memberikan kontribusi berupa hadirnya aturan
atau pola hubungan kata yang mewakili tanaman dan penyakitnya secara teks literal,
adanya struktur atribut tentang tanaman secara semantik, tujuannya adalah untuk

Universitas Sumatera Utara

4

mengatasi

keterbatasan

informasi

dalam

domain

yang


dibicarakan,

dan

memungkinkan diungkapkannya satu metode pengakusisian pengetahuan berdasarkan
domain yang dikaji.

Universitas Sumatera Utara

5

1.4

Batasan Masalah/Ruang Lingkup Kajian

Pendekatan yang dilakukan dalam kajian ini adalah:
1. Pendekatan pengakuisisian pengetahuan berdasarkan sekumpulan dokumen yang
dibangun sebagai korpus.
2. Domain kajian adalah tanaman kakao (coklat) dan penyakit yang berkaitan
dengannya.

3. Semua informasi ini berkaitan dengan literal teks, jadi pengolahan dilakukan
terhadap kata demi kata dalam berkas teks, dan aspek semantik yang diturunkan
berkaitan dengan penglibatan bahasa Indonesia seperti kata coklat.

Universitas Sumatera Utara