3
D D
i i
n n
a a
m m
i i
k k
a a
T T
e e
k k
n n
o o
l l
o o
g g
i i
Jurnal Ilmiah Teknologi dan Rekayasa, ISSN : 1907-7327
• Connection management Komponen ini akan mengatur service yang
digunakan untuk menghubungkan aplikasi dengan sistem manajemen database yang digunakan.
• Transaction management Komponen ini akan memampukan pengembang
software untuk dapat menjalankan operasi database lebih dari satu pada waktu yang bersamaan.
• Object relational mapping Komponen ini merupakan suatu teknik pemetaan
data yang berasal dari model objek menjadi data dengan model relasional.
1. Sistem Information Extraction Ada dua macam pendekatan dasar dalam
mengembangkan sistem Information Extraction, yaitu Knowledge Engineering Approach dan
Automatic
Training Approach.
Knowledge Engineering Approach adalah pengembangan
sistem information extraction dengan melakukan pendekatan menggunakan pola bahasa yang
digunakan oleh
knowledge engineer
atau pengembang pengetahuan. Rule based information
Extraction merupakan penerapan Knowledge Engineering Approach.
Pendekatan kedua, yaitu Automatic Training Approach, sangat berbeda dengan pendekatan yang
pertama. Automatic Training Approach merupakan suatu pendekatan dalam membangun sistem
information extraction tanpa adanya bantuan dari tangan manusia, khususnya knowledge engineer,
dalam menentukan anotasi dari teks untuk informasi yang diinginkan. Salah satu komponen
yang dapat digunakan dalam melakukan training yaitu coreference.
2. Rule Based Information Extraction Rule based information extraction adalah suatu
jenis
information extraction
dimana dalam
melakukan ekstraksi digunakan rule atau aturan- aturan untuk mendapatkan informasi sesuai dengan
field-field yang
telah ditentukan.
Dalam pengembangan rule based information extraction
diperlukan sekumpulan aturan, dimana aturan- aturan yang digunakan ditulis dengan format
tertentu dan setiap kalimat yang akan diekstrak akan dicocokkan dengan aturan tersebut. Apabila
terdapat kesamaan antara aturan dengan kalimat, maka informasi tersebut akan dimasukkan atau
disimpan ke database sesuai dengan field yang cocok. Dan setiap field akan mempunyai aturannya
masing-masing.
Segmen Program 1 rule untuk jenis industri
01: Rule 1:: “we are work at” | “company in” | “specialized in” industry “.”
02: Rule 2:: “growing” industry “looking for” Segmen program 1 merupakan segmen program
yang menunjukkan bagaimana menulis sebuah rule. Rule tersebut ditujukan untuk mendapatkan
informasi mengenai jenis industri yang ada. Pada rule 1 diberikan rule bahwa sebuah kalimat yang
jenis industri dapat dimulai dengan kata we are work at, company in, atau specialized in. Tanda |
menunjukkan arti atau sehingga sebuah kalimat yang berisi mengenai jenis pekerjaan, dapat
diawali dengan salah satu dari kata-kata tersebut. Terdapat dua jenis rule atau rumus untuk dapat
mendapatkan informasi mengenai jenis pekerjaan, dapat diawali dengan salah satu dari kata-kata
tersebut. Rule 2 digunakan untuk mendapatkan jenis pekerjaan dengan kata-kata yang berbeda.
Pendekatkan hasil yang diperoleh dapat disajikan dalam dua bentuk, yaitu best match dan exact
match. Sistem best match adalah memberikan hasil ekstraksi dengan menggunakan prioritas dimana
hasil yang ditampilkan adalah mirip atau mendekati dari query yang diberikan. Sistem exact
match adalah pendekatan hasil ekstraksi dimana informasi yang diberikan harus benar-benar mirip
dengan query yang diinputkan.
DESKRIPSI SISTEM
Pada bagian ini akan dijelaskan mengenai analisa dari sistem website yang yang akan dikembangkan.
Berikutnya akan dijelaskan mengenai deskripsi dan kebutuhan
dari sistem
baru yang
akan dikembangkan. Pada
bagian tersebut, akan diberikan penjelasan juga mengenai hal-hal apa
yang dibutuhkan oleh sistem baru untuk dapat mengatasi masalah yang terjadi pada sistem saat
ini. Selain
itu, dijelaskan
juga mengenai
kebutuhan-kebutuhan tambahan untuk mendukung sistem yang baru dan korelasi antara Struts,
Hibernate, dan Information Extraction dengan sistem yang dikembangkan.
1. Deskripsi dan Kebutuhan Sistem Baru Untuk dapat mengatasi masalah-masalah yang