Sistem Information Extraction Ada dua macam pendekatan dasar dalam Rule Based Information Extraction Rule based information extraction adalah suatu

3 D D i i n n a a m m i i k k a a T T e e k k n n o o l l o o g g i i Jurnal Ilmiah Teknologi dan Rekayasa, ISSN : 1907-7327 • Connection management Komponen ini akan mengatur service yang digunakan untuk menghubungkan aplikasi dengan sistem manajemen database yang digunakan. • Transaction management Komponen ini akan memampukan pengembang software untuk dapat menjalankan operasi database lebih dari satu pada waktu yang bersamaan. • Object relational mapping Komponen ini merupakan suatu teknik pemetaan data yang berasal dari model objek menjadi data dengan model relasional.

1. Sistem Information Extraction Ada dua macam pendekatan dasar dalam

mengembangkan sistem Information Extraction, yaitu Knowledge Engineering Approach dan Automatic Training Approach. Knowledge Engineering Approach adalah pengembangan sistem information extraction dengan melakukan pendekatan menggunakan pola bahasa yang digunakan oleh knowledge engineer atau pengembang pengetahuan. Rule based information Extraction merupakan penerapan Knowledge Engineering Approach. Pendekatan kedua, yaitu Automatic Training Approach, sangat berbeda dengan pendekatan yang pertama. Automatic Training Approach merupakan suatu pendekatan dalam membangun sistem information extraction tanpa adanya bantuan dari tangan manusia, khususnya knowledge engineer, dalam menentukan anotasi dari teks untuk informasi yang diinginkan. Salah satu komponen yang dapat digunakan dalam melakukan training yaitu coreference.

2. Rule Based Information Extraction Rule based information extraction adalah suatu

jenis information extraction dimana dalam melakukan ekstraksi digunakan rule atau aturan- aturan untuk mendapatkan informasi sesuai dengan field-field yang telah ditentukan. Dalam pengembangan rule based information extraction diperlukan sekumpulan aturan, dimana aturan- aturan yang digunakan ditulis dengan format tertentu dan setiap kalimat yang akan diekstrak akan dicocokkan dengan aturan tersebut. Apabila terdapat kesamaan antara aturan dengan kalimat, maka informasi tersebut akan dimasukkan atau disimpan ke database sesuai dengan field yang cocok. Dan setiap field akan mempunyai aturannya masing-masing. Segmen Program 1 rule untuk jenis industri 01: Rule 1:: “we are work at” | “company in” | “specialized in” industry “.” 02: Rule 2:: “growing” industry “looking for” Segmen program 1 merupakan segmen program yang menunjukkan bagaimana menulis sebuah rule. Rule tersebut ditujukan untuk mendapatkan informasi mengenai jenis industri yang ada. Pada rule 1 diberikan rule bahwa sebuah kalimat yang jenis industri dapat dimulai dengan kata we are work at, company in, atau specialized in. Tanda | menunjukkan arti atau sehingga sebuah kalimat yang berisi mengenai jenis pekerjaan, dapat diawali dengan salah satu dari kata-kata tersebut. Terdapat dua jenis rule atau rumus untuk dapat mendapatkan informasi mengenai jenis pekerjaan, dapat diawali dengan salah satu dari kata-kata tersebut. Rule 2 digunakan untuk mendapatkan jenis pekerjaan dengan kata-kata yang berbeda. Pendekatkan hasil yang diperoleh dapat disajikan dalam dua bentuk, yaitu best match dan exact match. Sistem best match adalah memberikan hasil ekstraksi dengan menggunakan prioritas dimana hasil yang ditampilkan adalah mirip atau mendekati dari query yang diberikan. Sistem exact match adalah pendekatan hasil ekstraksi dimana informasi yang diberikan harus benar-benar mirip dengan query yang diinputkan. DESKRIPSI SISTEM Pada bagian ini akan dijelaskan mengenai analisa dari sistem website yang yang akan dikembangkan. Berikutnya akan dijelaskan mengenai deskripsi dan kebutuhan dari sistem baru yang akan dikembangkan. Pada bagian tersebut, akan diberikan penjelasan juga mengenai hal-hal apa yang dibutuhkan oleh sistem baru untuk dapat mengatasi masalah yang terjadi pada sistem saat ini. Selain itu, dijelaskan juga mengenai kebutuhan-kebutuhan tambahan untuk mendukung sistem yang baru dan korelasi antara Struts, Hibernate, dan Information Extraction dengan sistem yang dikembangkan.

1. Deskripsi dan Kebutuhan Sistem Baru Untuk dapat mengatasi masalah-masalah yang