Kesimpulan Saran Information Retrieval System 1. Pengertian Information Retrieval System

BAB 5 KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan hasil dari Implementasi Algoritma Pencocokan String Knuth-Morris- Pratt Dalam Pembuatan Kamus Kedokteran Pada Platform Android, maka dapat disimpulkan bahwa: 1. Sistem mengimplementasikan Algoritma Knuth-Morris-Pratt dalam pencarian atau pencocokan data dengan field istilah sebagai inputan pencariannya. 2. Dalam Algoritma Knuth-Morris-Pratt dimungkinkan pergeseran sejauh mungkin menurut tabel next untuk menghindari pencarian berlebihan. 3. Hasil yang diperoleh dari pencarian menampilkan satu karakter yang cocok dengan kecepatan 0.06 detik.

5.2 Saran

Adapun saran yang dapat diberikan untuk mengembangkan penelitian ini adalah sebagai berikut: 1. Untuk pengembangan selanjutnya, diharapkan agar dapat menangani pergeseran pattern dari kanan ke kiri untuk proses pencarian yang lebih efisien. 2. Untuk pengembangan selanjutnya, diharapkan aplikasi ini menyediakan menu pilihan algoritma pencarian string dalam proses pencarian seperti Boyer-Moore, Rabin-Karp sehingga member pengetahuan tentang algoritma pencarian string. 3. Untuk pengembangan selanjutnya, diharapkan agar dapat menambahkan gambar dari penyakit-penyakit di dalam kamus kedokteran untuk dapat menjelaskan di mana letak dari penyakit tersebut. Universitas Sumatera Utara 4. Untuk pengembangan selanjutna, diharapkan aplikasi ini menyediakan informasi yang lebih banyak seperti penyebab penyakit, gejala penyakit serta penanganannya. Universitas Sumatera Utara BAB 2 LANDASAN TEORI 2.1. Information Retrieval System 2.1.1. Pengertian Information Retrieval System Information retrieval system merupakan bagian dari bidang ilmu komputer yang bertujuan untuk pengambilan informasi dari dokumen-dokumen yang didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. Definisi Information Retrieval System menurut Gerald J. Kowalski adalah suatu sistem yang mampu melakukan penyimpanan, pencarian, dan pemeliharaan informasi. Informasi dalam konteks yang dibahas dalam buku ini dapat berupa informasi teks termasuk data numerik dan tanggal, gambar, audio, video, dan objek multimedia lainnya J. Kowalski, G, 2000 Definisi menurut Christoper Manning adalah proses menemukan suatu tema utama biasanya berupa dokumen dari suatu data yang tidak terstruktur dalam koleksi yang besar tersimpan dalam komputer untuk memenuhi kebutuhan informasi yang relevan. Data tidak terstruktur adalah data yang tidak memiliki susunan semantik, atau dapat juga dikatakan data yang tidak memiliki struktur yang mudah dikenali oleh komputer, data ini biasanya berupa teks. Walaupun dalam kenyataannya tidak ada data yang benar-benar bersifat “tidak terstruktur”, termasuk teks, karena teks juga memiliki struktur, seperti judul, paragraf, dan catatan kaki yang mana biasanya struktur tersebut direpresentasikan dalam suatu dokumen dengan memberikan tanda markup yang jelas untuk masing-masing struktur tersebut. Selain memfasilitasi penemuan kembali pada data yang tidak terstruktur, IR juga memfasilitasi pencarian data semi-struktur, misalnya untuk menemukan dokumen dengan judul dokumen yang Universitas Sumatera Utara mengandung kata “Java” dengan badan teks yang mengandung kata “threading”Manning, 2008. Sebagai suatu bidang tersendiri dalam ilmu komputer, IR memiliki beberapa sub bidang, yaitu sebagai berikut: 1. Document routing, filtering, dan selective dissemination. Tema ini berbalik arah dengan proses IR pada umumnya. Jika proses IR yang umum adalah membandingkan dokumen dengan query yang dimasukan user, sedangkan pada document routing, filtering, dan selective dissemination sistem akan membandingkan antar dokumen berdasarkan query untuk mendapatkan dokumen yang dapat menarik minat pengguna. Contoh pada tema ini adalah agregator berita, misalnya dengan menggunakan proses routing untuk memisahkan berita berdasarkan tema tertentu bisnis, politik, olahraga, dan sebagainya. 2. Text clustering and categorization system, adalah sistem IR yang akan mengelompokkan dokumen berdasarkan kunci tertentu. 3. Summarization system atau peringkas teks, sistem ini akan membuat ringkasan dari teks yang diberikan. Contohnya adalah snippet yang ditampilkan pada hasil pencarian web. 4. Information extraction system, topik IR ini berfungsi mengidentifikasi entitas bernama, seperti nama tempat dan tanggal. Sistem ini juga dapat menkombinasikan informasi-informasi ke dalam rekaman terstruktur yang mendeskripsikan hubungan antara entitas-entitas tersebut. Misalkan untuk membuat daftar buku dan pengarangnya dari web data, ekstraksi informasi dari legal document seperti undang-undang, peraturan pemerintah, dan sebagainya. 5. Topic detection and tracking system sistem pendeteksi dan pelacakan topik, sistem ini berguna untuk mengidentifikasi topik peristiwa dalam berita dan sumber-sumber informasi yang sama. 6. Expert search system sistem pencari keahlian, sistem ini akan melakukan pengidentifikasian keahlian dari seorang anggota organisasi. 7. Question answering system sistem tanya jawab, adalah sistem yang mengintegrasikan informasi dari berbagai sumber untuk memberikan jawaban yang singkat dari pertanyaan tertentu. Sistem ini kadang juga digabungkan dengan tema IR lain seperti pencarian, peringkas teks, dan ekstraksi informasi. Universitas Sumatera Utara Jika sistem IR yang umum adalah mengembalikan dokumen yang relevan kepada user berdasarkan query yang diinputkan, namun pada sistem tanya jawab yang dikembalikan adalah berupa kalimat singkat untuk menjawab pertanyaan user. 8. Multimedia information retrieval system, adalah tema IR yang mengembangkan teknik-teknik IR pada data multimedia seperti gambar, video, musik, dan pidato. Contoh dari sub-bidang ini adalah pencarian gambar, pencarian musik, video, dan sebagainya Butcher, S, 2010. 2.2. Pencocokan String String Matching 2.2.1. Pengertian Pencocokan String