Information Retrieval Information Retrieval dan Information Filtering

7 BAB II LANDASAN TEORI

2.1 Information Retrieval dan Information Filtering

Perkembangan internet yang sangat pesat secara tidak langsung memberikan kemampuan kepada pengguna untuk memilih di antara banyak dari informasi yang ada di internet. Informasi ini bisa berkaitan dengan profesi mereka, kejadian yang ada di dunia, atau bahkan informasi yang berkaitan dengan gaya hidup. Informasi yang dibutuhkan oleh pengguna internet terus mengalami peningkatan dan ini bisa datangnya dari berbagai sumber yang berbeda-beda. Misalnya melalui halaman web, email, artikel, berita, jurnal, situs belanja, dan situs multimedia. Perkembangan ini memicu terjadinya information explosion di dunia maya yang menyulitkan pengguna dalam mencari suatu informasi dengan cepat dan relevan. Masalah ini menjadi alasan dikembangkannya beberapa teknik untuk information retrieval dan information filtering Mortensen, Magnus. 2007.

2.1.1 Information Retrieval

Information Retrieval IR sering sekali dikaitkan dengan pencarian data, merupakan teknologi yang mencakup crawling, processing dan indexing konten, serta querying untuk konten. Crawling adalah tindakan mengakses web server dan file system untuk mendapatkan informasi. Dengan mengikuti link yang ada, pengguna dapat melintasi hirarki konten web berdasarkan sebuah URL Uniform Resource Locator. Pada tahapan processing memungkinkan pengguna untuk melakukan penambahan, menghapus, dan mengubah informasi menjadi sebuah dokumen, seperti menambah informasi meta baru untuk laguange processing atau menggali informasi tentang bahasa yang tertulis pada dokumen tersebut. Indexing sendiri merupakan proses untuk memeriksa konten yang telah diperiksa pada tahap processing dan membuat sebuah struktur data yang dicari, disebut dengan index, dimana index berisi tentang referensi konten. Querying adalah tahapan untuk melakukan request informasi. IR memperbolehkan pengguna untuk menulis query dalam bentuk keyword yang menggambarkan informasi yang dibutuhkan oleh pengguna. Disini pengguna dapat berinteraksi dengan query interface, lalu sebuah query-processor akan menggunakan index untuk mencari referensi informasi berdasarkan keyword dan kemudian menampilkan referensi yang ada. Tujuannya adalah untuk menganalisa dan mengidentifikasi tujuan dari penggunaan query dan memberikan hasil yang paling relevan. Penyaringan informasi pada sistem IR dilakukan dengan memberikan akses bagi pengguna untuk menentukan informasi apa yang dibutuhkan dengan menulis secara manual keyword yang menggambarkan informasi yang ingin dicari. IR cukup sukses untuk mendukung pengguna yang tahu bagaimana menjelaskan dengan tepat apa yang mereka cari dengan cara yang kompatibel dengan mendeskripsi konten yang diciptakan selama indexing Mortensen, Magnus. 2007.

2.1.2 Information Filtering