7
BAB II
LANDASAN TEORI
2.1 Information Retrieval dan Information Filtering
Perkembangan internet yang sangat pesat secara tidak langsung memberikan kemampuan kepada pengguna untuk memilih di antara banyak dari informasi yang
ada di internet. Informasi ini bisa berkaitan dengan profesi mereka, kejadian yang ada di dunia, atau bahkan informasi yang berkaitan dengan gaya hidup. Informasi yang
dibutuhkan oleh pengguna internet terus mengalami peningkatan dan ini bisa datangnya dari berbagai sumber yang berbeda-beda. Misalnya melalui halaman web,
email, artikel, berita, jurnal, situs belanja, dan situs multimedia. Perkembangan ini memicu terjadinya information explosion di dunia maya yang menyulitkan pengguna
dalam mencari suatu informasi dengan cepat dan relevan. Masalah ini menjadi alasan dikembangkannya beberapa teknik untuk information retrieval dan information
filtering Mortensen, Magnus. 2007.
2.1.1 Information Retrieval
Information Retrieval IR sering sekali dikaitkan dengan pencarian data, merupakan teknologi yang mencakup crawling, processing dan indexing konten, serta
querying untuk konten. Crawling adalah tindakan mengakses web server dan file system untuk mendapatkan informasi. Dengan mengikuti link yang ada, pengguna
dapat melintasi hirarki konten web berdasarkan sebuah URL Uniform Resource Locator. Pada tahapan processing memungkinkan pengguna untuk melakukan
penambahan, menghapus, dan mengubah informasi menjadi sebuah dokumen, seperti menambah informasi meta baru untuk laguange processing atau menggali informasi
tentang bahasa yang tertulis pada dokumen tersebut. Indexing sendiri merupakan proses untuk memeriksa konten yang telah diperiksa pada tahap processing dan
membuat sebuah struktur data yang dicari, disebut dengan index, dimana index berisi
tentang referensi konten. Querying adalah tahapan untuk melakukan request informasi. IR memperbolehkan pengguna untuk menulis query dalam bentuk keyword
yang menggambarkan informasi yang dibutuhkan oleh pengguna. Disini pengguna dapat berinteraksi dengan query interface, lalu sebuah query-processor akan
menggunakan index untuk mencari referensi informasi berdasarkan keyword dan kemudian menampilkan referensi yang ada. Tujuannya adalah untuk menganalisa dan
mengidentifikasi tujuan dari penggunaan query dan memberikan hasil yang paling relevan.
Penyaringan informasi pada sistem IR dilakukan dengan memberikan akses bagi pengguna untuk menentukan informasi apa yang dibutuhkan dengan menulis
secara manual keyword yang menggambarkan informasi yang ingin dicari. IR cukup sukses untuk mendukung pengguna yang tahu bagaimana menjelaskan dengan tepat
apa yang mereka cari dengan cara yang kompatibel dengan mendeskripsi konten yang diciptakan selama indexing Mortensen, Magnus. 2007.
2.1.2 Information Filtering