Anatomi Robot-The Crawler Cara Kerja

48 Gambar 2.3. Cara Kerja Search Engine Sumber : google, 2011

2.6.1. Anatomi Robot-The Crawler

Komponen search engine tidak terlepas dengan robot yang dikatakan secara spesifik sebagai spider robot yang mampu merangkak dan menjelajahi halaman-halaman web. Setiap search engine tentunya memiliki robot penjelajah untuk memelihara database web sehingga informasi yang nantinya disajikan oleh search engine selalu fresh dan relevant, bukan tidak mungkin perubahan struktur robot yang melibatkan algoritma pun ikut berubah. Crawling search engine menjadi ujung tombak dari ketangguhan pengaksesan informasi di web. Ini adalah program otomatis „khusus‟, yang kadang disebut clawler atau spiders yang mampu mengumpulkan informasi dari internet Sulianta : 2008 : 39. 49 Istilah spiders dan crawlers umumnya mengacu pada “robot”. Sewaktu spider men-download halaman-halaman web, robot otomatis melihat link-link yang ada dan dengan mudah mengalamatinya. Crawler akan memutuskan kemana spider bekerja selanjutnya, tentunya didasari pada link-link yang ditemukan dari keberadaannya di URL. Kadang- kadang, link-link baru ditemukan sewaktu crawler mengunjungi kembali situs internet dan kemudian ditambahkan dalam daftar crawler. Tentunya ketika anda menambahkan URL anda ke situs pencari, anda me-request agar crawler mengunjungi situs anda. Sedangkan spider otomatis langsung men-download dokumen-dokumen web yang dikirimkan oleh crawler. Kebanyakan spider web tidak tertarik dengan file image. Hasil kelola spider ada di indeks. Ini dimungkinkan dengan adanya indexer yang merupakan bagian dari sistem yang menentukan jenis seperti apakah suatu website. Kata-kata yang ada pada website akan dibaca, beberapa diabaikan misalnya : kata-kata yang tergolong umum. Kode HTML dianalisa code, kata-kata yang di-bold, dicetak miring, dan header tag akan diberikan intensitas tersendiri. Meta information kata-kata kunci dan description tags pun dianalisa. Kemudian basis data, tempat dimana informasi yang telah dikumpulkan oleh indexer kemudian disimpan. Pertimbangan google, yang menyatakan dirinya sebagai database paling besar. Pembacaannya melebihi 3 miliar dokumen, walaupun rata-rata ukuran masing-masing dokumen hanya beberapa puluh kilobytes, namun 50 jika dikalkulasikan akan melebihi 1 juta megabytes, yang tentunya membutuhkan sangat banyak media penyimpanan. Sedangkan mesin hasil menjadi bagian yang paling penting dari search engine. Merupakan antarmuka bagi pengunjung, dan disinilah pengunjung akan melihat dan menilai keandalan dari search engine yaitu menyajikan halaman-halaman yang paling relevant terhadap query user. Sewaktu user mengetikkan kata kunci atau frase, mesin hasil result engine akan memutuskan halaman-halaman yang mana yang paling berguna bagi user. Berkaitan dengan bagaimana search engine bekerja, menganalisa dan mempertimbangkan hingga menyajikan informasi yang relevant Sulianta : 2008 : 41.

2.6.2. Kriteria Pada Search Engine Tools Analyzer