Spider Crawler Pengindeks Indexer

44 web maupun tema web itu sendiri. Sedangkan Off Page merupakan cara untuk membangun banyak link menuju ke website Enterprise : 2008 : 1.

2.5. Prinsip Umum

Search Engine Agar lebih paham tentang kinerja search engine, ada beberapa hal yang perlu dibahas terutama keterkaitannya dengan masalah arsitektur dan mekanisme dari search engine.

2.5.1. Spider

Spider adalah program otomatis yang men-download dokumen yang ditemukan pada web oleh crawler Feri Sulianta : 2008 : 40. Spider juga dapat dikatakan sebagai program yang men-download halaman- halaman yang mereka temukan, hampir sama dengan browser. Bedanya adalah browser menampilkan secara langsung informasi yang ada, seperti teks atau gambar untuk kepentingan manusia yang menggunakannya pada saat itu. Sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat seperti itu, karena kepentingannya bukan untuk manusia tapi melainkan untuk mesin. Spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman- halaman yang dikunjunginya untuk disimpan ke dalam database yang dimiliki oleh search engine Febrian : 2007 : 15.

2.5.2. Crawler

crawler adalah program otomatis khusus yang mampu mengikuti link-link yang ditemukan pada halaman-halaman web yang menuntun 45 spider dalam menemukan web yang lain untuk dikunjungi kemudian Feri Sulianta : 2008 : 40. Buku lain menyebutkan Clawler merupakan program yang dimiliki oleh search engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spider harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search engine Febrian : 2007 : 16.

2.5.3. Pengindeks Indexer

Pengindeks adalah program yang „membaca‟ halaman-halaman yang di download spiders. Di sini search engine akan menentukan seperti apakah sebuah web Feri Sulianta : 2008 : 40. Komponen ini melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, meliputi text, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus dan lain-lain Febrian : 2007 : 16.

2.5.4. Basis Data Database