Subject Directories Crawler Indexer Database Result Engine

19 • Pencarian berdasarkan kata kunci, mereka mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang yang ada dalam dokumen, • Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori, • Database dijaring dan dikumpulkan oleh spider, yaitu komputer yang memiliki program robot, dengan kemampuan seminimal mungkin dari pandangan atau sentuhan manusia, • Ukuran search engine: dari skala kecil hingga mampu menyimpan sangat banyak sekitar hingga 20 milyar halaman Web. • Meta-search engine dengan cepat melakukan pencarian ke dalam beberapa database dari berbagai search engine dalam satu kali permintaan. Hasilnya adalah daftar yang dihasilkan dari penggabungan hasil pencarian dari beberapa search engine yang mereka libatkan. • Contoh Search Engine: Google, Yahoo Search, Ask.com, dll. Meta-Search Engine: Dogpile, Clusty, Surfwax, Ixquick, Copernic Agent, dll.

b. Subject Directories

Karakteristik: • Seleksi dari situs yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala malah para ahli untuk subjek tertentu, • Sering dengan hati-hati dievaluasi dan menjaga keterbaruan informasi yang mereka miliki, namun tidak selalu, kadang-kadang malah tidak, terutama untuk mereka yang telah memiliki data yang banyak dan bersifat general. • Biasanya dikelola dalam bentuk subjek dan direktori yang tersusun secara hirarki, • Sering dilengkapi dengan catatan mengenai deskripsinya tidak untuk Yahoo, • Subjek dapat di-browse subject dan kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu, • No-full text document. Pencarian diminta lebih spesifik dibandingkan dengan pencarian melalui search engine, karena kata kunci tidak dibandingkan dengan isi dari halaman suatu situs, melainkan hanya pada subjek, kategori, dan deskripsi. • Contoh: dmoz, librarian index, infomine, About.com, dll.

c. Specialized Database Invisible Web

Karakteristik: • Merupakan Web yang menyediakan akses melalui suatu kontak pencarian ke dalam content database pada sebuah komputer di suatu tempat, • Dapat saja berupa berbagai topik, dapat juga hal yang sepele, komersial, pekerjaan yang spesifik, pemerintahan, dll. Universitas Sumatera Utara 20 • Juga terdiri dari banyak halaman yang menghasilkan hasil pencarian dari katalog direktori online. • Contoh: penempatan database khusus untuk mencari dari data yang bisa diandalkan melalui directory seperti dmoz, Yahoo Directory, dll.

3. Mekanisasi dari Search Engine a. Spider

Spider adalah program yang dijalankan oleh mesin secara otomatis untuk men-download halaman-halaman yang ditemukannya untuk disimpan ke dalam database search engine. Berbeda dengan browser, spider bekerja untuk kepentingan mesin bukan untuk kepentingan manusia.

b. Crawler

Crawler adalah program yang dimiliki oleh search engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spider harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search engine.

c. Indexer

Indexer adalah komponen yang melakukan aktivitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.

d. Database

Database adalah tempat standar untuk menyimpan data-data dan halaman yang telah dikunjungi, di-download dan sudah dianalisis. Kadang kala disebut juga index dari suatu search engine.

e. Result Engine

Result Engine adalah mesin yang melakukan penggolongan dan penentuan perangkingan dari hasil pencarian pada search engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian Universitas Sumatera Utara 21 berdasarkan permintaan penggunanya, dan bagaimana bentuk penampilan yang akan ditampilkan.

f. Web Server