permintaan dari web browser yang menggunakan protokol tersebut http:www.total.or.id.
d. URL
Uniform Resource Locator URL adalah sintaksis dan semantik perumusan informasi pengalamatan dan pengaksesan resource via Internet rfc1738.
Berikut adalah sebuah contoh URL dan anatominya :
Gambar 2.2 Anatomi URL Sumber : http:cscis12.dce.harvard.edu
2.4. Search Engine Mesin Pencari
Menurut Purbo 2008 : 67, mesin pencari adalah mesin yang dirancang untuk mencari informasi di World Wide Web. Informasi tersebut dapat berupa
halaman web, gambar, dan berbagai jenis file. Beberapa mesin pencari juga menggali data dari koran, buku, basis data, atau berbagai direktori yang terbuka.
Berbeda dengan direktori web, yang dibuat oleh editor manusia, mesin pencari beroperasi menggunakan algoritma atau campuran antara algoritma dan masukan
manusia.
2.4.1. Karakteristik Mesin Pencari
Crispen 2003 dalam penjelasannya menuliskan, bahwa karakteristik dari sebuah search engine terdiri dari tiga bagian, yaitu :
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
a. The Spider
Spider atau dikenal juga sebagai crawler atau bot merupakan perangkat lunak yang bertugas untuk mengotomatisasi pembentukan daftar kata-kata
yang ditemukan pada situs web. Empat spider dapat menghinggapi hingga seratus halaman per detik untuk keperluan pengindeksan lebih lanjut.
Gambar 2.3 Anatomi Pencarian Sisi Server
Sumber : http:computer.howstuffworks.com b.
The Catalog Catalog adalah sebuah program yang bertugas membuat indeks berskala
besar. Halaman yang telah dibaca oleh spider akan diindekskan untuk disimpan ke dalam basis data mesin pencari lihat gambar 2.3.
c. The Front End
Adalah sebuah program yang menerima permintaan pencarian penggunanya, membandingkannya dengan indeks yang terdapat dalam basis data dan
mengembalikan hasil pencarian kepada penggunanya.
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Gambar 2.4 Anatomi Pencarian Sisi Klien
Sumber : http:www.netsquirrel.com
2.4.2. Mesin Pencari Google
Google Search atau Google Web Search adalah sebuah mesin pencari web berorientasi teks milik perusahan Google, Google Inc, yang dikembangkan oleh
Sergey Brin dan Lawrance Page ketika masih di Stanford University, California. Sebelumnya, mesin pencari ini bernama BackRub, yang beroperasi di Stanford
hingga lebih dari setahun. Nama Google berasal dari kata googol, yang dalam matematik berarti 10
100
. Istilah tersebut sesuai dan merefleksikan misi mesin pencari yang mereka kembangkan. Adapun konsep antarmuka yang diusung
adalah kesederhanaan, dan masih terjaga hingga kini.
Gambar 2.5 Halaman Google Beta pada Tahun 1998
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Google mulai merintis kesuksesannya pada tahun 1998 dengan dibentuknya perusahaan Google pada tanggal 4 September di Menlo Park. Beberapa hari
kemudian, seiring dengan keadaan perusahaan yang stabil, Larry dan Sergey mendepositokan cek dengan nilai 100,000 yang diberikan oleh Andy
Bechtolsheim, co-founder Sun Microsystem, kepada Google Inc, yang sebelumnya tidak dapat dicairkan karena perushaan Google belum didirikan. Pada
bulan Maret 2004, kantor Googleplex pindah ke 1600 Amphitheatre Parkaway di Mountain View, dan pada tahun 2006 kantor Google pindah ke kota New York.
Dalam sejarah perkembangannya, Google terus memperluas layanannya dengan mengakuisisi puluhan perusahaan seperti, YouTube, reCAPTCHA, Writely cikal
bakal Google Docs, Keyhole cikal bakal Google Earth, Pyra Labs Blogger, dan lain-lain.
Hingga saat ini, Google masih menjadi mesin pencari web terpopuler di kalangan
pengguna Internet.
Bahkan menurut
survei yang
dilansir www.alexa.com hingga Februari 2011 kemarin, Google menduduki peringkat
pertama situs web yang paling banyak diakses. Terdapat tiga unsur yang paling mendasar dan utama dalam kinerja hingga
penggunaan Google Web Search. Ketiga unsur tersebut adalah : a.
PageRank Seperti yang telah disinggung pada sub bab sebelumnya, bahwa mesin pencari
web bekerja dengan memadukan The Spider dan algoritma-algoritma tertentu. Para pengguna Google lebih mengenal The Spider dengan nama Google Crawler
atau Google robot. Patrick Douglas Crispen melalui Advanced Googology memaparkan, bahwa cara kerja Google secara garis besar meliputi lima hal, yaitu :
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Pertama, Google menggunakan kata kunci sebagai sebuah frase dalam pencariannya, yang diberikan nilai X.
Kemudian, kedekatan letak kata kunci yang ditemukan Google pada halaman web diberi nilai Y.
Berikutnya, Google melakukan pembobotan nilai Z berdasarkan banyaknya kata kunci yang terdapat pada halaman yang ditemukan.
Dengan ketentuan XYZ, Google mengombinasikannya dengan sejumlah variabel lainnya untuk membatasi 2000 teratas.
Akhirnya, Google mengalikan hasil yang menduduki peringkat skor 2000 teratas tersebut dengan PageRank yang kemudian membatasi hasilnya
menjadi 1000 teratas. PageRank adalah algoritma yang digunakan untuk menilai popolaritas suatu
halaman web. Sehingga, sangat mempengaruhi prioritas hasil pencarian kata kunci web. Sergey Brin dan Lawrence Page memaparkan dalam paper yang mereka
tulis, bahwa PageRank merupakan analogi grafik kutipan pada karya tulis ilmiah yang diimplementasikan ke dalam mesin pencari web. Dalam hal ini, kutipan
berupa link. Mereka memformulasikannya secara matematik sebagai berikut :
A : Halaman yang akan diukur menggunakan PageRank
T1..Tn : Kutipan n halaman yang merujuk ke halaman A
C : Jumlah link pada halaman A yang menuju keluar halaman A
d : Faktor pengurang yang bernilai 0.85, dengan kisaran 0d1
2.1
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
b. Google Search Layout
Antarmuka mesin pencari Google cukup sederhana, dan kesederhanaan ini tetap terjaga hingga kini. Pada halaman utamanya, terdapat beberapa tautan menu
utama yang terdapat pada sisi bagian atas, sebuah logo Google untuk tanggal tertentu Google menggunakan logo alternatifnya yang dikenal sebagai Google
Doodle, lihat gambar 2.6, sebuah textbox yang digunakan untuk mengetikkan kata kunci pencarian, dua buah tombol, dan sejumlah tautan-tautan lainnya,
seperti pilihan bahasa, serba-serbi, penelusuran lanjutan, periklanan, dan lain- lainnya. Tombol
“Saya Lagi Beruntung” akan membawa ke halaman web yang menduduki peringkat pertama dalam penelusuran. Misalnya, ketika kita
mengetikkan kata google mail sebagai kata kunci penelusuran, maka kita akan dibawa kehalaman utama Gmail. Hal ini berarti akan mengefisienkan waktu
penelusuran, karena pengguna tidak perlu menelusuri halaman demi halaman.
Gambar 2.6 Halaman Utama Google dengan Google Doodles
Google juga menyediakan virtual keyboard sebagai text-assistant. Virtual keyboard ini dapat diakses dengan cara mengklik ikon keyboard yang berada
top panel menu Google Doodle
Logo
textbox search button
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
dalam pada sisi kanan dalam textbox lihat gambar 2.7. Untuk mempermudah penggunanya, Google juga sudah dilengkapi dengan auto-completion yang lebih
dikenal dengan Google Suggest lihat gambar 2.7.
Gambar 2.7 Layout Halaman Hasil Pencarian Google
Sejak tahun 2010, Google telah menggunakan rancangan antarmuka yang baru untuk hasil pencarian, yakni dengan menambahkan panel menu pada sisi kiri yang
juga merupakan menu utama lihat gambar 2.7. Panel menu ini kurang disukai oleh sejumlah Googlers pengguna Google karena terkesan redundan dengan
menu utama pada sisi bagian atas. Untuk layout hasil pencarian terbagi menjadi dua bagian, Google menempatkannya pada bagian tengah dan kanan. Hasil
pencarian yang berada pada bagian kanan merupakan fitur hasil pencarian yang bersifat khusus yang meliputi iklan lihat gambar 2.7 dan visualisasi tertentu
seperti peta lihat gambar 2.8, grafik, dan lain sebagainya. Sedangkan hasil pencarian utama terletak pada bagian tengah. Secara default, hasil pencarian yang
virtual keyboard left panel menu
Ikon virtual keyboard
Google Suggest
search result
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
ditampilkan oleh Google maksimal sepuluh buah, tidak termasuk iklan dan saran hasil pencarian terkait. Google membedakan iklan dengan hasil pencarian umum
lainnya dengan memberikan latar belakang kemerahan dan selalu berada pada posisi teratas hasil pencarian lihat gambar2.7. Informasi hasil pencarian yang
ditampilkan pun disajikan dalam bentuk yang sederhana, hanya terdiri judul halaman dan beberapa baris teks yang disebut juga dengan istilah snippet lihat
gambar 2.8.
Gambar 2.8 Navigasi Halaman Hasil Pencarian Google
Seperti halnya jumlah hasil pencarian default, navigasi halaman atau paging hasil pencarian Google juga hanya terdapat sepuluh buah per sepuluh halaman dengan
huruf o berulang tepat sejumlah sepuluh buah juga lihat gambar 2.8. Selain tampilan standar Google Search, Google juga menyediakan Google Search
tingkat lanjut. Melalui Google Search tingkat lanjut ini, Googlers dapat mengatur preferensi pencarian dan membatasi pencarian menjadi lebih spesifik. Namun,
antarmuka Google Advanced Search yang kompleks membuat Googlers cenderung kurang menyukainya lihat gambar 2.9.
paging page title
snippet
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Gambar 2.9 Antarmuka Google Advanced Search
c. Google Advanced Operators
Patrick Crispen melalui dokumen presentasinya yang berjudul Google 70-20-10 menjelaskan pembagian operator-operator tingkat lanjut yang dapat digunakan
dalam query Google menjadi 3 kelompok, yaitu : Query Modifiers
Adalah kelompok operator yang dapat ditambahkan pada pencarian reguler. Sebagian besar operator-operator pada kelompok ini merupakan operator
yang digunakan dalam Google Hack. Operator-operator yang termasuk ke dalam kelompok operator ini meliputi
filetype
,
intitle
,
inurl
,
site
, dan synonyms.
Gambar 2.10 Operator Synonyms
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Operator synonyms digunakan untuk mencari kata kunci beserta sinonimnya kata yang memiliki atau mendekati kesamaan makna. Penggunaan
operator ini sama pada operator dasar Google, yakni dengan menambahkan tanda tilde ~ sebagai awalan kata kunci lihat gambar 2.10. Selain itu,
juga terdapat operator
inanchor
dan
allinanchor
yang digunakan untuk pencarian teks tautan pada halaman. Pada praktiknya, keduanya sangat
jarang atau bahkan tidak pernah digunakan. Adapun operator-operator khusus lainnya akan dijelaskan lebih lanjut pada sub bab 2.6.2.
Alternative Query Types Adalah kelompok operator yang dapat digunakan untuk pencarian tanpa
kata kunci. Argumen tunggal yang digunakan pada operator-operator kelompok ini adalah URL. Operator-operator yang termasuk dalam
kelompok operator ini adalah operator
cache
,
link
,
related
, dan
info
.
Gambar 2.11 Tampilan Cache Hasil Penggunaan Operator cache
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Operator
cache
digunakan untuk menampilkan halaman web versi snapshot atau versi cache yang dimiliki Google. Contoh, [cache:mail.google.com].
Gambar 2.12 Operator link
Operator
link
digunakan untuk membatasi penelusuran terhadap berbagai halaman web yang memiliki referensi tautan kepada URL yang
dispesifikasikan. Contoh, [link:wikipedia.org].
Gambar 2.13 Operator related
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Operator
related
digunakan untuk melakukan pencarian terhadap berbagai halaman web yang memiliki kesamaan atau kemiripan terhadap halaman
web tertentu. Contoh, [related:wikipedia.org].
Gambar 2.14 Operator info
Operator
info
digunakan untuk menampilkan informasi yang dimiliki Google tentang keterangan suatu halaman web tertentu. Contoh,
[info:ubuntu.com]. Other Information Needs
Adalah kelompok operator dan non-operator ekspresi matematik dan kata kunci yang memiliki makna spesial sebagaimana operator yang digunakan
untuk melakukan pencarian informasi khusus seperti, definisi istilah, jadwal tayang film bioskop, menjawab pernyataan matematika, dan lain-lain.
Gambar 2.15 Operator define
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Operator
define
digunakan untuk melakukan pencarian definisi istilah atau arti dari sebuah kata atau frase yang bersumber dari situs web tertentu,
seperti situs web kategori ensiklopedia atau kategori kamus. Contoh, [define:internet].
Gambar 2.16 Google Calculator
Google Calculator digunakan untuk menyelesaikan permasalahan matematik yang meliputi, aritmatika dasar, konversi satuan pengukuran, konstanta
fisika, dan sebagainya. Contoh, [2010 feet in meters].
Gambar 2.17 Operator movie
Operator
movie
digunakan untuk melakukan pencarian informasi terkait dengan film tertentu, dalam hal ini adalah untuk menampilkan jadwal
tayang film pada bioskop daerah tertentu. Argumen yang digunakan untuk operator ini adalah lokasi, yang dapat berupa nama jalan, kota, negara, atau
kode pos. Contoh, [movie:orchard,sg].
Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.
Gambar 2.18 Kata Kunci weather
Kata kunci
weather
digunakan untuk menampilkan prakiraan cuaca suatu kota tertentu. Contoh, [weather jakarta].
2.5. Hacking