Karakteristik Mesin Pencari Mesin Pencari Google

permintaan dari web browser yang menggunakan protokol tersebut http:www.total.or.id. d. URL Uniform Resource Locator URL adalah sintaksis dan semantik perumusan informasi pengalamatan dan pengaksesan resource via Internet rfc1738. Berikut adalah sebuah contoh URL dan anatominya : Gambar 2.2 Anatomi URL Sumber : http:cscis12.dce.harvard.edu

2.4. Search Engine Mesin Pencari

Menurut Purbo 2008 : 67, mesin pencari adalah mesin yang dirancang untuk mencari informasi di World Wide Web. Informasi tersebut dapat berupa halaman web, gambar, dan berbagai jenis file. Beberapa mesin pencari juga menggali data dari koran, buku, basis data, atau berbagai direktori yang terbuka. Berbeda dengan direktori web, yang dibuat oleh editor manusia, mesin pencari beroperasi menggunakan algoritma atau campuran antara algoritma dan masukan manusia.

2.4.1. Karakteristik Mesin Pencari

Crispen 2003 dalam penjelasannya menuliskan, bahwa karakteristik dari sebuah search engine terdiri dari tiga bagian, yaitu : Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. a. The Spider Spider atau dikenal juga sebagai crawler atau bot merupakan perangkat lunak yang bertugas untuk mengotomatisasi pembentukan daftar kata-kata yang ditemukan pada situs web. Empat spider dapat menghinggapi hingga seratus halaman per detik untuk keperluan pengindeksan lebih lanjut. Gambar 2.3 Anatomi Pencarian Sisi Server Sumber : http:computer.howstuffworks.com b. The Catalog Catalog adalah sebuah program yang bertugas membuat indeks berskala besar. Halaman yang telah dibaca oleh spider akan diindekskan untuk disimpan ke dalam basis data mesin pencari lihat gambar 2.3. c. The Front End Adalah sebuah program yang menerima permintaan pencarian penggunanya, membandingkannya dengan indeks yang terdapat dalam basis data dan mengembalikan hasil pencarian kepada penggunanya. Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Gambar 2.4 Anatomi Pencarian Sisi Klien Sumber : http:www.netsquirrel.com

2.4.2. Mesin Pencari Google

Google Search atau Google Web Search adalah sebuah mesin pencari web berorientasi teks milik perusahan Google, Google Inc, yang dikembangkan oleh Sergey Brin dan Lawrance Page ketika masih di Stanford University, California. Sebelumnya, mesin pencari ini bernama BackRub, yang beroperasi di Stanford hingga lebih dari setahun. Nama Google berasal dari kata googol, yang dalam matematik berarti 10 100 . Istilah tersebut sesuai dan merefleksikan misi mesin pencari yang mereka kembangkan. Adapun konsep antarmuka yang diusung adalah kesederhanaan, dan masih terjaga hingga kini. Gambar 2.5 Halaman Google Beta pada Tahun 1998 Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Google mulai merintis kesuksesannya pada tahun 1998 dengan dibentuknya perusahaan Google pada tanggal 4 September di Menlo Park. Beberapa hari kemudian, seiring dengan keadaan perusahaan yang stabil, Larry dan Sergey mendepositokan cek dengan nilai 100,000 yang diberikan oleh Andy Bechtolsheim, co-founder Sun Microsystem, kepada Google Inc, yang sebelumnya tidak dapat dicairkan karena perushaan Google belum didirikan. Pada bulan Maret 2004, kantor Googleplex pindah ke 1600 Amphitheatre Parkaway di Mountain View, dan pada tahun 2006 kantor Google pindah ke kota New York. Dalam sejarah perkembangannya, Google terus memperluas layanannya dengan mengakuisisi puluhan perusahaan seperti, YouTube, reCAPTCHA, Writely cikal bakal Google Docs, Keyhole cikal bakal Google Earth, Pyra Labs Blogger, dan lain-lain. Hingga saat ini, Google masih menjadi mesin pencari web terpopuler di kalangan pengguna Internet. Bahkan menurut survei yang dilansir www.alexa.com hingga Februari 2011 kemarin, Google menduduki peringkat pertama situs web yang paling banyak diakses. Terdapat tiga unsur yang paling mendasar dan utama dalam kinerja hingga penggunaan Google Web Search. Ketiga unsur tersebut adalah : a. PageRank Seperti yang telah disinggung pada sub bab sebelumnya, bahwa mesin pencari web bekerja dengan memadukan The Spider dan algoritma-algoritma tertentu. Para pengguna Google lebih mengenal The Spider dengan nama Google Crawler atau Google robot. Patrick Douglas Crispen melalui Advanced Googology memaparkan, bahwa cara kerja Google secara garis besar meliputi lima hal, yaitu : Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.  Pertama, Google menggunakan kata kunci sebagai sebuah frase dalam pencariannya, yang diberikan nilai X.  Kemudian, kedekatan letak kata kunci yang ditemukan Google pada halaman web diberi nilai Y.  Berikutnya, Google melakukan pembobotan nilai Z berdasarkan banyaknya kata kunci yang terdapat pada halaman yang ditemukan.  Dengan ketentuan XYZ, Google mengombinasikannya dengan sejumlah variabel lainnya untuk membatasi 2000 teratas.  Akhirnya, Google mengalikan hasil yang menduduki peringkat skor 2000 teratas tersebut dengan PageRank yang kemudian membatasi hasilnya menjadi 1000 teratas. PageRank adalah algoritma yang digunakan untuk menilai popolaritas suatu halaman web. Sehingga, sangat mempengaruhi prioritas hasil pencarian kata kunci web. Sergey Brin dan Lawrence Page memaparkan dalam paper yang mereka tulis, bahwa PageRank merupakan analogi grafik kutipan pada karya tulis ilmiah yang diimplementasikan ke dalam mesin pencari web. Dalam hal ini, kutipan berupa link. Mereka memformulasikannya secara matematik sebagai berikut : A : Halaman yang akan diukur menggunakan PageRank T1..Tn : Kutipan n halaman yang merujuk ke halaman A C : Jumlah link pada halaman A yang menuju keluar halaman A d : Faktor pengurang yang bernilai 0.85, dengan kisaran 0d1 2.1 Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. b. Google Search Layout Antarmuka mesin pencari Google cukup sederhana, dan kesederhanaan ini tetap terjaga hingga kini. Pada halaman utamanya, terdapat beberapa tautan menu utama yang terdapat pada sisi bagian atas, sebuah logo Google untuk tanggal tertentu Google menggunakan logo alternatifnya yang dikenal sebagai Google Doodle, lihat gambar 2.6, sebuah textbox yang digunakan untuk mengetikkan kata kunci pencarian, dua buah tombol, dan sejumlah tautan-tautan lainnya, seperti pilihan bahasa, serba-serbi, penelusuran lanjutan, periklanan, dan lain- lainnya. Tombol “Saya Lagi Beruntung” akan membawa ke halaman web yang menduduki peringkat pertama dalam penelusuran. Misalnya, ketika kita mengetikkan kata google mail sebagai kata kunci penelusuran, maka kita akan dibawa kehalaman utama Gmail. Hal ini berarti akan mengefisienkan waktu penelusuran, karena pengguna tidak perlu menelusuri halaman demi halaman. Gambar 2.6 Halaman Utama Google dengan Google Doodles Google juga menyediakan virtual keyboard sebagai text-assistant. Virtual keyboard ini dapat diakses dengan cara mengklik ikon keyboard yang berada top panel menu Google Doodle Logo textbox search button Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. dalam pada sisi kanan dalam textbox lihat gambar 2.7. Untuk mempermudah penggunanya, Google juga sudah dilengkapi dengan auto-completion yang lebih dikenal dengan Google Suggest lihat gambar 2.7. Gambar 2.7 Layout Halaman Hasil Pencarian Google Sejak tahun 2010, Google telah menggunakan rancangan antarmuka yang baru untuk hasil pencarian, yakni dengan menambahkan panel menu pada sisi kiri yang juga merupakan menu utama lihat gambar 2.7. Panel menu ini kurang disukai oleh sejumlah Googlers pengguna Google karena terkesan redundan dengan menu utama pada sisi bagian atas. Untuk layout hasil pencarian terbagi menjadi dua bagian, Google menempatkannya pada bagian tengah dan kanan. Hasil pencarian yang berada pada bagian kanan merupakan fitur hasil pencarian yang bersifat khusus yang meliputi iklan lihat gambar 2.7 dan visualisasi tertentu seperti peta lihat gambar 2.8, grafik, dan lain sebagainya. Sedangkan hasil pencarian utama terletak pada bagian tengah. Secara default, hasil pencarian yang virtual keyboard left panel menu Ikon virtual keyboard Google Suggest search result Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. ditampilkan oleh Google maksimal sepuluh buah, tidak termasuk iklan dan saran hasil pencarian terkait. Google membedakan iklan dengan hasil pencarian umum lainnya dengan memberikan latar belakang kemerahan dan selalu berada pada posisi teratas hasil pencarian lihat gambar2.7. Informasi hasil pencarian yang ditampilkan pun disajikan dalam bentuk yang sederhana, hanya terdiri judul halaman dan beberapa baris teks yang disebut juga dengan istilah snippet lihat gambar 2.8. Gambar 2.8 Navigasi Halaman Hasil Pencarian Google Seperti halnya jumlah hasil pencarian default, navigasi halaman atau paging hasil pencarian Google juga hanya terdapat sepuluh buah per sepuluh halaman dengan huruf o berulang tepat sejumlah sepuluh buah juga lihat gambar 2.8. Selain tampilan standar Google Search, Google juga menyediakan Google Search tingkat lanjut. Melalui Google Search tingkat lanjut ini, Googlers dapat mengatur preferensi pencarian dan membatasi pencarian menjadi lebih spesifik. Namun, antarmuka Google Advanced Search yang kompleks membuat Googlers cenderung kurang menyukainya lihat gambar 2.9. paging page title snippet Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Gambar 2.9 Antarmuka Google Advanced Search c. Google Advanced Operators Patrick Crispen melalui dokumen presentasinya yang berjudul Google 70-20-10 menjelaskan pembagian operator-operator tingkat lanjut yang dapat digunakan dalam query Google menjadi 3 kelompok, yaitu :  Query Modifiers Adalah kelompok operator yang dapat ditambahkan pada pencarian reguler. Sebagian besar operator-operator pada kelompok ini merupakan operator yang digunakan dalam Google Hack. Operator-operator yang termasuk ke dalam kelompok operator ini meliputi filetype , intitle , inurl , site , dan synonyms. Gambar 2.10 Operator Synonyms Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Operator synonyms digunakan untuk mencari kata kunci beserta sinonimnya kata yang memiliki atau mendekati kesamaan makna. Penggunaan operator ini sama pada operator dasar Google, yakni dengan menambahkan tanda tilde ~ sebagai awalan kata kunci lihat gambar 2.10. Selain itu, juga terdapat operator inanchor dan allinanchor yang digunakan untuk pencarian teks tautan pada halaman. Pada praktiknya, keduanya sangat jarang atau bahkan tidak pernah digunakan. Adapun operator-operator khusus lainnya akan dijelaskan lebih lanjut pada sub bab 2.6.2.  Alternative Query Types Adalah kelompok operator yang dapat digunakan untuk pencarian tanpa kata kunci. Argumen tunggal yang digunakan pada operator-operator kelompok ini adalah URL. Operator-operator yang termasuk dalam kelompok operator ini adalah operator cache , link , related , dan info . Gambar 2.11 Tampilan Cache Hasil Penggunaan Operator cache Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Operator cache digunakan untuk menampilkan halaman web versi snapshot atau versi cache yang dimiliki Google. Contoh, [cache:mail.google.com]. Gambar 2.12 Operator link Operator link digunakan untuk membatasi penelusuran terhadap berbagai halaman web yang memiliki referensi tautan kepada URL yang dispesifikasikan. Contoh, [link:wikipedia.org]. Gambar 2.13 Operator related Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Operator related digunakan untuk melakukan pencarian terhadap berbagai halaman web yang memiliki kesamaan atau kemiripan terhadap halaman web tertentu. Contoh, [related:wikipedia.org]. Gambar 2.14 Operator info Operator info digunakan untuk menampilkan informasi yang dimiliki Google tentang keterangan suatu halaman web tertentu. Contoh, [info:ubuntu.com].  Other Information Needs Adalah kelompok operator dan non-operator ekspresi matematik dan kata kunci yang memiliki makna spesial sebagaimana operator yang digunakan untuk melakukan pencarian informasi khusus seperti, definisi istilah, jadwal tayang film bioskop, menjawab pernyataan matematika, dan lain-lain. Gambar 2.15 Operator define Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Operator define digunakan untuk melakukan pencarian definisi istilah atau arti dari sebuah kata atau frase yang bersumber dari situs web tertentu, seperti situs web kategori ensiklopedia atau kategori kamus. Contoh, [define:internet]. Gambar 2.16 Google Calculator Google Calculator digunakan untuk menyelesaikan permasalahan matematik yang meliputi, aritmatika dasar, konversi satuan pengukuran, konstanta fisika, dan sebagainya. Contoh, [2010 feet in meters]. Gambar 2.17 Operator movie Operator movie digunakan untuk melakukan pencarian informasi terkait dengan film tertentu, dalam hal ini adalah untuk menampilkan jadwal tayang film pada bioskop daerah tertentu. Argumen yang digunakan untuk operator ini adalah lokasi, yang dapat berupa nama jalan, kota, negara, atau kode pos. Contoh, [movie:orchard,sg]. Hak Cipta © milik UPN Veteran Jatim : Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber. Gambar 2.18 Kata Kunci weather Kata kunci weather digunakan untuk menampilkan prakiraan cuaca suatu kota tertentu. Contoh, [weather jakarta].

2.5. Hacking