Studi Perbandingan Fasilitas Dan Kinerja Search Engine Dalam Pencarian Dokumen Berbasis Web

STUDI PERBANDINGAN FASILITAS DAN KINERJA
SEARCH ENGINES DALAM PENCARIAN DOKUMEN
BERBASIS WEB

HERY WIDHIARTO

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2010

PERNYATAAN MENGENAI TESIS

Dengan ini saya menyatakan bahwa tesis dengan judul “Studi
Perbandingan Fasilitas Dan Kinerja Search Engines Dalam Pencarian Dokumen
Berbasis Web” adalah karya saya dan belum pernah diajukan dalam bentuk
apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau
dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam daftar pustaka di bagian akhir
tesis ini


Bogor, Februari 2010

Hery Widhiarto
NRP G651034064

RINGKASAN
HERY WIDHIARTO. Studi Perbandingan Fasilitas Dan Kinerja Search Engine
Dalam Pencarian Dokumen Berbasis Web. Dibimbing oleh KUDANG BORO
SEMINAR dan AZIZ KUSTIYO
Untuk melakukan pencarian informasi, diperlukan mesin pencari yang
dikenal dengan sebutan search engine. Search engine merupakan sebuah program
komputer yang dirancang untuk membantu seseorang menemukan file-file yang
disimpan dalam komputer. Guna mengetahui kelebihan dan kekurangan dari suatu
search engine khususnya dalam hal pencarian dokumen, dilakukan suatu analisis
perbandingan fasilitas dan kinerja dari lima search engine, yaitu Google, Yahoo, Ask
Jeeves, Altavista dan Scirus.
Tujuan dari penelitian ini adalah untuk mengetahui fasilitas ketersediaan
pencarian yang spesifik dan mengetahui kinerja pencarian dokumen ilmiah yang
dilakukan oleh search engine Google, Yahoo, Ask Jeeves, Altavista dan Scirus.
Fasilitas ketersediaan yang diperbandingkan adalah fasilitas advance search yang

ada pada setiap search engine antara lain fasilitas ketersediaan pengisian query,
fasilitas ketersediaan pilihan dalam menampilkan jumlah hasil pencarian per
halaman, ketersediaan pemilihan bahasa pengantar, fasilitas ketersediaan pemilihan
tipe file, ketersediaan fasilitas pilihan berdasarkan jangka waktu pencarian dan
fasilitas ketersediaan fasilitas pilihan berdasarkan jumlah region. Uji kinerja yang
dilakukan meliputi uji melalui masukkan keyword bahasa Indonesia, uji melalui
masukkan keyword bahasa Inggris, uji pencarian berfokus dan uji penilaian precision
and relative recall.
Di dalam pengisian query, search engine Google, Yahoo, Ask Jeeves dan
Altavista hampir mempunyai kesamaan pola pengisiannya walaupun agak sedikit
berbeda di dalam penyajian kata-katanya. Search engine Scirus memiliki perbedaan
di dalam pola pengisiannya karena search engine ini memang untuk pencarian
informasi ilmiah. Di antara kelima search engine yang diamati tentang fasilitas
ketersediaan pilihan di dalam menampilkan jumlah hasil pencarian per halamannya,
hanya search engine Scirus yang tidak menyediakan fasilitas tersebut. Google
menyediakan lima pilihan, Yahoo enam pilihan, Ask Jeeves empat, Altavista lima
pilihan dan Scirus tidak ada. Di dalam perbandingan fasilitas ketersediaan pencarian

dokumen berdasarkan bahasa pengantar, Google menyediakan 45 pilihan bahasa
pengantar, Yahoo 41 pilihan, Ask Jeeves 6 pilihan, Altavista 2 pilihan dan Scirus

tidak menyediakan. Pemilihan tipe file adalah untuk lebih memfokuskan pencarian
agar dapat memunculkan dokumen yang diinginkan user. Pada dasarnya kelima
search engine dapat menampilkan tipe file yang diinginkan oleh user. Ketersediaan
tipe file oleh masing-masing advance search pada kelima search engine berbedabeda. Google menyediakan 10 jenis tipe file, Yahoo 7, Ask Jeeves tidak menediakan,
Altavista dan Scirus menyediakan 6 jenis tipe file. Di dalam pengklasifikasian
pencarian dokumen berdasarkan waktu pencarian yang diinginkan, masing-masing
search engine beragam di dalam penyediaannya. Secara default kelima search engine
ini dapat melakukan pencarian berdasarkan waktu kapan saja. Dari kelima search
engine, terlihat Ask Jeeves dan Altavista memberikan penyediaan fasilitas pencarian
dokumen berdasarkan waktu pencarian yang sama yaitu enam pilihan, selanjutnya
secara berurutan Google 4 pilihan, Yahoo 3 pilihan, dan Scirus menyediakan 1
pilihan pencarian antara sebelum tahun 1900 sampai dengan tahun 2011. Di dalam
ketersediaan fasilitas pencarian dokumen berdasarkan pemilihan negara, search
engine Google menyediakan sebanyak 239 negara/region, Yahoo hanya 34, Ask
Jeeves 21 dan Altavista 28 pilihan. Search engine Scirus tidak menyediakan fasilitas
pencarian dokumen tersebut di dalam advance searchnya.
Perbandingan kinerja search engine dalam pencarian dokumen pada penelitian
ini adalah membandingkan unjuk kerja search engine di dalam pencarian dokumen
dengan memasukkan kata kunci (keyword). Di dalam uji memasukkan keyword
bahasa Indonesia, kelima search engine mampu melakukan kinerja pencariannya

dengan baik. Keyword yang dimasukkan antara lain +mesin pencari, ~mesin pencari
, -mesin pencari , *mesin pencari , “mesin pencari” dan mesin pencari NOT metode
sedangkan pada uji memasukkan keyword bahasa Inggris keyword yang dimasukkan
yaitu +search engine , ~search engine , -search engine, *search engine , “search
engine” dan search engine NOT method, kelima search engine mampu melakukan
kinerja pencariannya dengan baik. Uji pencarian berfokus antara lain pencarian
dengan operator-operator filetype, allinurl, inurl, site, intitle, allintitle, link dan
define, ke empat search engine dapat menampilkan hasil pencarian sedangkan Scirus
tidak dapat memberikan hasilnya.

Pada uji precision yang dilakukan pada bulan Mei, Juni dan Juli 2009, nilai
tengah precision Scirus mendapat nilai tertinggi yaitu 0,078 merupakan peringkat
pertama, Google mendapat peringkat ke dua dengan nilai 0,054, Yahoo peringkat
ketiga 0,043, Altavista peringkat ke empat 0,029 dan peringkat terakhir Ask Jeeves
dengan perolehan nilai 0,027, disini menunjukkan bahwa kinerja Scirus di dalam
penentuan tingkat presisi pada pencarian dokumen lebih baik dibandingkan dengan
Google, Yahoo, Ask Jeeves dan Altavista, sedangkan pada uji relative recall, nilai
tengah Scirus masih menjadi peringkat pertama dengan perolehan nilai yaitu 0,375,
Google mendapat peringkat kedua dengan nilai 0,155, Yahoo ke tiga 0,142 dan Ask
Jeeves ke empat dengan nilai 0,130.

Pada perbandingan perolehan nilai rata-rata precision untuk kata tunggal,
gabungan dan kompleks, untuk kata tunggal, Scirus menempati peringkat pertama
(0.084), sedang peringkat terakhir Ask Jeeves dan Altavista yang mempunyai nilai
yang sama (0.042). Untuk kata gabungan, Scirus tetap diurutan pertama (0.080),
sedang peringkat terakhir yaitu Altavista (0.016). Untuk kata kompleks, Scirus
urutan pertama (0.069), sedangkan peringkat terakhir Yahoo dan Ask Jeeves yang
mempunyai nilai yang sama (0.018). Selain perbandingan perolehan nilai rata-rata
relative recall, juga dibandingkan nilai rata-rata kata tunggal, gabungan dan
kompleks. Untuk kata tunggal peringkat pertama adalah Scirus (0.271), dan
peringkat akhir Altavista (0.116). Untuk kata gabungan, Scirus di urutan pertama
(0.513), sedangkan terakhir Altavista (0.060), untuk kata kompleks search engine
Scirus menempati peringkat pertama dengan perolehan nilai 0.341,

sedangkan

terakhir Altavista (0.041).
Search engine Scirus adalah mesin pencari yang merupakan pencarian
informasi ilmiah. Dari perolehan nilai tengah precision dan relative recall, search
engine Scirus lebih baik dibandingkan dengan ke empat search engine lainnya.
Menurut Shafi (2005) dan Hardi (2006), Scirus mendapat nilai precision dan relative

recall tertinggi karena search engine ini didisain untuk pencarian informasi ilmiah.  

Keyword : search engine, fasilitas, kinerja, precision and relative recall.

 
 
 
 
 
 

@ Hak Cipta milik IPB, Tahun 2010
Hak Cipta dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumber
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan
karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu
masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis

dalam bentuk laporan apapun tanpa izin IPB

ABSTRACT
Search engines are computer programs designed to help someone find the files
that are stored in the computer, for example, in a public server on the web (WWW) or the
computer itself. Search engines available today are so many and various search systems
are given. This caused problems for Internet users to select the most appropriate and
effective search engines used in order to acquire a selected search mode more quickly and
accurately.
Knowledge of search engines is very important for Internet users to not waste
more time and more quickly determine which search engines will be selected.
This research was conducted to determine the availability of facility-specific search and
find the search performance of scientific documents on the search engines.
Research is focused on five search engines, namely Google, Yahoo, Ask Jeeves,
AltaVista and Scirus. Testing is done by using the comparative method advanced search
facility on each search engine. Performance comparison is done by several types of tests,
namely the comparison test with the input keyword Indonesian, English, focusing the
search, and test precision and relative recall.
Test results showed that the ratio of facilities at the Advance Search, showed that
Google's search engine is superior in the availability of language selection, selection of

file types you want to display and selection by region / state, Yahoo is only superior in
availability displays the number of search results per page, Ask Jeeves and Altavista both
excel in the availability of the election based on a search term, while Scirus give different
results because search engines have their own characteristics and is devoted to the search
of scientific information.
Search engine performance tests conducted with the test include keywords in
Indonesian and English, the five search engines give good results, although Scirus has a
problem with the use of the service mark '*'. Test focused on search, search engines
Google and Altavista showed similar performance gains if the calculated results, the
follow Yahoo and Ask Jeeves, whereas the assessment test precision and relative recall,
Scirus search engine is better, the value of the precision and relative recall Scirus
received first rank. In the process Scirus been doing crawl filter powerful enough
information for a single word groups, combined and complex.
Keywords: search engines, features, performance, precision and relative recall.

STUDI PERBANDINGAN FASILITAS DAN KINERJA
SEARCH ENGINES DALAM PENCARIAN DOKUMEN
BERBASIS WEB

HERY WIDHIARTO


Tesis
Merupakan salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2010

Penguji Luar Komisi pada Ujian Tesis : Sony H. Wijaya, M.Kom

Judul Tesis

: Studi Perbandingan Fasilitas Dan Kinerja Search Engine
Dalam Pencarian Dokumen Berbasis Web

Nama


: Hery Widhiarto

NRP

: G651034064

Disetujui

Komisi Pembimbing

Prof. Dr. Ir. Kudang B. Seminar, M.Sc
Ketua

Aziz Kustiyo, S.Si, M.Kom
Anggota

Diketahui

Ketua Program Studi
Ilmu Komputer


Dr. Ir. Agus Buono, M.Si, M.Kom

Tanggal Ujian : 23 Januari 2010

Dekan Sekolah Pascasarjana IPB

Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S.

Tanggal Lulus :

PRAKATA

Syukur alhamdulillah penulis panjatkan kehadirat Allah S.W.T atas segala
karunia-Nya sehingga tesis ini berhasil diselesaikan dengan judul yang dipilih dalam
penelitian ini adalah “ Studi Perbandingan Fasilitas dan Kinerja Search Engine Dalam
Pencarian Dokumen Berbasis Web”.
Tesis ini disusun sebagai salah satu syarat untuk memperoleh gelar Magister
Sains pada Program Ilmu Komputer, Sekolah Pascasarjana Institut Pertanian Bogor.
Pada kesempatan ini penulis menyampaikan penghargaan dan ucapan terima
kasih kepada :
1. Kedua orangtuaku, Bapak Widodo dan Ibu Sri Haryadi tercinta, yang selalu tak
kenal lelah mendukung baik moril dan mendoakan siang dan malam.
2. Bapak Prof. Dr. Ir. Kudang Boro Seminar, M.Sc. selaku ketua komisi
pembimbing dan Bapak Aziz Kustiyo, S.Si, M.Kom selaku anggota komisi
pembimbing yang telah meluangkan waktu, tenaga dan pikiran sehingga tesis ini
dapat diselesaikan.
3. Bapak Sony Hartono Wijaya, M.Kom, selaku dosen penguji yang telah
memberikan arahan dan masukan untuk perbaikan tesis ini.
4. Bapak Dr. Ir. Agus Buono, M.Si., M.Kom., selaku Ketua Program Studi Ilmu
Komputer atas kerja samanya selama studi dan penelitian.
5. Bapak dan Ibu Yuwono Kolopaking serta Bapak dan Ibu Ir. Rivai Hamzah yang
telah banyak membantu hingga tercapainya kelulusan ini.
6. Istriku tercinta Siti Maryama dan anak-anakku Alwan dan Naufal yang selalu
membantu dan berdoa siang dan malam.
7. Staff Pengajar Program Studi Ilmu Komputer
8. Staff Administrasi Departemen Ilmu Komputer atas kerja samanya membantu
kelancaran proses administrasi hingga akhir studi.
9. Seluruh Jajaran Manajemen PPPTMGB ”LEMIGAS” khususnya Kepala Pusat,
Bapak Ir. Rida Mulyana, M.Sc., Kepala Kepegawaian, Bapak Ir. Daru Siswanto
dan Koordinator KPRT Aplikasi Produk, Bapak Drs. Mardono, M.M.
10. Teman-temanku Maymuchar, Cahyo, Setyo, Dimitri, Reza, Soemedi, Nur,
Kosasih yang setia membantu dengan ikhlas.
Penulis menyadari bahwa masih banyak kekurangan dalam penulisan tesis ini,
namun demikian penulis berharap tesis ini dapat bermanfaat untuk bidang ilmu komputer,
bidang pendidikan dan para bagi individu maupun kolektif (organisasi, grup, instansi,
perusahaan, lembaga, konsumen) pencari informasi yang ingin mendapatkan informasi
yang paling relevan sesuai dengan minat dan kebutuhannya.

Bogor, Februari 2010

RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 4 Nopember 1967 sebagai anak
ke tiga dari ayah bernama Widodo dan ibu bernama Sri Haryadi. Pendidikan
sekolah dasar hingga menengah atas ditempuh di DKI Jakarta. Pendidikan sarjana
ditempuh di Universitas Gunadarma, Depok, Jurusan Manajemen Informatika dan
Komputer, lulus 1991. Sejak tahun 1992 hingga sekarang bekerja di Pusat
Penelitian dan Pengembangan Teknologi Minyak dan Gas Bumi “LEMIGAS”
sebagai Pegawai Negeri Sipil, Jakarta. Pada tahun 2005 penulis memulai
pendidikan pascasarjana di Program Studi Ilmu Komputer, Sekolah Pascasarjana
IPB, Bogor.

DAFTAR ISI
Halaman
DAFTAR TABEL ……………………………………………………………………….. iv
DAFTAR GAMBAR …………………………………………………………………….

v

BAB I

PENDAHULUAN ……………………………………………………………..

1

1.1

Latar Belakang ………………………………………………………………… 1

1.2

Tujuan ………………………………………………………………………….

2

1.3

Ruang Lingkup ………………………………………………………………...

2

1.4

Manfaat Penelitian ……………………………………………………………..

3

BAB II STUDI PUSTAKA …………………………………………………………….. 4
2.1

Search Engine …………………………………………………………………..

4

2.1.1

Latar Belakang Search Engine ………………………………………...

4

2.1.2

Definisi Search Engine ………………………………………………...

5

2.1.3

Prinsip Umum Dari Search Engine …………………………………….

5

2.1.4

Cara Kerja Search Engine ……………………………………………... 7

2.1.5

Ranking ………………………………………………………………... 8

2.2

Search Engine Google …………………………………………………………

10

2.3

Search Engine Yahoo ………………………………………………………….

11

2.4

Search Engine Ask Jeeves ……………………………………………………..

12

2.5

Search Engine AltaVista ………………………………………………………. 12

2.6

Search Engine Scirus …………………………………………………………..

13

2.7

Precision And Recall …………………………………………………………..

13

2.8

Penelitian Sebelumnya yang Relevan …………………………………………

17

BAB III METODOLOGI ………………………………………………………………. 19
3.1

Alur Penelitian …………………………………………………………………

19

3.1.1

Identifikasi Masalah …………………………………………………… 20

3.1.2

Studi Literatur/Pustaka ………………………………………………...

3.1.3

Identifikasi dan Analisis Perbandingan Search Engine pada Search
Engine Google, Yahoo, Askjeeves, Altavista dan Scirus .......................

20
20

3.1.4 Perbandingan Fasilitas Ketersediaan Pencarian Dokumen Ilmiah pada
Search Engine Google, Yahoo, Ask Jeeves, Altavista dan Scirus ......... 21

ii

3.1.5 Uji Perbandingan Kinerja Search Engine Google, Yahoo, Ask Jeeves,
Altavista dan Scirus Dalam Pencarian Dokumen Ilmiah ........................ 21
3.1.6 Uji Precision And Recall Pada Search Engine Google, Yahoo, Ask
Jeeves, Altavista dan Scirus ................................................................... 21
3.1.7 Tulisan Ilmiah .........................................................................................

23

3.2

Bahan dan Alat .................................................................................................... 23

3.3

Waktu dan Tempat Penelitian .............................................................................. 23

BAB IV HASIL PERBANDINGAN DAN PEMBAHASAN …………………………. 24
4.1

Perbandingan Fasilitas Advance Search Untuk Pencarian Dokumen Pada
Search Engine Google, Yahoo, Ask Jeeves, Altavista dan Scirus …………….

24

4.1.1

24

Pola Pengisian Query ............................................................................

4.1.2 Ketersediaan Pilihan Dalam Menampilkan Jumlah Hasil Pencarian per
Halaman ................................................................................................. 25

4.2

4.1.3

Ketersediaan Fasilitas Pemilihan Bahasa Pengantar ............................. 25

4.1.4

Ketersediaan Fasilitas Pemilihan Tipe File ........................................... 26

4.1.5

Ketersediaan Fasilitas Pilihan Berdasarkan Jangka Waktu Pencarian ... 27

4.1.6

Ketersediaan Fasilitas Pilihan Berdasarkan Jumlah Region …………..

27

Perbandingan Kinerja Search Engine Google, Yahoo, Ask Jeeves, Altavista dan
Scirus dalam Pencarian Dokumen …………………………………………………….

28

4.2.1 Uji Melalui Masukkan Keyword Bahasa Indonesia dengan Keyword “Mesin
Pencari” dan Operator Boolean ………………………………………

28

4.2.2 Uji Melalui Masukkan Keyword Bahasa Inggris dengan Keyword “Search
Engine” dan Operator Boolean ……………………………………..

30

4.2.3 Uji Pencarian Berfokus .................................................................................... 32
4.2.4

Uji Precision And Relative Recall ......................................................... 39

BAB V KESIMPULAN DAN SARAN ………………………………………………... 47
5.1

Kesimpulan …………………………………………………………………….

47

5.2

Saran …………………………………………………………………………...

49

DAFTAR PUSTAKA ……………………………………………………………………

51

iii

DAFTAR TABEL
Halaman
4.1

Perbandingan Command Menu Fasilitas Pengisian Query ……………………..

4.2

Perbandingan Fasilitas Ketersediaan Memunculkan Jumlah Hasil Pencarian per

24

Halaman ………………………………………………………………………...

25

4.3

Perbandingan Jumlah Ketersediaan Bahasa Pengantar ........................................

26

4.4

Perbandingan Fasilitas di Dalam Pemilihan Tipe File ..........................................

26

4.5

Perbandingan Fasilitas Pilihan Berdasarkan Jangka Waktu Pencarian ................ 27

4.6

Perbandingan Jumlah Fasilitas Pilihan Berdasarkan Region/Negara ..................

4.7

Uji Dengan Keyword Berbahasa Indonesia .......................................................... 29

4.8

Uji Dengan Keyword Berbahasa Inggris …………………………………..........

4.9

Perbandingan Uji Operator Berfokus (filetype: doc/xls/ppt/pdf) ……………...... 33

4.10

Perbandingan Uji Operator Berfokus “Allinurl” dan “Inurl” …………………… 35

4.11

Perbandingan Uji Operator Berfokus Site:torry.net “xp style”..............................

4.12

Perbandingan Uji Operator Berfokus ‘intitle’ dan ‘allintitle’ …….......................

38

4.13

Perbandingan Uji Operator Berfokus ‘link’ dan ‘define’ ……………………

39

4.14

Nilai Rata-Rata Precision, Kata Tunggal, Gabungan dan Kompleks Bulan Mei
Tahun 2009 .........................................................................................................

4.15

4.20

40

42

Nilai Rata-Rata Relative Recall, Kata Tunggal, Gabungan dan Kompleks Bulan
Juni Tahun 2009 ....................................................................................................

4.19

40

Nilai Rata-Rata Relative Recall, Kata Tunggal, Gabungan dan Kompleks Bulan
Mei Tahun 2009 ....................................................................................................

4.18

40

Nilai Rata-Rata Precision, Kata Tunggal, Gabungan dan Kompleks Bulan Juli
Tahun 2009 .........................................................................................................

4.17

31

Nilai Rata-Rata Precision, Kata Tunggal, Gabungan dan Kompleks Bulan Juni
Tahun 2009 .........................................................................................................

4.16

28

42

Nilai Rata-Rata Relative Recall, Kata Tunggal, Gabungan dan Kompleks Bulan
Juli Tahun 2009 ....................................................................................................

42

Nilai Tengah Untuk Precision and Relative Recall ..............................................

43

iv

DAFTAR GAMBAR
Halaman
2.1

Komponen Arsitektur Dari Search Engine ...............................................................

3.1

Alur Penelitian …………………………………………………………………….. 19

4.1

Fasilitas Pengisian Query Search Engine Scirus …………………………………... 25

4.2

Grafik Uji Operator “Filetype:” Untuk doc, xls, ppt dan pdf ……………………..

4.3

Grafik Uji Operator “Allinurl:Google search” dan “Inurl:Google search”………… 35

4.4

Grafik Uji Operator Site:torry.net “xp style”.............................................................

4.5

Grafik Uji Operator “intitle” dan “allintitle” ............................................................. 38

4.6

Grafik Perbandingan Nilai Rata-Rata Precision Bulan Mei, Juni dan Juli Tahun
2009

4.7

36

Grafik Perbandingan Nilai Rata-Rata Relative Recall Bulan Mei, Juni dan Juli
43

Grafik Nilai Precision Dari Ke 5 Search Engine Untuk Kata Tunggal, Gabungan
Dan Kompleks

4.9

34

41

Tahun 2009
4.8

6

45

Grafik Nilai Relative Recall Dari Ke 5 Search Engine Untuk Kata Tunggal,
Gabungan Dan Kompleks

46

v

BAB I
PENDAHULUAN

1.1

Latar Belakang
Perkembangan dunia global telah mengubah kebutuhan informasi

masyarakat. Informasi yang disajikan secara elektronik lebih diminati karena
kemampuan updating informasi yang lebih cepat dibandingkan dengan media
cetak. Salah satu media elektronik yang paling diminati karena banyaknya
informasi yang tersedia adalah Internet. Internet adalah jaringan global yang
menghubungkan berbagai informasi di seluruh dunia. Internet merupakan sarana
yang paling mudah untuk memenuhi kebutuhan masyarakat dalam mendapatkan
informasi yang dibutuhkan. Internet telah menjadi “dunia paralel” dari dunia fisik
masyarakat. Pada artikel ilmah berjudul Mengukur Kinerja Search Engine:
Sebuah Eksperimentasi Penilaian Precision and Recall untuk Informasi Ilmiah
Bidang Ilmu Perpustakaan dan Informasi dijelaskan bahwa Harriet Shalat, seorang
pustakawan

rujukan

di

New

York

Public

Library,

Amerika

Serikat,

mengungkapkan, saat ini sudah terbentuk pandangan di publik Amerika yang
mengasumsikan bahwa sesuatu yang tidak dapat ditemukan di Internet berarti
memang tidak eksis (Hardi 2006).
Untuk melakukan pencarian informasi, diperlukan mesin pencari yang
dikenal dengan sebutan search engine. Search engine merupakan sebuah program
komputer yang dirancang untuk membantu seseorang menemukan file-file yang
disimpan dalam komputer, misalnya dalam sebuah server umum di web (www)
atau dalam komputer sendiri (Wikipedia.org). Cara penggunaan search engine
sangat mudah yaitu dengan mengetikkan kata kunci atau keyword yang hendak
dicari. Search engine yang tersedia saat ini begitu banyak dan memiliki beragam
sistem pencarian. Pemilihan search engine yang paling tepat dan efektif untuk
digunakan agar pencarian bisa lebih cepat dan akurat menjadi masalah tersendiri
bagi pengguna. Kebanyakan search engine menggunakan berbagai metode untuk
menentukan peringkat hasil pencarian agar mampu memberikan hasil terbaik
lebih dahulu. Penentuan halaman paling sesuai dan urutan halaman-halaman yang
ditampilkan search engine sangat bervariasi. Metode pencarian yang digunakan

1

juga berubah seiring perubahan kebutuhan penggunaan Internet dan berevolusinya
teknik-teknik baru.
Pengetahuan tentang search engine sangatlah penting bagi pengguna
Internet agar tidak membuang banyak waktu dan lebih cepat menentukan search
engine yang akan dipilih. Guna mengetahui kelebihan dan kekurangan dari suatu
search engine khususnya dalam hal pencarian dokumen, akan dilakukan suatu
analisis dan perbandingan fasilitas dan kinerja dari beberapa search engine.

1.2

Tujuan
Tujuan dari penelitian ini adalah :

1.

Mengetahui fasilitas ketersediaan pencarian yang spesifik yang diberikan
oleh masing-masing search engine Google, Yahoo, Ask Jeeves, Altavista
dan Scirus.

2.

Mengetahui kinerja pencarian dokumen ilmiah yang dilakukan oleh search
engine Google, Yahoo, Ask Jeeves, Altavista dan Scirus.

1.3

Ruang Lingkup
Untuk memperoleh hasil yang optimal sebagaimana disebutkan dalam

tujuan, maka penelitian ini dilaksanakan dengan memberikan batasan lingkup
penelitian sebagai berikut:
1.

Search engine yang diteliti yaitu Google, Yahoo, Ask Jeeves, Altavista
dan Scirus. Pertimbangan utama pemilihan search engine tersebut adalah
popularitasnya di mata pengguna Internet.

2.

Penelitian difokuskan untuk mengetahui ketersediaan fasilitas pencarian
dokumen.

3.

Penelitian perbandingan kinerja untuk kelima search engine ini dibatasi
pada uji perbandingan masukan keyword bahasa Indonesia dan Inggris
dengan kombinasi filter operator dan boolean, uji perbandingan pencarian
berfokus serta uji precision and relative recall.

2

1.4

Manfaat Penelitian
Penelitian ini diharapkan dapat memberi manfaat maksimal bagi individu

maupun kolektif (organisasi, grup, instansi, perusahaan, lembaga, konsumen)
pencari informasi yang ingin mendapatkan informasi yang paling relevan secara
cepat dan tepat sesuai dengan minat dan kebutuhannya.

3

BAB II
STUDI PUSTAKA

2.1

Search Engine

2.1.1

Latar belakang Search Engine
Perkembangan search engine berawal dari Montreal ketika Alan Emtage,

seorang mahasiswa Universitas McGill, Montreal, pada tahun 1990 membuat
Archie, ‘kakek’ dari semua search engine. Kemudian the University of Nevada
System Computing Service Group membangun sebuah tipe search engine yang
diberi nama Veronica, 1993. Search service ini merupakan ‘nenek’ dari search
engine. Kemudian Matthew Gray’s WWW Wanderer adalah ibu dari semua search
engine. The Wanderer adalah robot pertama di web. Kemudian Martijn Koster
menciptakan Aliweb pada Oktober 1993. Aliweb adalah search engine yang
sama dengan Archie. Search service ini masih menggunakan daftar list dari
masing-masing informasi yang dibuat.
Pada Desember 1993 telah dihasilkan tiga search engine yang
menggunakan program robot yaitu Jumpstation, WWW Worm dan The Repositorybased Software Engineering (RBSE) Spider. Pada saat sebelumnya enam orang
undergraduate dari Universitas Stanford memulai proyek pembangunan sebuah
search engine yang diberi nama Excite pada bulan Februari 1993. Pada awalnya
Excite bernama Architext dan hanya berupa sebuah software bagi webmaster
untuk digunakan pada website di lingkungan internal. Kemudian muncul Yahoo!,
sebuah search engine yang dibangun oleh dua orang kandidat doktoral dari
Universitas Stanford, David Filo and Jerry Yang. Lalu menyusul Lycos yang
merupakan sebuah proyek dari sebuah lab di Universitas Carnigie Mellon, Juli
1994, oleh Michael Maudlin. Altavista di keluarkan bulan Desember 1995 oleh
Digital Equipment Corporation’s (DEC). Hotbot dibangun pada tanggal 20 Mei
1996 dan merupakan produk keluaran Inkomotomi Corporation yang didirikan
oleh Eric Brewer dan Paul Gauthier dari Universitas California Berkeley.
Perkembangan selanjutnya adalah meta-search engine. Meta-search
engine pertama adalah Metacrawler yang menggabungkan dan mengambil

4

sumber dari Lycos, Altavista, Yahoo!, Excite, Webcrawler dan Infoseek.
Dibangun pada tahun 1995 oleh Eric Selburg, seorang mahasiswa master dari
Universitas Washington (Lubis 2003).

2.1.2

Definisi Search Engine
The American Heritage Dictionary (2006) mendefinisikan search engine

sebagai sebuah program perangkat lunak (software) yang menelusur, menjaring,
dan menampilkan informasi dari pangkalan data. Informasi yang ditampilkan
mengandung atau berhubungan dengan suatu istilah spesifik. Sedangkan menurut
Wikipedia, search engine adalah program komputer yang dirancang untuk
membantu seseorang menemukan file-file yang disimpan dalam komputer,
misalnya dalam sebuah server umum di web (WWW) atau dalam komputer
sendiri. Search engine merupakan salah satu fasilitas vital dari Internet untuk
menjelajahi lautan informasi yang begitu luas. Hanya dalam waktu beberapa detik
search engine dapat menyuguhkan ribuan bahkan jutaan alamat web (URL) yang
memuat informasi berkaitan dengan kata kunci (keyword) yang diketikkan sebagai
query.
2.1.3 Prinsip Umum Dari Search Engine
Secara prinsip, tujuan dari sebuah program search engine adalah
menemukan dokumen atau arsip elektronis di Internet yang sesuai dengan
kebutuhan atau permintaan pengguna dalam waktu yang sesingkat-singkatnya.
Kedua hal ini, yaitu kualitas hasil temuan dan waktu pencarian, kemudian menjadi
ukuran kinerja sebuah search engine. Pada Gambar 2.1 terlihat enam komponen
utama dari arsitektur sebuah program search engine.

5

Gambar 2.1 Komponen Arsitektur Dari Search Engine (Febrian, 2007)
Ke enam komponen utama tersebut adalah sebagai berikut :
1. Komponen pertama adalah query interface, yang merupakan bentuk
tampilan atau format situs yang menyediakan fasilitas searching engine.
Bentuk yang paling sederhana adalah tersedianya sebuah kotak kosong di
situs dimana pengguna Internet dapat menuliskan data atau informasi yang
akan dicari.
2. Komponen kedua adalah query engine, merupakan program yang bertugas
untuk menterjemahkan keinginan user ke dalam bahasa yang dimengerti
oleh mesin komputer. Query Engine ini pulalah yang segera melakukan
pencarian arsip dan dokumen yang tepat di dalam sistem basis data
(database) yang bersangkutan.
3. Komponen selanjutnya adalah database, yang pada dasarnya merupakan
kumpulan atau daftar dari dokumen maupun arsip dari seluruh situs yang
ada di Internet. Semakin besar skala Internet, akan semakin besar pula
kapasitas penyimpan yang dibutuhkan.
4. Komponen keempat yang merupakan komponen terpenting dalam sebuah
searching engine adalah spider. Secara berkala dan kontinyu, spider akan
mendata setiap situs yang ada di Internet, baik yang baru maupun yang
lama. Terhadap masing-masing situs, selain alamatnya, akan diambil katakata kunci dari arsip maupun dokumen yang ditemukan. Misalnya dari

6

situs Kompas.com akan diambil setiap kata pada kalimat judul berita, atau
pada Amazon.com akan diambil setiap kata pada judul buku. Di sinilah
persaingan antar situs terjadi, yaitu strategi dan teknik yang digunakan
dalam melakukan sampling terhadap kata-kata yang menjadi kunci dalam
pencarian arsip dan dokumen.
5. Komponen kelima disebut sebagai Indexer, yang merupakan sebuah
program untuk mempercepat proses pencarian. Filosofi yang digunakan
mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku.
Persaingan antar situs terjadi, karena teknik melakukan indeks akan sangat
berpengaruh terhadap kecepatan pencarian data atau informasi.
6. Dalam hal ini web yang dimaksud adalah web server yaitu merupakan
komputer yang melayani permintaan dan memberikan respon balik dari
permintaan tersebut. Web server ini biasanya menghasilkan informasi atau
dokumen dalam format HTML (Hyper Text Markup Language).

2.1.4 Cara Kerja Search Engine
Search engine, tidaklah benar-benar melakukan pencarian ke seluruh
World Wide Web secara langsung. Pencarian dilakukan dalam database yang
menyimpan teks dari dokumen yang tersedia di Internet. Teks dari halaman demi
halaman disimpan di dalam server database.
Ketika pengguna Internet melakukan pencarian web dengan menggunakan
search engine, yang dilakukan adalah pencarian salinan halaman yang disimpan
pada database search engine yang berisi salinan halaman tersebut pada saat
terakhir diakses.
Ketika pengguna Internet meng-click link yang disediakan oleh halaman
hasil pencarian yang dilakukan oleh search engine, sebenarnya alamat tersebut
diberikan dari server search engine melalui versi saat ini yang ada di dalam
database search engine.
Database dokumen yang ada pada search engine dipilih dan dijaring oleh
program robot yang disebut dengan spider. Untuk menemukan halaman potensial
lainnya, spider mengacu pada link-link yang terdapat pada halaman-halaman yang
telah disimpan di dalam database. Mesin ini tidak dapat menuliskan suatu URL

7

dan berfikir halaman-halaman yang mana yang akan ”dicoba” untuk dikunjungi.
Jika suatu halaman web tidak pernah di-link-kan, maka spider dari search engine
tidak dapat menemukan halaman tersebut. Spider hanya memantau dari database
yang dimiliki.
Untuk situs yang benar-benar baru, dan belum ada satupun situs lain yang
membuat link ke situs tersebut, maka spider tidak akan mengenalinya. Agar situs
baru tersebut bisa dikenal dan terdaftar pada search engine, khususnya untuk situs
yang belum dapat link dari situs lain, adalah dengan cara memberitahu langsung
search engine tersebut bahwa ada situs baru. Caranya adalah dengan membuka
search engine dan mengetikan alamat situs sebagai keyword-nya atau
mengetikkan salah satu kata kunci yang terdapat di dalam situs tersebut lalu klik
pada menu search. Hampir semua search engine memberikan fasilitas atau
penawaran untuk ini.
Setelah spider menemukan suatu halaman, maka hasil penemuan tersebut
dikirimkan ke komputer lain untuk diberi indeks. Program ini mengidentifikasi
teks, link serta isi lain pada halaman tersebut, lalu menyimpannya ke dalam file
database, sehingga melalui database tersebutlah bisa dilakukan pencarian kata
kunci atau apapun dalam bentuk tingkat lanjut lainnya yang ditawarkan, sampai
akhirnya situs ini dapat ditemukan pada hasil pencarian.
Beberapa tipe dari halaman dan link tidak dimasukkan ke dalam
kebanyakan search engine karena aturan-aturan tertentu. Beberapa yang lainnya
tidak dimasukkan juga karena spider tidak dapat mengakses halaman tersebut.
Halaman yang tidak dimasukkan ke dalam indeks disebut dengan ”invisible web”,
dimana kita tidak dapat melihat halaman dari hasil pencarian. Jumlah halaman ini
bisa mencapai dua hingga tiga kali lebih besar dari halaman yang boleh
ditampilkan (Febrian 2007).

2.1.5

Ranking
Dalam mesin pencari Internet, pengambilan data merupakan hasil kerja

sama dari tiga komponen, crawler (spider/robot), database, dan algoritma
pencarian. Ketiga komponen bekerjasama untuk memberi “jawaban” dari
“pertanyaan” pengguna Internet yang dimasukkan melalui antar-muka pencarian.

8

Mekanisme kerja ketiganya merupakan “rahasia dapur” masing-masing mesin
pencari.
Bagian yang sangat krusial adalah menentukan peringkat hasil pencarian
yang telah diambil dari database. Peringkat hasil pencarian menentukan berapa
kuantitas pengguna melihat dan mengunjungi suatu website. Permasalahannya
adalah algoritma perangkingan suatu mesin pencari sangat dirahasiakan. Apa yang
dapat dilakukan untuk “mempengaruhi” ranking di mesin pencari, atau lebih
dikenal sebagai SEO (Search Engine Optimization), tidak lebih dari “perkiraan
terstruktur” dari pengalaman menganalisis hasil mesin pencari, kemudian
menyesuaikan website dengan pola yang merupakan sinergi kompleks dari
berbagai elemen website yang memiliki ranking yang baik. Dengan tetap
mengingat bahwa masing-masing perangkat lunak memberikan bobot yang
berbeda-beda. Terdapat 2 faktor utama yang secara umum paling berpengaruh
pada ranking sebuah halaman web, yaitu faktor internal dan faktor eksternal.

1.

Faktor Internal (berhubungan dengan penulisan isi website dan
HTML)
Dalam menentukan rangking, search engine sangat memperhatikan konten

website sebagai salah satu acuan untuk menentukan tingkat relevansi. Halaman
web yang menampilkan citra yang hanya terdiri atas gambar dan flash serta tidak
menyertakan teks biasa, sangat sulit dibaca oleh search engine. Walaupun Google
saat ini sudah mulai menerapkan teknik kecerdasan buatan (Artificial
Intelegence), tetap saja belum dapat membaca makna dari sebuah gambar. Oleh
karena itu konten berupa teks murni harus dipakai agar suatu website mudah
dikenal. Dalam menyusun konten teks, suatu kata kunci atau keyword yang dibuat,
diusahakan dapat terpakai pada kalimat-kalimat dalam teks tersebut. Penggunaan
keyword yang dimaksud adalah penggunaan dalam batas yang wajar dengan
catatan kalimat masih enak untuk dibaca. Menentukan keyword yang tepat untuk
website tidaklah mudah. Jika website dioptimalkan dengan keyword yang salah
bisa berakibat fatal. Meskipun websitenya sudah berada di posisi paling atas pada
halaman pertama, tetap saja tidak berguna sebab keyword yang dioptimalkan
tidak pernah dicari orang. Salah satu cara untuk mengatasi masalah ini dengan

9

menggunakan

alat

bantu

seperti

yang

disediakan

WordTracker.com.

WordTracker.com memiliki database keyword-keyword populer berdasarkan data
dari beberapa search engine utama, dengan mengetikkan topik dari konten
website, dalam beberapa saat WordTracker bisa memberikan keyword-keyword
yang berhubungan dengan topik tersebut. Faktor lain yang perlu diperhatikan
adalah adanya broken link atau javascript error pada website.

2.

Faktor Eksternal (berhubungan dengan link popularity)
Seperti yang telah dijelaskan sebelumnya, faktor internal lebih berkaitan

dengan aspek yang ada dalam sebuah website. Faktor internal sangat mudah
dimanipulasi, sehingga search engine tidak mungkin menggunakannya 100%
sebagai acuan untuk menghasilkan hasil pencarian yang berkualitas. Manipulasi
yang dimaksud adalah spamming, seperti penulisan konten menggunakan keyword
yang diulang-ulang secara berlebihan, penulisan teks yang warnanya sama dengan
warna pada latar belakangnya (background) sehingga pengunjung tidak dapat
membacanya. Hal-hal semacam ini tujuannya tidak lain untuk mengecoh crawler.
Search engine biasanya menggunakan faktor eksternal sebagai acuan relevansi
antara konten website dan keyword. Faktor yang dimaksud adalah link popularity,
yaitu banyaknya link dari website lain yang mengarah ke website. Semakin
banyak link dari luar, berarti nilai link popularity-nya semakin besar. Hal ini
menyebabkan semakin baik pula konten yang dimiliki. Link popularity sudah
umum dipakai acuan oleh search engine (Teknik SEO Indonesia, 2008).

2.2

Search Engine Google
Google Inc. merupakan sebuah perusahaan publik Amerika Serikat,

berperan dalam pencarian Internet dan iklan online. Perusahaan ini berbasis di
Mountain View, California, dan memiliki karyawan berjumlah 19.604 orang (30
Juni 2008). Filosofi Google meliputi slogan seperti "Don't be evil", dan "Kerja
harusnya

menantang

dan

tantangan

itu

harusnya

menyenangkan",

menggambarkan budaya perusahaan yang santai.
Google didirikan oleh Larry Page dan Sergey Brin ketika masih
mahasiswa di Universitas Stanford dan perusahaan ini merupakan perusahaan

10

saham pribadi pada 7 September 1998. Penawaran umum perdananya dimulai
pada tanggal 19 Agustus 2004, mengumpulkan dana $1,67 milyar, menjadikannya
bernilai $23 milyar. Melalui berbagai jenis pengembangan produk baru,
pengambilalihan dan mitra, perusahaan ini telah memperluas bisnis pencarian dan
iklan awalnya hingga ke area lainnya, termasuk email berbasis web, pemetaan
online, produktivitas perusahaan, dan bertukar video.

2.3

Search Engine Yahoo
Yahoo! adalah sebuah portal web populer yang dioperasikan oleh

perusahaan yang bernama Yahoo! Inc., yang dirintis oleh oleh David Filo dan
Jerry Yang. Yahoo! pada awalnya hanyalah semacam bookmark (petunjuk
halaman buku), ide itu berawal pada bulan April 1994, saat itu dua orang alumni
Universitas Stanford mendapat liburan ketika profesor mereka pergi ke luar kota
karena cuti besar. Dua mahasiswa teknik tersebut mempunyai sedikit pekerjaan
yang harus dilakukan selain menjelajah internet, sehingga tidak membutuhkan
waktu lama untuk mengkompilasi sebuah daftar bookmark yang besar, yang
dikelompokkan berdasarkan subyek. Kemudian mereka berpikir, mengapa tidak
memasukannya di web. Mereka kemudian bekerja membuat sebuah program
database untuk menanganinya, yang dapat memberikan hasil secara online.
Koleksi bookmark tersebut, sekarang dikenal sebagai Yahoo!, menerima sejumlah
80 juta pengunjung setiap bulan (sensus tahun 2000).

11

2.4

Search engine Ask Jeeves (Ask.com)
Ask.com (atau Ask Jeeves di Inggris Raya) adalah sebuah mesin pencari

yang dimulai pada tahun 1996 oleh Garrett Gruener dan David Warthen di
Berkeley, California. Original perangkat lunak mesin pencari ini dilaksanakan
oleh Gary Chevsky dari desain sendiri. Chevsky, Justin Grant, dan lain-lain
membangun situs Ask Jeeves. Tiga perusahaan modal ventura, Highland Capital
Partners, Institutional Venture Partner, dan The RODA Group adalah investor
awal. Ask.com saat ini dimiliki oleh IAC/Inter ActiveCorp di bawah symbol
NASDAQ IACI. Ask.Com Ini awalnya dikenal sebagai Ask Jeeves.

"Jeeves"

adalah nama "Pribadi Pria Gentleman", atau pelayan (Diilustrasikan Oleh Marcos
Sorensen), mengambil jawaban untuk setiap pertanyaan yang diajukan. Karakter
didasarkan

pada

Jeeves, Bertie Wooster fiksi pelayan dari karya-karya

PGWodehouse.

2.5

Search engine Altavista
AltaVista diciptakan oleh para peneliti dari Digital Equipment

Corporation's Western Research Laboratory yang mencoba memberikan layanan
untuk di jaringan publik agar lebih mudah mendapatkan file. Ide awal ditemukan
oleh dua orang yaitu Louis Monier yang menulis crawler dan Michael Burrows
yang menulis indexer. Nama AltaVista merupakan nama yang dipilih oleh
perusahaan di Palo Alto. AltaVista diluncurkan ke publik umum sebagai search
engine

Internet

pada

tanggal

15

Desember

1995

dengan

alamat

http://altavista.digital.com/.
Saat peluncuran, layanan search engine ini mempunyai dua inovasi yang
mana men-setnya di depan search engine lainnya. Penggunaannya cepat, multithreaded crawler (Scooter) yang meliputi lebih banyak halaman web dan suatu
pencarian back-end efisien running pada advanced hardware. Terhitung sejak
tahun 1998, search engine ini menggunakan 20 mesin multi-processor DEC’s 64bit Alpha processor. Setiap mesin mempunyai 130 GB RAM, 500 GB space
harddisk dan menerima 13 juta queries perhari. Hal ini membuat AltaVista
pencari pertama, full-text database dari bagian besar World Wide Web. Fitur
pembeda AltaVista dengan Search engine lainnya saat ini adalah minimalistic

12

inteface yang dimilikinya; fitur akan hilang ketika ia menjadi suatu portal, tetapi
ada kembali saat ia mengulang kembali usahanya pada fungsi pencariannya
Site AltaVista tergolong sukses, terlihat dari Traffic-nya yang meningkat
tajam dari 300.000 pengunjung pada hari pertama menjadi 80 juta pengunjung
setiap hari. Kemampuan pencarian web, dan layanan AltaVista khususnya,
menjadi pokok materi pada banyak artikel dan bahkan beberapa buku. AltaVista
sendiri menjadi salah satu tujuan teratas pada web, dan tahun 1997 akan layak
mendapatkan US$50 juta dalam sponsorship revenue.

2.6

Search engine Scirus
Scirus adalah search engine yang khusus secara komprehensif digunakan

untuk pencarian ilmiah. Seperti halnya dengan CiteSeer dan Google Scholar yang
di fokuskan pada informasi ilmiah. Tidak seperti CiteSeer, Scirus tidak hanya
untuk informasi teknologi dan ilmu komputer serta tidak hanya hasil tetapi
seluruh teks dapat ditampilkan. Scirus juga berguna untuk hasil pencarian ilmiah
pada scopus, abstrak dan rujukan database meliputi keluaran pencarian ilmiah
secara global. Scirus dimiliki dan dioperasikan oleh Elsevier.
Scirus adalah sebuah mesin pencari web gratis yang dikembangkan
terutama bagi para ilmuwan, peneliti dan mahasiswa. Ini memungkinkan
seseorang mencari informasi ilmiah untuk menentukan informasi yang mereka
perlukan - termasuk peer-review artikel, informasi paten, penulis halaman rumah
dan situs web universitas - dengan cepat dan mudah. Scirus menawarkan pilihan
pencarian Dasar dan Advanced. Dengan fasilitas pencarian Advanced, pengguna
dapat lebih spesifik memilih informasi apa yang dicari (memilih area subyek atau
sumber konten misalnya) sebelum melakukan pencarian.

2.7

Precision and Recall
Cara yang paling efektif untuk menguji kehandalan sebuah search engine

adalah dengan meneliti tingkat precision and recall nya . Precision adalah jumlah
kelompok dokumen relevan dari total jumlah dokumen ditemukan oleh sistem.
Sedangkan, recall diartikan sebagai jumlah dokumen relevan yang ditemukan
oleh sistem (Hardi 2006).

13

Precision dan Recall adalah dua alat pengukur yang efektif untuk
mengevaluasi kualitas hasil di dalam domain seperti sistem temu kembali
informasi dan pengklasifikasian secara statistik.
Pengujian Precision and Recall pada search engine Google, Yahoo, Ask
Jeeves, Altavista dan Scirus
Proses pengujian terdiri dari 3 tahap:
1. Mengumpulkan literatur baik dalam bentuk cetak maupun elektronik.
2. Menyeleksi search engine dan menentukan query

yang

akan

digunakan untuk penelusuran.
3. Penelusuran dengan search engine
Pemilihan search engine mengacu pada:
1. Banyaknya hasil pembahasan mengenai search engine oleh para
pakar/penulis di Internet
2. Banyaknya publik/orang yang menggunakannya (search engine)
3. Popularitas search engine
Search engine yang dipilih yaitu :
1. Google
2. Yahoo
3. Ask Jeeves
4. AltaVista
5. Scirus
Penelitian ini menggunakan 15 istilah kata bidang ilmu komputer. Bahan
diambil dari Prosiding
2003”.

“2003 Congress on Evolutionary Computation CEC

Istilah kata pencarian yang diperoleh diklasifikasikan ke dalam 3

kelompok yaitu Kata Tunggal, Gabungan dan Kompleks.
1.

Kata Tunggal antara lain :
a. “Hybrid”
b. “Optimization”
c. “Evolutionary”
d. “Mining”
e. “Genetic”

14

2.

Kata Gabungan antara lain :
a. “genetic algorithm”
b. “singular value decomposition”
c. “dynamic environment”
d. “explicit learning”
e. “foot patterns”

3.

Kata Kompleks antara lain :
a. “genetic programming” OR “distribution programming” AND
problem
b. “multi-criteria evaluation” AND “ “data mining”
c. “genetic mining” AND genes
d. “singular value decomposition” AND genetic algorithm” AND
performance
e. Clustering OR “memetic algorithms”
Di dalam search engine terdapat dua metode pencarian yaitu simple dan

advance mode. Di dalam penelitian ini, pencarian dokumen yang dilakukan pada
lima search engine menggunakan advanced mode. Metode ini dipilih agar
penjaringan informasi memiliki tingkat precision yang lebih tinggi. Untuk kata
tunggal dan kompleks digunakan “match all of the words” dan “exact phrase”,
sedangkan untuk gabungan digunakan “exact phrase”. Hasil temuan dikontrol
dengan hanya menggunakan bahasa Inggris.
Dari masing-masing search engine diperoleh hasil pencarian dalam
jumlah yang sangat besar, akan tetapi dalam penelitian ini dibatasi hanya pada 10
hasil temuan yang muncul pada halaman pertama saja. Pengujian dilakukan pada
hari yang sama untuk kelima search engine tersebut, guna menghindari terjadinya
variasi hasil pencarian yang disebabkan oleh updating algoritma pengindeksan
dari masing-masing search engine (Clarke & Willet, 1997). Pengujian precision
and recall terhadap lima search engine ini dilakukan di bulan Mei, Juni dan Juli
tahun 2009.
Pengujian yang dilakukan dalam penelitian ini yaitu dengan menilai
precision dan recall dari search engine Google, Yahoo, Ask Jeeves, Altavista dan
Scirus. Precision adalah jumlah kelompok dokumen relevan dari total dokumen

15

ditemukan oleh sistem (Clarke & Willet, 1997). Rumus penilaian precision
menurut Shafi dan Rather (2005) dalam artikel ilmiah yang berjudul “Precision
and Recall of Five Search Engines for Retrieval of Scholarly Information in The
Field of Biotechnology” serta Hardi (2006) dalam artikel berjudul “Sebuah
Eksperimentasi Penilaian Precision and Recall Untuk Informasi Ilmiah Bidang
Ilmu Perpustakaan Dan Informasi“ , sebagai berikut :

Precision =

Jumlah skor dokumen ilmiah ditemukan oleh search engine
-------------------------------