Pengembangan sistem simulasi pemeringkatan webometrics

PENGEMBANGAN SISTEM SIMULASI
PEMERINGKATAN WEBOMETRICS

SYAMSUL BACHRI

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011

ABSTRACT
SYAMSUL BACHRI. Development of Webometrics Ranking Simulation System.
Supervised by KUDANG BORO SEMINAR and FIRMAN ARDIANSYAH.
Currently, university’s website is not only as university representation in internet but also as
information and knowledge spreading media. University’s activity through website may reflects its
quality whether good or not. A research group, Cybermetric Lab, trying to rank universities arround
the world by using bibliometric and informetric approach. According to Webometrics team, the
ranking measured based on four indicators: size means amount of web pages that indexed by search
engine, visibility is means amount of incoming links from another website, rich file means amount of
rich content documents that is indexed by search engine, and scholar means amount of jounal or

scientific-related document that is indexed by search engine.
Webometric ranking published twice yearly, therefore created system that could detemine
website ranking everyday. The system determines the ranking based on webometrics indicator that the
value of each indicator taken everyday from Yahoo! Search, Google Search, Bing Search, Exalead
Search, and Google Scholar. Each indicator has a weight, 50% for visibility, 25% for size, 15% for
each rich file and scholar. System outputs are indicator values and the ranking as chart and data-table.
Keywords: website, webometrics ranking, indicator.

PENGEMBANGAN SISTEM SIMULASI
PEMERINGKATAN WEBOMETRICS

SYAMSUL BACHRI

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR
BOGOR
2011

Judul
Nama
NIM

: Pengembangan Sistem Simulasi Pemeringkatan Webometrics
: Syamsul Bachri
: G64060956

Menyetujui:

Pembimbing I,

Pembimbing II,

Prof. Dr. Ir. Kudang Boro Seminar, M.Sc
NIP. 19591118 198503 1 004


Firman Ardiansyah, S.Kom, M.Si
NIP. 19790522 200501 1 003

Mengetahui:
Ketua Departemen Ilmu Komputer,

Dr. Ir. Sri Nurdiati, M.Sc.
NIP. 19601126 198601 2 001

Tanggal Lulus: 29 September 2010

PRAKATA
Segala puji syukur penulis panjatkan kepada Allah SWT atas segala limpahan nikmat dan karuniaNya sehingga penulis dapat menyelesaikan skripsi yang berjudul Pengembangan Sistem Simulasi
Pemeringkatan Webometrics ini. Penelitian ini dilaksanakan mulai Mei 2010 sampai Juli 2010,
bertempat di Departemen Ilmu Komputer IPB.
Ucapan terima kasih penulis sampaikan kepada kedua orang tua penulis atas segala doa dan
dukungannya selama ini. Penulis mengucapkan terima kasih kepada dosen pembimbing, Bapak Prof.
Dr. Ir. Kudang Boro Seminar, M.Sc. dan Bapak Firman Ardiansyah, S.Kom., M.Si., atas segala
bimbingan dan saran selama penyelesaian skripsi. Penulis juga mengucapkan terima kasih kepada

pihak-pihak yang telah membantu penyelesaian skripsi ini.
Ucapan terima kasih juga penulis sampaikan kepada ketiga adik penulis yang selalu memberikan
inspirasi, teman-teman Ilkomerz 43 atas kebersamaan, kehangatan dan keceriaannya, dan berbagai
pihak lainnya.
Semoga tulisan ini bermanfaat, amin.

Bogor, Juni 2011
Syamsul Bachri

RIWAYAT HIDUP
Penulis dilahirkan di Tangerang, Banten, pada tanggal 12 Juni 1989 dari pasangan Sapri dan
Maimunah. Penulis merupakan anak kedua dari dua bersaudara. Pada tahun 2006 penulis lulus dari
Sekolah Menengah Atas (SMA) Negeri 86 Jakarta dan diterima di IPB melalui jalur Undangan
Seleksi Masuk IPB (USMI) di Departemen Ilmu Komputer. Selama di Departemen Ilmu Komputer
IPB penulis pernah beberapa kali menjadi asisten praktikum untuk mata kuliah Bahasa Pemrograman,
Penerapan Komputer, Komputer Grafik, Pengembangan Sistem Berorientasi Objek. Selain itu juga
pada tahun 2009 sampai 2010 penulis pernah menjadi Microsoft Student Partners untuk IPB.

DAFTAR ISI
Halaman

DAFTAR TABEL ............................................................................................................................. v
DAFTAR GAMBAR ........................................................................................................................ v
DAFTAR LAMPIRAN ..................................................................................................................... v
PENDAHULUAN............................................................................................................................. 1
Latar Belakang............................................................................................................................. 1
Tujuan.......................................................................................................................................... 1
Ruang Lingkup ............................................................................................................................ 1
Manfaat Penelitian ....................................................................................................................... 1
TINJAUAN PUSTAKA .................................................................................................................... 1
Webometrics Ranking .................................................................................................................. 1
Internet dan World Wide Web (WWW) ....................................................................................... 2
Rekayasa Perangkat Lunak .......................................................................................................... 2
Metode Pengujian Black Box ....................................................................................................... 2
METODE PENELITIAN .................................................................................................................. 3
Studi Pustaka ............................................................................................................................... 3
Analisis Kebutuhan Sistem .......................................................................................................... 3
Perancangan Sistem ..................................................................................................................... 3
Pengembangan Sistem ................................................................................................................. 3
Pengujian ..................................................................................................................................... 3
Evaluasi ....................................................................................................................................... 3

HASIL DAN PEMBAHASAN ......................................................................................................... 3
Analisis Kebutuhan dan Batasan Sistem ..................................................................................... 3
Perancangan Sistem ..................................................................................................................... 4
Pengembangan Sistem Simulasi .................................................................................................. 4
Lingkungan Pengembangan ........................................................................................................ 4
Pengambilan Data Indikator dari Mesin Pencari ......................................................................... 5
Penghitungan Score dan Peringkat .............................................................................................. 5
Analisis Korelasi Antar Indikator ................................................................................................ 7
Visualisasi Data Indikator, Score, dan Peringkat ........................................................................ 8
Hasil Program .............................................................................................................................. 8
Masalah yang Ditemui setelah Sistem Dipasang di Production Server ....................................... 8
Evaluasi ....................................................................................................................................... 8
KESIMPULAN DAN SARAN ....................................................................................................... 10
Kesimpulan ................................................................................................................................ 10
Saran .......................................................................................................................................... 10
DAFTAR PUSTAKA ..................................................................................................................... 10
LAMPIRAN .................................................................................................................................... 12

iv


DAFTAR TABEL
Halaman
Parameter Rich File ..................................................................................................................... 5
Nilai korelasi komponen size ....................................................................................................... 7
Peringkat universitas menurut Simulasi dan Webometrics (Juli 2010) ....................................... 9
Komponen peringkat universitas berdasarkan nilai indikator menurut Simulasi (20 Juli
2010) ............................................................................................................................................ 9
5 Komponen peringkat universitas berdasarkan indikator menurut Webometrics (20 Juli
2010) .......................................................................................................................................... 10

1
2
3
4

DAFTAR GAMBAR
Halaman
1
2
3

4

Tahapan penelitian. ...................................................................................................................... 3
Arsitektur MVC yang digunakan sistem. .................................................................................... 4
Alur kerja sistem simulasi. .......................................................................................................... 4
Proses penentuan peringkat situs. ................................................................................................ 6

DAFTAR LAMPIRAN
Halaman
1
2
3
4
5
6

Entity Relationship Diagram ..................................................................................................... 13
URL End Point .......................................................................................................................... 14
Contoh pengambilan nilai indikator dari mesin pencari ............................................................ 15
File konfigurasi pola regular expression ................................................................................... 17

Contoh penghitungan score dan penentuan ranking .................................................................. 18
Antarmuka sistem simulasi ........................................................................................................ 19

v

PENDAHULUAN
Latar Belakang
Saat ini situs web universitas tidak hanya
menjadi representasi universitas tersebut di
dunia maya tapi juga menjadi media
penyebaran informasi atau pengetahuan yang
dimiliki oleh universitas tersebut. Aktivitas di
dunia maya tersebut dapat dicerminkan
berdasarkan impact dan size situs tersebut.
Cybermetrics Lab sebuah grup riset dari
Spanyol membuat pemeringkatan universitas
di
dunia
menggunakan
pendekatan

bibliometric dan informetric yang disebut
Webometrics Ranking of World Universities.
Webometrics Ranking kemudian menjadi
populer dan menjadi parameter apakah suatu
universitas baik atau tidak berdasarkan
indikator-indikator Webometrics.
Peringkat yang dibuat Webometrics
diumumkan dua kali dalam satu tahun atau
enam bulan satu kali. Dengan demikian perlu
dibuat
suatu
sistem
yang
dapat
mensimulasikan
pemeringkatan
yang
dilakukan oleh Webometrics. Simulasi ini
digunakan untuk mengetahui posisi atau
peringkat serta berapa nilai indikator suatu

universitas dari hari ke hari. Selain itu
universitas bisa lebih fokus meningkatkan
indikator-indikator Webometrics yang kurang
untuk meningkatkan peringkat universitas
tersebut di edisi yang mendatang.
Tujuan
Tujuan dari penelitian ini adalah:
 mempelajari dan mengidentifikasi cara
perhitungan
peringkat
universitas
menurut Webometrics,
 membangun sebuah sistem berbasis web
yang dapat menentukan peringkat terbaru
suatu universitas berdasarkan model
perhitungan Webometrics.
Ruang Lingkup
Ruang lingkup dalam penelitian ini adalah:
 situs universitas yang diambil adalah
universitas yang masuk 10 besar dunia
menurut Webometrics pada Januari 2010
dan universitas yang berasal dari
Indonesia,
 proses
pengambilan
data
dan
penghitungan nilai dan peringkat situs
dilakukan satu kali per hari,
 penghitungan nilai mengikuti model
penghitungan yang dipublikasikan oleh
Webometrics,

 aspek-aspek di luar parameter model
perhitungan seperti regulasi tidak
diperhitungkan.
Manfaat Penelitian
Manfaat yang diharapkan dari penelitian
ini adalah:





dapat memberikan informasi terbaru
peringkat universitas berdasarkan model
perhitungan Webometrics,
dapat menjadi salah satu rujukan atau
bahan koreksi bagi universitas untuk
meningkatkan indikator Webometrics
universitas,
dapat menjadi salah satu pertimbangan
dalam penilaian lomba web situs unit
kerja Institut Pertanian Bogor.

TINJAUAN PUSTAKA
Webometrics Ranking
Webometrics merupakan ilmu yang
mempelajari aspek kuantitatif dari konstruksi
dan penggunaan sumberdaya informasi,
struktur dan teknologi di Web menggunakan
pendekatan bibliometrics dan informetrics
(Björneborn
&
Ingwersen
2004).
Bibliometrics adalah studi kuantitatif dari unit
fisik buku yang dipublikasikan atau unit dari
bibliografi. Informetrics adalah studi tentang
aspek kuantitatif informasi dalam bentuk
apapun atau dengan kata lain tidak harus
dalam bentuk buku atau jurnal.
World Universities ranking on the Web
merupakan inisiatif dari Cybermetrics Lab,
grup riset dari Centro de Ciencias Humanas
y Sociales (CCHS) bagian dari National
Research Council (CSIC) yang merupakan
badan riset publik terbesar di Spanyol.
Webometrics Ranking of World Universities
pertama kali dipublikasikan pada tahun 2004,
dan diperbarui setiap enam bulan. Data
dikumpulkan pada Januari dan Juli tiap tahun
dan dipublikasikan peringkat terbaru setelah
satu bulan kemudian.
Aktivitas universitas sangat kompleks dan
multidimensi. Aktivitas universitas tersebut
dapat dicerminkan melalui keberadaan situs
web universitas tersebut. Pemeringkatan yang
dibuat oleh Cybermetrics Lab dibangun
dengan menggabungkan indikator-indikator
yang mengukur aspek-aspek yang berbeda
(Webometrics 2010).
Indikator-indikator Webometrics yang
benar-benar dipertimbangkan adalah total
publikasi elektronik di situs utama universitas

1

(size) dan visibility halaman web menurut
banyaknya external inlink yang mereka terima
dari situs web lain (impact). Kedua variabel
tersebut memiliki rasio 1:1. Aspek lain seperti
desain, aksesibilitas, banyaknya pengunjung
tidak termasuk aspek yang diperhitungkan
dalam Webometrics. Komponen size dipecah
menjadi tiga variabel yaitu banyaknya
halaman web (20%), banyaknya dokumen
dengan format pdf, doc, ps, dan ppt (15%),
dan banyaknya paper atau jurnal yang ada di
Google Scholar (15%). Sedangkan 50%
sisanya untuk banyaknya sitasi (site link
citations) (Aguillo 2009). Ada empat indikator
yang menjadi ukuran suatu situs antara lain
sebagai berikut:
 Size (S). Indikator ini merupakan
banyaknya halaman yang terdapat di
empat mesin pencari, yaitu Google,
Yahoo, Live Search (sekarang Bing), dan
Exalead,
 Visibility (V). Indikator ini menunjukkan
total unique external link yang masuk
(inlinks) yang didapatkan dari Yahoo
Search,
 Rich File (R). Total publikasi akademik
dalam file dengan format Adobe Acrobat
(.pdf), Adobe PostScript (.ps), Microsoft
Word (.doc) dan Microsoft Powerpoint
(.ppt),
 Scholar (Sc). Banyaknya paper dan sitasi
untuk masing-masing domain yang
terdapat di Google Scholar.
Empat indikator di atas dinormalisasi
menggunakan logaritma sehingga nilai
maksimum untuk masing-masing indikator
adalah satu. Indikator-indikator tersebut
memiliki proporsi atau bobot yang berbedabeda. Menurut Aguillo (2009), cara
penghitungan untuk masing-masing indikator
adalah sebagai berikut:
.......(1)
.................................(2)

Setelah diperoleh score untuk masingmasing situs, situs diurutkan secara menurun
berdasarkan score tersebut sehingga diperoleh
peringkat untuk masing-masing situs.
Internet dan World Wide Web (WWW)
Internet merupakan kumpulan dari ribuan
jaringan individu atau organisasi yang saling
terhubung. Salah satu bagian dari Internet
yaitu World Wide Web (WWW). WWW
merupakan jaringan global server Internet
yang memberikan akses ke dokumendokumen yang dapat ditautkan baik secara
lokal maupun jarak jauh. World Wide Web
saat ini banyak digunakan sebagai salah satu
sumber utama pencarian penelitian dan
informasi melalui pustaka digital dan
dokumen
elektronik
seperti
e-journal
(Jeyshankar & Babu 2009).
Rekayasa Perangkat Lunak
Rekayasa perangkat lunak adalah sebuah
pendekatan yang mengintegrasikan proses,
metode, dan alat bantu dalam pengembangan
perangkat lunak dengan meninjau produksi
perangkat lunak sebagai masalah utamanya.
Dalam
mengembangkan
suatu
sistem
perangkat lunak terdapat berbagai model yang
sering digunakan. Setiap model tersebut
memiliki kelebihan dan kekurangan masingmasing, namun semuanya memiliki tahapan
yang sama. Tahapan tersebut yaitu tahap
analisis, perancangan, implementasi, dan
pengujian (Pressman 2005).
Metode Pengujian Black Box

..................................(3)
..................................(4)


..............................(5)
...................................(6)

Pengujian black box atau pengujian
fungsional adalah suatu pendekatan pengujian
yang didasarkan pada spesifikasi komponen
atau program. Pengujian yang dilakukan
berfokus pada fungsional kebutuhan perangkat
lunak. Sistem yang akan diuji adalah sebuah
kotak hitam yang kemampuannya hanya bisa
ditentukan dengan mempelajari masukan dan
keluarannya. Pengujian hanya berfokus pada

2

fungsionalitas sistem, bukan pada perangkat
lunaknya (Pressman 2005).

METODE PENELITIAN
Secara umum, metode penelitian yang
dilakukan terdiri atas beberapa tahap. Hal ini
terlihat pada Gambar 1.

folder, alur penggunaan sistem oleh user, dan
GUI (Graphical User Interface) sistem.
Pengembangan Sistem
Pada tahap ini, dilakukan pembuatan
antarmuka pengguna, database, dan kode
program sesuai dengan hasil analisis dan
perancangan.
Pengujian

Mulai

Studi Pustaka

Analisis Kebutuhan
Sistem

Pengujian dilakukan untuk mencari dan
memperbaiki kesalahan yang terjadi pada
sistem yang menyebabkan keluaran atau hasil
yang diinginkan keluar dengan hasil yang
tidak diinginkan. Kesalahan yang diperbaiki
adalah kesalahan dalam proses kompilasi dan
kesalahan logic. Metode pengujian yang
digunakan pada sistem simulasi ini adalah
metode blackbox.
Evaluasi

Perancangan Sistem

Pengembangan Sistem

Evaluasi
dilakukan
dengan
membandingkan
hasil
peringkat
yang
diberikan oleh sistem simulasi dengan hasil
peringkat
yang
diumumkan
oleh
Webometrics.

HASIL DAN PEMBAHASAN

Pengujian Sistem

Analisis Kebutuhan dan Batasan Sistem
Evaluasi

Selesai
Gambar 1 Tahapan penelitian.

Sistem
Simulasi
Pemeringkatan
Webometrics
merupakan
sistem
yang
bertujuan untuk memberikan informasi terbaru
tentang nilai-nilai indikator dan posisi suatu
situs web universitas terhadap universitas lain.
Fungsi-fungsi yang disediakan oleh sistem
simulasi ini antara lain sebagai berikut:


Studi Pustaka
Pada tahap ini dilakukan pembelajaran
mengenai studi kasus atau permasalahan yang
akan diselesaikan. Selain itu, studi pustaka
juga dilakukan dengan mencari referensi ilmu
untuk mendukung dalam penyelesaian
masalah.





Analisis Kebutuhan Sistem
Pada tahap ini, kegiatan yang dilakukan
adalah mengumpulkan dan menganalisis
kebutuhan dan batasan-batasan sistem yang
akan dikembangkan.
Perancangan Sistem
Pada tahap perancangan sistem, dilakukan
perancangan database, struktur kode, file dan

menampilkan peringkat dan data nilai
indikator terbaru situs web,
menampilkan data nilai indikator situs
web dari hari ke hari,
menvisualisasikan peringkat dan data
nilai indikator dalam bentuk grafik,
mendukung
untuk
menambah,
mengubah, dan menghapus situs yang
terdaftar di dalam sistem.

Batasan-batasan sistem simulasi ini antara
lain sebagai berikut:




ada sistem lain yang dapat memicu
sistem simulasi untuk mulai melakukan
pengambilan data dan simulasi,
sistem yang dikembangkan berbasis web,
sistem harus terhubung dengan jaringan
Internet.

3


Perancangan Sistem
Perancangan sistem dibagi menjadi dua
bagian yaitu perancangan pangkalan data dan
perancangan arsitektur sistem.




Perancangan pangkalan data
Data yang digunakan adalah data nilai
indikator yang diperoleh dari mesin
pencari dan data situs web yang
didaftarkan ke dalam sistem oleh
pengguna. Hasil perancangan pangkalan
data dapat dilihat pada Lampiran 1.
Perancangan arsitektur sistem
Arsitektur sistem ini menggunakan
arsitektur
MVC
(Model-ViewController). Arsitektur ini menekankan
pada pembagian komponen-komponen
program menjadi tiga bagian utama yaitu
Model, View, dan Controller. Tujuan dari
pembagian komponen menjadi bagianbagian ini adalah untuk memisahkan
tanggung jawab dan peran masingmasing komponen. Arsitektur MVC
dapat dilihat pada Gambar 2.





modul yang bertugas mengambil data
indikator dari mesin pencari,
modul yang bertugas menghitung score
dan menentukan peringkat suatu situs,
modul yang bertugas menampilkan hasil
akhir yaitu berupa nilai-nilai indikator
dan score ke pengguna,
modul
yang
bertugas
membuat
visualisasi nilai indikator dan score
berupa grafik.

Cara
sistem
simulasi
menentukan
peringkat suatu situs dapat dilihat pada
Gambar 3.
mulai

Ambil data indikator
dari mesin pencari

Data indikator

Simpan data indikator
ke database

Hitung peringkat

Peringkat
situs

Gambar 2 Arsitektur MVC yang digunakan
sistem.

Tampilkan data indikator
dan peringkat situs

Pengembangan Sistem Simulasi
Sistem simulasi ini dikembangkan
menggunakan bahasa pemrograman PHP di
sisi server dan JavaScript di sisi client. Kode
program PHP dikembangkan menggunakan
framework CodeIgniter. Kode program
JavaScript
dikembangkan
menggunakan
framework jQuery. Kedua framework ini
dipilih
karena
framework
tersebut
menyediakan pustaka-pustaka atau fungsi
dasar yang umum digunakan, dokumentasi
dan contoh program yang jelas, komunitas dan
penggunanya banyak, ringan dan cepat,
pustaka tambahan seperti plugin mudah
didapatkan, serta sumber pembelajaran yang
mudah didapatkan.
Pembuatan kode program dibagi menjadi
beberapa modul antara lain sebagai berikut:

Selesai

Gambar 3 Alur kerja sistem simulasi.
Lingkungan Pengembangan
Spesifikasi perangkat keras dan perangkat
lunak untuk pengembangan sistem simulasi ini
adalah sebagai berikut:




Perangkat Keras
Prosesor Intel Core i3 2.27 GHz, 2 GB
RAM, harddisk berkapasitas 320 GB,
mouse, keyboard, monitor.
Perangkat Lunak
Sistem Operasi Windows 7 Ultimate,
Netbeans 6.8 digunakan untuk membuat
kode program (PHP, Javascript, HTML,

4

dan CSS), PHP 5.3 digunakan sebagai
interpreter kode PHP, MySQL 5.0
digunakan
sebagai
Database
Management System (DBMS), MySQL
Workbench OSS 5.2 digunakan untuk
proses administrasi database dan
debugging kode SQL, Mozilla Firefox,
Chromium, Google Chrome dan Internet
Explorer 8 digunakan untuk melihat hasil
program, IETester digunakan untuk
mengecek kompatibilitas sistem simulasi
pada beberapa versi Internet Explorer.
Pengambilan Data Indikator dari Mesin
Pencari
Proses pengambilan data dilakukan secara
otomatis setiap hari pada pukul 05:00 WIB di
saat jaringan IPB belum terlalu padat untuk
menghindari
kegagalan
pada
proses
pengambilan data. Mesin pencari yang
dijadikan sebagai sumber data yaitu Google,
Yahoo, Bing, Exalead, dan Google Scholar.
Sumber pengambilan data indikator adalah
sebagai berikut:
 indikator Visibility diambil dari Yahoo,
 indikator Size diambil dari Google, Bing,
Yahoo, dan Exalead,
 indikator Rich file diambil dari Google,
 indikator Scholar diambil dari Google
Scholar.
Data diambil dengan melakukan request
ke mesin pencari dengan menambahkan
parameter tambahan untuk masing-masing
indikator di URL. Daftar URL yang diakses
dapat dilihat pada Lampiran 2. Bentuk request
untuk setiap parameter adalah sebagai berikut:






Visibility dengan asumsi example.edu
adalah nama situs universitas
linkdomain:example.edu –
site:example.edu

Parameter Size di mesin pencari Google,
Yahoo, Bing, dan Exalead dengan
example.edu sebagai nama situs adalah:
site:example.edu
Parameter Rich File pada mesin pencari
Google dapat dilihat pada Tabel 1

Tabel 1 Parameter Rich File
Format Parameter
PDF
PS
PPT
DOC

filetype:pdf

site:example.edu

filetype:ps site:example.edu
filetype:ppt site:example.edu
filetype:doc

site:example.edu



Parameter Scholar pada Google Scholar
adalah:
site:example.edu

Contoh pengambilan nilai indikator dari
mesin pencari dapat dilihat pada Lampiran 3.
Response yang diterima dari mesin pencari
adalah teks HTML. Pada teks HTML tersebut
kemudian dilakukan parsing menggunakan
regular expression untuk diambil bagian
string yang menyatakan nilai untuk tiap-tiap
indikator.
Beberapa mesin pencari seperti Bing,
Google, dan Yahoo menyediakan Web Service
API (Application Programming Interface)
yang bisa diakses langsung dari program.
Namun hasil yang diperoleh jauh berbeda
dibandingkan hasil yang diberikan bila
menggunakan Web Search biasa. Sedangkan
mesin pencari Exalead dan Google Scholar
memang tidak menyediakan API sehingga
diperlukan proses parsing untuk mendapatkan
data indikator. Kekurangan dari proses
parsing HTML ini yaitu parsing akan gagal
mengambil string yang diinginkan bila suatu
saat mesin pencari mengubah HTML yang
dikembalikan ke sistem. Hal ini sudah
diantisipasi dengan membuat sebuah file
konfigurasi yang berisi pola regular
expression untuk masing-masing mesin
pencari. File konfigurasi tersebut dapat dilihat
pada Lampiran 4.
Data nilai indikator masing-masing situs
yang telah diperoleh tersebut kemudian
disimpan ke database untuk diproses pada
proses penghitungan score dan peringkat situs.
Penghitungan Score dan Peringkat
Setelah proses pengambilan data indikator
dari mesin pencari telah selesai, data yang
telah tersimpan di database diambil untuk
digunakan pada proses penghitungan score.
Urutan penghitungan yang dilakukan oleh
sistem simulasi ini antara lain sebagai berikut:
1 Penentuan nilai maksimum untuk setiap
indikator. Pada tahap ini, ditentukan nilai
maksimal
masing-masing
indikator
berdasarkan waktu tertentu.
2 Normalisasi nilai tiap-tiap indikator
untuk setiap situs. Pada tahap ini, nilai
indikator dinormalisasi agar nilai
indikator berada pada rentang nilai yang
yang sama, yaitu dari 0 sampai 1, karena
nilai indikator bervariasi dan pada
rentang yang berbeda-beda.
3 Penghitungan nilai score.
4 Pengurutan situs berdasarkan score
secara menurun.

5

5 Peringkat atau ranking diperoleh dari
urutan situs yang telah diurutkan
berdasarkan score.
Urutan penghitungan dapat dilihat pada
Gambar 4.
mulai

Ambil data indikator
dari database

Data
indikator

hitung nilai logaritmanya. Nilai maksimum
yang
berkorespondesi
juga
hitung
logaritmanya
setelah
nilai
maksimum
ditambahkan satu. Hasil logaritma nilai
indikator kemudian dibandingkan dengan hasil
logaritma dari nilai maksimum sehinggga
diperoleh nilai normalisasi untuk indikator
yang berkorespondensi. Jadi, normalisasi
untuk setiap indikator adalah:

........... (8)
................ (9)
.............. (10)

Hitung nilai maksimum
setiap indikator

............ (11)
Normalisasi nilai
indikator

........... ...(12)

Hitung score situs

..................... (13)

Score diurutkan
menurun

........................... (14)
.......................(15)

Peringkat
situs

...................... (16)
Simpan
peringkat ke
database

Selesai

Gambar 4 Proses penentuan peringkat situs.
Nilai normalisasi x diperoleh dengan
membandingkan hasil logaritma x, loga x,
dengan hasil logaritma nilai maksimum dari
koleksi x, loga xmax. Peubah x adalah suatu
bilangan positif, dan a adalah bilangan pokok.
............................. (7)
Nilai setiap indikator dinormalisasi
berdasarkan persamaan (7). Normalisasi
dilakukan setelah nilai maksimum untuk
setiap nilai indikator diperoleh. Kemudian
nilai setiap indikator ditambahkan satu lalu

............... (17)
Setelah setiap nilai normalisasi indikator
diperoleh, dilakukan penghitungan tahap
berikutnya yaitu penghitungan nilai untuk
masing-masing komponen size, visibility, rich
file, dan scholar.
Nilai untuk komponen size diperoleh
dengan menjumlahkan semua nilai dari
masing-masing indikator size (Yahoo, Google,
Bing, Exalead). Hasil penjumlahan tersebut
kemudian dikurang dengan nilai maksimum
dan minimum di antara nilai size di Yahoo,
Google, Bing, dan Exalead. Hasil tersebut
kemudian dibagi dua. Hasil inilah yang
menjadi nilai untuk komponen size (Sd).
...................... (18)
................... (19)

6

.................... (20)
................ (21)
Nilai untuk komponen rich file (Rd)
diperoleh dengan menggabungkan nilai setiap
dokumen yang kemudian dibagi empat.

Diasumsikan bahwa nilai maksimum untuk
setiap indikator berada di salah satu
unversitas yang berada di peringkat 10 besar
dunia tersebut.
Contoh proses penghitungan score dan
penentuan ranking dapat dilihat pada
Lampiran 5.
Analisis Korelasi Antar Indikator

............ (22)
Setelah diperoleh nilai untuk masingmasing komponen, kemudian dilakukan
penghitungan score. Nilai score inilah yang
akan digunakan pada proses penentuan
peringkat situs.

........................... (23)
Pada proses normalisasi nilai indikator,
nilai indikator dinormalisasi menggunakan
logaritma. Namun Webometrics tidak
menjelaskan secara detil bilangan pokok yang
digunakan pada logaritma tersebut. Oleh
karena itu diasumsikan bahwa logaritma yang
digunakan adalah logaritma natural. Pemilihan
logaritma natural didasarkan pada hubungan
bahwa logaritma dengan sembarang bilangan
pokok dapat dinyatakan dalam logaritma
natural (Stewart 2001):

Analisis korelasi dilakukan untuk melihat
keterhubungan atau pengaruh antara satu
indikator dengan indikator yang lain. Proses
penghitungan dilakukan dengan menggunakan
bantuan software PSPP. Data yang digunakan
adalah lima belas data indikator situs yang
terdaftar di sistem sebelum dinormalisasi per
tanggal 20 Juli 2010. Metode analisis yang
digunakan adalah korelasi Pearson. Hubungan
yang ingin dilihat antara lain:




.................................. (24)
Diketahui persamaan normalisasi:
..................... (25)
Bila disubstitusi persamaan
persamaan (25) diperoleh:

(24)

ke

Tabel 2 Nilai korelasi komponen size
Peubah 1
Peubah 2
Korelasi
Google
Yahoo
0,69
Google
Bing
0,80
Google
Exalead
0,83
Yahoo
Bing
0,56
Yahoo
Exalead
0,60
Bing
Exalead
0,87

.......................... (26)

......................... (27)

Jadi, berapapun bilangan pokok yang
digunakan, nilai normalisasi yang diperoleh
akan memberikan hasil yang sama dengan
nilai normalisasi yang menggunakan logaritma
natural.
Universitas yang menjadi 10 besar dunia
pada edisi Januari 2010 juga ikut
diperhitungkan karena pada proses normalisasi
diperlukan nilai maksimum untuk tiap-tiap
indikator. Nilai maksimum tersebut digunakan
sebagai pembanding pada proses normalisasi.

hubungan antara visibility dan size di
Yahoo.
Dari
hasil
penghitungan
diperoleh koefisien korelasi 0,18.
Artinya hubungan antara visibility dan
size di Yahoo tidak kuat, atau dengan
kata lain visibility bisa dikatakan tidak
terpengaruh oleh size atau pun
sebaliknya,
hubungan antara komponen size (Google,
Yahoo, Bing, dan Exalead). Nilai
korelasi komponen size dapat dilihat
pada Tabel 2.

Dari Tabel 2, dapat dilihat bahwa
hubungan antar komponen size memiliki
hubungan yang kuat dan saling
mempengaruhi,
hubungan antara size di Google dan tiaptiap komponen rich file (Pdf, Ppt, Ps, dan
Doc). Nilai koefisien relasi untuk size
dan Pdf sebesar 0,43, untuk size dan Ppt
0,66, untuk size dan Ps 0,19, terakhir
untuk size dan Doc sebesar 0,29. Dari
keempat nilai tersebut hanya size dan Ppt
yang memiliki hubungan yang kuat.
Artinya size di Google dipengaruhi oleh
banyaknya dokumen Ppt, begitu juga
sebaliknya,

7





hubungan antara scholar dan rich file
(Pdf, Ppt, Ps, dan Doc). Nilai korelasi
antara scholar dan Pdf sebesar 0,49,
scholar dan Ppt 0,21, scholar dan Ps
sebesar 0,36, dan terakhir antara scholar
dan Doc sebesar 0,01. Dari nilai-nilai
tersebut, tidak ada hubungan yang cukup
kuat dan berpengaruh atanara scholar
dengan komponen yang ada di rich file,
hubungan antara size di Google dan
scholar. Nilai korelasi antara size di
Google dan scholar yaitu 0,01. Jadi
dapat dikatakan antara size di google dan
scholar memiliki hubungan yang lemah
dan tidak saling berpengaruh.

Visualisasi Data Indikator, Score, dan
Peringkat
Visualisasi data indikator, score, dan
peringkat berupa grafik yang ditampilkan ke
pengguna. Visualisasi digunakan untuk
memudahkan pengguna dalam membaca dan
memahami data indikator situs.
Visualisasi pada sistem simulasi ini
menggunakan komponen yang sudah ada.
Komponen yang digunakan pada sistem
simulasi ini yaitu Visifire Community Edition.
Komponen ini berbasis Microsoft Silverlight
yang berjalan di browser client. Visifire
dipilih karena dapat memenuhi kebutuhan
sistem untuk menampilkan grafik, penggunaan
yang mudah, multiplatform, crossbrowser.
Selain itu, Visifire berlisensi GNU GPL v3
yang dapat digunakan secara bebas.
Hasil Program
Sistem simulasi ini berbasis web sehingga
untuk melihat hasil program pengguna dapat
menggunakan web browser. Fitur program
yang disediakan sistem ini antara lain:








menampilkan daftar situs web beserta
nilai indikator dan peringkatnya,
menampilkan
perkembangan
nilai
indikator dari hari ke hari,
membandingkan nilai indikator antara
dua situs atau lebih,
menyimulasikan nilai indikator berupa
tabel nilai indikator yang dapat diubahubah oleh pengguna,
menambah, mengubah, dan menghapus
situs yang terdaftar di sistem,
mengubah konfigurasi sistem simulasi
seperti mengubah parameter saat
pengambilan data dari mesin pencari,
mengekspor data indikator ke format
Microsoft Excel (.xls) dan PDF (.pdf).

Tampilan program dapat dilihat pada
Lampiran 6.
Masalah yang Ditemui setelah Sistem
Dipasang di Production Server
Setelah sistem mampu untuk mengambil
dan menyimpan data dari mesin pencari,
sistem dipasang di production server milik
IPB dengan URL http://hosting.ipb.ac.id/~gdl.
Namun setelah dipasang di server tersebut
terdapat beberapa masalah yang muncul.
Masalah-masalah yang muncul setelah sistem
dipasang di production server antara lain
sebagai berikut:
 mesin pencari Google mendeteksi dan
melarang request yang dibuat secara
otomatis dan mengalihkan request ke
halaman lain. Sehingga response yang
diberikan oleh Google bukan halaman
hasil pencarian seperti yang diharapkan.
Untuk menghindari pengalihan oleh
Google, dalam proses pengambilan data
dari Google diberikan jeda antara dua
request yang berurutan. Lama jeda yang
ditentukan secara acak (random) yang
berada pada selang 1 sampai 20 detik.
Pemberian jeda yang berbeda-beda untuk
menghindari pengalihan oleh Google
pada request yang diberikan,
 jaringan Internet yang tidak stabil
menyebabkan sistem tidak dapat
melakukan proses pengambilan data dari
mesin pencari. Oleh karena itu proses
pengambilan data dilakukan pada waktu
jaringan IPB belum terlalu padat,
 listrik yang sering padam, sehingga
sistem tidak berjalan.
Evaluasi
Evaluasi dilakukan setelah peringkat
universitas diumumkan oleh Webometrics
melalui situs resminya, yaitu pada 20 Juli
2010. Bentuk evaluasi yang dilakukan dengan
membandingkan peringkat yang diperoleh dari
simulasi dengan peringkat yang diumumkan
oleh Webometrics. Peringkat universitas yang
dihasilkan oleh sistem simulasi dan
Webometrics dapat dilihat pada Tabel 3.
Pada Tabel 3, situs web universitas yang
tidak dimasukkan ke sistem simulasi tidak
dihitung peringkatnya di Webometrics.
Peringkat domain yang diberi tanda *
menunjukkan bahwa domain-domain tersebut
mendapatkan perlakuan khusus. Perlakuan
khusus tersebut yaitu pengurangan nilai untuk
indikator Scholar sebesar 50% dari nilai asli.

8

Tabel 3 Peringkat universitas menurut
Simulasi dan Webometrics (Juli
2010)
Peringkat
Domain
Simulasi

Webometrics

gunadarma.ac.id

3

4*

itb.ac.id

5

1

ipb.ac.id

1

6*

its.ac.id

12

7

petra.ac.id

4

5*

ugm.ac.id

2

2

ui.ac.id

6

3

uii.ac.id

10

11

um.ac.id

8

12*

unair.ac.id

7

17

undip.ac.id

9

8

uns.ac.id

13

9

unsri.ac.id

14

10

upi.edu

15

15

usu.ac.id

11

16

visibility. Nilai visibility yang diambil
merupakan nilai visibility di luar domain .com,
.org, dan .net. Penambahan kriteria ini
mempengaruhi nilai indikator visibility dan
score. Dengan bobot 50% dari keseluruhan,
visibility merupakan indikator yang paling
berpengaruh
terhadap
score
secara
keseluruhan.
Oleh karena itu, untuk mengurangi
perbedaan tersebut sistem dibuat untuk
mendukung kedua cara penghitungan, yaitu
cara penghitungan yang telah digunakan
sebelumnya dan cara penghitungan yang baru
yang
disebutkan
di
situs
repositories.webometrics.info.
Komponen peringkat universitas di
Indonesia untuk setiap indikator menurut
simulasi dapat dilihat pada Tabel 4.
Tabel 4 Komponen peringkat universitas
berdasarkan nilai indikator menurut
Simulasi (20 Juli 2010)
Peringkat

Domain
S

Dari Tabel 3, peringkat masing-masing
universitas yang diberikan oleh sistem
simulasi berbeda dengan peringkat yang
diambil dari Webometrics. Perbedaan hasil
yang didapat tersebut bisa disebabkan ada
perubahan
pada
model
penghitungan
Webometrics pada edisi Juli 2010 dan ada
faktor lain yang juga ikut diperhitungkan yang
tidak dipublikasikan oleh tim Webometrics.
Disebutkan
dalam
situs
repositories.webometrics.info ada perbedaan
dalam cara perhitungan Webometrics yang
terbaru salah satunya yaitu pada bagian
penentuan nilai normalisasi indikator rich file.
Cara penentuan nilai indikator rich file dari
kabar tersebut adalah nilai masing-masing tipe
dokumen digabungkan baru kemudian nilai
hasil penggabungan tersebut dinormalisasi.
.........(28)
Pada sistem simulasi ini, cara menentukan
nilai normalisasi indikator rich file adalah
menggabungkan nilai hasil normalisasi
masing-masing tipe dokumen yang kemudian
dibagi banyaknya tipe dokumen yang
digunakan. Kedua cara tersebut memberikan
hasil normalisasi yang berbeda sehingga
score akhir yang dihasilkan juga berbeda.
Selain itu, di situs tersebut juga disebutkan ada
penambahan kriteria dalam pengambilan nilai

V

R1

R2

SC

itb.ac.id

1

3

6

8

11

ugm.ac.id

2

1

8

10

10

ui.ac.id

4

4

2

5

12

gunadarma.ac.id

3

6

5

2

1

petra.ac.id

5

7

4

1

4

ipb.ac.id

10

2

1

3

2

its.ac.id

7

10

12

4

13

unair.ac.id

6

11

3

7

7

undip.ac.id

11

13

9

9

3

uns.ac.id

9

9

11

11

14

uii.ac.id

14

8

15

15

9

um.ac.id

12

5

7

13

6

unsri.ac.id

15

14

10

12

8

upi.ac.id

8

12

14

14

15

usu.ac.id

13

15

13

6

5

Keterangan: S=Size, V=Visibility, R1=Rich
file hasil digabung setelah dinormalisasi,
R2=Rich file hasil digabung setelah digabung,
dan SC=Scholar.
Pada Tabel 4, terdapat domain yang
memiliki peringkat untuk scholar yang sama
karena Tim Webometrics menerapkan kasus
tertentu untuk domain tersebut.
Peringkat
universitas
untuk
setiap
indikator menurut www.webometrics.info
dapat dilihat pada Tabel 5.

9

Tabel 5 Komponen peringkat universitas
berdasarkan indikator menurut
Webometrics (20 Juli 2010)
Peringkat
Domain
S
V R SC
itb.ac.id

1

2

3

3

ugm.ac.id

3

1

4

4

ui.ac.id

4

3

1

12

gunadarma.ac.id

2

6

2

5

petra.ac.id

6

8

5

5

ipb.ac.id

10

5

7

5

its.ac.id

7

4

11

13

unair.ac.id

8

9

8

5

undip.ac.id

5

12

10

5

uns.ac.id

9

7

9

14

uii.ac.id

11

11

15

2

um.ac.id

15

13

6

5

unsri.ac.id

14

14

12

1

upi.ac.id

12

10

13

15

usu.ac.id

13

15

14

5

Keterangan: S=Size, V=Visibility, R2=Rich
file, dan SC=Scholar.
Bila dibandingkan antara peringkat situs
atau domain berdasarkan indikator pada Tabel
4 dan Tabel 5, terdapat perbedaan peringkat
yang diperoleh dari simulasi dengan peringkat
yang diumumkan di www.webometrics.info.
Untuk kategori indikator size terdapat 6 situs
yang berada pada urutan yang sama dengan
urutan sesuai www.webometrics.info (Tabel
4). Untuk visibility dan scholar situs yang
berada pada urutan yang sesuai berturut-turut
adalah adalah 4 dan 5 situs. Pada indikator
rich file dilakukan dua model penghitungan
yaitu gabungan dari nilai normalisasi setiap
dokumen (R1), dan normalisasi setelah nilai
dokumen PDF, PS, PPT, dan DOC digabung
(R2). Banyaknya situs menempati posisi yang
sesuai berdasarkan rich file yaitu 1 situs untuk
R1 dan 3 situs untuk R2.
Bila dilihat pada Tabel 5, peringkat Rich
file mempengaruhi peringkat Size. Hal tersebut
mungkin terjadi karena Rich file sebenarnya
juga bagian dari Size. Size merepresentasikan
banyaknya halaman web atau arsip-arsip dari
suatu situs, Rich file merepresentasikan
banyak arsip-arsip untuk format dokumen
tertentu yang lebih spesifik yaitu PDF, PPT,
PS, dan DOC. Jadi bisa dikatakan bila
indikator Rich file tinggi, maka besar
kemungkinan indikator Size juga akan tinggi.

Komposisi situs yang berada pada 10 besar
dunia juga mengalami perubahan. Terdapat
satu situs yang berubah yaitu Johns Hopkins
University (jhu.edu) yang keluar dari 10 besar
dunia digantikan oleh University of Texas
Austin (utexas.edu). Situs 10 besar dunia yang
digunakan sistem simulasi adalah harvard.edu,
mit.edu,
stanford.edu,
berkeley.edu,
cornell.edu, umn.edu, wisc.edu, umich.edu,
washington.edu, dan jhu.edu.

KESIMPULAN DAN SARAN
Kesimpulan
Dari penelitian yang telah dilakukan, dapat
disimpulkan:





telah diidentifikasi indikator size,
visibility, rich file dan scholar yang
mempengaruhi
peringkat
suatu
universitas
dalam
pemeringkatan
Webometrics,
terdapat perbedaan dari hasil yang
diberikan oleh sistem simulasi terhadap
hasil Webometrics yang sesungguhnya,
telah berhasil dikembangkan sistem
simulasi
untuk
pemeringkatan
Webometrics.

Saran
Untuk penelitian selanjutnya, disarankan
agar sistem simulasi ini mampu mendiagnosis
dan memberikan saran kepada pengguna
indikator apa yang sebaiknya ditingkatkan dan
menentukan besar nilai yang sebaiknya
ditingkatkan pada indikator untuk menaikkan
peringkat situs. Selain itu sistem simulasi juga
diharapkan
mampu
mempertimbangkan
aspek-aspek lain seperti aspek sejarah, sosial
dan budaya suatu universitas sebagai salah
satu komponen penilaian dalam penentuan
peringkat. Untuk data kualitatif tersebut dapat
digunakan pendekatan metode fuzzy dalam
pengolahannya. Selain itu juga diharapkan
dikembangkan sistem simulasi yang mampu
menentukan peringkat situs berdasarkan data
indikator
yang
sudah
ada
dengan
menggunakan pendekatan yang lain, misal
pendekatan metode jaringan syaraf tiruan
(JST).

DAFTAR PUSTAKA
Aguillo IF. 2009. Cybermetric Indicators: A
Methodological Approach 2009. 2nd
International Workshop on University
Web Rankings.

10

Björneborn L, Ingwersen P. 2004. Toward a
Basic Framework for Webometrics.
Journal of The American Society for
Information Science and Technology.
Vol 55(14) hal 1216-1227
Jeyshankar R, Babu BR. 2009. Websites of
Universities in Tamil Nadu: a
Webometric Study. Annals of Library
and Information Studies. Vol 56 hal
69-79
Pressman RS. 2005. Software Engineering: A
Practitioner’s Approach. Ed. ke-6.
New York: McGraw-Hill.
Stewart J. 2001. Kalkulus. Ed. ke-4. Jakarta:
Erlangga.
Webometrics.
2010.
Methodology.
http://www.webometrics.info/methodol
ogy.html [4 Juli 2010].

11

LAMPIRAN

Lampiran 1 Entity Relationship Diagram

13

Lampiran 2 URL End Point
Tabel URL End Point
Indikator
URL
http://search.yahoo.com/search?p=linkdomain:[nama-domain]
Visibility
Size (Google)
Size (Yahoo)
Size (Bing)
Size (Exalead)
Rich file (.pdf)
Rich file (.ps)
Rich file (.ppt)
Rich file (.doc)
Scholar
(Google
Scholar)

−site:[namadomain]
http://www.google.com/search?hl=en&q=site:[nama-domain]
http://siteexplorer.search.yahoo.com/search?bwm=p&bwms=p&fr=sfp&fr2=seord-se&p=http://[nama-domain]
http://www.bing.com/search?FORM=IEFM1&q=site:[nama-domain]
http://www.exalead.com/search/web/results/?q=site:[nama-domain]
http://www.google.com/search?hl=en&q=filetype:pdf site:[nama-domain]
http://www.google.com/search?hl=en&q=filetype:ps site:[nama-domain]
http://www.google.com/search?hl=en&q=filetype:ppt site:[nama-domain]
http://www.google.com/search?hl=en&q=filetype:doc site:[nama-domain]
http://scholar.google.com/scholar?hl=en&q=site:[nama-domain]

Keterangan: [nama-domain] merupakan nama domain web universitas

14

Lampiran 3 Contoh pengambilan nilai indikator dari mesin pencari
Nilai size di Google

Nilai size di Bing

Nilai size di Exalead

Nilai size di Yahoo

Nilai scholar di Google Scholar

15

Lampiran 3 Lanjutan
Nilai rich file untuk dokumen PDF di Google

Nilai rich file untuk dokumen PPT di Google

Nilai rich file untuk dokumen PS di Google

Nilai rich file untuk dokumen DOC di Google

Nilai visibility di Yahoo

16

Lampiran 4 File konfigurasi pola regular expression