1
BAB 1 PENDAHULUAN
1.1 Latar Belakang
Peningkatan jumlah dokumen digital yang pesat telah menyebabkan para pengguna Internet harus tetap
up-to-date
dengan dokumen terbaru. Karena jumlah penyedia dokumen digital yang sangat banyak, maka tidak mungkin seorang
pengguna mengingat alamat masing-masing penyedia dokumen digital. Salah satu solusinya adalah dengan membangun sebuah daftar indeks dokumen digital. Pada
prinsipnya hampir mirip dengan pencari web
web search engine
yang mengindeks alamat URL
Uniform Resource Locator
[1]. Penyedia dokumen digital mempunyai sejumlah informasi baik hanya berupa
informasi nama penulis, judul dan lain-lain yang berkaitan dengan dokumen tersebut. Masing-masing halaman mempunyai informasi dan ukuran yang berbeda. Seiring
dengan berkembangnya jumlah web yang ada, maka informasi yang terkandung di dalamnya mempunyai jumlah yang sangat banyak [2]. Informasi tersebut tersimpan
dalam berbagai macam bentuk salah satunya adalah metadata. Berbagai jenis metadata yang digunakan dapat mempersulit pengumpulan
data karena bentuk yang tidak sama antara satu metadata dengan yang lainnya. Penggunaan metadata yang mengikuti kaidah OAI-PMH
Open Archives Initiative Protocol for Metadata Harvesting
[3] dapat mempermudah proses pembacaan data
Universitas Sumatera Utara
digital oleh mesin sekaligus mengatasi masalah perbedaan penggunaan jenis metadata sesuai dengan rekomendasi Shuming Li pada penelitiannya yang berjudul “
Research of Metadata Based Digital Education Resource Sharing
” [4]. OAI-PMH telah diterapkan
pada institusi
yang menggunakan
perangkat lunak
DSpace www.dspace.org dan ePrints www.eprints.org. Kedua perangkat lunak ini
digunakan sebagai repositori digital. Untuk menangani jumlah metadata yang sedemikian banyak tersebut, timbul suatu pemikiran bagaimana merancang sistem
terdistribusi untuk menangani beban kerja yang tinggi sekaligus jumlah data yang besar.
Seperti yang tertera pada Tabel 1.1, telah dilakukan penelitian oleh Iqbal Syamsu yang berjudul “Perancangan Penjelajah Web
Crawler
Terdistribusi” dengan objek penelitiannya adalah dokumen
web
[5]. Pada penelitian tersebut dilakukan penelusuran web dan pengumpulan dokumen-dokumen di dalamnya
dengan tujuan merancang suatu
crawler
terdistribusi untuk
search engine
. Merujuk pada penelitian Michael L. Nelson yang berjudul “
Efficient, Automatic Web Resource Harvesting
” [6], dikemukakan bahwa teknik
crawling
konvensional tidak dapat mengetahui apakah seluruh halaman telah dijelajahi dan format data yang mudah
dibaca manusia tidak selalu sesuai untuk pemrosesan menggunakan mesin, sehingga penggunaan teknik pengumpulan
harvesting
metadata cenderung lebih baik daripada teknik
crawling
.
Universitas Sumatera Utara
Tabel 1.1 Penelitian tentang Pengumpul Metadata dan Sistem Terdistribusi
Penulis Judul Penelitian
Pembahasan Penelitian
yang dilakukan
Tahun
Iqbal Syamsu
Perancangan Penjelajah Web
Crawler
Terdistribusi Penjelajahan
dokumen web Pengumpulan
metadata 2008
Shuming Li, dkk
Research of Metadata Based
Digital Educational Resource Sharing
Rekomendasi penggunaan
metadata OAI- PMH
Menggunakan metadata
OAI-PMH 2008
Michael L.
Nelson, dkk
Efficient, Automatic
Web Resource Harvesting
Pengumpulan metadata
menggunakan modul Apache
Metadata OAI-PMH
2006
Pada penelitian Michael L. Nelson, dihasilkan sebuah pengumpul metadata OAI-PMH yang diintegrasikan dengan
web server
Apache dan merupakan sistem tunggal. Sedangkan aplikasi pengumpul pada penelitian ini merupakan sebuah
aplikasi yang berdiri sendiri serta merupakan sistem terdistribusi.
1.2 Rumusan masalah