Latar Belakang Prof. Dr. Opim S. Sitompul, M.Si

1 BAB 1 PENDAHULUAN

1.1 Latar Belakang

Peningkatan jumlah dokumen digital yang pesat telah menyebabkan para pengguna Internet harus tetap up-to-date dengan dokumen terbaru. Karena jumlah penyedia dokumen digital yang sangat banyak, maka tidak mungkin seorang pengguna mengingat alamat masing-masing penyedia dokumen digital. Salah satu solusinya adalah dengan membangun sebuah daftar indeks dokumen digital. Pada prinsipnya hampir mirip dengan pencari web web search engine yang mengindeks alamat URL Uniform Resource Locator [1]. Penyedia dokumen digital mempunyai sejumlah informasi baik hanya berupa informasi nama penulis, judul dan lain-lain yang berkaitan dengan dokumen tersebut. Masing-masing halaman mempunyai informasi dan ukuran yang berbeda. Seiring dengan berkembangnya jumlah web yang ada, maka informasi yang terkandung di dalamnya mempunyai jumlah yang sangat banyak [2]. Informasi tersebut tersimpan dalam berbagai macam bentuk salah satunya adalah metadata. Berbagai jenis metadata yang digunakan dapat mempersulit pengumpulan data karena bentuk yang tidak sama antara satu metadata dengan yang lainnya. Penggunaan metadata yang mengikuti kaidah OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting [3] dapat mempermudah proses pembacaan data Universitas Sumatera Utara digital oleh mesin sekaligus mengatasi masalah perbedaan penggunaan jenis metadata sesuai dengan rekomendasi Shuming Li pada penelitiannya yang berjudul “ Research of Metadata Based Digital Education Resource Sharing ” [4]. OAI-PMH telah diterapkan pada institusi yang menggunakan perangkat lunak DSpace www.dspace.org dan ePrints www.eprints.org. Kedua perangkat lunak ini digunakan sebagai repositori digital. Untuk menangani jumlah metadata yang sedemikian banyak tersebut, timbul suatu pemikiran bagaimana merancang sistem terdistribusi untuk menangani beban kerja yang tinggi sekaligus jumlah data yang besar. Seperti yang tertera pada Tabel 1.1, telah dilakukan penelitian oleh Iqbal Syamsu yang berjudul “Perancangan Penjelajah Web Crawler Terdistribusi” dengan objek penelitiannya adalah dokumen web [5]. Pada penelitian tersebut dilakukan penelusuran web dan pengumpulan dokumen-dokumen di dalamnya dengan tujuan merancang suatu crawler terdistribusi untuk search engine . Merujuk pada penelitian Michael L. Nelson yang berjudul “ Efficient, Automatic Web Resource Harvesting ” [6], dikemukakan bahwa teknik crawling konvensional tidak dapat mengetahui apakah seluruh halaman telah dijelajahi dan format data yang mudah dibaca manusia tidak selalu sesuai untuk pemrosesan menggunakan mesin, sehingga penggunaan teknik pengumpulan harvesting metadata cenderung lebih baik daripada teknik crawling . Universitas Sumatera Utara Tabel 1.1 Penelitian tentang Pengumpul Metadata dan Sistem Terdistribusi Penulis Judul Penelitian Pembahasan Penelitian yang dilakukan Tahun Iqbal Syamsu Perancangan Penjelajah Web Crawler Terdistribusi Penjelajahan dokumen web Pengumpulan metadata 2008 Shuming Li, dkk Research of Metadata Based Digital Educational Resource Sharing Rekomendasi penggunaan metadata OAI- PMH Menggunakan metadata OAI-PMH 2008 Michael L. Nelson, dkk Efficient, Automatic Web Resource Harvesting Pengumpulan metadata menggunakan modul Apache Metadata OAI-PMH 2006 Pada penelitian Michael L. Nelson, dihasilkan sebuah pengumpul metadata OAI-PMH yang diintegrasikan dengan web server Apache dan merupakan sistem tunggal. Sedangkan aplikasi pengumpul pada penelitian ini merupakan sebuah aplikasi yang berdiri sendiri serta merupakan sistem terdistribusi.

1.2 Rumusan masalah