Institutional Repository | Satya Wacana Christian University: Penerapan Web Crawlerdalam pencarian E-Book

Penerapan Web Crawler dalam pencarian
E-Book
Fakultas Teknologi Informasi
Untuk memperoleh Gelar Sarjana Komputer

Oleh:
Rivort Pormes (672007230)
Prof. Ir. Daniel Herman Freddy Manongga, M.Sc., Ph.D.
Hendry, M.Kom.

Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
September 2012

i

ii

Pernyataan


Penelitian yang berikut ini:
Judul

: Penerapan Web Crawler dalam Pencarian e-Book

Pembimbing :
1. Prof. Ir. Daniel Herman Freddy Manongga, M.Sc., Ph.D.
2. Hendry, S.Kom., M.Kom.
Adalah benar hasil karya saya:
Nama : Rivort Pormes
NIM

: 672007230

Saya menyatakan tidak mengambil sebagian atau seluruhnya dari
hasil karya orang lain kecuali sebagaimana yang tertulis pada
daftar pustaka. Pernyataan ini dibuat dengan sebenarya sesuai
dengan ketentuan yang berlaku dalam penulisan karya ilmiah.


Salatiga, September 2012

(Rivort Pormes)

iii

Prakata
Puji syukur kepada Tuhan Yesus Kristus yang telah
memberikan kekuatan dan kesabaran kepada penulis mulai dari
awal penelitian dan pengumpulan data hingga akhir dari
penelitian ini. Terimakasih untuk semua pernyataan dan campur
tangan Tuhan dalam kehidupan ini sehingga penulis tidak hanya
berjalan sendiri dalam menyelesaikan penelitian ini.
Penelitian ini dimaksudkan untuk membuat suatu bentuk
web penyedia e-Book yang membantu dan mempermudah user

atau pengguna di internet dalam mencari e-Book. Penulis
memakai teknologi Web Crawler dalam perancangan penelitian
ini, karna dapat mengotomatisasikan pekerjaan untuk pencarian
e-book di Internet.

Adapun penyelesaian penelitian ini tidak lepas dari
bantuan dan dukungnan banyak pihak, oleh karena itu penulis
ingin mengucapakan terimakasih kepada pihak-pihak yang
banyak membantu dan mendukung penulis selama ini:
1.

Andeka Rocky Tanaamah, S.E., M.Cs., selaku Dekan
Fakultas Teknologi Informasi Universitas Kristen Satya
Wacana.

2.

Dian W. Chandra, M.Cs., Selaku Ketua Program Studi
Teknik Informatika Fakultas Teknlogi Informasi.

3.

Prof. Ir. Daniel Herman Freddy Manongga, M.Sc., Ph.D
selaku pembimbing 1 yang selalu membimbing dengan


iv

sabar

dan

membantu

dalam

dalam

menyelesaikan

Penelitian ini
4.

Henry, M.Cs., Selaku pembimbing 2 yang telah banyak
membantu dan memberikan masukan-masukan, ide, serta
motivasi dalam perbaikan serta penyelesaian Penelitian ini.


5.

Mila

Chrismawati

Paseleng,

S.Si.,

M.Pd.,

sebagai

koordinator KP/TA/
6.

Seluruh dosen yang berada di Fakultas Teknologi Informasi
yang selama penulis bermahasiswa telah membantu dan

memberikan ilmunya.

7.

Staf Tata Usaha Fakultas Teknologi Informasi yang telah
membantu dalam proses admintrasi yang berkaitan dengan
penyusunan Tugas Akhir ini.

8.

Specila untuk Papa dan Mama tercinta. Terima kasih yang
sebesar-besarnya untuk setiap kasih dan sayang, dukungan,
motivasi, serta doa yang luar biasa selama penulisan Tugas
Akhir ini.

9.

Untuk saudara saya tercinta Edwin Pormes. Terima kasih
untuk setiap bantuan, masukan, dukungan doa, motivasi
yang tidak hentinya dalam proses penulisan Tugas Akir ini.


10.

Untuk saudari saya tercinta Wina dan Obe Pormes. Terima
kasih untuk setiap dukungan, motivasi, doa-doa kalian
selama penulisan Tugas Akhir ini.

11.

Saudari saya tercinta Rensa Pormes. Terima kasih untuk
setiap dukungan dan doa dari ade selama ini.

v

12.

Saudara saya tercinta Izhak Pormes. Terima kasih untuk
dukungan, motivasi, dan doanya selama ini.

13.


Special untuk Beauty Lucky Amelia tercinta (kiky). Terima
kasih untuk setiap cinta, dukungan, doa, pemberi semangat,
dan menjadi orang yang selalu memotivasi penulis untuk
menyelesaikan Tugas Akhir ini. “biarpun kita tidak tau apa
terjadi esok, tapi kita telah memiliki hari ini”.

14.

Seluruh teman-teman di kost Tarjo Mario, Wilnic, Novi,
Bung otis, Bu Ricken, Bung Deddy, Renne, Gilfy, Boby,
Theo, Dokka, Valdo, BenQ, Ganes, Bredly, Ito, Joy,
Mamen, Lebro, dan Reza. Terima kasih untuk kekompakan,
keakraban, persaudaraan, dan semua dukungan dari temanteman

semua

selama

ini.


Terima

kasih,

semoga

persahabatan dan persaudaraan kita selalu terjaga dengan
baik.
15.

Teman-teman di Ambon-Salatiga

bung Tezar, Albert

(Koko), Jan, Leo (El-Petra), David, Inka, Elly, Macica,
Kaka Ella, Itin, Uya, Decky, Everly, Endok, Qionk, Ain,
Bung Yan, Bung Emank, Bung Mario, Aldrin, Eky, Angga,
Sharon, Big, Kharen, Myrel, Ricardo, Chramse, Alice,
Moren, Elida, Nane, Tia, Jey, Tia (kecil), Carolin, William,

Ariel, Rico, Dj Ian Virion, Eko, EJ, Dessy, Mel, Putri,
Ilona, Isser, Lia (ijo), Bung Endok, dan teman-teman yang
lain yang tidak sempat penulis sebutkan satu persatu.
Terima kasih untuk kebersamaan dan dukungannya selama.

vi

16.

Teman-teman Manado Army, Priska (omha), Friska (ikhu),
Endly, dan Eva

17.

Teman-teman

HIPMMA

(Himpunan


pelajar

dan

Mahasiswa Maluku) terima kasih atas kekeluargaan dan
kebersamaannya selama ini. Tuhan Memberkati.
18.

Teman-teman (Moluccas ’07 Squad) terima kasih untuk
setiap

kebersamaan,

kekeluargaan,

persaudaraan,

persahabatan selama ini. Semoga selalu kompak dan solid.
Tuhan memberkati.
19.

Teman-teman angkatan 2007 Teknik Informatika. Terima
kasih untuk setiap persahabatan, kebersamaan, kenangan
indah dari pertama memasuki kuliah sampai sekarang.
Semoga kekeluargaan dan persahabatan kita selalu terjaga
dengan baik. Tuhan memberkati.

20.

Semua pihak yang tidak sempat penuliskan satu persatu.
Terima kasih untuk setiap selipan doa kalian, dukungan,
motivasi, dan juga seluruh bantuan kalian selama
penyelesaian Tuga Akhir ini. Kiranya Tuhan Selalu
menyertai kalian semua.

Penulis sadar bahwa masih banyak kekurangan dalam
penyelesaian Tugas akhir ini. Oleh karna itu, penulis sangat
mengharapkan kritik maupun saran yang sangat membangun
dalam proses perbaikan Tugas Akhir ini di masa yang akan

vii

datang. Semoga Tugas Akhir ini memberikan manfaat bagi
semua pihak.

Salatiga, 2012

Rivort Pormes

viii

Daftar Isi
Halaman Judul................................................................................. i
Lembar Persetujuan......................................................................... ii
Lembar Pernyataan.......................................................................... iii
Prakata............................................................................................. iv
Daftar Isi.......................................................................................... ix
Daftar Gambar................................................................................. xi
Kode Program.................................................................................. xii
Arti Singkatan.................................................................................. xiv
Abstract............................................................................................ xv
Bab 1 Pendahuluan.......................................................................... 1
1.1 Latar Belakang Masalah.................................................. 1
1.2 Rumusan Masalah........................................................... 3
1.3 Tujuan dan Manfaat Penulisan........................................ 3
1.4 Batasan Masalah.............................................................. 3
1.5 Sistematika Penulisan...................................................... 4
Bab 2 Tinjauan Pustaka................................................................... 5
2.1 Penelitian Terdahulu....................................................... 6
2.2 Web Crawler ................................................................... 7
2.2.1 Fungsi Utama Web Crawler ................................... 7
2.2.2 Dasar Web Crawler ................................................ 8
2.2.3 Desain Web Crawler .............................................. 12
2.3 e-Book............................................................................. 15

ix

2.4 HTML5........................................................................... 16
Bab 3 Metode dan Perancangan Sistem........................................... 18
3.1 Metode Perancangan Sistem............................................ 18
3.2 Analisis Kebutuhan..........................................................21
3.3 Perancangan Desain Sistem............................................. 22
3.4 Perancangan Antarmuka.................................................. 29
3.4.1 Rancangan Halaman Utama................................... 29
3.4.2 Rancangan Halaman Login Administrator ............. 31
3.4.3 Rancangan Halaman Request................................. 31
3.4.4 Rancangan Halaman Administrator ........................ 32
3.4.5 Rancangan Halaman Edit Tags............................... 33
3.4.5 Rancangan Halaman Show Request....................... 34
Bab 4 Hasil dan Pembahasan........................................................... 35
4.1 Implementasi Sistem......................................................... 35
4.1.1 Proses Breadth first crawling................................. 35
4.1.2 Proses Crawler ....................................................... 37
4.2 Analisa dan Pengujian...................................................... 39
4.2.1 Analisis Kerja Sistem............................................. 39
4.2.2 Pengujian Aplikasi.................................................. 46
4.2.3 Pengujian Responden............................................. 47
Bab 5 Kesimpulan dan Saran........................................................... 48
5.1 Kesimpulan............................................................... 49
5.2 Saran.......................................................................... 50
Daftar Pustaka.................................................................................. 51

x

Daftar Gambar
Gambar 2.1 Breadth-first crawling................................................. 10
Gambar 2.2 Depth first crawling..................................................... 11
Gambar 2.3 Arsitektur Web Crawler ............................................... 13
Gambar 3.1 Metode Kerja Sistem.................................................... 19
Gambar 3.2 Breadth-first crawling.................................................. 21
Gambar 3.3 Use Case Diagram....................................................... 24
Gambar 3.4 Activity Diagram admin dan Sistem.............................25
Gambar 3.5 Activity Diagram user dan Sistem............................... 26
Gambar 3.6 Activity Diagram use, sistem, dan admin.................. 27
Gambar 3.7 Sequence diagram user................................................ 28
Gambar 3.8 Sequence diagram admin............................................ 29
Gambar 3.9 Class diagram sistem................................................... 30
Gambar 3.4.1 Halaman Utama......................................................... 32
Gambar 3.4.2 Halaman Login Administrator ................................. 33
Gambar 3.4.3 Halaman Request....................................................... 33
Gambar 3.4.4 Rancangan Halaman Administrator ....................... 34
Gambar 3.4.5 Rancangan Halaman Edit Tags.............................. 35
Gambar 3.4.6 Rancangan Halaman Show Request......................

36

Gambar 4.1 Tampilan Utama e-Book repository.......................... 41
Gambar 4.2 Tampilan Hasil pencarian e-Book.............................. 42
Gambar 4.3 Tampilan halaman request user ................................. 43
Gambar 4.4 Tampilan halaman login admin................................. 44
Gambar 4.5 Halaman Utama Crawler ............................................ 45

xi

Gambar 4.6 Halaman show request................................................ 46
Gambar 4.7 Halaman edit tags........................................................ 47

Kode Program

xii

Kode program 4.2 Proses Crawler ............................................... 38
Kode program 4.2 Proses Run Crawler ........................................39
Kode program 4.3 Proses Membaca Halaman..............................40

Daftar Tabel
Tabel 4.1 Pengujian Aplikasi e-Book Repository........................ 48
Tabel 4.2 Pengujian Responden................................................... 49

xiii

Arti Singkatan
Unified Modelling Language merupakan bahasa yang
telah menjadi standar dalam industri untuk
visualisasi, merancang dan mendokumentasikan
sistem piranti lunak.
URL : Uniform Resource Locator , adalah rangkaian karakter
menurut suatu format standar tertentu, yang
digunakan untuk menunjukkan alamat suatu sumber
seperti dokumen dan gambar di Internet
HTML: HyperText Markup Language adalah sebuah bahasa
markup yang digunakan untuk membuat sebuah
halaman web, menampilkan berbagai informasi di
dalam sebuah Penjelajah web Internet
PDF : Portable Document Format adalah sebuah format
berkas untuk merepresentasikan dokumen dua
dimensi yang meliputi teks, huruf, citra dan grafik
vektor dua dimensi
PHP : Hypertext Preprocessor adalah bahasa skrip yang
dapat ditanamkan atau disisipkan ke dalam HTML.
PHP banyak dipakai untuk memrogram situs web
dinamis

UML :