Fahrur Razi : Analisis Pengaruh Panjang Bit Kode Pada Kinerja Program Kompresi Yang Menggunakan Algoritma Lempel Ziv Welch LZW, 2009.
USU Repository © 2009
BAB 4
ANALISIS PENGARUH PANJANG BIT KODE PADA KINERJA PROGRAM KOMPRESI YANG MENGGUNAKAN ALGORITMA LZW
4.1 File Yang Dicoba
Oleh sebab pada analisis penulis harus mencoba file-file tertentu dengan perangkat lunak yang telah dibuat, maka terlebih dahulu file-file yang dicoba haruslah file-file
yang dapat memaksimalkan analisis. Untuk itu penulis memilih Calgary Corpus serta Canterbury Corpus dalam analisis. Calgary Corpus dan Canterbury Corpus penulis
pilih karena keduanya telah umum digunakan dalam membandingkan algoritma kompresi. Selain itu penelitian penulis dapat lebih mudah dibandingkan dengan
penelitian lain tentang kompresi karena menggunakan file-file yang telah umum digunakan untuk penelitian mengenai kinerja kompresi. Canterbury Corpus
merupakan penyempurnaan dari Calgary Corpus dan Canterbury Corpus belum digantikan oleh standar yang lebih baru.
4.1.1 Calgary Corpus
Calgary Corpus adalah sebuah set file yang dibuat sebagai standar dalam pengujian dan perbandingan algoritma kompresi. Calgary Corpus dibuat oleh Ian Witten dan
Tim Bell pada tahun 1987 kemudian dipakai secara luas pada tahun 1990-an. Pada pembuatan Calgary Corpus terdapat beberapa kriteria sehingga Calgary Corpus
sangat tepat digunakan untuk membandingkan kinerja algoritma kompresi. Kriteria- kriteria tersebut adalah :
1. Corpus harus berisi sebuah sampel dari tipe data yang berbeda-beda.
Fahrur Razi : Analisis Pengaruh Panjang Bit Kode Pada Kinerja Program Kompresi Yang Menggunakan Algoritma Lempel Ziv Welch LZW, 2009.
USU Repository © 2009
2. Corpus harus tersebar luas, seperti melalui internet sehingga peneliti dapat
dengan mudah mendapatkannya. 3.
Corpus harus berisi materi yang umum pada masyarakat, bukan materi atau content yang jarang pada masyarakat umum.
4. Besar ukuran Corpus haruslah sesuai, tidak boleh terlalu besar juga tidak boleh
terlalu kecil. 5.
Corpus harus valid, bukan data rekaan.
4.1.2 Canterbury Corpus
Canterbury Corpus adalah sebuah set file yang dibuat sebagai standar dalam pengujian dan perbandingan algoritma kompresi sebagai penyempurnaan dari Calgary
Corpus. Canterbury Corpus dibuat untuk mengikuti perkembangan tipe file baru yang umum dipakai masyarakat. Canterbury Corpus berisi file teks bacaan, fax image, kode
sumber bahasa c, spreadsheet file, file biner, dokumentasi teknik, puisi berbahasa inggris, HTML, kode sumber lisp, dan buku manual GNU. Walaupun Calgary Corpus
sudah disempurnakan dengan Canterbury Corpus, mencoba keduanya pada analisis ini akan memberikan hasil analisis yang lebih baik. Semakin banyak file yang dicoba
diharapkan dapat memberikan analisis yang lebih baik.
4.2 Analisis Pengaruh Panjang Bit Kode pada Program Kompresi yang Menggunakan Algoritma LZW