File Yang Dicoba Analisis Pengaruh Panjang Bit Kode Pada Kinerja Program Kompresi Yang Menggunakan Algoritma Lempel Ziv Welch (LZW)

Fahrur Razi : Analisis Pengaruh Panjang Bit Kode Pada Kinerja Program Kompresi Yang Menggunakan Algoritma Lempel Ziv Welch LZW, 2009. USU Repository © 2009 BAB 4 ANALISIS PENGARUH PANJANG BIT KODE PADA KINERJA PROGRAM KOMPRESI YANG MENGGUNAKAN ALGORITMA LZW

4.1 File Yang Dicoba

Oleh sebab pada analisis penulis harus mencoba file-file tertentu dengan perangkat lunak yang telah dibuat, maka terlebih dahulu file-file yang dicoba haruslah file-file yang dapat memaksimalkan analisis. Untuk itu penulis memilih Calgary Corpus serta Canterbury Corpus dalam analisis. Calgary Corpus dan Canterbury Corpus penulis pilih karena keduanya telah umum digunakan dalam membandingkan algoritma kompresi. Selain itu penelitian penulis dapat lebih mudah dibandingkan dengan penelitian lain tentang kompresi karena menggunakan file-file yang telah umum digunakan untuk penelitian mengenai kinerja kompresi. Canterbury Corpus merupakan penyempurnaan dari Calgary Corpus dan Canterbury Corpus belum digantikan oleh standar yang lebih baru.

4.1.1 Calgary Corpus

Calgary Corpus adalah sebuah set file yang dibuat sebagai standar dalam pengujian dan perbandingan algoritma kompresi. Calgary Corpus dibuat oleh Ian Witten dan Tim Bell pada tahun 1987 kemudian dipakai secara luas pada tahun 1990-an. Pada pembuatan Calgary Corpus terdapat beberapa kriteria sehingga Calgary Corpus sangat tepat digunakan untuk membandingkan kinerja algoritma kompresi. Kriteria- kriteria tersebut adalah : 1. Corpus harus berisi sebuah sampel dari tipe data yang berbeda-beda. Fahrur Razi : Analisis Pengaruh Panjang Bit Kode Pada Kinerja Program Kompresi Yang Menggunakan Algoritma Lempel Ziv Welch LZW, 2009. USU Repository © 2009 2. Corpus harus tersebar luas, seperti melalui internet sehingga peneliti dapat dengan mudah mendapatkannya. 3. Corpus harus berisi materi yang umum pada masyarakat, bukan materi atau content yang jarang pada masyarakat umum. 4. Besar ukuran Corpus haruslah sesuai, tidak boleh terlalu besar juga tidak boleh terlalu kecil. 5. Corpus harus valid, bukan data rekaan.

4.1.2 Canterbury Corpus

Canterbury Corpus adalah sebuah set file yang dibuat sebagai standar dalam pengujian dan perbandingan algoritma kompresi sebagai penyempurnaan dari Calgary Corpus. Canterbury Corpus dibuat untuk mengikuti perkembangan tipe file baru yang umum dipakai masyarakat. Canterbury Corpus berisi file teks bacaan, fax image, kode sumber bahasa c, spreadsheet file, file biner, dokumentasi teknik, puisi berbahasa inggris, HTML, kode sumber lisp, dan buku manual GNU. Walaupun Calgary Corpus sudah disempurnakan dengan Canterbury Corpus, mencoba keduanya pada analisis ini akan memberikan hasil analisis yang lebih baik. Semakin banyak file yang dicoba diharapkan dapat memberikan analisis yang lebih baik.

4.2 Analisis Pengaruh Panjang Bit Kode pada Program Kompresi yang Menggunakan Algoritma LZW