Analisis Proses Kompresi File Teks dengan Metode Capocelli

C I C I Sp 0 11110 0 11110 100 C I C I P I Sp 0 11110 0 11110 11100 11110 100 C U K A 0 10110 10100 110 Dari Tabel 3.2 dapat dibentuk string bit dari string sebelum dikompresi yaitu “CACA CICI CICIPI CUKA” menjadi string bit “0110011010001111001111010001 1110011110111001111010001011010100110”. Sebelum ditulis ke sebuah file hasil kompresi dilakukan penambahan bitpadding dan flag diawal dan akhir string bit. Bit itu dihasilkan dari panjang string bit itu sendiri apakah habis dibagi delapan dan berapa sisanya jika dibagi delapan. Karena jumlah string bit 65 tidak habis dibagi delapan dan sisanya adalah satu. Maka dapat dibuat padding “0000000” dan flagnya adalah “00000111”. Sehingga total bit seluruhnya setelah penambahan padding dan flagging adalah 80 bits.

3.1.3.2. Analisis Proses Kompresi File Teks dengan Metode Capocelli

Berikut ini adalah contoh proses kompresi file teks dengan metode Capocelli.Terdapat file teks yang berisikan string “CACA CICI CICIPI CUKA”. Untuk mengukur ukuran String itu di dalam komputer dapat dilihat pada Tabel 3.3. Tabel 3.3 String yang belum di kompresi n Char ASCII Biner Bit Frek Bit x Frek 1 C 01000011 8 7 56 2 A 01000001 8 3 24 3 Sp 00100000 8 3 24 4 I 01001001 8 5 40 5 P 01010000 8 1 8 Universitas Sumatera Utara 6 U 01010101 8 1 8 7 K 01001011 8 1 8 Jumlah 168 Suffix = ‘0’ + r ‘1’ Untuk r = 2, maka suffix = ‘011’ Maka dapat dilakukan kompresi data pada string “CACA CICI CICIPI CUKA” sebagai berikut: Tabel 3.4. String yang Sudah Dikompresi Dengan Algoritma Capocelli n Char Capocelli r = 2 Prefix Suffix Frek Bit Frek x Bit C 011 7 3 21 1 A 00 011 3 4 12 2 Sp 10 011 3 4 12 3 I 000 011 5 5 25 4 P 001 011 1 5 5 5 U 010 011 1 5 5 6 K 100 011 1 6 6 Jumlah 86 C A C A Sp 01 100011 011 00011 10011 C I C I Sp 011 000011 011 000011 10011 C I C I P I Sp 011 000011 011 000011 001011 000011 10011 C U K A 011 010011 100011 00011 Universitas Sumatera Utara Dari Tabel 3.4 dapat dibentuk string bit dari string sebelum dikompresi yaitu “CACA CICI CICIPI CUKA” menjadi string bit: “01100011011000111001101100001101100001110011011000011011000011001011 0000111001101101001110001100011.” Sebelum ditulis ke sebuah file hasil kompresi dilakukan penambahan bit padding dan flag diawal dan akhir string bit. Bit itu dihasilkan dari panjang string bit itu sendiri apakah habis dibagi delapan dan berapa sisanya jika dibagi delapan. Karena jumlah string bit 86 tidak habis dibagi delapan dan sisanya adalah enam. Maka dapat dibuat padding “00” dan flagnya adalah “00000010”. Sehingga total bit seluruhnya setelah penambahan padding dan flagging adalah 96 bits. 3.1.3.3.Analisis Proses menghitung Parameter Pembanding Ratio of Compression RC, Compression Ratio CR, dan Space Saving SS. 1. Ratio of Compression RC Ratio of Compression dari contoh menggunakan algoritma Inverted Elias Gamma dihasilkan dari jumlah ukuran data sebelum dikompresi lalu dibagikan dengan jumlah ukuran data setela dikompresi menggunakan algoritma Inverted Elias Gamma. = ℎ = 168 65 = 2,58 Universitas Sumatera Utara Ratio of Compression dari contoh menggunakan algoritma Capocelli dihasilkan dari jumlah ukuran data sebelum dikompresi lalu dibagikan dengan jumlah ukuran data setela dikompresi. = ℎ = 168 86 = 1,95 2. Compression Ratio CR Compression Ratio dari contoh menggunakan algoritma Inverted Elias Gamma di hasilkan dari ukuran data setelah dikompresi menggunakan algoritma Inverted Elias Gamma di bagi ukuran data sebelum dikompresi lalu dibagi 100 . = ℎ 100 = 65 168 100 = 38,6 Compression Ratio dari contoh menggunakan algoritma Capocelli dihasilkan dari ukuran data setelah dikompresi menggunakan algoritma Capocelli dibagi ukuran data sebelum dikompresi lalu dibagi100. = ℎ 100 = 86 168 100 = 51 Universitas Sumatera Utara

3. Space Saving SS

Space Savings dari contoh menggunakan algoritma Inverted Elias Gamma dihasilkan dari persentase data yang belum dikompresi dikurangi dengan Compression Ratio dari kompresi menggunakan algoritma Inverted Elias Gamma. = 100 − = 100 − 38,6 = 61,4 Space Savings dari contoh menggunakan algoritma Capocelli dihasilkan dari persentase data yang belum dikompresi dikurangi dengan Compression Ratio dari kompresi menggunakan algoritma Capocelli. = 100 − = 100 − 51 = 49 3.1.3.4.Proses Dekompresi Dalam skripsi saya ini saya menggunakan dekompresi yang secara umum bisa digunakan dengan menggunakan algoritma apa saja. Adapun bentuk dekompresi pada skripsi saya ini yaitu; t = table : Char Code C A 01 Sp 110 Sb = String bit = “01100110 . . . .” function decompress t, sb { String = Universitas Sumatera Utara