Kompresi Data TINJAUAN PUSTAKA

y z A B C D E F G H I 22 23 24 25 26 27 28 29 30 31 32 K L M N O P Q R S T U 33 34 35 36 37 38 39 40 41 42 43 W X Y Z 1 2 3 4 5 6 44 45 46 47 48 49 50 51 52 53 54 7 8 9 sp . , 55 56 57 58 59 60 61

2.5 Kompresi Data

Kompresi adalah proses mengkonversikan sebuah aliran input data sumber aliran data, atau asli menjadi aliran data lainnya aliran data dalam bentuk bit, atau output data yang telah dipadatkan yang memiliki ukuran lebih kecil Salomon, 2007. Sedangkan kompresi data adalah cara untuk mengurangi jumlah bit pada data dalam penyimpanan, sehingga membuat lebih efisien dalam penyimpanan ataupun dalam pertukaran data tersebut Nelson Gailly 1996. Dalam kompresi data terdapat metode yang dikelompokkan menjadi dua bagian yaitu metode lossless dan metode lossy. 2.5.1 Metode Lossless Kompresi data lossless adalah metode yang tidak menyebabkan kehilangan informasi pada data yng telah dikompresi. Data asli dapat kembali didapatkan tepat seperti sebelum dilakukan proses kompresi Sayood, 2006. Metode lossless digunakan dalam berbagai aplikasi seperti format ZIP dan GZIP. Lossless juga sering digunakan sebagai komponen dalam teknologi kompresi data lossy, yang digunakan ketika sesuatu yang penting pada kondisi aslinya. Beberapa format gambar sperti PNG atau GIF hanya menggunakan kompresi lossless, Universitas Sumatera Utara sedangkan yang lainnya sperti TIFF dan MNG dapat menggunakan metode lossy atau juga lossless. Metode lossless menghasilkan data yang identik dengan data aslinya, hal ini dibutuhkan untuk banyak tipe data, seperti executable code, word processing files, tabulated numbers dan sebagainya. Kompresi lossless diperlukan untuk data teks dan file, seperti catatan bank, artikel teks dll. Misalkan pada suatu citra atau gambar, dimana metode ini akan menghasilkan hasil yang sama persis dengan citra semula, pixel per pixel sehingga tidak ada informasi yang hilang akibat kompresi, namun untuk rasio kompresi yaitu, ukuran file yang dikompresi dibanding ukuran file sebelum dikompresi dengan metode ini sangat rendah. Metode kompresi ini cocok untuk kompresi citra yang mengandung informasi penting yang tidak boleh rusakhilang akibat kompresi, misalnya gambar hasil diagnosa medis Nelson, 1996. Beberapa contoh algoritma kompresi lossless adalah sebagai berikut Sayood, 2006. 1. Algoritma Huffman, yang ditemukan oleh David Huffman, dapat digunakan untuk kompresi gambar dan suara lossless serta kompresi teks. 2. Algoritma Arithmetic Code, dapat digunakan untuk metode lossless maupun lossy. 3. Golomb Code dan Rice Code. 2.5.2 Metode Lossy Metode kompresi lossy yaitu metode yang menyebabkan kehilangan beberapa informasi dan data yang telah dikompresi dengan menggunakan metode ini, namun akan mendapatkan rasio kompresi yang lebih tinggi jika dibandingkan dengan metode lossless Sayood, 2006. Metode lossy adalah suatu metode untuk mengkompresi data dan men- dekompresinya, dimana data yang diperoleh mungkin berbeda dari yang aslinya tetapi cukup dekat perbedaaanya. Lossy kompresi ini paling sering digunakan untuk mengkompresi data multimedia audio ataupun gambar. Format kompresi lossy mengalami generation loss yaitu jika melakukan berulang kali kompresi dan dekompresi file akan menyebabkan kehilangan kualitas secara progresif. Universitas Sumatera Utara Ada terdapat dua skema dasar dalam kompresi lossy, yaitu : lossy transform codec dan lossy predictive codec. 1. Lossy transform codec, yaitu kompresi dimana sampel suara atau gambar yang diambil, di potong kesegmen kecil, diubah menjadi ruang basis yang baru dan hasil nilai kuantisasinya menjadi entropy coded. 2. Lossy predictive codec, yaitu kompresi dimana sebelum atau sesudahnya data yang didecode digunakan untuk memprediksi sampel suara dan frame picture saat ini. Kesalahan antara data prediksi dan data yang nyata, bersamaan dengan informasi lain digunakan untuk mereproduksi prediksi, dan kemudian dikuantisasi. Dalam beberapa system, kedua teknik digabungkan, dengan mengubah codec yang digunakan untuk mengkompresi kesalahan sinyal yang dihasilkan dari tahapan prediksi Nelson, 1996. Dengan kompresi data lossless, ketika pengguna yang menerima file terkompresi secara lossy misalnya untuk mengurangi waktu download file yang diambil akan sedikit berbeda dari yang aslinya dalam levelbit nya, dimana tidak dapat dibedakan oleh mata dan juga telinga manusia secara langsung. Metode ini menghasilkan rasio kompresi yang lebih besar daripada metode lossless. Contoh metode lossy adalah metode CSQ coarser sampling and or quantization, JPEG, dan MPEG. 2.5.3 Ukuran Kinerja Kompresi Ketika mengukur performa dari suatu algoritma kompresi, biasanya akan fokus pada efisiensi dari ruang penyimpanan dan efisiensi waktu termasuk dalam faktor lainnya. Performa suatu algoritma kompresi juga bergantung pada tipe dan struktur dari sumber masukan, yang mana juga akan tergantung pada apakah termasuk dalam kategori kompresi lossless atau lossy. Untuk menilai dan mengetahui keefektifan suatu algoritma kompresi ataupun untuk mengetahui perbandingan file sebelum dan setlah di kompresi, maka diperlukan beberapa parameter kinerja kompresi yang harus diperhatikan sebagai berikut Kodituwakku, 2011. 1. Compression Ratio Compression Ratio merupakan perbandingan antara ukuran file setelah terkompresi dengan file asli, dimana: Universitas Sumatera Utara Compression Ratio = ������������� ������������ ��� 2. Compression Factor Compression Factor merupakan kebalikan dari Compression Ratio, dimana perbandingan antara file asli sebelum terkompresi dengan file setelah terkompresi, dimana: Compression Factor = ���������������� ������������� 3. Saving Percentage Saving Percentage menghitung penyusutan setelah file terkompresi dari file asli sebagai persentase, dimana: Saving Percentage= ���� ������ ����������� −���� ����� ���������� � ���� ������ ����������� x 100 4. Compression Time Waktu yang dibutuhkan untuk kompresi dan dekompresi harus dipertimbangkan secara terpisah. Jika waktu yang dibutuhkan suatu algoritma untuk kompresi dan juga dekompresi kecil atau masih dalam level yang dapat diterima, hal itu menunjukkan bahwa algoritma tersebut dapat diterima untuk masing-masing faktor waktunya. Dengan perkembangan kecanggihan komputer saat ini, maka membuat compression time bernilai sangat kecil dan tergantung pada performa dari komputer yang digunakan.

2.6 Rice Code