8.5. Kompresi Data
Kompresi Data terdiri dua kata yaitu kata “data” yang secara umum digunakan untuk mendefinisikan informasi dalam bentuk digital yang dioperasikan oleh program
komputer, dan “kompresi” yang berarti sebuah proses untuk menghilangkan redudansi. Maka, kompresi data memiliki arti sebagai sebuah metode atau algoritma
yang secara efisien dirancang untuk merepresentasi data dengan mode redudansi yang rendah atau menghilangkan redudansi di dalam data. Tujuan utama dari kompresi data
adalah untuk mewakili data terkompresi dalam bentuk digital dengan bit sesedikit mungkin namun tetap memenuhi persyaratan minimal yang diperlukan untuk
merekonstruksi data kembali menjadi data asli. Algoritma kompresi data tidak akan bekerja apabila tidak terdapat algoritma dekompresi data. Dekompresi data adalah
teknik yang digunakan untuk mengembalian data yang telah terkompresi ke ukuran semula.
Kompresi data bekerja dengan dua konsep sederhana yaitu mengurangi jumlah simbol unik yang terdapat di dalam data dan mengencoding simbol dengan frekuensi
tinggi menjadi bit yang lebih sedikit. Setiap algoritma kompresi data fokus melakukan salah satu dari dua konsep tersebut. Algoritma kompresi data mentransformasi data
dengan mengurangi jumlah simbol atau mengambil keuntungan dari perbedaan jumlah frekuensi simbol dan mengencoding simbol dengan frekuensi tinggi dengan bit yang
lebih sedikit McAnlis Haecky 2016.
2.5.1 Parameter analisis algoritma kompresi
Terdapat beberapa parameter yang digunakan untuk menganalisis kinerja metode kompresi, antara lain:
1. Ratio of Compression Rc adalah perbandingan ukuran data sebelum dan setelah
dilakukan kompresi yang dirumuskan sebagai: �� =
��� ������� �������� ��� ������ℎ ��������
Misalkan didapat Ratio of Compression setelah kompresi sebesar 1.75. Hal ini menunjukkan bahwa ukuran data sebelum dikompresi adalah 1.75 kali lebih besar
dari ukuran data setelah dikompresi.
Universitas Sumatera Utara
2. Compression Ratio Cr adalah persentasi besar data setelah dikompresi yang
didapatkan dengan menghitung perbandingan ukuran data sesudah kompresi dan data sebelum kompresi yang dirumusakan sebagai:
�� = ��� ������ℎ ��������
��� ������� �������� � 100
Misalkan didapatkan Compression Ratio sebesar 40. Hal ini menunjukkan bahwa ukuran data setelah dikompresi hanya 40 dari ukuran file asli.
3. Redudancy Rd merupakan kelebihan yang terdapat didalam data sebelum
dilakukan kompresi. Kelebihan data ini dapat diketahui dengan menghitung selisih perbandingan ukuran data setelah kompresi dan data sebelum kompresi,
yang dirumuskan sebagai: �� = 100 − ���p������� �����
Nilai 65 yang didapatkan memiliki arti data sebelum kompresi memiliki kelebihan data sebesar 65.
4. Running Time adalah waktu yang dibutuhkan sistem untuk mengerjakan sebuah
proses. Semakin kecil waktu yang digunakan oleh sistem, maka kinerja algoritma semakin efisien.
2.5.2 Jenis kompresi data berdasarkan output
1. Lossy Compression
Metode ini dapat digunakan terutama untuk mengkompresi gambar, video, atau audio. Lossy compression menghasilkan hasil kompresi yang lebih baik daripada
lossless compression, akan tetapi terdapat beberapa data yang hilang setelah proses kompresi. Dengan Lossy Compression hasil kompresi berbeda dengan data
original yang di kompresi oleh encoder, namun tetap dapat diterima oleh user. Karena jumlah kehilangan data kecil, perbedaan yang ada tidak akan terdeteksi
hanya dengan panca indra sehingga hasil kompresi akan tetap terlihat atau terdengar sama. Beberapa algoritma yang termasuk dalam jenis lossy
compression adalah JPEG, MPEG, ADPCM, Fractal Compression, MP3, dan sebagainya.
Universitas Sumatera Utara
2. Lossless Compression
Pada kompresi file teks metode Lossy Compression tidak sesuai untuk digunakan, di mana pada file teks hilangnya karakter walaupun hanya satu buah dapat
menghasilkan teks yang salah, ambigu, atau tidak dapat dimengerti. File seperti ini harus dikompresi dengan metode lossless compression. Pada metode lossless
compression, hasil yang didapat identik dengan data original sebelum proses kompresi. Beberapa algoritma yang tergolong jenis metode ini antara lain FLBE,
VLBE, Even-Rodeh Code, Huffman Code, 7z, ace, bow, Zip, rar.
8.6. Algoritma Even-Rodeh