Kompresi Data Data Berlebihan Data Redundancy

6 Tablespace SYSTEM Tablespace 1 Tablespace 2 Database Segment 1 Segment 2 Segment 3 Extend 1 Extend 2 Data Block Tablespace Segment Gambar 2.3 Susunan Data Sistem di komputer akan mengorganisasi data dalam sebuah hirarki yang terdiri dari satuan-satuan bit, byte, field, record, file, dan database. Bit merupakan unit data yang terkecil, tingkatan terendah; singkatan dari binary digit Joos et al, 2009: 12. Byte adalah kumpulan dari kombinasi bits, biasanya terdiri 8 bit yang menjadi unit terkecil dalam storage dan mempunyai alamat, sering kali menjadi bagian dari word Supriyanto et al, 2008: 71. Field merupakan karakter-karakter yang membentuk arti tertentu, misalnya field untuk nomor mahasiswa, dan sebagainya Record adalah kumpulan dari fields yang membentuk sebuah arti yang saling berhubungan. Noersasongko, 2010: 36. File adalah kumpulan dari records yang sejenis, contoh file tentang kepegawaian di berbagai departemen di sebuah instansi Supriyanto et al, 2008: 71. Database adalah sekumpulan data yang berhubungan secara logika dan memiliki beberapa arti yang saling berpautan Mata-Toledo, 2007: 1.

2.2 Kompresi Data

Proses kompresi merupakan proses mereduksi ukuran suatu data untuk menghasilkan representasi digital yang padat atau mampat compact namun tetap dapat mewakili kuantitas informasi yang terkandung pada data tersebut. Tujuan dari kompresi data adalah untuk mengurangi data berlebihan redundancy sehingga ukuran data menjadi Universitas Sumatera Utara 7 lebih kecil dan lebih ringan dalam proses transmisi dan menghemat ruang memori dalam penyimpanan data Putra, 2010: 261. Ada beberapa faktor yang memunculkan data berlebihan sehingga harus diperlukan proses kompresi. Faktor-faktor tersebut antara lain sebagai berikut: 1. pada suatu citra tunggal atau pada frame tunggal video dapat terjadi korelasi yang signifikan antara suatu piksel dengan piksel tetangga. Korelasi ini disebut dengan korelasi spasial spatial correlation, 2. pada data yang diambil dari beberapa sensor multi sensor, terdapat korelasi yang signifikan antarsampel yang diambil oleh sensor-sensor tersebut. Korealasi ini disebut dengan korelasi spektral spectral correlation, 3. pada data temporal seperti video, terdapat korelasi yang signifikan antara sampel data pada segmen waktu yang berbeda. Korelasi ini disebut sebagai korelasi temporal temporal correlation, 4. pada suatu data terdapat informasi yang tidak relevan dengan sudut pandang persepsi mata.

2.3 Data Berlebihan Data Redundancy

Terdapat beberapa faktor yang memunculkan data berlebihan data redundancy. Data berlebihan ini dapat dinyatakan secara sistematis. Bila n 1 dan n 2 menyatakan jumlah satuan unit informasi dalam dua himpunan data data set yang mewakili data yang sama maka data berlebihan relatif relative data redundancy R D dari himpunan data pertama dinyatakan sebagai berikut: � � = 1 − 1 � � ................................................................................................. 1 Dimana R D merupakan redundansi, dan C R merupakan rasio kompresi. Rasio kompresi C R dinyatakan sebagai berikut: � � = � 1 � 2 .......................................................................................................... 2 Dimana n 1 merupakan nilai dari data hasil kompresi, dan n 2 merupakan nilai dari data asli. Bila n 1 = n 2 maka C R = 1 dan R D = 0, berarti bahwa data set pertama tidak mengandung data berlebihan. Bila n 2 n 1 n 2 jauh lebih kecil dari n 1 maka C R mendekati 1 tak terhingga, sehingga R D mendekati 1. Ini berarti terjadi kandungan data berlebihan sangat tinggi. Bila n 2 n 1 n 2 jauh lebih besar dari n 1 maka C R Universitas Sumatera Utara 8 mendekati 0, sehingga R D mendekati minus tak terhingga. Ini berarti data set kedua mengandung informasi jauh lebih banyak dibandingkan data set pertama. Secara umum, C R dan R D berturut-turut beada dalam interval 1, ∞ dan -∞,1. Dalam praktik, rasio kompresi 20 atau 20:1 berarti data set pertama mengandung 20 satuan unit informasi untuk setiap 1 unit pada data set kedua atau pada data terkompresi. Dengan kata lain, untuk kasus citra, citra asli citra belum termampatkan mengandung 20 bit informasi untuk setiap 1 bit pada data terkompresi. Redundansi 0.8 berarti 80 data pada data set pertama adalah berlebihan.

2.4 Teknik Kompresi Citra