Teori Informasi dan Entropi

Gambar 2.3 Pohon Biner Gambar diatas merupakan pohon biner dengan dua subpohon, yaitu subpohon kiri v dengan w sebagai akar dan subpohon kanan v dengan x sebagai akar.

2.6 Teori Informasi dan Entropi

Kompresi data citra memanfaatkan teori informasi karena kompresi menitikberatkan pada masalah redudansi. informasi yang redundan pada kumpulan data citra menimbulkan bit-bit tambahan pada pengkodean, jika informasi tambahan itu bisa diambil maka data yang diperlukan tersebut bisa direduksi. Teori informasi memanfaatkan terminologi entropi sebagai tolak ukur seberapa besar informasi yang dikodekan pada sebuah citra. Entropi merupakan suatu ukuran informasi yang dikandung oleh suatu citra dan digunakan sebagai ukuran untuk mengukur kemampuan kompresi dari citra. Entropi memiliki persamaan matematis sebagai berikut: m H X = - ∑ p i log 2 p i i=1 m = jumlah simbol p i = probabilitas simbol ke-i w v x Universitas Sumatera Utara Contoh: Untuk sumber biner, set probabilitasnya adalah: P = {p 1 , p 2 } = {p 1 , 1-p 1 } Hp 1 ,p 2 = -p 1 lgp 1 – p 2 lgp 2 = -p 1 lgp 1 – 1 – p 1 lg1 – p 1 = Hp 1 Gambar 2.4 Entropy Contoh konsep entropy pada Shannon-Fano Coding: S = {A, B, C, D, E} P = {0.35, 0.17, 0.17, 0.16, 0.15} Pengkodean Shannon-Fano: 1. Bagi S kedalam s 1 dan s 2 pilih yang memberikan perbedaan ps 1 dan ps 2 2. s terkecil 1 = A,B  ps 1 3. s = pA + pB = 0,52 2 = C,D,E  ps 2 4. Panggil ShannonFano = pC + pD + pE = 0,48 Panjang code rata-rata: L sh = 0,352 + 0,172 + 0,172 + 0,163+0,153 = 2,31 Universitas Sumatera Utara Semakin kecil nilai entropi yang dihasilkan maka kemampuan kompresi lebih baik. entropi juga didefinisikan sebagai limit kemampuan kompresi citra yang tidak dapat dilampau oleh algoritma manapun. jika nilai entropi dan jumlah simbol diketahui maka sebuah citra dapat diprediksi berapa besar ukuran terkompresinya, sehingga dapat diprediksi pula rasio kompresinya dengan menggunakan persamaan matematis berikut ini: ukuran terkompresi = w x h x t x m x entropi : 8 + m x j w: lebar citra digital h: tinggi citra digital t: menyatakan jumlah plane yang digunakan pada saat kompresi, bernilai 3 jika menggunakan tipe per plane, karena plane R, G, B digunakan secara terpisah dan bernilai 1 jika menggunakan tipe kompresi per piksel karena plane R, G, B digunakan secara satu kesatuan menjadi sebuah plane. m: jumlah simbol j: menyatakan ukuran codebook setiap barisnya, jumlah baris sama dengan jumlah simbol.

2.7 Kompresi Citra