Gambar 2.3 Pohon Biner
Gambar diatas merupakan pohon biner dengan dua subpohon, yaitu subpohon kiri v dengan w sebagai akar dan subpohon kanan v dengan x sebagai akar.
2.6 Teori Informasi dan Entropi
Kompresi data citra memanfaatkan teori informasi karena kompresi menitikberatkan pada masalah redudansi. informasi yang redundan pada kumpulan data citra
menimbulkan bit-bit tambahan pada pengkodean, jika informasi tambahan itu bisa diambil maka data yang diperlukan tersebut bisa direduksi.
Teori informasi memanfaatkan terminologi entropi sebagai tolak ukur seberapa besar informasi yang dikodekan pada sebuah citra. Entropi merupakan suatu ukuran
informasi yang dikandung oleh suatu citra dan digunakan sebagai ukuran untuk mengukur kemampuan kompresi dari citra. Entropi memiliki persamaan matematis
sebagai berikut: m
H X = - ∑ p
i
log
2
p
i i=1
m = jumlah simbol p
i
= probabilitas simbol ke-i w
v x
Universitas Sumatera Utara
Contoh: Untuk sumber biner, set probabilitasnya adalah:
P = {p
1
, p
2
} = {p
1
, 1-p
1
} Hp
1
,p
2
= -p
1
lgp
1
– p
2
lgp
2
= -p
1
lgp
1
– 1 – p
1
lg1 – p
1
= Hp
1
Gambar 2.4 Entropy
Contoh konsep entropy pada Shannon-Fano Coding: S = {A, B, C, D, E}
P = {0.35, 0.17, 0.17, 0.16, 0.15}
Pengkodean Shannon-Fano: 1.
Bagi S kedalam s
1
dan s
2
pilih yang memberikan perbedaan ps
1
dan ps
2
2. s
terkecil
1
= A,B ps
1
3. s
= pA + pB = 0,52
2
= C,D,E ps
2
4. Panggil ShannonFano
= pC + pD + pE = 0,48
Panjang code rata-rata: L
sh
= 0,352 + 0,172 + 0,172 + 0,163+0,153 = 2,31
Universitas Sumatera Utara
Semakin kecil nilai entropi yang dihasilkan maka kemampuan kompresi lebih baik. entropi juga didefinisikan sebagai limit kemampuan kompresi citra yang tidak
dapat dilampau oleh algoritma manapun. jika nilai entropi dan jumlah simbol diketahui maka sebuah citra dapat diprediksi berapa besar ukuran terkompresinya,
sehingga dapat diprediksi pula rasio kompresinya dengan menggunakan persamaan matematis berikut ini:
ukuran terkompresi = w x h x t x m x entropi : 8 + m x j
w: lebar citra digital h: tinggi citra digital
t: menyatakan jumlah plane yang digunakan pada saat kompresi, bernilai 3 jika menggunakan tipe per plane, karena plane R, G, B digunakan secara
terpisah dan bernilai 1 jika menggunakan tipe kompresi per piksel karena plane R, G, B digunakan secara satu kesatuan menjadi sebuah plane.
m: jumlah simbol j: menyatakan ukuran codebook setiap barisnya, jumlah baris sama dengan
jumlah simbol.
2.7 Kompresi Citra