Analisis Daya Serap Citra pada Pesan Berbahasa Indonesia Menggunakan Pencocokan Warna

BAB 2
LANDASAN TEORI

Untuk mendukung penelitian ini, maka penulis memerlukan beberapa sumber dan
informasi yang berhubungan dengan penelitian yang penulis kerjakan. Adapun refrensi
yang penulis sampaikan merupakan hasil penelitian dan buku yang telah diterbitkan
sebelumnya.
2.1

Pesan
Pesan (message) adalah data atau informasi yang dapat dibaca dan dimengerti

maknanya. Nama lain untuk pesan adalah plainteks (plaintext) atau teks-jelas (cleartext).
Secara umum, jenis pesan terbagi menjadi dua, yakni pesan verbal dan non-verbal. Pesan
verbal adalah jenis pesan yang penyampaiannya menggunakan kata-kata, dan dapat
dipahami isinya oleh penerima berdasarkan apa yang didengarnya. Sedangkan, pesan
non-verbal adalah jenis pesan yang penyampaiannya tidak menggunakan kata-kata secara
langsung, dan dapat dipahami isinya oleh penerima berdasarkan gerak-gerik, tingkah
laku, mimik wajah, atau ekspresi muka pengirim pesan. Pada pesan non-verbal
mengandalkan indera penglihatan sebagai penangkap stimuli yang timbul. (Ratmanto,
2006)


2.2

Steganografi
Steganografi (steganography) adalah ilmu dan seni menyembunyikan pesan

rahasia (hiding message) sedemikian sehingga keberadaan (eksistensi) pesan tidak
terdeteksi oleh indera manusia. Kata steganorafi berasal dari Bahasa Yunani yang berarti
“tulisan tersembunyi” (covered writing). Steganografi membutuhkan dua properti: wadah

penampung dan data rahasia yang akan disembunyikan. (Khalil & Hilmat, 2011).

Universitas Sumatera Utara

5

Steganografi digital menggunakan media digital sebagai wadah penampung,
misalnya citra, suara, teks, dan video. Data rahasia yang disembunyikan juga dapat
berupa citra, suara, teks, atau video. Steganografi dapat dipandang sebagai kelanjutan
kriptografi. Dengan steganografi pesan yang disembunyikan disamarkan atau disispkan

didalam sebuah media sehingga pihak ketiga tidak mengetahui keberadaannya. Di
negara-negara yang melakukan penyensoran informasi, steganografi sering digunakan
untuk menyembunyikan pesan-pesan melalui gambar (images), video, atau suara (audio).
Steganografi sudah dikenal oleh bangsa Yunani. Herodatus, penguasa Yunani, mengirim
pesan rahasia dengan menggunakan kepala budak atau prajurit sebagai media. Dalam hal
ini, rambut budak dibotaki, lalu pesan rahasia ditulis pada kulit kepala budak. Ketika
rambut budak tumbuh, budak tersebut diutus untuk membawa pesan rahasia di balik
rambutnya. Bangsa Romawi mengenal steganografi dengan menggunakan tinta taktampak (invisible ink) untuk menuliskan pesan. Tinta tersebut dibuat dari campuran sari
buah, susu, dan cuka. Jika tinta digunakan untuk menulis maka tulisannya tidak tampak.
Tulisan di atas kertas dapat dibaca dengan cara memanaskan kertas tersebut. (Piarsa,
2011)
Semakin pentingnya nilai dari sebuah informasi, maka semakin berkembang pula
metode-metode yang dapat digunakan untuk melakukan penyisipan informasi yang
didukung pula dengan semakin berkembangnya media elektronik. Berbagai macam
media elektronik kini telah dapat digunakan untuk melakukan berbagai fungsi
steganografi dengan berbagai macam tujuan dan fungsi yang diharapkan oleh
penggunanya. Sebagai fungsi yang umum, steganografi digunakan untuk memberikan
cap khusus dalam sebuah karya yang dibuat dalam format media elektronik sebagai
identifikasi, Steganografi yang baik memiliki bebrapa kriteria seperti Fidelity,
Robustness, Recovery. (Santiko, 2014)

2.2.1. Kriteria Steganografi yang Bagus
Penyembunyian data rahasia ke dalam citra digital akan mengubah kualitas citra
tersebut. Kriteria yang harus diperhatikan dalam penyembunyian data adalah:

Universitas Sumatera Utara

6

1. Fidelity, Mutu citra penampung tidak jauh berubah. Setelah penambahan data rahasia,
citra hasil steganografi masih terlihat dengan baik. Pengamat tidak mengetahui kalau di
dalam citra tersebut terdapat data rahasia.
2. Robustness, Data yang disembunyikan harus tahan terhadap manipulasi yang
dilakukan pada citra penampung (seperti pengubahan kontras, penajaman, pemampatan,
rotasi, perbesaran gambar, pemotongan (cropping), enkripsi, dan sebagainya). Bila pada
citra dilakukan operasi pengolahan citra, maka data yang disembunyikan tidak rusak.
3. Recovery, Data yang disembunyikan harus dapat diungkapkan kembali (recovery).
Karena tujuan steganografi adalah data hiding, maka sewaktu-waktu data rahasia di
dalam citra penampung harus dapat diambil kembali untuk digunakan lebih lanjut.

2.2.2. Teknik Steganografi

Teknik steganografi gambar dapat dibagi menjadi dua bagian: spatial domain dan
transform / frekuensi domain. Pada spatial domain informasi dimasukkan kedalam tiap
pixel satu persatu. Sementara itu, pada transform domain, gambar ditransformasikan
terlebih dulu kemudian informasi baru dimasukkan ke gambar. Teknik steganografi pada
spatial domain menggunakan metoda bit-wise yang menggunakan penyisipan bit dan
noise

manipulation.

Format gambar yang paling cocok untuk cara ini adalah tipe

lossless. Namun, cara ini sangat bergantung kepada format gambarnya. (Morkel, Eloff, &
Oliver, 2005)
Steganografi pada transform
transformasi gambar.

domain

melibatkan manipulasi algoritma dan


Metoda ini menyembunyikan informasi pada area yang lebih

signifikan pada cover image dan membuat hasilnya jadi lebih baik. Cara ini juga tidak
tergantung pada format gambar. Informasi yang disisipkan juga dapat bertahan walaupun
menggunakan kompresi lossy maupun lossless.
Dua teknik lain yang sangat erat kaitannya dengan steganografi adalah
watermarking dan fingerprinting. Kedua teknik ini berfokus pada perlindungan hak cipta
dengan menyisipkan informasi hak cipta pada media lain dan memberikan ijin kepada
pihak ketiga untuk mengetahui keberadaan informasi yang disisipkan tersebut. Hal ini
berbeda dengan steganografi yang menjaga informasi yang disisipkan pada media lain

Universitas Sumatera Utara

7

agar tidak terlihat oleh pihak ketiga. Jika ada pihak ketiga yang ingin menghack isi
informasi tersembunyi tersebut, maka tujuan mereka adalah berbeda. Jika pada
watermarking dan fingerprinting, maka mereka berusaha menghilangkan informasi yang
disisipkan, sedangkan jika pada steganografi, maka mereka berusaha sebatas mendeteksi
keberadaan informasi tersembunyi. (Morkel, Eloff, & Oliver, 2005).


2.3

Citra
Kata citra atau yang dikenal secara luas dengan kata “gambar” dapat diartikan

sebagai suatu representasi, kemiripan atau imitasi dari suatu objek atau benda. Secara
matematis, citra dinyatakan sebagai suatu fungsi kontinyu dari intensitas cahaya pada
bidang dua dimensi. Citra yang terlihat merupakan cahaya yang direfleksikan dari sebuah
objek. Sumber cahaya menerangi objek, objek memantulkan kembali sebagian dari berkas
cahaya tersebut dan pantulan cahaya ditangkap oleh alat-alat optik, misalnya: mata
manusia, kamera, scanner, sensor satelit. Citra digital merupakan hasil digitalisasi dari
representasi sebuah objek yang menghasilkan koordinat berupa (x,y) untuk citra dua
dimensi dan menghasilkan level brightness. Citra digital terdiri dari piksel-piksel yang
saling berhubungan untuk membentuk sebuah informasi dari citra yang dibentuk. Setiap
piksel didalam citra digital memiliki tiga nilai warna dasar yang dikombinasikan dan
membentuk warna baru, warna dasar penyusun piksel-piksel didalam citra adalah Merah,
Biru, dan Hijau. (Khalil & Hilmat, 2011)
Nilai warna dasar yang menyusun suatu piksel memiliki rentang tertentu, dari nilai
minimum sampai maksimum. Nilai yang digunakan berbeda-beda tergantung dari jenis

warnanya. Namun secara umum rentangnya adalah 0 – 255. Berikut ini adalah jenis-jenis
citra berdasarkan nilai warna dasar penyusun pikselnya. Citra biner adalah citra digital
yang hanya memiliki dua kemungkinan nilai warna dasar yaitu hitam (Nilai 255 pada 3
warna dasar), dan putih (Nilai 0 pada 3 warna dasar). Citra biner juga disebut sebagai
citra monokrom. Hanya dibutuhkan 1 bit untuk mewakili nilai setiap pixel dari citra biner.
Citra Grayscale merupakan citra digital yang hanya memiliki satu nilai yang sama
pada setiap warna dasarnya. Dengan kata lain nilai bagian RED = GREEN = BLUE. Nilai
tersebut menunjukkan tingkat intensitas dari setiap warna di dalam citra. Warna yang

Universitas Sumatera Utara

8

dimiliki adalah warna dari hitam, abu-abu, dan putih. Tingkatan abu-abu disini
merupakan warna abu-abu dengan berbagai tingkatan dari hitam hingga mendekati putih.
Untuk memproses citra baik mengubah warna, ukuran dan lain-lain maka dibutuhkan
sebuah pengolahan citra.
Pengolahan citra digital menunjuk pada pemrosesan gambar dua dimensi.
Pengolahan citra menggunakan komputer merupakan pengolahan citra yang dilakukan
menggunakan perangkat komputer, dimana perangkat komputer dapat mengolah isyaratisyarat elektronik digital yang merupakan sinyal biner (bernilai dua: 0 dan 1). Untuk itu

citra digital harus mempunyai format yang sesuai sehingga dapat mempresentasikan
objek citra dalam bentuk kombinasi data biner. Agar citra digital dapat diolah oleh
komputer, maka suatu citra harus direpresentasikan secara numerik yang dibentuk dari
nilai biner yang menyusun citra tersebut. Nilai-nilai tersebut direpresentasikan sebagai
nilai-nilai warna pada citra digital. Untuk citra 8 bit akan memiliki satu rentang warna
berkisar dari 0 – 255, untuk citra 16 bit akan memiliki dua rentang warna, dan citra 24 bit
akan memiliki tiga warna yang dikenal sebagai R(red), G(green), dan B(blue).
Di dalam sebuah citra digital terdapat berbagai nilai warna yang disusun untuk
menghasilkan informasi dari citra tersebut. Untuk mengetahui jumlah kemunculan warna
dari sebuah citra dibutuhkan sebuah histogram, yaitu sebuah grafik yang menggambarkan
penyebaran nilai-nilai warna pada pixel dari suatu citra atau bagian tertentu di dalam
citra. Dari sebuah histogram dapat diketahui jumlah kemunculan dari warna pada citra
tersebut. (Lussiana & Febriani, 2008)

2.3.1. Jenis Citra Digital
Berdasarkan warna-warna penyusunnya, citra digital dapat dibagi menjadi tiga
macam (Rafael & Richard, 2002) yaitu:
a. Citra biner, yaitu citra yang hanya terdiri atas dua warna atau citra monokrom. Oleh
karena itu, setiap pixel pada citra biner cukup direpresentasikan dengan 1 bit.


Universitas Sumatera Utara

9

Gambar 2.1 Citra Biner

Gambar 2.2 Representasi Citra Biner
Meskipun saat ini citra berwarna lebih disukai karena memberi kesan yang lebih
kaya dari citra biner, namun tidak membuat citra biner mati. Pada beberapa aplikasi citra
biner masih tetap di butuhkan, misalkan citra logo instansi (yang hanya terdiri dari warna
hitam dan putih), citra kode barang (bar code) yang tertera pada label barang, citra hasil
pemindaian dokumen teks, dan sebagainya. Seperti yang sudah disebutkan diatas, citra
biner hanya mempunyai dua nilai yaitu hitam dan putih. Piksel – piksel bernilai warna
dasar 0 dan piksel – piksel latar belakang dengan warna dasar bernilai 255/1. pada waktu
menampilkan gambar, 255/1 adalah putih dan 0 adalah hitam. Jadi pada citra biner, latar
belakang berwarna putih sedangkan objek berwarna hitam seperti tampak pada gambar
2.1 diatas. Meskipun komputer saat ini dapat memproses citra abu-abu (grayscale)
maupun citra berwarna, namun citra biner masih tetap di pertahankan keberadaannya.
Alasan penggunaan citra biner adalah karena citra biner memiliki sejumlah keuntungan
sebagai berikut:

1.

Kebutuhan memori kecil karena nilai derajat keabuan hanya membutuhkan
representasi 1 bit.

Universitas Sumatera Utara

10

2.

Waktu pemrosesan lebih cepat di bandingkan dengan citra abu-abu ataupun
warna.

b. Citra grayscale, yaitu citra yang nilai pixel-nya memiliki nilai dasar merepresentasikan
derajat

abu-abu

atau


intensitas

warna

putih.

Nilai

intensitas

paling

rendah

merepresentasikan warna hitam dan nilai intensitas paling tinggi merepresentasikan warna
putih. Pada umumnya citra grayscale memiliki kedalaman pixel 8 bit (256 derajat
keabuan), tetapi ada juga citra grayscale yang kedalaman pixel-nya bukan 8 bit, misalnya
16 bit untuk penggunaan yang memerlukan ketelitian tinggi.

Gambar 2.3 Citra Grayscale
Citra grayscale memiliki nilai warna yang sama didalam satu piksel nya yang
dibedakan dengan derajat keabuannya. Sebagai contoh citra grayscale dengan 256 level
artinya mempunyai skala abu dari 0 sampai 255 atau [0,255], yang dalam hal ini intensitas
0 menyatakan hitam, intensitas 255 menyataka putih, dan nilai antara 0 sampai 255
menyatakan warna keabuan yang terletak antara hitam dan putih.
c. Citra berwarna, yaitu citra yang nilai pixel-nya merepresentasikan warna tertentu
Banyaknya warna yang mungkin digunakan bergantung kepada kedalaman pixel citra
yang bersangkutan. Citra berwarna direpresentasikan dalam beberapa nilai (0-255) yang
menyatakan disusun menjadi warna untuk menampilkan informasi dari citra nya.
Banyaknya knilai warna yang digunakan bergantung pada model warna yang digunakan
pada citra tersebut.

Universitas Sumatera Utara

11

Gambar 2.4 Citra Berwarna
Intensitas suatu titik pada citra berwarna merupakan kombinasi dari tiga
intensitas: merah (fmerah (x, y)), hijau fhijau (x, y) dan biru (fbiru (x, y)). Persepsi visual
citra berwarna umumnya lebih kaya di bandingkan dengan citra biner dan grayscale. Citra
berwarna menampilkan objek seperti warna aslinya (meskipun tidak selalu tepat
demikian). Warna-warna yang diterima oleh mata manusia merupakan hasil kombinasi
cahaya dengan panjang gelombang berbeda. (Rafael & Richard, 2002)

2.3.2. Format Citra Digital
Citra digital dapat disimpan dalam berbagai macam format. Beberapa format citra
digital dapat memanfaatkan metode kompresi dalam penyimpanan data citra. Kompresi
yang dilakukan dapat bersifat lossy maupun lossless, bergantung kepada jenis format
yang digunakan. Kompresi yang bersifat lossy menyebabkan penurunan kualitas citra,
meskipun dalam beberapa kasus penurunan kualitas tersebut tidak dapat dikenali oleh
mata manusia. Beberapa format citra digital yang banyak ditemui adalah BMP, JPEG,
GIF, PNG, dan lain-lain. (Rafael & Richard, 2002)

1.

Bitmap images

Kriteria yang paling penting dari citra ini adalah kedalaman warna yaitu berapa banyak
bit per pixel yang didefinisikan dari sebuah warna.
Bitmap dengan mengikuti kriteria tadi maka dapat dilihat:

Universitas Sumatera Utara

12

1.

8 bit = 256 warna (256 gray scales).

2.

24 bit = 16.777.216 warna

Gambar 2.5 Warna bitmap
Secara umum dapat dikatakan semakin banyaknya warna, maka akan diperlukan
keamanan yang ketat atau tinggi dikarenakan bitmap memiliki area yang sangat luas
dalam sebuah warna yang seharusnya dihindarkan. Dilihat dari kedalaman atau kejelasan
dari sebuah warna, bitmap dapat mengambil sejumlah data tersembunyi dengan
perbandingan sebagai berikut (ukuran ratio dari bitmap dalam byte = ukuran dari data
yang disembunyikan):
1.

8 bit = 256 warna: 8: 1

2.

24 bit = 16.777.216 warna: 8: 1
Perbandingan tersebut diperoleh dari penentuan LSB dalam suatu byte, untuk citra

8 bit letak LSB adalah pada bit paling kanan sedangkan untuk citra 24 bit letak LSB
adalah pada bit ke-8, bit ke-16 dan bit ke 24 dimana masing-masing byte mewakili warna
merah (red), warna hijau (green) dan warna biru (blue).
Manipulasi pada bitmap tidak dapat dikonvert atau diubah ke dalam bentuk format
grafik yang lain karena data tersembunyi dalam file tersebut akan hilang. Format
menggunakan metode komperesi yang lain (seperti JPEG) tidak di gunakan dalam skripsi
ini. Mengurangi ukuran dari carrier file sangatlah penting untuk melakukan transmisi
online, yaitu dengan menggunakan utilitas kompresi (seperti: ARZ, LZH, PKZIP,
WinZip), dikarenakan kerja mereka tidak terlalu berat.

Universitas Sumatera Utara

13

2.

GIF

Graphic Interchange Format (GIF, dibaca jiff, tetapi kebanyakan orang menyebutnya
dengan giff) yang dibuat oleh Compuserve pada tahun 1987 untuk menyimpan berbagai
gambar dengan format bitmap menjadi sebuah file yang mudah untuk diubah pada
jaringan koputer. GIF adalah file format graphic yang paling tua pada Web, dan begitu
dekatnya file format ini dengan web pad saat itu sehingga para Browser menggunakan
format ini.
File GIF dapat disimpan dalam dua jalan yaitu secara berurutan (Dari atas ke
bawah) dan pembagian dengan baris (8 baris, 4 baris dan 2 baris). Pembagian baris pada
gambar dengan resolusi gambar yang rendah dengan cepat dimana secara gradual
datangnya untuk menjadikan lebih focus, dengan expense dari penambahan kapasitas file.
Terdapat dua tipe dari GIFs, antara lain:
a)

GIF87a: support dengan interlacing dan kapasitas dari beberapa file. Teknik itu
dinamakan GIF87 karena pada tahun 1987 standar ini ditemukan dan dijadikan
standar.

b)

GIF89a: adalah kelanjutan dari spesifikasi GIF87a dan penambahan pada
transparency, pemberian tulisan dan animasi dari text dan grafik.

3.

JPEG
Joint Photograpic Experts (JPEG, dibaca jay-peg) di rancang untuk kompresi

beberapa full-color atau gray-scale dari suatu gambar yang asli, seperti pemandangan asli
di dunia ini. JPEGs bekerja dengan baik pada continous tone images seperi photographs
tetapi tidak terlalu bagus pada ketajaman gambar dan seni pewarnaan seperti penulisan,
kartun yang sederhana atau gambar yang mengunakan banyak garis. JPEG sudah
mendukung untuk 24-bit color depth atau sama dengan 16,7 juta warna (224 =
16.777.216 warna), progressive JPEGs (pJPEGs) adalah tipe dari beberapa persen lebih
kecil dibandingkan baseline JPEGs: Tetapi keuntungan dari JPEG dan tipe-tipenya telihat
pada langkah-langkahnya sama seperti interlaced GIFs.

JPEG adalah algoritma kompresi secara lossy. JPEG bekerja dengan merubah
gambar spasial dan merepresentasikan kedalam pemetaan frekueunsi. Discrete Cosine

Universitas Sumatera Utara

14

Transform (DCT) dengan memisahkan antara informasi frekuensi yang rendah dan tinggi
dari sebuah gambar. Informasi frekuensi yang tinggi akan diseleksi untuk dihilangkan
yang terikat pada pengaturan kualitas yang digunakan. Kompresi dengan tingkatan yang
lebih baik, tingkatan yang lebih baik dari informasi yang dihilangkan. Waktu Kompresi
dan dekompresi dilaksanakan dengan simetris. JPEG Group’s (IJG) decode r lebih

ditingkatkan kemampuannya dibandingkan dengan encodernya. Manakala, ketika
diperlihatkan 8 bits, mengurangi kuantisasi warna yang lambat. Banyak para penjual
JPEG menawarkan untuk mempercepat hasil dari JPEG, kuantisasi warna dan kualitas
dengan mengimplementasikan IJG.

JPEG dirancang untuk mengeksploitasi tingkatan dari mata kita yakni bahwa mata
kita tidak akan dapat mebedakan perubahan yang lambat terang dan warna dibandingkan
dengan perbedaan suatu jarak apakah jauh atau dekat. Untuk itu JPEG sangat baik
digunkan pada fotografi dan monitor 80-bit. JPEG sebenarnya hanyalah algoritma
kompresi, bukan merupakan nama format file. File yang biasa disebut JPEG pada jaringan
sebenarnya adalah JFIF (JPEG File Interchange Format). (Rafael & Richard, 2002)
4.

PNG (Portable Network Graphics)
PNG adalah kepanjangan dari Portable Network Graphics atau bisa diplesetkan

menjadi “PNG-Nοt-GIF“. Dikembangkan sebagai alternatif lain untuk GIF, yang

menggunakan paten dari LZW–algoritma kompresi. PNG adalah format gambar yang
sangat baik untuk grafis internet, karena mendukung transparansi didalam perambah
(browser) dan memiliki keindahan tersendiri yang tidak bisa diberikan GIF atau bahkan
JPG. Bisa disebut sebagai salah satu format yang merupakan gabungan dari format JPG
dan GIF. Untuk tipe ini mampu untuk gradiasi warna.
Karena sifat transparannya yang tidak pecah-pecah, PNG yang masuk kelas 24-bit ini
cocok untuk membuat screenshoot. Ia bisa mereproduksi gambar desktop dari tiap piksel
ke piksel secara detil. PNG juga mendukung kelas 8-bit seperti GIF, sekaligus 24-bit
seperti JPG, bisa mengkompresi gambar dari proses fotografi tanpa banyak mengurangi

Universitas Sumatera Utara

15

kualitas gambarnya. Namun PNG cukup besar ukurannya diantara JPG dan GIF, serta
tidak didukung oleh perambah / browser yang lama.
Tipe file PNG merupakan solusi kompresi yang powerful dengan warna yang lebih
banyak (24 bit RGB + alpha). Berbeda dengan JPG yang menggunakan teknik kompresi
yang menghilangkan data, file PNG menggunakan kompresi yang tidak menghilangkan
data (lossles compression). Kelebihan file PNG adalah adanya warna transparan dan
alpha. Warna alpha memungkinkan sebuah gambar transparan, tetapi gambar tersebut
masih dapat dilihat mata seperti samar-samar atau bening. File PNG dapat diatur jumlah
warnanya hingga 64 bit (true color + alpha) sampai indexed color 1 bit. Dengan jumlah
warna yang sama, kompresi file PNG lebih baik daripada GIF, tetapi memiliki ukuran file
yang lebih besar daripada JPG. Kekurangan tipe PNG adalah belum populer sehingga
sebagian browser tidak mendukungnya.
Format PNG ini diperkenalkan untuk menggantikan format GIF. PNG mempunyai
faktor kompresi yang lebih baik dibandingkan dengan GIF (kurang lebih 5%-25% lebih
baik dibanding format GIF). Tetapi ada satu fasilitas dari GIF yang tidak terdapat pada
PNG format yaitu dukungan terhadap penyimpanan multi format untuk keperluan
animasi. Untuk keperluan pengolahan gambar, meskipun format PNG bisa dijadikan
alternatif selama proses pengolahan grafis namun format JPEG masih menjadi pilihan
yang lebih baik. (Rafael & Richard, 2002)
2.4

Distribusi Huruf
Huruf adalah tanda aksara dalam tata tulis yang disusun untuk menghasilkan

sebuah kata. Kata merupakan kumpulan huruf yag merupakan satuan bahasa terkecil yang
memiliki arti dan dapat berdiri sendiri. Penyampaian sebuah informasi atau pesan harus
terdiri dari kalimat yang disusun oleh beberapa kata. Sebuah pesan terdiri dari satu atau
lebih kalimat, dimana didalam kalimat tersebut terdapat sekumpulan huruf yang saling
berhubungan satu sama lain perkata.

Universitas Sumatera Utara

16

Distribusi huruf atau distribusi frekuensi kemunculan huruf merupakan jumlah persentase
rata-rata kemunculan sebuah huruf di dalam sebuah bahasa tertentu, dimana untuk
mendapatkan nilai dari distribusi huruf suatu bahasa harus dengan melakukan sebuah
penelitian yang menghasilkan data yang sesuai degan hasil penelitian dan dapat
dipublikasikan sesuai dengan aturan yang berlaku. Berikut penulis tampilkan daftar
frekuensi kemunculan huruf didalam teks berbahasa indonesia yang telah diteliti
sebelumnya oleh Galih Andana dengan persentase rata-rata penggunaan 6,6 buah huruf
disetiap kata:

Gambar 2.6 Grafik Distribusi Huruf Bahasa Indonesia
Sumber : (Andana, 2010)

Universitas Sumatera Utara