Penyisipan Pesan Kedalam File Wav Menggunakan Algoritma Echo Dan Data Hiding (EDH)

(1)

BAB 2

LANDASAN TEORI

2.1File Audio Digital

Digital audio / digitized sound (Audio digital) merupakan jenis file audio yang berasal dari hasil perekaman atau hasil sintesis dari komputer. Audio digital memiliki tiga karakteristik yang terutama yaitu:

a. Sample(s), merupakan representasi aktual suara yang disimpan dalam ribuan angka individual.

b. Resolution / bit depth, merupakan ukuran sample dalam bit (misalkan. 8-bit, 16-bit).

c. Sampling rate, merupakan kecepatan permrosesan bit oleh komputer (misalkan. 44.1 KHz untuk Compact Disc).

Proses encoding pada media audio melibatkan konversi sinyal analog ke dalam rangkaian bit. Sinyal analog (suara dan musik) direpresentasikan dalam gelombang sinus dalam frekwensi yang beragam. Sistem pendengaran manusia hanya dapat menangkap frekwensi dalam rentang 20 – 20.000 Hz. Karena gelombang suara bersifat analog (sinyalnya bersifat kontinyu), maka gelombang tersebut perlu dikonversikan terlebih dahulu ke dalam beberapa set sample agar dapat direpresentasikan dengan rangkaian biner (1 dan 0).

Konversi dari analog ke digital dicapai dengan mengambil sample dari suatu sinyal analog dan merubah sample tersebut ke dalam tingkatan voltase. Level voltase tersebut akan dikonversikan ke dalam numerik menggunakan skema yang disebut Pulse Code Modulation dan alat pengkonversinya disebut Coder-Decoder.


(2)

Gambar 2.14 Pulse Code Modulation

Pulse Code Modulation (PCM) hanya dapat menyediakan perkiraan dari sinyal analog yang asli. Misalnya sinyal analog diukur pada level 4.86, akan dikonversikan ke 5 pada PCM. Hal ini disebut quantization error. Aplikasi-aplikasi audio mendefinisikan level-level yang berbeda pada PCM.

Sinyal analog perlu di-sample dengan rate dua kali lebih dari frekuensi tertinggi pada sinyal, agar hasil yang asli dapat direproduksi dari sample. Sebagai contoh pada jaringan telepon, suara manusia dengan rentang frekuensi 0-4000Hz (walaupun pada kenyataannya hanya 400 – 3400 Hz yang membawa suara), di-sample dengan rate 8000 Hz. Aplikasi audio musik menangani spektrum penuh dari pendengaran manusia, aplikasi ini umumnya menggunakan sampling rate 44.1 kHz, dimana pada 1 detik musik digital terdapat 44100 sample (Kessler, 2004). Sedangkan besar dari ukuran file musik yang tidak dikompresi dapat dikalkulasikan dengan rumus :

Jumlah bit per detik = S * R* C S = Sampling rate

R = Resolusi Pulse Code Modulation (16 bit) C = Jumlah channel (mono = 1, stereo = 2)


(3)

Sebagai contoh, pada 1 menit file audio, dengan sampling rate 44.1 kHz dan menggunakan 2 channel, maka ukuran file yang tidak terkompres mencapai 10.09 MB. File audio yang populer sekarang ini seperti MP3, Ogg Vorbis, dan sebagainya, menggunakan skema kompresi untuk mengurangi ukuran dari file. Untuk lebih memahami media audio, terutama MP3 yang akan digunakan sebagai medium / Carrier, diperlukan pemahaman terlebih dahulu terhadap skema kompresi file audio yang ada.

2.1.1 Struktur Data pada File Audio

Format file wave merupakan salah satu format yang digunakan untuk menyimpan suara pada rentang frekuensi 20 Hz sampai 20 kHz. Gelombang suara mempunyai data yang kontinyu sehingga gelombang tersebut bila digambarkan akan berupa kurva yang tidak putus-putus, akan tetapi komputer hanya dapat menyimpan data dalam bentuk digital. Struktur data pada file audio berbeda-beda tergantung format audio-nya. Struktur file Wav dapat dilihat seperti pada Gambar 2.15.

Gambar 2.15 Struktur File WAV

File dengan format wave menggunakan metode pulse code modulation (PCM) untuk menyimpan suara yang bersifat analog menjadi data digital pada komputer. PCM adalah salah satu cara merepresentasikan data analog dalam bentuk digital


(4)

dimana data sinyal analog tersebut diambil sampelnya pada setiap selang periode tertentu kemudian dijadikan nilai pada sistem digital. Selang waktu yang digunakan untuk mengambil sampel pada sinyal analog tersebut menentukan kualitas suara yang dihasilkan. Semakin banyak sampel sinyal analog yang diambil dalam selang waktu tertentu maka semakin baik pula kualitas suara yang dihasilkan (hasil suara akan mendekati dengan suara aslinya). Data mentah hasil PCM ini kemudian disimpan dalam format file .WAV. Sebagai contoh file wav memiliki sample audio seperti pada Gambar

Gambar 2.15 Contoh Struktur file WAVE dalam bentuk hexa

Pada struktur file Wav di atas terdiri dari:

a. Chunk Descriptor yang terdiri dari data: 52 49 46 46 28 08 00 00 57 41 56 45. b. Fmt subChunk yang terdiri data subChunk1size, audioFormat, numChannel,

sampleRate, byteRate dan BlockAlign yaitu:

44 15 2f 3d 1e 2a 00 4d 01 7c 01 12 45 68 00 01 # 85 01 00 04 00 10 00 c. Data subChunk yang terdiri dari data subChunk2size serta sample-sa mple

yaitu: 54 2e 7a 4d 10 9d#1 12 12 44 00#2 24 17 1e f3#3 3c 13 3c 14 #4 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 24 f2 11 ce 1a 0d

2.1.2 Pembacaan File Audio

Data audio yang di-encoding terdiri dari 576 baris frekuensi tiap channel dan bagian kecil yang disimpan sebagai 16 bit signed integer. Sebagai contoh diberi sebuah spektrum frekuensi pada file audio berformat wav yang dapat dilihat pada Gambar 2.16.

52 49 46 46 28 08 00 00 57 41 56 45 44 15 2f 3d 1e 2a 00 4d 01 7c 01 12 45 68 00 01 # 85 01 00 04 00 10 00 54 2e 7a 4d 10 9d#1 12 12 44 00#2 24 17 1e f3#3 3c 13 3c 14 #4 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 24 f2 11 ce 1a 0d.


(5)

Gambar 2.16 Frekuensi File Audio (Redmond. 1993)

Pada file suara yang terkuantisasi dilakukan encoding yang menghasilkan nilai integer yang merupakan nilai frekuensi dari sampel audio. Sampel audio yang di-encoding dapat dilihat pada Gambar 2.17.

Gambar 2.17 Encoding Sampel Audio (Redmond. 1993)

2.2Steganography pada Media Digital

Steganography adalah merupakan salah satu cara untuk menyembunyikan suatu pesan / data rahasia di dalam data atau pesan lain yang tampak tidak mengandung apa-apa, kecuali bagi orang yang mengerti kuncinya. Dalam bidang keamanan komputer, steganografi digunakan untuk menyembunyikan data rahasia saat enkripsi tidak dapat

Waktu(detik) Amplitudo


(6)

dilakukan atau bersamaan dengan enkripsi. Jadi, walaupun enkripsi berhasil dipecahkan (decipher) pesan / data rahasia tetap tidak terlihat.

Saat ini steganography dalam dunia digital berkembang ke dalam 2 arah yang berbeda, satu arah bertujuan untuk melindungi pesan rahasia dari deteksi (protection against detection), yang merupakan tujuan utama dari steganography. Arah yang lain, walaupun mengandung tujuan utama dari steganography (menghindari deteksi), namun bertujuan untuk melindungi pesan rahasia pada media agar tidak dapat dihilangkan (protection against removal) (Vico, Jes´us d´iaz. 2010).

Hirarki Steganography pada Media Digital dapat dilihat pada Gambar 2.1.

Gambar 2.1 Hirarki Steganography pada Media Digital (Vico, Jes´us d´iaz. 2010)

Steganography menyediakan fungsi fungsi penting dan berguna dalam dunia digital, yang paling populer adalah digital watermarking. Aplikasi ini dapat menyembunyikan pesan rahasia di dalam sebuah file sehingga bukti kepemilikan dari karya intelektual tersebut dapat dibuktikan atau untuk memastikan integritas dari karya tersebut. Walaupun secara konsep mirip dengan steganography, namun tujuan dari digital watermarking sedikit berbeda. Secara umum hanya sedikit dari informasi yang dimasukkan dalam Carrier, penyembunyian informasi watermarking tidak terlalu perlu, dan informasi watermarking dapat ditarik / dihilangkan untuk menjaga integritas Carrier.


(7)

Steganography digital yang berfokus untuk menghindari deteksi terbagi menjadi 2 tipe menurut cara menyisipkan informasi dan media yang digunakan. Metode pertama adalah dengan menyembunyikan informasi pada data volatil, metode ini banyak digunakan pada sistem jaringan dengan memanipulasi proses enkapsulasi pada sistem layer pada protokol TCP/IP maupun yang lain, contoh: misalkan dengan memanfaatkan format segment pada TCP layer sperti pada Gambar 2.2.

Gambar 2.2 Contoh Steganografi pada Segmen di Jaringan Komputer

Pada header TCP terdapat 6 bit (hijau) yang tidak dimanfaatkan oleh TCP, bit-bit ini dapat digunakan untuk menyimpan informasi. Metode lain adalah menyimpan informasi pada user data, dalam menggunakan metode ini file Carrier/ medium harus diperhatikan (dalam hal ini data user). Metode ini terbagi dua berdasarkan file Carrier-nya yaitu fragile dan robust. Fragile berarti informasi yang disembunyikan dalam Carrier mudah rusak/hilang bila Carrier dirubah sekecil apapun, seperti dikompres dengan metode lossy, sedangkan robust berarti informasi yang disimpan dalam Carrier tidak akan hilang dengan mudah bila Carrier dirubah (Vico, Jes´us d´iaz. 2010).

Secara umum teknik steganography pada media digital menggunakan metode penumpangan data pada byte stream data, byte stream data dapat berbentuk segment, frames, datagrams, dan lainnya. Karena steganography mempunyai tujuan utama menghindari deteksi sehingga metode penumpangan data pada file dilakukan secara tak terlihat. Skema prosedur steganography sederhana dapat dilihat seperti pada Gambar 2.3.


(8)

Gambar 2.3 Skema Prosedur Steganography (Redmond. 1993)

Pada steganography yang menggunakan media digital terdapat beberapa teknik yang dapat digunakan, berikut contoh teknik-teknik tersebut dalam urutan yang menggambarkan kualitas teknik steganography tersebut dalam ketahanannya terhadap deteksi dari terburuk hingga terbaik (Redmond. 1993).

1. Menempatkan data di akhir file carrier (contoh: Camouflage, JpegX, SecurEngine untuk JPG, Safe&Quick Hide Files 2002, Steganography 1.50). 2. Menempatkan data pada field comment, atau bagian dari file yang tidak

tepakai (contoh: Invisible Secrets 2002 untuk JPG dan PNG, Steganozorus untuk JPG).

3. Menempatkan data pada byte stream file carrier dengan secara linier, sekuensial dan tetap (contoh: InPlainView, InThePicture, Invisible Secrets 2002 untuk BMP, ImageHide, JSteg).

4. Menempatkan data pada byte stream file carrier, secara acak menggunakan bilangan pseudo-random yang dihasilkan dari PassPhrase (contoh:CryptArkan, BMPSecrets, Steganos untuk BMP, TheThirdEye, JPHide).

5. Menempatkan data pada byte stream file carrier, secara acak menggunakan bilangan pseudo-random yang dihasilkan dari PassPhrase, dan merubah bit bit lain pada byte stream file carrier untuk mengkompensasi perubahan yang ditimbulkan oleh data yang disisipkan dan untuk menghilangkan perubahan secara statistik pada file carrier (contoh: Outguess, F5).


(9)

2.3Embedding Data

Data embedded yang tersembunyi dalam suatu media audio digital membutuhkan dua file. Pertama adalah media audio digital asli yang belum dimodifikasi yang akan menangani informasi tersembunyi, yang disebut cover audio. File kedua adalah informasi pesan yang disembunyikan. Suatu pesan dapat berupa plaintext, chipertext, gambar lain, atau apapun yang dapat ditempelkan ke dalam bit-stream. Ketika dikombinasikan, cover audio dan pesan yang ditempelkan membuat stego-audio. Suatu stego-key (suatu password khusus) juga dapat digunakan secara tersembunyi, pada saat decode selanjutnya dari pesan (Munir, R. 2004).

2.3.1 Steganografi pada Media Audio

Steganografi dapat diimplementasi pada media audio digital. Namun saat ini, teknik penyembunyian pesan di dalam media audio dirasa masih kurang efektif dibandingkan dengan penyembunyian pesan dalam media teks maupun citra. Hal ini disebabkan pendengaran manusia jauh lebih sensitif dibandingkan penglihatannya. Jika mata manusia bisa dikelabui oleh perubahan warna yang kecil, telinga manusia belum tentu dapat tertipu oleh perubahan suara walaupun sedikit. Karena alasan inilah penyisipan pesan melalui media audio cukup jarang dipilih. Padahal, audio merupakan media file yang memiliki banyak kelebihan, misalnya dapat menyimpan banyak byte tanpa membuat ukuran bertambah terlalu besar, serta dapat di-generate dengan cepat dan mudah sehingga tidak perlu menyimpan file asli di disk penyimpanan.

Ketika berurusan dengan transmisi sinyal audio, ada dua hal utama yang harus diperhatikan, yaitu bentuk representasi audio digital dan media transmisi yang digunakan. Secara umum, file audio digital memiliki dua karakteristik utama, yaitu sample quantization method (metode quantisasi) dan temporal sampling rate. Metode quantisasi menyatakan representasi sampel audio berdasarkan kualitas digitalnya, misalnya format WAV (Windows Audio Visual) dan format AIFF. Temporal sampling rate yaitu kecepatan yang dapat dihitung untuk melakukan sampling (pengambilan sampel) audio secara periodik. Temporal sampling rate untuk audio biasanya bernilai 8kHz, 9.6kHz, 10kHz, 12kHz, 16kHz, 22.05kHz dan 44.1kHz.


(10)

Media transmisi sinyal audio adalah lingkungan yang dilalui sinyal audio untuk berpindah dari satu tempat ke tempat lain, misalnya dari encoder to decoder. Ada empat media transmisi yang umum digunakan, yaitu sebagai berikut :

1. Digital end-to-end environment: yaitu perpindahan sinyal audio secara langsung dari mesin ke mesin. Sinyal hasil perpindahan akan sama antara sumber dengan tujuan.

2. Increased/decreased resampling environment: yaitu perpindahan sinyal digital disertai perubahan sampling rate, namun tetap dalam representasi digital. 3. Analog transmission and resampling: yaitu perpindahn sinyal digital dengan

sebelumnya diubah ke dalam representasi analog dan dilakukan resampling. 4. Over the air environment: yaitu perpindahan sinyal audio melalui udara,

dengan cara memainkan sinyal audio tadi dan ditangkap oleh mikrofon.

2.3.2 Metode Penyisipan File Audio

Ada tiga metode yang sering digunakan untuk melakukan penyisipan data dalam media audio, yaitu low bit encoding, spread spectrum, serta echo data hiding. (Vico, Jes´us d´iaz. 2010).

1. Low-bit Encoding

Pada dasarnya, metode steganografi low bit encoding pada audio sama saja dengan metode steganografi least significant bit (LSB) pada image (citra). Pada metode ini, sebagian bit pada file audio diubah menjadi nilai lain dalam representasi biner. Perubahan dapat dilakukan dengan berbagai cara dan algoritma, misalnya mengubah nilai biner 0 menjadi 1 atau sebaliknya, melakukan operasi XOR antara nilai biner pada file dengan nilai biner pada kunci. Karena dalam representasi biner, maka perubahan yang mungkin terjadi adalah nilai biner 1 menjadi 0, atau nilai biner 0 menjadi 1. Tidak semua bit dikenai operasi, melainkan hanya bit-bit yang dirasa kurang penting keberadaannya dalam file, yaitu bit-bit terakhir dalam suatu range tertentu. Ketika ketika bit tersebut diubah, nilai perubahannya hanya berkisar 1 bit dan tidak memberikan perubahan yang berarti terhadap keseluruhan data.

Suatu file audio dapat memiliki satu channel (mono) atau dua channel (stereo). Secara umum, kapasitas satu channel adalah sebesar 1 kbps per kilohertz. Karena


(11)

ukuran channel dapat mencapai 44000 byte, maka kapasitas maksimal yang dapat ditampung oleh satu channel adalah 44 kbps per kilohertz. Implementasi low-bit encoding dilakukan dengan cara yang relatif sama dengan yang dilakukan pada pengerjaan kriptografi. Pertama-tama, file pesan, kunci, dan file audio yang akan disisipkan pesan diubah ke dalam representasi bit array. Setelah itu, setiap bit di file pesan dioperasikan dengan bit di file audio dengan memanfaatkan kunci.

Sebenarnya penggunaan kunci dimaksudkan untuk memudahkan penyisipan serta ekstraksi pesan serta untuk memudahkan komunikasi antar pemberi dan penerima pesan. Bagian header dari file audio tidak ikut dimodifikasi, sehingga file audio masih tetap dapat dikenali dan dapat dimainkan kembali. Pada studi kali ini, saya membuat program console sederhana yang melakukan enkripsi file pesan ke dalam suatu file audio. Hasil penyisipan pesan menyebabkan perubahan pada atribut file audio. File audio yang telah disisipi pesan ternyata memiliki ukuran yang lebih besar daripada ukuran file audio sebelum disisipi pesan. Hal ini sebenarnya tidak sesuai harapan, karena secara teori, seharusnya ukuran file sebelum dan sesudah disisipi pesan tetap sama karena isi pesan dapat dikatakan hanya menggantikan posisi bit-bit yang ada pada file audio.

Namun demikian, berdasarkan fakta yang terjadi di lapangan, berubahnya ukuran file audio mungkin disebabkan karena banyak bit bernilai 0 yang tergantikan oleh bit bernilai 1, sehingga perubahan yang terjadi cukup memengaruhi ukuran file, yaitu menambah ukuran file sehingga menjadi lebih besar dari sebelumnya. File pesan yang disisipi ke dalam file audio merupakan file teks yang berukuran 128 byte.

2.3.3 Spread Spectrum

Teknik spread spectrum ini bekerja dengan menyembunyikan sekumpulan data di dalam sinyal lain yang area sebarnya lebih besar. File yang disembunyikan terlebih dulu dibagi ke dalam blok-blok dengan ukuran tertentu. Setiap blok tersebut nantinya akan ditempatkan secara acak di sinyal lain yang areanya labih luasa tadi. Langkah kerjanya adalah dengan membuat noise dari suatu sinyal menggunakan noise generator. Nantinya, pesan akan disembunyikan pada noise yang telah terbentuk tadi dan disebarkan ke berbagai spectrum dengan frekuensi sinyal yang berbeda-beda.


(12)

Implementasi dari program penyisipan pesan yang memanfaatkan spread spectrum ini tidak diimplementasikan karena keterbatasan waktu. Namun demikian, studi terhadap hasil penelitian yang pernah dilakukan sudah dikerjakan. Berdasarkan hasil penelitian dan studi literatur, penyisipan data dengan cara spread spectrum mengubah data menjadi noise yang kemudian disisipkan ke frekuensi-frekuensi sinyal lain yang berbeda-beda. Jadi, data yang telah berbentuk noise tadi disebar ke frekuensi frekuensi yang berbeda. Karena berbentuk noise yang terpisah-pisah, artinya untuk setiap frekuensi sinyal hanya memiliki sebagian pesan rahasia, maka keberadaan pesan rahasia di dalam frekuensi suatu sinyal sulit disadari maupun dideteksi.

2.3.4 Echo Data Hiding(EDH)

Pada metode echo data hiding, penyembunyian data dilakukan dengan menyembunyikan data tersebut ke dalam suatu file audio dalam representasi echo (gema). Echo dibuat dalam parameter yang berbeda-beda. Parameter yang divariasikan dalam metode ini adalah amplitudo, decay rate, dan offset. Pada sinyal audio, gema muncul beberapa saat setelah bunyi asli keluar. Jika delay waktu antara bunyi asli dengan gema diperkecil, maka suara gema akan lebih sulit dipersepsikan oleh telinga manusia. Selain itu, gema juga dapat dibuat menjadi inaudible (tak terdengar) dengan memanfaatkan variasi dari parameter-parameter echo tadi. Prinsip-prinsip inilah yang digunakan dalam proses penyisipan pesan dengan cara echo data hiding (Sugiono, etal. 2008).


(13)

Pengaturan parameter gema sehingga gema menjadi tak terdengar dapat dilakukan dengan beberapa cara sebagai berikut:

1. Mengatur offset atau delay dengan nilai yang relatif pendek sehingga gema yang terdengar tak dapat dipersepsi oleh telinga.

2. Mengatur delay paling tinggi sebesar 1 ms.

3. Mengatur nilai inisialisasi amplitudo dan delay rate dengan nilai di bawah threshold dari pendengaran manusia, sehingga manusia tidak dapat mendengar gema yang dihasilkan.

Dalam proses encode penyisipan pesan dalam audio dengan cara echo data hiding, sinyal audio yang akan disisipi pesan harus dibagi-bagi menjadi beberapa blok/window. Setelah itu, dua waktu delay digunakan untuk melakukan proses encode data pesan. Misalnya, nilai delay = offset digunakan untuk meng-encode biner 0, dan nilai delay = offset + delta digunakan untuk meng-encode biner 1. Selain itu, beberapa fungsi serta teknik filter digunakan untuk melakukan proses encode. Persamaan FIR Filter merupakan filter yang umum digunakan untuk melakukan encode pesan ke dalam file audio. Dengan persamaan ini, diperoleh nilai delay dari sinyal audio.

Ada dua pulsa yang digunakan di persamaan ini. Satu pulsa untuk menyalin sinyal asli, sedangkan pulsa lainnya digunakan untuk menciptakan echo yang tidak mudah dideteksi. Proses Mixer Sinyal untuk encode data dalam bentuk biner dapat dilihat seperti pada Gambar 2.5


(14)

Data disembunyikan dengan memvariasikan tiga parameter dalam echo yaitu besar amplitudo awal, tingkat penurunan atenuasi (peredaman), dan offset. Ketiga parameter tersebut diatur sedemikian rupa di bawah pendengaran manusia sehingga tidak mudah untuk dideteksi. Sebagai tambahan, offset divariasikan untuk merepresentasikan bina ry pesan yang disembunyikan. Nilai offset pertama merepresentasikan nilai binary 1 dan nilai offset kedua merepresentasikan binary 0. Echo Data Hiding menempatkan informasi sisipan pada sinyal asli (cover audio) dengan menggunakan sebuah “echo.” Pada hal telinga manusia tidak dapat mendengar sinyal asli dan echo secara bersamaan, melainkan hanya berupa sinyal distorsi tunggal. Hal ini sulit ditentukan secara tepat, ini tergantung pada kualitas rekaman sinyal asli, tipe suara yang di-echo dan pendengar. Fungsi sistem yang digunakan pada domain waktu adalah discrete time exponential yang cara membedakannya hanya pada delay antar impuls.

Gambar 2.6 Parameter dalam Echo (Sugiono, etal. 2008)

Untuk membentuk echo hanya menggunakan dua buah impuls yang disebut kernel. Kernel “satu” dibuat dengan delay δ1 detik sedangkan kernel “nol” dibuat dengan delay δ0 detik.


(15)

Jika hanya 1 echo yang dihasilkan dari sinyal asli maka hanya 1 bit informasi yang dapat di encoding. Karena itu, sinyal awal dibagi-bagi ke dalam beberapa blok sebelum proses encoding dimulai. Ketika proses encoding telah selesai, blok-blok tersebut digabungkan kembali membentuk sinyal baru.

Proses pembentukan echo dengan melakukan konvolusi antara signal audio asli dengan kernel dapat dilihat pada Gambar 2.8.

Gambar 2.8 Kernel dan Proses Pembentukan Echo (Sugiono, etal. 2008)

Awalnya, sinyal dibagi ke dalam blok-blok dan setiap blok diisi dengan 1 atau 0 berdasarkan pesan yang disimpan. Sebagai contoh, pesan yang akan disisipkan ke dalam file audio ialah “HEY” dengan nilai biner 01001000 01000101 01011001 dan selanjutnya dibentuk menjadi blok sinyal seperti pada Gambar 2.9.

0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 1 1 0 0 1 Gambar 2.9 Nilai Biner Sinyal


(16)

Blok-blok tersebut dikombinasikan untuk menghasilkan sinyal baru menjadi seperti pada Gambar 2.11.

Gambar 2.11 Dua Buah Sinyal Gabungan (Sugiono, etal. 2008)

Sinyal echo “1” kemudian dikali dengan sinyal mixer “1” dan sinyal echo “0” dikali dengan sinyal mixer “0”. Kemudian kedua hasil tersebut dijumlahkan untuk mendapatkan sinyal akhir. Dengan adanya offset dari echo dan sinyal asli maka echo akan tercampur dengan sinyal aslinya. Kelebihan dari metode ini dibandingkan dengan metode lain ialah sistem pendengaran manusia tidak dapat memisahkan antara echo dan sinyal asli.


(17)

Pada sinyal audio, gema muncul beberapa saat setelah bunyi asli keluar. Jika delay waktu antara bunyi asli dengan gema diperkecil, maka suara gema akan lebih sulit dipersepsikan oleh telinga manusia. Selain itu, gema juga dapat dibuat menjadi inaudible (tak terdengar) dengan memanfaatkan variasi dari parameter-parameter echo tadi. Prinsip-prinsip inilah yang digunakan dalam proses penyisipan pesan dengan cara echo data hiding. Pengaturan parameter gema sehingga gema menjadi tak terdengar dapat dilakukan dengan beberapa cara sebagai berikut:

1. Mengatur offset atau delay dengan nilai yang relatif pendek sehingga gema yang terdengar tak dapat dipersepsi oleh telinga.

2. Mengatur delay paling tinggi sebesar 1 ms.

3. Mengatur nilai inisialisasi amplitudo dan delay rate dengan nilai di bawah threshold dari pendengaran manusia, sehingga manusia tidak dapat mendengar gema yang dihasilkan.

Gambar 2.13 Ekstraksi Pesan pada Echo Data Hiding (Sugiono, etal. 2008)

Dalam proses encode penyisipan pesan dalam audio dengan cara echo data hiding, sinyal audio yang akan disisipi pesan harus dibagi-bagi menjadi beberapa


(18)

blok/window. Setelah itu, dua waktu delay digunakan untuk melakukan proses encode pesan. Misalnya, nilai delay = offset digunakan untuk meng-encode biner 0, dan nilai delay = offset + delta digunakan untuk meng-encode biner 1. Selain itu, beberapa fungsi serta teknik filter digunakan untuk melakukan proses encode. Persamaan Finite Impulse Response Filter (FIR Filter) merupakan filter yang umum digunakan untuk melakukan encode pesan ke dalam file audio. Dengan persamaan ini, diperoleh nilai delay dari sinyal audio. Ada dua pulsa yang digunakan di persamaan ini. Satu pulsa untuk menyalin sinyal asli, sedangkan pulsa lainnya digunakan untuk menciptakan echo yang tidak mudah dideteksi.

Data multimedia, seperti audio dan video adalah media pembawa yang sempurna. Setelah digitalisasi, multimedia berisi kuantisasi yang menyediakan ruang untuk melekatkan data. Penggunaan fungsi ekstrak, penerima harus mampu mereproduksi pesan yang menempel pada steganogram itu. Suatu steganogram harus mempunyai karakteristik statistik yang sama dengan media pembawa, sedemikian hingga penggunaan algoritma steganografi tidak dapat dideteksi. Konsekuensinya, pesan hanya dapat dibaca dari steganogram dan media pembawanya. Suatu pesan yang dibaca dari steganogram tidak harus secara statistik berbeda dengan pesan utama yang dibaca dari media pembawa, dengan cara lain, sistem steganografi akan bersifat tidak kuat.

2.4MSE

Pengukuran fidelity steganografi dapat dihitung dengan menghitung nilai MSE (Mean Squared Error) dan PSNR (Peak Signal to Noise Ratio). PSNR adalah perbandingan antara nilai maksimum dari sinyal yang diukur dengan besarnya noise yang berpengaruh pada sinyal tersebut. PSNR biasanya diukur dalam satuan desibel. PSNR digunakan untuk mengetahui kualitas (validasi) citra hasil kompresi. Untuk menentukan PSNR, terlebih dahulu harus ditentukan nilai rata-rata kuadrat dari error (MSE - Mean Square Error) (Krisnawati. 2008).

MSE dan PSNR dapat dihitung dengan persamaan (2.1) dan (2.2). Pada persamaan (2.1), I (x,y) adalah nilai grey-level citra asli di posisi (x,y), I’ adalah nilai derajat keabuan citra yang telah diberi watermark atau penyisip di posisi (x,y), X dan Y


(19)

adalah ukuran panjang dan lebar. Pada persamaan (2.2), m adalah nilai maksimum yang mungkin dimiliki oleh sebuah pixel. Sebagai contoh, untuk data citra 8 bit, nilai maksimumnya adalah 255 (Krisnawati. 2008).

MSE =

∑ ∑ ... (2,1) PSNR = 10 log

... (2,2) Nilai MSE menunjukkan perbandingan piksel yang rusak dengan piksel aslinya. Semakin besar nilai MSE, maka semakin besar kerusakan citra hasil pengolahan dan sebaliknya, semakin kecil nilai MSE maka nilai piksel hasil pengolahan makin


(1)

Data disembunyikan dengan memvariasikan tiga parameter dalam echo yaitu besar amplitudo awal, tingkat penurunan atenuasi (peredaman), dan offset. Ketiga parameter tersebut diatur sedemikian rupa di bawah pendengaran manusia sehingga tidak mudah untuk dideteksi. Sebagai tambahan, offset divariasikan untuk merepresentasikan bina ry pesan yang disembunyikan. Nilai offset pertama merepresentasikan nilai binary 1 dan nilai offset kedua merepresentasikan binary 0. Echo Data Hiding menempatkan informasi sisipan pada sinyal asli (cover audio) dengan menggunakan sebuah “echo.” Pada hal telinga manusia tidak dapat mendengar sinyal asli dan echo secara bersamaan, melainkan hanya berupa sinyal distorsi tunggal. Hal ini sulit ditentukan secara tepat, ini tergantung pada kualitas rekaman sinyal asli, tipe suara yang di-echo dan pendengar. Fungsi sistem yang digunakan pada domain waktu adalah discrete time exponential yang cara membedakannya hanya pada delay antar impuls.

Gambar 2.6 Parameter dalam Echo (Sugiono, etal. 2008)

Untuk membentuk echo hanya menggunakan dua buah impuls yang disebut kernel. Kernel “satu” dibuat dengan delay δ1 detik sedangkan kernel “nol” dibuat dengan delayδ0 detik.


(2)

Jika hanya 1 echo yang dihasilkan dari sinyal asli maka hanya 1 bit informasi yang dapat di encoding. Karena itu, sinyal awal dibagi-bagi ke dalam beberapa blok sebelum proses encoding dimulai. Ketika proses encoding telah selesai, blok-blok tersebut digabungkan kembali membentuk sinyal baru.

Proses pembentukan echo dengan melakukan konvolusi antara signal audio asli dengan kernel dapat dilihat pada Gambar 2.8.

Gambar 2.8 Kernel dan Proses Pembentukan Echo (Sugiono, etal. 2008)

Awalnya, sinyal dibagi ke dalam blok-blok dan setiap blok diisi dengan 1 atau 0 berdasarkan pesan yang disimpan. Sebagai contoh, pesan yang akan disisipkan ke dalam file audio ialah “HEY” dengan nilai biner 01001000 01000101 01011001 dan selanjutnya dibentuk menjadi blok sinyal seperti pada Gambar 2.9.

0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 1 1 0 0 1 Gambar 2.9 Nilai Biner Sinyal


(3)

Blok-blok tersebut dikombinasikan untuk menghasilkan sinyal baru menjadi seperti pada Gambar 2.11.

Gambar 2.11 Dua Buah Sinyal Gabungan (Sugiono, etal. 2008)

Sinyal echo “1” kemudian dikali dengan sinyal mixer “1” dan sinyal echo “0” dikali dengan sinyal mixer “0”. Kemudian kedua hasil tersebut dijumlahkan untuk mendapatkan sinyal akhir. Dengan adanya offset dari echo dan sinyal asli maka echo akan tercampur dengan sinyal aslinya. Kelebihan dari metode ini dibandingkan dengan metode lain ialah sistem pendengaran manusia tidak dapat memisahkan antara echo dan sinyal asli.


(4)

Pada sinyal audio, gema muncul beberapa saat setelah bunyi asli keluar. Jika delay waktu antara bunyi asli dengan gema diperkecil, maka suara gema akan lebih sulit dipersepsikan oleh telinga manusia. Selain itu, gema juga dapat dibuat menjadi inaudible (tak terdengar) dengan memanfaatkan variasi dari parameter-parameter echo tadi. Prinsip-prinsip inilah yang digunakan dalam proses penyisipan pesan dengan cara echo data hiding. Pengaturan parameter gema sehingga gema menjadi tak terdengar dapat dilakukan dengan beberapa cara sebagai berikut:

1. Mengatur offset atau delay dengan nilai yang relatif pendek sehingga gema yang terdengar tak dapat dipersepsi oleh telinga.

2. Mengatur delay paling tinggi sebesar 1 ms.

3. Mengatur nilai inisialisasi amplitudo dan delay rate dengan nilai di bawah threshold dari pendengaran manusia, sehingga manusia tidak dapat mendengar gema yang dihasilkan.

Gambar 2.13 Ekstraksi Pesan pada Echo Data Hiding (Sugiono, etal. 2008)

Dalam proses encode penyisipan pesan dalam audio dengan cara echo data hiding, sinyal audio yang akan disisipi pesan harus dibagi-bagi menjadi beberapa


(5)

blok/window. Setelah itu, dua waktu delay digunakan untuk melakukan proses encode pesan. Misalnya, nilai delay = offset digunakan untuk meng-encode biner 0, dan nilai delay = offset + delta digunakan untuk meng-encode biner 1. Selain itu, beberapa fungsi serta teknik filter digunakan untuk melakukan proses encode. Persamaan Finite Impulse Response Filter (FIR Filter) merupakan filter yang umum digunakan untuk melakukan encode pesan ke dalam file audio. Dengan persamaan ini, diperoleh nilai delay dari sinyal audio. Ada dua pulsa yang digunakan di persamaan ini. Satu pulsa untuk menyalin sinyal asli, sedangkan pulsa lainnya digunakan untuk menciptakan echo yang tidak mudah dideteksi.

Data multimedia, seperti audio dan video adalah media pembawa yang sempurna. Setelah digitalisasi, multimedia berisi kuantisasi yang menyediakan ruang untuk melekatkan data. Penggunaan fungsi ekstrak, penerima harus mampu mereproduksi pesan yang menempel pada steganogram itu. Suatu steganogram harus mempunyai karakteristik statistik yang sama dengan media pembawa, sedemikian hingga penggunaan algoritma steganografi tidak dapat dideteksi. Konsekuensinya, pesan hanya dapat dibaca dari steganogram dan media pembawanya. Suatu pesan yang dibaca dari steganogram tidak harus secara statistik berbeda dengan pesan utama yang dibaca dari media pembawa, dengan cara lain, sistem steganografi akan bersifat tidak kuat.

2.4MSE

Pengukuran fidelity steganografi dapat dihitung dengan menghitung nilai MSE (Mean Squared Error) dan PSNR (Peak Signal to Noise Ratio). PSNR adalah perbandingan antara nilai maksimum dari sinyal yang diukur dengan besarnya noise yang berpengaruh pada sinyal tersebut. PSNR biasanya diukur dalam satuan desibel. PSNR digunakan untuk mengetahui kualitas (validasi) citra hasil kompresi. Untuk menentukan PSNR, terlebih dahulu harus ditentukan nilai rata-rata kuadrat dari error (MSE - Mean Square Error) (Krisnawati. 2008).

MSE dan PSNR dapat dihitung dengan persamaan (2.1) dan (2.2). Pada persamaan (2.1), I (x,y) adalah nilai grey-level citra asli di posisi (x,y), I’ adalah nilai derajat keabuan citra yang telah diberi watermark atau penyisip di posisi (x,y), X dan Y


(6)

adalah ukuran panjang dan lebar. Pada persamaan (2.2), m adalah nilai maksimum yang mungkin dimiliki oleh sebuah pixel. Sebagai contoh, untuk data citra 8 bit, nilai maksimumnya adalah 255 (Krisnawati. 2008).

MSE =

∑ ∑ ... (2,1) PSNR = 10 log

... (2,2) Nilai MSE menunjukkan perbandingan piksel yang rusak dengan piksel aslinya. Semakin besar nilai MSE, maka semakin besar kerusakan citra hasil pengolahan dan sebaliknya, semakin kecil nilai MSE maka nilai piksel hasil pengolahan makin