View of PERANCANGAN DAN ANALISIS AUDIO WATERMARKING BERBASIS TEKNIK MODULASI DIGITAL DENGAN PENGKODEAN KONVOLUSI

  

PERANCANGAN DAN ANALISIS AUDIO WATERMARKING

BERBASIS TEKNIK MODULASI DIGITAL

DENGAN PENGKODEAN KONVOLUSI

1) 2) 3)

Augiska Muliansyahputra , Briliant Hadi Akbar , Gelar Budiman

1),2),3 )

  Fakultas Teknik Elektro, Universitas Telkom Bandung

Jl. Telekomunikasi No. 1 Bandung

Email : amuliansyahputra@gmail.com

  

Abstrak . Perkembangan teknologi informasi menyebabkan penyebaran data digital berjalan sangat pesat. Di

balik kemudahan mendapatkan segala jenis informasi digital, terdapat suatu masalah terhadap kepemilikan hak

cipta dari informasi tersebut, contohnya dalam industri multimedia. Karya-karya multimedia, khususnya dalam

industri musik yang berkaitan dengan audio digital, dengan mudahnya dicopy-paste, direkam ulang, dan

diedarkan kembali dengan mengganti nama pemilik asli dengan nama pembajak. Salah satu cara untuk

menghadapi masalah pembajakan karya khususnya dalam industri musik adalah dengan teknik audio

watermarking. Audio watermarking merupakan suatu teknik penyisipan informasi dalam bentuk data digital ke

dalam suatu file audio dengan tujuan sebagai penanda keaslian dari file audio tersebut. Dalam penelitian ini

akan dirancang suatu skema audio watermarking berbasis teknik modulasi digital, dengan merepresentasikan

bit informasi ke dalam bentuk lain, dalam hal ini suatu code sequence. Code sequence yang digunakan harus

diketahui saat proses embedding dan ekstraksi. Dalam skema ini terdapat rangkaian convolutional code dan

interleaver yang digunakan sebagai error correction code. Pengujian sistem dilakukan melalui beberapa

parameter penilaian seperti SNR, ODG, BER, dan SSIM. Skema audio watermarking dalam penelitian ini

mendapatkan range nilai SNR 35 dB hingga 52 dB dan tingkat deteksi 100% tanpa serangan.

  Kata kunci : perlindungan hak cipta, audio watermarking, M-ary, code sequence, pengkodean konvolusi 1.

   Pendahuluan

  Dewasa ini, saat teknologi informasi berkembang sangat pesat, hampir semua data telah berbentuk digital. Mulai dari data sederhana seperti buku referensi kuliah, tugas-tugas kuliah, hingga data penting seperti perjanjian kontrak saham perusahaan pasti memiliki data dalam bentuk digital. Apalagi dengan kehadiran internet, digital sudah dijadikan suatu ranah untuk kebutuhan komersil, contohnya dalam industri multimedia. Masalah yang sering terjadi dalam industri ini baik dalam skala perorangan sampai skala perusahaan adalah kasus pembajakan hak cipta (copyright piracy). Dikarenakan penyebaran pada internet yang begitu cepat, karya-karya multimedia khususnya dalam industri musik yang berkaitan dengan digital audio dengan mudahnya dicopy-paste, direkam ulang, dan diedarkan kembali dengan mengganti nama pemilik asli dengan nama pembajak. Sebenarnya, kegiatan pembajakan di indutri musik sangat sulit untuk dihentikan. Ketika suatu karya diunggah ke internet, dengan mudahnya karya tersebut akan menyebar luas tanpa pengawasan. Oleh karena itu, dibutuhkan suatu cara untuk menghadapi masalah pembajakan karya khususnya dalam industri musik, salah satunya dengan menggunakan teknik audio watermarking.

  Audio watermarking merupakan suatu teknik penyisipan informasi ke dalam suatu sinyal host

  (host media) yang berbentuk file audio tanpa mengganggu keaslian dari audio tersebut. Informasi yang disisipkan dapat berupa bit, teks, citra, atau audio dalam bentuk lain. Informasi yang disisipkan harus unik, agar informasi dalam suatu audio tidak sama dengan informasi dalam audio lain. Dalam audio

  

watermarking , terdapat berbagai macam teknik penyisipan diantaranya modifikasi LSB, phase coding,

spread spectrum, echo hiding, dan lain-lain. Secara umum, ada 2 kriteria yang harus dipenuhi dalam

audio watermarking [1]. Pertama, informasi yang disisipkan harus tahan terhadap berbagai serangan

  (robustness), dengan parameter pengukuran berupa nilai Bit Error Rate (BER). Kedua, hasil proses

  

watermarking harus menjaga kualitas audio asli (perceptual quality) dengan parameter pengukuran

  berupa nilai dari Mean Opinion Score (MOS). Itu berarti, informasi yang disisipkan ke file audio harus tidak terdeteksi oleh indera pendengaran manusia (Human Auditory System/HAS).

  Pada penelitian ini dilakukan perancangan dan analisis audio watermarking berbasis teknik modulasi digital dengan pengkodean konvolusi. Teknik modulasi digital merupakan suatu teknik untuk mentransmisikan sinyal dengan merepresentasikan bit informasi ke dalam bentuk lain agar dapat bekerja pada suatu medium. Ini merupakan dasar yang digunakan dalam skema audio watermarking pada penelitian ini yaitu mengubah satu atau sekelompok bit menjadi suatu code sequence (spreading data) menggunakan Pseudorandom Noise (PN) code, sebelum disisipkan ke host audio. Code

  

sequence yang digunakan harus diketahui saat proses embedding dan ekstraksi. Dalam skema ini juga

terdapat rangkaian convolutional code dan interleaver yang digunakan sebagai error correction code.

  Contoh untuk penggunaan spreading data menjadi suatu pseudo sequence dalam melakukan [2] modulasi watermark dipaparkan pada penelitian dan penggunaan pengkodean konvolusi dipaparkan [3] [4] [5] [5] pada penelitian , dan . Pada penelitian , skema watermarking berhasil mendapatkan nilai

  

Signal to Noise Ratio (SNR) diatas 20 dB. Pada proses ekstraksi akan digunakan Euchlidean distance

  dan cross correlation pada demodulasi dan Viterbi decoder pada dekonvolusi untuk mencari apakah bit yang diperoleh memiliki korelasi yang tinggi terhadap bit informasi sebelum disisipkan. Dengan menggabungkan metode-metode tersebut, skema audio watermarking ini diharapkan dapat meningkatkan nilai robustness dan imperceptibility dari sistem dengan bukti Bit Error Rate (BER) mendekati 0, Structural Similarity (SSIM) Index mendekati 1, dan Signal to Noise Ratio (SNR) diats 20 dB.

2. Dasar Teori

2.1.1 Convolutional Code (CC)

  Convolutional code adalah suatu jenis pengkodean yang dilakukan dengan cara melakukan

  konvolusi terhadap urutan bit-bit informasi masukan secara kontinu dan menghasilkan sebuah urutan bit output (codeword) yang kontinu. Dengan menggunkan konvolusi, codeword yang dihasilkan tergantung dengan bit input saat itu dan bit-bit input sebelumnya. Oleh karena itu, proses ini [6] membutuhkan suatu memori (shift register) dengan panjang tertentu .

  Convolutional code diwakili dengan 3 parameter yaitu n, k, dan K. n merupakan jumlah bit output

  yang ingin dihasilkan tiap k input, dan K adalah constraint length dimana encoder mempunyai K-1 elemen memori. Dalam convolutional code dikenal juga Rc = k/n yang disebut sebagai coding rate (laju pengkodean) yang menyatakan jumlah bit data input per bit yang ingin dikodekan. Pada shift

  

register , proses konvolusi dilakukan dengan membuat dua buah adder modulo-2 yang melakukan

  operasi XOR. Output yang dihasilkan dari dua buah adder ini akan diswitch antar satu dan lainnya [6] untuk mendapatkan suatu urutan kode . Contoh rangkaian convolutional code ditunjukkan pada Gambar 1, yang memiliki K= 3 dan Rc = ½.

  [4]

  Gambar 1. Convolutional encoder dengan K=3 dan Rc=1/2 Pada Gambar 2 ditunjukkan suatu state diagram yang menggambarkan rangkaian convolutional

  

code di Gambar 1. Setiap node menunjukkan isi dari shift register tepat sebelum dimasukkannya bit

input . Bit input yang bernilai “0” dan “1” direpresentasikan dengan garis yang menghubungkan setiap

node , dengan garis tebal mewakili bit “0” dan garis putus-putus mewakili bit “1”. Sebagai contoh

[7] dengan asumsi initial state 00, bit input 11010 akan menghasilkan output sequence 1101010010 .

  [7]

  Gambar 2. State diagram untuk encoder pada Gambar 1

  Convolutional code juga bisa direpresentasikan dengan trellis diagram yang memperhatikan

  transisi tiap proses. Trellis diagram menggambarkan bit input dengan panah-panah dari satu node menuju node lainnya, dimana tiap panah mengandung suatu output sequence tersendiri. Pada Gambar 3 ditunjukkan suatu trellis diagram yang merepresentasikan state diagram dalam Gambar 2 .

  [7]

  Gambar 3. Trellis diagram untuk encoder pada Gambar 1

2.1.2 PN Code

  Pseudorandom Noise code (PN code) merupakan suatu kode dengan suatu urutan bit data yang

  terlihat random namun bersifat periodik. PN code mempunyai 2 level, yaitu polar (bit -1 & 1) dan [8] nonpolar (bit 0 & 1). Secara umum, PN code dapat diklasifikasikan menjadi 2 jenis ; yaitu linear dan

  

non-linear . Kode linear dibangkitkan dengan mengkombinasikan keluaran feedback shift register

  dalam fungsi yang tetap (biasanya bermudulo 2. Sedangkan kode non-linear diperoleh dengan melakukan feedback shift register sebagai fungsi waktu. PN code mempunyai autokorelasi yang tinggi sehingga dapat dimanfaatkan untuk sinkronikasi. Sifat-sifat yang harus dimiliki oleh PN code adalah [9] sebagai berikut :

  1. Harus berbeda antara satu dengan yang lain, tetapi yang digunakan pada sisi pengirim dan penerima harus sama untuk mendapatkan kembali sinyal data infromasi.

  2. Harus berbentuk acak, tetapi memiliki pola tertentu.

  3. Cross correlation antara dua kode yang berbeda harus bernilai kecil.

  4. Kode harus mempunyai periode yang panjang.

2.1.3 Spreading

  Spreading merupakan suatu proses penyebaran atau penambahan panjang sequence data yang

  menghasilkan bit-bit keluaran sesuai dengan kode yang digunakan. Data masukan menentukan deretan

  

sequence manakah yang menjadi keluaran dari kode. Dalam penelitian ini, data masukan tidak

  dikalikan dengan kode, hanya menentukan kode yang akan dipakai. Kode tersebut harus diketahui di sisi pengirim dan penerima untuk melakukan despreading yang akan mengambil kembali data masukan awal.

3. Pembahasan

3.1 Perancangan Sistem

  Dalam penelitian ini akan dibuat suatu sistem audio watermarking dengan data sisipan berupa citra biner (black and white). Skema dari audio watermarking ini menggunakan teknik modulasi digital, dengan merepresentasikan bit informasi ke dalam suatu code sequence, dan menggunakan pengkodean konvolusi. Perancangan sistem dibagi menjadi dua tahap yaitu proses penyisipan informasi ke dalam host audio dan proses ekstraksi untuk mengambil kembali informasi sisipan dari

  

host audio . Secara umum, skema audio watermarking yang akan dilakukan adalah seperti pada

diagram alir dalam Gambar 4.

  Gambar 4 Diagram alir skema audio watermarking

3.1.1 Proses Embedding

  Embedding adalah suatu proses penyisipan informasi berbentuk data watermark ke dalam host

audio . Dalam penelitian ini, informasi yang ingin disisipkan berupa citra biner. Skema embedding

  pada penelitian ini dipaparkan pada Gambar 5. Citra biner akan diolah terlebih dahulu (preprocessing) sebelum nantinya dihasilkan suatu data watermark yang merepresentasikan citra biner tersebut.

  Gambar 5 Diagram alir proses embedding Berikut adalah tahapan-tahapan pada proses embedding watermark ke dalam host audio : 1.

  Informasi berupa citra digital biner (black and white) berbentuk 2 dimensi diubah (reshape) menjadi 1 dimensi.

  2. memasuki blok convolutional code dengan

  Dalam bentuk 1 dimensi, data watermark

  rate ½ yang berarti 1 bit input menghasilkan 2 bit output dengan mengikuti aturan pada trellis diagram yang digunakan.

3. Dilakukan proses blok interleaving pada bit sequence yang akan melakukan pengacakan pada bit-bit tersebut dan menghasilkan bit sequence baru .

  4. Bit sequence yang berbentuk bit-bit biner akan dimodulasi dengan mengelompokkan bit-bit biner tersebut menjadi bilangan desimal sesuai dengan M-ary yang digunakan dan menghasilkan

  sequence desimal C.

  5. digunakan sebagai kode orthogonal yang berbentuk matriks Ncode x Ncode.

  Penentuan kolom PN code yang akan digunakan didasari oleh pemilihan kunci, dengan ketentuan kunci = [1:M-ary] sehingga menghasilkan PN code dengan ukuran panjang kunci dikali Ncode.

  (Contoh : Ncode = 512, kunci = [1:4], kode orthogonal yang digunakan adalah PN code dengan ukuran 512 x 4)

6. PN code kemudian melalui filter psikoakustik agar watermark yang dihasilkan tidak terasa oleh indera pendengaran manusia.

  7. Sequence desimal C dipetakan (spreading) ke dalam PN code sesuai dengan bilangan desimal yang dikandungnya ditambah 1. Sebagai contoh, bilangan desimal 0 akan digantikan oleh PN code kolom pertama, bilangan desimal 1 akan digantikan oleh PN code kolom kedua, dan seterusnya. Proses spreading menghasilkan data sequence

  C’ dengan ukuran panjang dari sequence desimal C dikali Ncode.

  8.

  . C’ akan dikali scaling factor ( ) membentuk 9. dijumlahkan

  Hasil proses embedding berupa watermarked audio didapatkan dari hasil dengan host audio S melalui persamaan (1).

  (1)

  Watermarked audio di penerima akan dibandingkan dengan file host audio awal, sehingga dapat

  diketahui nilai perceptual quality menggunakan pengukuran parameter SNR dan MOS. Terdapat parameter-parameter yang harus disepakati antara pengirim dan penerima dalam skema audio

  

watermarking ini, diantaranya rate dan trellis yang digunakan dalam pengkodean konvolusi, jumlah

  baris dan kolom yang digunakan dalam interleaver, kode orthogonal yang digunakan dalam modulasi, dan nilai alfa yang digunakan sebagai scaling factor. Parameter tersebut harus diketahui pada penerima untuk melakukan proses ekstraksi watermark.

3.1.2 Proses Ekstraksi

  Proses ekstraksi adalah proses untuk mengambil data watermark yang telah disisipkan ke dalam host audio pada proses embedding. Skema ekstraksi pada penelitian ini dipaparkan pada Gambar 6.

  Gambar 6. Diagram alir proses ekstraksi Dalam penelitian ini, tidak dilakukan serangan pada watermarked audio. Berikut adalah tahapan- tahapan pada proses ekstraksi watermark dari watermarked audio :

  1. Watermarked audio y dideteksi dengan despreading dan menghasilkan bit sequence . Proses pendeteksian dilakukan dengan dua cara, yaitu : a.

  Euclidean distance Pendeteksian dengan mencari jarak terdekat dari watermarked audio sequence ke kode yang digunakan (PN code). Secara matematis, Euclidean distance ditunjukkan dalam persamaan (2).

  (2) b.

  Cross Correlation Pendeteksian dengan mencari hubungan tertinggi antara watermarked audio sequence dengan kode yang digunakan (PN code), dengan mengalikan secara kontinu bit-bit dari kedua

  sequence tersebut dan dicari nilai maksimumnya.

  Pendeteksian akan menghasilkan sequence desimal sesuai dengan nomor kolom dalam kode yang terdeteksi.

  2. Sequence desimal akan didemodulasi dengan merepresentasikan bilangan desimal tersebut menjadi bilangan biner kembali sesuai dengan M-ary yang digunakan dan menghasilkan bit sequence .

  3. menjadi sesuai dengan

  Deinterleaver akan mengembalikan urutan dari bit sequence interleaver yang digunakan pada proses embedding.

4. Dekonvolusi akan dilakukan oleh Viterbi decoder dengan pendekatan menggunakan algoritma

  Viterbi. Dekonvolusi ini digunakan untuk mengubah yang merupakan codeword dari informasi menjadi bit-bit informasi sebenarnya .

  Watermark yang diperoleh dalam proses ekstraksi akan dibandingkan dengan file watermark awal, sehingga dapat diketahui nilai robustness menggunakan pengukuran parameter BER dan SSIM.

3.2 Analisis Sistem

  Pada penelitian ini host audio yang digunakan adalah file audio berformat .wav dengan durasi menyesuaikan panjang dari watermark hasil preprocessing. Data yang disisipkan berupa citra digital

  

black and white beresolusi 20x20 piksel. Setelah watermark disisipkan ke dalam host audio, langsung

dilakukan proses ekstraksi pada watermarked audio tanpa melalui serangan.

  Penelitian ini menggunakan beberapa nilai parameter, diantaranya nilai Ncode yang digunakan adalah 512, dan nilai M-ary yang digunakan adalah 2, 4, dan 8. Pada demodulasi juga menggunakan dua cara (lihat 2.1.2), pertama menggunakan Euclidean distance dan kedua menggunakan cross

  

correlation . Tabel 1 menunjukkan nilai pengukuran terbaik yang didapat dari masing-masing Ncode

pada penelitian ini.

  Tabel 1 Tabel nilai pengukuran terbaik untuk masing-masing Ncode

  

Ncode M-ary Batas nilai alfa Tipe Demod SNR ODG BER SSIM

512 2 0.000531 1 52.5872 0.1498

  1 512 2 0.00163 2 42.8289 0.0943

  1 512 4 0.000991 1 47.0673 0.1216

  1 512 4 0.00154 2 43.2347 0.0909

  1 512 8 0.000945 1 47.8087 0.1220

  1 512 8 0.00326 2 37.0530 -0.0130

  1 Tabel 1 menunjukkan kisaran batas minimum nilai alfa yang dapat digunakan dalam skema audio

watermarking pada penelitian ini untuk menghasilkan parameter penilaian terbaik. Semakin besar nilai

  alfa, nilai SNR dan ODG akan semakin memburuk, sedangan nilai BER dan SSIM akan semakin membaik. Dalam skema ini, parameter penilaian terbaik didapatkan saat M-ary bernilai 2 dengan demodulasi Euclidean distance yang menghasilkan SNR bernilai 52.5872, ODG bernilai 0.1498, BER bernilai 0 dan SSIM bernilai 1.

4. Kesimpulan 1.

  Terdapat batas minimum nilai alfa sehingga saat proses deteksi watermark menghasilkan nilai BER 0 dan nilai SSIM 1 tanpa melalui serangan.

  2. Nilai alfa yang digunakan sangat berpengaruh kepada parameter pengukuran. Semakin besar nilai alfa, nilai SNR dan ODG yang dihasilkan akan semakin buruk, namun nilai BER dan SSIM akan yang dihasilkan akan semakin baik.

  3. Tipe demodulasi Euclidean distance dapat mendeteksi watermark dengan nilai alfa lebih kecil dibandingan demodulasi cross correlation untuk memperoleh nilai BER 0 dan nilai SSIM 1.

  4. Dengan analisis yang dilakukan, harus dicari nilai Ncode, M-ary, alfa, dan tipe demodulasi yang digunakan untuk menghasilkan semua nilai parameter pengukuran terbaik.

  Ucapan Terima Kasih

  Terima kasih kepada Allah SWT yang telah memperlancar penelitian ini, kepada Ayah, Ibu, dan Pak Gelar yang telah membantu dan mendukung penulis dalam menyelesaikan penelitian ini. Semoga penelitian ini bisa berguna untuk penulis sendiri dan orang lain yang berhubungan dengan topik pada penelitian ini.

  Daftar Pustaka

  [1] M. M. Alsalami, Mikdam A. T.; Al- Akaidi, “DIGITAL AUDIO WATERMARKING: SURVEY,” pp. 12

  • –13. [2] M. K. Pandey, G. Parmar, and R. Gupta, “Audio watermarking by spreading echo in time domain using pseudo noise gray sequence,” 2015 Int. Conf. Ind. Instrum. Control. ICIC 2015, no. Icic, pp. 740 –743, 2015.

  [3]

  G. Budiman, A. B. Suksmono, and D. H. Shin, “A multicarrier modulation audio watermarking system ,” in International Conference on Electrical Engineering and Informatics (ICEEI), 2015. [4]

  E. K. Rosita, Suwadi, and A. Ansori, “Implementasi Convolutional Code dan Viterbi Decode pada DSK TMS320C6416T,” vol. 2, no. 1, 2013. [5] X. Da-Wen, W. Rang-Ding, and B. Ji-

  Long, “A Blind Audio Watermarking Algorithm Based on Convolutional Code,” in 8th International Conference on Signal Processing, 2006. [6]

  E. K. Adiyanto, “Tugas Akhir : Perbandingan Performansi Convolutional Code dengan Convolutional Turbo Code,” Universitas Mercu Buana, 2009. [7] A. J. Viterbi, CDMA: Principles of Spread Spectrum Communications. Addison Wesley Longman Inc., 1995. [8] Dixon, R.C., "Spread Spectrum System", John Wiley & Sons, 1976. [9] Tataq Ajie R. and Y. Moegiharto, “Studi Perbandingan Kinerja Direct Sequence Spread Spectrum

  Code Division Multiple Acces (DS- SS CDMA) dengan Kode Penebar Walsh, Gold, dan Kasami,” Politeknik Elektronika Negeri Surabaya.