View of PERANCANGAN DAN ANALISIS AUDIO WATERMARKING BERBASIS TEKNIK MODULASI DIGITAL DENGAN PENGKODEAN KONVOLUSI
PERANCANGAN DAN ANALISIS AUDIO WATERMARKING
BERBASIS TEKNIK MODULASI DIGITAL
DENGAN PENGKODEAN KONVOLUSI
1) 2) 3)Augiska Muliansyahputra , Briliant Hadi Akbar , Gelar Budiman
1),2),3 )Fakultas Teknik Elektro, Universitas Telkom Bandung
Jl. Telekomunikasi No. 1 Bandung
Email : amuliansyahputra@gmail.com
Abstrak . Perkembangan teknologi informasi menyebabkan penyebaran data digital berjalan sangat pesat. Di
balik kemudahan mendapatkan segala jenis informasi digital, terdapat suatu masalah terhadap kepemilikan hak
cipta dari informasi tersebut, contohnya dalam industri multimedia. Karya-karya multimedia, khususnya dalam
industri musik yang berkaitan dengan audio digital, dengan mudahnya dicopy-paste, direkam ulang, dan
diedarkan kembali dengan mengganti nama pemilik asli dengan nama pembajak. Salah satu cara untuk
menghadapi masalah pembajakan karya khususnya dalam industri musik adalah dengan teknik audio
watermarking. Audio watermarking merupakan suatu teknik penyisipan informasi dalam bentuk data digital ke
dalam suatu file audio dengan tujuan sebagai penanda keaslian dari file audio tersebut. Dalam penelitian ini
akan dirancang suatu skema audio watermarking berbasis teknik modulasi digital, dengan merepresentasikan
bit informasi ke dalam bentuk lain, dalam hal ini suatu code sequence. Code sequence yang digunakan harus
diketahui saat proses embedding dan ekstraksi. Dalam skema ini terdapat rangkaian convolutional code dan
interleaver yang digunakan sebagai error correction code. Pengujian sistem dilakukan melalui beberapa
parameter penilaian seperti SNR, ODG, BER, dan SSIM. Skema audio watermarking dalam penelitian ini
mendapatkan range nilai SNR 35 dB hingga 52 dB dan tingkat deteksi 100% tanpa serangan.Kata kunci : perlindungan hak cipta, audio watermarking, M-ary, code sequence, pengkodean konvolusi 1.
Pendahuluan
Dewasa ini, saat teknologi informasi berkembang sangat pesat, hampir semua data telah berbentuk digital. Mulai dari data sederhana seperti buku referensi kuliah, tugas-tugas kuliah, hingga data penting seperti perjanjian kontrak saham perusahaan pasti memiliki data dalam bentuk digital. Apalagi dengan kehadiran internet, digital sudah dijadikan suatu ranah untuk kebutuhan komersil, contohnya dalam industri multimedia. Masalah yang sering terjadi dalam industri ini baik dalam skala perorangan sampai skala perusahaan adalah kasus pembajakan hak cipta (copyright piracy). Dikarenakan penyebaran pada internet yang begitu cepat, karya-karya multimedia khususnya dalam industri musik yang berkaitan dengan digital audio dengan mudahnya dicopy-paste, direkam ulang, dan diedarkan kembali dengan mengganti nama pemilik asli dengan nama pembajak. Sebenarnya, kegiatan pembajakan di indutri musik sangat sulit untuk dihentikan. Ketika suatu karya diunggah ke internet, dengan mudahnya karya tersebut akan menyebar luas tanpa pengawasan. Oleh karena itu, dibutuhkan suatu cara untuk menghadapi masalah pembajakan karya khususnya dalam industri musik, salah satunya dengan menggunakan teknik audio watermarking.
Audio watermarking merupakan suatu teknik penyisipan informasi ke dalam suatu sinyal host
(host media) yang berbentuk file audio tanpa mengganggu keaslian dari audio tersebut. Informasi yang disisipkan dapat berupa bit, teks, citra, atau audio dalam bentuk lain. Informasi yang disisipkan harus unik, agar informasi dalam suatu audio tidak sama dengan informasi dalam audio lain. Dalam audio
watermarking , terdapat berbagai macam teknik penyisipan diantaranya modifikasi LSB, phase coding,
spread spectrum, echo hiding, dan lain-lain. Secara umum, ada 2 kriteria yang harus dipenuhi dalam
audio watermarking [1]. Pertama, informasi yang disisipkan harus tahan terhadap berbagai serangan
(robustness), dengan parameter pengukuran berupa nilai Bit Error Rate (BER). Kedua, hasil proses
watermarking harus menjaga kualitas audio asli (perceptual quality) dengan parameter pengukuran
berupa nilai dari Mean Opinion Score (MOS). Itu berarti, informasi yang disisipkan ke file audio harus tidak terdeteksi oleh indera pendengaran manusia (Human Auditory System/HAS).
Pada penelitian ini dilakukan perancangan dan analisis audio watermarking berbasis teknik modulasi digital dengan pengkodean konvolusi. Teknik modulasi digital merupakan suatu teknik untuk mentransmisikan sinyal dengan merepresentasikan bit informasi ke dalam bentuk lain agar dapat bekerja pada suatu medium. Ini merupakan dasar yang digunakan dalam skema audio watermarking pada penelitian ini yaitu mengubah satu atau sekelompok bit menjadi suatu code sequence (spreading data) menggunakan Pseudorandom Noise (PN) code, sebelum disisipkan ke host audio. Code
sequence yang digunakan harus diketahui saat proses embedding dan ekstraksi. Dalam skema ini juga
terdapat rangkaian convolutional code dan interleaver yang digunakan sebagai error correction code.Contoh untuk penggunaan spreading data menjadi suatu pseudo sequence dalam melakukan [2] modulasi watermark dipaparkan pada penelitian dan penggunaan pengkodean konvolusi dipaparkan [3] [4] [5] [5] pada penelitian , dan . Pada penelitian , skema watermarking berhasil mendapatkan nilai
Signal to Noise Ratio (SNR) diatas 20 dB. Pada proses ekstraksi akan digunakan Euchlidean distance
dan cross correlation pada demodulasi dan Viterbi decoder pada dekonvolusi untuk mencari apakah bit yang diperoleh memiliki korelasi yang tinggi terhadap bit informasi sebelum disisipkan. Dengan menggabungkan metode-metode tersebut, skema audio watermarking ini diharapkan dapat meningkatkan nilai robustness dan imperceptibility dari sistem dengan bukti Bit Error Rate (BER) mendekati 0, Structural Similarity (SSIM) Index mendekati 1, dan Signal to Noise Ratio (SNR) diats 20 dB.
2. Dasar Teori
2.1.1 Convolutional Code (CC)
Convolutional code adalah suatu jenis pengkodean yang dilakukan dengan cara melakukan
konvolusi terhadap urutan bit-bit informasi masukan secara kontinu dan menghasilkan sebuah urutan bit output (codeword) yang kontinu. Dengan menggunkan konvolusi, codeword yang dihasilkan tergantung dengan bit input saat itu dan bit-bit input sebelumnya. Oleh karena itu, proses ini [6] membutuhkan suatu memori (shift register) dengan panjang tertentu .
Convolutional code diwakili dengan 3 parameter yaitu n, k, dan K. n merupakan jumlah bit output
yang ingin dihasilkan tiap k input, dan K adalah constraint length dimana encoder mempunyai K-1 elemen memori. Dalam convolutional code dikenal juga Rc = k/n yang disebut sebagai coding rate (laju pengkodean) yang menyatakan jumlah bit data input per bit yang ingin dikodekan. Pada shift
register , proses konvolusi dilakukan dengan membuat dua buah adder modulo-2 yang melakukan
operasi XOR. Output yang dihasilkan dari dua buah adder ini akan diswitch antar satu dan lainnya [6] untuk mendapatkan suatu urutan kode . Contoh rangkaian convolutional code ditunjukkan pada Gambar 1, yang memiliki K= 3 dan Rc = ½.
[4]
Gambar 1. Convolutional encoder dengan K=3 dan Rc=1/2 Pada Gambar 2 ditunjukkan suatu state diagram yang menggambarkan rangkaian convolutional
code di Gambar 1. Setiap node menunjukkan isi dari shift register tepat sebelum dimasukkannya bit
input . Bit input yang bernilai “0” dan “1” direpresentasikan dengan garis yang menghubungkan setiap
node , dengan garis tebal mewakili bit “0” dan garis putus-putus mewakili bit “1”. Sebagai contoh
[7] dengan asumsi initial state 00, bit input 11010 akan menghasilkan output sequence 1101010010 .[7]
Gambar 2. State diagram untuk encoder pada Gambar 1
Convolutional code juga bisa direpresentasikan dengan trellis diagram yang memperhatikan
transisi tiap proses. Trellis diagram menggambarkan bit input dengan panah-panah dari satu node menuju node lainnya, dimana tiap panah mengandung suatu output sequence tersendiri. Pada Gambar 3 ditunjukkan suatu trellis diagram yang merepresentasikan state diagram dalam Gambar 2 .
[7]
Gambar 3. Trellis diagram untuk encoder pada Gambar 1
2.1.2 PN Code
Pseudorandom Noise code (PN code) merupakan suatu kode dengan suatu urutan bit data yang
terlihat random namun bersifat periodik. PN code mempunyai 2 level, yaitu polar (bit -1 & 1) dan [8] nonpolar (bit 0 & 1). Secara umum, PN code dapat diklasifikasikan menjadi 2 jenis ; yaitu linear dan
non-linear . Kode linear dibangkitkan dengan mengkombinasikan keluaran feedback shift register
dalam fungsi yang tetap (biasanya bermudulo 2. Sedangkan kode non-linear diperoleh dengan melakukan feedback shift register sebagai fungsi waktu. PN code mempunyai autokorelasi yang tinggi sehingga dapat dimanfaatkan untuk sinkronikasi. Sifat-sifat yang harus dimiliki oleh PN code adalah [9] sebagai berikut :
1. Harus berbeda antara satu dengan yang lain, tetapi yang digunakan pada sisi pengirim dan penerima harus sama untuk mendapatkan kembali sinyal data infromasi.
2. Harus berbentuk acak, tetapi memiliki pola tertentu.
3. Cross correlation antara dua kode yang berbeda harus bernilai kecil.
4. Kode harus mempunyai periode yang panjang.
2.1.3 Spreading
Spreading merupakan suatu proses penyebaran atau penambahan panjang sequence data yang
menghasilkan bit-bit keluaran sesuai dengan kode yang digunakan. Data masukan menentukan deretan
sequence manakah yang menjadi keluaran dari kode. Dalam penelitian ini, data masukan tidak
dikalikan dengan kode, hanya menentukan kode yang akan dipakai. Kode tersebut harus diketahui di sisi pengirim dan penerima untuk melakukan despreading yang akan mengambil kembali data masukan awal.
3. Pembahasan
3.1 Perancangan Sistem
Dalam penelitian ini akan dibuat suatu sistem audio watermarking dengan data sisipan berupa citra biner (black and white). Skema dari audio watermarking ini menggunakan teknik modulasi digital, dengan merepresentasikan bit informasi ke dalam suatu code sequence, dan menggunakan pengkodean konvolusi. Perancangan sistem dibagi menjadi dua tahap yaitu proses penyisipan informasi ke dalam host audio dan proses ekstraksi untuk mengambil kembali informasi sisipan dari
host audio . Secara umum, skema audio watermarking yang akan dilakukan adalah seperti pada
diagram alir dalam Gambar 4.Gambar 4 Diagram alir skema audio watermarking
3.1.1 Proses Embedding
Embedding adalah suatu proses penyisipan informasi berbentuk data watermark ke dalam host
audio . Dalam penelitian ini, informasi yang ingin disisipkan berupa citra biner. Skema embedding
pada penelitian ini dipaparkan pada Gambar 5. Citra biner akan diolah terlebih dahulu (preprocessing) sebelum nantinya dihasilkan suatu data watermark yang merepresentasikan citra biner tersebut.
Gambar 5 Diagram alir proses embedding Berikut adalah tahapan-tahapan pada proses embedding watermark ke dalam host audio : 1.
Informasi berupa citra digital biner (black and white) berbentuk 2 dimensi diubah (reshape) menjadi 1 dimensi.
2. memasuki blok convolutional code dengan
Dalam bentuk 1 dimensi, data watermark
rate ½ yang berarti 1 bit input menghasilkan 2 bit output dengan mengikuti aturan pada trellis diagram yang digunakan.
3. Dilakukan proses blok interleaving pada bit sequence yang akan melakukan pengacakan pada bit-bit tersebut dan menghasilkan bit sequence baru .
4. Bit sequence yang berbentuk bit-bit biner akan dimodulasi dengan mengelompokkan bit-bit biner tersebut menjadi bilangan desimal sesuai dengan M-ary yang digunakan dan menghasilkan
sequence desimal C.
5. digunakan sebagai kode orthogonal yang berbentuk matriks Ncode x Ncode.
Penentuan kolom PN code yang akan digunakan didasari oleh pemilihan kunci, dengan ketentuan kunci = [1:M-ary] sehingga menghasilkan PN code dengan ukuran panjang kunci dikali Ncode.
(Contoh : Ncode = 512, kunci = [1:4], kode orthogonal yang digunakan adalah PN code dengan ukuran 512 x 4)
6. PN code kemudian melalui filter psikoakustik agar watermark yang dihasilkan tidak terasa oleh indera pendengaran manusia.
7. Sequence desimal C dipetakan (spreading) ke dalam PN code sesuai dengan bilangan desimal yang dikandungnya ditambah 1. Sebagai contoh, bilangan desimal 0 akan digantikan oleh PN code kolom pertama, bilangan desimal 1 akan digantikan oleh PN code kolom kedua, dan seterusnya. Proses spreading menghasilkan data sequence
C’ dengan ukuran panjang dari sequence desimal C dikali Ncode.
8.
. C’ akan dikali scaling factor ( ) membentuk 9. dijumlahkan
Hasil proses embedding berupa watermarked audio didapatkan dari hasil dengan host audio S melalui persamaan (1).
(1)
Watermarked audio di penerima akan dibandingkan dengan file host audio awal, sehingga dapat
diketahui nilai perceptual quality menggunakan pengukuran parameter SNR dan MOS. Terdapat parameter-parameter yang harus disepakati antara pengirim dan penerima dalam skema audio
watermarking ini, diantaranya rate dan trellis yang digunakan dalam pengkodean konvolusi, jumlah
baris dan kolom yang digunakan dalam interleaver, kode orthogonal yang digunakan dalam modulasi, dan nilai alfa yang digunakan sebagai scaling factor. Parameter tersebut harus diketahui pada penerima untuk melakukan proses ekstraksi watermark.
3.1.2 Proses Ekstraksi
Proses ekstraksi adalah proses untuk mengambil data watermark yang telah disisipkan ke dalam host audio pada proses embedding. Skema ekstraksi pada penelitian ini dipaparkan pada Gambar 6.
Gambar 6. Diagram alir proses ekstraksi Dalam penelitian ini, tidak dilakukan serangan pada watermarked audio. Berikut adalah tahapan- tahapan pada proses ekstraksi watermark dari watermarked audio :
1. Watermarked audio y dideteksi dengan despreading dan menghasilkan bit sequence . Proses pendeteksian dilakukan dengan dua cara, yaitu : a.
Euclidean distance Pendeteksian dengan mencari jarak terdekat dari watermarked audio sequence ke kode yang digunakan (PN code). Secara matematis, Euclidean distance ditunjukkan dalam persamaan (2).
(2) b.
Cross Correlation Pendeteksian dengan mencari hubungan tertinggi antara watermarked audio sequence dengan kode yang digunakan (PN code), dengan mengalikan secara kontinu bit-bit dari kedua
sequence tersebut dan dicari nilai maksimumnya.
Pendeteksian akan menghasilkan sequence desimal sesuai dengan nomor kolom dalam kode yang terdeteksi.
2. Sequence desimal akan didemodulasi dengan merepresentasikan bilangan desimal tersebut menjadi bilangan biner kembali sesuai dengan M-ary yang digunakan dan menghasilkan bit sequence .
3. menjadi sesuai dengan
Deinterleaver akan mengembalikan urutan dari bit sequence interleaver yang digunakan pada proses embedding.
4. Dekonvolusi akan dilakukan oleh Viterbi decoder dengan pendekatan menggunakan algoritma
Viterbi. Dekonvolusi ini digunakan untuk mengubah yang merupakan codeword dari informasi menjadi bit-bit informasi sebenarnya .
Watermark yang diperoleh dalam proses ekstraksi akan dibandingkan dengan file watermark awal, sehingga dapat diketahui nilai robustness menggunakan pengukuran parameter BER dan SSIM.
3.2 Analisis Sistem
Pada penelitian ini host audio yang digunakan adalah file audio berformat .wav dengan durasi menyesuaikan panjang dari watermark hasil preprocessing. Data yang disisipkan berupa citra digital
black and white beresolusi 20x20 piksel. Setelah watermark disisipkan ke dalam host audio, langsung
dilakukan proses ekstraksi pada watermarked audio tanpa melalui serangan.Penelitian ini menggunakan beberapa nilai parameter, diantaranya nilai Ncode yang digunakan adalah 512, dan nilai M-ary yang digunakan adalah 2, 4, dan 8. Pada demodulasi juga menggunakan dua cara (lihat 2.1.2), pertama menggunakan Euclidean distance dan kedua menggunakan cross
correlation . Tabel 1 menunjukkan nilai pengukuran terbaik yang didapat dari masing-masing Ncode
pada penelitian ini.Tabel 1 Tabel nilai pengukuran terbaik untuk masing-masing Ncode
Ncode M-ary Batas nilai alfa Tipe Demod SNR ODG BER SSIM
512 2 0.000531 1 52.5872 0.14981 512 2 0.00163 2 42.8289 0.0943
1 512 4 0.000991 1 47.0673 0.1216
1 512 4 0.00154 2 43.2347 0.0909
1 512 8 0.000945 1 47.8087 0.1220
1 512 8 0.00326 2 37.0530 -0.0130
1 Tabel 1 menunjukkan kisaran batas minimum nilai alfa yang dapat digunakan dalam skema audio
watermarking pada penelitian ini untuk menghasilkan parameter penilaian terbaik. Semakin besar nilai
alfa, nilai SNR dan ODG akan semakin memburuk, sedangan nilai BER dan SSIM akan semakin membaik. Dalam skema ini, parameter penilaian terbaik didapatkan saat M-ary bernilai 2 dengan demodulasi Euclidean distance yang menghasilkan SNR bernilai 52.5872, ODG bernilai 0.1498, BER bernilai 0 dan SSIM bernilai 1.
4. Kesimpulan 1.
Terdapat batas minimum nilai alfa sehingga saat proses deteksi watermark menghasilkan nilai BER 0 dan nilai SSIM 1 tanpa melalui serangan.
2. Nilai alfa yang digunakan sangat berpengaruh kepada parameter pengukuran. Semakin besar nilai alfa, nilai SNR dan ODG yang dihasilkan akan semakin buruk, namun nilai BER dan SSIM akan yang dihasilkan akan semakin baik.
3. Tipe demodulasi Euclidean distance dapat mendeteksi watermark dengan nilai alfa lebih kecil dibandingan demodulasi cross correlation untuk memperoleh nilai BER 0 dan nilai SSIM 1.
4. Dengan analisis yang dilakukan, harus dicari nilai Ncode, M-ary, alfa, dan tipe demodulasi yang digunakan untuk menghasilkan semua nilai parameter pengukuran terbaik.
Ucapan Terima Kasih
Terima kasih kepada Allah SWT yang telah memperlancar penelitian ini, kepada Ayah, Ibu, dan Pak Gelar yang telah membantu dan mendukung penulis dalam menyelesaikan penelitian ini. Semoga penelitian ini bisa berguna untuk penulis sendiri dan orang lain yang berhubungan dengan topik pada penelitian ini.
Daftar Pustaka
[1] M. M. Alsalami, Mikdam A. T.; Al- Akaidi, “DIGITAL AUDIO WATERMARKING: SURVEY,” pp. 12
- –13. [2] M. K. Pandey, G. Parmar, and R. Gupta, “Audio watermarking by spreading echo in time domain using pseudo noise gray sequence,” 2015 Int. Conf. Ind. Instrum. Control. ICIC 2015, no. Icic, pp. 740 –743, 2015.
[3]
G. Budiman, A. B. Suksmono, and D. H. Shin, “A multicarrier modulation audio watermarking system ,” in International Conference on Electrical Engineering and Informatics (ICEEI), 2015. [4]
E. K. Rosita, Suwadi, and A. Ansori, “Implementasi Convolutional Code dan Viterbi Decode pada DSK TMS320C6416T,” vol. 2, no. 1, 2013. [5] X. Da-Wen, W. Rang-Ding, and B. Ji-
Long, “A Blind Audio Watermarking Algorithm Based on Convolutional Code,” in 8th International Conference on Signal Processing, 2006. [6]
E. K. Adiyanto, “Tugas Akhir : Perbandingan Performansi Convolutional Code dengan Convolutional Turbo Code,” Universitas Mercu Buana, 2009. [7] A. J. Viterbi, CDMA: Principles of Spread Spectrum Communications. Addison Wesley Longman Inc., 1995. [8] Dixon, R.C., "Spread Spectrum System", John Wiley & Sons, 1976. [9] Tataq Ajie R. and Y. Moegiharto, “Studi Perbandingan Kinerja Direct Sequence Spread Spectrum
Code Division Multiple Acces (DS- SS CDMA) dengan Kode Penebar Walsh, Gold, dan Kasami,” Politeknik Elektronika Negeri Surabaya.