Pengkodean Suara Dengan Menggunakan Metode Mixed Excitation Linear Prediction (MELP).
ABSTRAK
Sistem komunikasi digital pada sepuluh tahun belakangan ini mengalami
kemajuan yang pesat. Banyak metode pengkodean suara yang telah dikembangkan
dengan laju bit rendah. Tujuan utama dari pengkodean suara adalah bagaimana
merepresentasikan sinyal suara dengan laju bit serendah mungkin tetapi kualitas suara
keluaran yang dihasilkan cukup baik.
Algoritma Mixed Excitation Linear Prediction (MELP) merupakan algoritma
pengkodean suara yang dikembangkan berdasarkan algoritma Linear Predictive
Coding (LPC), yang terdiri dari 54 bit untuk merepresentasikan suara tiap satu frame
selama 22,5 ms, dengan laju bit yang diperoleh sebesar 2,4 kbps.
Tugas akhir ini bertujuan untuk melakukan simulasi metode MELP dengan
laju bit 2,4 kbps. Simulasi dan analisis yang dilakukan dengan menggunakan
MATLAB secara offline dengan cara memproses suara dengan format *. Wav yang
disampel pada frekuensi 8 kHz. Berdasarkan analisa data dapat diketahui bahwa SNR
adalah sebesar 8,66 dB dan nilai MOS sebesar 3,14.
i
ABSTRACT
Digital communication system in the last decade has achieved great
improvements. Many of speech coding methods have been improved with low bitrate.
The main purpose of speech coding is how to represent speech information with
bitrate as low as possible with good quality output signal.
Mixed Excitation Linear Prediction (MELP) algorithm is developed speech
coding algorithm pursuant to Linear Predictive Coding (LPC) algorithm, consisting
of 54 bit for the representasion of voice every one frame during 22.5 ms, fastly
obtained bit equal to 2.4 kbps.
The objective of this final project is to simulate MELP method and design 2,4
kbps MELP coder and decoder. Simulation and analysis is perfomed using MATLAB
by processing speech file with *. Wav format which is sampled at 8 kHz sampling
frequency. Based on the data analysis, it can be seen that SNR is 8.66 dB and the
MOS value is 3.14.
ii
DAFTAR ISI
Hal
LEMBAR PENGESAHAN
SURAT PERNYATAAN
ABSTRAK
i
ABSTRACT
ii
KATA PENGANTAR
iii
DAFTAR ISI
iv
DAFTAR GAMBAR
viii
DAFTAR TABEL
x
DAFTAR SINGKATAN
xi
BAB I PENDAHULUAN
1
I.1 Latar Belakang
1
I.2 Identifikasi Masalah
2
I.3 Tujuan
2
I.4 Pembatasan Masalah
2
I.5 Sistematika Pembahasan
3
BAB II PENGKODEAN SINYAL SUARA MANUSIA
4
II.1 Pendahuluan
4
II.2 Sistem Komunikasi Suara
4
II.3 Klasifikasi Metode pengkodean suara
6
II.3.1 Waveform Coding
6
II.3.2 Voice Coding
7
II.3.3 Hybrid Coding
7
II.4 Pengkodean Sinyal Suara
7
II.5 Sistem Reproduksi Sinyal Suara
9
II.6 Analisa Prediksi Linier
12
v
II.7 Kinerja Sistem Pengkodean Suara
18
II.7.1 Laju bit
19
II.7.2 Kompleksitas
19
II.7.3 Kualitas suara
20
II.7.4 Waktu tunda
22
BAB III MIXED EXCITATION LINEAR PREDICTION (MELP)
23
III.1 Pendahuluan
23
III.2 Enkoder MELP
24
III.2.1 Penghilangan Frekuensi Rendah
26
III.2.2 Perhitungan Pitch Integer
27
III.2.3 Analisis Voicing Bandpass
27
III.2.4 Pitch Fraksional
28
III.2.5 Tanda Aperiodik
28
III.2.6 Analisis prediksi linier
29
III.2.7 Perhitungan Residu Prediksi Linier
29
III.2.8 Peakness
29
III.2.9 Perhitungan Pitch Akhir
29
III.2.10 Pengecekan Penggandaan Pitch
30
III.2.11Perhitungan Gain
31
III.2.12 Pembaharuan Pitch Rata-rata
31
III.2.13 Kuantisasi Koefisien LPC
31
III.2.14 Kuantisasi Pitch
32
III.2.15 Kuantisasi Gain
33
III.2.16 Kuantisasi Voicing Bandpass
33
III.2.17 Perhitungan dan Kuantisasi Fourier Magnitude
33
III.2.18 Proteksi Error dan Peng-pack-an Bit
34
III.3 Dekoder MELP
37
III.3.1 Bit Unpacking dan Koreksi Error
39
III.3.2 Interpolasi Parameter
40
vi
BAB
III.3.3 Pencampuran Eksitasi
41
III.3.4 Adaptive Spectral Enhancement
42
III.3.6 Gain Adjustment
44
III.3.7 Pulse Dispersion Filter
45
IV PERANCANGAN DAN ANALISIS DATA
49
IV.1 Pendahuluan
49
IV.2 Karakteristik sinyal input
49
IV.3 Diagram pemrosesan masukan/keluaran pada koder MELP
51
IV.4 Sinyal suara masukan dan keluaran
52
IV.5 Proses Windowing
57
IV.6 Alokasi Bit MELP 2,4 Kbps
63
IV.7 Kinerja Hasil Simulasi
64
IV.7.1 Perhitungan laju bit
64
IV.7.2 Pengujian kualitas suara
64
IV.7.2.1 Pengujian Kualitas Suara Secara Obyektif
64
IV.7.2.2 Pengujian Kualitas Suara Secara Subyektif
65
BAB V KESIMPULAN DAN SARAN
66
V.1 Kesimpulan
66
V.2 Saran
66
DAFTAR PUSTAKA
LAMPIRAN A MEAN OPINION SCORE (MOS)
vii
A-1
DAFTAR GAMBAR
Hal
Gambar II.1
Sistem komunikasi suara
5
Gambar II.2
Metode pengkodean suara
6
Gambar II.3
Elemen-elemen sistem pengkodean sinyal suara
8
Gambar II.4
Organ tubuh penghasil suara
10
Gambar II.5
Bentuk gelombang suara voiced (a) dan unvoiced (b)
11
Gambar II.6
Model Prediksi Linier dari vocal track
13
Gambar II.7
Representasi sinyal suara ke-n
14
Gambar III.1 Diagram blok dekoder MELP
25
Gambar III.2 Prediksi linier analysis-by-synthesis
26
Gambar III.3 Alur perancangan software encoder
36
Gambar III.4 Diagram blok enkoder MELP
38
Gambar III.5Alur perancangan software decoder
47
Gambar IV.1 Bentuk Sinyal “Suara1.wav”
51
Gambar IV.2 Bentuk Sinyal “Suara2.wav”
52
Gambar IV.3 Bentuk Sinyal “Suara3.wav”
52
Gambar IV.4 Bentuk Sinyal “Suara4.wav”
53
Gambar IV.5 Bentuk Sinyal “Suara5.wav”
53
Gambar IV.6 Bentuk Sinyal “Suara6.wav”
54
Gambar IV.7 Bentuk Sinyal “Suara7.wav”
54
Gambar IV.8 Bentuk Sinyal “Suara8.wav”
55
Gambar IV.9 Bentuk Sinyal “Suara9.wav”
55
Gambar IV.10 Bentuk Sinyal “Suara10.wav”
56
Gambar IV.11 Window Hamming
57
Gambar IV.12 Sinyal input “Suara1.wav” yang telah terwindow
57
Gambar IV.13 Sinyal input “Suara2.wav” yang telah terwindow
58
viii
Gambar IV.14 Sinyal input “Suara3.wav” yang telah terwindow
58
Gambar IV.15 Sinyal input “Suara4.wav” yang telah terwindow
59
Gambar IV.16 Sinyal input “Suara5.wav” yang telah terwindow
59
Gambar IV.17 Sinyal input “Suara6.wav” yang telah terwindow
60
Gambar IV.18 Sinyal input “Suara7.wav” yang telah terwindow
60
Gambar IV.19 Sinyal input “Suara8.wav” yang telah terwindow
61
Gambar IV.20 Sinyal input “Suara9.wav” yang telah terwindow
61
Gambar IV.21 Sinyal input “Suara10.wav” yang telah terwindow
62
Gambar IV.22 Flowchart masukan dan keluaran koder MELP
62
ix
DAFTAR TABEL
Hal
Tabel II.1
Kinerja beberapa standar sistem pengkodean suara
19
Tabel II.2
Skala nilai dan kualitas dari DRT
21
Tabel II.3
Ukuran skala dari MOS
21
Tabel III.1
Alokasi bit voiced parameter MELP
35
Tabel III.2
Susunan bit voiced yang dikirim
35
Tabel III.3.
Alokasi bit unvoiced Parameter MELP
46
Tabel III.4.
Susunan bit unvoiced yang dikirim
46
Tabel IV.1
Sepuluh sample suara yang digunakan untuk simulasi
50
Tabel IV.2.
Alokasi bit MELP 2,4 kbps
63
Tabel IV.3
Nilai SNR rata-rata pada tiap sinyal output
64
Tabel IV.4
Nilai MOS pada tiap sinyal output
65
x
DAFTAR SINGKATAN
ADC
= Analog Digital Converter
CW
= Characteristic Waveform
DAC
= Digital Analog Converter
DRT
= Diagnostic Rythme Test
DSP
= Digital Signal Processing
DTFS
= Discrete – Time Fourier Series
EVRC
= Enchanced Variable Rate Codec
LP
= Linear Prediction
LPC
= Linear Predictive Coding
LSF
= Linear Spectral Frequency
MIPS
= Million Instructions Per Second
MOS
= Mean Opinion Score
PCM
= Pulse Code Modulation
REW
= Rapidly Evolving Waveform
SEW
= Slowly Evolving Waveform
SNR
= Signal To Noise Ratio
SQR
= Signal To Quantization Noise Ratio
WIC
= Waveform Interpolative Coding
xi
LAMPIRAN A
MEAN OPINION SCORE (MELP)
BAB I
PENDAHULUAN
I.1. Latar Belakang
Akhir-akhir ini kemajuan teknologi di bidang telekomunikasi berkembang
sangat pesat seiring dengan kemajuan teknologi di bidang komputer. Banyak sekali
penelitian yang dilakukan untuk menciptakan metode-metode baru ataupun
mengembangkan metode yang telah ada agar lebih efektif dan efisien. Salah satunya
adalah metode dalam pengkodean sinyal suara.
Pada mulanya pengiriman sinyal informasi pada sistem telekomunikasi
menggunakan sistem analog. Tetapi Sistem ini memiliki banyak kekurangan,antara
lain kualitas suara yang diterima jauh menurun dari suara aslinya dan kemampuan
repeater yang kurang dapat merekonstruksi sinyal dengan baik seperti aslinya.
Setelah itu mulai berkembang sistem pengiriman sinyal digital yang lebih baik
dibanding dengan sinyal analog. Penggunaan sistem digital memungkinkan transmisi
sinyal dengan kecepatan yang tinggi.
Pada saat ini, kebutuhan akan komunikasi semakin besar, dengan banyaknya
pengguna sistem komunikasi, semakin besar pula permintaan akan penggunaan
bandwidth pada sistem transmisinya. Pada kenyataannya, bandwidth yang ada sangat
terbatas, oleh karena itu salah satu upaya yang dapat dilakukan adalah penggunaan
teknologi pengkodean sinyal suara (speech coding), dengan representasi bit – bit yang
kecil maka akan diperoleh laju bit (bit rate) yang rendah.
Algoritma pengkodean sinyal suara yang mampu menurunkan laju bit dan
penggunaan memori untuk aplikasi penyimpanan sinyal suara dengan metode
algoritma Mixed Exctation Linear Prediction (MELP) mampu menurunkan
penggunaan laju bit sampai 2,4 kbps dan penggunaan memori sampai 19 kbyte.
MELP telah menjadi bagian dari sistem komunikasi standar dari United States
Department of Defense (DoD). Dalam sistem pertahanan militer, dibutuhkan suatu
1
komunikasi yang sangat aman untuk menjaga kerahasiaan informasi. Untuk
memberikan keamanan dalam proses komunikasi tersebut diperlukan suatu teknologi
yang mampu menjaga informasi yang dikirim tidak dapat diketahui oleh orang lain.
I.2. Identifikasi Masalah
1. Bagaimana Pengkodean sinyal suara dengan menggunakan metode Mixed
Excitation Linear Prediction (MELP)?
2. Bagaimana Kualitas sinyal suara sintesis yang dihasilkan dengan menggunakan
metode Mixed Excitation Linear Prediction (MELP)?
I.3. Tujuan
Tujuan dari pembuatan tugas akhir ini adalah :
1. Merealisasikan pengkodean suara dengan menggunakan metode Mixed Excitation
Linear Prediction (MELP).
2. Membandingkan kualitas sinyal suara asli dengan sinyal suara sintetis yang
dihasilkan dengan menggunakan metode Mixed Excitation Linear Prediction
(MELP).
I.4. Pembatasan Masalah
Adapun batasan masalah yang akan dibahas dalam tugas akhir ini adalah:
1. Sinyal suara yang digunakan adalah sinyal suara manusia dengan frekuensi antara
300 Hz – 3400 Hz, dan disimpan dalam file berbentuk Wav.
2. Algoritma yang digunakan untuk proses pengkodean sinyal suara adalah Mixed
Excitation Linear Prediction (MELP).
3. Perangkat lunak yang dipakai dalam simulasi ini adalah MATLAB versi 6.1.
2
I.5. Sistematika Pembahasan
Tugas akhir ini memiliki sistematika penulisan sebagai berikut:
BAB I : PENDAHULUAN
Bab ini membahas mengenai latar belakang penelitian, maksud dan tujuan
penelitian, batasan masalah dalam penelitian, dan sistematika penulisan.
BAB II : PENGKODEAN SINYAL SUARA MANUSIA
Bab ini membahas mengenai pengkodean sinyal suara. Penjelasan meliputi
sistem produksi suara manusia, pemodelan sinyal suara secara digital, dan pemodelan
sinyal suara menggunakan algoritma Linear Predictive Coding (LPC).
BAB III : MELP (MIXED EXCITATION LINIEAR PREDICTION)
Bab ini menjelaskan mengenai deskripsi algoritma MELP dan juga
menjelaskan proses eksitasi sinyal yang akan digunakan untuk mensintesis sinyal
suara, dan perancangan serta implementasi sistem koder MELP, meliputi, sistem
enkoder dan dekoder.
BAB IV : PERANCANGAN DAN ANALISIS DATA
Bab ini membahas tentang perancangan dan analisa pengkodean sinyal suara
dengan metode MELP pada sinyal suara menusia.
BAB V : KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran mengenai sistem, dan hasil pengujian sistem
pengkodean sinyal suara menggunakan algoritma MELP.
3
BAB V
KESIMPULAN DAN SARAN
V.1
Kesimpulan
Dari analisa yang telah dilakukan, maka dapat diambil kesimpulan:
1.
Pengkodean sinyal suara dengan menggunakan metode Mixed Excitation
Linear Prediction (MELP) pada tugas akhir ini telah berhasil direalisasikan
dan menghasilkan laju bit sebesar 2,4 kbps.
2.
Pengkodean sinyal suara dengan menggunakan metode MELP menghasilkan
kualitas suara sintesis yang cukup baik dalam MOS sebesar 3,14 dan SNR
rata-rata sebesar 8,66 dB.
V.2
Saran
Adapun saran untuk tugas akhir ini adalah :
1.
Menggunakan prosesor DSP khusus seperti 20 MIPS TMS320C44 untuk
mengimplementasikan metode MELP secara real time.
2. Mengubah kode sumber MATLAB simulasi ini menjadi kode C/C++ atau
kode lainnya yang penggunaanya lebih umum.
66
DAFTAR PUSTAKA
1.
Andre Gavin. Implementasi Code-Excited Linear Predictive (CELP) Coding
pada
Modul DSP TMS320C3x. Tugas Akhir. Jurusan Teknik Elektro ITB.
1998.
2.
Krisdianto. Perbaikan Kualitas dan Inteligibilitas Pengsintesa Suara Ucapan
Manusia Berdasarkan Model LPC 10. Tesis Magister. Jurusan Teknik Elektro
ITB.1999.
3.
Deller, John D., Proakis, John G., dan Hansen, John H.L.. Discrete-Time
Processing if
Speech Signals. New York, Macmillan Publishing Company,
1993.
4
Federal Information Processing Standards Publication. Analog to Digital
conversion of Voice by 2.4000 Bit/second Mixed Excitation Linear Prediction
(MELP). 1997.
5.
Richard V. Cox dan Peter Kroon. Low Bit Rate Speech Coders for
Multimedia Communication. IEEE Communications Magazine. 1996.
6.
Frank K Soong dan Biing-Hwang. Optimal Quantizzation of LSP
Parameters. IEEE Transactions on Speech and Audio Processing. 1993.
7.
Alan V McCree. A Mixed Excitation LPC Vocoder Model for Low Bit Speech
Coding. IEEE Transactions on Speech and Audio Processing. 1993
8.
L.R Rabiner dan R.W. Schafer. Digital Processing of Speech Signals. New
Jersey, Prentice-Hall Englewood Cliffs, 1978.
9.
Oppenheim, Alan V., dan Ronald W. Schafer. Discrete-Time Signall
Processing. Prentice-Hall International, Inc. 1989.
10.
David J. DeFatta, Joseph G. Lucas, dan William S. Hodgkiss. Digital Signal
Processing A System Design Approach. John Willey and Sons. 1988.
Sistem komunikasi digital pada sepuluh tahun belakangan ini mengalami
kemajuan yang pesat. Banyak metode pengkodean suara yang telah dikembangkan
dengan laju bit rendah. Tujuan utama dari pengkodean suara adalah bagaimana
merepresentasikan sinyal suara dengan laju bit serendah mungkin tetapi kualitas suara
keluaran yang dihasilkan cukup baik.
Algoritma Mixed Excitation Linear Prediction (MELP) merupakan algoritma
pengkodean suara yang dikembangkan berdasarkan algoritma Linear Predictive
Coding (LPC), yang terdiri dari 54 bit untuk merepresentasikan suara tiap satu frame
selama 22,5 ms, dengan laju bit yang diperoleh sebesar 2,4 kbps.
Tugas akhir ini bertujuan untuk melakukan simulasi metode MELP dengan
laju bit 2,4 kbps. Simulasi dan analisis yang dilakukan dengan menggunakan
MATLAB secara offline dengan cara memproses suara dengan format *. Wav yang
disampel pada frekuensi 8 kHz. Berdasarkan analisa data dapat diketahui bahwa SNR
adalah sebesar 8,66 dB dan nilai MOS sebesar 3,14.
i
ABSTRACT
Digital communication system in the last decade has achieved great
improvements. Many of speech coding methods have been improved with low bitrate.
The main purpose of speech coding is how to represent speech information with
bitrate as low as possible with good quality output signal.
Mixed Excitation Linear Prediction (MELP) algorithm is developed speech
coding algorithm pursuant to Linear Predictive Coding (LPC) algorithm, consisting
of 54 bit for the representasion of voice every one frame during 22.5 ms, fastly
obtained bit equal to 2.4 kbps.
The objective of this final project is to simulate MELP method and design 2,4
kbps MELP coder and decoder. Simulation and analysis is perfomed using MATLAB
by processing speech file with *. Wav format which is sampled at 8 kHz sampling
frequency. Based on the data analysis, it can be seen that SNR is 8.66 dB and the
MOS value is 3.14.
ii
DAFTAR ISI
Hal
LEMBAR PENGESAHAN
SURAT PERNYATAAN
ABSTRAK
i
ABSTRACT
ii
KATA PENGANTAR
iii
DAFTAR ISI
iv
DAFTAR GAMBAR
viii
DAFTAR TABEL
x
DAFTAR SINGKATAN
xi
BAB I PENDAHULUAN
1
I.1 Latar Belakang
1
I.2 Identifikasi Masalah
2
I.3 Tujuan
2
I.4 Pembatasan Masalah
2
I.5 Sistematika Pembahasan
3
BAB II PENGKODEAN SINYAL SUARA MANUSIA
4
II.1 Pendahuluan
4
II.2 Sistem Komunikasi Suara
4
II.3 Klasifikasi Metode pengkodean suara
6
II.3.1 Waveform Coding
6
II.3.2 Voice Coding
7
II.3.3 Hybrid Coding
7
II.4 Pengkodean Sinyal Suara
7
II.5 Sistem Reproduksi Sinyal Suara
9
II.6 Analisa Prediksi Linier
12
v
II.7 Kinerja Sistem Pengkodean Suara
18
II.7.1 Laju bit
19
II.7.2 Kompleksitas
19
II.7.3 Kualitas suara
20
II.7.4 Waktu tunda
22
BAB III MIXED EXCITATION LINEAR PREDICTION (MELP)
23
III.1 Pendahuluan
23
III.2 Enkoder MELP
24
III.2.1 Penghilangan Frekuensi Rendah
26
III.2.2 Perhitungan Pitch Integer
27
III.2.3 Analisis Voicing Bandpass
27
III.2.4 Pitch Fraksional
28
III.2.5 Tanda Aperiodik
28
III.2.6 Analisis prediksi linier
29
III.2.7 Perhitungan Residu Prediksi Linier
29
III.2.8 Peakness
29
III.2.9 Perhitungan Pitch Akhir
29
III.2.10 Pengecekan Penggandaan Pitch
30
III.2.11Perhitungan Gain
31
III.2.12 Pembaharuan Pitch Rata-rata
31
III.2.13 Kuantisasi Koefisien LPC
31
III.2.14 Kuantisasi Pitch
32
III.2.15 Kuantisasi Gain
33
III.2.16 Kuantisasi Voicing Bandpass
33
III.2.17 Perhitungan dan Kuantisasi Fourier Magnitude
33
III.2.18 Proteksi Error dan Peng-pack-an Bit
34
III.3 Dekoder MELP
37
III.3.1 Bit Unpacking dan Koreksi Error
39
III.3.2 Interpolasi Parameter
40
vi
BAB
III.3.3 Pencampuran Eksitasi
41
III.3.4 Adaptive Spectral Enhancement
42
III.3.6 Gain Adjustment
44
III.3.7 Pulse Dispersion Filter
45
IV PERANCANGAN DAN ANALISIS DATA
49
IV.1 Pendahuluan
49
IV.2 Karakteristik sinyal input
49
IV.3 Diagram pemrosesan masukan/keluaran pada koder MELP
51
IV.4 Sinyal suara masukan dan keluaran
52
IV.5 Proses Windowing
57
IV.6 Alokasi Bit MELP 2,4 Kbps
63
IV.7 Kinerja Hasil Simulasi
64
IV.7.1 Perhitungan laju bit
64
IV.7.2 Pengujian kualitas suara
64
IV.7.2.1 Pengujian Kualitas Suara Secara Obyektif
64
IV.7.2.2 Pengujian Kualitas Suara Secara Subyektif
65
BAB V KESIMPULAN DAN SARAN
66
V.1 Kesimpulan
66
V.2 Saran
66
DAFTAR PUSTAKA
LAMPIRAN A MEAN OPINION SCORE (MOS)
vii
A-1
DAFTAR GAMBAR
Hal
Gambar II.1
Sistem komunikasi suara
5
Gambar II.2
Metode pengkodean suara
6
Gambar II.3
Elemen-elemen sistem pengkodean sinyal suara
8
Gambar II.4
Organ tubuh penghasil suara
10
Gambar II.5
Bentuk gelombang suara voiced (a) dan unvoiced (b)
11
Gambar II.6
Model Prediksi Linier dari vocal track
13
Gambar II.7
Representasi sinyal suara ke-n
14
Gambar III.1 Diagram blok dekoder MELP
25
Gambar III.2 Prediksi linier analysis-by-synthesis
26
Gambar III.3 Alur perancangan software encoder
36
Gambar III.4 Diagram blok enkoder MELP
38
Gambar III.5Alur perancangan software decoder
47
Gambar IV.1 Bentuk Sinyal “Suara1.wav”
51
Gambar IV.2 Bentuk Sinyal “Suara2.wav”
52
Gambar IV.3 Bentuk Sinyal “Suara3.wav”
52
Gambar IV.4 Bentuk Sinyal “Suara4.wav”
53
Gambar IV.5 Bentuk Sinyal “Suara5.wav”
53
Gambar IV.6 Bentuk Sinyal “Suara6.wav”
54
Gambar IV.7 Bentuk Sinyal “Suara7.wav”
54
Gambar IV.8 Bentuk Sinyal “Suara8.wav”
55
Gambar IV.9 Bentuk Sinyal “Suara9.wav”
55
Gambar IV.10 Bentuk Sinyal “Suara10.wav”
56
Gambar IV.11 Window Hamming
57
Gambar IV.12 Sinyal input “Suara1.wav” yang telah terwindow
57
Gambar IV.13 Sinyal input “Suara2.wav” yang telah terwindow
58
viii
Gambar IV.14 Sinyal input “Suara3.wav” yang telah terwindow
58
Gambar IV.15 Sinyal input “Suara4.wav” yang telah terwindow
59
Gambar IV.16 Sinyal input “Suara5.wav” yang telah terwindow
59
Gambar IV.17 Sinyal input “Suara6.wav” yang telah terwindow
60
Gambar IV.18 Sinyal input “Suara7.wav” yang telah terwindow
60
Gambar IV.19 Sinyal input “Suara8.wav” yang telah terwindow
61
Gambar IV.20 Sinyal input “Suara9.wav” yang telah terwindow
61
Gambar IV.21 Sinyal input “Suara10.wav” yang telah terwindow
62
Gambar IV.22 Flowchart masukan dan keluaran koder MELP
62
ix
DAFTAR TABEL
Hal
Tabel II.1
Kinerja beberapa standar sistem pengkodean suara
19
Tabel II.2
Skala nilai dan kualitas dari DRT
21
Tabel II.3
Ukuran skala dari MOS
21
Tabel III.1
Alokasi bit voiced parameter MELP
35
Tabel III.2
Susunan bit voiced yang dikirim
35
Tabel III.3.
Alokasi bit unvoiced Parameter MELP
46
Tabel III.4.
Susunan bit unvoiced yang dikirim
46
Tabel IV.1
Sepuluh sample suara yang digunakan untuk simulasi
50
Tabel IV.2.
Alokasi bit MELP 2,4 kbps
63
Tabel IV.3
Nilai SNR rata-rata pada tiap sinyal output
64
Tabel IV.4
Nilai MOS pada tiap sinyal output
65
x
DAFTAR SINGKATAN
ADC
= Analog Digital Converter
CW
= Characteristic Waveform
DAC
= Digital Analog Converter
DRT
= Diagnostic Rythme Test
DSP
= Digital Signal Processing
DTFS
= Discrete – Time Fourier Series
EVRC
= Enchanced Variable Rate Codec
LP
= Linear Prediction
LPC
= Linear Predictive Coding
LSF
= Linear Spectral Frequency
MIPS
= Million Instructions Per Second
MOS
= Mean Opinion Score
PCM
= Pulse Code Modulation
REW
= Rapidly Evolving Waveform
SEW
= Slowly Evolving Waveform
SNR
= Signal To Noise Ratio
SQR
= Signal To Quantization Noise Ratio
WIC
= Waveform Interpolative Coding
xi
LAMPIRAN A
MEAN OPINION SCORE (MELP)
BAB I
PENDAHULUAN
I.1. Latar Belakang
Akhir-akhir ini kemajuan teknologi di bidang telekomunikasi berkembang
sangat pesat seiring dengan kemajuan teknologi di bidang komputer. Banyak sekali
penelitian yang dilakukan untuk menciptakan metode-metode baru ataupun
mengembangkan metode yang telah ada agar lebih efektif dan efisien. Salah satunya
adalah metode dalam pengkodean sinyal suara.
Pada mulanya pengiriman sinyal informasi pada sistem telekomunikasi
menggunakan sistem analog. Tetapi Sistem ini memiliki banyak kekurangan,antara
lain kualitas suara yang diterima jauh menurun dari suara aslinya dan kemampuan
repeater yang kurang dapat merekonstruksi sinyal dengan baik seperti aslinya.
Setelah itu mulai berkembang sistem pengiriman sinyal digital yang lebih baik
dibanding dengan sinyal analog. Penggunaan sistem digital memungkinkan transmisi
sinyal dengan kecepatan yang tinggi.
Pada saat ini, kebutuhan akan komunikasi semakin besar, dengan banyaknya
pengguna sistem komunikasi, semakin besar pula permintaan akan penggunaan
bandwidth pada sistem transmisinya. Pada kenyataannya, bandwidth yang ada sangat
terbatas, oleh karena itu salah satu upaya yang dapat dilakukan adalah penggunaan
teknologi pengkodean sinyal suara (speech coding), dengan representasi bit – bit yang
kecil maka akan diperoleh laju bit (bit rate) yang rendah.
Algoritma pengkodean sinyal suara yang mampu menurunkan laju bit dan
penggunaan memori untuk aplikasi penyimpanan sinyal suara dengan metode
algoritma Mixed Exctation Linear Prediction (MELP) mampu menurunkan
penggunaan laju bit sampai 2,4 kbps dan penggunaan memori sampai 19 kbyte.
MELP telah menjadi bagian dari sistem komunikasi standar dari United States
Department of Defense (DoD). Dalam sistem pertahanan militer, dibutuhkan suatu
1
komunikasi yang sangat aman untuk menjaga kerahasiaan informasi. Untuk
memberikan keamanan dalam proses komunikasi tersebut diperlukan suatu teknologi
yang mampu menjaga informasi yang dikirim tidak dapat diketahui oleh orang lain.
I.2. Identifikasi Masalah
1. Bagaimana Pengkodean sinyal suara dengan menggunakan metode Mixed
Excitation Linear Prediction (MELP)?
2. Bagaimana Kualitas sinyal suara sintesis yang dihasilkan dengan menggunakan
metode Mixed Excitation Linear Prediction (MELP)?
I.3. Tujuan
Tujuan dari pembuatan tugas akhir ini adalah :
1. Merealisasikan pengkodean suara dengan menggunakan metode Mixed Excitation
Linear Prediction (MELP).
2. Membandingkan kualitas sinyal suara asli dengan sinyal suara sintetis yang
dihasilkan dengan menggunakan metode Mixed Excitation Linear Prediction
(MELP).
I.4. Pembatasan Masalah
Adapun batasan masalah yang akan dibahas dalam tugas akhir ini adalah:
1. Sinyal suara yang digunakan adalah sinyal suara manusia dengan frekuensi antara
300 Hz – 3400 Hz, dan disimpan dalam file berbentuk Wav.
2. Algoritma yang digunakan untuk proses pengkodean sinyal suara adalah Mixed
Excitation Linear Prediction (MELP).
3. Perangkat lunak yang dipakai dalam simulasi ini adalah MATLAB versi 6.1.
2
I.5. Sistematika Pembahasan
Tugas akhir ini memiliki sistematika penulisan sebagai berikut:
BAB I : PENDAHULUAN
Bab ini membahas mengenai latar belakang penelitian, maksud dan tujuan
penelitian, batasan masalah dalam penelitian, dan sistematika penulisan.
BAB II : PENGKODEAN SINYAL SUARA MANUSIA
Bab ini membahas mengenai pengkodean sinyal suara. Penjelasan meliputi
sistem produksi suara manusia, pemodelan sinyal suara secara digital, dan pemodelan
sinyal suara menggunakan algoritma Linear Predictive Coding (LPC).
BAB III : MELP (MIXED EXCITATION LINIEAR PREDICTION)
Bab ini menjelaskan mengenai deskripsi algoritma MELP dan juga
menjelaskan proses eksitasi sinyal yang akan digunakan untuk mensintesis sinyal
suara, dan perancangan serta implementasi sistem koder MELP, meliputi, sistem
enkoder dan dekoder.
BAB IV : PERANCANGAN DAN ANALISIS DATA
Bab ini membahas tentang perancangan dan analisa pengkodean sinyal suara
dengan metode MELP pada sinyal suara menusia.
BAB V : KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran mengenai sistem, dan hasil pengujian sistem
pengkodean sinyal suara menggunakan algoritma MELP.
3
BAB V
KESIMPULAN DAN SARAN
V.1
Kesimpulan
Dari analisa yang telah dilakukan, maka dapat diambil kesimpulan:
1.
Pengkodean sinyal suara dengan menggunakan metode Mixed Excitation
Linear Prediction (MELP) pada tugas akhir ini telah berhasil direalisasikan
dan menghasilkan laju bit sebesar 2,4 kbps.
2.
Pengkodean sinyal suara dengan menggunakan metode MELP menghasilkan
kualitas suara sintesis yang cukup baik dalam MOS sebesar 3,14 dan SNR
rata-rata sebesar 8,66 dB.
V.2
Saran
Adapun saran untuk tugas akhir ini adalah :
1.
Menggunakan prosesor DSP khusus seperti 20 MIPS TMS320C44 untuk
mengimplementasikan metode MELP secara real time.
2. Mengubah kode sumber MATLAB simulasi ini menjadi kode C/C++ atau
kode lainnya yang penggunaanya lebih umum.
66
DAFTAR PUSTAKA
1.
Andre Gavin. Implementasi Code-Excited Linear Predictive (CELP) Coding
pada
Modul DSP TMS320C3x. Tugas Akhir. Jurusan Teknik Elektro ITB.
1998.
2.
Krisdianto. Perbaikan Kualitas dan Inteligibilitas Pengsintesa Suara Ucapan
Manusia Berdasarkan Model LPC 10. Tesis Magister. Jurusan Teknik Elektro
ITB.1999.
3.
Deller, John D., Proakis, John G., dan Hansen, John H.L.. Discrete-Time
Processing if
Speech Signals. New York, Macmillan Publishing Company,
1993.
4
Federal Information Processing Standards Publication. Analog to Digital
conversion of Voice by 2.4000 Bit/second Mixed Excitation Linear Prediction
(MELP). 1997.
5.
Richard V. Cox dan Peter Kroon. Low Bit Rate Speech Coders for
Multimedia Communication. IEEE Communications Magazine. 1996.
6.
Frank K Soong dan Biing-Hwang. Optimal Quantizzation of LSP
Parameters. IEEE Transactions on Speech and Audio Processing. 1993.
7.
Alan V McCree. A Mixed Excitation LPC Vocoder Model for Low Bit Speech
Coding. IEEE Transactions on Speech and Audio Processing. 1993
8.
L.R Rabiner dan R.W. Schafer. Digital Processing of Speech Signals. New
Jersey, Prentice-Hall Englewood Cliffs, 1978.
9.
Oppenheim, Alan V., dan Ronald W. Schafer. Discrete-Time Signall
Processing. Prentice-Hall International, Inc. 1989.
10.
David J. DeFatta, Joseph G. Lucas, dan William S. Hodgkiss. Digital Signal
Processing A System Design Approach. John Willey and Sons. 1988.