Pengkodean Suara Dengan Menggunakan Metode Mixed Excitation Linear Prediction (MELP).

ABSTRAK
Sistem komunikasi digital pada sepuluh tahun belakangan ini mengalami
kemajuan yang pesat. Banyak metode pengkodean suara yang telah dikembangkan
dengan laju bit rendah. Tujuan utama dari pengkodean suara adalah bagaimana
merepresentasikan sinyal suara dengan laju bit serendah mungkin tetapi kualitas suara
keluaran yang dihasilkan cukup baik.

Algoritma Mixed Excitation Linear Prediction (MELP) merupakan algoritma
pengkodean suara yang dikembangkan berdasarkan algoritma Linear Predictive
Coding (LPC), yang terdiri dari 54 bit untuk merepresentasikan suara tiap satu frame
selama 22,5 ms, dengan laju bit yang diperoleh sebesar 2,4 kbps.

Tugas akhir ini bertujuan untuk melakukan simulasi metode MELP dengan
laju bit 2,4 kbps. Simulasi dan analisis yang dilakukan dengan menggunakan
MATLAB secara offline dengan cara memproses suara dengan format *. Wav yang
disampel pada frekuensi 8 kHz. Berdasarkan analisa data dapat diketahui bahwa SNR
adalah sebesar 8,66 dB dan nilai MOS sebesar 3,14.

i

ABSTRACT

Digital communication system in the last decade has achieved great
improvements. Many of speech coding methods have been improved with low bitrate.
The main purpose of speech coding is how to represent speech information with
bitrate as low as possible with good quality output signal.

Mixed Excitation Linear Prediction (MELP) algorithm is developed speech
coding algorithm pursuant to Linear Predictive Coding (LPC) algorithm, consisting
of 54 bit for the representasion of voice every one frame during 22.5 ms, fastly
obtained bit equal to 2.4 kbps.

The objective of this final project is to simulate MELP method and design 2,4
kbps MELP coder and decoder. Simulation and analysis is perfomed using MATLAB
by processing speech file with *. Wav format which is sampled at 8 kHz sampling
frequency. Based on the data analysis, it can be seen that SNR is 8.66 dB and the
MOS value is 3.14.

ii

DAFTAR ISI
Hal


LEMBAR PENGESAHAN
SURAT PERNYATAAN
ABSTRAK

i

ABSTRACT

ii

KATA PENGANTAR

iii

DAFTAR ISI

iv

DAFTAR GAMBAR


viii

DAFTAR TABEL

x

DAFTAR SINGKATAN

xi

BAB I PENDAHULUAN

1

I.1 Latar Belakang

1

I.2 Identifikasi Masalah


2

I.3 Tujuan

2

I.4 Pembatasan Masalah

2

I.5 Sistematika Pembahasan

3

BAB II PENGKODEAN SINYAL SUARA MANUSIA

4

II.1 Pendahuluan


4

II.2 Sistem Komunikasi Suara

4

II.3 Klasifikasi Metode pengkodean suara

6

II.3.1 Waveform Coding

6

II.3.2 Voice Coding

7

II.3.3 Hybrid Coding


7

II.4 Pengkodean Sinyal Suara

7

II.5 Sistem Reproduksi Sinyal Suara

9

II.6 Analisa Prediksi Linier

12

v

II.7 Kinerja Sistem Pengkodean Suara

18


II.7.1 Laju bit

19

II.7.2 Kompleksitas

19

II.7.3 Kualitas suara

20

II.7.4 Waktu tunda

22

BAB III MIXED EXCITATION LINEAR PREDICTION (MELP)

23


III.1 Pendahuluan

23

III.2 Enkoder MELP

24

III.2.1 Penghilangan Frekuensi Rendah

26

III.2.2 Perhitungan Pitch Integer

27

III.2.3 Analisis Voicing Bandpass

27


III.2.4 Pitch Fraksional

28

III.2.5 Tanda Aperiodik

28

III.2.6 Analisis prediksi linier

29

III.2.7 Perhitungan Residu Prediksi Linier

29

III.2.8 Peakness

29


III.2.9 Perhitungan Pitch Akhir

29

III.2.10 Pengecekan Penggandaan Pitch

30

III.2.11Perhitungan Gain

31

III.2.12 Pembaharuan Pitch Rata-rata

31

III.2.13 Kuantisasi Koefisien LPC

31


III.2.14 Kuantisasi Pitch

32

III.2.15 Kuantisasi Gain

33

III.2.16 Kuantisasi Voicing Bandpass

33

III.2.17 Perhitungan dan Kuantisasi Fourier Magnitude

33

III.2.18 Proteksi Error dan Peng-pack-an Bit

34

III.3 Dekoder MELP

37

III.3.1 Bit Unpacking dan Koreksi Error

39

III.3.2 Interpolasi Parameter

40

vi

BAB

III.3.3 Pencampuran Eksitasi

41

III.3.4 Adaptive Spectral Enhancement

42

III.3.6 Gain Adjustment

44

III.3.7 Pulse Dispersion Filter

45

IV PERANCANGAN DAN ANALISIS DATA

49

IV.1 Pendahuluan

49

IV.2 Karakteristik sinyal input

49

IV.3 Diagram pemrosesan masukan/keluaran pada koder MELP

51

IV.4 Sinyal suara masukan dan keluaran

52

IV.5 Proses Windowing

57

IV.6 Alokasi Bit MELP 2,4 Kbps

63

IV.7 Kinerja Hasil Simulasi

64

IV.7.1 Perhitungan laju bit

64

IV.7.2 Pengujian kualitas suara

64

IV.7.2.1 Pengujian Kualitas Suara Secara Obyektif

64

IV.7.2.2 Pengujian Kualitas Suara Secara Subyektif

65

BAB V KESIMPULAN DAN SARAN

66

V.1 Kesimpulan

66

V.2 Saran

66

DAFTAR PUSTAKA
LAMPIRAN A MEAN OPINION SCORE (MOS)

vii

A-1

DAFTAR GAMBAR

Hal
Gambar II.1

Sistem komunikasi suara

5

Gambar II.2

Metode pengkodean suara

6

Gambar II.3

Elemen-elemen sistem pengkodean sinyal suara

8

Gambar II.4

Organ tubuh penghasil suara

10

Gambar II.5

Bentuk gelombang suara voiced (a) dan unvoiced (b)

11

Gambar II.6

Model Prediksi Linier dari vocal track

13

Gambar II.7

Representasi sinyal suara ke-n

14

Gambar III.1 Diagram blok dekoder MELP

25

Gambar III.2 Prediksi linier analysis-by-synthesis

26

Gambar III.3 Alur perancangan software encoder

36

Gambar III.4 Diagram blok enkoder MELP

38

Gambar III.5Alur perancangan software decoder

47

Gambar IV.1 Bentuk Sinyal “Suara1.wav”

51

Gambar IV.2 Bentuk Sinyal “Suara2.wav”

52

Gambar IV.3 Bentuk Sinyal “Suara3.wav”

52

Gambar IV.4 Bentuk Sinyal “Suara4.wav”

53

Gambar IV.5 Bentuk Sinyal “Suara5.wav”

53

Gambar IV.6 Bentuk Sinyal “Suara6.wav”

54

Gambar IV.7 Bentuk Sinyal “Suara7.wav”

54

Gambar IV.8 Bentuk Sinyal “Suara8.wav”

55

Gambar IV.9 Bentuk Sinyal “Suara9.wav”

55

Gambar IV.10 Bentuk Sinyal “Suara10.wav”

56

Gambar IV.11 Window Hamming

57

Gambar IV.12 Sinyal input “Suara1.wav” yang telah terwindow

57

Gambar IV.13 Sinyal input “Suara2.wav” yang telah terwindow

58

viii

Gambar IV.14 Sinyal input “Suara3.wav” yang telah terwindow

58

Gambar IV.15 Sinyal input “Suara4.wav” yang telah terwindow

59

Gambar IV.16 Sinyal input “Suara5.wav” yang telah terwindow

59

Gambar IV.17 Sinyal input “Suara6.wav” yang telah terwindow

60

Gambar IV.18 Sinyal input “Suara7.wav” yang telah terwindow

60

Gambar IV.19 Sinyal input “Suara8.wav” yang telah terwindow

61

Gambar IV.20 Sinyal input “Suara9.wav” yang telah terwindow

61

Gambar IV.21 Sinyal input “Suara10.wav” yang telah terwindow

62

Gambar IV.22 Flowchart masukan dan keluaran koder MELP

62

ix

DAFTAR TABEL

Hal
Tabel II.1

Kinerja beberapa standar sistem pengkodean suara

19

Tabel II.2

Skala nilai dan kualitas dari DRT

21

Tabel II.3

Ukuran skala dari MOS

21

Tabel III.1

Alokasi bit voiced parameter MELP

35

Tabel III.2

Susunan bit voiced yang dikirim

35

Tabel III.3.

Alokasi bit unvoiced Parameter MELP

46

Tabel III.4.

Susunan bit unvoiced yang dikirim

46

Tabel IV.1

Sepuluh sample suara yang digunakan untuk simulasi

50

Tabel IV.2.

Alokasi bit MELP 2,4 kbps

63

Tabel IV.3

Nilai SNR rata-rata pada tiap sinyal output

64

Tabel IV.4

Nilai MOS pada tiap sinyal output

65

x

DAFTAR SINGKATAN
ADC

= Analog Digital Converter

CW

= Characteristic Waveform

DAC

= Digital Analog Converter

DRT

= Diagnostic Rythme Test

DSP

= Digital Signal Processing

DTFS

= Discrete – Time Fourier Series

EVRC

= Enchanced Variable Rate Codec

LP

= Linear Prediction

LPC

= Linear Predictive Coding

LSF

= Linear Spectral Frequency

MIPS

= Million Instructions Per Second

MOS

= Mean Opinion Score

PCM

= Pulse Code Modulation

REW

= Rapidly Evolving Waveform

SEW

= Slowly Evolving Waveform

SNR

= Signal To Noise Ratio

SQR

= Signal To Quantization Noise Ratio

WIC

= Waveform Interpolative Coding

xi

LAMPIRAN A
MEAN OPINION SCORE (MELP)

BAB I
PENDAHULUAN
I.1. Latar Belakang
Akhir-akhir ini kemajuan teknologi di bidang telekomunikasi berkembang
sangat pesat seiring dengan kemajuan teknologi di bidang komputer. Banyak sekali
penelitian yang dilakukan untuk menciptakan metode-metode baru ataupun
mengembangkan metode yang telah ada agar lebih efektif dan efisien. Salah satunya
adalah metode dalam pengkodean sinyal suara.
Pada mulanya pengiriman sinyal informasi pada sistem telekomunikasi
menggunakan sistem analog. Tetapi Sistem ini memiliki banyak kekurangan,antara
lain kualitas suara yang diterima jauh menurun dari suara aslinya dan kemampuan
repeater yang kurang dapat merekonstruksi sinyal dengan baik seperti aslinya.
Setelah itu mulai berkembang sistem pengiriman sinyal digital yang lebih baik
dibanding dengan sinyal analog. Penggunaan sistem digital memungkinkan transmisi
sinyal dengan kecepatan yang tinggi.
Pada saat ini, kebutuhan akan komunikasi semakin besar, dengan banyaknya
pengguna sistem komunikasi, semakin besar pula permintaan akan penggunaan
bandwidth pada sistem transmisinya. Pada kenyataannya, bandwidth yang ada sangat
terbatas, oleh karena itu salah satu upaya yang dapat dilakukan adalah penggunaan
teknologi pengkodean sinyal suara (speech coding), dengan representasi bit – bit yang
kecil maka akan diperoleh laju bit (bit rate) yang rendah.
Algoritma pengkodean sinyal suara yang mampu menurunkan laju bit dan
penggunaan memori untuk aplikasi penyimpanan sinyal suara dengan metode
algoritma Mixed Exctation Linear Prediction (MELP) mampu menurunkan
penggunaan laju bit sampai 2,4 kbps dan penggunaan memori sampai 19 kbyte.
MELP telah menjadi bagian dari sistem komunikasi standar dari United States
Department of Defense (DoD). Dalam sistem pertahanan militer, dibutuhkan suatu

1

komunikasi yang sangat aman untuk menjaga kerahasiaan informasi. Untuk
memberikan keamanan dalam proses komunikasi tersebut diperlukan suatu teknologi
yang mampu menjaga informasi yang dikirim tidak dapat diketahui oleh orang lain.

I.2. Identifikasi Masalah
1. Bagaimana Pengkodean sinyal suara dengan menggunakan metode Mixed
Excitation Linear Prediction (MELP)?
2. Bagaimana Kualitas sinyal suara sintesis yang dihasilkan dengan menggunakan
metode Mixed Excitation Linear Prediction (MELP)?

I.3. Tujuan
Tujuan dari pembuatan tugas akhir ini adalah :
1. Merealisasikan pengkodean suara dengan menggunakan metode Mixed Excitation
Linear Prediction (MELP).
2. Membandingkan kualitas sinyal suara asli dengan sinyal suara sintetis yang
dihasilkan dengan menggunakan metode Mixed Excitation Linear Prediction
(MELP).

I.4. Pembatasan Masalah
Adapun batasan masalah yang akan dibahas dalam tugas akhir ini adalah:
1. Sinyal suara yang digunakan adalah sinyal suara manusia dengan frekuensi antara
300 Hz – 3400 Hz, dan disimpan dalam file berbentuk Wav.
2. Algoritma yang digunakan untuk proses pengkodean sinyal suara adalah Mixed
Excitation Linear Prediction (MELP).
3. Perangkat lunak yang dipakai dalam simulasi ini adalah MATLAB versi 6.1.

2

I.5. Sistematika Pembahasan
Tugas akhir ini memiliki sistematika penulisan sebagai berikut:

BAB I : PENDAHULUAN
Bab ini membahas mengenai latar belakang penelitian, maksud dan tujuan
penelitian, batasan masalah dalam penelitian, dan sistematika penulisan.

BAB II : PENGKODEAN SINYAL SUARA MANUSIA
Bab ini membahas mengenai pengkodean sinyal suara. Penjelasan meliputi
sistem produksi suara manusia, pemodelan sinyal suara secara digital, dan pemodelan
sinyal suara menggunakan algoritma Linear Predictive Coding (LPC).

BAB III : MELP (MIXED EXCITATION LINIEAR PREDICTION)
Bab ini menjelaskan mengenai deskripsi algoritma MELP dan juga
menjelaskan proses eksitasi sinyal yang akan digunakan untuk mensintesis sinyal
suara, dan perancangan serta implementasi sistem koder MELP, meliputi, sistem
enkoder dan dekoder.

BAB IV : PERANCANGAN DAN ANALISIS DATA
Bab ini membahas tentang perancangan dan analisa pengkodean sinyal suara
dengan metode MELP pada sinyal suara menusia.

BAB V : KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran mengenai sistem, dan hasil pengujian sistem
pengkodean sinyal suara menggunakan algoritma MELP.

3

BAB V
KESIMPULAN DAN SARAN

V.1

Kesimpulan
Dari analisa yang telah dilakukan, maka dapat diambil kesimpulan:

1.

Pengkodean sinyal suara dengan menggunakan metode Mixed Excitation
Linear Prediction (MELP) pada tugas akhir ini telah berhasil direalisasikan
dan menghasilkan laju bit sebesar 2,4 kbps.

2.

Pengkodean sinyal suara dengan menggunakan metode MELP menghasilkan
kualitas suara sintesis yang cukup baik dalam MOS sebesar 3,14 dan SNR
rata-rata sebesar 8,66 dB.

V.2

Saran
Adapun saran untuk tugas akhir ini adalah :

1.

Menggunakan prosesor DSP khusus seperti 20 MIPS TMS320C44 untuk
mengimplementasikan metode MELP secara real time.

2. Mengubah kode sumber MATLAB simulasi ini menjadi kode C/C++ atau
kode lainnya yang penggunaanya lebih umum.

66

DAFTAR PUSTAKA

1.

Andre Gavin. Implementasi Code-Excited Linear Predictive (CELP) Coding
pada

Modul DSP TMS320C3x. Tugas Akhir. Jurusan Teknik Elektro ITB.

1998.
2.

Krisdianto. Perbaikan Kualitas dan Inteligibilitas Pengsintesa Suara Ucapan
Manusia Berdasarkan Model LPC 10. Tesis Magister. Jurusan Teknik Elektro
ITB.1999.

3.

Deller, John D., Proakis, John G., dan Hansen, John H.L.. Discrete-Time
Processing if

Speech Signals. New York, Macmillan Publishing Company,

1993.
4

Federal Information Processing Standards Publication. Analog to Digital
conversion of Voice by 2.4000 Bit/second Mixed Excitation Linear Prediction
(MELP). 1997.

5.

Richard V. Cox dan Peter Kroon. Low Bit Rate Speech Coders for
Multimedia Communication. IEEE Communications Magazine. 1996.

6.

Frank K Soong dan Biing-Hwang. Optimal Quantizzation of LSP
Parameters. IEEE Transactions on Speech and Audio Processing. 1993.

7.

Alan V McCree. A Mixed Excitation LPC Vocoder Model for Low Bit Speech
Coding. IEEE Transactions on Speech and Audio Processing. 1993

8.

L.R Rabiner dan R.W. Schafer. Digital Processing of Speech Signals. New
Jersey, Prentice-Hall Englewood Cliffs, 1978.

9.

Oppenheim, Alan V., dan Ronald W. Schafer. Discrete-Time Signall
Processing. Prentice-Hall International, Inc. 1989.

10.

David J. DeFatta, Joseph G. Lucas, dan William S. Hodgkiss. Digital Signal
Processing A System Design Approach. John Willey and Sons. 1988.