Pengkodean Sinyal Suara Dengan Metode Multi Band Excitation (MBE).
ABSTRACT
Nowadays, speech coding technology that encode speech with a minimum
number of bits while maintaining its quality is very required. This final project uses Multi
Band Excitation (MBE) to encode speech signal.
At this final project, simulation has been done in non real time using MBE with
MATLAB software. Coding method consists of two parts; mainly
encoding and
decoding that using five parameters of input and output; such as pitch, 10 LAR
coefficient, gain LPC, voice/unvoice decision and phase.
The software can do encoding and decoding work properly. Based on the analysis
at input and output signal form speech coding method with MBE, we have a quality of
mean SNR is -2.87 dB and the result of MOS for ten samples is 2.39. This final point
represent a bad quality of reconstruction signal.
ii
ABSTRAK
Saat ini, teknologi pengkodean suara ucapan yang mampu mengkodekan suatu
ucapan dengan jumlah bit minimum dan tetap menjaga kualitasnya sangatlah dibutuhkan.
Metode pengkodean suara yang digunakan adalah Multi Band Excitation (MBE)
Pada Tugas Akhir ini, simulasi telah dilakukan dengan menggunakan metode
MBE secara non real time dengan menggunakan perangkat lunak MATLAB.
Pengkodean terdiri atas dua bagian, yaitu bagian encoder dan bagian decoder yang
menggunakan lima buah parameter masukan dan keluaran, yaitu parameter pitch, 10
koefisien LAR, gain LPC, Keputusan Voice/Unvoiced dan fasa.
Perangkat lunak yang direalisasikan dapat berfungsi melakukan proses encoding
dan decoding. Berdasarkan pengamatan terhadap bentuk sinyal masukan dan keluaran
pengkode suara MBE, didapatkan nilai kualitas suara SNR rata-rata sebesar -2,87 dB dan
nilai MOS dari sepuluh sampel suara sebesar 2,39. Hasil yang didapat memperlihatkan
kualitas sinyal suara rekonstruksi yang kurang baik.
i
DAFTAR ISI
ABSTRAK………………………………………………………………………… i
KATA PENGANTAR…………………………………………………………….. iii
DAFTAR ISI……………………………………………………………………….v
DAFTAR GAMBAR……………………………………………………………….ix
DAFTAR TABEL………………………………………………………………….x
BAB I PENDAHULUAN………………………………………………………… 1
1.1 Latar Belakang…………………………………………………………. 1
1.2 Perumusan Masalah……………………………………………………. 2
1.3 Tujuan………………………………………………………………….. 2
1.4 Pembatasan Masalah…………………………………………………… 2
1.5 Sistematika Penulisan………………………………………………….. 2
BAB II LANDASAN TEORI.…...……………………………………………….. 4
2.1 Proses pengkodean suara………….………………………………… 4
2.2 Karakteristik Sinyal Suara……..………………..…………………….. 6
2.2.1 Sistem produksi suara secara fisik………………………………….. 6
2.3 Analisis Spektral short time…………………………………………... 9
2.4 Jenis pengkodean Suara ……………………………………………… 9
2.4.1
Pengkodean Waveform…………………………………..……….. 9
2.4.2
Voice Coder……………………………………………………….. 10
2.4.3
Pengkodean Hybrid ………………………………………………. 10
2.4.4 Teknik Pengkodean Kawasan Frekuensi ……………………………..11
2.4.4.1 Pengkodean Sinusoidal…………………………………….………. 11
2.4.4.2 Pengkodean Harmonik……………………………………………... 12
2.5 Linear Predictive Coding (LPC)……………………………………… 13
2.6.1 Metode Kovarian……………………...…………………………...
v
17
2.6.2 Metode Autokorelasi…………………………………...………….
17
2.7 Proses Kuantisasi………………………….…………………………... 19
2.7.1 Kuantisasi Linier (Uniform)……………………………………..…
20
2.7.2 Kuantisasi Logaritmik………………………………………………... 21
2.8 Discrete Fourier Transform (DFT) dengan Algoritma FFT……………22
2.9 Performansi Sistem Pengkodean Suara…………………………...…….26
2.9.1 Bit rate……………………………………………………………….. 26
2.9.2 Kompleksitas………………………………………………………… 26
2.9.3 Waktu tunda (delay)………………………………………………….. 27
2.9.4 Kualitas suara………………………………………………………… 27
BAB III PENGKODE SUARA MBE…………………………………………….. 30
3.1 Umum……………………………………………………………….….30
3.2 ALGORITMA ANALISIS MULTI-BAND EXCITATION…………...32
3.2.1 Estimasi Pitch…………………………………………………………34
3.2.2 Keputusan Voiced/Unvoiced…. …………………………………….. 37
3.2.3 Estimasi magnituda harmonisa…. …………………………………... 39
3.2.4 Pemodelan Magnituda dengan Koefisien LPC….. ………………….. 40
3.2.5 Informasi Fasa……………………………………………………….. 42
3.3 Algoritma Sintesis Multi Band Excitation…………………………….. 42
3.3.1 Sintesis Sinyal suara Unvoiced………………………………………. 43
3.3.2 Sintesis Sinyal Suara Voiced………………………………………… 43
3.3.3 Prosedur Overlap & Add…………………………………………….. 44
3.4 Kuantisasi Parameter MBE……………………………………………. 44
3.4.1 Kuantisasi Frekuensi Fundamental………………………………….. 45
3.4.2 Kuantisasi Koefisien Gain LPC……………………………………… 45
3.4.3 Kuantisasi Koefisien LPC …………………………………………... 45
3.5
Simulasi Pengkodean Suara
Multi Band Excitation 4,8kbps……………………………………… 46
vi
3.5.1 Umum……………………………………………………………… 46
3.5.2 Simulasi Analisis Pengkodean MBE…………………………..……. 47
3.5.2.1 Estimasi Periode Pitch…………………………………………… 48
3.5.2.2 Penghalusan Pitch………………………………………………… 50
3.5.2.3 Keputusan Voiced/Unoiced…………………………………………….. 50
3.5.2.4 Koefisien LPC……………………………………………………… 51
3.5.3 Kuantisasi Parameter MBE………………………………………….. 51
3.5.3.1 Kuantisasi Perioda Pitch…………………………………………… 51
3.5.3.2 Kuantisasi Keputusan Voiced/Unvoiced ………………………….. 52
3.5.3.3 Kuantisasi Fasa…………………………………………………….. 52
3.5.3.4 Kuantisasi Koefisien LAR………………………………………… 52
3.5.3.5 Kuantisasi Koefisien Gain LPC …………………………………… 52
3.5.4 Simulasi Sintesis Pengkode MBE ………………………………….. 53
3.5.4.1 Prosedur Overlap & Add……………………………………………55
3.5.5 Alokasi bit Pengkodean Suara MBE 4,8 kbps……………………….. 56
BAB IV SIMULASI DAN ANALISA DATA…………...………………………. 58
4.1 Suara Masukan………………………………………………………... 58
4.2 Alokasi Bit Multi Band Excitation……………………………………. 59
4.3 Diagram Alir Simulasi MBE …………………………………………. 60
4.4 Sinyal Suara Masukan Dan Keluaran…………………………………. 67
4.5 Metode Pengukuran…………………………………………………… 72
4.6 Hasil Pengamatan………………………………………………………73
4.7 Analisa Hasil Pengamatan……………………………………………... 73
BAB V KESIMPULAN DAN SARAN…….…………………………………….. 75
5.1 Kesimpulan……………………….…...……………………………….. 75
5.2 Saran……………………………...…...……………………………….. 75
vii
DAFTAR PUSTAKA
LAMPIRAN MEAN OPINION SCORE (MOS)
viii
DAFTAR TABEL
Tabel 2.1:
Skala DRT ...……………………………………………… 28
Tabel 2.2:
Lima nilai skala untuk pengujian metode MOS ................. 28
Tabel 2.3:
perbandingan laju bit, MOS dan kompleksitas
beberapa algoritma pengkodean suara................................... 29
Tabel 3:
Alokasi bit pengkodean MBE 4,8 kbps………………….. 57
Tabel 4.1:
10 sampel suara……………………………………………. 59
Tabel 4.2:
Hasil Pengamatan Simulasi MBE…………………………. 73
xi
DAFTAR GAMBAR
Gambar 2.1:
Elemen Sistem Pengkodean Suara………………………… 5
Gambar 2.2:
Sistem produksi suara manusia……………………………. 7
Gambar 2.3:
Sinyal suara voiced dan sinyal suara unvoiced…………….. 8
Gambar 2.4:
Metode pengkodean suara………………………………… 10
Gambar 2.5:
Diagram blok sistem LPC………………………………….. 13
Gambar 2.6:
Representasi sinyal suara………………………………….. 15
Gambar 2.7: Karakteristik kuantisasi linier (uniform)................................ 21
Gambar 2.8:
Dekomposisi tahap pertama………………………………... 24
Gambar 2.9:
Dekomposisi tahap kedua…………………………………. 25
Gambar 3.1:
Enkoder…………………………………………………….. 31
Gambar 3.2:
Dekoder…………………………………………………….. 32
Gambar 3.3:
Diagram blok algoritma analisis MBE…………………... 33
Gambar 3.4:
Blok algoritma sintesis pengkodean suara (MBE)………. 42
Gambar 3.5:
Diagram blok proses analisis dalam simulasi MBE……….. 47
Gambar 3.6:
Diagram blok proses estimasi pitch……………………… 48
Gambar 3.7:
Diagram blok proses sintesis MBE………………………... 53
Gambar 3.8:
Diagram blok sintesis suara unvoiced….……………………54
Gambar 3.9:
Diagram blok sintesis suara voiced…………………………55
Gambar 4.1:
Flowchart algoritma rekonstruksi spektrum……………….. 60
Gambar 4.2:
Flowchart algoritma perbaikan pitch………………………. 61
Gambar 4.3:
Flowchart algoritma separasi band………………………… 62
Gambar 4.4:
Flowchart algoritma deteksi voicing……………………….. 63
Gambar 4.5:
Flowchart algoritma sintesis bagian voiced………………. 64
Gambar 4.6:
Flowchart algoritma sintesis bagian unvoiced…………….. 65
Gambar 4.7:
Flowchart algoritma kuantisasi pitch……………………… 66
Gambar 4.8:
Bentuk sinyal ‘u.wav’ dengan bunyi suara “u”……………..67
ix
Gambar 4.9:
Bentuk sinyal ‘UKM1.wav’ dengan bunyi suara
“Universitas Kristen Maranatha”………………………… 67
Gambar 4.10: Bentuk sinyal ‘apa_adanya.wav’ dengan bunyi suara
“Apa adanya saja”…………………………………………. 68
Gambar 4.11: Bentuk sinyal ‘elektro.wav’ dengan bunyi suara
“departemen teknik elektro”……………………………….. 68
Gambar 4.12: Bentuk sinyal ‘dayung.wav’ dengan bunyi suara
“sekali merengkuh dayung dua tiga pulau terlewati ”…….. 69
Gambar 4.13: Bentuk sinyal ‘rang.wav’ dengan bunyi suara
“Rangkaian digital dan logika”…………………………….. 69
Gambar 4.14: Bentuk sinyal ‘dago.wav’ dengan bunyi suara
“jalan Insinyur Haji Juanda”………………………………. 70
Gambar 4.15: Bentuk sinyal ‘jalan_ganeca.wav’ dengan bunyi suara
“jalan Ganesa 10”………………………………………….. 70
Gambar 4.16: Bentuk sinyal ‘t1.wav’ dengan bunyi suara
“fundamental of digital sinyal processing”………………… 71
Gambar 4.17: Bentuk sinyal ‘t2.wav’ dengan bunyi suara
“pengujian kualitas suara secara subjektif dan objektif”……71
x
1
BAB I
PENDAHULUAN
Pada bab ini akan dijelaskan mengenai latar belakang, perumusan masalah,
tujuan penulisan, pembatasan masalah, serta sistematika penulisan laporan tugas
akhir ini.
1.1 Latar Belakang
Beberapa tahun belakangan ini teknologi telekomunikasi berkembang sangat
pesat, tentang telekomunikasi digital. Ilmuwan-ilmuwan dari seluruh dunia
melakukan banyak penelitian untuk mengembangkan metode-metode yang ada agar
menjadi lebih optimal ataupun menciptakan metode baru.
Salah satu penelitian pada bidang telekomunikasi adalah pengkodean suara.
Pengkodean suara dapat dilakukan dengan cara analog maupun digital, tetapi untuk
sekarang ini proses pengkodean suara secara digital lebih banyak digunakan daripada
pengkodean suara secara analog karena untuk memanipulasikan data dengan cara
digital lebih baik daripada secara analog. Pengkodean sinyal suara ini tujuannya
adalah bagaimana merealisasikan informasi suara dengan jumlah bitnya yang ditekan
serendah mungkin tetapi kualitas suara sintesis yang dihasilkan tetap baik. Oleh sebab
itu ilmuwan-ilmuwan menciptakan dan mengembangkan
metode-metode
agar
membuat level laju bit rendah, tetapi kualitas suara yang dihasilkan tetap tinggi
(baik).
Salah satu metode pengkodean suara adalah Multi-Band Excitation. (MBE).
Pada MBE digunakan pendekatan yang berbeda untuk merepresentasikan sinyal
eksitasi. Selain itu pada metode ini
klasifikasi voiced/unvoiced diganti dengan
interval harmonis dalam domain frekuensi.
Hal ini memungkinkan suara untuk
dicampur antara voiced dan unvoiced pada proses matching, sehingga kesamaan
bentuk gelombang tidak terlalu dipentingkan.
Walaupun pada
kenyataannya
2
sebagian suara unvoiced segmen suara original dan synthesized
tidak memiliki
kesamaan dalam domain waktu.
1.2 Perumusan Masalah
1. Bagaimana pengkodean sinyal suara dengan menggunakan metode Multi
Band Excitation?
2. Bagaimana kualitas sinyal suara syntesis yang dihasilkan dengan menggunakan
metode Multi-Band Excitation (MBE)?
1.3 Tujuan
1. Merealisasikan pengkodean sinyal suara dengan menggunakan metode MultiBand Excitation (MBE).
2. Membandingkan kualitas sinyal suara asli dengan suara sintesis dengan
menggunakan metode Multi-Band Excitation (MBE).
1.4 Pembatasan Masalah
1. Sinyal suara yang digunakan adalah sinyal suara manusia dengan
menggunakan frekwensi antara 300-3400 Hz dan disimpan dalam file
berbentuk wav.
2. Algoritma yang digunakan untuk melakukan proses pengkodean suara adalah
Multi-Band Excitation (MBE).
3.
Perangkat lunak yang dipakai dalam simulasi ini adalah bahasa pemrograman
MATLAB versi 6.0.
1.5 Sistematika Penulisan
Laporan tugas akhir ini terdiri atas 5 bab dengan sistematika penulisan
sebagai berikut :
1. Bab I membahas mengenai latar belakang, perumusan masalah, tujuan
penulisan, pembatasan masalah, serta sistematika penulisan laporan.
3
2. Bab II akan menjelaskan mengenai landasan teori pengkodean suara.
Penjelasan meliputi sistem produksi suara manusia, pengolahan sinyal suara
secara digital, kompresi sinyal suara, pemodelan sinyal suara menggunakan
algoritma Linear Prediction Coding, dan performansi pengkodean suara.
3. Bab III membahas mengenai algoritma pengkodean sinyal suara dengan
metode Multi Band Excitation (MBE).
4. Bab IV membahas mengenai hasil pengamatan yang diperoleh berdasarkan
implementasi dan realisasi perangkat lunak dari metode MBE.
5. Bab V membahas mengenai kesimpulan yang diperoleh berdasarkan hasil
pengamatan
selanjutnya.
dan
saran-saran
yang
diperlukan
untuk
pengembangan
BAB V
KESIMPULAN DAN SARAN
Pada bab ini akan dibahas mengenai kesimpulan yang diperoleh dari laporan
tugas akhir ini serta saran-saran yang diperlukan untuk pengembangan selanjutnya.
5.1 KESIMPULAN
Dari hasil-hasil simulasi yang telah dilakukan dapat disimpulkan sebagai berikut:
1. Pengkodean suara dengan metoda Multi Band Excitation telah berhasil
direalisasikan.
2.
Berdasarkan pangamatan terhadap bentuk sinyal masukan dan keluaran
pengkodean Multi Band Excitation didapat kualitas suara SNR rata-rata
adalah -2,87 dB, MSE rata-rata adalah 0,04 dan MOS rata-rata adalah 2,39.
5.2 SARAN
Untuk meningkatkan kualitas sinyal sintetik keluaran MBE dapat dilakukan halhal sebagai berikut :
1. Membuat
pengkodean
suara
dengan
diaplikasikan ke real time.
75
Multi
Band
Excitation
untuk
DAFTAR PUSTAKA
1. Atal, Bishnu S., Cuperman V., Gersho, Allan, “Advances In Speech Coding”,
Kluwer Academic Publisher, 1995.
2. Deller, Jhon R., Proakis, John G., Hansen, John H. L., Discrete-time Processing
of Speech Signals, Macmillan Publishing Company, 1993.
3. DVSI. INMARSAT M Voice Codec. USA, February 1991, Version 1.3.
4. Griffin D.W and J.S.Lim, Multiband Excitation Vocoder, IEEE Trans. on ASSP,
Vol.ASSP-36, No. 8,August 1988.
5. Hardwick, Jhon C. and Jae S. Lim, A 4.8 kbps Multi Band Excitation Speech
Coder, ICASSP-88, hal. 374-377, 1988.
6. Kondoz A.M, “Digital Speech Coding for Low Bit Rate Communication
Systems”. John Wiley and Sons, 1994.
7. Ludeman, Lonnie C., Fundamental of Digital Signal Processing, Jhon Willey &
Sons, New York, 1987.
8. McAulay, Robert J. and Thomas F. Quatieri, Speech Analysis/Synthesis Based on
a Sinusoidal Representation, IEEE Trans. on ASSP, Vol.ASSP-34, No. 4,pp. 744754, August 1986.
9. O’shaughnessey, Douglas, Speech Communication – Human and machine,
addison-Wesley Publishing Company, 1987.
10. Palm III, William J., “Introduction to MATLAB 6 for Engineers”, McGraw-Hill
International Edition, 2001.
11. Pribowo, Lukas, “Simulasi Pengkodean Suara dengan Menggunakan Metode
Waveform Interpolative Coding (WIC). Universitas Kristen Maranatha, 2004.
12. Rabiner L. and R. Schafer. Digital Processing of Speech Signals. Signal
Processing. Prentice-Hall,1978.
13. Rowe, David G., Techniques for harmonic sinusoidal coding, PhD thesis, Faculty
of Information Technology University of South Australia, july 1997.
14. Spanias,
A.
S.
(1994).
Speech
Coding:
A
Tutorial
Review.
Http://www.eas.asu.edu/~spanias/papers/review.ps.
15. Tjondronegoro, Suhartono, Speech coding for Communication, diktat Kuliah
Semester I 2000/2001, Institut Teknologi Bandung.
16. Tolle, Herman, “Pengkode Suara Dengan Multi Band Excitation 4,8 kbps’.
Institut Teknologi Bandung, 2002.
17. W T K Wong, R M Mack, B M G Cheetham and X Q Sun, Low rate Speech
Coding for Telecommunications, BT Technol J Vol 14 No 1 pp. 28-44, January
1996.
Nowadays, speech coding technology that encode speech with a minimum
number of bits while maintaining its quality is very required. This final project uses Multi
Band Excitation (MBE) to encode speech signal.
At this final project, simulation has been done in non real time using MBE with
MATLAB software. Coding method consists of two parts; mainly
encoding and
decoding that using five parameters of input and output; such as pitch, 10 LAR
coefficient, gain LPC, voice/unvoice decision and phase.
The software can do encoding and decoding work properly. Based on the analysis
at input and output signal form speech coding method with MBE, we have a quality of
mean SNR is -2.87 dB and the result of MOS for ten samples is 2.39. This final point
represent a bad quality of reconstruction signal.
ii
ABSTRAK
Saat ini, teknologi pengkodean suara ucapan yang mampu mengkodekan suatu
ucapan dengan jumlah bit minimum dan tetap menjaga kualitasnya sangatlah dibutuhkan.
Metode pengkodean suara yang digunakan adalah Multi Band Excitation (MBE)
Pada Tugas Akhir ini, simulasi telah dilakukan dengan menggunakan metode
MBE secara non real time dengan menggunakan perangkat lunak MATLAB.
Pengkodean terdiri atas dua bagian, yaitu bagian encoder dan bagian decoder yang
menggunakan lima buah parameter masukan dan keluaran, yaitu parameter pitch, 10
koefisien LAR, gain LPC, Keputusan Voice/Unvoiced dan fasa.
Perangkat lunak yang direalisasikan dapat berfungsi melakukan proses encoding
dan decoding. Berdasarkan pengamatan terhadap bentuk sinyal masukan dan keluaran
pengkode suara MBE, didapatkan nilai kualitas suara SNR rata-rata sebesar -2,87 dB dan
nilai MOS dari sepuluh sampel suara sebesar 2,39. Hasil yang didapat memperlihatkan
kualitas sinyal suara rekonstruksi yang kurang baik.
i
DAFTAR ISI
ABSTRAK………………………………………………………………………… i
KATA PENGANTAR…………………………………………………………….. iii
DAFTAR ISI……………………………………………………………………….v
DAFTAR GAMBAR……………………………………………………………….ix
DAFTAR TABEL………………………………………………………………….x
BAB I PENDAHULUAN………………………………………………………… 1
1.1 Latar Belakang…………………………………………………………. 1
1.2 Perumusan Masalah……………………………………………………. 2
1.3 Tujuan………………………………………………………………….. 2
1.4 Pembatasan Masalah…………………………………………………… 2
1.5 Sistematika Penulisan………………………………………………….. 2
BAB II LANDASAN TEORI.…...……………………………………………….. 4
2.1 Proses pengkodean suara………….………………………………… 4
2.2 Karakteristik Sinyal Suara……..………………..…………………….. 6
2.2.1 Sistem produksi suara secara fisik………………………………….. 6
2.3 Analisis Spektral short time…………………………………………... 9
2.4 Jenis pengkodean Suara ……………………………………………… 9
2.4.1
Pengkodean Waveform…………………………………..……….. 9
2.4.2
Voice Coder……………………………………………………….. 10
2.4.3
Pengkodean Hybrid ………………………………………………. 10
2.4.4 Teknik Pengkodean Kawasan Frekuensi ……………………………..11
2.4.4.1 Pengkodean Sinusoidal…………………………………….………. 11
2.4.4.2 Pengkodean Harmonik……………………………………………... 12
2.5 Linear Predictive Coding (LPC)……………………………………… 13
2.6.1 Metode Kovarian……………………...…………………………...
v
17
2.6.2 Metode Autokorelasi…………………………………...………….
17
2.7 Proses Kuantisasi………………………….…………………………... 19
2.7.1 Kuantisasi Linier (Uniform)……………………………………..…
20
2.7.2 Kuantisasi Logaritmik………………………………………………... 21
2.8 Discrete Fourier Transform (DFT) dengan Algoritma FFT……………22
2.9 Performansi Sistem Pengkodean Suara…………………………...…….26
2.9.1 Bit rate……………………………………………………………….. 26
2.9.2 Kompleksitas………………………………………………………… 26
2.9.3 Waktu tunda (delay)………………………………………………….. 27
2.9.4 Kualitas suara………………………………………………………… 27
BAB III PENGKODE SUARA MBE…………………………………………….. 30
3.1 Umum……………………………………………………………….….30
3.2 ALGORITMA ANALISIS MULTI-BAND EXCITATION…………...32
3.2.1 Estimasi Pitch…………………………………………………………34
3.2.2 Keputusan Voiced/Unvoiced…. …………………………………….. 37
3.2.3 Estimasi magnituda harmonisa…. …………………………………... 39
3.2.4 Pemodelan Magnituda dengan Koefisien LPC….. ………………….. 40
3.2.5 Informasi Fasa……………………………………………………….. 42
3.3 Algoritma Sintesis Multi Band Excitation…………………………….. 42
3.3.1 Sintesis Sinyal suara Unvoiced………………………………………. 43
3.3.2 Sintesis Sinyal Suara Voiced………………………………………… 43
3.3.3 Prosedur Overlap & Add…………………………………………….. 44
3.4 Kuantisasi Parameter MBE……………………………………………. 44
3.4.1 Kuantisasi Frekuensi Fundamental………………………………….. 45
3.4.2 Kuantisasi Koefisien Gain LPC……………………………………… 45
3.4.3 Kuantisasi Koefisien LPC …………………………………………... 45
3.5
Simulasi Pengkodean Suara
Multi Band Excitation 4,8kbps……………………………………… 46
vi
3.5.1 Umum……………………………………………………………… 46
3.5.2 Simulasi Analisis Pengkodean MBE…………………………..……. 47
3.5.2.1 Estimasi Periode Pitch…………………………………………… 48
3.5.2.2 Penghalusan Pitch………………………………………………… 50
3.5.2.3 Keputusan Voiced/Unoiced…………………………………………….. 50
3.5.2.4 Koefisien LPC……………………………………………………… 51
3.5.3 Kuantisasi Parameter MBE………………………………………….. 51
3.5.3.1 Kuantisasi Perioda Pitch…………………………………………… 51
3.5.3.2 Kuantisasi Keputusan Voiced/Unvoiced ………………………….. 52
3.5.3.3 Kuantisasi Fasa…………………………………………………….. 52
3.5.3.4 Kuantisasi Koefisien LAR………………………………………… 52
3.5.3.5 Kuantisasi Koefisien Gain LPC …………………………………… 52
3.5.4 Simulasi Sintesis Pengkode MBE ………………………………….. 53
3.5.4.1 Prosedur Overlap & Add……………………………………………55
3.5.5 Alokasi bit Pengkodean Suara MBE 4,8 kbps……………………….. 56
BAB IV SIMULASI DAN ANALISA DATA…………...………………………. 58
4.1 Suara Masukan………………………………………………………... 58
4.2 Alokasi Bit Multi Band Excitation……………………………………. 59
4.3 Diagram Alir Simulasi MBE …………………………………………. 60
4.4 Sinyal Suara Masukan Dan Keluaran…………………………………. 67
4.5 Metode Pengukuran…………………………………………………… 72
4.6 Hasil Pengamatan………………………………………………………73
4.7 Analisa Hasil Pengamatan……………………………………………... 73
BAB V KESIMPULAN DAN SARAN…….…………………………………….. 75
5.1 Kesimpulan……………………….…...……………………………….. 75
5.2 Saran……………………………...…...……………………………….. 75
vii
DAFTAR PUSTAKA
LAMPIRAN MEAN OPINION SCORE (MOS)
viii
DAFTAR TABEL
Tabel 2.1:
Skala DRT ...……………………………………………… 28
Tabel 2.2:
Lima nilai skala untuk pengujian metode MOS ................. 28
Tabel 2.3:
perbandingan laju bit, MOS dan kompleksitas
beberapa algoritma pengkodean suara................................... 29
Tabel 3:
Alokasi bit pengkodean MBE 4,8 kbps………………….. 57
Tabel 4.1:
10 sampel suara……………………………………………. 59
Tabel 4.2:
Hasil Pengamatan Simulasi MBE…………………………. 73
xi
DAFTAR GAMBAR
Gambar 2.1:
Elemen Sistem Pengkodean Suara………………………… 5
Gambar 2.2:
Sistem produksi suara manusia……………………………. 7
Gambar 2.3:
Sinyal suara voiced dan sinyal suara unvoiced…………….. 8
Gambar 2.4:
Metode pengkodean suara………………………………… 10
Gambar 2.5:
Diagram blok sistem LPC………………………………….. 13
Gambar 2.6:
Representasi sinyal suara………………………………….. 15
Gambar 2.7: Karakteristik kuantisasi linier (uniform)................................ 21
Gambar 2.8:
Dekomposisi tahap pertama………………………………... 24
Gambar 2.9:
Dekomposisi tahap kedua…………………………………. 25
Gambar 3.1:
Enkoder…………………………………………………….. 31
Gambar 3.2:
Dekoder…………………………………………………….. 32
Gambar 3.3:
Diagram blok algoritma analisis MBE…………………... 33
Gambar 3.4:
Blok algoritma sintesis pengkodean suara (MBE)………. 42
Gambar 3.5:
Diagram blok proses analisis dalam simulasi MBE……….. 47
Gambar 3.6:
Diagram blok proses estimasi pitch……………………… 48
Gambar 3.7:
Diagram blok proses sintesis MBE………………………... 53
Gambar 3.8:
Diagram blok sintesis suara unvoiced….……………………54
Gambar 3.9:
Diagram blok sintesis suara voiced…………………………55
Gambar 4.1:
Flowchart algoritma rekonstruksi spektrum……………….. 60
Gambar 4.2:
Flowchart algoritma perbaikan pitch………………………. 61
Gambar 4.3:
Flowchart algoritma separasi band………………………… 62
Gambar 4.4:
Flowchart algoritma deteksi voicing……………………….. 63
Gambar 4.5:
Flowchart algoritma sintesis bagian voiced………………. 64
Gambar 4.6:
Flowchart algoritma sintesis bagian unvoiced…………….. 65
Gambar 4.7:
Flowchart algoritma kuantisasi pitch……………………… 66
Gambar 4.8:
Bentuk sinyal ‘u.wav’ dengan bunyi suara “u”……………..67
ix
Gambar 4.9:
Bentuk sinyal ‘UKM1.wav’ dengan bunyi suara
“Universitas Kristen Maranatha”………………………… 67
Gambar 4.10: Bentuk sinyal ‘apa_adanya.wav’ dengan bunyi suara
“Apa adanya saja”…………………………………………. 68
Gambar 4.11: Bentuk sinyal ‘elektro.wav’ dengan bunyi suara
“departemen teknik elektro”……………………………….. 68
Gambar 4.12: Bentuk sinyal ‘dayung.wav’ dengan bunyi suara
“sekali merengkuh dayung dua tiga pulau terlewati ”…….. 69
Gambar 4.13: Bentuk sinyal ‘rang.wav’ dengan bunyi suara
“Rangkaian digital dan logika”…………………………….. 69
Gambar 4.14: Bentuk sinyal ‘dago.wav’ dengan bunyi suara
“jalan Insinyur Haji Juanda”………………………………. 70
Gambar 4.15: Bentuk sinyal ‘jalan_ganeca.wav’ dengan bunyi suara
“jalan Ganesa 10”………………………………………….. 70
Gambar 4.16: Bentuk sinyal ‘t1.wav’ dengan bunyi suara
“fundamental of digital sinyal processing”………………… 71
Gambar 4.17: Bentuk sinyal ‘t2.wav’ dengan bunyi suara
“pengujian kualitas suara secara subjektif dan objektif”……71
x
1
BAB I
PENDAHULUAN
Pada bab ini akan dijelaskan mengenai latar belakang, perumusan masalah,
tujuan penulisan, pembatasan masalah, serta sistematika penulisan laporan tugas
akhir ini.
1.1 Latar Belakang
Beberapa tahun belakangan ini teknologi telekomunikasi berkembang sangat
pesat, tentang telekomunikasi digital. Ilmuwan-ilmuwan dari seluruh dunia
melakukan banyak penelitian untuk mengembangkan metode-metode yang ada agar
menjadi lebih optimal ataupun menciptakan metode baru.
Salah satu penelitian pada bidang telekomunikasi adalah pengkodean suara.
Pengkodean suara dapat dilakukan dengan cara analog maupun digital, tetapi untuk
sekarang ini proses pengkodean suara secara digital lebih banyak digunakan daripada
pengkodean suara secara analog karena untuk memanipulasikan data dengan cara
digital lebih baik daripada secara analog. Pengkodean sinyal suara ini tujuannya
adalah bagaimana merealisasikan informasi suara dengan jumlah bitnya yang ditekan
serendah mungkin tetapi kualitas suara sintesis yang dihasilkan tetap baik. Oleh sebab
itu ilmuwan-ilmuwan menciptakan dan mengembangkan
metode-metode
agar
membuat level laju bit rendah, tetapi kualitas suara yang dihasilkan tetap tinggi
(baik).
Salah satu metode pengkodean suara adalah Multi-Band Excitation. (MBE).
Pada MBE digunakan pendekatan yang berbeda untuk merepresentasikan sinyal
eksitasi. Selain itu pada metode ini
klasifikasi voiced/unvoiced diganti dengan
interval harmonis dalam domain frekuensi.
Hal ini memungkinkan suara untuk
dicampur antara voiced dan unvoiced pada proses matching, sehingga kesamaan
bentuk gelombang tidak terlalu dipentingkan.
Walaupun pada
kenyataannya
2
sebagian suara unvoiced segmen suara original dan synthesized
tidak memiliki
kesamaan dalam domain waktu.
1.2 Perumusan Masalah
1. Bagaimana pengkodean sinyal suara dengan menggunakan metode Multi
Band Excitation?
2. Bagaimana kualitas sinyal suara syntesis yang dihasilkan dengan menggunakan
metode Multi-Band Excitation (MBE)?
1.3 Tujuan
1. Merealisasikan pengkodean sinyal suara dengan menggunakan metode MultiBand Excitation (MBE).
2. Membandingkan kualitas sinyal suara asli dengan suara sintesis dengan
menggunakan metode Multi-Band Excitation (MBE).
1.4 Pembatasan Masalah
1. Sinyal suara yang digunakan adalah sinyal suara manusia dengan
menggunakan frekwensi antara 300-3400 Hz dan disimpan dalam file
berbentuk wav.
2. Algoritma yang digunakan untuk melakukan proses pengkodean suara adalah
Multi-Band Excitation (MBE).
3.
Perangkat lunak yang dipakai dalam simulasi ini adalah bahasa pemrograman
MATLAB versi 6.0.
1.5 Sistematika Penulisan
Laporan tugas akhir ini terdiri atas 5 bab dengan sistematika penulisan
sebagai berikut :
1. Bab I membahas mengenai latar belakang, perumusan masalah, tujuan
penulisan, pembatasan masalah, serta sistematika penulisan laporan.
3
2. Bab II akan menjelaskan mengenai landasan teori pengkodean suara.
Penjelasan meliputi sistem produksi suara manusia, pengolahan sinyal suara
secara digital, kompresi sinyal suara, pemodelan sinyal suara menggunakan
algoritma Linear Prediction Coding, dan performansi pengkodean suara.
3. Bab III membahas mengenai algoritma pengkodean sinyal suara dengan
metode Multi Band Excitation (MBE).
4. Bab IV membahas mengenai hasil pengamatan yang diperoleh berdasarkan
implementasi dan realisasi perangkat lunak dari metode MBE.
5. Bab V membahas mengenai kesimpulan yang diperoleh berdasarkan hasil
pengamatan
selanjutnya.
dan
saran-saran
yang
diperlukan
untuk
pengembangan
BAB V
KESIMPULAN DAN SARAN
Pada bab ini akan dibahas mengenai kesimpulan yang diperoleh dari laporan
tugas akhir ini serta saran-saran yang diperlukan untuk pengembangan selanjutnya.
5.1 KESIMPULAN
Dari hasil-hasil simulasi yang telah dilakukan dapat disimpulkan sebagai berikut:
1. Pengkodean suara dengan metoda Multi Band Excitation telah berhasil
direalisasikan.
2.
Berdasarkan pangamatan terhadap bentuk sinyal masukan dan keluaran
pengkodean Multi Band Excitation didapat kualitas suara SNR rata-rata
adalah -2,87 dB, MSE rata-rata adalah 0,04 dan MOS rata-rata adalah 2,39.
5.2 SARAN
Untuk meningkatkan kualitas sinyal sintetik keluaran MBE dapat dilakukan halhal sebagai berikut :
1. Membuat
pengkodean
suara
dengan
diaplikasikan ke real time.
75
Multi
Band
Excitation
untuk
DAFTAR PUSTAKA
1. Atal, Bishnu S., Cuperman V., Gersho, Allan, “Advances In Speech Coding”,
Kluwer Academic Publisher, 1995.
2. Deller, Jhon R., Proakis, John G., Hansen, John H. L., Discrete-time Processing
of Speech Signals, Macmillan Publishing Company, 1993.
3. DVSI. INMARSAT M Voice Codec. USA, February 1991, Version 1.3.
4. Griffin D.W and J.S.Lim, Multiband Excitation Vocoder, IEEE Trans. on ASSP,
Vol.ASSP-36, No. 8,August 1988.
5. Hardwick, Jhon C. and Jae S. Lim, A 4.8 kbps Multi Band Excitation Speech
Coder, ICASSP-88, hal. 374-377, 1988.
6. Kondoz A.M, “Digital Speech Coding for Low Bit Rate Communication
Systems”. John Wiley and Sons, 1994.
7. Ludeman, Lonnie C., Fundamental of Digital Signal Processing, Jhon Willey &
Sons, New York, 1987.
8. McAulay, Robert J. and Thomas F. Quatieri, Speech Analysis/Synthesis Based on
a Sinusoidal Representation, IEEE Trans. on ASSP, Vol.ASSP-34, No. 4,pp. 744754, August 1986.
9. O’shaughnessey, Douglas, Speech Communication – Human and machine,
addison-Wesley Publishing Company, 1987.
10. Palm III, William J., “Introduction to MATLAB 6 for Engineers”, McGraw-Hill
International Edition, 2001.
11. Pribowo, Lukas, “Simulasi Pengkodean Suara dengan Menggunakan Metode
Waveform Interpolative Coding (WIC). Universitas Kristen Maranatha, 2004.
12. Rabiner L. and R. Schafer. Digital Processing of Speech Signals. Signal
Processing. Prentice-Hall,1978.
13. Rowe, David G., Techniques for harmonic sinusoidal coding, PhD thesis, Faculty
of Information Technology University of South Australia, july 1997.
14. Spanias,
A.
S.
(1994).
Speech
Coding:
A
Tutorial
Review.
Http://www.eas.asu.edu/~spanias/papers/review.ps.
15. Tjondronegoro, Suhartono, Speech coding for Communication, diktat Kuliah
Semester I 2000/2001, Institut Teknologi Bandung.
16. Tolle, Herman, “Pengkode Suara Dengan Multi Band Excitation 4,8 kbps’.
Institut Teknologi Bandung, 2002.
17. W T K Wong, R M Mack, B M G Cheetham and X Q Sun, Low rate Speech
Coding for Telecommunications, BT Technol J Vol 14 No 1 pp. 28-44, January
1996.