SISTEM PENGENALAN UCAPAN HURUF VOKAL MENGGUNAKAN METODE LINEAR PREDICTIVE CODING (LPC) DAN JARINGAN SARAF TIRUAN LEARNING VECTOR QUANTIZATION (LVQ) BERBASIS MIKROKONTROLER.
SISTEM PENGENALAN UCAPAN HURUF VOKAL MENGGUNAKAN
METODE LINEAR PREDICTIVE CODING (LPC) DAN JARINGAN
SARAF TIRUAN LEARNING VECTOR QUANTIZATION (LVQ)
BERBASIS MIKROKONTROLER
LAPORAN TUGAS AKHIR
DESI LESTARI
0910452031
JURUSAN SISTEM KOMPUTER
FAKULTAS TEKNOLOGI INFORMASI
UNIVERSITAS ANDALAS
PADANG
2014
ABSTRAK
SISTEM PENGENALAN UCAPAN HURUF VOKAL MENGGUNAKAN
METODE LINEAR PREDICTIVE CODING (LPC) DAN JARINGAN
SARAF TIRUAN LEARNING VECTOR QUANTIZATION (LVQ)
BERBASIS MIKROKONTROLER
Oleh
Desi Lestari
0910452031
Sistem pengenalan ucapan adalah suatu pengembangan teknik dan sistem yang
memungkinkan perangkat teknologi untuk bisa menerima masukan suara yang
diucapkan, mengenali dan menterjemahkannya. Sekarang ini, sistem pengenal
ucapan menjadi sesuatu yang sangat fungsional dalam bidang teknologi
komunikasi, karena ucapan dapat menjadi media untuk berinteraksi dengan
perangkat teknologi yang ada. Oleh sebab itu dibutuhkan sebuah alat atau sistem
yang mampu mengenali dan menterjemahkan suara ucapan manusia tersebut.
Dalam tugas akhir ini dilakukan pembuatan sistem pengenalan ucapan terhadap
suara /a/ /i/ /u/ /e/ dan /o/ dengan memakai algoritma ekstraksi ciri suara yaitu
LPC. LPC merupakan salah satu metode analisis sinyal suara yang menyatakan
ciri-ciri penting dari sinyal suara tersebut dalam bentuk koefisien LPC. Dengan
melakukan proses preemphasis, windowing, autokorelasi dan analisis LPC, maka
didapatkan perbedaan ciri dari nilai koefisien sinyal ucapan tersebut. Sedangkan
untuk pengklasifikasian dan identifikasi ucapan digunakan Jaringan Saraf Tiruan
dengan algoritma LVQ. Proses pelatihan LVQ akan menghasilkan nilai bobot
akhir untuk masing-masing ucapan huruf vokal. Sehingga nilai bobot akhir
tersebut akan menjadi bobot referensi untuk tahap identifikasi pengenalan ucapan
huruf vokal.
Dari hasil pengujian yang telah dilakukan terhadap sistem pengenalan ucapan
huruf vokal ini diketahui bahwa pengenalan ucapan terhadap data ucapan baru
lebih rendah terhadap data ucapan pelatihan. Dengan persentase keberhasilan
pengenalan data ucapan pelatihan adalah sebesar 80% dan untuk pengenalan data
ucapan baru sebesar 40%.
Kata kunci : Pengenalan ucapan, LPC, Jaringan saraf tiruan, LVQ
ABSTRACT
VOWEL SPEECH RECOGNITION SYSTEM USING LINEAR
PREDICTIVE CODING (LPC) METHOD AND NEURAL NETWORK
LEARNING VECTOR QUANTIZATION (LVQ) BASED
MICROCONTROLLER
By
Desi Lestari
0910452031
Speech recognition system is the development of techniques and systems that
enable the technology to be able to accept spoken voice input, recognize and
translate. Now, speech recognition system into something that is very functional
in the field of communication technology, because speech can be a medium to
interact with the existing technology. Therefore it takes a device or system that is
able to recognize and translate the sounds of human speech.
In this final task of making speech recognition system to the sound / a / / i / / u / / e
/ and / o / by using the voice feature extraction algorithm, namely LPC. LPC is
one method of voice signal analysis stating the essential features of the voice
signal in the form of LPC coefficients. By making the process preemphasis,
windowing, autocorrelation and LPC analysis, then the obtained difference
characteristics of the speech signal coefficient values. As for the classification and
identification of speech used by the Neural Network algorithm LVQ. LVQ training
process will produce a final weight values for each vowel utterance. So the value
of the final weight will be the weight of a reference for phase identification vowel
speech recognition.
From the results of the testing that has been done to the vowel speech recognition
system is known that the introduction of a new speech utterance to lower the data
to the data of training speech. With a success rate of data speech recognition
training is 80% and for the introduction of the new pronunciation of data by 40%.
Keywords: Speech recognition, LPC, artificial neural networks, LVQ
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Pengenalan ucapan adalah suatu pengembangan teknik dan sistem yang
memungkinkan perangkat teknologi untuk bisa menerima masukan suara yang
diucapkan, mengenali dan menterjemahkannya[2]. Pengenalan ucapan atau
pengenalan wicara dalam istilah bahasa Inggris disebut dengan speech
recognition. Sekarang ini, sistem pengenal ucapan menjadi sesuatu yang sangat
fungsional dalam bidang teknologi komunikasi, karena ucapan dapat menjadi
media untuk berinteraksi dengan perangkat teknologi yang ada. Dalam
penggunaan perangkat teknologi dengan media suara ini, dibutuhkan sebuah alat
atau sistem yang mampu mengenali dan menterjemahkan suara ucapan manusia
tersebut. Sinyal suara yang berupa analog harus dikonversi menjadi sinyal digital
agar dapat diolah secara komputerisasi. Selain itu juga diperlukan suatu metode
yang dapat menganalisis perbedaan ciri atau karakteristik dari setiap sinyal suara.
Supaya setiap suara yang diucapkan dapat dikenali dan dapat diterjemahkan
menjadi bentuk text digital.
Sistem pengenalan ucapan huruf vokal merupakan sebuah sistem yang
dirancang untuk mengenali perbedaan ucapan suara a, i, u, e dan o yang kemudian
dapat ditampilkan menjadi text pada layar LCD (Liquid Crystal Display). Metode
yang digunakan dalam pemprosesannya adalah LPC (linear predictive coding).
LPC adalah salah satu metode analisis sinyal suara (pengekstraksian ciri) yang
dapat menyatakan ciri-ciri karakteristik dari sebuah sinyal suara. Dari metode
LPC akan didapatkan nilai vektor masing-masing ucapan a, i, u, e dan o yang
disebut dengan koefisian LPC. Setelah masing-masing ucapan huruf vokal
didapatkan cirinya dalam bentuk vektor koefisien LPC, maka dilakukanlah sebuah
pelatihan (training) untuk proses pengklasifikasian suara. Proses training
menggunakan Jaringan Saraf Tiruan (JST) dengan algoritma pelatihan LVQ
(Learning Vector Quantization), yang akan menghasilkan nilai bobot akhir dari
tiap ucapan huruf vokal. Sehingga pada saat pengujian, sistem dapat
mengidentifikasi suara masukan dan mengenali sebagai ucapan /a/, /i/, /u/, /e/,
atau /o/.
Pengenalan ucapan vokal bahasa Indonesia dengan jaringan saraf tiruan
menggunakan linear predictive coding telah dilakukan penelitian sebelumnya
dalam bentuk program simulasi[1]. Namun pada kenyataan sekarang ini, sebuah
sistem yang nyata atau real lebih dibutuhkan dalam pengaplikasian program
tersebut. Untuk itu diperlukan sebuah alat atau sistem kendali yang dapat
mengontrol jalannya program. Mikrokontroler Mbed NXP LPC1768 adalah salah
satu jenis mikrokontroler yang dirancang khusus terutama untuk Ethernet, USB
(Universal Serial Bus) dan interface dengan perangkat lainnya. Mikrokontroler
ini akan dihubungkan dengan sebuah sensor suara yang menjadi alat inputan suara
dan LCD untuk menampilkan outputnya. Sehingga akan terbentuk sebuah sistem
pengenalan ucapan huruf vokal sinyal suara /a/, /i/, /u/, /e/, /o/ dengan keluaran
berupa text digital.
Dengan adanya latar belakang dan uraian seperti penjelasan diatas, maka
penulis mengangkat sebuah judul Tugas Akhir yang diharapkan dapat menjadi
sebuah sistem cerdas yang berfungsi untuk mengenal ucapan suara manusia dan
dapat menterjemahkannya menjadi sebuah tulisan atau text yaitu “ Sistem
Pengenalan Ucapan Huruf Vokal Menggunakan Metode Linear Predictive
Coding (LPC) dan Jaringan Saraf Tiruan Learning Vector Quantization
(LVQ) Berbasis Mikrokontroler ”.
1.2 Perumusan Masalah
Pada Tugas Akhir ini dapat dirumuskan berbagai masalah yang akan dibahas,
antara lain sbb :
1. Bagaimana proses pencuplikan (sampling) sinyal suara ucapan /a/, /i/, /u/,
/e/, /o/.
2. Bagaimana cara mengimplementasikan algoritma Linear Predictive
Coding (LPC) kedalam Mikrokontroler Mbed NPX LPC1768.
3. Bagaimana
mengimplementasikan
jaringan
saraf
tiruan
algoritma
Learning Vector Quantization (LVQ) untuk mengenali ucapan huruf vokal
kedalam Mikrokontroler Mbed NPX LPC1768.
1.3 Batasan Masalah
Agar penelitian dalam Tugas Akhir ini tidak terlalu luas cakupannya, maka
dibatasilah masalah yang akan dibahas. Adapun batasan masalahnya antara lain :
1. Input suara yang diucapkan huruf vokal dalam bahasa Indonesia saja yaitu
/a/, /i/, /u/, /e/, /o/.
2. Proses pelatihan (training) jaringan saraf tiruan LVQ dilakukan diMatlab.
3. Sistem bersifat dependent, yaitu hanya dapat mengenali suara yang
disampling .
4. Input suara ucapan berada pada range 300-1000Hz.
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Untuk merancang dan membuat sebuah sistem pengenalan ucapan huruf
vokal dalam bahasa Indonesia.
2. Untuk mengimplementasikan algoritma LPC dan JST LVQ pada sistem
pengenalan ucapan yang berbasis Mikrokontroler Mbed NXP LPC1768 .
3. Untuk mengetahui tingkat keberhasilan penggunaan metode LPC dan JST
LVQ pada Mikrokontroler Mbed NXP LPC1768 sebagai sistem
pengenalan ucapan huruf vokal.
1.5 Sistematika Penulisan
Penulisan Tugas Akhir ini dijelaskan dalam beberapa bab dengan urutan sbb :
Bab I. Pendahuluan
Yaitu menjelaskan tentang latar belakang masalah, perumusan masalah, batasan
masalah, tujuan penelitian dan sistematika penulisan.
Bab II. Landasan Teori
Yaitu menjelaskan tentang teori-teori yang mendukung dan berhubungan dengan
penelitian, diantaranya tentang pengenalan suara, teori dasar suara, ADC, metode
LPC, jaringan saraf tiruan, algoritma LVQ, mikrokontroler Mbed, sensor suara
dan LCD.
Bab III. Metodologi Penelitian
Yaitu menjelaskan tentang cara dan metode penelitian yang akan dilakukan dalam
pembuatan sistem.
Bab IV. Hasil dan Analisa
Yaitu menjelaskan tentang hasil serta analisa dari alat penelitian yang telah dibuat.
Bab V. Kesimpulan dan Saran
Yaitu menjelaskan tentang kesimpulan dan saran dari hasil penelitian yang telah
dilakukan.
METODE LINEAR PREDICTIVE CODING (LPC) DAN JARINGAN
SARAF TIRUAN LEARNING VECTOR QUANTIZATION (LVQ)
BERBASIS MIKROKONTROLER
LAPORAN TUGAS AKHIR
DESI LESTARI
0910452031
JURUSAN SISTEM KOMPUTER
FAKULTAS TEKNOLOGI INFORMASI
UNIVERSITAS ANDALAS
PADANG
2014
ABSTRAK
SISTEM PENGENALAN UCAPAN HURUF VOKAL MENGGUNAKAN
METODE LINEAR PREDICTIVE CODING (LPC) DAN JARINGAN
SARAF TIRUAN LEARNING VECTOR QUANTIZATION (LVQ)
BERBASIS MIKROKONTROLER
Oleh
Desi Lestari
0910452031
Sistem pengenalan ucapan adalah suatu pengembangan teknik dan sistem yang
memungkinkan perangkat teknologi untuk bisa menerima masukan suara yang
diucapkan, mengenali dan menterjemahkannya. Sekarang ini, sistem pengenal
ucapan menjadi sesuatu yang sangat fungsional dalam bidang teknologi
komunikasi, karena ucapan dapat menjadi media untuk berinteraksi dengan
perangkat teknologi yang ada. Oleh sebab itu dibutuhkan sebuah alat atau sistem
yang mampu mengenali dan menterjemahkan suara ucapan manusia tersebut.
Dalam tugas akhir ini dilakukan pembuatan sistem pengenalan ucapan terhadap
suara /a/ /i/ /u/ /e/ dan /o/ dengan memakai algoritma ekstraksi ciri suara yaitu
LPC. LPC merupakan salah satu metode analisis sinyal suara yang menyatakan
ciri-ciri penting dari sinyal suara tersebut dalam bentuk koefisien LPC. Dengan
melakukan proses preemphasis, windowing, autokorelasi dan analisis LPC, maka
didapatkan perbedaan ciri dari nilai koefisien sinyal ucapan tersebut. Sedangkan
untuk pengklasifikasian dan identifikasi ucapan digunakan Jaringan Saraf Tiruan
dengan algoritma LVQ. Proses pelatihan LVQ akan menghasilkan nilai bobot
akhir untuk masing-masing ucapan huruf vokal. Sehingga nilai bobot akhir
tersebut akan menjadi bobot referensi untuk tahap identifikasi pengenalan ucapan
huruf vokal.
Dari hasil pengujian yang telah dilakukan terhadap sistem pengenalan ucapan
huruf vokal ini diketahui bahwa pengenalan ucapan terhadap data ucapan baru
lebih rendah terhadap data ucapan pelatihan. Dengan persentase keberhasilan
pengenalan data ucapan pelatihan adalah sebesar 80% dan untuk pengenalan data
ucapan baru sebesar 40%.
Kata kunci : Pengenalan ucapan, LPC, Jaringan saraf tiruan, LVQ
ABSTRACT
VOWEL SPEECH RECOGNITION SYSTEM USING LINEAR
PREDICTIVE CODING (LPC) METHOD AND NEURAL NETWORK
LEARNING VECTOR QUANTIZATION (LVQ) BASED
MICROCONTROLLER
By
Desi Lestari
0910452031
Speech recognition system is the development of techniques and systems that
enable the technology to be able to accept spoken voice input, recognize and
translate. Now, speech recognition system into something that is very functional
in the field of communication technology, because speech can be a medium to
interact with the existing technology. Therefore it takes a device or system that is
able to recognize and translate the sounds of human speech.
In this final task of making speech recognition system to the sound / a / / i / / u / / e
/ and / o / by using the voice feature extraction algorithm, namely LPC. LPC is
one method of voice signal analysis stating the essential features of the voice
signal in the form of LPC coefficients. By making the process preemphasis,
windowing, autocorrelation and LPC analysis, then the obtained difference
characteristics of the speech signal coefficient values. As for the classification and
identification of speech used by the Neural Network algorithm LVQ. LVQ training
process will produce a final weight values for each vowel utterance. So the value
of the final weight will be the weight of a reference for phase identification vowel
speech recognition.
From the results of the testing that has been done to the vowel speech recognition
system is known that the introduction of a new speech utterance to lower the data
to the data of training speech. With a success rate of data speech recognition
training is 80% and for the introduction of the new pronunciation of data by 40%.
Keywords: Speech recognition, LPC, artificial neural networks, LVQ
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Pengenalan ucapan adalah suatu pengembangan teknik dan sistem yang
memungkinkan perangkat teknologi untuk bisa menerima masukan suara yang
diucapkan, mengenali dan menterjemahkannya[2]. Pengenalan ucapan atau
pengenalan wicara dalam istilah bahasa Inggris disebut dengan speech
recognition. Sekarang ini, sistem pengenal ucapan menjadi sesuatu yang sangat
fungsional dalam bidang teknologi komunikasi, karena ucapan dapat menjadi
media untuk berinteraksi dengan perangkat teknologi yang ada. Dalam
penggunaan perangkat teknologi dengan media suara ini, dibutuhkan sebuah alat
atau sistem yang mampu mengenali dan menterjemahkan suara ucapan manusia
tersebut. Sinyal suara yang berupa analog harus dikonversi menjadi sinyal digital
agar dapat diolah secara komputerisasi. Selain itu juga diperlukan suatu metode
yang dapat menganalisis perbedaan ciri atau karakteristik dari setiap sinyal suara.
Supaya setiap suara yang diucapkan dapat dikenali dan dapat diterjemahkan
menjadi bentuk text digital.
Sistem pengenalan ucapan huruf vokal merupakan sebuah sistem yang
dirancang untuk mengenali perbedaan ucapan suara a, i, u, e dan o yang kemudian
dapat ditampilkan menjadi text pada layar LCD (Liquid Crystal Display). Metode
yang digunakan dalam pemprosesannya adalah LPC (linear predictive coding).
LPC adalah salah satu metode analisis sinyal suara (pengekstraksian ciri) yang
dapat menyatakan ciri-ciri karakteristik dari sebuah sinyal suara. Dari metode
LPC akan didapatkan nilai vektor masing-masing ucapan a, i, u, e dan o yang
disebut dengan koefisian LPC. Setelah masing-masing ucapan huruf vokal
didapatkan cirinya dalam bentuk vektor koefisien LPC, maka dilakukanlah sebuah
pelatihan (training) untuk proses pengklasifikasian suara. Proses training
menggunakan Jaringan Saraf Tiruan (JST) dengan algoritma pelatihan LVQ
(Learning Vector Quantization), yang akan menghasilkan nilai bobot akhir dari
tiap ucapan huruf vokal. Sehingga pada saat pengujian, sistem dapat
mengidentifikasi suara masukan dan mengenali sebagai ucapan /a/, /i/, /u/, /e/,
atau /o/.
Pengenalan ucapan vokal bahasa Indonesia dengan jaringan saraf tiruan
menggunakan linear predictive coding telah dilakukan penelitian sebelumnya
dalam bentuk program simulasi[1]. Namun pada kenyataan sekarang ini, sebuah
sistem yang nyata atau real lebih dibutuhkan dalam pengaplikasian program
tersebut. Untuk itu diperlukan sebuah alat atau sistem kendali yang dapat
mengontrol jalannya program. Mikrokontroler Mbed NXP LPC1768 adalah salah
satu jenis mikrokontroler yang dirancang khusus terutama untuk Ethernet, USB
(Universal Serial Bus) dan interface dengan perangkat lainnya. Mikrokontroler
ini akan dihubungkan dengan sebuah sensor suara yang menjadi alat inputan suara
dan LCD untuk menampilkan outputnya. Sehingga akan terbentuk sebuah sistem
pengenalan ucapan huruf vokal sinyal suara /a/, /i/, /u/, /e/, /o/ dengan keluaran
berupa text digital.
Dengan adanya latar belakang dan uraian seperti penjelasan diatas, maka
penulis mengangkat sebuah judul Tugas Akhir yang diharapkan dapat menjadi
sebuah sistem cerdas yang berfungsi untuk mengenal ucapan suara manusia dan
dapat menterjemahkannya menjadi sebuah tulisan atau text yaitu “ Sistem
Pengenalan Ucapan Huruf Vokal Menggunakan Metode Linear Predictive
Coding (LPC) dan Jaringan Saraf Tiruan Learning Vector Quantization
(LVQ) Berbasis Mikrokontroler ”.
1.2 Perumusan Masalah
Pada Tugas Akhir ini dapat dirumuskan berbagai masalah yang akan dibahas,
antara lain sbb :
1. Bagaimana proses pencuplikan (sampling) sinyal suara ucapan /a/, /i/, /u/,
/e/, /o/.
2. Bagaimana cara mengimplementasikan algoritma Linear Predictive
Coding (LPC) kedalam Mikrokontroler Mbed NPX LPC1768.
3. Bagaimana
mengimplementasikan
jaringan
saraf
tiruan
algoritma
Learning Vector Quantization (LVQ) untuk mengenali ucapan huruf vokal
kedalam Mikrokontroler Mbed NPX LPC1768.
1.3 Batasan Masalah
Agar penelitian dalam Tugas Akhir ini tidak terlalu luas cakupannya, maka
dibatasilah masalah yang akan dibahas. Adapun batasan masalahnya antara lain :
1. Input suara yang diucapkan huruf vokal dalam bahasa Indonesia saja yaitu
/a/, /i/, /u/, /e/, /o/.
2. Proses pelatihan (training) jaringan saraf tiruan LVQ dilakukan diMatlab.
3. Sistem bersifat dependent, yaitu hanya dapat mengenali suara yang
disampling .
4. Input suara ucapan berada pada range 300-1000Hz.
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Untuk merancang dan membuat sebuah sistem pengenalan ucapan huruf
vokal dalam bahasa Indonesia.
2. Untuk mengimplementasikan algoritma LPC dan JST LVQ pada sistem
pengenalan ucapan yang berbasis Mikrokontroler Mbed NXP LPC1768 .
3. Untuk mengetahui tingkat keberhasilan penggunaan metode LPC dan JST
LVQ pada Mikrokontroler Mbed NXP LPC1768 sebagai sistem
pengenalan ucapan huruf vokal.
1.5 Sistematika Penulisan
Penulisan Tugas Akhir ini dijelaskan dalam beberapa bab dengan urutan sbb :
Bab I. Pendahuluan
Yaitu menjelaskan tentang latar belakang masalah, perumusan masalah, batasan
masalah, tujuan penelitian dan sistematika penulisan.
Bab II. Landasan Teori
Yaitu menjelaskan tentang teori-teori yang mendukung dan berhubungan dengan
penelitian, diantaranya tentang pengenalan suara, teori dasar suara, ADC, metode
LPC, jaringan saraf tiruan, algoritma LVQ, mikrokontroler Mbed, sensor suara
dan LCD.
Bab III. Metodologi Penelitian
Yaitu menjelaskan tentang cara dan metode penelitian yang akan dilakukan dalam
pembuatan sistem.
Bab IV. Hasil dan Analisa
Yaitu menjelaskan tentang hasil serta analisa dari alat penelitian yang telah dibuat.
Bab V. Kesimpulan dan Saran
Yaitu menjelaskan tentang kesimpulan dan saran dari hasil penelitian yang telah
dilakukan.