modelling, pemodelan pengucapan pronounciation modelling, model bahasa language model, dan decoder.
Blok diagram untuk sistem pengenalan ucapan adalah sebagai berikut:
Gambar 2.7. Blok diagram untuk sistem pengenalan ucapan Sumber : Gales dan Young, 2007
2.4.1. Ekstraksi Fitur
Gelombang input audio dari sebuah microphone dikonversikan menjadi sebuah urutan vektor akustik
T T
O O
O ,...,
1 :
1
= dalam proses
yang disebut ekstraksi fitur fitur extractionGales dan Young, 2007.
Tahap ekstraksi fitur bertujuan untuk memberikan sebuah gambaran dari gelombang ucapan. Tahap ekstraksi fitur ini dapat
meminimalkan hilangnya informasi yang membedakan antara kata- kata, dan memberikan kecocokan dengan asumsi distribusi yang
dibuat oleh model akustik. Metode yang digunakan adalah Linear Predictive CodingLPC.
Language Model
Feature Extraction
Decoder
Acoustic Modelling
Pronounciation Modelling
Speech Feature
Vectors ...
O W
“Stop that.” Words
Pre-emphasis Frame
Blocking Windowing
Auto Correlation
Analisa LPC
LPC Parameter
LPCmerupakan salah satu teknik analisis sinyal percakapan yang paling powerful dan menyediakan ekstraksi fitur yang
berkualitas baik dan efisien untuk digunakan dalam perhitungan .
Prosedur untuk mendapatkan koefisien LPC diperlihatkan pada blok diagram berikut:
Gambar 2.8. Blok Diagram LPC
Langkah-langkah dasar yang harus dilakukan mengenai blok diagram tersebut adalah sebagai berikut:
1. Pre-emphasis : Proses dimana sinyal speech ucapan dirubah
menjadi sinyal.
2. Frame Blocking : pada tahap ini, sinyal yang telah di pre-
emphasis, diblok menjadi beberapa bagian dengan jumlah sampel N, dan tiap bagian dipisahkan dengan sejumlah M sampel.
3. Windowing : Tahap berikutnya adalah melakukan proses window
pada setiap bagian sinyal yang telah dibuat sebelumnya. Hal ini dilakukan untuk meminimalkan pada bagian awal dan akhir
sinyal. Jika didefinisikan sebuah window
n w
dan sinyal tiap bagian adalah
n x
maka sinyal hasil proses windowing.
4. Auto Correlation Analysis : Tiap bagian yang telah diberi window
kemudian akan dibentuk autokorelasinya.
5. Analisa LPC : Langkah berikutnya adalah analisa LPC dimana
semua nilai autokorelasinya yang telah dihitung pada tahap sebelumnya akan diubah menjadi parameter LPC.
6. Pengubahan parameter LPC menjadi koefisien cepstral :
Parameter LPC yang sangat penting yang bisa diturunkan dari koefisien LPC adalah koefisien cepstral LPC,
m c
Adapun langkah-langkah analisa LPC untuk pengenalan ucapan speech recognition adalah sebagai berikut:
1. Pre-emphasis terhadap cuplikan sinyal dengan persamaan Pre-
emphasizer
2.5
dengan
n s
adalah sampel ke-n dan harga
a
yang paling sering digunakan adalah 0.95
2. Membagi hasil pre-emphasis
n s
ke dalam frame-frame yang masing-masing memuat
N
buah sampel yang dipisahkan sejauh M buah sample. Semakin
N M
semakin baik perkiraan spektral LPC dari frame ke frame.
3. Melakukan windowing terhadap setiap frame yang telah dibentuk
untuk meminimalkan diskontinuitas pada ujung awal dan ujung akhir setiap frame dengan persamaan Hamming Window untuk
sampel ke-n adalah :
1 2
cos 46
. 54
. −
− =
N n
n W
π ,
1 −
≤ ≤
N n
2.6
4. Analisis autokorelasi terhadap setiap frame hasil windowing
1
n x
dengan persamaan :
1 −
− =
n as
n s
n s
∑
− −
=
+ =
1 1
1 1
1 n
n
m n
x n
x m
r
2.7
dengan
m
dimulai dari 0 dan nilai tertinggi dari
p m
=
adalah orde LPC yang biasa bernilai 8-16.
5. Mengubah
1 +
p
buah hasil autokorelasi pada masing-masing frame menjadi koefisien LPC
p m
m
a a
= untuk
p m
,..., 2
, 1
=
dengan persamaan dibawah ini : r
E =
2.8
, |
| {
1 1
∑
− −
− −
=
m m
m
E j
m r
m r
k
p m
≤ ≤
1 2.9
m m
m
k =
α
2.10 ,
1 1
− −
−
− =
m j
m m
m j
m j
k
α α
α
1 1
− ≤
≤ m
j 2.11
1 2
1
−
− =
m m
m
E k
E
2.12
dengan
r
adalah hasil autokorelasi,
m
E
adalah error,
m
k adalah koefisien pantulan,
m j
a
adalah koefisien prediksi untuk
m j
≤ ≤
1
.
6. Mengubah parameter LPC
m
a ke koefisien cepstral
m
c untuk mendapatkan kinerja yang lebih baik dan tahan terhadap noise,
yaitu dengan persamaan”
∑
− =
−
+ =
1 1
,
m k
k m
k m
m
a c
m k
a c
p m
≤ ≤
1 2.13
∑
− =
−
=
1 1
,
m k
k m
k m
a c
m k
c p
m 2.14
Koefisien cepstral ini adalah koefisien dari representasi pada spectrum logarithms.
2.4.2. Pemodelan Akustik