Dalam operasi, HMM membuat transisi dari kondisi saat ini ke salah satu keadaan state yang terhubung setiap langkah waktu.
Kemungkinan membuat transisi stertentu dari state ke state diberikan oleh probabilitas transisi
{ }
ij
a . Masuk ke state, fitur vector
yang dihasilkan dengan menggunakan distribusi terkait dengan keadaan state yang masuk,
{ }
j
b
.
Bentuk proses menghasilkan asumsi bebas bersyarat standar untuk HMM:
• keadaan state yang bersyarat independen dari semua state-state lain mengingat keadaan sebelumnya
• pengamatan bersyarat independen dari semua pengamatan lainnya mengingat keadaan yang dihasilkan itu.
2.4.4. Model Bahasa
Model bahasa Language Model digunakan untuk membatasi proses pencarian pada pengenalan ucapan speech recognition, yaitu
menuntun pencarian urutan kata yang benar dengan memprediksi kemungkinan kata n menggunakan n-1 kata-kata sebelumnya.
Model bahasa dapat diklasifikasikan menjadi: 1.
Model seragam: setiap kata memiliki probabilitas yang sama terhadap kejadian.
2. Model stokastik: probabilitas terhadap kejadian dari sebuah kata
tergantung pada kata yang mendahuluinya. 3.
Bahasa state yang terbatas: bahasa menggunakan jaringan anegara yang terbatas untuk menentukan urutan kata yang
diperbolehkan. 4.
Konteks tata bahasa bebas: dapat digunakan untuk mengkodekan yang jenis kalimat diperbolehkan.
Model bahasa N-gram merupakan sebuah metode yang diaplikasikan untuk pembangkitan kata atau karakter. Probabilitas
sebelumnya dari urutan kata
k
W W
W ,...,
1
= diperoleh dari persamaan
berikut: 2.21
Untuk pengenalan kosakata yang besar, sejarah pendingin kata dalam biasanya dipotong ke N-1 kata-kata untuk membentuk
model bahasa N-gram
,..., ,
|
1 2
1 1
+ −
− −
=
∏
=
N i
i i
i K
i
W W
W W
P W
P
2.22 dimana N biasanya diantara 2-4. Model bahasa sering dinilai
dari segi kebingungan perplexity mereka, H, yang didefinisikan sebagai
,..., log
1
1 2
lim
K K
W W
P K
H
∞ →
− =
dimana perkiraan tersebut digunakan untuk model bahasa N- gram dengan urutan kata dengan panjang terbatas.
Probabilitas N-gram diperkirakan dari training teks dengan menghitung kejadian N-gram untuk membentuk maximum likelihood
ML estimasi parameter.
Sebuah pendekatan alternatif untuk estimasi model bahasa yang kuat adalah dengan menggunakan model berbasis kelas di
mana untuk setiap kata
k
W ada kelas yang sesuai
k
C . Maka,
,..., |
|
1 1
1 +
− −
=
∏
=
N k
k k
k k
K k
C C
C p
C W
P W
P
2.23 Gales dan Young, 2007
,..., ,
| log
1
1 1
2 1
2
∑
= +
− −
−
− ≈
K i
N i
i i
i
W W
W W
P K
,..., |
1 1
1
W W
W P
W P
k k
K k
− =
∏
=
2.4.5. Decoder
Decoder adalah peralatan yang digunakan untuk mendapatkan kembali sinyal analog yang telah dikodekan menjadi data digital.
Perlu diingat bahwa untuk dapat melakukan pembalikkan kode, persyaratan Nyquist harus dipenuhi pada saat melakukan pencacahan
sampling Mafisamin, 2014.
Decoder merupakan suatu tahapan yang paling penting dalam proses pengenalan ucapan speech recognition. Sebuah decoder
berfungsi untukmelakukan keputusan yang sebenarnya dengan menggabungkan pemodelan akustik acoustic modelling,
pemodelan pengucapan pronounciation modellingdan model bahasa language model untuk mencari semua urutan kata yang
mungkin dan akan menghasilkan output.
2.5. Hidden Markov Model HMM