Model Bahasa Decoder Tahapan-tahapan dalam pengenalan ucapan speech recognition

Dalam operasi, HMM membuat transisi dari kondisi saat ini ke salah satu keadaan state yang terhubung setiap langkah waktu. Kemungkinan membuat transisi stertentu dari state ke state diberikan oleh probabilitas transisi { } ij a . Masuk ke state, fitur vector yang dihasilkan dengan menggunakan distribusi terkait dengan keadaan state yang masuk, { } j b . Bentuk proses menghasilkan asumsi bebas bersyarat standar untuk HMM: • keadaan state yang bersyarat independen dari semua state-state lain mengingat keadaan sebelumnya • pengamatan bersyarat independen dari semua pengamatan lainnya mengingat keadaan yang dihasilkan itu.

2.4.4. Model Bahasa

Model bahasa Language Model digunakan untuk membatasi proses pencarian pada pengenalan ucapan speech recognition, yaitu menuntun pencarian urutan kata yang benar dengan memprediksi kemungkinan kata n menggunakan n-1 kata-kata sebelumnya. Model bahasa dapat diklasifikasikan menjadi: 1. Model seragam: setiap kata memiliki probabilitas yang sama terhadap kejadian. 2. Model stokastik: probabilitas terhadap kejadian dari sebuah kata tergantung pada kata yang mendahuluinya. 3. Bahasa state yang terbatas: bahasa menggunakan jaringan anegara yang terbatas untuk menentukan urutan kata yang diperbolehkan. 4. Konteks tata bahasa bebas: dapat digunakan untuk mengkodekan yang jenis kalimat diperbolehkan. Model bahasa N-gram merupakan sebuah metode yang diaplikasikan untuk pembangkitan kata atau karakter. Probabilitas sebelumnya dari urutan kata k W W W ,..., 1 = diperoleh dari persamaan berikut: 2.21 Untuk pengenalan kosakata yang besar, sejarah pendingin kata dalam biasanya dipotong ke N-1 kata-kata untuk membentuk model bahasa N-gram ,..., , | 1 2 1 1 + − − − = ∏ = N i i i i K i W W W W P W P 2.22 dimana N biasanya diantara 2-4. Model bahasa sering dinilai dari segi kebingungan perplexity mereka, H, yang didefinisikan sebagai ,..., log 1 1 2 lim K K W W P K H ∞ → − = dimana perkiraan tersebut digunakan untuk model bahasa N- gram dengan urutan kata dengan panjang terbatas. Probabilitas N-gram diperkirakan dari training teks dengan menghitung kejadian N-gram untuk membentuk maximum likelihood ML estimasi parameter. Sebuah pendekatan alternatif untuk estimasi model bahasa yang kuat adalah dengan menggunakan model berbasis kelas di mana untuk setiap kata k W ada kelas yang sesuai k C . Maka, ,..., | | 1 1 1 + − − = ∏ = N k k k k k K k C C C p C W P W P 2.23 Gales dan Young, 2007 ,..., , | log 1 1 1 2 1 2 ∑ = + − − − − ≈ K i N i i i i W W W W P K ,..., | 1 1 1 W W W P W P k k K k − = ∏ =

2.4.5. Decoder

Decoder adalah peralatan yang digunakan untuk mendapatkan kembali sinyal analog yang telah dikodekan menjadi data digital. Perlu diingat bahwa untuk dapat melakukan pembalikkan kode, persyaratan Nyquist harus dipenuhi pada saat melakukan pencacahan sampling Mafisamin, 2014. Decoder merupakan suatu tahapan yang paling penting dalam proses pengenalan ucapan speech recognition. Sebuah decoder berfungsi untukmelakukan keputusan yang sebenarnya dengan menggabungkan pemodelan akustik acoustic modelling, pemodelan pengucapan pronounciation modellingdan model bahasa language model untuk mencari semua urutan kata yang mungkin dan akan menghasilkan output.

2.5. Hidden Markov Model HMM