Parameter-parameter yang ditentukan kemudian dapat digunakan untuk analisis yang lebih jauh, misalnya untuk aplikasi pattern
recognitionMonika, 2012.
Berdasarkan uraian tersebut, penulis memilih judul “Penerapan Hidden Markov Model untuk Pengenalan Ucapan.“
1.2. Rumusan Masalah
Masalah dalam penelitian ini adalah sebagai berikut: 1.
Bagaimana tahapan-tahapan dalam merancang sistem pengenalan ucapan speech recognition.
2. Bagaimana mencocokan perintah suara yang dibuat agar komputer dapat
mengenali dan memahami kata-kata yang diucapkan. 3.
Bagaimana melakukan uji coba dan analisis terhadap parameter- parameter yang berpengaruh terhadap pengenalan ucapan speech
recognition.
1.3. Batasan Masalah
Batasan-batasan masalah dalam penelitian ini adalah sebagai berikut: 1.
Perintah suara yang dibuat dalam penelitian ini hanya mampu mengenali kata yang diucapkan melalui hardware yaitu mikrophone dengan bantuan
soundcard yang terdapat pada komputer.
2. Pengucapan bunyi lafal dilakukan oleh orang yang tidak mengalami
cacat artikulasi orang normal.
3. Kata yang diucapkan dalam penelitian ini adalah “open notepad” untuk
membuka aplikasi komputer 4.
Menggunakan perangkat lunak softwareMicrosoft Speech Application Programming Interface.
1.4. Tinjauan Pustaka
Hidden Markov Model HMM adalah suatu model statistik dari sebuah sistem yang diasumsikan sebuah proses Markov dengan parameter yang
tidak diketahui. Kita harus menentukan parameter-parameter tersembunyi state dari parameter-parameter yang dapat diamati. Parameter-parameter
yang ditentukan kemudian dapat digunakan untuk analisis yang lebih jauh, misalnya untuk aplikasi pattern recognition Monika, 2012.
HMM pada dasarnya perluasan dari rantai Markov yang merupakan model stokastik. Biasanya dalam model Markov setiap keadaan state dapat
terlihat langsung oleh pengamatan, sehingga kemungkinan transisi antara keadaan menjadi satu-satunya parameter yang teramati.
Rabiner 1989 mengemukakan bahwa transisi pada Rantai Markov yaitu:
a. Transisi dari suatu keadaan tergantung pada keadaan sebelumnya.
1.1 b.
Transisi keadaan bebas terhadap waktu. 1.2
Berikut ini adalah contoh gambar dari rantai Markov.
Gambar 1.1. Rantai Markov Sumber: Monika, 2012
13
a
31
a
12
a
21
a
32
a
23
a
33
a
22
a
11
a
1
2 3
] |
[ ......]
| |
[
1 2
1 i
t j
t k
t i
t j
t
S q
S q
P S
q S
q S
q P
= =
= =
= =
− −
−
] |
[
1
i q
S q
P a
t j
t ij
= =
=
−
Hidden Markov ModelHMM terdiri dari keadaan state, peluang transisi state probabilities, peluang emisi emission probabilities, dan
peluang awalinitial probabilities.
HMM didefinisikan sebagai berikut: 1.
N, jumlah state dalam model yang didefinisikan oleh
{ }
N
S S
S ,...,
1
= 2.
M, jumlah simbol pengamatan yang berbeda tiap state, misalnya ukuran alfabet diskrit didefinisikan oleh
{ }
M
v v
V ,...,
1
=
. Jika pengamatankontinu maka M adalah tak terbatas.
3. Distribusi peluang keadaan transisi
{ }
ij
a A
=
, dimana
ij
a
adalah distribusi yang state pada waktu
1 +
t adalah
j
S
, diberikan ketika keadaan pada waktu t adalah
i
S . Struktur matriks stokastik ini mendefinisikan hubungan struktur model.
[ ]
, |
1 i
t j
t ij
S q
S q
p a
= =
=
+
, 1 i
≤
N j
≤
1.3 4.
Distribusi peluang simbol pengamatan pada masing-masing state j ,
{ }
k b
B
j
= dimana
k b
j
adalah peluang yang simbol
k
V diemisi dalam keadaan
j
S
.
[ ]
, |
j t
k t
j
S q
V O
p k
b =
= =
, 1
N j
≤ ≤
M k
≤ ≤
1 1.4
jika pengamatankontinu, maka kita harus menggunakan fungsi kepadatan peluang kontinu.
5. Distribusi keadaan awal
{ }
i
π π
= dimana
i
π
adalah peluang bahwa model tersebut berada dalam keadaan
i
S pada waktu =
t didefinisikan oleh
{ }
,
1
i q
p
i
= =
π N
i ≤
≤ 1
1.5
Hidden Markov Model HMM dapat dituliskan sebagai
, ,
π λ
B A
=
. Dengan diketahuinya parameter-parameter
, ,
, ,
B A
M N
dan
π
Dymarski, 2011.
Sistem pengenalan ucapan speech recognition terdiri dari 5 blok, yaitu: ekstraksi fitur feature extraction, pemodelan akustik
acoustic modelling, pemodelan pengucapan pronounciation modelling, model bahasa language model, dan decoder.
Blok diagram untuk sistem pengenalan ucapan adalah sebagai berikut:
Gambar 1.2. Blok diagram untuk sistem pengenalan ucapan Sumber : Gales dan Young, 2007
Pengenalan ucapan juga dikenal sebagai Automatic Speech Recognition ASR. ASR merupakan pengenalan ucapan komputer yang
berarti suara pemahaman komputer dan melakukan setiap tugas yang diperlukan atau kemampuan untuk mencocokkan suara terhadap kosakata
yang tersedia atau diperoleh.
Dalam sistem pengenalan ucapan automatis automatic speech recognitionberbasis statistik, ucapan diwakili oleh beberapa urutan
pengamatan fitur akustik O , berasal dari urutan kata-kata W . Gelombang input audio dari sebuah mikrophone dikonversikan menjadi sebuah urutan
vektor akustik
T T
O O
O ,...,
1 :
1
= dalam proses yang disebut ekstraksi fitur
fitur extraction. Decoder kemudian berusaha untuk menemukan urutan kata-kata
L L
W W
W ,...,
1 :
1
= .
Sinyal akustik dirumuskan oleh: 1.6
} |
{ max
arg O
W P
W
w
=
Language Model
Feature Extraction
Decoder
Acoustic Modelling
Pronounciation Modelling
Speech Feature
Vectors ...
O W
“Stop that.” Words
Akan tetapi, karena |
O W
P sulit untuk dimodelkan secara
langsung, maka dapat menggunakan aturan Baye Baye’s Rule dapat ditulis sebagai berikut:
1.7
Dalam persamaan 1.7,
| W
O P
adalah probabilitas pengamatan dan dievaluasi berdasarkan pemodelan akustik acoustic
modellingsedangkan W
P ditentukan oleh model bahasa languange
model dan diperoleh dari Hidden Markov ModelHMM. Di antara berbagai model, HMM sejauh ini merupakan teknik yang paling banyak
digunakan karena yang algoritma yang efisien untuk pengenalan ucapan speech recognitionSaini dan Kaur, 2013.
1.5. Tujuan Penelitian