Gambar 2.11 Contoh tiga tipe rantai HMM a Model 4-state b Model 4-state-kiri-kanan c Model parallel 6-state
2.7.1 Algoritma Training dengan Baum-Welch
Algortima Baum-Welch
atau algoritma
forward-backward merupakan salah satu algoritma yang dapat memberikan model terbaik
berupa means dan varians karena dapat mengoptimalkan probabilitas observasi sekuens O parameter-parameter model
λ = { A, B, π }. Perhitungan pada algoritma ini digunakan untuk mencari nilai maximum
likehood atau angka kemiripan maksimum yang merupakan sebuah model yang mewakili sekelompok sampel data.
Variabel forward didefinisikan sebagai observasi parsial dari probabilitas state sekuen yang dilambangkan dengan
O1, O2, …. Ot hingga waktu t dan state Si pada waktu t , dengan model
λ, dan α sebagai ti . Untuk variabel backward didefinisikan sebagai observasi parsial dari
probabilitas state sekuen dari t+1 ke state sebelumnya yang mana terdapat state Si pada waktu t, dengan model
λ dan α sebagai ti. Observasi dari probabilitas state sekuen ini dihitung dengan rumus:
� =
=1 �
�
=
=1 �
2.10 Probabilitas pada saat berada pada state Si pada waktu t , dan
diberikan sekuens observasi O , dan model λ adalah :
�
=
∝
� �
| �
2.11
a variabel forward
b variabel backward Gambar 2.12 Ilustrasi dari operasi Baum-Welch
Pada saat menghitung model yang akan akan digunakan maka akan membutuhkan banyak sampel data yang akan dimodelkan. Karakteristik
dari setiap contoh akan diekstrak dan disimpan dalam sebuah parameter vektor sekuens xt. Parameter ini yang akan dipetakan sebagai ekuivalensi
dari Ot. Metode Baum-Welch memiliki cara kerja sebagai berikut :
1. Estimasikan sebuah model HMM sebagai
λ = { A, B, π }
2. Dengan nilai
λ dari sekuens observasi O, hitung sebuah model baru � = , , �
Seperti � |�
3. Jika
� − � �
threshold, maka hentikan langkah ini. Jika tidak, maka letakkan nilai
� untuk menggantikan λ dan ulangi langkah 1.
2.7.2 Algoritma Testing dengan Viterbi
Algoritma Viterbi digunakan untuk menghitung sekuens state Q yang paling dekat dengan kemungkinan atau probabilitasnya dari sekuens
Observasi O. Algoritma Viterbi dapat didefinisikan sebagai: δ
t
i = max
q1,q2…q3
P[q
1
,q
2
,…q
t
= i, O
1
O
2….
O
t
| λ ] 2.12
δ
t
i merupakan nilai probabilitas terbaik pada waktu t, yang dihitung pada observasi t pertama yang diakhiri pada state S
i.
2.8 Metode Evaluasi 5-Fold Cross Validation
Metode 5-Fold Cross-Validation digunakan pada saat evaluasi untuk mengukur tingkat akurasi sebuah sistem. Metode 5-Fold Cross
Validation membagi tiap kelompok data suara menjadi data yang kemudian akan menjadi data untuk proses training dan testing
Dalam penelitian ini, terdapat 4 lima kelompok data yang mana masing-masing kelompok mewakili setiap orang yang akan diambil
suaranya. Setiap kelompok memiliki data sebanyak 50 yang kemudian dibagi menjadi 5 lima kelompok. Pada metode 5-Fold Cross Validation ,