Apabila dilihat dari rumusan diatas, dapat dilihat bahwa X
n
merupakan angka yang kompleks. Hasil dari X
n
dapat dijabarkan sebagai berikut:
1. Ketika n = 0 merupakan keadaaan frekuensi saat kosong.
2. Ketika 1 ≤ n ≤ N2 – 1 merupakan keadaan saat frekuensi bernilai
positif 0 f F
s
2. 3.
Ketika N 2+1 ≤ n ≤ N-1 merupakan keadaaan saat frekuensi bernilai
negatif F
s
2 f 0. F
s
sendiri merupakan frekuensi sample. Hasil yang diperoleh berupa spektrum sinyal atau periodogram.
2.5.4 Mel-Frequency Wrapping
Sinyal suara terdiri dari nada-nada yang memiliki frekuensi yang berbeda. Setiap nada dengan frekuensi yang sebenarnya, f, diukur dalam
Hz. Nada yang subyektif diukur dengan menggunakan skala Mel. Sebagai acuan, nada dengan frekuensi 1kHz, 40dB diatas dari threshold
pendengaran, didefinisikan sebagai 1000 mels. Rumus yang digunakan untuk menghitung mels dengan frekuensi dalam Hz adalah sebagai
berikut: melf= 2595log101 + f700
2-5
Salah satu pendekatan untuk menggambarkan spektrum yang subyektif adalah dengan menggunakan filter. Setiap filter ditujukan untuk
komponen mel-frequency yang diinginkan. Filter yang dibentuk memiliki jarak pusat filter adalah konstan pada ruang frekuensi mel. Skala mel
dibentuk untuk mengikuti persepsi sistem pendengaran manusia yang bersifat linear untuk frekuensi rendah dan bersifat logaritmik untuk
frekuensi tinggi, dengan batas pada nilai frekuensi akustik sebesar 1000Hz. Hubungan skala mel dan frekuensi dapat digambarkan pada
Gambar 2.8.
Gambar 2.9 Grafik hubungan skala mel dengan frekuensi IPB
Gambar 2.10 Contoh mel-spaced Filter bank IPB
Dari M filter yang telah terbentuk, maka dilakukan wrapping terhadap sinyal domain frekuensi dan menghasilkan satu komponen untuk
setiap filter dengan menggunakan rumus Buono, 2009 : � = log
10
� �
−1 =0
2-6 Dengan i
= 1,2,3….M dan H
i
k adalah nilai filter segitiga ke-i untuk frekuensi akustik sebesar k. Hasil dalam spektrum mel ini kemudian
akan dipilih cepstrum coefficients, nilai koefisien diperoleh dengan menggunakan transformasi cosinus. Rumus yang digunakan adalah :
= � cos − 1 2
� =1
2-7
Dengan j = 1,2,3…K yang merupakan jumlah cepstrum coefficients
dan M merupakan jumlah filter.
2.5.5 Cepstrum
Pada langkah terakhir, logaritma dari spektrum mel harus dikonversikan kembali ke domain waktu. Hasil yang didapatkan bernama
mel-frequency cepstrum coefficients MFCCs Hasan, Jamil, Rabbani dan Rahman, 2004. Karena koefisien dari mel merupakan bilangan nyata,
dapat juga dikonversikan ke dalam domain berbasis waktu menggunakan Discrete Cosine Transform DCT.
MFCC sendiri dapat dihitung dengan rumus sebagai berikut :
= �� −
1 2
� −1
2-8
dimana n = 1,2,…. K
Komponen pertama, C , tidak termasuk DCT karena
merepresentasikan nilai rata-rata sinyal yang membawa sedikit informasi speaker yang spesifik. Dengan menerapkan prosedur yang telah
dijelaskan, untuk setiap frame sekitar 30 ms dengan overlap, koefisien- koefisien dari mel cepstrum dapat dihitung.
2.6 Metode Hidden Markov Models HMM
Hidden Markov Models merupakan sebuah pemodelan statistik dari sebuah sistem yang diasumsikan sebagai ‘Rantai Markov‘ dengan
parameter yang tidak diketahui, dan tantangannya adalah menemukan parameter yang tersembunyi hidden dari parameter yang diketahui
observer Przytycka, 2000. Parameter yang telah digunakan kemudian dapat digunakan untuk analisa yang lebih jauh, misalnya untuk Speaker
Recognition. HMM disebut statistik karena mencari means, varians, dan probabilitas dari model yang digunakan.
Dalam jurnal yang berjudul “ Hidden Markov Models For Speech Recognition
“ yang ditulis oleh B. H. Juang dan L. R. Rabiner disebutkan bahwa metode HMM sangat populer dikarenakan memiliki kerangka
statistik yang tidak dapat dipisahkan atau dapat dikatakan tepat secara