Frame Blocking Windowing Mel-Frequency Cepstral Coefficients MFCC

Apabila dilihat dari rumusan diatas, dapat dilihat bahwa X n merupakan angka yang kompleks. Hasil dari X n dapat dijabarkan sebagai berikut: 1. Ketika n = 0 merupakan keadaaan frekuensi saat kosong. 2. Ketika 1 ≤ n ≤ N2 – 1 merupakan keadaan saat frekuensi bernilai positif 0 f F s 2. 3. Ketika N 2+1 ≤ n ≤ N-1 merupakan keadaaan saat frekuensi bernilai negatif F s 2 f 0. F s sendiri merupakan frekuensi sample. Hasil yang diperoleh berupa spektrum sinyal atau periodogram.

2.5.4 Mel-Frequency Wrapping

Sinyal suara terdiri dari nada-nada yang memiliki frekuensi yang berbeda. Setiap nada dengan frekuensi yang sebenarnya, f, diukur dalam Hz. Nada yang subyektif diukur dengan menggunakan skala Mel. Sebagai acuan, nada dengan frekuensi 1kHz, 40dB diatas dari threshold pendengaran, didefinisikan sebagai 1000 mels. Rumus yang digunakan untuk menghitung mels dengan frekuensi dalam Hz adalah sebagai berikut: melf= 2595log101 + f700 2-5 Salah satu pendekatan untuk menggambarkan spektrum yang subyektif adalah dengan menggunakan filter. Setiap filter ditujukan untuk komponen mel-frequency yang diinginkan. Filter yang dibentuk memiliki jarak pusat filter adalah konstan pada ruang frekuensi mel. Skala mel dibentuk untuk mengikuti persepsi sistem pendengaran manusia yang bersifat linear untuk frekuensi rendah dan bersifat logaritmik untuk frekuensi tinggi, dengan batas pada nilai frekuensi akustik sebesar 1000Hz. Hubungan skala mel dan frekuensi dapat digambarkan pada Gambar 2.8. Gambar 2.9 Grafik hubungan skala mel dengan frekuensi IPB Gambar 2.10 Contoh mel-spaced Filter bank IPB Dari M filter yang telah terbentuk, maka dilakukan wrapping terhadap sinyal domain frekuensi dan menghasilkan satu komponen untuk setiap filter dengan menggunakan rumus Buono, 2009 : � = log 10 � � −1 =0 2-6 Dengan i = 1,2,3….M dan H i k adalah nilai filter segitiga ke-i untuk frekuensi akustik sebesar k. Hasil dalam spektrum mel ini kemudian akan dipilih cepstrum coefficients, nilai koefisien diperoleh dengan menggunakan transformasi cosinus. Rumus yang digunakan adalah : = � cos − 1 2 � =1 2-7 Dengan j = 1,2,3…K yang merupakan jumlah cepstrum coefficients dan M merupakan jumlah filter.

2.5.5 Cepstrum

Pada langkah terakhir, logaritma dari spektrum mel harus dikonversikan kembali ke domain waktu. Hasil yang didapatkan bernama mel-frequency cepstrum coefficients MFCCs Hasan, Jamil, Rabbani dan Rahman, 2004. Karena koefisien dari mel merupakan bilangan nyata, dapat juga dikonversikan ke dalam domain berbasis waktu menggunakan Discrete Cosine Transform DCT. MFCC sendiri dapat dihitung dengan rumus sebagai berikut : = �� − 1 2 � −1 2-8 dimana n = 1,2,…. K Komponen pertama, C , tidak termasuk DCT karena merepresentasikan nilai rata-rata sinyal yang membawa sedikit informasi speaker yang spesifik. Dengan menerapkan prosedur yang telah dijelaskan, untuk setiap frame sekitar 30 ms dengan overlap, koefisien- koefisien dari mel cepstrum dapat dihitung.

2.6 Metode Hidden Markov Models HMM

Hidden Markov Models merupakan sebuah pemodelan statistik dari sebuah sistem yang diasumsikan sebagai ‘Rantai Markov‘ dengan parameter yang tidak diketahui, dan tantangannya adalah menemukan parameter yang tersembunyi hidden dari parameter yang diketahui observer Przytycka, 2000. Parameter yang telah digunakan kemudian dapat digunakan untuk analisa yang lebih jauh, misalnya untuk Speaker Recognition. HMM disebut statistik karena mencari means, varians, dan probabilitas dari model yang digunakan. Dalam jurnal yang berjudul “ Hidden Markov Models For Speech Recognition “ yang ditulis oleh B. H. Juang dan L. R. Rabiner disebutkan bahwa metode HMM sangat populer dikarenakan memiliki kerangka statistik yang tidak dapat dipisahkan atau dapat dikatakan tepat secara