artikulator pasif adalah alat ucap yang diam tidak aktif bergerak, yaitu bibir atas, gigi atas, gusi, langit - langit keras, dan langit - langit lunak, yang berfungsi sebagai daerah
artikulasi yaitu lokasi tempat artikulator aktif menghambat atau menutup udara. Suara manusia biasanya memiliki rentang frekuensi 300-3000 Hz. Ada 4 proses produksi suara
pada manusia yaitu proses oronasal, proses artikulasi, proses aliran udara dan proses pembunyian. Gambar 2.2 adalah gambar tempat produksi suara[4].
Gambar 2.2. Gambar Tempat Produksi Suara. [4]
2.2. Speech Recognition
Speech recognition pengenalan lafalucapan adalah suatu proses untuk mengenali
seseorang dengan mengenali ucapan dari orang tersebut [1]. Untuk mengenali ucapan atau lafal tersebut akan diproses didalam komputer dengan perhitungan perhitungan algoritma .
Ucapan manusia yang masuk kedalam komputer akan dikenal dengan membandingan masukan ucapan dengan database sehingga mendapatkan hasil untuk mengenali ucapan
tersebut.
2.3. Sampling
Sampling adalah proses pengambilan sebuah sinyal terhadap waktu tertentu. Dalam
proses sampling, sinyal suara yang diambil akan menjadi gelombang diskrit. Pada saat proses sampling , nilai frekuensi sampling harus diperhatikan. Frekuensi sampling
merupakan laju pengambilan yang menandakan banyak pengambilan sinyal analog dalam satu detik. Nilai satuan frekuensi sampling yakni Hertz Hz. Harry Nyquist dari Bell
Laboratory mempelajari proses sampling dan membuat kriteria untuk menentukan laju
sampling sampling rate minimun untuk sinyal analog kontinyu. Nilai frekuensi sampling
sebaiknya tertuju pada kriteria Nyquist[5]. Saat ini laju sampling minimum dikenal sebagai Nyquist sampling rate yang menyatakan bawah frekuensi sampling minimal harus
dua kali lebih besar dari frekuensi tertinggi dari sinyal yang disampling tersebut. Rumus pada kriteia Nyquist dapat dituliskan [6].
2.1 Keterangan :
F
s
= frekuensi sampling Hz F
m
= frekuensi sinyal analog Hz Pada proses sampling kriteria Nyquist apabila tidak terpenuhi akan
menimbulkan aliasing. Aliasing merupakan adanya frekuensi yang terlihat sebagai frekuensi lain. Gambar 2.3 menunjukan gambar aliasing.
Gambar 2.3 Gambar Aliasing [6]
2.4. Preprocessing
Prepocessing merupakan tahapan awal untuk mengkondisikan sinyal sebelum
diproses dalam ektraksi ciri. Preprocessing dilakukan untuk membuang noise pada sinyal ucapan. Dalam preprocessing ada beberapa tahapan meliputi normalisasi, pemotongan
sinyal, dan zero padding.
2.4.1. Pre Emphasis
Pre Emphasis adalah proses yang dirancang untuk mengurangi dampak buruk dari
transmisi dan suara latar. Proses pre emphasis sangat baik dalam mengurangi efek distorsi, atenuasi, dan saturasi dari media rekaman. Perhitungan pre emphasis dilakukan pada
sinyal digital dalam domain waktu dan menggunakan persamaan berikut[7] :
1
n s
n s
n s
2.2 Dimana
= 0.9 1 biasanya yang sering digunakan bernilai 0,95 Sn
= sampel ke-n Pada gambar 2.4. menunjukan sinyal masukan yang akan diproses dalam pre emphasis
dan gambar 2.5. menunjukan sinyal masukan yang sudah melewati proses pre emphasis