3. Jumlah kosakata
Semakin kecil sedikit jumlah kosakata yang diimplementasikan dalam sebuah ASR Automatic Speech Recognition maka semakin sedikit kata
yang harus dikenali oleh sistem, begitu juga sebaliknya berdasarkan jumlah katanya, sistem dapat dibagi menjadi dua macam yaitu sistem yang dapat
mengenali small vocabulary 20 kata dan large vocabulary 20000 kata.
4. Media dan Noise
Media dan noise merupakan parameter eksternal yang memengaruhi performa dari sistem pengenalan suara. Media yang digunakan biasanya
berupa head mounted microfones. Dengan mikrofon tersebut, distorsi dari sinyal suara dapat dihindari, sehingga diharapkan
kualitas suara yang dihasilkan juga baik. Selain itu kualitas sinyal suara juga dipengaruhi oleh noise. Jika terdapat noise misalnya bunyi selain
sinyal suara ketika proses perekaman, maka kualitas sinyal yang dihasilkan tidak akan baik. Jika keberadaan noise lebih dari 30 dB maka
suara memiliki low noise, sedangkan jika kurang dari 10 dB maka suara dikatakan high noise.
2.5 Pemrosesan Sinyal Suara
Sinyal suara merupakan gelombang yang tercipta dari tekanan udara yang berasal dari paru-paru yang berjalan melewati lintasan suara menuju mulut dan rongga hidung Al-
Akaidi, 2007. Pemrosesan suara itu sendiri merupakan teknik menransformasi sinyal suara menjadi informasi yang berarti sesuai dengan yang diinginkan Buono et al.
2009. Secara umum proses transformasi tersebut terdiri atas digitalisasi sinyal
analog, ekstraksi ciri dan diakhiri dengan pengenalan pola untuk klasifikasi, seperti yang terlihat pada gambar berikut:
Universitas Sumatera Utara
Gambar 2.3 Transformasi sinyal suara menjadi informasi Buono et al. 2009
Pengolahan sinyal analog menjadi sinyal digital dapat dilakukan melalui dua tahap yaitu sampling dan kuantisasi Jurafsky and Martin, 2000. Sampling adalah
suatu proses untuk membagi-bagi suatu sinyal kontinyu sinyal analog dalam interval waktu yang telah ditentukan. Sampling ini dilakukan dengan mengubah sinyal analog
menjadi sinyal digital dalam fungsi waktu. Pengubahan bentuk sinyal ini bertujuan untuk mempermudah memproses sinyal masukan yang berupa analog
karena sinyal analog memiliki kepekaan terhadap noise yang rendah, sehingga sulit untuk memproses sinyal tersebut.
Nilai dari hasil sampling tersebut dibulatkan ke nilai terdekat rounding, atau bisa juga dengan pemotongan bagian sisa truncating sehingga menghasilkan sinyal
suara digital dengan mengekspresikannya menggunakan sejumlah digit tertentu dan proses ini yang dikenal dengan kuantisasi.
Sinyal suara digital kemudian dilakukan proses pembacaan sinyal per frame dengan lebar frame tertentu yang saling tumpang tindih. Proses ini dikenal dengan
proses frame blocking. Barisan frame berisi informasi yang lengkap dari sebuah sinyal suara. Informasi yang terdapat dalam frame-frame tersebut direpresentasikan
dengan cara pengekstraksian ciri sehingga dihasilkan vektor-vektor yang nantinya digunakan dalam pengenalan pola.
Universitas Sumatera Utara
2.6 Ekstraksi ciri