25
2.2.2 Kinerja Sistem Pengenalan Suara
Sistem pengenalan suara, tergantung pada beberapa faktor, dapat memiliki rentang kinerja yang diukur dari rata-rata eror kalimat. Faktor-faktor
ini termasuk lingkungan, rata-rata berbicara, konteks atau tata bahasa yang digunakan dalam pengenalan.
Kebanyakan pengguna pengenalan suara cenderung setuju bahawa mesin perintah dapat mencapai kinerja yang tinggi pada kondisi terkontrol.
Bagian yang membingungkan terutama datang dari campuran penggunaan istilah pengenalan suara dan pendiktean.
Terdapat 4 langkah utama dalam sistem pengenalan suara : 1.
Penerimaan data input 2. Ekstraksi, yaitu penyimpanaan data masukaan sekaligus pembuatan
database untuk template. 3. Pembandingan pencocokan, yaitu tahap pencocokan data baru dengan data
suara pencocokan tata bahasa pada template. 4. Validasi identitas pengguna.
2.2.3 Proses perubahan dari suara ke data
Untuk menukar atau mengubah ucapan kepada data text dalam komputer atau perintah komputer, sebuah komputer harus melewati langkah
yang rumit.
26
Saat kita berbicara, kita menciptakan sebuah getaran diudara. Pengubahan sinyal analog kepada digital analog to digital converter ADC.
Menerjemahkan getaran analog ini kepada data digital yang bisa dimengerti oleh komputer. Untuk melakukan ini, komputer mencontohkan atau
menggambarkan suara tersebut dengan cara mengambil pengukuran tepat pada getaran yang ada di frekuensi interval.
System ini menyaring suara yang digambarkan untuk menghilangkan suara-suara yang tidak diinginkan, dan terkadang juga memisahkannya kepada
jalur gelombang frekuensi yang berbeda. frekuensi adalah jarak gelombang dari getaran suara yang didengar oleh manusia sebagai perbedaan tinggi atau
rendahnya suara. Frekuensi juga menormalkan atau menetralkan suara, atau menyesuaikannya kepada level volume yang tetap. Frekuensi mungkin juga
harus disusun atau disejajarkan sementara. Orang-orang tidak selalu berbicara pada kecepatan yang sama, jadi suara harus harus disesuaikan untuk
mencocokan kecepatan. Contoh suara yang telah disimpan didalam memory system selanjutnya sinyal tersebut dibagikan atau dipisahkan kedalam segmen
atau juga ribuan dalam perkata plogine consonant sound konsonan berhenti memproduksi dengan menghalangi aliran udara didalam saluran vocal, seperti
âPâ atau âTâ. setelah itu program akan mencocokan segmen tersebut untuk mengetahui phonemes didalam bahasa yang layak. Phonemes adalah element
terkecil dalam sebuah bahasa gambaran atau perwakilan dari suara yang kita keluarkan dan menyatukannya untuk membentuk ekspresi yang bermakna.
27
Didalam bahasa inggris ada kira-kira 40 phonemes. ahli bahasa yang berbeda mempunyai opini yang berbeda tentang jumlah tepatnya, sedangkan bahasa
lainnya mempunyai phonemes kurang ataupun lebih dari itu.
2.2.4 Bagaimana program pengenalan suara bekerja