Kinerja Sistem Pengenalan Suara Proses perubahan dari suara ke data

25

2.2.2 Kinerja Sistem Pengenalan Suara

Sistem pengenalan suara, tergantung pada beberapa faktor, dapat memiliki rentang kinerja yang diukur dari rata-rata eror kalimat. Faktor-faktor ini termasuk lingkungan, rata-rata berbicara, konteks atau tata bahasa yang digunakan dalam pengenalan. Kebanyakan pengguna pengenalan suara cenderung setuju bahawa mesin perintah dapat mencapai kinerja yang tinggi pada kondisi terkontrol. Bagian yang membingungkan terutama datang dari campuran penggunaan istilah pengenalan suara dan pendiktean. Terdapat 4 langkah utama dalam sistem pengenalan suara : 1. Penerimaan data input 2. Ekstraksi, yaitu penyimpanaan data masukaan sekaligus pembuatan database untuk template. 3. Pembandingan pencocokan, yaitu tahap pencocokan data baru dengan data suara pencocokan tata bahasa pada template. 4. Validasi identitas pengguna.

2.2.3 Proses perubahan dari suara ke data

Untuk menukar atau mengubah ucapan kepada data text dalam komputer atau perintah komputer, sebuah komputer harus melewati langkah yang rumit. 26 Saat kita berbicara, kita menciptakan sebuah getaran diudara. Pengubahan sinyal analog kepada digital analog to digital converter ADC. Menerjemahkan getaran analog ini kepada data digital yang bisa dimengerti oleh komputer. Untuk melakukan ini, komputer mencontohkan atau menggambarkan suara tersebut dengan cara mengambil pengukuran tepat pada getaran yang ada di frekuensi interval. System ini menyaring suara yang digambarkan untuk menghilangkan suara-suara yang tidak diinginkan, dan terkadang juga memisahkannya kepada jalur gelombang frekuensi yang berbeda. frekuensi adalah jarak gelombang dari getaran suara yang didengar oleh manusia sebagai perbedaan tinggi atau rendahnya suara. Frekuensi juga menormalkan atau menetralkan suara, atau menyesuaikannya kepada level volume yang tetap. Frekuensi mungkin juga harus disusun atau disejajarkan sementara. Orang-orang tidak selalu berbicara pada kecepatan yang sama, jadi suara harus harus disesuaikan untuk mencocokan kecepatan. Contoh suara yang telah disimpan didalam memory system selanjutnya sinyal tersebut dibagikan atau dipisahkan kedalam segmen atau juga ribuan dalam perkata plogine consonant sound konsonan berhenti memproduksi dengan menghalangi aliran udara didalam saluran vocal, seperti “P” atau “T”. setelah itu program akan mencocokan segmen tersebut untuk mengetahui phonemes didalam bahasa yang layak. Phonemes adalah element terkecil dalam sebuah bahasa gambaran atau perwakilan dari suara yang kita keluarkan dan menyatukannya untuk membentuk ekspresi yang bermakna. 27 Didalam bahasa inggris ada kira-kira 40 phonemes. ahli bahasa yang berbeda mempunyai opini yang berbeda tentang jumlah tepatnya, sedangkan bahasa lainnya mempunyai phonemes kurang ataupun lebih dari itu.

2.2.4 Bagaimana program pengenalan suara bekerja