Analisis Pengumpulan Material Tombol-tombol yang akan tersedia dalam simulasi Listening
Dalam pemrosesannya untuk dapat mengkonversi suara ke dalam bentuk teks terdapat beberapa tahapan, diantaranya:
1. Suara pengguna berupa sinyal analog dikonversi oleh perangkat komputer kedalam bentuk diskrit yang kemudian di ubah kedalam
bentuk biner dan secara realtime dikirim ke server untuk dilakukan proses konversi.
2. Setelah pengguna berhenti berbicara stop recording or end detect server menerima seluruh data percakapan dalam bentuk digitalbiner,
kemudian server akan melakukan proses konversi. 3. Setelah proses konversi selesai, server akan mengirim hasil konversi
berupa teks string ke device.
Penjelasan : 1. Proses input suara recording melalui microphone ke dalam device
2. Selanjutnya device akan menerima inputan suara tersebut dan memprosesnya ke dalam sistem
3. Sistem akan memproses aliran suara stream audio tersebut dan mengirimkannya ke server iSpeech untuk diproses lebih lanjut.
4. iSpeech akan mulai memproses aliran suara tersebut, semua proses recognize terjadi di server iSpeech.
5. Pada level application ada komponen utama yang tersedia untuk developer yaitu recognizer.
6. Pada level speech kit ada beberapa proses yang terkoordinasi, yaitu: a.
Library sepenuhnya mengelola sistem audio untuk recording. b.
Komponen networking mengelola koneksi ke server. c.
End detection menentukan bila pengguna telah berhenti berbicara dan secara otomatis menghentikan rekaman.
7. Sistem server bertanggung jawab untuk sebagian besar pekerjaan dalam siklus pemrosesan suara speech processing. Proses pengenalan ucapan
recognition dilakukan pada server. 8. Lalu setelah proses pengenalan ucapan selesai diproses server akan
mengirimkan response kepada sistem yang akan berupa hasil result jika proses berhasil. Tetapi jika gagal server akan mengirimkan notifikasi rerrors
yang berarti proses recognize atau pengenalan suara gagal.