keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama bekerja terus menerus selama beberapa waktu tertentu Junaedih. 2007.
2.3.2.3. Pencocokan Kata Pencocokan kata adalah proses untuk mencocokkan kata ucapan yang berhasil
diidentifikasi dengan basis data yang dipunyai oleh sistem. 2.3.2.4. Pembendaharaan Kata
Perbendaharaan kata ialah bagian terakhir dalam sebuah sistem pengenalan pembicaraan. Jika perbendaharaan kata berjumlah banyak, maka sebuah sistem akan
mudah dalam melakukan pencocokan kata, tetapi dengan makin meningkatnya jumlah perbendaharaan kata, maka jumlah kata yang mempunyai ucapan hampir sama juga
meningkat, dimana hal ini menurunkan keakuratan pengenalan. Dan sebaliknya, jika sebuah sistem mempunyai perbendaharaan kata sedikit,
maka keakuratan pengenalan akan tinggi karena sedikitnya kata yang hampir sama, tetapi akan semakin banyak kata yang tidak terkenali.
2.4 Speech Application Programming Interface SAPI
Speech recognition bukanlah hal baru untuk dunia penelitian teknologi. Penelitian –
penelitian mengenai speech recognition telah banyak dilakukan dan salah satu diantaranya yang cukup dikenal adalah penelitian yang dilakukan oleh Microsoft
Corporation. Microsoft telah mengembangkan sistem speech recognition yang dapat digunakan pada sistem operasi Windows. Sistem tersebut memiliki perkembangan
termasuk standard interface SAPI Speech Application Programming Interface yang memungkinkan
pembuat aplikasi
menerapkan sistem
speech recognition
menggunakan engine yang berbeda tanpa merubah aplikasi yang dibuat. Sekarang banyak aplikasi yang dikembangkan menggunakan speech
recognition, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat High-performance fighter aircraft, Training air traffic controllers, sampai pada alat
yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan, maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi
pengucapan user Sunny, A.S. 2009.
Universitas Sumatera Utara
2.4.1 Komponen Speech Application Programming Interface SAPI Selain mengenali ucapan, SAPI juga memiliki fungsi untuk mengenali ucapan dan
mengubahnya menjadi teks. Hal tersebut dapat terjadi karena di dalam SAPI sendiri terdapat komponen
– komponen yang memang memiliki fungsi – fungsi khusus untuk pengembangan sistem speech recognition, diantaranya :
a. Voice Command
Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan pengenalan suara.
b. Voice Dictation
Sebuah obyek level tinggi untuk continous dictation speech recognition. c.
Voice Talk Sebuah obyek level tinggi untuk speech synthesis.
d. Voice Telephony
Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara. e.
Direct Speech Recognition Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara direct
control of recognition engine f.
Direct Text to Speech Sebuah obyek sebagai mesin yang mengontrol synthesis.
g. Audio Object
Untuk membaca dari audio device atau sebuah file audio.
2.4.2 Antar muka Speech Application Programming Interface SAPI SAPI 5.1 terdiri dari 2 antar muka yaitu application programming interface API dan
device driver interface DDI Nurcahyono, D., Kristalina, P. Huda, M., 2011.
a. Application Programming Interface API
Windows Application Programming Interface API adalah sekumpulan fungsi dan konstanta yang terdapat dalam file-file Dynamic Link Library DLL yang
menyusun Sistem Operasi Windows Supriyono, B., 2004. Pada sistem
Universitas Sumatera Utara
pengenalan pembicaraan, aplikasi akan menerima event pada saat suara yang diterima telah dikenali oleh engine. Arsitektur SAPI sendiri dapat kita lihat
pada blog diagram seperti yang terlihat pada gambar 2.1 Supriyono, B., 2004.
Gambar 2.1 Blok Diagram Arsitektur SAPI
Dalam API terdapat fungsi-fungsi perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah
dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut kemudian akan memanggil system calls sesuai dengan sistem operasinya Sianturi,
A.H., 2014.
b. Device Driver Interface DDI
DDI menyediakan fungsi untuk menerima data suara dari SAPI dan mengembalikan pengenalan frasa pada level SAPI paling dasar. Terdapat dua
antar muka yang digunakan oleh DDI yaitu ISpSREngine, yang diimplementasikan oleh engine dan ISpSREngineSite yang diimplementasikan
oleh SAPI Nurcahyono, D., Kristalina, P. Huda, M., 2011.
2.5 Transformasi Fourier