11
2.3 Microsoft Speech Application Programming Interface SAPI
Speech Application Programming Interface SAPI merupakan Application Programming Interface API yang dikembangkan oleh Microsoft yang dapat
digunakan untuk pengembangan speech recognition dengan sistem operasi yang berbasis windows. Speech Aplication Programming Interface SAPI diperkenalkan
oleh Microsoft pada tahun 1995. SAPI memungkinkan sistem akan mengenali input suara dari sipengguna dan kemudian akan menghasilkan ouput berupa text. Dengan
kata lain Speech Application Programming Interface SAPI ini dapat mengubah sinyal suara menjadi text melalui proses ekstraksi yang terjadi di dalamnya. Dalam
speech recognition, speech to text terdapat beberapa modul yang disebut engines Permadi. T, 2008. SAPI telah digunakan dalam windows XP, windows vista, dan
windows seven. Banyak versi dari Speech Application Programming Interface SAPI, diantaranya adalah Speech Application Programming Interface SAPI 1,
Speech Application Programming Interface SAPI 3, Speech Application Programming Interface SAPI 4, dan versi terbaru Speech Application Programming
Interface SAPI 5. Komponen yang terdapat pada Speech Application Programming Interface SAPI adalah sebagai berikut.
1. Voice Command
Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan pengenalan suara.
2. Voice Dictation
Sebuah obyek level tinggi untuk continous dictation speech recognition. 3.
Voice Talk Sebuah obyek level tinggi untuk speech synthesis.
4. Voice Telephony
Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara. 5.
Direct Speech Recognition Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara direct control of
recognition engine
Universitas Sumatera Utara
12
6. Direct Text to Speech
Sebuah obyek sebagai mesin yang mengontrol synthesis. 7.
Audio Object Untuk membaca dari audio device atau sebuah file audio.
Speech Application Programming Interface SAPI terdiri dari 2 antarmuka yaitu Application Programming Interface dan Device Driver Interface DDI
Permadi. T, 2008 Arsitektur SAPI ini dapat dilihat pada gambar 2.1.
2.3.1 Application Programming Interface API Dalam API terdapat fungsi-fungsi perintah-perintah untuk menggantikan bahasa yang
digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut
kemudian akan memanggil system calls sesuai dengan sistem operasinya. Keuntungan memprogram dengan menggunakan API adalah :
a.
Portabilitas dimana programmer yang menggunakan API dapat menjalankan
programnya dalam sistem operasi mana saja apabila API sudah ter- install dalam sistem operasi tersebut. Sedangkan system call berbeda antar sistem
operasi, dengan catatan dalam pengaplikasiannya ada kemungkinan untuk berbeda.
Gambar 2.1. Arsitektur SAPI
Aplikasi Aplikasi
SAPI Runtime Recognition
Engine TTS
Engine API
DDI
Universitas Sumatera Utara
13
b.
Lebih mudah dimengerti. API menggunakan bahasa yang lebih terstruktur dan
mudah dimengerti daripada bahasa system call. Hal ini sangat penting dalam hal editing dan pengembangan.
System call interface ini berfungsi sebagai penghubung antara API dan system call yang dimengerti oleh sistem operasi. System call interface ini akan
menerjemahkan perintah dalam API dan kemudian akan memanggil system calls yang diperlukan.
2.3.2 Device Driver Interface DDI Device Driver Interface DDI berfungsi untuk menerima data masukan yang berupa
suara dari Speech Application Programming Interface SAPI dan mengembalikan phrase pada level SAPI paling dasar.
2.4 Penelitian Terdahulu