Microsoft Speech Application Programming Interface SAPI

11

2.3 Microsoft Speech Application Programming Interface SAPI

Speech Application Programming Interface SAPI merupakan Application Programming Interface API yang dikembangkan oleh Microsoft yang dapat digunakan untuk pengembangan speech recognition dengan sistem operasi yang berbasis windows. Speech Aplication Programming Interface SAPI diperkenalkan oleh Microsoft pada tahun 1995. SAPI memungkinkan sistem akan mengenali input suara dari sipengguna dan kemudian akan menghasilkan ouput berupa text. Dengan kata lain Speech Application Programming Interface SAPI ini dapat mengubah sinyal suara menjadi text melalui proses ekstraksi yang terjadi di dalamnya. Dalam speech recognition, speech to text terdapat beberapa modul yang disebut engines Permadi. T, 2008. SAPI telah digunakan dalam windows XP, windows vista, dan windows seven. Banyak versi dari Speech Application Programming Interface SAPI, diantaranya adalah Speech Application Programming Interface SAPI 1, Speech Application Programming Interface SAPI 3, Speech Application Programming Interface SAPI 4, dan versi terbaru Speech Application Programming Interface SAPI 5. Komponen yang terdapat pada Speech Application Programming Interface SAPI adalah sebagai berikut. 1. Voice Command Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan pengenalan suara. 2. Voice Dictation Sebuah obyek level tinggi untuk continous dictation speech recognition. 3. Voice Talk Sebuah obyek level tinggi untuk speech synthesis. 4. Voice Telephony Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara. 5. Direct Speech Recognition Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara direct control of recognition engine Universitas Sumatera Utara 12 6. Direct Text to Speech Sebuah obyek sebagai mesin yang mengontrol synthesis. 7. Audio Object Untuk membaca dari audio device atau sebuah file audio. Speech Application Programming Interface SAPI terdiri dari 2 antarmuka yaitu Application Programming Interface dan Device Driver Interface DDI Permadi. T, 2008 Arsitektur SAPI ini dapat dilihat pada gambar 2.1. 2.3.1 Application Programming Interface API Dalam API terdapat fungsi-fungsi perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut kemudian akan memanggil system calls sesuai dengan sistem operasinya. Keuntungan memprogram dengan menggunakan API adalah : a. Portabilitas dimana programmer yang menggunakan API dapat menjalankan programnya dalam sistem operasi mana saja apabila API sudah ter- install dalam sistem operasi tersebut. Sedangkan system call berbeda antar sistem operasi, dengan catatan dalam pengaplikasiannya ada kemungkinan untuk berbeda. Gambar 2.1. Arsitektur SAPI Aplikasi Aplikasi SAPI Runtime Recognition Engine TTS Engine API DDI Universitas Sumatera Utara 13 b. Lebih mudah dimengerti. API menggunakan bahasa yang lebih terstruktur dan mudah dimengerti daripada bahasa system call. Hal ini sangat penting dalam hal editing dan pengembangan. System call interface ini berfungsi sebagai penghubung antara API dan system call yang dimengerti oleh sistem operasi. System call interface ini akan menerjemahkan perintah dalam API dan kemudian akan memanggil system calls yang diperlukan. 2.3.2 Device Driver Interface DDI Device Driver Interface DDI berfungsi untuk menerima data masukan yang berupa suara dari Speech Application Programming Interface SAPI dan mengembalikan phrase pada level SAPI paling dasar.

2.4 Penelitian Terdahulu