Pengenalan Suara Speech Recognition

2.2.1 Arsitektur Android

Android akan bekerja dengan serangkaian aplikasi inti termasuk klien email, program SMS, kalender, peta, browser, kontak, dan lain-lain. Semua aplikasi ditulis menggunakan bahasa pemrograman Java. Gambar 2.2 Arsitektur Android

2.3 Pengenalan Suara

Pengenalan suara adalah sebuah teknik yang memungkinkan komputer dapat mengenali dan atau memanipulasi sinyal suara. Voice recognition atau pengenalan suara sendiri terbagi dua jenis, yaitu speech recognition dan speaker recognition. Speaker recognition merupakan pengenalan identitas yang diklaim oleh seseorang dari suaranya ciri khusus dapat berupa intonasi suara, tingkat kedalaman suara, dan sebagainya. Sedangkan speech recognition adalah proses yang dilakukan computer untuk mengenali kata yang diucapkan oleh seseorang tanpa mempedulikan identitas orang terkait dan parameter yang digunakan dengan membandingkan tingkat penekanan suara dengan template database yang telah tersedia Melissa, 2008. Universitas Sumatera Utara

2.4 Speech Recognition

Speech recognition dikenal juga sebagai Automatic Speech Recognition ASR atau Computer Speech Recognition adalah proses untuk mengkonversi sinyal suara ke dalam urutan kata-kata, dengan cara mengimplemantasikan algoritma sebagai program komputer Anusuya and Katti, 2009. Proses identifikasi diperlukan agar sistem dapat mengenali input suara sehingga dapat dimanfaatkan. Hasil pengenalan suara dapat digunakan untuk melakukan berbagai tugas seperti mengendalikan mesin, mengakses database, dan menghasilkan tulisan text Permana, 2011. Untuk dapat melakukan identifikasi sebuah input dalam pengenalan suara dapat dilakukan dengan beberapa teknik pendekatan, yaitu sebagai berikut Rabiner dan Juang, 1993 : 1. Pendekatan akustik-fonetik acoustic-fonetic approach 2. Pendekatan pengenalan pola pattern recognition approach 3. Pendekatan kecerdasan buatan artificial intelligent aproach Menurut Zue et al. 2007 proses pengklasifikasian sistem pengenalan suara perlu memperhatikan beberapa parameter, antara lain: 1. Cara dan gaya bicara Jika sistem hanya dapat mengenali kata tunggal dalam sekali proses maka disebut dengan isolated word recognition, sedangkan jika sistem dapat mengenali beberapa kata sebuah kalimat dalam sekali waktu maka disebut dengan continuous speech recognition. Sistem dengan continuous speech recognition sangat sulit diimplementasikan, untuk itu perlu dibedakan antara cara bicara antara manusia dengan manusia conversation speech dan cara bicara manusia dengan mesin read speech. 2. Karakteristik pembicara Lebih mudah mengembangkan sistem yang dapat mengenali dialek standar, atau dengan kata lain suara yang dikenali berasal dari pembicara yang sudah dilatih speaker dependent dari pada sistem yang dapat mengenali suara yang berasal dari pembicara yang belum dilatih speaker independent. Universitas Sumatera Utara 3. Jumlah kosakata Semakin kecil sedikit jumlah kosakata yang diimplementasikan dalam sebuah ASR Automatic Speech Recognition maka semakin sedikit kata yang harus dikenali oleh sistem, begitu juga sebaliknya berdasarkan jumlah katanya, sistem dapat dibagi menjadi dua macam yaitu sistem yang dapat mengenali small vocabulary 20 kata dan large vocabulary 20000 kata. 4. Media dan Noise Media dan noise merupakan parameter eksternal yang memengaruhi performa dari sistem pengenalan suara. Media yang digunakan biasanya berupa head mounted microfones. Dengan mikrofon tersebut, distorsi dari sinyal suara dapat dihindari, sehingga diharapkan kualitas suara yang dihasilkan juga baik. Selain itu kualitas sinyal suara juga dipengaruhi oleh noise. Jika terdapat noise misalnya bunyi selain sinyal suara ketika proses perekaman, maka kualitas sinyal yang dihasilkan tidak akan baik. Jika keberadaan noise lebih dari 30 dB maka suara memiliki low noise, sedangkan jika kurang dari 10 dB maka suara dikatakan high noise.

2.5 Pemrosesan Sinyal Suara