2.2.1 Arsitektur Android
Android akan bekerja dengan serangkaian aplikasi inti termasuk klien email, program SMS, kalender, peta, browser, kontak, dan lain-lain. Semua aplikasi ditulis
menggunakan bahasa pemrograman Java.
Gambar 2.2 Arsitektur Android
2.3 Pengenalan Suara
Pengenalan suara adalah sebuah teknik yang memungkinkan komputer dapat mengenali dan atau memanipulasi sinyal suara. Voice recognition atau pengenalan
suara sendiri terbagi dua jenis, yaitu speech recognition dan speaker recognition. Speaker recognition merupakan pengenalan identitas yang diklaim oleh
seseorang dari suaranya ciri khusus dapat berupa intonasi suara, tingkat kedalaman suara, dan sebagainya. Sedangkan speech recognition adalah proses yang dilakukan
computer untuk mengenali kata yang diucapkan oleh seseorang tanpa mempedulikan identitas orang terkait dan parameter yang digunakan dengan membandingkan tingkat
penekanan suara dengan template database yang telah tersedia Melissa, 2008.
Universitas Sumatera Utara
2.4 Speech Recognition
Speech recognition dikenal juga sebagai Automatic Speech Recognition ASR atau Computer Speech Recognition adalah proses untuk mengkonversi sinyal suara ke
dalam urutan kata-kata, dengan cara mengimplemantasikan algoritma sebagai program komputer Anusuya and Katti, 2009.
Proses identifikasi diperlukan agar sistem dapat mengenali input suara sehingga dapat dimanfaatkan. Hasil pengenalan suara dapat digunakan untuk
melakukan berbagai tugas seperti mengendalikan mesin, mengakses database, dan menghasilkan tulisan text Permana, 2011.
Untuk dapat melakukan identifikasi sebuah input dalam pengenalan suara dapat dilakukan dengan beberapa teknik pendekatan, yaitu sebagai berikut Rabiner
dan Juang, 1993 : 1.
Pendekatan akustik-fonetik acoustic-fonetic approach 2.
Pendekatan pengenalan pola pattern recognition approach 3.
Pendekatan kecerdasan buatan artificial intelligent aproach Menurut Zue et al. 2007 proses pengklasifikasian sistem pengenalan suara
perlu memperhatikan beberapa parameter, antara lain: 1.
Cara dan gaya bicara Jika sistem hanya dapat mengenali kata tunggal dalam sekali proses maka
disebut dengan isolated word recognition, sedangkan jika sistem dapat mengenali beberapa kata sebuah kalimat dalam sekali waktu maka
disebut dengan continuous speech recognition. Sistem
dengan continuous
speech recognition
sangat sulit
diimplementasikan, untuk itu perlu dibedakan antara cara bicara antara manusia dengan manusia conversation speech dan cara bicara manusia
dengan mesin read speech. 2.
Karakteristik pembicara Lebih mudah mengembangkan sistem yang dapat mengenali dialek
standar, atau dengan kata lain suara yang dikenali berasal dari pembicara yang sudah dilatih speaker dependent dari pada sistem yang dapat
mengenali suara yang berasal dari pembicara yang belum dilatih speaker independent.
Universitas Sumatera Utara
3. Jumlah kosakata
Semakin kecil sedikit jumlah kosakata yang diimplementasikan dalam sebuah ASR Automatic Speech Recognition maka semakin sedikit kata
yang harus dikenali oleh sistem, begitu juga sebaliknya berdasarkan jumlah katanya, sistem dapat dibagi menjadi dua macam yaitu sistem yang dapat
mengenali small vocabulary 20 kata dan large vocabulary 20000 kata.
4. Media dan Noise
Media dan noise merupakan parameter eksternal yang memengaruhi performa dari sistem pengenalan suara. Media yang digunakan biasanya
berupa head mounted microfones. Dengan mikrofon tersebut, distorsi dari sinyal suara dapat dihindari, sehingga diharapkan
kualitas suara yang dihasilkan juga baik. Selain itu kualitas sinyal suara juga dipengaruhi oleh noise. Jika terdapat noise misalnya bunyi selain
sinyal suara ketika proses perekaman, maka kualitas sinyal yang dihasilkan tidak akan baik. Jika keberadaan noise lebih dari 30 dB maka
suara memiliki low noise, sedangkan jika kurang dari 10 dB maka suara dikatakan high noise.
2.5 Pemrosesan Sinyal Suara