1
BAB I PENDAHULUAN
1.1 Latar Belakang
Seiring berkembangnya teknologi dalam bidang hiburan berupa mainan, memberikan rasa ketertarikan dan kemudahan terhadap mainan tersebut pada saat
dimainkan. Sebagai contohnya yaitu mainan berbentuk mobil yang dikenal dengan sebutan ‘mobil-mobilan’. Dahulu mainan tersebut harus didorong dan ditarik agar bisa bergerak.
Saat ini dengan dilengkapi oleh rangkaian elektronik dan teknologi yang semakin maju dan modern, maka mainan tersebut telah berkembang menjadi robot mobil yang laju
pergerakannya dikontrol menggunakan remote controller. Penggunaan remote controller membuat robot mobil menjadi lebih menarik dan dapat lebih mudah dimainkan.
Disamping hal diatas, saat ini telah berkembang pula teknologi speech recognition. Teknologi speech regcognition merupakan teknologi pengenalan lafal atau ucapan yang
memanfaatkan sinyal suara manusia sebagai data input [1]. Sinyal suara tersebut diproses oleh sistem dengan berbagai algoritma yang digunakan dalam ekstraksi pola atau ciri
suara. Kesesuaian hasil data pengenalan ucapan terhadap masukan ucapan yang ditangkap dapat digunakan diberbagai macam aplikasi. Banyak aplikasi-aplikasi yang telah
dihasilkan seiring dengan berkembangnya metode dan proses dari pengenalan ucapan tersebut. Salah satu aplikasinya adalah untuk navigasi robot [1]. Proses pengenalan ucapan
memiliki beberapa aspek yang perlu diperhatikan yaitu akuisisi data ucapan suara, pembentukan database ucapan, ekstraksi ciri sinyal ucapan, dan pengenalan pola sinyal
ucapan hasil ekstraksi ciri terhadap database ucapan [2]. Pengetahuan tersebut memberikan ide bagi penulis untuk membuat aplikasi yang
mengatur arah laju pergerakan robot mobil dengan ucapan manusia sebagai pengganti remote control
[1]. Proses akuisisi data suara diperoleh melalui mikrofon kemudian diubah dalam bentuk digital oleh soundcard pada PClaptop. Proses ekstraksi ciri yang digunakan
dalam penelitian ini yaitu Discrete Cosine Transform DCT. Hasil dari ekstraksi ciri akan dihitung kesesuaiannya terhadap database ucapan dengan menggunakan algoritma
similaritas kosinus. Hasil data pengenalan ucapan yang diperoleh akan dikirimkan secara serial kepada mikrokontroler. Mikrokontroler akan mengolah data yang diterima untuk
menjalankan laju pergerakan robot mobil sesuai dengan perintah ucapannya.
1.2 Tujuan dan Manfaat Penelitian
Tujuan dari penelitian ini yaitu : Mengaplikasikan pengenalan ucapan untuk mengatur gerak robot mobil.
Robot mobil tersebut sebagai wujud dari objek aplikasi pengenalan ucapan oleh manusia. Robot mobil akan bergerak maju, mundur, kiri, kanan, dan stop sesuai
dengan perintah ucapan yang diterima. Manfaat dari penelitian ini yaitu :
Penelitian ini dapat digunakan bagi perkembangan teknologi dibidang kontrol dengan menggunakan perintah suara untuk mengontrol alat-alat yang
bersifat elektronik
1.3 Batasan Masalah
Agar penelitian ini bisa mengarah pada tujuan dan untuk menghindari besarnya permasalahan yang muncul, maka perlu adanya beberapa batasan masalah yang
sesuai dengan judul dari penelitian ini. Adapun batasan masalah yaitu : 1. Software pengolahan data untuk pengenalan ucapan menggunakan MATLAB.
2. Pengolahan data suara menggunakan Ekstraksi ciri Discrete Cosine Transform dan algoritma similaritas kosinus.
3. Kata yang digunakan sebagai masukan pengenalan ucapan yaitu maju, mundur, kiri, kanan, dan stop. Pengucapan selain kata-kata yang sudah ditentukan akan
dikenali secara salah. 4. User yang memberi perintah ucapan hanya satu orang yaitu peneliti, dengan
intonasi pengucapan kata secara normal atau biasa. 5. Variasi nilai pada variabel batas potong pada pemotongan sinyal, nilai alfa pada
proses windowing, dan nilai faktor downsampling ditentukan sebagai berikut : Batas potong
= 0,1; 0,2; 0,3; dan 0,4. Nilai alfa
= 0,4; 0,5; 0,6; 0,7; dan 0,8. Faktor downsampling
= 1, 2, dan 4. 6. Mobil akan berhenti kemudian berputar ditempat kearah kiri bila mendapat
perintah kiri. Berlaku juga pada perintah kanan maka mobil akan berhenti kemudian berputar kearah kanan.
7. Pemberian nilai kecepatan putar motor PWM disesuaikan secara manual agar robot bergerak maju, mundur, berputar kiri, dan berputar kanan secara efektif.
8. Menggunakan mikrokontroler keluarga AVR ATmega8 pada robot mobil. 9. Media komunikasi data dari laptop kepada mikrokontroler menggunakan modul
RC-Timer Radio Telemetry 915Mhz. 10. Menggunakan mikrofon pada headset INTOPIC Jazz 525 sebagai penangkap
suara, dengan jarak mikrofon terhadap mulut sekitar 6 cm.
1.4 Metodologi Penelitian
Berdasarkan pada tujuan yang ingin dicapai, maka ada beberapa metode yang harus digunakan dalam penyusunan penelitian ini yaitu:
1. Studi literatur, Mencari bahan-bahan sebagai referensi dan informasi pengetahuan melalui
pembacaan buku dan jurnal-jurnal yang berkaitan dengan penelitian seperti ekstraksi ciri DCT, algoritma similaritas kosinus, Matlab, komunikasi serial,
motor driver dan datasheet ATmega8.
2. Perancangan alur kerja sistem secara umum Merancang alur atau diagram kerja yang akan dipakai dalam penelitian.
Alur kerja sistem pada gambar 1.1 menjelaskan proses dari awal penangkapan ucapan hingga terjadi aksi dari robot mobil.
Gambar 1.1. Alur kerja seluruh sistem.
3. Pembuatan database ucapan. Merekam sampel suara berupa ucapan kata yang digunakan sebagai
database . Database tersebut akan digunakan sebagai pembanding terhadap
masukan suara real-time saat percobaan pengenalan. 4. Perancangan dan pembuatan software pengenalan ucapan.
Merancang dan membuat program pengolahan data ucapan menggunakan Matlab agar dapat melakukan pengenalan ucapan. Merancang dan membuat
program pengiriman data serial dengan Matlab. 5. Perancangan hardware.
Tahap ini bertujuan untuk merancang pemodelan hardware berupa robot mobil yang optimal dan sesuai dengan penelitian. Perancangan harus
mempertimbangkan faktor-faktor permasalahan dan kebutuhan yang telah ditentukan. Sesuai pada Gambar 1.1. hardware pada robot mobil terdiri dari
mikrokontroler sebagai pengolah data, dan motor driver sebagai penggerak motor. Pembuatan program juga dilakukan agar mikrokontroler dapat mengolah
data untuk menggerakkan motor dan untuk menerima data secara serial dari Matlab.
6. Pengambilan data. Pengambilan data yang dilakukan untuk dapat menguji sistem dilakukan
dalam 3 tahap yaitu : Pengenalan ucapan secara tidak real time dengan merekam 20 data
ucapan pada tiap kata ucapan sebagai masukan percobaan. Percobaan pengenalan ucapan dilakukan terhadap setiap variasi
nilai variabel. Pengiriman data serial dari laptop menuju mikrokontroler dengan
menggunakan modul RC-Timer Radio Telemetry 915 Mhz. Pengenalan ucapan secara real time dengan menangkap ucapan dan
langsung diproses hingga terjadi pergerakan robot mobil. Pengambilan data tersebut dilakukan terhadap seluruh variasi nilai dari
masing-masing variabel data yang digunakan. Variabel yang digunakan yaitu batas potong sinyal, nilai alfa pada windowing, dan faktor downsampling.
7. Analisis dan pembahasan hasil penelitian. Analisa dilakukan dengan pendataan dari hasil keberhasilan pengenalan
ucapan terhadap setiap kondisi variasi nilai dari variabel data yang ditentukan. Analisa dan pembahasan dilakukan dengan mengamati nilai persentase error
dari percobaan pengenalan ucapan berdasarkan pengaruh variasi nilai-nilai variabel datanya.
6
BAB II DASAR TEORI
2.1 Sinyal Suara Manusia
Input pengenalan suara diperoleh dari sinyal suara saat manusia melakukan
percakapan. Sinyal suara tercipta dari kombinasi yang sangat kompleks melalui perpaduan vocal tract
dan nasal tract. Vocal tract adalah sistem pembentukan suara dimana jalur udara melewati mulut, sedangkan nasal tract adalah sistem pembentukan sengau atau
derau dengan jalur udara melalui hidung [3]. Sinyal suara terjadi oleh getaran tekan udaran yang dibentuk dari penekanan udara didalam
paru-paru melewati pita suara yang kemudian bergetar dan pengaruh vocal tract serta bentuk bibir dan saluran hidung atau nasal tract. Udara akan termodulasi dan dibentuk dari
getaran pada celah suara, resonansi dari vocal tract bersama rongga hidung, posisi lidah, dan bentuk mulut [4].
Anatomi manusia dalam memproduksi suara terlihat pada Gambar 2.1. Bagian dari organ pembentuk suara meliputi paru paru, laring, rongga pada saluran vocal tract, rongga pada
saluran nasal tract, gigi, bibir, dan katub penghubung.
Gambar 2.1. Anatomi Organ Tubuh Pembentuk Suara [3] Paru-paru mengembang dan mengempis untuk menyedot dan mengeluarkan udara.
Udara yang dihembuskan oleh paru-paru keluar melewati suatu daerah yang dinamakan