Implementasi hidden markov model untuk aplikasi pengenalan ucapan sebagai kendali gerak robot mobil

IMPLEMENTASI HIDDEN MARKOV MODEL
UNTUK APLIKASI PENGENALAN UCAPAN
SEBAGAI KENDALI GERAK ROBOT MOBIL

ARIEF FAJAR PERMANA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011

IMPLEMENTASI HIDDEN MARKOV MODEL
UNTUK APLIKASI PENGENALAN UCAPAN
SEBAGAI KENDALI GERAK ROBOT MOBIL

ARIEF FAJAR PERMANA

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011

ABSTRACT

ARIEF FAJAR PERMANA. Implementation of Hidden Markov Models for Speech Recognition
Applications as Controlling Mobile Robot Movements. Supervised by SRI NURDIATI and HASAN
MAYDITIA.
Robot is an electronic or mechanical equipment capable of performing a series of actions
automatically. In the world of robotics, control systems is a very important part that serves to control
the movement or navigation in a robot. Sound based mobile control system is an alternative voice
control that is quite efficient. However, voice recognition process is not easily done by a machine. It
needs a machine learning method that can be used to perform the voice feature extraction by studying
the characteristics of a previous vote. This study uses Mel-Frequency Cepstral Coefficient (MFCC) to
extract speech signal and HMM (Hidden Markov Model) for modeling the speech signal. Result of the

experiment from the whole system performance speech recognition is 96,4% for people that have been
inputted in the database, and 91,2% for people which have not been inputted in database. The mobile
robot system test results showed that the system has worked well and has an average response time to
move after the speech recognition process around 0,46 seconds.

Keyword : Mobile robot, Speech recognition, Hidden Markov Model, MFCC.

Judul

:

Nama
NRP

:
:

Implementasi Hidden Markov Model Untuk Aplikasi Pengenalan Ucapan Sebagai
Kendali Gerak Robot Mobil
Arief Fajar Permana

G64063196

Menyetujui:
Pembimbing I,

Pembimbing II,

Dr. Ir. Sri Nurdiati, M.Sc.
NIP. 19601126 198601 2 001

Hasan Mayditia, S.Si.
NIP. 19840502 200604 1 8

Mengetahui :
Ketua Departemen Ilmu Komputer

Dr. Ir. Sri Nurdiati, M.Sc.
NIP. 19601126 198601 2 001

Tanggal Lulus :


RIWAYAT HIDUP
Arief Fajar Permana dilahirkan di Bekasi, pada tanggal 30 Mei 1988 dari pasangan Bapak Salamin
Ishak dan Ibu Encum Sumiati
Pada tahun 2006 penulis lulus dari Sekolah Menengah Atas (SMA) Negeri 3 Bekasi dan diterima
di Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI). Setelah satu
tahun menyelesaikan program Tingkat Persiapan Bersama (TPB), pada tahun 2007 penulis diterima di
Departemen Ilmu Komputer FMIPA IPB. Pada tahun 2007 penulis aktif dalam organisasi Himpunan
Mahasiswa Ilmu Komputer (Himalkom) FMIPA IPB sebagai anggota Divisi Multimedia. Pada bulan
Juli hingga Agustus tahun 2009, penulis melaksanakan kegiatan praktik kerja lapangan di PT.
Perusahaan Listrik Negara Distribusi Jawa Barat dan Banten (PT. PLN DJBB).

PRAKATA
Puji syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan hidayahNya sehingga tugas akhir dengan judul Implementasi Hidden Markov Model Untuk Aplikasi
Pengenalan Ucapan Sebagai Kendali Gerak Robot Mobil dapat diselesaikan dengan lancar. Penelitian
ini dilaksanakan mulai September 2010 hingga Januari 2011 bertempat di Departemen Ilmu
Komputer.
Pelaksanaan tugas akhir ini tentunya tidak lepas dari dukungan dan bantuan dari berbagai pihak,
oleh karena itu penulis ingin mengucapkan terima kasih kepada :
1. Kedua orang tua tercinta dan kakak-kakak yang telah memberi dukungan dan doa.

2. Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku pembimbing pertama yang selalu memotivasi dan
mendukung untuk setiap ide dan kreatifitas yang muncul pada penelitian ini.
3. Bapak Hasan Mayditia, S.Si. selaku pembimbing kedua yang telah memberikan bimbingan dan
arahan selama pelaksanaan tugas akhir ini.
4. Bapak Dr. Ir. Agus Buono, M.Si., M.Kom. selaku penguji yang telah memberikan masukan dan
saran dalam perbaikan dan penyelesaian tugas akhir ini.
5. Rizqi Baihaqi Ahmadi, S.Komp., sahabat yang tidak pernah lelah membantu penulis dalam
penyelesaian tugas akhir ini.
6. Sahabat-sahabat terbaik dari ilkomerz 43 Hendro, Wildan, Ardhan, Musthofa, Farhad, Ira, dan
Yuli yang telah berbagi cerita suka dan duka bersama selama penulis menjadi mahasiswa.
7. Teman-teman satu bimbingan Deni dan Deden atas saran dan semangat yang diberikan kepada
penulis.
8. Kawan-kawan se-Dota dan se-Tanah air Akbar, Rendy, Aan, Hizry, Doris, Eko, dan Ade F.
9. Semua pihak yang telah membantu baik secara langsung maupun tidak langsung dalam
pelaksanaan tugas akhir ini.
Semoga tugas akhir ini bermanfaat dan dapat dikembangkan bagi pendidikan dan kemajuan
teknologi di negeri tercinta Indonesia.

Bogor, Februari 2011


Arief Fajar Permana

DAFTAR ISI
Halaman
DAFTAR TABEL ................................................................................................................................ v
DAFTAR GAMBAR ............................................................................................................................ v
DAFTAR LAMPIRAN ......................................................................................................................... v
PENDAHULUAN
Latar Belakang ................................................................................................................................
Tujuan .............................................................................................................................................
Ruang Lingkup ................................................................................................................................
Manfaat Penelitian ..........................................................................................................................

1
1
1
1

TINJAUAN PUSTAKA
Mikrokontroler ................................................................................................................................

Komunikasi Data .............................................................................................................................
UART ..............................................................................................................................................
Speech Recognition .........................................................................................................................
Pemrosesan Sinyal Suara ................................................................................................................
Ekstraksi Ciri ...................................................................................................................................
Hidden Markov Model .....................................................................................................................
Algoritme Forward .........................................................................................................................
Algoritme Backward .......................................................................................................................
Algoritme Baum-Welch ..................................................................................................................
Gaussian Multivariate .....................................................................................................................
Scaling .............................................................................................................................................

1
2
2
2
3
4
5
6

6
6
7
7

METODE PENELITIAN
Kerangka Pemikiran ........................................................................................................................
Studi Pustaka ...................................................................................................................................
Identifikasi Masalah ........................................................................................................................
Perancangan ....................................................................................................................................
Implementasi ...................................................................................................................................
Pengujian .........................................................................................................................................

7
8
8
8
8
9


RANCANGAN DETAIL DAN PEMBAHASAN
Perancangan .................................................................................................................................... 9
a. Perancangan Sistem Pengenalan Ucapan .............................................................................. 9
b. Perancangan Elektrik ............................................................................................................ 11
c. Perancangan Mekanik ........................................................................................................... 12
d. Perancangan Antarmuka Aplikasi ......................................................................................... 12
Implementasi ................................................................................................................................... 13
a. Implementasi Sistem Pengenalan Ucapan ............................................................................ 13
b. Implementasi Pengiriman Data ............................................................................................. 13
Pengujian ......................................................................................................................................... 14
a. Pengujian Sistem Pengenalan Ucapan .................................................................................. 14
b. Pengujian Respon Pada Mobil .............................................................................................. 15
KESIMPULAN DAN SARAN
Kesimpulan ..................................................................................................................................... 16
Saran ............................................................................................................................................... 16
DAFTAR PUSTAKA ........................................................................................................................... 16
LAMPIRAN ......................................................................................................................................... 17

iv


DAFTAR TABEL
Halaman
1
2
3
4
5
6
7

Penggunaan port mikrokontroler ................................................................................................... 11
Arah pergerakan motor depan ....................................................................................................... 12
Arah pergerakan motor belakang ................................................................................................. 12
Representasi kata ke dalam karakter ASCII .................................................................................. 14
Hasil pengenalan ucapan responden di dalam database................................................................ 15
Hasil pengenalan ucapan responden di luar database .................................................................. 15
Hasil pengujian respon robot mobil .............................................................................................. 15
DAFTAR GAMBAR
Halaman


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

Mikrokontroler (MCU).................................................................................................................. 1
Komunikasi data paralel ................................................................................................................ 2
Komunikasi data serial ................................................................................................................. 2
Universal Asynchronous Receiver-Transmitter (UART) ............................................................. 2
Tahapan transformasi sinyal suara menjadi informasi ................................................................. 3
Blok diagram proses MFCC ......................................................................................................... 4
Ilustrasi frame blocking pada sinyal suara .................................................................................... 4
HMM model ergodic ..................................................................................................................... 5
HMM model left-right ................................................................................................................... 5
Ilustrasi alur algoritme forward .................................................................................................... 6
Ilustrasi alur algoritme backward ................................................................................................. 6
Ilustrasi perhitungan pada algoritme Baum-Welch ...................................................................... 7
Metode penelitian ......................................................................................................................... 7
Diagram alir proses pengenalan ucapan ....................................................................................... 8
Variasi sinyal suara ...................................................................................................................... 9
Data sinyal suara awal .................................................................................................................. 9
Data suara setelah praproses ......................................................................................................... 10
Data suara dengan cut silent yang tidak optimal .......................................................................... 10
Pin-pin ATMega16 kemasan 40 pin ............................................................................................. 11
Port DB9 male dan female ........................................................................................................... 11
Bentuk fisik rangkaian sistem robot mobil ................................................................................... 12
Penempatan rangkaian sistem robot mobil ................................................................................... 12
Penempatan power supply ............................................................................................................. 12
Tampilan antarmuka program sistem pengenalan ucapan ............................................................. 13
Tampilan program pengenalan ucapan dijalankan ........................................................................ 13
Implementasi sistem robot kendali suara....................................................................................... 13
Proses pengiriman data ke mikrokontroler .................................................................................... 14
Grafik akurasi pengenalan kata pada sistem.................................................................................. 15
DAFTAR LAMPIRAN
Halaman

1
2
3
4
5
6

Hasil pengenalan data testing dengan responden di dalam database ........................................... 18
Hasil pengenalan data testing dengan responden di luar database ................................................ 19
Nilai peluang data testing dengan responden di dalam database .................................................. 20
Nilai peluang data testing dengan responden di luar database ...................................................... 22
Hasil pengujian pergerakan pada robot mobil ............................................................................... 23
Rangkaian sistem robot mobil ...................................................................................................... 26

v

PENDAHULUAN
Latar Belakang
Robot merupakan sebuah alat elektronik
maupun mekanik yang mampu melakukan
serangkaian tindakan secara otomatis, baik
menggunakan pengawasan dan kontrol manusia,
ataupun menggunakan program yang telah
didefinisikan terlebih dahulu oleh komputer.
Dunia robotik saat ini telah berkembang
pesat. Berbagai macam bentuk robot telah
dikembangkan, salah satunya adalah robot
mobil. Robot mobil sangat disukai bagi orang
yang mulai mempelajari robot karena untuk
membuatnya tidak diperlukan mekanisme yang
rumit dan kerja fisik yang berat, minimal dapat
memanfaatkan bahan yang ada seperti akrilik
bahkan alumunium serta ditunjang dengan
pengetahuan dasar tentang mikrokontroler dan
sensor-sensor elektronik.
Sistem kontrol merupakan bagian yang amat
penting dan tak terpisahkan dalam sistem
robotik. Sistem kontrol berfungsi untuk
mengontrol pergerakan atau navigasi pada
sebuah robot. Sistem kontrol atau kendali robot
mobil pada umumnya masih menggunakan
remote control. Alat ini cukup efektif dan telah
dipakai dalam berbagai aplikasi alat lainnya.
Akan tetapi para pengguna diharuskan
melakukan
suatu
pembelajaran
atau
menyesuaikan terlebih dahulu terhadap remote
control ini agar dapat menjalankan robot mobil
dengan baik.
Sistem kendali berbasiskan suara menjadi
salah satu alternatif yang menjanjikan, karena
proses kontrol dapat dilakukan dengan mudah
dan efisien terutama bagi seseorang yang
memiliki keterbatasan fisik. Namun proses
pengenalan suara tidaklah mudah dilakukan
oleh sebuah mesin. Dibutuhkan suatu metode
pembelajaran mesin yang dapat digunakan
untuk melakukan ekstraksi ciri pola atau ciri
suara dengan mempelajari ciri-ciri suara
sebelumnya.
Penelitian mengenai pengenalan suara
(speech recognition) telah banyak dilakukan.
Ruvinna (2008) menerapkan metode HMM
dengan algoritme Baum-Welch pada kasus
pengenalan kata-kata berbahasa Indonesia dan
berhasil mencapai tingkat akurasi 83,125% saat
digunakan tiga hidden state dengan lama
pelatihan sepuluh epoh. Penelitian ini
memanfaatkan
dan
mengimplementasikan
metode yang digunakan oleh Ruvinna (2008)
untuk aplikasi pengenalan ucapan yang nantinya
digunakan pada proses kendali robot mobil.

Tujuan
Tujuan penelitian ini adalah membuat
sebuah sistem robot mobil yang dikendalikan
oleh suara dengan mengimplementasikan
Hidden Markov Model sebagai metode
pembelajaran dan pemodelan suaranya.
Ruang Lingkup
Adapun ruang lingkup dari penelitian ini
antara lain:
1. Penelitian ini terbatas pada pengenalan kata,
bukan pengenalan kalimat.
2. Data masukan berupa lima buah kata bahasa
Indonesia, yaitu “maju”, “mundur”, “kiri”,
“kanan”, dan “diam”.
3. Analisis sinyal dilakukan dengan ekstraksi
ciri menggunakan MFCC (Mel-Frequency
Ceptrums Coefficients).
4. Proses pengenalan suara dilakukan dengan
Hidden Markov Model dan algoritme BaumWelch.
5. Proses pengiriman data dari komputer
dilakukan melalui jalur komunikasi data
serial.
Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan
informasi mengenai kinerja Hidden Markov
Model dalam mengenali ucapan serta melihat
waktu respon yang dibutuhkan untuk
pergerakan robot mobil.

TINJAUAN PUSTAKA
Mikrokontroler
Mikrokontroler atau MCU merupakan
sebuah komponen rangkaian terintegrasi
(Integrated Circuit atau IC) yang dapat
diprogram untuk menjalankan instruksi atau
fungsi kontrol yang khusus. Mikrokontroler
memiliki seluruh atau sebagian besar elemen
sistem komputer (memory dan I/O) yang
dikemas dalam satu chip IC, sehingga sering
disebut dengan single chip microcomputer
(Axelson 1997), seperti yang diilustrasikan pada
Gambar 1.

Komunikasi Serial (UART)

Gambar 1 Mikrokontroler (MCU).

1

Komunikasi Data
Komunikasi data merupakan bentuk
komunikasi yang secara khusus berkaitan
dengan transmisi atau perpindahan data antara
komputer-komputer atau komputer-piranti lain
dalam bentuk data digital yang dikirimkan
melaui media komunikasi data.
Secara umum, komunikasi data digital
digolongkan menjadi dua, yaitu (Bai 2005) :
1. Komunikasi paralel
Komunikasi paralel merupakan pertukaran
atau penerjemahan data antara dua piranti
secara paralel yang artinya bahwa bit-bit data
dapat dikirimkan secara simultan. Gambar 2
menunjukkan komunikasi data paralel.

Gambar 2 Komunikasi data paralel.
2. Komunikasi serial
Komunikasi serial merupakan pertukaran
atau penerjemahan data antara dua piranti yang
hanya dapat dilakukan bit per bit (Bai 2005).
Gambar 3 menunjukkan komunikasi data serial.

Gambar 4 Universal Asynchronous ReceiverTransmitter (UART).
Speech Recognition
Pengenalan ucapan (speech recognition)
merupakan proses dimana komputer dapat
mengidentifikasi kata-kata yang diucapkan
(Cook 2002). Proses identifikasi diperlukan
agar sistem dapat mengenali suatu input suara
sehingga dapat dimanfaatkan. Hasil pengenalan
suara dapat digunakan untuk melakukan
berbagai tugas seperti mengendalikan mesin,
mengakses database, dan menghasilkan tulisan
(text).
Menurut Zue et al. (2007) proses
pengklasifikasian sistem pengenalan suara perlu
memperhatikan beberapa parameter, antara lain:
a. Cara dan gaya bicara
Jika sistem hanya dapat mengenali kata
tunggal dalam sekali proses maka disebut
dengan isolated word recognition, sedangkan
jika sistem dapat mengenali beberapa kata
(sebuah kalimat) dalam sekali waktu maka
disebut dengan continuous speech recognition.
Sistem dengan continuous speech recognition
sangat sulit diimplementasikan, untuk itu perlu
dibedakan antara cara bicara antara manusia
dengan manusia (conversation speech) dan cara
bicara manusia dengan mesin (read speech).
b. Karakteristik pembicara

Gambar 3 Komunikasi data serial.
UART
UART atau Universal Asynchronous
Receiver-Transmitter merupakan sebuah control
unit yang melakukan pertukaran data pada
komunikasi data. UART terdiri atas transmitter
dan receiver (Bai 2005). Gambar 4
menunjukkan peran UART.

Lebih mudah mengembangkan sistem yang
dapat mengenali dialek standar, atau dengan
kata lain suara yang dikenali berasal dari
pembicara yang sudah dilatih (speaker
dependent) dari pada sistem yang dapat
mengenali suara yang berasal dari pembicara
yang belum dilatih (speaker independent).
c. Jumlah kosakata
Semakin kecil (sedikit) jumlah kosakata
yang diimplementasikan dalam sebuah ASR
(Automatic Speech Recognition) maka semakin
sedikit kata yang harus dikenali oleh sistem,

2

begitu juga sebaliknya. Berdasarkan jumlah
katanya, sistem dapat dibagi menjadi dua
macam yaitu sistem yang dapat mengenali small
vocabulary (< 20 kata) dan large vocabulary (>
20000 kata).
d. Media dan noise
Media dan noise merupakan parameter
eksternal yang memengaruhi performa dari
sistem pengenalan suara. Media yang digunakan
biasanya berupa head mounted microfones.
Dengan mikrofon tersebut, distorsi dari sinyal
suara dapat dihindari, sehingga diharapkan
kualitas suara yang dihasilkan juga baik. Selain
itu kualitas sinyal suara juga dipengaruhi oleh
noise. Jika terdapat noise (misalnya bunyi selain
sinyal suara) ketika proses perekaman, maka
kualitas sinyal yang dihasilkan tidak akan baik.
Jika keberadaan noise lebih dari 30 dB maka
suara memiliki low noise, sedangkan jika
kurang dari 10 dB maka suara dikatakan high
noise.
Pemrosesan Sinyal Suara
Sinyal suara merupakan gelombang yang
tercipta dari tekanan udara yang berasal dari
paru-paru yang berjalan melewati lintasan suara
menuju mulut dan rongga hidung (Al-Akaidi
2007). Pemrosesan suara itu sendiri merupakan
teknik menransformasi sinyal suara menjadi
informasi yang berarti sesuai dengan yang
diinginkan (Buono et al. 2009).
Sinyal secara umum dapat dikategorikan
sesuai dengan peubah bebas waktu, yaitu:
1. Sinyal waktu kontinyu: kuantitas sinyal
terdefinisi pada setiap waktu dalam selang
kontinyu. Sinyal waktu kontinyu disebut
juga sinyal analog.
2. Sinyal waktu diskret: kuantitas sinyal
terdefinisi pada waktu diskret tertentu, yang
dalam hal ini jarak antar waktu tidak harus
sama.
Secara umum proses transformasi tersebut
terdiri atas digitalisasi sinyal analog, ekstraksi
ciri dan diakhiri dengan pengenalan pola untuk
klasifikasi, seperti yang terlihat pada Gambar 5.

Gambar 5 Transformasi sinyal suara menjadi
informasi (Buono et al. 2009).
Pengolahan sinyal analog menjadi sinyal
digital dapat dilakukan melalui dua tahap yaitu
sampling dan kuantisasi (Jurafsky 2007).
Sampling adalah suatu proses untuk membagibagi suatu sinyal kontinyu (sinyal analog)
dalam interval waktu yang telah ditentukan.
Sampling ini dilakukan dengan mengubah
sinyal analog menjadi sinyal digital dalam
fungsi waktu. Pengubahan bentuk sinyal ini
bertujuan untuk mempermudah memproses
sinyal masukan yang berupa analog karena
sinyal analog memiliki kepekaan terhadap noise
yang rendah, sehingga sulit untuk memproses
sinyal tersebut.
Nilai dari hasil sampling tersebut dibulatkan
ke nilai terdekat (rounding), atau bisa juga
dengan pemotongan bagian sisa (truncating)
sehingga menghasilkan sinyal suara digital
dengan mengekspresikannya menggunakan
sejumlah digit tertentu dan proses ini yang
dikenal dengan kuantisasi.
Sinyal suara digital kemudian dilakukan
proses pembacaan sinyal per frame dengan
lebar frame tertentu yang saling tumpang tindih.
Proses ini dikenal dengan proses frame
blocking. Barisan frame berisi informasi yang
lengkap dari sebuah sinyal suara. Informasi
yang terdapat dalam frame-frame tersebut
direpresentasikan dengan cara pengekstraksian
ciri sehingga dihasilkan vektor-vektor yang
nantinya digunakan dalam pengenalan pola.

3

Ekstraksi Ciri
Ekstraksi ciri merupakan proses untuk
menentukan satu nilai atau vektor yang dapat
dipergunakan sebagai penciri objek atau
individu (Buono et al. 2009). Terdapat banyak
cara untuk merepresentasikan parameter sinyal
suara, salah satunya ialah Mel-Frequency
Cepstrum Coefficients (MFCC).
MFCC merupakan cara yang paling sering
digunakan pada berbagai bidang area
pemrosesan suara, karena dianggap cukup baik
dalam merepresentasikan sinyal. Cara kerja
MFCC didasarkan pada perbedaan frekuensi
yang dapat ditangkap oleh telinga manusia
sehingga mampu merepresentasikan sinyal
suara
sebagaimana
manusia
merepresentasikannya (Do 1994). Blok diagram
proses MFCC dapat dilihat pada Gambar 6.
Speech

Frame
Blocking

Frame

Windowing

FFT

fungsi window tertentu. Proses windowing
bertujuan
untuk
meminimalisasi
ketidakberlanjutan sinyal pada awal dan akhir
setiap frame (Do 1994). Jika kita definisikan
window sebagai w(n), 0 ≤ n ≤ N – 1, dimana N
adalah jumlah sampel pada setiap frame-nya,
maka hasil dari windowing adalah sinyal:
y1(n) = x1(n) w(n), 0 ≤ n ≤ N – 1.
dimana w(n) biasanya menggunakan window
Hamming yang memiliki bentuk:
w(n) = 0.54 – 0.46 cos



, 0 ≤ n ≤ N – 1.

 Fast Fourier Transform (FFT)
FFT merupakan fast algorithm dari Discrete
Fourier Transform (DFT) yang berguna untuk
mengonversi setiap frame dengan N sampel dari
domain waktu menjadi domain frekuensi,
sebagaimana didefinisikan sebagai berikut (Do
1994):



Spectrum

,

dimana n = 0, 1, β, …, N-1 dan j = √-1.
Mel

Mel

cepstrum

Cepstrum

spectrum

Mel-frequency
Wrapping

Gambar 6 Blok diagram proses MFCC.
 Frame blocking
Pada proses ini, sinyal suara disegmentasi
menjadi beberapa frame yang saling tumpang
tindih (overlap). Hal ini dilakukan agar tidak
ada sedikitpun sinyal yang hilang (deletion).
Proses ini akan berlanjut sampai seluruh sinyal
sudah masuk ke dalam satu atau lebih frame
seperti yang diilustrasikan dalam Gambar 7.

Hasil dari tahapan ini biasanya disebut
dengan spectrum atau periodogram.
 Mel-Frequency Wrapping
Persepsi sistem pendengaran manusia
terhadap frekuensi sinyal suara tidak dapat
diukur dalam skala linear. Untuk setiap nada
dengan frekuensi aktual, f, diukur dalam Hz,
sebuah subjective pitch diukur dalam sebuah
skala yang disebut „mel‟. Skala mel-frequency
ialah sebuah frekuensi rendah yang bersifat
linear di bawah 1000 Hz dan sebuah frekuensi
tinggi yang bersifat logaritmik di atas 1000 Hz
(Do 1994). Persamaan berikut menunjukkan
hubungan skala mel dengan frekuensi dalam
Hz:
Fmel = {

.

Proses wrapping terhadap sinyal dalam
domain frekuensi dilakukan menggunakan
persamaan berikut:

Gambar 7 Ilustrasi frame blocking pada sinyal
suara.
 Windowing
Sinyal analog yang sudah diubah menjadi
sinyal digital dibaca frame demi frame dan pada
setiap frame-nya dilakukan windowing dengan

Xi = log1o ∑

.

dimana i = 1,β,γ,…,M (M adalah jumlah filter
segitiga) dan Hi(k) adalah nilai filter segitiga
ke-i untuk frekuensi akustik sebesar k.
 Cepstrum
Pada tahap ini akan dikonversi mel-spectrum
ke dalam domain waktu dengan menggunakan

4

Discrete Cosine Transform (DCT). Hasilnya
disebut dengan mel-frequency cepstrum
coefficient (MFCC). Berikut adalah persamaan
yang digunakan dalam transformasi cosinus:
Cj = ∑

Pada HMM left-right, perpindahan state
hanya dapat berpindah dari kiri ke kanan saja
tidak dapat mundur ke belakang, seperti yang
ditunjukkan pada Gambar 9.

.

dimana j = 1, β, γ,…, K (K adalah jumlah
koefisien yang diinginkan) dan M adalah
jumlah filter.
Hidden Markov Model
Sebelum mendefinisikan HMM, perlu
dibahas terlebih dulu mengenai Markov chain
(rantai Markov). Markov chain merupakan
kumpulan state yang transisi antar state-nya
memiliki antar peluang yang mengindikasikan
kemungkinan jalur state tersebut diambil.
Markov chain bermanfaat untuk menghitung
peluang urutan kejadian yang dapat diamati.
Pada kondisi tertentu tidak semua kejadian
dapat diamati secara langsung, namun dapat
dievaluasi dari kejadian lain yang dapat diamati
secara langsung. Untuk masalah seperti ini
diperlukan modifikasi dari rantai Markov yang
disebut dengan Hidden Markov Model.
Hidden markov model (HMM) merupakan
suatu model stokastik yang menggambarkan
dua keterkaitan antar peubah yaitu peubah yang
tak teramati (hidden state) dari waktu ke waktu,
serta peubah yang teramati (observable state)
(Rabiner 1989).
Dalam implementasinya,
menjadi dua tipe dasar yaitu:

2. HMM left-right

HMM

dibagi

1. HMM ergodic
Pada HMM model ergodic, perpindahan
state yang satu ke state yang lain semuanya
memungkinkan atau bisa juga dikatakan
perpindahan (transisi) state-nya bebas, seperti
yang ditunjukkan pada Gambar 8.

Gambar 9 HMM model left-right.
Dalam
perhitungannya,
HMM
menggunakan beberapa notasi, di antaranya
(Dugad & Desai 1996):
 N adalah merepresentasikan banyaknya
jumlah hidden state (state ke 1, β,…, )
dalam HMM. Semua state dalam model
terhubung satu sama lain.
 M adalah jumlah kemungkinan kemunculan
peubah yang terobservasi/teramati.
 T adalah panjang rangkaian observasi.
 π merepresentasikan matriks π atau πi
dengan
yaitu matriks
distribusi peluang pada tahap awal berada di
state i. Dalam hal ini, ∑
.
 A merupakan peluang transisi antar state. A
= { } dimana
yaitu peluang berada di state j pada waktu
t + 1 jika pada waktu t berada di state i.
Dalam hal ini,
diasumsikan bebas dari
waktu.
 B adalah peluang kemunculan peubah yang
terobservasi pada suatu state. B = {
}
dengan
, yaitu peluang simbol
saat t jika state
yang terjadi adalah j.

merepresentasikan notasi untuk nilai
teramati pada waktu t, sehingga barisan nilai
teramati (observable symbol) adalah
dengan T merupakan
panjang observasi.
Dengan menggunakan notasi-notasi tersebut,
maka suatu HMM dapat dilambangkan dengan
.
Secara umum, terdapat tiga permasalahan
yang berkaitan dengan HMM, yaitu (Rabiner
1989):

Gambar 8 HMM model ergodic.

1. Masalah 1 (Evaluation) : Untuk suatu
tertentu, ingin diketahui
, yaitu peluang munculnya barisan
Masalah ini dapat
diselesaikan dengan menggunakan algoritme
forward dan algoritme backward.

5

2. Masalah 2 (Decoding) : Untuk suatu
dan barisan observasi
tertentu, bagaimana kita
memilih
barisan
dari
state
yang optimal, yaitu yang
paling besar kemungkinannya menghasilkan
. Untuk penyelesaian masalah ini,
algoritme Viterbi dapat memudahkan untuk
menemukan barisan state tersebut.
3. Masalah 3 (Learning) : Permasalahan
mengenai bagaimana kita melakukan
pendugaan parameter-parameter model
HMM,
, sehingga
atau
maksimum. Permasalahan ini
dapat diselesaikan dengan menggunakan
algoritme Baum-Welch.

digunakan untuk menduga nilai
.
Perbedaannya dengan algoritme forward adalah
algoritme ini menentukan peubah
pada
masing-masing state dan waktu. Beberapa
langkah yang terdapat pada algoritme backward
adalah sebagai berikut (Rabiner 1989):
1. Inisialisasi:
, dengan

.

2. Induksi:


dengan

,
dan

.

Ilustrasi untuk algoritme backward dapat dilihat
pada Gambar 11.

Algoritme Forward
Algoritme forward merupakan suatu
algoritme yang digunakan untuk menduga nilai
dari suatu HMM
. Pada
algoritme ini didefinisikan peubah
yang
digunakan dalam proses perhitungan
.
Algoritme ini meliputi beberapa langkah, di
antaranya (Rabiner 1989):
1. Inisialisasi:
, dengan 1

.

2. Induksi:

dengan

Gambar 11 Ilustrasi alur algoritme backward.
Algoritme Baum-Welch

[∑

dan

]

,
.

3. Terminasi:

dengan

.



,

Ilustrasi untuk algoritme forward dapat dilihat
pada Gambar 10.

Algoritme Baum-Welch merupakan salah
satu algoritme yang digunakan untuk
menyelesaikan masalah learning pada HMM.
Algoritme ini melibatkan algoritme forward
dan algoritme
untuk menentukan
. Untuk
backward untuk menentukan
menggambarkan prosedur update parameter
HMM, diperlukan variabel
yang
merupakan peluang berada pada state pada
waktu , dan state pada waktu
dan
merepresentasikan peluang berada di state
pada waktu . Secara matematis nilai
dan
dapat diformulasikan dengan
persamaan berikut (Rabiner 1989):


. (1)



.



Gambar 10 Ilustrasi alur algoritme forward.
Algoritme Backward
Algoritme backward merupakan algoritme
lain selain algoritme forward yang dapat

(2)

Dengan menggunakan persamaan (1) dan
(2), maka persamaan untuk meng-update
parameter-parameter (A, B, π) pada HMM
dapat dirumuskan sebagai berikut:

̅

, 1 ≤ i ≤ N.

6



̅
̂

{

̂




̅





.





Ilustrasi mengenai algoritme
dapat dilihat pada Gambar 12.

dengan

Baum-Welch

,



.



, maka

ketika
terdefinisi.

menjadi tidak

Untuk menghindari nilai tak terdefinisi pada
setiap iterasi maka dilakukan proses scaling.
Fungsi ini bertujuan untuk mengubah nilai-nilai
pada setiap state sehingga lebih rasional. Proses
ini melibatkan nilai koefisien c pada setiap state
t yang diperoleh dari persamaan:


.

Nilai
tersebut kemudian digunakan untuk
menransformasi nilai ̂ dan ̂ dengan rumus
(Rabiner 1989):
Gambar 12 Ilustrasi perhitungan pada algoritme
Baum-Welch (Rabiner 1989).
Gaussian Multivariate
Distribusi Gaussian dikenal juga dengan
distribusi
normal.
Distribusi
Gaussian
merupakan suatu fungsi yang diparameterisasi
oleh mean (nilai rata-rata) dan
variance,
dimana distribusi tersebut mengkarakterisasikan
rata-rata sebaran dari mean (Jurafsky 2007).
State pada sebuah HMM bersifat tersembunyi,
sehingga kita tidak dapat mengetahui secara
pasti vektor observasi Ot mana yang dihasilkan
oleh state yang mana.
Untuk mengatasi permasalahan di atas maka
digunakanlah distribusi Gaussian Multivariate
untuk menghitung nilai probabilitas simbol
yang diobservasi Ot saat waktu t bila diketahui
bahwa ia berada di state i. Adapun persamaan
yang digunakan ialah sebagai berikut:
bi(Ot) =
Scaling



̂

.

̂

.

METODE PENELITIAN
Kerangka Pemikiran
Penelitian ini dibagi ke dalam beberapa
tahapan, yaitu studi pustaka, identifikasi
masalah, perancangan, implementasi, pengujian,
dan dokumentasi. Alur metode penelitian dapat
dilihat pada Gambar 13.
Studi Pustaka

Identifikasi Masalah

Perancangan

exp(- (Ot - µ i)T ∑i-1 (Ot - µ i)).

Pada proses perhitungan parameter, terutama
pada saat proses re-estimation (algoritme
Baum-Welch), seringkali menghasilkan nilai
yang sangat kecil hingga mendekati nilai nol.
Hal ini menjadi masalah penting, ketika proses
komputasi terdapat operasi pembagian dimana
nilai pembaginya mendekati nol, misalkan
untuk proses perhitungan di bawah ini:

Implementasi

Pengujian

Dokumentasi

Gambar 13 Metode penelitian.

7

Studi Pustaka

Pengambilan Data

Mulai

Studi pustaka dilakukan untuk mengetahui
informasi yang dibutuhkan selama penelitian
serta memahami langkah-langkah yang harus
dilakukan dalam metode penelitian. Referensireferensi yang digunakan pada penelitian ini
dapat dilihat pada daftar pustaka.

Praproses

Ekstraksi Ciri dengan MFCC

Data Latih

Data Uji

Identifikasi Masalah
Pada tahap ini akan dilakukan identifikasi
masalah yang mencakup apa saja kebutuhan
dalam membangun sebuah sistem robot mobil
kendali suara. Identifikasi ini meliputi
identifikasi sistem pengenalan suara, rangkaian
elektronik penunjang sistem, serta penyesuaian
rancangan mekanik robot mobil.

Pemodelan / Inisialisasi

Pelatihan Model HMM

HMM
repository

Perancangan

Init Serial

Pengujian

Text / ASCII

1. Perancangan Sistem Pengenalan Ucapan
Pada tahap ini dirancang sebuah aplikasi
pengenalan ucapan yang terdiri atas dua bagian,
yaitu bagian pengenalan ucapan dan pengiriman
data ke robot seperti yang ditunjukkan pada
Gambar 14.

Kirim Data
(bit)
Tidak

Baca Data
di Mikon

2. Perancangan Elektrik
Data dikirim
sama dengan
diterima

Pada tahap ini dirancang sebuah rangkaian
elektronik yang akan digunakan untuk
mengimplementasikan sebuah sistem kendali
robot mobil dengan suara. Rangkaian elektronik
dalam perancangan ini terbagai ke dalam tiga
bagian, yaitu:

Ya
Kirim Kode
Pengontrolan

a. Rangkaian mikrokontroler
Selesai

Rangkaian ini berfungsi untuk mengatur
kinerja dari seluruh rangkaian yang saling
terhubung satu sama lain.

Gambar 14 Diagram alir aplikasi pengenalan
ucapan.

b. Rangkaian driver motor dc

4. Perancangan Mekanik

Rangkaian ini berfungsi untuk mengatur
gerak kedua motor dc pada robot mobil.
Motor depan akan diatur untuk bergerak ke
kanan dan ke kiri, sedangkan motor
belakang diatur untuk bergerak maju dan
mundur.

Pada tahap ini dilakukan penyesuaian
mekanik robot mobil untuk penempatan
rangkaian elektronik yang telah dibuat dengan
sedikit pemotongan pada chasing mobil.

c. Rangkaian serial

Pada tahap ini dilakukan penyesuaian
antarmuka
aplikasi
untuk
melakukan
serangkaian pengujian sistem pengenalan
ucapan.

Rangkaian
ini
berfungsi
sebagai
jembatan komunikasi untuk pengiriman data
antara komputer dan robot mobil yang
terhubung ke port COM1/COM2.
3. Perancangan Mekanik
Pada tahap ini dilakukan penyesuaian
mekanik robot mobil untuk penempatan
rangkaian elektronik yang telah dibuat dengan
sedikit pemotongan pada chasing mobil.

5. Perancangan Antarmuka Aplikasi

Implementasi
Hasil perancangan sistem pengenalan
ucapan dan elektrik diimplementasikan menjadi
sebuah sistem yang saling terhubung satu sama
lain.

8

Pengujian
Pengujian sistem bertujuan untuk melihat
akurasi pengenalan ucapan, serta mengetahui
waktu yang diperlukan untuk memberikan
respon gerak terhadap robot mobil.
Perhitungan tingkat akurasi pengenalan
ucapan dilakukan dengan membandingkan
jumlah output yang benar yang dihasilkan
sistem dengan jumlah seluruh data. Presentase
tingkat akurasi dihitung dengan fungsi berikut:
akurasi =





x 100%.

RANCANGAN DETAIL DAN
PEMBAHASAN
Perancangan
1. Perancangan Sistem Pengenalan Ucapan
Perancangan sistem pengenalan ucapan ini
terdiri atas proses pengambilan data, praproses,
ekstraksi ciri, pemodelan/inisialisasi, dan
pelatihan model.

Gambar 15 Variasi sinyal suara.
 Praproses
Data yang dihasilkan pada perekaman
merupakan data suara kotor, karena masih
terdapat silent atau jeda pada awal dan akhir
suara seperti pada Gambar 16.

 Pengambilan data
Pengambilan data suara dilakukan dengan
perekaman suara pada frekuensi sampel (Fs) 11
KHz selama satu detik untuk setiap kata, karena
frekuensi ini dapat meminimalisasi efek
aliasing saat konversi sinyal analog ke sinyal
digital (Do 1994).
Pengambilan data suara training dilakukan
dengan perekaman suara dengan lima orang
responden yang terdiri atas empat pria dan satu
wanita. Tiap responden melakukan perekaman
sebanyak sepuluh kali untuk setiap kata,
sehingga total data diperoleh 250 suara.
Masing-masing kata diucapkan dengan aksen
yang berbeda. Hal ini bertujuan agar sistem
mampu mengenali variasi suara kata yang
diberikan. Gambar 15 merupakan contoh variasi
sinyal suara kata „maju‟.
Tempat yang digunakan untuk proses
pengambilan suara dilakukan pada kondisi
ruangan dengan tingkat kebisingan yang rendah,
karena bila noise yang terdapat pada ruangan
terlalu besar dapat menyulitkan saat proses
pembersihan data suara.

Silent

Suara

Silent

Gambar 16 Data sinyal suara awal.
Pemrosesan awal data suara dilakukan
dengan menormalisasi amplitudo terlebih
dahulu, setelah itu dilakukan pendeteksian awal
dan akhir kata.
Normalisasi amplitudo dilakukan dengan
cara membagi semua nilai input dengan nilai
maksimum dari input itu sendiri. Dengan
demikian untuk semua sinyal masukan memiliki
nilai maksimum yang sama yaitu satu.
Deteksi awal dan akhir kata digunakan pada
proses untuk mendeteksi mulai sinyal ucapan
awal dan berakhir ketika sudah tidak diucapkan.
Dengan demikian tidak disalah artikan untuk
tiap sinyal yang masuk, proses ini disebut
dengan pembersihan data (cutting silent). Hasil
data suara dari praproses dapat dlihat pada
Gambar 17.

9

vektor pusat sebagai wakil dari keseluruhan
vektor yang ada.
{

Gambar 17 Data suara setelah praproses.
Apabila noise yang terdapat pada suara
terlalu besar, maka proses pembersihan data ini
tidak dapat berjalan dengan optimal seperti
yang terlihat pada Gambar 18. Hal ini
disebabkan sistem tidak mampu membedakan
lagi antara gelombang suara dengan noise dari
lingkungan. Noise juga dapat disebabkan dari
gangguan distorsi pada gelombang sinyal listrik
AC (Alternate Current) yang masuk melalui
power battery atau device lain.
1

Pengelompokan
berdasarkan
koefisien
cepstral dari satu jenis kata yang telah
didapatkan dari proses ekstraksi ciri di atas dan
jumlah cluster menunjukkan jumlah state yang
digunakan dalam model HMM yaitu tiga.
Proses ini diperlukan untuk mendapatkan nilai
awal parameter (A, B, ) yang dibutuhkan
dalam membangun sebuah model HMM. Nilai
B terdiri atas dua variabel yaitu μ dan ∑,
dimana μ adalah rata-rata nilai observasi setiap
state untuk setiap koefisien dan ∑ adalah ragam
nilai observasi untuk setiap state.



|∑

|

0.8
0.6
0.4
0.2

|

-0.4
-0.6
-0.8
-1
0

2000

4000

6000

8000

10000

12000

Gambar 18 Data suara dengan cut silent yang
tidak optimal.
 Ekstraksi ciri
Tahap berikutnya adalah ekstraksi ciri sinyal
suara menggunakan metode MFCC. Pada
penelitian ini, proses MFCC diimplementasikan
dengan menggunakan toolbox yang telah
tersedia, yaitu auditory toolbox yang
dikembangkan oleh Stanley pada tahun 1998.
Dalam penggunaannya, fungsi ini memerlukan
beberapa parameter yaitu time frame yang
digunakan sebesar 30 ms, dimana terjadi
overlap sebanyak 50% antara satu frame dengan
frame selanjutnya. Banyaknya koefisien
cepstral yang diinginkan sebagai output adalah
13,
jadi
masing-masing
frame
akan
menghasilkan vektor ciri Ot yang terdiri dari 13
koefisien cepstral.
 Pemodelan / Inisialisasi
Proses inisialisasi HMM dimulai dengan
pengelompokan (clustering) menggunakan
metode k-means untuk membuat beberapa

|

|





0
-0.2

|






,

















|,

|.

Pada penelitian ini hanya digunakan satu
macam jumlah state, yaitu tiga state HMM
untuk setiap katanya dan digunakan lima kata,
sehingga hasil inisialisasi HMM ialah sebanyak
lima macam HMM (A, B, ).
 Pelatihan model
Pelatihan
HMM
dilakukan
dengan
menggunakan
algoritme
Baum-Welch.
Algoritme
Baum-Welch
merupakan
penggabungan dua buah algoritme yaitu
algoritme Forward dan Backward, dimana
metode distribusi Gaussian diperlukan dalam
perhitungan kedua algoritme ini.
Hasil perhitungan algoritme Baum-Welch
sering kali menghasilkan nilai yang sangat kecil
hingga mendekati nol (0). Untuk mengatasi hal
tersebut perlu digunakan fungsi scaling. Fungsi
ini berguna untuk menskalakan nilai Alfa (α)
dan Beta ( ) yang dihasilkan agar menghindari
nilai nol pada penyebut saat pembagian. Nilai
variabel α dan yang dihasilkan dari algoritme
Forward dan Backward digunakan untuk

10

menghasilkan variabel dan ξ yang kemudian
akan digunakan untuk meng-update nilai
parameter HMM (A, B, ).
2. Perancangan Elektrik
Dalam perancangan elektrik, tiap-tiap
rangkaian elektronik akan terintegrasi dengan
program-program yang akan mengatur kinerja
dari keseluruhan rangkaian. Program-program
tersebut dimasukkan ke dalam rangkaian
elektronik dengan menggunakan kompilator
CodeVision AVR 1.25.9. Terdapat tiga
rangkaian yang diperlukan untuk membangun
sistem robot mobil kendali suara ini, yaitu:

Port
PortC
PortD

Input / Output
Output
Output

Interface
LED
Motor DC

 Rangkaian serial
Pada komunikasi serial dibutuhkan suatu
port sebagai saluran data, port serial yang
digunakan pada penelitian ini ialah port serial
DB9 (9 pin) yang berpasangan (male dan
female) seperti yang ditunjukkan pada Gambar
20 berikut.

 Rangkaian mikrokontroler
Rangkaian mikrokontroler merupakan blok
kendali dari alat, karena seluruh proses input
dan output-nya dilakukan pada blok rangkaian
ini.
Pada
penelitian
ini
digunakan
mikrokontroler berbasis AVR 8-bit ATMega16
dengan kemasan 40 pin DIP (Dual Inline
Package) seperti yang ditunjukkan pada
Gambar 19.

Gambar 20 (a) Port DB9 male, (b) Port DB9
female.
Pada dasarnya standar komunikasi serial
untuk komputer menggunakan level RS-232.
RS-232 mempunyai standar tegangan yang
berbeda dengan serial port mikrokontroler yaitu
level tegangan TTL. Oleh sebab itu, diperlukan
sebuah pengubah level tegangan dari TTL ke
RS-232. IC yang paling mudah dan sering
digunakan ialah IC MAX232. Di dalam IC ini
terdapat charge pump yang bisa menghasilkan
+10 Volt dan -10 Volt dari sumber tegangan +5
volt. Tegangan ini dihasilkan dari proses
pengisian dan pembuangan empat kapasitor luar
yang dihubungkan dengan rangkaian pengganda
tegangan internal yang dimiliki IC ini.
 Rangkaian driver motor dc

Gambar 19 Pin-pin ATMega16 kemasan 40
pin.
Pada mikrontroler AVR ATMega16, pin
PD0 dan PD1 digunakan untuk komunikasi
serial UART yang berfungsi untuk melakukan
pertukaran data atau komunikasi dua arah. PD0
(RXD) berfungsi untuk menerima data dari
komputer/perangkat lainnya, dan PD1 (TXD)
berfungsi
untuk
mengirim
data
ke
komputer/perangkat lainnya.
Pada perancangan robot mobil ini digunakan
PortB, PortC, dan PortD. Untuk lebih jelasnya
penggunaan port mikrokontroler terlihat seperti
pada Tabel 1 berikut.
Tabel 1 Penggunaan port mikrokontroler.
Port

Input / Output

Interface

PortB

Input

Downloader
Connector

Sebuah rangkaian driver motor dc terdiri
atas komponen-komponen sebagai berikut,
yaitu: sebuah ic h-bridge motor driver L298,
dua belas buah resistor 10 ohm sebagai r-sense,
delapan buah dioda 1N4002, dua buah kapasitor
100nF, dan empat buah LED sebagai indicator.
Semua komponen tersebut kemudian dirangkai
menjadi sebuah rangkaian driver motor yang
akan mengendalikan pergerakan kedua motor dc
pada mobil.
Gerak kedua motor dc akan ditentukan dari
input yang diberikan pada L298.Terdapat enam
jalur input pada L298 yang terdiri atas input
data arah pergerakan motor dan input untuk
PWM (Pulse Width Modulation). Kecepatan
motor akan diatur melalui variasi lebar pulsa
yang diberikan oleh mikrokontroler sebagai
input PWM. Dalam mengatur arah pergerakan
motor, terdapat beberapa kemungkinan kondisi
input dapat diberikan pada L298 sesuai dengan
Tabel 2 dan Tabel 3.

11

Tabel 2 Arah pergerakan motor depan.
INPUT
EnA = H Dir1A = 0
Dir2A = 1
Dir1A = 1
Dir2A = 0
EnA = L
L = Low

Dir1A = Dir2A
Dir1A = X
Dir2A = X
H = High

FUNCTION
Left
Right
Fast motor stop
Free Running
Motor stop
X = Don’t care

Tabel 3 Arah pergerakan motor belakang.
INPUT
EnA = H Dir1B = 1

EnA = L
L = Low

Dir2B = 0
Dir1B = 0
Dir2B = 1
Dir1B = Dir2B
Dir1B = X
Dir2B = X
H = High

FUNCTION
Forward
Reverse

Gambar 22 Penempatan rangkaian sistem robot
mobil.
Penambahan power supply berupa battery
12V 2100 mA yang berukuran lebih besar dari
sebelumnya, menyebabkan battery supply box
tidak dapat digunakan. Oleh karena itu,
diperlukan pemotongan pada bagian bawah
chasing mobil agar penempatan battery tetap
berada pada battery supply box seperti yang
terlihat pada Gambar 23 berikut.

Fast motor stop
Free Running
Motor stop
X = Don’t care

Bentuk fisik dari rangkaian sistem robot
mobil yang telah selesai dibangun ditunjukkan
oleh Gambar 21 di bawah ini.

Gambar 23 Penempatan power supply.
4. Perancangan Antarmuka Aplikasi

Gambar 21 Bentuk fisik rangkaian sistem robot
mobil.
3. Perancangan Mekanik
Penyesuaian mekanik dilakukan agar robot
mobil dapat berjalan dengan baik. Rangkaian
sistem elektronik yang telah siap digunakan
diletakkan pada rangka bagian atas, seperti yang
ditunjukkan pada Gambar 22. Pemilihan rangka
bagian atas disebabkan oleh bagian tersebut
mampu menyediakan akses yang bagus untuk
mengendalikan kedua motor dc.

Perancangan antarmuka pada penelitian ini
ditujukan untuk memberikan kemudahan
kepada administrator dalam melakukan
pengujian. Pada tampilan antarmuka sistem
pengenalan ucapan terdapat menu data testing
serta tombol Connect dan Disconnect seperti
yang terlihat pada Gambar 24. Kedua tombol ini
berfungsi
untuk
menghubungkan
dan
memutuskan koneksi antara port serial pada
komputer dengan program Matlab. Pada menu
data testing terdapat dua kategori pilihan yaitu
Open File dan Record. Tombol Browse pada
kategori Open File berfungsi untuk mencari file
suara berekstensi .wav yang terdapat pada
komputer, sedangkan tombol Record pada
kategori Record berfungsi untuk mengambil
sinyal suara secara langsung.

12

Gambar 26 Implementasi sistem robot kendali
suara.
Gambar 24 Tampilan antarmuka program
sistem pengenalan ucapan.
Implementasi
Pengembangan sistem pengenalan ucapan
ini menggunakan b