i TUGAS AKHIR - Aplikasi hidden markov model pada pintu geser berbasis suara = The application of hidden markov model in sliding door based on human voice - USD Repository
TUGAS AKHIR
APLIKASI HIDDEN MARKOV MODEL PADA PINTU GESER BERBASIS SUARA Diajukan untuk memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Teknik
Program Studi Teknik Elektro
Oleh :
ARYADITA WIJAYA
065114008
PROGRAM STUDI TEKNIK ELEKTRO
FAKULTAS SAINS DAN TEKNOLOGIUNIVERSITAS SANATA DHARMA
YOGYAKARTA
2011
FINAL PROJECT
THE APPLICATION OF HIDDEN MARKOV MODEL
IN SLIDING DOOR BASED ON HUMAN VOICE
Presented as Partial Fulfillment of the Requirements
To Obtain the Sarjana Teknik Degree
In Study Program of Electrical Engineering
By:
ARYADITA WIJAYA
065114008
ELECTRICAL ENGINEERING STUDY PROGRAM
SCIENCE AND TECHNOLOGY FACULTY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2011
HALAMAN PERSETUJUAN
HALAMAN PENGESAHAN
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa tugas akhir ini tidak memuat katya
atau bagian karya orang lain, kecuali yang telah saya sebutkan dalam kutipan dan daftar
pustaka sebagaiman layaknya dalam karya ilmiah.Yogyakarta,25 Agustus 2011 Aryadita Wijaya
HALAMAN PERSEMBAHAN DAN MOTO HIDUP
K ehidupan seseorang tidak berakhir saat ia gagal, kehidupannya berakhir saat ia berhenti dan tidak mau berjuang lagi
K arya ini ku persembahkan untuk : Tuhan Y esus-ku, panutan sekaligus sumber kekuatan-ku K edua orang tua-ku
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma : Nama : Aryadita WijayaNIM : 065114008
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma karya ilmiah saya yang berjudul :
APLIKASI HIDDEN MARKOV MODEL
PADA PINTU GESER BERBASIS SUARA
Beserta perangkat yang diperlukan ( bila ada ). Dengan demikian saya memberikan kepada
Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam
bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikan secara
terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis
tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap
mencantumkan nama saya sebagai penulis.Demikian pernyataan ini yang saya buat dengan sebenarnya.
Yogyakarta,25 Agustus 2011 ( Aryadita Wijaya )
INTISARI
Salah satu aplikasi yang dapat digunakan untuk proses pengolahan suara adalahspeech recognition . Speech recognition merupakan upaya agar manusia dan mesin dapat
berkomunikasi dengan media suara. Metode yang sering digunakan dalam pengolahan
suara atau ucapan adalah Jaringan Saraf Tiruan (JST) dan Hidden Markov Model (HMM).
Aplikasi Hidden Markov Model pada pintu geser berbasis suara ini akan menghasilkan
sebuah sistem penggerakan prototype pintu geser yang diaktifkan menggunakan suara
manusia. Pintu geser hanya aktif jika menerima masukan berupa kata dari orang yang sama
seperti yang telah tersimpan di dalam sistem.HMM sendiri merupakan suatu sistem yang memodelkan simbol ke dalam suatu
mesin finite state (keadaan yang terbatas), sehingga diketahui simbol apa yang dapat
mewakili sebuah parameter vektor dari sebuah kata yang dimasukkan ke dalam mesin dan
diestimasi berulang-ulang hingga dihasilkan parameter observasi dengan mean dan
kovarian yang konvergen untuk setiap statenya.Aplikasi Hidden Markov Model pada pintu geser berbasis suara ini sudah berhasil
dibuat namun belum dapat bekerja dengan maksimal. Sistem yang dibuat belum dapat
mendeteksi orang yang menggunakan sistem ini. Namun sistem sudah dapat membedakan
kata masukan atau password yang dimasukkan oleh user. Tingkat akurasi sistem pada
proses pemodelan yaitu sebesar 95% dan pada proses pengenalan yaitu sebesar 91,667%.
ABSTRACT
Speech recognition is one of an application for voice recognition. Speechrecognition is an effort to make human and machine can be communicate. Several methods
that can be used in the voice processing is artificial neural networks and Hidden Markov
Models. The application of Hidden Markov Model in sliding door based on human voice
produce a sliding door actuating system that uses voice activated. Sliding doors will be
active if it receives input from the people of the same as stored in the systemHMM is a system that can be a model of the symbol into a finite state machine, and
then know what the symbol represents the parameter vector of a word and it will be
estimated repeatedly until the resulting parameters of observations with mean and variance
for each state.This application has been successfully to build, but it could not work with the
maximum. This system can not distinguish the user's system, but the system is able to
recognize the input word being entered by the user. The level of accuracy obtained is 95%
for modeling process and 91,667% for the recognition process.KATA PENGANTAR
Puji dan syukur kepada Tuhan Yang Maha Esa atas berkat dan rahmatNya yang melimpah sehingga penulis dapat menyelesaikan Laporan Tugas Akhir ini. Pada kesempatan ini penulis ingin menyampaikan terimakasih kepada semua pihak
yang sudah membantu dalam penyelesaian skripsi ini, sehingga skripsi ini dapat
terselesaikan dengan baik. Ucapan terima kasih ini saya sampaikan terutama kepada.1. Bapak Yosef Agung Cahyanta, S.T., M.T., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.
2. Ibu B.Wuri Harini, S.T., M.T., selaku Ketua Jurusan Teknik Elektro Universitas Sanata Dharma dan Dosen Pembimbing TA. Terima kasih atas bimbingan yang selama ini telah diberikan kepada saya.
3. Ibu Ir.Th.Prima Ari, M.T. selaku Dosen Pembimbing Akademik Teknik Elektro angkatan 2006.
4. Seluruh Dosen Teknik Elektro yang selama lima tahun ini telah membagikan ilmunya yang sangat berguna kepada saya.
5. Seluruh Staff Universitas Sanata Dharma, yang atas kerja kerasnya, membuat perkuliahan menjadi terasa nyaman.
6. Bapak, Ibu dan Kakak yang telah memberikan banyak doa, semangat, dukungan baik moril maupun finansial serta cinta yang begitu besar, selalu ada dan tak akan pernah berhenti.
7. Dominikus Catur Edi Wasesa yang telah memberikan support, semangat, dukungan sehingga TA ini dapat selesai.
8. Serta semua pihak yang telah membantu kelancaran dalam penulisan tugas akhir ini. Saya mengucapkan banyak terima kasih.
Penulis menyadari bahwa masih banyak kekurangan yang terdapat pada laporan
tugas akhir ini. Saran dan kritik sangat penulis harapkan untuk perbaikan-perbaikan dimasa
yang akan datang. Akhir kata, penulis berharap tulisan ini bermanfaat bagi kemajuan dan
perkembangan ilmu pengetahuan serta berbagai pengguna pada umumnya.Yogyakarta,25 Agustus 2011 Aryadita Wijaya
DAFTAR ISI
HALAMAN JUDUL ........................................................................................................ i
HALAMAN JUDUL DALAM BAHASA INGGRIS..................................................... ii HALAMAN PERSETUJUAN
....................................................................................... iii
HALAMAN PENGESAHAN .........................................................................................iv
PERNYATAAN KEASLIAN KARYA........................................................................... v HALAMAN PERSEMBAHAN DAN MOTO HIDUP
..................................................vi
LEMBAR PERNYATAAN PERSETUJUAN .............................................................. vii
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS................. vii
INTISARI ..................................................................................................................... viii
ABSTRACT ....................................................................................................................ix
KATA PENGANTAR ...................................................................................................... x
DAFTAR ISI...................................................................................................................xi
DAFTAR GAMBAR ..................................................................................................... xiv
DAFTAR TABEL ......................................................................................................... xvi
BAB I PENDAHULUAN................................................................................................. 1
1.1. Latar Belakang ..................................................................................................... 1
1.2. Tujuan dan Manfaat ............................................................................................. 2
1.3. Batasan Masalah .................................................................................................. 2
1.4. Metodologi Penelitian .......................................................................................... 3
BAB II LANDASAN TEORI ........................................................................................... 5
2.1. Suara ................................................................................................................... 5
2.2. MFCC (Mel Frequency Cepstrum coefficients) .................................................... 6
2.2.1 Konversi Analog Menjadi Digital ................................................................. 8
2.2.2 Pre-emphasize Filtering ................................................................................ 9
2.2.3 Frame Blocking .......................................................................................... 10
2.2.4 Windowing ................................................................................................. 11
2.2.5 Analisis Fourier .......................................................................................... 14
2.2.6 Discrete Fourier Transform (DFT) .............................................................. 15
2.2.7 Fast Fourier Transform (FFT) ..................................................................... 16
2.2.8 Mel Frequency Warping ............................................................................. 18
2.2.9 Discrete Cosine Transform (DCT) .............................................................. 20
2.2.10 Cepstral Liftering ........................................................................................ 21
2.3. Hidden Markov Model (HMM) .......................................................................... 22
2.3.1 Observasi .................................................................................................... 22
2.3.2 Inisialisasi ................................................................................................... 23
2.3.3 Estimasi ...................................................................................................... 24
3.5.3 Motor Servo ................................................................................................ 50
3.4.1.1. Pengenalan ................................................................................................... 46
3.4.1.2. Viterbi ........................................................................................................... 47
3.4.2 Subsistem Software Pada Mikrokontroler .................................................... 48
3.5. Subsistem Hardware .......................................................................................... 49
3.5.1 Perancangan Prototype Pintu Geser ............................................................ 49
3.5.2 Perancangan Pin Mikrokontroler ATmega8535 ........................................... 50
3.5.4 Indikator Kesalahan .................................................................................... 51
3.4. Subsistem Software ............................................................................................ 45
3.6. Komunikasi Serial RS232 .................................................................................. 51
3.7. Proses Evaluasi .................................................................................................. 52
3.7.1 Proses Evaluasi Subsistem Software............................................................ 52
3.7.2 Proses Evaluasi Subsistem Hardware ......................................................... 53
BAB IV HASIL DAN PEMBAHASAN ......................................................................... 54
4.1. Implementasi ..................................................................................................... 54
3.4.1 Subsistem Software Pada PC ....................................................................... 45
3.3.1 MFCC ........................................................................................................ 44
2.3.4 Rantai Markov ............................................................................................ 27
2.5. Mikrokontroler ATmega8535 ............................................................................ 33
2.3.5 Tipe HMM.................................................................................................. 27
2.3.6 Elemen HMM ............................................................................................. 28
2.3.7 Pengenalan Suara dengan HMM ................................................................. 29
2.3.8 Algoritma Baum Welch .............................................................................. 29
2.3.9 Algoritma Viterbi ....................................................................................... 31
2.4. Catu daya ........................................................................................................... 32
2.5.1 Timer0 ........................................................................................................ 33
3.3. Proses Pemodelan .............................................................................................. 43
2.5.2 Register pengendali Timer0 ........................................................................ 33
2.5.3 Mode operasi .............................................................................................. 35
2.6. Motor servo ....................................................................................................... 37
2.7. Komunikasi Serial RS232 .................................................................................. 37
BAB III RANCANGAN PENELITIAN ........................................................................ 41
3.1. Arsitektur Sistem ............................................................................................... 41
3.2. Diagram Alir Sistem .......................................................................................... 42
4.1.1 Implementasi Proses Pemodelan ................................................................. 55
4.1.2 Implementasi Antarmuka Subsistem Software............................................. 56
4.1.1.1 Halaman Utama .................................................................................................... 57
4.1.1.2 Halaman Sistem .................................................................................................... 57
4.1.1.3 Halaman Bant uan ................................................................................................. 62
4.1.3 Implementasi Antarmuka Subsistem Hardware .......................................... 63
4.1.4 Implementasi Komunikasi Subsistem Software dan Hardware .................... 64
4.2. Hasil Pengujian .................................................................................................. 65
4.2.1. Subsistem Software ..................................................................................... 65
4.2.2. Subsistem Hardware................................................................................... 72
BAB V KESIMPULAN DAN SARAN .......................................................................... 74
5.1. Kesimpulan ........................................................................................................ 74
5.2. Saran ................................................................................................................. 74
DAFTAR PUSTAKA ...................................................................................................... 75
DAFTAR GAMBAR
Gambar 2.1 Organ Pembetuk Suara Manusia[2] ................................................................. 5Gambar 2.2 Contoh sinyal suara [3] ................................................................................... 7Gambar 2.3 Blok diagram untuk MFCC [3] ....................................................................... 7Gambar 2.4 Proses pembentukan sinyal digital [3] ............................................................. 8Gambar 2.5 Contoh dari pre-emphasize pada sebuah frame [5] .......................................... 9Gambar 2.6 Magnitude response dari pre- emphasize filter untuk nilai α yang berbeda [5] 10Gambar 2.7 Short Term Spectral Analysis [5] ................................................................. 11Gambar 2.8 Bentuk gelombang dari Hamming dan Rectangular window beserta dengan
mnagnitude hasil dan proses FFT [5] ................................................................................ 13
Gambar 2.9 Contoh wideband spectrogram [5] ................................................................ 14Gambar 2.10 Contoh narrowband spectrogram [5] .......................................................... 14Gambar 2.11 Tiga Gelombang Sinusoidal dan Superposisinya [5] .................................... 15Gambar 2.12 Domain Waktu menjadi Domain Frekuensi [5] ........................................... 16Gambar 2.14 Pembagian sinyal suara menjadi dua kelompok [5] ..................................... 17Gambar 2.15 Magnitude dari rectangular dan triangular filterbank [5] .............................. 18Gambar 2.16 Prinsip Frekuensi Warping [5] .................................................................... 19Gambar 2.17 Triangular filterbank dengan mel scale [5] .................................................. 20Gambar 2.18 Perbandingan spectrum dengan dan tanpa cepstral liftering ........................ 21Gambar 2.19 State HMM ................................................................................................. 23Gambar 2.20 Algoritma Viterbi ........................................................................................ 24Gambar 2.21 Diagram alir untuk estimasi ........................................................................ 25Gambar 2.22 Contoh proses Pembelajaran dan Pengenalan .............................................. 27Gambar 2.23 Rantai Markov ............................................................................................ 27Gambar 2.24 HMM model ergodic .................................................................................. 28Gambar 2.25 HMM model Kiri-kanan ............................................................................. 28Gambar 2.26 ATmega8535 [11] ....................................................................................... 33Gambar 2.27 Pulsa PWM [11] ........................................................................................ 36Gambar 2.28 Pulsa Fast PWM [11] .................................................................................. 36Gambar 2.29 Konfigurasi Konektor DB9 [12] .................................................................. 38Gambar 2.30 Konfigurasi IC MAX232 [13] ..................................................................... 39Gambar 2.31 Perbedaan Level Tegangan TTL dan RS232 [14] ........................................ 39Gambar 3.1 Arsitektur umum ........................................................................................... 41Gambar 3.2 Diagram alir sistem ....................................................................................... 42Gambar 3.3 Proses Pemodelan ......................................................................................... 43Gambar 3.4 Diagram blok MFCC .................................................................................... 45Gambar 3.5 Cara kerja sistem .......................................................................................... 46Gambar 3.6 Proses Pengenalan ........................................................................................ 47Gambar 3.7 Proses Viterbi ............................................................................................... 48Gambar 3.8 Pengontrolan Penggerak............................................................................... 49Gambar 3.9 Konfigurasi kabel motor servo ...................................................................... 50Gambar 3.10 Rangkaian indikator kesalahan .................................................................... 51Gambar 3.11 Perancangan RS232 .................................................................................... 52Gambar 4.1 Implementasi Sistem ..................................................................................... 54Gambar 4.2 Halaman Utama ............................................................................................ 57Gambar 4.3 Halaman Sistem ............................................................................................ 58Gambar 4.4 Tampilan Text Informasi Mulai Rekam Suara ............................................... 59Gambar 4.5 Tampilan Text Informasi Perekaman Selesai ................................................. 59Gambar 4.6 Tampilan Text Informasi Hasil Pengenalan Buka .......................................... 61Gambar 4.7 Tampilan Text Informasi Hasil Pengenalan Tutup ......................................... 62Gambar 4.8 Halaman Bantuan.......................................................................................... 62Gambar 4.9 Tampilan Utama Sistem Hardware ............................................................... 63Gambar 4.10 Tampilan Pintu Geser pada Posisi Terbuka ................................................. 64Gambar 4.11 Tampilan Pintu Geser pada Posisi Tertutup ................................................. 64
DAFTAR TABEL
Tabel 1.1 Confusion Matrix. .............................................................................................. 4Tabel 2.1 Fungsi-fungsi window dan formulanya ............................................................. 12Tabel 2.2 Prescaler Timer0 .............................................................................................. 34Tabel 2.3 Mode operasi .................................................................................................... 34Tabel 2.4 Mode Fast PWM .............................................................................................. 34Tabel 2.5 Konfigurasi Pin dan Nama Bagian Konektor Serial DB9 [12] ........................... 38Tabel 3.1 Pin mikrokontroler yang digunakan ................................................................. 50Tabel 3.2 Confusion Matrix ............................................................................................. 53Tabel 4.1 Tingkat Akurasi Hasil Pengujian (dalam %) ..................................................... 66Tabel 4.2 Confusion Matrix Hasil Pengujian .................................................................... 66Tabel 4.3 Confusion matrix 5ms 11state dan 6ms 14state ................................................. 67Tabel 4.4 Confusion matrix 4ms 18state dan 6ms 18state ................................................. 67Tabel 4.5 Pengenalan untuk kombinasi window-size 5ms jumlah state 11 ........................ 69Tabel 4.6 Pengenalan untuk kombinasi window-size 6ms jumlah state 14 ........................ 69Tabel 4.7 Pengenalan untuk kombinasi window-size 4ms jumlah state 18 ........................ 70Tabel 4.8 Pengenalan untuk kombinasi window-size 6ms jumlah state 18 ........................ 70Tabel 4.9 Pengenalan untuk orang lain berjenis kelamin perempuan ................................ 71BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan dunia teknologi di bidang pengolahan suara mengalami
perkembangan yang cukup pesat. Saat ini sinyal informasi yang dikirimkan tidak hanya
berupa data teks tetapi juga suara manusia. Suara manusia sangat unik dan berbeda satu
sama lain sehingga memerlukan pengolahan secara khusus, yaitu dengan proses
pengolahan suara. Salah satu aplikasi yang dapat digunakan untuk proses pengolahan suara
adalah speech recognition. Speech recognition merupakan upaya agar manusia dan mesin
dapat berkomunikasi dengan media suara [1].Salah satu metode yang paling sering digunakan dalam pengenalan suara atau
ucapan adalah Jaringan Saraf Tiruan (JST) dan Hidden Markov Model (HMM). Dalam
speech recognition terdapat beberapa permasalahan yang sering muncul dan berbeda untuk
setiap permasalahannya misalnya kecepatan pengenalannya, ketepatan pengenalannya, dll.
Sebagian permasalahan ini telah dapat diatasi oleh julius speech recognition yaitu suatu
modul pengolahan sinyal wicara berkecepatan tinggi yang berbasis pada N-Gram dan
HMM accoustic model [1]. Saat ini telah terdapat HTK (Hidden Markov Model Toolkit)
yaitu suatu tool atau perangkat lunak yang mudah digunakan untuk membangun dan
memanipulasi HMM.HMM sendiri merupakan suatu sistem yang memodelkan simbol ke dalam suatu
mesin finite state (keadaan yang terbatas), sehingga diketahui simbol apa yang dapat
mewakili sebuah parameter vektor dari sebuah kata yang dimasukkan ke dalam mesin dan
diestimasi berulang-ulang hingga dihasilkan parameter observasi dengan mean dan
kovarian yang konvergen untuk setiap statenya. Dengan tool ini maka pembuatan sistem
pengenalan sinyal suara manusia dapat lebih bagus dan rapi (untuk setiap kata dari orang
yang berbeda dan logat dari orang yang berbeda pula).Berdasarkan hal di atas, penulis akan membuat sebuah otomatisasi untuk
pengoperasian pintu yang menggunakan teknologi pengolahan suara. Sistem otomatisasi
ini berupa pintu geser yang diaktifkan menggunakan suara manusia. Penggunaan suara
manusia sebagai kata kunci digunakan untuk menggantikan sistem kunci manual yang ada
saat ini. Penggunaan suara sebagai kata diharapkan akan mempermudah user karena tidak
perlu membawa kunci saat pergi meninggalkan rumah dan user juga tidak perlu khawatir
kunci tertinggal ataupun hilang.Hasil dari pembuatan sistem ini dapat melengkapi sistem smart house/ rumah pintar
yang kini banyak dikembangkan. Seperti yang diketahui, smart house/ rumah pintar
dirancang dan dibangun sebagai rumah impian masa depan. Rumah impian masa depan ini
menggunakan teknologi terkini, di mana semua yang ada dalam rumah tersebut dapat
dioperasikan secara otomatis.Dalam implementasinya sistem yang akan dibuat akan bekerja apabila user ingin
membuka pintu geser. Suara user akan diproses dan dicocokkan dengan suara yang telah
tersimpan dalam sistem. Jika suara user memiliki pola yang sama dengan pola suara yang
telah tersimpan maka sistem akan mengaktifkan pintu geser. Sedangkan jika pola suara
berbeda maka pintu geser tidak akan aktif.1.2. Tujuan dan Manfaat Tujuan dari penelitian ini adalah menghasilkan sebuah prototype pintu geser yang
diaktifkan menggunakan suara manusia. Pintu geser hanya aktif jika menerima masukan
berupa kata dari orang yang sama seperti yang telah tersimpan di dalam sistem. Manfaat
dari penelitian ini adalah sebagai pengganti sistem kunci manual.1.3. Batasan Masalah Batasan-batasan masalah dalam pengembangan sistem ini adalah sebagai berikut:
1. Proses pengolahan suara dilakukan oleh Personal Computer (PC)
2. Metode yang digunakan untuk proses pengenalan kata adalah Hidden Markov Model
(HMM ).
3. Metode yang digunakan untuk feature extraction (ekstraksi ciri) adalah Mel Frequency
Cepstrum Coeffisients (MFCC).4. Pintu yang dibuat berupa sebuah prototype pintu geser yang berukuran 8x18 cm.
5. Penggendalian pintu dilakukan menggunakan mikrokontroler ATmega8535.
6. Motor yang digunakan untuk menggerakkan pintu adalah motor servo.
7. Sistem bersifat dependent, artinya sistem hanya dapat digunakan oleh orang tertentu.
1.4. Metodologi Penelitian
Metodologi yang akan digunakan dalam pengembangan sistem ini adalah sebagai berikut:
a. Pengumpulan bahan-bahan referensi / studi pustaka Tahap ini bertujuan untuk mencari bahan-bahan referensi yang dapat digunakan
untuk menunjang kebutuhan sistem yang akan dibuat. Penulis akan mengumpulkan serta
meninjau berbagai bahan atau referensi yang terkait dengan metode HMM. b.Menentukan variabel yang terkait Tahap ini bertujuan untuk menemukan variabel-variabel yang terkait dandigunakan dalam pengembangan sistem. Pada tahap ini penulis mengambil contoh suara
user yang akan dijadikan sebagai model dari pengaktifan sistem.c. Perancangan subsistem hardware dan software Tahap ini bertujuan untuk mencari desain yang optimal dari sistem yang akan
dibuat dengan mempertimbangkan berbagai faktor permasalahan dan kebutuhan yang telah
ditentukan. Untuk perancangan subsistem hardware, penulis akan merancang prototype
pintu, peletakan motor penggerak, dan minimum sistem mikrokontroler. Untuk
perancangan subsistem software, penulis mempelajari dan menuliskan tentang speech
recognition , metode HMM yang memuat algoritma Baum Welch dan algoritma Viterbi,
feature extraction (ekstraksi ciri) yang menggunakan metode MFCC, dan blok diagram
pengolahan suara dan perancangan kontrol penggerak. d.Pembuatan subsistem hardware dan software Pada tahap ini penulis akan membuat subsistem hardware dan software. Subsistemhardware terdiri dari prototype pintu geser, mikrokontroler dan motor penggerak,
Subsistem software terdiri dari pengolahan suara dan kontrol penggerak. Pada proses
pengolahan suara, penulis menerapkan metode HMM ke dalam bahasa komputer sesuai
dengan desain yang telah disusun. Hasil dari proses ini adalah sebuah aplikasi yang dapat
mengidentifikasi suara user. Pada proses kontrol penggerak, penulis akan mengatur
pergerakan pintu, untuk membuka dan menutup sesuai dengan hasil identifikasi pada
proses pengolahan suara.e. Proses pengambilan data dan pengujian Pengambilan data dan pengujian sistem dilakukan menggunakan suara user dan
suara orang lain. Suara orang lain digunakan sebagai pembanding untuk menguji apakah
sistem dapat dibuka oleh orang lain selain user. Dalam proses ini digunakan 10 orang
sebagai sampel, 5 pria dan 5 wanita. Setiap sampel akan merekam suaranya sebanyak 10
kali untuk setiap kata yang digunakan sebagai kata sandi pengoperasian pintu. Pada
pengujian langsung dilakukan dengan menggunakan suara yang direkam pada saat itu juga.
f. Analisa dan penyimpulan hasil penelitian Analisa dilakukan dengan menggunakan confusion matrix untuk penghitungan
akurasi dari hasil pengujian sistem yang dibuat. Confusion matrix merupakan matrix
berbentuk bujur sangkar. Banyaknya kolom dan baris adalah sama yaitu sebanyak N,
dimana N adalah banyaknya model suara yang ada. Tabel 1.1 merupakan ilustrasi dari
confusion matrix .Tabel 1.1 Confusion Matrix.
Diagonal dari tabel 1.1 yang diblok merupakan gambaran dari jumlah data yang benar
dalam pengenalan. Persamaan yang digunakan untuk menghitung akurasi yaitu : jumlah data dikenal _ _ akurasi 100 % (1.1) jumlah _ data
Keakuratan sitem dapat dilihat dari tingkat akurasi dalam proses pengenalan kata.
BAB II LANDASAN TEORI 2.1. Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. Suara dapat
dihantarkan dengan media air, udara maupun benda padat. Dengan kata lain, suara adalah
gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara yang dapat
didengar oleh manusia berkisar antara 20 Hz sampai dengan 20KHz, dimana Hz adalah
satuan frekuensi yang berarti banyak getaran per detik (cps / cycle per second) [2].Perlengkapan produksi suara pada manusia terdapat pada gambar 2.1 yang secara
garis besar terdiri dari jalur suara (vocal track) dan jalur hidung (nasal track). Jalur suara
dimulai dari pita suara (vocal cords), celah suara (glottis) dan berakhir pada bibir. Jalur
hidung dimulai dari bagian belakang langit-langit (velum) dan berakhir pada cuping hidung
(nostrils).Gambar 2.1 Organ Pembetuk Suara Manusia[2] Proses terjadinya suara, dimulai dari udara masuk ke paru-paru melalui pernafasan,
kemudian melalui trakea, udara masuk ke batang tenggorok dimana dalam batang
tenggorok ini terdapat pita suara. Pita suara ini kemudian bergetar dengan frekuensi
tertentu karena adanya aliran udara tersebut sehingga dihasilkan suara. Suara yang
dihasilkan ini berbeda-beda bergantung pada posisi lidah, bibir, mulut dan langit-langit
pada saat itu.Suara yang dihasilkan terbagi menjadi tiga bagian yaitu voiced sound, unvoiced
sound serta plosive sound. Voiced sound terjadi jika pita suara bergetar dengan frekuensi
50 Hz sampai 250 Hz. Contoh voiced sound adalah bunyi pada kata ‘ah”, Unvoiced sound
teijadi jika pita suara tidak bergetar sama sekali. Contoh unvoiced sound ialah bunyi pada
kata “shh”. Sedangkan piosive sound terjadi jika pita suara tertutup sesaat dan kemudian
tiba-tiba membuka. Contoh plosive sound ialah bunyi “beh” pada kata benar dan “pah”
pada kata pasar [2].2.2. MFCC (Mel Frequency Cepstrum coefficients)
MFCC(Mel Frequency Cepstrum Coefficients) merupakan salah satu metode, yang
banyak digunakan dalam bidang speech technology, baik speaker recognition maupun
speech recognition. Metode ini digunakan untuk melakukan feature extraction (ekstraksi
ciri), sebuah proses yang mengkonversikan sinyal suara menjadi beberapa parameter.
Tujuan akhir dari proses feature extraction adalah pemberian parameter suara ke dalam
deretan feature vector yang berupa ringkasan dan informasi yang relevan dari suara
tersebut. Feature yang diekstrak diharapkan mampu membedakan suara yang serupa,
sehingga model dapat dibuat tanpa memerlukan data training yang besar. Keunggulan dari
metode ini adalah [3]:1. Mampu untuk menangkap karakteristik suara yang sangat penting bagi pengenalan suara atau dengan katalain, mampu menangkap informasi-informasi penting yang terkandung dalam sinyal suara.
2. Menghasilkan data seminimal mungkin, tanpa menghilangkan informasi-informasi penting yang ada.
3. Mereplikasi organ pendengaran manusia dalam melakukan persepsi terhadap sinyal suara.
Perhitungan yang dilakukan dalam MFCC menggunakan dasar dari perhitungan
short-tern analysis . Hal ini dilakukan mengingat sinyal suara yang bersifat quasi
stationary . Contoh dari sinyal suara dapat dilihat pada Gambar 2.2. Pengujian yang
dilakukan untuk periode waktu yang cukup pendek (sekitar 10 sampai 30 milidetik) akan
menunjukkan karakteristik sinyal suara yang stationary. Tetapi bila dilakukan dalam
periode waktu yang lebih panjang karakteristik sinyal suara akan terus berubah sesuai
dengan kata yang diucapkan.Gambar 2.2 Contoh sinyal suara [3] MFCC feature extraction merupakan adaptasi dan sistem pendengaran manusia,
dimana sinyal suara akan di-filter secara linear untuk frekuensi rendah (di bawah 1000 Hz)
dan secara logaritmik untuk frekuensi tinggi (di atas 1000 Hz). Berikut ini adalah blok
diagram untuk MFCC [3].Gambar 2.3 Blok diagram untuk MFCC [3]2.2.1 Konversi Analog Menjadi Digital
Sinyal-sinyal natural pada umumnya seperti sinyal suara merupakan sinyal
kontinyu dimana memiliki nilai yang tidak terbatas. Sedangkan pada komputer, semua
sinyal yang dapat di proses oleh komputer hanyalah sinyal diskrit atau sering dikenal
dengan isilah sinyal digital. Agar sinyal natural dapat diproses oleh komputer, maka harus
diubah terlebih dahulu dari data sinyal kontinyu menjadi sinyal diskrit. Hal itu dapat
dilakukan melalui tiga proses, diantaranya adalah proses pencuplikan data, proses
kuantisasi, dan proses pengkodean [3].Proses pencuplikan adalah suatu proses untuk mengambil data sinyal continue
untuk setiap periode tertentu. Dalam melakukan proses pencuplikan data, berlaku aturan
Nyquist, yaitu bahwa frekuensi pencuplikan (sampling rate) minimal harus 2 kali lebih
tinggi dari frekuensi maksimum yang akan di sampling. Jika sinyal pencuplikan kurang
dan 2 kali frekuensi maksimum sinyal yang akan di sampling, maka akan timbul efek
aliasing . Aliasing adalah suatu efek dimana sinyal yang dihasilkan memiliki frekuensi
yang berbeda dengan sinyal aslinya.Proses kuantisasi adalah proses untuk membulatkan nilai data ke dalam bilangan-
bilangan tertentu yang telah ditentukan terlebih dahulu. Semakin banyak level yang dipakai
maka semakin akurat pula data sinyal yang disimpan tetapi akan menghasilkan ukuran data
besar dan proses yang lama. Proses pengkodean adalah proses pemberian kode untuk tiap-
tiap data sinyal yang telah terkuantisasi berdasarkan level yang ditempati [3].Berikut adalah gambaran contoh proses pembentukan sinyal digital.
Gambar 2.4 Proses pembentukan sinyal digital [3]2.2.2 Pre-emphasize Filtering
Pre-emphasize merupakan salah satu jenis filter yang sering digunakan sebelum
sebuah sinyal diproses lebih lanjut. Filter ini mempertahankan frekuensi-frekuensi tinggi
pada sebuah spektrum yang umumnya tereliminasi pada saat proses produksi suara. Tujuan
dan pre-emphasize filter ini adalah:1. Mengurangi noise ratio pada sinyal, sehingga dapat meningkatkan kualitas sinyal [1, 4] .
2. Menyeimbangkan spektrum dari voiced sound [5, 6]. Pada saat memproduksi voiced sound , glottis manusia menghasilkan sekitar -12 dB octave slope. Namun ketika energi akustik tersebut dikeluarkan melalui bibir, terjadi peningkatan sebesar