i TUGAS AKHIR - Aplikasi hidden markov model pada pintu geser berbasis suara = The application of hidden markov model in sliding door based on human voice - USD Repository

  

TUGAS AKHIR

APLIKASI HIDDEN MARKOV MODEL PADA PINTU GESER BERBASIS SUARA Diajukan untuk memenuhi Salah Satu Syarat

  

Memperoleh Gelar Sarjana Teknik

Program Studi Teknik Elektro

Oleh :

  

ARYADITA WIJAYA

065114008

PROGRAM STUDI TEKNIK ELEKTRO

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

  

2011

  

FINAL PROJECT

THE APPLICATION OF HIDDEN MARKOV MODEL

IN SLIDING DOOR BASED ON HUMAN VOICE

  

Presented as Partial Fulfillment of the Requirements

To Obtain the Sarjana Teknik Degree

In Study Program of Electrical Engineering

  

By:

ARYADITA WIJAYA

065114008

ELECTRICAL ENGINEERING STUDY PROGRAM

  

SCIENCE AND TECHNOLOGY FACULTY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2011

HALAMAN PERSETUJUAN

  

HALAMAN PENGESAHAN

PERNYATAAN KEASLIAN KARYA

  Saya menyatakan dengan sesungguhnya bahwa tugas akhir ini tidak memuat katya

atau bagian karya orang lain, kecuali yang telah saya sebutkan dalam kutipan dan daftar

pustaka sebagaiman layaknya dalam karya ilmiah.

  Yogyakarta,25 Agustus 2011 Aryadita Wijaya

HALAMAN PERSEMBAHAN DAN MOTO HIDUP

  K ehidupan seseorang tidak berakhir saat ia gagal, kehidupannya berakhir saat ia berhenti dan tidak mau berjuang lagi

  K arya ini ku persembahkan untuk : Tuhan Y esus-ku, panutan sekaligus sumber kekuatan-ku K edua orang tua-ku

  

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma : Nama : Aryadita Wijaya

  NIM : 065114008

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma karya ilmiah saya yang berjudul :

  

APLIKASI HIDDEN MARKOV MODEL

PADA PINTU GESER BERBASIS SUARA

Beserta perangkat yang diperlukan ( bila ada ). Dengan demikian saya memberikan kepada

Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam

bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikan secara

terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis

tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap

mencantumkan nama saya sebagai penulis.

  Demikian pernyataan ini yang saya buat dengan sebenarnya.

  Yogyakarta,25 Agustus 2011 ( Aryadita Wijaya )

  

INTISARI

Salah satu aplikasi yang dapat digunakan untuk proses pengolahan suara adalah

speech recognition . Speech recognition merupakan upaya agar manusia dan mesin dapat

berkomunikasi dengan media suara. Metode yang sering digunakan dalam pengolahan

suara atau ucapan adalah Jaringan Saraf Tiruan (JST) dan Hidden Markov Model (HMM).

Aplikasi Hidden Markov Model pada pintu geser berbasis suara ini akan menghasilkan

sebuah sistem penggerakan prototype pintu geser yang diaktifkan menggunakan suara

manusia. Pintu geser hanya aktif jika menerima masukan berupa kata dari orang yang sama

seperti yang telah tersimpan di dalam sistem.

  HMM sendiri merupakan suatu sistem yang memodelkan simbol ke dalam suatu

mesin finite state (keadaan yang terbatas), sehingga diketahui simbol apa yang dapat

mewakili sebuah parameter vektor dari sebuah kata yang dimasukkan ke dalam mesin dan

diestimasi berulang-ulang hingga dihasilkan parameter observasi dengan mean dan

kovarian yang konvergen untuk setiap statenya.

  Aplikasi Hidden Markov Model pada pintu geser berbasis suara ini sudah berhasil

dibuat namun belum dapat bekerja dengan maksimal. Sistem yang dibuat belum dapat

mendeteksi orang yang menggunakan sistem ini. Namun sistem sudah dapat membedakan

kata masukan atau password yang dimasukkan oleh user. Tingkat akurasi sistem pada

proses pemodelan yaitu sebesar 95% dan pada proses pengenalan yaitu sebesar 91,667%.

  

ABSTRACT

Speech recognition is one of an application for voice recognition. Speech

recognition is an effort to make human and machine can be communicate. Several methods

that can be used in the voice processing is artificial neural networks and Hidden Markov

Models. The application of Hidden Markov Model in sliding door based on human voice

produce a sliding door actuating system that uses voice activated. Sliding doors will be

active if it receives input from the people of the same as stored in the system

  HMM is a system that can be a model of the symbol into a finite state machine, and

then know what the symbol represents the parameter vector of a word and it will be

estimated repeatedly until the resulting parameters of observations with mean and variance

for each state.

  This application has been successfully to build, but it could not work with the

maximum. This system can not distinguish the user's system, but the system is able to

recognize the input word being entered by the user. The level of accuracy obtained is 95%

for modeling process and 91,667% for the recognition process.

KATA PENGANTAR

  Puji dan syukur kepada Tuhan Yang Maha Esa atas berkat dan rahmatNya yang melimpah sehingga penulis dapat menyelesaikan Laporan Tugas Akhir ini. Pada kesempatan ini penulis ingin menyampaikan terimakasih kepada semua pihak

yang sudah membantu dalam penyelesaian skripsi ini, sehingga skripsi ini dapat

terselesaikan dengan baik. Ucapan terima kasih ini saya sampaikan terutama kepada.

  1. Bapak Yosef Agung Cahyanta, S.T., M.T., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

  2. Ibu B.Wuri Harini, S.T., M.T., selaku Ketua Jurusan Teknik Elektro Universitas Sanata Dharma dan Dosen Pembimbing TA. Terima kasih atas bimbingan yang selama ini telah diberikan kepada saya.

  3. Ibu Ir.Th.Prima Ari, M.T. selaku Dosen Pembimbing Akademik Teknik Elektro angkatan 2006.

  4. Seluruh Dosen Teknik Elektro yang selama lima tahun ini telah membagikan ilmunya yang sangat berguna kepada saya.

  5. Seluruh Staff Universitas Sanata Dharma, yang atas kerja kerasnya, membuat perkuliahan menjadi terasa nyaman.

  6. Bapak, Ibu dan Kakak yang telah memberikan banyak doa, semangat, dukungan baik moril maupun finansial serta cinta yang begitu besar, selalu ada dan tak akan pernah berhenti.

  7. Dominikus Catur Edi Wasesa yang telah memberikan support, semangat, dukungan sehingga TA ini dapat selesai.

  8. Serta semua pihak yang telah membantu kelancaran dalam penulisan tugas akhir ini. Saya mengucapkan banyak terima kasih.

  Penulis menyadari bahwa masih banyak kekurangan yang terdapat pada laporan

tugas akhir ini. Saran dan kritik sangat penulis harapkan untuk perbaikan-perbaikan dimasa

yang akan datang. Akhir kata, penulis berharap tulisan ini bermanfaat bagi kemajuan dan

perkembangan ilmu pengetahuan serta berbagai pengguna pada umumnya.

  Yogyakarta,25 Agustus 2011 Aryadita Wijaya

  

DAFTAR ISI

HALAMAN JUDUL ........................................................................................................ i

HALAMAN JUDUL DALAM BAHASA INGGRIS

  ..................................................... ii HALAMAN PERSETUJUAN

  ....................................................................................... iii

HALAMAN PENGESAHAN .........................................................................................iv

PERNYATAAN KEASLIAN KARYA

  ........................................................................... v HALAMAN PERSEMBAHAN DAN MOTO HIDUP

  ..................................................vi

LEMBAR PERNYATAAN PERSETUJUAN .............................................................. vii

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

  ................. vii

  INTISARI ..................................................................................................................... viii

  

ABSTRACT ....................................................................................................................ix

KATA PENGANTAR ...................................................................................................... x

DAFTAR ISI

  ...................................................................................................................xi

DAFTAR GAMBAR ..................................................................................................... xiv

DAFTAR TABEL ......................................................................................................... xvi

BAB I PENDAHULUAN

  ................................................................................................. 1

  

1.1. Latar Belakang ..................................................................................................... 1

  

1.2. Tujuan dan Manfaat ............................................................................................. 2

  

1.3. Batasan Masalah .................................................................................................. 2

  

1.4. Metodologi Penelitian .......................................................................................... 3

  BAB II LANDASAN TEORI ........................................................................................... 5

  

2.1. Suara ................................................................................................................... 5

  

2.2. MFCC (Mel Frequency Cepstrum coefficients) .................................................... 6

  2.2.1 Konversi Analog Menjadi Digital ................................................................. 8

  2.2.2 Pre-emphasize Filtering ................................................................................ 9

  2.2.3 Frame Blocking .......................................................................................... 10

  2.2.4 Windowing ................................................................................................. 11

  2.2.5 Analisis Fourier .......................................................................................... 14

  2.2.6 Discrete Fourier Transform (DFT) .............................................................. 15

  2.2.7 Fast Fourier Transform (FFT) ..................................................................... 16

  2.2.8 Mel Frequency Warping ............................................................................. 18

  2.2.9 Discrete Cosine Transform (DCT) .............................................................. 20

  2.2.10 Cepstral Liftering ........................................................................................ 21

  

2.3. Hidden Markov Model (HMM) .......................................................................... 22

  2.3.1 Observasi .................................................................................................... 22

  2.3.2 Inisialisasi ................................................................................................... 23

  2.3.3 Estimasi ...................................................................................................... 24

  3.5.3 Motor Servo ................................................................................................ 50

  3.4.1.1. Pengenalan ................................................................................................... 46

  3.4.1.2. Viterbi ........................................................................................................... 47

  3.4.2 Subsistem Software Pada Mikrokontroler .................................................... 48

  

3.5. Subsistem Hardware .......................................................................................... 49

  3.5.1 Perancangan Prototype Pintu Geser ............................................................ 49

  3.5.2 Perancangan Pin Mikrokontroler ATmega8535 ........................................... 50

  3.5.4 Indikator Kesalahan .................................................................................... 51

  

3.4. Subsistem Software ............................................................................................ 45

  

3.6. Komunikasi Serial RS232 .................................................................................. 51

  

3.7. Proses Evaluasi .................................................................................................. 52

  3.7.1 Proses Evaluasi Subsistem Software............................................................ 52

  3.7.2 Proses Evaluasi Subsistem Hardware ......................................................... 53

  BAB IV HASIL DAN PEMBAHASAN ......................................................................... 54

  

4.1. Implementasi ..................................................................................................... 54

  3.4.1 Subsistem Software Pada PC ....................................................................... 45

  3.3.1 MFCC ........................................................................................................ 44

  2.3.4 Rantai Markov ............................................................................................ 27

  

2.5. Mikrokontroler ATmega8535 ............................................................................ 33

  2.3.5 Tipe HMM.................................................................................................. 27

  2.3.6 Elemen HMM ............................................................................................. 28

  2.3.7 Pengenalan Suara dengan HMM ................................................................. 29

  2.3.8 Algoritma Baum Welch .............................................................................. 29

  2.3.9 Algoritma Viterbi ....................................................................................... 31

  

2.4. Catu daya ........................................................................................................... 32

  2.5.1 Timer0 ........................................................................................................ 33

  

3.3. Proses Pemodelan .............................................................................................. 43

  2.5.2 Register pengendali Timer0 ........................................................................ 33

  2.5.3 Mode operasi .............................................................................................. 35

  

2.6. Motor servo ....................................................................................................... 37

  

2.7. Komunikasi Serial RS232 .................................................................................. 37

  BAB III RANCANGAN PENELITIAN ........................................................................ 41

  

3.1. Arsitektur Sistem ............................................................................................... 41

  

3.2. Diagram Alir Sistem .......................................................................................... 42

  4.1.1 Implementasi Proses Pemodelan ................................................................. 55

  4.1.2 Implementasi Antarmuka Subsistem Software............................................. 56

  4.1.1.1 Halaman Utama .................................................................................................... 57

  4.1.1.2 Halaman Sistem .................................................................................................... 57

  4.1.1.3 Halaman Bant uan ................................................................................................. 62

  4.1.3 Implementasi Antarmuka Subsistem Hardware .......................................... 63

  4.1.4 Implementasi Komunikasi Subsistem Software dan Hardware .................... 64

  

4.2. Hasil Pengujian .................................................................................................. 65

  4.2.1. Subsistem Software ..................................................................................... 65

  4.2.2. Subsistem Hardware................................................................................... 72

  

BAB V KESIMPULAN DAN SARAN .......................................................................... 74

  

5.1. Kesimpulan ........................................................................................................ 74

  

5.2. Saran ................................................................................................................. 74

DAFTAR PUSTAKA ...................................................................................................... 75

  

DAFTAR GAMBAR

Gambar 2.1 Organ Pembetuk Suara Manusia[2] ................................................................. 5Gambar 2.2 Contoh sinyal suara [3] ................................................................................... 7Gambar 2.3 Blok diagram untuk MFCC [3] ....................................................................... 7Gambar 2.4 Proses pembentukan sinyal digital [3] ............................................................. 8Gambar 2.5 Contoh dari pre-emphasize pada sebuah frame [5] .......................................... 9Gambar 2.6 Magnitude response dari pre- emphasize filter untuk nilai α yang berbeda [5] 10Gambar 2.7 Short Term Spectral Analysis [5] ................................................................. 11Gambar 2.8 Bentuk gelombang dari Hamming dan Rectangular window beserta dengan

  

mnagnitude hasil dan proses FFT [5] ................................................................................ 13

Gambar 2.9 Contoh wideband spectrogram [5] ................................................................ 14Gambar 2.10 Contoh narrowband spectrogram [5] .......................................................... 14Gambar 2.11 Tiga Gelombang Sinusoidal dan Superposisinya [5] .................................... 15Gambar 2.12 Domain Waktu menjadi Domain Frekuensi [5] ........................................... 16Gambar 2.14 Pembagian sinyal suara menjadi dua kelompok [5] ..................................... 17Gambar 2.15 Magnitude dari rectangular dan triangular filterbank [5] .............................. 18Gambar 2.16 Prinsip Frekuensi Warping [5] .................................................................... 19Gambar 2.17 Triangular filterbank dengan mel scale [5] .................................................. 20Gambar 2.18 Perbandingan spectrum dengan dan tanpa cepstral liftering ........................ 21Gambar 2.19 State HMM ................................................................................................. 23Gambar 2.20 Algoritma Viterbi ........................................................................................ 24Gambar 2.21 Diagram alir untuk estimasi ........................................................................ 25Gambar 2.22 Contoh proses Pembelajaran dan Pengenalan .............................................. 27Gambar 2.23 Rantai Markov ............................................................................................ 27Gambar 2.24 HMM model ergodic .................................................................................. 28Gambar 2.25 HMM model Kiri-kanan ............................................................................. 28Gambar 2.26 ATmega8535 [11] ....................................................................................... 33Gambar 2.27 Pulsa PWM [11] ........................................................................................ 36Gambar 2.28 Pulsa Fast PWM [11] .................................................................................. 36Gambar 2.29 Konfigurasi Konektor DB9 [12] .................................................................. 38Gambar 2.30 Konfigurasi IC MAX232 [13] ..................................................................... 39Gambar 2.31 Perbedaan Level Tegangan TTL dan RS232 [14] ........................................ 39Gambar 3.1 Arsitektur umum ........................................................................................... 41Gambar 3.2 Diagram alir sistem ....................................................................................... 42Gambar 3.3 Proses Pemodelan ......................................................................................... 43Gambar 3.4 Diagram blok MFCC .................................................................................... 45Gambar 3.5 Cara kerja sistem .......................................................................................... 46Gambar 3.6 Proses Pengenalan ........................................................................................ 47Gambar 3.7 Proses Viterbi ............................................................................................... 48Gambar 3.8 Pengontrolan Penggerak............................................................................... 49Gambar 3.9 Konfigurasi kabel motor servo ...................................................................... 50Gambar 3.10 Rangkaian indikator kesalahan .................................................................... 51Gambar 3.11 Perancangan RS232 .................................................................................... 52Gambar 4.1 Implementasi Sistem ..................................................................................... 54Gambar 4.2 Halaman Utama ............................................................................................ 57Gambar 4.3 Halaman Sistem ............................................................................................ 58Gambar 4.4 Tampilan Text Informasi Mulai Rekam Suara ............................................... 59Gambar 4.5 Tampilan Text Informasi Perekaman Selesai ................................................. 59Gambar 4.6 Tampilan Text Informasi Hasil Pengenalan Buka .......................................... 61Gambar 4.7 Tampilan Text Informasi Hasil Pengenalan Tutup ......................................... 62Gambar 4.8 Halaman Bantuan.......................................................................................... 62Gambar 4.9 Tampilan Utama Sistem Hardware ............................................................... 63Gambar 4.10 Tampilan Pintu Geser pada Posisi Terbuka ................................................. 64Gambar 4.11 Tampilan Pintu Geser pada Posisi Tertutup ................................................. 64

  

DAFTAR TABEL

Tabel 1.1 Confusion Matrix. .............................................................................................. 4Tabel 2.1 Fungsi-fungsi window dan formulanya ............................................................. 12Tabel 2.2 Prescaler Timer0 .............................................................................................. 34Tabel 2.3 Mode operasi .................................................................................................... 34Tabel 2.4 Mode Fast PWM .............................................................................................. 34Tabel 2.5 Konfigurasi Pin dan Nama Bagian Konektor Serial DB9 [12] ........................... 38Tabel 3.1 Pin mikrokontroler yang digunakan ................................................................. 50Tabel 3.2 Confusion Matrix ............................................................................................. 53Tabel 4.1 Tingkat Akurasi Hasil Pengujian (dalam %) ..................................................... 66Tabel 4.2 Confusion Matrix Hasil Pengujian .................................................................... 66Tabel 4.3 Confusion matrix 5ms 11state dan 6ms 14state ................................................. 67Tabel 4.4 Confusion matrix 4ms 18state dan 6ms 18state ................................................. 67Tabel 4.5 Pengenalan untuk kombinasi window-size 5ms jumlah state 11 ........................ 69Tabel 4.6 Pengenalan untuk kombinasi window-size 6ms jumlah state 14 ........................ 69Tabel 4.7 Pengenalan untuk kombinasi window-size 4ms jumlah state 18 ........................ 70Tabel 4.8 Pengenalan untuk kombinasi window-size 6ms jumlah state 18 ........................ 70Tabel 4.9 Pengenalan untuk orang lain berjenis kelamin perempuan ................................ 71

BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan dunia teknologi di bidang pengolahan suara mengalami

  

perkembangan yang cukup pesat. Saat ini sinyal informasi yang dikirimkan tidak hanya

berupa data teks tetapi juga suara manusia. Suara manusia sangat unik dan berbeda satu

sama lain sehingga memerlukan pengolahan secara khusus, yaitu dengan proses

pengolahan suara. Salah satu aplikasi yang dapat digunakan untuk proses pengolahan suara

adalah speech recognition. Speech recognition merupakan upaya agar manusia dan mesin

dapat berkomunikasi dengan media suara [1].

  Salah satu metode yang paling sering digunakan dalam pengenalan suara atau

ucapan adalah Jaringan Saraf Tiruan (JST) dan Hidden Markov Model (HMM). Dalam

speech recognition terdapat beberapa permasalahan yang sering muncul dan berbeda untuk

setiap permasalahannya misalnya kecepatan pengenalannya, ketepatan pengenalannya, dll.

  

Sebagian permasalahan ini telah dapat diatasi oleh julius speech recognition yaitu suatu

modul pengolahan sinyal wicara berkecepatan tinggi yang berbasis pada N-Gram dan

HMM accoustic model [1]. Saat ini telah terdapat HTK (Hidden Markov Model Toolkit)

yaitu suatu tool atau perangkat lunak yang mudah digunakan untuk membangun dan

memanipulasi HMM.

  HMM sendiri merupakan suatu sistem yang memodelkan simbol ke dalam suatu

mesin finite state (keadaan yang terbatas), sehingga diketahui simbol apa yang dapat

mewakili sebuah parameter vektor dari sebuah kata yang dimasukkan ke dalam mesin dan

diestimasi berulang-ulang hingga dihasilkan parameter observasi dengan mean dan

kovarian yang konvergen untuk setiap statenya. Dengan tool ini maka pembuatan sistem

pengenalan sinyal suara manusia dapat lebih bagus dan rapi (untuk setiap kata dari orang

yang berbeda dan logat dari orang yang berbeda pula).

  Berdasarkan hal di atas, penulis akan membuat sebuah otomatisasi untuk

pengoperasian pintu yang menggunakan teknologi pengolahan suara. Sistem otomatisasi

  

ini berupa pintu geser yang diaktifkan menggunakan suara manusia. Penggunaan suara

manusia sebagai kata kunci digunakan untuk menggantikan sistem kunci manual yang ada

saat ini. Penggunaan suara sebagai kata diharapkan akan mempermudah user karena tidak

perlu membawa kunci saat pergi meninggalkan rumah dan user juga tidak perlu khawatir

kunci tertinggal ataupun hilang.

  Hasil dari pembuatan sistem ini dapat melengkapi sistem smart house/ rumah pintar

yang kini banyak dikembangkan. Seperti yang diketahui, smart house/ rumah pintar

dirancang dan dibangun sebagai rumah impian masa depan. Rumah impian masa depan ini

menggunakan teknologi terkini, di mana semua yang ada dalam rumah tersebut dapat

dioperasikan secara otomatis.

  Dalam implementasinya sistem yang akan dibuat akan bekerja apabila user ingin

membuka pintu geser. Suara user akan diproses dan dicocokkan dengan suara yang telah

tersimpan dalam sistem. Jika suara user memiliki pola yang sama dengan pola suara yang

telah tersimpan maka sistem akan mengaktifkan pintu geser. Sedangkan jika pola suara

berbeda maka pintu geser tidak akan aktif.

  1.2. Tujuan dan Manfaat Tujuan dari penelitian ini adalah menghasilkan sebuah prototype pintu geser yang

diaktifkan menggunakan suara manusia. Pintu geser hanya aktif jika menerima masukan

berupa kata dari orang yang sama seperti yang telah tersimpan di dalam sistem. Manfaat

dari penelitian ini adalah sebagai pengganti sistem kunci manual.

  1.3. Batasan Masalah Batasan-batasan masalah dalam pengembangan sistem ini adalah sebagai berikut:

  1. Proses pengolahan suara dilakukan oleh Personal Computer (PC)

  

2. Metode yang digunakan untuk proses pengenalan kata adalah Hidden Markov Model

(HMM ).

  

3. Metode yang digunakan untuk feature extraction (ekstraksi ciri) adalah Mel Frequency

Cepstrum Coeffisients (MFCC).

  4. Pintu yang dibuat berupa sebuah prototype pintu geser yang berukuran 8x18 cm.

  5. Penggendalian pintu dilakukan menggunakan mikrokontroler ATmega8535.

  6. Motor yang digunakan untuk menggerakkan pintu adalah motor servo.

  7. Sistem bersifat dependent, artinya sistem hanya dapat digunakan oleh orang tertentu.

1.4. Metodologi Penelitian

  

Metodologi yang akan digunakan dalam pengembangan sistem ini adalah sebagai berikut:

  a. Pengumpulan bahan-bahan referensi / studi pustaka Tahap ini bertujuan untuk mencari bahan-bahan referensi yang dapat digunakan

untuk menunjang kebutuhan sistem yang akan dibuat. Penulis akan mengumpulkan serta

meninjau berbagai bahan atau referensi yang terkait dengan metode HMM. b.Menentukan variabel yang terkait Tahap ini bertujuan untuk menemukan variabel-variabel yang terkait dan

digunakan dalam pengembangan sistem. Pada tahap ini penulis mengambil contoh suara

user yang akan dijadikan sebagai model dari pengaktifan sistem.

  c. Perancangan subsistem hardware dan software Tahap ini bertujuan untuk mencari desain yang optimal dari sistem yang akan

dibuat dengan mempertimbangkan berbagai faktor permasalahan dan kebutuhan yang telah

ditentukan. Untuk perancangan subsistem hardware, penulis akan merancang prototype

pintu, peletakan motor penggerak, dan minimum sistem mikrokontroler. Untuk

perancangan subsistem software, penulis mempelajari dan menuliskan tentang speech

recognition , metode HMM yang memuat algoritma Baum Welch dan algoritma Viterbi,

feature extraction (ekstraksi ciri) yang menggunakan metode MFCC, dan blok diagram

pengolahan suara dan perancangan kontrol penggerak. d.Pembuatan subsistem hardware dan software Pada tahap ini penulis akan membuat subsistem hardware dan software. Subsistem

hardware terdiri dari prototype pintu geser, mikrokontroler dan motor penggerak,

Subsistem software terdiri dari pengolahan suara dan kontrol penggerak. Pada proses

pengolahan suara, penulis menerapkan metode HMM ke dalam bahasa komputer sesuai

dengan desain yang telah disusun. Hasil dari proses ini adalah sebuah aplikasi yang dapat

  

mengidentifikasi suara user. Pada proses kontrol penggerak, penulis akan mengatur

pergerakan pintu, untuk membuka dan menutup sesuai dengan hasil identifikasi pada

proses pengolahan suara.

  e. Proses pengambilan data dan pengujian Pengambilan data dan pengujian sistem dilakukan menggunakan suara user dan

suara orang lain. Suara orang lain digunakan sebagai pembanding untuk menguji apakah

sistem dapat dibuka oleh orang lain selain user. Dalam proses ini digunakan 10 orang

sebagai sampel, 5 pria dan 5 wanita. Setiap sampel akan merekam suaranya sebanyak 10

kali untuk setiap kata yang digunakan sebagai kata sandi pengoperasian pintu. Pada

pengujian langsung dilakukan dengan menggunakan suara yang direkam pada saat itu juga.

  f. Analisa dan penyimpulan hasil penelitian Analisa dilakukan dengan menggunakan confusion matrix untuk penghitungan

akurasi dari hasil pengujian sistem yang dibuat. Confusion matrix merupakan matrix

berbentuk bujur sangkar. Banyaknya kolom dan baris adalah sama yaitu sebanyak N,

dimana N adalah banyaknya model suara yang ada. Tabel 1.1 merupakan ilustrasi dari

confusion matrix .

Tabel 1.1 Confusion Matrix.

  

Diagonal dari tabel 1.1 yang diblok merupakan gambaran dari jumlah data yang benar

dalam pengenalan. Persamaan yang digunakan untuk menghitung akurasi yaitu :  jumlah data dikenal  _ _ akurasi

    100 % (1.1)   jumlah _ data

    Keakuratan sitem dapat dilihat dari tingkat akurasi dalam proses pengenalan kata.

BAB II LANDASAN TEORI 2.1. Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. Suara dapat

  

dihantarkan dengan media air, udara maupun benda padat. Dengan kata lain, suara adalah

gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara yang dapat

didengar oleh manusia berkisar antara 20 Hz sampai dengan 20KHz, dimana Hz adalah

satuan frekuensi yang berarti banyak getaran per detik (cps / cycle per second) [2].

  Perlengkapan produksi suara pada manusia terdapat pada gambar 2.1 yang secara

garis besar terdiri dari jalur suara (vocal track) dan jalur hidung (nasal track). Jalur suara

dimulai dari pita suara (vocal cords), celah suara (glottis) dan berakhir pada bibir. Jalur

hidung dimulai dari bagian belakang langit-langit (velum) dan berakhir pada cuping hidung

(nostrils).

Gambar 2.1 Organ Pembetuk Suara Manusia[2] Proses terjadinya suara, dimulai dari udara masuk ke paru-paru melalui pernafasan,

  

kemudian melalui trakea, udara masuk ke batang tenggorok dimana dalam batang

  

tenggorok ini terdapat pita suara. Pita suara ini kemudian bergetar dengan frekuensi

tertentu karena adanya aliran udara tersebut sehingga dihasilkan suara. Suara yang

dihasilkan ini berbeda-beda bergantung pada posisi lidah, bibir, mulut dan langit-langit

pada saat itu.

  Suara yang dihasilkan terbagi menjadi tiga bagian yaitu voiced sound, unvoiced

sound serta plosive sound. Voiced sound terjadi jika pita suara bergetar dengan frekuensi

  

50 Hz sampai 250 Hz. Contoh voiced sound adalah bunyi pada kata ‘ah”, Unvoiced sound

teijadi jika pita suara tidak bergetar sama sekali. Contoh unvoiced sound ialah bunyi pada

kata “shh”. Sedangkan piosive sound terjadi jika pita suara tertutup sesaat dan kemudian

tiba-tiba membuka. Contoh plosive sound ialah bunyi “beh” pada kata benar dan “pah”

pada kata pasar [2].

2.2. MFCC (Mel Frequency Cepstrum coefficients)

  MFCC(Mel Frequency Cepstrum Coefficients) merupakan salah satu metode, yang

banyak digunakan dalam bidang speech technology, baik speaker recognition maupun

speech recognition

  . Metode ini digunakan untuk melakukan feature extraction (ekstraksi

ciri), sebuah proses yang mengkonversikan sinyal suara menjadi beberapa parameter.

Tujuan akhir dari proses feature extraction adalah pemberian parameter suara ke dalam

deretan feature vector yang berupa ringkasan dan informasi yang relevan dari suara

tersebut. Feature yang diekstrak diharapkan mampu membedakan suara yang serupa,

sehingga model dapat dibuat tanpa memerlukan data training yang besar. Keunggulan dari

metode ini adalah [3]:

  1. Mampu untuk menangkap karakteristik suara yang sangat penting bagi pengenalan suara atau dengan katalain, mampu menangkap informasi-informasi penting yang terkandung dalam sinyal suara.

  2. Menghasilkan data seminimal mungkin, tanpa menghilangkan informasi-informasi penting yang ada.

  3. Mereplikasi organ pendengaran manusia dalam melakukan persepsi terhadap sinyal suara.

  Perhitungan yang dilakukan dalam MFCC menggunakan dasar dari perhitungan

short-tern analysis . Hal ini dilakukan mengingat sinyal suara yang bersifat quasi

stationary . Contoh dari sinyal suara dapat dilihat pada Gambar 2.2. Pengujian yang

dilakukan untuk periode waktu yang cukup pendek (sekitar 10 sampai 30 milidetik) akan

  

menunjukkan karakteristik sinyal suara yang stationary. Tetapi bila dilakukan dalam

periode waktu yang lebih panjang karakteristik sinyal suara akan terus berubah sesuai

dengan kata yang diucapkan.

Gambar 2.2 Contoh sinyal suara [3] MFCC feature extraction merupakan adaptasi dan sistem pendengaran manusia,

  

dimana sinyal suara akan di-filter secara linear untuk frekuensi rendah (di bawah 1000 Hz)

dan secara logaritmik untuk frekuensi tinggi (di atas 1000 Hz). Berikut ini adalah blok

diagram untuk MFCC [3].

Gambar 2.3 Blok diagram untuk MFCC [3]

2.2.1 Konversi Analog Menjadi Digital

  Sinyal-sinyal natural pada umumnya seperti sinyal suara merupakan sinyal

kontinyu dimana memiliki nilai yang tidak terbatas. Sedangkan pada komputer, semua

sinyal yang dapat di proses oleh komputer hanyalah sinyal diskrit atau sering dikenal

dengan isilah sinyal digital. Agar sinyal natural dapat diproses oleh komputer, maka harus

diubah terlebih dahulu dari data sinyal kontinyu menjadi sinyal diskrit. Hal itu dapat

dilakukan melalui tiga proses, diantaranya adalah proses pencuplikan data, proses

kuantisasi, dan proses pengkodean [3].

  Proses pencuplikan adalah suatu proses untuk mengambil data sinyal continue

untuk setiap periode tertentu. Dalam melakukan proses pencuplikan data, berlaku aturan

Nyquist, yaitu bahwa frekuensi pencuplikan (sampling rate) minimal harus 2 kali lebih

tinggi dari frekuensi maksimum yang akan di sampling. Jika sinyal pencuplikan kurang

dan 2 kali frekuensi maksimum sinyal yang akan di sampling, maka akan timbul efek

aliasing . Aliasing adalah suatu efek dimana sinyal yang dihasilkan memiliki frekuensi

yang berbeda dengan sinyal aslinya.

  Proses kuantisasi adalah proses untuk membulatkan nilai data ke dalam bilangan-

bilangan tertentu yang telah ditentukan terlebih dahulu. Semakin banyak level yang dipakai

maka semakin akurat pula data sinyal yang disimpan tetapi akan menghasilkan ukuran data

besar dan proses yang lama. Proses pengkodean adalah proses pemberian kode untuk tiap-

tiap data sinyal yang telah terkuantisasi berdasarkan level yang ditempati [3].

  Berikut adalah gambaran contoh proses pembentukan sinyal digital.

Gambar 2.4 Proses pembentukan sinyal digital [3]

2.2.2 Pre-emphasize Filtering

  Pre-emphasize merupakan salah satu jenis filter yang sering digunakan sebelum

sebuah sinyal diproses lebih lanjut. Filter ini mempertahankan frekuensi-frekuensi tinggi

pada sebuah spektrum yang umumnya tereliminasi pada saat proses produksi suara. Tujuan

dan pre-emphasize filter ini adalah:

  1. Mengurangi noise ratio pada sinyal, sehingga dapat meningkatkan kualitas sinyal [1, 4] .

  2. Menyeimbangkan spektrum dari voiced sound [5, 6]. Pada saat memproduksi voiced sound , glottis manusia menghasilkan sekitar -12 dB octave slope. Namun ketika energi akustik tersebut dikeluarkan melalui bibir, terjadi peningkatan sebesar