Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

(1)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS

SKRIPSI

RAISHA ARIANI SIRAIT 091402014

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2015


(2)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

RAISHA ARIANI SIRAIT 091402014

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2015


(3)

iii

PERSETUJUAN

Judul : Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

Kategori : SKRIPSI

Nama : RAISHA ARIANI SIRAIT

Nomor Induk Mahasiswa : 091402014

Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI

Departemen : TEKNOLOGI INFORMASI

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI (FASILKOM-TI) UNIVERSITAS SUMATERA UTARA

Diluluskan di

Medan, 25 Juni 2015 Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Romi Fadillah Rahmat, B.Comp.Sc., M.Sc NIP. 19860303 201012 1 004

M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010

Diketahui/Disetujui oleh

Program Studi S1 Teknologi Informasi Ketua,

M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010


(4)

PERNYATAAN

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, 25 Juni 2015

Raisha Ariani Sirait 091402014


(5)

v

PENGHARGAAN

Alhamdulillah, segala puji dan syukur penulis panjatkan atas kehadirat Allah SWT beserta Nabi besar Muhammad SAW yang telah memberikan rahmat, hidayah-Nya, segala daya dan upaya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat utnuk memperoleh gelar Sarjana Program Studi S-1 Teknologi Informasi Universitas Sumatera Utara, Ucara terima kasih yang sebesar-besarnya penulis sampaikan kepada: 1. Kedua orang tua penulis, orang yang paling berharga dalam hidup penulis, ayahanda Mamora Sirait dan ibunda Anggreini Hasibuan yang telah membesarkan, mendidik, memberi dukungan, doa dan motivasi tanpa henti. Serta kepada Abang penulis Radinal Moechtar Sirait yang selalu ada dan menemani penulis.

2. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak Muhammad Anggia Muchtar, ST., MM. IT. dan Bapak Muhammad Fadly Syahputra, B.Sc, M.Sc.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi.

3. Bapak M. Anggia Muchtar, S.T, MMIT selaku pembimbing pertama dan Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc selaku pembimbing kedua, yang telah banyak meluangkan waktunya dan memberikan masukan-masukan yang bermanfaat bagi penulis dalam menyelesaikan skripsi ini.

4. Bapak Sajaddin Sembiring, S.Si, M.Comp.Sc dan Dani Gunawan, ST, MT yang telah bersedia menjadi dosen pembanding dan Bapak Ainul Hizriadi, S.Kom, M. Kom yang telah memberikan saran-saran yang baik bagi penulis dalam menyelesaikan skripsi ini.

5. Kepada Ade, Yogi, Ibnu, Ammar, Reza, Ridzuan, Fadli Rizky, Icha, Yanna, Dijah, Julia, Fanny, Hani, M. Ardiansyah, Fadli Rachman, Dezi, Kurniawan, Fadil, Lydia, Amira, Jihan, Musyafa dan Andre yang selalu mendukung, membantu dan memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini. Serta teman-teman yang mendukung dan membantu penulis Febrina Panjaitan, Ifitriana dan Mifthah Huljannah dan seluruh teman-teman lainnya yang tidak dapat disebutkan satu persatu.

6. Kepada Ibu Mega, Abang Manaf dan Kak Umi yang selaku bagian tata usaha Program Studi S1 Teknologi Informasi yang telah membimbing dan membantu penulis dari awal proposal sampai sidang.

Sekali lagi penulis mengucapkan terima kasih yang sebesar-besarnya kepada semua pihak yang membantu dalam penyelesaian tugas akhir ini yang tidak dapat disebutkan. Terima kasih atas masukan, saran, dan motivasi yang diberikan. Semoga Allah SWT membalas dengan nikmat yang berlimpah.


(6)

ABSTRAK

Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft Corporation menciptakan Speech Application Programming Interface (SAPI) untuk membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai 81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar 30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali input.

Kata kunci : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.


(7)

vii

ABSTRACT

Speech recognition is a study that use human voice as an input for device to recognize. The research about speech recognition that use voice as an input for an application is not a new thing. However among that researches there still rarely to see an application that used Indonesia as an input. Among that researches, Microsoft Corporation create Speech Application Programming Interface (SAPI) that can use to develop a speech recognition application. For this research, it will use command in Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal by dividing every part of the signal into two parts continuously until each part consist one point signal. The final result of this research show that the system has succeed recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The accuracy of the system be affected by noise and the quality of the voice input, if the fewer the noise and with good quality of the voice input, then more and more accurate the system in recognising the input.

Keyword : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.


(8)

DAFTAR ISI

Hal

PERSETUJUAN i

PERNYATAAN ii

PENGHARGAAN iii

ABSTRAK vi

ABSTRACT vii

DAFTAR ISI viii

DAFTAR TABEL xi

DAFTAR GAMBAR xii

BAB 1 PENDAHULUAN 1

1.1Latar Belakang 1

1.2Rumusan Masalah 3

1.3Batasan Masalah 3

1.4Tujuan Penelitian 4

1.5Manfaat Penelitian 4

1.6Metodologi Penelitian 4

1.7Sistematika Penulisan 5

BAB 2 LANDASAN TEORI 7

2.1Suara 7

2.2Kata Baku & Tidak Baku 7

2.3Speech Recognition 7

2.3.1 Mode Speech Recognition 8

2.3.2 Proses Speech Recognition 8

2.3.2.1 Pemisahan kata 8

2.3.2.2 Ketergantungan terhadap pengguna 9

2.3.2.3 Pencocokan kata 10

2.3.2.4 Pembendaharaan kata 10


(9)

ix

2.4.1 Komponen Speech Application Programming Interface (SAPI)

11

2.4.2 Antar muka Speech Application Programming Interface (SAPI)

11

2.5Transformasi Fourier 12

2.5.1 Discrete Fourier Transform (DFT) 13

2.5.2 Fast Fourier Transform (FFT) 13

2.6Penelitian Terdahulu 16

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18

3.1Identifikasi Masalah 18

3.2Data yang Digunakan 19

3.3Analisis Sistem 20

3.3.1Proses ekstraksi 22

3.3.2Penetapan grammar 23

3.3.3Pengenalan pola spektrum suara 23

3.3.4Jalankan perintah pada perangkat 23

3.4 Perancangan Sistem 23

3.4.1 Diagram use case 23

3.4.2 Spesifikasi use case 24

3.4.3 Diagram aktifitas 25

3.4.4 Perancangan antar muka 27

BAB 4 IMPLEMENTASI DAN PENGUJIAN 29

4.1Implementasi Sistem 29

4.1.1Perangkat keras 29

4.1.2Perangkat lunak 30

4.1.3Implementasi perancangan antar muka 30

4.2Pengujian Sistem 32

4.2.1Kasus dan hasil pengujian sistem 34

4.2.2Pengujian kinerja sistem 35

4.3Hasil Pengujian Suara 40

4.3.1 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0 – 500 Hz


(10)

4.3.2 Hasil pengujian suara dengan tingkat frekuensi lingkungan 501 – 1000 Hz

42

BAB 5 KESIMPULAN DAN SARAN 45

5.1Kesimpulan 45

5.2Saran 46


(11)

xi

DAFTAR TABEL

Hal

Tabel 2.1 Penelitin terdahulu 17

Tabel 3.1 Penjelasan data yang akan digunakan 19 Tabel 3.2 Spesifikasi use case untuk input suara 24 Tabel 3.3 Spesifikasi use case untuk bantuan 25

Tabel 4.1 Hasil pengujian halaman awal 33

Tabel 4.2 Hasil pengujian halaman tentang 35

Tabel 4.3 Hasil pengujian halaman bantuan 39

Tabel 4.4 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0

– 500 Hz 40

Tabel 4.5 Hasil pengujian suara dengan tingkat frekuensi lingkungan


(12)

DAFTAR GAMBAR

Hal

Gambar 2.1 Blok Diagram Arsitektur SAPI 12

Gambar 2.2 Desimasi untuk 16 titik 14

Gambar 2.3 Konsep FFT 14

Gambar 3.1 Arsitektur umum sistem 20

Gambar 3.2 Flowchart sistem 21

Gambar 3.3 Diagram use case sistem 24

Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara) 26 Gambar 3.5 Diagram aktifitas sistem (Bantuan) 26

Gambar 3.6 Rancangan halaman awal 27

Gambar 3.7 Rancangan halaman bantuan 28

Gambar 4.1 Halaman awal 31

Gambar 4.2 Halaman bantuan 32

Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan 36 Gambar 4.4 Halaman awal ketika perintah “buka” diucapkan 36 Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan 37 Gambar 4.6 Halaman awal ketika perintah “Word” diucapkan 37 Gambar 4.7 Halaman awal ketika perintah “Excel” diucapkan 38 Gambar 4.8 Halaman awal ketika perintah “Publisher” diucapkan 38 Gambar 4.9 Halaman awal ketika input kata ganti perintah 39

Gambar 4.10 Halaman bantuan 39

Gambar 4.11 Persentase keberhasilan perintah suara denga tingkat

frekuensi lingkungan 0 – 500 Hz 44

Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat


(13)

vi

ABSTRAK

Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft Corporation menciptakan Speech Application Programming Interface (SAPI) untuk membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai 81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar 30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali input.

Kata kunci : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.


(14)

ABSTRACT

Speech recognition is a study that use human voice as an input for device to recognize. The research about speech recognition that use voice as an input for an application is not a new thing. However among that researches there still rarely to see an application that used Indonesia as an input. Among that researches, Microsoft Corporation create Speech Application Programming Interface (SAPI) that can use to develop a speech recognition application. For this research, it will use command in Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal by dividing every part of the signal into two parts continuously until each part consist one point signal. The final result of this research show that the system has succeed recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The accuracy of the system be affected by noise and the quality of the voice input, if the fewer the noise and with good quality of the voice input, then more and more accurate the system in recognising the input.

Keyword : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.


(15)

BAB 1

PENDAHULUAN

1.1Latar Belakang

Pada tahun 2005, Martin, Brown, DeHayes, Hoffer dan Perkins mendefinisikan teknologi informasi merupakan kombinasi teknologi komputer yang terdiri dari perangkat keras dan lunak untuk mengolah dan menyimpan informasi dengan teknologi komunikasi untuk melakukan penyaluran informasi. Berdasarkan definisi di atas, dapat disimpulkan bahwa hubungan antara teknologi komputer dan penyaluran informasi merupakan hubungan yang saling membutuhkan baik teknologi komputer sebagai media atau alat dan informasi sebagai data yang diolah, disimpan dan disalurkan begitu pula sebaliknya.

Perkembangan cara berkomunikasi antara manusia dan komputer telah mengalami perubahan dari waktu ke waktu. Perubahan tersebut bertujuan agar komunikasi antara manusia dan komputer menjadi lebih efisien. Salah satu metode komunikasi yang banyak dikembangkan saat ini adalah pengenalan ucapan atau yang lebih kita kenal dengan istilah speech recognition. Manusia dalam berinteraksi dengan sesama manusia secara umum banyak dilakukan menggunakan ucapan. Dengan menerapkan cara interaksi antara sesama manusia tersebut diharapkan menjadi cara alternatif yang dapat dipakai untuk interaksi antara manusia dan komputer secara lisan layaknya interaksi antara manusia dengan manusia (Syarif, A., Daryanto, T. & Arifin, M.J., 2011).

Teknologi pengenalan ucapan telah banyak diterapkan di berbagai sistem. Hal tersebut bertujuan agar ke depannya manusia dapat berkomunikasi dengan komputer selayaknya berkomunikasi dengan sesama manusia. Oleh karena itu, penulis mencoba mengolah informasi dengan menggabungkan teknologi komputer dan unsur suara


(16)

sebagai data. Speech recognition merupakan metode komunikasi yang berfokus pada suara, sehingga diharapkan penyaluran informasi dapat dilaksanakan dengan lebih efisien. Selain itu, teknologi pengenalan ucapan masih memiliki banyak potensi untuk dikembangkan.

Banyak penelitian yang telah dan sedang dilakukan untuk mendapatkan pengenalan ucapan yang cepat dan akurat. Salah satu yang terkenal adalah penelitian yang dilakukan oleh Microsoft Corporation yang dikembangkan untuk sistem operasi Windows. Selain mengembangkan mesin pengenalan ucapan, Microsoft juga mengembangkan standar untuk pengenalan ucapan yaitu Speech Application Programming Interface (SAPI).

Pada penelitian ini, penulis mencoba menerapkan metode Fast Fourier Transform pada tahap ekstraksi ciri untuk mengetahui frekuensi lingkungan sehingga dapat dibandingkan ketika mengoperasikan perintah – perintah dasar di OS Windows. Proses yang akan dilalui oleh sistem ini mengadaptasi dasar dari sistem pengenalan ucapan pada umumnya. Proses tersebut diawali dengan menginput suara menggunakan microphone. Kemudian dilanjutkan dengan proses ekstraksi ciri, yakni proses mendapatkan besaran pada bagian sinyal masukan untuk menetapkan pola pembelajaran atau pola uji.

Untuk tahap pembelajaran atau pola uji penulis juga menggunakan Speech Application Programming Interface (SAPI) dengan grammar yang telah ditentukan sendiri oleh penulis. SAPI memungkinkan pengenalan ucapan tanpa mempengaruhi aplikasi yang ingin dibuat, sehingga SAPI dapat digunakan sebagai fungsi tersendiri untuk mendukung aplikasi yang akan dibuat.

Sedangkan pada proses eksekusi, dimana ucapan yang dimasukkan telah dikenali akan dieksekusi dengan perintah event/case yang terdapat pada bahasa pemrograman visual basic. Event/case merupakan jenis perintah pengganti keyboard pada pemrograman visual basic. Disini penulis akan mengganti event keyboard di visual basic agar bisa dieksekusi melalui perintah suara yang telah didefinisikan terlebih dahulu.

Sistem diharapkan dapat digunakan oleh pengguna yang berbeda setiap kali percobaannya. Hal tersebut sesuai dengan sifat sistem pengenalan suara, yakni Speaker Adaptive. Speaker Adaptive merupakan perpaduan dari Speaker Dependent dan Speaker Independent, dimana pengguna tidak perlu melakukan pelatihan dan


(17)

3

keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama bekerja terus menerus selama beberapa waktu tertentu (Adipranata, 2003).

Berdasarkan penelitian terdahulu yang telah dilakukan dan keefektifan yang dimiliki metode tersebut, penulis terdorong untuk membuat penelitian penerapan perintah suara berbahasa Indonesia menggunakan aplikasi SAPI. Dipilihnya bahasa Indonesia sebagai jenis input untuk menjalankan aplikasi ini dikarenakan masih sedikitnya aplikasi – aplikasi yang mengenali ucapan bahasa Indonesia. Maka dari itu, penulis ingin mengetahui sejauh apa sistem pengenalan ucapan dapat mengidentifikasi kata – kata berbahasa Indonesia. Hal ini diharapkan memberikan kemampuan yang baik pada sistem penerapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah – perintah dasar pada OS Windows.

1.2Rumusan Masalah

Berdasarkan latar belakang yang telah dipaparkan, dapat dilihat bahwa penelitian di bidang speech recognition masih memiliki banyak peluang untuk dikembangkan, terutama implementasi di bahasa – bahasa asing. Oleh karena itu, rumusan masalah dari penelitian ini adalah bagaimana menerapkan perintah suara berbahasa Indonesia untuk mengoperasikan perintah – perintah dasar di OS Windows menggunakan Speech Application Programming Interface (SAPI)

1.3Batasan Masalah

Penelitian ini memiliki banyak cakupan sehingga penulis membatasi permasalahan pada penelitian ini. Batasan masalah tersebut adalah sebagai berikut :

a. Perintah suara menggunakan bahasa Indonesia,

b. Perintah yang diterapkan berupa Explorer, buka, atas, bawah, kanan, kiri, kembali, Browser, Word, Point, Excel dan Publisher,

c. Menggunakan Ejaan Yang Disempurnakan (EYD),

d. Pengambilan data suara dari 4 responden. Dimana 2 responden adalah wanita dan 2 responden adalah pria,


(18)

f. Diterapkan pada Operating System (OS) Windows 7.

1.4Tujuan Penelitian

Tujuan dari penelitian ini adalah memanfaatkan teknologi aplikasi Speech Application Programming Interface (SAPI) untuk menjalankan perintah dengan pengucapan berbahasa Indonesia serta menerapkan metode Fast Fourier Transform (FFT) untuk melihat tingkat frekuensi noise yang mempengaruhi kinerja Speech Application Programming Interface (SAPI) tersebut.

1.5Manfaat Penelitian

Penulis berharap penelitian ini dapat memberikan manfaat kepada penulis sendiri dan para pembaca. Adapun manfaat dari penelitian ini adalah sebagai berikut :

a. Meningkatkan efisiensi interaksi manusia dengan komputer ketika akan mengoperasikan perintah dasar di windows.

b. Mengetahui kinerja Speech Application Programming Interface (SAPI) pada aplikasi yang menggunakan bahasa Indonesia sebagai inputnya serta metode Fast Fourier Transform (FFT) pada transformasi sinyal suara.

c. Penelitian dapat menjadi bahan rujukan untuk pengembangan penelitian lebih lanjut.

1.6Metodologi Penelitian

Adapun metodologi penelitian yang digunakan peneliti yaitu :

1. Studi Literatur

Pada tahap ini peneliti melakukan pengumpulan sumber referensi yang akan digunakan untuk penelitian. Peneliti membaca dan mempelajari buku-buku, jurnal, media online dan sumber lainnya yang berhubungan dengan penelitian pengenalan ucapan (speech recognition) serta metode – metode terkait yang akan dilakukan.


(19)

5

2. Perancangan Desain Sistem

Pada tahap ini peneliti melakukan perancangan aplikasi, seperti merancang activity diagram, diagram alur (flowchart) sistem, perancangan desain, dan perancangan desain antarmuka (interface).

3. Implementasi Sistem

Pada tahap ini dilakukan pengkodean dan implementasi rancangan yang telah dibuat dengan menggunakan bahasa pemrograman yang telah dipilih. Pengkodean dilakukan dengan bahasa pemrograman visual basic dengan menggunakan aplikasi Speech Application Programming Interface (SAPI) dan metode Fast Fourier Transform (FFT).

4. Pengujian Sistem

Pada tahap ini dilakukan pengujian dan percobaan pada sistem dengan subjek berbeda yang telah dibuat sesuai dengan kriteria dan kebutuhan yang diinginkan dan memastikan apakah program berjalan sesuai dengan yang diinginkan.

5. Dokumentasi Sistem

Pada tahap ini, peneliti mendokumentasikan sistem dalam bentuk laporan tertulis untuk menunjukkan hasil penelitian yang dilakukan.

1.7Sistematika Penulisan

Adapun penulisan skripsi ini terdiri dari lima bagian utama dengan penjelasan singkat sebagai berikut :

Bab 1 Pendahuluan

Pada bab ini berisi uraian penjelasan latar belakang terkait judul skripsi yang diajukan, perumusan masalah pada penelitian, batasan masalah yang ditetapkan, tujuan penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan dari penyusunan skripsi ini.


(20)

Bab 2 Landasan Teori

Pada bab ini dibahas mengenai teori-teori pendukung yang digunakan pada penelitian ini, seperti suara, speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT) dan penelitian terdahulu.

Bab 3 Analisis dan Perancangan Sistem

Pada bab ini berisi penjelasan analisis mengenai permasalahan dan identifikasi kebutuhan perancangan sistem.

Bab 4 Implementasi dan Pengujian Sistem

Pada bab ini berisi penjelasan implementasi sistem dari hasil analisis yang dilakukan serta menguji sistem yang telah dibuat.

Bab 5 Kesimpulan dan Saran

Pada bab ini berisi kesimpulan yang didapat dari penelitian skripsi yang telah dilakukan dan saran yang dapat digunakan untuk penelitian lebih lanjut mengenai topik yang terkait pada skripsi ini.


(21)

BAB 2

LANDASAN TEORI

2.1 Suara

Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara yang dapat didengar manusia berkisar antara 20 Hz sampai dengan 20 KHz, dimana Hz adalah satuan frekuensi yang artinya banyaknya getaran per-detik (cps / cycle per second) (Darmawan, Y., 2011).

Speech Processing (pemrosesan lafal/ucapan) adalah metode mengekstrak informasi yang diinginkan dari sebuah sinyal suara. Untuk memproses sebuah sinyal dengan sebuah computer digital, sinyal harus dihadirkan dalam bentuk digital sehingga sinyal tersebut dapat digunakan oleh sebuah computer digital (L. Rabiner et al. 1993)

2.2 Kata Baku dan Tidak Baku Bahasa Indonesia

Di dalam bahasa Indonesia terdapat dua jenis kata, yakni kata baku dan kata tidak baku. Kata baku adalah kata yang digunakan sesuai dengan kaidah bahasa Indonesia yang telah ditentukan. Kamus Besar Bahasa Indonesia (KBBI) merupakan sumber utama dan menjadi acuan untuk menentukan kata baku bahasa Indonesia. Kata tidak baku adalah kata yang digunakan tidak sesuai dengan kaidah bahasa Indonesia yang ditentukan.

2.3 Speech Recognition

Speech recognition merupakan teknik dimana perangkat akan mengenali masukan berupa suara, setelah itu perangkat melakukan respon yang sesuai dengan masukan suara tersebut (Syarif, A., Daryanto, T. & Arifin, M.J. 2011). Speech recognition


(22)

(pengenalan lafal/ucapan) juga diketahui sebagai suatu proses untuk mengenali seseorang dengan mengenali ucapan dari orang tersebut (L. Rabiner et al. 1993).

2.3.1 Mode Speech Recognition

Speech recognition memiliki dua mode, yakni mode diktasi dan mode command and control. Penjelasan kedua mode tersebut adalah sebagai berikut :

a. Mode Diktasi

Mode ini merupakan mode dimana pengguna komputer dapat mengucapkan kata / kalimat yang selanjutnya akan dikenali oleh komputer dan diubah menjadi data teks. Pengenalan mode diktasi merupakan speaker dependent. Keakuratan pengenalan mode ini bergantung pada pola suara dan aksen pembicara serta pelatihan yang telah dilakukan.

b. Mode Command and Control

Pada mode ini pengguna komputer mengucapkan kata / kalimat yang sudah terdefinisi terlebih dahulu pada database dan selanjutnya akan digunakan untuk menjalankan perintah tertentu pada aplikasi komputer. Mode ini merupakan speaker independent karena jumlah kata yang dikenali biasanya terbatas sekali dan ada kemungkinan pembicara tidak perlu melakukan pelatihan pada sistem sebelumnya (Junaedih. 2007)

2.3.2 Proses Speech Recognition

Pada proses speech recognition atau sistem pengenal pembicaraan, terdapat empat proses utama yang diterapkan baik pada mode diktasi maupun mode command and control. Keempat proses tersebut adalah pemisahan kata, ketergantungan terhadap pengguna, pencocokan kata dan pembendaharaan kata.

2.3.2.1. Pemisahan Kata

Pemisahan kata adalah proses untuk memisahkan suara yang diucapkan oleh pengguna menjadi beberapa bagian (Junaedih. 2007). Pada proses pemisahan kata ini, terdapat tiga metode yang dapat digunakan, yaitu :


(23)

9

a. Discrete Speech

Pada discrete speech, pengguna diharuskan mengucapkan kalimat secara terpenggal dengan adanya jeda sejenak diantara kata. Jeda tersebut digunakan oleh sistem untuk mendeteksi awal dan akhir sebuah kata.

b. Word Spotting

Pada word spotting, dalam sebuah kalimat yang diucapkan pengguna, sistem hanya mendeteksi kata yang terdapat di dalam perbendaharaan yang dimilikinya, dan mengabaikan kata – kata lain yang tidak dimilikinya. Sehingga walau pengguna mengucapkan kalimat yang berbeda tetapi di dalam kalimat tersebut terdapat sebuah kata yang sama dan terdapat di perbendaharaan sistem, maka hasil pengenalan akan sama.

c. Continuous Speech

Pada metode continuous speech, sistem akan mengenali dan memproses setiap kata yang diucapkan.

2.3.2.2. Ketergantungan Terhadap Pengguna

Ketergantungan terhadap pengguna merupakan sebuah kondisi yang menjadikan sistem pengenalan pembicaraan memiliki beberapa sifat. Sifat – sifat tersebut adalah speaker dependent, speaker independent dan speaker adaptive.

a. Speaker Dependant

Pada speaker dependent, sistem membutuhkan pelatihan untuk setiap pengguna yang akan menggunakan system tersebut.

b. Speaker Independent

Pada speaker independent, pengguna tidak perlu melakukan pelatihan sebelum dapat menggunakan sistem, karena sistem mampu mengenali suara semua pengguna tidak tergantung warna suara dan dialek yang digunakan.

c. Speaker Adaptive

Speaker adaptive merupakan perpaduan dari speaker dependent dan speaker independent, dimana pengguna tidak perlu melakukan pelatihan dan


(24)

keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama bekerja terus menerus selama beberapa waktu tertentu (Junaedih. 2007). 2.3.2.3. Pencocokan Kata

Pencocokan kata adalah proses untuk mencocokkan kata ucapan yang berhasil diidentifikasi dengan basis data yang dipunyai oleh sistem.

2.3.2.4. Pembendaharaan Kata

Perbendaharaan kata ialah bagian terakhir dalam sebuah sistem pengenalan pembicaraan. Jika perbendaharaan kata berjumlah banyak, maka sebuah sistem akan mudah dalam melakukan pencocokan kata, tetapi dengan makin meningkatnya jumlah perbendaharaan kata, maka jumlah kata yang mempunyai ucapan hampir sama juga meningkat, dimana hal ini menurunkan keakuratan pengenalan.

Dan sebaliknya, jika sebuah sistem mempunyai perbendaharaan kata sedikit, maka keakuratan pengenalan akan tinggi karena sedikitnya kata yang hampir sama, tetapi akan semakin banyak kata yang tidak terkenali.

2.4 Speech Application Programming Interface (SAPI)

Speech recognition bukanlah hal baru untuk dunia penelitian teknologi. Penelitian – penelitian mengenai speech recognition telah banyak dilakukan dan salah satu diantaranya yang cukup dikenal adalah penelitian yang dilakukan oleh Microsoft Corporation. Microsoft telah mengembangkan sistem speech recognition yang dapat digunakan pada sistem operasi Windows. Sistem tersebut memiliki perkembangan termasuk standard interface SAPI (Speech Application Programming Interface) yang memungkinkan pembuat aplikasi menerapkan sistem speech recognition menggunakan engine yang berbeda tanpa merubah aplikasi yang dibuat.

Sekarang banyak aplikasi yang dikembangkan menggunakan speech recognition, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat High-performance fighter aircraft, Training air traffic controllers, sampai pada alat yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan, maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi pengucapan user (Sunny, A.S. 2009).


(25)

11

2.4.1 Komponen Speech Application Programming Interface (SAPI)

Selain mengenali ucapan, SAPI juga memiliki fungsi untuk mengenali ucapan dan mengubahnya menjadi teks. Hal tersebut dapat terjadi karena di dalam SAPI sendiri terdapat komponen – komponen yang memang memiliki fungsi – fungsi khusus untuk pengembangan sistem speech recognition, diantaranya :

a. Voice Command

Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan pengenalan suara.

b. Voice Dictation

Sebuah obyek level tinggi untuk continous dictation speech recognition. c. Voice Talk

Sebuah obyek level tinggi untuk speech synthesis. d. Voice Telephony

Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara. e. Direct Speech Recognition

Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara (direct control of recognition engine)

f. Direct Text to Speech

Sebuah obyek sebagai mesin yang mengontrol synthesis. g. Audio Object

Untuk membaca dari audio device atau sebuah file audio.

2.4.2 Antar muka Speech Application Programming Interface (SAPI)

SAPI 5.1 terdiri dari 2 antar muka yaitu application programming interface (API) dan device driver interface (DDI) (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).

a. Application Programming Interface (API)

Windows Application Programming Interface (API) adalah sekumpulan fungsi dan konstanta yang terdapat dalam file-file Dynamic Link Library (DLL) yang menyusun Sistem Operasi Windows (Supriyono, B., 2004). Pada sistem


(26)

pengenalan pembicaraan, aplikasi akan menerima event pada saat suara yang diterima telah dikenali oleh engine. Arsitektur SAPI sendiri dapat kita lihat pada blog diagram seperti yang terlihat pada gambar 2.1 (Supriyono, B., 2004).

Gambar 2.1 Blok Diagram Arsitektur SAPI

Dalam API terdapat fungsi-fungsi/ perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut kemudian akan memanggil system calls sesuai dengan sistem operasinya (Sianturi, A.H., 2014).

b. Device Driver Interface (DDI)

DDI menyediakan fungsi untuk menerima data suara dari SAPI dan mengembalikan pengenalan frasa pada level SAPI paling dasar. Terdapat dua antar muka yang digunakan oleh DDI yaitu ISpSREngine, yang diimplementasikan oleh engine dan ISpSREngineSite yang diimplementasikan oleh SAPI (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).

2.5 Transformasi Fourier

Transformasi Fourier merupakan suatu persamaan integral untuk menghitung frekuensi, amplitudo dan fase dari suatu gelombang sinyal (Stefanus, Hamz, M. &


(27)

13

Angzas, Y., 2005). Sementara untuk menghitung spektrum frekuensi sinyal pada komputer digital, kita membutuhkan algoritma Discrete Fourier Transform (DFT).

2.5.1 Discrete Fourier Transform (DFT)

DFT adalah suatu persamaan integral alat yang digunakan untuk menganalisa suatu frekuensi diskrit (Stefanus, Hamz, M. & Angzas, Y., 2005). DFT mengubah sinyal domain waktu, menjadi sinyal domain frekuensi. DFT dapat diterjemahkan dalam rumus :

F(k∆f) ≡ ∑

for k = 0, 1, 2, ….., N – 1 (1)

N = jumlah sampel yang diambil T = total waktu sampling

∆t = pertambahan waktu antar sampel = frekuensi sampel =

2.5.2 Fast Fourier Transform (FFT)

Fast Fourier Transform merupakan DFT dengan algoritma yang lebih optimal, sehingga menghasilkan perhitungan yang lebih cepat. Dengan DFT, memerlukan waktu O(n2) untuk mengolah sampel data sebanyak n buah. Hal ini tentunya akan memakan waktu lama bila sampel data makin banyak (Stefanus, Hamz, M. & Angzas, Y., 2005).

Metode FFT dapat dilakukan dalam domain waktu dan frekuensi, yang disebut sebagai desimasi – dalam – waktu (decimation-in-time) dan desimasi-dalam-frekuensi (decimation-in-frequency) (Gunawan, D., Juwono, F.H., 2012). Pada prinsipnya algoritma ini adalah memecah N-titik menjadi dua (N/2) – titik, kemudian memecah tiap (N/2) – titik menjadi dua (N/4) – titik, begitu seterusnya sampai hanya terdapat 1 titik. Prinsip tersebut dapat kita lihat lebih jelas pada gambar 2.2 berikut (Gunawan, D., Juwono, F.H., 2012).


(28)

Gambar 2.2 Desimasi untuk 16 titik

Sedangkan untuk konsep FFT sendiri secara keseluruhan dapat kita lihat pada gambar 2.3 berikut (Gunawan, D., Juwono, F.H., 2012).

Gambar 2.3 Konsep FFT

Dikarenakan FFT masih bagian dari perhitungan DFT, maka akan lebih baik menghitung FFT dengan mempertimbangkan nilai N DFT terlebih dahulu (Yang, T., 2012).


(29)

15

X(k) = ∑ k = 0, 1, 2…N-1 (2)

Pisahkan x(n) menjadi dua bagian : x(ganjil) dan x (genap) = x(2m), dimana m=0, 1,2,…,N/2-1. Lalu nilai N DFT juga dibagi dua bagian untuk tiap nilai N/2 : X(k) = ∑ = ∑ + ∑

= ∑ + ∑ (3)

Dimana m = 0, 1, 2,…., N/2-1 Karena :

= cos( ) + j sin( ) (4)

= cos[ ] + j. sin[

= -cos( ) – j.sin( ) = -[cos( ) + j.sin( )]

= - (5)

Maka :

= - (6)

Jadi ketika faktor diubah dengan setengah periode, nilai dari faktor tersebut tidak akan berubah, tetapi tanda nilai faktor tersebut akan menjadi sebaliknya. Hal ini merupakan sifat simetri dari faktor. Karena factor bisa juga ditulis sebagai =

, maka :

= - (7)

Dan

( 2 = - = (8)


(30)

X(k) = ∑ (9) k = 0,1….N/2

X(k + N/2) = - (10)

k = 0, 1, 2…..N/2

Jadi nilai N DFT dipisah menjadi dua nilai N/2 DFT. Dari persamaan (9), (k) memiliki (N/2) * (N/2) = (N/2)2. memiliki N/2 + (N/2)2.

Maka jumlah total dari perhitungan untuk X(k) adalah 2(N/2)2 + N/2=N2/2+N/2. Untuk nilai awal N DFT, dimulai dari N2. Maka pada langkah pertama, pisahkan x(n) menjadi dua bagian yang membuat perhitungan dari N2 menjadi N2/2+N/2. Jumlah angka perkalian dikurangi setengah secara berkala.

Berikut adalah proses pengurangan perkalian dari nilai N menjadi N/2. Lanjutkan pemisahan (m) dan (m) menjadi bagian ganjil dan genap dengan cara yang sama, perhitungan untuk N/2 akan dikurangi menjadi N/4. Kemudian perhitungan DFT akan berkurang secara terus – menerus. Jadi jika sinyal untuk nilai N DFT terpisah terus – menerus sampai sinyal akhir menjadi satu titik. Misalkan ada N=2v DFT yang perlu dihitung. Maka jumlah pemisahan yang dapat dilakukan adalah v = (N). maka jumlah total perkalian akan dikurangi hingga (N/2) (N). untuk tambahan perhitungan, angka yang akan dikurangi mencapai N (N). Karena perkalian dan penambahan dikurangi, maka kecepatan perhitungan komputasi DFT dapat ditingkatkan. Tujuan utama untuk Radix -2 FFT adalah memisahkan deretan data menjadi ganjil dan genap secara terus – menerus sampai mendekati setengah perhitungan.

2.6 Penelitian Terdahulu

Pada bagian ini akan dipaparkan mengenai penelitian terdahulu yang berkaitan dengan aplikasi perintah suara. Seperti yang tertera pada tabel 2.1


(31)

17

Tabel 2.1 Penelitian Terdahulu

No. Peneliti Tahun Judul Penelitian Keterangan

1 Syarif, Daryanto, et al

2011 Aplikasi Speech Application Programming

Interface (SAPI) 5.1

Sebagai Perintah untuk Pengoperasian Aplikasi Berbasis Windows

Memanfaatkan SAPI untuk menjalankan aplikasi berbasis windows

2 Nurcahyono, Kristalina, et al

2011 Pembuatan Speech Recognition dan Database Wicara Untuk Konrol Peralatan Rumah Tangga Jarak Jauh

Noise, jenis kelamin dan usia user

mempengaruhi hasil akhir aplikasi 3 Yang 2012 The Algorithms of Speech

Recognition,

Programming and

Simulating in MATLAB

Pengujian

algoritma FFT dalam sistem speech recognition menggunakan MATLAB


(32)

BAB 3

ANALISIS DAN PERANCANGAN SISTEM

Bab ini menjelaskan data yang digunakan, flowchart, diagram use case serta tahapan – tahapan dan rancangan antar muka sistem

3.1 Identifikasi Masalah

Keinginan untuk membuat cara berinteraksi yang lebih alami menyebabkan perlunya dicari alternatif lain sebagai pengganti atau pelengkap piranti yang sudah ada. Manusia dalam berinteraksi dengan sesama manusia secara umum banyak dilakukan menggunakan ucapan. Dengan menerapkan cara interaksi antara sesama manusia tersebut diharapkan menjadi cara alternatif yang dapat dipakai untuk interaksi antara manusia dan komputer secara lisan layaknya interaksi antara manusia dengan manusia (Syarif, A., Daryanto, T. & Arifin, M.J., 2011).

Interaksi antara manusia dengan komputer yang paling berkembang saat ini adalah menggunakan suara sebagai input untuk menjalankan aplikasi. Kebanyakan aplikasi – aplikasi yang menggunakan suara sebagai input digunakan menggunakan perangkat mobile dan memiliki fungsi tersendiri seperti aplikasi pencari lirik lagu ataupun yang pencarian kata. Disini penulis ingin menerapkan suara sebagai input untuk aplikasi yang dapat mengoperasikan windows. Walaupun windows sudah memiliki Speech Application Programming Interface (SAPI) untuk mengoperasikan windows menggunakan suara, penulis ingin menerapkan perintah yang bersifat bahasa Indonesia. Selama ini kebanyakan aplikasi perintah suara bersifat mengenali suara dan mengenali ucapan yang berbahasa inggris. Untuk penelitian ini, penulis akan menerapkan bahasa Indonesia sebagai perintah suara untuk menjalankan aplikasi yang dapat mengoperasikan perintah pada windows.


(33)

19

3.2 Data yang Digunakan

Dalam pembangunan sistem ini, data yang akan digunakan berupa suara yang terdiri dari dua orang perempuan dan dua orang laki - laki dengan usia 20 – 60 tahun dengan kata yang berjumlah 12 seperti yang dijabarkan dalam tabel 3.1.

Tabel 3.1 Penjelasan data yang akan digunakan

NO JENIS SUARA KATA

1 Perempuan A

Explorer Buka Atas Bawah Kanan Kiri Kembali Browser Word Point Excel Publisher 2 Perempuan B

3 Laki – laki A

4 Laki – laki B

Kata yang akan digunakan sebagai input adalah :

- Explorer : untuk mengaktifkan window explorer

- Buka : untuk membuka folder atau menjalankan file - Atas : untuk menggerakkan kursor satu langkah ke atas - Bawah : untuk menggerakkan kursor satu langkah ke bawah - Kanan : untuk menggerakkan kursor satu langkah ke kanan - Kiri : untuk menggerakkan kursor satu langkah ke kiri

- Kembali : untuk mengembalikan explorer ke halaman sebelumnya - Browser : untuk mengaktifkan browser google chrome

- Word : untuk mengaktifkan aplikasi Microsoft office Word - Point : untuk mengaktifkan aplikasi Microsoft office Power Point


(34)

- Excel : untuk mengaktifkan aplikasi Microsoft office Excel - Publisher : untuk mengaktifkan aplikasi Microsoft office Publisher

3.3 Analisis Sistem

Analisis sistem bertujuan untuk mengidentifikasi sistem yang akan dikembangkan. Analisis diperlukan sebagai dasar perancangan sistem. Pada penelitian ini, analisis yang akan dilakukan berupa arsitektur umum dan flowchart. Arsitektur umum akan menggambarkan keseluruhan metode yang diterapkan dan flowchart dapat menggambarkan tahapan – tahapan sistem yang akan dirancang secara terstruktur sehingga memudahkan pemahaman atas gambaran sistem yang sedang dirancang. Arsitektur umum mengenai sistem pengenapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah dasar pada windows dapat dilihat pada gambar 3.1.

Ekstraksi Ciri Pengenalan Pola (Speech API)

Jalankan perintah pada windows Input suara

Digitalisasi suara

Fast Fourier

Transform Grammar

Gambar 3.1 Arsitektur umum sistem

Adapun penjelasan tahapan dari arsitektur umum sistem adalah sebagai berikut : 1. User berbicara menggunakan mikrofon agar kata yang diucapkan dapat

dijadikan input untuk menjalankan aplikasi

2. Suara tersebut akan diubah menjadi sinyal digital menggunakan SoundCard yang terdapat di dalam komputer

3. Setelah input telah berbentuk sinyal digital di dalam komputer, tahapan selanjutnya adalah proses ekstraksi dimana sinyal tersebut akan diubah menjadi spektrum suara


(35)

21

4. Pada proses ekstraksi tersebut, algoritma Fast Fourier Transform akan mengubah sinyal digital ke dalam bentuk spektrogram

5. Setelah proses spektogram, aplikasi akan menggunakan Speech API sebagai library yang berperan sebagai tempat menetapkan grammar dan pengenal pola sinyal yang dimasukkan

6. Sebelum sinyal dikenali, grammar ditetapkan terlebih dahulu sebagai pembanding di tahap pengenalan nantinya

7. Pada tahap pengenalan, engine pada Speech API yang berfungsi sebagai recognition akan mengenali jenis sinyal dan membandingkannya dengan yang ada pada grammar

8. Setelah input dikenali, aplikasi akan dibaca sebagai perintah yang akan digunakan untuk menjalankan perangkat Windows

Bentuk flowchart dari tahapan di atas dapat dilihat pada gambar 3.2

Mulai

Sinyal suara diubah ke dalam bentuk

digital

Pengenalan pola

spektrum suara Grammar

Dikenali Jalankan komando

pada perangkat end Masukkan

sinyal suara

Proses ekstraksi (FFT)

ya tidak


(36)

3.3.1 Proses Ekstraksi

Pada proses ekstraksi, sinyal suara yang sudah dikonversi ke dalam bentuk sinyal digital akan diubah ke dalam bentuk spektrum suara untuk mendapatkan karakteristiknya. Pada proses ini digunakan algoritma Fast Fourier Transform untuk mendapatkan spektrogram sinyal sehingga dapat dijadikan pola untuk dikenali pada proses pengenalan.

Adapun penjelasan mengenali algoritma Fast Fourier Transform dapat dilihat melalui pseudocode berikut :

Fast Fourier Transform

For i = 0 To bitsInLength - 1

m, n, k, j : integer

For k = 0 to m -1

alpha : double

alpha = -(2 * Math.PI/n) j = k

while j < length even = data(j)

odd = oddmultiplier * data(j+m) data(j) = even + odd

data (j + m) = even - odd

j += n End While

Next Next


(37)

23

3.3.2 Penetapan Grammar

Sebelum spektrogram sinyal suara dikenali, jenis perintah yang akan dikenali akan ditetapkan terlebih dahulu sebagai grammar. Grammar ini akan dijadikan contoh untuk dibandingkan pada tahap pengenalan pola.

3.3.3 Pengenalan pola spektrum suara

Pada tahap pengenalan pola spektrum suara, aplikasi akan menggunakan engine speech API untuk mengenali pola spekrum suara tersebut. Speech API akan membandingkan suara tersebut dengan grammar yang sudah ditetapkan terlebih dahulu.

3.3.4 Jalankan perintah pada perangkat

Proses jalankan perintah pada perangkat merupakan tahap akhir atau tahap eksekusi dari aplikasi ini, spektrogram yang telah dikenali dan disesuaikan dengan grammar akan menjadi pemicu perintah untuk menjalankan operating system Windows.

3.4 Perancangan Sistem

Pada perancangan sistem akan dilakukan perancangan bagaimana aplikasi akan memproses sinyal suara serta menjalankannya sebaga perintah untuk mengoperasikan operating system Windows dan dilakukan juga perancangan tentang antarmuka sistem yang akan dibangun.

3.4.1 Diagram Use Case

Use case diagram merupakan pemodelan terhadap cara kerja maupun tingkah laku sistem informasi yang akan dibuat. Use case mendeskripsikan interaksi tipikal antara user dengan sistem itu sendiri dengan member sebuah narasi tentang bagaimana sistem tersebut digunakan (Fowler, 2005). Diagram use case sistem untuk aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar pada windows dapat dilihat pada gambar 3.3.


(38)

Halaman utama / input suara

Tentang

Bantuan

Jalankan komando pada perangkat User

Gambar 3.3 diagram use case sistem

3.4.2Spesifikasi Use Case

Use case spesifikasi adalah dekskripsi mengenai use case diagram, menjelaskan bagaimana sebuah use case itu bekerja (Muchtar, et al. 2011).

Tabel 3.2 Spesifikasi use case untuk input suara

Nama use case Halaman utama / input suara

Aktor Pengguna komputer (user)

Deskripsi Use case ini digunakran oleh user untuk menginput suara

Pre condition User diasumsikan sudah mengetahui kata apa saja

yang bisa dijadikan input untuk menjalankan sistem Characteristic of activation Eksekusi dapat dilakukan oleh siapapun

Basic flow - User yang sudah mengetahui kata yang ingin

digunakan menjalankan sistem atau menginput sendiri kata yang ingin digunakan sebagai input perintah

- User melakukan input suara

- Sistem mengenali input dan mengeksekusi perintah


(39)

25

- Windows dijalankan berdasarkan perintah yang diinput

Alternative flow - Perintah tidak dikenali

- User melakukan input suara lagi

Post condition User dapat memasukkan input suara berupa kata dan melihat daftar kata yang dapat digunakan sebagai perintah untuk menjalankan windows

Limitations User hanya dapat menginput kata tertentu sesuai

dengan yang tertera pada halaman utama

Tabel 3.3 Spesifikasi use case untuk bantuan

Nama use case Bantuan

Aktor Pengguna komputer (user)

Deskripsi Use case ini digunakan oleh user untuk melihat petunjuk penggunaan aplikasi

Pre condition Setiap pengunjung bisa mengakses modul ini

Characteristic of activation Eksekusi dapat dilakukan oleh siapa pun

Basic flow User mengklik tombol bantuan untuk melihat

petunjuk penggunaan aplikasi

Alternative flow

-Post condition User dapat melihat petunjuk penggunaan aplikasi

Limitations -

3.4.3Diagram Aktifitas

Activity diagram sistem menggambarkan urutan aktivitas dalam sistem yang sedang dirancang. Aktivitas yang digambarkan hanya secara umum, tidak secara eksak seperti pembuatan flowchart yang terstruktur. Diagram aktivasi menjelaskan tentang kegiatan apa yang dapat dilakukan pada sistem tetapi tidak menjelaskan apa yang telah dilakukan oleh aktor (Fowler, 2005).

Pada gambar 3.4, setelah user melihat daftar perintah user dapat memilih untuk menjalankan sistem dengan cara menginput suara dengan kata yang telah tercantum


(40)

dalam daftar. Sistem akan merekam suara tersebut dan melakukan proses ekstraksi ciri dan dilanjutkan dengan proses pengenalan pola sehingga eksekusi berupa pengoperasian windows sesuai inputan suara dapat dijalankan.

Input suara

Jalankan perintah untuk perangkat

Ekstraksi ciri

Pengenalan pola

User Sistem

Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara)

Pada gambar 3.5, sistem memberikan informasi mengenai petunjuk penggunaan aplikasi yang disebut bantuan. Hal ini bertujuan untuk memberikan kemudahan bagi user yang kurang terbiasa dengan aplikasi speech recognition atau pengguna pertama kali.

User Sistem

Lihat bantuan Menampilkan petunjuk penggunaan aplikasi


(41)

27

3.4.4 Perancangan Antar Muka

Perancangan antar muka merupakan gambaran umum tentang perancangan setiap tampilan yang terdapat dalam sistem yang akan dibangun. Berikut akan dijelaskan rancangan bagian-bagian dari sistem.

a. Rancangan halaman awal

Pada halaman awal nama aplikasi terletak paling atas, dengan logo universitas di bagian kiri, keterangan perintah yang tersedia di kanan serta progress bar untuk menandakan suara terdeteksi tepat di sebelah kiri keterangan perintah seperti yang tertera pada gambar 3.6.

Gambar 3.6 Rancangan halaman awal

b. Rancangan halaman bantuan

Pada rancangan halaman bantuan, nama aplikasi dan logo tidak berubah. Namun, pada bawah nama aplikasi tersedia tiga bagian untuk penjelasan mengenai penggunaan aplikasi. Kemudian di bawah bagian keterangan penggunaan aplikasi tersebut terdapat satu tombol kembali untuk mengembalikan ke halaman awal seperti yang terlihat pada gambar 3.7.


(42)

(43)

BAB 4

IMPLEMENTASI DAN PENGUJIAN SISTEM

Pada bab ini, pengimplementasian dan pengujian sistem akan dibahas sesuai dengan analisis dan perancangan yang telah dibahas pada bab tiga. Tahapan ini bertujuan untuk menampilkan hasil tampilan akhir sistem yang dibangun dan proses pengujian sistem untuk melihat tingkat keberhasilan sistem dalam mengenali perintah berbahasa Indonesia.

4.1 Implementasi Sistem

Berdasarkan analisis dan perancangan yang dibuat, sistem akan diimplementasikan menggunakan bahasa pemrograman visual basic dan aplikasi SAPI 5.1. Kebutuhan dalam pembangunan sistem ini meliputi perangkat keras dan lunak.

4.1.1 Perangkat keras

Spesifikasi perangkat keras yang digunakan untuk implementasi sistem adalah sebagai berikut :

- Processor, Intel® Core™ i3-3217U CPU @ 1.80 GHz - RAM , 4 GB

- Harddisk, 500 GB - Microphone


(44)

4.1.2 Perangkat lunak

Spesifikasi perangkat lunak yang digunakan untuk implementasi sistem adalah sebagai berikut :

- Windows 7 Pro 64-bit

- Speech Application Programming Interface (SAPI) 5.1 - Microsoft Visual Studio 2012

- CorelDraw 12

4.1.3 Implementasi perancangan antar muka

Adapun implementasi perancangan antarmuka yang telah dilakukan sebelumnya pada sistem adalah:

1. Halaman Awal

Halaman awal merupakan halaman pertama yang muncul apabila aplikasi dijalankan. Pada halaman ini terdapat keterangan perintah yang dapat digunakan, progress bar, dua text box serta tombol bantuan dan tombol tentang. Progress bar berfungsi untuk mendeteksi suara yang masuk sehingga user dapat melihat apakah suaranya cukup keras atau tidak untuk menjalankan aplikasi. Dua text box yang terdapat pada halaman awal ini berfungsi untuk mendeskripsikan perintah yang diucapkan dan juga untuk mengetahui tingkat frekuensi suara baik suara input ataupun suara keadaan sekitar (noise). Sedangkan tombol bantuan dan tombol tentang berfungsi untuk membuka halaman bantuan dan tentang. Untuk input kata – kata pengganti perintah dapat diketik pada textbox yang tersedia dan disesuaikan dengan ketersediaan combobox. Untuk keterangan perintah yang dapat digunakan dapat langsung dilihat pada halaman awal aplikasi penerapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah dasar pada windows seperti yang terlihat pada gambar 4.1


(45)

31

Gambar 4.1 Halaman Awal

2. Halaman Bantuan

Pada halaman bantuan, terdapat tiga jenis penjelasan. Penjelasan pertama adalah deskripsi perintah yang dapat digunakan serta fungsi – fungsinya. Penjelasan yang kedua merupakan penjelasan mengenai cara penggunaan aplikasi.Sedangkan penjelasan yang ketiga adalah penjelasan mengenai penggunaan control panel / penetapan perintah sendiri. Halaman bantuan juga memiliki tombol kembali yang berfungsi mengembalikan aplikasi ke halaman awal. Halaman bantuan penerapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah dasar windows dapat dilihat pada gambar 4.2


(46)

Gambar 4.2 Halaman Bantuan

4.2 Pengujian Sistem

Pengujian sistem dilakukan untuk mengantisipasi kemungkinan terjadinya eror pada komponen ataupun pada interface dari program. Hal ini dilakukan dengan menguji apakah sistem tersebut telah memenuhi functional requirement dan non-functional requirement (Sommerville, 2004).

Metode pengujian yang digunakan adalah metode pengujian black box. Pengujian black box merupakan pengujian yang dilakukan pada interface sistem yang digunakan untuk mendemonstrasikan fungsi sistem yang dioperasikan (Gea, 2011).

4.2.1 Kasus dan Hasil Pengujian Sistem

Adapun kasus dan hasil pengujian sistem menggunakan teknik black box adalah sebagai berikut :

a. Halaman Awal


(47)

33

Tabel 4.1 Hasil pengujian halaman awal

No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian

1 Mengklik tombol “Bantuan” Aplikasi menampilkan halaman

bantuan Berhasil

2 Mengklik tombol “Tentang” Aplikasi menampilkan halaman

tentang Berhasil

3 Mengklik tombol “Tetapkan”

Aplikasi menampilkan message box berisi kata yang diinput dalam text box

Berhasil

4

Masukkan input suara “Explorer” menggunakan EYD

Aplikasi menampilkan windows

explorer Berhasil

Masukkan input suara “Explorer” tidak

menggunakan EYD

Aplikasi tidak menampilkan

windows explorer Berhasil

5

Masukkan input suara “Buka” menggunakan EYD

Aplikasi akan membuka folder / file yang terpilih pada windows explorer

Berhasil Masukkan input

suara “Buka” tidak

menggunakan EYD

Aplikasi tidak akan membuka folder / file yang terpilih pada windows explorer

Tidak Berhasil

6

Masukkan input suara “Atas” menggunakan EYD

Aplikasi akan menggeser pointer satu langkah ke atas pada

windows explorer

Berhasil

Masukkan input suara “Atas” tidak menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke atas pada windows explorer

Berhasil

7

Masukkan input suara “Bawah” menggunakan EYD

Aplikasi akan menggeser pointer satu langkah ke bawah pada windows explorer

Berhasil Masukkan input

suara “Bawah” tidak

menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke bawah pada windows explorer

Berhasil

8

Masukkan input suara “Kanan” menggunakan

Aplikasi akan menggeser pointer satu langkah ke kanan pada windows explorer


(48)

EYD

Masukkan input suara “Kanan” tidak

menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke kanan pada windows explorer

Berhasil

9

Masukkan input suara “Kiri” menggunakan EYD

Aplikasi akan menggeser pointer satu langkah ke kiri pada

windows explorer

Berhasil Masukkan input

suara “Kiri” tidak menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke kiri pada windows explorer

Berhasil

10

Masukkan input suara “Kembali” menggunakan EYD

Aplikasi akan mengembalikan ke direktori sebelumnya pada windows explorer

Berhasil

Masukkan input suara “Kembali” tidak

menggunakan EYD

Aplikasi tidak akan

mengembalikan ke direktori sebelumnya pada windows explorer

Berhasil

11

Masukkan input suara “Browser” menggunakan EYD

Aplikasi menampilkan browser

Google Chrome Berhasil

Masukkan input suara “Browser” tidak

menggunakan EYD

Aplikasi tidak menampilkan

browser Google Chrome Berhasil

12

Masukkan input suara “Word” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Word Berhasil

Masukkan input suara “Word” tidak

menggunakan EYD

Aplikasi tidak menampilkan

Microsoft Office Word Berhasil

13

Masukkan input suara “Point” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Power Point Berhasil Masukkan input

suara “Point” tidak

menggunakan

Aplikasi tidak menampilkan


(49)

35

EYD

14

Masukkan input suara “Excel” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Excel Berhasil

Masukkan input suara “Excel” tidak

menggunakan EYD

Aplikasi tidak menampilkan

Microsoft Office Excel Berhasil

15

Masukkan input suara “Publisher” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Publisher Berhasil

Masukkan input suara “Publisher” tidak

menggunakan EYD

Aplikasi tidak menampilkan

Microsoft Office Publisher Berhasil

b. Halaman Bantuan

Tabel 4.2 akan menjelaskan skenario pengujian sistem pada halaman bantuan

Tabel 4.2 Hasil pengujian halaman bantuan

No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian

1 Mengklik tombol “kembali”

Aplikasi akan menutup halaman bantuan dan kembali ke halaman awal

Berhasil

4.2.2 Pengujian kinerja sistem

Pada pengujian kinerja sistem akan dijelaskan hasil perancangan sistem yang dibuat. Hasil dari tiap halaman sistem adalah sebagai berikut :

a. Halaman awal

Gambar 4.3 dan gambar 4.4 menampilkan halaman awal dari aplikasi. Apabila user mengatakan kata “Explorer”, maka windows explorer akan muncul tanpa


(50)

mengklik apapun. Begitu pula apabila user mengatakan kata “atas”, “buka” dan perintah lain yang berfungsi menggeser pointer, maka pointer akan bergerak tanpa kita menggunakan mouse.

Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan


(51)

37

Sedangkan untuk perintah memanggil aplikasi seperti browser, word, excel dan publisher juga dapat dilakukan sama seperti windows explorer seperti yang terlihat pada gambar 4.5 sampai gambar 4.8

Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan


(52)

Gambar 4.7 Halaman awal ketika perintah “excel” diucapkan

Gambar 4.8 Halaman awal ketika perintah “publisher” diucapkan

Pada gambar 4.9 adalah halaman ketika user menggunakan fasilitas control panel / tetapkan perintah untuk memasukkan kata – kata yang user inginkan untuk dijadikan perintah


(53)

39

Gambar 4.9 Halaman awal ketika input kata ganti perintah

b. Halaman bantuan

Gambar 4.10 menunjukkan halaman bantuan dari aplikasi ini. Apabila user mengklik tombol kembali maka halaman tersebut akan tertutup dan kembali pada halaman awal


(54)

4.3 Hasil Pengujian Suara

Disini penulis akan memaparkan hasil pengujian suara dari dua orang perempuan dan dua orang laki – laki sebanyak lima kali per perintah dengan tingkat sensitifitas microphone dan keadaan frekuensi noise yang berbeda. Berikut penjelasan pengujian dari tiap kondisi.

4.3.1 Hasil pengujian suara dengan tingkat frekuensi noise0 – 500 Hz

Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi berada pada 0 – 500 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.4

Tabel 4.4 Pengujian suara dengan tingkat frekuensi noise 0 500 Hz

Subjek Kata yang diuji

Pengujian (Berhasil / Gagal /

Jumlah)

Tingkat frekuensi lingkungan

(noise)

Tingkat keberhasilan

B G J

Perempuan A

Explorer 5 0 5

0 – 500 Hz

100 %

Buka 5 0 5 100 %

Atas 5 0 5 100 %

Bawah 5 0 5 100 %

Kanan 5 0 5 100 %

Kiri 5 0 5 100 %

Kembali 5 0 5 100 %

Browser 5 0 5 100 %

Word 5 0 5 100 %

Point 3 2 5 60 %

Excel 5 0 5 100 %

Publisher 5 0 5 100 %

Perempuan B

Explorer 5 0 5

0 – 500 Hz

100 %

Buka 5 0 5 100 %

Atas 5 0 5 100 %

Bawah 5 0 5 100 %

Kanan 5 0 5 100 %

Kiri 0 5 5 0 %

Kembali 5 0 5 100 %

Browser 2 3 5 40 %

Word 0 5 5 0 %

Point 0 5 5 0 %

Excel 4 1 5 80 %

Publisher 3 2 5 60 %

Laki – Laki A

Explorer 4 1 5

0 – 500 Hz

80 %

Buka 5 0 5 100 %


(55)

41

Bawah 5 0 5 100 %

Kanan 5 0 5 100 %

Kiri 5 0 5 100 %

Kembali 5 0 5 100 %

Browser 4 1 5 80 %

Word 5 0 5 100 %

Point 4 1 5 80 %

Excel 5 0 5 100 %

Publisher 4 1 5 80 %

Laki – Laki B

Explorer 4 1 5

0 – 500 Hz

80 %

Buka 5 0 5 100 %

Atas 5 0 5 100 %

Bawah 2 3 5 40 %

Kanan 5 0 5 100 %

Kiri 5 0 5 100 %

Kembali 5 0 5 100 %

Browser 5 0 5 100 %

Word 5 0 5 100 %

Point 1 4 5 20 %

Excel 5 0 5 100 %

Publisher 5 0 5 100 %

Dari tabel 4.4 dapat diketahui persentase keberhasilan aplikasi pada lingkungan dengan tingkat frekuensi (noise) 0 – 500 Hz adalah sebagai berikut : Perempuan A = 96,6 %

Perempuan B = 65 % Laki – laki A = 83 % Laki – laki B = 80 %

Dengan tingkat keberhasilan per perintah sebagai berikut : - Explorer = 90 %

- Buka = 100 %

- Atas = 90 %

- Bawah = 85 % - Kanan = 100 %

- Kiri = 75 %

- Kembali = 100 % - Browser = 80 % - Word = 75 % - Point = 40 % - Excel = 95 % - Publisher = 85 %


(56)

4.3.2 Hasil pengujian suara dengan tingkat frekuensi (noise) 501 – 1000 Hz

Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi berada pada 501 – 1000 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.5

Tabel 4.5 Pengujian suara dengan tingkat frekuensi noise 501 1000 Hz

Subjek Kata yang diuji

Pengujian (Berhasil / Gagal /

Jumlah)

Tingkat frekuensi lingkungan

(noise)

Tingkat keberhasilan

B G J

Perempuan A

Explorer 0 5 5

501 – 1000 Hz

0 %

Buka 2 3 5 40 %

Atas 4 1 5 80 %

Bawah 3 2 5 60 %

Kanan 3 2 5 60 %

Kiri 1 4 5 20 %

Kembali 1 4 5 20 %

Browser 2 3 5 40 %

Word 2 3 5 40 %

Point 2 3 5 40 %

Excel 5 0 5 100 %

Publisher 2 3 5 40 %

Perempuan B

Explorer 1 4 5

501 – 1000 Hz

20 %

Buka 2 3 5 40 %

Atas 3 2 5 60 %

Bawah 1 4 5 20 %

Kanan 1 4 5 20 %

Kiri 0 5 5 0 %

Kembali 2 3 5 40 %

Browser 0 5 5 0 %

Word 0 5 5 0 %

Point 0 5 5 0 %

Excel 1 4 5 20 %

Publisher 0 5 5 0 %

Laki – Laki A

Explorer 3 2 5

501 – 1000 Hz

60 %

Buka 3 2 5 60 %

Atas 4 1 5 80 %

Bawah 3 2 5 60 %

Kanan 5 0 5 100 %

Kiri 3 2 5 60 %

Kembali 1 4 5 20 %

Browser 2 3 5 40 %

Word 1 4 5 20 %

Point 2 3 5 40 %


(57)

43

Publisher 2 3 5 40 %

Laki – Laki B

Explorer 1 4 5

501 – 1000 Hz

20 %

Buka 0 5 5 0 %

Atas 0 5 5 0 %

Bawah 0 5 5 0 %

Kanan 2 3 5 40 %

Kiri 1 4 5 20 %

Kembali 1 4 5 20 %

Browser 0 5 5 0 %

Word 0 5 5 0 %

Point 0 5 5 0 %

Excel 0 5 5 0 %

Publisher 0 5 5 0 %

Dari tabel 4.5 dapat diketahui persentase keberhasilan aplikasi pada lingkungan dengan tingkat frekuensi noise 501 – 1000 Hz adalah sebagai berikut : Perempuan A = 45 %

Perempuan B = 18,3 % Laki – laki A = 51,6 % Laki – laki B = 8,3 %

Dengan tingkat keberhasilan per perintah sebagai berikut : - Explorer = 25 %

- Buka = 35 %

- Atas = 55 %

- Bawah = 35 % - Kanan = 55 %

- Kiri = 25 %

- Kembali = 25 % - Browser = 20 % - Word = 15 % - Point = 20 % - Excel = 40 % - Publisher = 20 %


(58)

Berdasarkan tabel 4.4 dan tabel 4.5, dapat dilihat persentase keberhasilan sistem dalam mengenali input suara berbahasa Indonesia pada gambar 4.11 dan gambar 4.12

Gambar 4.11 Persentase keberhasilan perintah suara dengan tingkat frekuensi

noise 0 500 Hz

Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat frekuensi

noise 501 1000 Hz

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher 0% 10% 20% 30% 40% 50% 60% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher


(59)

BAB 5

KESIMPULAN DAN SARAN 5.1 Kesimpulan

Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows didapat beberapa kesimpulan, yaitu :

1. Hasil pengujian aplikasi menunjukkan bahwa tingkat keberhasilan perintah suara bahasa Indonesia dikenali dengan tingkat frekuensi lingkungan 0 – 500 Hz adalah 81,15 %. Sedangkan tingkat keberhasilan perintah suara bahasa Indonesia dengan tingkat frekuensi lingkungan 501 – 1000 Hz adalah 30,8 %.

2. Hasil pengujian aplikasi juga menunjukkan bahwa tingkat keberhasilan cenderung rendah apabila pengguna (user) memiliki pengucapan kata yang kurang jelas. Hal tersebut menunjukkan tingkat akurasi aplikasi dipengaruhi oleh kualitas input yang diberikan pengguna (user).

3. Untuk pengujian dengan tingkat frekuensi lingkungan 501 – 1000 Hz, perintah yang masih dapat dikenali adalah kanan dan atas. Sementara untuk perintah pemanggilan aplikasi yang cenderung berbahasa inggris tidak dapat dikenali seperti explorer, word dan point.

4. Jarak waktu perintah diberikan dan eksekusi perintah tidak lebih dari satu detik sehingga dapat dikatakan cukup nyaman untuk digunakan.

Berdasarkan kesimpulan di atas perintah suara berbahasa Indonesia berhasil diterapkan untuk mengoperasikan perintah dasar di windows. Penerapan Speech Application Programming Interface (SAPI) dan algoritma Fast Fourier Transform sesuai dengan kebutuhan aplikasi yang berhasil berjalan dengan tingkat keberhasilan 81,15 %.


(60)

5.2 Saran

Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows terdapat beberapa kelemahan seperti perintah yang tidak dikenali di lingkungan yang ribut, aplikasi juga membatasi kualitas input sehingga aplikasi dapat dikatakan kaku karena membatasi tipe input. Maka dari itu, penulis memiliki beberapa saran agar dapat dilakukan penelitian – penelitian lain yang dapat mengembangkan aplikasi – aplikasi speech recognition berbahasa Indonesia, seperti :

1. Diharapkan penelitian mengenali pengenalan ucapan berbahasa Indonesia dapat dikembangkan sehingga dapat diterapkan di berbagai aplikasi.

2. Dapat menerapkan metode – metode lain yang dapat meningkatkan tingkat keberhasilan walau dengan tingkat frekuensi lingkungan (noise) yang cenderung besar atau ditemukannya metode untuk mereduksi noise (frekuensi lingkungan) sehingga aplikasi dapat berjalan dengan lebih optimal.

3. Diharapkan juga ada penelitian yang bersifat memprediksi pola ucapan sehingga pengguna (user) yang memiliki kebiasaan berbicara tidak menggunakan Ejaan Yang Disempurnakan (EYD) atau memiliki kekurangan dalam melafalkan huruf dapat menggunakan aplikasi pengenalan ucapan dengan nyaman.


(61)

DAFTAR PUSTAKA

Darmawan, Y., 2011. Speech Recognition menggunakan metode Mel Frequency Cepstrum Coefficient dan Algoritma Dynamic Time Wrapping. Skripsi. Universitas Sumatera Utara

Gunawan, D. & Juwono, F.H., 2012. Pengolahan Sinyal Digital dengan Pemrograman MATLAB. 978-979-756-814-6. Graha Ilmu : Yogyakarta

Junaedih. 2007. Implementasi Speech Recognition menggunakan SAPI 5 dan Visual Basic 6.0 pada pembuatan Aplikasi Kalkulator Audio Visual. Skripsi. Universitas Islam Negeri Syarif Hidayatullah Jakarta

Nurcahyono, D., Kristalina, P. & Huda, M. 2011. Pembuatan Speech Recognition dan Database Wicara untuk Kontrol Peralatan Rumah Tangga Jarak Jauh. Speech Recognition 1-7

Pressman, R.S. 2010. Software Engineering: A Practitioner’s Approach. 7th Edition. McGraw-Hill: New York.

Rabiner, L., Juang, B.H.1993. Fundamental of Speech Recognition. New Jersey : Prantice - Hall Inc

Sianturi, A.H. 2014. Implementasi Speech Recognition pada Aplikasi Pembelajaran dalam bentuk Permainan Menebak Kata Baku Bahasa Indonesia. Skripsi. Universitas Sumatera Utara.

Sommerville, I. 2004. Software Engineering. 7th edition. Pearson/Addison-Wesley: New York

Speech Application Programming Interface (SAPI). (online) http : //msdn.com/SAPI 5.4. (April 2015)


(62)

Stefanus, Hamz, M., Angzas, Y. 2005. Perancangan Aplikasi Pengenalan Ucapan Bahasa Mandarin menggunakan Jaringan Syaraf Tiruan Fuzzy Artmap. Indonesia : Bina Nusantara

Sunny, A.S. 2009. Speech Recognition menggunakan Algoritma Program Dinamis. Indonesia : Teknik Informatika Institut Teknologi Bandung

Supriyono, B. 2004. Perancangan Aplikasi Voice User Interface Dengan Menggunakan Microsoft Speech API. L2F 099 583 : 1-15

Syarif, A., Daryanto, T. & Arifin, M.J. 2011. Aplikasi Speech Application Programming Interface (SAPI) 5.1 sebagai perintah untuk Pengoperasian Aplikasi berbasis Windows. Speech Application Programming Interface (SAPI) 1907-5022 : 1-7

Yang, T. 2012. The Algorithms of Speech Recognition, Programming and Simulating in MATLAB. Tesis. University of Gavle


(1)

Publisher 2 3 5 40 %

Laki – Laki B

Explorer 1 4 5

501 – 1000 Hz

20 %

Buka 0 5 5 0 %

Atas 0 5 5 0 %

Bawah 0 5 5 0 %

Kanan 2 3 5 40 %

Kiri 1 4 5 20 %

Kembali 1 4 5 20 %

Browser 0 5 5 0 %

Word 0 5 5 0 %

Point 0 5 5 0 %

Excel 0 5 5 0 %

Publisher 0 5 5 0 %

Dari tabel 4.5 dapat diketahui persentase keberhasilan aplikasi pada lingkungan dengan tingkat frekuensi noise 501 – 1000 Hz adalah sebagai berikut : Perempuan A = 45 %

Perempuan B = 18,3 %

Laki – laki A = 51,6 % Laki – laki B = 8,3 %

Dengan tingkat keberhasilan per perintah sebagai berikut :

- Explorer = 25 % - Buka = 35 %

- Atas = 55 %

- Bawah = 35 % - Kanan = 55 %

- Kiri = 25 %

- Kembali = 25 % - Browser = 20 % - Word = 15 % - Point = 20 % - Excel = 40 % - Publisher = 20 %


(2)

44

Berdasarkan tabel 4.4 dan tabel 4.5, dapat dilihat persentase keberhasilan sistem dalam mengenali input suara berbahasa Indonesia pada gambar 4.11 dan gambar 4.12

Gambar 4.11 Persentase keberhasilan perintah suara dengan tingkat frekuensi noise 0 500 Hz

Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat frekuensi noise 501 1000 Hz

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher 0% 10% 20% 30% 40% 50% 60% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher


(3)

BAB 5

KESIMPULAN DAN SARAN 5.1 Kesimpulan

Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows didapat beberapa kesimpulan, yaitu :

1. Hasil pengujian aplikasi menunjukkan bahwa tingkat keberhasilan perintah suara bahasa Indonesia dikenali dengan tingkat frekuensi lingkungan 0 – 500 Hz adalah 81,15 %. Sedangkan tingkat keberhasilan perintah suara bahasa Indonesia dengan tingkat frekuensi lingkungan 501 – 1000 Hz adalah 30,8 %.

2. Hasil pengujian aplikasi juga menunjukkan bahwa tingkat keberhasilan cenderung rendah apabila pengguna (user) memiliki pengucapan kata yang kurang jelas. Hal tersebut menunjukkan tingkat akurasi aplikasi dipengaruhi oleh kualitas input yang diberikan pengguna (user).

3. Untuk pengujian dengan tingkat frekuensi lingkungan 501 – 1000 Hz, perintah yang masih dapat dikenali adalah kanan dan atas. Sementara untuk perintah pemanggilan aplikasi yang cenderung berbahasa inggris tidak dapat dikenali seperti explorer, word dan point.

4. Jarak waktu perintah diberikan dan eksekusi perintah tidak lebih dari satu detik sehingga dapat dikatakan cukup nyaman untuk digunakan.

Berdasarkan kesimpulan di atas perintah suara berbahasa Indonesia berhasil diterapkan untuk mengoperasikan perintah dasar di windows. Penerapan Speech Application Programming Interface (SAPI) dan algoritma Fast Fourier Transform

sesuai dengan kebutuhan aplikasi yang berhasil berjalan dengan tingkat keberhasilan 81,15 %.


(4)

46

5.2 Saran

Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows terdapat beberapa kelemahan seperti perintah yang tidak dikenali di lingkungan yang ribut, aplikasi juga membatasi kualitas input

sehingga aplikasi dapat dikatakan kaku karena membatasi tipe input. Maka dari itu, penulis memiliki beberapa saran agar dapat dilakukan penelitian – penelitian lain yang dapat mengembangkan aplikasi – aplikasi speech recognition berbahasa Indonesia, seperti :

1. Diharapkan penelitian mengenali pengenalan ucapan berbahasa Indonesia dapat dikembangkan sehingga dapat diterapkan di berbagai aplikasi.

2. Dapat menerapkan metode – metode lain yang dapat meningkatkan tingkat keberhasilan walau dengan tingkat frekuensi lingkungan (noise) yang cenderung besar atau ditemukannya metode untuk mereduksi noise (frekuensi lingkungan) sehingga aplikasi dapat berjalan dengan lebih optimal.

3. Diharapkan juga ada penelitian yang bersifat memprediksi pola ucapan sehingga pengguna (user) yang memiliki kebiasaan berbicara tidak menggunakan Ejaan Yang Disempurnakan (EYD) atau memiliki kekurangan dalam melafalkan huruf dapat menggunakan aplikasi pengenalan ucapan dengan nyaman.


(5)

DAFTAR PUSTAKA

Darmawan, Y., 2011. Speech Recognition menggunakan metode Mel Frequency Cepstrum Coefficient dan Algoritma Dynamic Time Wrapping. Skripsi. Universitas Sumatera Utara

Gunawan, D. & Juwono, F.H., 2012. Pengolahan Sinyal Digital dengan Pemrograman MATLAB. 978-979-756-814-6. Graha Ilmu : Yogyakarta

Junaedih. 2007. Implementasi Speech Recognition menggunakan SAPI 5 dan Visual Basic 6.0 pada pembuatan Aplikasi Kalkulator Audio Visual. Skripsi. Universitas Islam Negeri Syarif Hidayatullah Jakarta

Nurcahyono, D., Kristalina, P. & Huda, M. 2011. Pembuatan Speech Recognition dan Database Wicara untuk Kontrol Peralatan Rumah Tangga Jarak Jauh. Speech Recognition 1-7

Pressman, R.S. 2010. Software Engineering: A Practitioner’s Approach. 7th Edition. McGraw-Hill: New York.

Rabiner, L., Juang, B.H.1993. Fundamental of Speech Recognition. New Jersey : Prantice - Hall Inc

Sianturi, A.H. 2014. Implementasi Speech Recognition pada Aplikasi Pembelajaran dalam bentuk Permainan Menebak Kata Baku Bahasa Indonesia. Skripsi. Universitas Sumatera Utara.

Sommerville, I. 2004. Software Engineering. 7th edition. Pearson/Addison-Wesley: New York

Speech Application Programming Interface (SAPI). (online) http : //msdn.com/SAPI 5.4. (April 2015)


(6)

Stefanus, Hamz, M., Angzas, Y. 2005. Perancangan Aplikasi Pengenalan Ucapan Bahasa Mandarin menggunakan Jaringan Syaraf Tiruan Fuzzy Artmap. Indonesia : Bina Nusantara

Sunny, A.S. 2009. Speech Recognition menggunakan Algoritma Program Dinamis. Indonesia : Teknik Informatika Institut Teknologi Bandung

Supriyono, B. 2004. Perancangan Aplikasi Voice User Interface Dengan Menggunakan Microsoft Speech API. L2F 099 583 : 1-15

Syarif, A., Daryanto, T. & Arifin, M.J. 2011. Aplikasi Speech Application Programming Interface (SAPI) 5.1 sebagai perintah untuk Pengoperasian Aplikasi berbasis Windows. Speech Application Programming Interface (SAPI)

1907-5022 : 1-7

Yang, T. 2012. The Algorithms of Speech Recognition, Programming and Simulating in MATLAB. Tesis. University of Gavle