Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows
PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS
SKRIPSI
RAISHA ARIANI SIRAIT 091402014
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2015
(2)
PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
RAISHA ARIANI SIRAIT 091402014
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2015
(3)
iii
PERSETUJUAN
Judul : Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows
Kategori : SKRIPSI
Nama : RAISHA ARIANI SIRAIT
Nomor Induk Mahasiswa : 091402014
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI (FASILKOM-TI) UNIVERSITAS SUMATERA UTARA
Diluluskan di
Medan, 25 Juni 2015 Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Romi Fadillah Rahmat, B.Comp.Sc., M.Sc NIP. 19860303 201012 1 004
M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010
(4)
PERNYATAAN
Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 25 Juni 2015
Raisha Ariani Sirait 091402014
(5)
v
PENGHARGAAN
Alhamdulillah, segala puji dan syukur penulis panjatkan atas kehadirat Allah SWT beserta Nabi besar Muhammad SAW yang telah memberikan rahmat, hidayah-Nya, segala daya dan upaya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat utnuk memperoleh gelar Sarjana Program Studi S-1 Teknologi Informasi Universitas Sumatera Utara, Ucara terima kasih yang sebesar-besarnya penulis sampaikan kepada: 1. Kedua orang tua penulis, orang yang paling berharga dalam hidup penulis, ayahanda Mamora Sirait dan ibunda Anggreini Hasibuan yang telah membesarkan, mendidik, memberi dukungan, doa dan motivasi tanpa henti. Serta kepada Abang penulis Radinal Moechtar Sirait yang selalu ada dan menemani penulis.
2. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak Muhammad Anggia Muchtar, ST., MM. IT. dan Bapak Muhammad Fadly Syahputra, B.Sc, M.Sc.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi.
3. Bapak M. Anggia Muchtar, S.T, MMIT selaku pembimbing pertama dan Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc selaku pembimbing kedua, yang telah banyak meluangkan waktunya dan memberikan masukan-masukan yang bermanfaat bagi penulis dalam menyelesaikan skripsi ini.
4. Bapak Sajaddin Sembiring, S.Si, M.Comp.Sc dan Dani Gunawan, ST, MT yang telah bersedia menjadi dosen pembanding dan Bapak Ainul Hizriadi, S.Kom, M. Kom yang telah memberikan saran-saran yang baik bagi penulis dalam menyelesaikan skripsi ini.
5. Kepada Ade, Yogi, Ibnu, Ammar, Reza, Ridzuan, Fadli Rizky, Icha, Yanna, Dijah, Julia, Fanny, Hani, M. Ardiansyah, Fadli Rachman, Dezi, Kurniawan, Fadil, Lydia, Amira, Jihan, Musyafa dan Andre yang selalu mendukung, membantu dan memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini. Serta teman-teman yang mendukung dan membantu penulis Febrina Panjaitan, Ifitriana dan Mifthah Huljannah dan seluruh teman-teman lainnya yang tidak dapat disebutkan satu persatu.
6. Kepada Ibu Mega, Abang Manaf dan Kak Umi yang selaku bagian tata usaha Program Studi S1 Teknologi Informasi yang telah membimbing dan membantu penulis dari awal proposal sampai sidang.
Sekali lagi penulis mengucapkan terima kasih yang sebesar-besarnya kepada semua pihak yang membantu dalam penyelesaian tugas akhir ini yang tidak dapat disebutkan. Terima kasih atas masukan, saran, dan motivasi yang diberikan. Semoga Allah SWT membalas dengan nikmat yang berlimpah.
(6)
ABSTRAK
Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft Corporation menciptakan Speech Application Programming Interface (SAPI) untuk membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai 81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar 30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali input.
Kata kunci : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.
(7)
vii
ABSTRACT
Speech recognition is a study that use human voice as an input for device to recognize. The research about speech recognition that use voice as an input for an application is not a new thing. However among that researches there still rarely to see an application that used Indonesia as an input. Among that researches, Microsoft Corporation create Speech Application Programming Interface (SAPI) that can use to develop a speech recognition application. For this research, it will use command in Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal by dividing every part of the signal into two parts continuously until each part consist one point signal. The final result of this research show that the system has succeed recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The accuracy of the system be affected by noise and the quality of the voice input, if the fewer the noise and with good quality of the voice input, then more and more accurate the system in recognising the input.
Keyword : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.
(8)
DAFTAR ISI
Hal
PERSETUJUAN i
PERNYATAAN ii
PENGHARGAAN iii
ABSTRAK vi
ABSTRACT vii
DAFTAR ISI viii
DAFTAR TABEL xi
DAFTAR GAMBAR xii
BAB 1 PENDAHULUAN 1
1.1Latar Belakang 1
1.2Rumusan Masalah 3
1.3Batasan Masalah 3
1.4Tujuan Penelitian 4
1.5Manfaat Penelitian 4
1.6Metodologi Penelitian 4
1.7Sistematika Penulisan 5
BAB 2 LANDASAN TEORI 7
2.1Suara 7
2.2Kata Baku & Tidak Baku 7
2.3Speech Recognition 7
2.3.1 Mode Speech Recognition 8
2.3.2 Proses Speech Recognition 8
2.3.2.1 Pemisahan kata 8
2.3.2.2 Ketergantungan terhadap pengguna 9
2.3.2.3 Pencocokan kata 10
2.3.2.4 Pembendaharaan kata 10
(9)
ix
2.4.1 Komponen Speech Application Programming Interface (SAPI)
11
2.4.2 Antar muka Speech Application Programming Interface (SAPI)
11
2.5Transformasi Fourier 12
2.5.1 Discrete Fourier Transform (DFT) 13
2.5.2 Fast Fourier Transform (FFT) 13
2.6Penelitian Terdahulu 16
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18
3.1Identifikasi Masalah 18
3.2Data yang Digunakan 19
3.3Analisis Sistem 20
3.3.1Proses ekstraksi 22
3.3.2Penetapan grammar 23
3.3.3Pengenalan pola spektrum suara 23
3.3.4Jalankan perintah pada perangkat 23
3.4 Perancangan Sistem 23
3.4.1 Diagram use case 23
3.4.2 Spesifikasi use case 24
3.4.3 Diagram aktifitas 25
3.4.4 Perancangan antar muka 27
BAB 4 IMPLEMENTASI DAN PENGUJIAN 29
4.1Implementasi Sistem 29
4.1.1Perangkat keras 29
4.1.2Perangkat lunak 30
4.1.3Implementasi perancangan antar muka 30
4.2Pengujian Sistem 32
4.2.1Kasus dan hasil pengujian sistem 34
4.2.2Pengujian kinerja sistem 35
4.3Hasil Pengujian Suara 40
4.3.1 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0 – 500 Hz
(10)
4.3.2 Hasil pengujian suara dengan tingkat frekuensi lingkungan 501 – 1000 Hz
42
BAB 5 KESIMPULAN DAN SARAN 45
5.1Kesimpulan 45
5.2Saran 46
(11)
xi
DAFTAR TABEL
Hal
Tabel 2.1 Penelitin terdahulu 17
Tabel 3.1 Penjelasan data yang akan digunakan 19 Tabel 3.2 Spesifikasi use case untuk input suara 24 Tabel 3.3 Spesifikasi use case untuk bantuan 25
Tabel 4.1 Hasil pengujian halaman awal 33
Tabel 4.2 Hasil pengujian halaman tentang 35
Tabel 4.3 Hasil pengujian halaman bantuan 39
Tabel 4.4 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0
– 500 Hz 40
Tabel 4.5 Hasil pengujian suara dengan tingkat frekuensi lingkungan
(12)
DAFTAR GAMBAR
Hal
Gambar 2.1 Blok Diagram Arsitektur SAPI 12
Gambar 2.2 Desimasi untuk 16 titik 14
Gambar 2.3 Konsep FFT 14
Gambar 3.1 Arsitektur umum sistem 20
Gambar 3.2 Flowchart sistem 21
Gambar 3.3 Diagram use case sistem 24
Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara) 26 Gambar 3.5 Diagram aktifitas sistem (Bantuan) 26
Gambar 3.6 Rancangan halaman awal 27
Gambar 3.7 Rancangan halaman bantuan 28
Gambar 4.1 Halaman awal 31
Gambar 4.2 Halaman bantuan 32
Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan 36 Gambar 4.4 Halaman awal ketika perintah “buka” diucapkan 36 Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan 37 Gambar 4.6 Halaman awal ketika perintah “Word” diucapkan 37 Gambar 4.7 Halaman awal ketika perintah “Excel” diucapkan 38 Gambar 4.8 Halaman awal ketika perintah “Publisher” diucapkan 38 Gambar 4.9 Halaman awal ketika input kata ganti perintah 39
Gambar 4.10 Halaman bantuan 39
Gambar 4.11 Persentase keberhasilan perintah suara denga tingkat
frekuensi lingkungan 0 – 500 Hz 44
Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat
(13)
vi
ABSTRAK
Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft Corporation menciptakan Speech Application Programming Interface (SAPI) untuk membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai 81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar 30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali input.
Kata kunci : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.
(14)
ABSTRACT
Speech recognition is a study that use human voice as an input for device to recognize. The research about speech recognition that use voice as an input for an application is not a new thing. However among that researches there still rarely to see an application that used Indonesia as an input. Among that researches, Microsoft Corporation create Speech Application Programming Interface (SAPI) that can use to develop a speech recognition application. For this research, it will use command in Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal by dividing every part of the signal into two parts continuously until each part consist one point signal. The final result of this research show that the system has succeed recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The accuracy of the system be affected by noise and the quality of the voice input, if the fewer the noise and with good quality of the voice input, then more and more accurate the system in recognising the input.
Keyword : speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT), bahasa Indonesia.
(15)
BAB 1
PENDAHULUAN
1.1Latar Belakang
Pada tahun 2005, Martin, Brown, DeHayes, Hoffer dan Perkins mendefinisikan teknologi informasi merupakan kombinasi teknologi komputer yang terdiri dari perangkat keras dan lunak untuk mengolah dan menyimpan informasi dengan teknologi komunikasi untuk melakukan penyaluran informasi. Berdasarkan definisi di atas, dapat disimpulkan bahwa hubungan antara teknologi komputer dan penyaluran informasi merupakan hubungan yang saling membutuhkan baik teknologi komputer sebagai media atau alat dan informasi sebagai data yang diolah, disimpan dan disalurkan begitu pula sebaliknya.
Perkembangan cara berkomunikasi antara manusia dan komputer telah mengalami perubahan dari waktu ke waktu. Perubahan tersebut bertujuan agar komunikasi antara manusia dan komputer menjadi lebih efisien. Salah satu metode komunikasi yang banyak dikembangkan saat ini adalah pengenalan ucapan atau yang lebih kita kenal dengan istilah speech recognition. Manusia dalam berinteraksi dengan sesama manusia secara umum banyak dilakukan menggunakan ucapan. Dengan menerapkan cara interaksi antara sesama manusia tersebut diharapkan menjadi cara alternatif yang dapat dipakai untuk interaksi antara manusia dan komputer secara lisan layaknya interaksi antara manusia dengan manusia (Syarif, A., Daryanto, T. & Arifin, M.J., 2011).
Teknologi pengenalan ucapan telah banyak diterapkan di berbagai sistem. Hal tersebut bertujuan agar ke depannya manusia dapat berkomunikasi dengan komputer selayaknya berkomunikasi dengan sesama manusia. Oleh karena itu, penulis mencoba mengolah informasi dengan menggabungkan teknologi komputer dan unsur suara
(16)
sebagai data. Speech recognition merupakan metode komunikasi yang berfokus pada suara, sehingga diharapkan penyaluran informasi dapat dilaksanakan dengan lebih efisien. Selain itu, teknologi pengenalan ucapan masih memiliki banyak potensi untuk dikembangkan.
Banyak penelitian yang telah dan sedang dilakukan untuk mendapatkan pengenalan ucapan yang cepat dan akurat. Salah satu yang terkenal adalah penelitian yang dilakukan oleh Microsoft Corporation yang dikembangkan untuk sistem operasi Windows. Selain mengembangkan mesin pengenalan ucapan, Microsoft juga mengembangkan standar untuk pengenalan ucapan yaitu Speech Application Programming Interface (SAPI).
Pada penelitian ini, penulis mencoba menerapkan metode Fast Fourier Transform pada tahap ekstraksi ciri untuk mengetahui frekuensi lingkungan sehingga dapat dibandingkan ketika mengoperasikan perintah – perintah dasar di OS Windows. Proses yang akan dilalui oleh sistem ini mengadaptasi dasar dari sistem pengenalan ucapan pada umumnya. Proses tersebut diawali dengan menginput suara menggunakan microphone. Kemudian dilanjutkan dengan proses ekstraksi ciri, yakni proses mendapatkan besaran pada bagian sinyal masukan untuk menetapkan pola pembelajaran atau pola uji.
Untuk tahap pembelajaran atau pola uji penulis juga menggunakan Speech Application Programming Interface (SAPI) dengan grammar yang telah ditentukan sendiri oleh penulis. SAPI memungkinkan pengenalan ucapan tanpa mempengaruhi aplikasi yang ingin dibuat, sehingga SAPI dapat digunakan sebagai fungsi tersendiri untuk mendukung aplikasi yang akan dibuat.
Sedangkan pada proses eksekusi, dimana ucapan yang dimasukkan telah dikenali akan dieksekusi dengan perintah event/case yang terdapat pada bahasa pemrograman visual basic. Event/case merupakan jenis perintah pengganti keyboard pada pemrograman visual basic. Disini penulis akan mengganti event keyboard di visual basic agar bisa dieksekusi melalui perintah suara yang telah didefinisikan terlebih dahulu.
Sistem diharapkan dapat digunakan oleh pengguna yang berbeda setiap kali percobaannya. Hal tersebut sesuai dengan sifat sistem pengenalan suara, yakni Speaker Adaptive. Speaker Adaptive merupakan perpaduan dari Speaker Dependent dan Speaker Independent, dimana pengguna tidak perlu melakukan pelatihan dan
(17)
3
keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama bekerja terus menerus selama beberapa waktu tertentu (Adipranata, 2003).
Berdasarkan penelitian terdahulu yang telah dilakukan dan keefektifan yang dimiliki metode tersebut, penulis terdorong untuk membuat penelitian penerapan perintah suara berbahasa Indonesia menggunakan aplikasi SAPI. Dipilihnya bahasa Indonesia sebagai jenis input untuk menjalankan aplikasi ini dikarenakan masih sedikitnya aplikasi – aplikasi yang mengenali ucapan bahasa Indonesia. Maka dari itu, penulis ingin mengetahui sejauh apa sistem pengenalan ucapan dapat mengidentifikasi kata – kata berbahasa Indonesia. Hal ini diharapkan memberikan kemampuan yang baik pada sistem penerapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah – perintah dasar pada OS Windows.
1.2Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan, dapat dilihat bahwa penelitian di bidang speech recognition masih memiliki banyak peluang untuk dikembangkan, terutama implementasi di bahasa – bahasa asing. Oleh karena itu, rumusan masalah dari penelitian ini adalah bagaimana menerapkan perintah suara berbahasa Indonesia untuk mengoperasikan perintah – perintah dasar di OS Windows menggunakan Speech Application Programming Interface (SAPI)
1.3Batasan Masalah
Penelitian ini memiliki banyak cakupan sehingga penulis membatasi permasalahan pada penelitian ini. Batasan masalah tersebut adalah sebagai berikut :
a. Perintah suara menggunakan bahasa Indonesia,
b. Perintah yang diterapkan berupa Explorer, buka, atas, bawah, kanan, kiri, kembali, Browser, Word, Point, Excel dan Publisher,
c. Menggunakan Ejaan Yang Disempurnakan (EYD),
d. Pengambilan data suara dari 4 responden. Dimana 2 responden adalah wanita dan 2 responden adalah pria,
(18)
f. Diterapkan pada Operating System (OS) Windows 7.
1.4Tujuan Penelitian
Tujuan dari penelitian ini adalah memanfaatkan teknologi aplikasi Speech Application Programming Interface (SAPI) untuk menjalankan perintah dengan pengucapan berbahasa Indonesia serta menerapkan metode Fast Fourier Transform (FFT) untuk melihat tingkat frekuensi noise yang mempengaruhi kinerja Speech Application Programming Interface (SAPI) tersebut.
1.5Manfaat Penelitian
Penulis berharap penelitian ini dapat memberikan manfaat kepada penulis sendiri dan para pembaca. Adapun manfaat dari penelitian ini adalah sebagai berikut :
a. Meningkatkan efisiensi interaksi manusia dengan komputer ketika akan mengoperasikan perintah dasar di windows.
b. Mengetahui kinerja Speech Application Programming Interface (SAPI) pada aplikasi yang menggunakan bahasa Indonesia sebagai inputnya serta metode Fast Fourier Transform (FFT) pada transformasi sinyal suara.
c. Penelitian dapat menjadi bahan rujukan untuk pengembangan penelitian lebih lanjut.
1.6Metodologi Penelitian
Adapun metodologi penelitian yang digunakan peneliti yaitu :
1. Studi Literatur
Pada tahap ini peneliti melakukan pengumpulan sumber referensi yang akan digunakan untuk penelitian. Peneliti membaca dan mempelajari buku-buku, jurnal, media online dan sumber lainnya yang berhubungan dengan penelitian pengenalan ucapan (speech recognition) serta metode – metode terkait yang akan dilakukan.
(19)
5
2. Perancangan Desain Sistem
Pada tahap ini peneliti melakukan perancangan aplikasi, seperti merancang activity diagram, diagram alur (flowchart) sistem, perancangan desain, dan perancangan desain antarmuka (interface).
3. Implementasi Sistem
Pada tahap ini dilakukan pengkodean dan implementasi rancangan yang telah dibuat dengan menggunakan bahasa pemrograman yang telah dipilih. Pengkodean dilakukan dengan bahasa pemrograman visual basic dengan menggunakan aplikasi Speech Application Programming Interface (SAPI) dan metode Fast Fourier Transform (FFT).
4. Pengujian Sistem
Pada tahap ini dilakukan pengujian dan percobaan pada sistem dengan subjek berbeda yang telah dibuat sesuai dengan kriteria dan kebutuhan yang diinginkan dan memastikan apakah program berjalan sesuai dengan yang diinginkan.
5. Dokumentasi Sistem
Pada tahap ini, peneliti mendokumentasikan sistem dalam bentuk laporan tertulis untuk menunjukkan hasil penelitian yang dilakukan.
1.7Sistematika Penulisan
Adapun penulisan skripsi ini terdiri dari lima bagian utama dengan penjelasan singkat sebagai berikut :
Bab 1 Pendahuluan
Pada bab ini berisi uraian penjelasan latar belakang terkait judul skripsi yang diajukan, perumusan masalah pada penelitian, batasan masalah yang ditetapkan, tujuan penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan dari penyusunan skripsi ini.
(20)
Bab 2 Landasan Teori
Pada bab ini dibahas mengenai teori-teori pendukung yang digunakan pada penelitian ini, seperti suara, speech recognition, Speech Application Programming Interface (SAPI), Fast Fourier Transform (FFT) dan penelitian terdahulu.
Bab 3 Analisis dan Perancangan Sistem
Pada bab ini berisi penjelasan analisis mengenai permasalahan dan identifikasi kebutuhan perancangan sistem.
Bab 4 Implementasi dan Pengujian Sistem
Pada bab ini berisi penjelasan implementasi sistem dari hasil analisis yang dilakukan serta menguji sistem yang telah dibuat.
Bab 5 Kesimpulan dan Saran
Pada bab ini berisi kesimpulan yang didapat dari penelitian skripsi yang telah dilakukan dan saran yang dapat digunakan untuk penelitian lebih lanjut mengenai topik yang terkait pada skripsi ini.
(21)
BAB 2
LANDASAN TEORI
2.1 Suara
Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara yang dapat didengar manusia berkisar antara 20 Hz sampai dengan 20 KHz, dimana Hz adalah satuan frekuensi yang artinya banyaknya getaran per-detik (cps / cycle per second) (Darmawan, Y., 2011).
Speech Processing (pemrosesan lafal/ucapan) adalah metode mengekstrak informasi yang diinginkan dari sebuah sinyal suara. Untuk memproses sebuah sinyal dengan sebuah computer digital, sinyal harus dihadirkan dalam bentuk digital sehingga sinyal tersebut dapat digunakan oleh sebuah computer digital (L. Rabiner et al. 1993)
2.2 Kata Baku dan Tidak Baku Bahasa Indonesia
Di dalam bahasa Indonesia terdapat dua jenis kata, yakni kata baku dan kata tidak baku. Kata baku adalah kata yang digunakan sesuai dengan kaidah bahasa Indonesia yang telah ditentukan. Kamus Besar Bahasa Indonesia (KBBI) merupakan sumber utama dan menjadi acuan untuk menentukan kata baku bahasa Indonesia. Kata tidak baku adalah kata yang digunakan tidak sesuai dengan kaidah bahasa Indonesia yang ditentukan.
2.3 Speech Recognition
Speech recognition merupakan teknik dimana perangkat akan mengenali masukan berupa suara, setelah itu perangkat melakukan respon yang sesuai dengan masukan suara tersebut (Syarif, A., Daryanto, T. & Arifin, M.J. 2011). Speech recognition
(22)
(pengenalan lafal/ucapan) juga diketahui sebagai suatu proses untuk mengenali seseorang dengan mengenali ucapan dari orang tersebut (L. Rabiner et al. 1993).
2.3.1 Mode Speech Recognition
Speech recognition memiliki dua mode, yakni mode diktasi dan mode command and control. Penjelasan kedua mode tersebut adalah sebagai berikut :
a. Mode Diktasi
Mode ini merupakan mode dimana pengguna komputer dapat mengucapkan kata / kalimat yang selanjutnya akan dikenali oleh komputer dan diubah menjadi data teks. Pengenalan mode diktasi merupakan speaker dependent. Keakuratan pengenalan mode ini bergantung pada pola suara dan aksen pembicara serta pelatihan yang telah dilakukan.
b. Mode Command and Control
Pada mode ini pengguna komputer mengucapkan kata / kalimat yang sudah terdefinisi terlebih dahulu pada database dan selanjutnya akan digunakan untuk menjalankan perintah tertentu pada aplikasi komputer. Mode ini merupakan speaker independent karena jumlah kata yang dikenali biasanya terbatas sekali dan ada kemungkinan pembicara tidak perlu melakukan pelatihan pada sistem sebelumnya (Junaedih. 2007)
2.3.2 Proses Speech Recognition
Pada proses speech recognition atau sistem pengenal pembicaraan, terdapat empat proses utama yang diterapkan baik pada mode diktasi maupun mode command and control. Keempat proses tersebut adalah pemisahan kata, ketergantungan terhadap pengguna, pencocokan kata dan pembendaharaan kata.
2.3.2.1. Pemisahan Kata
Pemisahan kata adalah proses untuk memisahkan suara yang diucapkan oleh pengguna menjadi beberapa bagian (Junaedih. 2007). Pada proses pemisahan kata ini, terdapat tiga metode yang dapat digunakan, yaitu :
(23)
9
a. Discrete Speech
Pada discrete speech, pengguna diharuskan mengucapkan kalimat secara terpenggal dengan adanya jeda sejenak diantara kata. Jeda tersebut digunakan oleh sistem untuk mendeteksi awal dan akhir sebuah kata.
b. Word Spotting
Pada word spotting, dalam sebuah kalimat yang diucapkan pengguna, sistem hanya mendeteksi kata yang terdapat di dalam perbendaharaan yang dimilikinya, dan mengabaikan kata – kata lain yang tidak dimilikinya. Sehingga walau pengguna mengucapkan kalimat yang berbeda tetapi di dalam kalimat tersebut terdapat sebuah kata yang sama dan terdapat di perbendaharaan sistem, maka hasil pengenalan akan sama.
c. Continuous Speech
Pada metode continuous speech, sistem akan mengenali dan memproses setiap kata yang diucapkan.
2.3.2.2. Ketergantungan Terhadap Pengguna
Ketergantungan terhadap pengguna merupakan sebuah kondisi yang menjadikan sistem pengenalan pembicaraan memiliki beberapa sifat. Sifat – sifat tersebut adalah speaker dependent, speaker independent dan speaker adaptive.
a. Speaker Dependant
Pada speaker dependent, sistem membutuhkan pelatihan untuk setiap pengguna yang akan menggunakan system tersebut.
b. Speaker Independent
Pada speaker independent, pengguna tidak perlu melakukan pelatihan sebelum dapat menggunakan sistem, karena sistem mampu mengenali suara semua pengguna tidak tergantung warna suara dan dialek yang digunakan.
c. Speaker Adaptive
Speaker adaptive merupakan perpaduan dari speaker dependent dan speaker independent, dimana pengguna tidak perlu melakukan pelatihan dan
(24)
keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama bekerja terus menerus selama beberapa waktu tertentu (Junaedih. 2007). 2.3.2.3. Pencocokan Kata
Pencocokan kata adalah proses untuk mencocokkan kata ucapan yang berhasil diidentifikasi dengan basis data yang dipunyai oleh sistem.
2.3.2.4. Pembendaharaan Kata
Perbendaharaan kata ialah bagian terakhir dalam sebuah sistem pengenalan pembicaraan. Jika perbendaharaan kata berjumlah banyak, maka sebuah sistem akan mudah dalam melakukan pencocokan kata, tetapi dengan makin meningkatnya jumlah perbendaharaan kata, maka jumlah kata yang mempunyai ucapan hampir sama juga meningkat, dimana hal ini menurunkan keakuratan pengenalan.
Dan sebaliknya, jika sebuah sistem mempunyai perbendaharaan kata sedikit, maka keakuratan pengenalan akan tinggi karena sedikitnya kata yang hampir sama, tetapi akan semakin banyak kata yang tidak terkenali.
2.4 Speech Application Programming Interface (SAPI)
Speech recognition bukanlah hal baru untuk dunia penelitian teknologi. Penelitian – penelitian mengenai speech recognition telah banyak dilakukan dan salah satu diantaranya yang cukup dikenal adalah penelitian yang dilakukan oleh Microsoft Corporation. Microsoft telah mengembangkan sistem speech recognition yang dapat digunakan pada sistem operasi Windows. Sistem tersebut memiliki perkembangan termasuk standard interface SAPI (Speech Application Programming Interface) yang memungkinkan pembuat aplikasi menerapkan sistem speech recognition menggunakan engine yang berbeda tanpa merubah aplikasi yang dibuat.
Sekarang banyak aplikasi yang dikembangkan menggunakan speech recognition, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat High-performance fighter aircraft, Training air traffic controllers, sampai pada alat yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan, maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi pengucapan user (Sunny, A.S. 2009).
(25)
11
2.4.1 Komponen Speech Application Programming Interface (SAPI)
Selain mengenali ucapan, SAPI juga memiliki fungsi untuk mengenali ucapan dan mengubahnya menjadi teks. Hal tersebut dapat terjadi karena di dalam SAPI sendiri terdapat komponen – komponen yang memang memiliki fungsi – fungsi khusus untuk pengembangan sistem speech recognition, diantaranya :
a. Voice Command
Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan pengenalan suara.
b. Voice Dictation
Sebuah obyek level tinggi untuk continous dictation speech recognition. c. Voice Talk
Sebuah obyek level tinggi untuk speech synthesis. d. Voice Telephony
Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara. e. Direct Speech Recognition
Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara (direct control of recognition engine)
f. Direct Text to Speech
Sebuah obyek sebagai mesin yang mengontrol synthesis. g. Audio Object
Untuk membaca dari audio device atau sebuah file audio.
2.4.2 Antar muka Speech Application Programming Interface (SAPI)
SAPI 5.1 terdiri dari 2 antar muka yaitu application programming interface (API) dan device driver interface (DDI) (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).
a. Application Programming Interface (API)
Windows Application Programming Interface (API) adalah sekumpulan fungsi dan konstanta yang terdapat dalam file-file Dynamic Link Library (DLL) yang menyusun Sistem Operasi Windows (Supriyono, B., 2004). Pada sistem
(26)
pengenalan pembicaraan, aplikasi akan menerima event pada saat suara yang diterima telah dikenali oleh engine. Arsitektur SAPI sendiri dapat kita lihat pada blog diagram seperti yang terlihat pada gambar 2.1 (Supriyono, B., 2004).
Gambar 2.1 Blok Diagram Arsitektur SAPI
Dalam API terdapat fungsi-fungsi/ perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut kemudian akan memanggil system calls sesuai dengan sistem operasinya (Sianturi, A.H., 2014).
b. Device Driver Interface (DDI)
DDI menyediakan fungsi untuk menerima data suara dari SAPI dan mengembalikan pengenalan frasa pada level SAPI paling dasar. Terdapat dua antar muka yang digunakan oleh DDI yaitu ISpSREngine, yang diimplementasikan oleh engine dan ISpSREngineSite yang diimplementasikan oleh SAPI (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).
2.5 Transformasi Fourier
Transformasi Fourier merupakan suatu persamaan integral untuk menghitung frekuensi, amplitudo dan fase dari suatu gelombang sinyal (Stefanus, Hamz, M. &
(27)
13
Angzas, Y., 2005). Sementara untuk menghitung spektrum frekuensi sinyal pada komputer digital, kita membutuhkan algoritma Discrete Fourier Transform (DFT).
2.5.1 Discrete Fourier Transform (DFT)
DFT adalah suatu persamaan integral alat yang digunakan untuk menganalisa suatu frekuensi diskrit (Stefanus, Hamz, M. & Angzas, Y., 2005). DFT mengubah sinyal domain waktu, menjadi sinyal domain frekuensi. DFT dapat diterjemahkan dalam rumus :
F(k∆f) ≡ ∑
for k = 0, 1, 2, ….., N – 1 (1)
N = jumlah sampel yang diambil T = total waktu sampling
∆t = pertambahan waktu antar sampel = frekuensi sampel =
2.5.2 Fast Fourier Transform (FFT)
Fast Fourier Transform merupakan DFT dengan algoritma yang lebih optimal, sehingga menghasilkan perhitungan yang lebih cepat. Dengan DFT, memerlukan waktu O(n2) untuk mengolah sampel data sebanyak n buah. Hal ini tentunya akan memakan waktu lama bila sampel data makin banyak (Stefanus, Hamz, M. & Angzas, Y., 2005).
Metode FFT dapat dilakukan dalam domain waktu dan frekuensi, yang disebut sebagai desimasi – dalam – waktu (decimation-in-time) dan desimasi-dalam-frekuensi (decimation-in-frequency) (Gunawan, D., Juwono, F.H., 2012). Pada prinsipnya algoritma ini adalah memecah N-titik menjadi dua (N/2) – titik, kemudian memecah tiap (N/2) – titik menjadi dua (N/4) – titik, begitu seterusnya sampai hanya terdapat 1 titik. Prinsip tersebut dapat kita lihat lebih jelas pada gambar 2.2 berikut (Gunawan, D., Juwono, F.H., 2012).
(28)
Gambar 2.2 Desimasi untuk 16 titik
Sedangkan untuk konsep FFT sendiri secara keseluruhan dapat kita lihat pada gambar 2.3 berikut (Gunawan, D., Juwono, F.H., 2012).
Gambar 2.3 Konsep FFT
Dikarenakan FFT masih bagian dari perhitungan DFT, maka akan lebih baik menghitung FFT dengan mempertimbangkan nilai N DFT terlebih dahulu (Yang, T., 2012).
(29)
15
X(k) = ∑ k = 0, 1, 2…N-1 (2)
Pisahkan x(n) menjadi dua bagian : x(ganjil) dan x (genap) = x(2m), dimana m=0, 1,2,…,N/2-1. Lalu nilai N DFT juga dibagi dua bagian untuk tiap nilai N/2 : X(k) = ∑ = ∑ + ∑
= ∑ + ∑ (3)
Dimana m = 0, 1, 2,…., N/2-1 Karena :
= cos( ) + j sin( ) (4)
= cos[ ] + j. sin[
= -cos( ) – j.sin( ) = -[cos( ) + j.sin( )]
= - (5)
Maka :
= - (6)
Jadi ketika faktor diubah dengan setengah periode, nilai dari faktor tersebut tidak akan berubah, tetapi tanda nilai faktor tersebut akan menjadi sebaliknya. Hal ini merupakan sifat simetri dari faktor. Karena factor bisa juga ditulis sebagai =
, maka :
= - (7)
Dan
( 2 = - = (8)
(30)
X(k) = ∑ ∑ (9) k = 0,1….N/2
X(k + N/2) = - (10)
k = 0, 1, 2…..N/2
Jadi nilai N DFT dipisah menjadi dua nilai N/2 DFT. Dari persamaan (9), (k) memiliki (N/2) * (N/2) = (N/2)2. memiliki N/2 + (N/2)2.
Maka jumlah total dari perhitungan untuk X(k) adalah 2(N/2)2 + N/2=N2/2+N/2. Untuk nilai awal N DFT, dimulai dari N2. Maka pada langkah pertama, pisahkan x(n) menjadi dua bagian yang membuat perhitungan dari N2 menjadi N2/2+N/2. Jumlah angka perkalian dikurangi setengah secara berkala.
Berikut adalah proses pengurangan perkalian dari nilai N menjadi N/2. Lanjutkan pemisahan (m) dan (m) menjadi bagian ganjil dan genap dengan cara yang sama, perhitungan untuk N/2 akan dikurangi menjadi N/4. Kemudian perhitungan DFT akan berkurang secara terus – menerus. Jadi jika sinyal untuk nilai N DFT terpisah terus – menerus sampai sinyal akhir menjadi satu titik. Misalkan ada N=2v DFT yang perlu dihitung. Maka jumlah pemisahan yang dapat dilakukan adalah v = (N). maka jumlah total perkalian akan dikurangi hingga (N/2) (N). untuk tambahan perhitungan, angka yang akan dikurangi mencapai N (N). Karena perkalian dan penambahan dikurangi, maka kecepatan perhitungan komputasi DFT dapat ditingkatkan. Tujuan utama untuk Radix -2 FFT adalah memisahkan deretan data menjadi ganjil dan genap secara terus – menerus sampai mendekati setengah perhitungan.
2.6 Penelitian Terdahulu
Pada bagian ini akan dipaparkan mengenai penelitian terdahulu yang berkaitan dengan aplikasi perintah suara. Seperti yang tertera pada tabel 2.1
(31)
17
Tabel 2.1 Penelitian Terdahulu
No. Peneliti Tahun Judul Penelitian Keterangan
1 Syarif, Daryanto, et al
2011 Aplikasi Speech Application Programming
Interface (SAPI) 5.1
Sebagai Perintah untuk Pengoperasian Aplikasi Berbasis Windows
Memanfaatkan SAPI untuk menjalankan aplikasi berbasis windows
2 Nurcahyono, Kristalina, et al
2011 Pembuatan Speech Recognition dan Database Wicara Untuk Konrol Peralatan Rumah Tangga Jarak Jauh
Noise, jenis kelamin dan usia user
mempengaruhi hasil akhir aplikasi 3 Yang 2012 The Algorithms of Speech
Recognition,
Programming and
Simulating in MATLAB
Pengujian
algoritma FFT dalam sistem speech recognition menggunakan MATLAB
(32)
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
Bab ini menjelaskan data yang digunakan, flowchart, diagram use case serta tahapan – tahapan dan rancangan antar muka sistem
3.1 Identifikasi Masalah
Keinginan untuk membuat cara berinteraksi yang lebih alami menyebabkan perlunya dicari alternatif lain sebagai pengganti atau pelengkap piranti yang sudah ada. Manusia dalam berinteraksi dengan sesama manusia secara umum banyak dilakukan menggunakan ucapan. Dengan menerapkan cara interaksi antara sesama manusia tersebut diharapkan menjadi cara alternatif yang dapat dipakai untuk interaksi antara manusia dan komputer secara lisan layaknya interaksi antara manusia dengan manusia (Syarif, A., Daryanto, T. & Arifin, M.J., 2011).
Interaksi antara manusia dengan komputer yang paling berkembang saat ini adalah menggunakan suara sebagai input untuk menjalankan aplikasi. Kebanyakan aplikasi – aplikasi yang menggunakan suara sebagai input digunakan menggunakan perangkat mobile dan memiliki fungsi tersendiri seperti aplikasi pencari lirik lagu ataupun yang pencarian kata. Disini penulis ingin menerapkan suara sebagai input untuk aplikasi yang dapat mengoperasikan windows. Walaupun windows sudah memiliki Speech Application Programming Interface (SAPI) untuk mengoperasikan windows menggunakan suara, penulis ingin menerapkan perintah yang bersifat bahasa Indonesia. Selama ini kebanyakan aplikasi perintah suara bersifat mengenali suara dan mengenali ucapan yang berbahasa inggris. Untuk penelitian ini, penulis akan menerapkan bahasa Indonesia sebagai perintah suara untuk menjalankan aplikasi yang dapat mengoperasikan perintah pada windows.
(33)
19
3.2 Data yang Digunakan
Dalam pembangunan sistem ini, data yang akan digunakan berupa suara yang terdiri dari dua orang perempuan dan dua orang laki - laki dengan usia 20 – 60 tahun dengan kata yang berjumlah 12 seperti yang dijabarkan dalam tabel 3.1.
Tabel 3.1 Penjelasan data yang akan digunakan
NO JENIS SUARA KATA
1 Perempuan A
Explorer Buka Atas Bawah Kanan Kiri Kembali Browser Word Point Excel Publisher 2 Perempuan B
3 Laki – laki A
4 Laki – laki B
Kata yang akan digunakan sebagai input adalah :
- Explorer : untuk mengaktifkan window explorer
- Buka : untuk membuka folder atau menjalankan file - Atas : untuk menggerakkan kursor satu langkah ke atas - Bawah : untuk menggerakkan kursor satu langkah ke bawah - Kanan : untuk menggerakkan kursor satu langkah ke kanan - Kiri : untuk menggerakkan kursor satu langkah ke kiri
- Kembali : untuk mengembalikan explorer ke halaman sebelumnya - Browser : untuk mengaktifkan browser google chrome
- Word : untuk mengaktifkan aplikasi Microsoft office Word - Point : untuk mengaktifkan aplikasi Microsoft office Power Point
(34)
- Excel : untuk mengaktifkan aplikasi Microsoft office Excel - Publisher : untuk mengaktifkan aplikasi Microsoft office Publisher
3.3 Analisis Sistem
Analisis sistem bertujuan untuk mengidentifikasi sistem yang akan dikembangkan. Analisis diperlukan sebagai dasar perancangan sistem. Pada penelitian ini, analisis yang akan dilakukan berupa arsitektur umum dan flowchart. Arsitektur umum akan menggambarkan keseluruhan metode yang diterapkan dan flowchart dapat menggambarkan tahapan – tahapan sistem yang akan dirancang secara terstruktur sehingga memudahkan pemahaman atas gambaran sistem yang sedang dirancang. Arsitektur umum mengenai sistem pengenapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah dasar pada windows dapat dilihat pada gambar 3.1.
Ekstraksi Ciri Pengenalan Pola (Speech API)
Jalankan perintah pada windows Input suara
Digitalisasi suara
Fast Fourier
Transform Grammar
Gambar 3.1 Arsitektur umum sistem
Adapun penjelasan tahapan dari arsitektur umum sistem adalah sebagai berikut : 1. User berbicara menggunakan mikrofon agar kata yang diucapkan dapat
dijadikan input untuk menjalankan aplikasi
2. Suara tersebut akan diubah menjadi sinyal digital menggunakan SoundCard yang terdapat di dalam komputer
3. Setelah input telah berbentuk sinyal digital di dalam komputer, tahapan selanjutnya adalah proses ekstraksi dimana sinyal tersebut akan diubah menjadi spektrum suara
(35)
21
4. Pada proses ekstraksi tersebut, algoritma Fast Fourier Transform akan mengubah sinyal digital ke dalam bentuk spektrogram
5. Setelah proses spektogram, aplikasi akan menggunakan Speech API sebagai library yang berperan sebagai tempat menetapkan grammar dan pengenal pola sinyal yang dimasukkan
6. Sebelum sinyal dikenali, grammar ditetapkan terlebih dahulu sebagai pembanding di tahap pengenalan nantinya
7. Pada tahap pengenalan, engine pada Speech API yang berfungsi sebagai recognition akan mengenali jenis sinyal dan membandingkannya dengan yang ada pada grammar
8. Setelah input dikenali, aplikasi akan dibaca sebagai perintah yang akan digunakan untuk menjalankan perangkat Windows
Bentuk flowchart dari tahapan di atas dapat dilihat pada gambar 3.2
Mulai
Sinyal suara diubah ke dalam bentuk
digital
Pengenalan pola
spektrum suara Grammar
Dikenali Jalankan komando
pada perangkat end Masukkan
sinyal suara
Proses ekstraksi (FFT)
ya tidak
(36)
3.3.1 Proses Ekstraksi
Pada proses ekstraksi, sinyal suara yang sudah dikonversi ke dalam bentuk sinyal digital akan diubah ke dalam bentuk spektrum suara untuk mendapatkan karakteristiknya. Pada proses ini digunakan algoritma Fast Fourier Transform untuk mendapatkan spektrogram sinyal sehingga dapat dijadikan pola untuk dikenali pada proses pengenalan.
Adapun penjelasan mengenali algoritma Fast Fourier Transform dapat dilihat melalui pseudocode berikut :
Fast Fourier Transform
For i = 0 To bitsInLength - 1
m, n, k, j : integer
For k = 0 to m -1
alpha : double
alpha = -(2 * Math.PI/n) j = k
while j < length even = data(j)
odd = oddmultiplier * data(j+m) data(j) = even + odd
data (j + m) = even - odd
j += n End While
Next Next
(37)
23
3.3.2 Penetapan Grammar
Sebelum spektrogram sinyal suara dikenali, jenis perintah yang akan dikenali akan ditetapkan terlebih dahulu sebagai grammar. Grammar ini akan dijadikan contoh untuk dibandingkan pada tahap pengenalan pola.
3.3.3 Pengenalan pola spektrum suara
Pada tahap pengenalan pola spektrum suara, aplikasi akan menggunakan engine speech API untuk mengenali pola spekrum suara tersebut. Speech API akan membandingkan suara tersebut dengan grammar yang sudah ditetapkan terlebih dahulu.
3.3.4 Jalankan perintah pada perangkat
Proses jalankan perintah pada perangkat merupakan tahap akhir atau tahap eksekusi dari aplikasi ini, spektrogram yang telah dikenali dan disesuaikan dengan grammar akan menjadi pemicu perintah untuk menjalankan operating system Windows.
3.4 Perancangan Sistem
Pada perancangan sistem akan dilakukan perancangan bagaimana aplikasi akan memproses sinyal suara serta menjalankannya sebaga perintah untuk mengoperasikan operating system Windows dan dilakukan juga perancangan tentang antarmuka sistem yang akan dibangun.
3.4.1 Diagram Use Case
Use case diagram merupakan pemodelan terhadap cara kerja maupun tingkah laku sistem informasi yang akan dibuat. Use case mendeskripsikan interaksi tipikal antara user dengan sistem itu sendiri dengan member sebuah narasi tentang bagaimana sistem tersebut digunakan (Fowler, 2005). Diagram use case sistem untuk aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar pada windows dapat dilihat pada gambar 3.3.
(38)
Halaman utama / input suara
Tentang
Bantuan
Jalankan komando pada perangkat User
Gambar 3.3 diagram use case sistem
3.4.2Spesifikasi Use Case
Use case spesifikasi adalah dekskripsi mengenai use case diagram, menjelaskan bagaimana sebuah use case itu bekerja (Muchtar, et al. 2011).
Tabel 3.2 Spesifikasi use case untuk input suara
Nama use case Halaman utama / input suara
Aktor Pengguna komputer (user)
Deskripsi Use case ini digunakran oleh user untuk menginput suara
Pre condition User diasumsikan sudah mengetahui kata apa saja
yang bisa dijadikan input untuk menjalankan sistem Characteristic of activation Eksekusi dapat dilakukan oleh siapapun
Basic flow - User yang sudah mengetahui kata yang ingin
digunakan menjalankan sistem atau menginput sendiri kata yang ingin digunakan sebagai input perintah
- User melakukan input suara
- Sistem mengenali input dan mengeksekusi perintah
(39)
25
- Windows dijalankan berdasarkan perintah yang diinput
Alternative flow - Perintah tidak dikenali
- User melakukan input suara lagi
Post condition User dapat memasukkan input suara berupa kata dan melihat daftar kata yang dapat digunakan sebagai perintah untuk menjalankan windows
Limitations User hanya dapat menginput kata tertentu sesuai
dengan yang tertera pada halaman utama
Tabel 3.3 Spesifikasi use case untuk bantuan
Nama use case Bantuan
Aktor Pengguna komputer (user)
Deskripsi Use case ini digunakan oleh user untuk melihat petunjuk penggunaan aplikasi
Pre condition Setiap pengunjung bisa mengakses modul ini
Characteristic of activation Eksekusi dapat dilakukan oleh siapa pun
Basic flow User mengklik tombol bantuan untuk melihat
petunjuk penggunaan aplikasi
Alternative flow
-Post condition User dapat melihat petunjuk penggunaan aplikasi
Limitations -
3.4.3Diagram Aktifitas
Activity diagram sistem menggambarkan urutan aktivitas dalam sistem yang sedang dirancang. Aktivitas yang digambarkan hanya secara umum, tidak secara eksak seperti pembuatan flowchart yang terstruktur. Diagram aktivasi menjelaskan tentang kegiatan apa yang dapat dilakukan pada sistem tetapi tidak menjelaskan apa yang telah dilakukan oleh aktor (Fowler, 2005).
Pada gambar 3.4, setelah user melihat daftar perintah user dapat memilih untuk menjalankan sistem dengan cara menginput suara dengan kata yang telah tercantum
(40)
dalam daftar. Sistem akan merekam suara tersebut dan melakukan proses ekstraksi ciri dan dilanjutkan dengan proses pengenalan pola sehingga eksekusi berupa pengoperasian windows sesuai inputan suara dapat dijalankan.
Input suara
Jalankan perintah untuk perangkat
Ekstraksi ciri
Pengenalan pola
User Sistem
Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara)
Pada gambar 3.5, sistem memberikan informasi mengenai petunjuk penggunaan aplikasi yang disebut bantuan. Hal ini bertujuan untuk memberikan kemudahan bagi user yang kurang terbiasa dengan aplikasi speech recognition atau pengguna pertama kali.
User Sistem
Lihat bantuan Menampilkan petunjuk penggunaan aplikasi
(41)
27
3.4.4 Perancangan Antar Muka
Perancangan antar muka merupakan gambaran umum tentang perancangan setiap tampilan yang terdapat dalam sistem yang akan dibangun. Berikut akan dijelaskan rancangan bagian-bagian dari sistem.
a. Rancangan halaman awal
Pada halaman awal nama aplikasi terletak paling atas, dengan logo universitas di bagian kiri, keterangan perintah yang tersedia di kanan serta progress bar untuk menandakan suara terdeteksi tepat di sebelah kiri keterangan perintah seperti yang tertera pada gambar 3.6.
Gambar 3.6 Rancangan halaman awal
b. Rancangan halaman bantuan
Pada rancangan halaman bantuan, nama aplikasi dan logo tidak berubah. Namun, pada bawah nama aplikasi tersedia tiga bagian untuk penjelasan mengenai penggunaan aplikasi. Kemudian di bawah bagian keterangan penggunaan aplikasi tersebut terdapat satu tombol kembali untuk mengembalikan ke halaman awal seperti yang terlihat pada gambar 3.7.
(42)
(43)
BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM
Pada bab ini, pengimplementasian dan pengujian sistem akan dibahas sesuai dengan analisis dan perancangan yang telah dibahas pada bab tiga. Tahapan ini bertujuan untuk menampilkan hasil tampilan akhir sistem yang dibangun dan proses pengujian sistem untuk melihat tingkat keberhasilan sistem dalam mengenali perintah berbahasa Indonesia.
4.1 Implementasi Sistem
Berdasarkan analisis dan perancangan yang dibuat, sistem akan diimplementasikan menggunakan bahasa pemrograman visual basic dan aplikasi SAPI 5.1. Kebutuhan dalam pembangunan sistem ini meliputi perangkat keras dan lunak.
4.1.1 Perangkat keras
Spesifikasi perangkat keras yang digunakan untuk implementasi sistem adalah sebagai berikut :
- Processor, Intel® Core™ i3-3217U CPU @ 1.80 GHz - RAM , 4 GB
- Harddisk, 500 GB - Microphone
(44)
4.1.2 Perangkat lunak
Spesifikasi perangkat lunak yang digunakan untuk implementasi sistem adalah sebagai berikut :
- Windows 7 Pro 64-bit
- Speech Application Programming Interface (SAPI) 5.1 - Microsoft Visual Studio 2012
- CorelDraw 12
4.1.3 Implementasi perancangan antar muka
Adapun implementasi perancangan antarmuka yang telah dilakukan sebelumnya pada sistem adalah:
1. Halaman Awal
Halaman awal merupakan halaman pertama yang muncul apabila aplikasi dijalankan. Pada halaman ini terdapat keterangan perintah yang dapat digunakan, progress bar, dua text box serta tombol bantuan dan tombol tentang. Progress bar berfungsi untuk mendeteksi suara yang masuk sehingga user dapat melihat apakah suaranya cukup keras atau tidak untuk menjalankan aplikasi. Dua text box yang terdapat pada halaman awal ini berfungsi untuk mendeskripsikan perintah yang diucapkan dan juga untuk mengetahui tingkat frekuensi suara baik suara input ataupun suara keadaan sekitar (noise). Sedangkan tombol bantuan dan tombol tentang berfungsi untuk membuka halaman bantuan dan tentang. Untuk input kata – kata pengganti perintah dapat diketik pada textbox yang tersedia dan disesuaikan dengan ketersediaan combobox. Untuk keterangan perintah yang dapat digunakan dapat langsung dilihat pada halaman awal aplikasi penerapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah dasar pada windows seperti yang terlihat pada gambar 4.1
(45)
31
Gambar 4.1 Halaman Awal
2. Halaman Bantuan
Pada halaman bantuan, terdapat tiga jenis penjelasan. Penjelasan pertama adalah deskripsi perintah yang dapat digunakan serta fungsi – fungsinya. Penjelasan yang kedua merupakan penjelasan mengenai cara penggunaan aplikasi.Sedangkan penjelasan yang ketiga adalah penjelasan mengenai penggunaan control panel / penetapan perintah sendiri. Halaman bantuan juga memiliki tombol kembali yang berfungsi mengembalikan aplikasi ke halaman awal. Halaman bantuan penerapan perintah suara berbahasa Indonesia untuk mengoperasikan perintah dasar windows dapat dilihat pada gambar 4.2
(46)
Gambar 4.2 Halaman Bantuan
4.2 Pengujian Sistem
Pengujian sistem dilakukan untuk mengantisipasi kemungkinan terjadinya eror pada komponen ataupun pada interface dari program. Hal ini dilakukan dengan menguji apakah sistem tersebut telah memenuhi functional requirement dan non-functional requirement (Sommerville, 2004).
Metode pengujian yang digunakan adalah metode pengujian black box. Pengujian black box merupakan pengujian yang dilakukan pada interface sistem yang digunakan untuk mendemonstrasikan fungsi sistem yang dioperasikan (Gea, 2011).
4.2.1 Kasus dan Hasil Pengujian Sistem
Adapun kasus dan hasil pengujian sistem menggunakan teknik black box adalah sebagai berikut :
a. Halaman Awal
(47)
33
Tabel 4.1 Hasil pengujian halaman awal
No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian
1 Mengklik tombol “Bantuan” Aplikasi menampilkan halaman
bantuan Berhasil
2 Mengklik tombol “Tentang” Aplikasi menampilkan halaman
tentang Berhasil
3 Mengklik tombol “Tetapkan”
Aplikasi menampilkan message box berisi kata yang diinput dalam text box
Berhasil
4
Masukkan input suara “Explorer” menggunakan EYD
Aplikasi menampilkan windows
explorer Berhasil
Masukkan input suara “Explorer” tidak
menggunakan EYD
Aplikasi tidak menampilkan
windows explorer Berhasil
5
Masukkan input suara “Buka” menggunakan EYD
Aplikasi akan membuka folder / file yang terpilih pada windows explorer
Berhasil Masukkan input
suara “Buka” tidak
menggunakan EYD
Aplikasi tidak akan membuka folder / file yang terpilih pada windows explorer
Tidak Berhasil
6
Masukkan input suara “Atas” menggunakan EYD
Aplikasi akan menggeser pointer satu langkah ke atas pada
windows explorer
Berhasil
Masukkan input suara “Atas” tidak menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke atas pada windows explorer
Berhasil
7
Masukkan input suara “Bawah” menggunakan EYD
Aplikasi akan menggeser pointer satu langkah ke bawah pada windows explorer
Berhasil Masukkan input
suara “Bawah” tidak
menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke bawah pada windows explorer
Berhasil
8
Masukkan input suara “Kanan” menggunakan
Aplikasi akan menggeser pointer satu langkah ke kanan pada windows explorer
(48)
EYD
Masukkan input suara “Kanan” tidak
menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke kanan pada windows explorer
Berhasil
9
Masukkan input suara “Kiri” menggunakan EYD
Aplikasi akan menggeser pointer satu langkah ke kiri pada
windows explorer
Berhasil Masukkan input
suara “Kiri” tidak menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke kiri pada windows explorer
Berhasil
10
Masukkan input suara “Kembali” menggunakan EYD
Aplikasi akan mengembalikan ke direktori sebelumnya pada windows explorer
Berhasil
Masukkan input suara “Kembali” tidak
menggunakan EYD
Aplikasi tidak akan
mengembalikan ke direktori sebelumnya pada windows explorer
Berhasil
11
Masukkan input suara “Browser” menggunakan EYD
Aplikasi menampilkan browser
Google Chrome Berhasil
Masukkan input suara “Browser” tidak
menggunakan EYD
Aplikasi tidak menampilkan
browser Google Chrome Berhasil
12
Masukkan input suara “Word” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Word Berhasil
Masukkan input suara “Word” tidak
menggunakan EYD
Aplikasi tidak menampilkan
Microsoft Office Word Berhasil
13
Masukkan input suara “Point” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Power Point Berhasil Masukkan input
suara “Point” tidak
menggunakan
Aplikasi tidak menampilkan
(49)
35
EYD
14
Masukkan input suara “Excel” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Excel Berhasil
Masukkan input suara “Excel” tidak
menggunakan EYD
Aplikasi tidak menampilkan
Microsoft Office Excel Berhasil
15
Masukkan input suara “Publisher” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Publisher Berhasil
Masukkan input suara “Publisher” tidak
menggunakan EYD
Aplikasi tidak menampilkan
Microsoft Office Publisher Berhasil
b. Halaman Bantuan
Tabel 4.2 akan menjelaskan skenario pengujian sistem pada halaman bantuan
Tabel 4.2 Hasil pengujian halaman bantuan
No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian
1 Mengklik tombol “kembali”
Aplikasi akan menutup halaman bantuan dan kembali ke halaman awal
Berhasil
4.2.2 Pengujian kinerja sistem
Pada pengujian kinerja sistem akan dijelaskan hasil perancangan sistem yang dibuat. Hasil dari tiap halaman sistem adalah sebagai berikut :
a. Halaman awal
Gambar 4.3 dan gambar 4.4 menampilkan halaman awal dari aplikasi. Apabila user mengatakan kata “Explorer”, maka windows explorer akan muncul tanpa
(50)
mengklik apapun. Begitu pula apabila user mengatakan kata “atas”, “buka” dan perintah lain yang berfungsi menggeser pointer, maka pointer akan bergerak tanpa kita menggunakan mouse.
Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan
(51)
37
Sedangkan untuk perintah memanggil aplikasi seperti browser, word, excel dan publisher juga dapat dilakukan sama seperti windows explorer seperti yang terlihat pada gambar 4.5 sampai gambar 4.8
Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan
(52)
Gambar 4.7 Halaman awal ketika perintah “excel” diucapkan
Gambar 4.8 Halaman awal ketika perintah “publisher” diucapkan
Pada gambar 4.9 adalah halaman ketika user menggunakan fasilitas control panel / tetapkan perintah untuk memasukkan kata – kata yang user inginkan untuk dijadikan perintah
(53)
39
Gambar 4.9 Halaman awal ketika input kata ganti perintah
b. Halaman bantuan
Gambar 4.10 menunjukkan halaman bantuan dari aplikasi ini. Apabila user mengklik tombol kembali maka halaman tersebut akan tertutup dan kembali pada halaman awal
(54)
4.3 Hasil Pengujian Suara
Disini penulis akan memaparkan hasil pengujian suara dari dua orang perempuan dan dua orang laki – laki sebanyak lima kali per perintah dengan tingkat sensitifitas microphone dan keadaan frekuensi noise yang berbeda. Berikut penjelasan pengujian dari tiap kondisi.
4.3.1 Hasil pengujian suara dengan tingkat frekuensi noise0 – 500 Hz
Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi berada pada 0 – 500 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.4
Tabel 4.4 Pengujian suara dengan tingkat frekuensi noise 0 – 500 Hz
Subjek Kata yang diuji
Pengujian (Berhasil / Gagal /
Jumlah)
Tingkat frekuensi lingkungan
(noise)
Tingkat keberhasilan
B G J
Perempuan A
Explorer 5 0 5
0 – 500 Hz
100 %
Buka 5 0 5 100 %
Atas 5 0 5 100 %
Bawah 5 0 5 100 %
Kanan 5 0 5 100 %
Kiri 5 0 5 100 %
Kembali 5 0 5 100 %
Browser 5 0 5 100 %
Word 5 0 5 100 %
Point 3 2 5 60 %
Excel 5 0 5 100 %
Publisher 5 0 5 100 %
Perempuan B
Explorer 5 0 5
0 – 500 Hz
100 %
Buka 5 0 5 100 %
Atas 5 0 5 100 %
Bawah 5 0 5 100 %
Kanan 5 0 5 100 %
Kiri 0 5 5 0 %
Kembali 5 0 5 100 %
Browser 2 3 5 40 %
Word 0 5 5 0 %
Point 0 5 5 0 %
Excel 4 1 5 80 %
Publisher 3 2 5 60 %
Laki – Laki A
Explorer 4 1 5
0 – 500 Hz
80 %
Buka 5 0 5 100 %
(55)
41
Bawah 5 0 5 100 %
Kanan 5 0 5 100 %
Kiri 5 0 5 100 %
Kembali 5 0 5 100 %
Browser 4 1 5 80 %
Word 5 0 5 100 %
Point 4 1 5 80 %
Excel 5 0 5 100 %
Publisher 4 1 5 80 %
Laki – Laki B
Explorer 4 1 5
0 – 500 Hz
80 %
Buka 5 0 5 100 %
Atas 5 0 5 100 %
Bawah 2 3 5 40 %
Kanan 5 0 5 100 %
Kiri 5 0 5 100 %
Kembali 5 0 5 100 %
Browser 5 0 5 100 %
Word 5 0 5 100 %
Point 1 4 5 20 %
Excel 5 0 5 100 %
Publisher 5 0 5 100 %
Dari tabel 4.4 dapat diketahui persentase keberhasilan aplikasi pada lingkungan dengan tingkat frekuensi (noise) 0 – 500 Hz adalah sebagai berikut : Perempuan A = 96,6 %
Perempuan B = 65 % Laki – laki A = 83 % Laki – laki B = 80 %
Dengan tingkat keberhasilan per perintah sebagai berikut : - Explorer = 90 %
- Buka = 100 %
- Atas = 90 %
- Bawah = 85 % - Kanan = 100 %
- Kiri = 75 %
- Kembali = 100 % - Browser = 80 % - Word = 75 % - Point = 40 % - Excel = 95 % - Publisher = 85 %
(56)
4.3.2 Hasil pengujian suara dengan tingkat frekuensi (noise) 501 – 1000 Hz
Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi berada pada 501 – 1000 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.5
Tabel 4.5 Pengujian suara dengan tingkat frekuensi noise 501 – 1000 Hz
Subjek Kata yang diuji
Pengujian (Berhasil / Gagal /
Jumlah)
Tingkat frekuensi lingkungan
(noise)
Tingkat keberhasilan
B G J
Perempuan A
Explorer 0 5 5
501 – 1000 Hz
0 %
Buka 2 3 5 40 %
Atas 4 1 5 80 %
Bawah 3 2 5 60 %
Kanan 3 2 5 60 %
Kiri 1 4 5 20 %
Kembali 1 4 5 20 %
Browser 2 3 5 40 %
Word 2 3 5 40 %
Point 2 3 5 40 %
Excel 5 0 5 100 %
Publisher 2 3 5 40 %
Perempuan B
Explorer 1 4 5
501 – 1000 Hz
20 %
Buka 2 3 5 40 %
Atas 3 2 5 60 %
Bawah 1 4 5 20 %
Kanan 1 4 5 20 %
Kiri 0 5 5 0 %
Kembali 2 3 5 40 %
Browser 0 5 5 0 %
Word 0 5 5 0 %
Point 0 5 5 0 %
Excel 1 4 5 20 %
Publisher 0 5 5 0 %
Laki – Laki A
Explorer 3 2 5
501 – 1000 Hz
60 %
Buka 3 2 5 60 %
Atas 4 1 5 80 %
Bawah 3 2 5 60 %
Kanan 5 0 5 100 %
Kiri 3 2 5 60 %
Kembali 1 4 5 20 %
Browser 2 3 5 40 %
Word 1 4 5 20 %
Point 2 3 5 40 %
(57)
43
Publisher 2 3 5 40 %
Laki – Laki B
Explorer 1 4 5
501 – 1000 Hz
20 %
Buka 0 5 5 0 %
Atas 0 5 5 0 %
Bawah 0 5 5 0 %
Kanan 2 3 5 40 %
Kiri 1 4 5 20 %
Kembali 1 4 5 20 %
Browser 0 5 5 0 %
Word 0 5 5 0 %
Point 0 5 5 0 %
Excel 0 5 5 0 %
Publisher 0 5 5 0 %
Dari tabel 4.5 dapat diketahui persentase keberhasilan aplikasi pada lingkungan dengan tingkat frekuensi noise 501 – 1000 Hz adalah sebagai berikut : Perempuan A = 45 %
Perempuan B = 18,3 % Laki – laki A = 51,6 % Laki – laki B = 8,3 %
Dengan tingkat keberhasilan per perintah sebagai berikut : - Explorer = 25 %
- Buka = 35 %
- Atas = 55 %
- Bawah = 35 % - Kanan = 55 %
- Kiri = 25 %
- Kembali = 25 % - Browser = 20 % - Word = 15 % - Point = 20 % - Excel = 40 % - Publisher = 20 %
(58)
Berdasarkan tabel 4.4 dan tabel 4.5, dapat dilihat persentase keberhasilan sistem dalam mengenali input suara berbahasa Indonesia pada gambar 4.11 dan gambar 4.12
Gambar 4.11 Persentase keberhasilan perintah suara dengan tingkat frekuensi
noise 0 – 500 Hz
Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat frekuensi
noise 501 – 1000 Hz
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher 0% 10% 20% 30% 40% 50% 60% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher
(59)
BAB 5
KESIMPULAN DAN SARAN 5.1 Kesimpulan
Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows didapat beberapa kesimpulan, yaitu :
1. Hasil pengujian aplikasi menunjukkan bahwa tingkat keberhasilan perintah suara bahasa Indonesia dikenali dengan tingkat frekuensi lingkungan 0 – 500 Hz adalah 81,15 %. Sedangkan tingkat keberhasilan perintah suara bahasa Indonesia dengan tingkat frekuensi lingkungan 501 – 1000 Hz adalah 30,8 %.
2. Hasil pengujian aplikasi juga menunjukkan bahwa tingkat keberhasilan cenderung rendah apabila pengguna (user) memiliki pengucapan kata yang kurang jelas. Hal tersebut menunjukkan tingkat akurasi aplikasi dipengaruhi oleh kualitas input yang diberikan pengguna (user).
3. Untuk pengujian dengan tingkat frekuensi lingkungan 501 – 1000 Hz, perintah yang masih dapat dikenali adalah kanan dan atas. Sementara untuk perintah pemanggilan aplikasi yang cenderung berbahasa inggris tidak dapat dikenali seperti explorer, word dan point.
4. Jarak waktu perintah diberikan dan eksekusi perintah tidak lebih dari satu detik sehingga dapat dikatakan cukup nyaman untuk digunakan.
Berdasarkan kesimpulan di atas perintah suara berbahasa Indonesia berhasil diterapkan untuk mengoperasikan perintah dasar di windows. Penerapan Speech Application Programming Interface (SAPI) dan algoritma Fast Fourier Transform sesuai dengan kebutuhan aplikasi yang berhasil berjalan dengan tingkat keberhasilan 81,15 %.
(60)
5.2 Saran
Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows terdapat beberapa kelemahan seperti perintah yang tidak dikenali di lingkungan yang ribut, aplikasi juga membatasi kualitas input sehingga aplikasi dapat dikatakan kaku karena membatasi tipe input. Maka dari itu, penulis memiliki beberapa saran agar dapat dilakukan penelitian – penelitian lain yang dapat mengembangkan aplikasi – aplikasi speech recognition berbahasa Indonesia, seperti :
1. Diharapkan penelitian mengenali pengenalan ucapan berbahasa Indonesia dapat dikembangkan sehingga dapat diterapkan di berbagai aplikasi.
2. Dapat menerapkan metode – metode lain yang dapat meningkatkan tingkat keberhasilan walau dengan tingkat frekuensi lingkungan (noise) yang cenderung besar atau ditemukannya metode untuk mereduksi noise (frekuensi lingkungan) sehingga aplikasi dapat berjalan dengan lebih optimal.
3. Diharapkan juga ada penelitian yang bersifat memprediksi pola ucapan sehingga pengguna (user) yang memiliki kebiasaan berbicara tidak menggunakan Ejaan Yang Disempurnakan (EYD) atau memiliki kekurangan dalam melafalkan huruf dapat menggunakan aplikasi pengenalan ucapan dengan nyaman.
(61)
DAFTAR PUSTAKA
Darmawan, Y., 2011. Speech Recognition menggunakan metode Mel Frequency Cepstrum Coefficient dan Algoritma Dynamic Time Wrapping. Skripsi. Universitas Sumatera Utara
Gunawan, D. & Juwono, F.H., 2012. Pengolahan Sinyal Digital dengan Pemrograman MATLAB. 978-979-756-814-6. Graha Ilmu : Yogyakarta
Junaedih. 2007. Implementasi Speech Recognition menggunakan SAPI 5 dan Visual Basic 6.0 pada pembuatan Aplikasi Kalkulator Audio Visual. Skripsi. Universitas Islam Negeri Syarif Hidayatullah Jakarta
Nurcahyono, D., Kristalina, P. & Huda, M. 2011. Pembuatan Speech Recognition dan Database Wicara untuk Kontrol Peralatan Rumah Tangga Jarak Jauh. Speech Recognition 1-7
Pressman, R.S. 2010. Software Engineering: A Practitioner’s Approach. 7th Edition. McGraw-Hill: New York.
Rabiner, L., Juang, B.H.1993. Fundamental of Speech Recognition. New Jersey : Prantice - Hall Inc
Sianturi, A.H. 2014. Implementasi Speech Recognition pada Aplikasi Pembelajaran dalam bentuk Permainan Menebak Kata Baku Bahasa Indonesia. Skripsi. Universitas Sumatera Utara.
Sommerville, I. 2004. Software Engineering. 7th edition. Pearson/Addison-Wesley: New York
Speech Application Programming Interface (SAPI). (online) http : //msdn.com/SAPI 5.4. (April 2015)
(62)
Stefanus, Hamz, M., Angzas, Y. 2005. Perancangan Aplikasi Pengenalan Ucapan Bahasa Mandarin menggunakan Jaringan Syaraf Tiruan Fuzzy Artmap. Indonesia : Bina Nusantara
Sunny, A.S. 2009. Speech Recognition menggunakan Algoritma Program Dinamis. Indonesia : Teknik Informatika Institut Teknologi Bandung
Supriyono, B. 2004. Perancangan Aplikasi Voice User Interface Dengan Menggunakan Microsoft Speech API. L2F 099 583 : 1-15
Syarif, A., Daryanto, T. & Arifin, M.J. 2011. Aplikasi Speech Application Programming Interface (SAPI) 5.1 sebagai perintah untuk Pengoperasian Aplikasi berbasis Windows. Speech Application Programming Interface (SAPI) 1907-5022 : 1-7
Yang, T. 2012. The Algorithms of Speech Recognition, Programming and Simulating in MATLAB. Tesis. University of Gavle
(1)
Publisher 2 3 5 40 %
Laki – Laki B
Explorer 1 4 5
501 – 1000 Hz
20 %
Buka 0 5 5 0 %
Atas 0 5 5 0 %
Bawah 0 5 5 0 %
Kanan 2 3 5 40 %
Kiri 1 4 5 20 %
Kembali 1 4 5 20 %
Browser 0 5 5 0 %
Word 0 5 5 0 %
Point 0 5 5 0 %
Excel 0 5 5 0 %
Publisher 0 5 5 0 %
Dari tabel 4.5 dapat diketahui persentase keberhasilan aplikasi pada lingkungan dengan tingkat frekuensi noise 501 – 1000 Hz adalah sebagai berikut : Perempuan A = 45 %
Perempuan B = 18,3 %
Laki – laki A = 51,6 % Laki – laki B = 8,3 %
Dengan tingkat keberhasilan per perintah sebagai berikut :
- Explorer = 25 % - Buka = 35 %
- Atas = 55 %
- Bawah = 35 % - Kanan = 55 %
- Kiri = 25 %
- Kembali = 25 % - Browser = 20 % - Word = 15 % - Point = 20 % - Excel = 40 % - Publisher = 20 %
(2)
44
Berdasarkan tabel 4.4 dan tabel 4.5, dapat dilihat persentase keberhasilan sistem dalam mengenali input suara berbahasa Indonesia pada gambar 4.11 dan gambar 4.12
Gambar 4.11 Persentase keberhasilan perintah suara dengan tingkat frekuensi noise 0 – 500 Hz
Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat frekuensi noise 501 – 1000 Hz
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher 0% 10% 20% 30% 40% 50% 60% Perintah Explorer Buka Kembali Atas Bawah Kanan Kiri Browser Word Point Excel Publisher
(3)
BAB 5
KESIMPULAN DAN SARAN 5.1 Kesimpulan
Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows didapat beberapa kesimpulan, yaitu :
1. Hasil pengujian aplikasi menunjukkan bahwa tingkat keberhasilan perintah suara bahasa Indonesia dikenali dengan tingkat frekuensi lingkungan 0 – 500 Hz adalah 81,15 %. Sedangkan tingkat keberhasilan perintah suara bahasa Indonesia dengan tingkat frekuensi lingkungan 501 – 1000 Hz adalah 30,8 %.
2. Hasil pengujian aplikasi juga menunjukkan bahwa tingkat keberhasilan cenderung rendah apabila pengguna (user) memiliki pengucapan kata yang kurang jelas. Hal tersebut menunjukkan tingkat akurasi aplikasi dipengaruhi oleh kualitas input yang diberikan pengguna (user).
3. Untuk pengujian dengan tingkat frekuensi lingkungan 501 – 1000 Hz, perintah yang masih dapat dikenali adalah kanan dan atas. Sementara untuk perintah pemanggilan aplikasi yang cenderung berbahasa inggris tidak dapat dikenali seperti explorer, word dan point.
4. Jarak waktu perintah diberikan dan eksekusi perintah tidak lebih dari satu detik sehingga dapat dikatakan cukup nyaman untuk digunakan.
Berdasarkan kesimpulan di atas perintah suara berbahasa Indonesia berhasil diterapkan untuk mengoperasikan perintah dasar di windows. Penerapan Speech Application Programming Interface (SAPI) dan algoritma Fast Fourier Transform
sesuai dengan kebutuhan aplikasi yang berhasil berjalan dengan tingkat keberhasilan 81,15 %.
(4)
46
5.2 Saran
Berdasarkan pengujian aplikasi penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar windows terdapat beberapa kelemahan seperti perintah yang tidak dikenali di lingkungan yang ribut, aplikasi juga membatasi kualitas input
sehingga aplikasi dapat dikatakan kaku karena membatasi tipe input. Maka dari itu, penulis memiliki beberapa saran agar dapat dilakukan penelitian – penelitian lain yang dapat mengembangkan aplikasi – aplikasi speech recognition berbahasa Indonesia, seperti :
1. Diharapkan penelitian mengenali pengenalan ucapan berbahasa Indonesia dapat dikembangkan sehingga dapat diterapkan di berbagai aplikasi.
2. Dapat menerapkan metode – metode lain yang dapat meningkatkan tingkat keberhasilan walau dengan tingkat frekuensi lingkungan (noise) yang cenderung besar atau ditemukannya metode untuk mereduksi noise (frekuensi lingkungan) sehingga aplikasi dapat berjalan dengan lebih optimal.
3. Diharapkan juga ada penelitian yang bersifat memprediksi pola ucapan sehingga pengguna (user) yang memiliki kebiasaan berbicara tidak menggunakan Ejaan Yang Disempurnakan (EYD) atau memiliki kekurangan dalam melafalkan huruf dapat menggunakan aplikasi pengenalan ucapan dengan nyaman.
(5)
DAFTAR PUSTAKA
Darmawan, Y., 2011. Speech Recognition menggunakan metode Mel Frequency Cepstrum Coefficient dan Algoritma Dynamic Time Wrapping. Skripsi. Universitas Sumatera Utara
Gunawan, D. & Juwono, F.H., 2012. Pengolahan Sinyal Digital dengan Pemrograman MATLAB. 978-979-756-814-6. Graha Ilmu : Yogyakarta
Junaedih. 2007. Implementasi Speech Recognition menggunakan SAPI 5 dan Visual Basic 6.0 pada pembuatan Aplikasi Kalkulator Audio Visual. Skripsi. Universitas Islam Negeri Syarif Hidayatullah Jakarta
Nurcahyono, D., Kristalina, P. & Huda, M. 2011. Pembuatan Speech Recognition dan Database Wicara untuk Kontrol Peralatan Rumah Tangga Jarak Jauh. Speech Recognition 1-7
Pressman, R.S. 2010. Software Engineering: A Practitioner’s Approach. 7th Edition. McGraw-Hill: New York.
Rabiner, L., Juang, B.H.1993. Fundamental of Speech Recognition. New Jersey : Prantice - Hall Inc
Sianturi, A.H. 2014. Implementasi Speech Recognition pada Aplikasi Pembelajaran dalam bentuk Permainan Menebak Kata Baku Bahasa Indonesia. Skripsi. Universitas Sumatera Utara.
Sommerville, I. 2004. Software Engineering. 7th edition. Pearson/Addison-Wesley: New York
Speech Application Programming Interface (SAPI). (online) http : //msdn.com/SAPI 5.4. (April 2015)
(6)
Stefanus, Hamz, M., Angzas, Y. 2005. Perancangan Aplikasi Pengenalan Ucapan Bahasa Mandarin menggunakan Jaringan Syaraf Tiruan Fuzzy Artmap. Indonesia : Bina Nusantara
Sunny, A.S. 2009. Speech Recognition menggunakan Algoritma Program Dinamis. Indonesia : Teknik Informatika Institut Teknologi Bandung
Supriyono, B. 2004. Perancangan Aplikasi Voice User Interface Dengan Menggunakan Microsoft Speech API. L2F 099 583 : 1-15
Syarif, A., Daryanto, T. & Arifin, M.J. 2011. Aplikasi Speech Application Programming Interface (SAPI) 5.1 sebagai perintah untuk Pengoperasian Aplikasi berbasis Windows. Speech Application Programming Interface (SAPI)
1907-5022 : 1-7
Yang, T. 2012. The Algorithms of Speech Recognition, Programming and Simulating in MATLAB. Tesis. University of Gavle