PROGRAM PEMANGGILAN APLIKASI PERKANTORAN DENGAN MICROSOFT SPEECH Program Pemanggilan Aplikasi Perkantoran Dengan Microsoft Speech Application Programming Interface Yang Terintegrasi Melalui Visual Basic .Net.
PROGRAM PEMANGGILAN APLIKASI
PERKANTORAN DENGAN MICROSOFT SPEECH
APPLICATION PROGRAMMING INTERFACE YANG
TERINTEGRASI MELALUI VISUAL BASIC .NET
Makalah
Diajukan Oleh:
Shofwanin
Aris Rakhmadi
Fatah Yasin Irsyadi
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS KOMUNIKASI DAN INFORMATIKA
UNIVERSITAS MUHAMMADIYAH SURAKARTA
Juni, 2014
TIALAIvIAN PENGESAHAN
Fublikasi Jurnal lhniah dengan Judul:
PROGRAM PEMANGGILAN APLIKASI
PERKAI\ITORAN DENGAI\I MICROSOF'T SPEECH
APPLICATION PROGRAMMING INTERFACE YAITG
TERINTEGRASI MELALTT VISUAL BASIC .I[ET
Yang disusun dan dipersiapkan oleh:
Shoftmnin
L200080183
Telah disetujui pada:
Haxi
Tanggal
:.................
:.................
Pembimbing 2
4ry*
S.T., M.F.ng.
Fatah Yasin lrsyadr, S.T., M.T.
NIK: 738
Skripsi ini telah dit€rima sebagai salah satu persyaralan
untuk memperoleh gelar sarjana
Tanggal
Mengetahui,
KetuaProgram Studi
Teknik Informatika
Dr. Heru Supriyono. M.Sc.
NIK:970
PROGRAM PEMANGGILAN APLIKASI PERKANTORAN
DENGAN MICROSOFT SPEECH APPLICATION
PROGRAMMING INTERFACE YANG TERINTEGRASI
MELALUI VISUAL BASIC .NET
Teknik Informatika, Fakultas Komunikasi dan Informatika, UMS.
Shofwanin (e-mail: anin.farikin@gmail.com)
Abstrak : Teknologi pengenalan suara adalah teknologi yang memanfaatkan
masukan berupa audio (suara) dengan menggunakan piranti keras berupa
microphone untuk menginterpretasikan suara manusia sebagai metode interaksi
alternatif dengan komputer. Menggunakan aplikasi yang telah dikembangkan oleh
Microsoft, yaitu Speech Application Programming Interface. Penelitian ini
bertujuan untuk mempermudah pengguna dalam mengakses program aplikasi
perkantoran. Masukan suara yang dikenali dalam bentuk text disimpan dalam
basis data dan dikenali sebagai perintah untuk melakukan aktifitas tertentu.
Metode yang digunakan untuk mengenali suara atau kata adalah dengan mode
diktasi, yaitu mengenal data analog berupa suara ke bentuk data teks yang
kemudian disimpan dalam basis data. Keakuratan mode ini tergantung pada pola
dan aksen suara serta frekuensi yang dikenali pada lingkungan tertentu. Eksekusi
perintah dilakukan dengan mode commmand and control, yaitu mengenali
pengucapan kata yang telah tersimpan dalam basis data.
Kata Kunci : frekuensi, pengenalan suara, Microsoft, SAPI, Speech Application
Programming Interface, diktasi, command and control.
Abstact: Voice recognition technology is a technology that utilizes the input of the
audio (sound) using hardware such as microphones to interpret the human voice
as an alternative method of interaction with the computer. Used application has
been developed by microsoft, Speech Application Programming Interface. This
Research aims to ease users to access the applications office program. The voice
input in the text would saved to database and recognized as some activities
command. The method that used to recognize voice or word is a dictation, which
recognized analogue data. The accuracy of this mode depends on the pattern and
accent sounds and frequencies that are recognized in a specific environment.
Command execution is done with commmand and control mode, which recognize
the pronunciation of the word that has been stored in a database.
Key Words: speech, voice, sound, recognition, Microsoft, SAPI, Speech
Application Programming Interface, dictation, command and control.
Hal-1
BAB I PENDAHULUAN
Sebagian
dihabiskan
BAB II TINJAUAN PUSTAKA
hidup
dengan
manusia
berkomunikasi
dengan manusia lainnya. Berbicara
adalah
hal
yang
lebih
alami
dibandingkan dengan membaca atau
menulis, setiap orang menguasai cara
bicara melebihi cara membaca atau
menulis. Berbicara juga lebih efisien
dibandingkan mengetik atau menulis.
Pengelolaan
perkantoran
dengan perintah suara akan lebih
efektif
digunakan
dibandingkan
melakukan secara langsung. Beberapa
kegiatan seperti memainkan musik,
menonton
video,
2.1. Suara
dan
membuka
Agus Suryanto (2011), Suara
atau
bunyi
biasanya
merambat
melalui udara dan akan memantul
apabila ada dinding, suara atau bunyi
tidak dapat merambat melalui ruang
hampa. Suara dihasilkan oleh getaran
suatu
benda.
Selama
bergetar,
perbedaan tekanan terjadi di udara
sekitarnya. Pola asilasi yang terjadi
disebut
gelombang.
Gelombang
memiliki
pola
sama
yang
dan
berulang pada interval tertentu, yang
disebut periode.
2.2. Analog ke Digital
aplikasi pun dapat dilakukan hanya
Solihin Arianto (2008). File
dengan menggunakan suara. Kegiatan
tersebut akan lebih sulit dilakukan
berupa
jika
banyak
diproses, disimpan dan kemudian
jendela kerja (multitasking), namun
diubah ke bentuk biner mennjadi data
dengan perintah suara semua kegiatan
digital
tersebut akan lebih mudah.
kembali ke data analog berupa suara.
pengguna
membuka
Penelitian ini akan difokuskan
pada
pengenalan
suara
dengan
data
yang
analog
akan
disandikan,
dikonversikan
Data analog tersebut akan diencoded-kan dalam berbagai bentuk
memanfaatkan fitur Microsoft Speech
media, seperti:
Application Programming Interface
a. Logika 1 atau 0
yang dikembangkan oleh Microsoft.
b. On atau Off
c. Voltage atau No Voltage
Hal-2
Capt ure Dat a
analog
microphone
2.4. Mode Sistem Pengenalan Suara
ADC
Analog Digit al
Convert er
Tareb Permadi (2008), Terdapat dua
mode pengenalan suara, yaitu:
Conve
rt t o
Binary
DAC
Digit al Analog
Convert er
a. Mode Diktasi, pada mode ini
pengguna mengucapkan kata atau
kalimat yang selanjutnya akan
Out put Dat a
analog
Speaker
Gambar 1 : Proses Analog ke Digital
diubah ke data teks. Kemungkinan
jumlah kata yang dikenali dibatasi
oleh jumlah kata yang telah
terdapat
2.3. Speech Recognition
pada
Pengenalan
Ardianto
Nugroho
database.
mode
diktasi
(2010),
merupakan speaker dependent.
Speech Recognition adalah proses
Kakuratan mode ini tergantung
konversi sebuah sinyal akustik untuk
pada
merangkai kata – kata. Kata – kata
pembicara
yang dikenali bisa jadi sebagai hasil
berlangsung.
akhir, untuk sebuah aplikasi seperti
pola
suara
saat
dan
aksen
penelitian
b. Mode Command and Control,
command & control, pemasukan data,
pada
dan
Speech
mengucapkan kata atau kalimat
recognizer yang pertama keluar di
yang sudah terdefinisi sebelumnya
tahun 1952. Salah satu perangkat
pada database yang kemudian
speech
digunakan
persiapan
dokumen.
recognizer
adalah
IBM
mode
ini
untuk
pengguna
menjalankan
Shoebox, yang dikeluarkan pada 1963
perintah
melalui New York World’s Fair.
merupakan speaker independent
Microphone merupakan salah satu
karena jumlah kata yang dikenali
teknologi
terbatas
yang
digunakan
untuk
menginterpretasikan suara manusia
untuk
alternatif
transkripsi
untuk
atau
tertentu.
pada
Mode
database
ini
yang
sudah ada.
metode
berkomunikasi
dengan komputer.
Hal-3
2.5. Pemisahan Kata
cukup akurat dalam mengenali
Junaedih (2007), Pemisahan
kata adalah pemisahan suara yang
diucapkan pengguna dalam beberapa
bagian. Bagian tersebut dapat berupa
kata atau kalimat. Terdapat tiga
metode
yang
digunakan
dalam
pemisahan kata tersebut, yaitu:
a. Discrete Speech, pengguna harus
mengucapkan
kalimat
secara
ucapan
pengguna.
Kekurangan
dari metode ini adalah besarnya
resource yang diperlukan dalam
memproses
data.
Metode
ini
mengidentifikasi setiap awal dan
akhir kata tanpa jeda kemudian
mencocokkkan tiap kata yang
diucapkan dengan database.
2.6. Sifat Pengenalan Pembicaraan
terpenggal dengan jeda di antara
Tareb Permadi (2008), Sistem
kata. Jeda tersebut digunakan
pengenalan pembicaraan dilihat dari
untuk identifikasi awal dan akhir
ketergantungannya
kata. Kelebihan metode ini adalah
pengguna memiliki beberapa sifat,
sedikitnya
(memori,
diantaranya:
waktu proses) yang digunakan
a. Speaker
resource
sistem untuk mendeteksi suara.
b. Word
Spotting, dalam sebuah
kalimat
pengguna,
yang
sistem
diucapkan
hanya
terhadap
Dependent,
sistem
memmbutuhkan pelatihan berupa
sampel untuk pengguna yang akan
menggunakan
sistem
Sistem
akan
tidak
tersebut.
mengenali
mendeteksi kata yang ada di
pengguna yang belum pernah
dalam database dan mengabaikan
menggunakan atau memasukkan
yang tidak dikenali. Kekurangan
sampel ke dalam sistem.
dari metode ini adalah apabila ada
b. Speaker Independent, pengguna
kalimat yang memiliki kata yang
tidak perlu melakukan pelatihan
sama maka akan diidentifikasi dan
dalam
menghasilkan output yang sama.
tersebut,
menggunakan
karena
sistem
sistem dapat
c. Continuous Speech, sistem akan
mengenali semmua suara tidak
mengenali dan memproses setiap
peduli siapa pengguna dan dialek
kata yang diucapkan. Metode ini
yang digunakan.
Hal-4
c. Speaker
adaptive,
perpaduan
yang diucapkan akan berpengaruh
speaker dependent dan speaker
pada
independent
pemrosesan.
dimana
pengguna
kecepatan
dan
keakuratan
tidak perlu melakukan pelatihan
2.9. Microsoft Speech Application
dan keakuratan tergantung pada
Programming Interface
intensitas
pengguna
Speech
dalam
Application
Programming
memanfaatkan sistem.
Interface
merupakan
2.7. Pencocokan Kata
Application
Programming
Tareb
Permadi
(2008),
Pencocokan kata adalah proses untuk
melakukan pencocokan ucapan yang
berhasil diidentifikasi oleh database
yang dimiliki sistem. Terdapat dua
kata yang digunakan dalam proses
pencocokan kata, yaitu:
a. Whole-word
Interface
(API)
dikembangkan
Microsoft
speech
untuk digunakan pada
recognition
synthesis
oleh
dengan
berbasis
dan
speech
sistem
operasi
Windows.
Dengan
API
tersebut
menggunakan
dimungkinkan bagi pihak ketiga atau
Matching,
sistem
akan mencari dalam database kata
yang persis dengan kata yang
diucapkan pengguna.
b. Phoneme
yang
(SAPI)
individu
untuk
mengembangkan
perangkat Speech Recognition yang
dapat
bekerjasama
dengan
SAPI
tersebut.
Matching,
sistem
2.10. Microsoft Visual Basic .NET
memiliki kamus fonem, yaitu kata
terkecil
dari
suara
Microsoft .NET adalah suatu
yang
platform
membentuk suatu kata.
untuk
menjalankan
2.8. Perbendaharaan Kata
membangun
generasi
aplikasi-aplikasi
Tareb
Permadi
(2008),
Perbendaharaan kata adalah bagian
akhir dari sistem pengenalan suara.
Terdapat
dua
diperhatikan,
hal
yaitu
yang
perlu
ukuran
dan
keakuratan. Semakin sedikit
kata
dan
penerus
terdistribusi.
Microsoft.NET
merupakan
framework (kerangka) pengembangan
yang
menyediakan
antarmuka
pemrograman baru untuk layanan
Windows
dan
API
(Application
Programming Interface).
Hal-5
BAB III METODE PENELITIAN
Penelitian dilakukan di Wisma
Ratih 3 dengan 10 responden.
3.2. Metode Pengumpulan Data
Metode yang digunakan untuk
mengumpulkan data dalam penelitian
ini ada dua cara, yaitu metode angket
3.1. Alur Penelitian
dan studi pustaka.
Metode
yang
digunakan
1. Metode Angket
penulis dalam perancangan sistem
Metode
adalah
pengumpulan
metode
daur
hidup
angket
adalah
data
cara
melalui
pengembangan sistem atau system
pengajuan pertanyaan-pertanyaan
development
(SDLC).
tertulis kepada subyek penelitian,
SDLC merupakan pendekatan yang
responden, atau sumber data dan
sangat
jawabannya diberikan pula secara
secara
untuk
life
cycle
terstruktur,
bertingkat
digambarkan
dan
menggambarkan
digunakan
bahwa
tertulis (Budiyono, 2003: 47).
2. Studi Pustaka
keluaran dari suatu tahap merupakan
Studi Pustaka adalah metode yang
masukan dari tahap berikutnya serta
digunakan untuk memperoleh data
dimungkinkan untuk kembali pada
melalui
langkah sebelumnya (proses iterasi)
tutorial tentang program Speech
saat suatu keputusan tertentu perlu
Application
dipertimbangkan
Interface, serta makalah sebagai
kembali
(Murniningsih, 2012).
buku-buku
teori
dan
Programming
referensi dalam penelitian ini
yang
disertakan
pada
daftar
pustaka.
3.3. Analisis Sistem
1. Studi Kelayakan
Studi kelayakan sistem digunakan
untuk menentukan kemungkinan
apakah pengembangan program
perintah suara layak diteruskan
Gambar 2 : Diagram Alir SDLC
atau dihentikan. Ukurun studi
Hal-6
kelayakan menyangkut beberapa
faktor antara lain faktor teknologi,
ekonomi, operasional, dan hukum.
2. Analisis Kebutuhan
Analisis
kebutuhan
dilakukan
untuk menghasilkan spesifikasi
kebutuhan yaitu spesifikasi yang
rinci tentang hal-hal yang akan
dilakukan
program
diimplementasikan.
ketika
Pada
penelitian ini, dilakukan analisis
Gambar 3: Diagram Alir Program
3.5. Analisis Basis Data
menggunakan kuesioner dengan
Pada program ini, terdapat
tujuan untuk mengetahui apakah
program disukai dan dibutuhkan
sebuah
oleh user. Dengan menggunakan
“data_perintah”.
kuesioner,
analisis
dan tanpa
bernama
dapat
dilakukan dengan waktu yang
singkat
basisdata
membatasi
Atribut
Listperintah.item1
ruang lingkup analisis karena
(Command)
tanpa batasan umur.
Listperintah.item2
Tipe
Integer
Integer
(Program)
3.4. Perancangan Sistem
Diagram
pemanggilan
Listperintah.item3 (Path)
alir
aplikasi
program
perkantoran
Integer
Tabel 1: Basisdata Data_Perintah
3.6. Use Case Program
dengan perintah suara dapat dilihat
pada gambar di bawah ini:
Berikut ini gambar diagram
untu penggunaan sistem.
Hal-7
Imports System.Speech.Recognition
Pem anggilan
Imports_
Aplikasi
System.Speech.Recognition.SrgsGram
Tambah
mar
Perintah
M enu
Hapus
Ut ama
InitializeComponent()
Daftar
recognizer = New_
Ubah daftar
SpeechRecognizer()
perint ah
Instruksi untuk menjalankan aplikasi
Set ting
Speech Recognizer
Speech
Gambar 4: Use Case Diagram Sistem
AddHandler_
recognizer.SpeechDetected,_
AddressOf_
BAB IV Hasil Dan Pembahasan
recognizer_SpeechDetected
4.1. Integrasi Visual Basic dengan
AddHandler_
SAPI
recognizer.SpeechRecognitionRejec_
ted, AddressOf_
Tareb Permadi (2008), Antar muka
recognizer_SpeechRecognitionRejec_
utama
ted
yang
digunakan
ISpRecoContext.
Antar
ialah
muka
ini
merupakan sebuah ISpEventSource,
AddHandler_
recognizer.SpeechRecognized,
_AddressOf_
yang berarti ISpRecoContext tersebut
recognizer_SpeechRecognized
adalah antar muka aplikasi untuk
Instruksi penanganan saat
menerima notifikasi dari sebuah event
pengenalan
pembicaraan.
menggunakan
engine
pembicaraan
Dengan
untuk
pengenalan
(ISpRecognizer).
menggunakan
recognizer
Aplikasi
yang
berbagi
shared
memungkinkan
resource
dengan
suara dideteksi, ditolak atau dikenali
dan dikenali sebagai perintah baru.
Dim grammar As New
GrammarBuilder()
grammar.Append(New_
Choices("application", "control",
" "))
aplikasi pengenalan pembicaraan yang
lain.
grammar.Append(New_
Choices("open", "close",_
"panel"))
Hal-8
4.2. Hasil Perancangan Program
3. Setting
1. Menu Utama
M ulai
M ulai
Set ting Speech Recognit ion
Ucapkan Perint ah
Tidak
Tidak
Berhasil?
Berhasil
Ya
Ya
Selesai
Tampilkan
Gambar 7: Flowcart Setting
Selesai
Gambar 5: Flowcart Pemanggilan
Aplikasi
2. Tambah Perintah Baru
M ulai
M asukkan perint ah suara (melalui suara at au keyboard )
dan nama program aplikasi
Cari dir ektori aplikasi yang akan dipanggil dengan klik
t ombol cari melalui open file dialog
Tidak
Klik t ombol Simpan
Berhasil
Ya
Basisdat a
Selesai
Gambar 6. Flowchart Tambah Perintah baru
Hal-9
Gambar 8: Tampilan Menu Utama
Gambar 9: Tampilan Menu Tambah Perintah Suara
Gambar 10: Setting Speech Recognition
Hal-10
BAB V PENUTUP
2. Program
5.1. Kesimpulan
pemanggilan
perkantoran
Berdasarkan proses pengujian
dengan
aplikasi
SAPI
memiliki interface yang menarik.
yang dilakukan di Wisma Ratih 3,
3. Kurangnya
kemampuan
Pabelan, Kertasura diketahui bahwa
pronounce
membuat
program
pengoperasian sistem mengalami
pemanggilan
aplikasi
perkantoran
dengan
menggunakan
Microsoft
speech
application
beberapa hambatan.
5.2. Saran
programming interface merupakan
Saran yang dapat peneliti sampaikan
program
adalah :
digunakan
aplikasi
untuk
yang
dapat
membantu
1. Penelitian
selanjutnya
dapat
mempepermudah kerja pengoperasian
dikembangkan metode baru yang
komputer dengan beberapa catatan,
dapat
diantaranya:
peralatan elektronik.
1. Shortcut desktop mungkin biasa
digunakan untuk mempermudah
pemanggilan aplikasi namun jika
terlalu
banyak
icon
yang
memenuhi layar kemudahan itu
tidak lagi bisa dirasakan, perintah
dengan suara bisa jadi solusi
dikorelasikan
dengan
2. Masalah yang dihadapi dalam
pembuatan program ini, seperti
masalah
pronounce
dimanfaatkan
bisa
untuk
pengembangan program lanjutan
semisal program pelatihan oral
English, dan sebagainya.
lainnya.
Hal-11
DAFTAR PUSTAKA
Budiyono. 2003. M etodologi Penelit ian Pendidikan. Surakarta : UNS Press.
Junaedih. 2007. Implementasi Speech Recognition Menggunakan sapi 5 dan
visual basic 6.0 Pada Pembuatan Aplikasi Kalkulator Audio Visual.
Jakarta: UIN Syarif Hidayatullah.
Kalinli dan Narayan. 2009. Continuous Speech Recognition Using Attention Shift
Decoding with Soft Decision. University of Southern California, Los
Angeles, CA, USA.
Microsoft.
Speech
APIs
and
SDK
(Microsoft
http://microsoft.com/speech/speech2007/default.mspx
Speech).
[1
Oktober
Windows
XP.
2012]
Microsoft.
Speech
Recognition
with
http://microsoft.com/windowsxp/using/setup/expert/moskowitz_02sep
tember23.mspx [1 Oktober 2012]
Pardosi, Mico. 2005. Microsoft Visual Basic 6.0. Surabaya: Dua Selaras.
Permadi, Tareb. 2008. Pemanfaatan Microsoft Speech Application Programming
Interface Pada Pembuatan Aplikasi Perintah Suara. Jakarta: UPN.
Hal-12
PERKANTORAN DENGAN MICROSOFT SPEECH
APPLICATION PROGRAMMING INTERFACE YANG
TERINTEGRASI MELALUI VISUAL BASIC .NET
Makalah
Diajukan Oleh:
Shofwanin
Aris Rakhmadi
Fatah Yasin Irsyadi
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS KOMUNIKASI DAN INFORMATIKA
UNIVERSITAS MUHAMMADIYAH SURAKARTA
Juni, 2014
TIALAIvIAN PENGESAHAN
Fublikasi Jurnal lhniah dengan Judul:
PROGRAM PEMANGGILAN APLIKASI
PERKAI\ITORAN DENGAI\I MICROSOF'T SPEECH
APPLICATION PROGRAMMING INTERFACE YAITG
TERINTEGRASI MELALTT VISUAL BASIC .I[ET
Yang disusun dan dipersiapkan oleh:
Shoftmnin
L200080183
Telah disetujui pada:
Haxi
Tanggal
:.................
:.................
Pembimbing 2
4ry*
S.T., M.F.ng.
Fatah Yasin lrsyadr, S.T., M.T.
NIK: 738
Skripsi ini telah dit€rima sebagai salah satu persyaralan
untuk memperoleh gelar sarjana
Tanggal
Mengetahui,
KetuaProgram Studi
Teknik Informatika
Dr. Heru Supriyono. M.Sc.
NIK:970
PROGRAM PEMANGGILAN APLIKASI PERKANTORAN
DENGAN MICROSOFT SPEECH APPLICATION
PROGRAMMING INTERFACE YANG TERINTEGRASI
MELALUI VISUAL BASIC .NET
Teknik Informatika, Fakultas Komunikasi dan Informatika, UMS.
Shofwanin (e-mail: anin.farikin@gmail.com)
Abstrak : Teknologi pengenalan suara adalah teknologi yang memanfaatkan
masukan berupa audio (suara) dengan menggunakan piranti keras berupa
microphone untuk menginterpretasikan suara manusia sebagai metode interaksi
alternatif dengan komputer. Menggunakan aplikasi yang telah dikembangkan oleh
Microsoft, yaitu Speech Application Programming Interface. Penelitian ini
bertujuan untuk mempermudah pengguna dalam mengakses program aplikasi
perkantoran. Masukan suara yang dikenali dalam bentuk text disimpan dalam
basis data dan dikenali sebagai perintah untuk melakukan aktifitas tertentu.
Metode yang digunakan untuk mengenali suara atau kata adalah dengan mode
diktasi, yaitu mengenal data analog berupa suara ke bentuk data teks yang
kemudian disimpan dalam basis data. Keakuratan mode ini tergantung pada pola
dan aksen suara serta frekuensi yang dikenali pada lingkungan tertentu. Eksekusi
perintah dilakukan dengan mode commmand and control, yaitu mengenali
pengucapan kata yang telah tersimpan dalam basis data.
Kata Kunci : frekuensi, pengenalan suara, Microsoft, SAPI, Speech Application
Programming Interface, diktasi, command and control.
Abstact: Voice recognition technology is a technology that utilizes the input of the
audio (sound) using hardware such as microphones to interpret the human voice
as an alternative method of interaction with the computer. Used application has
been developed by microsoft, Speech Application Programming Interface. This
Research aims to ease users to access the applications office program. The voice
input in the text would saved to database and recognized as some activities
command. The method that used to recognize voice or word is a dictation, which
recognized analogue data. The accuracy of this mode depends on the pattern and
accent sounds and frequencies that are recognized in a specific environment.
Command execution is done with commmand and control mode, which recognize
the pronunciation of the word that has been stored in a database.
Key Words: speech, voice, sound, recognition, Microsoft, SAPI, Speech
Application Programming Interface, dictation, command and control.
Hal-1
BAB I PENDAHULUAN
Sebagian
dihabiskan
BAB II TINJAUAN PUSTAKA
hidup
dengan
manusia
berkomunikasi
dengan manusia lainnya. Berbicara
adalah
hal
yang
lebih
alami
dibandingkan dengan membaca atau
menulis, setiap orang menguasai cara
bicara melebihi cara membaca atau
menulis. Berbicara juga lebih efisien
dibandingkan mengetik atau menulis.
Pengelolaan
perkantoran
dengan perintah suara akan lebih
efektif
digunakan
dibandingkan
melakukan secara langsung. Beberapa
kegiatan seperti memainkan musik,
menonton
video,
2.1. Suara
dan
membuka
Agus Suryanto (2011), Suara
atau
bunyi
biasanya
merambat
melalui udara dan akan memantul
apabila ada dinding, suara atau bunyi
tidak dapat merambat melalui ruang
hampa. Suara dihasilkan oleh getaran
suatu
benda.
Selama
bergetar,
perbedaan tekanan terjadi di udara
sekitarnya. Pola asilasi yang terjadi
disebut
gelombang.
Gelombang
memiliki
pola
sama
yang
dan
berulang pada interval tertentu, yang
disebut periode.
2.2. Analog ke Digital
aplikasi pun dapat dilakukan hanya
Solihin Arianto (2008). File
dengan menggunakan suara. Kegiatan
tersebut akan lebih sulit dilakukan
berupa
jika
banyak
diproses, disimpan dan kemudian
jendela kerja (multitasking), namun
diubah ke bentuk biner mennjadi data
dengan perintah suara semua kegiatan
digital
tersebut akan lebih mudah.
kembali ke data analog berupa suara.
pengguna
membuka
Penelitian ini akan difokuskan
pada
pengenalan
suara
dengan
data
yang
analog
akan
disandikan,
dikonversikan
Data analog tersebut akan diencoded-kan dalam berbagai bentuk
memanfaatkan fitur Microsoft Speech
media, seperti:
Application Programming Interface
a. Logika 1 atau 0
yang dikembangkan oleh Microsoft.
b. On atau Off
c. Voltage atau No Voltage
Hal-2
Capt ure Dat a
analog
microphone
2.4. Mode Sistem Pengenalan Suara
ADC
Analog Digit al
Convert er
Tareb Permadi (2008), Terdapat dua
mode pengenalan suara, yaitu:
Conve
rt t o
Binary
DAC
Digit al Analog
Convert er
a. Mode Diktasi, pada mode ini
pengguna mengucapkan kata atau
kalimat yang selanjutnya akan
Out put Dat a
analog
Speaker
Gambar 1 : Proses Analog ke Digital
diubah ke data teks. Kemungkinan
jumlah kata yang dikenali dibatasi
oleh jumlah kata yang telah
terdapat
2.3. Speech Recognition
pada
Pengenalan
Ardianto
Nugroho
database.
mode
diktasi
(2010),
merupakan speaker dependent.
Speech Recognition adalah proses
Kakuratan mode ini tergantung
konversi sebuah sinyal akustik untuk
pada
merangkai kata – kata. Kata – kata
pembicara
yang dikenali bisa jadi sebagai hasil
berlangsung.
akhir, untuk sebuah aplikasi seperti
pola
suara
saat
dan
aksen
penelitian
b. Mode Command and Control,
command & control, pemasukan data,
pada
dan
Speech
mengucapkan kata atau kalimat
recognizer yang pertama keluar di
yang sudah terdefinisi sebelumnya
tahun 1952. Salah satu perangkat
pada database yang kemudian
speech
digunakan
persiapan
dokumen.
recognizer
adalah
IBM
mode
ini
untuk
pengguna
menjalankan
Shoebox, yang dikeluarkan pada 1963
perintah
melalui New York World’s Fair.
merupakan speaker independent
Microphone merupakan salah satu
karena jumlah kata yang dikenali
teknologi
terbatas
yang
digunakan
untuk
menginterpretasikan suara manusia
untuk
alternatif
transkripsi
untuk
atau
tertentu.
pada
Mode
database
ini
yang
sudah ada.
metode
berkomunikasi
dengan komputer.
Hal-3
2.5. Pemisahan Kata
cukup akurat dalam mengenali
Junaedih (2007), Pemisahan
kata adalah pemisahan suara yang
diucapkan pengguna dalam beberapa
bagian. Bagian tersebut dapat berupa
kata atau kalimat. Terdapat tiga
metode
yang
digunakan
dalam
pemisahan kata tersebut, yaitu:
a. Discrete Speech, pengguna harus
mengucapkan
kalimat
secara
ucapan
pengguna.
Kekurangan
dari metode ini adalah besarnya
resource yang diperlukan dalam
memproses
data.
Metode
ini
mengidentifikasi setiap awal dan
akhir kata tanpa jeda kemudian
mencocokkkan tiap kata yang
diucapkan dengan database.
2.6. Sifat Pengenalan Pembicaraan
terpenggal dengan jeda di antara
Tareb Permadi (2008), Sistem
kata. Jeda tersebut digunakan
pengenalan pembicaraan dilihat dari
untuk identifikasi awal dan akhir
ketergantungannya
kata. Kelebihan metode ini adalah
pengguna memiliki beberapa sifat,
sedikitnya
(memori,
diantaranya:
waktu proses) yang digunakan
a. Speaker
resource
sistem untuk mendeteksi suara.
b. Word
Spotting, dalam sebuah
kalimat
pengguna,
yang
sistem
diucapkan
hanya
terhadap
Dependent,
sistem
memmbutuhkan pelatihan berupa
sampel untuk pengguna yang akan
menggunakan
sistem
Sistem
akan
tidak
tersebut.
mengenali
mendeteksi kata yang ada di
pengguna yang belum pernah
dalam database dan mengabaikan
menggunakan atau memasukkan
yang tidak dikenali. Kekurangan
sampel ke dalam sistem.
dari metode ini adalah apabila ada
b. Speaker Independent, pengguna
kalimat yang memiliki kata yang
tidak perlu melakukan pelatihan
sama maka akan diidentifikasi dan
dalam
menghasilkan output yang sama.
tersebut,
menggunakan
karena
sistem
sistem dapat
c. Continuous Speech, sistem akan
mengenali semmua suara tidak
mengenali dan memproses setiap
peduli siapa pengguna dan dialek
kata yang diucapkan. Metode ini
yang digunakan.
Hal-4
c. Speaker
adaptive,
perpaduan
yang diucapkan akan berpengaruh
speaker dependent dan speaker
pada
independent
pemrosesan.
dimana
pengguna
kecepatan
dan
keakuratan
tidak perlu melakukan pelatihan
2.9. Microsoft Speech Application
dan keakuratan tergantung pada
Programming Interface
intensitas
pengguna
Speech
dalam
Application
Programming
memanfaatkan sistem.
Interface
merupakan
2.7. Pencocokan Kata
Application
Programming
Tareb
Permadi
(2008),
Pencocokan kata adalah proses untuk
melakukan pencocokan ucapan yang
berhasil diidentifikasi oleh database
yang dimiliki sistem. Terdapat dua
kata yang digunakan dalam proses
pencocokan kata, yaitu:
a. Whole-word
Interface
(API)
dikembangkan
Microsoft
speech
untuk digunakan pada
recognition
synthesis
oleh
dengan
berbasis
dan
speech
sistem
operasi
Windows.
Dengan
API
tersebut
menggunakan
dimungkinkan bagi pihak ketiga atau
Matching,
sistem
akan mencari dalam database kata
yang persis dengan kata yang
diucapkan pengguna.
b. Phoneme
yang
(SAPI)
individu
untuk
mengembangkan
perangkat Speech Recognition yang
dapat
bekerjasama
dengan
SAPI
tersebut.
Matching,
sistem
2.10. Microsoft Visual Basic .NET
memiliki kamus fonem, yaitu kata
terkecil
dari
suara
Microsoft .NET adalah suatu
yang
platform
membentuk suatu kata.
untuk
menjalankan
2.8. Perbendaharaan Kata
membangun
generasi
aplikasi-aplikasi
Tareb
Permadi
(2008),
Perbendaharaan kata adalah bagian
akhir dari sistem pengenalan suara.
Terdapat
dua
diperhatikan,
hal
yaitu
yang
perlu
ukuran
dan
keakuratan. Semakin sedikit
kata
dan
penerus
terdistribusi.
Microsoft.NET
merupakan
framework (kerangka) pengembangan
yang
menyediakan
antarmuka
pemrograman baru untuk layanan
Windows
dan
API
(Application
Programming Interface).
Hal-5
BAB III METODE PENELITIAN
Penelitian dilakukan di Wisma
Ratih 3 dengan 10 responden.
3.2. Metode Pengumpulan Data
Metode yang digunakan untuk
mengumpulkan data dalam penelitian
ini ada dua cara, yaitu metode angket
3.1. Alur Penelitian
dan studi pustaka.
Metode
yang
digunakan
1. Metode Angket
penulis dalam perancangan sistem
Metode
adalah
pengumpulan
metode
daur
hidup
angket
adalah
data
cara
melalui
pengembangan sistem atau system
pengajuan pertanyaan-pertanyaan
development
(SDLC).
tertulis kepada subyek penelitian,
SDLC merupakan pendekatan yang
responden, atau sumber data dan
sangat
jawabannya diberikan pula secara
secara
untuk
life
cycle
terstruktur,
bertingkat
digambarkan
dan
menggambarkan
digunakan
bahwa
tertulis (Budiyono, 2003: 47).
2. Studi Pustaka
keluaran dari suatu tahap merupakan
Studi Pustaka adalah metode yang
masukan dari tahap berikutnya serta
digunakan untuk memperoleh data
dimungkinkan untuk kembali pada
melalui
langkah sebelumnya (proses iterasi)
tutorial tentang program Speech
saat suatu keputusan tertentu perlu
Application
dipertimbangkan
Interface, serta makalah sebagai
kembali
(Murniningsih, 2012).
buku-buku
teori
dan
Programming
referensi dalam penelitian ini
yang
disertakan
pada
daftar
pustaka.
3.3. Analisis Sistem
1. Studi Kelayakan
Studi kelayakan sistem digunakan
untuk menentukan kemungkinan
apakah pengembangan program
perintah suara layak diteruskan
Gambar 2 : Diagram Alir SDLC
atau dihentikan. Ukurun studi
Hal-6
kelayakan menyangkut beberapa
faktor antara lain faktor teknologi,
ekonomi, operasional, dan hukum.
2. Analisis Kebutuhan
Analisis
kebutuhan
dilakukan
untuk menghasilkan spesifikasi
kebutuhan yaitu spesifikasi yang
rinci tentang hal-hal yang akan
dilakukan
program
diimplementasikan.
ketika
Pada
penelitian ini, dilakukan analisis
Gambar 3: Diagram Alir Program
3.5. Analisis Basis Data
menggunakan kuesioner dengan
Pada program ini, terdapat
tujuan untuk mengetahui apakah
program disukai dan dibutuhkan
sebuah
oleh user. Dengan menggunakan
“data_perintah”.
kuesioner,
analisis
dan tanpa
bernama
dapat
dilakukan dengan waktu yang
singkat
basisdata
membatasi
Atribut
Listperintah.item1
ruang lingkup analisis karena
(Command)
tanpa batasan umur.
Listperintah.item2
Tipe
Integer
Integer
(Program)
3.4. Perancangan Sistem
Diagram
pemanggilan
Listperintah.item3 (Path)
alir
aplikasi
program
perkantoran
Integer
Tabel 1: Basisdata Data_Perintah
3.6. Use Case Program
dengan perintah suara dapat dilihat
pada gambar di bawah ini:
Berikut ini gambar diagram
untu penggunaan sistem.
Hal-7
Imports System.Speech.Recognition
Pem anggilan
Imports_
Aplikasi
System.Speech.Recognition.SrgsGram
Tambah
mar
Perintah
M enu
Hapus
Ut ama
InitializeComponent()
Daftar
recognizer = New_
Ubah daftar
SpeechRecognizer()
perint ah
Instruksi untuk menjalankan aplikasi
Set ting
Speech Recognizer
Speech
Gambar 4: Use Case Diagram Sistem
AddHandler_
recognizer.SpeechDetected,_
AddressOf_
BAB IV Hasil Dan Pembahasan
recognizer_SpeechDetected
4.1. Integrasi Visual Basic dengan
AddHandler_
SAPI
recognizer.SpeechRecognitionRejec_
ted, AddressOf_
Tareb Permadi (2008), Antar muka
recognizer_SpeechRecognitionRejec_
utama
ted
yang
digunakan
ISpRecoContext.
Antar
ialah
muka
ini
merupakan sebuah ISpEventSource,
AddHandler_
recognizer.SpeechRecognized,
_AddressOf_
yang berarti ISpRecoContext tersebut
recognizer_SpeechRecognized
adalah antar muka aplikasi untuk
Instruksi penanganan saat
menerima notifikasi dari sebuah event
pengenalan
pembicaraan.
menggunakan
engine
pembicaraan
Dengan
untuk
pengenalan
(ISpRecognizer).
menggunakan
recognizer
Aplikasi
yang
berbagi
shared
memungkinkan
resource
dengan
suara dideteksi, ditolak atau dikenali
dan dikenali sebagai perintah baru.
Dim grammar As New
GrammarBuilder()
grammar.Append(New_
Choices("application", "control",
" "))
aplikasi pengenalan pembicaraan yang
lain.
grammar.Append(New_
Choices("open", "close",_
"panel"))
Hal-8
4.2. Hasil Perancangan Program
3. Setting
1. Menu Utama
M ulai
M ulai
Set ting Speech Recognit ion
Ucapkan Perint ah
Tidak
Tidak
Berhasil?
Berhasil
Ya
Ya
Selesai
Tampilkan
Gambar 7: Flowcart Setting
Selesai
Gambar 5: Flowcart Pemanggilan
Aplikasi
2. Tambah Perintah Baru
M ulai
M asukkan perint ah suara (melalui suara at au keyboard )
dan nama program aplikasi
Cari dir ektori aplikasi yang akan dipanggil dengan klik
t ombol cari melalui open file dialog
Tidak
Klik t ombol Simpan
Berhasil
Ya
Basisdat a
Selesai
Gambar 6. Flowchart Tambah Perintah baru
Hal-9
Gambar 8: Tampilan Menu Utama
Gambar 9: Tampilan Menu Tambah Perintah Suara
Gambar 10: Setting Speech Recognition
Hal-10
BAB V PENUTUP
2. Program
5.1. Kesimpulan
pemanggilan
perkantoran
Berdasarkan proses pengujian
dengan
aplikasi
SAPI
memiliki interface yang menarik.
yang dilakukan di Wisma Ratih 3,
3. Kurangnya
kemampuan
Pabelan, Kertasura diketahui bahwa
pronounce
membuat
program
pengoperasian sistem mengalami
pemanggilan
aplikasi
perkantoran
dengan
menggunakan
Microsoft
speech
application
beberapa hambatan.
5.2. Saran
programming interface merupakan
Saran yang dapat peneliti sampaikan
program
adalah :
digunakan
aplikasi
untuk
yang
dapat
membantu
1. Penelitian
selanjutnya
dapat
mempepermudah kerja pengoperasian
dikembangkan metode baru yang
komputer dengan beberapa catatan,
dapat
diantaranya:
peralatan elektronik.
1. Shortcut desktop mungkin biasa
digunakan untuk mempermudah
pemanggilan aplikasi namun jika
terlalu
banyak
icon
yang
memenuhi layar kemudahan itu
tidak lagi bisa dirasakan, perintah
dengan suara bisa jadi solusi
dikorelasikan
dengan
2. Masalah yang dihadapi dalam
pembuatan program ini, seperti
masalah
pronounce
dimanfaatkan
bisa
untuk
pengembangan program lanjutan
semisal program pelatihan oral
English, dan sebagainya.
lainnya.
Hal-11
DAFTAR PUSTAKA
Budiyono. 2003. M etodologi Penelit ian Pendidikan. Surakarta : UNS Press.
Junaedih. 2007. Implementasi Speech Recognition Menggunakan sapi 5 dan
visual basic 6.0 Pada Pembuatan Aplikasi Kalkulator Audio Visual.
Jakarta: UIN Syarif Hidayatullah.
Kalinli dan Narayan. 2009. Continuous Speech Recognition Using Attention Shift
Decoding with Soft Decision. University of Southern California, Los
Angeles, CA, USA.
Microsoft.
Speech
APIs
and
SDK
(Microsoft
http://microsoft.com/speech/speech2007/default.mspx
Speech).
[1
Oktober
Windows
XP.
2012]
Microsoft.
Speech
Recognition
with
http://microsoft.com/windowsxp/using/setup/expert/moskowitz_02sep
tember23.mspx [1 Oktober 2012]
Pardosi, Mico. 2005. Microsoft Visual Basic 6.0. Surabaya: Dua Selaras.
Permadi, Tareb. 2008. Pemanfaatan Microsoft Speech Application Programming
Interface Pada Pembuatan Aplikasi Perintah Suara. Jakarta: UPN.
Hal-12