PROGRAM PEMANGGILAN APLIKASI PERKANTORAN DENGAN MICROSOFT SPEECH Program Pemanggilan Aplikasi Perkantoran Dengan Microsoft Speech Application Programming Interface Yang Terintegrasi Melalui Visual Basic .Net.

PROGRAM PEMANGGILAN APLIKASI
PERKANTORAN DENGAN MICROSOFT SPEECH
APPLICATION PROGRAMMING INTERFACE YANG
TERINTEGRASI MELALUI VISUAL BASIC .NET
Makalah

Diajukan Oleh:
Shofwanin
Aris Rakhmadi
Fatah Yasin Irsyadi

PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS KOMUNIKASI DAN INFORMATIKA
UNIVERSITAS MUHAMMADIYAH SURAKARTA
Juni, 2014

TIALAIvIAN PENGESAHAN
Fublikasi Jurnal lhniah dengan Judul:

PROGRAM PEMANGGILAN APLIKASI
PERKAI\ITORAN DENGAI\I MICROSOF'T SPEECH


APPLICATION PROGRAMMING INTERFACE YAITG
TERINTEGRASI MELALTT VISUAL BASIC .I[ET
Yang disusun dan dipersiapkan oleh:

Shoftmnin
L200080183
Telah disetujui pada:

Haxi
Tanggal

:.................
:.................

Pembimbing 2

4ry*

S.T., M.F.ng.


Fatah Yasin lrsyadr, S.T., M.T.

NIK: 738
Skripsi ini telah dit€rima sebagai salah satu persyaralan
untuk memperoleh gelar sarjana
Tanggal
Mengetahui,

KetuaProgram Studi
Teknik Informatika

Dr. Heru Supriyono. M.Sc.

NIK:970

PROGRAM PEMANGGILAN APLIKASI PERKANTORAN
DENGAN MICROSOFT SPEECH APPLICATION
PROGRAMMING INTERFACE YANG TERINTEGRASI
MELALUI VISUAL BASIC .NET

Teknik Informatika, Fakultas Komunikasi dan Informatika, UMS.
Shofwanin (e-mail: anin.farikin@gmail.com)
Abstrak : Teknologi pengenalan suara adalah teknologi yang memanfaatkan
masukan berupa audio (suara) dengan menggunakan piranti keras berupa
microphone untuk menginterpretasikan suara manusia sebagai metode interaksi
alternatif dengan komputer. Menggunakan aplikasi yang telah dikembangkan oleh
Microsoft, yaitu Speech Application Programming Interface. Penelitian ini
bertujuan untuk mempermudah pengguna dalam mengakses program aplikasi
perkantoran. Masukan suara yang dikenali dalam bentuk text disimpan dalam
basis data dan dikenali sebagai perintah untuk melakukan aktifitas tertentu.
Metode yang digunakan untuk mengenali suara atau kata adalah dengan mode
diktasi, yaitu mengenal data analog berupa suara ke bentuk data teks yang
kemudian disimpan dalam basis data. Keakuratan mode ini tergantung pada pola
dan aksen suara serta frekuensi yang dikenali pada lingkungan tertentu. Eksekusi
perintah dilakukan dengan mode commmand and control, yaitu mengenali
pengucapan kata yang telah tersimpan dalam basis data.
Kata Kunci : frekuensi, pengenalan suara, Microsoft, SAPI, Speech Application
Programming Interface, diktasi, command and control.
Abstact: Voice recognition technology is a technology that utilizes the input of the
audio (sound) using hardware such as microphones to interpret the human voice

as an alternative method of interaction with the computer. Used application has
been developed by microsoft, Speech Application Programming Interface. This
Research aims to ease users to access the applications office program. The voice
input in the text would saved to database and recognized as some activities
command. The method that used to recognize voice or word is a dictation, which
recognized analogue data. The accuracy of this mode depends on the pattern and
accent sounds and frequencies that are recognized in a specific environment.
Command execution is done with commmand and control mode, which recognize
the pronunciation of the word that has been stored in a database.
Key Words: speech, voice, sound, recognition, Microsoft, SAPI, Speech
Application Programming Interface, dictation, command and control.

Hal-1

BAB I PENDAHULUAN
Sebagian
dihabiskan

BAB II TINJAUAN PUSTAKA


hidup

dengan

manusia

berkomunikasi

dengan manusia lainnya. Berbicara
adalah

hal

yang

lebih

alami

dibandingkan dengan membaca atau

menulis, setiap orang menguasai cara
bicara melebihi cara membaca atau
menulis. Berbicara juga lebih efisien
dibandingkan mengetik atau menulis.
Pengelolaan

perkantoran

dengan perintah suara akan lebih
efektif

digunakan

dibandingkan

melakukan secara langsung. Beberapa
kegiatan seperti memainkan musik,
menonton

video,


2.1. Suara

dan

membuka

Agus Suryanto (2011), Suara
atau

bunyi

biasanya

merambat

melalui udara dan akan memantul
apabila ada dinding, suara atau bunyi
tidak dapat merambat melalui ruang
hampa. Suara dihasilkan oleh getaran

suatu

benda.

Selama

bergetar,

perbedaan tekanan terjadi di udara
sekitarnya. Pola asilasi yang terjadi
disebut

gelombang.

Gelombang

memiliki

pola


sama

yang

dan

berulang pada interval tertentu, yang
disebut periode.
2.2. Analog ke Digital

aplikasi pun dapat dilakukan hanya
Solihin Arianto (2008). File

dengan menggunakan suara. Kegiatan
tersebut akan lebih sulit dilakukan

berupa

jika


banyak

diproses, disimpan dan kemudian

jendela kerja (multitasking), namun

diubah ke bentuk biner mennjadi data

dengan perintah suara semua kegiatan

digital

tersebut akan lebih mudah.

kembali ke data analog berupa suara.

pengguna

membuka


Penelitian ini akan difokuskan
pada

pengenalan

suara

dengan

data

yang

analog

akan

disandikan,

dikonversikan

Data analog tersebut akan diencoded-kan dalam berbagai bentuk

memanfaatkan fitur Microsoft Speech

media, seperti:

Application Programming Interface

a. Logika 1 atau 0

yang dikembangkan oleh Microsoft.

b. On atau Off
c. Voltage atau No Voltage

Hal-2

Capt ure Dat a
analog
microphone

2.4. Mode Sistem Pengenalan Suara

ADC
Analog Digit al
Convert er

Tareb Permadi (2008), Terdapat dua
mode pengenalan suara, yaitu:

Conve
rt t o
Binary

DAC
Digit al Analog
Convert er

a. Mode Diktasi, pada mode ini
pengguna mengucapkan kata atau
kalimat yang selanjutnya akan

Out put Dat a
analog
Speaker

Gambar 1 : Proses Analog ke Digital

diubah ke data teks. Kemungkinan
jumlah kata yang dikenali dibatasi
oleh jumlah kata yang telah
terdapat

2.3. Speech Recognition

pada

Pengenalan
Ardianto

Nugroho

database.

mode

diktasi

(2010),

merupakan speaker dependent.

Speech Recognition adalah proses

Kakuratan mode ini tergantung

konversi sebuah sinyal akustik untuk

pada

merangkai kata – kata. Kata – kata

pembicara

yang dikenali bisa jadi sebagai hasil

berlangsung.

akhir, untuk sebuah aplikasi seperti

pola

suara
saat

dan

aksen

penelitian

b. Mode Command and Control,

command & control, pemasukan data,

pada

dan

Speech

mengucapkan kata atau kalimat

recognizer yang pertama keluar di

yang sudah terdefinisi sebelumnya

tahun 1952. Salah satu perangkat

pada database yang kemudian

speech

digunakan

persiapan

dokumen.

recognizer

adalah

IBM

mode

ini

untuk

pengguna

menjalankan

Shoebox, yang dikeluarkan pada 1963

perintah

melalui New York World’s Fair.

merupakan speaker independent

Microphone merupakan salah satu

karena jumlah kata yang dikenali

teknologi

terbatas

yang

digunakan

untuk

menginterpretasikan suara manusia
untuk
alternatif

transkripsi
untuk

atau

tertentu.

pada

Mode

database

ini

yang

sudah ada.

metode

berkomunikasi

dengan komputer.

Hal-3

2.5. Pemisahan Kata

cukup akurat dalam mengenali

Junaedih (2007), Pemisahan
kata adalah pemisahan suara yang
diucapkan pengguna dalam beberapa
bagian. Bagian tersebut dapat berupa
kata atau kalimat. Terdapat tiga
metode

yang

digunakan

dalam

pemisahan kata tersebut, yaitu:
a. Discrete Speech, pengguna harus
mengucapkan

kalimat

secara

ucapan

pengguna.

Kekurangan

dari metode ini adalah besarnya
resource yang diperlukan dalam
memproses

data.

Metode

ini

mengidentifikasi setiap awal dan
akhir kata tanpa jeda kemudian
mencocokkkan tiap kata yang
diucapkan dengan database.
2.6. Sifat Pengenalan Pembicaraan

terpenggal dengan jeda di antara

Tareb Permadi (2008), Sistem

kata. Jeda tersebut digunakan

pengenalan pembicaraan dilihat dari

untuk identifikasi awal dan akhir

ketergantungannya

kata. Kelebihan metode ini adalah

pengguna memiliki beberapa sifat,

sedikitnya

(memori,

diantaranya:

waktu proses) yang digunakan

a. Speaker

resource

sistem untuk mendeteksi suara.
b. Word

Spotting, dalam sebuah

kalimat
pengguna,

yang
sistem

diucapkan
hanya

terhadap

Dependent,

sistem

memmbutuhkan pelatihan berupa
sampel untuk pengguna yang akan
menggunakan

sistem

Sistem

akan

tidak

tersebut.
mengenali

mendeteksi kata yang ada di

pengguna yang belum pernah

dalam database dan mengabaikan

menggunakan atau memasukkan

yang tidak dikenali. Kekurangan

sampel ke dalam sistem.

dari metode ini adalah apabila ada

b. Speaker Independent, pengguna

kalimat yang memiliki kata yang

tidak perlu melakukan pelatihan

sama maka akan diidentifikasi dan

dalam

menghasilkan output yang sama.

tersebut,

menggunakan
karena

sistem

sistem dapat

c. Continuous Speech, sistem akan

mengenali semmua suara tidak

mengenali dan memproses setiap

peduli siapa pengguna dan dialek

kata yang diucapkan. Metode ini

yang digunakan.

Hal-4

c. Speaker

adaptive,

perpaduan

yang diucapkan akan berpengaruh

speaker dependent dan speaker

pada

independent

pemrosesan.

dimana

pengguna

kecepatan

dan

keakuratan

tidak perlu melakukan pelatihan

2.9. Microsoft Speech Application

dan keakuratan tergantung pada

Programming Interface

intensitas

pengguna

Speech

dalam

Application

Programming

memanfaatkan sistem.

Interface

merupakan

2.7. Pencocokan Kata

Application

Programming
Tareb

Permadi

(2008),

Pencocokan kata adalah proses untuk
melakukan pencocokan ucapan yang
berhasil diidentifikasi oleh database
yang dimiliki sistem. Terdapat dua
kata yang digunakan dalam proses
pencocokan kata, yaitu:
a. Whole-word

Interface

(API)

dikembangkan

Microsoft
speech

untuk digunakan pada
recognition

synthesis

oleh

dengan

berbasis

dan

speech

sistem

operasi

Windows.

Dengan

API

tersebut

menggunakan

dimungkinkan bagi pihak ketiga atau

Matching,

sistem

akan mencari dalam database kata
yang persis dengan kata yang
diucapkan pengguna.
b. Phoneme

yang

(SAPI)

individu

untuk

mengembangkan

perangkat Speech Recognition yang
dapat

bekerjasama

dengan

SAPI

tersebut.

Matching,

sistem

2.10. Microsoft Visual Basic .NET

memiliki kamus fonem, yaitu kata
terkecil

dari

suara

Microsoft .NET adalah suatu

yang

platform

membentuk suatu kata.

untuk

menjalankan

2.8. Perbendaharaan Kata

membangun
generasi

aplikasi-aplikasi
Tareb

Permadi

(2008),

Perbendaharaan kata adalah bagian
akhir dari sistem pengenalan suara.
Terdapat

dua

diperhatikan,

hal
yaitu

yang

perlu

ukuran

dan

keakuratan. Semakin sedikit

kata

dan

penerus

terdistribusi.

Microsoft.NET

merupakan

framework (kerangka) pengembangan
yang

menyediakan

antarmuka

pemrograman baru untuk layanan
Windows

dan

API

(Application

Programming Interface).
Hal-5

BAB III METODE PENELITIAN
Penelitian dilakukan di Wisma
Ratih 3 dengan 10 responden.

3.2. Metode Pengumpulan Data
Metode yang digunakan untuk
mengumpulkan data dalam penelitian
ini ada dua cara, yaitu metode angket

3.1. Alur Penelitian

dan studi pustaka.
Metode

yang

digunakan

1. Metode Angket

penulis dalam perancangan sistem

Metode

adalah

pengumpulan

metode

daur

hidup

angket

adalah
data

cara

melalui

pengembangan sistem atau system

pengajuan pertanyaan-pertanyaan

development

(SDLC).

tertulis kepada subyek penelitian,

SDLC merupakan pendekatan yang

responden, atau sumber data dan

sangat

jawabannya diberikan pula secara

secara
untuk

life

cycle

terstruktur,
bertingkat

digambarkan
dan

menggambarkan

digunakan
bahwa

tertulis (Budiyono, 2003: 47).
2. Studi Pustaka

keluaran dari suatu tahap merupakan

Studi Pustaka adalah metode yang

masukan dari tahap berikutnya serta

digunakan untuk memperoleh data

dimungkinkan untuk kembali pada

melalui

langkah sebelumnya (proses iterasi)

tutorial tentang program Speech

saat suatu keputusan tertentu perlu

Application

dipertimbangkan

Interface, serta makalah sebagai

kembali

(Murniningsih, 2012).

buku-buku

teori

dan

Programming

referensi dalam penelitian ini
yang

disertakan

pada

daftar

pustaka.
3.3. Analisis Sistem
1. Studi Kelayakan
Studi kelayakan sistem digunakan
untuk menentukan kemungkinan
apakah pengembangan program
perintah suara layak diteruskan
Gambar 2 : Diagram Alir SDLC

atau dihentikan. Ukurun studi

Hal-6

kelayakan menyangkut beberapa
faktor antara lain faktor teknologi,
ekonomi, operasional, dan hukum.
2. Analisis Kebutuhan
Analisis

kebutuhan

dilakukan

untuk menghasilkan spesifikasi
kebutuhan yaitu spesifikasi yang
rinci tentang hal-hal yang akan
dilakukan

program

diimplementasikan.

ketika
Pada

penelitian ini, dilakukan analisis

Gambar 3: Diagram Alir Program
3.5. Analisis Basis Data

menggunakan kuesioner dengan
Pada program ini, terdapat

tujuan untuk mengetahui apakah
program disukai dan dibutuhkan

sebuah

oleh user. Dengan menggunakan

“data_perintah”.

kuesioner,

analisis

dan tanpa

bernama

dapat

dilakukan dengan waktu yang
singkat

basisdata

membatasi

Atribut
Listperintah.item1

ruang lingkup analisis karena

(Command)

tanpa batasan umur.

Listperintah.item2

Tipe
Integer

Integer

(Program)
3.4. Perancangan Sistem
Diagram
pemanggilan

Listperintah.item3 (Path)

alir

aplikasi

program
perkantoran

Integer

Tabel 1: Basisdata Data_Perintah
3.6. Use Case Program

dengan perintah suara dapat dilihat
pada gambar di bawah ini:

Berikut ini gambar diagram
untu penggunaan sistem.

Hal-7

Imports System.Speech.Recognition

Pem anggilan
Imports_

Aplikasi

System.Speech.Recognition.SrgsGram

Tambah

mar

Perintah

M enu

Hapus

Ut ama

InitializeComponent()

Daftar

recognizer = New_

Ubah daftar

SpeechRecognizer()

perint ah

Instruksi untuk menjalankan aplikasi
Set ting

Speech Recognizer

Speech

Gambar 4: Use Case Diagram Sistem

AddHandler_
recognizer.SpeechDetected,_
AddressOf_

BAB IV Hasil Dan Pembahasan

recognizer_SpeechDetected

4.1. Integrasi Visual Basic dengan
AddHandler_

SAPI

recognizer.SpeechRecognitionRejec_
ted, AddressOf_

Tareb Permadi (2008), Antar muka

recognizer_SpeechRecognitionRejec_

utama

ted

yang

digunakan

ISpRecoContext.

Antar

ialah

muka

ini

merupakan sebuah ISpEventSource,

AddHandler_
recognizer.SpeechRecognized,
_AddressOf_

yang berarti ISpRecoContext tersebut

recognizer_SpeechRecognized

adalah antar muka aplikasi untuk
Instruksi penanganan saat

menerima notifikasi dari sebuah event
pengenalan

pembicaraan.

menggunakan

engine

pembicaraan
Dengan

untuk

pengenalan

(ISpRecognizer).

menggunakan

recognizer

Aplikasi

yang

berbagi

shared

memungkinkan
resource

dengan

suara dideteksi, ditolak atau dikenali
dan dikenali sebagai perintah baru.
Dim grammar As New
GrammarBuilder()
grammar.Append(New_
Choices("application", "control",
" "))

aplikasi pengenalan pembicaraan yang
lain.

grammar.Append(New_
Choices("open", "close",_
"panel"))

Hal-8

4.2. Hasil Perancangan Program

3. Setting

1. Menu Utama
M ulai
M ulai

Set ting Speech Recognit ion
Ucapkan Perint ah

Tidak
Tidak

Berhasil?
Berhasil
Ya

Ya
Selesai

Tampilkan

Gambar 7: Flowcart Setting

Selesai

Gambar 5: Flowcart Pemanggilan
Aplikasi
2. Tambah Perintah Baru
M ulai

M asukkan perint ah suara (melalui suara at au keyboard )
dan nama program aplikasi

Cari dir ektori aplikasi yang akan dipanggil dengan klik
t ombol cari melalui open file dialog

Tidak

Klik t ombol Simpan

Berhasil
Ya
Basisdat a
Selesai

Gambar 6. Flowchart Tambah Perintah baru

Hal-9

Gambar 8: Tampilan Menu Utama

Gambar 9: Tampilan Menu Tambah Perintah Suara

Gambar 10: Setting Speech Recognition

Hal-10

BAB V PENUTUP

2. Program

5.1. Kesimpulan

pemanggilan

perkantoran

Berdasarkan proses pengujian

dengan

aplikasi
SAPI

memiliki interface yang menarik.

yang dilakukan di Wisma Ratih 3,

3. Kurangnya

kemampuan

Pabelan, Kertasura diketahui bahwa

pronounce

membuat

program

pengoperasian sistem mengalami

pemanggilan

aplikasi

perkantoran

dengan

menggunakan

Microsoft

speech

application

beberapa hambatan.
5.2. Saran

programming interface merupakan

Saran yang dapat peneliti sampaikan

program

adalah :

digunakan

aplikasi
untuk

yang

dapat

membantu

1. Penelitian

selanjutnya

dapat

mempepermudah kerja pengoperasian

dikembangkan metode baru yang

komputer dengan beberapa catatan,

dapat

diantaranya:

peralatan elektronik.

1. Shortcut desktop mungkin biasa
digunakan untuk mempermudah
pemanggilan aplikasi namun jika
terlalu

banyak

icon

yang

memenuhi layar kemudahan itu
tidak lagi bisa dirasakan, perintah
dengan suara bisa jadi solusi

dikorelasikan

dengan

2. Masalah yang dihadapi dalam
pembuatan program ini, seperti
masalah

pronounce

dimanfaatkan

bisa
untuk

pengembangan program lanjutan
semisal program pelatihan oral
English, dan sebagainya.

lainnya.

Hal-11

DAFTAR PUSTAKA

Budiyono. 2003. M etodologi Penelit ian Pendidikan. Surakarta : UNS Press.

Junaedih. 2007. Implementasi Speech Recognition Menggunakan sapi 5 dan
visual basic 6.0 Pada Pembuatan Aplikasi Kalkulator Audio Visual.
Jakarta: UIN Syarif Hidayatullah.
Kalinli dan Narayan. 2009. Continuous Speech Recognition Using Attention Shift
Decoding with Soft Decision. University of Southern California, Los
Angeles, CA, USA.
Microsoft.

Speech

APIs

and

SDK

(Microsoft

http://microsoft.com/speech/speech2007/default.mspx

Speech).
[1

Oktober

Windows

XP.

2012]
Microsoft.

Speech

Recognition

with

http://microsoft.com/windowsxp/using/setup/expert/moskowitz_02sep
tember23.mspx [1 Oktober 2012]
Pardosi, Mico. 2005. Microsoft Visual Basic 6.0. Surabaya: Dua Selaras.
Permadi, Tareb. 2008. Pemanfaatan Microsoft Speech Application Programming
Interface Pada Pembuatan Aplikasi Perintah Suara. Jakarta: UPN.

Hal-12