c. Tombol “reset”
Tombol reset berfungsi untuk mengulangi proses pengenalan ucapan manusia dengan menggunakan variasi ucapan lain atau ucapan yang sama.
Berikut perintah dari program reset tersebut :
Program diatas ini digunakan untuk menghapus data axes yang telah ditampilkan dan teks ucapan yang telah dikenali sebelumnya.
d. Tombol “keluar”
Tombol ini berfungsi sebagai tombol yang digunakan user untuk keluar atau mengakhiri program pengenalan ucapan manusia dan perintahnya sebagai
berikut:
Kesimpulan dari pengujian program pengenalan bawah tombol dan alur program berjalan dengan baik sesuai perancangan
.
4.2. Hasil Pengujian Program Pengenalan Ucapan Terhadap Tingkat
Pengenalan Ucapan Manusia
Dalam pengujian program pengenalan ucapan ini akan dilakukan pengujian dengan parameter pengaturan batas potong, segment averaging, dan nilai k-Nearest
Neighbor untuk mencari nilai dari batas potong, segment averaging dan nilai fungsi k-
Nearest Neighbor yang mempunyai tingkat pengenalan terbaik. Tahap kedua ini bertujuan
axeshandles.axes1; plot0;
axeshandles.axes2; plot0;
sethandles.text1, String
, ;
deletefiguregui08;
agar program pengenalan mampu untuk tidak mengenali ucapan selain dari peneliti dengan cara mencari batas jarak yang optimal. Tahap ketiga atau tahap pengujian secara real-time
adalah dengan menggunakan masukan ucapan dari ucapan peneliti dengan variasi ucapan awal yaitu kanan, kiri, cepat, lambat dan stop. Dalam pengujian real-time ini menggunakan
parameter pengenalan terbaik dari hasil pengenalan secara tidak real-time, walaupun pengujian secara real time penguji bisa juga menggunakan variasi yang terdapat pada GUI.
4.2.1 Metode Segment Averaging
Dalam pengenalan suara ini akan menggunakan metode segment averaging jika tidak menggunakan metode segment averaging tingkat pengenalan yang diperoleh hanya
sebesar 72 persen dengan variasi nilai yang sama yaitu menggunakan variasi batas potong 0,2 dan k-Nearest Neighbor sebesar 3. Dalam pengenalan yang hanya mencapai 72 persen
dan bertambah menjadi 98 persen dilihat pada tabel 4.1 dan tabel 4.2; dapat bertambah dengan mengurangi koefisien elemen ekstrasi ciri. Sub program pembagian data awal agar
dapat menghasilkan pengurangan koefisien ekstrasi ciri adalah dapat dilihat dibawah ini :
Tabel 4.1. Hasil tingkat pengenalan setelah pembagian data awal
No Lebar Segment
Averaging titik Jumlah Elemen
Ekstraksi Tingkat Pengenalan
1 4
512 80
2 8
256 86
3 16
128 94
4 32
64 94
5 64
32 98
6 128
16 94
y=reshapey,64,[];
y2=meany ;
Dalam pengujian yang tidak menggunakan nilai lebar segment averaging. Pengujian ini menggunakan nilai batas potong sebesar 0,1 sampai 0,5. Nilai k-Nearest
Neighbor yang digunakan sebesar 1, 3, 5 dan 7. Dapat dilihat pada tabel 4.2.
Tabel 4.2. Tingkat pengenalan untuk hasil nilai batas potong dan k-Nearest Neighbor tanpa menggunakan lebar segment averaging
Nilai Batas Potong
Nilai k-Nearest Neighbor 1
3 5
7 0,1
62 60
60 72
0,2 68
72 76
72 0,3
70 70
72 70
0,4 70
72 68
70 0,5
70 68
66 62
Gambar 4.5. Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan
20 40
60 80
1 3
5 7
P e
rs e
n ta
se P
e n
gen a
la n
Nilai k-Nearest Neighbor
Pengaruh Perubahan Nilai Batas Potong Terhadap Pengenalan Ucapan
batas potong 0.1 batas potong 0.2
batas potong 0.3 batas potong 0.4
batas potong 0.5
Gambar 4.6. Pengaruh perubahan k-Nearest Neighbor terhadap pengenalan ucapan Dari hasil pengujian tidak real-time yang menggunakan variasi batas potong dan k-
Nearest Neighbor tetapi tanpa menggunakan lebar segment averaging, didapat bawah
presentase pengenalan mengalami penurunan pada seluruh variasi kedua nilai tersebut, masih lebih baik, pengenalan yang menggunakan metode segment averaging.
4.2.2 Pengujian Tidak Real-Time
Pengujian ini dilakukan menggunakan ucapan uji sebagai masukannya yang telah diperoleh. Dalam pengujian ini menggunakan suara terekam sebanyak 100 data
dikarenakan setiap jenis suara ucapan memiliki 20 data yang terbagi menjadi 10 data ucapan uji dan 10 data sebagai database yang sudah terekam sebelumnya. Database
menggunakan ucapan referensi yang sudah tersimpan dan ucapan jenis suara yang telah terekam sebelumnya.
Dalam pengujian tidak real-time ini diperoleh data tingkat pengenalan suara ucapan dari penguji yang berbentuk presentase yang berdasarkan variasi dari nilai batas
potong, segment averaging dan k-Nearest Neighbor . Terdapat enam grafik yang akan ditampilkan yang bertujuan untuk mengetahui tingkat pengenalan yang paling tinggi
terhadap nilai batas potong dan segment averaging dengan menggunakan juga variasi nilai
10 20
30 40
50 60
70 80
0.1 0.2
0.3 0.4
0.5
P e
rs e
n ta
se P
e n
gen a
la n
Nilai Batas Potong
Pengaruh Perubahan Nilai k-Nearest Neighbor Terhadap Pengenalan Ucapan
K=1 K=3
K=5 K=7
k-Nearest Neighbor . Dari enam grafik yang akan ditampilkan nantinya akan digunakan
pada pengujian secara real-time
a Pengujian Nilai Batas Potong dan Segment Averaging Tanpa
Menggunakan Nilai k-Nearest Neighbor K=1
Dalam pengujian ini nilai batas potong ini, nilai yang digunakan adalah sebesar 0,1 sampai 0,5. Nilai segment yang digunakan sebesar 4 sampai 64 titik, pengujian ini tidak
menggunakan nilai k-Nearest Neighbor atau nilai K=1. Dapat dilihat pada tabel 4.3.
Tabel 4.3. Tingkat pengenalan untuk hasil nilai batas potong dan segment averaging tanpa menggunakan nilai k-Nearest Neighbor K=1
Nilai Batas Potong
Lebar Segment Averaging titik 4
8 16
32 64
128 0,1
78 80
90 96
96 90
0,2 76
96 96
96 96
90 0,3
76 76
76 92
84 78
0,4 78
78 84
94 86
82 0,5
80 78
80 84
74 70
Gambar 4.7. Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan
50 100
150
4 8
16 32
64 128
P e
rs e
n ta
se P
e n
gen a
la n
Lebar Segment Averaging titik
Pengaruh Perubahan Lebar Segment Averaging Terhadap Pengenalan Ucapan
batas potong 0.1 batas potong 0.2
batas potong 0.3 batas potong 0.4
batas potong 0.5
Gambar 4.8. Pengaruh perubahan batas potong terhadap pengenalan ucapan Gambar 4.8 dan gambar 4.9 dengan menggunakan tidak menggunakan nilai k-
Nearest Neighbor menunjukan bahwa dalam pengunakan nilai batas potong yang
mempunyai nilai pengenalan terbaik di nilai 0,2 yang mampu mengenali hingga 96 persen. Lebar segment averaging yang mempunyai nilai pengenalan terbaik di nilai 32 dan 64
yang mampu mengenali hingga 96 persen.
b Pengujian Nilai Batas Potong dan Segment averaging Dengan
Menggunakan Nilai k-Nearest Neighbor K=3
Nilai batas potong dan segment averaging variasi sama dengan tanpa nilai k- Nearest Neighbor
, yang diubah hanya nilai k-Nearest Neighbor yang bernilai tiga. Dapat dilihat pada tabel 4.4.
Tabel 4.4. Tingkat pengenalan untuk hasil nilai batas potong dan segment tanpa menggunakan nilai k-Nearest Neighbor K=3
Nilai Batas Potong
Lebar Segment Averaging titik 4
8 16
32 64
128 0,1
80 86
90 92
92 94
0,2 80
86 94
94 98
94 0,3
76 78
84 94
90 82
0,4 78
78 84
96 90
88 0,5
70 72
76 80
80 74
20 40
60 80
100 120
0.1 0.2
0.3 0.4
0.5
P e
rs e
n ta
se P
e n
gen a
la n
Nilai Batas Potong
Perubahan Nilai Batas Potong Terhadap Pengenalan Ucapan
frame 4 frame 8
frame 16 frame 32
frame 64 frame 128
Gambar 4.9. Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan
Gambar 4.10. Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan Gambar 4.9. dan gambar 4.10. dengan menggunakan nilai k-Nearest Neighbor
sebesar tiga menunjukan bahwa dalam pengunakan nilai batas potong yang mempunyai nilai pengenalan terbaik di nilai 0,2 yang mampu mengenali hingga 98 persen. Lebar
segment averaging yang mempunyai nilai pengenalan terbaik di nilai 64 titik yang mampu
mengenali hingga 98 persen.
20 40
60 80
100 120
0.1 0.2
0.3 0.4
0.5
P e
rs e
n ta
se P
e n
gen a
la n
Nilai Batas Potong
Pengaruh Perubahan Nilai Batas Potong Terhadap Pengenalan Ucapan
frame 4 frame 8
frame 16 frame 32
frame 64 frame 128
20 40
60 80
100 120
4 8
16 32
64 128
P e
rs e
n ta
se P
e n
gen a
la n
Lebar Segment Averaging titik
Pengaruh Perubahan Lebar Segment Averaging Terhadap Pengenalan Ucapan
batas potong 0.1 batas potong 0.2
batas potong 0.3 batas potong 0.4
batas potong 0.5
c Pengujian Nilai Batas Potong dan Segment averaging Dengan
Menggunakan Nilai k-Nearest Neighbor K=5
Nilai batas potong dan segment averaging variasi sama dengan tanpa nilai k- Nearest Neighbor
yang diubah hanya nilai k-Nearest Neighbor yang bernilai empat. Dapat dilihat pada tabel 4.5.
Tabel 4.5. Tingkat pengenalan untuk hasil nilai batas potong dan lebar segment averaging
tanpa menggunakan nilai k-Nearest Neighbor K=5 Nilai
Batas Potong Lebar segment averaging titik
4 8
16 32
64 128
0,1 76
84 92
92 90
92 0,2
86 92
96 96
92 80
0,3 80
80 86
94 88
78 0,4
76 76
84 94
90 84
0,5 68
72 72
68 68
76
Gambar 4.11. Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan
20 40
60 80
100 120
0.1 0.2
0.3 0.4
0.5
P e
rs e
n ta
se P
e n
gen a
la n
Nilai Batas Potong
Pengaruh Perubahan Nilai Batas Potong Terhadap Pengenalan Ucapan
frame 4 frame 8
frame 16 frame 32
frame 64 frame 128
Gambar 4.12. Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan
Gambar 4.11. dan gambar 4.12. dengan menggunakan nilai k-Nearest Neighbor sebesar lima menunjukan bahwa dalam pengunakan nilai batas potong yang mempunyai
nilai pengenalan terbaik di nilai 0,2 yang mampu mengenali hingga 96 persen. Lebar segment averaging
yang mempunyai nilai pengenalan terbaik di nilai 16 dan 32 titik yang mampu mengenali hingga 96 persen.
d Pengujian Nilai Batas Potong dan Segment Averaging Dengan
Menggunakan Nilai k-Nearest Neighbor K=7
Nilai batas potong dan segment averaging variasi sama dengan tanpa nilai k- Nearest Neighbor
, yang diubah hanya nilai k-Nearest Neighbor yang bernilai empat. Dapat dilihat pada tabel 4.6.
Tabel 4.6. Tingkat pengenalan untuk hasil nilai batas potong dan segment averaging tanpa menggunakan nilai k-Nearest Neighbor K=7
Nilai Batas Potong
Lebar segment averaging titik 4
8 16
32 64
128 0,1
78 84
90 90
90 86
0,2 82
88 92
94 94
82 0,3
72 72
88 92
84 78
0,4 74
76 86
76 74
80 0,5
60 66
66 72
78 80
20 40
60 80
100 120
4 8
16 32
64 128
P e
rs e
n ta
se P
e n
gen a
la n
Lebar Segment Averaging titik
Pengaruh Perubahan Lebar Segment Averaging Terhadap Pengenalan Ucapan
batas potong 0.1 batas potong 0.2
batas potong 0.3 batas potong 0.4
batas potong 0.5
Gambar 4.13. Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan
Gambar 4.14. Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan Gambar 4.13. dan gambar 4.14. dengan menggunakan nilai k-Nearest Neighbor
sebesar tujuh menunjukan bahwa dalam pengunakan nilai batas potong yang mempunyai nilai pengenalan terbaik di nilai 0,2 yang mampu mengenali hingga 94 persen. Lebar
segment averaging yang mempunyai nilai pengenalan terbaik di nilai 32 dan 64 titik yang
mampu mengenali hingga 94 persen.
10 20
30 40
50 60
70 80
90 100
0.1 0.2
0.3 0.4
0.5
P e
rs e
n ta
se P
e n
gen a
la n
Nilai Batas Potong
Pengaruh Perubahan Nilai Batas Potong Terhadap Pengenalan Ucapan
frame 4 frame 8
frame 16 frame 32
frame 64 frame 128
20 40
60 80
100
4 8
16 32
64 128
P e
rs e
n ta
se P
e n
ge n
a la
n
Lebar Segment Averaging titik
Pengaruh Perubahan Lebar Segment Averaging Terhadap Pengenalan Ucapan
batas potong 0.1 batas potong 0.2
batas potong 0.3 batas potong 0.4
batas potong 0.5
Dari keenam grafik yang telah ditampilkan, dapat simpulkan bahwa nilai k-Nearest Neighbor
sebesar tiga dengan batas potong sebesar 0,2 dan variasi segment averaging bernilai 64 titik mempunyai pengenalan yang paling balik dengan tingkat pengenalan
sebesar 98 persen. Pengujian yang selanjutnya dengan mengambil salah satu variasi nilai pengenalan
terbaik dari kesimpulan keenam grafik diatas bahwa variasi terbaik adalah dengan nilai batas potong 0,2; lebar segment averaging 64 titik dan menggunakan nilai k-Nearest
Neighbor sebesar tiga yang dapat mengenali ucapan sebesar 98 persen.
Tabel 4.7. Confusion matrix pengujian secara tidak real-time
Output Input
CEPAT LAMBAT
KANAN KIRI
STOP CEPAT
10
LAMBAT 10
KANAN 10
KIRI
10
STOP 1
9
Dari tabel 4.7. dapat dilihat bawah pengenalan tidak mampu mengenali sampai
dengan 100 persen. Hal tersebut dikarenakan keterbatas metode yang digunakan peneliti untuk proses pengenalan suara ucapan dan suara ucapan yang keluar dari mulut tidak
selalu sama. Dari 100 persen yang dikenali sebesar 98 persen yang berarti ada 1 suara ucapan yang tidak dikenali dari 50 ucapan.
4.2.3 Pengujian Real-Time
a. Pengujian Software