Analisa Hasil Identifikasi Suara
23 6 MFCC_D
20 93
24 6 MFCC_D
25 91
25 4 MFCC_D_A
10 80
26 4 MFCC_D_A
15 77
27 4 MFCC_D_A
20 82
28 4 MFCC_D_A
25 72
29 5 MFCC_D_A
10 82
30 5 MFCC_D_A
15 81
31 5 MFCC_D_A
20 88
32 5 MFCC_D_A
25 87
33 6 MFCC_D_A
10 78
34 6 MFCC_D_A
15 83
35 6 MFCC_D_A
20 88
36 6 MFCC_D_A
25 89
Pada Gambar 4.1 berikut merupakan grafik yang menunjukkan tingkat akurasi identifikasi suara manusia dengan menggunakan feature
MFFC_D dan dengan kombinasi windows size dan jumlah state yang berbeda. Grafik di bawah ini merupakan pengujian pada Speech
Recognition.
Gambar 4.1 Tingkat Akurasi Identifikasi Suara Manusia dengan Feature MFCC_D untuk Speech Recognition
70 75
80 85
90 95
100
4 5
6
A ku
rasi
Window Size
Hasil Pengujian
10 15
20 25
Jumlah state
Pada Gambar 4.2 berikut merupakan grafik yang menunjukkan tingkat akurasi identifikasi suara manusia dengan menggunakan feature
MFFC_D dan dengan kombinasi windows size dan jumlah state yang berbeda. Grafik di bawah ini merupakan pengujian pada Speaker
Recognition.
Gambar 4.2 Tingkat Akurasi Identifikasi Suara Manusia dengan Feature MFCC_D untuk Speaker Recognition
70 75
80 85
90 95
4 5
6
A ku
rasi
Windows Size
Hasil Pengujian
10 15
20 25
Jumlah state
Pada Tabel 4.3 dan Tabel 4.5 berikut ini menunjukkan tingkat akurasi dari berbagai jenis tipe feature yang berbeda. Pada Tabel 4.3 jumlah state yang
digunakan adalah 25 dengan ukuran windows size adalah 6ms. Sedangkan pada Tabel 4.5 jumlah state yang digunakan adalah 20 dengan ukuran
windows size adalah 6ms.
Tabel 4.3 Hasil identifikasi suara berdasarkan tipe feature pada proses Speech Recognition
Feature Akurasi
MFCC 93
MFCC_D 95
MFCC_D_A 92
Hasil dari pengujian tersebut menunjukkan bahwa tingkat akurasi yang dihasilkan bervariasi mulai dari 92 sampai dengan 95. Pengujian
Hidden Markov Models yang menggunakan tipe feature MFCC_D dengan jumlah state 25 dan besar windows size 6ms memiliki akurasi yang paling
tinggi.
Tabel berikut ini merupakan confusion matrix untuk pengujian yang memiliki tingkat akurasi yang paling tinggi. Confusion matrix di
bawah ini untuk proses pengujian dengan speech recognition.
Tabel 4.4 Confusion Matrix MFCC_D untuk Speech Recognition
no l
sat u
du a
tig a
emp at
lim a
ena m
tuju h
delapa n
sembila n
nol 19 0
1 satu
20 dua
19 1
tiga 19
1 empat
19 1
lima 18
1 1
enam 18
2 tujuh
1 17
2 delapan
20 sembila
n 20
Pada confusion matrix di atas dapat dilihat bahwa sistem dapat mengidentifikasi suara dengan baik. Pada pengucapan kata ‘satu’,
‘delapan’, dan ‘sembilan’ mampu dikenali dengan tepat dengan menunjukkan hasil maksimal yaitu 20. Nilai terendah dari confusion matrix
tersebut adalah 17 yaitu pada penguca pan kata ‘tujuh’.
Dalam proses identifikasi speech recognition, suara yang masuk tetapi bukan berasal dari speaker yang telah dimodelkan sebelumnya dapat
diproses dan terkadang hasil pengujian tepat. Hal ini dikarenakan pola kata yang harus diucapkan telah tetap sehingga walaupun suara yang masuk
tidak berasal dari speaker yang telah dimodelkan masih dapat dikenali dengan mencari kedekatan yang maksimum.
Tabel 4.5 Hasil identifikasi suara berdasarkan tipe feature pada proses Speaker Recognition
Feature Akurasi
MFCC 89
MFCC_D 93
MFCC_D_A 88
Hasil dari pengujian tersebut menunjukkan bahwa tingkat akurasi yang dihasilkan bervariasi mulai dari 88 sampai dengan 93. Pengujian
Hidden Markov Models yang menggunakan tipe feature MFCC_D dengan jumlah state 20 dan besar windows size 6ms memiliki akurasi yang paling
tinggi. Tabel berikut ini merupakan confusion matrix untuk pengujian yang
memiliki tingkat akurasi yang paling tinggi. Confusion matrix di bawah ini untuk proses pengujian dengan speaker recognition.
Tabel 4.6 Confusion Matrix MFCC_D untuk Speaker Verification Angga
Deta Petra
Yudhi Angga
45 5
Deta 44
6 Petra
3 47
Yudhi 1
49
Pada confusion matrix diatas hasil paling tinggi adalah 49 yaitu pada speaker yang bernama Yudhi. Sedangkan jumlah paling kecil yaitu
44 yang merupakan speaker yang bernama Deta.
Pada proses speaker verification terdapat beberapa faktor yang mempengaruhi tingkat akurasi proses identifikasi. Salah satu faktor
tersebut adalah speaker yang memiliki hubungan darah dapat membuat sistem sedikit sulit untuk membedakan speaker tersebut. Dalam kasus ini
Petra dan Deta adalah speaker yang memiliki hubungan darah sehingga terkadang suara Petra yang masuk tetapi teridentifikasi sebagai Deta.