sinyal suara tidak berupa skala linier. Oleh karena itu, untuk setiap nada dengan frekuensi
aktual f dalam Hertz, tinggi subjektifnya diukur dengan skala ‘mel’. Pendekatan berikut
dapat digunakan untuk menghitung mel- frequency untuk frekuensi f dalam Hz:
Melf = 2595log
10
1+f700 Langkah terakhir adalah mengkonversi log
mel spectrum ke domain waktu. Hasilnya disebut mel frequency cepstrum coefficients.
Probabilistic Neural Network
Input bagi Probabilistic Neural Network berasal dari data suara pelatihan dan data
suara pengujian yang telah mengalami proses ekstraksi ciri sinyal suara dengan MFCC.
Pada pattern layer, dilakukan perhitungan antara data pelatihan dan data pengujian. Nilai
h diperoleh dari persamaan 2.24×standar deviasi×n
-15
karena memberikan nilai optimal Silverman 1985. Hasil dari pattern
layer ini akan dijumlahkan dengan hasil pattern layer lainnya yang satu kelas. Proses
ini terjadi pada summation layer. Dari summation layer, diperoleh nilai terbesar
untuk suatu kelas.
Berdasarkan Tabel 1, identifikasi terdiri atas dua macam, yaitu tanpa threshold dan
dengan threshold. Adanya threshold
dimaksudkan untuk meningkatkan keakuratan hasil identifikasi.
1 Tanpa Threshold
1.1 Identifikasi Dengan 20 Data Pelatihan
Hasil identifikasi untuk 20 data pengujian kelompok 1 dapat dilihat pada Tabel 3. Dari
Tabel 3 dapat dilihat bahwa untuk pembicara laki-laki pembicara 1 s.d. 5, pembicara yang
paling banyak diidentifikasi dengan benar adalah pembicara 4, yaitu sebanyak 19,
sedangkan pembicara yang paling sedikit diidentifikasi dengan benar adalah pembicara
5, yaitu sebanyak 12. Untuk pembicara perempuan pembicara 6 s.d. 10, pembicara
yang paling banyak diidentifikasi dengan benar adalah pembicara 10, yaitu sebanyak
20, sedangkan pembicara yang paling sedikit diidentifikasi dengan benar adalah pembicara
6, yaitu sebanyak 12.
Secara keseluruhan pembicara yang paling banyak diidentifikasi dengan benar adalah
pembicara 10, yaitu sebanyak 20. Sedangkan pembicara yang paling sedikit diidentifikasi
dengan benar adalah pembicara 5 dan 6, yaitu sebanyak 12.
Tingkat akurasi dihitung sebagai rasio antara jumlah data pembicara yang
diidentifikasi secara benar dengan jumlah seluruh data pembicara yang diujikan. Tingkat
akurasi untuk pembicara 10 adalah
2020×100=100 sedangkan untuk pembicara 5 dan 6 memiliki tingkat akurasi
yang sama, yaitu 1220×100=60. Tingkat akurasi untuk tiap pembicara dapat
dilihat pada Tabel 3. Tingkat akurasi untuk seluruh pembicara adalah
84 100
200 =
×
Hasil identifikasi untuk 5 data kelompok 2 dapat dilihat pada Tabel 4. Dari Tabel 4 dapat
dilihat bahwa pembicara yang tidak terdaftar diidentifikasi secara beragam sebagai
pembicara yang terdaftar pembicara 1 s.d. 10. Seharusnya pembicara 1 s.d. 10 dari
kelompok 2 diidentifikasi sebagai pembicara yang tidak terdaftar pembicara 0. Hal ini
dikarenakan tidak adanya thresh
20 19
17 17
12 12
19 17
17 18
+ +
+ +
+ +
+ +
old untuk menjadi pembicara yang terdaftar.
+
Tabel 3 Hasil identifikasi 20 pelatihan tanpa threshold untuk 20 data pengujian kelompok 1 Diidentifikasi Sebagai Pembicara Ke-
Pembicara 1
2 3
4 5
6 7
8 9
10 Tingkat
Akurasi 1
18 0 0 2 0 0 0 0 0 0 90 2
17 0 3 0 0 0 0 0 0 85 3
1 1 17 1 0 0 0 0 0 0 85 4
1 0 0 19 0 0 0 0 0 0 95 5
2 5 1 0 12 0 0 0 0 0 60 6
0 0 0 0 0 12 0 4 4 0 60 7
0 0 0 0 0 0 17 0 3 0 85 8
0 0 0 0 0 0 0 17 3 0 85 9
0 0 0 0 0 0 1 0 19 0 95 10
0 0 0 0 0 0 0 0 0 20 100
Tabel 4 Hasil identifikasi 20 pelatihan tanpa threshold untuk 5 data pengujian kelompok 2 Diidentifikasi Sebagai Pembicara Ke-
Pembicara 1
2 3
4 5
6 7
8 9
10 Tingkat
Akurasi 1
0 2 0 0 3 0 0 0 0 0 0 0 2
0 1 2 0 0 2 0 0 0 0 0 0 3
0 4 1 0 0 0 0 0 0 0 0 0 4
0 5 0 0 0 0 0 0 0 0 0 0 5
0 4 0 0 1 0 0 0 0 0 0 0 6
0 1 0 0 0 0 0 2 1 1 0 0 7
0 0 0 0 0 0 0 0 0 5 0 0 8
0 0 0 0 0 0 0 0 0 5 0 0 9
0 5 0 0 0 0 0 0 0 0 0 0 10
0 5 0 0 0 0 0 0 0 0 0 0
1.2 Identifikasi Dengan 30 Data Pelatihan