Maka dengan batas maksimal frekuensi manusia yang dapat didengar yaitu 3000 Hz, maka batas maksimal frekuensi tersebut kemudian dikalikan dua yaitu menjadi 6000
Hz. Dalam sekali perekaman peneliti membutuh 1,5 detik dikarenakan untuk setiap kali perekeman, peneliti mengucapkan 2 suku kata.
3.1.5.2 Suara Uji
Suara uji ini merupakan suara terekam yang bertujuan untuk menjalankan proses program secara offline. Suara uji ini untuk menentukan nilai batas potong dan lebar
segment averaging, agar mendapatkan hasil pengenalan ucapan yang paling baik. Gambar
3.3. menunjukan pembuatan suara referensi sama dengan pembuatan suara uji.
3.1.6. Preprocessing
a. Normalisasi
Pada proses normalisasi ini berfungsi untuk menyamakan besar nilai amplitudo dalam setiap database. Dalam proses ini setiap database akan
mempunyai besar skala amplitudo puncak sebesar 1 dan -1 dan skala yang lainnya akan menyesesuaikan. Dalam proses normalisasi ini mengunakan rumus
3.4 untuk menyamakan skala amplitudo puncak : �
= �
�
max
�
�
3.4 b.
Pemotongan Sinyal Dalam proses perekaman, sering kali adanya data sebelum dan sesudah data
ucapan peneliti yang terdapat dalam setiap perekaman. Proses pemotongkan data ucapan ditentukan oleh variabel batas potong pada program peneliti. Dalam
proses ini akan menghasilkan data yang berisi ucapan saja.
c. Jendela Blackman
Jendela Blackman adalah suatu jendela yang dapat digunakan untuk keperluan windowing. Dalam subproses ini merupakan perkalian antar elemen
yang berfungsi untuk mengurangi efek diskontinuitas dari sinyal digital hasil perekaman.
d. Zero Padding
Dalam proses ini berfungsi sebagai penyamaan jumlah data sinyal dalam setiap database. Dengan cara menambahkan deretan nilai nol setelah data yang
berisi ucapan. Penambahan deretan nilai nol tersebut ditentukan dengan rumus 2
n
, disebabkan dalam sinyal suara dibagi dalam beberapa grup darri n sampel, dimana n dapat mengambil nilai sebasar 64, 128, 256, 512, 1024, 2048, 4096
dan 8192.
3.1.7 Ekstrasi Ciri
Discrete Cosine Transform berfungsi sebagai proses ekstraksi ciri. Teknik ini untuk
mengubah sinyal ke dalam komponen frekuensi dasar. Discrete Cosine Transform proses ekstraksi ciri suatu data suara maupun gambar. Setelah mengekstraksi ciri, setiap koefisien
transform dapat dikodekan secara independen tanpa kehilangan efisiensi kompresi.
3.1.8 Jarak Clark
Proses ini untuk membandingkan suara manusia yang terekam dengan 10 nada referensi yang terdapat di database. Hasil yang diperoleh dari perbandingan yaitu jarak
minimum dengan suara terekam, yang kemudian akan digunakan dalam proses selanjutnya. Dalam proses ini peneliti menggunakan fungsi jarak Clark.
3.1.9 Proses k-Nearest Neighbor k-NN