Preprocessing Ekstrasi Ciri Jarak Clark

Maka dengan batas maksimal frekuensi manusia yang dapat didengar yaitu 3000 Hz, maka batas maksimal frekuensi tersebut kemudian dikalikan dua yaitu menjadi 6000 Hz. Dalam sekali perekaman peneliti membutuh 1,5 detik dikarenakan untuk setiap kali perekeman, peneliti mengucapkan 2 suku kata.

3.1.5.2 Suara Uji

Suara uji ini merupakan suara terekam yang bertujuan untuk menjalankan proses program secara offline. Suara uji ini untuk menentukan nilai batas potong dan lebar segment averaging, agar mendapatkan hasil pengenalan ucapan yang paling baik. Gambar 3.3. menunjukan pembuatan suara referensi sama dengan pembuatan suara uji.

3.1.6. Preprocessing

a. Normalisasi Pada proses normalisasi ini berfungsi untuk menyamakan besar nilai amplitudo dalam setiap database. Dalam proses ini setiap database akan mempunyai besar skala amplitudo puncak sebesar 1 dan -1 dan skala yang lainnya akan menyesesuaikan. Dalam proses normalisasi ini mengunakan rumus 3.4 untuk menyamakan skala amplitudo puncak : � = � � max ⁡ � � 3.4 b. Pemotongan Sinyal Dalam proses perekaman, sering kali adanya data sebelum dan sesudah data ucapan peneliti yang terdapat dalam setiap perekaman. Proses pemotongkan data ucapan ditentukan oleh variabel batas potong pada program peneliti. Dalam proses ini akan menghasilkan data yang berisi ucapan saja. c. Jendela Blackman Jendela Blackman adalah suatu jendela yang dapat digunakan untuk keperluan windowing. Dalam subproses ini merupakan perkalian antar elemen yang berfungsi untuk mengurangi efek diskontinuitas dari sinyal digital hasil perekaman. d. Zero Padding Dalam proses ini berfungsi sebagai penyamaan jumlah data sinyal dalam setiap database. Dengan cara menambahkan deretan nilai nol setelah data yang berisi ucapan. Penambahan deretan nilai nol tersebut ditentukan dengan rumus 2 n , disebabkan dalam sinyal suara dibagi dalam beberapa grup darri n sampel, dimana n dapat mengambil nilai sebasar 64, 128, 256, 512, 1024, 2048, 4096 dan 8192.

3.1.7 Ekstrasi Ciri

Discrete Cosine Transform berfungsi sebagai proses ekstraksi ciri. Teknik ini untuk mengubah sinyal ke dalam komponen frekuensi dasar. Discrete Cosine Transform proses ekstraksi ciri suatu data suara maupun gambar. Setelah mengekstraksi ciri, setiap koefisien transform dapat dikodekan secara independen tanpa kehilangan efisiensi kompresi.

3.1.8 Jarak Clark

Proses ini untuk membandingkan suara manusia yang terekam dengan 10 nada referensi yang terdapat di database. Hasil yang diperoleh dari perbandingan yaitu jarak minimum dengan suara terekam, yang kemudian akan digunakan dalam proses selanjutnya. Dalam proses ini peneliti menggunakan fungsi jarak Clark.

3.1.9 Proses k-Nearest Neighbor k-NN