software Matlab. Pengolahan data ucapan dilakukan melalui beberapa tahapan yaitu preprocessing, framing, windowing, ekstraksi ciri, korelasi, dan K-NN. Pada tahap
preprocessing merupakan tahap pengkondisian sinyal. Preprocessing sendiri terdiri dari beberapa tahap yaitu, preemphasis, normalisasi, pemotongan sinyal. Pada tahap
selanjutnya proses framing dan windowing dengan hasil prosesnya dilanjutkan pada tahap korelasi, pada tahap ini database penyimpanan suara akan dipanggil sabagai data
perhitungan. Selanjutnya proses k-NN dimana akan menentukan hasil keluaran dari pengenalan suara.
Gambar 3.16. Blok Diagram Pengenalan Ucapan
3.5.2.1. Sampling
Mulai Masukan : perintah suara
Pencuplikan Keluaran: Ucapan angka.wav
Selesai
Gambar 3.17. Diagram Blok sampling
Proses sampling merupakan proses pencuplikan ucapan manusia.. Percakapan manusia mempunyai rentang frekuensi 300 Hz
– 3000 Hz. Nilai frekuensi tersebut akan digunakan untuk menentukan nilai frekuensi sampling. Nilai frekuensi ucapan ditentukan
pada nilai tertinggi yaitu 3000 Hz kemudian berdasarkan kriteria Nyquist minimum frekuensi sampling ialah 2 kali dari frekuensi asal. Dengan memakai teori tersebut maka
penulis mengambil nilai sampling rate sebesar 6000 Hz dengan frekuensi asal 3000 Hz batas atas dari rentang frekuensi maksimal. Lama waktu penangkapan ucapan ditentukan
sebesar 2 detik. Waktu tersebut ditentukan agar kata yang diucapkan dapat terekam secara utuh. Penentuan lama waktu berdasarkan hasil percobaan yang disertakan dalam lampiran
L1.
3.5.2.2. Pre-emphasis
Pada proses pre emphasis hasil sampling akan di filter agar dapat menghasilkan bentuk sinyal yang lebih halus tanpa terganggunya noise dan mempertahankan sinyal suara
yang blur menjadi lebih jelas.
mulai Masukan : hasil sampling
Proses Pre-emphasis keluaran : hasil Pre-emphasis
Selesai
Gambar 3.18. proses Pre-emphasis
3.5.2.3. Normalisasi
Pada proses normalisasi ini digunakan untuk menyeragamkan nilai amplitudo dari sinyal sampling yang sudah melewati proses pre-emphasis. Tujuan dari normalisasi yaitu
agar pengaruh dari kuat atau lemahnya suara yang diucapkan user dapat diminimalkan dalam proses normalisasi. Hasil dari proses normalisasi ini dirancang agar batasan nilai
puncak maksimum dari data ucapan user tersebut bernilai 1 atau -1.
Mulai
Masukan : Hasil Pre-empahsis
Normalisasi = sinyal hasil preemphasis sinyal tertinggi dari hasil preemphasis
Keluaran : Hasil normalisasi
Selesai
Gambar 3.19. Diagram Blok Normalisasi
3.5.2.4. Pemotongan Sinyal
Mulai Masukan :
- hasil normalisasi - batas potong
Pemotongan sinyal sisi kiri hingga batas potong
Pemotongan sinyal sisi kiri hingga batas potong
Keluaran : Hasil pemotongan Selesai
Membalik data sinyal
Membalik data sinyal ke kondisi awal
Gambar 3.20. Diagram Pemotongan Sinyal Proses pemotongan sinyal bertujuan untuk menghilangkan suara lain yang ikut
terekam sebelum suara yang diinginkan terekam. Hal ini diperlukan agar proses pengenalan mampu benar-benar hanya mengenali suara yang diperlukan saja. Masukan
pada proses pemotongan sinyal meliputi sinyal hasil normalisasi dan batas potong. Proses
pemotongan data sinyal dibatasi oleh nilai dari batas potong . Nilai batas potong yang akan digunakan sebagai pemotongan sinyal sebesar 0,3 yang didapat dari referensi [21].
Proses pemotongan dilakukan dengan mencari data antara nilai batas potong yang sudah ditentukan. Sebagai contoh jika nilai batas potong dimasukan nilai 0,3 maka nilai
yang akan diproses untuk pemotongan sinyal adalah antara 0,3 sampai -0,3. Data diantara nilai batas potong tersebut akan dihilangkan dari data awal hingga data pertama pada hasil
pencarian data yang dilakukan. Pada saat proses pemotongan sinyal akan dijalankan secara bertahap yang dimulai dari data sinyal bagian depan atau kiri dahulu dan dilanjutkan pada
akhir atau kanan sinyal. Saat proses pemotongan data sinyal bagian depan atau bagian kiri sudah selesai,
maka akan dilakukan penyusunan data sinyal dari belakang menuju depan untuk membalikan urutan data sinyal dari kanan ke kiri. Pembalikan urutan data sinyal tersebut
bertujuan untuk memotong data bagian akhir. Setelah data sinyal bagian akhir dipotong maka data akan disusun kembali untuk mengembalikan pada posisi awal atau pada urutan
sebenarnya. Hasil pemotongan sinyal akan disesuainkan urutannya dengan proses zero padding
agar banyaknya data pada sinyal ucapan pada setiap percobaan pengucapan berjumlah sama. Proses ini melakukan penyisipkan deretan nilai 0 pada bagian akhir data
ucapan.
3.5.2.5. Framing dan Windowing