P rep
ro cess
in g
3.2 Perancangan Referensi Ucapan
Dalam proses pengenalan ucapan manusia ,dibutuhkan suara acuan yang disebut nada referensi. Nada referensi diperlukan sebagai database yang nantinya akan
dibandingkan dengan suara yang akan dikenali, proses pembandingan ini terdapat dalam subproses fungsi jarak. Dalam memeperoleh nada referensi pada setiap jenis ucapan yang
akan dikenali pada sistem pengenalan ucapan manusia, peneliti mengambil 10 sample pada setiap jenis ucapan ucapan kanan, kiri, cepat, lambat, stop . Bahwa sepuluh sample
tersebut diasumsikan bahwa sudah cukup untuk mendapatkan variasi ucapan normal. Pengambilan suara ucapan yang akan dijadikan suara referensi melalui proses perekaman,
preprocessing dan ekstraksi cirri DCT.
Gambar 3.3. Diagram blok proses pengambilan suara referensi
3.3 Perancangan Sistem Software
Dalam sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias menggunakan beberapa subproses yang akan dilalui dalam melakukan pengenalan ucapan.
Pada gambar 3.4. ini memperlihatkan alur proses yang dimulai dari perekaman sampai dengan output pengenalan Ucapan.
Ekstraksi Ciri Hasil Ekstraksi Ciri
Ucapan Manusia Perekaman
Pemotongan Sinyal Normalisasi
Jendela Blackman Zero Padding
P rep
ro cess
in g
Gambar 3.4. Diagram blok keseluruhan proses
3.3.1 Proses Perekaman
Dalam proses rekam peneliti menentukan panjang frekuensi dan panjang durasi waktu rekam, kemudian baru memulai proses perekaman, kemudian melalui proses
sampling . Panjang pencuplikan dalam proses ini sebesar 6000 Hz, nilai tersebut berasal
dari perkalian antara frekuensi sampling dan waktu pencuplikan. Hasil output proses
berupa .wav . Pada gambar 3.5. menunjukan diagram alir proses perekaman.
Gambar 3.5. Diagram alir proses perekaman Ekstraksi Ciri
Jarak Clark k-Nearest Neighbor
Output Pengenalan Ucapan
Database Ucapan Manusia
Perekaman
Pemotongan Sinyal Normalisasi
Jendela Blackman Zero Padding
3.3.2 Pre-processing
Pada proses Pre-processing ini merupakan proses dimana hasil perekaman yang berupa data sinyal dan akan dikondisikan supaya sinyal lebih baik. Macam-macam
subproses Pre-processing dapat dilihat pada gambar 3.6.
Gambar 3.6. Diagram alir proses pre-processing
a. Normalisasi Proses normalisasi berfungsi untuk menyetarakan besarnya nilai ampitudo pada
data ucapan supaya mempunyai skala yang sama atau pengesetan nilai maksimum pada setiap data menjadi bernilai 1. Pada subproses ini input yang berasal dari hasil sampling
akan dinormalisasi dengan cara data hasil sampling dibagi dengan data tertinggi dari nilai absolut data hasil sampling. Keluaran hasil dari subproses ini berupa data ucapan yang
sudah ternormalisasi. Pada gambar 3.7. menunjukan diagram alir proses normalisasi
Gambar 3.7. Diagram alir proses normalisasi
b. Pemotongan Sinyal Pada proses ini masukan yang berupa data ucapan yang sudah ternormalisasi,
data ucapan akan dipotongan dibagian awal dan akhir data, dan akan menghasilkan keluaran yang berupa data ucapan yang hanya menyisakan data yang berisi ucapan saja.
Pada gambar 3.8 diagram alir proses pemotongan sinyal.
Pada proses ini, pemotongan sinyal tergantung nilai batas potong yang terdapat di M-file. Proses pemotongan pertama adalah data sinyal di bagian awal akan dipotong dan
kemudian posisi data sinyal akan diputar dari kanan ke kiri kemudian dipotong lagi sesuai batas potong, kemudian data sinyal yang hanya menyisakan data sinyal yg berisi data
ucapan dibalik seperti semula.
Gambar 3.8. Diagram alir proses pemotongan sinyal
c. Jendela Blackman Dalam proses windowing yang menggunakan jendela blackman. Proses ini
menggunakan masukan yang berasal dari pemotongan sinyal. Gambar 3.9. dibawah ini
merupakan diagram alir dari proses windowing. Pada gambar 3.9. diagram alir proses
Jendela Blackman.
Gambar 3.9. Diagram alir proses jendela blackman
d. Zero Padding Dalam proses zero padding ini mendapatkan masukan yang berasal dari proses
windowing. Pada proses ini panjang sinyal antara setiap database akan berbeda, maka
proses zero padding ini akan menyamakan panjang satiap database. Zero padding merupakan proses pengolahan sinyal digital untuk menyamakan panjang gelombang yang
berisi data ucapan dengan menambahkan deretan nilai nol didepan setiap database, panjangnya data dapat menggunkan rumus 2
n
. Alur program zero padding terdapat di gambar 3.10.
Gambar 3.10. Diagram alir proses zero padding
3.3.3 Ekstraksi Ciri
Discrete Cosine Transform berfungsi sebagai proses ekstraksi ciri. Pada proses ini
terdapat dua macam proses yaitu transformasi, absolut DCT dan log DCT. Dalam proses ini transformasi yang digunakan adalah transformasi Discrete Cosine Transform DCT .
Dalam proses ini terdapat proses segment averaging yang berfungsi untuk mendapatkan
hasil yang lebih baik dan agar dalam pengecekkan hasil DCT dapat lebih mudah. Pada gambar 3.11. menunjukan diagram alir proses ekstraksi ciri.
Gambar 3.11. Diagram alir proses ekstraksi ciri
3.3.4 Perhitungan Jarak
Dalam proses pembanding jarak ini mendapat masukan dari hasil ekstrasi ciri dan dari database. Dalam proses ini membandingkan dua variabel antara nada referensi dan
nada terekam kemudian daftar perhitungan dari perbandingan kedua variabel akan digunakan sebagai hasil keluaran dalam pengenalan ucapan. Gambar 3.12 berikut adalah
alur program perhitungan fungsi jarak clark.
Gambar 3.12. Diagram alir proses pembanding fungsi jarak.
Mencari sejumlah k jarak terkecil INPUT:
Hasil Perhitungan Jarak MULAI
Pemilihan nilai k=1, 3, 5, dan 7 Sortir jarak dari yang paling
kecil ke yang paling besar
Keluaran= kelas yang paling sering muncul
OUTPUT: Hasil
k-Nearest Neighbor
k-NN SELESAI
Mencari sejumlah kelas dari sejumlah k jarak terkecil tersebut
3.3.5 Proses k-Nearest Neighbor k-NN
Dalam proses ini hasil dari pembanding fungsi jarak kemudian k-Nearest Neighbor k-NN akan mengurutkan hasil perhitungan jarak dari nilai yang paling kecil sampai yang
besar. Hasil nilai yang paling terkecil atau paling minimum akan diambil sesuai dengan banyaknya k seperti 1, 3, 5, dan 7. Hasil dari pemilihan k tersebut akan mengeluarkan
urutan sampel yang sesuai dengan urutan hasil pembanding fungsi jarak yang sudah berurutan dari nilai terkecil sampai terbesar dan hasil dan hasil urutan nomor sampel.
Setelah itu yang di ambil nilai kelas yang paling banyak muncul yang akan menjadi penentuan keluaran jenis ucapan yang dikenal.
Gambar 3.13. Diagram alir proses k-Nearest Neighbor.
Dalam penentuan keluaran merupakan proses terakhir dari sistem software pengenalan ucapan manusia untuk mengatur nyala LED hias. Penentuan keluaran ini
mempunyai keluaran yang berupa data hasil pengenalan suara. Ditentukan berdasarkan kelas yang paing banyak muncul dengan menggunakan metode K-nearest neiber. Setelah
itu hasil dari nilai kelas yang paling banyak muncul tersebut akan menjadi keluaran berupa teks yang berupa jenis ucapan suara cepat, lambat, kanan, kiri dan stop.
3.3.6 Output Pengenalan Ucapan
Dalam proses ini hasil dari inisialisasi hasil keluaran kemudian akan dikirimkan ke mikrokontroler melalui modul K-125R secara serial. Setelah diterima oleh mikrokontroler
kemudian diproses untuk menentukan aksi dalam mengatur nyala LED hias. Alur program pengenalan ucapan dapat dilihat pada gambar 3.14.
Gambar 3.14. Diagram alir proses output pengenalan ucapan
3.3.7 Tampilan Pengenalan Ucapan
Hasil akhir dari pembuatan sistem software pengenalan ucapan manusia untuk mengatur nyala LED hias, akan ditampilkan dalam computer dalam bentuk visual GUI Matlab. Pada
gambar 3.15 menunjukan tampilan user.
Gambar 3.15. Tampilan user Tabel 3.2. Keterangan tampilan user
NO. NAMA BAGIAN
KETERANGAN
1 PLOT HASIL
PEREKAMAN Tampilan grafik untuk suara hasil perekaman
2 PLOT HASIL EKSTRAKSI
CIRI DCT Tampilan grafik hasil ektraksi ciri DCT
3 NILAI kNN
Untuk memilih nilai K-nearest neiber 4
NILAI BATAS POTONG Untuk memilih nilai batas potong
5 HASIL PENGENALAN
Menunjukkan hasil pengenalan suara 6
NILAI SEGMENT AVERAGING
Untuk memilih nilai segment averaging 7
REKAM Tombol tekan untuk memulai perekaman
8 RESET
Tombol tekan untuk mengulang proses dari awal 9
KELUAR Tombol tekan untuk mengakhiri aplikasi atau
keluar aplikasi
3.4 Perancangan Sistem Hardware