Sampling Framing dan Windowing

2.3. Sampling

Proses pertama dalam pengolahan sinyal suara adalah sampling, yaitu proses pencuplikan sinyal ucapan manusia yang berupa sinyal analog pada periode waktu tertentu. Dalam proses sampling, sinyal suara yang diambil akan menjadi gelombang sinyal diskrit. Pada proses sampling, nilai frekuensi sampling harus diperhatikan [2]. Frekuensi sampling merupakan laju pencuplikan yang menandakan banyak pengambilan sinyal analog dalam satu detik. Nilai satuan frekuensi sampling adalah Hertz Hz. Contoh proses sampling ditunjukan pada gambar 2.4. Gambar 2.4. Contoh Proses Sampling Nilai frekuensi sampling dianjurkan untuk mengacu pada kriteria Nyquist. Laju sampling minimum dikenal sebagai Nyquist sampling rate, yang menyatakan bawah nilai frekuensi sampling minimal harus 2 kali lebih besar terhadap nilai frekuensi maksimum dari sinyal yang dicuplik [2]. Apabila kriteria Nyquist tidak dipenuhi, maka akan terjadi aliasing pada proses sampling, yaitu adanya frekuensi yang terlihat sebagai frekuensi lain. Gambar 2.5 menunjukan gambar aliasing. Kriteria Nyquist sampling rate dapat dituliskan: 2.1 Keterangan : f s = frekuensi sampling Hz f m = frekuensi sinyal analog Hz Gambar 2.5. Contoh Aliasing Pada Proses Sampling

2.4. Preprocessing

Prepocessing merupakan tahapan untuk mengkondisikan sinyal sebelum diproses dalam segmentasi lalu ektraksi ciri pada proses pengenalan ucapan. Preprocessing dilakukan untuk membuang noise, menyesuaikan skala amplitudo serta frekuensi pada sinyal ucapan. Dalam preprocessing ada beberapa tahapan meliputi pre emphasis, normalisasi, pemotongan sinyal, dan zero padding.

2.4.1. Pre Emphasis

Pre Emphasis adalah proses yang dirancang untuk mengurangi dampak buruk dari transmisi dan suara latar yang ikut tercuplik. Proses pre emphasis sangat baik dalam mengurangi efek distorsi, atenuasi, dan saturasi dari media perekaman. Perhitungan pre emphasis dilakukan pada sinyal digital dalam domain waktu dan menggunakan persamaan berikut [6] : 1    n s n s n s  2.2 Dimana  = 0.9 1 Nilai  yang paling sering digunakan adalah 0,95 [7] Sn = sampel ke-n Gambar sinyal masukan yang akan diproses dalam pre emphasis ditunjukan pada gambar 2.6. dan gambar sinyal yang telah melewati proses pre emphasis ditunjukan pada gambar 2.7. Gambar 2.6. Sinyal Masukan Gambar 2.7. Sinyal Hasil Pre Emphasis dari Gambar 2.6.

2.4.2. Normalisasi

Normalisasi adalah proses penyeragaman nilai amplitudo dari sinyal hasil pre emphasis agar terbentuk pada skala yang sama [8]. Proses normalisasi sangat diperlukan karena besarnya amplitudo sinyal suara manusia saat melakukan pengucapan selalu berbeda. Perhitungan matematis untuk mencari nilai normalisasi dirumuskan dengan persamaan sebagai berikut : | | dengan keterangan sebagai berikut : = hasil data sinyal normalisasi 1,2,3,…,N = data masukan dari sampling 1,2,3,…,N N = banyaknya data sinyal Sinyal hasil pre emphasis pada gambar 2.7. akan diolah sebagai masukan untuk proses normalisasi. Gambar 2.8. menunjukan sinyal masukan yang sudah melewati proses normalisasi. Gambar 2.8. Sinyal Hasil Normalisasi dari Gambar 2.7.

2.4.3. Pemotongan Sinyal

Pemotongan sinyal dilakukan dengan tujuan memotong beberapa bagian sinyal yang dianggap noise yang ikut tercuplik. Sinyal data ucapan ditunjukan oleh gambar 2.9. Gambar 2.9. Posisi Sinyal Data Ucapan Dalam proses ini, pemotongan sinyal dilakukan pada bagian awal dan akhir selain sinyal data ucapan. Pemotongan sinyal suara dimaksudkan untuk menghilangkan bagian yang dianggap bukan sinyal ucapan dan mengurangi gangguan sinyal yang diakibatkan dari derau ruangan atau suara lain yang ikut terekam. Sinyal selain data ucapan yang berada dibagian kiri dan kanan pada gambar 2.9. merupakan noise. Proses pemotongan sinyal ditunjukan oleh gambar 2.10., dengan nilai batas potong 0,3 [5]. Tahap pertama dalam pemotongan sinyal adalah memotong bagian kiri dari sinyal hasil normalisasi. Selanjutnya dilakukan pembalikan sinyal, lalu potong bagian kanan dari sinyal. Setelah itu sinyal dikembalikan ke kondisi semula, yang merupakan hasil dari proses pemotongan sinyal. Gambar 2.10. Proses Pemotongan Sinyal Gambar 2.10. Lanjutan Proses Pemotongan Sinyal

2.4.4. Zero Padding

Setelah dilakukan pemotongan sinyal, proses selanjutnya adalah zero padding. Zerro padding merupakan tahapan akhir dari pre processing, dimana pada tahapan ini terdapat proses pemberian deretan data bernilai 0 pada data sinyal. Proses pemotongan sinyal mengakibatkan perbedaan panjang gelombang dari setiap data sinyal ucapan, sehingga dilakukan penambahan nilai 0 sampai panjang gelombang sesuai nilai dengan frekuensi sinyal yang telah ditentukan. Proses zero padding ditunjukan oleh gambar 2.11. Gambar 2.11 Proses Zero Padding

2.5. Framing dan Windowing

Framing merupakan proses dimana sinyal data masukan akan dibentuk dalam frame-frame. Dalam bentuk frame ini data akan lebih mudah untuk diketahui, sehingga tidak perlu memeriksa sinyal data secara keseluruhan secara langsung. Data akan diperiksa setiap frame sebesar nilai panjang frame yang telah ditentukan. Jika dalam pemeriksaan tersebut sinyal data melebihi maka akan mengalami overlap, lalu dipotong sebesar nilai overlap [10]. Gambar 2.12. Proses Framing [9] Windowing merupakan tahapan untuk menetralisir diskontinuitas sinyal pada awalan dan akhir tiap bentuk data sinyal dengan melakukan proses dari fungsi window [9]. Windowing berfungsi untuk membuat pola pada sinyal, sehingga dapat diproses dalam tahapan selanjutnya. Pada proses ini jenis window yang dipakai adalah jenis Hamming. Digunakan Hamming window karena mempunyai side lobe yang paling kecil dan main lobe yang paling besar, sehingga hasil windowing akan lebih halus dalam menghilangkan efek diskontinuitas[6]. Pada gambar 2.13. menunjukan proses windowing. Persamaan Hamming Window [7]:          1 2 cos 46 , 54 , N n n w  2.4 Dimana: wn = windowing N = jumlah data dari sinyal n = waktu diskrit ke – n Gambar 2.13. Proses Framing dan Windowing

2.6. Discrete Fourier TransformDFT