Ekstraksi Fitur Tahapan-tahapan dalam pengenalan ucapan speech recognition

modelling, pemodelan pengucapan pronounciation modelling, model bahasa language model, dan decoder. Blok diagram untuk sistem pengenalan ucapan adalah sebagai berikut: Gambar 2.7. Blok diagram untuk sistem pengenalan ucapan Sumber : Gales dan Young, 2007

2.4.1. Ekstraksi Fitur

Gelombang input audio dari sebuah microphone dikonversikan menjadi sebuah urutan vektor akustik T T O O O ,..., 1 : 1 = dalam proses yang disebut ekstraksi fitur fitur extractionGales dan Young, 2007. Tahap ekstraksi fitur bertujuan untuk memberikan sebuah gambaran dari gelombang ucapan. Tahap ekstraksi fitur ini dapat meminimalkan hilangnya informasi yang membedakan antara kata- kata, dan memberikan kecocokan dengan asumsi distribusi yang dibuat oleh model akustik. Metode yang digunakan adalah Linear Predictive CodingLPC. Language Model Feature Extraction Decoder Acoustic Modelling Pronounciation Modelling Speech Feature Vectors ... O W “Stop that.” Words Pre-emphasis Frame Blocking Windowing Auto Correlation Analisa LPC LPC Parameter LPCmerupakan salah satu teknik analisis sinyal percakapan yang paling powerful dan menyediakan ekstraksi fitur yang berkualitas baik dan efisien untuk digunakan dalam perhitungan . Prosedur untuk mendapatkan koefisien LPC diperlihatkan pada blok diagram berikut: Gambar 2.8. Blok Diagram LPC Langkah-langkah dasar yang harus dilakukan mengenai blok diagram tersebut adalah sebagai berikut: 1. Pre-emphasis : Proses dimana sinyal speech ucapan dirubah menjadi sinyal. 2. Frame Blocking : pada tahap ini, sinyal yang telah di pre- emphasis, diblok menjadi beberapa bagian dengan jumlah sampel N, dan tiap bagian dipisahkan dengan sejumlah M sampel. 3. Windowing : Tahap berikutnya adalah melakukan proses window pada setiap bagian sinyal yang telah dibuat sebelumnya. Hal ini dilakukan untuk meminimalkan pada bagian awal dan akhir sinyal. Jika didefinisikan sebuah window n w dan sinyal tiap bagian adalah n x maka sinyal hasil proses windowing. 4. Auto Correlation Analysis : Tiap bagian yang telah diberi window kemudian akan dibentuk autokorelasinya. 5. Analisa LPC : Langkah berikutnya adalah analisa LPC dimana semua nilai autokorelasinya yang telah dihitung pada tahap sebelumnya akan diubah menjadi parameter LPC. 6. Pengubahan parameter LPC menjadi koefisien cepstral : Parameter LPC yang sangat penting yang bisa diturunkan dari koefisien LPC adalah koefisien cepstral LPC, m c Adapun langkah-langkah analisa LPC untuk pengenalan ucapan speech recognition adalah sebagai berikut: 1. Pre-emphasis terhadap cuplikan sinyal dengan persamaan Pre- emphasizer 2.5 dengan n s adalah sampel ke-n dan harga a yang paling sering digunakan adalah 0.95 2. Membagi hasil pre-emphasis n s ke dalam frame-frame yang masing-masing memuat N buah sampel yang dipisahkan sejauh M buah sample. Semakin N M semakin baik perkiraan spektral LPC dari frame ke frame. 3. Melakukan windowing terhadap setiap frame yang telah dibentuk untuk meminimalkan diskontinuitas pada ujung awal dan ujung akhir setiap frame dengan persamaan Hamming Window untuk sampel ke-n adalah : 1 2 cos 46 . 54 . − − = N n n W π , 1 − ≤ ≤ N n 2.6 4. Analisis autokorelasi terhadap setiap frame hasil windowing 1 n x dengan persamaan : 1 − − = n as n s n s ∑ − − = + = 1 1 1 1 1 n n m n x n x m r 2.7 dengan m dimulai dari 0 dan nilai tertinggi dari p m = adalah orde LPC yang biasa bernilai 8-16. 5. Mengubah 1 + p buah hasil autokorelasi pada masing-masing frame menjadi koefisien LPC p m m a a = untuk p m ,..., 2 , 1 = dengan persamaan dibawah ini : r E = 2.8 , | | { 1 1 ∑ − − − − = m m m E j m r m r k p m ≤ ≤ 1 2.9 m m m k = α 2.10 , 1 1 − − − − = m j m m m j m j k α α α 1 1 − ≤ ≤ m j 2.11 1 2 1 − − = m m m E k E 2.12 dengan r adalah hasil autokorelasi, m E adalah error, m k adalah koefisien pantulan, m j a adalah koefisien prediksi untuk m j ≤ ≤ 1 . 6. Mengubah parameter LPC m a ke koefisien cepstral m c untuk mendapatkan kinerja yang lebih baik dan tahan terhadap noise, yaitu dengan persamaan” ∑ − = − + = 1 1 , m k k m k m m a c m k a c p m ≤ ≤ 1 2.13 ∑ − = − = 1 1 , m k k m k m a c m k c p m 2.14 Koefisien cepstral ini adalah koefisien dari representasi pada spectrum logarithms.

2.4.2. Pemodelan Akustik