Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)
ABSTRAK
Perkembangan teknologi pengolahan sinyal suara manusia pada akhirakhir ini banyak digemari dan dikembangkan. Salah satu contoh pengolahan
sinyal suara manusia yang sedang dikembangkan adalah sistem pengenalan
pembicara
(speaker
recognitionsystem).
Pengenalan
pembicara
(Speaker
recognition) memungkinkan untuk menggunakan suara untuk mengontrol atau
memverifikasi identitas sumber suara. Pada sistem penelitian ini digunakan
metode MFCC (mel frequency cepstrum coefficients) dimana MFCC ini mampu
menangkap karakteristik pengenalan suara manusia atau dengan kata lain mampu
menangkap informasi yang terkandung dalam sinyal suara.
Pada sistem yang akan dibuat menggunakan software MATLAB memiliki
kemampuan membedakan setiap file suara yang telah diambil datanya. Pada
penerapannya nilai jumlah koefisien (N) ditentukan atau ditetapkan berdasarkan
nilai yang ditulis dalam program yang panjangnya antara 10-30 ms atau 256-1024
data. Sinyal suara yang kontinyu akan diblock menjadi frame sampel N, dengan
frame yang berdekatan dipisahkan oleh nilai koefisien (M) dengan ketentuan
dimana M
Perkembangan teknologi pengolahan sinyal suara manusia pada akhirakhir ini banyak digemari dan dikembangkan. Salah satu contoh pengolahan
sinyal suara manusia yang sedang dikembangkan adalah sistem pengenalan
pembicara
(speaker
recognitionsystem).
Pengenalan
pembicara
(Speaker
recognition) memungkinkan untuk menggunakan suara untuk mengontrol atau
memverifikasi identitas sumber suara. Pada sistem penelitian ini digunakan
metode MFCC (mel frequency cepstrum coefficients) dimana MFCC ini mampu
menangkap karakteristik pengenalan suara manusia atau dengan kata lain mampu
menangkap informasi yang terkandung dalam sinyal suara.
Pada sistem yang akan dibuat menggunakan software MATLAB memiliki
kemampuan membedakan setiap file suara yang telah diambil datanya. Pada
penerapannya nilai jumlah koefisien (N) ditentukan atau ditetapkan berdasarkan
nilai yang ditulis dalam program yang panjangnya antara 10-30 ms atau 256-1024
data. Sinyal suara yang kontinyu akan diblock menjadi frame sampel N, dengan
frame yang berdekatan dipisahkan oleh nilai koefisien (M) dengan ketentuan
dimana M