Hubungan spektral, tangga nada, intensitas suara, bentuk pengucapan, penggukuran sepstral, merupakan ciri yang digunakan pada pengolahan
suara. Data ciri memberikan hasil baik pada satu situasi, tetapi dapat juga memberikan hasil buruk di situasi yang lain, sehingga, sekali ciri-ciri suara
dipilih untuk digunakan dalam proses pengolahan suara, maka akan diekstraksi dari suara yang diucapkan, dan dapat digunakan untuk
mengidentifikasi pembicara. Dimensi data yang terlalu besar dapat menyebabkan hasil perhitungan
fungsi kepekatan peluang menjadi tidak stabil, sehingga hasil klasifikasi tidak handal. Untuk mengatasi masalah tersebut sering digunakan teknik
mereduksi dimensi data, salah satu teknik yang dapat diterapkan untuk mereduksi data adalah Mel-Frequency Cepstral Coefficients MFCC.
MFCC diketahui memiliki kinerja yang baik dalam mendukung sistem identifikasi pembicara, dan juga dapat mereduksi data suara dengan baik.
Tahapan proses ekstraksi ciri dengan metode MFCC, digambarkan dalam suatu blok diagram alir data seperti disajikan pada Gambar 16.
Gambar 16 Diagram alir proses ekstraksi ciri dengan metode MFCC
3.1.6 Penyebaran Data Ciri
Data ciri vektor ciri hasil proses ekstraksi ciri dengan metode MFCC, disebar kedalam 2 kelompok data, yaitu: kelompok data pelatihan
dan kelompok data pengujian.
Penyebaran data ciri kedalam kelompok-kelompok tersebut, adalah untuk mengetahui data ciri vektor ciri mana saja yang akan dijadikan data
pelatihan saat proses rekonstruksi model JST Probabilistik dilakukan, dan data ciri mana saja yang akan dijadikan data pengujian.
Bagaimana komposisi data ciri vektor ciri dan berapa jumlahnya yang akan dijadikan anggota kelompok data pelatihan dan kelompok data
pengujian ditentukan berdasarkan aturan yang berlaku pada metode validasi yang dijadikan acuan pada penelitian ini. Komposisi dan jumlah data ciri
pada kelompok data pelatihan dan kelompok data pengujian untuk model PNN yang akan divalidasi dengan metode holdout disajikan pada Tabel 1.
Tabel 1 komposisi dan jumlah vektor ciri untuk metode validasi holdout
Pengujian ke.
Kelompok Data Pelatihan Kelompok Data
Pengujian 1
Vc2, Vc4, Vc6, Vc8, Vc10, Vc7, Vc9 Vc1, Vc3, Vc5
2 Vc1, Vc3, Vc5, Vc7, Vc9, Vc8, Vc10
Vc2, Vc4, Vc6 3
Vc2, Vc4, Vc6, Vc8, Vc10, Vc1, Vc3 Vc5, Vc7, Vc9
4 Vc1, Vc3, Vc5, Vc7, Vc9, Vc2, Vc4
Vc6, Vc8, Vc10 5
Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc1, Vc2, Vc3
6 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7
Vc8, Vc9, Vc10
Sedangkan komposisi dan jumlah data ciri pada kelompok data pelatihan dan kelompok data pengujian untuk model PNN yang akan
divalidasi dengan metode leave-one out disajikan pada Tabel 2. Tabel 2 komposisi dan jumlah vektor ciri untuk metode validasi leave-one
out
Pengujian ke.
Kelompok Data Pelatihan Kelompok Data
Pengujian 1
Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9 Vc10
2 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc10
Vc9 3
Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc9, Vc10 Vc8
4 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc8, Vc9, Vc10
Vc7 5
Vc1, Vc2, Vc3, Vc4, Vc5, Vc7, Vc8, Vc9, Vc10 Vc6
6 Vc1, Vc2, Vc3, Vc4, Vc6, Vc7, Vc8, Vc9, Vc10
Vc5 7
Vc1, Vc2, Vc3, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc4
8 Vc1, Vc2, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10
Vc3 9
Vc1, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc2
10 Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10
Vc1
3.1.7 Identifikasi Suara