3.1.3. Ekstraksi Ciri
Metode ekstraksi ciri menggunakan metode yang bernama MFCC Mel Frequency Cepstral Coefficient. Metode tersebut dipilih karena banyak digunakan
dalam bidang speech processing, baik itu speech recognition maupun speaker recognition.
Proses ekstraksi ciri dalam tahap pelatihan dilakukan pada semua file suara dengan menentukan terlebih dahulu ukuran frame dan overlap yang akan digunakan
pada saat proses perhitungan nilai MFCC. Kemudian masing-masing nilai MFCC yang dihasilkan dari setiap rekaman yang ada, dilakukan proses reduksi ciri yaitu
dengan menghitung nilai statistik berupa nilai mean, variance, min, dan max dari nilai MFCC, yang kemudian akan digunakan sebagai input dari jaringan syaraf
tiruan.
Gambar 3.5 Contoh hasil ekstraksi ciri MFCC
Pada gambar 3.5 merupakan contoh hasil ekstraksi ciri MFCC sebelum dilakukan proses reduksi ciri atau mengubah dimensi ciri MxN menjadi Mx1. 39
merupakan jumlah koefisien MFCC yang dihasilkan, sedangkan 332 merupakan jumlah frame yang dihasilkan pada saat proses frame blocking. Jumlah frame
sebanyak 332 dihasilkan melalui perhitungan sebagai berikut : Sample rate = 16000,
Frame size = 25ms = 25100016000 = 400 sample point, Overlap = 10 ms = 10100016000 = 160 sample point,
Step = 400 – 160 = 240,
Duration = 5s, Sample Total = 516000 = 80000,
Jumlah frame = 80000-160240 = 332 Proses reduksi ciri dilakukan dengan cara menghitung nilai mean, variance,
minimum, dan maximum setiap baris koefisien MFCC yaitu 1-39. Sebagai contoh baris pertama koefisien pertama MFCC dilakukan perhitungan nilai mean dengan
data nilai dari frame 1-332, sehingga akan menghasilkan 1 baris baru. Perhitungan dilakukan hingga mencapai koefisien ke 39, hal ini juga dilakukan ketika mencari
nilai variance, minimum dan maximum. Pada akhir proses, akan menghasilkan ciri baru sebanyak 156x1 dengan rincian nilai mean, variance, minimum, dan maximum
masing-masing sebanyak 39 untuk masing-masing file rekaman. Ada 9 tahap yang dilakukan pada proses ekstraksi ciri, dengan 8 tahap
merupakan proses dari MFCC dan 1 tahap lainnya merupakan perhitungan terhadap nilai MFCC yang telah dihasilkan. Tahap-tahap tersebut adalah :
1. Pre-emphasis
2. Frame blocking
3. Hamming windowing
4. Fast Fourier Transform FFT
5. Triangular Bandpass Filters
6. Discrete Cosine Transform DCT
7. Log Energy
8. Delta Cepstrum
9. Menghitung nilai mean, variance, minimum, dan maximum
Sebelum masuk pada jaringan syaraf tiruan, data terlebih dahulu diseleksi sesuai dengan feature yang diinginkan, dengan rincian dalam tabel berikut ini :
Tabel 3.1 Statistic Features Indices
MFCC Statistic Features Indices
Total Coefficients
Mean Variance Minimum Maximum Without Delta or
Delta Delta 13 coefficients
1-13 40-52
79-91 118-130
52 Delta 26 coefficients 1-26
40-65 79-104
118-143 104
Delta Delta 39 coefficients
1-39 40-78
79-117 118-156
156 Keterangan :
Untuk MFCC 13 coefficients masing-masing feature mean, variance, minimum, maximum akan memiliki nilai sebanyak 13, sehingga total keseluruhan ada 52 nilai
jika semua feature tersebut dipilih. Begitu pula dengan MFCC 26 coefficients dan MFCC 39 coefficients masing-
masing feature mean, variance, minimum, maximum akan memiliki nilai sebanyak 26 dan 39, sehingga total keseluruhan ada 104 nilai untuk MFCC 26
coefficients dan 156 nilai untuk MFCC 39 coefficients. Angka-angka pada kolom mean, variance, minimum, maximum merupakan nilai
indeks yang menyatakan letak keberadaan feature tersebut pada masing-masing MFCC-nya dalam sebuah database feature.
Kemudian data dibagi menjadi k bagian, untuk train, validation, test set. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 3.2 3 Fold Cross Validation
Percobaan Train Validation Test 1
3 1
2 2
1 2
3 3
2 3
1
Tabel 3.3 5 Fold Cross Validation
Percobaan Train Validation Test 1
3,4,5 1
2 2
1,4,5 2
3 3
1,2,5 3
4 4
1,2,3 4
5 5
2,3,4 5
1
Tabel 3.4 10 Fold Cross Validation
Percobaan Train
Validation Test 1
3,4,5,6,7,8,9,10 1
2 2
1,4,5,6,7,8,9,10 2
3 3
1,2,5,6,7,8,9,10 3
4 4
1,2,3,6,7,8,9,10 4
5 5
1,2,3,4,7,8,9,10 5
6 6
1,2,3,4,5,8,9,10 6
7 7
1,2,3,4,5,6,9,10 7
8 8
1,2,3,4,5,6,7,10 8
9 9
1,2,3,4,5,6,7,8 9
10 10
2,3,4,5,6,7,8,9 10
1
Setelah itu data feature yang telah dipilih akan dijadikan sebagai input pada jaringan syaraf tiruan, pada subbab selanjutnya akan dijelaskan mengenai arsitektur
jaringan yang akan digunakan pada saat proses pelatihan dan pengujian.
3.1.4. Jaringan Syaraf Tiruan