Ekstraksi Ciri Gambaran Penelitian

3.1.3. Ekstraksi Ciri

Metode ekstraksi ciri menggunakan metode yang bernama MFCC Mel Frequency Cepstral Coefficient. Metode tersebut dipilih karena banyak digunakan dalam bidang speech processing, baik itu speech recognition maupun speaker recognition. Proses ekstraksi ciri dalam tahap pelatihan dilakukan pada semua file suara dengan menentukan terlebih dahulu ukuran frame dan overlap yang akan digunakan pada saat proses perhitungan nilai MFCC. Kemudian masing-masing nilai MFCC yang dihasilkan dari setiap rekaman yang ada, dilakukan proses reduksi ciri yaitu dengan menghitung nilai statistik berupa nilai mean, variance, min, dan max dari nilai MFCC, yang kemudian akan digunakan sebagai input dari jaringan syaraf tiruan. Gambar 3.5 Contoh hasil ekstraksi ciri MFCC Pada gambar 3.5 merupakan contoh hasil ekstraksi ciri MFCC sebelum dilakukan proses reduksi ciri atau mengubah dimensi ciri MxN menjadi Mx1. 39 merupakan jumlah koefisien MFCC yang dihasilkan, sedangkan 332 merupakan jumlah frame yang dihasilkan pada saat proses frame blocking. Jumlah frame sebanyak 332 dihasilkan melalui perhitungan sebagai berikut : Sample rate = 16000, Frame size = 25ms = 25100016000 = 400 sample point, Overlap = 10 ms = 10100016000 = 160 sample point, Step = 400 – 160 = 240, Duration = 5s, Sample Total = 516000 = 80000, Jumlah frame = 80000-160240 = 332 Proses reduksi ciri dilakukan dengan cara menghitung nilai mean, variance, minimum, dan maximum setiap baris koefisien MFCC yaitu 1-39. Sebagai contoh baris pertama koefisien pertama MFCC dilakukan perhitungan nilai mean dengan data nilai dari frame 1-332, sehingga akan menghasilkan 1 baris baru. Perhitungan dilakukan hingga mencapai koefisien ke 39, hal ini juga dilakukan ketika mencari nilai variance, minimum dan maximum. Pada akhir proses, akan menghasilkan ciri baru sebanyak 156x1 dengan rincian nilai mean, variance, minimum, dan maximum masing-masing sebanyak 39 untuk masing-masing file rekaman. Ada 9 tahap yang dilakukan pada proses ekstraksi ciri, dengan 8 tahap merupakan proses dari MFCC dan 1 tahap lainnya merupakan perhitungan terhadap nilai MFCC yang telah dihasilkan. Tahap-tahap tersebut adalah : 1. Pre-emphasis 2. Frame blocking 3. Hamming windowing 4. Fast Fourier Transform FFT 5. Triangular Bandpass Filters 6. Discrete Cosine Transform DCT 7. Log Energy 8. Delta Cepstrum 9. Menghitung nilai mean, variance, minimum, dan maximum Sebelum masuk pada jaringan syaraf tiruan, data terlebih dahulu diseleksi sesuai dengan feature yang diinginkan, dengan rincian dalam tabel berikut ini : Tabel 3.1 Statistic Features Indices MFCC Statistic Features Indices Total Coefficients Mean Variance Minimum Maximum Without Delta or Delta Delta 13 coefficients 1-13 40-52 79-91 118-130 52 Delta 26 coefficients 1-26 40-65 79-104 118-143 104 Delta Delta 39 coefficients 1-39 40-78 79-117 118-156 156 Keterangan : Untuk MFCC 13 coefficients masing-masing feature mean, variance, minimum, maximum akan memiliki nilai sebanyak 13, sehingga total keseluruhan ada 52 nilai jika semua feature tersebut dipilih. Begitu pula dengan MFCC 26 coefficients dan MFCC 39 coefficients masing- masing feature mean, variance, minimum, maximum akan memiliki nilai sebanyak 26 dan 39, sehingga total keseluruhan ada 104 nilai untuk MFCC 26 coefficients dan 156 nilai untuk MFCC 39 coefficients. Angka-angka pada kolom mean, variance, minimum, maximum merupakan nilai indeks yang menyatakan letak keberadaan feature tersebut pada masing-masing MFCC-nya dalam sebuah database feature. Kemudian data dibagi menjadi k bagian, untuk train, validation, test set. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Tabel 3.2 3 Fold Cross Validation Percobaan Train Validation Test 1 3 1 2 2 1 2 3 3 2 3 1 Tabel 3.3 5 Fold Cross Validation Percobaan Train Validation Test 1 3,4,5 1 2 2 1,4,5 2 3 3 1,2,5 3 4 4 1,2,3 4 5 5 2,3,4 5 1 Tabel 3.4 10 Fold Cross Validation Percobaan Train Validation Test 1 3,4,5,6,7,8,9,10 1 2 2 1,4,5,6,7,8,9,10 2 3 3 1,2,5,6,7,8,9,10 3 4 4 1,2,3,6,7,8,9,10 4 5 5 1,2,3,4,7,8,9,10 5 6 6 1,2,3,4,5,8,9,10 6 7 7 1,2,3,4,5,6,9,10 7 8 8 1,2,3,4,5,6,7,10 8 9 9 1,2,3,4,5,6,7,8 9 10 10 2,3,4,5,6,7,8,9 10 1 Setelah itu data feature yang telah dipilih akan dijadikan sebagai input pada jaringan syaraf tiruan, pada subbab selanjutnya akan dijelaskan mengenai arsitektur jaringan yang akan digunakan pada saat proses pelatihan dan pengujian.

3.1.4. Jaringan Syaraf Tiruan