Penyebaran Data Ciri Kerangka Pikir Penelitian

Hubungan spektral, tangga nada, intensitas suara, bentuk pengucapan, penggukuran sepstral, merupakan ciri yang digunakan pada pengolahan suara. Data ciri memberikan hasil baik pada satu situasi, tetapi dapat juga memberikan hasil buruk di situasi yang lain, sehingga, sekali ciri-ciri suara dipilih untuk digunakan dalam proses pengolahan suara, maka akan diekstraksi dari suara yang diucapkan, dan dapat digunakan untuk mengidentifikasi pembicara. Dimensi data yang terlalu besar dapat menyebabkan hasil perhitungan fungsi kepekatan peluang menjadi tidak stabil, sehingga hasil klasifikasi tidak handal. Untuk mengatasi masalah tersebut sering digunakan teknik mereduksi dimensi data, salah satu teknik yang dapat diterapkan untuk mereduksi data adalah Mel-Frequency Cepstral Coefficients MFCC. MFCC diketahui memiliki kinerja yang baik dalam mendukung sistem identifikasi pembicara, dan juga dapat mereduksi data suara dengan baik. Tahapan proses ekstraksi ciri dengan metode MFCC, digambarkan dalam suatu blok diagram alir data seperti disajikan pada Gambar 16. Gambar 16 Diagram alir proses ekstraksi ciri dengan metode MFCC

3.1.6 Penyebaran Data Ciri

Data ciri vektor ciri hasil proses ekstraksi ciri dengan metode MFCC, disebar kedalam 2 kelompok data, yaitu: kelompok data pelatihan dan kelompok data pengujian. Penyebaran data ciri kedalam kelompok-kelompok tersebut, adalah untuk mengetahui data ciri vektor ciri mana saja yang akan dijadikan data pelatihan saat proses rekonstruksi model JST Probabilistik dilakukan, dan data ciri mana saja yang akan dijadikan data pengujian. Bagaimana komposisi data ciri vektor ciri dan berapa jumlahnya yang akan dijadikan anggota kelompok data pelatihan dan kelompok data pengujian ditentukan berdasarkan aturan yang berlaku pada metode validasi yang dijadikan acuan pada penelitian ini. Komposisi dan jumlah data ciri pada kelompok data pelatihan dan kelompok data pengujian untuk model PNN yang akan divalidasi dengan metode holdout disajikan pada Tabel 1. Tabel 1 komposisi dan jumlah vektor ciri untuk metode validasi holdout Pengujian ke. Kelompok Data Pelatihan Kelompok Data Pengujian 1 Vc2, Vc4, Vc6, Vc8, Vc10, Vc7, Vc9 Vc1, Vc3, Vc5 2 Vc1, Vc3, Vc5, Vc7, Vc9, Vc8, Vc10 Vc2, Vc4, Vc6 3 Vc2, Vc4, Vc6, Vc8, Vc10, Vc1, Vc3 Vc5, Vc7, Vc9 4 Vc1, Vc3, Vc5, Vc7, Vc9, Vc2, Vc4 Vc6, Vc8, Vc10 5 Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc1, Vc2, Vc3 6 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7 Vc8, Vc9, Vc10 Sedangkan komposisi dan jumlah data ciri pada kelompok data pelatihan dan kelompok data pengujian untuk model PNN yang akan divalidasi dengan metode leave-one out disajikan pada Tabel 2. Tabel 2 komposisi dan jumlah vektor ciri untuk metode validasi leave-one out Pengujian ke. Kelompok Data Pelatihan Kelompok Data Pengujian 1 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9 Vc10 2 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc10 Vc9 3 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc9, Vc10 Vc8 4 Vc1, Vc2, Vc3, Vc4, Vc5, Vc6, Vc8, Vc9, Vc10 Vc7 5 Vc1, Vc2, Vc3, Vc4, Vc5, Vc7, Vc8, Vc9, Vc10 Vc6 6 Vc1, Vc2, Vc3, Vc4, Vc6, Vc7, Vc8, Vc9, Vc10 Vc5 7 Vc1, Vc2, Vc3, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc4 8 Vc1, Vc2, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc3 9 Vc1, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc2 10 Vc2, Vc3, Vc4, Vc5, Vc6, Vc7, Vc8, Vc9, Vc10 Vc1

3.1.7 Identifikasi Suara