Frame Blocking dan Windowing

Gambar 2. Pembentukan frame pada sinyal suara Rabiner dan Juang 1993 Tahap selanjutnya dari pemrosesan sinyal adalah membuat window terhadap tiap-tiap frame dengan tujuan untuk meminimalkan ketidak- kontinuan pada awal dan akhir setiap frame. Umumnya, window yang digunakan adalah window Hamming. Pembentukan window Hamming menggunakan formula : 1 , , ; 1 2 cos 46 , 54 ,            N n N n n    6 dengan N adalah banyaknya sampel. Keuntungan menggunakan window Hamming adalah memiliki kebocoran spektral yang lebih sedikit dari pada tanpa menggunakan window Hamming Ahrendt 2006. Kebocoran spektral spectral leakage adalah efek pada analisis frekuensi sinyal di mana munculnya sejumlah energi sinyal kecil yang diamati pada komponen frekuensi yang tidak terdapat pada bentuk gelombang aslinya. Istilah kebocoran di sini dimaksudkan bahwa seolah- olah terdapat sebagian energi yang bocor keluar dari spektrum sinyal aslinya ke frekuensi yang lain http:en.wikipedia.orgwikiSpectral_leakage. Setelah sinyal suara dibagi-bagi ke dalam frame, setiap frame sinyal suara tersebut dikenakan operasi window Hamming. Selanjutnya proses ekstraksi ciri akan dilakukan terhadap setiap frame tersebut. Sinyal suara N N N M M Frame 3 Frame 1 Frame 2 N – M

2.5 Penyiapan Data untuk Klasifikasi

Menurut Han dan Kamber 2001 terdapat beberapa langkah praproses terhadap data untuk meningkatkan akurasi, efisiensi, dan skalabilitas dari klasifikasi atau prediksi, antara lain : 1 Pembersihan Data Tujuan dari praproses ini adalah untuk menghilangkan atau mengurangi noise misalnya dengan melakukan proses smoothing dan mengadakan perlakuan khusus pada data yang hilang misalnya menggantinya dengan nilai modus data tersebut. 2 Analisa Relevansi atau Pemilihan Ciri Sejumlah atribut di dalam data mungkin saja tidak relevan untuk diklasifikasi atau diprediksi atau juga atribut yang lain mungkin redundant. Praproses ini dilakukan untuk menghilangkan atribut yang redundant atau tidak relevan. 3 Transformasi atau Normalisasi Data Data dapat digeneralisasi ke konsep yang lebih tinggi. Konsep hirarki dapat digunakan di sini. Misalnya nilai untuk atribut frekuensi dapat diganti dengan rendah, sedang, atau tinggi. Beberapa metode yang umum digunakan yaitu : a. Min-Max Min-Max merupakan metode normalisasi dengan melakukan transformasi linier terhadap data asli. Salah satu metodenya adalah distribusi normal kumulatif dengan rumus sebagai berikut : √ 7 Di mana x adalah nilai yang akan didistribusi dan erf adalah error function. Error function didapatkan dengan rumus sebagai berikut : √ ∫ 8 Metode ini akan menormalisasi input dan target sedemikian rupa sehingga hasil normalisasi akan berada pada interval 0 dan 1. b. Unary Encoding Unary Encoding merupakan metode transformasi data yaitu dengan merepresentasikan data dengan kombinasi angka 1 dan 0 variabel bilangan biner. Metode ini digunakan untuk mentransformasi data bersifat kategori. Sebagai contoh ‘10’ untuk data ‘musik’ dan ‘01’ untuk data ‘bukan musik’. c. Data Numerik dan Kategorik Menurur Kantardzic 2003 tipe data yang umum adalah numerik dan kategorik. Nilai numerik termasuk nilai real maupun integer seperti waktu dan frekuensi. Nilai numerik memiliki 2 properti yang penting yaitu relasi urut 2 5 dan 5 7 dan jarak jarak 2,1, 3,2 = 1, 1. Sedangkan untuk kategorik data tidak memiliki keduanya tersebut. Nilai dari 2 variabel ini bisa sama atau tidak sama yang artinya hanya mempunyai relasi equality rock = rock, rock klasik. Variabel dengan tipe ini dapat dikonversi menjadi numeric binary variable atau dalam statistik disebut dengan dummy variables. Variabel kategorik dengan n nilai dapat dikonversi menjadi n numerical binary variable. Jika terdapat 4 pilihan genre yaitu rock, klasik, pop dan jazz. Maka 4 genre tersebut dapat dikonversi menjadi 4 bit numerical binary variable yaitu klasik bernilai 1000, disko bernilai 0100, metal bernilai 0010, dan reggae bernilai 0001.

2.6 Ekstraksi Ciri

Tahap pertama dalam sistem klasifikasi, seperti yang ditunjukkan dalam Gambar 3, adalah penting bagi akurasi sistem klasifikasi. Vektor ciri y, yang merupakan komposisi dari beberapa ciri harus sediskriminatif mungkin dari kelas yang bersangkutan. Idealnya, vektor ciri harus dapat memisahkan seluruh sampel dari kelas-kelas yang berbeda. Gambar 3. Sistem dasar klasifikasi Andersson 2004 y Pengklasifikasi Ekstraksi Ciri Pengamatan Vektor Ciri Prediksi