Gambar 2. Pembentukan frame pada sinyal suara Rabiner dan Juang 1993
Tahap selanjutnya dari pemrosesan sinyal adalah membuat window terhadap tiap-tiap frame dengan tujuan untuk meminimalkan ketidak-
kontinuan pada awal dan akhir setiap frame. Umumnya, window yang digunakan adalah window Hamming. Pembentukan window Hamming
menggunakan formula : 1
, ,
; 1
2 cos
46 ,
54 ,
N
n N
n
n
6
dengan N adalah banyaknya sampel. Keuntungan menggunakan window Hamming adalah memiliki
kebocoran spektral yang lebih sedikit dari pada tanpa menggunakan window Hamming Ahrendt 2006.
Kebocoran spektral spectral leakage adalah efek pada analisis frekuensi sinyal di mana munculnya sejumlah energi sinyal kecil yang
diamati pada komponen frekuensi yang tidak terdapat pada bentuk gelombang aslinya. Istilah kebocoran di sini dimaksudkan bahwa seolah-
olah terdapat sebagian energi yang bocor keluar dari spektrum sinyal aslinya ke frekuensi yang lain http:en.wikipedia.orgwikiSpectral_leakage.
Setelah sinyal suara dibagi-bagi ke dalam frame, setiap frame sinyal suara tersebut dikenakan operasi window Hamming. Selanjutnya proses
ekstraksi ciri akan dilakukan terhadap setiap frame tersebut.
Sinyal suara
N N
N M
M Frame
3
Frame
1
Frame
2
N – M
2.5 Penyiapan Data untuk Klasifikasi
Menurut Han dan Kamber 2001 terdapat beberapa langkah praproses terhadap data untuk meningkatkan akurasi, efisiensi, dan skalabilitas dari
klasifikasi atau prediksi, antara lain : 1 Pembersihan Data
Tujuan dari praproses ini adalah untuk menghilangkan atau mengurangi noise misalnya dengan melakukan proses smoothing dan
mengadakan perlakuan khusus pada data yang hilang misalnya menggantinya dengan nilai modus data tersebut.
2 Analisa Relevansi atau Pemilihan Ciri Sejumlah atribut di dalam data mungkin saja tidak relevan untuk
diklasifikasi atau diprediksi atau juga atribut yang lain mungkin redundant. Praproses ini dilakukan untuk menghilangkan atribut yang redundant atau
tidak relevan. 3 Transformasi atau Normalisasi Data
Data dapat digeneralisasi ke konsep yang lebih tinggi. Konsep hirarki dapat digunakan di sini. Misalnya nilai untuk atribut frekuensi dapat diganti
dengan rendah, sedang, atau tinggi. Beberapa metode yang umum digunakan yaitu :
a. Min-Max Min-Max merupakan metode normalisasi dengan melakukan
transformasi linier terhadap data asli. Salah satu metodenya adalah distribusi normal kumulatif dengan rumus sebagai berikut :
√
7 Di mana x adalah nilai yang akan didistribusi dan erf adalah error
function. Error function didapatkan dengan rumus sebagai berikut :
√
∫ 8
Metode ini akan menormalisasi input dan target sedemikian rupa sehingga hasil normalisasi akan berada pada interval 0 dan 1.
b. Unary Encoding Unary Encoding merupakan metode transformasi data yaitu
dengan merepresentasikan data dengan kombinasi angka 1 dan 0
variabel bilangan biner. Metode ini digunakan untuk mentransformasi data bersifat kategori. Sebagai contoh ‘10’ untuk data ‘musik’ dan ‘01’
untuk data ‘bukan musik’.
c. Data Numerik dan Kategorik Menurur Kantardzic 2003 tipe data yang umum adalah numerik
dan kategorik. Nilai numerik termasuk nilai real maupun integer seperti waktu dan frekuensi. Nilai numerik memiliki 2 properti yang penting
yaitu relasi urut 2 5 dan 5 7 dan jarak jarak 2,1, 3,2 = 1, 1. Sedangkan untuk kategorik data tidak memiliki keduanya tersebut. Nilai
dari 2 variabel ini bisa sama atau tidak sama yang artinya hanya mempunyai relasi equality rock = rock, rock klasik. Variabel
dengan tipe ini dapat dikonversi menjadi numeric binary variable atau dalam statistik disebut dengan dummy variables.
Variabel kategorik dengan n nilai dapat dikonversi menjadi n numerical binary variable. Jika terdapat 4 pilihan genre yaitu rock,
klasik, pop dan jazz. Maka 4 genre tersebut dapat dikonversi menjadi 4 bit numerical binary variable yaitu klasik bernilai 1000, disko bernilai
0100, metal bernilai 0010, dan reggae bernilai 0001.
2.6 Ekstraksi Ciri
Tahap pertama dalam sistem klasifikasi, seperti yang ditunjukkan dalam Gambar 3, adalah penting bagi akurasi sistem klasifikasi. Vektor ciri
y, yang merupakan komposisi dari beberapa ciri harus sediskriminatif mungkin dari kelas yang bersangkutan. Idealnya, vektor ciri harus dapat
memisahkan seluruh sampel dari kelas-kelas yang berbeda.
Gambar 3. Sistem dasar klasifikasi Andersson 2004
y
Pengklasifikasi Ekstraksi Ciri
Pengamatan Vektor Ciri
Prediksi