Penyiapan Data untuk Klasifikasi

variabel bilangan biner. Metode ini digunakan untuk mentransformasi data bersifat kategori. Sebagai contoh ‘10’ untuk data ‘musik’ dan ‘01’ untuk data ‘bukan musik’. c. Data Numerik dan Kategorik Menurur Kantardzic 2003 tipe data yang umum adalah numerik dan kategorik. Nilai numerik termasuk nilai real maupun integer seperti waktu dan frekuensi. Nilai numerik memiliki 2 properti yang penting yaitu relasi urut 2 5 dan 5 7 dan jarak jarak 2,1, 3,2 = 1, 1. Sedangkan untuk kategorik data tidak memiliki keduanya tersebut. Nilai dari 2 variabel ini bisa sama atau tidak sama yang artinya hanya mempunyai relasi equality rock = rock, rock klasik. Variabel dengan tipe ini dapat dikonversi menjadi numeric binary variable atau dalam statistik disebut dengan dummy variables. Variabel kategorik dengan n nilai dapat dikonversi menjadi n numerical binary variable. Jika terdapat 4 pilihan genre yaitu rock, klasik, pop dan jazz. Maka 4 genre tersebut dapat dikonversi menjadi 4 bit numerical binary variable yaitu klasik bernilai 1000, disko bernilai 0100, metal bernilai 0010, dan reggae bernilai 0001.

2.6 Ekstraksi Ciri

Tahap pertama dalam sistem klasifikasi, seperti yang ditunjukkan dalam Gambar 3, adalah penting bagi akurasi sistem klasifikasi. Vektor ciri y, yang merupakan komposisi dari beberapa ciri harus sediskriminatif mungkin dari kelas yang bersangkutan. Idealnya, vektor ciri harus dapat memisahkan seluruh sampel dari kelas-kelas yang berbeda. Gambar 3. Sistem dasar klasifikasi Andersson 2004 y Pengklasifikasi Ekstraksi Ciri Pengamatan Vektor Ciri Prediksi Bagaimana vektor ciri y dibentuk adalah penting bagi akurasi klasifikasi. Vektor ciri yang dibentuk secara efektif memudahkan pengklasifikasian dan juga memudahkan perancangan pengklasifikasi. Oleh karena itu, ciri apa yang akan diekstrak tergantung dari konteks. Adapun tujuan dari ekstraksi ciri feature extraction adalah untuk mengurangi jumlah data yang sebenarnya dengan melakukan pengukuran terhadap properti atau ciri tertentu yang membedakan pola masukan input yang satu dengan yang lainnya Duda et al. 2001. Dalam sistem klasifikasi musik, ciri diekstrak oleh algoritma pemproses sinyal untuk mendapatkan informasi diskriminatif sebanyak mungkin dari tahap pengamatan. Ciri yang sering dipakai dalam penelitian sitem klasifikasi musik seperti pada penelitian Costa et al. 2004, Tzanetakis et al. 2002, dan Norowi et al. 2005 adalah Mel-Frequency Cepstral Coefficents MFCC. Ciri MFCC menghitung koefisien cepstral dengan mempertimbangkan persepsi sistem pendengaran manusia terhadap frekuensi suara. Gambar 4. Ilustrasi dari perhitungan MFCC Diagram alir yang terlihat pada Gambar 4 mengilustrasikan langkah- langkah dalam menghitung MFCC dari sinyal audio mentah menjadi ciri MFCC. Sinyal audio dibaca frame demi frame, dan dilakukan windowing untuk setiap frame untuk berikutnya dilakukan transformasi Fourier. Dari nilai hasil transformasi Foruier ini selanjutnya dihitung spektrum mel menggunakan sejumlah filter yang dibentuk sedemikian sehingga jarak antar pusat filter adalah konstan pada ruang frekuensi mel. Dari literatur yang ada, skala mel ini dibentuk untuk mengikuti persepsi sistem Hamming Window Dicsrete Fourier Transform Mel- Frequency Wrapping Dicsrete Cosine Transform Sinyal Ciri MFCC