Simpulan Saran Perbandingan metode voting feature intervals dengan jaringan saraf tiruan dalam mengklasifikasi genre musik
Han J, Kamber M. 2001. Data Mining : Concept, Model, Methods, and Algorithm. New Jersey: Wiley-Interscience.
Hayne M. Mee D, Rumble R. Influence of Music Genre and Composition on Entertainment Noise Limits. Proceedings of ACOUSTIC 2005;
Busselton, Western Australia. 9-11 November 2005. Jang, JSR. Sun, CT, Mizutani, E. 1997. Neuro Fuzzy and Soft Computing, A
Computanional Approach to Learning and Machine Intelligence, International Edition, Prentice-Hall International Inc.
Kantardzic M. 2003. Data Mining : Concept and Techniques. San Fransisco: Morgan Kaufmann Publisher.
Kusumadewi, S. 2004. Membangun Jaringan Saraf Tiruan Menggunakan Matlab dan Excel Link. Yogyakarta. Graha Ilmu.
Lai HK. 2003. Speech Processing Workstation, Project Report. New Zealand: University of Auckland.
Lampropoulus, AS. Lampropoulou, PS. Tsihrintzis, GA. 2005. Musical Genre Classification Enhanced by Improved Source Separation
Techniques. University of Piraeus. McKay C. 2004. Issues in Automatic Musical Genre Classification. Faculty
of Music, McGill University. Nilsson M, Ejnarsson M. 2002. Speech Recognition using Hidden Markov
Model [tesis]. Karlskrona, Sweden: Blekinge Institute of Technology. Norowi NM, Doraisamy S, Wirza R. 2005. Factors Affecting Automatic
Genre Classification : An Investigation Incorporating Non-Western Musical Forms. Faculty of Computer Science and Information
technology, University Putra Malaysia. Rabiner LR, Juang BH. 1993, Fundamentals of Speech Recognition. New
Jersey: Prentice Hall. ISBN 0-13-015157-2. Rumelhart, D. E., Hinton, G. E., and Williams, R. J. 1986. Learning
Internal Representations by Error Propagation. In Parallel Distributed Processing, Volume 1. MIT Press, Cambridge, MA.
Tzanetakis G, Cook P. 2000. Marsyas : A framework for Audio Analysis. Organised Sound, 43.
Tzanetakis G, Cook P. 2002. Musical Genre Classification of Audio Signals. IEEE Transactions on Speech and Audio Processing, 105.
Wang Y, Liu Z, Huang J. 2000. Multimedia Content Analysis. IEEE Signal Processing Magazine. hlm. 12-36.
Welsh NM, von Behren B, Woo A. 1999. Querying Large Collections of Music for Similarity. Technical report UCBCSD00-1096. Berkeley:
Computer Science Department, UC.
LAMPIRAN
Lampiran 1. Prediksi sistem dengan Metode VFI dengan ciri 7 koefisien MFCC, 30 detik waktu berkas musik pada fold kedua
No. Lagu
Klasik Disko
Metal Reggae
Sebenarnya Prediksi
1 K16
0,7916667 0,0416667 0,0833333 0,0833333 K
K 2
K17 0,8333333
0 0,1666667 K
K 3
K18 0,7404762 0,0904762 0,0738095 0,0952381
K K
4 K19
0,4734541 0,1881005 0,0709534 0,267492
K K
5 K20
0,8833333 0,0333333 0,0166667 0,0666667 K
K 6
D16 0,3885017
0,109281 0,2729384 0,2292789 D
K 7
D17 0,1446912 0,3996632 0,2833934 0,1722522
D D
8 D18
0,4466341 0,1480256 0,1324623 0,2728781 D
K 9
D19 0,3876263 0,2592172 0,1233586
0,229798 D
K 10
D20 0,2270616 0,3429706 0,2061266 0,2238412
D D
11 M16
0,3072391 0,3332912 0,2830808 0,0763889 M
D 12
M17 0,1186924 0,3362087 0,3321979 0,2129011
M D
13 M18
0,1306563 0,3110602 0,4208792 0,1374044 M
M 14
M19 0,0989103 0,4294163 0,2184982 0,2531752
M D
15 M20
0,1511068 0,2286978 0,4726583 0,1475371 M
M 16
R16 0,0677735 0,2879691 0,2571821 0,3870753
R R
17 R17
0,2745562 0,3540655 0,1613738 0,2100045 R
D 18
R18 0,1684228 0,1873713 0,2656855 0,3785204
R R
19 R19
0,1085898 0,275214 0,2087128 0,4074835
R R
20 R20
0,2731481 0,2662037 0,1805556 0,2800926 R
R
Lampiran 2. Prediksi sistem dengan Metode VFI dengan ciri 7 koefisien MFCC, 30 detik waktu berkas musik pada fold ketiga
No. Lagu
Klasik Disko
Metal Reggae
Sebenarnya Prediksi
1 K6
0,6355519 0,1222944 0,1374459 0,1047078 K
K 2
K7 0,425407 0,1476567
0,174713 0,2522233 K
K 3
K8 0,4940553 0,2107297 0,1238404 0,1713745
K K
4 K9
0,5518637 0,186155 0,0927207 0,1692605
K K
5 K10
0,3108915 0,186155 0,2038318 0,2991217
K K
6 D6
0,1096157 0,3288192 0,3781443 0,1834208 D
M 7
D7 0,0810443 0,4288192 0,3067158 0,1834208
D D
8 D8
0,1381871 0,3347715 0,2769539 0,2500875 D
D 9
D9 0,1096157 0,3157239 0,3245729 0,2500875
D M
10 D10
0,2245225 0,2498854 0,2396868 0,2859053 D
R 11
M6 0,1346157 0,2836861 0,3856724 0,1960258
M M
12 M7
0,0964104 0,2187251 0,4006033 0,2842611 M
M 13
M8 0,1096157 0,1747575 0,5053152 0,2103116
M M
14 M9
0,1096157 0,2335811 0,3305253 0,3262779 M
M 15
M10 0,1124819 0,2866873 0,3486075 0,2522233
M M
16 R6
0,1256871 0,2211861 0,1088866 0,5442401 R
R 17
R7 0,1096157 0,2204858 0,1340967 0,5358018
R R
18 R8
0,1256871 0,2479718 0,1535295 0,4728116 R
R 19
R9 0,1542586 0,2688052 0,1088866 0,4680497
R R
20 R10
0,4114014 0,1854718 0,1088866 0,2942401 R
K
Lampiran 3. Prediksi sistem dengan Metode VFI dengan ciri 7 koefisien MFCC, 30 detik waktu berkas musik pada fold keempat
No. Lagu
Klasik Disko
Metal Reggae
Sebenarnya Prediksi
1 K1
0,5035461 0,2654991 0,0742831 0,1566717 K
K 2
K2 0,547619 0,1933107 0,0972695 0,1618008
K K
3 K3
0,4047619 0,3004535 0,0347695 0,2600151 K
K 4
K4 0,5596927 0,1708601 0,0866637 0,1827836
K K
5 K5
0,6968254 0,0888889 0,1428571 0,0714286 K
K 6
D1 0,1673316 0,2136841 0,1545649 0,4644194
D R
7 D2
0,0273556 0,509266 0,1999099 0,2634685
D D
8 D3
0,1146572 0,4338692 0,2855581 0,1659155 D
D 9
D4 0,0485816 0,3087148 0,4400387 0,2026649
D M
10 D5
0,2291413 0,2283959 0,2664128 0,27605
D R
11 M1
0,1194191 0,277744
0,525228 0,0776089 M
M 12
M2 0,0416413 0,2357011
0,461218 0,2614396 M
M 13
M3 0,2479905 0,3519143 0,2501919 0,1499033
M D
14 M4
0,0382979 0,3682355 0,3502686 0,2431979 M
D 15
M5 0,0670382 0,2896488 0,4956645 0,1476486
M M
16 R1
0,2862842 0,2149039 0,1536482 0,3451637 R
R 17
R2 0,0596927
0,255937 0,2722146 0,4121557 R
R 18
R3 0,1226556 0,2635881 0,2584597 0,3552965
R R
19 R4
0,1839982 0,2550654 0,1392117 0,4217247 R
R 20
R5 0,2767604 0,2291896 0,1028546 0,3911955
R R
Lampiran 4. Prediksi sistem dengan Metode JST dengan ciri 13 koefisien MFCC, 10 detik waktu berkas musik pada fold kedua
No. Lagu
Klasik Disko
Metal Reggae
Sebenarnya Prediksi
1 K16
0,0026902 1,668E-05 9,413E-12 1
K R
2 K17
1 2,948E-05 4,762E-09 4,001E-07
K K
3 K18
1 4,488E-05 1,129E-10 1,871E-06
K K
4 K19
0,999962 5,766E-06 0,9915043
K K
5 K20
1 5,722E-11 6,086E-09 5,097E-09
K K
6 D16
0,0002962 0,0001718 2,235E-12 D
K 7
D17 0,8894274 0,0943354 1,568E-09
D D
8 D18
0,9960964 0,9999886 5,218E-15 1,586E-06 D
D 9
D19 0,1111004 0,6167787 1,887E-15 6,306E-08
D D
10 D20
1,164E-12 1
D R
11 M16
5,551E-17 1,151E-05 0,9999921 M
M 12
M17 2,958E-10 0,9982838 0,9999999 5,793E-11
M M
13 M18
2,018E-06 0,9999976 2,343E-13 M
M 14
M19 1,341E-12 0,9999979
0,999853 3,468E-05
M D
15 M20
0,0005595 0,9996645 3,009E-10 M
M 16
R16 1,792E-06
8,557E-11 0,8622164 R
R 17
R17 0,9999567
0,9366358 R
D 18
R18 1,21E-07
5,551E-17 1
R R
19 R19
5,299E-06 3,05E-10
1,206E-13 1
R R
20 R20
1,198E-07 1
R R
Lampiran 5. Prediksi sistem dengan Metode JST dengan ciri 13 koefisien MFCC, 10 detik waktu berkas musik pada fold ketiga
No. Lagu
Klasik Disko
Metal Reggae
Sebenarnya Prediksi
1 K6
0,7580475 0,0187478 0,0049602 9,572E-07 K
K 2
K7 0,9854195 0,5459333 0,0217173
1,49E-07 K
K 3
K8 0,9864808
0,000115 0,0316341 0,0007921
K K
4 K9
0,9993517 0,0071214 0,523228
1,447E-12 K
K 5
K10 0,9556504 0,0001662 0,0001021 0,9999999
K R
6 D6
6,784E-05 0,9765964 0,0302286 5,362E-05 D
D 7
D7 0,0002008 0,9737478 0,1569229
2,25E-09 D
D 8
D8 3,716E-05 0,9828505
0,004859 5,685E-06
D D
9 D9
0,0002112 0,9495207 0,3270895 2,232E-11 D
D 10
D10 7,987E-05
0,673826 0,0062544 3,284E-07
D D
11 M6
0,0018417 0,9894321 0,0711125 0,0002826 M
D 12
M7 0,0152057
0,000229 0,9757417
3,1E-05 M
M 13
M8 0,0003292 0,0020528 0,9986078
6,52E-07 M
M 14
M9 0,0002657 0,4194286 0,2167519 0,0003305
M D
15 M10
5,737E-06 0,989934
0,0132318 7,339E-05 M
D 16
R6 0,0006757 0,5400892 0,0002535
0,965059 R
R 17
R7 0,0005992 0,0327941 0,0003729 0,9999999
R R
18 R8
0,0016562 0,0199238 0,0001455 1
R R
19 R9
0,0012209 0,1198935 0,0009152 0,9997532 R
R 20
R10 0,0390726 0,0187286 8,017E-05 0,9999637
R R
Lampiran 6. Prediksi sistem dengan Metode JST dengan ciri 13 koefisien MFCC, 10 detik waktu berkas musik pada fold keempat
No. Lagu
Klasik Disko
Metal Reggae
Sebenarnya Prediksi
1 K1
0,9664646 1,417E-05 0,9999943
K R
2 K2
0,9428953 0,0136088 2,054E-15 1,043E-07 K
K 3
K3 0,9979345 5,031E-05 2,183E-11 3,968E-06
K K
4 K4
0,999304 1,005E-13
6,88E-12 0,8957108
K K
5 K5
0,5895183 0,0093555 1,014E-12 1,826E-13 K
K 6
D1 3,6E-07
0,9999999 5,157E-05
D D
7 D2
9,098E-14 1
1,035E-08 2,109E-15 D
D 8
D3 2,258E-10 0,1220503 1,262E-06 1,979E-07
D D
9 D4
1,507E-11 0,1827688 0,9880998 2,354E-12 D
M 10
D5 2,97E-08
2,441E-09 0,9693352 1,885E-07 D
M 11
M1 8,022E-10 0,1108836 0,9999986
M M
12 M2
2,243E-10 5,275E-05 0,9987326 7,216E-16 M
M 13
M3 8,028E-08 0,9993343 0,0169557
M D
14 M4
7,969E-12 0,9605371 0,9997328 M
M 15
M5 5,02E-10
7,892E-11 1
8,791E-13 M
M 16
R1 2,246E-06 1,269E-09 1,034E-13
1 R
R 17
R2 1,083E-10 0,0002381
1 R
R 18
R3 9,97E-06
8,049E-15 0,4207323 0,9999813 R
R 19
R4 4,345E-11 2,413E-06 6,203E-10 0,9999278
R R
20 R5
0,166197 1,665E-16 4,057E-09
1 R
R
ABSTRACT
SYAHZAM. Comparison of Voting Feature Intervals with Neural Network Methode in Classifying Music Genre. Under direction of AGUS BUONO
and AZIZ KUSTIYO.
Music genre is one of the important descriptions that have been used to classify digital music. The aim of this research is to compare Voting
Feature Intervals VFI methode with the Neural Network NN methode in
classifying music genre. There are 12 scenarios of feature extractions in this research. Three
variations of MFCC coefficient number 7, 13 and 20 coefficients and four variations of music length 1, 5, 10, and 30 seconds. From each of the
feature vector, mean was calculated. For the NN methode after the feature vectors were extracted, normalization was applied using the cumulative
normal distribution methode.
This research shown that the optimal number of MFCC coefficients was 13 coefficients. NN predictions were better than VFI predictions. NN
has an accuracy up to 95 which was obtained by using 30 neurons of hidden layer, 10 seconds length of music and 13 MFCC coefficients. While
the VFI has an accuracy up to 85 which was obtained by using 30 seconds length of music and 7 MFCC coefficients. Both experiments that used 13
and 20 coefficients of MFCC feature obtained same accuracy using the NN method. Classic genre has an accuracy of 100 in VFI. The reliability of
the system was 57,14 for disco up to 94,44 for classic.
Keywords : Music genre, Voting Feature Intervals, Neural Network, Mel- Frequency Cepstral Coefficents
RINGKASAN
SYAHZAM. Perbandingan Metode Voting Feature Intervals Dengan Jaringan Saraf Tiruan Dalam Mengklasifikasi Genre Musik. Dibimbing oleh
AGUSU BUONO dan AZIZ KUSTIYO.
Perkembangan teknologi media penyimpanan storage digital dan pertambahan kapasitas lebar pita jaringan di dunia telah mengakibatkan
terciptanya koleksi musik digital yang sangat banyak yang dapat dinikmati oleh beragam pengguna komputer. Oleh karena itu, dibutuhkan sebuah
sistem yang memiliki kemampuan untuk manajemen dan mengambil retrieve secara otomatis koleksi berkas musik yang sangat banyak dari
dalam media penyimpanan
Genre musik adalah salah satu deskripsi penting yang digunakan untuk mengklasifikasi musik. Tujuan utama penelitian ini adalah untuk
mengembangkan suatu prototipe sistem yang dapat digunakan untuk mengklasifikasi musik digital berdasarkan genrenya dengan menggunakan
metode Voting Feature Intervals VFI dan membandingkan akurasi prototipe sistem ini dalam mengenali genre musik dengan metode Jaringan
Saraf Tiruan JST.
Jumlah dataset yang digunakan pada penelitian ini adalah 80 berkas musik berformat au mono 16-bit yang memiliki frekuensi sampling sebesar
22,05 kHz dengan durasi 30 detik setiap berkasnya. Setiap genre akan memiliki 20 berkas musik yang dapat dijadikan sebagai data pelatihan dan
pengujian. Genre musik yang akan dipakai untuk penelitian ini adalah genre musik klasik, disko, metal dan reggae.
Terdapat 12 skenario ekstraksi ciri pada penelitian ini yaitu tiga variasi jumlah koefisien MFCC 7, 13 dan 20 koefisien dan empat variasi
penggunaan waktu berkas musik 1, 5, 10 dan 30 detik. Ciri yang diekstrak diperlakukan window Hamming dengan time frame 30 ms mili detik serta
overlap sebesar 75.
Dari setiap ciri tersebut, mean rataan dihitung untuk membentuk vektor ciri.
Untuk metode JST, setelah ciri diekstrak maka dilakukan normalisasi menggunakan metode distribusi normal kumulatif.
Hasil penelitian menunjukkan bahwa penggunaan ciri koefisien MFCC optimum yaitu 13 koefisien dengan hasil akurasi yaitu 95. Hasil
akurasi tersebut juga didapatkan dengan pengunaan ciri 20 koefisien MFCC. Hasil akurasi cenderung meningkat dengan bertambahnya besaran waktu
berkas musik yang digunakan dimana akurasi pada penggunaan waktu 1 detik yaitu 80 dan akurasi pada penggunaan waktu 30 detik yaitu 95
pada metode JST dengan 13 dan 20 koefisien MFCC. Akurasi dengan metode JST memiliki akurasi yang terbaik yaitu 95 yang diperoleh dengan
jumlah layer hidden neuron sebanyak 30 layer pada 10 detik waktu berkas musik dan penggunaan ciri 13 koefisen MFCC. Akurasi dengan metode VFI
mencapai hingga 85 dengan 30 detik waktu berkas musik dan penggunaan ciri 7 koefisien MFCC. Genre musik yang paling mudah dikenali pada
metode VFI yaitu genre klasik dengan akurasi sebesar 100. Reliabilitas pada genre musik berkisar dari 57,14 pada genre disko hingga 94,44
pada genre klasik.
Penelitian ini masih dapat dikembangkan sebagai upaya untuk meningkatkan akurasi model VFI ataupun JST dalam melakukan prakiraan
atau prediksi genre musik, antara lain dengan menambah data training dan testing. Pada penelitian ini, data set yang digunakan sebanyak 80 data. Oleh
karena itu, diperlukan penelitian lebih lanjut dengan menggunakan data set yang lebih banyak sehingga memperoleh akurasi yang lebih baik. Perlu
dilakukan pengujian dengan menambahkan ciri selain dari MFCC dan melihat kinerja akurasi kedua metode dalam mengklasifikasi genre musik.
Kata Kunci : Genre musik, Voting Feature Intervals, Jaringan Saraf Tiruan, Mel-Frequency Cepstral Coefficents
PERBANDINGAN METODE VOTING FEATURE
INTERVALS DENGAN JARINGAN SARAF TIRUAN DALAM MENGKLASIFIKASI
GENRE MUSIK
SYAHZAM
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2011
I PENDAHULUAN