Penerapan SOM untuk Pengenalan Nada pada Angklung Modern

PENERAPAN SOM UNTUK PENGENALAN NADA PADA
ANGKLUNG MODERN

AREN AUDITA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan SOM untuk
Pengenalan Nada pada Angklung Modern adalah benar karya saya dengan arahan
dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada
perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya
yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam
teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Februari 2014
Aren Audita
NIM G64114016

ABSTRAK
AREN AUDITA. Penerapan SOM untuk Pengenalan Nada pada Angklung
Modern. Dibimbing oleh AGUS BUONO.
Angklung merupakan warisan budaya Indonesia yang berasal dari Jawa
Barat dan telah berkembang mengikuti perkembangan musik yang modern.
Tujuan penelitian ini adalah menerapkan metode self-organizing maps (SOM) dan
ekstraksi ciri mel-frequency cepstrum coefficients (MFCC) serta mengetahui
akurasinya. Data yang digunakan sebanyak 300 nada angklung yang dimainkan
dengan cara dicetok dari 12 nada diatonis yang masing-masing nadanya sebanyak
25 suara. Data nada direkam selama 3 detik dengan beberapa cetokan dalam
memainkannya. Proses awal adalah membuat nada menjadi satu cetokan saja,
kemudian dinormalisasi, lalu diekstraksi ciri dengan 26 koefisien cepstral MFCC.
Pembagian data latih dan uji dilakukan secara acak dengan komposisi setiap nada
yaitu 19 data latih dan 5 data uji. Penelitian ini melakukan tiga ulangan di radius
0, 1, dan 2 dengan data latih, data uji, dan 10 nilai parameter laju pembelajaran
pada SOM yang berbeda di tiap ulangannya. Hasil clustering dengan SOM

menghasilkan akurasi terbaik sebesar 98.33% di radius 1 pada ulangan 1 dan 3,
serta di radius 2 pada ulangan 1 dengan laju pembelajaran yang sama di kedua
radius yaitu 0.0090.
Kata kunci: angklung, clustering, MFCC, nada diatonis, SOM

ABSTRACT
AREN AUDITA. Application of SOM for Tones Recognition on Modern
Angklung. Supervised by AGUS BUONO.
Angklung is an Indonesian cultural heritage from West Java and has been
developed following the development of modern music. The purpose of this
research is to recognize the tone of angklung by using self-organizing maps
(SOM) and mel-frequency cepstrum coefficients (MFCC) feature extraction. The
used data were 300 tones of angklung that were played by staccato of 12 diatonic
tones, each tone by 25 voices. Tones data were recorded for 3 seconds with some
staccato in play. The initial process was making the data into one staccato tone,
normalized, and then its characteristics were extracted with 26 cepstral
coefficients MFCC. Distribution of training and test data was conducted randomly
by the composition of 19 training data and 5 test data for each tone. This research
conducted three repetitions on radius 0, 1, and 2 with training data, test data and
learning rate of 10 parameter values at different SOM in each of their repetition.

The result shows that the best accuracy obtained was 98.33% at a radius of 1 in
repetition 1 and 3, as well as at a radius of 2 in repetition 1 with a common
learning rate in both radius, 0.0090.
Keywords: angklung, clustering, diatonic tones, MFCC, SOM

PENERAPAN SOM UNTUK PENGENALAN NADA PADA
ANGKLUNG MODERN

AREN AUDITA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Ilmu Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR

2014

Penguji:
1 Aziz Kustiyo, SSi MKom
2 Toto Haryanto, SKom MSi

Judul Skripsi : Penerapan SOM untuk Pengenalan Nada pada Angklung Modern
Nama
: Aren Audita
NIM
: G64114016

Disetujui oleh

Dr Ir Agus Buono, MSi MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom

Ketua Departemen

Tanggal Lulus:

Judul Skripsi: Penerapan SOM untuk Pengenalan Nada pada Angklung Modem
Nama
: Aren Audita
NIM
: G64114016

Disetujui oleh

Dr If

>1U

セM

Tanggal Lulus:


r
,'

u uono MSi MKom
Pembimbing

Ket'Ua Departemen
- -'

o 4 MAR 2014

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian ini ialah pengenalan suara, dengan judul Penerapan SOM
untuk Pengenalan Nada pada Angklung Modern.
Terima kasih penulis ucapkan kepada:
1 Ayah dan seluruh keluarga atas segala doa, dukungan dan kasih sayangnya
khususnya untuk ibu saat masih menemani dalam pengerjaan karya ilmiah ini.
2 Bapak Dr Ir Agus Buono, MSi MKom selaku dosen pembimbing yang telah

banyak memberi saran saat bimbingan.
3 Bapak Aziz Kustiyo, SSi MKom dan Bapak Toto Haryanto, SKom MSi selaku
dosen penguji atas kesediaannya sebagai penguji.
4 Suhermanto dan Sarah dari Lises Gentra Kaheman IPB yang telah membantu
selama pengumpulan data.
5 Teman-teman Ilkom alih jenis angkatan 6 khususnya teman-teman satu
bimbingan yang senantiasa memberikan dukungan dan bantuan selama
pengerjaan karya ilmiah ini.
Semoga karya ilmiah ini bermanfaat.

Bogor, Februari 2014
Aren Audita

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR


vi

PENDAHULUAN

1

Latar Belakang

1

Tujuan Penelitian

3

Manfaat Penelitian

3

Ruang Lingkup Penelitian


3

METODE

3

Lingkungan Pengembangan

3

Studi Literatur

4

Pengambilan Data Nada Angklung

4

Praproses


5

Pembagian Data Latih dan Data Uji

8

Pemodelan SOM (Self-Organizing Maps)

8

Pengujian

9

Rancangan Percobaan

9

HASIL DAN PEMBAHASAN


10

Pengambilan Data Nada Angklung

10

Praproses

10

Pembagian Data Latih dan Data Uji

10

Struktur SOM

11

Hasil dan Analisis Percobaan

11

SIMPULAN DAN SARAN

15

Simpulan

15

Saran

16

DAFTAR PUSTAKA

16

RIWAYAT HIDUP

18

DAFTAR TABEL
1
2
3
4

Nada angklung melodi
Hasil randperm data uji
Akurasi 91.67% ulangan 3 radius 0
Akurasi 91.67% ulangan 2 radius 0

2
10
14
15

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Angklung
Tahapan proses penelitian
Alur praproses
Alur ambil satu cetokan nada
Diagram alur proses MFCC
Kohonen self-organizing maps
Akurasi radius 0
Rata-rata akurasi radius 0
Akurasi radius 1
Akurasi radius 2
Akurasi radius 0, 1, dan 2
Rata-rata akurasi radius 1
Rata-rata akurasi radius 2
Rata-rata akurasi dari 3 ulangan di 3 radius

1
4
5
6
7
9
11
11
12
12
13
13
13
14

PENDAHULUAN
Latar Belakang
Angklung merupakan warisan budaya dari Indonesia yang berasal dari
daerah Jawa Barat. Angklung adalah alat musik yang terdiri atas dua sampai
empat tabung bambu yang digantung dalam bingkai bambu dan terikat dengan tali
rotan. Pada bulan November 2010, UNESCO telah mengakui angklung sebagai
warisan kebudayaan dunia dari Indonesia dengan kategori “Intangible Cultural
Heritage of Humanity” (UNESCO 2010).
Angklung telah berkembang mengikuti perkembangan musik yang modern.
Angklung yang awalnya hanya memiliki nada pentatonis, kini telah berkembang
menjadi nada diatonis. Nama nada pada skala pentatonis yaitu C, D, E, G, dan A,
sedangkan pada skala diatonis yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, dan B.
Angklung diatonis ini dikembangkan oleh Bapak Daeng Soetigna pada tahun
1938 yang kemudian diberi nama angklung Padaeng. Menurut Kemdikbud RI
(tahun tidak diketahui), angklung ini dikelompokkan menjadi dua yaitu angklung
melodi dan angklung akompanimen (pengiring). Jenis angklung ini dapat dilihat
pada Gambar 1. Jenis angklung pada Gambar 1 dari kiri ke kanan yaitu angklung
melodi 2 tabung, angklung melodi 3 tabung, angklung mayor akompanimen, dan
angklung minor akompanimen. Satu set unit angklung melodi terdapat 31
angklung melodi kecil dan 11 angklung melodi besar. Nada angklung melodi kecil
dapat dilihat pada Tabel 1. Cara memainkan angklung ini ada tiga yaitu:
1 Kurulung (getar)
Satu tangan memegang rangka angklung, kemudian tangan yang lainnya
menggoyangkan angklung selama nada yang diinginkan.
2 Cetok (sentak)
Tabung dasar ditarik dengan cepat oleh jari ke telapak tangan, sehingga nada
yang dihasilkan akan berbunyi sekali saja (staccato).
3 Tengkep
Teknik yang mirip dengan kurulung, hanya saja salah satu tabung ditahan agar
tidak bergetar.

Gambar 1 Angklunga
a

Sumber: http://www.angklung-udjo.co.id/wp-content/uploads/2010/01/angklung-range.jpg.

2
Tabel 1 Nada angklung melodib
Oktaf
Nada
Melodi
F#
0
3
G
1
G#
2
A
3
A#
4
B
5
4

C
C#
D
D#
E
F
F#
G
G#
A
A#
B

6
7
8
9
10
11
12
13
14
15
16
17

5

C
C#
D
D#
E
F
F#
G
G#
A
A#
B

18
19
20
21
22
23
24
25
26
27
28
29

6

C

30

Bagi orang biasa atau pemula dalam bidang musik, untuk menghasilkan
nada pada angklung ini cukuplah mudah. Akan tetapi, untuk mengenali nada pada
angklung tersebut, mereka membutuhkan waktu untuk mengenalinya. Tentunya
hal ini berbeda dengan seorang ahli musik yang sudah terbiasa memegang alat
musik ini. Oleh karena itu, sistem pengenalan nada pada angklung dibutuhkan
untuk membantu dalam mengenali nada tersebut.
Penelitian tentang pengenalan nada angklung ini masih jarang ditemukan.
Penelitian yang akan dilakukan yaitu dengan mencoba menggunakan metode selforganizing maps (SOM) sebagai pengenalan pola dan mel-frequency cepstrum
coefficients (MFCC) sebagai fitur ekstraksi cirinya. Pemilihan kedua metode ini
b

Sumber: http://klungbot.com/wp-content/uploads/2013/04/tabel-nada-angklung.pdf.

3
berdasarkan penelitian yang dilakukan oleh Zak (2011) dan Monte et al. (1996).
Pada penelitian Zak (2011) menghasilkan akurasi di atas 90%, sedangkan pada
penelitian Monte et al. (1996) menghasilkan akurasi 100%. Alasan lainnya adalah
Davis dan Mermelstein telah membuktikan bahwa MFCC memberikan akurasi
tertinggi dibandingkan dengan fitur ekstraksi lainnya (Buono et al. 2011; Ganchev
2005).
Angklung yang digunakan dalam penelitian ini adalah angklung melodi
kecil 2 tabung Padaeng yang akan dimainkan dengan cara dicetok. Nada yang
dipilih adalah nada diatonis dalam satu oktaf yang berada pada oktaf keempat.
Tujuan Penelitian
Tujuan dari penelitian ini ialah:
1 Menerapkan metode SOM dan teknik ekstraksi ciri MFCC dalam pengenalan
nada pada angklung.
2 Mengetahui akurasi pengenalan nada pada angklung dengan menggunakan
metode SOM dan teknik ekstraksi ciri MFCC.
Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan informasi mengenai akurasi
penggunaan metode SOM dalam pengenalan nada pada angklung.
Ruang Lingkup Penelitian
Ruang lingkup dalam penelitian ini ialah:
1 Nada yang akan dikenali adalah nada diatonis dalam satu oktaf yang berada
pada oktaf keempat.
2 Nada yang akan dikenali adalah nada angklung yang dimainkan dengan cara
staccato (dicetok).
3 Jenis angklung yang dipakai adalah angklung melodi kecil 2 tabung Padaeng.

METODE
Penelitian ini dilakukan dengan beberapa tahapan proses, yaitu studi
literatur, pengambilan data nada angklung, praproses, pemodelan SOM, dan
pengujian. Tahapan proses penelitian ini dapat dilihat pada Gambar 2.
Lingkungan Pengembangan
Penelitian ini menggunakan perangkat keras dan perangkat lunak dengan
spesifikasi sebagai berikut:
1 Perangkat Keras
 Processor Intel Core 2 Duo CPU @ 2.10 GHz.
 Memori 4 GB.
 Harddisk 300 GB.
 Keyboard dan mouse.

4
 Monitor.
2 Perangkat Lunak
 Sistem operasi Windows XP Professional 32 bit.
 Matlab 7.7.0 (R2008b).
Mulai
Studi Literatur
Pengambilan Data Nada Angklung
Praproses

Data
Latih

Data
Uji

Pemodelan SOM

Data Bobot
Hasil SOM

Pengujian

Selesai

Gambar 2 Tahapan proses penelitian
Studi Literatur
Tahapan ini melakukan pencarian dan pembelajaran tentang apa yang
dibutuhkan dalam penelitian ini. Hal-hal yang dibutuhkan antara lain tentang
metode SOM dan juga MFCC. Selain itu, hal-hal yang terkait dengan pengenalan
suara akan dicari dan dipelajari untuk dijadikan referensi dalam penelitian ini.
Pengambilan Data Nada Angklung
Data yang digunakan dalam penelitian ini adalah 12 jenis nada angklung
yang dimainkan dengan cara dicetok kemudian direkam. Angklung yang
digunakan berasal dari Lises Gentra Kaheman IPB. Dua belas jenis nada tersebut
yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, dan B. Masing-masing nada tersebut
direkam sebanyak 25 kali sehingga didapatkan untuk setiap nada memiliki 25 data
suara. Data direkam di ruangan yang hening guna menghindari noise. Data nada
direkam selama 3 detik dengan sampling rate 11 000 Hz, bit rate sebesar 16 bit,

5
dan ekstensi fail WAV. Selama 3 detik itu terdapat beberapa cetokan dalam
memainkannya.
Praproses
Tahapan ini membuat setiap nada yang awalnya terdapat beberapa cetokan
menjadi satu cetokan saja. Alur dari tahapan ini dapat dilihat pada Gambar 3. Pada
tahap silence removing di awal, data yang terdapat silent di awal akan dibuang.
Setelah itu, data akan diambil satu cetokan di awal saja. Untuk membuat nada
menjadi satu cetokan di awal saja, nada akan diambil dari awal dalam kondisi
bersuara hingga ditemukannya kondisi nada yang silent. Dalam mendeteksi
kondisi silent itu, proses ini akan menggunakan algoritma silence removal dan
endpoint detection yang dilakukan oleh Saha et al. (2005). Alur dari proses ini
dapat dilihat pada Gambar 4. Setelah itu, data akan dinormalisasi sehingga semua
data memiliki nilai maksimum 1 atau nilai minimum -1. Kemudian, data
diekstraksi ciri dengan menggunakan MFCC. Diagram alur proses MFCC dapat
dilihat pada Gambar 5 (Do 1994).

Silence Removing
di awal

Membuat nada menjadi satu
cetokan

Normalisasi

Ekstraksi ciri
MFCC
Mel Cepstrum

Gambar 3 Alur praproses

6
Mulai
Baca x (i) & Hitung μ, σ
x(i) = sampel nada yang ke i
μ = rata-rata; σ = simpangan baku
While x (i) z
z = threshold
x dibagi menjadi
beberapa frame

ya
Tandai x (i) dengan 1
(Sampel bersuara)

Untuk setiap frame, tandai 1 jika
di dalam frame itu lebih banyak
sampel bersuara dibandingkan
sampel tidak bersuara dan tandai 0
jika sampel tidak bersuara yang
lebih banyak
Ambil frame awal yang bersuara sampai
bertemu frame yang tidak bersuara

Selesai

Gambar 4 Alur ambil satu cetokan nada
MFCC ini sering digunakan sebagai ekstraksi ciri dalam pengenalan suara,
karena dapat merepresentasikan ciri sebuah sinyal suara (Do 1994). MFCC ini
mengubah sinyal suara ke dalam bentuk matriks yang berukuran jumlah koefisien
dikali dengan banyaknya frame suara yang terbentuk. Beberapa parameter input
dalam proses ini yaitu:
1 Input yang digunakan adalah data suara nada dengan ekstensi WAV.
2 Sampling rate yaitu nilai sinyal suara yang diambil dalam satu detik. Sampling
rate yang digunakan sebesar 11 000 Hz.
3 Time frame yaitu waktu yang dipakai untuk membagi data suara menjadi
beberapa bagian frame. Time frame yang digunakan sebesar 40 ms.
4 Overlapping digunakan untuk mengurangi hilangnya informasi saat proses
frame blocking. Overlapping yang digunakan sebesar 50%.
5 Koefisien cepstral yaitu koefisien ciri yang diinginkan untuk output dari proses
MFCC. Koefisien cepstral yang digunakan sebesar 26 karena dalam penelitian
Wisnudisastra dan Buono (2010) menghasilkan akurasi 96% untuk 26
koefisien cepstral dan akurasi 91% untuk 13 koefisien cepstral.

7
Speech

Frame Blocking

Mel Cepstrum

Frame

Cepstrum

Windowing
Mel-frequency

FFT
Spectrum

Gambar 5 Diagram alur proses MFCC
Frame Blocking
Pada tahapan MFCC ini, sinyal suara akan dibagi menjadi beberapa frame
dari N sampel yang direpresentasikan dalam bentuk vektor. Agar tidak ada
informasi yang hilang, setiap frame yang bersebelahan dibuat menjadi saling
tumpang tindih atau overlap.
Windowing
Proses frame blocking memungkinkan terjadinya diskontinuitas sinyal pada
awal dan akhir setiap frame. Diskontinuitas ini akan menyebabkan terjadinya
distorsi spektral. Untuk menguranginya, tiap frame dilakukan proses windowing.
Metodenya yaitu dengan mengalikan tiap frame dengan fungsi window tertentu.
Fungsi window yang dipakai adalah Hamming window:
w(n) = 0.54 - 0.46 cos(2πn / (N - 1)) , 0  n  N-1
Keterangan:
N = jumlah sampel pada setiap frame
n = frame ke-…
w = fungsi Hamming window
Fast Fourier Transform (FFT)
Proses ini mengubah setiap frame dari domain waktu ke domain frekuensi.
Hal ini dilakukan untuk mempermudah dalam pemrosesan selanjutnya. Hasil dari
proses ini yaitu spektrum atau periodogram. Algoritme dari FFT yaitu:
N-1
Xn = ∑k=0 xk eps(- 2πjkn / N) , n = 0,1,2,…,N-1

Keterangan:
Xn = magnitude frekuensi
xk = nilai-nilai sampel
N = jumlah data sampel
j = bilangan imajiner

Mel-frequency
Persepsi manusia terhadap frekuensi sinyal suara tidak mengikuti skala
linear. Oleh karena itu untuk setiap nada dengan frekuensi aktual f (dalam satuan
Hz), nilai subjektif dari pitch diukur dengan menggunakan skala “mel”. Skala
mel-frequency adalah selang frekuensi linear di bawah 1000 Hz dan selang
logaritmik di atas 1000 Hz. Proses ini umumnya menggunakan filterbank.
Perhitungannya adalah:
N-1
Xi = log10 ∑k=0 |X(k)| Hi (k) , i = 1,2,3,…,M

Keterangan:
Hi (k) = nilai filter segitiga ke i
X(k) = nilai data ke k hasil proses FFT

8
M = jumlah filter
N = banyaknya data
Cepstrum
Proses ini mengubah mel-frequency ke domain waktu dengan menggunakan
Discrete Cosine Transform (DCT). Hasilnya disebut dengan MFCC. Proses DCT:
M

Cj =

Xi cos(j(i - 1)2(π / M))

i=0

Keterangan:
Cj = nilai koefisien C ke j
j = jumlah koefisien cepstral
i = jumlah wrapping
Xi = hasil mel-frequency pada frekuensi ke i
Pembagian Data Latih dan Data Uji
Pada tahap ini, data yang telah melalui tahap praproses akan dipilih secara
acak dari masing-masing nada. Pembagian data tersebut yaitu 19 data suara untuk
data latih, 1 data suara untuk data bobot, dan 5 data suara untuk data uji. Setelah
itu, data latih akan melalui tahap pemodelan SOM sebagai vektor masukan dan
data bobot untuk bobot awal.
Pemodelan SOM (Self-Organizing Maps)
Metode ini merupakan salah satu model jaringan saraf tiruan. Metode ini
disebut juga topology-preserving maps yang berarti struktur topologi antara unit
cluster (Fausett 1994). SOM ini mempunyai bobot vektor setiap unit cluster
sebagai contoh dari pola masukan yang terkait dengan cluster tersebut. Selama
prosesnya, akan dipilih satu cluster sebagai pemenang dan cluster pemenang serta
cluster tetangganya akan memperbaharui bobot cluster. Cluster pemenang ini
ditentukan dari jarak yang terdekat dari bobotnya. Arsitektur dari model SOM
menurut Fausett (1994) dapat dilihat pada Gambar 6.
Menurut Fausett (1994), algoritme dari metode SOM ini yaitu:
1 Inisialisasi
 Bobot wij
 Parameter laju pembelajaran awal (α) dan faktor penurunannya
 Parameter topologi tetangga (R)
2 Selama kondisi penghentian bernilai salah, lakukan langkah 3-9
3 Untuk setiap vektor masukan x, lakukan langkah 4-6
2

4 Hitung D(j) = ∑ (wij - xi ) untuk semua j
5 Tentukan indeks J sehingga D(J) bernilai minimum. D(J) dilihat dari D(j)
6 Modifikasi bobot untuk setiap unit j di sekitar J berdasarkan topologi tetangga
yang telah ditentukan dan untuk seluruh i:
wij (baru) = wij (lama) + α(xi - wij(lama))
7 Modifikasi laju pembelajaran
8 Kurangi radius topologi tetangga pada waktu tertentu
9 Uji kondisi penghentian

9



Y1

W1j

Wn1
W11

X1



Yj

Wi1

Ym

W1m

Wnj
Wij

Wim
Wnm



Xi



Xn

Gambar 6 Kohonen self-organizing maps
Pengujian
Pengujian dilakukan dari data uji yang telah diekstraksi ciri menggunakan
MFCC kemudian di-cluster dengan metode SOM menggunakan bobot dari hasil
SOM data latihnya. Setiap data nada angklung yang diuji akan di-cluster-kan ke
cluster yang sesuai.
Tingkat akurasi sistem akan dihitung untuk mengevaluasi hasil penelitian.
Setiap data yang diuji akan dilihat apakah data tersebut akan masuk ke dalam
cluster yang sesuai. Persentase tingkat akurasi dihitung dengan fungsi berikut:
Hasil=

∑ nada yang benar
× 100%
∑ nada yang diuji

Rancangan Percobaan

Penelitian ini menggunakan data nada dengan perekaman 3 detik, sampling
rate 11 000 Hz, bit rate sebesar 16 bit, ekstensi fail WAV, dan dalam 3 detik itu
terdapat beberapa cetokan dalam memainkannya. Pada tahap MFCC, parameter
yang digunakan adalah sampling rate sebesar 11 000 Hz, time frame sebesar 40
ms, overlapping sebesar 50%, dan 26 koefisien cepstral. Threshold yang
digunakan pada tahap ambil satu cetokan nada sebesar 0.1.
Penelitian ini akan melakukan tiga kali ulangan dengan 10 parameter SOM
berbeda di tiap ulangannya. Setiap ulangan ini mempunyai jumlah yang sama di
setiap nadanya yaitu 19 data latih, 5 data uji, dan 1 data bobot tetapi ada
perbedaan dalam pemilihan secara acak dari masing-masing nada yaitu untuk data
latih dan data uji. Sepuluh parameter SOM yang berbeda itu terletak pada laju
pembelajaran. Laju pembelajaran yang akan digunakan yaitu 0.0001, 0.0003,

10
0.0005, 0.0007, 0.0009, 0.0010, 0.0030, 0.0050, 0.0070, dan 0.0090. Parameter
lainnya dalam pemodelan SOM yaitu 300 epoch, penurunan laju pembelajaran
sebesar 0.1, radius sebesar 0, 1, dan 2, vektor masukan x diambil dari data latih,
bobot awal diambil dari data bobot.

HASIL DAN PEMBAHASAN
Pengambilan Data Nada Angklung
Nada angklung diambil dengan cara direkam langsung menggunakan
perangkat lunak Matlab. Nada tersebut direkam selama 3 detik dengan beberapa
cetokan dalam memainkannya lalu disimpan ke dalam ekstensi fail WAV. Jumlah
data yang direkam sebanyak 300 data nada angklung dari 12 nada yang masingmasing nadanya sebanyak 25 suara.
Praproses
Pada tahap awal praproses ini, data nada dibuat menjadi satu cetokan saja.
Setelah itu, data akan dinormalisasi dengan cara membagi semua nilai nada
dengan nilai maksimum dari absolut nilai nada. Kemudian, data diekstraksi ciri
dengan menggunakan MFCC. Proses MFCC ini menggunakan fungsi auditory
toolbox Matlab. Parameter MFCC yang digunakan yaitu sampling rate sebesar 11
000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan koefisien
cepstral sebesar 26.
Pembagian Data Latih dan Data Uji
Setiap nada akan dibagi menjadi 3 bagian yaitu 19 data suara untuk data
latih, 1 data suara untuk data bobot, dan 5 data suara untuk data uji. Tahap awal
adalah menentukan data ke-25 sebagai data bobot, kemudian memilih secara acak
5 data yang akan menjadi data uji dengan menggunakan fungsi randperm pada
Matlab. Sisa dari data itu akan dijadikan sebagai data latih. Hasil randperm untuk
data uji dapat dilihat pada Tabel 2.

Ulangan
1
2
3

Tabel 2 Hasil randperm data uji
Data uji ke1
2
3
5
24
1
20
6
10
3
9
24

4
13
1
14

5
3
19
10

Tabel 2 menunjukkan pada percobaan di ulangan pertama akan
menggunakan 5 data uji pada urutan data ke-24, 16, 17, 18, dan 23. Ulangan
kedua akan menggunakan 5 data uji pada urutan data ke-9, 16, 23, 14, dan 17
sedangkan pada ulangan ketiga pada urutan data ke-11, 19, 22, 1, 12. Proses

11
pembagian untuk setiap ulangan ini didapatkan sejumlah data latih sebanyak 228,
data uji sebanyak 60, dan data bobot sebanyak 26.
Struktur SOM
Struktur SOM ini memiliki 26 neuron input dan 12 neuron output. Vektor
masukannya ialah data latih dan bobot awalnya ialah data bobot.
bobot Laju
pembelajaran yang digunakan yaitu 0.0001, 0.0003, 0.0005,, 0.0007,
0.
0.0009,
0.0010, 0.0030, 0.0050
0050, 0.0070, dan 0.0090. Parameter lainnya yaitu 300 epoch,
penurunan laju pembelajaran sebesar 0.1, serta radius sebesar 0, 1, dan 2.
2
Hasil dan Analisis Percobaan

Akurasi

Radius 0
Gambar 7 menyajikan akurasi hasil percobaan tiga kali ulangan dengan
sepuluh parameter
meter laju pembelajaran berbeda di setiap
tiap ulangannya. Di gambar ini
terlihat bahwa akurasi terendah yang didapatkan sebesar 88.33% dan akurasi
tertinggi sebesar 91.67%. Ulangan pertama dan ketiga
ga terlihat bahwa semakin
besar laju pembelajarannya,
pembelajarannya, maka semakin rendah akurasi yang didapatkan. Hal
ini dikarenakan kecepatan belajar pada jaringan SOM. Laju pembelajaran yang
besar berarti kecepatan belajarnya pun lebih cepat dan tidak terlalu detail sehingga
pemetaan nadanya tidak terlalu baik. Sebaliknya, laju pembelajaran yang kecil
akan menghasilkan pemetaan nada yang baik karena proses pembelajarannya akan
lebih detail walaupun lama dalam kecepatan belajarnya.
100%
96%
92%
88%
84%
80%

90.00%

88.33%

Ulangan 1

91.67%

Ulangan 2

91.67%

90.00%

Ulangan 3

α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009
α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090

Rata-Rata
Akurasi

Gambar 7 Akurasi radius 0
100%
96%
92%
88%
84%
80%

89.00%

Ulangan 1

91.67%

91.50%

Ulangan 2

Ulangan 3

Gambar 8 Rata-rata akurasi radius 0
Dari Gambar 8, rata-rata
rata rata akurasi terkecil terdapat di ulangan 1 yaitu 89%
dan rata-rata
rata akurasi terbesar terdapat di ulangan 2 yaitu 91.67%. Pada gambar ini
rata rata akurasi yang berbedajuga dapat dilihat bahwa setiap ulangan memiliki rata-rata

12
beda. Hal ini dikarenakan kurang baiknya dalam perekaman nada. Oleh karena itu,
setiap data uji berubah, maka berubah pula akurasi yang didapatkan.
Radius 1 dan Radius 2
Saat radius 1 dan 2 ini, akurasi yang dihasilkan mengalami peningkatan
akurasi.
kurasi. Akurasi yang dihasilkan saat radius 1 dan radius 2 dapat dilihat pada
Gambar 9 dan Gambar 10.. Akurasi tertinggi yang dihasilkan saat
saat radius 1 dan 2
ini sama yaitu 98.33%, begitupun dengan
d
akurasi terendahnya yaitu 90.00%. Pada
radius 1 di semua ulangan
3, semakin kecil laju
ngan dan radius 2 di ulangan 1 dan 3,
nya maka semakin kecil pula akurasi yang dihasilkan. Hal ini
pembelajarannya
berbanding
0 Perbandingan ketiga radius ini dapat dilihat
erbanding terbalik saat radius 0.
pada Gambar 11.
100%

98.33%

Akurasi

96%
92%

93.33%
90.00%

98.33%
96.67%
95.00%
95.00%
93.33% 91.67% 93.33%
91.67%

88%
84%
80%

Ulangan 1

Ulangan 2

Ulangan 3

α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009
α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090

Gambar 9 Akurasi radius 1
100%

Akurasi

96%
92%

98.33%
95.00%
93.33%
90.00%

91.67%

95.00%
95.00%
93.33% 93.33%
91.67%

88%
84%
80%

Ulangan 1

Ulangan 2

Ulangan 3

α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009
α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090

Gambar 10 Akurasi radius 2

96.67%

13
100%

Akurasi

96%
92%
88%
84%
80%

0.0001 0.0003 0.0005 0.0007 0.0009 0.0010 0.0030 0.0050 0.0070 0.0090
Laju Pemahaman
Radius 0 Ulangan 1

Radius 0 Ulangan 2

Radius 0 Ulangan 3

Radius 1 Ulangan 1

Radius 1 Ulangan 2

Radius 1 Ulangan 3

Radius 2 Ulangan 1

Radius 2 Ulangan 2

Radius 2 Ulangan 3

Rata-Rata
Akurasi

Gambar 11 Akurasi radius 0, 1, dan 2
100%
96%
92%
88%
84%
80%

91.50%

92.17%

Ulangan 1

Ulangan 2

94.17%

Ulangan 3

Gambar 12 Rata-rata akurasi radius 1

Rata-Rata
Akurasi

Jika dilihat dari radius 0, 1, dan 2 yang dapat dilihat pada Gambar 8, 12,
12 dan
13, radius 1 dan 2 ini yang lebih tinggi untuk semua ulangan dalam menghasilkan
akurasinya dibandingkan dengan radius 0. Perbedaan rata-rata
rata akurasi di radius 1
dan 2 ini terletak pada ulangan 1 dan 3. Untuk ulangan 1, radius 2 yang
menghasilkan akurasi tertinggi yaitu 91.67%,
91.67%, sedangkan untuk ulangan 3, radius 1
yang menghasilkan akurasi tertinggi yaitu 94.17%.
94.17% Untuk ulangan 2, radius 1 dan
2 ini sama-sama
sama menghasilkan akurasi 92.17%.
100%
96%
92%
88%
84%
80%

91.67%

92.17%

Ulangan 1

Ulangan 2

94.00%

Ulangan 3

Gambar 13 Rata-rata akurasi radius 2
Perbedaan rata--rata
rata akurasi untuk tiap ulangan ini juga terjadi pada radius 1
dan 2. Radius 0, 1, dan 2 ini mengalami perbedaan rata-rata
rata rata akurasi untuk tiap
ulangannya. Hal ini dapat dikatakan bahwa dalam perekaman nada pun dapat
mempengaruhi hasil akurasi yang didapatkan.

Rata-Rata
Akurasi

14
100%
96%
92%
88%
84%
80%

90.72%

92.61%

92.61%

Radius 0

Radius 1

Radius 2

Gambar 14 Rata-rata
Rata
akurasi dari 3 ulangan di 3 radius
Radius yang menghasilkan akurasi tertinggi berdasarkan rata
rata-rata
ulangannya adalah radius 1 dan 2 dengan akurasi sebesar 92.61%, sedangkan yang
90.72% Hal ini dapat dilihat
terendah adalah radius 0 dengan akurasi sebesar 90.72%.
pada Gambar 14. Dapat dikatakan bahwa radius 1 dan 2 inilah yang terbaik
terbai dalam
menghasilkan akurasi.
Analisis Kesalahan Clustering
Kesalahan yang terjadi dalam penempatan cluster ini karena jarak nada yang
kecil yaitu setengah. Contohnya adalah pada percobaan di ulangan 3 dengan
radius 0 yang akurasinya
nya sebesar 91.67% di Tabel 3.. Disini ada 2 nada yang
masuk ke cluster yang salah yaitu
yaitu nada D# dan F. Dua nada D# masuk ke cluster
E serta 3 nada F masuk ke F#. Hal ini terjadi karena nada D# dan E ini berjarak
setengah nada, begitu pun nada F dan F#. Hal serupa terjadi pada ulangan 2
dengan radius 0 di Tabel 4.
4 Bahkan pada percobaan ini terdapat 5 nada F yang
semuanya masuk ke cluster yang salah yaitu F#.
Tabel 3
Nada A A#
A
5 0
A#
0 5
B
0 0
C
0 0
C#
0 0
D
0 0
D#
0 0
E
0 0
F
0 0
F#
0 0
G
0 0
G#
0 0

Akurasi 91.67% ulangan 3 radius 0
B C C# D D# E F F# G G#
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
5 0 0 0 0 0 0 0 0 0
0 5 0 0 0 0 0 0 0 0
0 0 5 0 0 0 0 0 0 0
0 0 0 5 0 0 0 0 0 0
0 0 0 0 3 2 0 0 0 0
0 0 0 0 0 5 0 0 0 0
0 0 0 0 0 0 2 3 0 0
0 0 0 0 0 0 0 5 0 0
0 0 0 0 0 0 0 0 5 0
0 0 0 0 0 0 0 0 0 5

Untuk mengatasinya, penggantian radius perlu dilakukan. Hal ini
dikarenakan nada yang berpengaruh dalam penempatan cluster yang sesuai itu
adalah nada tetangganya yang bersebelahan. Hal ini dapat dilihat dari Tabel 3 dan
4 yang semua kesalahan clustering-nya
clustering nya ada pada jarak nada yang setengah.
Penggantian radius menjadi 1 untuk ulangan 2 dengan laju pembelajaran
0.0090 berhasil menaikkan akurasinya dari 91.67% menjadi 95%. Lima nada F
yang masuk ke cluster F#, setelah diganti radiusnya menjadi 1, kini hanya 3 nada

15
yang masuk ke cluster F#. Saat radius diganti menjadi 2 pun akurasinya
meningkat menjadi 93.33%. Begitupun dengan nada F yang 3 nadanya masih
masuk ke cluster F#. Tetapi dalam radius 2 ini, nada B yang awalnya masuk ke
cluster B semua, sekarang ada 1 nada yang masuk ke cluster yang salah yaitu A#.
Tabel 4
Nada A A#
A
5 0
A#
0 5
B
0 0
C
0 0
C#
0 0
D
0 0
D#
0 0
E
0 0
F
0 0
F#
0 0
G
0 0
G#
0 0

Akurasi 91.67% ulangan 2 radius 0
B C C# D D# E F F# G G#
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
5 0 0 0 0 0 0 0 0 0
0 5 0 0 0 0 0 0 0 0
0 0 5 0 0 0 0 0 0 0
0 0 0 5 0 0 0 0 0 0
0 0 0 0 5 0 0 0 0 0
0 0 0 0 0 5 0 0 0 0
0 0 0 0 0 0 0 5 0 0
0 0 0 0 0 0 0 5 0 0
0 0 0 0 0 0 0 0 5 0
0 0 0 0 0 0 0 0 0 5

Hal ini membuktikan bahwa dengan mengganti radiusnya menjadi 1
ataupun 2, maka akan meminimalisir kesalahan clustering dan dapat
meningkatkan akurasinya. Nada yang masih salah dalam clustering ini
dikarenakan kurang baiknya dalam perekaman nada dan juga kurang baiknya
dalam memainkan angklungnya.

SIMPULAN DAN SARAN
Simpulan
Berdasarkan penelitian yang telah dilakukan, maka dapat disimpulkan
bahwa:
1 Penelitian ini telah berhasil menerapkan metode SOM dan teknik ekstraksi ciri
MFCC dalam pengenalan nada angklung.
2 Akurasi tertinggi yang dihasilkan adalah 98.33% di radius 1 pada ulangan 1
dan 3 serta di radius 2 pada ulangan 1 dengan laju pembelajaran yang sama di
kedua radius yaitu 0.0090. Parameter MFCC yang digunakan yaitu sampling
rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%,
dan 26 koefisien cepstral serta parameter SOM lainnya yaitu 300 epoch,
penurunan laju pembelajaran sebesar 0.1.
3 Saat radius 0, semakin besar laju pembelajaran yang digunakan maka semakin
kecil akurasi yang didapatkan karena proses pembelajaran yang cepat dan tidak
terlalu detail sehingga pemetaan nada tidak baik, sedangkan pada radius 1,
semakin besar laju pembelajaran maka semakin besar akurasi yang didapatkan.

16
4 Perubahan radius dari 0 menjadi 1 ataupun 2, maka akan meminimalisir
kesalahan clustering dan dapat meningkatkan akurasinya.
5 Radius 1 dan 2 memiliki rata-rata akurasi tertinggi dari ulangannya yaitu
sebesar 92.61%.
Saran
Saran untuk pengembangan selanjutnya yaitu:
1 Mencoba dengan data yang lebih banyak lagi untuk dibandingkan hasilnya
dengan penelitian ini.
2 Mencoba memodelkan dengan metode pengenalan pola serta ekstraksi ciri
yang lain untuk dibandingkan akurasinya dengan penelitian ini. Metode
pengenalan pola lain misalnya LVQ, Backpropagation, Counterpropagation,
dan lainnya. Metode ekstraksi ciri misalnya LPCC, LPC, RCC, dan lainnya.
3 Mencoba mengganti parameter-parameter SOM serta MFCC untuk
dibandingkan hasilnya dengan penelitian ini.

DAFTAR PUSTAKA
Buono A, Jatmiko W, Kusumoputro B. 2011. Mel-frequency cepstrum
coefficients as higher order statistics representation to characterize speech
signal for speaker identification system in noisy environment using hidden
markov model. Di dalam: Mwasiagi JI, editor. Self Organizing Maps Applications and Novel Algorithm Design. Rijeka (HR): Intech. hlm 189-206.
doi: 10.5772/566.
Do MN. 1994. Digital signal processing mini-project: an automatic recognition
system. Laussane (CH): Federal Institute of Technology.
Fausett L. 1994. Fundamentals of Neural Networks: Architectures, Algorithms,
and Applications. New Jersey (US): Prentice Hall.
Ganchev TD. 2005. Speaker recognition [disertasi]. Patras (GR): University of
Patras.
[Kemdikbud RI] Kementerian Pendidikan dan Kebudayaan Republik Indonesia.
[tahun tidak diketahui]. Angklung [Internet]. [diunduh 2013 Okt 3]. Tersedia
pada: http://kebudayaanindonesia.net/id/culture/826/angklung#.UlgaY1NmNds.
Monte E, Hernando J, Miro X, Adolf A. 1996. Text independent speaker
identification on noisy environments by means of self organizing maps. Di
dalam: Bunnell HT, Idsardi W, editor. Proceedings ICSLP 96 Fourth
International Conference on Spoken Language; 1996 Okt 3-6; Philadelphia,
Amerika Serikat. Wilmington (US): Citation Delaware. 3(1):1084-1807. doi:
10.1109/ICSLP.1996.607980.
Saha G, Chakroborty S, Senapati S. 2005. A new silence removal and endpoint
detection algorithm for speech and speaker recognition applications. Di dalam:
Lamba TS, Biswas PK, Pathak SS, editor. Proceedings of the Eleventh
National Conference on Communications NCC-2005; 2005 Jan 28-30.
Kharagpur (IN): Allied. hlm 291-295.

17
[UNESCO] United Nations Educational, Scientific and Cultural Organization.
2010. Indonesian angklung [Internet]. [diunduh 2013 Okt 3]. Tersedia pada:
http://www.unesco.org/culture/ich/en/RL/00393.
Wisnudisastra E, Buono A. 2010. Pengenalan chord pada alat musik gitar
menggunakan codebook dengan teknik ekstraksi ciri MFCC. Jurnal Ilmiah
Ilmu Komputer. 14 (1):16-21.
Zak A. 2011. Ship’s hydroacoustics signatures classification using neural
networks. Di dalam: Mwasiagi JI, editor. Self Organizing Maps - Applications
and Novel Algorithm Design. Rijeka (HR): Intech. hlm 209-232. doi:
10.5772/566.

18

RIWAYAT HIDUP
Penulis dilahirkan di Cirebon, Jawa Barat, Indonesia pada tanggal 16
Oktober 1990. Penulis merupakan anak kedua dari tiga bersaudara, dari pasangan
H Achmad Hudaja, SEAk dan Dra Hj Sri Endang Pawukir, MA.
Penulis memulai pendidikan formal dari TK 27 Cirebon dan lulus pada
tahun 1996, kemudian melanjutkan pendidikan di SDN Kebonbaru 4 Cirebon dan
lulus pada tahun 2002. Pendidikan menengah diselesaikan di SMP Negeri 5
Cirebon dan lulus pada tahun 2005. Lalu, penulis melanjutkan pendidikan tingkat
atas di SMAN 6 Cirebon dan lulus pada tahun 2008. Pada tahun 2008, penulis
melanjutkan pendidikan di Institut Pertanian Bogor Direktorat Program Diploma,
Program Keahlian Teknik Komputer melalui jalur Undangan Seleksi Masuk IPB
(USMI) dan lulus pada tahun 2011.
Pada tahun 2011, penulis melanjutkan pendidikan di Program Alih Jenis S1
Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut
Pertanian Bogor.