Pengembangan Model Jaringan Syaraf Tiruan Resilient Backpropagation Untuk Identifikasi Pembicara Dengan Praproses MFCC

1

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN
RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI PEMBICARA
DENGAN PRAPROSES MFCC

Oleh:
NURHADI SUSANTO
G64103059

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2007

2

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN
RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI PEMBICARA
DENGAN PRAPROSES MFCC


Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh :
NURHADI SUSANTO
G64103059

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2007

3

ABSTRAK
NURHADI SUSANTO. Pengembangan Model Jaringan Syaraf Tiruan Resilient Backpropagation

untuk Identifikasi Pembicara dengan Praproses MFCC. Dibimbing oleh AGUS BUONO dan IRMAN
HERMADI.
Suara manusia dapat digunakan sebagai sarana identifikasi diri. Dari suara seseorang dapat
diambil suatu fitur yang kemudian dimodelkan dan digunakan untuk mengenali seseorang berdasarkan
suaranya. Pada penelitian ini, dikembangkan suatu model jaringan syaraf tiruan resilient
backpropagation untuk identifikasi pembicara. Untuk ekstraksi ciri sinyal suara digunakan fitur
MFCC. Jenis identifikasi pembicara pada penelitian ini adalah Closed-Set Identification yang mana
suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang telah
terdaftar atau diketahui dan kata yang dilatih maupun diujikan telah ditentukan.
Data suara yang digunakan dalam penelitian ini adalah data suara yang diambil secara unguided
atau tanpa panduan. Selain itu diamati pula pengaruh noise terhadap akurasi identifikasi dengan cara
menambahkan white gaussian noise pada data yang digunakan.
Hasil penelitian ini berupa tingkat akurasi kebenaran dari data yang diujikan. Secara
keseluruhan, model terbaik yang dikembangkan menghasilkan nilai akurasi rata-rata sebesar 92,8%.
Dengan data yang menggunakan noise 30 dB, nilai akurasi rata-rata yang dihasilkan turun menjadi
71,0% dan dengan data yang menggunakan noise 20 dB, nilai akurasi rata-rata yang dihasilkan turun
menjadi 48,3%.
Kata kunci: Identifikasi Pembicara, Jaringan Syaraf Tiruan Resilient Backpropagation, MFCC.

4


Judul : Pengembangan Model Jaringan Syaraf Tiruan Resilient Backpropagation
untuk Identifikasi Pembicara dengan Praproses MFCC
Nama : Nurhadi Susanto
NRP : G64103059

Menyetujui:
Pembimbing I,

Pembimbing II

Ir. Agus Buono, M.Si., M.Kom.
NIP 132 045 532

Irman Hermadi, S.Kom., MS
NIP 132 321 422

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor


Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131 473 999

Tanggal Lulus :

5

RIWAYAT HIDUP
Penulis dilahirkan di Tangerang tanggal 7 November 1985, sulung dari lima bersaudara dari
pasangan Sunaryoto dan Khasanah. Pada tahun 2000, penulis menuntut ilmu di SMU Negeri 2
Tangerang hingga tahun 2003. Setelah lulus pada tahun 2003 penulis diterima sebagai mahasiswa S1
Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian
Bogor melalui jalur SPMB. Pada tahun 2006, penulis melaksanakan kegiatan praktik kerja lapangan di
Balai Besar Penelitian dan Pengembangan Teknologi Pertanian (BP2TP), Cimanggu, Bogor.

6

PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur Penulis panjatkan kepada Allah SWT atas

segala curahan rahmat dan karunia-Nya sehingga tugas akhir dengan judul Pengembangan Jaringan
Syaraf Tiruan Resilient Backpropagation untuk Identifikasi Pembicara Berbasis Data MFCC ini dapat
diselesaikan. Dalam menyelesaikan karya tulis ini penulis mendapatkan banyak sekali bantuan,
bimbingan dan dorongan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima
kasih yang sebesar-besarnya kepada semua pihak yang telah membantu kelancaran penelitian ini,
antara lain kepada:
1.
Orangtuaku tercinta, Bapak Sunaryoto dan Ibunda Khasanah atas segala do’a, kasih sayang, dan
dukungan baik dari moril maupun materiil yang telah diberikan selama ini.
2.
Adik-adikku tersayang Santi, Peni, Rio dan Ponco yang memberi tambahan motivasi dalam
penyelesaian karya tulis ini.
3.
Bapak Ir. Agus Bouno, M.Si, M.Komp selaku pembimbing pertama atas bimbingan dan
arahannya selama penyusunan karya tulis ini.
4.
Bapak Irman Hermadi, S.Kom, MS selaku pembimbing kedua atas bimbingan dan arahannya
selama penyusunan karya tulis ini.
5.
Abdul Nasrah, seorang teman sekamar terbaik yang selalu memberikan yang terbaik untuk

teman-temannya
6.
M.Nono Suhartono, Vicky Zilvan, dan Wini Purnamasari, rekan seperjuangan dalam penelitian
di bidang speaker recognizing.
7.
Dhany, Gemma, Ryan, Inang, Mulyadi, dan Iqbal yang sudah memberikan banyak sekali
kenangan selama tinggal bersama.
8.
Pandi, Ghoffar, Dona, Mulyadi, Nanik, Vita, Thessy, Yustin, dan seluruh rekan yang telah ikut
menymbangkan suranya untuk dijadikan bahan penelitian.
9.
Seluruh teman-teman Ilkom 40 yang tidak dapat disebutkan namanya satu-persatu.
Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan
penelitian ini yang tidak dapat disebutkan satu-persatu, Penulis ucapkan terima kasih banyak. Semoga
penelitian ini dapat memberi manfaat.

Bogor, Mei 2007

Nurhadi Susanto


v

DAFTAR ISI
Halaman
DAFTAR GAMBAR ......................................................................................................................vi
DAFTAR TABEL...........................................................................................................................vi
DAFTAR LAMPIRAN ...................................................................................................................vi
PENDAHULUAN............................................................................................................................1
Latar Belakang .............................................................................................................................1
Tujuan..........................................................................................................................................1
Ruang Lingkup.............................................................................................................................1
Manfaat........................................................................................................................................1
TINJAUAN PUSTAKA ...................................................................................................................1
Jenis Pengenalan Pembicara .........................................................................................................1
Dijitasi Gelombang Suara .............................................................................................................2
Signal to Noise Ratio (SNR) .........................................................................................................2
Ekstraksi Ciri Sinyal Suara ...........................................................................................................2
MFCC (Mel-Frequency Cepstrum Coefficients)............................................................................3
Resilient Backpropagation ............................................................................................................5
METODOLOGI PENELITIAN........................................................................................................6

Data .............................................................................................................................................6
Proses Pengenalan Suara...............................................................................................................6
Arsitektur Jaringan Syaraf Tiruan .................................................................................................7
Parameter-parameter Resilient Backpropagation ...........................................................................7
Lingkungan Pengembangan ..........................................................................................................7
HASIL DAN PEMBAHASAN.........................................................................................................7
Hasil Pengambilan Data................................................................................................................7
Praproses dengan MFCC ..............................................................................................................7
Pengembangan Model Jaringan Syaraf Tiruan...............................................................................8
Pengambilan Threshold .............................................................................................................. 11
Hasil Identikasi Pembicara Model JST Terbaik pada Data Tanpa Noise...................................... 11
KESIMPULAN DAN SARAN....................................................................................................... 14
Kesimpulan ................................................................................................................................ 14
Saran.......................................................................................................................................... 14
DAFTAR PUSTAKA..................................................................................................................... 14
LAMPIRAN .................................................................................................................................. 13

vi

DAFTAR GAMBAR

Halaman
1 Diagram blok dari proses MFCC (Do 1994). .................................................................................3
2 Arsitektur JST lapis tunggal...........................................................................................................4
3 Grafik fungsi sigmoid biner dengan selang (0,1).............................................................................4
4 Arsitektur jaringan propagasi balik (Fu 1994)................................................................................5
5 Proses pengenalan pembicara.........................................................................................................6
6 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data tanpa noise. ................................................................................................................8
7 Grafik perbandingan jumlah epoh rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data tanpa noise. ................................................................................................................9
8 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data ber-noise 30 dB. ....................................................................................................... 10
9 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data ber-noise 20 dB. ....................................................................................................... 10
10 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi. ....................... 11
11 Grafik perbandingan jumlah data suara yang teridentifikasi dengan benar pada data tanpa noise . 13

DAFTAR TABEL
Halaman
1 Struktur JST Resilient Backpropagation.........................................................................................7

2 Hasil identifikasi model JST terbaik dari dua puluh data pembicara tanpa threshold ..................... 12
3 Hasil identifikasi model JST terbaik dari dua puluh data pembicara dengan threshold.................. 12
4 Hasil identifikasi dua puluh data suara tanpa noise dari pembicara yang tidak ikut serta dalam
pelatihan dengan menggunakan threshold .................................................................................... 14

DAFTAR LAMPIRAN
Halaman
1 Algoritma JST RPROP ................................................................................................................ 17
2 Hasil Pelatihan dan Pengujian Model JST dari tiga puluh perlakuan jumlah neuron tersembunyi
pada data tanpa noise. .................................................................................................................. 19
3 Hasil Pelatihan dan Pengujian Model JST dari tiga puluh perlakuan jumlah neuron tersembunyi
pada data dengan SNR 30 dB....................................................................................................... 21
4 Hasil Pelatihan dan Pengujian Model JST dari tiga puluh perlakuan jumlah neuron tersembunyi
pada data dengan SNR 20 dB....................................................................................................... 22

1

PENDAHULUAN
Latar Belakang
Suara manusia dapat digunakan sebagai

sarana identifikasi diri. Suara yang dihasilkan
tersebut diperlakukan sebagai data yang dapat
diolah sehingga dapat dimanfaatkan. Sinyal
suara yang kontinu dicuplik dengan rentang
waktu tertentu sehingga menghasilkan sinyal
dijital. Setelah sinyal suara tersebut menjadi
sinyal dijital, berbagai perlakuan dapat
diterapkan pada data suara tersebut. Salah satu
perlakuan yang bermanfaat adalah mengolah
data tersebut sedemikian rupa sehingga dapat
digunakan untuk mengenali pembicara.
Berbagai metode dapat dipakai untuk
mengolah data suara tadi. Beberapa metode
yang pernah digunakan diantaranya model
markov tersembunyi (Purnamasari 2006) dan
jaringan syaraf tiruan propagasi balik standar
(Oktavianto 2004). Penggunaan metode
jaringan syaraf tiruan propagasi balik tersebut
masih dapat dikembangkan dengan penggunaan
metode praproses dan juga penggunaan jaringan
syaraf tiruan yang lain dan juga diperlukan
kombinasi percobaan yang lebih banyak.
Model jaringan saraf tiruan terinspirasi oleh
cara kerja otak manusia. Untuk berpikir, otak
manusia mendapat rangsangan dari neuronneuron yang terdapat pada indera manusia dan
kemudian hasil rangsangan tersebut diolah
sehingga menghasilkan suatu informasi. Pada
komputer,
rangsangan-rangsangan
yang
diberikan diibaratkan sebagai masukan dimana
masukan tersebut dikalikan dengan suatu nilai,
yang dikenal dengan bobot, dan kemudian
diolah dengan fungsi aktivasi tertentu untuk
menghasilkan suatu keluaran. Pada saat
pelatihan, pemasukan tersebut dilakukan
berulang-ulang sampai tercapai keluaran seperti
yang diinginkan. Dengan metode propagasi
balik, keluaran yang diinginkan berusaha
dicapai dengan melakukan pembaharuan yang
terhadap nilai bobot. Setelah proses pelatihan,
diharapkan komputer dapat mengenali suatu
masukan baru berdasarkan informasi yang telah
diperoleh pada saat pelatihan.
Beberapa modifikasi dari prosedur propagasi
balik telah diajukan untuk menambah kecepatan
pembelajaran. Martin Riedmiller dan Heinrich
Braun telah mengembangkan suatu metode
yang disebut Resilient Backpropagation
(Riedmiller & Braun 1993). Metode ini telah
terbukti sebagai metode yang memiliki
kecepatan pembelajaran yang baik dan juga
andal (Saputro 2006).

Tujuan
Penelitian
ini
bertujuan
untuk
mengembangkan model jaringan syaraf tiruan
resilient
backpropagation
untuk
mengidentifikasi pembicara pada data yang
direkam tanpa pengarahan. Selain itu, dilakukan
pula perbandingan tingkat akurasi model untuk
suara yang diberi noise dan tanpa noise.
Ruang Lingkup
Ruang lingkup penelitian ini adalah:
1. Penelitian
difokuskan
pada
tahapan
pemodelan identifikasi suara manusia dengan
menggunakan jaringan syaraf tiruan dan tidak
pada pemrosesan sinyal analog sebagai
praproses dari sistem.
2. Model
pengenalan
dibangun
dengan
menggunakan jaringan syaraf tiruan model
Multi Layer Preceptron dengan menggunakan
metode
pembelajaran
resilient
backpropagation.
3. Analisis dilakukan
untuk pengenalan
pembicara tertutup bergantung teks dengan
data yang direkam tanpa pengarahan. Uji
kinerja dilakukan dengan menghitung tingkat
akurasi identifikasi sistem terhadap input
yang diberikan.
Manfaat
Penelitian ini diharapkan dapat memberikan
informasi mengenai akurasi jaringan syaraf
tiruan model Multi Layer Preceptron dengan
menggunakan metode pembelajaran resilient
backpropagation untuk identifikasi pembicara.
Di samping itu, diharapkan pula pengaruh noise
terhadap nilai akurasi identifikasi dapat diamati.
Selanjutnya, diharapkan model yang dihasilkan
dapat digunakan untuk mengembangkan sistem
identifikasi pembicara yang bersifat tertutup dan
bergantung pada teks.
TINJAUAN PUSTAKA
Jenis Pengenalan Pembicara
Menurut Campbell (1997), Pengenalan
pembicara berdasarkan jenis aplikasinya dibagi
menjadi:
1. Identifikasi pembicara adalah proses
mengenali seseorang berdasarkan suaranya.
Identifikasi pembicara dibagi dua, yaitu:
• Identifikasi
tertutup
(closed-set
identification) yang mana suara masukan
yang akan dikenali merupakan bagian
dari sekumpulan suara pembicara yang
telah terdaftar atau diketahui.
• Identifikasi
terbuka
(open-set
identification) suara masukan boleh tidak

2

ada pada kumpulan suara pembicara
yang telah terdaftar.
2. Verifikasi
pembicara
adalah
proses
menerima atau menolak permintaan identitas
dari seseorang berdasarkan suaranya.
Berdasarkan
teks
yang
digunakan,
pengenalan pembicara dibagi menjadi dua
(Campbell 1997):
1. Pengenalan pembicara bergantung teks yang
mengharuskan
pembicara
untuk
mengucapkan kata atau kalimat yang sama,
baik pada pelatihan maupun pengenalan.
2. Pengenalan pembicara bebas teks yang tidak
mengharuskan
pembicara
untuk
mengucapkan kata atau kalimat yang sama,
baik pada pelatihan maupun pengenalan.
Dijitasi Gelombang Suara
Suara adalah sebuah gelombang yang
dilewatkan melalui suatu medium dan sampai
ke telinga manusia sehingga dapat didengarkan.
Medium perantara yang biasa digunakan adalah
udara. Gelombang suara merupakan gelombang
analog, sehingga untuk dapat diolah dengan
peralatan elektronik, gelombang suara harus
direpresentasikan
dalam
bentuk
dijital
(Boomkamp (2004) dalam Musthofa 2005).
Proses mengubah masukan suara dari
gelombang analog menjadi representasi data
dijital disebut dijitasi suara. Proses dijitasi suara
terdiri dari dua tahap yaitu sampling dan
kuantisasi (Jurafsky & Martin 2000). Sampling
adalah proses pengambilan nilai setiap jangka
waktu tertentu. Nilai ini menyatakan amplitudo
volume suara pada saat itu. Hasilnya adalah
sebuah vektor yang menyatakan nilai-nilai hasil
sampling. Panjang vektor data ini tergantung
pada panjang atau lamanya suara yang
didijitasikan serta sampling rate yang
digunakan pada proses dijitasinya. Sampling
rate sendiri adalah banyaknya nilai yang
diambil setiap detik. Sampling rate yang biasa
digunakan adalah 8000 Hz dan 16000 Hz
(Jurafsky & Martin 2000). Hubungan antara
panjang vektor data yang dihasilkan dengan
sampling rate dan panjangnya data suara yang
didijitasikan dapat dinyatakan secara sederhana
sebagai berikut:
S = Fs * T
dengan,
S = panjang vektor
Fs = sampling rate yang digunakan (Hertz)
T = panjang suara (detik)
Setelah melalui tahap sampling, proses
dijitasi suara selanjutnya adalah kuantisasi yaitu

menyimpan nilai amplitudo ini ke dalam
representasi nilai 8 bit atau 16 bit (Jurafsky &
Martin 2000).
Signal to Noise Ratio (SNR)
Signal-to-noise ratio (yang biasa disingkat
menjadi SNR atau S/N) adalah suatu konsep
yang mendefinisikan perbandingan antara
kekuatan sinyal dengan kekuatan noise yang
merusak sinyal. Secara sederhana, signal-tonoise ratio membandingkan level dari sinyal
yang diinginkan (seperti suara piano dalam
suatu konser) dengan level dari sinyal yang
tidak diinginkan (seperti suara orang yang
bercakap-cakap dalam suatu konser). Semakin
kecil nilai SNR, semakin tinggi pengaruh noise
dalam merusak sinyal asli.
Secara umum, SNR didefinisikan sebagai

SNR =

Psignal
Pnoise

 Asignal
= 
 Anoise





2

dengan P adalah rata-rata dari daya (power) dan
A adalah akar kuadrat rata-rata dari amplitudo.
Pada umumnya, sinyal suara memiliki
jangkauan dinamis yang sangat tinggi. Hal ini
menyebabkan SNR akan lebih efisien jika
diekspresikan dalam skala logarithmic decibel.
Pada desibel, SNR didefinisikan sebagai 10
dikali logaritma dari perbandingan daya. Jika
sinyal dan noise dihitung dalam impedansi yang
sama maka nilai SNR bisa didapatkan dengan

 Psignal 

SNR(dB) = 10 log10 
 Pnoise 
 Asignal 

= 20 log 10 
A
 noise 
sehingga semakin kecil nilai SNR dalam
desibel, semakin tinggi pengaruhnya dalam
merusak sinyal asli.
Ekstraksi Ciri Sinyal Suara
Sinyal suara merupakan sinyal bervariasi
yang diwaktukan dengan lambat atau biasa
disebut quasi-stationary (Do 1994). Ketika
diamati dalam jangka waktu yang sangat
pendek (5 - 100 ms), karakteristiknya hampir
sama. Namun, dalam jangka waktu yang
panjang (0,2 detik atau lebih) karakteristik
sinyal berubah dan merefleksikan perbedaan
sinyal suara yang diucapkan. Oleh karena itu,
digunakan spektrum waktu pendek (short-time
spectral analysis) untuk mengkarakterisasi
sinyal suara.

1

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN
RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI PEMBICARA
DENGAN PRAPROSES MFCC

Oleh:
NURHADI SUSANTO
G64103059

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2007

2

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN
RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI PEMBICARA
DENGAN PRAPROSES MFCC

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Oleh :
NURHADI SUSANTO
G64103059

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2007

3

ABSTRAK
NURHADI SUSANTO. Pengembangan Model Jaringan Syaraf Tiruan Resilient Backpropagation
untuk Identifikasi Pembicara dengan Praproses MFCC. Dibimbing oleh AGUS BUONO dan IRMAN
HERMADI.
Suara manusia dapat digunakan sebagai sarana identifikasi diri. Dari suara seseorang dapat
diambil suatu fitur yang kemudian dimodelkan dan digunakan untuk mengenali seseorang berdasarkan
suaranya. Pada penelitian ini, dikembangkan suatu model jaringan syaraf tiruan resilient
backpropagation untuk identifikasi pembicara. Untuk ekstraksi ciri sinyal suara digunakan fitur
MFCC. Jenis identifikasi pembicara pada penelitian ini adalah Closed-Set Identification yang mana
suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang telah
terdaftar atau diketahui dan kata yang dilatih maupun diujikan telah ditentukan.
Data suara yang digunakan dalam penelitian ini adalah data suara yang diambil secara unguided
atau tanpa panduan. Selain itu diamati pula pengaruh noise terhadap akurasi identifikasi dengan cara
menambahkan white gaussian noise pada data yang digunakan.
Hasil penelitian ini berupa tingkat akurasi kebenaran dari data yang diujikan. Secara
keseluruhan, model terbaik yang dikembangkan menghasilkan nilai akurasi rata-rata sebesar 92,8%.
Dengan data yang menggunakan noise 30 dB, nilai akurasi rata-rata yang dihasilkan turun menjadi
71,0% dan dengan data yang menggunakan noise 20 dB, nilai akurasi rata-rata yang dihasilkan turun
menjadi 48,3%.
Kata kunci: Identifikasi Pembicara, Jaringan Syaraf Tiruan Resilient Backpropagation, MFCC.

4

Judul : Pengembangan Model Jaringan Syaraf Tiruan Resilient Backpropagation
untuk Identifikasi Pembicara dengan Praproses MFCC
Nama : Nurhadi Susanto
NRP : G64103059

Menyetujui:
Pembimbing I,

Pembimbing II

Ir. Agus Buono, M.Si., M.Kom.
NIP 132 045 532

Irman Hermadi, S.Kom., MS
NIP 132 321 422

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131 473 999

Tanggal Lulus :

5

RIWAYAT HIDUP
Penulis dilahirkan di Tangerang tanggal 7 November 1985, sulung dari lima bersaudara dari
pasangan Sunaryoto dan Khasanah. Pada tahun 2000, penulis menuntut ilmu di SMU Negeri 2
Tangerang hingga tahun 2003. Setelah lulus pada tahun 2003 penulis diterima sebagai mahasiswa S1
Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian
Bogor melalui jalur SPMB. Pada tahun 2006, penulis melaksanakan kegiatan praktik kerja lapangan di
Balai Besar Penelitian dan Pengembangan Teknologi Pertanian (BP2TP), Cimanggu, Bogor.

6

PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur Penulis panjatkan kepada Allah SWT atas
segala curahan rahmat dan karunia-Nya sehingga tugas akhir dengan judul Pengembangan Jaringan
Syaraf Tiruan Resilient Backpropagation untuk Identifikasi Pembicara Berbasis Data MFCC ini dapat
diselesaikan. Dalam menyelesaikan karya tulis ini penulis mendapatkan banyak sekali bantuan,
bimbingan dan dorongan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima
kasih yang sebesar-besarnya kepada semua pihak yang telah membantu kelancaran penelitian ini,
antara lain kepada:
1.
Orangtuaku tercinta, Bapak Sunaryoto dan Ibunda Khasanah atas segala do’a, kasih sayang, dan
dukungan baik dari moril maupun materiil yang telah diberikan selama ini.
2.
Adik-adikku tersayang Santi, Peni, Rio dan Ponco yang memberi tambahan motivasi dalam
penyelesaian karya tulis ini.
3.
Bapak Ir. Agus Bouno, M.Si, M.Komp selaku pembimbing pertama atas bimbingan dan
arahannya selama penyusunan karya tulis ini.
4.
Bapak Irman Hermadi, S.Kom, MS selaku pembimbing kedua atas bimbingan dan arahannya
selama penyusunan karya tulis ini.
5.
Abdul Nasrah, seorang teman sekamar terbaik yang selalu memberikan yang terbaik untuk
teman-temannya
6.
M.Nono Suhartono, Vicky Zilvan, dan Wini Purnamasari, rekan seperjuangan dalam penelitian
di bidang speaker recognizing.
7.
Dhany, Gemma, Ryan, Inang, Mulyadi, dan Iqbal yang sudah memberikan banyak sekali
kenangan selama tinggal bersama.
8.
Pandi, Ghoffar, Dona, Mulyadi, Nanik, Vita, Thessy, Yustin, dan seluruh rekan yang telah ikut
menymbangkan suranya untuk dijadikan bahan penelitian.
9.
Seluruh teman-teman Ilkom 40 yang tidak dapat disebutkan namanya satu-persatu.
Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan
penelitian ini yang tidak dapat disebutkan satu-persatu, Penulis ucapkan terima kasih banyak. Semoga
penelitian ini dapat memberi manfaat.

Bogor, Mei 2007

Nurhadi Susanto

v

DAFTAR ISI
Halaman
DAFTAR GAMBAR ......................................................................................................................vi
DAFTAR TABEL...........................................................................................................................vi
DAFTAR LAMPIRAN ...................................................................................................................vi
PENDAHULUAN............................................................................................................................1
Latar Belakang .............................................................................................................................1
Tujuan..........................................................................................................................................1
Ruang Lingkup.............................................................................................................................1
Manfaat........................................................................................................................................1
TINJAUAN PUSTAKA ...................................................................................................................1
Jenis Pengenalan Pembicara .........................................................................................................1
Dijitasi Gelombang Suara .............................................................................................................2
Signal to Noise Ratio (SNR) .........................................................................................................2
Ekstraksi Ciri Sinyal Suara ...........................................................................................................2
MFCC (Mel-Frequency Cepstrum Coefficients)............................................................................3
Resilient Backpropagation ............................................................................................................5
METODOLOGI PENELITIAN........................................................................................................6
Data .............................................................................................................................................6
Proses Pengenalan Suara...............................................................................................................6
Arsitektur Jaringan Syaraf Tiruan .................................................................................................7
Parameter-parameter Resilient Backpropagation ...........................................................................7
Lingkungan Pengembangan ..........................................................................................................7
HASIL DAN PEMBAHASAN.........................................................................................................7
Hasil Pengambilan Data................................................................................................................7
Praproses dengan MFCC ..............................................................................................................7
Pengembangan Model Jaringan Syaraf Tiruan...............................................................................8
Pengambilan Threshold .............................................................................................................. 11
Hasil Identikasi Pembicara Model JST Terbaik pada Data Tanpa Noise...................................... 11
KESIMPULAN DAN SARAN....................................................................................................... 14
Kesimpulan ................................................................................................................................ 14
Saran.......................................................................................................................................... 14
DAFTAR PUSTAKA..................................................................................................................... 14
LAMPIRAN .................................................................................................................................. 13

vi

DAFTAR GAMBAR
Halaman
1 Diagram blok dari proses MFCC (Do 1994). .................................................................................3
2 Arsitektur JST lapis tunggal...........................................................................................................4
3 Grafik fungsi sigmoid biner dengan selang (0,1).............................................................................4
4 Arsitektur jaringan propagasi balik (Fu 1994)................................................................................5
5 Proses pengenalan pembicara.........................................................................................................6
6 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data tanpa noise. ................................................................................................................8
7 Grafik perbandingan jumlah epoh rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data tanpa noise. ................................................................................................................9
8 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data ber-noise 30 dB. ....................................................................................................... 10
9 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi pada pelatihan
dengan data ber-noise 20 dB. ....................................................................................................... 10
10 Grafik perbandingan nilai akurasi rata-rata terhadap jumlah neuron tersembunyi. ....................... 11
11 Grafik perbandingan jumlah data suara yang teridentifikasi dengan benar pada data tanpa noise . 13

DAFTAR TABEL
Halaman
1 Struktur JST Resilient Backpropagation.........................................................................................7
2 Hasil identifikasi model JST terbaik dari dua puluh data pembicara tanpa threshold ..................... 12
3 Hasil identifikasi model JST terbaik dari dua puluh data pembicara dengan threshold.................. 12
4 Hasil identifikasi dua puluh data suara tanpa noise dari pembicara yang tidak ikut serta dalam
pelatihan dengan menggunakan threshold .................................................................................... 14

DAFTAR LAMPIRAN
Halaman
1 Algoritma JST RPROP ................................................................................................................ 17
2 Hasil Pelatihan dan Pengujian Model JST dari tiga puluh perlakuan jumlah neuron tersembunyi
pada data tanpa noise. .................................................................................................................. 19
3 Hasil Pelatihan dan Pengujian Model JST dari tiga puluh perlakuan jumlah neuron tersembunyi
pada data dengan SNR 30 dB....................................................................................................... 21
4 Hasil Pelatihan dan Pengujian Model JST dari tiga puluh perlakuan jumlah neuron tersembunyi
pada data dengan SNR 20 dB....................................................................................................... 22

1

PENDAHULUAN
Latar Belakang
Suara manusia dapat digunakan sebagai
sarana identifikasi diri. Suara yang dihasilkan
tersebut diperlakukan sebagai data yang dapat
diolah sehingga dapat dimanfaatkan. Sinyal
suara yang kontinu dicuplik dengan rentang
waktu tertentu sehingga menghasilkan sinyal
dijital. Setelah sinyal suara tersebut menjadi
sinyal dijital, berbagai perlakuan dapat
diterapkan pada data suara tersebut. Salah satu
perlakuan yang bermanfaat adalah mengolah
data tersebut sedemikian rupa sehingga dapat
digunakan untuk mengenali pembicara.
Berbagai metode dapat dipakai untuk
mengolah data suara tadi. Beberapa metode
yang pernah digunakan diantaranya model
markov tersembunyi (Purnamasari 2006) dan
jaringan syaraf tiruan propagasi balik standar
(Oktavianto 2004). Penggunaan metode
jaringan syaraf tiruan propagasi balik tersebut
masih dapat dikembangkan dengan penggunaan
metode praproses dan juga penggunaan jaringan
syaraf tiruan yang lain dan juga diperlukan
kombinasi percobaan yang lebih banyak.
Model jaringan saraf tiruan terinspirasi oleh
cara kerja otak manusia. Untuk berpikir, otak
manusia mendapat rangsangan dari neuronneuron yang terdapat pada indera manusia dan
kemudian hasil rangsangan tersebut diolah
sehingga menghasilkan suatu informasi. Pada
komputer,
rangsangan-rangsangan
yang
diberikan diibaratkan sebagai masukan dimana
masukan tersebut dikalikan dengan suatu nilai,
yang dikenal dengan bobot, dan kemudian
diolah dengan fungsi aktivasi tertentu untuk
menghasilkan suatu keluaran. Pada saat
pelatihan, pemasukan tersebut dilakukan
berulang-ulang sampai tercapai keluaran seperti
yang diinginkan. Dengan metode propagasi
balik, keluaran yang diinginkan berusaha
dicapai dengan melakukan pembaharuan yang
terhadap nilai bobot. Setelah proses pelatihan,
diharapkan komputer dapat mengenali suatu
masukan baru berdasarkan informasi yang telah
diperoleh pada saat pelatihan.
Beberapa modifikasi dari prosedur propagasi
balik telah diajukan untuk menambah kecepatan
pembelajaran. Martin Riedmiller dan Heinrich
Braun telah mengembangkan suatu metode
yang disebut Resilient Backpropagation
(Riedmiller & Braun 1993). Metode ini telah
terbukti sebagai metode yang memiliki
kecepatan pembelajaran yang baik dan juga
andal (Saputro 2006).

Tujuan
Penelitian
ini
bertujuan
untuk
mengembangkan model jaringan syaraf tiruan
resilient
backpropagation
untuk
mengidentifikasi pembicara pada data yang
direkam tanpa pengarahan. Selain itu, dilakukan
pula perbandingan tingkat akurasi model untuk
suara yang diberi noise dan tanpa noise.
Ruang Lingkup
Ruang lingkup penelitian ini adalah:
1. Penelitian
difokuskan
pada
tahapan
pemodelan identifikasi suara manusia dengan
menggunakan jaringan syaraf tiruan dan tidak
pada pemrosesan sinyal analog sebagai
praproses dari sistem.
2. Model
pengenalan
dibangun
dengan
menggunakan jaringan syaraf tiruan model
Multi Layer Preceptron dengan menggunakan
metode
pembelajaran
resilient
backpropagation.
3. Analisis dilakukan
untuk pengenalan
pembicara tertutup bergantung teks dengan
data yang direkam tanpa pengarahan. Uji
kinerja dilakukan dengan menghitung tingkat
akurasi identifikasi sistem terhadap input
yang diberikan.
Manfaat
Penelitian ini diharapkan dapat memberikan
informasi mengenai akurasi jaringan syaraf
tiruan model Multi Layer Preceptron dengan
menggunakan metode pembelajaran resilient
backpropagation untuk identifikasi pembicara.
Di samping itu, diharapkan pula pengaruh noise
terhadap nilai akurasi identifikasi dapat diamati.
Selanjutnya, diharapkan model yang dihasilkan
dapat digunakan untuk mengembangkan sistem
identifikasi pembicara yang bersifat tertutup dan
bergantung pada teks.
TINJAUAN PUSTAKA
Jenis Pengenalan Pembicara
Menurut Campbell (1997), Pengenalan
pembicara berdasarkan jenis aplikasinya dibagi
menjadi:
1. Identifikasi pembicara adalah proses
mengenali seseorang berdasarkan suaranya.
Identifikasi pembicara dibagi dua, yaitu:
• Identifikasi
tertutup
(closed-set
identification) yang mana suara masukan
yang akan dikenali merupakan bagian
dari sekumpulan suara pembicara yang
telah terdaftar atau diketahui.
• Identifikasi
terbuka
(open-set
identification) suara masukan boleh tidak

2

ada pada kumpulan suara pembicara
yang telah terdaftar.
2. Verifikasi
pembicara
adalah
proses
menerima atau menolak permintaan identitas
dari seseorang berdasarkan suaranya.
Berdasarkan
teks
yang
digunakan,
pengenalan pembicara dibagi menjadi dua
(Campbell 1997):
1. Pengenalan pembicara bergantung teks yang
mengharuskan
pembicara
untuk
mengucapkan kata atau kalimat yang sama,
baik pada pelatihan maupun pengenalan.
2. Pengenalan pembicara bebas teks yang tidak
mengharuskan
pembicara
untuk
mengucapkan kata atau kalimat yang sama,
baik pada pelatihan maupun pengenalan.
Dijitasi Gelombang Suara
Suara adalah sebuah gelombang yang
dilewatkan melalui suatu medium dan sampai
ke telinga manusia sehingga dapat didengarkan.
Medium perantara yang biasa digunakan adalah
udara. Gelombang suara merupakan gelombang
analog, sehingga untuk dapat diolah dengan
peralatan elektronik, gelombang suara harus
direpresentasikan
dalam
bentuk
dijital
(Boomkamp (2004) dalam Musthofa 2005).
Proses mengubah masukan suara dari
gelombang analog menjadi representasi data
dijital disebut dijitasi suara. Proses dijitasi suara
terdiri dari dua tahap yaitu sampling dan
kuantisasi (Jurafsky & Martin 2000). Sampling
adalah proses pengambilan nilai setiap jangka
waktu tertentu. Nilai ini menyatakan amplitudo
volume suara pada saat itu. Hasilnya adalah
sebuah vektor yang menyatakan nilai-nilai hasil
sampling. Panjang vektor data ini tergantung
pada panjang atau lamanya suara yang
didijitasikan serta sampling rate yang
digunakan pada proses dijitasinya. Sampling
rate sendiri adalah banyaknya nilai yang
diambil setiap detik. Sampling rate yang biasa
digunakan adalah 8000 Hz dan 16000 Hz
(Jurafsky & Martin 2000). Hubungan antara
panjang vektor data yang dihasilkan dengan
sampling rate dan panjangnya data suara yang
didijitasikan dapat dinyatakan secara sederhana
sebagai berikut:
S = Fs * T
dengan,
S = panjang vektor
Fs = sampling rate yang digunakan (Hertz)
T = panjang suara (detik)
Setelah melalui tahap sampling, proses
dijitasi suara selanjutnya adalah kuantisasi yaitu

menyimpan nilai amplitudo ini ke dalam
representasi nilai 8 bit atau 16 bit (Jurafsky &
Martin 2000).
Signal to Noise Ratio (SNR)
Signal-to-noise ratio (yang biasa disingkat
menjadi SNR atau S/N) adalah suatu konsep
yang mendefinisikan perbandingan antara
kekuatan sinyal dengan kekuatan noise yang
merusak sinyal. Secara sederhana, signal-tonoise ratio membandingkan level dari sinyal
yang diinginkan (seperti suara piano dalam
suatu konser) dengan level dari sinyal yang
tidak diinginkan (seperti suara orang yang
bercakap-cakap dalam suatu konser). Semakin
kecil nilai SNR, semakin tinggi pengaruh noise
dalam merusak sinyal asli.
Secara umum, SNR didefinisikan sebagai

SNR =

Psignal
Pnoise

 Asignal
= 
 Anoise





2

dengan P adalah rata-rata dari daya (power) dan
A adalah akar kuadrat rata-rata dari amplitudo.
Pada umumnya, sinyal suara memiliki
jangkauan dinamis yang sangat tinggi. Hal ini
menyebabkan SNR akan lebih efisien jika
diekspresikan dalam skala logarithmic decibel.
Pada desibel, SNR didefinisikan sebagai 10
dikali logaritma dari perbandingan daya. Jika
sinyal dan noise dihitung dalam impedansi yang
sama maka nilai SNR bisa didapatkan dengan

 Psignal 

SNR(dB) = 10 log10 
 Pnoise 
 Asignal 

= 20 log 10 
A
 noise 
sehingga semakin kecil nilai SNR dalam
desibel, semakin tinggi pengaruhnya dalam
merusak sinyal asli.
Ekstraksi Ciri Sinyal Suara
Sinyal suara merupakan sinyal bervariasi
yang diwaktukan dengan lambat atau biasa
disebut quasi-stationary (Do 1994). Ketika
diamati dalam jangka waktu yang sangat
pendek (5 - 100 ms), karakteristiknya hampir
sama. Namun, dalam jangka waktu yang
panjang (0,2 detik atau lebih) karakteristik
sinyal berubah dan merefleksikan perbedaan
sinyal suara yang diucapkan. Oleh karena itu,
digunakan spektrum waktu pendek (short-time
spectral analysis) untuk mengkarakterisasi
sinyal suara.

3

MFCC (Mel-Frequency Cepstrum Coefficients)

j digunakan untuk menotasikan unit imajiner,

MFCC didasarkan pada variasi yang telah
diketahui dari jangkauan kritis telinga manusia
terhadap frekuensi. Filter dipisahkan secara
linear pada frekuensi rendah dan logaritmik
pada frekuensi tinggi. Hal ini telah dilakukan
untuk menangkap karakteristik penting dari
sinyal suara. Tujuan utama MFCC adalah untuk
meniru perilaku telinga manusia. Selain itu
MFCC telah terbukti bisa menyebutkan variasi
dari gelombang suara itu sendiri. Diagram alir
dari proses MFCC dapat dilihat pada Gambar 1.

yaitu j = − 1 . Secara umum Xn adalah
bilangan kompleks. Barisan {Xn} yang
dihasilkan
diartikan
sebagai berikut:
frekuensi nol berkorespondensi dengan n =
0, frekuensi positif
0 < f < Fs/2
berkorespondensi dengan nilai 1 ≤ n ≤ N/2-1,
sedangkan frekuensi negatif –Fs/2 < f < 0
berkorespondensi dengan N/2+1 < n < N-1.
Dalam hal ini Fs adalah sampling frequency.
Hasil yang didapatkan dalam tahap ini biasa
disebut dengan spektrum sinyal atau
periodogram.

Gambar 1 Diagram blok dari proses MFCC
(Do 1994).
Penjelasan tiap tahapan pada proses MFCC
sebagai berikut (Do 1994):
1. Frame Blocking. Pada tahap ini sinyal suara
(continous speech) dibagi ke dalam frameframe. Tiap frame terdiri dari N sample.
2. Windowing. Proses selanjutnya adalah
melakukan windowing pada tiap frame untuk
meminimalkan diskontinuitas sinyal pada
awal dan akhir tiap frame. Konsepnya adalah
meminimisasi distorsi spektral dengan
menggunakan window untuk memperkecil
sinyal hingga mendekati nol pada awal dan
akhir tiap frame. Jika window didefinisikan
sebagai w(n), 0 ≤ n ≤ N-1, dengan N adalah
banyaknya sampel tiap frame, maka hasil
dari windowing adalah sinyal dengan
persamaan:
Yt(n) = x1(n)w(n), 0 ≤ n ≤ N-1
Pada umumnya, window yang digunakan
adalah hamming window, dengan persamaan:
w(n)=0.54-0.46cos(2πn/N-1), 0 ≤ n ≤ N-1
3. Fast Fourier Transform (FFT). Tahap ini
mengkonversi tiap frame dengan N sampel
dari time domain menjadi frequency domain.
FFT adalah suatu algoritma untuk
mengimplementasikan Discrete Fourier
Transform (DFT) yang didefinisikan pada
himpunan N sampel {xn} sebagai berikut:
N −1
−2πjkn / N
, n = 0,1, 2,..., N − 1
X n = ∑ xk e
k =0

4. Mel-frequency Wrapping. Studi psikofisik
menunjukkan bahwa persepsi manusia
terhadap frekuensi sinyal suara tidak berupa
skala linier. Oleh karena itu, untuk setiap
nada dengan frekuensi aktual f (dalam
Hertz), tinggi subjektifnya diukur dengan
skala ‘mel’. Skala mel-frequency adalah
selang frekuensi di bawah 1000 Hz dan
selang logaritmik untuk frekuensi di atas
1000 Hz, sehingga pendekatan berikut dapat
digunakan untuk menghitung mel-frequency
untuk frekuensi f dalam Hz:
Mel(f) = 2595*log10(1+f/700).
5. Cepstrum. Langkah terakhir, konversikan log
mel spectrum ke domain waktu. Hasilnya
disebut mel frequency cepstrum coefficients.
Representasi cepstral spektrum suara
merupakan representasi properti spektral
lokal yang baik dari suatu sinyal untuk
analisis frame. Mel spectrum coefficients
(dan logaritmanya) berupa bilangan riil,
sehingga dapat dikonversikan ke domain
waktu dengan menggunakan Discrete Cosine
Transform (DCT).
Jaringan Syaraf Tiruan (JST)
Jaringan Syaraf Tiruan (JST) merupakan
suatu sistem pemroses informasi yang memiliki
persamaan secara umum dengan cara kerja
jaringan syaraf biologi (Fausett 1994). Metode
komputasional dari JST diinspirasikan oleh cara
kerja sel-sel otak manusia. Untuk berpikir, otak
manusia mendapat rangsangan dari neuronneuron yang terdapat pada indera manusia,
kemudian hasil rangsangan tersebut diolah
sehingga menghasilkan suatu informasi. Pada
komputer,
rangsangan
yang
diberikan
diumpamakan sebagai masukan dimana
masukan tersebut dikalikan dengan suatu nilai
dan kemudian diolah dengan fungsi tertentu
untuk menghasilkan suatu keluaran. Pada saat
pelatihan, pemasukan tersebut dilakukan
berulang-ulang hingga dicapai keluaran seperti

4

yang diinginkan. Setelah proses pelatihan,
diharapkan komputer dapat mengenali suatu
masukan baru berdasarkan data-data yang telah
diberikan pada saat pelatihan.
Menurut Fausett (1994), suatu JST dicirikan
oleh tiga hal sebagai berikut:
1. Arsitektur jaringan syaraf tiruan
Arsitektur jaringan ialah pengaturan neuron
dalam suatu lapisan, pola hubungan dalam
lapisan dan di antara lapisan. Dalam JST,
neuron-neuron diatur dalam sebuah lapisan
(layer). Ada 3 tipe lapisan, yaitu lapisan
input, lapisan tersembunyi (hidden layer)
dan lapisan output.
Jaringan neuron
dikelompokkan sebagai lapis tunggal (single
layer) yang terdiri atas lapisan input dan
output, dan lapis banyak (multiple layer)
yang terdiri atas lapisan input, lapisan
tersembunyi, dan lapisan output. Ilustrasi
JST lapis tunggal dapat dilihat dalam
Gambar 2. Pada Gambar 2, pr
melambangkan masukan untuk tiap neuron
ke-r pada lapisan input, wr melambangkan
bobot dari neuron ke-r pada lapisan input ke
neuron output, dan b melambangkan bias.
Jumlah dari seluruh masukan untuk neuron
output, yang dilambangkan sebagai n,
kemudian dihitung dengan fungsi aktivasi f
untuk menghasilkan keluaran dari neuron
tersebut yang dilambangkan sebagai a.
p1

p2

w1

JST Propagasi Balik Standar
Menurut Fu (1994), jaringan propagasi balik
(propagation network) merupakan jaringan
umpan maju berlapis banyak (multilayer
feedforward network). Aturan pembelajaran
propagasi balik disebut backpropagation yang
merupakan jenis dari teknik gradient descent
dengan backward error (gradient) propagation.
Fungsi aktivasi yang digunakan dalam
propagasi balik ialah fungsi sigmoid. Hal ini
disebabkan karena dalam jaringan propagasi
balik fungsi aktivasi yang digunakan harus
kontinu, dapat didiferensialkan, dan monoton
naik (Fausett 1994). Salah satu fungsi aktivasi
yang paling banyak digunakan ialah sigmoid
biner, yang memiliki selang [0, 1] dan
didefinisikan sebagai:

1
.................... (1)
f1( x) =
1 + exp( − x)
Dengan turunannya

f1 ' ( x) = f1 ( x)[1 − f1 ( x)] ............ (2)

w2
a

n
p3

3. Fungsi aktivasi yang digunakan.
Fungsi aktivasi merupakan fungsi yang
menentukan level aktivasi, yaitu keadaan
internal sebuah neuron dalam JST. Keluaran
aktivasi ini biasanya dikirim sebagai sinyal
ke neuron lainnya. Contoh fungsi aktivasi
ialah fungsi identitas fungsi tangga biner
(binary step function), fungsi tangga bipolar,
fungsi sigmoid biner dan fungsi sigmoid
bipolar.

Σ

f

w3

Grafik untuk fungsi sigmoid biner dapat
diihat dalam Gambar 3 dengan n sebagai
masukan dan a sebagai keluaran dari neuron
tersebut.

wr
pr

b

Gambar 2 Arsitektur JST lapis tunggal.
2. Metode pembelajaran untuk penentuan
pembobot koneksi.
Metode pembelajaran digunakan untuk
menentukan nilai pembobot yang akan
digunakan pada saat pengujian. Ada dua tipe
pembelajaran, yaitu dengan pengarahan
(supervised learning) dan tanpa pengarahan
(unsupervised learning). Sedangkan metode
pembelajaran JST, di antaranya: perceptron,
Aturan Delta (Adaline/Madaline), Propagasi
Balik, Self Organizing Map (SOM), dan
Learning Vector Quantization (LVQ) .

Gambar 3 Grafik fungsi sigmoid biner dengan
selang (0,1).
Jaringan
ini
menggunakan
metode
pembelajaran dengan pengarahan (supervised
learning). Cara kerja JST diawali dengan
inisialisasi pembobot dan bias. Pemilihan
metode inisialisasi pembobot dan bias
berpengaruh pada kecepatan JST dalam
mencapai kekonvergenan (Fausett, 1994).
Jaringan propagasi balik ditunjukkan dalam
Gambar 4.

5

Target
Output

Σ

Actual Output
OUTPUT
LAYER

KK

Backward
Error
Propagation

tersembunyi untuk melakukan pembelajaran.
Hal ini dilakukan dengan mendistribusikan
pembobot dan bias awal sedemikian rupa
sehingga dapat meningkatkan kemampuan
lapisan tersembunyi dalam melakukan proses
pembelajaran. Inisialisasi Nguyen-Widrow
didefinisikan sebagai persamaan berikut
(Fausett 1994):
- Hitung harga faktor penskalaan β

β = 0