Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Program Studi Teknik Informatika
PENGENALAN SONG-TYPE BURUNG ORTOLAN BUNTING
MENGGUNAKAN PENDEKATAN HIDDEN MARKOV
MODELS
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Teknik
Program Studi Teknik Informatika
Oleh:
Lydia Rizcy Arimbi
NIM : 055314072
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2010
HALAMAN PERSEMBAHAN
Ketika segala macam ujian dan pencobaan menekan hidup kita, jangan menganggap semua itu seperti para penyusup, tetapi sambutlah mereka seperti para kawan.
Skipsi ini saya persembahkan untuk : Yesus Kristus, keluarga, sahabat-sahabat dan kekasih.
Terima kasih untuk segalanya. v
DAFTAR ISI
HALAMAN JUDUL BAHASA INDONESIA................................................ ...I
HALAMAN JUDUL BAHASA INGGRIS ..................................................... ..II
HALAMAN PERSETUJUAN ......................................................................... .III
HALAMAN PENGESAHAN........................................................................... .IV
HALAMAN PERSEMBAHAN ....................................................................... ..V
HALAMAN PERNYATAAN KEASLIAN KARYA ..................................... .VI
HALAMAN PERSETUJUAN PUBLIKASI .................................................. VII
ABSTRAK ........................................................................................................ VIII
ABSTRACT....................................................................................................... .IX
KATA PENGANTAR....................................................................................... ...X
DAFTAR ISI...................................................................................................... XII
I. PENDAHULUAN ....................................................................................... …1
1.1. Latar Belakang dan Deskripsi Topik ........................................................... ....1
1.2. Rumusan Masalah ........................................................................................ …2
1.3. Tujuan .......................................................................................................... …2
1.4. BatasanMasalah… ....................................................................................... ...3
1.5. Metodologi Penelitian .................................................................................. …3
1.6. Sistematika Penulisan .................................................................................. …4
II. LANDASAN TEORI .................................................................................. …6
2.1. Teori Speech Recognition (Pengenalan suara) ............................................ …6
2.1.1. Feature Analysis ............................................................................... …7
2.1.2. Accoustic Modeling........................................................................... …8
2.1.3. Language Modeling ......................................................................... …8
2.2. Feature Extraction....................................................................................... …8
2.2.1. Greenwood function cepstral coefficients (GFCC)........................... …9
2.2.2. Greenwood function cepstral coefficients (GFCC) Delta dan delta-delta ......................................................................... ..13
2.3. Hidden Markov Models (HMM) ................................................................. ..14
2.3.1. Teori Markov Model......................................................................... ..14
2.3.2. Definisi HMM................................................................................... ..16
2.3.3. Algoritma Viterbi .............................................................................. ..22
2.3.4. Algoritma Baum-Welch .................................................................... ..23
III.METODOLOGI .......................................................................................... ..27
3.1. Data.............................................................................................................. ..27
3.2. Skema Pengenalan Suara menggunakan HMM .......................................... ..32
3.2.1. Feature extraction............................................................................. ..33
3.2.2. Tahap Training.................................................................................. ..34
3.2.3. Tahap Testing.................................................................................... ..35
3.3. Kebutuhan Perangkat Lunak ....................................................................... ..37
3.4. Kebutuhan Perangkat Keras ........................................................................ ..37
3.5. Perancangan Antar Muka ............................................................................ ..38
3.5.1. Halaman Home.................................................................................. ..38
3.5.2. Halaman Pengenalan Song-type........................................................ ..39
3.5.3. Halaman Pengujian Akurasi Hidden Markov Models....................... ..40
3.5.4. Halaman Bantuan.............................................................................. ..41
3.5.5. Halaman Tentang Program ............................................................... ..42
IV. IMPLEMENTASI DAN ANALISA .......................................................... . 43
4.1. Hasil Penelitian............................................................................................ ..43
4.2. Implementasi Antar Muka yang Digunakan pada Sistem ........................... ..48
4.2.1. Halaman Utama ................................................................................ ..48
4.2.2. Halaman Pengenalan Song-type........................................................ ..50
4.2.3. Halaman Pengujian Hidden Markov Models .................................... ..52
4.2.4. Halaman Bantuan.............................................................................. ..54
V. PENUTUP.................................................................................................... ..56
5.1. Kesimpulan.................................................................................................. ..56
5.2. Saran ............................................................................................................ ..57
DAFTAR PUSTAKA........................................................................................ ..58
HALAMAN LAMPIRAN LISTING PROGRAM......................................... ..60
HALAMAN LAMPIRAN FILE HMM........................................................... ..93
BAB I PENDAHULUAN
1.1. Latar Belakang dan Deskripsi Topik
Perkembangan teknologi informasi saat ini mengalami kemajuan yang
sangat pesat. Berbagai pemanfaatan teknologi informasi menghasilkan informasi
yang dapat meningkatkan kinerja manusia. Perkembangan teknologi speech
recognition (pengenalan suara) adalah salah satu bentuk perkembangan teknologi
di abad ke 20 yang memanfaatkan suara sebagai masukan. Komputer akan
mengenali suara sebagai perintah dan memberi terhadap perintah tersebut.Teknologi pengenalan suara dapat diimplementasikan untuk mengenali
suara binatang. Teknik-teknik yang digunakan untuk mengenal pola suara
binatang dengan variasi vokalisasi dibagi menjadi 2 kategori yaitu kualitatif dan
kuantitatif (Mc.Gregor et al., 2000). Pendekatan kualitatif meliputi perbandingan
spectogram yang dilakukan oleh para peneliti. Kebanyakan peneliti biologi
mengenal suara binatang dengan sonogram yaitu deskripsi dari sebuah
spectogram. Pendekatan ini mempunyai konsep yang sederhana dan kemudahan
dalam pengoperasian (Wakita, 1976). Akan tetapi, variable yang dilibatkan dalam
perhitungan dengan spectogram tidak cukup untuk menggambarkan karakteristik
dari isi spectrum dan pola signal sehingga tingkat akurasinya rendah. Untuk itu,
diperlukan metode kuantitatif yang lebih teliti dalam pengukuran secara detail
parameter frekuensi dan parameter temporal dari suatu vokalisasi. Salah satu
metode pendekatan kuantitatif adalah Hidden Markov Models. Metode ini tidak
membutuhkan waktu yang lama dalam pengoperasian, dan hasil akurasi yang
diperoleh tinggi.Dalam penulisan tugas akhir ini, akan diterapkan pendekatan Hidden
Markov Models untuk mengenal song-type burung Ortolon Bunting. Burung ini
bermigrasi tersebar dari Eropa Barat ke Mongolia (Cramp, Perrins, 1994). Burung
ini mempunyai ciri khas suara yang unik. Suara yang dihasilkan mempunyai
variasi song-type. Burung ini mempunyai song-type yang berbeda untuk setiap
individu. Setiap burung mempunyai dua sampai tiga song-type.1.2. Rumusan Masalah Dari latar belakang diatas dapat dirumuskan masalah sebagai berikut :
1. Bagaimana komputer secara otomatik dapat mengenal song-type
burung?2. Bagaimana mengimplementasikan pendekatan Hidden Markov Models (HMM) yang banyak digunakan dalam teknologi Speech Recognation untuk mengenali song-type burung?
3. Bagaimana tingkat akurasi pengenalan song-type burung dengan menggunakan metode HMM?
1.3 Tujuan Adapun tujuan dari penelitian ini adalah
1. Merancang dan mengimplementasikan metode HMM untuk mengenal secara otomatis song-type burung Ortolan Bunting.
2. Menganalisa dan mengetahui keakuratan metode HMM dalam penerapan pengenalan song-type burung Ortolan Bunting.
1.4 Batasan Masalah
Dalam pengenalan jenis nyanyian burung dilakukan beberapa batasan sebagai berikut :
1. Suara yang dapat diproses adalah suara wav (*.WAV).
2. Ekstrak ciri dilakukan dengan menggunakan metode GFCC (Greenwood Functions Ceptral Coefficients).
3. Pemodelan suara burung menggunakan metode HMM (Hidden Markov Models).
4. Jumlah data ada lima song-type burung dan setiap song-type ada 100 song.
5. Bahasa pemrograman yang digunakan adalah MATLAB 6.5.
1.5. Metodologi Penelitian
Metodologi yang digunakan untuk penelitian sebagai berikut :
1. Studi pustaka dan literature Tahap ini akan mempelajari teori-teori tentang pengenalan suara (Speech Recognition), feature extraction, metode HMM, algoritma Baum-Welch, algoritma Viterbi yang kesemuanya bersumber dari buku-buku maupun makalah-makalah.
2. Akuisisi Data Tahap ini mengolah sampel nyanyian burung Ortolon Bunting dari koleksi data yang tersedia.
3. Implementasi Pada tahap ini akan dibuat desain user interface serta berbagai tombol atau fungsi yang akan digunakan untuk membangun perangkat lunak sebagai alat bantu untuk pengenalan song-type burung.
4. Pengujian dan analisa Pada tahap ini akan dilakukan pengujian dan menganalisis hasil akurasi dengan menggunakan pendekatan HMM.
5. Kesimpulan Pembuatan kesimpulan dari hasil dan analisa yang dilakukan pada tahap pengujian.
1.6. Sistematika Penulisan
BAB I, Pendahuluan Berisi latar belakang yang mengarah pada deskripsi topik, rumusan masalah, batasan sistem, tujuan penelitian, metode penelitian, serta sistematika penulisan.
BAB II, Landasan Teori Berisi tentang teori-teori yang dipakai dalam implementasi, yaitu teori Pengenalan Suara (Speech Recognition), HMM (Hidden Markov
Models), feature extraction, algoritma Baum-Welch dan algoritma Viterbi.
BAB III, Metodologi Berisi tentang bagaimana perancangan dan pengimplementasian
metode Hidden Markov Models dan desain user interface untuk
membangun perangkat lunak sebagai alat bantu pengenalan song-type
burung.BAB IV, Implementasi dan Analisa Berisi tentang implementasi dari program yang dibuat sehingga menghasilkan akurasi serta analisis dari sistem yang dibuat. BAB V, Penutup Berisi tentang kesimpulan dan saran.
BAB II LANDASAN TEORI Pada bab ini akan dijelaskan beberapa teori yang menunjang perancangan
dan implementasi pengenalan song-type burung. Bagian ini mencakup : teknologi
Speech Recognition, feature extraction dan HMM.2.1 Teori Speech Recognition (Pengenalan suara)
Gambar 2.1 Blok diagram sistem pengenalan suara (Rabiner,1996) Gambar 2.1 menunjukkan blok diagram suatu sistem pengenalan suara.
Speech Recognition (pengenalan suara) merupakan metode untuk pengembangan
dan pengimplementasian algoritma pada komputer untuk mengenal linguistic
content dari suatu suara. Sinyal suara merupakan sinyal yang kompleks yang tidak
mudah diuraikan. Hasil sinyal suara antara orang yang satu berbeda dengan yang
lain. Suatu sinyal suara bisa berbeda, meskipun diucapkan oleh orang yang sama
terdiri dari beberapa tahap yaitu: feature analysis, accoustic modeling dan
language modeling.2.1.1. Feature analysis
Pada feature analysis, suara akan diekstrak menjadi sebuah rangkaian
feature vektor X yang mengandung informasi yang relevan tentang rangkaian kata
dari suatu suara. Feature analysis melakukan konversi sinyal suara ke dalam
bentuk rangkaian feature vector yang akan digunakan pada saat klasifikasi.
Analisis suara dikerjakan pada sebuah ukuran frame tertentu pada analysis
window. Sebuah window dengan ukuran 3 ms sampai 6 ms dapat digunakan untuk
feature analysis. Fourier adalah metode yang banyak digunakan untuk
mengekstrak feature spectral untuk pengenalan suara. Tujuan dari feature
analysis adalah menghitung parameter sebuah vokalisasi menjadi sebuah vektor
feature yang berisi informasi suatu vokalisasi. Feature analysis pada speech
recognition terdiri dari tiga proses:1. Beberapa deteksi suara digunakan untuk menghapus bagian yang bukan merupakan suara.
2. Feature diekstraksi untuk mendapatkan informasi.
3. Beberapa kompensasi sinyal diterapkan.
2.1.2. Accoustic modeling
Accoustic modeling digunakan untuk memodelkan secara statistik hasil
training yang telah dilakukan ke dalam sebuah template. Pada accoustic modeling
sistem harus dapat menentukan nilai P(X │W), kemungkinan dari observasi X bila
diketahui sebuah rangkaian suara tertentu W.2.1.3. Language modeling
Language modeling digunakan untuk memodelkan bentuk kata baik
berupa kata, fonem, ataupun kalimat. Awalnya sistem pengenalan suara hanya
menggunakan informasi akustik untuk mengevaluasi kemungkinan.
Perkembangan pada sistem pengenalan suara yaitu pemisahan bahasa untuk
meningkatkan akurasi. Struktur dan grammar rangkaian kata meningkatkan
akurasi sistem pengenalan suara dengan menghapus rangkaian kata yang baru
yang tidak sesuai dengan grammar (Seneff, 1992).Feature Extraction Pengenalan song-type burung yang menggunakan data yang mempunyai
label disebut sebagai “supervised”. Data suara yang diambil merupakan data
signal (audio). Namun tidak semua data audio tersebut yang digunakan, sehingga
diperlukan proses feature extraction untuk mengambil feature yang digunakan.
Feature yang diekstrak diharapkan mempunyai kemampuan untuk membedakan
kemiripan vokalisasi serta untuk membuat model tanpa membutuhkan sebuah data
training yang berlebihan.Adapun tujuan dari proses feature extraction adalah untuk parameterisasi
suara (audio) ke dalam rangkaian vector feature, sehingga dapat mewakili
ut. informasi dari suara terseb2.2.1. Greenwood function cepstral coefficients (GFCC)
Greenwood function cepstral coefficients (GFCC) merupakan salah satu
pendekatan yang digunakan untuk mengekstrak feature berdasarkan pada
perceptual model dari spesies. Dalam kasus ini adalah suara spesies burung
Ortolan Bunting.Greenwood (Greenwood , 1961, 1990) menjelaskan bahwa beberapa dari
spesies mamalia baik yang di darat maupun di air dapat menerima frekuensi pada
skala algoritmik dengan persamaan sebagai berikut := (10 − ) (2.1) Keterangan :
f merupakan frekuensi (Hz) A, a dan b merupakan konstanta untuk masing-masing spesies x merupakan posisi dari selaput pendengaran Untuk frekuensi f , maka pendefinisian frekuensi warping sebagai berikut :
( ) = ( + ) (2.2) Konstanta A dan a dapat diperoleh sebagai berikut : =
(2.3)
(2.4)
dimana range pende ndengaran spesies tersebut dan dan nilai b =0,88
(LePage, 2003).Vocalization Ceptral
Windowed Greenwood Discrete cosine FFT filterbank transform waveform coefficients
Gam ambar 2.2. Blok diagram perhitungan GFCC
Proses ekstrak kstrak ciri bisa dilihat pada gambar 2.2. Siny nyal suara dibagimenjadi beberapa fram frame dan masing-masing frame disebut window ndow. Window dari
data suara kemudia udian ditransformasi menggunakan fast fouri ourier transform,
didefinisikan sebagai ai berikut :(2.5)
dimana x(n) adalah si h sinyal dalam waktu dengan panjang N; k=0,1,... 0,1,... N-1 dan k
berkorespondensi den dengan frekuensi f(k) = kfs/N, fs adalah sam sampling frekuensi
dalam Hz dan w(n) n) adalah time-window. Time-window yang di digunakan adalah Suara burung Ortolan Bunting mempunyai jangkuan frekuensi yang lebih
tinggi dari suara manusia. Window-sizes untuk suara burung adalah antara 3 ms
hingga 6 ms sehingga untuk setiap ukuran frame adalah satu-setengah dari
window-sizes dengan overlap secara berturut-turut sebesar 50% dari window-
sizes. Besarnya koefisien |X(k)| dikorelasikan dengan masing-masing triangular
filter dalam Greenwood filterbank (k, m). Korelasi ini berarti koefisien magnitude
dari fast fourier transform dikalikan dengan filter-gain, didefinisikan sebagai
berikut :( ) = ( | ( )| ( , )) (2.6) ∑
untuk m = 1, 2, …, M, dimana M adalah jumlah dari filterbank dan M<<N.
Greenwood filterbank merupakan kumpulan dari triangular filter yang
didefinisikan oleh frekuensi-frekuensi utama. Frekuensi utama pada Greenwood
filterbank dihitung dengan menggunakan skala Greenwood pada persamaan (2.2).
Triangular filter terdapat diseluruh jangkauan frekuensi dari nol hingga frekuensi
Nyquist. Band-limiting menggunakan frekuensi bawah dan atas untuk me-reject
frekuensi yang tidak diinginkan. Pada Greenwood filterbank, untuk suara burung
Ortolan Bunting menggunakan jangkauan frekuensi dari 400 hz hingga 7400 Hz
(gambar 2.3) supaya sesuai dengan dari song burung (Edwards,
− 1943).Gambar 2.3. Greenwood filterbankGambar 2.3 merupakan proses pada Greenwood filterbank. Pada proses ini sinyal suara akan difilter sehingga menghasilkan feature yang tidak berkorelasi.
Amplitudo filterbank biasanya berkorelasi dan penggunaan dari sebuah
transformasi cepstral memberikan gambaran yang lebih baik untuk pengenalan
pola. Discrete cosine transform digunakan untuk menghitung koefisien cepstral dari log amplitudo filterbank sebagai berikut :( ) = ( ( )cos ( (2.7) ∑ − 0,5)) untuk i = 1, 2, …M, dimana c(i) adalah GFCC.
2.2.2. Greenwood function cepstral coefficients (GFCC) Delta dan
delta-delta Vektor-vektor feature dihitung dari fungsi Greenwood yang memberikansebuah perkiraan yang terbaik dari local spectra. Karakteristik yang penting dari
data vokalisasi ini dinamis vokalisasi. Kinerja sistem suara dapat ditingkatkan
dengan menambah waktu turunan pada parameter statis. Banyak peneliti
memanfaatkan perkiraan daerah turunan waktu. Delta cepstrum (Furui, 1986)
adalah salah satu bentuk umum dari langkah ini. Delta cepstrum
diimplementasikan sebagai turunan pertama koefisien regresi. Turunan waktu
dinyatakan sebagai berikut :( ) ∑
= (2.8)
∑
dimana d adalah koefisien delta pada waktu t dihitung dalam jangka koefisien
t waktu statis c t-k hingga c t+k .Turunan kedua, disebut sebagai delta-delta cepstrum atau koefisien
percepatan, sesuai dengan penerapan korelasi yang sama pada koefisien delta.
Sebagian besar sistem yang memadukan feature delta dan delta-delta. Kedua
feature tersebut digunakan sebagai tambahan pada perhitungan statis seperti
MFCCs atau GFCCs.2.3 Hidden Mar Markov Models (HMM)
2.3.1. Teori Markov kov Model
Markov mode odel merupakan sistem dengan serangkaian st state dan transisi
state (setiap transisi da si dari state mempunyai sebuah probabilitas) di dimana rangkaian
dari state-state tersebut sebut disebut dengan Markov chain.Dalam Markov rkov model atau first-order-Markov mengasum asumsikan bahwa
probabilitas observasi vasi pada waktu n hanya tergantung pada obse observasi S yang
n-1 dilakukan pada waktu ktu n-1. Untuk serangkaian {S 1 ,S 2 ,...,S n } makaP(S ,S ,...,S ) = P(S ) (asumsi Markov) Markov) (2.9) n │ │S n-1 n-2
1 n │S n-1
Untuk mempe mperoleh probabilitas gabungan (joint probabi probability) dari
observasi-observasi se si sebelumnya maupun observasi sekarang da dapat diturunkan
menjadi :(2.10) Contoh soal : Misalkan terda rdapat 3 tipe cuaca : “sunny”, ”rainy” dan “ n “foggy”, berikut
dengan tabel probabi abilitas P(S n+1 n ) cuaca yang akan terjadi jadi besok (S n+1 )
│S berdasarkan cuaca har hari ini (S ) yang terlihat pada tabel 2.1. n
Tabel 2.1.
P(S 2 =sunny, S 3 =rainy| S
1 =sunny) = P(S
3 =rainy, S 2 =sunny| S 1 =sunny) .Hidden Markov Models (HMM) adalah sebuah model statistik yang
diasumsikan dari rantai Markov dengan parameter yang tidak diketahui. Metode
ini disebut sebagai model statistik karena metode ini mencari means, varians dan
P(S 3 =sunny| S 2 =foggy, S 1 =rainy)= P(S 3 =sunny| S 2 =foggy)= 0.2
3 dengan cuaca “sunny” ?
2. Jika cuaca kemarin S 1 adalah “rainy” dan cuaca hari ini S 2 adalah “foggy”, berapakah probabilitas besok S
1 =sunny) = 0.05 . 0.8 = 0.04
2 =sunny| S
2 =sunny) . P(S
3 =rainy| S
1 =sunny)= P(S
2 =sunny| S
3 ) adalah “rainy” ?
Probabolitas P(S n+1 │S n ) cuaca yang akan terjadi besok berdasarkan
cuaca hari ini
Cuaca besok Cuaca hari ini sunny Rainy foggy1. Jika hari ini cuacanya adalah “sunny” berapakah probabilitas besok bercuaca “sunny” dan hari berikutnya (S
0.5 State yang ada q = {“sunny”, ”rainy”, “foggy”} dan setiap hari mempunyai kemungkinan transisi P(S n │S n-1 ) state berdasarkan tabel probabilitas 2.1.
0.3
0.2
0.2 Foggy
0.6
0.2
0.15 Rainy
0.05
0.8
Sunny
P(S
2.3.2 Definisi HMM
probabilitas dari model yang dimasukkan.
Hidden Markov Models merupakan rantai markov dengan himpunan state
terbatas yang menghasilkan suatu barisan pengamatan dan bersifat tersembunyi
(hidden). Perubahan atau perpindahan state direpresentasikan oleh suatu
himpunan peluang yang dinamakan matriks peluang transisi. Hidden Markov
Models dibangun oleh suatu kejadian yang tersembunyi hidden. HMM digunakan
untuk pembuatan model pada proses training dan testing. Bentuk model HMM
berupa state-state yang saling berhubungan. Proses training bertujuan untuk
membuat model untuk data suara burung. Pemodelan ini berupa model yang
bersifat kontinu untuk data suara.Gambar 2.4. HMM dari kiri ke kanan (after Young et al., 2002)Gambar 2.4 merupakan salah satu contoh rangkaian HMM dari kiri ke kanan dimana ada sebuah lima model state yang bergerak melalui rangkaian stateS=1, 2, 2, 3, 4, 4, 5 untuk menghasilkan rangkaian x 1 hingga x 5 . Model state ke-2,
3 dan 4 mempunyai ai hasil probabilitas yang saling berhubungan gan dengan model
state tersebut. Matriks riks pada model ini mempunyai 5 baris dan 5 5 kolom sebagai
berikut : a = ij1 0.3 0. 4 0. 3
0.3
0.7
0.3
0.7 Probabilitas ke keseluruhan adalah X yang dihasilkan oleh h model HMM M
bergerak melalui rang angkaian state S adalah hanya dihitung hasil sil dari probabilitas
transisi dan probabili bilitas output. Jadi rangkaian state pada gam ambar 2.4 sebagai
berikut :P ( X , S
12 b
2 (x 1 ) a 22 b 2 (x 2 ) a 23 b 3 (x 3 )... (2.13) │M )= a Pendekatan ini ini, hanya rangkaian observasi X yang diketahui ahui dan rangkaian state S tersembunyi (hi hidden). Pendekatan ini disebut Hidden Mark arkov Model.HMM didefini inisikan oleh sebuah kumpulan parameter (
{s} ada adalah kumpulan state yang menyatakan state a e awal S 1 dan state akhir S S
F { a ij } a } adalah probabilitas sebuah transisi dari state i i sampai state j {b (k)} } adalah probabilitas dari keluaran output k pa pada saat state j. j a dan b memenuhi sif sifat sebagai berikut : Ada dua asum sumsi pada sebuah deret pertama HMM. Pertam ama adalah asumsi
Markov pada persa rsamaan (2.10). Asumsi kedua adalah a asumsi output-
independence. Proba obabilitas pada masing-masing state diperol roleh berdasarkan
observasi x i sehingga pr ngga probabilitas P(S i |x i ) dapat dirumuskan sebaga bagai berikut : (2.14)Dengan memperhatika tikan probabilitas P(x i ) yang tidak berubah unt untuk setiap state
maka masing-masing sing potensi state yang akan diuji atau diperiksa periksa mempunyai
probabilitas P(x i ) yan ang sama sehingga persamaan 2.14 dapat dirum dirumuskan sebagai
berikut :(2.15) Contoh soal : Pada contoh oh Markov model, keadaan cuaca dapat diobse diobservasi secara
langsung sedangkan p n pada HMM, cuaca-cuaca dalam keadaan “hi hidden”. Hal ini
dapat kita umpamaka akan seandainya kita dikunci disebuah kamar ar untuk beberapa
hari (tidak dapat me elihat kondisi luar). Untuk melakukan predi ediksi cuaca yang
akan terjadi, maka hanya terdapat tanda yaitu pada orang yang setiap datang ke
kamar untuk membawakan makanan, apakah orang tersebut membawa payung
atau tidak.1. Seandainya hari pada saat kita terkunci bercuaca “sunny” . Hari berikutnya orang yang mengantarkan makanan membawa payung.
L(S
2 =membawa payung) = P(x
2 =membawa
2 =membawa payung) = P(x
1 =sunny, x
2 =rainy| S
2 =sunny) . P(S
2 =sunny| S
1 =sunny) = 0.1 . 0.8 = 0.08 Kemungkinan hari kedua “rainy” :2 =membawa payung| S
1 =sunny, x
Tabel 2.2 . Probabilitas P(x2 =sunny| S
Berapakah probabilitas masing-masing cuaca pada hari itu? Kemungkinan hari kedua adalah “sunny” :
0.3 Tabel 2.2 merupakan probabilitas membawa payung berdasarkan keadaan
cuaca. Probabilitas orang tersebut membawa payung jika cuaca pada hari itu
“sunny” adalah 0.1, jika bercuaca “rainy” adalah 0.8, jika bercuaca “foggy”adalah
0.3.0.8 Foggy
0.1 Rainy
Sunny
) membawa payung berdasarkan cuaca S i pada hari i
Cuaca Probabilitas membawa payung
i |S i
L(S
payung| S 2 =rainy) . P(S
2 =rainy| S
1 =sunny) = 0.8 . 0.05 = 0.04 Kemungkinan hari kedua “foggy” :L(S 2 =foggy| S 1 =sunny, x 2 =membawa payung) = P(x 2 =membawa payung| S
2 =foggy) . P(S
2
=foggy| S
1 =sunny) = 0.3 . 0.15 =0.045
2. Seandainya kita tidak mengetahui cuaca pada hari kita dikunci dalam kamar, tiga hari berturut-turut orang mengantarkan makanan tidak membawa payung. Berapakah likelihood cuaca tersebut adalah {
1 = ,
2 = ,
3 = } ?
L(S
2 =foggy, S
1 =sunny| S
1
=tidak membawa payung, x2 =tidak membawa payung, x
3 =tidak membawa payung) = P(x 1 =tidak membawa payung| S
1 =sunny) . P(x
2 =tidak membawa payung| S
2 =foggy) . P(x
3 =tidak membawa payung| S
3 =sunny) . P(S 1 =sunny). P(S 2 =foggy| S 1 =sunny) . P(S 3 =sunny| S 2 =foggy) = 0.9 . 0.7 . 0.9 . 1/3 . 0.15 . 0.2 = 0.0057
Pada vokalisasi burung, state menunjukkan rangkaian waktu dari silabel, dapat dilihat pada gambar 2.5 sebagai berikut :
Gambar 2.5. Markov model untuk song ortolan bunting3 =sunny| x
Dalam kasus penge genalan song-type burung Ortolan Bunting, unting, HMM akan
memodelkan karakter kteristik sinyal atau suara yang secara temporal poral dan spectrum
yang memiliki bebera berapa variasi. Dalam state terdapat suatu runtun untun waktu sinyal
yang dihasilkan oleh sua h suara burung Ortolan Bunting tersebut.Struktur dasar sar HMM diatas memberikan tiga masalah utam ama yang dihadapi HMM (Rabiner, 1989 1989) sebagai berikut :
1. Masalah evalua aluasi Bila diketahui hui suatu model HMM observasi, bagaimana dan barisan observa menghitung p probabilitas observasi jika diberikan model?
2. Masalah decodi coding Bila diketahui hui barisan observasi dan model, bagaima ana menentukan barisan state y e yang optimal?
3. Masalah penge ngenalan
Bagaimana menyesua suaikan model parameter untuk memaksimalka lkan probabilitas
observasi?2.3.3 Algoritma Vit Viterbi
Rangkaian obse observasi dapat ditentukan secara rekursif kursif menggunakan
algoritma Viterbi. Alg Algoritma Viterbi membuat penggunaan dari dua i dua variabel t (i)
t (i). t (i) adalah lah kemungkinan nilai tertinggi mendekati jalur lur single diantara δ δ δ dan ψ δ semua jalur terakhir pa r pada state i waktu t.(2.16)
ψ t (i) merupakan varia pada state i waktu t.
δ t (i) seperti forward re dan perhitungannya id HMM dengan adalah sebagai berikut
Inisialisasi Recursion Terminati Backtrack sehingga variabel untuk menyimpan data pada akhir jalur ard recursion
α t (i), hanya dengan mengenai rangk a identik mendekati. gan N state, cara menemukan rangkaian stat kut : sasi ion nation racking alur yang terbaik (2.17) gkaian state single state yang terbaik Sebelumnya r rangkaian observasi X = (x 1, x 2, ..., x T ) adalah lah sebuah model
parameter oritma Viterbi memberikan dua hasil yang bai aik, yaitu pilihan
Φ, algoritm- *
jalur yang terbaik diant diantara semua jalur yang mungkin pada model el yang dikenal, S
- * * *
= { S ,...., S } dan ke kemungkinan jalur terbaik P(X,S
X
1 T │Φ)=Φ P(X│ │Φ)
2.3.4 Algoritma Bau Baum-welch
Pada training ning akan membentuk suatu model (estimate ate model). Pada t (i) adalah estimate model akan menghitung probabilitas state. Definisi γ estimate model akan menghitung probabilitas state. Definisi γ estimate model akan menghitung probabilitas state. Definisi γ
probabilitas pada state state S pada waktu t, diketahui deret obeservasi si X dan model ,
i sebagai berikut :(2.18) Rumus (2.16) dapat di t dinyatakan dengan variabel forward-bakward ard seperti : (2.19) Selain itu juga dapat didefinisikan dengan fungsi probabilitas ξ Selain itu juga dapat didefinisikan dengan fungsi probabilitas ξ t (i,j), probabilitas (
pada state S pada wakt aktu t sampai state S pada waktu t+1, diketah tahui model dan
i j rangkaian observasi X X sebagai berikut: (2.20)
Dari definisi variabel bel forward dan backward, rumus diatas didef definsikan sebagai
berikut : (2.21) Hubungan antara t (i t (i,j) sebagai berikut :γ ) dan ξ ) dan ξ (2.22)
Estimasi awal da dari parameter model adalah sebaga agai berikut :
(2.23) (2.24) (2.25)^
Setelah estimasi awal dari parameter model, model baru yang lebih mungkin
menghasilkan rangkaian observasi X dari model yang dihasilkan yaitu
^ P(X )> P(X │ │).
Algoritma Baum-welch yang dijelaskan diatas merupakan implementasi
secara umum dari EM algoritma. Awalnya dengan menginisialisasi parameter
HMM =(A, B, π), perhitungan E (expectation) dan M (maximization) secara bergantian. Untuk E (expectation) menghitung perkiraan total state occupancy γdan perkiraan total transisi state dari kemungkinan probabilitas A dan B dengan
algoritma forward-backward. Pada M(maximization ), γ dan ξ digunakan untuk
menghitung probabilitas baru A, B dan π dengan persamaan (2.23), (2.24) dan (2.25).BAB III METODOLOGI Bab ini menjelaskan tahap perancangan dan pengimplementasian metode Hidden Markov Models untuk mengenal song-type burung Ortolan Bunting sehingga menghasilkan akurasi yang optimal.
3.1. Data
Jenis burung yang dijadikan sampel adalah Ortolan Bunting (Emberiza
hortulana). Ortolan Bunting adalah burung yang bermigrasi yang tersebar dari
Eropa Barat ke Mongolia (Cramp, Perrins, 1994). Pada musim dingin berada di
Africa. Burung ini mendiami daerah pertanian, dataran tinggi, padang pasir ,
hutan yang telah terbakar dan hutan gundul. Ortolan Bunting termasuk burung
monogami, diklasifikasi sebagai spesies yang langka. Burung ini mengalami
penurunan populasi yang cukup besar pada jumlah individu dan penyebarannya.
Ortolan Bunting mempunyai song yang relatif sederhana dan setiap individu
mempunyai 2-3 song-type. Frekuensi song berada diantara 1.9 kHz dan 6.7 kHz.
Beberapa song dari Ortolon Bunting digambarkan berdasar silabel, song-type dan
song variants. Jumlah keseluruhan ada 63 song type dan 234 variasi song,
tersusun dari 20 silabel yang berbeda. Sebuah silabel merupakan inisial suatu
song.Sebuah song digambarkan dengan menggunakan notasi huruf seperti
aaaabb or ccccbb, dimana huruf menunjukkan keterangan silabel. Setiap song-
type mempunyai beberapa silabel yang panjang dan frekuensinya berbeda di
antara individu, tetapi mempunyai ukuran yang sama pada sonogram.Gambar 3.1. Syllable Ortolan Bunting (Osiejuk, 2003)Gambar 3.1 merupakan kumpulan silabel dari burung Ortolan Bunting. Song-type adalah sebuah kumpulan song yang terdiri dari susunan silabel yang sama padarangkaian yang sama. Sebagai contoh: type-ab(aaabb), type-cb(cccbb).
Setiap song-type mempunyai perbedaan pada jumlah silabel dalam song
yang disebut song variant, misalnya : song-type ab mempunyai banyak song
variant yang mungkin yaitu aaab,aabbbb,aaabb. Silabel awal dan akhir
mempunyai sedikit perbedaan pada amplitudo dan frekuensi karena mekanisme
produksi suara. Contoh song-type burung Ortolan bunting yang diubah menjadi
sinyal spectrogram :Gambar 3.2 . Specgram Song-type ab
Gambar 3.3 . Specgram Song-type cb
Perancangan dan pengimplementasian metode HMM untuk mengenal
song-type burung Ortolan Bunting, menggunakan jumlah sampel lima song-type
yaitu song-type ab, song-type cb, song-type cd, song-type eb, song-type ef.
(gambar 3.2 dan 3.3). Specgram pada masing-masing song-type menggambarkan
silabelnya. Setiap song-type terdapat 100 song burung Ortolan Bunting dan ada 8