Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Program Studi Teknik Informatika

  

PENGENALAN SONG-TYPE BURUNG ORTOLAN BUNTING

MENGGUNAKAN PENDEKATAN HIDDEN MARKOV

MODELS

SKRIPSI

  

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik

Program Studi Teknik Informatika

  

Oleh:

Lydia Rizcy Arimbi

NIM : 055314072

  

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2010

HALAMAN PERSEMBAHAN

  Ketika segala macam ujian dan pencobaan menekan hidup kita, jangan menganggap semua itu seperti para penyusup, tetapi sambutlah mereka seperti para kawan.

  Skipsi ini saya persembahkan untuk : Yesus Kristus, keluarga, sahabat-sahabat dan kekasih.

  Terima kasih untuk segalanya. v

  

DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA................................................ ...I

HALAMAN JUDUL BAHASA INGGRIS ..................................................... ..II

HALAMAN PERSETUJUAN ......................................................................... .III

HALAMAN PENGESAHAN........................................................................... .IV

HALAMAN PERSEMBAHAN ....................................................................... ..V

HALAMAN PERNYATAAN KEASLIAN KARYA ..................................... .VI

HALAMAN PERSETUJUAN PUBLIKASI .................................................. VII

ABSTRAK ........................................................................................................ VIII

ABSTRACT....................................................................................................... .IX

KATA PENGANTAR....................................................................................... ...X

DAFTAR ISI...................................................................................................... XII

  

I. PENDAHULUAN ....................................................................................... …1

  

1.1. Latar Belakang dan Deskripsi Topik ........................................................... ....1

  

1.2. Rumusan Masalah ........................................................................................ …2

  

1.3. Tujuan .......................................................................................................... …2

  

1.4. BatasanMasalah… ....................................................................................... ...3

  

1.5. Metodologi Penelitian .................................................................................. …3

  

1.6. Sistematika Penulisan .................................................................................. …4

  

II. LANDASAN TEORI .................................................................................. …6

  

2.1. Teori Speech Recognition (Pengenalan suara) ............................................ …6

  2.1.1. Feature Analysis ............................................................................... …7

  2.1.2. Accoustic Modeling........................................................................... …8

  2.1.3. Language Modeling ......................................................................... …8

  

2.2. Feature Extraction....................................................................................... …8

  2.2.1. Greenwood function cepstral coefficients (GFCC)........................... …9

  2.2.2. Greenwood function cepstral coefficients (GFCC) Delta dan delta-delta ......................................................................... ..13

  

2.3. Hidden Markov Models (HMM) ................................................................. ..14

  2.3.1. Teori Markov Model......................................................................... ..14

  2.3.2. Definisi HMM................................................................................... ..16

  2.3.3. Algoritma Viterbi .............................................................................. ..22

  2.3.4. Algoritma Baum-Welch .................................................................... ..23

  

III.METODOLOGI .......................................................................................... ..27

  

3.1. Data.............................................................................................................. ..27

  

3.2. Skema Pengenalan Suara menggunakan HMM .......................................... ..32

  3.2.1. Feature extraction............................................................................. ..33

  3.2.2. Tahap Training.................................................................................. ..34

  3.2.3. Tahap Testing.................................................................................... ..35

  

3.3. Kebutuhan Perangkat Lunak ....................................................................... ..37

  

3.4. Kebutuhan Perangkat Keras ........................................................................ ..37

  

3.5. Perancangan Antar Muka ............................................................................ ..38

  3.5.1. Halaman Home.................................................................................. ..38

  3.5.2. Halaman Pengenalan Song-type........................................................ ..39

  3.5.3. Halaman Pengujian Akurasi Hidden Markov Models....................... ..40

  3.5.4. Halaman Bantuan.............................................................................. ..41

  3.5.5. Halaman Tentang Program ............................................................... ..42

  

IV. IMPLEMENTASI DAN ANALISA .......................................................... . 43

  

4.1. Hasil Penelitian............................................................................................ ..43

  

4.2. Implementasi Antar Muka yang Digunakan pada Sistem ........................... ..48

  4.2.1. Halaman Utama ................................................................................ ..48

  4.2.2. Halaman Pengenalan Song-type........................................................ ..50

  4.2.3. Halaman Pengujian Hidden Markov Models .................................... ..52

  4.2.4. Halaman Bantuan.............................................................................. ..54

  

V. PENUTUP.................................................................................................... ..56

  

5.1. Kesimpulan.................................................................................................. ..56

  

5.2. Saran ............................................................................................................ ..57

DAFTAR PUSTAKA........................................................................................ ..58

HALAMAN LAMPIRAN LISTING PROGRAM......................................... ..60

HALAMAN LAMPIRAN FILE HMM........................................................... ..93

BAB I PENDAHULUAN

1.1. Latar Belakang dan Deskripsi Topik

  Perkembangan teknologi informasi saat ini mengalami kemajuan yang

sangat pesat. Berbagai pemanfaatan teknologi informasi menghasilkan informasi

yang dapat meningkatkan kinerja manusia. Perkembangan teknologi speech

recognition (pengenalan suara) adalah salah satu bentuk perkembangan teknologi

di abad ke 20 yang memanfaatkan suara sebagai masukan. Komputer akan

mengenali suara sebagai perintah dan memberi terhadap perintah tersebut.

  Teknologi pengenalan suara dapat diimplementasikan untuk mengenali

suara binatang. Teknik-teknik yang digunakan untuk mengenal pola suara

binatang dengan variasi vokalisasi dibagi menjadi 2 kategori yaitu kualitatif dan

kuantitatif (Mc.Gregor et al., 2000). Pendekatan kualitatif meliputi perbandingan

spectogram yang dilakukan oleh para peneliti. Kebanyakan peneliti biologi

mengenal suara binatang dengan sonogram yaitu deskripsi dari sebuah

spectogram. Pendekatan ini mempunyai konsep yang sederhana dan kemudahan

dalam pengoperasian (Wakita, 1976). Akan tetapi, variable yang dilibatkan dalam

perhitungan dengan spectogram tidak cukup untuk menggambarkan karakteristik

dari isi spectrum dan pola signal sehingga tingkat akurasinya rendah. Untuk itu,

diperlukan metode kuantitatif yang lebih teliti dalam pengukuran secara detail

parameter frekuensi dan parameter temporal dari suatu vokalisasi. Salah satu

metode pendekatan kuantitatif adalah Hidden Markov Models. Metode ini tidak

  

membutuhkan waktu yang lama dalam pengoperasian, dan hasil akurasi yang

diperoleh tinggi.

  Dalam penulisan tugas akhir ini, akan diterapkan pendekatan Hidden

Markov Models untuk mengenal song-type burung Ortolon Bunting. Burung ini

bermigrasi tersebar dari Eropa Barat ke Mongolia (Cramp, Perrins, 1994). Burung

ini mempunyai ciri khas suara yang unik. Suara yang dihasilkan mempunyai

variasi song-type. Burung ini mempunyai song-type yang berbeda untuk setiap

individu. Setiap burung mempunyai dua sampai tiga song-type.

  1.2. Rumusan Masalah Dari latar belakang diatas dapat dirumuskan masalah sebagai berikut :

  

1. Bagaimana komputer secara otomatik dapat mengenal song-type

burung?

  2. Bagaimana mengimplementasikan pendekatan Hidden Markov Models (HMM) yang banyak digunakan dalam teknologi Speech Recognation untuk mengenali song-type burung?

  3. Bagaimana tingkat akurasi pengenalan song-type burung dengan menggunakan metode HMM?

  1.3 Tujuan Adapun tujuan dari penelitian ini adalah

1. Merancang dan mengimplementasikan metode HMM untuk mengenal secara otomatis song-type burung Ortolan Bunting.

2. Menganalisa dan mengetahui keakuratan metode HMM dalam penerapan pengenalan song-type burung Ortolan Bunting.

1.4 Batasan Masalah

  Dalam pengenalan jenis nyanyian burung dilakukan beberapa batasan sebagai berikut :

  1. Suara yang dapat diproses adalah suara wav (*.WAV).

  2. Ekstrak ciri dilakukan dengan menggunakan metode GFCC (Greenwood Functions Ceptral Coefficients).

  3. Pemodelan suara burung menggunakan metode HMM (Hidden Markov Models).

  4. Jumlah data ada lima song-type burung dan setiap song-type ada 100 song.

  5. Bahasa pemrograman yang digunakan adalah MATLAB 6.5.

1.5. Metodologi Penelitian

  Metodologi yang digunakan untuk penelitian sebagai berikut :

  1. Studi pustaka dan literature Tahap ini akan mempelajari teori-teori tentang pengenalan suara (Speech Recognition), feature extraction, metode HMM, algoritma Baum-Welch, algoritma Viterbi yang kesemuanya bersumber dari buku-buku maupun makalah-makalah.

  2. Akuisisi Data Tahap ini mengolah sampel nyanyian burung Ortolon Bunting dari koleksi data yang tersedia.

  3. Implementasi Pada tahap ini akan dibuat desain user interface serta berbagai tombol atau fungsi yang akan digunakan untuk membangun perangkat lunak sebagai alat bantu untuk pengenalan song-type burung.

  4. Pengujian dan analisa Pada tahap ini akan dilakukan pengujian dan menganalisis hasil akurasi dengan menggunakan pendekatan HMM.

  5. Kesimpulan Pembuatan kesimpulan dari hasil dan analisa yang dilakukan pada tahap pengujian.

1.6. Sistematika Penulisan

  BAB I, Pendahuluan Berisi latar belakang yang mengarah pada deskripsi topik, rumusan masalah, batasan sistem, tujuan penelitian, metode penelitian, serta sistematika penulisan.

  BAB II, Landasan Teori Berisi tentang teori-teori yang dipakai dalam implementasi, yaitu teori Pengenalan Suara (Speech Recognition), HMM (Hidden Markov

  

Models), feature extraction, algoritma Baum-Welch dan algoritma Viterbi.

  BAB III, Metodologi Berisi tentang bagaimana perancangan dan pengimplementasian

metode Hidden Markov Models dan desain user interface untuk

membangun perangkat lunak sebagai alat bantu pengenalan song-type

burung.

BAB IV, Implementasi dan Analisa Berisi tentang implementasi dari program yang dibuat sehingga menghasilkan akurasi serta analisis dari sistem yang dibuat. BAB V, Penutup Berisi tentang kesimpulan dan saran.

BAB II LANDASAN TEORI Pada bab ini akan dijelaskan beberapa teori yang menunjang perancangan

  

dan implementasi pengenalan song-type burung. Bagian ini mencakup : teknologi

Speech Recognition, feature extraction dan HMM.

2.1 Teori Speech Recognition (Pengenalan suara)

Gambar 2.1 Blok diagram sistem pengenalan suara (Rabiner,1996) Gambar 2.1 menunjukkan blok diagram suatu sistem pengenalan suara.

  

Speech Recognition (pengenalan suara) merupakan metode untuk pengembangan

dan pengimplementasian algoritma pada komputer untuk mengenal linguistic

content dari suatu suara. Sinyal suara merupakan sinyal yang kompleks yang tidak

mudah diuraikan. Hasil sinyal suara antara orang yang satu berbeda dengan yang

lain. Suatu sinyal suara bisa berbeda, meskipun diucapkan oleh orang yang sama

  

terdiri dari beberapa tahap yaitu: feature analysis, accoustic modeling dan

language modeling.

2.1.1. Feature analysis

  Pada feature analysis, suara akan diekstrak menjadi sebuah rangkaian

feature vektor X yang mengandung informasi yang relevan tentang rangkaian kata

dari suatu suara. Feature analysis melakukan konversi sinyal suara ke dalam

bentuk rangkaian feature vector yang akan digunakan pada saat klasifikasi.

  

Analisis suara dikerjakan pada sebuah ukuran frame tertentu pada analysis

window. Sebuah window dengan ukuran 3 ms sampai 6 ms dapat digunakan untuk

feature analysis. Fourier adalah metode yang banyak digunakan untuk

mengekstrak feature spectral untuk pengenalan suara. Tujuan dari feature

analysis adalah menghitung parameter sebuah vokalisasi menjadi sebuah vektor

feature yang berisi informasi suatu vokalisasi. Feature analysis pada speech

recognition terdiri dari tiga proses:

  1. Beberapa deteksi suara digunakan untuk menghapus bagian yang bukan merupakan suara.

  2. Feature diekstraksi untuk mendapatkan informasi.

  3. Beberapa kompensasi sinyal diterapkan.

2.1.2. Accoustic modeling

  Accoustic modeling digunakan untuk memodelkan secara statistik hasil

training yang telah dilakukan ke dalam sebuah template. Pada accoustic modeling

  

sistem harus dapat menentukan nilai P(X │W), kemungkinan dari observasi X bila

diketahui sebuah rangkaian suara tertentu W.

2.1.3. Language modeling

  Language modeling digunakan untuk memodelkan bentuk kata baik

berupa kata, fonem, ataupun kalimat. Awalnya sistem pengenalan suara hanya

menggunakan informasi akustik untuk mengevaluasi kemungkinan.

  

Perkembangan pada sistem pengenalan suara yaitu pemisahan bahasa untuk

meningkatkan akurasi. Struktur dan grammar rangkaian kata meningkatkan

akurasi sistem pengenalan suara dengan menghapus rangkaian kata yang baru

yang tidak sesuai dengan grammar (Seneff, 1992).

  Feature Extraction Pengenalan song-type burung yang menggunakan data yang mempunyai

label disebut sebagai “supervised”. Data suara yang diambil merupakan data

signal (audio). Namun tidak semua data audio tersebut yang digunakan, sehingga

diperlukan proses feature extraction untuk mengambil feature yang digunakan.

  

Feature yang diekstrak diharapkan mempunyai kemampuan untuk membedakan

kemiripan vokalisasi serta untuk membuat model tanpa membutuhkan sebuah data

training yang berlebihan.

  Adapun tujuan dari proses feature extraction adalah untuk parameterisasi

suara (audio) ke dalam rangkaian vector feature, sehingga dapat mewakili

ut. informasi dari suara terseb

2.2.1. Greenwood function cepstral coefficients (GFCC)

  Greenwood function cepstral coefficients (GFCC) merupakan salah satu

pendekatan yang digunakan untuk mengekstrak feature berdasarkan pada

perceptual model dari spesies. Dalam kasus ini adalah suara spesies burung

Ortolan Bunting.

  Greenwood (Greenwood , 1961, 1990) menjelaskan bahwa beberapa dari

spesies mamalia baik yang di darat maupun di air dapat menerima frekuensi pada

skala algoritmik dengan persamaan sebagai berikut :

  = (10 − ) (2.1) Keterangan :

   f merupakan frekuensi (Hz)  A, a dan b merupakan konstanta untuk masing-masing spesies  x merupakan posisi dari selaput pendengaran Untuk frekuensi f , maka pendefinisian frekuensi warping sebagai berikut :

  ( ) = ( + ) (2.2) Konstanta A dan a dapat diperoleh sebagai berikut : =

  (2.3)

  (2.4)

dimana range pende ndengaran spesies tersebut dan dan nilai b =0,88

(LePage, 2003).

  Vocalization Ceptral

  Windowed Greenwood Discrete cosine FFT filterbank transform waveform coefficients

  

Gam ambar 2.2. Blok diagram perhitungan GFCC

Proses ekstrak kstrak ciri bisa dilihat pada gambar 2.2. Siny nyal suara dibagi

menjadi beberapa fram frame dan masing-masing frame disebut window ndow. Window dari

data suara kemudia udian ditransformasi menggunakan fast fouri ourier transform,

didefinisikan sebagai ai berikut :

  (2.5)

dimana x(n) adalah si h sinyal dalam waktu dengan panjang N; k=0,1,... 0,1,... N-1 dan k

berkorespondensi den dengan frekuensi f(k) = kfs/N, fs adalah sam sampling frekuensi

dalam Hz dan w(n) n) adalah time-window. Time-window yang di digunakan adalah Suara burung Ortolan Bunting mempunyai jangkuan frekuensi yang lebih

tinggi dari suara manusia. Window-sizes untuk suara burung adalah antara 3 ms

hingga 6 ms sehingga untuk setiap ukuran frame adalah satu-setengah dari

window-sizes dengan overlap secara berturut-turut sebesar 50% dari window-

sizes. Besarnya koefisien |X(k)| dikorelasikan dengan masing-masing triangular

filter dalam Greenwood filterbank (k, m). Korelasi ini berarti koefisien magnitude

dari fast fourier transform dikalikan dengan filter-gain, didefinisikan sebagai

berikut :

  ( ) = ( | ( )| ( , )) (2.6) ∑

untuk m = 1, 2, …, M, dimana M adalah jumlah dari filterbank dan M<<N.

  

Greenwood filterbank merupakan kumpulan dari triangular filter yang

didefinisikan oleh frekuensi-frekuensi utama. Frekuensi utama pada Greenwood

filterbank dihitung dengan menggunakan skala Greenwood pada persamaan (2.2).

  

Triangular filter terdapat diseluruh jangkauan frekuensi dari nol hingga frekuensi

Nyquist. Band-limiting menggunakan frekuensi bawah dan atas untuk me-reject

frekuensi yang tidak diinginkan. Pada Greenwood filterbank, untuk suara burung

Ortolan Bunting menggunakan jangkauan frekuensi dari 400 hz hingga 7400 Hz

(gambar 2.3) supaya sesuai dengan dari song burung (Edwards,

− 1943).

Gambar 2.3. Greenwood filterbankGambar 2.3 merupakan proses pada Greenwood filterbank. Pada proses ini sinyal suara akan difilter sehingga menghasilkan feature yang tidak berkorelasi.

  

Amplitudo filterbank biasanya berkorelasi dan penggunaan dari sebuah

transformasi cepstral memberikan gambaran yang lebih baik untuk pengenalan

pola. Discrete cosine transform digunakan untuk menghitung koefisien cepstral dari log amplitudo filterbank sebagai berikut :

  ( ) = ( ( )cos ( (2.7) ∑ − 0,5)) untuk i = 1, 2, …M, dimana c(i) adalah GFCC.

  

2.2.2. Greenwood function cepstral coefficients (GFCC) Delta dan

delta-delta Vektor-vektor feature dihitung dari fungsi Greenwood yang memberikan

sebuah perkiraan yang terbaik dari local spectra. Karakteristik yang penting dari

data vokalisasi ini dinamis vokalisasi. Kinerja sistem suara dapat ditingkatkan

dengan menambah waktu turunan pada parameter statis. Banyak peneliti

memanfaatkan perkiraan daerah turunan waktu. Delta cepstrum (Furui, 1986)

adalah salah satu bentuk umum dari langkah ini. Delta cepstrum

diimplementasikan sebagai turunan pertama koefisien regresi. Turunan waktu

dinyatakan sebagai berikut :

  ( ) ∑

  = (2.8)

  ∑

  

dimana d adalah koefisien delta pada waktu t dihitung dalam jangka koefisien

t waktu statis c t-k hingga c t+k .

  Turunan kedua, disebut sebagai delta-delta cepstrum atau koefisien

percepatan, sesuai dengan penerapan korelasi yang sama pada koefisien delta.

  

Sebagian besar sistem yang memadukan feature delta dan delta-delta. Kedua

feature tersebut digunakan sebagai tambahan pada perhitungan statis seperti

MFCCs atau GFCCs.

2.3 Hidden Mar Markov Models (HMM)

2.3.1. Teori Markov kov Model

  Markov mode odel merupakan sistem dengan serangkaian st state dan transisi

state (setiap transisi da si dari state mempunyai sebuah probabilitas) di dimana rangkaian

dari state-state tersebut sebut disebut dengan Markov chain.

  Dalam Markov rkov model atau first-order-Markov mengasum asumsikan bahwa

probabilitas observasi vasi pada waktu n hanya tergantung pada obse observasi S yang

n-1 dilakukan pada waktu ktu n-1. Untuk serangkaian {S 1 ,S 2 ,...,S n } maka

  P(S ,S ,...,S ) = P(S ) (asumsi Markov) Markov) (2.9) n │ │S n-1 n-2

1 nS n-1

  Untuk mempe mperoleh probabilitas gabungan (joint probabi probability) dari

observasi-observasi se si sebelumnya maupun observasi sekarang da dapat diturunkan

menjadi :

  (2.10) Contoh soal : Misalkan terda rdapat 3 tipe cuaca : “sunny”, ”rainy” dan “ n “foggy”, berikut

dengan tabel probabi abilitas P(S n+1 n ) cuaca yang akan terjadi jadi besok (S n+1 )

  │S berdasarkan cuaca har hari ini (S ) yang terlihat pada tabel 2.1. n

  Tabel 2.1.

  P(S 2 =sunny, S 3 =rainy| S

1 =sunny) = P(S

3 =rainy, S 2 =sunny| S 1 =sunny) .

  Hidden Markov Models (HMM) adalah sebuah model statistik yang

diasumsikan dari rantai Markov dengan parameter yang tidak diketahui. Metode

ini disebut sebagai model statistik karena metode ini mencari means, varians dan

  P(S 3 =sunny| S 2 =foggy, S 1 =rainy)= P(S 3 =sunny| S 2 =foggy)= 0.2

  3 dengan cuaca “sunny” ?

  2. Jika cuaca kemarin S 1 adalah “rainy” dan cuaca hari ini S 2 adalah “foggy”, berapakah probabilitas besok S

  1 =sunny) = 0.05 . 0.8 = 0.04

  2 =sunny| S

  2 =sunny) . P(S

  3 =rainy| S

  1 =sunny)= P(S

  2 =sunny| S

  3 ) adalah “rainy” ?

  Probabolitas P(S n+1S n ) cuaca yang akan terjadi besok berdasarkan

cuaca hari ini

Cuaca besok Cuaca hari ini sunny Rainy foggy

  1. Jika hari ini cuacanya adalah “sunny” berapakah probabilitas besok bercuaca “sunny” dan hari berikutnya (S

  0.5 State yang ada q = {“sunny”, ”rainy”, “foggy”} dan setiap hari mempunyai kemungkinan transisi P(S nS n-1 ) state berdasarkan tabel probabilitas 2.1.

  0.3

  0.2

  0.2 Foggy

  0.6

  0.2

  0.15 Rainy

  0.05

  0.8

  Sunny

P(S

2.3.2 Definisi HMM

  probabilitas dari model yang dimasukkan.

  Hidden Markov Models merupakan rantai markov dengan himpunan state

terbatas yang menghasilkan suatu barisan pengamatan dan bersifat tersembunyi

(hidden). Perubahan atau perpindahan state direpresentasikan oleh suatu

himpunan peluang yang dinamakan matriks peluang transisi. Hidden Markov

Models dibangun oleh suatu kejadian yang tersembunyi hidden. HMM digunakan

untuk pembuatan model pada proses training dan testing. Bentuk model HMM

berupa state-state yang saling berhubungan. Proses training bertujuan untuk

membuat model untuk data suara burung. Pemodelan ini berupa model yang

bersifat kontinu untuk data suara.

Gambar 2.4. HMM dari kiri ke kanan (after Young et al., 2002)Gambar 2.4 merupakan salah satu contoh rangkaian HMM dari kiri ke kanan dimana ada sebuah lima model state yang bergerak melalui rangkaian state

  S=1, 2, 2, 3, 4, 4, 5 untuk menghasilkan rangkaian x 1 hingga x 5 . Model state ke-2,

  

3 dan 4 mempunyai ai hasil probabilitas yang saling berhubungan gan dengan model

state tersebut. Matriks riks pada model ini mempunyai 5 baris dan 5 5 kolom sebagai

berikut : a = ij

  1 0.3 0. 4 0. 3

  0.3

  0.7

  0.3

  0.7 Probabilitas ke keseluruhan adalah X yang dihasilkan oleh h model HMM M

bergerak melalui rang angkaian state S adalah hanya dihitung hasil sil dari probabilitas

transisi dan probabili bilitas output. Jadi rangkaian state pada gam ambar 2.4 sebagai

berikut :

  P ( X , S

12 b

2 (x 1 ) a 22 b 2 (x 2 ) a 23 b 3 (x 3 )... (2.13) │M )= a Pendekatan ini ini, hanya rangkaian observasi X yang diketahui ahui dan rangkaian state S tersembunyi (hi hidden). Pendekatan ini disebut Hidden Mark arkov Model.

  HMM didefini inisikan oleh sebuah kumpulan parameter ( ฀฀ ฀฀

   {s} ada adalah kumpulan state yang menyatakan state a e awal S 1 dan state akhir S S

  F  { a ij } a } adalah probabilitas sebuah transisi dari state i i sampai state j  {b (k)} } adalah probabilitas dari keluaran output k pa pada saat state j. j a dan b memenuhi sif sifat sebagai berikut : Ada dua asum sumsi pada sebuah deret pertama HMM. Pertam ama adalah asumsi

Markov pada persa rsamaan (2.10). Asumsi kedua adalah a asumsi output-

independence. Proba obabilitas pada masing-masing state diperol roleh berdasarkan

observasi x i sehingga pr ngga probabilitas P(S i |x i ) dapat dirumuskan sebaga bagai berikut : (2.14)

Dengan memperhatika tikan probabilitas P(x i ) yang tidak berubah unt untuk setiap state

maka masing-masing sing potensi state yang akan diuji atau diperiksa periksa mempunyai

probabilitas P(x i ) yan ang sama sehingga persamaan 2.14 dapat dirum dirumuskan sebagai

berikut :

  (2.15) Contoh soal : Pada contoh oh Markov model, keadaan cuaca dapat diobse diobservasi secara

langsung sedangkan p n pada HMM, cuaca-cuaca dalam keadaan “hi hidden”. Hal ini

dapat kita umpamaka akan seandainya kita dikunci disebuah kamar ar untuk beberapa

hari (tidak dapat me elihat kondisi luar). Untuk melakukan predi ediksi cuaca yang

  

akan terjadi, maka hanya terdapat tanda yaitu pada orang yang setiap datang ke

kamar untuk membawakan makanan, apakah orang tersebut membawa payung

atau tidak.

1. Seandainya hari pada saat kita terkunci bercuaca “sunny” . Hari berikutnya orang yang mengantarkan makanan membawa payung.

L(S

  2 =membawa payung) = P(x

  2 =membawa

  2 =membawa payung) = P(x

  1 =sunny, x

  2 =rainy| S

  2 =sunny) . P(S

2 =sunny| S

1 =sunny) = 0.1 . 0.8 = 0.08  Kemungkinan hari kedua “rainy” :

  2 =membawa payung| S

  1 =sunny, x

Tabel 2.2 . Probabilitas P(x

  2 =sunny| S

  Berapakah probabilitas masing-masing cuaca pada hari itu?  Kemungkinan hari kedua adalah “sunny” :

  0.3 Tabel 2.2 merupakan probabilitas membawa payung berdasarkan keadaan

cuaca. Probabilitas orang tersebut membawa payung jika cuaca pada hari itu

sunny” adalah 0.1, jika bercuaca “rainy” adalah 0.8, jika bercuaca “foggy”adalah

0.3.

  0.8 Foggy

  0.1 Rainy

  Sunny

  ) membawa payung berdasarkan cuaca S i pada hari i

Cuaca Probabilitas membawa payung

  i |S i

L(S

  payung| S 2 =rainy) . P(S

2 =rainy| S

1 =sunny) = 0.8 . 0.05 = 0.04  Kemungkinan hari kedua “foggy” :

  L(S 2 =foggy| S 1 =sunny, x 2 =membawa payung) = P(x 2 =membawa payung| S

  2 =foggy) . P(S

  2

=foggy| S

  1 =sunny) = 0.3 . 0.15 =0.045

  2. Seandainya kita tidak mengetahui cuaca pada hari kita dikunci dalam kamar, tiga hari berturut-turut orang mengantarkan makanan tidak membawa payung. Berapakah likelihood cuaca tersebut adalah {

  1 = ,

  2 = ,

  3 = } ?

L(S

  2 =foggy, S

  1 =sunny| S

  

1

=tidak membawa payung, x

  2 =tidak membawa payung, x

  3 =tidak membawa payung) = P(x 1 =tidak membawa payung| S

  1 =sunny) . P(x

  2 =tidak membawa payung| S

  2 =foggy) . P(x

  3 =tidak membawa payung| S

  3 =sunny) . P(S 1 =sunny). P(S 2 =foggy| S 1 =sunny) . P(S 3 =sunny| S 2 =foggy) = 0.9 . 0.7 . 0.9 . 1/3 . 0.15 . 0.2 = 0.0057

  Pada vokalisasi burung, state menunjukkan rangkaian waktu dari silabel, dapat dilihat pada gambar 2.5 sebagai berikut :

Gambar 2.5. Markov model untuk song ortolan bunting

  3 =sunny| x

  

Dalam kasus penge genalan song-type burung Ortolan Bunting, unting, HMM akan

memodelkan karakter kteristik sinyal atau suara yang secara temporal poral dan spectrum

yang memiliki bebera berapa variasi. Dalam state terdapat suatu runtun untun waktu sinyal

yang dihasilkan oleh sua h suara burung Ortolan Bunting tersebut.

  Struktur dasar sar HMM diatas memberikan tiga masalah utam ama yang dihadapi HMM (Rabiner, 1989 1989) sebagai berikut :

  1. Masalah evalua aluasi Bila diketahui hui suatu model HMM observasi, bagaimana dan barisan observa menghitung p probabilitas observasi jika diberikan model?

  2. Masalah decodi coding Bila diketahui hui barisan observasi dan model, bagaima ana menentukan barisan state y e yang optimal?

  3. Masalah penge ngenalan

Bagaimana menyesua suaikan model parameter untuk memaksimalka lkan probabilitas

observasi?

2.3.3 Algoritma Vit Viterbi

  Rangkaian obse observasi dapat ditentukan secara rekursif kursif menggunakan

algoritma Viterbi. Alg Algoritma Viterbi membuat penggunaan dari dua i dua variabel t (i)

t (i). t (i) adalah lah kemungkinan nilai tertinggi mendekati jalur lur single diantara δ δ δ dan ψ δ semua jalur terakhir pa r pada state i waktu t.

  (2.16)

  ψ t (i) merupakan varia pada state i waktu t.

  δ t (i) seperti forward re dan perhitungannya id HMM dengan adalah sebagai berikut

   Inisialisasi  RecursionTerminatiBacktrack sehingga variabel untuk menyimpan data pada akhir jalur ard recursion

  α t (i), hanya dengan mengenai rangk a identik mendekati. gan N state, cara menemukan rangkaian stat kut : sasi ion nation racking alur yang terbaik (2.17) gkaian state single state yang terbaik Sebelumnya r rangkaian observasi X = (x 1, x 2, ..., x T ) adalah lah sebuah model

parameter oritma Viterbi memberikan dua hasil yang bai aik, yaitu pilihan

Φ, algoritm

  • *

    jalur yang terbaik diant diantara semua jalur yang mungkin pada model el yang dikenal, S

  • * * *

  = { S ,...., S } dan ke kemungkinan jalur terbaik P(X,S

  X

  1 T Φ)=Φ P(X│ │Φ)

2.3.4 Algoritma Bau Baum-welch

  Pada training ning akan membentuk suatu model (estimate ate model). Pada t (i) adalah estimate model akan menghitung probabilitas state. Definisi γ estimate model akan menghitung probabilitas state. Definisi γ estimate model akan menghitung probabilitas state. Definisi γ

probabilitas pada state state S pada waktu t, diketahui deret obeservasi si X dan model ,

i sebagai berikut :

  (2.18) Rumus (2.16) dapat di t dinyatakan dengan variabel forward-bakward ard seperti : (2.19) Selain itu juga dapat didefinisikan dengan fungsi probabilitas ξ Selain itu juga dapat didefinisikan dengan fungsi probabilitas ξ t (i,j), probabilitas (

pada state S pada wakt aktu t sampai state S pada waktu t+1, diketah tahui model  dan

i j rangkaian observasi X X sebagai berikut: (2.20)

  

Dari definisi variabel bel forward dan backward, rumus diatas didef definsikan sebagai

berikut : (2.21) Hubungan antara t (i t (i,j) sebagai berikut :

  γ ) dan ξ ) dan ξ (2.22)

Estimasi awal da dari parameter model adalah sebaga agai berikut :

(2.23) (2.24) (2.25)

  ^

Setelah estimasi awal dari parameter model, model baru  yang lebih mungkin

menghasilkan rangkaian observasi X dari model  yang dihasilkan yaitu

  ^ P(X )> P(X │ │).

  Algoritma Baum-welch yang dijelaskan diatas merupakan implementasi

secara umum dari EM algoritma. Awalnya dengan menginisialisasi parameter

HMM =(A, B, π), perhitungan E (expectation) dan M (maximization) secara bergantian. Untuk E (expectation) menghitung perkiraan total state occupancy γ

dan perkiraan total transisi state dari kemungkinan probabilitas A dan B dengan

algoritma forward-backward. Pada M(maximization ), γ dan ξ digunakan untuk

menghitung probabilitas baru A, B dan π dengan persamaan (2.23), (2.24) dan (2.25).

BAB III METODOLOGI Bab ini menjelaskan tahap perancangan dan pengimplementasian metode Hidden Markov Models untuk mengenal song-type burung Ortolan Bunting sehingga menghasilkan akurasi yang optimal.

3.1. Data

  Jenis burung yang dijadikan sampel adalah Ortolan Bunting (Emberiza

hortulana). Ortolan Bunting adalah burung yang bermigrasi yang tersebar dari

Eropa Barat ke Mongolia (Cramp, Perrins, 1994). Pada musim dingin berada di

Africa. Burung ini mendiami daerah pertanian, dataran tinggi, padang pasir ,

hutan yang telah terbakar dan hutan gundul. Ortolan Bunting termasuk burung

monogami, diklasifikasi sebagai spesies yang langka. Burung ini mengalami

penurunan populasi yang cukup besar pada jumlah individu dan penyebarannya.

  

Ortolan Bunting mempunyai song yang relatif sederhana dan setiap individu

mempunyai 2-3 song-type. Frekuensi song berada diantara 1.9 kHz dan 6.7 kHz.

  

Beberapa song dari Ortolon Bunting digambarkan berdasar silabel, song-type dan

song variants. Jumlah keseluruhan ada 63 song type dan 234 variasi song,

tersusun dari 20 silabel yang berbeda. Sebuah silabel merupakan inisial suatu

song.

  Sebuah song digambarkan dengan menggunakan notasi huruf seperti

aaaabb or ccccbb, dimana huruf menunjukkan keterangan silabel. Setiap song-

  

type mempunyai beberapa silabel yang panjang dan frekuensinya berbeda di

antara individu, tetapi mempunyai ukuran yang sama pada sonogram.

Gambar 3.1. Syllable Ortolan Bunting (Osiejuk, 2003)Gambar 3.1 merupakan kumpulan silabel dari burung Ortolan Bunting. Song-type adalah sebuah kumpulan song yang terdiri dari susunan silabel yang sama pada

  rangkaian yang sama. Sebagai contoh: type-ab(aaabb), type-cb(cccbb).

  Setiap song-type mempunyai perbedaan pada jumlah silabel dalam song

yang disebut song variant, misalnya : song-type ab mempunyai banyak song

variant yang mungkin yaitu aaab,aabbbb,aaabb. Silabel awal dan akhir

mempunyai sedikit perbedaan pada amplitudo dan frekuensi karena mekanisme

produksi suara. Contoh song-type burung Ortolan bunting yang diubah menjadi

sinyal spectrogram :

  Gambar 3.2 . Specgram Song-type ab

  Gambar 3.3 . Specgram Song-type cb

  Perancangan dan pengimplementasian metode HMM untuk mengenal

song-type burung Ortolan Bunting, menggunakan jumlah sampel lima song-type

yaitu song-type ab, song-type cb, song-type cd, song-type eb, song-type ef.

  

(gambar 3.2 dan 3.3). Specgram pada masing-masing song-type menggambarkan

silabelnya. Setiap song-type terdapat 100 song burung Ortolan Bunting dan ada 8