Pendugaan rekursif yang diperoleh adalah 1.
Pendugaan untuk state
∑ ,
.
,
∑
,
, .
2. Pendugaan Banyaknya Lompatan
= ,
, ,
Penduga banyaknya lompatan adalah
,
1
∑
,
, ,
. Penduga smoother banyaknya lompatan adalah
,
∑
,
, .
3. Pendugaan Lamanya Waktu Kejadian
,
Penduga lamanya waktu kejadian adalah
,
∑
,
, ,
.
Penduga smoother lamanya waktu kejadian adalah
,
∑
,
, .
4. Pendugaan untuk Proses Observasi
∑ ,
, ,
, .
Penduga untuk proses observasi adala
,
∑
,
, ,
, .
Penduga smoother untuk proses observasi adalah
,
∑
,
, . Dari pendugaan rekursif dapat ditentukan parameter model sebagai berikut
,
1 ,
. ̂
, 1
, 1 .
Nilai Harapan adalah
| ∑ ∑
1 1
.
Model Hidden Markov diskret di atas diaplikasikan pada perubahan urutan basa DNA pada spesies
Aspergillus niger , dengan
N = 2. Dalam perkembangan lebih lanjut, dibuat suatu program komputasi yang berbasis pemprograman fungsional untuk
menyelesaikan masalah tersebut. Software yang digunakan adalah Mathematica 7.0. Hasil yang di peroleh pada penelitian ini sangat bergantung pada penentuan nilai
awal. Sampai saat ini hasil yang diperoleh belum cukup baik, karena belum ditemukan cara untuk menentukan nilai awal yang paling baik sehingga hasil yang
diperoleh optimal. Kata kunci:
Rantai Markov, model hidden Markov diskret, algoritme EM.
© Hak Cipta milik IPB, tahun 2009 Hak Cipta dilindungi Undang-Undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber. a.
Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah b.
Pengutipan tidak merugikan kepentingan yang wajar IPB 2.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya Tulis dalam bentuk apapun tanpa izin IPB.
KAJIAN MODEL HIDDEN MARKOV DISKRET DAN APLIKASINYA PADA DNA
N U R M A I L Y
Tesis sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada Program Studi Matematika Terapan
SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2009
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Wayan Mangku, M.Sc.
Judul Tesis : Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA. Nama : Nurmaily
NRP : G551070281
Disetujui Komisi Pembimbing
Dr. Berlian Setiawaty, M.S. Ir. N. K. Kutha Ardana, M.Sc. Ketua Anggota
Diketahui Ketua Program Studi Dekan Sekolah Pascasarjana
Matematika Terapan Dr. Ir. Endar H. Nugrahani, M.S. Prof, Dr. Ir. Khairil A. Notodiputro, M.S.
Tanggal Ujian: 19 Agustus 2009 Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat dan karunia-Nya sehingga tugas akhir yang berjudul “Kajian Model Hidden Markov
Diskret dan Aplikasinya pada DNA” ini bisa terselesaikan sebagai salah satu syarat untuk menyelesaikan pendidikan pada Program Studi Matematika, Sekolah
Pascasarjana Institut Pertanian Bogor.
Terimakasih yang mendalam penulis sampaikan kepada: 1.
Dr. Berlian Setiawaty, M.S. dan Ir. N. K. Kutha Ardana, M.Sc. selaku pembimbing yang telah memberikan bimbingan dan motivasinya.
2. Dr. Ir. Wayan Mangku, M.Sc. selaku penguji yang telah memberikan saran dan
kritiknya. 3.
Departemen Agama Republik Indonesia yang telah memberikan beasiswa kepada penulis selama menempuh pendidikan di IPB.
4. Seluruh keluarga atas segala dukungan, doa dan kasih sayangnya.
5. Mahasiswa S2 Matematika Terapan IPB angkatan 2007, serta semua pihak
yang telah membantu penulis. Penulis menyadari bahwa tugas akhir ini masih begitu banyak kekurangan.
Dengan segala keterbatasan yang ada, semoga tugas akhir ini bermanfaat.
Bogor, Agustus 2009 Nurmaily
KAJIAN MODEL HIDDEN MARKOV DISKRET DAN APLIKASINYA PADA DNA
N U R M A I L Y
SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2009
PERNYATAAN MENGENAI TUGAS AKHIR DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis dengan judul “Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA” adalah karya saya dengan arahan
dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya
yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2009 Nurmaily
NRP G551070281
ABSTRACT
NURMAILY.
The Study of Discrete Hidden Markov Model and Its Application on
DNA Sequence. Under supervision of BERLIAN SETIAWATY and N. K. KUTHA ARDANA.
A discrete hidden Markov model is a model which consists of the cause of event and observation process. This model assumes that the cause of event is a Markov chain,
which is not observed directly. The observation process has discrete range. Parameters of this model are transition probability matrices. They are estimated using
the maximum likelihood method and expectation maximization algorithm. The estimation procedure involves the change of measure. The estimation of parameters
uses Mathematica 7.0, a functional programming based on algebraic computer systems. The model is applied to the DNA
sequence. The estimated parameters are used to calculate the expectation of DNA sequence. The result depends on the
decision of the initial value. There should be another study for determining the initial value which gives the optimal result.
Keywords:
Markov chain, discrete hidden Markov model, expectation maximization
algorithm.
RINGKASAN
NURMAILY. Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA. Di
bawah bimbingan BERLIAN SETIAWATY dan N.K. KUTHA ARDANA.
Setiap kejadian berkaitan erat dengan penyebab kejadian. Jika penyebab kejadian tersebut tidak diamati secara langsung dan membentuk rantai Markov, maka
pasangan kejadian dan penyebabnya dapat dimodelkan dengan model Hidden Markov Hidden Markov Model, HMM.
Semua proses didefinisikan pada ruang peluang
Ω, , . Misalkan ;
adalah rantai Markov dengan state berhingga yang bersifat homogen dan diasumsikan tidak diamati secara langsung, sedangkan
; adalah proses
observasinya. Pasangan proses stokastik ,
merupakan model Hidden Markov.
Model Hidden Markov Elliot et al. 1995 yang digunakan pada karya ilmiah ini adalah
+ Y
CX W , untuk
di mana , , … ,
, , , ,
, A dan C merupakan matriks peluang transisi dengan
dan , yang
memenuhi
∑ 1,
, dan ∑
1, .
dan memenuhi
| ,
| |
diag diag
diag diag
.
Jika , maka vektor
, , … , merupakan nilai harapan
dari , yaitu dan untuk ergodic memenuhi
dan ∑
1. Parameter yang digunakan pada model di atas adalah
, 1 ,
, , 1
, 1 .
Akan ditentukan parameter baru dengan menggunakan algoritme EM , 1
, , ̂
, 1 , 1
, yang memaksimumkan fungsi log-likelihood bersyaratnya. Hasilnya berupa
parameter dalam bentuk pendugaan rekursif, diantaranya penduga untuk state, penduga untuk banyaknya loncatan, penduga lamanya rantai Markov berada pada
suatu state tertentu dan penduga proses observasi.
Pendugaan rekursif yang diperoleh adalah 1.
Pendugaan untuk state
∑ ,
.
,
∑
,
, .
2. Pendugaan Banyaknya Lompatan