Data input DNA Aplikasi Model Hidden Markov Diskret pada DNA

Gambar 1 Pembentukan secara skematik struktur dsDNA dari gula fosfat sebagai backbone dan basa nukleotida A. Bentuk skematik double-helix DNA B. Struktur untaian helix DNA ditentukan oleh tumpukan stacking basa-basa nukleotida berdekatan yang ada pada satu untai, sedangkan struktur untai gandanya ditentukan oleh ikatan hidrogen antara basa-basa yang berpasangan.

4.2 Data input DNA

Data yang digunakan merupakan sebagian dari data komplit DNA pada cendawan aspergillus niger. Data yang diamati ada sebanyak 1000 basa nitrogen sebagai berikut 1 ccaccaaggg ttccattacc tccgtccagg ccgtctacgt ccctgctgac gatttgactg 61 accctgcccc cgccaccacc ttcgctcact tggacgccac cactgtcttg tcccgtggta 121 tctccgagtt gggtatctac cctgccgtcg accctctcga ctccaagtcc cgtatgctcg 181 acacccgtat cgtcggtgaa gaccactaca acaccgccac ccgtgtccag cagatgctcc 241 aggagtacaa gtccctccag gatatcattg ccattctggg tatggacgaa ctgtctgagg 301 ctgacaagct taccgtcgag cgtgctcgta agctccagcg tttcctgtcc cagcccttca 361 ccgtcgccca ggtcttcact g gtatcgagg gtaagctggt cgacctgaag gacaccatcc A B 421 gcagtttcaa ggccatcatc a acggtgaag gtgacgacct cctgagggt aagttgatct 481 ctccactttc t gtttggtga tc ggcatgga tgctaatttg tttatctaca gctgctttct 541 acatggttgg tgacttcgag tctgcccgcg ccaagggtga gaagatcttg gccgagctcg 601 agaacaaggc ctaaatgtaa tattgttttt aagcgccctt ttcctttttt gttagacatg 661 gacttccttt cttccatgtg ccgttttcta ccgatccgtg tacagtactc gaattgagaa 721 aagggagttg aaagaaaggc gaggtccccc ctatataaaa ggatgagagc gctcttaacg 781 tacacctctc tgaaagtctg gatggaaact tctagacttg tgttacacta cgtgctcatg 841 taagtaagtt aaaatgacca cagtcagcct gatacccgct gggctgggac aattgtactc 901 aaatttcctt tgttgaaccg ggggaccgtg atatctgttg cgtagacatt cctgtagcat 961 gtaatctgta agattccaaa cgagccatac gtcccttcta Sumber:[ http:www.ncbi.nlm.gov 06052009] Keterangan: dari data di atas, 1, 61, 121,… menyatakan urutan ke- k urutan basa nitrogen.

4.3 Aplikasi Model Hidden Markov Diskret pada DNA

Barisan DNA mengalami perubahan pada setiap urutannya. Sampai saat ini penyebab perubahannya tidak diketahui, namun penyebab tersebut diasumsikan sebagai state yang tidak diamati. Untuk menjelaskan perilaku urutan basa nitrogen pada cendawan spesies Aspergillus niger , dibangun suatu model stokastik. Ide memilih model Hidden Markov diskret Elliot et al. 1995 untuk masalah ini diperoleh dari Jamal 2008. Data yang diamati dan dimodelkan pada model Hidden Markov diskret [Elliot et al . 1995] hanya sebagian dari barisan DNA lengkap pada spesies Aspergillus niger , dengan banyaknya data T = 1000 dan k menyatakan urutan DNA. Pada komputasi, basa nitrogen c, g,t, dan a diubah menjadi c=1,g=2,t=3, dan a=4. Diasumsikan bahwa barisan DNA pada spesies Aspergillus niger dibangkitkan oleh proses pengamatan yang hanya dipengaruhi oleh proses penyebab kejadian yang membentuk rantai Markov dan tidak diamati secara langsung. Faktor-faktor yang menyebabkan terjadinya perubahan keteraturan DNA diasumsikan sebagai state dari suatu rantai Markov . Pada setiap state, urutan DNA dibangkitkan oleh peubah acak yang menyebar dengan sebaran tertentu pada ruang peluang Ω, , . Misalkan hubungan antara dan ditentukan oleh persamaan 3.5, yaitu , untuk . Berdasarkan asumsi bahwa penyebab perubahan DNA tidak diamati secara langsung, sehingga proses tersembunyi hidden di balik data pengamatan . Jadi pasangan , merupakan model Hidden Markov diskret [Elliot et al . 1995] dengan parameter model di atas berbentuk : , 1 , , , 1 , 1 . Dengan menggunakan data di atas, parameter model diduga dengan menggunakan metode maximum likelihood dan pendugaan ulang menggunakan metode expectation maximization yang melibatkan perubahan ukuran. Penduga rekursif yang dilakukan pada penelitian ini adalah penduga smoother dengan N = 2.

4.4 Hasil Komputasi