Struktur Protein Pengembangan hidden semi markov model dengan distribusi durasi state empiris untuk prediksi struktur sekunder protein

DNA : TAC CGC GGC TAT TAC TGC CAG GAA GGA ACT RNA : AUG GCG CCG AUA AUG ACG GUC CUU CCU UGA Protein : Met Ala Pro Ile Met Thr Val Leu Pro Stop Gambar 2. Contoh urutan asam amino pembentuk suatu protein Gambar 2 merupakan ilustrasi proses pembentukan protein mulai dari urutan sekuens DNA sampai dengan proses translasi yang dapat menghasilkan suatu protein. Tabel 1. Asam amino, singkatan, simbol dan karakteristik Asam Amino Singkatan Simbol Karakteristik Alanine Ala A Nonpolar, hydrophobic Arginine Arg R Polar, hydrophilic Asparagine Asn N Polar, hydrophilic Aspartic acid Asp D Polar, hydrophilic Cystein Cys C Polar, hydrophilic Glutamine Gln Q Polar, hydrophilic Glutamic acid Glu E Polar, hydrophilic Glycine Gly G Polar, hydrophilic Histidine His H Polar, hydrophilic Isoleucine Ile I Nonpolar, hydrophobic Leucine Leu L Nonpolar, hydrophobic Lysine Lys K Polar, hydrophilic Methionine Met M Nonpolar, hydrophobic Phenylalanine Phe F Nonpolar, hydrophobic Proline Pro P Nonpolar, hydrophobic Serine Ser S Polar, hydrophilic Threonine Thr T Polar, hydrophilic Tryptophan Trp W Nonpolar, hydrophobic Tyrosine Tyr Y Polar, hydrophilic Valine Val V Nonpolar, hydrophobic Tabel 2. Codon pembentuk protein U C A G U UUU Phe UUC Phe UUA Leu UUG Leu UCU Ser UCC Ser UCA Ser UCG Ser UAU Tyr UAC Tyr UAA Stop UAG Stop UGU Cys UGC Cys UGA Stop UGG Trp C CUU Leu CUC Leu CUA Leu CUG Leu CCU Pro CCC Pro CCA Pro CCG Pro CAU His CAC His CAA Gln CAG Gln CGU Arg CGC Arg CGA Arg CGG Arg A AUU Ile AUC Ile AUA Ile AUG Met ACU Thr ACC Thr ACA Thr ACG Thr AAU Asn AAC Asn AAA Lys AAG Lys AGU Ser AGC Ser AGA Arg AGG Arg G GUU Val GUC Val GUA Val GUG Val GCU Ala GCC Ala GCA Ala GCG Ala GAU Asp GAC Asp GAA Glu GAG Glu GGU Gly GGC Gly GGA Gly GGG Gly Struktur protein terdiri atas struktur primer, struktur sekunder dan struktur tersier Polanski dan Kimmel 2007. Struktur primer dari suatu protein adalah rangkaian asam amino pembentuknya di sekitar rantai polipeptida. Database Bioinformatics memiliki 3 x 10 6 atau 3.000.000 sekuens asam amino dari protein. Struktur primer ini yang dibentuk dari hasil translasi DNA sampai menjadi codon. Hormon merupakan contoh protein yang dapat dilihat dari susunan asam aminonya. Sebagai contoh, prolaktin adalah salah satu hormon pertumbuhan yang dimiliki setiap makhluk hidup. Gambar 3 adalah contoh asam amino dari hormon prolaktin pada manusia. b a c Gambar 3. Contoh susunan asam amino hormon prolaktin pada manusia Struktur sekunder adalah struktur protein yang ditentukan oleh bentuk alpha-helix H, betha-sheet B dan coil C penyusunnya. Struktur sekunder diperoleh dari sekuens asam amino, yang terikat dengan ikatan péptida. Dari sekuens asam amino tersebut, akan membentuk tiga kemungkinan segmen yaitu alpha-helix H yang bentuknya berpilin, betha-sheet B yang bentuknya lurus atau coil C. Contoh bentuk ketiganya dapat dilihat pada Gambar 4. Gambar struktur sekunder protein tersebut didapatkan dengan menggunakan perangkat lunak RasMol Versi 2.7.4.2 sebagai perangkat lunak untuk memodelkan struktur protein yang bersifat free software. Gambar 4. Gambar struktur sekunder protein : a. alpha-helix H, b. betha- sheet b dan c. coil c Struktur tersier protein adalah struktur sekunder protein yang mengalami pelipatan atau dikenal dengan istilah melakukan folding protein. Struktur tersier protein terjadi dengan adanya interaksi untaian rantai alpha-helix, betha-sheet dan coil yang kemudian melakukan proses pelipatan Lesk 2002. Bentuk struktur tersier protein seperti dilihat pada Gambar 5 dengan menggunakan perangkat lunak RasMol Versi 2.7.4.2 . Gambar 5. Struktur tersier protein Data struktur tersier protein dapat diperoleh dari suatu database yang bernama Protein Data Bank PDB. Dari data ini protein dapat divisualisasikan dalam bentuk tiga dimensi. Fungsi protein akan terlihat apabila sudah melakukan pelipatan atau protein folding. Protein merupakan molekul kompleks dengan struktur tiga dimensi 3D yang dikenal dengan struktur tersier. Namun, demikian struktur kompleks tersebut dibangun dari struktur primer yang terdiri atas sekuens asam amino pembentuknya Polanski dan Kimmel 2007.

2.2 Prediksi Struktur sekunder protein

Struktur sekunder protein merupakan tahap awal dari proses prediksi struktur tiga dimensi 3D suatu protein. Prediksi struktur sekunder protein bertujuan untuk mendapatkan informasi segmen alpha-helix H, betha-sheet B atau coil C dari untaian asam amino primer yang membentuknya. Struktur Protein dapat diprediksi dengan beberapa cara. Cara pertama adalah dengan melakukan eksperimen secara kimiawi menggunakan X-Ray Crystallography dan Nuclear Magnetic Resonance NMR spectroscopy. Albert et al. 2007. Cara ini akan menghasilkan struktur protein secara tepat dan sangat memungkinkan menghasilkan struktur baru. Cara kedua adalah dengan pendekatan heuristic yaitu dengan comparative modelling yang hasilnya berupa prediksi. Prediksi struktur protein dengan menggunakan pendekatan heuristik ini, tidak akan menghasilkan penemuan struktur protein baru karena pendekatan ini hanya melakukan perbandingan antara data yang kita miliki dengan model yang sudah ada.

2.3 Hidden Markov Model HMM

Hidden Markov Model HMM merupakan model probabilistik yang dapat diaplikasikan untuk menganalisis model deret waktu atau sekuens linear Eddy 1998. Pada sekitar tahun 1990, untuk membandingkan dua buah sekuens data biologi baik DNA atau RNA digunakan perbandingan pasangan antara dua sekuens yang akan disamakan. Namun, terdapat kendala yang ada apabila dua sekuens tersebut tidak sama di samping kesulitan apabila adanya sekuens baru Baldi dan Brunak 2001. HMMs adalah salah satu pendekatan yang digunakan untuk memodelkan kumpulan sekuens tersebut. HMMs telah banyak dikembangkan pada banyak permasalahan seperti speech recognition Rabiner 1989. Menurut Rabiner 1989, aplikasi pada HMMs pada akhirnya akan direduksi untuk menyelesaikan tiga jenis permasalahan, yaitu : 1. Jika diberikan suatu model π B, A, = λ , bagaimana menghitung peluang dari sukuens observasi O = O 1 ,O 2 ,...O T yang dinotasikan dengan λ | PO 2. Jika diberikan suatu model π B, A, = λ , bagaimana memilih state sekuens I = I 1 ,I 2 ,...I T sehingga λ | I PO, sebagai peluang bersama dari sekuens observasi O = O 1 ,O 2 ,...O T dan state sekuens tersebut memiliki nilai maksimum 3. Mendapatkan parameter model HMM yang optimal sehingga peluang suatu observasi memiliki nilai maksimum,