METODE PENELITIAN Identifikasi Protein-Protein Signifikan Yang Berasosiasi Dengan Diabetes Mellitus (Dm) Tipe 2 Menggunakan Analisis Topologi Jejaring Protein-Protein Interaction

ensiklopedia gen-gen manusia dan penyakit genetik yang menghubungkan entry gen pada GenBank dan literatur ilmiah pada PubMed. Tipe query adalah “Gene Map” dengan query key “diabetes mellitus” Gambar 3. Basis data OMIM mengambalikan sejumlah protein yang kemudian disebut kandidat protein-protein signifikan yang berasosiasi dengan DM. Kandidat protein- protein signifikan yang berasosiasi dengan DM merupakan sejumlah protein- protein yang diduga berkontribusi menyediakan nutrisi Acencio ML, Lemke N. 2009 yang diperlukan untuk menghasilkan insulin dalam jumlah yang cukup bagi tubuh manusia. Kandidat protein-protein signifikan ini saling berinteraksi baik secara langsung maupun tidak langsung. 2 data protein-protein interaksi PPI, data ini diperoleh dari basis data STRING http:www.string-db.org dengan melibatkan 2,5 juta protein dari 630 organisme yang berbeda Jensen et al. 2009. HNF1A Kandidat Protein Signifikan Gambar 3. Tampilan depan dari basis data OMIM Gambar 4. Tampilan depan dari basis data STRING 7 Sebagai data masukan pada basis data STRING adalah semua Mouse Geneprotein yang berasosiasi dengan DM yang diperoleh dari basis data OMIM. Basis data STRING mengembalikan untuk tiap Mouse Geneprotein serangkaian data PPI. Dari data PPI yang diperoleh, selain kandidat protein-protein signifikan diperoleh pula protein-protein yang bukan kandidat protein signifikan yang menjadi perantara interaksi antar kandidat protein-protein signifikan. Konstruksi Jejaring Interaksi Antar Protein PPI Protein-protein interaksi PPI adalah kontak fisik yang terbentuk antara dua atau lebih protein yang telah dipelajari dari berbagai perspektif seperti biokimia, kimia kuantum, dinamika molekuler, transduksi sinyal dan gaya elektrostatik Herce 2013; Jones Thornton 1996; Phizicky Fieds 1995. Data PPI tersebut kemudian dikonstruksi menjadi sebuah jejaring PPI. Topologi jejaring inilah yang selanjutnya dianalisis untuk mendapatkan protein-protein signifikan dan sekaligus dapat membantu memahami bagaimana jejaring biologis dari protein-protein tersebut beroperasi Xia Y et al. 2004. Gambar 5 menunjukkan ilustrasi konstruksi jejaring PPI dari Data PPI yang dikembalikan oleh basis data SRTING. Misalkan diberikan Data PPI : Jejaring PPI Node1 Node2 INSR ubc INSR INS ubc FYN FYN INS FYN gcg INS akt1 INS IL6 INS alb akt1 GCK akt1 IL6 IL6 gcg Data PPI pada ilustrasi konstruksi Jejaring PPI diatas terdiri atas 5 protein sebagai kandidat protein-protein signifikan yang ditulis dengan huruf kapital INSR, FYN, INS, IL6, GCK dan 4 protein bukan kandidat protein-protein signifikan yang ditulis dengan huruf bukan kapital ubc, gcg, alb, akt1. Konstruksi Jejaring PPI gcg INSR FYN akt1 alb ubc INS IL6 GCK Gambar 5. Ilustrasi konstruksi jejaring PPI dari data PPI yang diperoleh dari basis data STRING Konstruksi Subnetwork dari Semua Lintasan Terpendek Pasangan Biner Kandidat Protein-Protein Signifikan pada Jejaring PPI Subnetwork adalah jejaring interaksi antar protein dengan jumlah minimal node dari semua node protein pada jejaring PPI. Jejaring ini dikonstruksi untuk melihat konsistensi protein-protein jejaring penyangga yang diperoleh dari jejaring PPI. Node-node yang tidak dilalui lintasan terpendek pasangan biner interaksi antar kandidat protein-protein signifikan akan dihilangkan dari jejaring sehingga diperoleh jejaring yang hanya melibatkan node-node dengan nilai degree besar saja. Subnetwork dikonstruksi dari semua lintasan terpendek pasangan biner semua kandidat protein-protein signifikan yang dikumpulkan dari Jejaring PPI. Jejaring PPI dan subnetwork jejaring PPI dikonstruksi dengan bahasa pemrograman Python dan aplikasi Cytoscape Shannon et al. 2003 untuk visualisasi jejaring. Ilustrasi konstruksi subnetwork dari jejaring PPI adalah sebagai berikut Gambar 6 : Lintasan terpendek pasangan biner kandidat protein signifikan pada jejaring PPI dan akumulasi nilai degree tiap lintasan yang terbentuk : INSR,FYN = INSR-ubc-FYN = 2+2+3 = 7 INSR-INS-FYN = 2+5+3 = 10 INSR,INS = INSR-INS INSR,IL6 = INSR-INS-IL6 INSR,GCK = INSR-INS-akt1-GCK FYN,INS = FYN-INS FYN,IL6 = FYN-INS-IL6 FYN,GCK = FYN-INS-akt1-GCK INS,IL6 = INS-IL6 INS,GCK = INS-akt1-GCK IL6,GCK = IL6-akt1-GCK Jika lintasan terpendek yang terbentuk dari sepasang kandidat protein signifikan, maka lintasan terpendek yang dipilih adalah lintasan dengan akumulasi nilai degree terbesar dari node-nodenya . Kandidat protein-protein signifikan : [INSR, FYN, INS, IL6, GCK] Bukan Kandidat protein-protein signifikan : [ubc, gcg, alb, akt1] Pasangan biner kandidat protein signifikan : [INSR,FYN,INSR,INS,INSR,IL6, INSR,GCK,FYN,INS,FYN,IL6, FYN,GCK,INS,IL6,INS,GCK, IL6,GCK] Konstruksi subnetwork dari semua lintasan terpendek Subnetwork Jejaring PPI INSR FYN akt1 alb ubc INS IL6 gcg GCK INSR FYN akt1 INS IL6 GCK Gambar 6. Konstruksi subnetwork dari semua lintasan terpendek pasangan kandiat protein-protein signifikan 9 Analisis Topologi Subnetwork dari Jejaring PPI Untuk menentukan protein-protein signifikan ada tiga parameter yang digunakan Hwang S et al. 2008. Ketiga parameter tersebut adalah Connectivity degree k, betweenness centrality BC dan closeness centrality CC. Connectivity degree k adalah nilai yang menunjukkan seberapa banyak sebuah node berinteraksi langsung dengan node lain dalam jejaring. Nilai ini akan digunakan untuk memilih satu lintasan terpendek dari beberapa lintasan terpendek yang mungkin terbentuk dari sepasang node dalam jejaring. Gambar 7 menunjukkan nilai connectivity degree k node-node dalam sebuah jejaring. Node k GCK 1 akt1 2 INS 3 INSR 1 IL6 1 Nilai BC akan menentukan seberapa penting node tersebut dibandingkan dengan node-node lain dalam jejaring, hal ini disebabkan karena seringnya sebuah node dilalui lintasan terpendek sepasang node lain dalam jejaring yang dirumuskan � = ∑ � � � ≠�≠ ∈� . Berikut ilustrasi penghitungan nilai BC sebuah node dalam jejaring sebagai berikut : 8a - σ st INS = Jumlah lintasan terpendek yang melalui node INS = 5 8b - σ st = Total lintasan terpendek yang terbentuk dengan tidak menjadikan node INS sebagai node source atau target = 6 Jadi nilai BC dari node INS = 56 = 0.83333 Nilai k tiap node pada Jejaring 1 2 3 4 5 1 2 3 4 5 6 a b Gambar 7. Nilai connectivity degree k tiap node dalam jejaring Gambar 8. Ilustrasi menghitung nilai BC dari node INS Nilai CC akan menentukan node yang menjadi pusat dari jejaring. Semakin besar nilai CC sebuah node maka semakin pusat node tersebut dalam jejaring. Rumusan untuk menghitung nilai CC sebuah node dalam jejaring adalah = �−1 ∑ � �, ∈� dan ilustrasi penghitungan nilai CC sebuah node dalam jejaring sebagai berikut : - Jumlah node N = 5 - d G INS,t = d G INS,akt1 + d G INS,GCK + d G INS,INSR + d G INS,IL6 = 1 + 2 + 1 + 1 = 5 - Jadi nilai CC dari node INS = 5-15 = 0.8 Menentukan Protein-protein Signifikan berdasarkan nilai BC dari Subnetwork dan Konstruksi Jejaring Penyangga Subnetwork menggambarkan keterkaitan kandidat protein-protein signifikan yang lebih sederhana Gambar 13. Protein-protein signifikan ditentukan dari protein-protein yang banyak digunakan sebagai persimpangan atau protein- protein yang memiliki nilai BC tertinggi. Jumlah protein dengan BC tinggi yang diambil sebagai protein-protein signifikan adalah 5 dari total nodeprotein pada jejaring Goni et al. 2008; Kim et al. 2009. Semua protein-protein signifikan yang diperoleh digunakan untuk mengkonstruksi jejaring penyangga. Informasi protein- protein signifikan, protein node pusat jejaring dan protein-protein yang bertetangga langsung dengan protein pusat diperoleh dari jejaring penyangga yang terbentuk. Protein pusat jejaring ditentukan dari protein node yang mempunyai nilai CC tertinggi dari subnetwork Wasserman Faust 1994. Semua protein-protein signifikan yang telah ditentukan kemudian dikonstruksi menjadi jejaring penyangga. Jejaring ini menggambarkan keterkaitan antar protein signifikan dalam jejaring PPI baik secara langsung maupun tidak langsung. Karena jejaring ini terbentuk dari semua protein signifikan memiliki nilai BC tinggi dalam jejaring PPI di mana protein-protein tersebut menjadi jembatan sebagai besar lintasan terpendek tiap pasang protein-protein dalam jejaring, maka jejaring penyangga ini adalah jejaring utama Ran J et al. 2013 pada jejaring PPI. INSR akt1 INS IL6 GCK 1 1 1 2 Gambar 9. Ilustrasi menghitung nilai CC dari node INS 11 Proses konstruksinya adalah 1 menelusuri semua lintasan terpendek antar protein-protein signifikan pada jejaring PPI, 2 semua lintasan terpendek yang ditemukan diubah menjadi data interaksi antar protein PPI, 3 data interaksi antar protein ini digunakan untuk mengkonstruksi jejaring penyangga. Evaluasi Ketahanan Jejaring Penyangga Jejaring uji dikonstruksi untuk mengevaluasi ketahanan jejaring penyangga konsistensi protein-protein yang menyusun jejaring penyangga dengan tidak menjadikan beberapa kandidat protein-protein signifikan yang dikembalikan oleh basis data OMIM sebagai data input pada basis data STRING. Jumlah kandidat protein-protein signifikan yang tidak dijadikan sebagai data input pada basis data STRING adalah 10 Ran et al. 2013 dari seluruh data kandidat protein-protein signifikan. Misalkan terdapat 72 kandidat protein-protein signifikan, maka jumlah kandidat protein-protein signifikan yang tidak dijadikan sebagai data input pada basis data STRING adalah 1 sampai 7 protein. Jika 1 dari 72 kandidat protein-protein signifikan yang tidak dilibatkan sebagai data input pada basis data STRING yang dipilih secara bergantian, maka jumlah kombinasi kandidat protein-protein signifikan yang terbentuk adalah 72 kombinasi data input. Untuk 2 sampai 7 kandidat protein signifikan yang tidak dilibatkan sebagai data input, protein pusat yang memiliki nilai CC terbesar selalu termasuk protein yang idak dilibatkan sabagai data input pada basis data STRING. Hal ini dilakukan untuk menguji kekokohan protein pusat dalam jejaring. Dengan demikian jika ada 2 kandidat protein signifikan yang tidak dilibatkan sebagai data input , maka akan terbentuk 71 kombinasi data input. Adapun jika jumlah kandidat protein signifikan yang tidak dilibatkan sebagai data input adalah 3 sampai 7 protein, maka jumlah kombinasi kandidat protein signifikan sebagai data input adalah 30 kombinasi yang masing-masing dipilih secara acak Ran et al. 2013. Sebagai ilustrasi jika ada 3 kandidat protein signifikan yang tidak dilibatkan sebagai data input pada basis data STRING, maka akan terbentuk 357.840 72x71x70 kombinasi data input. Sehingga total jumlah kombinasi kandidat protein-protein signifikan sebagai data input pada basis data STRING adalah 293 72 + 71 + 5 x 30 kombinasi. Langkah-langkah yang dilakukan dalam mengkonstruksi jejaring uji untuk tiap kombinasi kandidat protein-protein signifikan sebagai berikut : a. Scanning data PPI pada basis data STRING untuk tiap kandidat protein signifikan yang ada pada data input. b. Konstruksi jejaring PPI dari seluruh data PPI yang diperoleh. c. Analisis topologi jejaring PPI yang terbentuk untuk mendapatkan nilai degree, BC dan CC untuk tiap node pada jejaring PPI dan kemudian diurutkan dari besar ke kecil. d. Memilih node-node penting protein-protein signifikan dengan nilai BC tinggi sebanyak 5 dari semua node pada jejaring PPI. e. Konstruksi jejaring uji dari semua node-node penting protein-protein signifikan yang terpilih. f. Similaritas node-node protein-protein jejaring uji dihitung terhadap jejaring penyangga untuk mendapatkan nilai akurasi jejaring uji terhadap jejaring penyangga. g. Mengakumulasi frekuensi node protein dengan nilai degree, BC dan CC terbesar untuk tiap jejaring uji yang terbentuk. Konstruksi jejaring uji dilakukan untuk semua kombinasi kandidat protein- protein signifikan dan akan diperoleh frekuensi dari nodeprotein dengan nilai BC tertinggi, nodeprotein yang bertindak sebagai pusat jejaring nodeprotein dengan nilai CC tertinggi dan nodeprotein yang memiliki interaksi langsung terbanyak dengan nodeprotein lain dalam jejaring nodeprotein dengan nilai degree tertinggi. Selain itu nilai akurasi dari semua jejaring uji yang terbentuk terhadap jejaring penyangga juga dihitung. 13

4. HASIL DAN PEMBAHASAN

Data Interaksi Antar Protein PPI, Konstruksi Jejaring PPI dan Subnetwork dari Semua Lintasan Terpendek Interaksi Antar Kandidat Protein pada Jejaring PPI Basis data OMIM mengembalikan 83 kandidat protein-protein signifikan yang berasosiasi dengan DM tipe 2 Tabel 1. Tiap data kandidat protein-protein signifikan yang diperoleh terdiri atas 10 item data Gambar 10 yaitu Cytogenetic location, Genomic coordinates GRCh37From NCBI, Gene, Gene name, Gene MIM number, Comments, Phenotype, Phenotype MIM number, Pheno map key dan Mouse Gene from MGI. Dari seluruh item data tersebut hanya item data “Mouse Gene from MGI” yang akan digunakan sebagai data input pada basis data STRING untuk mendapakan data seed protein dalam bentuk protein-protein interaksi PPI. Gambar 10. Daftar protein-protein yang berasosiasi dengan DM yang dikembalikan oleh basis data OMIM Tabel 1 menunjukkan daftar 83 kandidat protein-protein signifikan yang dikembalikan oleh basis data OMIM. Tabel 1. Kandidat protein-protein signifikan yang berasosiasi dengan DM tipe 2 No Gene Protein GeneLocus name 1 ABCC8 ATP-binding cassette, subfamily C, member 8 sulfonylurea receptor 2 ACE Angiotensin I converting enzyme dipeptidyl carboxypeptidase-1 3 AKT2 Murine thymoma viral v-akt homolog-2 4 AQP2 Aquaporin-2 collecting duct 5 AVP Arginine vasopressin neurophysin II, antidiuretic hormone 6 AVPR2 Arginine vasopressin receptor-2 7 BLK BLK nonreceptor tyrosine kinase 8 CAPN10 Calpain-10 9 CCR5 Chemokine C-C receptor 5 10 CDKAL1 CDK5 regulatory subunit-associated protein 1-like 1 11 CEL Carboxyl-ester lipase bile-salt stimulated lipase 12 CTLA4 Cytotoxic T-lymphocyte-associated serine esterase-4 13 DNAJC3 DnaJ, E. coli, homolog of, subfamily C, member 3 14 ENPP1 Ectonucleotide pyrophosphatasephosphodiesterase 1 Tabel 1. Kandidat protein-protein signifikan yang berasosiasi dengan DM tipe 2 No Gene Protein GeneLocus name 15 EPO Erythropoietin 16 FOXC2 Forkhead box C2 17 FOXP3 Forkhead box P3 scurfin 18 GCGR Glucagon receptor 19 GCK Glucokinase hexokinase-4 20 GLIS3 GLIS family zinc finger protein 3 21 GPD2 Glycerol-3-phosphate dehydrogenase 2 mitochondrial 22 HFE Hemochromatosis gene 23 HMGA1 High-mobility group AT-hook 1 24 HNF1A HNF1 homeobox B 25 HNF1B HNF1 homeobox B transcription factor 2 26 HNF4A Hepatocyte nuclear factor 4, alpha transcription factor-14 27 IAPP Islet amyloid polypeptide diabetes-associated peptide; amylin 28 IDDM1 Insulin-dependent diabetes mellitus-1 29 IDDM11 Insulin-dependent diabetes mellitus-11 30 IDDM13 Insulin-dependent diabetes mellitus-13 31 IDDM15 Insulin-dependent diabetes mellitus-15 32 IDDM17 Insulin-dependent diabetes mellitus-17 33 IDDM18 Insulin-dependent diabetes mellitus-18 34 IDDM19 Diabetes mellitus, insulin-dependent, 19 35 IDDM21 Diabetes mellitus, insulin-dependent, 21 36 IDDM23 Diabetes mellitus, insulin-dependent, 23 37 IDDM24 Diabetes mellitus, insulin-dependent, 24 38 IDDM3 Insulin-dependent diabetes mellitus-3 39 IDDM4 Insulin-dependent diabetes mellitus-4 40 IDDM6 Insulin-dependent diabetes mellitus-6 41 IDDM7 Insulin-dependent diabetes mellitus-7 42 IDDM8 Insulin-dependent diabetes mellitus-8 43 IDDMX Diabetes mellitus, insulin-dependent, X-linked, susceptibility to 44 IER3IP1 Immediate-early response 3-interacting protein 1 45 IGF2BP2 Insulin-like growth factor 2 mRNA-binding protein 2 46 IL1RN Interleukin-1 receptor antagonist 47 IL2RA Interleukin-2 receptor 48 IL6 Interleukin-6 interferon, beta-2 49 INS Insulin 50 INSR Insulin receptor 51 IRS1 Insulin receptor substrate-1 52 IRS2 Insulin receptor substrate 2 53 ITPR3 Inositol 1,4,5-triphosphate receptor, type 3 54 KCNJ11 Potassium inwardly-rectifying channel, subfamily J, member 11 55 KLF11 Kruppel-like factor 11 56 LIPC Lipase, hepatic 57 MAPK8IP1 Mitogen-activated protein kinase 8-interacting protein 1 58 MTNR1B Melatonin receptor 1B 59 NEUROD1 Neurogenic differentiation 1 60 NIDDM2 Diabetes mellitus, noninsulin-dependent, 2 61 NIDDM3 Noninsulin-dependent diabetes mellitus 3 62 NIDDM4 Diabetes mellitus, noninsulin-dependent, 4 63 OAS1 2,5-oligoadenylate synthetase-1 64 PAX4 Paired box homeotic gene-4 65 PBCA Pancreatic beta cell, agenesis of 66 PDX1 Insulin promoter factor 1, homeodomain transcription factor 67 PLAGL1 Pleomorphic adenoma gene-like 1 ZAC tumor suppressor