METODE PENELITIAN Identifikasi Protein-Protein Signifikan Yang Berasosiasi Dengan Diabetes Mellitus (Dm) Tipe 2 Menggunakan Analisis Topologi Jejaring Protein-Protein Interaction
ensiklopedia gen-gen manusia dan penyakit genetik yang menghubungkan entry gen pada GenBank dan literatur ilmiah pada PubMed. Tipe query adalah
“Gene Map” dengan query key “diabetes mellitus” Gambar 3.
Basis data OMIM mengambalikan sejumlah protein yang kemudian disebut kandidat protein-protein signifikan yang berasosiasi dengan DM. Kandidat protein-
protein signifikan yang berasosiasi dengan DM merupakan sejumlah protein- protein yang diduga berkontribusi menyediakan nutrisi Acencio ML, Lemke N.
2009 yang diperlukan untuk menghasilkan insulin dalam jumlah yang cukup bagi tubuh manusia. Kandidat protein-protein signifikan ini saling berinteraksi baik
secara langsung maupun tidak langsung. 2 data protein-protein interaksi PPI, data ini diperoleh dari basis data STRING http:www.string-db.org dengan
melibatkan 2,5 juta protein dari 630 organisme yang berbeda Jensen et al. 2009.
HNF1A Kandidat Protein
Signifikan
Gambar 3. Tampilan depan dari basis data OMIM
Gambar 4. Tampilan depan dari basis data STRING
7
Sebagai data masukan pada basis data STRING adalah semua Mouse Geneprotein
yang berasosiasi dengan DM yang diperoleh dari basis data OMIM. Basis data STRING mengembalikan untuk tiap Mouse Geneprotein serangkaian
data PPI. Dari data PPI yang diperoleh, selain kandidat protein-protein signifikan diperoleh pula protein-protein yang bukan kandidat protein signifikan yang menjadi
perantara interaksi antar kandidat protein-protein signifikan.
Konstruksi Jejaring Interaksi Antar Protein PPI
Protein-protein interaksi PPI adalah kontak fisik yang terbentuk antara dua atau lebih protein yang telah dipelajari dari berbagai perspektif seperti biokimia,
kimia kuantum, dinamika molekuler, transduksi sinyal dan gaya elektrostatik Herce 2013; Jones Thornton 1996; Phizicky Fieds 1995. Data PPI tersebut
kemudian dikonstruksi menjadi sebuah jejaring PPI. Topologi jejaring inilah yang selanjutnya dianalisis untuk mendapatkan protein-protein signifikan dan sekaligus
dapat membantu memahami bagaimana jejaring biologis dari protein-protein tersebut beroperasi Xia Y et al. 2004. Gambar 5 menunjukkan ilustrasi konstruksi
jejaring PPI dari Data PPI yang dikembalikan oleh basis data SRTING.
Misalkan diberikan Data PPI : Jejaring PPI
Node1 Node2
INSR ubc
INSR INS
ubc FYN
FYN INS
FYN gcg
INS akt1
INS IL6
INS alb
akt1 GCK
akt1 IL6
IL6 gcg
Data PPI pada ilustrasi konstruksi Jejaring PPI diatas terdiri atas 5 protein sebagai kandidat protein-protein signifikan yang ditulis dengan huruf kapital
INSR, FYN, INS, IL6, GCK dan 4 protein bukan kandidat protein-protein signifikan yang ditulis dengan huruf bukan kapital ubc, gcg, alb, akt1.
Konstruksi Jejaring PPI
gcg INSR
FYN
akt1 alb
ubc
INS
IL6 GCK
Gambar 5. Ilustrasi konstruksi jejaring PPI dari data PPI yang diperoleh dari basis data STRING
Konstruksi Subnetwork dari Semua Lintasan Terpendek Pasangan Biner Kandidat Protein-Protein Signifikan pada Jejaring PPI
Subnetwork adalah jejaring interaksi antar protein dengan jumlah minimal
node dari semua node protein pada jejaring PPI. Jejaring ini dikonstruksi untuk
melihat konsistensi protein-protein jejaring penyangga yang diperoleh dari jejaring PPI. Node-node yang tidak dilalui lintasan terpendek pasangan biner interaksi antar
kandidat protein-protein signifikan akan dihilangkan dari jejaring sehingga diperoleh jejaring yang hanya melibatkan node-node dengan nilai degree besar saja.
Subnetwork
dikonstruksi dari semua lintasan terpendek pasangan biner semua kandidat protein-protein signifikan yang dikumpulkan dari Jejaring PPI. Jejaring
PPI dan subnetwork jejaring PPI dikonstruksi dengan bahasa pemrograman Python dan aplikasi Cytoscape Shannon et al. 2003 untuk visualisasi jejaring. Ilustrasi
konstruksi subnetwork dari jejaring PPI adalah sebagai berikut Gambar 6 :
Lintasan terpendek pasangan biner kandidat protein signifikan pada jejaring PPI dan
akumulasi nilai degree tiap lintasan yang terbentuk :
INSR,FYN = INSR-ubc-FYN = 2+2+3 = 7
INSR-INS-FYN = 2+5+3
= 10
INSR,INS = INSR-INS INSR,IL6 = INSR-INS-IL6
INSR,GCK = INSR-INS-akt1-GCK FYN,INS = FYN-INS
FYN,IL6
= FYN-INS-IL6 FYN,GCK = FYN-INS-akt1-GCK
INS,IL6 = INS-IL6
INS,GCK = INS-akt1-GCK IL6,GCK
= IL6-akt1-GCK Jika lintasan terpendek yang terbentuk dari
sepasang kandidat protein signifikan, maka lintasan terpendek yang dipilih adalah lintasan
dengan akumulasi nilai degree terbesar dari node-nodenya
. Kandidat protein-protein signifikan :
[INSR, FYN, INS, IL6, GCK] Bukan Kandidat protein-protein signifikan :
[ubc, gcg, alb, akt1] Pasangan biner kandidat protein signifikan :
[INSR,FYN,INSR,INS,INSR,IL6, INSR,GCK,FYN,INS,FYN,IL6,
FYN,GCK,INS,IL6,INS,GCK, IL6,GCK]
Konstruksi subnetwork dari semua lintasan terpendek
Subnetwork Jejaring PPI
INSR FYN
akt1 alb
ubc
INS
IL6 gcg
GCK
INSR FYN
akt1 INS
IL6 GCK
Gambar 6. Konstruksi subnetwork dari semua lintasan terpendek pasangan kandiat protein-protein signifikan
9
Analisis Topologi Subnetwork dari Jejaring PPI
Untuk menentukan protein-protein signifikan ada tiga parameter yang digunakan Hwang S et al. 2008. Ketiga parameter tersebut adalah Connectivity
degree k, betweenness centrality BC dan closeness centrality CC.
Connectivity degree k adalah nilai yang menunjukkan seberapa banyak
sebuah node berinteraksi langsung dengan node lain dalam jejaring. Nilai ini akan digunakan untuk memilih satu lintasan terpendek dari beberapa lintasan terpendek
yang mungkin terbentuk dari sepasang node dalam jejaring. Gambar 7 menunjukkan nilai connectivity degree k node-node dalam sebuah jejaring.
Node k
GCK 1
akt1 2
INS 3
INSR 1
IL6 1
Nilai BC akan menentukan seberapa penting node tersebut dibandingkan dengan node-node lain dalam jejaring, hal ini disebabkan karena seringnya sebuah
node dilalui lintasan terpendek sepasang node lain dalam jejaring yang dirumuskan
� = ∑
� � �
≠�≠ ∈�
.
Berikut ilustrasi penghitungan nilai BC sebuah node dalam jejaring sebagai berikut :
8a -
σ
st
INS = Jumlah lintasan terpendek yang melalui node INS = 5
8b -
σ
st
= Total lintasan terpendek yang terbentuk dengan tidak menjadikan node INS
sebagai node source atau target = 6
Jadi nilai BC dari node INS = 56 = 0.83333
Nilai k tiap node pada Jejaring
1
2 3
4 5
1 2
3
4 5
6
a b
Gambar 7. Nilai connectivity degree k tiap node dalam jejaring
Gambar 8. Ilustrasi menghitung nilai BC dari node INS
Nilai CC akan menentukan node yang menjadi pusat dari jejaring. Semakin besar nilai CC sebuah node maka semakin pusat node tersebut dalam jejaring.
Rumusan untuk menghitung nilai CC sebuah node dalam jejaring adalah
=
�−1 ∑
�
�,
∈�
dan ilustrasi penghitungan nilai CC sebuah node dalam jejaring sebagai berikut :
-
Jumlah node N = 5
- d
G
INS,t = d
G
INS,akt1 + d
G
INS,GCK + d
G
INS,INSR + d
G
INS,IL6 = 1 + 2 + 1 + 1 = 5 -
Jadi nilai CC dari node INS = 5-15 = 0.8
Menentukan Protein-protein Signifikan berdasarkan nilai BC dari Subnetwork dan Konstruksi Jejaring Penyangga
Subnetwork menggambarkan
keterkaitan kandidat
protein-protein signifikan yang lebih sederhana Gambar 13. Protein-protein signifikan ditentukan
dari protein-protein yang banyak digunakan sebagai persimpangan atau protein- protein yang memiliki nilai BC tertinggi. Jumlah protein dengan BC tinggi yang
diambil sebagai protein-protein signifikan adalah 5 dari total nodeprotein pada jejaring Goni et al. 2008; Kim et al. 2009. Semua protein-protein signifikan yang
diperoleh digunakan untuk mengkonstruksi jejaring penyangga. Informasi protein- protein signifikan, protein node pusat jejaring dan protein-protein yang
bertetangga langsung dengan protein pusat diperoleh dari jejaring penyangga yang terbentuk. Protein pusat jejaring ditentukan dari protein node yang mempunyai
nilai CC tertinggi dari subnetwork Wasserman Faust 1994.
Semua protein-protein signifikan yang telah ditentukan kemudian dikonstruksi menjadi jejaring penyangga. Jejaring ini menggambarkan keterkaitan
antar protein signifikan dalam jejaring PPI baik secara langsung maupun tidak langsung. Karena jejaring ini terbentuk dari semua protein signifikan memiliki
nilai BC tinggi dalam jejaring PPI di mana protein-protein tersebut menjadi jembatan sebagai besar lintasan terpendek tiap pasang protein-protein dalam
jejaring, maka jejaring penyangga ini adalah jejaring utama Ran J et al. 2013 pada jejaring PPI.
INSR akt1
INS
IL6 GCK
1 1
1 2
Gambar 9. Ilustrasi menghitung nilai CC dari node INS
11
Proses konstruksinya adalah 1 menelusuri semua lintasan terpendek antar protein-protein signifikan pada jejaring PPI, 2 semua lintasan terpendek yang
ditemukan diubah menjadi data interaksi antar protein PPI, 3 data interaksi antar protein ini digunakan untuk mengkonstruksi jejaring penyangga.
Evaluasi Ketahanan Jejaring Penyangga
Jejaring uji dikonstruksi untuk mengevaluasi ketahanan jejaring penyangga konsistensi protein-protein yang menyusun jejaring penyangga dengan tidak
menjadikan beberapa kandidat protein-protein signifikan yang dikembalikan oleh basis data OMIM sebagai data input pada basis data STRING. Jumlah kandidat
protein-protein signifikan yang tidak dijadikan sebagai data input pada basis data STRING adalah 10 Ran et al. 2013 dari seluruh data kandidat protein-protein
signifikan. Misalkan terdapat 72 kandidat protein-protein signifikan, maka jumlah kandidat protein-protein signifikan yang tidak dijadikan sebagai data input pada
basis data STRING adalah 1 sampai 7 protein.
Jika 1 dari 72 kandidat protein-protein signifikan yang tidak dilibatkan sebagai data input pada basis data STRING yang dipilih secara bergantian, maka
jumlah kombinasi kandidat protein-protein signifikan yang terbentuk adalah 72 kombinasi data input. Untuk 2 sampai 7 kandidat protein signifikan yang tidak
dilibatkan sebagai data input, protein pusat yang memiliki nilai CC terbesar selalu termasuk protein yang idak dilibatkan sabagai data input pada basis data STRING.
Hal ini dilakukan untuk menguji kekokohan protein pusat dalam jejaring. Dengan demikian jika ada 2 kandidat protein signifikan yang tidak dilibatkan sebagai data
input
, maka akan terbentuk 71 kombinasi data input. Adapun jika jumlah kandidat protein signifikan yang tidak dilibatkan sebagai data input adalah 3 sampai 7
protein, maka jumlah kombinasi kandidat protein signifikan sebagai data input adalah 30 kombinasi yang masing-masing dipilih secara acak Ran et al. 2013.
Sebagai ilustrasi jika ada 3 kandidat protein signifikan yang tidak dilibatkan sebagai data input pada basis data STRING, maka akan terbentuk 357.840 72x71x70
kombinasi data input. Sehingga total jumlah kombinasi kandidat protein-protein signifikan sebagai data input pada basis data STRING adalah 293 72 + 71 + 5 x
30 kombinasi.
Langkah-langkah yang dilakukan dalam mengkonstruksi jejaring uji untuk tiap kombinasi kandidat protein-protein signifikan sebagai berikut :
a. Scanning data PPI pada basis data STRING untuk tiap kandidat protein
signifikan yang ada pada data input. b.
Konstruksi jejaring PPI dari seluruh data PPI yang diperoleh. c.
Analisis topologi jejaring PPI yang terbentuk untuk mendapatkan nilai degree, BC dan CC untuk tiap node pada jejaring PPI dan kemudian diurutkan dari
besar ke kecil.
d. Memilih node-node penting protein-protein signifikan dengan nilai BC tinggi
sebanyak 5 dari semua node pada jejaring PPI. e.
Konstruksi jejaring uji dari semua node-node penting protein-protein signifikan yang terpilih.
f. Similaritas node-node protein-protein jejaring uji dihitung terhadap jejaring
penyangga untuk mendapatkan nilai akurasi jejaring uji terhadap jejaring penyangga.
g. Mengakumulasi frekuensi node protein dengan nilai degree, BC dan CC
terbesar untuk tiap jejaring uji yang terbentuk. Konstruksi jejaring uji dilakukan untuk semua kombinasi kandidat protein-
protein signifikan dan akan diperoleh frekuensi dari nodeprotein dengan nilai BC tertinggi, nodeprotein yang bertindak sebagai pusat jejaring nodeprotein dengan
nilai CC tertinggi dan nodeprotein yang memiliki interaksi langsung terbanyak dengan nodeprotein lain dalam jejaring nodeprotein dengan nilai degree
tertinggi. Selain itu nilai akurasi dari semua jejaring uji yang terbentuk terhadap jejaring penyangga juga dihitung.
13