Analisis Gerombol Simultan Dan Jejaring Farmakologi Pada Penentuan Senyawa Aktif Jamu Anti Diabetes Tipe 2.
ANALISIS GEROMBOL SIMULTAN DAN JEJARING
FARMAKOLOGI PADA PENENTUAN SENYAWA AKTIF
JAMU ANTI DIABETES TIPE 2
NURUL QOMARIASIH
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul “Analisis Gerombol
Simultan dan Jejaring Farmakologi pada Penentuan Senyawa Aktif Jamu Anti
Diabetes Tipe 2” adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan
dalam Daftar Pustaka di bagian akhir disertasi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, November 2015
Nurul Qomariasih
NIM G151130071
RINGKASAN
NURUL QOMARIASIH. Analisis Gerombol Simultan dan Jejaring Farmakologi
pada Penentuan Senyawa Aktif Jamu Anti Diabetes Tipe 2. Dibimbing oleh BUDI
SUSETYO dan FARIT MOCHAMAD AFENDI.
Selama ini, pembuatan obat untuk menyembuhkan suatu penyakit masih
menargetkan hanya satu protein khusus yang menjadi penyebab penyakit tersebut,
yang tentu hanya menggunakan satu senyawa aktif. Selain menimbulkan efek
samping, obat kimia sintetis belum bisa menangani suatu penyakit dengan
menyasar banyak protein sekaligus. Baru-baru ini terjadi perubahan paradigma
dari “one drug, one-target” menjadi “multi-components, network target”.
Paradigma baru ini telah melahirkan beberapa penelitian untuk menghasilkan
formulasi jamu, dimana konsep formulasi jamu memerlukan beberapa senyawa
aktif yang terlibat. Formula jamu yang diteliti sebagai upaya menyembuhkan
penyakit Diabetes Melitus (DM) Tipe II terdiri dari 4 tanaman yaitu Pare
(Momordica charantia), Sembung (Blumea balsamifera), Bratawali (Tinospora
crispa), dan Jahe (Zingiber officinale) berdasarkan hasil penelitian Nurishmaya
tahun 2014 serta berdasarkan ramuan jamu yang sedang dikembangkan di Pusat
Studi Biofarmaka, Bogor. Evaluasi senyawa yang berkaitan dengan DM Tipe II
dilakukan dengan terlebih dahulu menambahkan 19 obat sintetis yang ditujukan
untuk DM Tipe II dari basis data Drug Bank. Sedangkan setiap tanaman juga
dicari masing-masing senyawa yang terkandung di dalamnya melalui basis data
Dictionary of National Products (DNP) ChemnetBase dan Take Out “Jamu” of
Knapsack. Didapatkan 291 senyawa dari tanaman Jahe, 18 senyawa dari tanaman
Bratawali, 41 senyawa dari tanaman Sembung, dan 245 senyawa dari tanaman
Pare. Total senyawa yang didapat dari keempat tanaman ada sebanyak 595.
Kesemua senyawa baik yang berasal dari tanaman maupun dari obat sintetis dicari
identitasnya lebih lanjut berupa struktur kimia senyawa dan aktifitas biologisnya
berupa protein yang ditargetkan. Sayangnya, tidak semua senyawa tanaman
diketahui protein targetnya, sehingga data penelitian yang akan diteliti lebih lanjut
berkurang menjadi sebanyak 74 senyawa aktif yang terdiri dari 55 senyawa dari
keempat tanaman dan 19 senyawa dari masing-masing obat sintetis. Setiap
senyawa (74 senyawa) dapat menargetkan protein yang sama di dalam tubuh
manusia. Diperoleh jumlah protein sebanyak 3059, total koneksi senyawa-protein
sebanyak 4082 dan total protein target unik sebanyak 478.
Berdasarkan data di atas, dilakukan analisis bagi data jejaring farmakologi
yang dinamakan drugCIPHER. Analisis tersebut dilakukan untuk mencari proteinprotein target yang memiliki korelasi terbesar dengan tiap senyawa. Langkah
pertama adalah mencari nilai kedekatan antar 74 senyawa menggunakan koefisien
Tanimoto atau dikenal juga dengan koefisien Jaccard. Di sisi yang lain, dilakukan
juga analisis graf untuk mendapatkan jarak terdekat antar protein yang kemudian
dikonversi menjadi kedekatan antar protein melalui konsep perhitungan
eksponensial. Lalu langkah kedua adalah mencari korelasi antara kedua nilai
kedekatan sampai menghasilkan 100 protein target yang berkorelasi paling tinggi
dengan masing-masing dari 74 senyawa yang dinamakan sebagai skor konkordan
DrugCIPHER. Karena setiap senyawa dapat memiliki korelasi tinggi dengan
protein yang sama, maka penting untuk mendapatkan protein uniknya saja.
Didapatkan sebanyak 1250 protein unik yang semula berjumlah 7400 koneksi
senyawa-protein. Skor konkordan antara 74 senyawa dengan 1250 protein tersebut
kemudian digunakan dalam analisis gerombol simultan antara senyawa dan
protein target. Tujuan utama melakukan analisis gerombol simultan tersebut
adalah melihat penggerombolan senyawa berdasarkan protein targetnya. Senyawa
tanaman yang menggerombol bersama senyawa obat sintetis dicurigai berpotensi
menjadi salah satu komposisi jamu anti-diabetes. Selain itu, analisis tersebut juga
digunakan untuk mendeteksi protein target mana saja yang berperan sebagai
penyebab penyakit diabetes tipe 2.
Selain itu, analisis komponen utama melalui plot dua dan tiga dimensi juga
dilakukan untuk memastikan bahwa hasil yang ditunjukkan melalui analisis
gerombol simultan tidak berbeda jauh. Sedangkan untuk melengkapi analisis
gerombol simultan, dibuat sebuah jejaring kemiripan dari senyawa tanaman yang
memiliki korelasi sangat tinggi terhadap senyawa obat sintetis. Berdasarkan ketiga
analisis tersebut didapat bahwa 2 dari 3 senyawa Bratawali berpotensi sebagai
obat antidiabetes karena menggerombol dan berkorelasi tinggi dengan senyawa
aktif obat antidiabetes, sedangkan 11 dari 44 senyawa Jahe menggerombol
bersama senyawa aktif obat antidiabetes tetapi hanya 5 senyawa Jahe yang
berkorelasi kuat dengan senyawa aktif obat antidiabetes. Sembung dan Pare tidak
menggerombol dengan senyawa aktif obat antidiabetes namun mungkin dapat
berpotensi sebagai tanaman antidiabetes bila data yang digunakan lebih banyak
atau dengan analisis yang lain.
Kata kunci: Diabetes Tipe 2, Jamu, Jejaring farmakologi, DrugCIPHER, Analisis
Gerombol Simultan.
SUMMARY
NURUL QOMARIASIH. Simultaneous Clustering Analysis and Network
Pharmacology in the Determination of Active Compounds of Jamu for Diabetes
Type 2. Supervised by BUDI SUSETYO and FARIT MOCHAMAD AFENDI.
During this time, the manufacture of drug in order to cure a disease is still
target only one specific protein that causes the disease, which of course uses only
one active compound. In fact, besides causing side effects, treatment of a disease
needs a lot of protein targets at once. Thus, a paradigm shifts from "one-targets,
one drug" to “network target, multi-components" becomes popular. This new
paradigm has inspired several studies to produce herbal formulation, while the
concept of herbal formulations requires some active compounds involved. Herbal
formulas studied in an effort to cure the disease of Diabetes Mellitus (DM) Type
II consists of 4 plants: bitter melon (Momordica charantia), Sembung (Blumea
balsamifera), Bratawali (Tinospora crispa), and ginger (Zingiber officinale)
which are based on research from Nurishmaya 2014 and based on herbs that are
being developed at Biopharmaca Research Centre, Bogor, Indonesia. Evaluation
of the compounds associated with Type II diabetes is done by first adding 19
synthetic drugs intended to Type II DM from Drug Bank database. While
compound contained in each plant also searched through the database of
Dictionary of National Products (DNP) ChemnetBase and Take Out "Jamu" of
Knapsack. There are 291 compounds obtained from Jahe, 18 compounds from
plant Bratawali, 41 compounds from Sembung, and 245 compounds from Pare. So
the total compound obtained from the four plants have as many as 595. All of the
compounds whether from plants or from synthetic drugs sought further their
credentials in the form of the chemical structure of the compound and its
biological activities in the form of a targeted protein. Unfortunately, not all plant
compounds have target protein in the body, so that the research data that will be
examined further reduced to as many as 74 active compounds consisting of 55
natural compounds from four plants and 19 respectively compound of synthetic
drugs. Each of the compounds (74 compounds) can target the same protein in the
human body. Total unique protein obtained amounted to 3059 from a total of
compound-protein connections is 4082 and a total of 478 unique protein targets.
Based on the above data, the analysis conducted for the data of network
pharmacology called drugCIPHER. The analysis is performed to find the target
proteins that have the greatest correlation with each compound. The first step is to
find the value of the closeness between 74 compounds using Tanimoto coefficient
or also known as the coefficient of Jaccard. On the other hand, performed well
graph analysis to get the closest distance among proteins which is then converted
to the dissimilarity among proteins through the concept of exponential calculation.
Then the second step is to find the correlation between the two values of the
smilarity until produced 100 highest correlated protein targets with each of the 74
compounds, namely DrugCIPHER concordant scores. Because every compound
can have a high correlation with the same protein, it is important to get a unique
protein. It was obtained 1250 unique protein from 7400 compound-protein
connections. Concordant scores between 74 compounds and 1250 proteins are
then used in the analysis of simultaneous clustering between compounds and
target proteins. The main purpose of the analysis of simultaneous clustering is to
see the compound cluster based on the target protein. Plant compounds which are
clustered together with synthetic drug compounds suspected as the potential one
to become one of the anti-diabetic Jamu composition. In addition, the analysis was
also used to detect any target protein that acts as a cause of type 2 diabetes.
In addition, principal component analysis through two and threedimensional plot is also made to ensure that the results shown by the analysis of
simultaneous clustering does not differ too much. As for the complete analysis of
simultaneous clustering, Similarity Network was made between plant compounds
which have a very high correlation to the synthetic drug compounds. Based on the
three analysis, there are found 2 of the 3 Bratawali compounds as a potential
antidiabetic drugs because they were gathered and correlated with active
compounds of antidiabetic drugs, while 11 of the 44 Jahe compounds clustered
together with the active compound of antidiabetic drugs but only 5 compounds of
Jahe are correlated with the active compounds of drugs antidiabetic. Sembung and
Pare did not gather with the active compound of antidiabetic drugs but may be
potentially as antidiabetic plant when more data are being used or with other
analyzes.
Keywords: Diabetes Type 2, Jamu, Network Pharmacology, DrugCIPHER,
Simultaneous Clustering.
© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB
ANALISIS GEROMBOL SIMULTAN DAN JEJARING
FARMAKOLOGI PADA PENENTUAN SENYAWA AKTIF
JAMU ANTI DIABETES TIPE 2
NURUL QOMARIASIH
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015
Penguji Luar Komisi pada Ujian Tesis: Dr Wisnu Ananta Kusuma, ST MT
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih merupakan bagian dari kajian program riset pertanian pada Program Studi
Statistika, yaitu pengembangan data dan analisis Jamu di Indonesia. Tesis ini
diberi judul Analisis Gerombol Simultan dan Jejaring Farmakologi pada
Penentuan Senyawa Aktif Jamu Anti Diabetes Tipe 2.
Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Budi Susetyo, M.Sc dan
Bapak Dr. Farit Mochamad Afendi, S.Si, M.Si selaku pembimbing atas
kesediaannya membagi ilmu kepada penulis serta dorongan semangat yang tak
terhingga dalam penyusunan tesis ini. Terimakasih kepada Direktorat Jenderal
Pendidikan Tinggi (Dikti) yang telah memberikan beasiswa pascasarjana program
Magister kepada penulis. Ucapan terima kasih juga penulis sampaikan sebesarbesarnya kepada seluruh Dosen Program Studi Statistika IPB yang telah mendidik
penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta
seluruh staf Program Studi Statistika IPB atas bantuan, pelayanan, dan
kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan setinggi-tingginya kepada
Bapak Jumiran dan Mamah Juju Juarsih selaku orang tua atas kasih sayangnya
membesarkan dan senantiasa mendukung di setiap langkah positif yang penulis
jalani, juga kedua adik laki-laki Hadi Johar Prakoso dan Muhammad Surya yang
selalu menyemangati di sela-sela pengerjaan tesis ini. Tak lupa penulis ucapkan
terima kasih kepada teman seperjuangan di riset pertanian Rizal Bakri, M.Si dan
Nur Hilal A. Syahrir, M.Si atas kebersamaannya menghadapi masa-masa terindah
maupun tersulit dalam pencarian data penelitian ini.
Terakhir penulis sampaikan terima kasih sedalam-dalamnya kepada
seluruh mahasiswa Pascasarjana Program Studi Statistika angkatan 2013 atas
kebersamaannya yaitu kenangan bahagia, kenangan sedih, haru, dan pengorbanan
yang kita perjuangkan bersama selama menuntut ilmu di bangku kuliah, serta
semua pihak yang telah banyak membantu dan tak sempat penulis sebutkan satu
per satu.
Semoga karya ilmiah ini dapat bermanfaat.
Bogor, November 2015
Nurul Qomariasih
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
1
1
2
2 TINJAUAN PUSTAKA
Diabetes Melitus (DM) Tipe 2
Jejaring Farmakologi
DrugCIPHER
DrugCIPHER-CS
DrugCIPHER-GR
Unweighted Breadth-First
Nilai konkordan
Analisis Komponen Utama
Analisis Gerombol Simultan
Algoritma Coupled Two-Way Clustering analysis (CTWC)
Metode Penggerombolan
Pseudo-F
Jejaring kemiripan (Similarity Network)
3
3
3
3
4
6
6
6
7
7
8
10
11
12
3 METODE PENELITIAN
Data
Metode analisis
13
13
14
4 HASIL DAN PEMBAHASAN
Jejaring Farmakologi
DrugCIPHER
Analisis komponen utama
Penggerombolan simultan 2 dimensi
Jejaring kemiripan
16
16
16
19
20
23
5 SIMPULAN DAN SARAN
Simpulan
Saran
24
24
24
DAFTAR PUSTAKA
25
LAMPIRAN
26
RIWAYAT HIDUP
38
DAFTAR TABEL
1 Set biner antara dua senyawa
2 Perbandingan antara analisis gerombol klasik dan analisis gerombol
simultan (Charrad dan Ahmed 2011).
3 Algoritma analisis gerombol simultan
4 Daftar pangkalan data publikasi ilmiah
5 Nilai pseudo-F dari berbagai metode dan jumlah gerombol
6 Protein penyebab diabetes yang bersesuaian pada kotak horizontal
4
8
9
13
20
22
DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
Jejaring farmakologi jamu
Dua struktur molekul senyawa
Prinsip drugCIPHER
Metode Breadth First Search
Reorganisasi oleh permutasi dari baris dan kolom (Govaert 1995)
Penggerombolan berhirarki 2 dimensi oleh Parsons et al. (2003)
Jejaring antara senyawa (kuning) dengan protein target (merah)
Kemiripan antar senyawa berdasarkan struktur kimia yang dihitung
melalui koefisien kemiripan Tanimoto
Jejaring interaksi antar protein target
Skor konkordan senyawa dengan protein target
Plot komponen utama
Hasil gerombol simultan Ward.D
Jejaring kemiripan senyawa sintetis dengan senyawa tanaman
3
4
5
6
8
10
16
17
17
18
19
21
23
DAFTAR LAMPIRAN
1 Senyawa sintetis antidiabetes yang telah terdaftar di Food and Drug
Asociation (FDA) dengan sumber basis data Drugbank
2 Senyawa yang berasal dari tanaman yang diduga sebagai antidiabetes
3 Syntax R untuk analisis data
4 Hasil gerombol simultan dengan metode Single Linkage
5 Hasil gerombol simultan dengan metode Complete Linkage
6 Hasil gerombol simultan dengan metode Average Linkage
7 Hasil gerombol simultan dengan metode Ward.D
8 Hasil gerombol simultan dengan metode Ward.D2
26
27
29
33
34
35
36
37
1
1 PENDAHULUAN
Latar Belakang
Seiring perkembangan jaman, kecenderungan orang memilih bahan alami
untuk konsumsi sehari-hari maupun pengobatan semakin berkembang. Bidang
pengobatan juga memiliki pemikiran yang mengacu pada perubahan paradigma
dan menjadi topik yang mulai banyak diteliti saat ini, yakni dari "one drug, onetarget" menjadi “multi-components, network target". "one drug, one-target"
mengacu kepada obat kimia sintetis yang berisi satu senyawa aktif untuk
mengobati satu keluhan penyakit tertentu. Namun terkadang obat seperti ini
menimbulkan efek samping. Sedangkan “multi-components, network target"
diterapkan salah satunya pada jamu yang memiliki konsep keterlibatan beberapa
senyawa aktif untuk menargetkan beberapa protein penyebab penyakit.
Langkah pertama dalam mengidentifikasi target untuk membuat obat kimia
sintetis dalam bidang farmasi yaitu penemuan obat berdasarkan target dimulai
dengan mengidentifikasi fungsi dari target yang mungkin dan perananya dalam
penyakit. Langkah kedua adalah validasi target, dalam langkah ini diperlukan
demonstrasi bahwa molekul target secara langsung terlibat dalam proses penyakit.
Langkah selanjutnya adalah identifikasi senyawa aktif yang didefinisikan sebagai
molekul yang menunjukkan aktifitas biologis yang signifikan dalam uji skrining,
yakni materi baru yang menghubungkan struktur kimia untuk modulasi target.
Hingga langkah terakhir, yaitu langkah ke-11 yang melibatkan pengujian klinikal
atas konsep obat yang telah dibuat. Berdasarkan serangkaian langkah tersebut,
maka akan didapatkan molekul target (protein) yang berperan terhadap penyebab
suatu penyakit tertentu dan senyawa aktif obat sintetis yang berfungsi untuk
menargetkan molekul tersebut. Fungsi dari senyawa aktif adalah mengunci protein
target dalam rangka penyembuhan suatu penyakit, atau keduanya diistilahkan
sebagai “lock and key”.
Sementara itu, dalam rangka pembuatan jamu yang melibatkan senyawa
aktif tanaman, pendekatan statistika berbasis komputasi dapat dimanfaatkan untuk
mendapatkan senyawa yang berperan aktif mengobati suatu penyakit tertentu
berdasarkan protein targetnya. Hasil penelitian Nurishmaya (2014) serta
berdasarkan ramuan jamu yang sedang dikembangkan di Pusat Studi Biofarmaka,
Bogor, terdapat empat tanaman obat yang berkhasiat mengobati penyakit Diabetes
Melitus (DM) Tipe II yaitu Pare (Momordica charantia), Sembung (Blumea
balsamifera), Bratawali (Tinospora crispa), dan Jahe (Zingiber officinale).
Berdasarkan penelitian tersebut, maka akan diterapkan metode statistika
penggerombolan berhirarki dua dimensi berdasarkan skor konkordan antara
hubungan kedekatan antar senyawa dengan hubungan kedekatan senyawa-protein
target untuk menghasilkan senyawa aktif tanaman obat yang berperan sebagai
antidiabetes. Hubungan kedekatan antar senyawa diukur berdasarkan kesamaan
struktur senyawa kimiawi menggunakan koefisien Tanimoto berbasis data biner
dengan kriteria fingerprint Klekota-Roth (KR). Sedangkan hubungan kedekatan
senyawa-protein target dihitung dengan menggunakan konsep shortest path dari
teori graph dan konsep drugCIPHER untuk mencari 100 protein target teratas
2
untuk masing-masing senyawa. Pengelompokkan tersebut melibatkan senyawa
aktif obat kimia yang telah disetujui oleh Food and Drug Administration (FDA)
Amerika Serikat dan sudah diketahui fungsinya sebagai obat antidiabetes,
sehingga akan didapat senyawa aktif tanaman obat yang memiliki kemiripan
dengan senyawa obat kimia antidiabetes berdasarkan protein target. Metode
pengelompokkan yang dipakai adalah metode complete linkage, single linkage,
ward.D, ward.D2, dan average linkage. Beberapa metode tersebut akan dievaluasi
menggunakan Pseudo-F untuk menentukan metode mana yang paling baik
digunakan dan berapa gerombol yang sebaiknya diterapkan. Serta yang terakhir
akan divisualisaskan jejaring antara senyawa aktif obat kimia sintetis dan senyawa
aktif tanaman obat berdasarkan kesamaan target menggunakan Cytoscape. Hasil
akhir dari analisis gerombol dua dimensi antara senyawa (senyawa aktif tanaman
obat dan senyawa aktif obat sintetis) dengan protein target yaitu menghasilkan
senyawa aktif tanaman yang memiliki kemiripan protein target dengan senyawa
aktif obat sintetis antidiabetes.
Tujuan Penelitian
Tujuan dari penelitian ini yaitu penentuan senyawa aktif tanaman obat
diabetes tipe 2 dengan metode jejaring farmakologi dan analisis gerombol
simultan.
3
2 TINJAUAN PUSTAKA
Diabetes Melitus (DM) Tipe 2
Diabetes adalah penyakit kronis yang terjadi baik ketika pankreas tidak
menghasilkan cukup insulin atau ketika tubuh tidak dapat secara efektif
menggunakan insulin yang dihasilkan. Insulin merupakan hormon yang mengatur
gula darah (World Health Organization 1999). Efek jangka panjang dari Diabetes
adalah kerusakan serius pada sistem tubuh, terutama syaraf dan pembuluh darah.
Sebagian besar DM Tipe II merupakan hasil dari kelebihan berat badan dan
merupakan 90% dari penderita diabetes seluruh dunia.
Jejaring Farmakologi
Berdasarkan kemajuan dalam biologi kimia dan ilmu jaringan, jejaring
farmakologi adalah pendekatan baru khusus untuk penemuan obat. Pendekatan ini
melibatkan penerapan analisis jaringan untuk menentukan set protein yang paling
penting dalam penyakit, dan kemudian biologi kimia untuk mengidentifikasi
molekul atau senyawa yang mampu menargetkan set protein. Jejaring farmakologi
berbeda dari pendekatan obat konvensional, yang umumnya didasarkan pada
penargetan yang sangat spesifik dari protein tunggal (Zhang Gui-biao et al 2013)
Jamu
Jamu 1
Tanaman
Senyawa
Tanaman 1
Senyawa 1
Protein 1
Tanaman 2
Senyawa 2
Protein 2
Tanaman 3
Jam
Tanaman 4
u2
Senyawa 3
Protein 3
Senyawa 4
Protein 4
Senyawa 5
Protein 5
Jamu 1
Protein target
Penyakit
Penyakit
Protein 6
Gambar 1. Jejaring farmakologi jamu
Jejaring farmakologi sebuah jamu terdiri dari gabungan beberapa tanaman.
Setiap tanaman mengandung beberapa senyawa dan masing-masing senyawa
mampu menargetkan beberapa protein dalam tubuh. Sementara itu, suatu penyakit
juga diakibatkan oleh aktivitas menyimpang beberapa protein dalam tubuh.
DrugCIPHER
Langkah pertama dalam menganalisis data jaringan adalah dengan metode
DrugCIPHER. Metode ini merupakan ulasan tentang pengetahuan mengenai
penggunaan farmasi (Wotring dan Virginia 2012). Lebih fokus Zhao dan Li
(2010) mengartikan metode ini sebagai sebuah kerangka kerja komputasi berbasis
1
5
Ruang farmakologi
Kemiripan struktur kimia obat
d1
d2
d3
(CS)
d4
Kaitan ruang farmakologi dan
ruang genomik (GR)
A
Ruang
Genomik
Kedekatan
senyawa-protein
d
d1
d2 d3 . . . . . dn
p
C
C
Jaringan Interaksi protein-protein
Senyawa
Protein target
B
Gambar 3. Prinsip drugCIPHER.
Bagian A pada prinsip drugCIPHER merupakan ruang farmakologi yang
meliputi kemiripan efek terapi obat (TS) dan kemiripan struktur kimiawa obat
(CS) Bagian B menunjukkan jaringan interaksi antar protein (PPI) (garis hitam
solid) yang merepresentasikan informasi pada ruang genomik. Bersama dengan
interaksi senyawa- protein target (haris hitam putus-putus), hubungan kedekatan
(garis cokelat putus-putus) didefinisikan sebagai asosiasi senyawa dengan protein
tertentu. Bagian C menunjukkan senyawa d dan protein p, dua vektor kemiripan d
di dalam ruang farmakologi dan satu vektor kedekatan p adalah φp.
Pendekatan fingerprint biner merupakan salah satu metode evaluasi
kemiripan. Fingerprint biner dari dua molekul (Tabel 1) dapat dibandingkan
untuk dikuantifikasi jaraknya menggunakan koefisien kemiripan Tanimoto yaitu:
dari
adalah suatu molekul tertentu,
dan
merupakan representasi biner
dan ,
merupakan jarak Euclid (Sharma dan Pranit 2011)
DrugCIPHER-GR
6
Asosiasi ruang farmakologi dengan ruang genomik mendefinisikan
kedekatan antara protein p dengan senyawa d pada basis jaringan PPI yaitu:
merupakan protein target yang dituju oleh senyawa .
merupakan
jarak terpendek antara
dan
pada jaringan PPI pada ruang genomik
berdasarkan teori graf algoritme Dijktra.
digunakan untuk mengkonversi
jarak protein-protein menjadi kedekatan protein-protein. Persamaan ini
menunjukkan bahwa kedekatan antara obat
dan protein
sama dengan
penjumlahan dari kedekatan antara protein dengan semua protein target dari
obat . Jika jarak dua protein sangat jauh, didefiniskan
. Sedangkan
jaringan PPI merupakan data interaksi biner antar protein dalam tubuh manusia.
Unweighted Breadth-First
Breadth-first search (BFS) adalah graf dasar yang sering digunakan sebagai
blok-blok pembangun pada banyak algoritma graf yang lebih komplek (Beamer et
al. 2013). Metode ini akan mengunjungi terlebih dahulu semua node pada level n
sebelum mengunjungi node-node pada level n+1. Pencarian dimulai dari node
akar terus ke level ke-1 dari kiri ke kanan (Gambar 4).
Gambar 4. Metode Breadth First Search (Indrawati et al. 2011).
Keuntungan pertama dari metode ini yaitu tidak akan menemui jalan buntu.
Keuntungan kedua adalah jika ada satu solusi maka breadth-first search akan
menemukannya, namun jika ada lebih dari satu solusi, maka solusi minimum akan
ditemukan. Selain keuntungan, metode ini juga memiliki kekurangan, metode ini
akan menyimpan semua node dalam satu pohon, sehingga membutuhkan memori
yang cukup banyak. Waktu pengerjaannya pun cukup lama, karena akan menguji
n level untuk mendapatkan solusi pada level ke-(n+1).
Nilai konkordan
Nilai konkordan yang akan digunakan sebagai
penggerombolan berhirarki dua dimensi didefinisikan sebagai:
nilai
dalam
7
Nilai konkordan ini menjelaskan derajat kontribusi dari senyawa dengan
pada protein pada persamaan sebebelumnya. Nilai ini
vektor kedekatan
memiliki rentang nilai -1 hingga 1. Ketika hubungan antara
dengan
positif, semakin dekat kemiripan senyawa i dengan senyawa j, maka senyawa i
akan semakin menargetkan protein target dari senyawa j.
Analisis Komponen Utama
Analisis komponen utama banyak digunakan pada berbagai bidang ilmu.
Tujuan utama dari analisis komponen utama adalah mereduksi dimensi data besar
dan saling berkorelasi menjadi dimensi yang lebih kecil dan saling bebas. Peubah
baru ini merupakan kombinasi linier dari peubah asal dan disebut dengan
komponen utama (Principal Component). Komponen utama ini dapat dibentuk
berdasarkan matriks ragam peragam ataupun matriks korelasi.
Sebelum analisis penggerombolan simultan dua dimensi, data nilai
konkordan dilihat penyebarannya pada plot skor komponen utama. Hal ini untuk
melihat penyebaran titik-titik senyawa tanaman terhadap senyawa obat sintetis
setelah jumlah peubah (protein) direduksi menjadi beberapa komponen.
Penentuan jumlah komponen yang diambil dilihat melalui scree plot.
Pembentukkan komponen utama berdasarkan matriks ragam peragam dapat
merupakan
dilakukan jika satuan pengukuran setiap peubah sama. Misalkan
, dengan pasangan akar ciri dan vektor
matriks ragam peragam
ciri
,
dengan
maka
komponen utama ke-i didefinisikan sebagai berikut:
Selain itu, nilai dari proporsi kontribusi keragaman komponen utama ke-i ,
yaitu:
(Johnson dan Wichern 2007).
Analisis Gerombol Simultan
Penggerombolan simultan biasa disebut biclustering, co-clustering, 2-way
clustering atau block clustering. Tujuannya adalah untuk menemukan submatrik,
dimana subgrup baris dan subgrup kolom memperlihatkan korelasi tinggi. Metode
ini banyak diaplikasikan pada bidang bioinformasi, web-mining, text mining dan
analisis social network (Charrad dan Ahmed 2011). Perbandingan dari kedua
metode penggerombolan dijelaskan pada Tabel 2.
Penelitian mengenai penggerombolan simultan dengan menetapkan sebuah
permasalahan untuk menemukan dua partisi simultan dengan cara perhitungan
matriks telah ditemukan sejak 1960-an, penelitian tersebut juga mendefinisikan
kriteria untuk pengoptimuman, namun tanpa mengusulkan metode apapun untuk
memecahkan masalah ini.
8
Tabel 2. Perbandingan antara analisis gerombol klasik dan analisis gerombol
simultan (Charrad dan Ahmed 2011).
Analisis gerombol klasik
Diaplikasikan pada baris atau kolom
dari data matriks secara terpisah
model global
Menghasilkan gerombol baris atau
gerombol kolom
Setiap objek pada gerombol objek
didefinisikan menggunakan semua
peubah. Setiap peubah pada gerombol
peubah mencirikan semua objek.
Analisis Gerombol Simultan
Menampilkan penggerombolan pada
dua dimensi secara simultan.
model lokal
Mencari blok dari baris dan kolom
yang saling berhubungan.
Setiap objek di dalam bicluster diplih
hanya menggunakan subset peubah
dan setiap peubah di dalam bicluster
dipilih hanya menggunakan subset
dari objek
Penelitian selanjutnya pada tahun 1970-an dilakukan pemilhan set untuk
pengklasifikasian. Pendekatan iteratif pun diusulkan dimana objek dan peubah
dapat diklasifikasikan sampai kedua partisi menjadi “saling harmonis” (Gambar 5).
Gambar 5. Reorganisasi oleh permutasi dari baris dan kolom (Govaert 1995)
Konteks analisis gerombol simultan bersifat eksploratif dan untuk
memenuhi beberapa tujuan berikut:
Mengusulkan ringkasan hasil yang sederhana dan mudah dipahami.
Memungkinkan penggunaan metode faktorial dan metode pengelompokan
secara bersama-sama.
Mendapatkan metode pengelompokan klasik ketika hanya mencoba
menggerombolkan satu dari dua set data.
Algoritma Coupled Two-Way Clustering analysis (CTWC)
Terdapat beberapa pilihan algoritma dalam melakukan analisis gerombol
simultan berdasarkan tipe data, pendekatan dan penerapan (Tabel 3). Salah
satunya adalah Coupled Two-Way Clustering analysis (CTWC). Sama seperti
prinsip penggerombolan simultan, algoritma ini mengasumsikan bahwa hanya ada
sebagian kecil gen berpartisipasi dalam proses seluler yang berlangsung pada
subset sampel. Memfokuskan pada subset yang kecil berarti menurunkan noise
yang disebabkan oleh sampel dari gen lainnya. CTWC akan menghasilkan
9
pasangan subset objek dan fitur melalui proses iteratif dengan menguji hanya pada
submatriks baris (atau kolom) yang dimiliki oleh gen (atau sampel) yang telah
teridentifikasi pada iterasi sebelumnya.
Proses diawali dengan matriks penuh yaitu set semua gen (g0) dan semua
sampel (s0) yang digunakan sebagai fitur dan objek untuk dilakukan standard twoway clustering. Gerombol stabil dari gen dan sampel pada langkah pertama
dinotasikan sebagai g1 dan s1. Setiap pasangan (gin dan sjm) akan dilakukan twoway clustering. Hasil gerombol stabil dari gen (atau sampel) dinotasikan gk2 atau
sl2. Setiap gerombol disimpan di dalam satu dari dua “gerombol stabil register”,
gerombol gen di register G dan gerombol sampel di S. Bersama dengan gerombol
baru, sebuah pointer dipasang untuk mengidentifikasi gerombol sebelumnya (gin
dan sjm) yang digunakan sebagai set objek dan fitur dalam proses penggerombolan
yang dihasilkan. Langkah tersebut terus berulang menggunakan pasangan semua
gerombol yang telah ditemukan sebelumnya. Proses dihentikan ketika telah sesuai
dengan posisi gerombol semula.
Tabel 3. Algoritma analisis gerombol simultan.
Algoritma
Two-way
splitting
CROEUC
CROKI2
CROBIN
CTWC
Penerapan
Pendekatan
Lainnya
Lainnya
Lainnya
Lainnya
Bioinformatika
Plaid Models
δ-biclusters
δ -ks patterns
ITWC
DCC
Bioinformatika
Bioinformatika
Bioinformatika
Bioinformatika
Bioinformatika
OPSM
Bioinformatika
SAMBA
FLOC
Bioinformatika
Bioinformatika
Spectral
ITWC
BGSP
Bioinformatika
Text Mining
Text Mining
cHawk
Bioinformatika
Variance Minimization
Two-way clustering
Two-way clustering
Two-way clustering
Two-way clustering
Probabilistic and
generative
Variance Minimization
Variance Minimization
Two-way clustering
Two-way clustering
Motif and pattern
recognition
Probabilistic and
generative
Variance Minimization
Motif and pattern
recognition
Bi-partite Graph
Bi-partite Graph
Probabilistic and
generative
Block-EM
Lainnya
Two-way clustering
Block-CEM
Lainnya
Two-way clustering
Cemcroki2
Lainnya
Two-way clustering
Tipe data
Kontinu
Kontinu
Kategori
Biner
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kategori
Kontinu
biner
Kontinu
biner
Kategori
10
Sebagai gambaran mengenai hasil analisis gerombol simultan, Parsons et
al. (2003) melakukan analisis gerombol simultan berhirarki dua-dimensi dari
senyawa dan gen target yang ditampilkan seperti pada Gambar 6. Interaksi
senyawa-gen target diwakili dengan warna merah. Interaksi gen diplot pada
sumbu horisontal, dengan pohon gerombol gen di atas. Senyawa diplot pada
sumbu vertikal, dengan pohon gerombol di sisi kiri plot. Senyawa yang
mengelompok dengan gen target dan jalur hubungan keduanya ditandai oleh
warna yang sama.
Gambar 6. Penggerombolan berhirarki 2 dimensi oleh Parsons et al. (2003)
Metode penggerombolan
Berbagai metode penggerombolan dapat diterapkan pada kerangka CTWC.
Namun metode paling baik untuk menganalisis ekspresi gen harus memiliki
beberapa sifat-sifat yaitu jumlah gerombol tidak ditentukan sebelumnya (seperti
SOMS dan K-means) melainkan melalui dendogram, stabil terhadap noise,
memiliki mekanisme untuk mengidentifikasi kestabilan dan kekekaran gerombol,
serta dapat mengidentifikasi kepadatan dari set data (Getz et al. 2000). Beberapa
metode dasar yang akan diterapkan pada penelitian ini terdiri dari metode
penggerombolan agglomerative (metode penggabungan) yaitu linkage methods
seperti single linkage (jarak minimum atau tetangga terdekat), complete linkage
(jarak terjauh atau tetangga terjauh), dan average linkage (jarak rata-rata). Selain
itu juga menggunakan metode Ward yang meminimumkan “loss of information”
dari gabungan dua kelompok data, yaitu didefinisikan sebagai peningkatan kriteria
jumlah kuadrat galat (ESS).
Penyelesaian metode single linkage mulanya adalah menentukan jarak
lalu gabung dua objek terdekat U dan V dalam satu gerombol
terkecil
(UV). Jarak UV dengan gerombol lain W yaitu:
.
dan
masing-masing merupakan jarak antara tetangga terdekat
gerombol U-W dan V-W. Serupa pada single linkage, complete linkage berbeda
pada penentuan jarak UV dengan gerombol lain W yaitu:
.
11
Metode average linkage, jarak UV dengan gerombol lain W ditentukan
sebagai:
adalah jarak antara objek i dalam gerombol (UV) dan objek k pada
gerombol W,
dan
masing-masing adalah jumlah objek pada gerombol
UV dan gerombol W. Sedangkan akan ada dua algoritma metode Ward yang
digunakan yaitu Ward.D dan Ward.D2. Keduanya memiliki konsep yang sama
yaitu meminimumkan perubahan ragam atau jumlah kuadrat galat. Fion Murtagh
tahun 1985 menyatakan formula untuk memperbaharui gerombol pada Ward.D
yaitu:
berdasarkan jarak kuadrat Euclidean antar objek, maka
sedangkan
. Pada Ward.D2, formula
memperbaharui gerombol yaitu:
untuk
seperti pada Ward.D, berdasarkan jarak kuadrat Euclidean antar objek, maka
sedangkan
.
Semua metode di atas dicobakan untuk menggerombolkan senyawa dan
protein target berdasarkan nilai konkordan antara drugCIPHER-CS dan vektor
. Lalu masing-masing metode serta jumlah
kedekatan senyawa-protein target
gerombol yang terbentuk dievaluasi menggunakan pseudo-F. Pseudo-F
merupakan analisis untuk mendapatkan suatu nilai perbandingan keragaman antar
gerombol dengan keragaman di dalam gerombol.
Pseudo-F
Calinski dan Harabasz (1974) membuat suatu index sebagai indikasi
terhadap jumlah gerombol yang benar. Indeks Calinski dan Harabasz yang disebut
Variance Ratio Criterion (VRC) didefinisikan sebagai:
kriteria ini serupa dengan uji statistik F pada analisis univariat, dimana n
dan k masing-masing adalah jumlah total observasi dan jumlah gerombol, WGSS
merupakan jumlah kuadrat dalam gerombol yang didefinisikan sebagai:
sedangkan BGSS merupakan jumlah kuadrat antar gerombol yaitu:
;
12
Tujuan indeks tersebut yaitu meminimumkan WGSS dan memaksimumkan
BGSS, sehingga semakin tinggi nilai suatu index mengindikasikan jumlah
gerombol yang lebih baik. Hasil penggerombolan terbaik berdasarkan Pseudo-F
digunakan untuk mendapatkan jejaring kemiripan antar senyawa yang merupakan
langkah akhir dari analisis penentuan senyawa aktif tanaman untuk antidiabetes.
Jejaring kemiripan (Similarity Network)
Dua objek yang benar-benar mirip atau identik yaitu ketika sjj=1
sedangkan ketidakmiripan ditunjukkan sjj=0. Kemiripan merupakan kebalikan dari
ketidakmiripan yang dihitung pada selang [0,1], sehingga kemiripan dinotasikan
dimana
merupakan jarak Euclid antar objek (Gower dan
sebagai
Legendre 1986).
dapat berupa nilai korelasi antar objek untuk selang [-1,1].
Koefisien kemiripan antara dua objek yaitu senyawa tanaman dengan senyawa
sintetis antidiabetes ditetapkan nilai cutoff > 0,5 (Li Huiying et al, 2013). Jaringan
kemiripan (similarity network) senyawa tanaman dengan obat sintetis antidiabetes
(berdasarkan profil target>0,5) divisualisasi menggunakan network visualization
software CytoScape 2,8.
13
3 METODE PENELITIAN
Data
Data yang digunakan merupakan daftar bahan aktif ramuan jamu yang
sedang dikembangkan di Pusat Studi Biofarmaka untuk pengobatan diabetes
mellitus tipe II yang terdiri dari Pare (Momordica charantia), Sembung (Blumea
balsamifera), Bratawali (Tinospora crispa), dan Jahe (Zingiber officinale). Daftar
lebih rinci mengenai bahan aktif dari tanaman-tanaman tersebut dicari lebih lanjut
melalui berbagai publikasi ilmiah yang dilakukan selama bulan Januari hingga
Mei 2015 seperti tertera pada Tabel 4.
Tabel 4. Daftar pangkalan data publikasi ilmiah
Data
Senyawa
Pangkalan
Data
Take Out
“Jamu” of
Knapsack
Informasi yang diperoleh
dari pangkalan data
Daftar senyawa dari
tanaman Jahe, Pare,
Sembung, dan Bratawali.
(Afendi et al. 2012,
Running WE 1993)
DrugBank
Database
Senyawa obat kimia
sintetis antidiabetes
(Wishart et al. 2008)
Daftar senyawa (tanaman
Dari jumlah total 595
& sintetis) yang memliki
senyawa tanaman,
aktifitas biologis serta
terdapat 288 senyawa
informasi lebih rinci
unik dengan informasi
seperti Simplified
yang lengkap. Sedangkan
molecular input line
semua senyawa obat
entry system (Smiles)
sintetis memiliki
dan PubChem ID (CID).
informasi yang lengkap.
(Wang et al. 2009)
Daftar kriteria fingerprint Terdapat sebanyak 4860
(Klekota dan Roth 2008)
substruktur molekul
senyawa.
Bahan
aktif
Pubchem
Fingerprint
Klekota
Roth
(KR)
Interaksi
antar
protein
target
Konversi
gi
number
ChemDes
Human
Protein
Reference
Database
biological
DataBase
network
Interaksi biner antar
protein target dalam
tubuh.
(Goel et al. 2012)
Identitas protein dalam
bentuk selain gi number.
(Mudunuri et al.2009)
Hasil penelusuran data
291 senyawa Jahe, 18
senyawa Bratawali, 41
senyawa Sembung, dan
245 senyawa Pare. Total
jumlah senyawa
sebanyak 595
19 senyawa aktif obat
sintetis anti-diabetes.
39.240 interaksi biner
antar 9.673 protein unik.
505 HPRD ID untuk
setiap protein target.
14
Metode Analisis
Tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut:
I. Pendugaan protein target
Tahap ini menggunakan metode drugCIPHER dengan langkah-langkah
sebagai berikut (Zhao dan Li 2010):
1. Mendapatkan matriks drugCIPHER-CS
a. Menggabungkan data 55 senyawa tanaman (Lampiran 2) dan 19
senyawa obat (Lampiran 1) menjadi total keseluruhan 74 senyawa
dilengkapi dengan Simplified Molecular-Input Line-Entry System
(Smiles).
b. Membuat set biner sepanjang 4860 bit untuk masing-masing
senyawa berdasarkan fingerprint KR.
c. Menghitung nilai kemiripan struktur molekul antar senyawa
menggunakan koefisien Tanimoto (Sharma dan Pranit 2011):
2.
3.
sehingga akan dihasilkan matriks kemiripan senyawa (0
FARMAKOLOGI PADA PENENTUAN SENYAWA AKTIF
JAMU ANTI DIABETES TIPE 2
NURUL QOMARIASIH
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul “Analisis Gerombol
Simultan dan Jejaring Farmakologi pada Penentuan Senyawa Aktif Jamu Anti
Diabetes Tipe 2” adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan
dalam Daftar Pustaka di bagian akhir disertasi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, November 2015
Nurul Qomariasih
NIM G151130071
RINGKASAN
NURUL QOMARIASIH. Analisis Gerombol Simultan dan Jejaring Farmakologi
pada Penentuan Senyawa Aktif Jamu Anti Diabetes Tipe 2. Dibimbing oleh BUDI
SUSETYO dan FARIT MOCHAMAD AFENDI.
Selama ini, pembuatan obat untuk menyembuhkan suatu penyakit masih
menargetkan hanya satu protein khusus yang menjadi penyebab penyakit tersebut,
yang tentu hanya menggunakan satu senyawa aktif. Selain menimbulkan efek
samping, obat kimia sintetis belum bisa menangani suatu penyakit dengan
menyasar banyak protein sekaligus. Baru-baru ini terjadi perubahan paradigma
dari “one drug, one-target” menjadi “multi-components, network target”.
Paradigma baru ini telah melahirkan beberapa penelitian untuk menghasilkan
formulasi jamu, dimana konsep formulasi jamu memerlukan beberapa senyawa
aktif yang terlibat. Formula jamu yang diteliti sebagai upaya menyembuhkan
penyakit Diabetes Melitus (DM) Tipe II terdiri dari 4 tanaman yaitu Pare
(Momordica charantia), Sembung (Blumea balsamifera), Bratawali (Tinospora
crispa), dan Jahe (Zingiber officinale) berdasarkan hasil penelitian Nurishmaya
tahun 2014 serta berdasarkan ramuan jamu yang sedang dikembangkan di Pusat
Studi Biofarmaka, Bogor. Evaluasi senyawa yang berkaitan dengan DM Tipe II
dilakukan dengan terlebih dahulu menambahkan 19 obat sintetis yang ditujukan
untuk DM Tipe II dari basis data Drug Bank. Sedangkan setiap tanaman juga
dicari masing-masing senyawa yang terkandung di dalamnya melalui basis data
Dictionary of National Products (DNP) ChemnetBase dan Take Out “Jamu” of
Knapsack. Didapatkan 291 senyawa dari tanaman Jahe, 18 senyawa dari tanaman
Bratawali, 41 senyawa dari tanaman Sembung, dan 245 senyawa dari tanaman
Pare. Total senyawa yang didapat dari keempat tanaman ada sebanyak 595.
Kesemua senyawa baik yang berasal dari tanaman maupun dari obat sintetis dicari
identitasnya lebih lanjut berupa struktur kimia senyawa dan aktifitas biologisnya
berupa protein yang ditargetkan. Sayangnya, tidak semua senyawa tanaman
diketahui protein targetnya, sehingga data penelitian yang akan diteliti lebih lanjut
berkurang menjadi sebanyak 74 senyawa aktif yang terdiri dari 55 senyawa dari
keempat tanaman dan 19 senyawa dari masing-masing obat sintetis. Setiap
senyawa (74 senyawa) dapat menargetkan protein yang sama di dalam tubuh
manusia. Diperoleh jumlah protein sebanyak 3059, total koneksi senyawa-protein
sebanyak 4082 dan total protein target unik sebanyak 478.
Berdasarkan data di atas, dilakukan analisis bagi data jejaring farmakologi
yang dinamakan drugCIPHER. Analisis tersebut dilakukan untuk mencari proteinprotein target yang memiliki korelasi terbesar dengan tiap senyawa. Langkah
pertama adalah mencari nilai kedekatan antar 74 senyawa menggunakan koefisien
Tanimoto atau dikenal juga dengan koefisien Jaccard. Di sisi yang lain, dilakukan
juga analisis graf untuk mendapatkan jarak terdekat antar protein yang kemudian
dikonversi menjadi kedekatan antar protein melalui konsep perhitungan
eksponensial. Lalu langkah kedua adalah mencari korelasi antara kedua nilai
kedekatan sampai menghasilkan 100 protein target yang berkorelasi paling tinggi
dengan masing-masing dari 74 senyawa yang dinamakan sebagai skor konkordan
DrugCIPHER. Karena setiap senyawa dapat memiliki korelasi tinggi dengan
protein yang sama, maka penting untuk mendapatkan protein uniknya saja.
Didapatkan sebanyak 1250 protein unik yang semula berjumlah 7400 koneksi
senyawa-protein. Skor konkordan antara 74 senyawa dengan 1250 protein tersebut
kemudian digunakan dalam analisis gerombol simultan antara senyawa dan
protein target. Tujuan utama melakukan analisis gerombol simultan tersebut
adalah melihat penggerombolan senyawa berdasarkan protein targetnya. Senyawa
tanaman yang menggerombol bersama senyawa obat sintetis dicurigai berpotensi
menjadi salah satu komposisi jamu anti-diabetes. Selain itu, analisis tersebut juga
digunakan untuk mendeteksi protein target mana saja yang berperan sebagai
penyebab penyakit diabetes tipe 2.
Selain itu, analisis komponen utama melalui plot dua dan tiga dimensi juga
dilakukan untuk memastikan bahwa hasil yang ditunjukkan melalui analisis
gerombol simultan tidak berbeda jauh. Sedangkan untuk melengkapi analisis
gerombol simultan, dibuat sebuah jejaring kemiripan dari senyawa tanaman yang
memiliki korelasi sangat tinggi terhadap senyawa obat sintetis. Berdasarkan ketiga
analisis tersebut didapat bahwa 2 dari 3 senyawa Bratawali berpotensi sebagai
obat antidiabetes karena menggerombol dan berkorelasi tinggi dengan senyawa
aktif obat antidiabetes, sedangkan 11 dari 44 senyawa Jahe menggerombol
bersama senyawa aktif obat antidiabetes tetapi hanya 5 senyawa Jahe yang
berkorelasi kuat dengan senyawa aktif obat antidiabetes. Sembung dan Pare tidak
menggerombol dengan senyawa aktif obat antidiabetes namun mungkin dapat
berpotensi sebagai tanaman antidiabetes bila data yang digunakan lebih banyak
atau dengan analisis yang lain.
Kata kunci: Diabetes Tipe 2, Jamu, Jejaring farmakologi, DrugCIPHER, Analisis
Gerombol Simultan.
SUMMARY
NURUL QOMARIASIH. Simultaneous Clustering Analysis and Network
Pharmacology in the Determination of Active Compounds of Jamu for Diabetes
Type 2. Supervised by BUDI SUSETYO and FARIT MOCHAMAD AFENDI.
During this time, the manufacture of drug in order to cure a disease is still
target only one specific protein that causes the disease, which of course uses only
one active compound. In fact, besides causing side effects, treatment of a disease
needs a lot of protein targets at once. Thus, a paradigm shifts from "one-targets,
one drug" to “network target, multi-components" becomes popular. This new
paradigm has inspired several studies to produce herbal formulation, while the
concept of herbal formulations requires some active compounds involved. Herbal
formulas studied in an effort to cure the disease of Diabetes Mellitus (DM) Type
II consists of 4 plants: bitter melon (Momordica charantia), Sembung (Blumea
balsamifera), Bratawali (Tinospora crispa), and ginger (Zingiber officinale)
which are based on research from Nurishmaya 2014 and based on herbs that are
being developed at Biopharmaca Research Centre, Bogor, Indonesia. Evaluation
of the compounds associated with Type II diabetes is done by first adding 19
synthetic drugs intended to Type II DM from Drug Bank database. While
compound contained in each plant also searched through the database of
Dictionary of National Products (DNP) ChemnetBase and Take Out "Jamu" of
Knapsack. There are 291 compounds obtained from Jahe, 18 compounds from
plant Bratawali, 41 compounds from Sembung, and 245 compounds from Pare. So
the total compound obtained from the four plants have as many as 595. All of the
compounds whether from plants or from synthetic drugs sought further their
credentials in the form of the chemical structure of the compound and its
biological activities in the form of a targeted protein. Unfortunately, not all plant
compounds have target protein in the body, so that the research data that will be
examined further reduced to as many as 74 active compounds consisting of 55
natural compounds from four plants and 19 respectively compound of synthetic
drugs. Each of the compounds (74 compounds) can target the same protein in the
human body. Total unique protein obtained amounted to 3059 from a total of
compound-protein connections is 4082 and a total of 478 unique protein targets.
Based on the above data, the analysis conducted for the data of network
pharmacology called drugCIPHER. The analysis is performed to find the target
proteins that have the greatest correlation with each compound. The first step is to
find the value of the closeness between 74 compounds using Tanimoto coefficient
or also known as the coefficient of Jaccard. On the other hand, performed well
graph analysis to get the closest distance among proteins which is then converted
to the dissimilarity among proteins through the concept of exponential calculation.
Then the second step is to find the correlation between the two values of the
smilarity until produced 100 highest correlated protein targets with each of the 74
compounds, namely DrugCIPHER concordant scores. Because every compound
can have a high correlation with the same protein, it is important to get a unique
protein. It was obtained 1250 unique protein from 7400 compound-protein
connections. Concordant scores between 74 compounds and 1250 proteins are
then used in the analysis of simultaneous clustering between compounds and
target proteins. The main purpose of the analysis of simultaneous clustering is to
see the compound cluster based on the target protein. Plant compounds which are
clustered together with synthetic drug compounds suspected as the potential one
to become one of the anti-diabetic Jamu composition. In addition, the analysis was
also used to detect any target protein that acts as a cause of type 2 diabetes.
In addition, principal component analysis through two and threedimensional plot is also made to ensure that the results shown by the analysis of
simultaneous clustering does not differ too much. As for the complete analysis of
simultaneous clustering, Similarity Network was made between plant compounds
which have a very high correlation to the synthetic drug compounds. Based on the
three analysis, there are found 2 of the 3 Bratawali compounds as a potential
antidiabetic drugs because they were gathered and correlated with active
compounds of antidiabetic drugs, while 11 of the 44 Jahe compounds clustered
together with the active compound of antidiabetic drugs but only 5 compounds of
Jahe are correlated with the active compounds of drugs antidiabetic. Sembung and
Pare did not gather with the active compound of antidiabetic drugs but may be
potentially as antidiabetic plant when more data are being used or with other
analyzes.
Keywords: Diabetes Type 2, Jamu, Network Pharmacology, DrugCIPHER,
Simultaneous Clustering.
© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB
ANALISIS GEROMBOL SIMULTAN DAN JEJARING
FARMAKOLOGI PADA PENENTUAN SENYAWA AKTIF
JAMU ANTI DIABETES TIPE 2
NURUL QOMARIASIH
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015
Penguji Luar Komisi pada Ujian Tesis: Dr Wisnu Ananta Kusuma, ST MT
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih merupakan bagian dari kajian program riset pertanian pada Program Studi
Statistika, yaitu pengembangan data dan analisis Jamu di Indonesia. Tesis ini
diberi judul Analisis Gerombol Simultan dan Jejaring Farmakologi pada
Penentuan Senyawa Aktif Jamu Anti Diabetes Tipe 2.
Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Budi Susetyo, M.Sc dan
Bapak Dr. Farit Mochamad Afendi, S.Si, M.Si selaku pembimbing atas
kesediaannya membagi ilmu kepada penulis serta dorongan semangat yang tak
terhingga dalam penyusunan tesis ini. Terimakasih kepada Direktorat Jenderal
Pendidikan Tinggi (Dikti) yang telah memberikan beasiswa pascasarjana program
Magister kepada penulis. Ucapan terima kasih juga penulis sampaikan sebesarbesarnya kepada seluruh Dosen Program Studi Statistika IPB yang telah mendidik
penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta
seluruh staf Program Studi Statistika IPB atas bantuan, pelayanan, dan
kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan setinggi-tingginya kepada
Bapak Jumiran dan Mamah Juju Juarsih selaku orang tua atas kasih sayangnya
membesarkan dan senantiasa mendukung di setiap langkah positif yang penulis
jalani, juga kedua adik laki-laki Hadi Johar Prakoso dan Muhammad Surya yang
selalu menyemangati di sela-sela pengerjaan tesis ini. Tak lupa penulis ucapkan
terima kasih kepada teman seperjuangan di riset pertanian Rizal Bakri, M.Si dan
Nur Hilal A. Syahrir, M.Si atas kebersamaannya menghadapi masa-masa terindah
maupun tersulit dalam pencarian data penelitian ini.
Terakhir penulis sampaikan terima kasih sedalam-dalamnya kepada
seluruh mahasiswa Pascasarjana Program Studi Statistika angkatan 2013 atas
kebersamaannya yaitu kenangan bahagia, kenangan sedih, haru, dan pengorbanan
yang kita perjuangkan bersama selama menuntut ilmu di bangku kuliah, serta
semua pihak yang telah banyak membantu dan tak sempat penulis sebutkan satu
per satu.
Semoga karya ilmiah ini dapat bermanfaat.
Bogor, November 2015
Nurul Qomariasih
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
1
1
2
2 TINJAUAN PUSTAKA
Diabetes Melitus (DM) Tipe 2
Jejaring Farmakologi
DrugCIPHER
DrugCIPHER-CS
DrugCIPHER-GR
Unweighted Breadth-First
Nilai konkordan
Analisis Komponen Utama
Analisis Gerombol Simultan
Algoritma Coupled Two-Way Clustering analysis (CTWC)
Metode Penggerombolan
Pseudo-F
Jejaring kemiripan (Similarity Network)
3
3
3
3
4
6
6
6
7
7
8
10
11
12
3 METODE PENELITIAN
Data
Metode analisis
13
13
14
4 HASIL DAN PEMBAHASAN
Jejaring Farmakologi
DrugCIPHER
Analisis komponen utama
Penggerombolan simultan 2 dimensi
Jejaring kemiripan
16
16
16
19
20
23
5 SIMPULAN DAN SARAN
Simpulan
Saran
24
24
24
DAFTAR PUSTAKA
25
LAMPIRAN
26
RIWAYAT HIDUP
38
DAFTAR TABEL
1 Set biner antara dua senyawa
2 Perbandingan antara analisis gerombol klasik dan analisis gerombol
simultan (Charrad dan Ahmed 2011).
3 Algoritma analisis gerombol simultan
4 Daftar pangkalan data publikasi ilmiah
5 Nilai pseudo-F dari berbagai metode dan jumlah gerombol
6 Protein penyebab diabetes yang bersesuaian pada kotak horizontal
4
8
9
13
20
22
DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
Jejaring farmakologi jamu
Dua struktur molekul senyawa
Prinsip drugCIPHER
Metode Breadth First Search
Reorganisasi oleh permutasi dari baris dan kolom (Govaert 1995)
Penggerombolan berhirarki 2 dimensi oleh Parsons et al. (2003)
Jejaring antara senyawa (kuning) dengan protein target (merah)
Kemiripan antar senyawa berdasarkan struktur kimia yang dihitung
melalui koefisien kemiripan Tanimoto
Jejaring interaksi antar protein target
Skor konkordan senyawa dengan protein target
Plot komponen utama
Hasil gerombol simultan Ward.D
Jejaring kemiripan senyawa sintetis dengan senyawa tanaman
3
4
5
6
8
10
16
17
17
18
19
21
23
DAFTAR LAMPIRAN
1 Senyawa sintetis antidiabetes yang telah terdaftar di Food and Drug
Asociation (FDA) dengan sumber basis data Drugbank
2 Senyawa yang berasal dari tanaman yang diduga sebagai antidiabetes
3 Syntax R untuk analisis data
4 Hasil gerombol simultan dengan metode Single Linkage
5 Hasil gerombol simultan dengan metode Complete Linkage
6 Hasil gerombol simultan dengan metode Average Linkage
7 Hasil gerombol simultan dengan metode Ward.D
8 Hasil gerombol simultan dengan metode Ward.D2
26
27
29
33
34
35
36
37
1
1 PENDAHULUAN
Latar Belakang
Seiring perkembangan jaman, kecenderungan orang memilih bahan alami
untuk konsumsi sehari-hari maupun pengobatan semakin berkembang. Bidang
pengobatan juga memiliki pemikiran yang mengacu pada perubahan paradigma
dan menjadi topik yang mulai banyak diteliti saat ini, yakni dari "one drug, onetarget" menjadi “multi-components, network target". "one drug, one-target"
mengacu kepada obat kimia sintetis yang berisi satu senyawa aktif untuk
mengobati satu keluhan penyakit tertentu. Namun terkadang obat seperti ini
menimbulkan efek samping. Sedangkan “multi-components, network target"
diterapkan salah satunya pada jamu yang memiliki konsep keterlibatan beberapa
senyawa aktif untuk menargetkan beberapa protein penyebab penyakit.
Langkah pertama dalam mengidentifikasi target untuk membuat obat kimia
sintetis dalam bidang farmasi yaitu penemuan obat berdasarkan target dimulai
dengan mengidentifikasi fungsi dari target yang mungkin dan perananya dalam
penyakit. Langkah kedua adalah validasi target, dalam langkah ini diperlukan
demonstrasi bahwa molekul target secara langsung terlibat dalam proses penyakit.
Langkah selanjutnya adalah identifikasi senyawa aktif yang didefinisikan sebagai
molekul yang menunjukkan aktifitas biologis yang signifikan dalam uji skrining,
yakni materi baru yang menghubungkan struktur kimia untuk modulasi target.
Hingga langkah terakhir, yaitu langkah ke-11 yang melibatkan pengujian klinikal
atas konsep obat yang telah dibuat. Berdasarkan serangkaian langkah tersebut,
maka akan didapatkan molekul target (protein) yang berperan terhadap penyebab
suatu penyakit tertentu dan senyawa aktif obat sintetis yang berfungsi untuk
menargetkan molekul tersebut. Fungsi dari senyawa aktif adalah mengunci protein
target dalam rangka penyembuhan suatu penyakit, atau keduanya diistilahkan
sebagai “lock and key”.
Sementara itu, dalam rangka pembuatan jamu yang melibatkan senyawa
aktif tanaman, pendekatan statistika berbasis komputasi dapat dimanfaatkan untuk
mendapatkan senyawa yang berperan aktif mengobati suatu penyakit tertentu
berdasarkan protein targetnya. Hasil penelitian Nurishmaya (2014) serta
berdasarkan ramuan jamu yang sedang dikembangkan di Pusat Studi Biofarmaka,
Bogor, terdapat empat tanaman obat yang berkhasiat mengobati penyakit Diabetes
Melitus (DM) Tipe II yaitu Pare (Momordica charantia), Sembung (Blumea
balsamifera), Bratawali (Tinospora crispa), dan Jahe (Zingiber officinale).
Berdasarkan penelitian tersebut, maka akan diterapkan metode statistika
penggerombolan berhirarki dua dimensi berdasarkan skor konkordan antara
hubungan kedekatan antar senyawa dengan hubungan kedekatan senyawa-protein
target untuk menghasilkan senyawa aktif tanaman obat yang berperan sebagai
antidiabetes. Hubungan kedekatan antar senyawa diukur berdasarkan kesamaan
struktur senyawa kimiawi menggunakan koefisien Tanimoto berbasis data biner
dengan kriteria fingerprint Klekota-Roth (KR). Sedangkan hubungan kedekatan
senyawa-protein target dihitung dengan menggunakan konsep shortest path dari
teori graph dan konsep drugCIPHER untuk mencari 100 protein target teratas
2
untuk masing-masing senyawa. Pengelompokkan tersebut melibatkan senyawa
aktif obat kimia yang telah disetujui oleh Food and Drug Administration (FDA)
Amerika Serikat dan sudah diketahui fungsinya sebagai obat antidiabetes,
sehingga akan didapat senyawa aktif tanaman obat yang memiliki kemiripan
dengan senyawa obat kimia antidiabetes berdasarkan protein target. Metode
pengelompokkan yang dipakai adalah metode complete linkage, single linkage,
ward.D, ward.D2, dan average linkage. Beberapa metode tersebut akan dievaluasi
menggunakan Pseudo-F untuk menentukan metode mana yang paling baik
digunakan dan berapa gerombol yang sebaiknya diterapkan. Serta yang terakhir
akan divisualisaskan jejaring antara senyawa aktif obat kimia sintetis dan senyawa
aktif tanaman obat berdasarkan kesamaan target menggunakan Cytoscape. Hasil
akhir dari analisis gerombol dua dimensi antara senyawa (senyawa aktif tanaman
obat dan senyawa aktif obat sintetis) dengan protein target yaitu menghasilkan
senyawa aktif tanaman yang memiliki kemiripan protein target dengan senyawa
aktif obat sintetis antidiabetes.
Tujuan Penelitian
Tujuan dari penelitian ini yaitu penentuan senyawa aktif tanaman obat
diabetes tipe 2 dengan metode jejaring farmakologi dan analisis gerombol
simultan.
3
2 TINJAUAN PUSTAKA
Diabetes Melitus (DM) Tipe 2
Diabetes adalah penyakit kronis yang terjadi baik ketika pankreas tidak
menghasilkan cukup insulin atau ketika tubuh tidak dapat secara efektif
menggunakan insulin yang dihasilkan. Insulin merupakan hormon yang mengatur
gula darah (World Health Organization 1999). Efek jangka panjang dari Diabetes
adalah kerusakan serius pada sistem tubuh, terutama syaraf dan pembuluh darah.
Sebagian besar DM Tipe II merupakan hasil dari kelebihan berat badan dan
merupakan 90% dari penderita diabetes seluruh dunia.
Jejaring Farmakologi
Berdasarkan kemajuan dalam biologi kimia dan ilmu jaringan, jejaring
farmakologi adalah pendekatan baru khusus untuk penemuan obat. Pendekatan ini
melibatkan penerapan analisis jaringan untuk menentukan set protein yang paling
penting dalam penyakit, dan kemudian biologi kimia untuk mengidentifikasi
molekul atau senyawa yang mampu menargetkan set protein. Jejaring farmakologi
berbeda dari pendekatan obat konvensional, yang umumnya didasarkan pada
penargetan yang sangat spesifik dari protein tunggal (Zhang Gui-biao et al 2013)
Jamu
Jamu 1
Tanaman
Senyawa
Tanaman 1
Senyawa 1
Protein 1
Tanaman 2
Senyawa 2
Protein 2
Tanaman 3
Jam
Tanaman 4
u2
Senyawa 3
Protein 3
Senyawa 4
Protein 4
Senyawa 5
Protein 5
Jamu 1
Protein target
Penyakit
Penyakit
Protein 6
Gambar 1. Jejaring farmakologi jamu
Jejaring farmakologi sebuah jamu terdiri dari gabungan beberapa tanaman.
Setiap tanaman mengandung beberapa senyawa dan masing-masing senyawa
mampu menargetkan beberapa protein dalam tubuh. Sementara itu, suatu penyakit
juga diakibatkan oleh aktivitas menyimpang beberapa protein dalam tubuh.
DrugCIPHER
Langkah pertama dalam menganalisis data jaringan adalah dengan metode
DrugCIPHER. Metode ini merupakan ulasan tentang pengetahuan mengenai
penggunaan farmasi (Wotring dan Virginia 2012). Lebih fokus Zhao dan Li
(2010) mengartikan metode ini sebagai sebuah kerangka kerja komputasi berbasis
1
5
Ruang farmakologi
Kemiripan struktur kimia obat
d1
d2
d3
(CS)
d4
Kaitan ruang farmakologi dan
ruang genomik (GR)
A
Ruang
Genomik
Kedekatan
senyawa-protein
d
d1
d2 d3 . . . . . dn
p
C
C
Jaringan Interaksi protein-protein
Senyawa
Protein target
B
Gambar 3. Prinsip drugCIPHER.
Bagian A pada prinsip drugCIPHER merupakan ruang farmakologi yang
meliputi kemiripan efek terapi obat (TS) dan kemiripan struktur kimiawa obat
(CS) Bagian B menunjukkan jaringan interaksi antar protein (PPI) (garis hitam
solid) yang merepresentasikan informasi pada ruang genomik. Bersama dengan
interaksi senyawa- protein target (haris hitam putus-putus), hubungan kedekatan
(garis cokelat putus-putus) didefinisikan sebagai asosiasi senyawa dengan protein
tertentu. Bagian C menunjukkan senyawa d dan protein p, dua vektor kemiripan d
di dalam ruang farmakologi dan satu vektor kedekatan p adalah φp.
Pendekatan fingerprint biner merupakan salah satu metode evaluasi
kemiripan. Fingerprint biner dari dua molekul (Tabel 1) dapat dibandingkan
untuk dikuantifikasi jaraknya menggunakan koefisien kemiripan Tanimoto yaitu:
dari
adalah suatu molekul tertentu,
dan
merupakan representasi biner
dan ,
merupakan jarak Euclid (Sharma dan Pranit 2011)
DrugCIPHER-GR
6
Asosiasi ruang farmakologi dengan ruang genomik mendefinisikan
kedekatan antara protein p dengan senyawa d pada basis jaringan PPI yaitu:
merupakan protein target yang dituju oleh senyawa .
merupakan
jarak terpendek antara
dan
pada jaringan PPI pada ruang genomik
berdasarkan teori graf algoritme Dijktra.
digunakan untuk mengkonversi
jarak protein-protein menjadi kedekatan protein-protein. Persamaan ini
menunjukkan bahwa kedekatan antara obat
dan protein
sama dengan
penjumlahan dari kedekatan antara protein dengan semua protein target dari
obat . Jika jarak dua protein sangat jauh, didefiniskan
. Sedangkan
jaringan PPI merupakan data interaksi biner antar protein dalam tubuh manusia.
Unweighted Breadth-First
Breadth-first search (BFS) adalah graf dasar yang sering digunakan sebagai
blok-blok pembangun pada banyak algoritma graf yang lebih komplek (Beamer et
al. 2013). Metode ini akan mengunjungi terlebih dahulu semua node pada level n
sebelum mengunjungi node-node pada level n+1. Pencarian dimulai dari node
akar terus ke level ke-1 dari kiri ke kanan (Gambar 4).
Gambar 4. Metode Breadth First Search (Indrawati et al. 2011).
Keuntungan pertama dari metode ini yaitu tidak akan menemui jalan buntu.
Keuntungan kedua adalah jika ada satu solusi maka breadth-first search akan
menemukannya, namun jika ada lebih dari satu solusi, maka solusi minimum akan
ditemukan. Selain keuntungan, metode ini juga memiliki kekurangan, metode ini
akan menyimpan semua node dalam satu pohon, sehingga membutuhkan memori
yang cukup banyak. Waktu pengerjaannya pun cukup lama, karena akan menguji
n level untuk mendapatkan solusi pada level ke-(n+1).
Nilai konkordan
Nilai konkordan yang akan digunakan sebagai
penggerombolan berhirarki dua dimensi didefinisikan sebagai:
nilai
dalam
7
Nilai konkordan ini menjelaskan derajat kontribusi dari senyawa dengan
pada protein pada persamaan sebebelumnya. Nilai ini
vektor kedekatan
memiliki rentang nilai -1 hingga 1. Ketika hubungan antara
dengan
positif, semakin dekat kemiripan senyawa i dengan senyawa j, maka senyawa i
akan semakin menargetkan protein target dari senyawa j.
Analisis Komponen Utama
Analisis komponen utama banyak digunakan pada berbagai bidang ilmu.
Tujuan utama dari analisis komponen utama adalah mereduksi dimensi data besar
dan saling berkorelasi menjadi dimensi yang lebih kecil dan saling bebas. Peubah
baru ini merupakan kombinasi linier dari peubah asal dan disebut dengan
komponen utama (Principal Component). Komponen utama ini dapat dibentuk
berdasarkan matriks ragam peragam ataupun matriks korelasi.
Sebelum analisis penggerombolan simultan dua dimensi, data nilai
konkordan dilihat penyebarannya pada plot skor komponen utama. Hal ini untuk
melihat penyebaran titik-titik senyawa tanaman terhadap senyawa obat sintetis
setelah jumlah peubah (protein) direduksi menjadi beberapa komponen.
Penentuan jumlah komponen yang diambil dilihat melalui scree plot.
Pembentukkan komponen utama berdasarkan matriks ragam peragam dapat
merupakan
dilakukan jika satuan pengukuran setiap peubah sama. Misalkan
, dengan pasangan akar ciri dan vektor
matriks ragam peragam
ciri
,
dengan
maka
komponen utama ke-i didefinisikan sebagai berikut:
Selain itu, nilai dari proporsi kontribusi keragaman komponen utama ke-i ,
yaitu:
(Johnson dan Wichern 2007).
Analisis Gerombol Simultan
Penggerombolan simultan biasa disebut biclustering, co-clustering, 2-way
clustering atau block clustering. Tujuannya adalah untuk menemukan submatrik,
dimana subgrup baris dan subgrup kolom memperlihatkan korelasi tinggi. Metode
ini banyak diaplikasikan pada bidang bioinformasi, web-mining, text mining dan
analisis social network (Charrad dan Ahmed 2011). Perbandingan dari kedua
metode penggerombolan dijelaskan pada Tabel 2.
Penelitian mengenai penggerombolan simultan dengan menetapkan sebuah
permasalahan untuk menemukan dua partisi simultan dengan cara perhitungan
matriks telah ditemukan sejak 1960-an, penelitian tersebut juga mendefinisikan
kriteria untuk pengoptimuman, namun tanpa mengusulkan metode apapun untuk
memecahkan masalah ini.
8
Tabel 2. Perbandingan antara analisis gerombol klasik dan analisis gerombol
simultan (Charrad dan Ahmed 2011).
Analisis gerombol klasik
Diaplikasikan pada baris atau kolom
dari data matriks secara terpisah
model global
Menghasilkan gerombol baris atau
gerombol kolom
Setiap objek pada gerombol objek
didefinisikan menggunakan semua
peubah. Setiap peubah pada gerombol
peubah mencirikan semua objek.
Analisis Gerombol Simultan
Menampilkan penggerombolan pada
dua dimensi secara simultan.
model lokal
Mencari blok dari baris dan kolom
yang saling berhubungan.
Setiap objek di dalam bicluster diplih
hanya menggunakan subset peubah
dan setiap peubah di dalam bicluster
dipilih hanya menggunakan subset
dari objek
Penelitian selanjutnya pada tahun 1970-an dilakukan pemilhan set untuk
pengklasifikasian. Pendekatan iteratif pun diusulkan dimana objek dan peubah
dapat diklasifikasikan sampai kedua partisi menjadi “saling harmonis” (Gambar 5).
Gambar 5. Reorganisasi oleh permutasi dari baris dan kolom (Govaert 1995)
Konteks analisis gerombol simultan bersifat eksploratif dan untuk
memenuhi beberapa tujuan berikut:
Mengusulkan ringkasan hasil yang sederhana dan mudah dipahami.
Memungkinkan penggunaan metode faktorial dan metode pengelompokan
secara bersama-sama.
Mendapatkan metode pengelompokan klasik ketika hanya mencoba
menggerombolkan satu dari dua set data.
Algoritma Coupled Two-Way Clustering analysis (CTWC)
Terdapat beberapa pilihan algoritma dalam melakukan analisis gerombol
simultan berdasarkan tipe data, pendekatan dan penerapan (Tabel 3). Salah
satunya adalah Coupled Two-Way Clustering analysis (CTWC). Sama seperti
prinsip penggerombolan simultan, algoritma ini mengasumsikan bahwa hanya ada
sebagian kecil gen berpartisipasi dalam proses seluler yang berlangsung pada
subset sampel. Memfokuskan pada subset yang kecil berarti menurunkan noise
yang disebabkan oleh sampel dari gen lainnya. CTWC akan menghasilkan
9
pasangan subset objek dan fitur melalui proses iteratif dengan menguji hanya pada
submatriks baris (atau kolom) yang dimiliki oleh gen (atau sampel) yang telah
teridentifikasi pada iterasi sebelumnya.
Proses diawali dengan matriks penuh yaitu set semua gen (g0) dan semua
sampel (s0) yang digunakan sebagai fitur dan objek untuk dilakukan standard twoway clustering. Gerombol stabil dari gen dan sampel pada langkah pertama
dinotasikan sebagai g1 dan s1. Setiap pasangan (gin dan sjm) akan dilakukan twoway clustering. Hasil gerombol stabil dari gen (atau sampel) dinotasikan gk2 atau
sl2. Setiap gerombol disimpan di dalam satu dari dua “gerombol stabil register”,
gerombol gen di register G dan gerombol sampel di S. Bersama dengan gerombol
baru, sebuah pointer dipasang untuk mengidentifikasi gerombol sebelumnya (gin
dan sjm) yang digunakan sebagai set objek dan fitur dalam proses penggerombolan
yang dihasilkan. Langkah tersebut terus berulang menggunakan pasangan semua
gerombol yang telah ditemukan sebelumnya. Proses dihentikan ketika telah sesuai
dengan posisi gerombol semula.
Tabel 3. Algoritma analisis gerombol simultan.
Algoritma
Two-way
splitting
CROEUC
CROKI2
CROBIN
CTWC
Penerapan
Pendekatan
Lainnya
Lainnya
Lainnya
Lainnya
Bioinformatika
Plaid Models
δ-biclusters
δ -ks patterns
ITWC
DCC
Bioinformatika
Bioinformatika
Bioinformatika
Bioinformatika
Bioinformatika
OPSM
Bioinformatika
SAMBA
FLOC
Bioinformatika
Bioinformatika
Spectral
ITWC
BGSP
Bioinformatika
Text Mining
Text Mining
cHawk
Bioinformatika
Variance Minimization
Two-way clustering
Two-way clustering
Two-way clustering
Two-way clustering
Probabilistic and
generative
Variance Minimization
Variance Minimization
Two-way clustering
Two-way clustering
Motif and pattern
recognition
Probabilistic and
generative
Variance Minimization
Motif and pattern
recognition
Bi-partite Graph
Bi-partite Graph
Probabilistic and
generative
Block-EM
Lainnya
Two-way clustering
Block-CEM
Lainnya
Two-way clustering
Cemcroki2
Lainnya
Two-way clustering
Tipe data
Kontinu
Kontinu
Kategori
Biner
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kategori
Kontinu
biner
Kontinu
biner
Kategori
10
Sebagai gambaran mengenai hasil analisis gerombol simultan, Parsons et
al. (2003) melakukan analisis gerombol simultan berhirarki dua-dimensi dari
senyawa dan gen target yang ditampilkan seperti pada Gambar 6. Interaksi
senyawa-gen target diwakili dengan warna merah. Interaksi gen diplot pada
sumbu horisontal, dengan pohon gerombol gen di atas. Senyawa diplot pada
sumbu vertikal, dengan pohon gerombol di sisi kiri plot. Senyawa yang
mengelompok dengan gen target dan jalur hubungan keduanya ditandai oleh
warna yang sama.
Gambar 6. Penggerombolan berhirarki 2 dimensi oleh Parsons et al. (2003)
Metode penggerombolan
Berbagai metode penggerombolan dapat diterapkan pada kerangka CTWC.
Namun metode paling baik untuk menganalisis ekspresi gen harus memiliki
beberapa sifat-sifat yaitu jumlah gerombol tidak ditentukan sebelumnya (seperti
SOMS dan K-means) melainkan melalui dendogram, stabil terhadap noise,
memiliki mekanisme untuk mengidentifikasi kestabilan dan kekekaran gerombol,
serta dapat mengidentifikasi kepadatan dari set data (Getz et al. 2000). Beberapa
metode dasar yang akan diterapkan pada penelitian ini terdiri dari metode
penggerombolan agglomerative (metode penggabungan) yaitu linkage methods
seperti single linkage (jarak minimum atau tetangga terdekat), complete linkage
(jarak terjauh atau tetangga terjauh), dan average linkage (jarak rata-rata). Selain
itu juga menggunakan metode Ward yang meminimumkan “loss of information”
dari gabungan dua kelompok data, yaitu didefinisikan sebagai peningkatan kriteria
jumlah kuadrat galat (ESS).
Penyelesaian metode single linkage mulanya adalah menentukan jarak
lalu gabung dua objek terdekat U dan V dalam satu gerombol
terkecil
(UV). Jarak UV dengan gerombol lain W yaitu:
.
dan
masing-masing merupakan jarak antara tetangga terdekat
gerombol U-W dan V-W. Serupa pada single linkage, complete linkage berbeda
pada penentuan jarak UV dengan gerombol lain W yaitu:
.
11
Metode average linkage, jarak UV dengan gerombol lain W ditentukan
sebagai:
adalah jarak antara objek i dalam gerombol (UV) dan objek k pada
gerombol W,
dan
masing-masing adalah jumlah objek pada gerombol
UV dan gerombol W. Sedangkan akan ada dua algoritma metode Ward yang
digunakan yaitu Ward.D dan Ward.D2. Keduanya memiliki konsep yang sama
yaitu meminimumkan perubahan ragam atau jumlah kuadrat galat. Fion Murtagh
tahun 1985 menyatakan formula untuk memperbaharui gerombol pada Ward.D
yaitu:
berdasarkan jarak kuadrat Euclidean antar objek, maka
sedangkan
. Pada Ward.D2, formula
memperbaharui gerombol yaitu:
untuk
seperti pada Ward.D, berdasarkan jarak kuadrat Euclidean antar objek, maka
sedangkan
.
Semua metode di atas dicobakan untuk menggerombolkan senyawa dan
protein target berdasarkan nilai konkordan antara drugCIPHER-CS dan vektor
. Lalu masing-masing metode serta jumlah
kedekatan senyawa-protein target
gerombol yang terbentuk dievaluasi menggunakan pseudo-F. Pseudo-F
merupakan analisis untuk mendapatkan suatu nilai perbandingan keragaman antar
gerombol dengan keragaman di dalam gerombol.
Pseudo-F
Calinski dan Harabasz (1974) membuat suatu index sebagai indikasi
terhadap jumlah gerombol yang benar. Indeks Calinski dan Harabasz yang disebut
Variance Ratio Criterion (VRC) didefinisikan sebagai:
kriteria ini serupa dengan uji statistik F pada analisis univariat, dimana n
dan k masing-masing adalah jumlah total observasi dan jumlah gerombol, WGSS
merupakan jumlah kuadrat dalam gerombol yang didefinisikan sebagai:
sedangkan BGSS merupakan jumlah kuadrat antar gerombol yaitu:
;
12
Tujuan indeks tersebut yaitu meminimumkan WGSS dan memaksimumkan
BGSS, sehingga semakin tinggi nilai suatu index mengindikasikan jumlah
gerombol yang lebih baik. Hasil penggerombolan terbaik berdasarkan Pseudo-F
digunakan untuk mendapatkan jejaring kemiripan antar senyawa yang merupakan
langkah akhir dari analisis penentuan senyawa aktif tanaman untuk antidiabetes.
Jejaring kemiripan (Similarity Network)
Dua objek yang benar-benar mirip atau identik yaitu ketika sjj=1
sedangkan ketidakmiripan ditunjukkan sjj=0. Kemiripan merupakan kebalikan dari
ketidakmiripan yang dihitung pada selang [0,1], sehingga kemiripan dinotasikan
dimana
merupakan jarak Euclid antar objek (Gower dan
sebagai
Legendre 1986).
dapat berupa nilai korelasi antar objek untuk selang [-1,1].
Koefisien kemiripan antara dua objek yaitu senyawa tanaman dengan senyawa
sintetis antidiabetes ditetapkan nilai cutoff > 0,5 (Li Huiying et al, 2013). Jaringan
kemiripan (similarity network) senyawa tanaman dengan obat sintetis antidiabetes
(berdasarkan profil target>0,5) divisualisasi menggunakan network visualization
software CytoScape 2,8.
13
3 METODE PENELITIAN
Data
Data yang digunakan merupakan daftar bahan aktif ramuan jamu yang
sedang dikembangkan di Pusat Studi Biofarmaka untuk pengobatan diabetes
mellitus tipe II yang terdiri dari Pare (Momordica charantia), Sembung (Blumea
balsamifera), Bratawali (Tinospora crispa), dan Jahe (Zingiber officinale). Daftar
lebih rinci mengenai bahan aktif dari tanaman-tanaman tersebut dicari lebih lanjut
melalui berbagai publikasi ilmiah yang dilakukan selama bulan Januari hingga
Mei 2015 seperti tertera pada Tabel 4.
Tabel 4. Daftar pangkalan data publikasi ilmiah
Data
Senyawa
Pangkalan
Data
Take Out
“Jamu” of
Knapsack
Informasi yang diperoleh
dari pangkalan data
Daftar senyawa dari
tanaman Jahe, Pare,
Sembung, dan Bratawali.
(Afendi et al. 2012,
Running WE 1993)
DrugBank
Database
Senyawa obat kimia
sintetis antidiabetes
(Wishart et al. 2008)
Daftar senyawa (tanaman
Dari jumlah total 595
& sintetis) yang memliki
senyawa tanaman,
aktifitas biologis serta
terdapat 288 senyawa
informasi lebih rinci
unik dengan informasi
seperti Simplified
yang lengkap. Sedangkan
molecular input line
semua senyawa obat
entry system (Smiles)
sintetis memiliki
dan PubChem ID (CID).
informasi yang lengkap.
(Wang et al. 2009)
Daftar kriteria fingerprint Terdapat sebanyak 4860
(Klekota dan Roth 2008)
substruktur molekul
senyawa.
Bahan
aktif
Pubchem
Fingerprint
Klekota
Roth
(KR)
Interaksi
antar
protein
target
Konversi
gi
number
ChemDes
Human
Protein
Reference
Database
biological
DataBase
network
Interaksi biner antar
protein target dalam
tubuh.
(Goel et al. 2012)
Identitas protein dalam
bentuk selain gi number.
(Mudunuri et al.2009)
Hasil penelusuran data
291 senyawa Jahe, 18
senyawa Bratawali, 41
senyawa Sembung, dan
245 senyawa Pare. Total
jumlah senyawa
sebanyak 595
19 senyawa aktif obat
sintetis anti-diabetes.
39.240 interaksi biner
antar 9.673 protein unik.
505 HPRD ID untuk
setiap protein target.
14
Metode Analisis
Tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut:
I. Pendugaan protein target
Tahap ini menggunakan metode drugCIPHER dengan langkah-langkah
sebagai berikut (Zhao dan Li 2010):
1. Mendapatkan matriks drugCIPHER-CS
a. Menggabungkan data 55 senyawa tanaman (Lampiran 2) dan 19
senyawa obat (Lampiran 1) menjadi total keseluruhan 74 senyawa
dilengkapi dengan Simplified Molecular-Input Line-Entry System
(Smiles).
b. Membuat set biner sepanjang 4860 bit untuk masing-masing
senyawa berdasarkan fingerprint KR.
c. Menghitung nilai kemiripan struktur molekul antar senyawa
menggunakan koefisien Tanimoto (Sharma dan Pranit 2011):
2.
3.
sehingga akan dihasilkan matriks kemiripan senyawa (0