adi setiawan unbraw 2

PENENTUAN BESARNYA PENGARUH FAKTOR GENETIK
TERHADAP SIFAT FENOTIP DENGAN
METODE PASANGAN KEMBAR
A. Setiawan
Program Studi Matematika, Fakultas Sains dan Matematika
Universitas Kristen Satya Wacana Salatiga, Indonesia
Abstract. Twins that have a particular trait can be used to determine the genetic
contribution to the trait. In this paper it is described a simulation study to
determine the genetic factor. If the data of particular trait in MZ twin and DZ
twin are available then by using the moment method and the maximum likelihood
method, the genetic contribution can be determined.
Key-words: twin, genetic contribution, maximum likelihood method, moment
method.

1 Pendahuluan
Kumpulan pasangan kembar dapat digunakan untuk mengetahui
besarnya pengaruh faktor genetik terhadap sifat fenotip (trait) tertentu yang
menjadi perhatian dengan membandingkan similaritas pada pasangan kembar MZ
(monozygotic) dan DZ (dizygotic). Dalam makalah ini akan dijelaskan tentang
penentuan besarnya pengaruh faktor genetik terhadap sifat fenotip dengan metode
pasangan kembar. Simulasi digunakan untuk memberikan gambaran bagaimana

estimasi dilakukan jika dimiliki data kategori tentang suatu trait pada sejumlah
pasangan kembar MZ dan pasangan kembar DZ.

2 Dasar teori
Misalkan suatu trait kuantitatif X dari suatu individu yang dipilih secara random
dari suatu populasi. Kita menganggap bahwa trait kuantitatif X mengikuti model
aditif
X = f(G) + F,
dengan f(G) dan F faktor genetik dan faktor lingkungan (van der Vaart, 2006).
Dalam hal ini dianggap bahwa G dan F saling bebas. Misalkan dianggap 2
individu masing-masing dengan trait X1 dan X2. Model yang biasa digunakan
adalah
X1 = f(G1) + C + E1,
X2 = f(G2) + C + E2,
dengan (G1, G2) , C, E1, E2 saling bebas dan E1, E2 berdistribusi identik. Dalam
hal ini C adalah faktor lingkungan bersama dan E adalah faktor lingkungan bukan
bersama. Faktor genetik dapat didekomposisi lebih lanjut sebagai
f(Gi) = Ai + Di,
dengan Ai pengaruh faktor genetik, Di pengaruh faktor lingkungan dan Ai, Di
saling bebas. Dalam hal ini distribusi bersama dari (A1, A2) dan (D1, D2)

menyatakan hubungan genetik antara dua individu tersebut. Model ini dikenal

A. SETIAWAN

dengan model ADCE sedangkan bila dianggap faktor dominansi tidak muncul
dinamakan model ACE.
Misalkan suatu trait dengan dekomposisi X = f(G) + F, heritabilitas
didefinisikan sebagai proporsi dari variansi yang ditentukan secara genetik dan
dapat dinyatakan sebagai

V ( f (G ))
V ( f (G ))

,
V ( X ) V ( f (G ))  V ( F )

yang dapat diestimasi berdasarkan dari pengamatan di bawah beberapa anggapan.
Heritabilitas dapat dipandang sebagai besarnya pengaruh faktor genetik terhadap
sifat fenotip. Dalam model ADCE dan di bawah anggapan kesetimbangan
perkawinan random, variansi dan kovariansi dari trait X1 dan X2 antara dua

saudara dapat didekomposisi menjadi

V ( X 1 ) V ( X 2 )   2   2 A   2 D   2C   2 E ,
Cov( X 1 , X 2 )  2  2 A    2 D   2 C .
 2 A ,  2 D ,  2 C ,  2 E masing-masing adalah variansi

Dalam hal ini
aditif,
variansi dominansi, variansi lingkungan bersama dan variansi lingkungan bukan
bersama sedangkan  dan  masing-masing dinamakan koefisien kinship dan
koefisien fraternity yang tergantung pada hubungan antara dua saudara tersebut
(lihat Lange, 2002). Misalkan dimiliki sampel random dari trait antara saudara
maka ruas kanan dapat diestimasi berdasarkan data pengamatan sehingga
parameter yang tidak diketahui dapat diperoleh dengan menyelesaikan sistem
persamaan linear tersebut. Untuk itu diperlukan paling sedikit 4 persamaan
supaya dapat diidentifikasi. Hal ini dapat dicapai dengan melakukan sampling dari
berbagai macam individu yang mempunyai hubungan saudara sehingga memiliki
pasangan (,Δ) yang berbeda. Di samping itu dapat juga dilakukan pengurangan
banyaknya parameter misalkan dengan menganggap variansi dominansi bernilai
nol.

Pasangan kembar MZ dan pasangan kembar DZ dapat dibandingkan
dalam semua hal kecuali hubungan genetik. Khususnya variansi lingkungan
untuk pasangan kembar MZ dan pasangan kembar DZ dapat dimodelkan dengan
parameter yang sama. Pasangan kembar MZ merupakan pasangan kembar yang
identik secara genetik dan mempunyai  = ½ dan Δ = 1 sedangkan pasangan
kembar DZ mempunyai  = 1/4 dan Δ = 1/4 . Misalkan dimiliki sampel random
untuk pasangan kembar MZ dan pasangan kembar DZ, koefisien korelasi ρMZ dan
ρDZ antara trait mereka dapat diestimasi dengan koefisien korelasi sampel.
Koefisien korelasi ρMZ dan ρDZ memenuhi persamaan

 2 A  2D  2E
,
2
0,5  2 A  0,25  2 D   2 E

2

 MZ 
 DZ


.

Jika dianggap bahwa variansi dominasi 2D bernilai nol maka persamaan tersebut
dapat diselesaikan sehingga diperoleh pengaruh faktor genetik

PENENTUAN BESARNYA PENGARUH FAKTOR GENETIK

 2A
 2 (  MZ   DZ )
2

(1)

yang dapat diestimasi dengan mengganti koefisien korelasi ρMZ dan ρDZ dengan
koefisien korelasi sampel. Akibatnya pengaruh faktor lingkungan bersama dan
pengaruh faktor lingkungan bukan bersama masing-masing dapat diestimasi
dengan

dan


 2C
 2  DZ   MZ
2

 2C
 2 A  2C



1
2
2 2

.

Metode ini dapat digunakan asalkan 1 < ρMZ /ρDZ < 2 dan dikenal dengan nama
metode momen. Untuk informasi lebih lanjut lihat Sham (1998).
Di samping metode momen dapat juga digunakan metode maximum
likelihood. Misalkan faktor lingkungan bersama C dan faktor lingkungan bukan
bersama E1, E2 mempunyai distribusi normal. Akibatnya X1 dan X2 mempunyai

distribusi bivariat normal dengan vektor mean dan matriks kovariansi berbentuk

dan


 


1
 2 



.
1 

Koefisien korelasi untuk pasangan kembar MZ dan pasangan kembar DZ masingmasing adalah dan dengan anggapan 2D = 0 akan memenuhi

 2 A   2E
 MZ 

,
2
0,5  2 A   2 E
 DZ 
2

.

Hal itu berarti bahwa ruang parameter yang dimiliki adalah
 = { ( , 2, 2A, 2C ) |   R , 2A, 2C  0, 2 - 2A - 2C  0 }.
Parameter-parameter tersebut dapat diestimasi dengan menggunakan metode
maximum likelihood.
Dekomposisi variansi yang telah dijelaskan di atas dapat diterapkan untuk
trait kuantitatif dan trait kualitatif/trait kategori (categorical trait). Trait kategori
dianggap sebagai suatu trait yang dipengaruhi oleh trait yang tidak teramati
(unobservable trait) yang dinamakan liabilitas (liability). Trait yang teramati
(observable trait) seperti berpenyakit tertentu atau tidak, akan berkaitan dengan
suatu liabilitas yang melampaui ambang batas (threshold).
Misalkan dianggap terdapat suatu variable random X yang terkait dengan Y
yaitu status berpenyakit atau tidaknya seseorang dengan menggunakan model

ambang batas

A. SETIAWAN
Y = 0 jika X  b,
= 1 jika X > b,
dengan b merupakan parameter ambang batas. Hal itu berarti bahwa individu
yang berpenyakit jika liabilitas X melampaui b. Karena variabel random X tidak
teramati maka tidak mungkin untuk mengidentifikasi mean dan variansinya
sehingga tanpa meninggalkan sifat keumuman masing-masing dapat dibuat 0
dan 1. Untuk mengestimasi heribilitas dari suatu trait biner (binary trait) dari
data trait (Y1, Y2) pada pasangan kembar, kita mengkaitkan Y1 dan Y2 dengan
liabilitas X1 dan X2 melalui model ambang batas tersebut di atas dan model
pasangan liabilitas (X1, X2) melalui model ACE. Heritabilitas dari trait biner
kemudian dapat didefinisikan sebagai proporsi variansi genetik dalam liabilitas.
Distribusi dari data pengamatan diberikan oleh probabilitas
P( Y1 = y1, Y2 = y2)
untuk y1, y2  { 0, 1} dan dihubungkan dengan distribusi liabilitas melalui
persamaan
P( Y1 = 0, Y2 = 0) = P(X1  b, X2  b ) =


P( Y1 = 0, Y2 = 1) = P(X1  b, X2 > b ) =
P( Y1 = 1, Y2 = 0) = P(X1 > b, X2  b ) =
P( Y1 = 1, Y2 = 1) = P(X1 > b, X2 > b ) =

 
b



b



 
b



 b


 


b

b



b

b

 




f ( x1 , x2 ) dx1 dx2 ,
f ( x1 , x2 ) dx1 dx2 ,
f ( x1 , x2 ) dx1 dx2 ,

f ( x1 , x2 ) dx1 dx2 ,

dengan f adalah fungsi densitas (density function) normal bivariat yang
diparametrisasi dengan (2A, 2C ) dan memberikan parameter  = (b, 2A, 2C )
sebagai model untuk pengamatan (Y1, Y2). Parameter-parameter tersebut dapat
diestimasi dengan menggunakan metode maximum likelihood. Metode ini
diimplementasikan pada paket program Mx yang akan digunakan dalam makalah
ini (Neale & Cardon, 1992).

3 Metode
Simulasi dilakukan untuk dengan cara membangkitkan sampel random dari
distribusi normal bivariat berdasarkan model ACE dengan rumus :

 X 1   A1   C   E1 
          
 X 2   A2   C   E 2 

dengan

  0   2 A  2 A  
 A1 

  ~ N 2    ,  2
 0  A  2 A 
 A2 




 0   2 A
 A1 
  ~ N 2    , 
  0  0,5  2 A
 A2 



pada pasangan kembar MZ dan

0,5  2 A  

 2 A  

PENENTUAN BESARNYA PENGARUH FAKTOR GENETIK

  0   2 C
C 
  ~ N 2    ,  2
0  C
C 



pada pasangan kembar DZ, sedangkan

  0   2 E
 E1 
  ~ N 2    , 
0
 E2 
 0


 2 C  

 2 C  

0 

 2 E  

,

.

Apabila terbentuk sampel random X1 dan X2 maka trait kategori yang
terbentuk adalah Yi = 0 jika Xi  b dan Yi = 1 jika Xi > b untuk i =1,2 dan b yang
dipilih. Dalam hal ini, misalkan dalam simulasi dipilih b = 1, 2A = 0,8, 2C = 0,1
dan 2E = 0,1 sehingga
2A + 2C + 2E = 2 = 1.
Korelasi antara X1 dan X2 pada pasangan kembar MZ yaitu

 MZ 

 2 A  2C  2 E
2
V ( X 1 )V ( X 2 )

Cov( X 1 , X 2 )



dapat dipandang sebagai korelasi polikorik (polychoric correlation) antara trait
kategori untuk pasangan kembar MZ (Setiawan, 2007).

4 Hasil dan Pembahasan
Implementasi dari metode yang dijelaskan pada pasal 3 digunakan paket program
R. Dalam simulasi ini digunakan 400 pasangan kembar untuk memberikan
gambaran bagaimana metode ini digunakan. Contoh dari hasil simulasi tersebut
dapat dilihat pada Tabel 1 dan Tabel 2. Dari tabel tersebut, terlihat bahwa
terdapat 400 pasangan kembar. Dari 400 pasang tersebut, terdapat 313 pasang
yang keduanya tidak berpenyakit tertentu yang menjadi perhatian (trait), 17
pasang kembar yang orang kembar 1 tidak berpenyakit sedangkan orang kembar
2 berpenyakit, 21 pasang kembar yang orang kembar 1 berpenyakit sedangkan
orang kembar 2 tidak berpenyakit, dan 49 pasang yang keduanya berpenyakit.
Berdasarkan Tabel 1 dapat diestimasi besarnya korelasi polikorik dari sifat fenotip
(trait) yang menjadi perhatian pada pasangan kembar MZ yaitu ρMZ dengan
menggunakan paket program polychor dalam bahasa R (CRAN-R). Dengan cara
yang sama dapat juga ditentukan ρDZ. Pengaruh faktor genetik dapat diestimasi
kembali dengan menggunakan rumus (1). Demikian juga bila diberikan data Tabel
1 dan Tabel 2, dengan menggunakan Mx juga dapat diestimasi ulang pengaruh
faktor genetik 2A/2 = 2A/1 = 2A, lingkungan bersama 2C dan lingkungan tidak
bersama 2E. Bila simulasi dilakukan n= 40 kali maka akan diperoleh hasil
lengkap seperti dinyatakan pada Tabel 3. Hal itu berarti bahwa kedua metode
memberikan hasil yang relatif sama dan hasil yang diperoleh memberikan hasil
yang tidak berbeda jauh dengan parameter input yang digunakan dalam simulasi.
Tabel 1. Tabel kontingensi dari status berpenyakit tertentu (kategori 1) atau tidak (kategori 0) pada
pasangan kembar MZ

Kembar 2
Kembar 1
Kategori 0
Kategori 1

Kategori 0
313
21

Kategori 1
17
49

A. SETIAWAN

Tabel 2. Tabel kontingensi dari status berpenyakit tertentu (kategori 1) atau tidak (kategori 0) pada
pasangan kembar DZ

Kembar 2
Kategori 0
285
40

Kembar 1
Kategori 0
Kategori 1

Kategori 1
46
29

Tabel 3. Data hasil simulasi trait kategori pada pasangan kembar MZ dan DZ serta estimasi kembali
pengaruh factor genetik 2A, lingkungan bersama 2C dan lingkungan tidak bersama 2E dengan
menggunakan metode momen maupun metode maximum likelihood.

No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

(0,0)
313
321
323
319
320
300
333
330
316
315
318
310
333
335
309
314
317
339
320
316
331
312
325
313
316
339
321
338
317
323
320
324
328
329
326
312
325
317
320
320

MZ
(0,1)
(1,0)
17
21
13
20
19
21
12
20
16
13
24
14
16
17
14
15
14
20
19
21
15
16
22
17
14
10
13
18
19
25
20
20
27
17
15
9
17
14
26
15
13
16
15
18
14
17
20
18
18
22
12
11
24
15
15
10
16
19
14
20
14
26
15
19
19
15
18
14
16
13
19
20
21
13
20
20
15
17
20
17

DZ
(1,1)
(0,0)
49
285
46
306
37
302
49
294
51
288
62
297
34
291
41
297
50
299
45
291
51
298
51
306
43
298
34
292
47
299
46
292
39
306
37
302
49
301
43
301
40
298
55
295
44
302
49
306
44
287
38
305
40
287
37
302
48
313
43
308
40
293
42
300
38
307
39
297
45
282
49
286
41
289
43
294
48
286
43
289
Rata-rata

(0,1)
46
32
42
34
36
38
48
44
40
44
29
40
29
40
42
41
34
38
34
35
32
33
32
32
44
33
49
39
35
31
42
39
37
38
41
39
37
45
47
44

(1,0)
40
39
35
45
46
40
36
33
37
39
46
33
46
42
36
40
40
36
39
41
44
44
41
41
42
38
37
34
33
41
40
37
36
40
44
47
47
36
37
40

(1,1)
29
23
21
27
30
25
25
26
24
26
27
21
27
26
23
27
20
24
26
23
26
28
25
21
27
24
27
25
19
20
25
24
20
25
33
28
27
25
30
27

Metode Momen
2A
2C
2E
0,82
0,07
0,11
0,77
0,14
0,09
0,79
0,06
0,15
0,82
0,10
0,08
0,83
0,10
0,07
0,85
0,07
0,08
0,84
0,03
0,13
0,80
0,12
0,08
0,85
0,06
0,09
0,81
0,06
0,13
0,75
0,17
0,08
0,82
0,07
0,11
0,79
0,15
0,06
0,83
0,06
0,11
0,77
0,08
0,15
0,76
0,11
0,13
0,75
0,08
0,17
0,85
0,09
0,06
0,76
0,16
0,08
0,76
0,10
0,14
0,78
0,13
0,09
0,77
0,15
0,08
0,76
0,15
0,09
0,81
0,08
0,11
0,82
0,04
0,14
0,81
0,13
0,06
0,81
0,06
0,13
0,80
0,13
0,07
0,82
0,08
0,10
0,84
0,06
0,10
0,80
0,06
0,14
0,80
0,10
0,10
0,84
0,05
0,11
0,81
0,09
0,10
0,80
0,12
0,08
0,83
0,05
0,12
0,84
0,05
0,11
0,78
0,08
0,14
0,82
0,09
0,09
0,82
0,06
0,12
0,80
0,10
0,10

Metode ML
2A
2C
2E
0,83
0,06
0,11
0,76
0,14
0,10
0,80
0,05
0,15
0,82
0,10
0,08
0,84
0,09
0,07
0,81
0,10
0,09
0,88
0,01
0,11
0,83
0,09
0,08
0,84
0,07
0,09
0,81
0,06
0,13
0,77
0,15
0,08
0,79
0,09
0,12
0,83
0,12
0,05
0,86
0,04
0,10
0,76
0,09
0,15
0,76
0,11
0,13
0,73
0,05
0,17
0,86
0,07
0,07
0,76
0,16
0,08
0,75
0,11
0,14
0,81
0,11
0,08
0,77
0,15
0,08
0,77
0,14
0,09
0,80
0,09
0,11
0,83
0,04
0,13
0,83
0,11
0,06
0,83
0,04
0,13
0,81
0,12
0,07
0,79
0,10
0,10
0,84
0,06
0,10
0,80
0,06
0,14
0,80
0,09
0,11
0,84
0,04
0,12
0,82
0,08
0,10
0,83
0,10
0,07
0,84
0,05
0,11
0,86
0,04
0,10
0,79
0,07
0,14
0,84
0,08
0,08
0,83
0,05
0,12
0,79
0,11
0,10

PENENTUAN BESARNYA PENGARUH FAKTOR GENETIK

5 Kesimpulan
Pasangan kembar MZ dan DZ yang mempunyai sifat fenotip tertentu dapat
digunakan untuk menentukan besarnya pengaruh genetik terhadap sifat fenotip
yang menjadi perhatian tersebut. Penelitian ini dapat diperluas untuk penentuan
besarnya pengaruh genetik terhadap sifat fenotip kontinu seperti pada tinggi
badan, BMI (body mass index) maupun beberapa sifat fenotip dalam satu kesatuan
(model multivariat).

References
[1]

Lange, K. [2002], Mathematics and Statistical Methods for Genetic Analysis,
Springer, New York

[2] Neale, M. C. & Cardon, L. [1992],

Methodology for Genetic Studies of Twins and
Families, Kluwer Academic Publishers, Dordrecht.

[3]

Setiawan, A. [2007] , Statistical Data Analysis of Genetic Data in Twin Studies
and Association Studies, Vrije Universiteit, Amsterdam, Ph.D Thesis, ISBN
978-90-9021728.

[4]

Sham, P. [1998], Statistics in Human Genetics, A Hodder Arnold Publication,
London.

[5]

van der Vaart, A. W. [2006], Statistical Genetics, Faculty of Sciences, Vrije
Universiteit, Amsterdam