Using Empirical Best Linear Unbiased Prediction (EBLUP) Method on the General Linear Mixed Model
PENGGUNAAN METODE EMPIRICAL BEST LINEAR UNBIASED PREDICTION
(EBLUP) PADA GENERAL LINEAR MIXED MODEL
Tri Handhika Pusat Studi Komputasi Matematika (PSKM), Kampus D 139 Universitas Gunadarma
trihandika@staff.gunadarma.ac.id
Abstrak Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed
Model. Parameter-parameter pada General Linear Mixed Model merupakan parameter
untuk melihat efek fixed dan efek random dari variabel-variabel prediktor terhadap variabel respon. Dalam hal ini, metode yang digunakan untuk mencari taksiran parameter pada
General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction
(EBLUP). Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya. Metode yang digunakan untuk menaksir parameter dari variansi efek random adalah Metode Maximum Likelihood (ML).
Kata kunci: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model.
Abstract This paper aims to find the estimated parameters in the General Linear Mixed
Model. Parameters in the General Linear Mixed Model are the parameter to see the fixed effects and the random effects of the predictor variables on the response variable. In this case, the estimation methods used to search the parameters in the General Linear Mixed Model is the Empirical Best Linear Unbiased Prediction (EBLUP) method. Unlike the Best Linear Unbiased Prediction (BLUP) method where the variance parameters of the random effects is known, the EBLUP method requires estimation of the variance parameters that in fact the value is not known. The method used to estimate the variance parameters of the random effects is the Maximum Likelihood (ML) method.
Key word: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model.
1. PENDAHULUAN
Pola hubungan antara variabel prediktor dengan variabel respon dapat dinyatakan dalam bentuk persamaan regresi di mana variabel prediktornya dapat berupa faktor fixed atau faktor random. Model regresi linier yang melibatkan lebih dari satu variabel prediktor dengan satu variabel respon disebut model regresi linier berganda. Pada model ini diasumsikan bahwa variansi error spherical.
Jika asumsi tersebut tidak dapat terpenuhi maka model tersebut dinamakan
Generalized Linear Regression Model (GLRM) dengan asumsi variansi error nonspherical.
Model GLRM yang dipengaruhi tidak hanya oleh efek fixed tetapi juga oleh efek random disebut General Linear Mixed Model. Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed Model sehingga dapat dilihat efek-efek dari variabel prediktor tersebut terhadap variabel respon.Terdapat bermacam-macam metode penaksiran parameter pada General Linear
Mixed Model, di antaranya adalah Best Linear Unbiased Prediction (BLUP) dan EBLUP.
Pada Makalah ini akan dibahas metode penaksiran parameter pada General Linear Mixed Model dengan Metode EBLUP yang merupakan perluasan dari Metode BLUP.Pada metode EBLUP, asumsi bahwa parameter dari variansi efek random diketahui tidak digunakan seperti halnya pada BLUP, melainkan akan diestimasi melalui Metode
Maximum Likelihood (ML) yang akan dijelaskan lebih lanjut. Penaksiran ini dilakukan
karena pada kenyataannya sulit untuk mengetahui parameter dari variansi efek random tersebut.
2. MODEL
Pada bagian ini diberikan General Linear Mixed Model adalah sebagai berikut:
yX Zb e (2.1)
di mana
y
1 : vektor random dari variabel respon yang terobservasi berukuran n di mana nilai observasinya disebut vektor data.
X
dari variabel prediktor yang elemen-elemennya : matriks full rank berukuran n k diketahui.
1 : vektor parameter bersifat fixed berukuran k yang tidak diketahui dan tidak terobservasi.
Z
: matriks full rank berukuran n h dari variabel prediktor yang elemen-elemennya diketahui.
b
1 : vektor random parameter yang tidak diketahui dan tidak terobservasi berukuran h .
e
1 : vektor random error yang tidak terobservasi berukuran n . dengan asumsi T T
E b E e Var E Var E b bb G e ee R
0 , 0 ,
, , di mana b dan e
independently distributed sedangkan G dan R adalah matriks varians kovarians yang
T , , ,
tergantung pada vektor parameter dari variansi efek random, yaitu 1 2 q .
corr b e ,
Oleh karena dan independen, maka sehingga T T b e
cov b e , E be E eb
. Berikut ini diberikan bentuk dari matriks G dan R:
g g g 11 12 1 h
g g g 21 22 2 h
G
g g g h 1 h 2 hh
r r r 11 12 1 n
r r r 21 22 2 n
R
r r r n 1 n 2 nn
Prosedur penaksiran parameter dengan menggunakan Metode Best Linear Unbiasd
Prediction (BLUP) dimulai dengan memisalkan nilai-nilai dari vektor random b yang
dapat dinotasikan dengan di mana berbentuk vektor. Ingin diketahui pengaruh dari efek fixed dan efek random (tetapi bukan error) yang merupakan kombinasi linier dari T
l T y c y
dan . Misalkan adalah sembarang penaksir dari kombinasi linier
T T
di mana c suatu nilai konstanta dan l suatu vektor konstanta sedangkan
T y k 1
1
berukuran dan berukuran h . dapat mengestimasi kombinasi linier
tersebut jika T y merupakan penaksir yang unbiased dan linier di mana definisi masing- T T
E T E y b
masingnya adalah sebagai berikut, T y disebut unbiased jika ,
T a b aT bT y y y y
1 2 1 2 dan disebut linier jika .
T T
c Diketahui bahwa dapat diestimasi oleh T
T y jika dan hanya jika
X
dan merupakan kombinasi linier dari baris-baris . Selanjutnya, ambil sembarang
T T
yang merupakan kombinasi linier yang dapat diestimasi kemudian T T T T 2
E T y b
definisikan t b . Selain itu, definisikan pula sebagai
Mean Squared Error (MSE) dari penaksir
T y . Dengan menggunakan Metode Best Linear Unbiased Prediction (BLUP) di mana ˆ
ˆ
y
y
diasumsikan diketahui, didapat dan sedemikian sehingga T 1 T 1 1
ˆ y
X X X y (2.2)
dan T 1
ˆ ˆ
y G Z y X y (2.3)
di mana T R ZGZ .
Dengan demikian, Best Linear Unbiased Predictor (BLUP) dari adalah T T ˆ
ˆ ˆ
y y y
(2.4)
yang memiliki MSE terkecil dari semua taksiran yang unbiased dan linier. Detail penurunan rumus dapat dilihat pada Makalah Phydelya dengan judul “Penggunaan Metode
Best Linear Unbiased Prediction pada Generalized Linear Mixed Model”.
3. HASIL
3.1. Penaksiran Parameter pada General Linear Mixed Model dengan Asumsi b dan
e Berdistribusi NormalPada Bagian sebelumnya telah dijelaskan mengenai penggunaan Metode Best
Linear Unbiased Prediction (BLUP) dalam penaksiran pada General Linear Mixed Model
tanpa asumsi distribusi. Pada dasarnya Metode EBLUP adalah suatu metode penaksiran parameter pada General Linear Mixed Model yang merupakan perluasan dari Metode BLUP dengan menggunakan taksiran parameter dari variansi efek random ˆ yang pada
kenyataannya parameter tersebut tidak diketahui nilainya. Metode penaksiran yang digunakan pada Makalah ini adalah Metode ML yang memerlukan asumsi distribusi. Oleh sebab itu, diasumsikan bahwa b dan e berdistribusi normal. Dikarenakan taksiran parameter pada General Linear Mixed Model yang telah didapat sebelumnya ((2.2)) dan (2.3)), yaitu
ˆ
ˆ
dan , didapat tanpa asumsi distribusi maka harus dicari taksiran parameter pada
General Linear Mixed Model dengan asumsi b dan e berdistribusi normal yang dinotasikan
dengan dan . Dengan asumsi b dan e berdistribusi normal, parameter pada General Linear Mixed
Model, yaitu dan dapat ditaksir menggunakan Metode ML. Metode ini memerlukan
T y , y , , y y
fungsi likelihood yang merupakan joint pdf dari T 1 2 n dan
, , ,
. Joint pdf tersebut dapat dinyatakan sebagai berikut:
1 2 h f y , g y | h
(3.1.1)
di mana
g y | g
(3.1.2)
Oleh sebab itu, (3.1.1) dapat ditulis sebagai
f y , g h
di mana
1
1 T -1 h exp G .
n 1 2 2
2
2 G
sehingga diperoleh
L , ; f , y y
g h
1
1 T -1 T -1 exp R G .
1
n 2 2
2 G R
Oleh karena ingin dicari taksiran dari dan menggunakan Metode ML, agar lebih mudah dalam hal perhitungannya akan digunakan fungsi log-likelihood, yaitu:
1 T -1 T -1 T -1 T T -1 T T -1 T T -1 ln L , ; c ( y y R y y R X y R Z
X R y
X R X
X R Z
2 T T -1 T T -1 T T -1 T -1 Z R y Z R X Z R Z G ) n 1 2 (3.1.3)
c ln 2 G R
dengan suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut
diturunkan terhadap masing-masing dan kemudian dicari penyelesaiannya sehingga didapat
T -1 T -1 T -1
X R X
X R Z
X R y T -1 T -1 -1 T -1 (3.1.4)
Z R X Z R Z G Z R y .
(3.1.5)
Selanjutnya, dengan proses eliminasi didapat
1
T -1 -1 T -1 -1 T -1 T -1 -1 T -1 -1 T -1 1 1
X R R Z Z R Z G Z R
X X R R Z Z R Z G Z R y
(3.1.6)
dan 1
T -1 -1 T -1
.
Z R Z G Z R y
X
(3.1.7)
ˆ
Jadi, selain ˆ dan yang didapat tanpa asumsi distribusi, terdapat pula
dan
yang merupakan taksiran parameter pada General Linear Mixed Model dengan
mengasumsikan b dan e berdistribusi normal. Selanjutnya, untuk penaksiran
yang didapat dengan asumsi
menggunakan Metode ML seharusnya memerlukan dan
b dan e berdistribusi normal. Akan tetapi, berikutnya akan dibuktikan bahwa dan
yang didapat dengan asumsi b dan e berdistribusi normal tersebut, ternyata identik dengan
ˆ
ˆ
dan yang diperoleh tanpa asumsi distribusi. Oleh karena itu, untuk seterusnya
ˆ penaksiran akan menggunakan ˆ dan .
3.2. Memeriksa bahwa Taksiran Parameter pada General Linear Mixed Model
yang didapat dengan atau tanpa Asumsi b dan e Berdistribusi Normal adalah IdentikTelah diketahui dari (2.2) dan (2.3) bahwa taksiran parameter pada General Linear
ˆ
Mixed Model tanpa asumsi distribusi adalah ˆ dan . Sedangkan, taksiran parameter pada
General Linear Mixed Model dengan asumsi b dan e berdistribusi normal diberikan oleh(3.1.6) dan (3.1.7). Dari (3.1.6), misalkan:
- -1 -1 T -1 -1 T -1 1 W R R Z Z R Z G Z R .
(3.2.1)
W
I
Oleh karena dapat dibuktikan bahwa , maka terbukti pula bahwa ˆ
. (3.2.2)
1 T -1 -1 T -1 T 1 Z R Z G Z R GZ
Selain itu, dapat dibuktikan pula bahwa sehingga dapat
disimpulkan bahwa
ˆ (3.2.3)
Berdasarkan (3.2.2) dan (3.2.3) terbukti bahwa dengan atau tanpa asumsi b dan e berdistribusi normal kedua jenis taksiran parameter pada General Linear Mixed Model tersebut identik sehingga taksiran parameter yang didapat dengan asumsi b dan e berdistribusi normal juga memiliki sifat linear, unbiased, dan best.
3.3. Penaksiran Parameter dari Variansi Efek Random Pada Makalah ini, Metode ML digunakan untuk menaksir pada General Linear
Mixed Model. Oleh karena itu, dibutuhkan fungsi likelihood yang merupakan joint pdf dari
T y y , y , , ysehingga fungsi likelihood-nya adalah sebagai berikut:
1 2 n T
1 1 -1
L , ; y f y exp y X y X n 2 1 2 (3.3.1)
2
2
Sebagaimana sebelumnya, Metode ML menggunakan fungsi log-likelihood, yaitu: T
1 -1 ln L , ; y c ln y X y X
(3.3.2)
2 n
c ln 2
dengan adalah suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut
2
,
diturunkan terhadap , dinotasikan dengan s , sehingga untuk elemen ke-j didapat formula berikut ini: T
1 -1 -1 -1
1
s , tr
j j j
y X y X (3.3.3)
2
2
j dengan .
j
Sesuai dengan Metode ML, berikutnya (3.3.3) dicari solusinya menjadi -1 -1 -1 T ˆ ˆ
tr y X y X
j j(3.3.4) Terlihat dari (3.3.4) tidak dapat diselesaikan secara analitik. Oleh karena itu, taksiran dengan Metode ML kemudian diselesaikan secara numerik. Pada Makalah ini, a 1
ˆ
1
a , yaitu
algoritma yang digunakan adalah Scoring Algorithm di mana iterasi ke- , secara iteratif menggunakan formula sebagai berikut: a 1 a a a a 1
ˆ ˆ ˆ ˆ ˆ ˆ
s ,
dengan T T T T T ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
ˆ ˆ ˆ ˆ
s , s , , s , , , s , 1 2 q dan 1 2 q
di mana 2
ln L , ; y
1 -1 -1 E tr jk
j k (3.3.5)
k j
2
Berdasarkan penjabaran di atas, didapatkan taksiran parameter dari variansi efek
random ˆ secara numerik yang selanjutnya akan digunakan dalam penaksiran parameter
pada General Linear Mixed Model sesuai dengan Metode EBLUP.
3.4. Penaksiran Parameter pada General Linear Mixed Model dengan Metode
EBLUPTaksiran parameter pada General Linear Mixed Model dengan menggunakan
ˆ y
Metode EBLUP didapat dengan mensubstitusikan taksiran , dinotasikan dengan ,
ˆ
ke ˆ dan , yaitu: 1 T 1 T 1 ˆ ˆ ˆ
ˆ
y y ,
X
X X y dan
T 1
ˆ ˆ ˆ ˆ ˆ ˆ
y y , G Z y X y y ,
Berdasarkan (2.4) taksiran kombinasi linier yang baru adalah sebagai berikut: T T ˆ ˆ ˆ ˆ
ˆ ˆ y y y y y y .
(3.4.1)
ˆ
ˆ
ˆ
y y ˆ y
Oleh karena tersebut didapat dengan mensubstitusikan ke ˆ dan ,
maka perlu dibuktikan ketakbiasan dari taksiran tersebut. Sebelumnya diketahui lemma berikut ini:
Lemma 3.1 z z
Jika adalah vektor random berdistribusi simetris di sekitar nol sedemikian sehingga
z
dan identically distributed, dan f z adalah variabel random yang merupakan fungsi
z f z f z , maka ganjil dari sehingga f z berdistribusi simetris di sekitar nol.
ˆ ˆ
E y y ˆ y
Sebelumnya diketahui bahwa berhingga dan merupakan
y
fungsi genap serta translation-invariant dari sehingga didapat
ˆ ˆ ˆ ˆ y y X Zb e Zb e
(3.4.2)ˆ
E ˆ t y y
Oleh karena terbukti bahwa maka dapat disimpulkan bahwa
T T
ˆ
ˆ
y y
tetap unbiased untuk mengestimasi .
4. PENERAPAN
Sebuah Waralaba makanan cepat saji ingin menambahkan produk makanan baru dalam daftar menunya. Oleh sebab itu, pihak marketing mengusulkan kepada pihak
manajemen tiga pilihan bentuk promosi atau campaign X yang akan diujicobakan di
enam lokasi Waralaba atau location Z yang dipilih secara acak dari sepuluh Waralaba yang ada. Namun, selama satu bulan pertama pihak manajemen ingin melihat terlebih dahulu seberapa besar pengaruh masing-masing bentuk promosi dan lokasi Waralaba dalam meningkatkan penjualannya (sales). Diasumsikan bahwa matriks-matriks varians kovarians
R G 1 g
I 1 dan merupakan parameter dari
dari e dan b, yaitu I dan r di mana
I r g
variansi e dan b sedangkan merupakan matriks identitas berukuran 30 30 dan
I dan
6 6 . Sebelum melakukan penaksiran parameter pada General Linear Mixed Model, perlu diperiksa terlebih dahulu kenormalan dari variabel dependen (Sales). Dengan menggunakan
Metode EBLUP didapatkan taksiran dari parameter-parameter tersebut, yaitu sebagai berikut. T
ˆ 46.0171, 832.7489
T
ˆ . , ,
230 0812 191.1613 218.5482
T
ˆ 53 4308 -0.2670 -38.0198 -5.1867, 11.8286, -21.7859 . . , , ,
5. KESIMPULAN
Dari pembahasan Makalah ini dapat disimpulkan bahwa Metode Empirical Best
Linear Unbiased Prediction (EBLUP) yang merupakan perluasan dari Metode Best Linear
Unbiased Prediction (BLUP) dapat digunakan untuk menaksir parameter pada General
Linear Mixed Model dengan terlebih dahulu melakukan penaksiran terhadap parameter dari
variansi efek random yang pada kenyataannya tidak diketahui nilainya.REFERENSI Anton, H. (2000), Dasar-Dasar Aljabar Linier, Batam: Interaksara.
Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications, New York: Springer. Harville, D. A. (1997), Matrix Algebra from A Statistician’s Perspective, New York: Springer. Kackar, R. N., and Harville, D. A. (1981), Unbiasedness of Two-stage Estimation and
Prediction Procedures for Mixed Linear Models, Communications in Statistics, Series A, 10, 1249-1261.
McCulloch, C. E., and Searle, S. R. (2001), Generalized, Linear, and Mixed Models, New York: John Wiley and Sons. Phydelya, A. (2007), Penggunaan Metode Best Linear Unbiased Prediction pada Generalized Linear Mixed Model, Depok: Departemen Matematika FMIPA UI. Searle, S.R., Casella, G., and McCulloch, C. E. (1992), Variance Components, New York: Wiley.