Using Empirical Best Linear Unbiased Prediction (EBLUP) Method on the General Linear Mixed Model

  

PENGGUNAAN METODE EMPIRICAL BEST LINEAR UNBIASED PREDICTION

(EBLUP) PADA GENERAL LINEAR MIXED MODEL

  Tri Handhika Pusat Studi Komputasi Matematika (PSKM), Kampus D 139 Universitas Gunadarma

  

trihandika@staff.gunadarma.ac.id

  Abstrak Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed

  

Model. Parameter-parameter pada General Linear Mixed Model merupakan parameter

  untuk melihat efek fixed dan efek random dari variabel-variabel prediktor terhadap variabel respon. Dalam hal ini, metode yang digunakan untuk mencari taksiran parameter pada

  

General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction

  (EBLUP). Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya. Metode yang digunakan untuk menaksir parameter dari variansi efek random adalah Metode Maximum Likelihood (ML).

  Kata kunci: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model.

  Abstract This paper aims to find the estimated parameters in the General Linear Mixed

  Model. Parameters in the General Linear Mixed Model are the parameter to see the fixed effects and the random effects of the predictor variables on the response variable. In this case, the estimation methods used to search the parameters in the General Linear Mixed Model is the Empirical Best Linear Unbiased Prediction (EBLUP) method. Unlike the Best Linear Unbiased Prediction (BLUP) method where the variance parameters of the random effects is known, the EBLUP method requires estimation of the variance parameters that in fact the value is not known. The method used to estimate the variance parameters of the random effects is the Maximum Likelihood (ML) method.

  Key word: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model.

1. PENDAHULUAN

  Pola hubungan antara variabel prediktor dengan variabel respon dapat dinyatakan dalam bentuk persamaan regresi di mana variabel prediktornya dapat berupa faktor fixed atau faktor random. Model regresi linier yang melibatkan lebih dari satu variabel prediktor dengan satu variabel respon disebut model regresi linier berganda. Pada model ini diasumsikan bahwa variansi error spherical.

  Jika asumsi tersebut tidak dapat terpenuhi maka model tersebut dinamakan

Generalized Linear Regression Model (GLRM) dengan asumsi variansi error nonspherical.

Model GLRM yang dipengaruhi tidak hanya oleh efek fixed tetapi juga oleh efek random disebut General Linear Mixed Model. Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed Model sehingga dapat dilihat efek-efek dari variabel prediktor tersebut terhadap variabel respon.

  Terdapat bermacam-macam metode penaksiran parameter pada General Linear

Mixed Model, di antaranya adalah Best Linear Unbiased Prediction (BLUP) dan EBLUP.

Pada Makalah ini akan dibahas metode penaksiran parameter pada General Linear Mixed Model dengan Metode EBLUP yang merupakan perluasan dari Metode BLUP.

  Pada metode EBLUP, asumsi bahwa parameter dari variansi efek random diketahui tidak digunakan seperti halnya pada BLUP, melainkan akan diestimasi melalui Metode

  

Maximum Likelihood (ML) yang akan dijelaskan lebih lanjut. Penaksiran ini dilakukan

  karena pada kenyataannya sulit untuk mengetahui parameter dari variansi efek random tersebut.

2. MODEL

  Pada bagian ini diberikan General Linear Mixed Model adalah sebagai berikut:

  

 

y

  X Zb e (2.1)

  di mana

  y

  1 : vektor random dari variabel respon yang terobservasi berukuran n  di mana nilai observasinya disebut vektor data.

  X

   dari variabel prediktor yang elemen-elemennya : matriks full rank berukuran n k diketahui.

  

  1 : vektor parameter bersifat fixed berukuran k  yang tidak diketahui dan tidak terobservasi.

  Z

  : matriks full rank berukuran n h  dari variabel prediktor yang elemen-elemennya diketahui.

  b

  1 : vektor random parameter yang tidak diketahui dan tidak terobservasi berukuran h  .

  e

  1 : vektor random error yang tidak terobservasi berukuran n  . dengan asumsi T T

  E bE eVar E Var E bbbG eeeR

    0 ,   0 ,    

  , , di mana b dan e

     

independently distributed sedangkan G dan R adalah matriks varians kovarians yang

T  

    , , ,

  tergantung pada vektor parameter dari variansi efek random, yaitu 1 2 q .

    corr b e , 

   

  Oleh karena dan independen, maka sehingga T T b e

  cov b e ,  E beE eb

  . Berikut ini diberikan bentuk dari matriks G dan R:

        g g g 11   12   1 h    

   g g g 21   22   2 h  

    G

            

     g g g h 1   h 2   hh  

      r r r 11   12   1 n    

   r r r 21   22   2 n  

    R 

   

     

       r r r n 1   n 2   nn  

   

  Prosedur penaksiran parameter dengan menggunakan Metode Best Linear Unbiasd

  

Prediction (BLUP) dimulai dengan memisalkan nilai-nilai dari vektor random b yang

 

  dapat dinotasikan dengan di mana berbentuk vektor. Ingin diketahui pengaruh dari efek fixed dan efek random (tetapi bukan error) yang merupakan kombinasi linier dari T

  l T y   c y

    

  dan . Misalkan adalah sembarang penaksir dari kombinasi linier

  T T

  

  

    di mana c suatu nilai konstanta dan l suatu vektor konstanta sedangkan

T y k

  1

  1

   

  berukuran dan berukuran h  . dapat mengestimasi kombinasi linier

   

  tersebut jika T y merupakan penaksir yang unbiased dan linier di mana definisi masing- T T

  E T E    y   b

       

  masingnya adalah sebagai berikut, T y disebut unbiased jika ,

    T a b aT bT yyyy

   1 2    1   2 dan disebut linier jika .

  T T

     c  Diketahui bahwa     dapat diestimasi oleh T

  T y jika dan hanya jika

  X

  dan merupakan kombinasi linier dari baris-baris . Selanjutnya, ambil sembarang

  T T

        yang merupakan kombinasi linier yang dapat diestimasi kemudian T T T T 2  

  E T    y   b

     

  definisikan t    b . Selain itu, definisikan pula sebagai

   

     

  

  Mean Squared Error (MSE) dari penaksir

T y . Dengan menggunakan Metode Best Linear Unbiased Prediction (BLUP) di mana ˆ

  ˆ

    y

    y

   

  diasumsikan diketahui, didapat dan sedemikian sehingga T 1 T1 1

    ˆ     y

  X X X y       (2.2)

   

  dan T 1

   ˆ ˆ

    yG  Z   yX   y           (2.3)

  di mana T     R ZGZ .

   

  Dengan demikian, Best Linear Unbiased Predictor (BLUP) dari adalah T T ˆ

  

  ˆ ˆ

   y   y   y      

  (2.4)

  yang memiliki MSE terkecil dari semua taksiran yang unbiased dan linier. Detail penurunan rumus dapat dilihat pada Makalah Phydelya dengan judul “Penggunaan Metode

  Best Linear Unbiased Prediction pada Generalized Linear Mixed Model”.

3. HASIL

  

3.1. Penaksiran Parameter pada General Linear Mixed Model dengan Asumsi b dan

e Berdistribusi Normal

  Pada Bagian sebelumnya telah dijelaskan mengenai penggunaan Metode Best

  

Linear Unbiased Prediction (BLUP) dalam penaksiran pada General Linear Mixed Model

  tanpa asumsi distribusi. Pada dasarnya Metode EBLUP adalah suatu metode penaksiran parameter pada General Linear Mixed Model yang merupakan perluasan dari Metode BLUP dengan menggunakan taksiran parameter dari variansi efek random ˆyang pada

   

  kenyataannya parameter tersebut tidak diketahui nilainya. Metode penaksiran yang digunakan pada Makalah ini adalah Metode ML yang memerlukan asumsi distribusi. Oleh sebab itu, diasumsikan bahwa b dan e berdistribusi normal. Dikarenakan taksiran parameter pada General Linear Mixed Model yang telah didapat sebelumnya ((2.2)) dan (2.3)), yaitu

  ˆ

  ˆ

  

dan , didapat tanpa asumsi distribusi maka harus dicari taksiran parameter pada

  

General Linear Mixed Model dengan asumsi b dan e berdistribusi normal yang dinotasikan

   dengan  dan . Dengan asumsi b dan e berdistribusi normal, parameter pada General Linear Mixed

  

Model, yaitu dan dapat ditaksir menggunakan Metode ML. Metode ini memerlukan

T

   y , y , , y y

  fungsi likelihood yang merupakan joint pdf dari  T 1 2 n  dan

      , , , 

  . Joint pdf tersebut dapat dinyatakan sebagai berikut:

   1 2 h f y , g y | h

        (3.1.1)

  di mana

  g y  |  g    

  (3.1.2)

  Oleh sebab itu, (3.1.1) dapat ditulis sebagai

  f y  ,  g h      

  di mana

  1

  1 T -1   h  exp   G  .

    n 1 2 2  

  2

  

   

  2 G

   

  sehingga diperoleh

  L   , ; f , yy

       g h

     

  1

  1  T -1 T -1   exp   R  G  .

1

n 2    

  2  

2 G R

     

  

  Oleh karena ingin dicari taksiran dari dan menggunakan Metode ML, agar lebih mudah dalam hal perhitungannya akan digunakan fungsi log-likelihood, yaitu:

  1 T -1 T -1 T -1 T T -1 T T -1 T T -1 ln L   , ; c (        y   y R yy R Xy R Z

  X R y

  X R X

  X R Z  

  2 T T -1 T T -1 T T -1 T -1 Z R y Z R X  Z R Z  G  ) n 1 2 (3.1.3)

   c   ln 2 G R

  dengan suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut

     

  

  diturunkan terhadap masing-masing dan kemudian dicari penyelesaiannya sehingga didapat

  

T -1 T -1 T -1

   

  X R X 

  X R Z 

  X R y T -1 T -1 -1 T -1 (3.1.4)  

  Z R X Z R ZG Z R y .

  (3.1.5)  

  Selanjutnya, dengan proses eliminasi didapat

  

1

T -1 -1 T -1 -1 T -1 T -1 -1 T -1 -1 T -11  1

  

  X RR Z Z R ZG Z R

  X X RR Z Z R ZG Z R y    

  

   

 

  (3.1.6)

  dan 1

    T -1 -1 T -1 

    .

   Z R ZG Z R y

  X  

  (3.1.7)  

  

  ˆ

  

  Jadi, selain ˆ dan yang didapat tanpa asumsi distribusi, terdapat pula 

  dan

  yang merupakan taksiran parameter pada General Linear Mixed Model dengan

  

  mengasumsikan b dan e berdistribusi normal. Selanjutnya, untuk penaksiran 

  yang didapat dengan asumsi

  menggunakan Metode ML seharusnya memerlukan  dan 

   b dan e berdistribusi normal. Akan tetapi, berikutnya akan dibuktikan bahwa  dan

  yang didapat dengan asumsi b dan e berdistribusi normal tersebut, ternyata identik dengan

  ˆ

  ˆ

  

dan yang diperoleh tanpa asumsi distribusi. Oleh karena itu, untuk seterusnya

ˆ

   penaksiran akan menggunakan ˆ dan .

  

3.2. Memeriksa bahwa Taksiran Parameter pada General Linear Mixed Model

yang didapat dengan atau tanpa Asumsi b dan e Berdistribusi Normal adalah Identik

  Telah diketahui dari (2.2) dan (2.3) bahwa taksiran parameter pada General Linear

  ˆ

  

Mixed Model tanpa asumsi distribusi adalah ˆ dan . Sedangkan, taksiran parameter pada

General Linear Mixed Model dengan asumsi b dan e berdistribusi normal diberikan oleh

  (3.1.6) dan (3.1.7). Dari (3.1.6), misalkan:

  • -1 -1 T -1 -1 T -1
  • 1 WRR Z Z R ZG Z R .

      (3.2.1)  

       W

      

    I

    Oleh karena dapat dibuktikan bahwa , maka terbukti pula bahwa

       ˆ

      . (3.2.2)

      1 T -1 -1 T -1 T1 Z R ZG Z RGZ 

      Selain itu, dapat dibuktikan pula bahwa sehingga dapat

       

      disimpulkan bahwa

      

    ˆ 

        (3.2.3)

      Berdasarkan (3.2.2) dan (3.2.3) terbukti bahwa dengan atau tanpa asumsi b dan e berdistribusi normal kedua jenis taksiran parameter pada General Linear Mixed Model tersebut identik sehingga taksiran parameter yang didapat dengan asumsi b dan e berdistribusi normal juga memiliki sifat linear, unbiased, dan best.

        

      3.3. Penaksiran Parameter dari Variansi Efek Random Pada Makalah ini, Metode ML digunakan untuk menaksir pada General Linear

      

    Mixed Model. Oleh karena itu, dibutuhkan fungsi likelihood yang merupakan joint pdf dari

    Ty  y , y , , y

      sehingga fungsi likelihood-nya adalah sebagai berikut:

       1 2 n T

      1 1 -1  

      L   , ; yf y  exp  yX    yX           n   2 1 2 (3.3.1)

      2

        

      2  

         

      Sebagaimana sebelumnya, Metode ML menggunakan fungsi log-likelihood, yaitu: T

      1 -1 ln L   , ; y   c ln  yX    yX 

               (3.3.2)

         

      2 n

       c   ln 2

       

      dengan adalah suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut

      2

      ,

       

      diturunkan terhadap , dinotasikan dengan s   , sehingga untuk elemen ke-j didapat formula berikut ini: T

      1 -1 -1 -1

      1

    s   , tr       

    j   j   j  

       yX y

      X     (3.3.3)

         

      2

      2     

      j dengan   .

       j

      Sesuai dengan Metode ML, berikutnya (3.3.3) dicari solusinya menjadi -1 -1 -1 T ˆ ˆ

      tr   yX       yX 

             

    j j

      (3.3.4)         Terlihat dari (3.3.4) tidak dapat diselesaikan secara analitik. Oleh karena itu, taksiran dengan Metode ML kemudian diselesaikan secara numerik. Pada Makalah ini, a 1

       

      ˆ

      1

      a  , yaitu

      algoritma yang digunakan adalah Scoring Algorithm di mana iterasi ke- , secara iteratif menggunakan formula sebagai berikut: a 1 a a a a1

               

      ˆ ˆ ˆ ˆ ˆ ˆ

      

      s   ,

       

         

      dengan T T T T T ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ

        ˆ ˆ ˆ ˆ

      s   ,  s   , , s   , , , s   ,         1 2 q dan 1 2 q                

      

       

      di mana 2

         ln L   , ; y  

      1 -1 -1     Etr     jk    

        j   k (3.3.5)  

           

    k j

      2  

      Berdasarkan penjabaran di atas, didapatkan taksiran parameter dari variansi efek

      

    random ˆsecara numerik yang selanjutnya akan digunakan dalam penaksiran parameter

      pada General Linear Mixed Model sesuai dengan Metode EBLUP.

      

    3.4. Penaksiran Parameter pada General Linear Mixed Model dengan Metode

    EBLUP

      Taksiran parameter pada General Linear Mixed Model dengan menggunakan

       ˆ y  

      Metode EBLUP didapat dengan mensubstitusikan taksiran , dinotasikan dengan ,

      ˆ

      ke ˆ dan , yaitu: 1 T 1 T1 ˆ ˆ ˆ

      ˆ

        y y , 

    X  

      X X   y   dan

              T 1

      ˆ ˆ ˆ ˆ ˆ ˆ

        y y ,  G  Z   yX   y y ,    

               

      Berdasarkan (2.4) taksiran kombinasi linier yang baru adalah sebagai berikut: T T ˆ ˆ ˆ ˆ

      

      ˆ ˆ  y y      y y      y y  .

            (3.4.1)

           

      ˆ

       ˆ

      ˆ

       y y  ˆ y

       

      Oleh karena tersebut didapat dengan mensubstitusikan   ke ˆ dan ,

       

      maka perlu dibuktikan ketakbiasan dari taksiran tersebut. Sebelumnya diketahui lemma berikut ini:

      Lemma 3.1 z z

      Jika adalah vektor random berdistribusi simetris di sekitar nol sedemikian sehingga

      z  

      dan identically distributed, dan f z adalah variabel random yang merupakan fungsi

      z f    z f     z , maka   ganjil dari sehingga f z berdistribusi simetris di sekitar nol.

      ˆ ˆ

      E   y  y  ˆ y  

       

      Sebelumnya diketahui bahwa berhingga dan merupakan

         

    y

      fungsi genap serta translation-invariant dari sehingga didapat

      ˆ ˆ ˆ ˆ  y yX  ZbeZbe

      

           

      (3.4.2)

      ˆ

      E  ˆ   t y y  

       

      Oleh karena terbukti bahwa maka dapat disimpulkan bahwa

         

      T T

      ˆ

      

      ˆ

       y y   

        tetap unbiased untuk mengestimasi     .

       

    4. PENERAPAN

      Sebuah Waralaba makanan cepat saji ingin menambahkan produk makanan baru dalam daftar menunya. Oleh sebab itu, pihak marketing mengusulkan kepada pihak

       

      manajemen tiga pilihan bentuk promosi atau campaign X yang akan diujicobakan di

       

      enam lokasi Waralaba atau location Z yang dipilih secara acak dari sepuluh Waralaba yang ada. Namun, selama satu bulan pertama pihak manajemen ingin melihat terlebih dahulu seberapa besar pengaruh masing-masing bentuk promosi dan lokasi Waralaba dalam meningkatkan penjualannya (sales). Diasumsikan bahwa matriks-matriks varians kovarians

       

      RG 1 g

      I 1 dan merupakan parameter dari

      dari e dan b, yaitu I dan r di mana

      I r g

       variansi e dan b sedangkan merupakan matriks identitas berukuran 30 30 dan

      I dan

      6 6  . Sebelum melakukan penaksiran parameter pada General Linear Mixed Model, perlu diperiksa terlebih dahulu kenormalan dari variabel dependen (Sales). Dengan menggunakan

      Metode EBLUP didapatkan taksiran dari parameter-parameter tersebut, yaitu sebagai berikut. T

      ˆ  46.0171, 832.7489

        T

       ˆ . , ,

     230 0812 191.1613 218.5482

        T

      ˆ  53 4308 -0.2670 -38.0198 -5.1867, 11.8286, -21.7859 . . , , ,

      

    5. KESIMPULAN

      Dari pembahasan Makalah ini dapat disimpulkan bahwa Metode Empirical Best

      

    Linear Unbiased Prediction (EBLUP) yang merupakan perluasan dari Metode Best Linear

    Unbiased Prediction (BLUP) dapat digunakan untuk menaksir parameter pada General

    Linear Mixed Model dengan terlebih dahulu melakukan penaksiran terhadap parameter dari

    variansi efek random yang pada kenyataannya tidak diketahui nilainya.

      REFERENSI Anton, H. (2000), Dasar-Dasar Aljabar Linier, Batam: Interaksara.

      Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications, New York: Springer. Harville, D. A. (1997), Matrix Algebra from A Statistician’s Perspective, New York: Springer. Kackar, R. N., and Harville, D. A. (1981), Unbiasedness of Two-stage Estimation and

      Prediction Procedures for Mixed Linear Models, Communications in Statistics, Series A, 10, 1249-1261.

      McCulloch, C. E., and Searle, S. R. (2001), Generalized, Linear, and Mixed Models, New York: John Wiley and Sons. Phydelya, A. (2007), Penggunaan Metode Best Linear Unbiased Prediction pada Generalized Linear Mixed Model, Depok: Departemen Matematika FMIPA UI. Searle, S.R., Casella, G., and McCulloch, C. E. (1992), Variance Components, New York: Wiley.