7. Ignacia Diana L. & Dwi Ispriyanti

Ignacia Diana Larissa1 dan Dwi Ispriyanti2 (Penentuan Estimasi Parameter Regresi dengan Variabel...)

PENENTUAN ESTIMASI PARAMETER REGRESI DENGAN VARIABEL
DEPENDEN TERSENSOR
Ignacia Diana Larissa1 dan Dwi Ispriyanti2
1, 2
Program Studi Statistika Jurusan Matematika FMIPA Universitas Diponegoro
Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang
Abstract. Regression analysis is a statistical analysis that use relation between two or more
variables. To use regression analysis, the value of each variable (dependent or independent) must
be available. In fact, not all of the information is available. Missing value on dependent variable
cause Ordinary Least Square is no longer to be used. One method to handle this problem is
censored regression. On this regression, missing value is replaced with a censored point. This
censored point may occur naturally or made by researcher, depend on the goal of research.
Maximum Likelihood Method following Newton-Raphson Iteration Method, is used to get
parameter estimation of censored regression. Test of model signification uses Likelihood Ratiotest and Wald-test.
Keywords: censored point, maximum likelihood method, Newton Raphson Iteration method.

1. PENDAHULUAN
Model regresi linear adalah suatu
model yang digunakan untuk mengetahui

hubungan antara sebuah variabel dependen
dengan
satu
atau
lebih
variabel
independen.
Menurut [2] persamaan
umum model regresi adalah:
y i   0  1 xi1   2 xi 2     p xip   i .
Masing-masing
koefisien
diestimasi dengan menggunakan metode
kuadrat terkecil (Ordinary Least Square).
Menurut G. David Garson model regresi
dengan metode OLS hanya cocok
diterapkan untuk variabel dependen yang
kontinu dan tidak mengalami pembatasan
nilai. Tetapi pada kenyataannya, variabel
dependen dapat mengalami pembatasan

nilai atau sering disebut sebagai variabel
dependen tersensor ( terbatas).
Misalkan ingin diteliti besarnya
pengeluaran konsumsi telur suatu rumah
tangga
dikaitkan
dengan
tingkat
pendidikan kepala rumah tangga, jumlah
anggota rumah tangga, dan rata-rata
pengeluaran per bulan suatu rumah tangga.
Kenyataannya tidak semua rumah tangga
terpilih memiliki informasi tentang
besarnya jumlah pengeluaran untuk
konsumsi telur dikarenakan rumah tangga
135

tersebut tidak memberikan informasi
tentang seberapa besar pengeluaran
konsumsi telur.

Dengan hilangnya
informasi terhadap variabel X tersebut ,
maka metode kuadrat terkecil tidak dapat
digunakan
untuk
mengestimasi
parameternya.
Salah satu metode statistika yang
dapat digunakan untuk menentukan model
bila terjadi pembatasan pada variabel
dependennya adalah model regresi
tersensor. Pada model regresi tersensor
beberapa nilai sampel dicatat sebagai nilai
batas dari nilai yang sebenarnya. Data
pengamatan pada variabel jenis ini
mengelompok akibat adanya batas bawah
(tersensor kiri), batas atas (tersensor
kanan) atau dapat juga keduanya.
Pembatasan tersebut dapat terjadi secara
alamiah seperti beberapa nilai yang lebih

dekat terhadap suatu nilai tertentu.
Pembatasan juga dapat ditentukan oleh
peneliti
tergantung
pada
tujuan
penelitiannya [1]. Adanya pembatasan
terhadap suatu nilai tertentu terhadap
variabel dependen Y, sebut
saja a,
mengakibatkan distribusi data tersebut
berubah. Jika suatu populasi telah
diketahui berdistribusi normal, maka
distribusi akibat adanya pemotongan nilai

Jurnal Matematika Vol. 11, No.3, Desember 2008:135-140

tertentu berubah menjadi distribusi normal
tersensor.
Sebelum

pembentukan
model
regresi tersensor, terlebih dahulu harus
ditentukan dulu mean tersensor dan varian
tersensor dari distribusi normal tersensor,
sehingga
mempermudah
langkah
selanjutnya untuk melakukan estimasi
terhadap parameter-parameternya.
2.

METODE MAKSIMUM
LIKELIHOOD
Misalkan X variabel random
distribusi probabilitas f(x|, dengan
parameter tunggal  tidak diketahui.
Misalkan X1, X2, …, Xn adalah sampel
random dari populasi dengan densitas f(xi|
k, maka menurut [5], fungsi

Likelihood didefinisikan dengan:





n

L 1 ,  2 , ,  k / X  f  xi / 1 ,  2 ,  , k 
~

i 1

Untuk
menentukan
estimator
maksimum Likelihood dari  dapat
digunakan langkah berikut ini:
Tentukan fungsi Likelihood:





L 1 , 2 ,, k / X
~



n

 f  xi / 1 ,  2 ,  ,  k  .
i 1



l log L 1 ,  2 ,  , k / X
~

Tentukan turunan dari



l



1 , 2 , , k :



.

Bentuk persamaan Likelihood dan

selesaikan

log L 1 ,  2 , ,  k / X 0
~
 i






maka probabilitas tersensor y = a bernilai
Prob(y = a) = Prob (y* ≤ a)
 1  y *   2 
a
1
 
 dy *
exp
=
 2    

2 


a 

1




e



1 2
z
2

dz
,
2
y* 
1
dengan z 
dan dy* dz .



a 
.
Sehingga Pr ob( y a) 
  
Sedangkan untuk probabilitas tidak
tersensor y = y* adalah
Prob (y = y*) = Prob (y* > a)
=1  Prob ( y* a)
a 

= 1  
  
Menurut [4] fungsi densitas dari y
adalah:
= 

1  y  
 1
 

f ( y) 
e 2  
 2 


2

1 j






1 j

  a   
    

 

j

j

  a   
    , (5)

 

 1 , jika y a
,
 0 , jika lainnya

dengan j 

terhadap


log L  1 ,  2 ,  k / X
~
 i

 a , jika y* a
y 
 y * , jika lainnya

 1  y   
=  

   

Bentuk log Likelihood :


Variabel tersensor didefinisikan
sebagai berikut.
Misalkan y* berdistribusi normal
dengan mean μ dan varian σ2,

 dan  masing-masing adalah fungsi
densitas dan fungsi distribusi dari
distribusi normal standar. Selanjutnya dari
persamaan (5) diperoleh densitas untuk
nilai y = y* atau nilai y > a adalah
1  y*  
f ( y*)  

   
dan densitas dari y = a adalah :
a 
f ( a ) Prob ( y a ) 
.
  

3. DISTRIBUSI NORMAL
TERSENSOR

136

Ignacia Diana Larissa1 dan Dwi Ispriyanti2 (Penentuan Estimasi Parameter Regresi dengan Variabel...)





*
'
2
diasumsikan y i ~ N x i  ,  dan





f  i / x i'  f    .
Nilai ekspektasi variable dependen baru
y i diketahui x i' adalah







E y i / x i'  i . a  1    i  x i' 



Gambar 1. Variabel Normal y* dan
Variabel Tersensor y
Menurut [3] momen untuk variabel normal
tersensor adalah:
jika y* ~ N[  ,  2 ] maka
E [ y ] a  (1   )(    ) dan



i
 i . a  1   i  
 x i'  
 1 i

'
 i . a  i  x i  1   i  .
Sedangkan nilai variansi dari variabel
dependen baru y i diketahui x i' adalah

Var [ y ]  2 (1   )[(1   )  (   ) 2 ]
a 
a 
     ,
dengan  
, 

  

a 

     
    ,
1 
  
dan 2    .

Var y i / x i'  2 1   i  1   i    i  i   i ,

4. MODEL REGRESI TERSENSOR
Model yang didasarkan pada
variabel dependen tersensor disebut
dengan model regresi tersensor . Model ini
dibentuk dengan mengaitkan mean yang
sudah diperoleh sebelumnya dengan model
regresi linear. Persamaan umum model
tersebut adalah y i *  xi '    i
jika y i * a
a ,
dan y i 
,
 y i * , jika y i *  a
dimana:
y i*
: variabel dependen laten
yi
: variabel dependen yang diamati
'
x i 1 xi1 x12  xik  : vektor
variabel independen
0 
 
 1
   
 
 k
 





dengan  i 

2

: vektor koefisien dan

a



a  x i' 
,


 a  x 'i  
 ,
 i   i  
  

  i 
 i    i  
dan
1    i 
i

a
 i  



x i' 



.


ESTIMASI PARAMETER
Metode untuk melakukan estimasi
parameter tersensor ini digunkan dengan
metode Maksimum Likehood dengan
variabel dependen baru. Fungsi loglikelihoodnya adalah
log L  ,  / xi'





 n  1  y  x'
i
log    i
 i 1    



 


1 j

  a  xi' 

  


 


j






  1  y  x '    1 j
  a  xi' 
i
   log 
 log   i
  
i 1 
  

 
n

adalah titik sensor, dan  i diasumsikan
berdistribusi normal dengan mean 0 dan
varian σ2 [4]. Karena  i berdistribusi
normal maka menurut [2] dapat
137




 y  xi' 
1
  log  2  log 2   i
2 yi a 




 a  xi' 
  log 
yi a
 










2






 


j






Jurnal Matematika Vol. 11, No.3, Desember 2008:135-140


1
dan  


maka fungsi log likelihoodnya menjadi
log L ,  / xi' 
Dengan mengganti  





1
 log  2  log 2  yi  xi'

2 yi a





 log a 



y i a





 x y  x     x    0 .

2

'
i







dan



 log a 

xi'  .

G



y i a



2

Metode Newton Raphson Untuk Regresi
Tersensor
Turunan kedua dari persamaan diatas
adalah :
 2 log L  ,  / xi' 
 



 log L  ,  / xi'
0
 
, di mana
 


 log L  ,  / xi'
 
 

  1


   2
 






 log 2 



log 2  yi  xi'

 log  a 


xi'  0 .






 log  a 



2 log L  ,  / xi'
 



2

















yi a

i

y a



log  2  yi  xi'



'
i

i

y i a









 x x    x x  
'
i

yi a

'
i

'
i

'
i

i

i

 i

2



y i a

,

( i )
.
 ( i )

 log 2 

  x    





II.
 1

 2

 
'
'
  xi yi  xi 
  y i  a

 '  a  xi' 
  x x    xi
' 
yi  a
y i a   a  xi 

1

'

  yi yi  xi   a   ( i ) 0 ,
yi a
y i a






' '
i i

  a ( ) 0

 yi yi  xi' 

dengan  ( i ) 



y i a

2 log L ,  / xi' 
 

a a  xi'

0
'
y i 0  a  xi
1


y i  a




  1

'
    yi yi  xi   a    i  
  y i  a 

y i a

2
'
'
  yi xi  a   i i  i xi ,
yi  a


xi'  0


1
1 1
( 2)   ( 2)  yi yi  xi'
2
2
y i  0
yi 0



,



 1
log 2  log  2  yi  xi'


2
yi a

y i a





 1
2
2
    2  yi   a 2   i i  i


y i  a
y i a

Dilakukan perhitungan secara terpisah:
I.



2






y i a







  1

'
    yi yi  xi   a    i  
  y i  a 

y i a


 a  xi'
 1
2
    2  yi   a 
'

y i  a 
y i a  a  xi 

y i a



i

y i a

Kemudian penyelesaiannya digunakan
metode iterasi Newton Raphson.



1
 log 2  log 2  yi  xi'
2 yi a

'
i

yi  a

y i a



'
i

i




xi' a  xi'
0

'
y i 0  a  xi

1
 ( 2)  xi' yi  xi' 
2
yi  a



xi'


xi'  0


 log  a 

2



2 log L ,  / xi' 
 

yi a

138

Ignacia Diana Larissa1 dan Dwi Ispriyanti2 (Penentuan Estimasi Parameter Regresi dengan Variabel...)



 
'
'
  xi yi  xi 
  y i  a

  x    



'
i

i

   
m1 m 1
  H gmm
m1 ˆˆ m



y i a







 '  a  xi' 
  x y    xi
' 
yi a
y i a   a  xi 
'
i i

 

  xi' yi  a  xi'  i i  i
yi a

y i a

2

 .

Diperoleh matriks turunan kedua adalah









 2 log L  ,  / xi'

 
G  2
'
  log L  ,  / xi

 










 2 log L  ,  / xi'
 
2
 log L  ,  / xi'
 







 h11 h12 
dengan H m 
 , di mana
 h21 h22 
 1
2
2
h11    2  yi   a 2   i i  i ,

y  a 
y a

,
 g11
atau G 
 g 21

g11    
y  a
i

g12 
, dengan
g 22 
1
2
2
 yi   a 2   i i  i
2


y i a





2







i

i

yi a

g 22 

h21

i

 
 dan
  x x      .

g 21   xi' yi  a  xi'  i i  i
' '
i i

yi a

h22

i

i

i

y i a

Sehingga diperoleh matrik Hessiannya
adalah H m  G atau



  2 log L  ,  / xi'

 
H m   2
'
  log L  ,  / xi

 







'
i



2 log L  ,  / xi'
 
2
 log L  ,  / xi'
 



Dengan demikian estimasi parameter
dengan metode Maksimum Likelihood
dengan bantuan metode Newton Raphson
dapat dirumuskan










i

i

y i a

'
i

2

 i xi' ,
2

'
i

i

i

i

i

y i a

2

' '
i i

yi a

2

' '
i i



i

yi a

2

y i a

x x

 y x     

yi  a

'
i



i

 
  x y    x      ,
  x x         x  dan

h12 

yi x  a   i i  i x ,
, g12  y
a
y a
'
i

,

i

i

i

'
i

y i a

 1


'
     yi  y i  x i     a  i 
 yi a  .
g m   yi  a 
'
'
'
   x i  yi  x i     x i i 
yi a
 yi a

Jika nilai estimasi parameter ˆ dan ̂
telah diperoleh maka dengan menggunakan
1
ˆ
persamaan ˆ  ˆ dan ˆ  ˆ nilai


estimasi parameter ˆ
dan ˆ dapat
diperoleh. Sehingga
diperoleh model
regresi tersensor dugaan yaitu:
E  yi / xi'   i a  1   i  ˆi  xi' ˆ ,
 a  xi' ˆ 

 
ˆ 

dengan i 
.
 a  xi' ˆ 

1  

 ˆ 





5. KESIMPULAN
1.
Model regresi dengan metode OLS
hanya cocok diterapkan untuk variabel
139

Jurnal Matematika Vol. 11, No.3, Desember 2008:135-140

dependen yang tidak mengalami
pembatasan nilai.
2.
Model regresi dengan variabel
dependen tersensor, metode estimasi
parameternya digunakan adalah metode
Maksimum Likehood yang dilanjutkan
dengan
metode
iterasi
Newton
Rapshson. Pembatasan dapat terjadi
secara alamiah atau dapat juga
ditentukan oleh peneliti tergantung pada
tujuan penelitiannya.
3.
Harga mean dan varian dari regresi
tersensor berturut-turut adalah
E [ y ] a  (1   )(    ) dan
Var [ y ]  2 (1   )[(1   )  (   ) 2 ]

[3] Hamilton, James D. (1994), Time
Series Analysis, Princeton University
Press, UK.
[4] Joreskog, K.G. (2002), Censored
Variabels and Censored Regression,
http://aac.asm.org/cgi/reprint/50/1/62
diakses tanggal 20 Mei 2008

6. DAFTAR PUSTAKA
[1] Frone, R. Michael (1997), Regression
Models For Discrete and Limited
Dependent
Variabels,
http://division.aomonline.org/rm/1997
_forum_regression_models.htmlfrone
diakses tanggal 20 Mei 2008.
[2] Greene,
H.
William
(1993),
Econometric Analysis, second edition,
Macmillan Publishing Company, USA.

140