50
i i
i i
y m x
e
, i = 1, 2, ..., m
4.1 dengan
|
i i
x
~ 0,
, e
i
~ 0,
2 i
, serta
i
e dengan
i
saling bebas. Fungsi nilai tengah area kecil dapat dituliskan sebagai berikut:
i i
i i
x m x
yang merupakan kombinasi linier dari nilai tengah
i
m x dan pengaruh acak
i
. Kita dapat menggunakan suatu teknik pendugaan untuk mendapatkan fungsi pemulus seperti menggunakan fungsi pemulus
linier meliputi pemulus spline, regresi spline, dan local polynomial regression. Lebih lanjut pembahasan mendetail metode-metode
tersebut dapat dilihat pada Hastie dan Tibshirani 1990. Jika digunakan fungsi pemulus kernel untuk menduga mx
i
, penduga terbaik best predictor bagi nilai tengah area kecil
i
dapat dituliskan sebagai berikut
E
i
|y
i
=
i
y
i
+ 1 -
i
h
m ˆ
x
i
4.2 dengan
i
=
+
2 i
. Hampiran MSE bagi penduga parameter tersebut dapat dilakukan dengan mengadopsi pendekatan yang
diberikan Prasad dan Rao 1990 dengan mensubstitusi x
i T
dalam model linier campuran dengan
h
m ˆ
x
i
, sehingga diperoleh formulasi sebagai berikut :
mse
i
θˆ
=
2 i u
2 i
u
D D +
ˆ ˆ
+
2 h
i
1- mse m
x ˆ
ˆ
+
-3 2
2 2
i u
i u
2D + D
mse ˆ
ˆ
. 4.3
4.3. Pendekatan Nonparametrik P-Spline
Pendekatan nonparametrik P-spline dalam pendugaan area kecil terutama diarahkan dalam menangani pengaruh ketidakcocokan model
yang mungkin terjadi. Beberapa kajian yang terkait dengan pengembangan model nonparamterik P-spline dalam pendugaan area
kecil telah dilakukan oleh Zheng dan Little 2004, Opsomer, et.al 2008 serta Kurnia, Notodiputro dan Ibrahim 2007. Hasil kajian
51
awal mereka menunjukkan bahwa pendekatan yang dilakukan mampu memberikan perbaikan hasil jika dibandingkan dengan pendekatan
standar EBLUP maupun EB. Pendekatan P-spline juga cukup memberikan perbaikan yang memuaskan jika data mengandung
pengaruh spasial seperti yang dilaporkan oleh Opsomer, et.al 2008 maupun pengaruh acak gerombol dalam penarikan contoh acak
gerombol Zheng dan Little, 2004. Pendekatan P-spline yang digunakan dalam penelitian ini, dengan
mengikuti metodologi yang dilakukan oleh Opsomer et.al 2008 serta Ruppert, Wand dan Carroll 2003 dapat dideskripsikan sebagai
berikut. Perhatikan model sederhana
y
i
= m
o
x
i
+
i
dengan
i
~ 0,
2
. Jika m
o
. diduga dengan metode p-splines, diperoleh
m
o
x; , =
+
1
x + … +
p
x
p
+
p k
k
κ x
k
dengan p adalah derajat spline, x
p +
adalah suatu fungsi dimana x
p
I
x0
,
1
…
K
adalah himpunan dari fixed knot dan =
,
1
, … ,
p T
, =
1
,
2
, …,
K T
adalah koefisien parametrik dan komponen spline dari model. Jika k cukup besar, maka mx;
, akan memiliki ukuran yang sangat besar sehingga model m
o
x; , berpotensi over-
parameterized. Dengan demikian biasanya digunakan suatu penalti terhadap parameter spline
.
Untuk suatu gugus data {x
i
, y
i
: i = 1, 2, …n}, solusi bagi dan bisa diperoleh dengan meminimumkan bentuk
i 2
i i
, ;
mx y
+
T
52
terhadap dan dengan adalah fixed penalty parameter. Ruppert,
Wand dan Carrol 2003 memperlakukan sebagai pengaruh acak
dalam konteks model linier campuran. Hal ini dilakukan karena penetapan nilai
tertentu akan sangat berpengaruh dalam pendugaan model dan
dengan sendirinya akan memiliki kemungkinan nilai yang banyak.
Karena P-spline maupun model SAE dapat dipandang sebagai model dengan pengaruh acak, sangat memungkinkan untuk menggabungkan
kedua konsep tersebut dalam nonparametric small area estimation framework yang berdasarkan pada model linier campuran.
Kita perhatikan m small area, U
1
, …., U
m
, yang menjadi perhatian. Kemudian kita definisikan d
it
= I
i Um
, dan untuk setiap observasi ke-i,
d
i
= d
i1
, …, d
im T
. Misalkan pula Y = y
1
, …, y
n T
, X dan Z adalah matriks disain sebagai berikut
X =
p n
n p
1 1
x ...
x 1
: :
: :
x ...
x 1
, Z =
p k
1 p
1 n
p k
1 p
1 1
κ x
... κ
x :
: :
κ x
... κ
x
dan D = d
1 T
, …, d
m T
T
. Dengan demikian, hubungan antar komponen tersebut dalam notasi matriks dapat dituliskan sebagai berikut
Y = X + Z + D +
dengan ~ 0,
;
2
I
K
~ 0,
;
2
I
m
~ 0,
;
2
I
n
dan masing-masing komponen bersifat saling bebas. Model Y = X
+ Z + D + mencakup komponen fungsi spline yang sebagai representasi nilai tengah fungsi nonparametrik X
+ Z, dan komponen pengaruh acak area kecil D
. Berdasarkan model ini
53
dengan tetap mengasumsikan Z sebagi faktor pengaruh acak, maka
diperoleh VarY = V = Z
Z
T
+ D
D
T
+
. Jika ragam dari komponen acak diketahui, penyelesaian BLUP mudah
dikerjakan untuk memperoleh dugaan parameter , dan general least
square GLS untuk dan sebagai berikut
ˆ = X
T
V
-1
X
-1
X
T
V
-1
Y ˆ =
Z
T
V
-1
Y - X ˆ
ˆ
=
D
T
V
-1
Y - X ˆ .
Lebih lanjut, untuk suatu area kecil tertentu U
m
, misalkan kita ingin mengetahui nilai tengahnya, maka kita gunakan pendekatan
m m
m m
y = x
+ z + e
ˆ ˆ
ˆ
, yang merupakan suatu kombinasi linier dari penduga GLS dan BLUP
sebagai komponen sintetik pada pendugaan area kecil. Sedangkan pendugaan MSE dari parameter yang menjadi perhatian, selanjutnya
bisa digunakan hampiran yang dilakukan oleh Prasad dan Rao 1990 dengan mensubstitusi komponen sintetik dengan hasil dugaan P-
spline.
4.4. Penerapan Model Aditif dan Nonparametrik pada Data Susenas