Pendekatan Nonparametrik P-Spline METODE PENDUGAAN TIDAK LANGSUNG

50   i i i i y m x e     , i = 1, 2, ..., m 4.1 dengan | i i x  ~ 0,  , e i ~ 0, 2 i  , serta i e dengan i  saling bebas. Fungsi nilai tengah area kecil dapat dituliskan sebagai berikut:     i i i i x m x     yang merupakan kombinasi linier dari nilai tengah   i m x dan pengaruh acak  i . Kita dapat menggunakan suatu teknik pendugaan untuk mendapatkan fungsi pemulus seperti menggunakan fungsi pemulus linier meliputi pemulus spline, regresi spline, dan local polynomial regression. Lebih lanjut pembahasan mendetail metode-metode tersebut dapat dilihat pada Hastie dan Tibshirani 1990. Jika digunakan fungsi pemulus kernel untuk menduga mx i , penduga terbaik best predictor bagi nilai tengah area kecil  i dapat dituliskan sebagai berikut E  i |y i =  i y i + 1 -  i h m ˆ x i 4.2 dengan  i =   + 2 i  . Hampiran MSE bagi penduga parameter tersebut dapat dilakukan dengan mengadopsi pendekatan yang diberikan Prasad dan Rao 1990 dengan mensubstitusi x i T  dalam model linier campuran dengan h m ˆ x i , sehingga diperoleh formulasi sebagai berikut : mse i θˆ = 2 i u 2 i u D D + ˆ ˆ   + 2 h i 1- mse m x ˆ ˆ  + -3 2 2 2 i u i u 2D + D mse ˆ ˆ   . 4.3

4.3. Pendekatan Nonparametrik P-Spline

Pendekatan nonparametrik P-spline dalam pendugaan area kecil terutama diarahkan dalam menangani pengaruh ketidakcocokan model yang mungkin terjadi. Beberapa kajian yang terkait dengan pengembangan model nonparamterik P-spline dalam pendugaan area kecil telah dilakukan oleh Zheng dan Little 2004, Opsomer, et.al 2008 serta Kurnia, Notodiputro dan Ibrahim 2007. Hasil kajian 51 awal mereka menunjukkan bahwa pendekatan yang dilakukan mampu memberikan perbaikan hasil jika dibandingkan dengan pendekatan standar EBLUP maupun EB. Pendekatan P-spline juga cukup memberikan perbaikan yang memuaskan jika data mengandung pengaruh spasial seperti yang dilaporkan oleh Opsomer, et.al 2008 maupun pengaruh acak gerombol dalam penarikan contoh acak gerombol Zheng dan Little, 2004. Pendekatan P-spline yang digunakan dalam penelitian ini, dengan mengikuti metodologi yang dilakukan oleh Opsomer et.al 2008 serta Ruppert, Wand dan Carroll 2003 dapat dideskripsikan sebagai berikut. Perhatikan model sederhana y i = m o x i +  i dengan  i ~ 0,  2  . Jika m o . diduga dengan metode p-splines, diperoleh m o x; ,  =  +  1 x + … +  p x p +    p k k κ x k dengan p adalah derajat spline, x p + adalah suatu fungsi dimana x p I x0 ,  1 …  K adalah himpunan dari fixed knot dan  =  ,  1 , … ,  p T ,  =  1 ,  2 , …,  K T adalah koefisien parametrik dan komponen spline dari model. Jika k cukup besar, maka mx; ,  akan memiliki ukuran yang sangat besar sehingga model m o x; ,  berpotensi over- parameterized. Dengan demikian biasanya digunakan suatu penalti terhadap parameter spline . Untuk suatu gugus data {x i , y i : i = 1, 2, …n}, solusi bagi  dan  bisa diperoleh dengan meminimumkan bentuk   i 2 i i , ; mx y +    T  52 terhadap  dan  dengan  adalah fixed penalty parameter. Ruppert, Wand dan Carrol 2003 memperlakukan  sebagai pengaruh acak dalam konteks model linier campuran. Hal ini dilakukan karena penetapan nilai  tertentu akan sangat berpengaruh dalam pendugaan model dan  dengan sendirinya akan memiliki kemungkinan nilai yang banyak. Karena P-spline maupun model SAE dapat dipandang sebagai model dengan pengaruh acak, sangat memungkinkan untuk menggabungkan kedua konsep tersebut dalam nonparametric small area estimation framework yang berdasarkan pada model linier campuran. Kita perhatikan m small area, U 1 , …., U m , yang menjadi perhatian. Kemudian kita definisikan d it = I i  Um , dan untuk setiap observasi ke-i, d i = d i1 , …, d im T . Misalkan pula Y = y 1 , …, y n T , X dan Z adalah matriks disain sebagai berikut X =           p n n p 1 1 x ... x 1 : : : : x ... x 1 , Z =                   p k 1 p 1 n p k 1 p 1 1 κ x ... κ x : : : κ x ... κ x dan D = d 1 T , …, d m T T . Dengan demikian, hubungan antar komponen tersebut dalam notasi matriks dapat dituliskan sebagai berikut Y = X  + Z + D +  dengan  ~ 0,   ;     2  I K  ~ 0,   ;     2  I m  ~ 0,   ;     2  I n dan masing-masing komponen bersifat saling bebas. Model Y = X  + Z + D +  mencakup komponen fungsi spline yang sebagai representasi nilai tengah fungsi nonparametrik X  + Z, dan komponen pengaruh acak area kecil D . Berdasarkan model ini 53 dengan tetap mengasumsikan Z  sebagi faktor pengaruh acak, maka diperoleh VarY = V = Z   Z T + D   D T +   . Jika ragam dari komponen acak diketahui, penyelesaian BLUP mudah dikerjakan untuk memperoleh dugaan parameter , dan general least square GLS untuk  dan  sebagai berikut ˆ = X T V -1 X -1 X T V -1 Y ˆ =   Z T V -1 Y - X ˆ  ˆ =   D T V -1 Y - X ˆ  . Lebih lanjut, untuk suatu area kecil tertentu U m , misalkan kita ingin mengetahui nilai tengahnya, maka kita gunakan pendekatan m m m m y = x + z + e ˆ ˆ ˆ    , yang merupakan suatu kombinasi linier dari penduga GLS dan BLUP sebagai komponen sintetik pada pendugaan area kecil. Sedangkan pendugaan MSE dari parameter yang menjadi perhatian, selanjutnya bisa digunakan hampiran yang dilakukan oleh Prasad dan Rao 1990 dengan mensubstitusi komponen sintetik dengan hasil dugaan P- spline.

4.4. Penerapan Model Aditif dan Nonparametrik pada Data Susenas