Model Dasar Pendugaan Area Kecil

10

BAB II METODE PENDUGAAN AREA KECIL

Disertasi ini membahas pengembangan teknik pendugaan area kecil khususnya pengembangan prediksi terbaik empirik untuk model transformasi. Berikut disajikan kajian ulang metode-metode baku dalam pendugaan area kecil sebagai pengantar untuk memahami permasalahan serta konsep dasar pendugaan parameter dalam SAE. Dalam bab ini dibahas model dasar pendugaan area kecil, konsep pendugaan berbasis disain survei, penduga BLUPEBLUP, dan penduga Bayes.

2.1. Model Dasar Pendugaan Area Kecil

Penduga parameter yang bersifat kekar untuk suatu area kecil, saat ini merupakan tujuan penting bagi banyak badan dan penelitian dalam SAE. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil ke-i i  didasarkan pada aplikasi model disain penarikan contoh design-based, pendugaan tersebut kemudian disebut pendugaan langsung direct estimation. Metode pendugaan tersebut menimbulkan dua permasalahan penting. Pertama, penduga yang dihasilkan merupakan penduga tak bias tetapi memiliki ragam yang besar karena diperoleh dari ukuran contoh yang kecil. Kedua, apabila pada suatu area kecil ke-i tidak terwakili di dalam survei, maka tidak memungkinkan dilakukan pendugaan secara langsung. Adakalanya kita memiliki informasi tambahan yang dapat digunakan untuk pendugaan pada area kecil. Dalam beberapa kasus kita bisa memperoleh informasi tentang parameter yang menjadi perhatian dari area kecil lain yang memiliki karakteristik serupa, atau nilai pada waktu yang lalu, atau nilai dari peubah yang memiliki hubungan 11 dengan peubah yang sedang diamati. Pendugaan paramater dan inferensinya yang menggunakan informasi tambahan tersebut, dinamakan pendugaan tidak langsung indirect estimation atau model- based estimation. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat ”meminjam kekuatan” borrowing strength informasi dari hubungan antara peubah respon dengan informasi yang ditambahkan. Metode ini memiliki sejarah yang panjang tetapi baru mendapat perhatian dalam beberapa dekade terakhir untuk digunakan sebagai pendekatan pada pendugaan parameter area kecil. Dalam hal ini, dua ide utama digunakan untuk mengembangkan model pendugaan area kecil yaitu 1 asumsi bahwa keragaman di dalam area kecil, peubah respon dapat diterangkan seluruhnya oleh hubungan keragaman yang bersesuaian pada informasi tambahan, kemudian disebut model pengaruh tetap fixed effect models, dan 2 asumsi keragaman spesifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area kecil random effect. Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator Levy dan French, 1977, composite estimator Schaible et. al., 1977 dan prediction estimator Holt et. al., 1979; Sarndal, 1984; Marker, 1999. Secara lengkap pembahasan penduga-penduga tersebut disajikan dalam Rao 2003. Fay dan Herriot 1979 secara umum menggunakan model pengaruh campuran linear mixed model dengan pengaruh acak yang hanya mengandung intersep, dengan kata lain model hanya meliputi pengaruh acak area, untuk menduga rata-rata pendapatan sub- populasi 1000 menggunakan data sensus 1970 di Amerika Serikat. Model Fay-Herriot tersebut merupakan model dasar bagi 12 pengembangan pemodelan area kecil yaitu i i i y e    ; T i i i x      , dimana i e dan i  saling bebas dengan E i e = E i  = 0 serta Var i e = 2 i  dan Var i  = 2  i = 1, 2, 3, ..., m. i y adalah penduga langsung bagi area ke-i dan diperoleh dari data survei yang bersesuaian, i  merupakan parameter yang menjadi perhatian, i e adalah galat contoh,   1 2 , , ..., i i i ip x x x x  adalah peubah penyerta, dan i  adalah pengaruh acak area. Russo et. al. 2005 menjabarkan lebih lanjut model area kecil dengan memperjelas pengaruh acak sub-populasi di dalam model sebagai berikut : 1.   1 2 , , ..., i i i ip x x x x  vektor data pendukung peubah penyerta 2. T i i i x      untuk i = 1, 2, ..., m merupakan parameter yang menjadi perhatian dan diasumsikan memiliki hubungan dengan peubah penyerta pada 1 sedang i  pengaruh acak dengan nilai tengah nol dan ragam 2  3. i i i y e    penduga langsung untuk sub-populasi ke-i yang merupakan fungsi linier dari parameter yang menjadi perhatian dan galat contoh i e 4. T i i i i y x e      untuk i = 1, 2, ..., m model tersebut terdiri dari pengaruh acak dan pengaruh tetap sehingga merupakan bentuk khusus dari model linier campuran dengan struktur peragam yang diagonal. Model regresi merupakan upaya untuk membentuk model umum dan memanfaatkan kekuatan dan keakuratan pendugaan pada level populasi, sedangkan deviasi sub-populasi untuk menangkap kekhasan 13 yang terjadi pada setiap sub-populasi dan bersifat acak. Dengan demikian jika kita hanya akan memanfaatkan informasi umum maka T i i x    , dan jika pengaruh umum dan lokal kita adopsi, diperoleh T i i i x      . Secara statistika model pada point 4 di atas melibatkan pengaruh acak akibat disain penarikan contoh i e dan pengaruh acak pemodelan sub-populasi i  . Model tersebut merupakan bentuk khusus dari model linier campuran. Salah satu sifat yang menarik dari model campuran adalah kemampuannya dalam menduga kombinasi linier dari pengaruh tetap dan pengaruh acak. Dalam papernya, Henderson 1953, 1975 mengembangkan teknik penyelesaian model pengaruh campuran best linear unbiased prediction BLUP. BLUP menjadi metode yang powerful dan digunakan secara luas. Namun demikian, BLUP yang dikembangkan Henderson 1948-1975 mengasumsikan diketahuinya ragam pengaruh acak dalam model campuran komponen ragam. Dalam praktek, komponen ragam tidak diketahui dan harus diduga berdasarkan data. Harville 1977 melakukan review terhadap beberapa metode pendugaan komponen ragam, dengan memasukkan metode kemungkinan maksimum dan metode kemungkinan maksimum terkendala serta tiga metode yang diajukan Henderson. Penduga BLUP yang diperoleh ketika komponen ragam yang tidak diketahui disubstitusi oleh penduganya, disebut empirical best linear unbiased predictor EBLUP seperti yang dikembangkan Harville 1991. Model campuran telah digunakan untuk meningkatkan akurasi pendugaan pada kasus area kecil berdasarkan data survei dan data sensus oleh Fay dan Herriot 1979, Ghosh dan Rao 1994, Rao 1999, Pfeffermann 1999, Kubokawa 2006 serta Jiang dan Lahiri 14 2006. Pada aplikasi ini, model campuran diturunkan dari konsep bahwa vektor nilai populasi terbatas merupakan realisasi dari superpopulasi. Dalam kasus ini, pendugaan rataan area kecil ekuivalen dengan pendugaan dari perwujudan pengaruh acak area yang tidak diobservasi dalam model campuran untuk sebaran superpopulasi yang dicari rataannya. Selain EBLUP, pendugaan dan inferensi pada pendugaan area kecil juga menggunakan empirical Bayes EB dan hierarchical Bayes HB. Pada pendekatan EB, pendugaan dan inferensi berdasarkan pada sebaran posterior yang parameternya diduga dari data. Persoalan mendasar dalam metode EB adalah lebih sulitnya dalam pendugaan galat model uncertainty model. Beberapa pendekatan telah dikembangkan untuk mengatasi persoalan ini, di antaranya yang umum digunakan adalah metode delta dan bootstrap. Deely dan Lindley 1981 serta Kass dan Steffey 1989 telah mendiskusikan metode delta, sementara Laird dan Louis 1987, Butar 1997 serta Butar dan Lahiri 2003 mengembangkan metode bootstrap. Selain itu, pendekatan lain yang juga diajukan adalah metode jackknife seperti dibahas oleh Wan 1999, Chen 2001, Jiang, Lahiri dan Wan 2002, serta Chen dan Lahiri 2005. Adapun pada pendekatan HB, parameter model yang tidak diketahui termasuk komponen ragam diperlakukan sebagai komponen acak yang masing-masing memiliki sebaran prior tertentu. Ghosh dan Rao 1994 mengulas penggunaan HB pada pendugaan area kecil, sedangkan secara spesifik Maiti 1998 menggunakan non-informative prior untuk kasus hiperparameter pada penggunaan HB. You dan Rao 2000 menggunakan HB untuk menduga rataan area kecil berdasarkan model pengaruh acak. Metode HB mempunyai keuntungan karena pemodelannya dilakukan secara bertahap. Setiap tahap bisa relatif sederhana dan mudah 15 dipahami, meskipun proses pemodelannya secara keseluruhan sangat rumit. Di samping itu, karena sebaran prior dari parameter modelnya didasarkan pada beberapa asumsi, maka penduga HB mempunyai kuadrat tengah galat yang lebih kecil dibandingkan dengan penduga BLUP Ghosh dan Rao, 1994.

2.2. Konsep Pendugaan Berbasis Disain