ESTIMASI REGRESI PADA STRATIFIED SAMPLING
Oleh: Adhi Kurniawan
SEKOLAH TINGGI ILMU STATISTIK
ESTIMASI REGRESI PADA STRATIFIED SAMPLING
Tepat digunakan jika true regression coefficient nilainya bervariasi antarstrata. Koefisien regresi diestimasi pada masing-masing strata
Separate Tepat digunakan jika jumlah sampel tiap strata besar
Regression Estimasi Estimator
Biasnya cenderung besar, varians cenderung kecil regresi
Informasi nilai harus diketahui pada stratified
Tepat digunakan jika true regression coefficient diasumsikan sama untuk semua strata. sampling
Estimasi koefisien regresi untuk semua strata sama -
- -> menggunakan combined regression coefficient
Combined Regression Variansnya cenderung besar, biasnya cenderung kecil
Estimator
SEPARATE REGRESSION ESTIMATOR
Ilustrasi Rumus umum (SRS)
Strata 1 Strata 2 Strata 3 Koefisien regresi
ℎ
ℎ = =
ℎ ℎ
2 ℎ
ℎ
1
1
2
2
3
3 Estimasi rata-rata strata
11
11
21
21
31
31
= − +
ℎ ℎ ℎ ℎ ℎ
1 −
ℎ
12
12
22
22
32
32
2
2
2
- = − 2
ℎ ℎ ℎ ℎ
ℎ ℎ
ℎ
… … … … … … 1 −
ℎ
2
2
= 1 −
ℎ ℎ 1 1 1 1 2 2 2 2 3 3 3 3 ℎ
Estimasi rata-rata populasi , , ,
=
ℎ ℎ
, , ,
1
1
2
2
3
3 ℎ=1
2
= ( − ) = +
- ( − )
1
1
1
1
1
3
3
3
3 3 = ℎ
ℎ ℎ=1
= ( − + )
2
2
2
2
2 Estimasi total populasi
=
2
= =
1
1
2
2
3
3
SEPARATE REGRESSION ESTIMATOR
› Contoh:
Suatu populasi N=10 pekerja di suatu industri batik dikelompokkan menjadi 2 strata
menurut jenis kelamin lalu dilakukan pengambilan sampel secara SRS WOR 1. laki-laki:= 6 --> = 4
1
1
2
2 Diketahui rata-rata masa kerja pegawai laki-laki adalah 3,7 tahun dan perempuan 5,8
2. Perempuan: = 4 --> = 3
tahun. Data yang diperoleh: Laki-laki Perempuan
Batik yang Batik yang Masa Masa No dihasilkan per No dihasilkan per kerja kerja bulan bulan
1
3
3
1
6
9
2
5
6
2
5
6
3
4
4
3
7
9
4
2
3
Strata = =
1
2 Strata
− −
2 ℎ
= = =
2
= = =
= = Estimasi total produksi batik perusahaan sebulan:
ℎ=1
=
ℎ
1
= + − =
ℎ=1
=
ℎ ℎ
Estimasi rata-rata batik yang diproduksi satu orang pekerja sebulan: =
2 Jumlah
=
Strata = =
1
6 4 0,6 3,7 3,5 1,29 4 1,41 0,91
1 4/6
2
4 3 0,4 5,8
6
1 8 1,73 0,86 1,5 3/4 Strata
−
- = −
= − 1 4,2 0,0278 2,52 0,01 2 7,7 0,0625 3,08 0,01
Jumlah 5,6 0,02
Estimasi rata-rata batik yang diproduksi Estimasi total produksi batik perusahaan satu orang pekerja sebulan: sebulan:
= = 10 × 5,6 = 56 = = 2,52 + 3,08 = 5,6
2 ℎ ℎ
=
ℎ=1
2
= 10 × 0,02 = 2
2
= 1,414 = = 0,01 + 0,01 = 0,02
ℎ ℎ
1,414
ℎ=1
= = 0,1414 56 × 100% = 2,52%
0,1414
= × 100% = 2,52%
5,6
COMBINED REGRESSION ESTIMATOR
Ilustrasi Rumus umum (SRS)
Strata 1 Strata 2 Strata 3 stratified sampling Estimasi rata-rata untuk
= , =
ℎ ℎ ℎ ℎ
1
1
2
2
3
3 ℎ=1 ℎ=1
11
11
21
21
31
31 Sampling variance dan sampling covariance:
12
12
22
22
32
32
1 −
ℎ
2
2
… … … … … … =
ℎ ℎ ℎ
ℎ=1 1 1 1 1 2 2 2 2 3 3 3 3
1 −
ℎ
2
2
=
ℎ ℎ
, , ,
1
1
2
2
3
3 ℎ
ℎ=1
, 1 −
ℎ
2
, =
ℎ ℎ ℎ
,
ℎ
)
ℎ=1
( , Koefisien regresi gabungan )
( , , = =
= −
COMBINED REGRESSION ESTIMATOR
Ilustrasi Rumus umum (SRS)
Strata 1 Strata 2 Strata 3 Estimasi rata-rata karakteristik:
- = −
1
1
2
2
3
3
2
(1 − )
ℎ ℎ
2
2
2
11
21
21
31
31 = − 2
- 11
ℎ ℎ ℎ ℎ
ℎ ℎ=1
12
12
22
22
32
32
… … … … … … Estimasi total karakteristik:
1 1 1 1 2 2 2 2 3 3 3 3
= Unbiased sampling variance:
2
, , ,
1
1
2
2
3
3
= , Keterangan: ,
ℎ ℎ ℎ ℎ ℎ
( , ) ( , =
) =
= −
COMBINED REGRESSION ESTIMATOR
› Contoh:
Suatu populasi N=10 pekerja di suatu industri batik dikelompokkan menjadi 2 strata
menurut jenis kelamin lalu dilakukan pengambilan sampel secara SRS WOR 1. laki-laki:= 6 --> = 4
1
1
2
2 Diketahui rata-rata masa kerja pegawai laki-laki adalah 3,7 tahun dan perempuan 5,8
2. Perempuan: = 4 --> = 3
tahun. Data yang diperoleh: Laki-laki Perempuan
Batik yang Batik yang Masa Masa No dihasilkan per No dihasilkan per kerja kerja bulan bulan
1
3
3
1
6
9
2
5
6
2
5
6
3
4
4
3
7
9
4
2
3
Strata
1 −
2
1 −
ℎ ℎ ℎ=1 ℎ
2
= ; =
ℎ
2
ℎ ℎ
ℎ=1
ℎ= =
2
= , =
ℎ
2
1 −
ℎ ℎ ℎ
= ; =
ℎ
ℎ ℎ ℎ=1
= =
1 −
1
2 Jumlah
Strata ℎ
2
1 −
ℎ ℎ ℎ
2
ℎ ℎ ℎ
, =
2
1 −
ℎ ℎ
1
2 Jumlah =
ℎ ℎ
=
ℎ=1
, =
Strata
2
ℎ ℎ ℎ=1
= 4,5 =
ℎ
2
1 −
ℎ ℎ ℎ=1 ℎ
2
= 0,1 ; =
ℎ
1 −
ℎ=1
ℎ ℎ
ℎ=1
ℎ2
= 0,0633 , =
ℎ
2
1 −
ℎ ℎ ℎ
= 0,07 ; =
, = 0,07
, =
= 5,6
= =
2
1
6 4 0,6 4/6
3,7 3,5 4 2,1 2,4
2
4 3 0,4 3/4
5,8
6 8 2,4 3,2 Jumlah
4,5 5,6
Strata ℎ
1 −
ℎ ℎ
ℎ ℎ ℎ
2
1 −
ℎ ℎ ℎ
2
1 −
ℎ ℎ
1 1,29 1,41 0,91 1,67 0,0500 0,06 0,05
2 1 1,73 0,86 1,50 0,0133 0,04 0,02 Jumlah 0,0633 0,10 0,07
=
0,0633 = 1,106
COMBINED REGRESSION ESTIMATOR
Rata-rata jam kerja populasi = = 0,6 × 3,7 + 0,4 × 5,8 = 4,54
ℎ ℎ ℎ=1
Estimasi rata-rata produksi batik untuk tiap pekerja selama sebulan:
- = − = 5,6 + 1,106 4,54 − 4,5 = 5,64
2
(1 − )
ℎ ℎ
2
2
2
= − 2 +
ℎ ℎ ℎ ℎ
ℎ ℎ=1
= 0,0226 = 0,0226 = 0,1503
0,1503 =
5,64 × 100% = 2,66% Estimasi total produksi batik perusahaan selama sebulan:
= = 10 × 5,64 = 56,4
2
= = 100 × 0,0226 = 2,26 = 2,26 = 1,503
1,503 =
56,4 × 100% = 2,66%
LATIHAN 1
Suatu survei stratified random sampling dilakukan di suatu desa untuk mengetahui
pengeluaran untuk bidang pendidikan di desa tersebut. RW dianggap sebagai strata dan
setiap RW diambil sampel sebanyak 8 rumah tangga. Data yang diperoleh:Populasi Sampel Strata
Ruta Ruta Ruta Ruta Ruta Ruta Ruta Ruta Ruta Penduduk Variabel
1
2
3
4
5
6
7
8 Pengeluaran 1000 1250 1900 1325 1174 1100 1450 1849 (000 rupiah)
RW 1 62 210 ART usia sekolah
2
2
3
2
1
3
4
2 Pengeluaran 2250 1546 2094 2400 2350 1975 2000 2125 (000 rupiah)
RW 2 90 288 ART usia sekolah
3
1
2
2
3
1
2
4
ℎ=1
1 ℎ
ℎ=1 ℎ
2 ℎ
−
∙ ℎ
2
∙ ℎ
1 −
LATIHAN 1
Jika diketahui proporsi penduduk usia sekolah di desa tersebut sebesar 30%, maka:( ) =
Catatan: Untuk point (c) Ingat MPC 1:
d. Jika rumah tangga yang rata-rata pengeluaran pendidikannya lebih rendah dari rata-
rata pengeluaran pendidikan pada point (b) akan mendapatkan bantuan beasiswa sebanyak Rp. 500.000,00 untuk tiap rumah tangga, berapa dana yang harus disiapkan oleh pemerintah ?. Gunakan rumus estimasi pada stratified sampling.Kesimpulan apa yang bisa diperoleh ?
b. Perkirakan pengeluaran rata-rata untuk bidang pendidikan per rumah tangga di desa
tsb beserta standar error, RSE, dan 95%CI-nya dengan estimasi regresi yang anda sebutkan pada point (a). Interpretasikan hasil yang diperoleh !c. Hitung relative efficiency metode estimasi regresi tersebut terhadap penduga SRS !.
a. Jika penduduk usia sekolah ingin digunakan sebagai auxiliarry variable, metode
estimasi regresi manakah yang anda digunakan, separate atau combined ?. Berikan alasan !- ℎ
LATIHAN 2
Untuk mengetahui dampak krisis Eropa 2012 terhadap industri tekstil,
diadakan Survei Deteksi Dini Dampak Krisis terhadap Industri Tekstil dan
Pengolahan Tekstil (TPT) di salah satu provinsi di Indonesia. Populasi
industri TPT di provinsi tersebut dikelompokkan menjadi 2 strata: › Strata 1: Industri TPT yang berorientasi pasar ekspor › Strata 2: Industri TPT yang berorientasi pasar domestik.
Untuk strata 1 dilakukan pendataan secara sensus karena populasi
industri TPT yang berorientasi pasar ekspor jumlahnya kecil, tetapi
diperkirakan industri ini berpotensi terkena dampak yang lebih besar
dari adanya krisis. Untuk strata 2 dilakukan survei dengan pengambilan
sampel secara SRS WOR.
LATIHAN 2
Data yang diperoleh sebagai berikut:Populasi Sampel
Nilai Output (juta Rp) Nilai
Strata Jumlah
Output Tahun Sampel Sampel Sampel Sampel Sampel Sampel Sampel Sampel Sampel
Industri 2011
1
2
3
4
5
6
7
8
9 2011
96 64 120
72
1 4 352 2012
84 72 114
60 2011
16
24
8
12
4
32
28
12
26
2 20 348 2012
15
20
10
9
4
36
30
8
18
a. Dengan menggunakan metode separate regression estimator, perkirakan nilai rata-
rata dan total output tahun 2012 beserta standar error, RSE dan 95% Confidence Interval-nya.
b. Dengan menggunakan metode combined regression estimator, perkirakan nilai rata-
rata dan total output tahun 2012 beserta standar error, RSE dan 95% Confidence Interval-nya.
c. Hitung relative efficiency metode separate regression estimator terhadap combined
regression estimator !BIVARIATE REGRESSION ESTIMATOR
› Bivariate Regression Estimator adalah penduga regresi yang
memanfaatkan dua variabel pendukung untuk memaksimalkan ketelitian dari estimasi nilai karakteristik yang diteliti. › Misalkan adalah estimasi rata-rata dari variabel yang diteliti, adalah penduga yang tidak bias dari rata-rata populasi , dan adalah koefisien regresi dari y pada , di mana k=1,2.BIVARIATE REGRESSION ESTIMATOR
› Formulasi untuk estimasi adalah =
- 2
- 2
- 2
- 2
1
1 − 2
1
2
2
2
2 − 2
1
1 ,
2
1
2 ,
2
1
2
1
2
1 ,
2
2
2
1
2 Unbiased sampling varians: =
2 = +
1
1
1 −
1
2
2 −
1
2
1
2
2
1
2
1 ,
2 = +
- 2
- 2
1
BIVARIATE REGRESSION ESTIMATOR
1 ,
2
› Dengan substitusi
2 = 1 −
1 dalam rumus varians di atas, kemudian melakukan diferensiasi terhadap
1 dan mempersamakan hasilnya dengan nol, didapatkan penimbang yang akan meminimumkan varians, yaitu:
1 =
2 −
- 2
- 2
1 ,
1
2
1 ,
2
2
2 ,
1 −
1 ,
2 = −
1 ,
2
2
2
2 ,
2 = − 2
2
1
1
1 ,
1 = − 2
2 › Keterangan:
− 2
1
2
1 ,
1 −
2 =
2
1 ,
− 2
- 1
- 2
- 1
BIVARIATE REGRESSION ESTIMATOR
15
2
10
10
6
3
12
7
16
4
10
11
8
1
12
16
5
Berikut ini adalah data yang diperoleh dari penarikan sampel industri kerajinan rumah tangga di suatu kecamatan. Jika sampel di atas diambil secara SRS WOR dari populasi N=64 industri dan diketahui jumlah tenaga kerja industri kerajinan rumah tangga di kecamatan tersebut sebanyak 264 orang, serta jumlah input industri kerajinan rumah tangga sebanyak 1200, maka: a. Perkirakan rata-rata output dengan metode regression estimator berdasarkan variabel pendukung jumlah tenaga kerja, beserta rse-nya ! b. Perkirakan rata-rata output dengan metode regression estimator berdasarkan variabel pendukung jumlah input, beserta rse-nya ! c. Perkirakan rata-rata output dengan metode bivariate regression
estimator berdasarkan variabel pendukung jumlah tenaga kerja dan
2
jumlah input, beserta rse-nya ! d. Bandingkan efisiensi dari ketiga metode di atas. No
Tenaga kerja Input Output
1
2
12
14
3
4
14
14
3
5
15
24
4
15
TERIMA KASIH
Have A Nice Sampling