Estimasi Variansi Dalam Sampling Multi Tahap

BAB 1
PENDAHULUAN

1.1 Latar Belakang
Setiap peneliti mengharapkan agar hasil penelitiannya representatif (menggambarkan keadaan yang sebenarnya).
Agar hasil penelitian lebih dapat dipercaya, maka seorang peneliti seharusnya melakukan sensus. Namun biaya, tenaga dan waktu sering menjadi faktor
penghambat berlangsungnya penelitian, terlebih bila daftar populasi tidak tersedia serta populasi meliputi daerah yang sangat luas. Sehingga boleh jadi peneliti
tidak meneliti keseluruhan elemen atau unsur yang dimaksud.
Untuk mengatasi kendala tersebut maka sebaiknya dilakukanlah penarikan
sampel. Namun perlu diingat teknik penarikan sampel (sampling techniques)
adalah suatu hal yang sangat penting. Karena dalam sampel yang berjumlah
besar bisa menyesatkan jika teknik penarikan sampelnya salah. Sebaliknya, sampel kecil sudah cukup memadai jika teknik penarikan sampelnya benar.
Cochran William G. (1977) Keuntungan utama dari penarikan sampel dua
tahap lebih fleksibel dari penarikan sampel satu tahap. Jika penarikan sampel
acak sederhana digunakan pada ketiga tahap, maka rata-rata sampel per-unit
tahap ketiga adalah suatu perkiraan yang tidak bias.
Langkah-langkah yang perlu diperhatikan dalam pengambilan sampel dengan dua tahap adalah:
1. Menentukan cluster yang tepat, misalnya sesuai dengan kondisi geografis
dan ukuran yang dapat dijangkau atau dikelola.
2. Memilih sampel acak sederhana (boleh juga sistematik) yang ditarik dari
kerangka penarikan sampel berupa daftar semua cluster. Pemilihan ini disebut tahap pertama.


1

2
3. Membentuk kerangka penarikan sampel tahap kedua berupa daftar semua
elemen yang ada di setiap cluster sampel atau cluster yang terpilih dalam
pemilihan pertama.
4. Memilih sampel acak sederhana (boleh juga sistematik) berupa sebagian
elemen-elemen dari setiap cluster sampel atau cluster terpilih. Pemilihan
ini disebut pemilihan tahap kedua yang menghasilkan sampel dua tahap.
Sampling dua tahap sering digunakan untuk memperkirakan total populasi
atau rata-rata x ketika harga perunit dari pengumpulan data tambahan x lebih
kecil dari harga perunit dari pengukuran bunga y. Skema sampling terdiri dari
dua tahap. Pada tahap pertama, sampel besar s1 dari ukuran n1 diambil dari
himpunan U berdasarkan pola sampling khusus dengan probabilitas {p (s1)} dan
x untuk unit sampel i ∈ s1 . s1 disebut sampel tahap pertama, s2 sampel tahap
kedua, dipilih dari s1 berdasarkan pola sampling khusus probabilitas bersyarat
{p (s2 s1)} dan (y, x) untuk unitnya i ∈ s2. Dalam beberapa kasus, total populasi
dari beberapa komponen x1 dari x dapat juga diketahui.
Neyman (1938) pertama sekali mengajukan sampling dua tahap untuk stratifikasi. Sampel s1 tahap pertama, dipilih secara acak sederhana, distratifikasi

pada basis dari sebuah variabel x tambahan konstanta yang dilihat pada unit
di dalam konteks dari sebuah sampel acak sederhana dari tahap pertama s1 dan
ukuran n1 , i ∈ s1 : s1 = ∪g s1g , dimana s1g adalah ukuran acak dari sampel tahap
pertama, n1g , pada stratum g. Pada tahap ke dua, sampel acak sederhana s2g
dari ukuran n2g ditentukan dari sampel tahap pertama s1g dari ukuran acak n1g ,
P
g n1g = n1 . Dalam tahap ke dua, sampel acak sederhana s2g dari ukuran n2g

ditentukan dari sampel tahap pertama s1g secara bebas. Diasumsikan ukuran

tepat dari n2g dibatasi oleh batas atas, namun demikian adalah tidak sama dengan prosedur sampling karena batas atas n2g dibatasi oleh variabel acak n1g yang
bervariasi dari 0 hingga minus (n1 , ng ) dimana ng adalah jumlah satuan populasi
dalam stratum g. Rao dan Hidiroglou (2003) manyatakan sebuah alokasi sampel
yang menghindarkan kesulitan dalam metode Neyman (1938) atas alokasi sampel
pada tahap kedua. Metode ini mengambil pecahan yang tepat Vg dari unit sampel
pada tahap pertama, sebagai contoh, n2g = Vg n1g , 0 < Vg ≤ 1. Cochran (1977)

3
mempelajari rasio dan perkiraan pengurangan untuk kasus khusus dari sampling
acak sederhana dalam kedua tahap.

Perkiraan variansi yang diajukan S¨arndal, et.al, (1992) memiliki bentuk yang
sama dengan perkiraan variansi HT dalam sampling satu tahap. Secara umum
pola tahap tunggal dengan penambahan probabilitas yang tidak sama, perkiraan
variansi terakhir diketahui sangat tidak stabil dan mungkin memperoleh ukuran
negatif. Alternatif lain untuk perkiraan variansi dikenal sebagai perkiraan variansi
Sen-Yates-Grundy (SYG) adalah lebih stabil dari pada perkiraan variansi HT.
Karena itu sangat bermanfaat untuk mengembangkan perkiraan estimator SYG
dalam metode sampling dua tahap.
Akhir-akhir ini, banyak penjelasan tentang sampling multi tahap, S¨arndal
et.al, (1992) memberlakukan desain sampling di multi tahap. Misalkan π1i dan
π1ij menjadi perlakuan pertama dan kedua melingkupi peluang untuk sampel
tahap pertama s1 dan π2i|s1 dan π2ij|s1 menjadi bersyarat dari perintah pertama
dan juga perintah kedua yang melingkupi peluang untuk sampel tahap kedua s2 ,
P
diberikan s1. Sebuah estimator tidak bias dari total populasi Y = U yi adalah

diberikan

Yˆ2 =


X
s2

dimana y˙ i =

yi pi
li

dan

P

a

X yi
y1
=
π1iπ2i|s
π2i|s
s


(1.1)

2

dinotasikan untuk menghimpun semua unit i ∈ a.

Estimator ini disebut estimator ekspansi ganda dengan perluasan atau turunan
dari estimator HT untuk sampling fase umum. S¨arndal et.al, (1992) menurunkan
sebuah estimator tidak bias dari variansi Yˆ2 sebagai
  XX △
X X △2ij|s1
y˙ 1y˙j
1ij
y˙ iy˙j +
vHT Yˆ2 =

πij
πij|s1 π2i|s1 π2j|s1
s

s

(1.2)

2

2

dimana πij∗ = π2ij|s1 , △1ij = π1ij − π1iπ1j dan △2ij|s1 = π2ij|s1 − π2i|s1 π2j|s1
Formula (1.1) dan (1.2) dapat diperlihatkan dengan lengkap sebagai
Yˆ2 =

X yi
πi∗
s

(1.3)

2


Dan

  X X △∗
ij
yy
vHT Yˆ2 =
∗ i j
π
ij
s
2

(1.4)

4
dimana πi∗ = π1iπ2i|s1 dan△∗ij = πij∗ − πi∗πj∗, S¨arndal et.al, (1992).
Estimator variansi (1.4) dan (1.2) memiliki bentuk yang sama dengan estimator variansi HT di sampling fase tunggal. Untuk desain fase tunggal yang
umum dengan pertidaksamaan yang mengandung peluang, estimator variansi
yang terbaru memiliki ketidakstabilan yang tinggi dan memberikan nilai yang
negatif (Rao, 1973 dan Cochran 1977). Di kasus lain, sebuah estimator variansi alternatif, dikenal dengan estimator variansi SYG, yang memiliki kestabilan

lebih dari pada estimator variansi HT lebih berguna untuk mengembangkan jenis
estimator variansi SYG dengan sampling dua tahap.
S¨arndal,et.al, (1992) memperluas estimator tidak bias pada persamaan (1.1)
termasuk data yang bersifat tambahan yaitu koleksi x di fase pertama menggunakan GREG. S¨arndal,et.al, menurunkan persamaan linier taylor (1.2). Estimator GREG mengkalibrasi nilai x pada estimator tahap pertama x, yang mana
P
estimator GREG dari Y membentuk s2 wi yi dengan bobot wi yang memenuhi
P
P
arndal mengambil estimator GREG bers1 d1i xi. Hidroglou dan S¨
s2 wi xi =
dasarkan kalibrasi estimator fase pertama yang terkalibrasi seperti yang diketahui
P
P
P
P
dari total x1 , yaitu s2 wi xi = s1 w1ixi dan s2 w1ix1i = U x1i , yang juga
bertujuan membentuk linierisasi estimator variansi (1.2).

Binder (2000) menyederhanakan estimator variansi HT (1.2) ketika fase pertama membuat stratifikasi dari sampel acak yang sederhana yang distratifikasi
ulang, menggunakan data tambahan, koleksi x di fase pertama dan sampel acak

yang tergambar dengan tidak ada perubahan berasal dari fase kedua untuk menemukan y. Kott (1997) mempelajari desain fase dua tahap yang hampir sama
kecuali sampel-sampel fase pertamanya dengan perubahan sampel cluster tahap
pertama. Kott (1997) bertujuan mengganti bobot yang sudah ada pada daerah
hasil estimator tersebut. Pada kasus umum sangatlah sulit untuk memperluas
daerah hasil pada estimator double expansion dan menjadikan estimator variansi
tersebut jackknife. Kott (1997) juga mendemonstrasikan metode jackknife tidak
efektif untuk estimator double expansion. Lee dan Kim (2002) juga mempelajari
hal yang sama kecuali sampel fase pertamanya distratifikasi oleh sampel sampel
tahap tunggal tanpa ada penggantian.

5
Estimator double expansion dan estimator Reweighted adalah indentik untuk desain Kott (1997). Lee dan Kim (2002) mengembangkan sebuah estimator
variansi Jackknife, yang diperhitungkan dalam pemecahan sampling untuk dua
fase. Bagaimanapun, informasi tambahan digunakan untuk memperkirakan jumlah total, estimator variansi biasanya melakukan perhitungan berdasarkan informasi sampel dua tahap. Sangatlah masuk akal ketika informasi tambahan yang
cocok untuk elemen yang tidak termasuk dalam sampel fase kedua, dan dapat
digunakan secara luas untuk estimator variansi sebagaimana baiknya. Dorfman
1993, Rao dan Sitter 1995, Sitter 1997 dan Axelson 1998 bertujuan untuk menggunakan data tambahan fase pertama di estimasi variansi.
1.2 Perumusan Masalah
Berdasarkan latar belakang di atas, maka rumusan masalah yang diajukan dalam
penelitian ini adalah:

1. Bagaimana peranan pola perkiraan variansi dalam penarikan sampel dengan
metode sampling multi tahap?
2. Apa kelebihan metode sampling multi tahap dibandingkan terhadap metode
sampling satu tahap?
1.3 Tujuan Penelitian
Tujuan penelitian ini adalah:
1. Untuk mengetahui peranan pola perkiraan variansi dalam penarikan sampel
dengan metode sampling multi tahap.
2. Untuk mengetahui kelebihan metode sampling multi tahap dibandingkan
terhadap metode sampling satu tahap.

6
1.4 Manfaat Penelitian
Hasil penelitian ini dapat dimanfaatkan untuk perhitungan bunga tabungan dan
bermanfaat bagi pembaca untuk menambah literatur tentang masalah perkiraan
variansi pada metode sampling multi tahap.

1.5 Metodologi Penelitian
Adapun langkah-langkah yang dilakukan oleh penulis adalah sebagai berikut
1. Pengaturan Umum

Pada tahap ini, penulis mengevaluasi perkiraan variansi SYG untuk mengklasifikasi sampling kedua tahap. Pada tahap pertama, sampel besar s1 pada ukuran n1 adalah gambaran yang sesuai dengan bentuk yang ditentukan
dengan probabilitas inklusi marjinal π1i dan bersama probabilitas inkluisi
π1ij . Menggunakan kumpulan informasi tambahan sederhana pada semua
unit i ∈ s1 pada sampel tahap pertama s1 menjadi tingkat G (s1 ), dinotasikan dengan s1g (g = 1, · · · , G (s1 )) , dengan m1g adalah anggota pada

P
tingkat g,
g m1g = n1 . Pada tahap ke dua, probabilitas s2g pada ukuran m2g adalah gambaran dari s1g , bebas di semua g, dan memperhitungkan
sifat yang menarik dari y
2. Stratifikasi Sampling Dua-Tahap
Misalkan populasi I tambahan ditingkatkan menjadi I, Uk dengan Nk angP

H
gota pada h − th tingkat
N
=
N
. Pada tahap pertama, diamh
h=1
bil sampel s1h sederhana yang bebas dari tingkat Uh tahap pertama dan

mengamati variabel skalar, x, untuk i ∈ s1h , h = 1, · · · , H, dimana ukuran

P
H
H
n
=
n
s1h adalah n1h
1 . Sampel s1 = ∪h=1 s1k tahap pertama dih=1 1h

P
G
,
m
=
n
stratifikasi ulang menjadi G tingkat s˜1g pada ukuran m1g
1g
1
h=1
menggunakan variabel tambahan x pada pengamatan tahap pertama.

3. Penarikan Sampel Tiga-Tahap
Proses sub–penarikan sampel dapat dilanjutkan dengan suatu tahap ketiga dengan penarikan sampel sub-unit pengganti pencacahan lengkapnya.
Hasilnya adalah perluasan dari penarikan sampel dua tahap yang mudah.

7
Populasinya terdiri dari N unit tahap pertama, yang masing-masing berisi
M unit tahap kedua, dimana masing-masing dari M memiliki K unit tahap
ketiga. Masing-masing diambil sampelnya sebanyak n, m dan k.