Metode Untuk Sampling Berkelompok Stratifikasi Dengan Stratifikasi Informasi

METODE UNTUK SAMPLING BERKELOMPOK STRATIFIKASI DENGAN STRATIFIKASI INFORMASI
TESIS
Oleh SUSIANA 097021008/MT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011
Universitas Sumatera Utara

METODE UNTUK SAMPLING BERKELOMPOK STRATIFIKASI DENGAN STRATIFIKASI INFORMASI
TESIS
Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Magister Sains dalam
Program Studi Magister Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Oleh SUSIANA 097021008/MT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011
Universitas Sumatera Utara

Judul Tesis
Nama Mahasiswa Nomor Pokok Program Studi

: METODE UNTUK SAMPLING BERKELOMPOK STRATIFIKASI DENGAN STRATIFIKASI INFORMASI
: Susiana : 097021008 : Matematika


Menyetujui, Komisi Pembimbing

(Prof. Dr. Herman Mawengkang) Ketua

(Prof. Dr. Opim Salim S, M.Sc) Anggota

Ketua Program Studi

Dekan

(Prof. Dr. Herman Mawengkang)

(Dr. Sutarman, M.Sc)

Tanggal lulus: 16 Juni 2011

Universitas Sumatera Utara

Telah diuji pada Tanggal 16 Juni 2011
PANITIA PENGUJI TESIS Ketua : Prof. Dr. Herman Mawengkang Anggota : 1. Prof. Dr. Opim Salim S, M.Sc

2. Dr. Marwan Ramli, M.Si 3. Drs. Open Darnius, M.Sc
Universitas Sumatera Utara

ABSTRAK Penggunaan metode sampling bertujuan untuk membuat penarikan sampel lebih efisien. Pemilihan metode sampling yang tepat untuk suatu kasus dengan memperhatikan karakteristik-karakteristiknya dapat memberikan hasil yang lebih akurat. Tesis ini mengkaji tentang metode estimasi berbobot (weighted estimation method) dan metode semi-parametrik maksimum likelihood (semi-parametric maximum likelihood method) untuk sampling berkelompok stratifikasi dengan stratifikasi informasi. Metode estimasi berbobot (weighted estimation method) relatif jelas, sederhana untuk diimplementasikan tetapi tidak efisien untuk penelitian yang bersifat retrospective. Sedangkan metode semi-parametrik efisien tetapi sulit untuk diimplementasikan karena memerlukan distribusi gabungan dari seluruh kovariat. Kata kunci: Sampling berkelompok stratifikasi, Metode estimasi berbobot, Meto-
de semi-parametrik maksimum likelihood.
i
Universitas Sumatera Utara

ABSTRACT Using of sampling method aims to make withdrawal of sampel more efficient. Election of correct sampling method for a case with it attends its characteristics can gives a result more accurate. This thesis concerns about weighted estimation method and semi-parametric maximum likelihood method for stratified cluster sampling with informative stratification. Weighted estimation method is relatively obvious, simply for implementation but inefficient for the retrospective research. Meanwhile,the method semi-parametric is more efficient but difficult to implement because it requires the joint distribution of all covariates. Keyword: Stratified cluster sampling, Weighted estimation method, Semi-parame-
tric maximum likelihood method.
ii
Universitas Sumatera Utara

KATA PENGANTAR
Puji syukur kepada Allah SWT atas anugrah yang telah diberikan-Nya, serta shalawat teruntuk Nabi Muhammad SAW sehingga penulis dapat menyelesaikan tesis dengan judul: METODE UNTUK SAMPLING BERKELOMPOK STRATIFIKASI DENGAN STRATIFIKASI INFORMASI. Penulis menyampaikan terima kasih yang sebesar-besarnya kepada :
Bapak Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc(CTM), Sp.A(K) selaku Rektor Universitas Sumatera Utara.
Bapak Prof.Dr.Ir. A.Rahim Matondang, MSIE, Direktur Sekolah Pascasarjana Universitas Sumatera Utara.
Bapak Dr. Sutarman, M.Sc, Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara, yang telah memberikan kesempatan kepada penulis untuk mengikuti Program Magister Matematika di FMIPA Universitas Sumatera Utara.
Bapak Prof. Dr. Herman Mawengkang, Ketua Program Studi Magister Matematika FMIPA Universitas Sumatera Utara, yang juga sebagai pembimbing utama, dan banyak memberikan arahan dalam menyelesaikan tesis ini.
Bapak Dr. Saib Suwilo, M.Sc selaku Sekretaris Program Studi Magister Matematika FMIPA Universitas Sumatera Utara.

Bapak Prof. Dr. Opim Salim S, M.Sc, Pembimbing II yang telah membimbing dan mengarahkan dalam penulisan tesis ini.
Bapak Dr. Marwan Ramli M.Si, Pembanding - I yang telah memberikan masukan dan saran dalam penyempurnaan tesis ini.
Bapak Drs. Open Darnius, MSc, Pembanding II yang memberikan masukan dan saran dalam penyempurnaan tesis ini.
Bapak / Ibu Dosen Program Studi Magister Matematika FMIPA Universitas Sumatera Utara yang telah memberikan ilmunya selama masa perkuliahan.
iii
Universitas Sumatera Utara

Ibu Misiani, S.Si, staf administrasi Program Studi Magister Matematika FMIPA Universitas Sumatera Utara yang banyak membantu proses administrasi. Ucapan terimakasih juga penulis sampaikan kepada : Pemerintah Indonesia melalui Direktorat Jenderal Pendidikan Tinggi yang telah membiayai pendidikan ini melalui program BPPS. Bapak Rektor Universitas Negeri Medan yang telah memberikan dukungan kepada penulis selama pendidikan di FMIPA Universitas Sumatera Utara. Ibunda dan ayahanda tercinta, Kancina dan Alm.Yunus dan mertua tercinta, Fahyuril Azian Nasution dan Norma Pasaribu beserta anggota keluarga lainnya yang telah memberikan bantuan dan dukungan baik moril maupun materiil selama penulis dalam pendidikan. Suami tersayang, Faisal Roni Nasution yang telah begitu banyak membantu dan memberikan motivasi kepada penulis selama menjalani studi, juga kepada anak-anakku yang terkasih dan ku-banggakan, Safinah Annajah, Shada Fathimah, Shada Zainab, dan Musa Husayn Nasution atas semua kesabaran dan pengertian yang telah diberikan kepada bunda baik selama pendidikan maupun dalam proses penyelesaian tesis ini. Rekan-rekan mahasiswa Program Studi Magister Matematika FMIPA Universitas Sumatera Utara khususnya angkatan reguler tahun 2009, dan semua pihak yang tidak dapat penulis sebutkan satu persatu pada tesis ini. Semoga Allah SWT membalas segala kebaikan dan bantuan yang telah diberikan.
Medan, Juni 2011 Penulis,
Susiana
iv
Universitas Sumatera Utara

RIWAYAT HIDUP
Susiana, dilahirkan di Desa Telaga Sari Kecamatan Tanjung Morawa Kabupaten Deli Serdang pada tanggal 19 Mei 1979, merupakan anak kedelapan dari Sembilan bersaudara dari ayah Almarhum Yunus dan ibunda Kancina.Penulis menyelesaikan pendidikan Sekolah Dasar (SD) di SD Negeri 101881 Tanjung Morawa pada tahun 1992, Sekolah Lanjutan tingkat Pertama (SLTP) di SMP Negeri 1 Tanjung Morawa pada tahun 1995,dan Sekolah Menengah Umum (SMU) di SMU Negeri Tanjung Morawa pada tahun 1998.
Pada tahun 1999 penulis melanjutkan pendidikan sarjana Strata-1 pada Fakultas Matematika dan Ilmu Pengetahuan Alam jurusan matematika di Universitas Sumatera Utara dan memperoleh gelar Sarjana Sains pada tahun 2003. Selama menjalani pendidikan sarjana strata-1, penulis juga mengajar di beberapa sekolah menengah pertama (SMP) dan Sekolah Menengah Kejuruan (SMK)di kota Tanjung Morawa. Pada tahun 2005, penulis diterima sebagai staf pengajar di Universitas Negeri Medan dan berlanjut hingga sekarang. Pada tahun itu pula penulis menikah dengan Faisal Roni Nasution dan telah dikaruniai 3(tiga) orang putri dan 1(satu) orang putra. Pada tahun 2009, penulis melanjutkan studi pada Program Studi Magister Matematika di FMIPA Universitas Sumetera Utara.
v
Universitas Sumatera Utara

DAFTAR ISI


ABSTRAK ABSTRACT KATA PENGANTAR RIWAYAT HIDUP DAFTAR ISI
BAB 1 PENDAHULUAN
1.1 Latar Belakang 1.2 Perumusan Masalah 1.3 Tujuan Penelitian 1.4 Manfaat Penelitian 1.5 Metode Penelitian
BAB 2 TINJAUAN PUSTAKA

Halaman i ii
iii v vi
1
1 3 3 3 4
5

BAB 3 LANDASAN TEORI

8

3.1 Teori Dasar Sampling

8


3.2 Fungsi Likelihood

11

3.3 Sampling Berkelompok Stratifikasi dengan Stratifikasi Informasi 13

BAB 4 PEMBAHASAN

16

4.1 Metode Estimasi Berbobot (Weighted Estimation Method)

16

4.2 Metode Semi-parametrik Maksimum Likelihood (Semi-parametric

Maximum Likelihood Method)

19


vi
Universitas Sumatera Utara

4.3 Efisiensi Profile Likelihood BAB 5 KESIMPULAN DAN SARAN
5.1 Kesimpulan 5.2 Saran DAFTAR PUSTAKA

21 23
23 23 24

vii
Universitas Sumatera Utara

ABSTRAK Penggunaan metode sampling bertujuan untuk membuat penarikan sampel lebih efisien. Pemilihan metode sampling yang tepat untuk suatu kasus dengan memperhatikan karakteristik-karakteristiknya dapat memberikan hasil yang lebih akurat. Tesis ini mengkaji tentang metode estimasi berbobot (weighted estimation method) dan metode semi-parametrik maksimum likelihood (semi-parametric maximum likelihood method) untuk sampling berkelompok stratifikasi dengan stratifikasi informasi. Metode estimasi berbobot (weighted estimation method) relatif jelas, sederhana untuk diimplementasikan tetapi tidak efisien untuk penelitian yang bersifat retrospective. Sedangkan metode semi-parametrik efisien tetapi sulit untuk diimplementasikan karena memerlukan distribusi gabungan dari seluruh kovariat. Kata kunci: Sampling berkelompok stratifikasi, Metode estimasi berbobot, Meto-
de semi-parametrik maksimum likelihood.
i
Universitas Sumatera Utara

ABSTRACT Using of sampling method aims to make withdrawal of sampel more efficient. Election of correct sampling method for a case with it attends its characteristics can gives a result more accurate. This thesis concerns about weighted estimation method and semi-parametric maximum likelihood method for stratified cluster sampling with informative stratification. Weighted estimation method is relatively obvious, simply for implementation but inefficient for the retrospective research. Meanwhile,the method semi-parametric is more efficient but difficult to implement because it requires the joint distribution of all covariates. Keyword: Stratified cluster sampling, Weighted estimation method, Semi-parame-
tric maximum likelihood method.
ii

Universitas Sumatera Utara

BAB 1 PENDAHULUAN
1.1 Latar Belakang
Sampling adalah cara pengumpulan data jika hanya elemen sampel (sebagian dari elemen populasi) yang diteliti (Cochran, 1977). Saat ini kecenderungan untuk melakukan survei sampel semakin meningkat, baik yang dilakukan oleh pemerintah, perusahaan maupun secara personal.
Misalnya saja, untuk mengetahui hasil pemilukada (pemilihan umum kepala daerah) dengan cepat, dilakukan pengambilan sampel daerah pemilihan (tempat pemungutan suara). Pemerintah menggunakan survei sampel untuk mendapatkan informasi yang dibutuhkan guna perencanaan pembangunan. Perusahaan melakukan penelitian pasar untuk mengetahui respons pembeli terhadap produk yang dihasilkannya.
Adanya keterbatasan dan kendala kendala untuk melakukan survei seluruh populasi telah memunculkan berbagai jenis teknik sampling, diantaranya adalah sampling berkelompok stratifikasi. Kendala-kendala tersebut diantaranya sebagai berikut :
1. Untuk anggota populasi yang besar, sering tidak ada data yang lengkap dan terbaru (up to date) tentang orang-orang, perumahan, atau tanah pertanian dalam wilayah geografis yang luas. Solusi dari masalah ini adalah pembagian wilayah menjadi unit-unit daerah seperti blok-blok dikota atau segmen tanah dengan batas-batas yang jelas untuk dipedesaan.
2. Seringkali, daftar perumahan individual tersedia, pertimbangan biaya dapat mengarah pada pemilihan sebuah unit kelompok yang lebih besar.
3. Jika data diketahui ketelitian yang diinginkan untuk subkelompok tertentu dari populasi, ada baiknya memperlakukan setiap kelompok sebagai suatu populasi tertentu.
1
Universitas Sumatera Utara

2
4. Adanya adat kebiasaan yang berbeda dalam suatu populasi dapat diperlakukan atas strata-strata yang berbeda, misalnya untuk orang-orang yang hidup di lingkungan rumah sakit dan penjara ditempatkan dalam strata yang berbeda dengan orang-orang yang hidup dilingkungan rumah-rumah biasa.

St.Peter et al.(1992) melakukan analisis data dari National health Interview Survey on Child Health tahun 1988. Analisis ini bertujuan menentukan apakah adanya jaminan kesehatan mempengaruhi penggunaan tindakan preventif (sebagai upaya pencegahan) bagi anak-anak dari keluarga tidak mampu (miskin). Penelitian ini mencakup 17.710 responden yang dipilih berdasarkan sampling berkelompok stratifikasi.

Whittemore dan Jerry Halperin(2003) melakukan sebuah penelitian tentang hubungan antara resiko penyakit dengan faktor genetik ataupun lingkungan. Dalam penelitian ini, data yang diolah adalah data tentang kasus penyakit kanker ovarium dimana yang menjadi kelompok adalah pasangan ibu dengan anak gadisnya. Kelompok-kelompok tersebut dibagi menjadi dua strata yaitu case dan control. Yang diperlakukan sebagai case adalah pasangan yang anak gadisnya terdeteksi mengidap kanker ovarium, sedangkan sebagai control adalah pasangan yang tidak terdeteksi mengidap penyakit tersebut.


Lin et al.(2004) melakukan analisis data dari hasil survei nasional tahun 1983-2000 tentang prevalensi dari kasus myopi pada anak-anak usia sekolah di Taiwan. Dalam hal ini respons yang dipertimbangkan adalah jenis kelamin dan prestasi akademik dari anak-anak tersebut.

Misalkan y menyatakan vektor respons untuk unit-unit dalam sebuah kelom-

pok dan andaikan X matriks yang bersesuaian dengan nilai kovariat. Didefinisikan

sebuah variabel indikator stratum, Z dengan nilai Z = h jika kelompok diberikan

pada stratum ke-h(h = 1, ..., L). Diasumsikan bahwa nilai-nilai populasi ter-

batas dari N kelompok dibangun oleh sampling dari distribusi bersama (y, X, Z).

Kelompok-kelompok dibagi menjadi L stratum, S1, ..., SLberdasarkan nilai-nilai

Z, menghasilkan Nh kelompok dalam Sh(

L 1

Nh


=

N).Kemudian diambil sam-

Universitas Sumatera Utara

3
pel acak sederhana, Dh, nh kelompok dari Nh kelompok dalam Sh(h = 1, ..., L) dan diamati dengan nilai (y, X). Andaikan (yhj, Xhj) menyatakan nilai-nilai yang diobservasi untuk kelompok ke-j dalam strata ke-h, maka bentuk data observasi tersebut menjadi {(yhj, Xhj, j ∈ Dh), Nh; h = 1, ..., L} .
Tehnik pengambilan sampel sebagaimana digambarkan diatas adalah tehnik pengambilan sampel berkelompok stratifikasi. Pertanyaaan selanjutnya adalah bagaimana cara menentukan perkiraan-perkiraan parameter dalam sampling berkelompok stratifikasi. Tesis ini bertujuan mengkaji metode-metode yang berkaitan dengan teknik sampling tersebut dengan judul “Metode untuk Sampling Berkelompok Stratifikasi dengan Stratifikasi Informasi“. Informasi yang dimaksud adalah respons yang diberikan oleh objek penelitian atau informasi lain yang diperoleh setelah pembentukan kelompok. Jadi, kelompok-kelompok dimasukkan dalam strata menurut respons/informasi yang diperoleh dari observasi awal sedemikian hingga probabilitas sebuah kelompok masuk ke stratum tertentu bergantung pada nilai dari respons yang diberikan.
1.2 Perumusan Masalah
Rumusan permasalahan dalam penelitian ini adalah mengkaji metode estimasi berbobot, metode semi-parametrik maksimum likelihood dalam sampling berkelompok stratifikasi dengan stratifikasi informasi.
1.3 Tujuan Penelitian
Penelitian ini bertujuan untuk menentukan metode yang tepat dalam sampling berkelompok stratifikasi dengan stratifikasi informasi.
1.4 Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan kontribusi bagi perkembangan ilmu pengetahuan, khususnya bidang sampling. Sedangkan dalam bidang aplikasi diharapkan penelitian ini memberikan kontribusi kepada para peneliti dalam membuat perkiraan parameter untuk data sampling berkelompok stratifikasi.
Universitas Sumatera Utara

4 1.5 Metode Penelitian
Penelitian ini merupakan penelitian yang bersifat literature kepustakaan. Adapun langkah-langkah yang akan dilakukan dalam penelitian ini adalah sebagai berikut:
1. Menjelaskan setiap terminologi yang digunakan. 2. Menjelaskan metode-metode yang telah digunakan dalam bidang penelitian

yang sama. 3. Menjelaskan metode estimasi berbobot 4. Menjelaskan metode semi parametrik maksimum likelihood 5. Menarik kesimpulan dan memberikan saran-saran berkaitan dengan tindak
lanjut penelitian.
Universitas Sumatera Utara

BAB 2 TINJAUAN PUSTAKA
Penggunaan metode sampling bertujuan untuk membuat penarikan sampel lebih efisien. Metode sampling mencoba untuk mengembangkan metode pemilihan sampel dan metode perkiraan dengan biaya yang sekecil mungkin dan perkiraan yang cukup teliti untuk tujuan tertentu (Cochran, 1977).
Beberapa metode sampling yang biasa digunakan diantaranya adalah :
1. Sampling acak sederhana (Simple Random Sampling), yaitu memilih n unit dari N anggota populasi sehingga setiap elemen dari CnN sampel yang berbeda mempunyai kesempatan yang sama untuk dipilih.
2. Sampel stratifikasi (Stratified Sampling), yaitu membagi N anggota populasi menjadi L strata (subpopulasi), masing-masing N1, N2, ..., NL unit, dimana N1 + N2 + NL = N . Kemudian sebuah sampel diambil secara bebas dari tiap strata sebanyak n1, n2, ..., nL.
3. Sampel berkelompok (Cluster Sampling), yaitu membagi populasi menjadi beberapa kelompok, kemudian memilih kelompok yang menjadi sampel, selanjutnya elemen-elemen dalam kelompok yang terpilih diteliti.
4. Sampling berkelompok stratifikasi (Stratified Cluster Sampling), yaitu membagi populasi menjadi N kelompok. Setiap kelompok dipilih untuk dibagi menjadi L strata. Dari tiap strata diambil sampel sebanyak nh kelompok, selanjutnya diambil dh elemen darinh kelompok.
Berkaitan dengan judul tesis ini terdapat beberapa pendekatan yang telah dilakukan, diantaranya adalah pendekatan survei standar yaitu melalui persamaan estimasi berbobot (weighted estimating equation) dengan bobot berbanding terbalik dengan probabilitas yang terpilih, pendekatan semi-parametrik maksimum likelihood,dan pendekatan lainnya yang melibatkan model distribusi gabungan dari respons, kovariat, dan variabel buatan yang digunakan untuk stratifikasi.
5
Universitas Sumatera Utara

6

Rao et al. ( 1998 ) mengkaji pendekatan survei standar yaitu melalui persamaan estimasi berbobot dengan bobot berbanding terbalik dengan peluang yang terpilih. Andaikan untuk semua unit dari populasi terbatas yang berukuran N. Terdapat (xi, yi) dimana x adalah vektor dari variabel-variabel penjelas dan Y adalah variabel respon. Asumsikan bahwa untuk nilai x yang diketahui , Y digenerate oleh beberapa proses acak dengan rata-rata :

E (Yi) = µi = µ (xi, β)


(2.1)

dan anggap bahwa model untuk variansinya adalah:

var (Yi) = V0i = V0 (µi)

(2.2)

untuk i = 1, , N. Tentunya tidak semua nilai-nilai unit populasi diobservasi tetapi hanya sampel yang diambil dari populasi terbatas berdasarkan desain sampling yang telah ditentukan.

Selanjutnya, anggap bahwa, jika nilai-nilai untuk seluruh populasi terbatas diperoleh, dapat ditentukan estimator konsisten dari β dengan menyelesaikan persamaan estimasi :

S (β) =

N 1

ui

(β)

=

0

(2.3)

dimana ui(β) mempunyai komponen ke-k yakni uik = (∂µi/∂βk)(yi − µi)/Voi. Karena pada kenyataannya, nilai-nilai untuk seluruh populasi tidak dapat diketahui maka diambil beberapa sampel dari populasi tersebut. Anggap bahwa desain sampel memberikan konsistensi, estimator yang normal asymtotik dari total populasi dan diasosiasikan dengan standard error. Maka, karena S(β) adalah sebuah vektor dari total populasi untuk nilai β, dapat diperoleh sebuah estimator dari S(β) sebagai berikut :

S (β) = i∈s wisui (β)

(2.4)

dimana bobot survei wis, bergantung pada sampel s, estimator sampel β, ditentukan dengan menyelesaikan S β = 0.

Scott dan Wild (2007) melakukan pendekatan estimator semi-parametrik

Universitas Sumatera Utara

7

untuk sampling berkelompok stratifikasi. Estimator maximum likelihood semi-

parametrik, θ dan γ diperoleh dengan memaksimumkan ℓ (θ, γ, g) = log L (θ, γ, g).

Dimulai dengan mereduksi masalah menjadi case yang lebih sederhana dimana

anggota stratum ditentukan oleh respons kelompok. Kemudian tambahkan vektor

respons y dengan indikator stratum Z untuk membentuk variabel respons yang

dimodifikasi y =

y z


. Selanjutnya θ =

θ γ

dan masalahtersebut menjadi :


f y| X; θ = f (z, y, X; γ) f ( y| X; θ) = Pz (y, X; γ) f ( y| X; θ)

(2.5)

untuk data yang berasal dari sampel stratifikasi dimana stratum Sh(h = 1, , L) diperoleh secara lengkap dengan respons, ⌣y.

Universitas Sumatera Utara

BAB 3 LANDASAN TEORI
Pemilihan metode sampel sebagai sumber data berarti menarik kesimpulan tentang karakteristik suatu populasi berdasarkan informasi-informasi yang diperoleh dari sampel. Hal ini dilakukan mengingat adanya beberapa alasan seperti biaya yang lebih kecil dibandingkan jika melakukannya dengan cara sensus, waktu yang lebih singkat, atau kemungkinan akses pada responden lebih mudah. Meskipun begitu, jikalau memang tersedia waktu dan dana yang tak terbatas, sensus mungkin menjadi pilihan yang lebih baik.
3.1 Teori Dasar Sampling
Definisi-definisi dari teori dasar sampling yang digunaka dalam tesis ini sebagian besar dikutip dari (Kapoor, 2002), (Cochran, 1977) dan sumber referensi lainnya, diantaranya sebagai berikut :
1. Populasi dan sampel Populasi adalah kumpulan individu-individu atau atribut-atribut atau hasilhasil dari suatu operasi yang dapat dijelaskan secara numerik (Kapoor, 2002). Suatu populasi terdiri atas keseluruhan pengamatan yang menjadi objek penelitian. Terdapat dua macam populasi yaitu populasi tak terbatas (infinite) dan populasi terbatas (finite). Populasi dalam metode sampling adalah populasi yang terbatas dan ditentukan batasnya (finite and delimited), seperti penduduk suatu kota, mesin-mesin dalam suatu pabrik, ikanikan dalam suatu danau(Cochran, 1977). Sedangkan sampel adalah sebagian dari anggota-anggota populasi. Ukuran dalam populasi disebut sebagai parameter, biasanya menggunakan simbol µ untuk rata-rata,σ untuk varian. Ukuran yang diperoleh dari pengolahan sampel disebut sebagai statistik dan sifatnya adalah sebagai estimator bagi parameter. Sampel dengan ukuran lebih dari 30 disebut sampel berukuran
8
Universitas Sumatera Utara

9

besar. Sedangkan sampel dengan ukuran kurang dari 30 disebut sampel berukuran kecil (Kapoor, 2002).

2. Variabel acak
Suatu variabel acak X ialah suatu fungsi bernilai real dengan daerah definisi ω yakni, untuk setiap ω ∈ Ω, X (ω) ∈ ℜ = {y : −∞ < y < +∞}. Variabel acak terbagi atas dua jenis yakni variabel acak diskrit dan variabel acak kontinu.

3. Parameter dalam populasi terbatas

Parameter-parameter dalam populasi terbatas adalah fungsi-fungsi dari karakteristik yang diteliti yang diasosiasikan dengan unit-unit sampling dalam populasi terbatas dengan asumsi-asumsi. Masalah mendasar dalam survei sampling adalah menarik kesimpulan(inferensi) terhadap parameter- parameter ini berdasarkan sampel-sampel yang terpilih menurut desain sampling berpeluang dari populasi terbatas (Chen dan Rao, 2007).

Dalam suatu sampling survei, parameter yang akan diestimasi biasanya meliputi rata-rata, jumlah total, rasio dan proporsi untuk parameter yang sederhana. Beberapa parameter tersebut dirumuskan sebagai berikut :

Asumsikan bahwa tiap unit dalam populasi merupakan pasangan karakte-

ristik (xi, yi), i = 1, ..., N .

N
Jumlah : Y = yi,
i=1

N
X = xi
i=1

Rata − rata : Y¯ = N −1Y, X¯ = N −1X

V ariansi : σY2 = (N − 1)−1 N yi − Y¯ 2
i=1
Kovariansi : σXY = (N − 1)−1 N xi − X¯
i=1

yi − Y¯

4. Distribusi peluang

Fungsi f(x, y) adalah fungsi padat gabungan variabel acak kontinu X dan Y jika :

(a) f (x, y) ≥ 0 untuk semua (x, y)

Universitas Sumatera Utara

10

(b)

∞ −∞

∞ −∞

f

(x,

y)

dx

dy

=

1

(c) P [(X, Y ) ∈ A] = A f (x, y) dx dy untuk tiap daerah A di bidang xy

5. Fungsi peluang marginal

Fungsi peluang marginal dari adalah Xil , ..., Xil adalah :

P [Xi1 = xi1, ..., Xil = xil] =

P [X1 = x1, ..., Xn = xn]

xil ,...,xin

untuk il = ik (l = k) .

6. Fungsi peluang bersyarat
Fungsi peluang bersyarat Xil , ..., Xil bila diketahui Xil+1 = xil+1, ..., Xis = xis adalah, bila P Xit+1 = xit+1, ..., Xis = xis > 0( untuk himpunan variabel yang terpisah ) ;
Pn X1 = x1, ..., Xn = xn Xit+1 = xit+1, ..., Xis = xis =

[ ]P Xi1 =xi1 ,...,Xit ,xit+1 ,...,Xis =xis [ ]P Xil+1 =xil+1 ,...,Xis =xis
7. Ekspektasi (nilai harapan)

Ekspektasi atau nilai harapan dari variabel acak X adalah

EX =

∞ −∞

xfx

(x)

dx

,

jika

X

kontinu

dengan

fungsi

padat

peluang

fx (x)

dan EX = xipx (xi)jika X diskret dengan fungsi peluang px (xi) .

8. Variansi dan kovarian Variansi dari variabel acak X adalah : σx2 = E [X − EX]2 Kovarian dari variabel acak X dan Y adalah : Cov(X, Y ) = E {[X − EX] [X − EY ]}

9. Kesalahan sampling
Misalkan θ adalah sebuah parameter dan θ adalah estimator dari θ , maka yang dimaksud dengan kesalahan sampling adalah θˆ − θ .

Universitas Sumatera Utara

11
10. Sifat-sifat estimator Sebuah estimator dikatakan konsisten jika hasil estimasi tepat sama dengan nilai populasi (sensus). Meskipun konsistensi merupakan sifat yang diinginkan pada estimator, tapi pada sisi lain estimator yang tidak konsisten masih berguna bila n kecil dibandingkan dengan N. Sebuah statistik t dikatakan estimator tak bias dari sebuah parameter θ jika E (t) = θ. (Kapoor, 2002) Sebuah statistik t dikatakan estimator tak bias asymtotik dari sebuah parameter θ jika Ltn→∞E (tn) = θ, dimana n adalah ukuran sampel.

3.2 Fungsi Likelihood

1. Full semiparametric likelihood

Pandang bahwa N unit (yi, Xi) , i = 1, 2, ..., N ada atau dibangkitkan (generated) dari f (y |X; θ ) g (X). Range dari (y, X) di-partisi menjadi L strata S1, ..., SL. Andaikan G() menyatakan fungsi distribusi yang bersesuaian keg (X),

Qh (θ, G) = P {(Y, X) ∈ Sn}

(3.2.1)

Qh∗ (X; θ) = P {(Y, X) ∈ Sn |X }

dimana

L h=1

Qn∗

(X ;

θ)

=

1

untuk

semua

X

dan

Qh (θ, G) = P {(Y, X) ∈ Sn |X } dG (X) = Q∗h (X; θ) dG (X)

(3.2.2) (3.2.3)

Misalkan strata didefinisikan untuk semua unit, fungsi full semiparametric

likelihood dalam berbagai metode sampling yang telah dijelaskan diatas da-

pat dituliskan sebagai :

LF (θ, G) =

K j=1

i∈Dh f (yi |Xi; θ ) g (Xi) Qh (θ, G)Nh−nh

(3.2.4)

Pada intinya, perlu diasumsikan bahwa nilai-nilai (x, y) yang record-nya

ada dalam strata Sh adalah sampel acak dari distribusi bersyarat (y, X) jika diketahui (y, X) ∈ Sh.

Universitas Sumatera Utara

12

Pada kasus sampling berkelompok stratifikasi, fungsi likelihood dapat dituliskan sebagai berikut :

L (θ, γ, g) =

L h=1

j∈Dh P (yhj , Xhj kelompok ∈ Sh) QnNh

=h

Dh {f yhj | Xhj ; θ g(Xhj )} QNh h−nh

(3.2.5)

dimana g(X) menyatakan fungsi peluang marginal dari X dari populasi dan

Qh = Qh (θ, γ, g) = P (Z = h)

= Ph (y, X, γ) f y | X; θ g (X) dydx

(3.2.6)

menyatakan peluang marginal bahwa sebuah kelompok masuk ke dalam strata Sh.

2. Pseudo-likelihood

Fungsi pseudo-likelihood dapat diestimasi dengan memaksimumkan LF θ, G˜ dimana G˜ adalah nilai estimasi dari G yang dapat dihitung secara empiris.

Selanjutnya G˜(x) =

K j=1

G˜j

(x)

Nj N

, dimana G˜j (x) adalah fungsi dis-

tribusi kumulatif atas xi untuk unit-unit ∈ Dj , yaitu unit-unit yang secara

lengkap diobservasi dalam stratum ke-j. Sehingga nilai dari log pseudo-

likelihood dapat dihitung berdasarkan :

lp(θ) = i=1 log f yhj | Xhj ; θ

+

K j=1

(Nj



nj )

log

K l=1

p˜−l 1

dimana p˜j = /nj Nj

i∈Dl Q∗j (xi; θ)

(3.2.7)

3. Weighted pseudo-likelihood ( pseudo-likelihood berbobot )

Andaikan semua N unit telah diobservasi secara lengkap, maka fungsi log-

likelihood menjadi log f (yi |Xi; θ ). Sebuah estimasi dari perhitungan ini dapat diperoleh jika menggunakan unit-unit observasi yang lengkap dan bobotnya secara terbalik berdasarkan peluang dari terpilihnya. Fungsi log

pseudo-likelihood diberikan oleh :

ℓw(θ) =

K j=1

pˆj−1

i∈Dj logf (yi |Xi; θ )

(3.2.8)

Untuk sampling stratifikasi dipergunakan pˆj = /nj Nj yang memberikan sebuah persamaan estimasi tak bias untuk θ.

Universitas Sumatera Utara

13
3.3 Sampling Berkelompok Stratifikasi dengan Stratifikasi Informasi
Metode penarikan sampling secara umum terbagi atas dua jenis yakni:
1. Sampling berpeluang (probability sampling) adalah teknik pengambilan sampel yang memberikan peluang yang sama bagi setiap unsur (anggota) populasi untuk dipilih menjadi anggota sampel. Yang termasuk dalam jenis ini diantaranya sampling acak sederhana, sampling berkelompok, sampling stratifikasi dan sampling berkelompok stratifikasi.
2. Sampling tak berpeluang (non-probability sampling) adalah teknik sampling yang memberi peluang atau kesempatan tidak sama bagi setiap unsur atau anggota populasi untuk dipilih menjadi sampel. Teknik sampling non peluang meliputi :sampling aksidental, sampling purposive, dan sampling kuota.
Dalam sampling berkelompok stratifikasi berarti melakukan penstrataan dengan menggunakan kelompok-kelompok. Populasi dibagi atas beberapa kelompok, selanjutnya kelompok-kelompok tersebut dibagi menjadi strata-strata. Dari tiap strata dipilih beberapa kelompok sebagai sampel. Akhirnya, dari sampel kelompok-kelompok yang terpilih diambil sampel acak sederhana (unit sampel) yang akan diobservasi.
Sebagai dasar untuk melakukan stratifikasi kelompok biasanya dapat dirujuk dari lokasi tempat tinggal calon responden (misalnya: survei tentang lamanya waktu yang dihabiskan masyarakat untuk menonton televisi ; dapat dikelompokkan menjadi masyarakat yang tinggal di kota dan di desa ), atau dengan melihat faktor adanya batasan-batasan administrasi (misalnya: kondisi sosioekonomi, dan lain-lain). Selain itu penstrataan juga dapat dilakukan berdasarkan informasi dari observasi awal. Untuk selanjutnya tesis ini mengkhususkan bahwa penstrataan yang dilakukan adalah dengan stratifikasi informasi. Informasi yang dimaksud disini dapat berupa respons yang diberikan oleh unit sampel atau informasi lainnya yang telah ditetapkan dalam kerangka survei oleh peneliti.
Universitas Sumatera Utara

14

Misalkan y menyatakan vektor respons untuk unit-unit dalam sebuah kelompok dan andaikan X matriks yang bersesuaian dengan nilai kovariat. Didefinisikan sebuah variabel indikator stratum, Z dengan nilai Z = h jika kelompok diberikan pada stratum ke-h (h = 1, , L). Diasumsikan bahwa nilai-nilai populasi terbatas dari N kelompok dibangun oleh sampling dari distribusi bersama (y, X, Z).

Kelompok-kelompok dibagi menjadi L strata, S1, ..., SL berdasarkan nilai-

nilai Z, menghasilkan Nh kelompok dalam Sh

L 1

Nh

=

N

. Kemudian diambil

sampel acak sederhana,Dh, nh kelompok dari Nhkelompok dalam Sh (h = 1, ..., L)

dan diamati dengan nilai (y, X).

Andaikan (yhj, Xhj) menyatakan nilai-nilai yang diobservasi untuk kelompok ke-j dalam stratum ke-h, maka bentuk data observasi tersebut menjadi {(yhj, Xhj, j ∈ Dh) , Nh ; h = 1, ..., L},dan ukuran sampel N1, ..., NL merupakan variabel yang bersifat acak. (Scott dan Wild, 2007).

Penyelesaian masalah diatas, dapat dilakukan dengan model parametrik, Ph (y, X; γ), dimana untuk peluang bersyarat dari sebuah kelompok yang termasuk kedalam strata ke-h diberikan oleh nilai-nilai vektor respons, y, dan matriks kovariat, X. Tidaklah menjadi masalah jika strata yang termasuk dalam model ini hanya mengandung X. Akan tetapi, jika model bergantung pada respons, atau bergantung pada sebuah variabel buatan yang diasosiasikan dengan y tetapi tidak termasuk dalam model, maka sampling (penarikan sampel) tidak dapat diabaikan, dan tentunya akan mempengaruhi nilai likelihood.

Dalam sebuah proses yang menghasilkan data berdasarkan model f y | X; θ g(X). Disini, y menyatakan variabel respons, yang mungkin saja bersifat multivariat, dan X merupakan vektor kovariat yang dapat bersifat diskret ataupun kontinu. Sedangkan f y | X; θ adalah fungsi distribusi bersyarat dari vektor respons kelompok y jika diketahui nilai matriks kovariat kelompok X, dan g(X) adalah fungsi distribusi marginal dari X .Tujuan dari penggunaan θ adalah untuk membuat distribusi bersyarat dari y jika diketahui X sedemikian hingga g(X) tidak mengandung θ. Karena itu tujuannya adalah estimasi terhadap θ (Lawless et al.,1999).

Universitas Sumatera Utara

15

Peluang bersyarat bahwa sebuah kelompok masuk kedalam stratum ke-h, Sh (h = 1, ..., L) jika diketahui y dan X :

P kelompok ∈ Sh | y, X = P Z = h | y, X = Ph (y, X; γ)

(3.3.1)

Persamaan (3.3.1) menunjukkan bahwa sebuah kelompok masuk atau tidak kedalam suatu stratum ke-h bergantung kepada nilai-nilai dari vektor respons, y dan matriks kovariat, X.

Universitas Sumatera Utara

BAB 4 PEMBAHASAN

4.1 Metode Estimasi Berbobot (Weighted Estimation Method)

Misalkan nilai-nilai dari (y, X, Z) untuk setiap kelompok dalam populasi yang terbatas telah diobservasi, maka estimasi θ dapat diperoleh dengan menyelesaikan persamaan likelihood berikut :

S (θ) =

L h=1

Nh j=1

Uhj

(θ)

=

0

(4.1.1)

dimana Uhj (θ) = ∂ log f (yhj |Xhj; θ )/∂θ. Diasumsikan bahwa kondisi reguler standard untuk fungsi likelihood dipenuhi sedemikian hingga :

E {S (θ)} = 0, Cov {S (θ)} = −E

∂ S (θ) ∂θ

= NJ (θ) ,

pada saat θ = θ0

(4.1.2)

Untuk sebarang nilai θ yang telah ditentukan , S (θ) merupakan sebuah vektor dari populasi total yang dapat diestimasi dari observasi sampel dengan menggunakan nilai sampel berbobot berikut :

Sw (θ) =

h

Dh

Nh nh

Uhj

(θ)

(4.1.3)

Estimator berbobot, θˆw didefinisikan sebagai solusi untuk persamaan pseudolikelihood berbobot Sw (θ) = 0.

Pada kondisi {Uhj} standard (normal),θˆw merupakan estimator yang konsisten dari parameter θC untuk populasi terbatas (sensus), dimana θC didefinisikan sebagai solusi dari persamaan (4.1) (Rao et al., 1998).

Dalam terminologi sampling, materi dalam tesis ini dapat juga dikategorikan sebagai stratifikasi dua tahap. Tahap pertama, populasi terbatas dibangkitkan sebagai sampel acak berukuran N dari sebuah super-populasi (tak terbatas) dan penentuan kelompok-kelompok menjadi stratum-stratum. Sedangkan sebagai tahap keduanya adalah proses pengambilan sampel acak sederhana yang berukuran nh

16

Universitas Sumatera Utara

17

dari Nh-kelompok dalam stratum Sh, dengan nilai n1, ..., nL bergantung pada N1, ..., NL dan observasi yhj, Xhj, j ∈ Dh untuk h = 1, ..., L.

Selanjutnya akan dibangun solusi dengan pengkondisian pada ZN ,vektor indikator stratum untuk populasi terbatas yang tercapai dan kemudian menentukan distribusi dari ZN . Diketahui ZN , N1, ..., NL dan disini n1, ..., nL adalah konstanta yang telah ditentukan dan Uhj (θ) , j ∈ Dh. Observasi-observasi dari distribusi bersyarat U (θ) = (∂ log f (y |X; θ )) /∂θ diketahui Z = h.

Andaikan µh (θ) dan h θ menyatakan vektor rata-rata dan matriks kovarian dari distribusi bersyarat ini, dan andaikan µ (θ) dan (θ) menyatakan nilai-nilai yang bersesuaian dengan distribusi tak-bersyarat U (θ). Pandang kembali bahwa µ (θ0) = 0 dan (θ0) = J (θ0) dibawah kondisi standard. Distribusi tak-bersyarat dari N1, ..., NL bersifat multinomial (N ; Q1, · · · , QL) dimana Qh merupakan peluang marginal bahwa Z = h untuk h = 1, ..., L.

Diketahui bahwa:

E { h Nhµh (θ)} = N { h Nhµh (θ) Qh} = N µ (θ)

(4.1.4)

E {Sw (θ)} = E { h Nhµh (θ)} = N µ (θ)

(4.1.5)

Sehingga E { h Nhµh (θ)} = 0 pada saat θ = θ0.Menggunakan hasil standar untuk varians bersyarat diperoleh :

Cov {Sw (θ)} = Cov { h Nhµh (θ)} + E

N2

P
h

(θ)

h h nh

(4.1.6)

Selanjutnya, untuk menentukan nhS ,diasumsikan fraksi nh/Nhkonstan, fh dengan 0 < fh ≤ 1 untuk h = 1, ..., L. maka :

Cov {Sw (θ)} ≃ N µhµTh Qh (1 − Qh) − 2

l