Kajian Model Pendugaan Area Kecil Untuk Pendugaan Tingkat Pengangguran Menggunakan Pendekatan Bayes

KAJIAN MODEL PENDUGAAN AREA KECIL
UNTUK PENDUGAAN TINGKAT PENGANGGURAN
MENGGUNAKAN PENDEKATAN BAYES

YUSRIANTI HANIKE

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Model
Pendugaan Area Kecil Untuk Pendugaan Tingkat Pengangguran Menggunakan
Pendekatan Bayes ” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Februari 2016

Yusrianti Hanike
G151130261

RINGKASAN
YUSRIANTI HANIKE. Kajian Model Pendugaan Area Kecil untuk Pendugaan
Tingkat Pengangguran Menggunakan Pendekatan Bayes. Dibimbing oleh
KUSMAN SADIK dan ANANG KURNIA.
Pendugaan area kecil merupakan suatu metode untuk menduga parameter
pada suatu subpopulasi dengan ukuran contoh kecil. Metode yang dikembangkan
dalam pendugaan area kecil adalah metode pendugaan tidak langsung dengan
memanfaatkan kekuatan area di sekitarnya dan sumber data di luar area. Tujuan
dari metode pendugaan ini adalah untuk meningkatkan keefektifan ukuran contoh
dan menurunkan keragaman dugaan parameter.
Pada praktiknya pendugaan yang menggunakan data administrasi dari
Badan Pusat Statistik terkadang tidak sesuai dengan area yang akan dibentuk.
Untuk mengatasi hal tersebut, dilakukan post-stratification yang merupakan
pengelompokan (strata) data setelah pengambilan contoh. Data Sakernas BPS

terkait pengangguran terbuka distratifikasi berdasarkan latar belakang pendidikan
yang terdiri dari tujuh kategori pendidikan. Post-stratification yang dihasilkan
dapat dipandang dengan dua pendekatan model yakni model I, pengaruh
pendidikan dianggap sebagai pengaruh tetap yang dimodelkan dengan
menggunakan peubah dummy, dan model II, pengaruh pendidikan dianggap
sebagai pengaruh acak. Pendekatan post-stratification pada model I menghasilkan
kelayakan model yang lebih baik dari model II.
Pada kasus pendugaan tingkat pengangguran terbuka yang menjadi
perhatian penelitian, pendekatan model Poisson-Gamma mampu mengatasi
asumsi sebaran Poisson yang tidak terpenuhi, baik data yang mengalami
overdispersi maupun underdispersi. Penduga dengan menggunakan metode Bayes
empirik memiliki nilai KTG yang lebih kecil dibanding dengan penduga
langsung. Metode Bayes empirik dapat mengatasi permasalahan dari pendugaan
langsung dengan menambahkan informasi peubah penyerta, sehingga
menghasilkan pendugaan yang lebih akurat.
.
Kata kunci : Pendugaan Area Kecil, Post-stratification, Model Poisson-Gamma,
Bayes empirik.

SUMMARY

YUSRIANTI HANIKE. Study of Small Area Estimation (SAE) for Estimating the
Unemployment Rate Using Bayes approach. Supervised by KUSMAN SADIK
and ANANG KURNIA.
Small area estimation model reflects the demand for reliable small area
estimates for regional planning. Small areas can be a geographical region of a
country, a demographic group (a particular sex, race or age group) or a
demographic group within a geographical area. While, estimation used direct
estimator has big variance and sometimes wasn’t valid estimation. Using indirect
estimation, small area estimation, fixed it and more reliable than direct survey
estimates. In the absence of adequate direct information in small areas, small area
estimation technique borrows strength from related sources to produce precise
small area estimates. In fact, we find the empirical Bayes as the indirect estimator
has smaller mean square error than direct estimator.
In our research, we used post-stratification to handle the area interest. Poststratification is stratified method after survey sampling data. The data obtained by
BPS-Statistic Indonesia about unemployment rate which stratified into seven
category education. The result of this, made up teo model approach.First, the
effect education as the fixed or be dummy variable and the second, the education
as the random variable. Using post-stratification, model I results better evaluated
model than model II.
In unemployment rate case, the respon variable has Poisson assumption that

can be handling by Poisson-Gamma model approach. This approach can resolve
the underdispersion and overdispersion problem.
Keywords: Small Area Estimation, Post-stratification, Poisson-Gamma Model,
Empirical Bayes.

© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB

KAJIAN MODEL PENDUGAAN AREA KECIL
UNTUK PENDUGAAN TINGKAT PENGANGGURAN
MENGGUNAKAN PENDEKATAN BAYES

YUSRIANTI HANIKE


Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis : Dr Ir Indahwati, MSi

Judul Tesis : Kajian Model Pendugaan Area Kecil untuk Pendugaan Tingkat
Pengangguran Menggunakan Pendekatan Bayes
Nama
: Yusrianti Hanike
NIM
: G151130261


Disetujui oleh
Komisi Pembimbing

Dr Kusman Sadik, SSi MSi
Ketua

Dr Anang Kurnia, SSi MSi
Anggota

Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Kusman Sadik, SSi MSi

Dr Ir Dahrul Syah,MScAgr


Tanggal Ujian : 11 Januari 2016

Tanggal Lulus :

PRAKATA
Puji syukur penulis panjatkan kehadirat Allah SWT atas limpahan rahmat
dan ridho-Nya, kesempatan, dan kesehatan yang dikaruniakan-Nya sehingga tesis
yang berjudul “Kajian Model Pendugaan Area Kecil untuk Pendugaan Tingkat
Pengangguran Menggunakan Pendekatan Bayes” ini dapat terselesaikan.
Terima kasih penulis ucapkan kepada Bapak Dr Kusman Sadik, S.Si., M.Si.
Dan Dr. Anang Kurnia, S.Si., M.Si. selaku pembimbing, atas kesediaan dan
kesabaran untuk membimbing dan membagi ilmunya kepada penulis dalam
penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan sebesarbesarnya kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh
dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan
studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan
kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga
penulis ucapkan kepada Ayahanda dan Ibunda tercinta Hanike Gani dan
Darmawati Buhari yang telah membesarkan dan mendidik penulis dengan penuh
kasih sayang demi keberhasilan penulis selama menjalani proses pendidikan, juga

adikku tersayang Nisrina Hanike dan Putra Tri Sarwan, dan terima kasih tercurah
kepada teman spesialku Arfandi Arif serta seluruh keluarga besarku atas doa dan
semangatnya.
Terima kasih juga kepada program BPPDN Direktorat Pendidikan Tinggi
(Dikti) yang telah membiayai pendidikan Magister selama dua tahun di IPB dan
Penelitian Unggulan Sesuai Mandat Divisi (PUB) yang turut serta memberikan
kontribusi dalam penyelesaian thesis. Penelitian ini telah dipublikasikan pada
SEAMS (South East Asian Mathematical Society) UGM Conference 7” UGM
Yogyakarta pada 18–21 Agustus 2015.
Penulis juga menyampaikan terima kasih kepada seluruh mahasiswa
Pascasarjana Departemen Statistika IPB atas segala bantuan dan kebersamaannya
selama menghadapi masa-masa terindah maupun tersulit dalam menuntut ilmu,
serta semua pihak yang telah banyak membantu dan tak sempat penulis sebutkan
satu per satu.
Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Februari 2016

Yusrianti Hanike


DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
Manfaat Penelitian

1
1

2
2

2 TINJAUAN PUSTAKA
Pendugaan Langsung
Post-Stratification Sampling
Pendugaan Tidak Langsung
Model Linear Terampat
Model Poisson-Gamma
Bayes Empirik

3
3
3
4
7
8
10

3 METODE PENELITIAN

Data
Metode Analisis

12
12
14

4 HASIL DAN PEMBAHASAN
Deskripsi Data Pengangguran
Post-Stratification Sampling
Pemodelan dan Pendugaan Parameter
Penduga Kuadrat Tengah Galat
Kelayakan model
Pendugaan Pengangguran

15
15
16
17
20
21
22

5 SIMPULAN DAN SARAN
Simpulan
Saran

25
25
25

DAFTAR PUSTAKA

26

LAMPIRAN

29

RIWAYAT HIDUP

DAFTAR TABEL
1 Rincian peubah respon dan penyerta
2 Presentase pengangguran setiap kabupaten
3 Proporsi kejadian terhadap contoh data pengangguran terbuka tahun 2014
4 Hasil pengecekan asumsi pada sebaran Poisson
5 Hasil penanganan asumsi equidispersi model Poisson-Gamma
6 Pendugaan ragam area dan dispersi
7 Pendugaan β pada model I
8 Pendugaan β pada model II
9 Hasil perbandingan KTG dari setiap area
10 Hasil nilai BIC pada kelayakan model I dan model II

13
15
16
18
18
19
19
20
20
21

DAFTAR GAMBAR
1 Diagram pemilihan contoh blok sensus dan rumah tangga Sakernas
2 Diagram contoh Sakernas menurut angkatan kerja
3 Kuadrat tengah galat pendugaan langsung, dan pendugaan tidak langsung
menggunakan Bayes empirik kabupaten/kota di Sulawesi Selatan tahun
4 Pendugaan langsung Kabupaten/Kota Bulukumba, Pinrang, Enrekang,
Sinjai, Pangkep dan Soppeng di Sulawesi Selatan tahun 2014
5 Pendugaan tidak langsung Kabupaten/Kota Makassar, Maros, dan Luwu
Timur di Sulawesi Selatan tahun 2014

13
14
21
22
23

DAFTAR LAMPIRAN
1 Hasil perbandingan pendugaan langsung, dan tidak langsung (model I
dan II)
2 Tabel Kuadrat tengah galat pendugaan langsung, dan Bayes empirik
(model I dan II)
3 Formula Poisson-Gamma
4 syntax dan output

28
29
33
39

1
1 PENDAHULUAN

Latar Belakang
Survei merupakan salah satu alat untuk pengumpulan data. Pentingnya
survei seiring dengan meningkatnya kebutuhan terhadap informasi yang lebih
rinci pada lingkup keseluruhan populasi terhadap bagian dari populasinya, terlebih
saat ini sistem pemerintah di Indonesia menganut sistem desentralisasi (Bappenas
2010). Terkait dengan fungsi survei tersebut, saat ini dilakukan beberapa
pengembangan metodologi survei. Survei yang dilakukan oleh pemerintah,
umumnya didesain untuk memperoleh statistik nasional yang melingkupi daerah
yang cakupannya besar. Program yang dicanangkan pemerintah lebih spesifik
membutuhkan informasi untuk wilayah yang lebih kecil, contohnya informasi
pada level kabupaten, kecamatan bahkan mungkin level desa. Ukuran contoh pada
level wilayah tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan
memiliki ragam yang besar. Hasil pendugaan juga tidak dapat dilakukan jika area
tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu,
dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini.
Metode tersebut dikenal dengan metode pendugaan area kecil (Small Area
Estimation/SAE).
Pendugaan parameter untuk model dasar SAE biasanya menggunakan
metode Prediksi Tak-bias Linier Terbaik (Best Linear Unbiased Predictor) yaitu
dengan meminimumkan Kuadrat Tengah Galat (KTG) dari penduga. Rao (2003)
mengatakan bahwa metode tersebut hanya cocok untuk peubah kontinu, tetapi
kurang sesuai jika digunakan untuk pemodelan peubah respon bertipe diskrit
(biner atau cacahan). Untuk peubah bertipe diskrit akan lebih tepat menggunakan
metode pendugaan melalui pendekatan Bayes, baik melalui metode Bayes empirik
maupun metode Bayes berhirarki. Pada pendekatan Bayes empirik, pendugaan
berdasarkan pada sebaran posterior yang diduga dari data. Adapun pada
pendekatan Bayes berhirarki, parameter model yang tidak diketahui (termasuk
komponen ragam) diperlakukan sebagai komponen acak yang masing-masing
memiliki sebaran prior tertentu. Sebaran posterior untuk parameter yang menjadi
perhatian diperoleh berdasarkan seluruh sebaran prior tersebut.
Pendugaan model SAE diaplikasikan pada berbagai kebijakan pemerintah
salah satunya pengentasan kemiskinan. Pengentasan kemiskinan pada aspek
sumber daya manusia dapat dilakukan dengan menyiapkan lapangan kerja atau
menanggulangi banyaknya pengangguran di Indonesia. Dalam penanggulangan
pengangguran, beberapa program pengentasan memperhatikan latar belakang dari
penggangguran. Salah satunya terkait jenjang pendidikan yang telah ditempuh
dari pengangguran tersebut. Tak hanya itu, dari informasi pengangguran ini akan
menjadi indikator dari pelaksanaan program pemberdayaan masyarakat, sehingga
menjadi penting untuk diteliti.
Tingkat pengangguran pada setiap jenjang pendidikan dapat dianggap
sebagai peubah respon bertipe diskrit. Salah satu sebaran yang cocok dalam
menggambarkan tingkat pengangguran pada setiap jenjang pendidikan ini adalah
sebaran berbasis Multinomial. Ini dikarenakan sebaran Multinomial adalah
sebaran yang memiliki lebih dari dua peluang. Penelitian sebelumnya, Rumiati

2
(2012) yang mengadopsi sebaran ini melakukan pendugaan angka melek huruf
pada jenjang pendidikan di Provinsi Jawa Timur.
Pendugaan melalui sebaran Multinomial ternyata menemukan jalan yang
sulit. Satu respon dengan berbagai kategori menyebabkan analitik yang rumit.
Mengatasi hal ini, maka ditawarkan solusi post-stratification. Post-stratification
adalah salah satu cara untuk melakukan pengelompokkan setelah data survei.
Teknik ini diperkenalkan oleh Holt dan Smith (1979) yang melakukan
pengelompokan atau stratifikasi dari data yang telah disurvei. Hogan (2003)
mengadopsi teknik ini pada data sensus yang tidak homogen. Selain itu, Little
(1993) juga melakukan teknik ini dengan menstratifikasi survei kesehatan mental
berdasarkan gender, ras, dan umur
Menurut BPS (2014) Pengangguran pada setiap provinsi di Indonesia
tercatat sekitar 10%, hal ini menyebabkan angka yang kecil untuk kejadian
pengangguran di level kabupaten. Maka dari itu, banyaknya pengangguran
diasumsikan memiliki sebaran Poisson. Permasalahan kemudian, Poisson pada
umumnya melenceng dari asumsi equidipersi, equidispersi adalah nilai rata-rata
sama dengan nilai ragamnya. Salah satu cara mengatasi hal tersebut yakni dengan
mengakomodasi ragam ekstra dari pengamatan data contoh. Metode ini dikenal
dengan Binomial negatif yang didasari oleh model campuran Poisson-Gamma
(Kismiantini 2007). Selanjutnya, pendugaan parameter akan dilakukan melalui
pendekatan Bayes, mengingat sebaran ini merupakan sebaran diskrit (Rao 2003).
Pendekatan Bayes yang digunakan yakni Bayes empirik dikarenakan pendugaan
yang dilakukan diambil dari data sehingga pendugaan terhadap asumsi
equidispersi dari data dapat dimasukkan pada pendugaan yang diharapkan dapat
mengatasi asumsi tersebut.
Definisi pengangguran akan dibatasi dengan mengacu pada Badan Pusat
Statistik (BPS) yakni pengangguran terbuka. Di tahun 2013, tercatat ada 10
provinsi yang termasuk memiliki tingkat pengangguran terbuka yang tinggi, salah
satunya yakni Sulawesi Selatan. Di tahun 2013 Sulawesi memiliki tingkat
pengangguran sebesar 5.08%, sementara dana yang dianggarkan untuk
pemberdayaan masyarakat pada daerah tersebut terbilang besar yakni sekitar
20,34% APBD (Komite Ekonomi Nasional, 2011). Melalui hal tersebut, akan
dilakukan penelitian dengan menduga tingkat pendidikan pengangguran pada
level kabupaten di Provinsi Sulawesi Selatan.
Tujuan Penelitian
1. Menduga persentase area kecil pada model Poisson-Gamma melalui
pendekatan Bayes
2. Menerapkan pendugaan model Poisson-Gamma pada tingkat pengangguran
pada setiap jenjang pendidikan melalui post-stratification sampling di setiap
kabupaten di Sulawesi Selatan baik melalui pendugaan langsung maupun
pendekatan Bayes.
Manfaat Penelitian
Penelitian ini bermanfaat bagi pemerintah daerah di Provinsi Sulawesi
Selatan ataupun di tingkat kabupaten/kota di Provinsi Sulawesi Selatan terutama

3
di bidang sosial dalam mengidentifikasi banyaknya pengangguran terbuka pada
kabupaten/kota di Provinsi Sulawesi Selatan.

4
2

TINJAUAN PUSTAKA

Pendugaan Langsung
Dalam konteks survei, penduga dikatakan langsung (direct estimator)
apabila pendugaan parameter di suatu area hanya didasarkan pada data contoh
yang diperoleh dari area tersebut (Sadik 2009). Contoh kasus misalnya,
pendugaan tingkat pengangguran suatu kabupaten didasarkan hanya pada data
survei yang diperoleh dari kabupaten tersebut. Informasi lain yang berada di luar
area kabupaten tersebut tidak diperhitungkan.
Metode pendugaan langsung memiliki kelemahan jika dihadapkan pada
contoh dengan ukuran kecil, yaitu dugaan yang dihasilkan tidak memiliki presisi
yang memadai. Nilai hasil pendugaan langsung pada suatu area kecil merupakan
penduga tak bias meskipun memiliki ragam yang besar dikarenakan dugaannya
diperoleh dari ukuran contoh yang kecil (Rao 2003). Data contoh yang digunakan
adalah data Survei Angkatan Kerja Nasional (Sakernas) tahun 2014.
Data yang digunakan merupakan hasil penarikan contoh dari Sakernas,
sehingga pada pendugaan merupakan pendugaan yang berbasis pada rancangan
survei. Maka akan memperhitungkan bobot yang dihasilkan pada penarikan
contoh tersebut. Pada pendugaan yang berbasis pada rancangan survei, pembobot
rancangan ( ) memiliki peranan penting dalam membentuk penduga berbasis
rancangan
bagi
. Pembobot ini bergantung pada s dan elemen
� dengan = 1,2, … dan = 1,2, … . . Pembobot ini telah ditentukan
oleh Sakernas berdasarkan metode penarikan contoh yang digunakan. Sehingga
penduga langsung untuk setiap area dapat diekspresikan sebagai berikut:
=1

=

( )

(2.1)

dengan
= =1 , pembobot ini merupakan bentuk umum dari penduga
Horvit Thompson (Cochran 1977).
Penduga ragam proporsi area kecil merupakan penduga takbias, sehingga
Kuadrat Tengah Galat (KTG) sama dengan penduga ragam proporsi area kecil
tersebut. Pendugaan ragam pada pendugaan langsung mengacu pada data survei.
Menurut Demnati dan Rao (2007) Taylor linearization sering digunakan untuk
mendapatkan ragam dari pendugaan pada populasi terbatas. Metode ini digunakan
pada pendugaan statistik yang kompleks baik pada pendugaan rasio maupun
logistik pada regresi. Secara garis besar, metode ini diaplikasikan pada desain
penarikan contoh pada pendugaan ragam yang tak berbias untuk pendugaan linear,
berbeda dengan jackknife metode ini lebih sederhana.
Prosedur dari pendugaan ragam dapat dituliskan sebagai berikut:
=

=1

1−

1

2
1

+

1

=1

1−

2

2
2

(2.2)

5

dengan

2
1

=
2

1

1

2
=1

−1

=

,

=1
( )



2

1

=1

=1

,

2
2

,
=

dan

=

2

1

=1

=1

−1

( )



.

=

.
= 1/( 1 2 ) dengan 1 = /
dan 2 =
. menunjukkan banyaknya populasi pada sampling pertama sementara
menunjukkan banyaknya populasi di sampling kedua. Metode ini dapat
dihitung menggunakan aplikasi SAS dengan menggunakan surveymeans
procedure.
/

Post-stratification Sampling
Post-stratification adalah teknik penarikan contoh dengan melakukan
pengelompokkan setelah data survei. Teknik ini awalnya didesain karena strata
yang telah ada pada data sensus dianggap tidak homogen. Mengatasi hal tersebut
maka diberikan solusi dengan menggunakan post-stratification sampling.
Walaupun sifatnya yang subjektif dalam pemberian strata, teknik ini terbilang
mampu memberikan hasil pendugaan yang lebih baik (Hogan 2003).
Kelebihan lain yang diberikan teknik ini yakni dapat meningkatkan
ketepatan perkiraan pada populasi dan meminimalisir ragam dalam menduga ratarata. Teknik ini pun menjadi efektif, jika unit contoh untuk strata tidak bisa
dikendalikan misalnya memiliki pencilan atau tingkat heterogen yang tinggi
(Westfall et al. 2011).
Pendugaan melalui post-stratification menurut Westfall et al (2011) dapat
dirumuskan sebagai berikut:


dengan

=


=1

(2.3)

adalah bobot yang dihasilkan dari post-stratification yakni

peluang dari banyaknya sampel dari strata yang terpilih di
terhadap seluruh
jumlah sampel. Standar error dari hasil pendugaan pada persamaan (2.2) dapat


dihitung dengan

untuk

2

=

=1

(

=


−1

)2

1


=1

2

+


=1(1 −

)

1

2

dan

Pendugaan dapat pula dihitung menggunakan

aplikasi SAS dengan menggunakan surveymeans procedure .
Pendugaan Tidak Langsung
Permasalahan yang ditimbulkan dari pendugaan langsung (direct estimator)
dapat ditanggulangi dengan mengembangkan suatu metode pendugaan dengan
cara tidak langsung (indirect estimation). Tujuan dari pendugaan ini adalah untuk
meningkatkan keefektifan ukuran contoh dan menurunkan keragaman sehingga
lebih akurat. Pendugaan tersebut dikenal sebagai pendugaan area kecil.
Pendugaan parameter pendugaan tidak langsung menggunakan informasi
tambahan. Metode dengan memanfaatkan informasi tambahan tersebut secara
statistik memiliki sifat ”meminjam kekuatan” (borrowing strength) informasi dari

6
hubungan antara peubah respon dengan informasi yang ditambahkan. Dengan
demikian, pendugaan tidak langsung ini dapat mencakup data dari area yang lain.
Chand dan Alexander (1995) dalam Kurnia (2009) menyebutkan bahwa
prosedur pendugaan area kecil pada dasarnya memanfaatkan kekuatan informasi
area sekitarnya (neighbouring areas) dan sumber data di luar area yang
statistiknya ingin diperoleh melalui pembentukan model yang tepat untuk
meningkatkan efektifitas ukuran contoh. Secara umum, pendugaan area kecil
dapat dikatakan sebagai suatu model untuk menduga parameter pada suatu area
yang relatif kecil dalam percontohan survei dengan memanfaatkan informasi dari
luar area, dari dalam area itu sendiri dan dari luar survei.
Pendugaan tidak langsung untuk menduga parameter regresi dapat
menggunakan metode Penduga Tak Bias Linier Terbaik Empirik (EBLUP),
Penduga Bayes empirik dan juga Penduga Hierarchical Bayes.
Pendugaan tidak langsung membagi model area kecil ke dalam 2 kelompok
yaitu model berbasis area (basic area level model) dan model berbasis unit (basic
unit level model).
Model Berbasis Area
Perhatikan suatu populasi berukuran yang dipartisi ke dalam himpunan
bagian yang masing-masing berukuran 1 , … ,
yang selanjutnya disebut
sebagai area atau domain. Misalkan � merupakan suatu nilai dari peubah yang
diamati pada unit ke-j untuk area ke-i. Tujuannya untuk memperoleh rata-rata dari
1
m area yang memenuhi persamaan � =
=1 � untuk i=1,2,…, m.

Suatu contoh berukuran
diambil dari populasi dengan menggunakan
rancangan penarikan contoh tertentu. Penduga langsung sebut saja, , bagi
parameter � merupakan penduga yang hanya menggunakan data contoh dari area
m. Melalui rancangan seperti ini maka menurut Fay dan Herriot (1979) penduga
langsung untuk area-area dengan data contoh yang kecil akan mempunyai ragam
yang terlalu besar. Untuk mengurangi ragam tersebut, dalam konteks pendugaan
area kecil, Fay-Herriot (1979) mengasumsikan bahwa parameter = (� ) untuk
beberapa (. ) yang dihubungkan pada data tambahan dalam area tertentu xi = (x1i,
. . ., xpi)T mengikuti model linear seperti di bawah ini:
=

�+

i = 1,2,...,m

(2.4)

dengan bi adalah konstanta bernilai positif dan � = ( 1 , … , � ) vektor koefisien
pengaruh acak dari area tertentu yang saling bebas
regresi berukuran � × 1.
dan bersebaran identik dengan nilai harapan model ( ) = 0 dan ragam model
( ) = � 2 . Untuk membuat model mengenai rata-rata area kecil � di bawah
model (2.4) diasumsikan bahwa telah tersedia penduga langsung . Menurut Rao
(2003) sebagaimana metode James-Stein diasumsikan bahwa :
=

� =

+

= 1,2, … ,

(2.5)

7
saling bebas dengan nilai harapan dan ragamnya masing-masing adalah
) = � 2 . Pada umumnya diasumsikan pula
adalah
) = 0 dan
2
galat penarikan contoh dengan ragam penarikan contoh � adalah diketahui.
Dengan mengkombinasikan model pada persamaan 2.4 dan 2.5 maka akan
diperoleh :
=


��

+

+

= 1, … ,

(2.6)

model di atas melibatkan dua buah galat, yaitu galat
dan , dalam hal ini
diasumsikan bahwa keduanya saling bebas. Model di atas adalah kasus khusus
untuk model campuran linear.
Model Berbasis Unit
Model level unit merupakan suatu model dengan data pendukung yang
tersedia bersesuaian antara individu dengan data respon. Misal
=
( 1 , 2 , … , � ) tersedia pada elemen ke-j di area ke-i. Peubah yang
diperhatikan adalah
yang diasumsikan memiliki hubungan dengan
melalui
model:
�+

=

+

, = 1, … ,

, = 1, … ,

(2.7)

dengan pengaruh acak area yang diasumsikan bebas dan menyebar identik,
dengan
=
, dengan
adalah nilai konstanta yang diketahui dan
menyebar iid terhadap
dan ( ) = 0 dan ragam model ( ) = � 2 . Pada
umumnya dan
diketahui.
Jika diasumsikan contoh dengan ukuran
yang diambil dari unit pada
area ke-i dan berdasarkan pada model (2.6) maka dapat pula dibentuk persamaan
yang menggunakan peubah penyerta
pada contoh terambil sebagai berikut:




= �� � +

��� + �� � , = 1, … ,

× 1 dan
dengan �� adalah
× �, � � , ��� , �� � adalah vektor berukuran

�� = (1, … ,1) ,sehingga asumsi penarikan contoh dalam setiap area yang
diambil secara acak sederhana, maka model dapat dinyatakan dalam bentuk
matriks:




=





=

��
�� ∗

+

��
�� ∗

��
+ �∗


(2.8)

dimana bagian yang ditandai asterisk (*) menunjukkan unit yang tidak tercakup
dalam contoh. Jika � merupakan rata-rata populasi di area kecil ke-i, maka �
adalah:
� =

+ 1−





(2.9)

8
dengan

=

,



adalah rata-rata dari seluruh contoh di area ke-i dan � adalah

rata-rata elemen populasi dari bagian yang tidak terambil sebagai contoh. Oleh
karena itu, untuk model SAE berbasis unit, pendugaan parameter area kecil �

dan � � tersedia. Model SAE
sama dengan menduga � jika data contoh
yang digunakan dalam penelitian ini adalah model level area karena data
pendukungnya hanya ada pada level area tertentu yaitu kabupaten/kota.
Model Linear Terampat
Istilah Model linear terampat merujuk pada kelas model yang lebih luas
yang dipopulerkan oleh diperkenalkan oleh McCullagh dan Nelder (1983). Model
ini mengasumsikan bahwa peubah respon mengikuti sebaran dari keluarga
eksponensial dengan
, yang biasanya diasumsikan sebagai suatu fungsi

(seringkali bentuknya nonlinear) dari
� �. Beberapa penulis menyatakan
bentuknya adalah nonlinear karena seringkali merupakan fungsi nonlinear dari
kovariat. Namun
McCullagh dan Nelder (1983) mempertimbangkan fungsi
tersebut sebagai bentuk yang linear, karena kovariat ini mempnegaruhi sebaran
respon hanya melalui kombinasi linear dari �� �.
Model linear terampat didefinisikan dalam bentuk segugus peubah acak
�1 , … . , � yang saling bebas, dan masing-masing peubah acak tersebut
mempunyai sebaran yang sama dari keluarga eksponensial (Hajarisman 2013).
Sebaran tersebut memiliki sifat-sifat sebagai berikut:
1.
Sebaran dari masing-masing peubah respon berbentuk kanonik dan
bergantung pada satu parameter tunggal , yang fungsi peluangnya dapat
dituliskan sebagai berikut:


, � = exp



+

,�

(2.10)

Sebaran dari semua peubah peubah acak � mempunyai bentuk yang sama.
merupakan suatu fungsi bagi . Dalam
Misalkan
� = , dengan
GLM dilakukan transformasi bagi
sedemikian rupa sehingga diperoleh

( ) = = � � dengan g merupakan fungsi monoton dan mempunyai turunan
yang disebut juga sebagai fungsi hubung (link function), � merupakan vektor
dari peubah penyerta berukuran p x 1.
Model linear terampat mempunyai tiga buah komponen, yaitu:
1.
Peubah respons �1 , … . , � yang diasumsikan merupakan anggota dari
sebaran keluarga eksponensial. Komponen acaknya adalah peubah respon.
2.
Komponen sistematik adalah kombinasi linear dari kovariat 1 , … . , � .
3.
Fungsi penghubung adalah fungsi yang menghubungkan antara komponen
acak dan komponen sistematik. Fungsi ini harus bersifat terdiferensialkan
monoton.
Penelitian ini fokus pada peubah respon dengan sebaran Poisson. Fungsi
peluang pada poisson dapat dituliskan sebagai berikut:
2.

|

=



(

)
!

9
= exp

log(

)−(

− log⁡
( !)]

(2.11)

dengan = log(
), � = 1,
= exp( ) dan
, � = − log ! . Hal ini
menunjukkan bahwa sebaran Poisson merupakan anggota dari keluarga
eksponensial. Fungsi penghubung dari Poisson ini adalah log, jika parameter
alamiah
dimodelkan
=
� + yang tidak lain merupakan model SAE
berbasis area pada persamaan (2.4), dapat dituliskan sebagai berikut:
�+

=

log

(2.12)

melalui persamaan (2.12) akan dilakukan pendugaan terhadap area ke-i
berdasarkan metode yang akan digunakan, dalam hal ini Bayes empirik.
Model Poisson-Gamma
Pada sebaran Poisson biasanya tidak memenuhi asumsi equidipersi. Asumsi
ini menyatakan bahwa nilai ragamnya sama dengan nilai rataannya. Pada
umumnya, gejala yang dialami yakni overdispersi. Overdispersi terjadi karena
keragamannya yang lebih besar dari nilai tengahnya. Hal ini akan mengakibatkan
galat baku dari parameter dugaan menjadi berbias ke bawah.
Fenomena overdispersi dan underdispersi untuk kasus Poisson dapat
dituliskan: Overdispersi : Var (Y) > E (Y) dan underdispersi: Var (Y) < E(Y).
Menurur Rodriguez (2013) cara untuk mendeteksi asumsi ini adalah dengan
menggunakan pearson chi-square yang dibagi dengan derajat bebas sebagai
berikut:

dimana � 2 =

=1

( −

)2



�=

�2

(2.13)

dan df = n – p dengan n adalah banyaknya observasi

dan p adalah banyaknya parameter.
Untuk mengatasi hal tersebut maka dikembangkanlah formulasi Poisson
yang mengakomodasi ragam ekstra dari pengamatan data contoh, model ini
dikenal dengan model campuran Poisson-Gamma (Kismiantini 2007).
Pada sebaran Poisson diasumsikan sebaran Gamma sebagai prior yang
merupakan conjugate dari sebaran Poisson. Sebaran Poisson dinotasikan
~Poisson(
).
Misalnya dinotasikan
dengan
=
, dengan
= �� � +
dan
mengikuti sebaran Gamma dengan rataan 1 dan ragam 1/�. Parameter �
merupakan parameter dari dispersi. Jeong dan Yang (2009) menyatakan bahwa
masalah dari rataan yang rendah diakibatkan dari pendugaan � dari ukuran contoh
yang kecil.
Misalkan 1 , … . , � merupakan peubah penyerta dan diasumsikan rataan dari
dari persamaan linier di bawah ini:
�;

=

0

+

1 1

+ ⋯+

� �

+

(2.14)

10
dengan � = ( 0 , 1 , … , � )′ dan = ( 1 , 2 , … , � )′, dan = peubah acak area
dan diasumsikan log sebagai fungsi hubung, sehingga dapat dibentuk sebagai
berikut:
=

log

=

Menurut Jeong

| ~Gamma �,

dan

1



(

)

,

!

Yang



+ ⋯+

1



~ Poisson (

Fungsi kepekatan Poisson,
berikut:
|

+

0

(2009)

=

|





Γ(� )



+

.

(2.15)

) dapat dituliskan sebagai

= 0,1, ….

(2.16)

fungsi

� −1

� �

kepekatan

,

peluang

>0

(2.17)

sehingga fungsi kepekatan bersamanya dapat dituliskan sebagai berikut :

,

=



(



)
!

=







� �

� −1

Γ(� )

+�−1 −

!Γ(� )

= 0,1, … ;

,

+



>0

(2.18)

dengan Γ(. ) adalah fungsi Euler gamma yang didefinisikan sebagai Γ
=

−1 −
. Sebaran marjinal
diperoleh dari persamaan (2.18) yang
0
ditegralkan terhadap
membentuk sebaran Binomial negatif yang dapat
dinyatakan sebagai berikut:
=





Γ( +�)

+�

!Γ(� )

1−



+�

(2.19)

dengan rata-rata dan ragam:
=

+�

(2.20)



+( )
+�

=
+



2

.

(2.21)

11
Persamaan (2.21) menunjukkan parameter skala � dapat mengakomodasi
overdispersi. Pada pendekatan Bayes, digunakan rata-rata posterior (2.20) sebagai
penduga ketika parameter yang diasumsikan diketahui.

12
Bayes Empirik
Berdasarkan model Poisson-Gamma, didapatkan nilai harapan fungsi
= . Jika
posterior, nilai harapan inilah yang menjadi pendugaan Bayes
� dan diduga dari data, pendugaan ini dikenal dengan Bayes empirik
.
Pendekatan Bayes empirik tidak berbeda jauh dengan pendekatan frequentist,
karena hanya menghubungkan model dengan memvalidasi data. Pendekatan ini
tidak memerlukan pendugaan parameter prior, berbeda dengan metode
hierarchical Bayes. Jika �, and
diasumsikan diketahui melalui pendugaan
dari data, parameter tersebut akan disubstitusi pada pendugaan EB terhadap fungsi
posterior dari .
Fungsi posterior menurut aturan Bayes dapat dituliskan sebagai berikut:
, ,� =



,

(2.22)

sehingga, posterior dapat didefinisikan memiliki | , , � ~ Gamma( + �, + � ) .
Penduga Bayes yang merupakan nilai harapan dari fungsi posterior dapat
dinyatakan sebagai berikut:
=

+�

(2.23)



+( )

dengan = exp⁡
( 0 + 1 1 +⋯+
(2.23) dengan
= (�; � ) dan





+

). Pendugaan EB pada persamaan

didapatkan melalui pendugaan dengan

metode maksimum likelihood dan dapat dituliskan dalam bentuk sebagai
berikut:



=

=
dengan

=



+�

+�

+ (1 −

dengan 0 <

+

)

+�

(2.24)

< 1.

Pendugaan parameter � dan
dilakukan dengan menggunakan metode
Laplace Approximation. Metode Laplace Approximation adalah salah teknik
pendugaan parameter baik pada pengaruh tetap maupun acak. Metode ini
mengatasi sebaran yang tidak normal, lalu melakukan pendekatan normal untuk
melakukan pendugaan. Pada Tahapannya, metode ini akan menentukan modus
dari fungsi posterior kemudian menempatkannya sebagai rataan berdasarkan
asumsi normal.
Kelebihan dari teknik ini yakni dapat menghasilkan pendugaan yang lebih
akurat dibandingkan dengan menggunakan quasi-likelihood (Bolker et al. 2009).
Tak hanya itu, teknik ini memberikan perkiraan yang lebih akurat dari setiap
fungsi parameter dalam analisis Bayesian. Pedugaan melalui metode ini dapat
dihitung melalui program SAS pada Glimmix procedure.

13
Penduga MSE(
) atau kuadrat tengah galat (KTG) didapatkan
posterior. Steffey dan Kass (1989) menyatakan bahwa KTG dari EB
dapat didekatkan dengan menggunakan ragam yang dihasilkan dari
Bayes dengan mensubtitusikan parameter yang telah diduga yakni
kedalam (2.21) maka dapat dijabarkan sebagai berikut:
+�

=
+



2

.

dari ragam
pendugaan
pendugaan
� dan
(2.25)

Pendugaan Bayes empirik baik pada pendugaan proporsi maupun KTG dihitung
melalui program SAS dengan menggunakan Proc IML.

14
3

METODE PENELITIAN
Data

Data yang digunakan dalam penelitian ini adalah data primer dari Survei
Angkatan Kerja Nasional (Sakernas) 2014 yang diambil pada triwulan III bulan
Agustus 2014. Sakernas Agustus 2014 dilaksanakan di seluruh wilayah Republik
Indonesia dengan jumlah contoh sekitar 200 000 rumah tangga, tersebar pada 20
000 blok sensus di seluruh provinsi baik di daerah perkotaan maupun perdesaan.
Sebanyak 20 000 blok sensus diantaranya 5 000 blok sensus adalah contoh
Sakernas triwulanan III dan 15 000 blok sensus merupakan contoh Sakernas
tambahan dengan pendataan yang dilakukan hingga tingkat kabupaten/kota.
Rumah tangga korps diplomatik, rumah tangga yang tinggal baik blok sensus
khusus dan rumah tangga khusus yang berada di blok sensus biasa tidak dipilih
dalam contoh.
Menurut pedoman Sakernas 2014, desain contoh pada survei ini dilakukan
dalam tiga tahap yakni tahap pertama: dari daftar wilayah cacahan SP2010 dipilih
30 000 wilayah cacahan untuk Susenas secara Probability Proportional to Size
(pps) dengan ukuran jumlah rumah tangga SP2010. Kemudian 30 000 wilayah
cacahan tersebut dialokasikan sama ke dalam empat triwulan, masing-masing
sebesar 7 500 wilayah cacahan. Dari 7 500 wilayah cacahan Susenas Triwulan I,
dipilih 5 000 wilayah cacahan secara sistematik untuk Sakernas 2011 Triwulan I
dan akan digunakan lagi untuk Triwulan II, III, dan IV. Tahap kedua: memilih dua
blok sensus pada setiap wilayah cacahan terpilih Susenas yang juga terpilih
Sakernas secara pps sistematik dengan ukuran jumlah rumah tangga hasil
pemutakhiran SP2010. Selanjutnya blok-blok sensus terpilih dialokasikan secara
acak untuk Susenas dan Sakernas. Blok-blok sensus terpilih Sakernas ini
digunakan untuk pendugaan provinsi dan dibagi ke dalam 4 paket contoh. Khusus
untuk Sakernas Triwulan III, yang diperuntukkan untuk estimasi kabupaten,
diperlukan tambahan contoh blok sensus. Dari 15 000 contoh wilayah cacahan
terpilih Susenas Triwulan II dan III masing-masing dipilih dua blok sensus, satu
untuk keperluan Susenas dan yang lainnya untuk Sakernas. Blok sensus untuk
Sakernas yang terpilih dari PSU Susenas Triwulan II dan III ini selanjutnya
digunakan sebagai contoh blok sensus komplemen yang merupakan tambahan
contoh yang apabila digabungkan dengan blok sensus pendugaan provinsi
(Sakernas Triwulan III) dapat digunakan untuk pendugaan kabupaten. Tahap
ketiga: memilih 10 rumah tangga secara sistematik berdasarkan hasil
pemutakhiran rumah tangga SP2010.
Pada Sakernas Provinsi Sulawesi Selatan terdiri kabupaten/kota sebanyak
24 dengan blok sensus sebanyak 696 dan rumah tangga sebanyak 6 960. Dari
rumah tangga tersebut terambil contoh sebanyak 24 231 individu. Diagram
pemilihan contoh blok sensus dan rumah tangga Sakernas dapat dilihat pada
Gambar 1.
Definisi pengangguran mengacu pada BPS yakni pengangguran terbuka.
Pengangguran terbuka didefinisikan yakni individu berumur 15 tahun ke atas,
tidak bekerja setelah lebih dari satu minggu, mencari pekerjaan, mempersiapkan
usaha, putus asa/merasa tidak mungkin mendapatkan pekerjaan, sudah punya
pekerjaan tetapi belum bekerja.

15

Gambar 1 Diagram pemilihan contoh blok sensus dan rumah tangga Sakernas
Definisi pengangguran terbuka pada Gambar 2 distratifikasi berdasarkan
metode post-stratification. Teknik stratifikasi dilakukan pada hasil data survei
menjadi 7 kategori yaitu tidak tamat SD, SD, SMP, SMA, SMK, Diploma, lulusan
universitas. Sehingga, jika kategori dan kabupaten dikombinasikan akan
membentuk 168 informasi mengenai pengangguran berdasarkan kategori
pendidikannya.
Tabel 1 Rincian peubah respon dan penyerta
No
Nama Peubah
1 Banyaknya
pengangguran
area ke-i( )
2 Pendapatan
kabupaten ( 1 )
3 Kapasitas
perekonomian
( 2)
4

Kapasitas sosial
kemasyarakatan
( 3)

Status
Peubah
respon
Peubah
penyerta
Peubah
penyerta

Penjelasan
Banyaknya pengangguran terhadap
banyaknya contoh

Nilai pendapatan kabupaten dalam satuan
rupiah
Program/kegiatan pemberdayaan
masyarakat melalui Peningkatan kapasitas
sosial kemasyarakatan (SDM) Peningkatan
keterampilan pemasaran hasil produksi
Peubah Program/kegiatan pemberdayaan
penyerta masyarakat melalui Peningkatan kapasitas
sosial kemasyarakatan (SDM) penguatan
kelembagaan sosial kemasyarakatan

16

Data yang digunakan untuk peubah penyerta yakni potensi desa tahun 2014.
Data hasil Pendataan Potensi Desa (Podes) 2014 dapat dimanfaatkan untuk berbagai
keperluan oleh berbagai pihak yang membutuhkan sumber data berbasis wilayah.
Podes 2014 dilaksanakan selama bulan April 2014, mencakup seluruh wilayah
administrasi pemerintahan setingkat desa (BPS 2014).

Gambar 2 Diagram contoh Sakernas menurut angkatan kerja
Metode Analisis
Data akan dianalisis dengan dua model yakni pendugaan langsung dan
dengan pendekatan Bayes.
Berikut penjabaran proses analisis:
1. Data peubah respon yakni kategori pendidikan pengangguran terbuka
dilakukan teknik penarikan contoh post-stratification.
2. Eksplorasi data dan pengecekan asumsi Poisson.
3. Menghitung proporsi pendidikan pengangguran melalui pendugaan
langsung pada persamaan (2.1).
4. Menentukan kuadrat tengah galat (KTG) dari pendugaan langsung pada
persamaan (2.2).
5. Pendugaan �, � dan ragam pengaruh acak melalui Laplace
Approximation.
6. Menentukan penduga bayes, yang dapat dinyatakan sebagai berikut:
=
Dimana

=



+�

dengan 0 <

+ (1 −

)

< 1.

7. Menentukan nilai proporsi dari setiap pendugaan pengangguran pada
setiap jenjang dengan membagi berdasakan ukuran sampel yang terambil
pada setiap area. Hasil proporsi kemudian dikonversi menjadi persentase.
8. Menghitung KTG melalui pendekatan Bayes pada persamaan (2.24).
9. Membandingkan KTG pendugaan langsung dan penduga Bayes

17
4

HASIL DAN PEMBAHASAN

Deskripsi Data Pengangguran
Provinsi Sulawesi Selatan terdiri dari 24 kabupaten, setiap kabupaten
didefinisikan memiliki 7 kategori pendidikan yakni belum tamat SD, tamat SD,
tamat SMP, tamat SMA, tamat SMK, tamat diploma, tamat universitas.
Data pengangguran Sulawesi Selatan diasumsikan bersebaran Poisson. Ini
disebabkan beberapa kejadian pada setiap kabupaten di setiap jenjang pendidikan
memiliki kejadian yang sedikit. Kejadian yang sedikit disebabkan oleh beberapa
faktor. Diantaranya contoh yang sedikit dan pembatasan definisi pengangguran.
Data pengangguran yang digunakan diambil dari Sakernas 2014. Konsep
dan definisi yang digunakan dalam pengumpulan data ketenagakerjaan melalui
Sakernas oleh Badan Pusat Statistik (BPS) adalah The labor force concept yang
disarankan oleh International Labor Organization (ILO) yakni: Pengangguran
meliputi yakni individu berumur 15 tahun ke atas, penduduk yang tidak bekerja
atau sedang mencari pekerjaan lebih dari satu minggu, atau mempersiapkan suatu
usaha, atau merasa tidak mungkin mendapat pekerjaan (putus asa), atau sudah
diterima bekerja, tetapi belum mulai bekerja.
Berikut hasil survei terhadap banyaknya penggangguran dalam bentuk
persentase untuk setiap kabupaten di Sulawesi Selatan tahun 2014.
Tabel 2 Persentase pengangguran setiap kabupaten
No
1
2
3
4
5
6
7
8
9
10
11
12

Kabupaten
Selayar
Bulukumba
Bantaeng
Jeneponto
Takalar
Gowa
Sinjai
Bone
Maros
Pangkep
Barru
Soppeng

Persentase
1.43
2.87
2.71
2.39
2.23
3.03
1.11
5.10
7.80
1.43
7.17
2.23

No
13
14
15
16
17
18
19
20
21
22
23
24

Kabupaten
Wajo
Sidenreng Rappang
Pinrang
Enrekang
Luwu
Tana Toraja
Luwu Utara
Luwu Timur
Toraja Utara
Makassar
Pare-pare
Palopo

Persentase
3.82
5.25
2.87
2.71
6.37
4.30
1.75
7.48
3.50
10.51
4.94
7.01

Tabel 2 menyajikan persentase pengangguran di setiap kabupaten di
Sulawesi Selatan. Dari hasil deskriptif data, kota Makassar adalah daerah dengan
tingkat pengangguran tertinggi. Persentase pengangguran di kota tersebut yakni
10.51%. Di urutan kedua yakni Kabupaten Maros dengan persentase sebanyak
7.80%.

18
Post-stratification Sampling
Post-stratification sampling adalah teknik penarikan contoh stratifikasi
setelah data diperoleh. Post-stratification sampling ini biasanya dilakukan jika
ingin melakukan stratifikasi pada daerah tertentu sesuai dengan keinginan
penelitian. Sifatnya yang subjektif menyebabkan teknik ini tidak memiliki aturan
tertentu pada proses stratifikasinya (James et. al. 2011). Teknik ini dapat disajikan
dalam beberapa model.
Model dengan menggunakan teknik penarikan contoh ini akan
menyebabkan ragam yang lebih kecil pada setiap area yang dihasilkan sebelum
dilakukan post-stratification. Namun, kebaikan model yang dihasilkan tergantung
pada peubah penyerta yang mendukung (Westfall et. al. 2011). Sifatnya yang nonadministrasi menyebabkan peubah penyerta yang ingin digunakan menjadi
terbatas. Maka dari itu, model yang dihasilkan belum tentu lebih baik jika
dibandingkan dengan model tanpa stratifikasi.
Tabel 3 Proporsi kejadian terhadap contoh data pengangguran terbuka tahun 2014
Ktgr/Kab

Selayar

Tdk tmt SD
SD
SMP
SMA
SMK
Diploma
Univ

0
0
2.36
2.78
0
5.56
3.08

Ktgr/Kab
Tdk tmt SD
SD
SMP
SMA
SMK
Diploma
Univ
Ktgr/Kab
Tdk tmt SD
SD
SMP
SMA
SMK
Diploma
Univ

Sinjai
0
0.39
0
1.26
2.5
2.38
2.44
Wajo
0.36
1.2
1.55
8.08
0
22.22
10.91

Bulu
kumba
0
1.01
1.1
4.37
3.17
5.56
4.23

Ban
taeng
1.66
1.31
0.55
2.92
0
5.26
5.19

Bone

Maros

1.03
0.87
1.8
6.85
4.76
4.55
4.71

1.2
1.75
6.29
11.11
4.88
8.7
7.61

Sidrap

Pinrang

1.02
3.3
2.62
5.11
10.71
0
4.65

1.26
1.57
2.05
1.69
3.85
0
2.86

Jene
ponto
0.26
1.02
0.55
4.81
4.44
0
4.94
Pang
kep
0
1.09
0
2.22
3.23
0
1.96
Enre
Kang
0
0.63
0.78
3.09
1.43
3.03
2.04

Takalar

Gowa

0.36
0.51
1.17
1.14
6.12
15.79
2.86

0
0.42
1.03
2.42
5.61
0
5.56

Barru
1
1.6
4.07
5.73
2.56
9.68
5.49
Luwu
0.91
1.48
3.25
6.19
8.7
9.52
8.2

Tana
Toraja
0.5
0.69
0.85
5.41
5.56
23.81
8.47
Parepare
0
0.68
2.26
7.69
5.49
0
7.32

Sop
Peng
0
1.13
1.28
4.04
3.13
4.55
4.05

Luwu
Utara
0
1.98
0.99
0.71
4.76
6.25
0

5.26
4.62
1.86
5.95
7.79
5.88
3.19

Luwu
Timur
3.21
3.61
3.66
9.46
10.71
6.67
7.35

Maka
ssar
0
0.98
2.13
5.33
9.52
14.81
8.66

Toraja
Utara
0
0
0.57
7.38
6.42
9.09
6.25

Palopo

19
Pada pendugaan pengangguran di Provinsi Sulawesi Selatan dilakukan poststratification pada kategori pendidikan. Pendekatan penarikan contoh ini, akan
membentuk area sebanyak 168 area yang merupakan kombinasi dari kabupaten
dan kategori pendidikan. Sementara untuk ukuran contoh dapat dilihat pada Tabel
3 dari setiap kabupaten di setiap jenjang bila dibandingkan dengan total populasi
yang ada, rata-rata ukuran contoh hanya berkisar 0.7% dari total populasi.
Berdasarkan Tabel 3, kecilnya contoh yang diperoleh dapat menyebabkan
pendugaan dengan ragam yang tinggi dengan hanya mengandalkan pendugaan
langsung. Maka dari itu, dilakukan pendugaan dengan menggunakan model
pendugaan area kecil. Untuk penelitian ini, kejadian nol masih diabaikan.
Berdasarkan pada Tabel 3, kabupaten dengan tingkat pengangguran tertinggi
berdasarkan proporsi contoh terhadap kejadian adalah Tana Toraja, urutan kedua
yakni Kabupaten Wajo dan ketiga yakni Kabupaten Takalar. Ketiga proporsi
terbesar ini terdapat pada kategori diploma.
Berdasarkan jumlah pengangguran di setiap kabupaten/kota, Kota Makassar
memiliki tingkat pengangguran tertinggi. Sementara untuk kategori pendidikan,
SMA merupakan kategori dengan tingkat pengangguran tertinggi.
Pemodelan dan Pendugaan Parameter
Berdasarkan model SAE maka didefinisikan dua model yang dapat disajikan
dengan menggunakan aturan post-stratification. Pada model I mendefinisikan
pengaruh acak di tujuh kategori pada kabupaten/kota yang sama diasumsikan
sama, sementara di model II setiap kategori baik di kabupaten/kota yang sama
tetap memiliki pengaruh acak yang berbeda.
Model I
Pada pendugaan model I, peubah yang menjelaskan kategori pendidikan
didefinisikan dalam bentuk dummy. Hal ini dimaksudkan bahwa untuk semua
kategori pendidikan pada setiap kabupaten memiliki pendugaan area u yang sama.
Model dapat dituliskan sebagai berikut:


dengan



=

0

+

1

1

+ ⋯+

= 1, … , 168 ; � = 1,2,3;





+

1 1i

= 1, … , 6

+ ⋯+

+

k

(4.1)

Model II
Pada model II, pengaruh acak didefinisikan sebagai kombinasi antara
kategori dan kabupaten/kota. Model ini menunjukkan bahwa setiap kategori
pendidikan di dalam satu kabupaten/kota memiliki pengaruh acak yang berbeda.
Model tersebut dapat dituliskan sebagai berikut:


=

0

+

1

1

+⋯+





+



(4.2)

dengan ∗ = 1, … , 168 ; � = 1,2,3; dimana i adalah area yang terbentuk dan p
adalah peubah penyerta.
Perbedaan dari kedua model adalah jumlah pengaruh acak yang berbeda.
Model II sebanyak 168 sementara pada model I hanya 24 sesuai dengan

20
banyaknya kabupaten/kota yang terdapat di Sulawesi Selatan. Model yang pada
persamaan (4.1) maupun (4.2) akan diduga terlebih dahulu pengaruh acak (�)
maupun pengaruh tetap. Pengaruh tetap yakni nilai dispersi � dan pendugaan �.
Pendugaan parameter �, � dan � telah dibahas pada bab sebelumnya dengan
menggunakan Laplace approximation.
Peubah respon yang diasumsikan memiliki sebaran Poisson sering
melanggar asumsi equidispersi. Maka dari itu, perlu penanganan terlebih dahulu.
Penanganan asumsi ini bisa dilakukan melalui beberapa cara. Pada penelitian ini
fokus pada penanganan asumsi equidispersi melalui model Poisson-Gamma.
Model ini mampu mengatasi asumsi Poisson tersebut (Kismiantini 2007).
Sebelum dilakukan penanganan asumsi equidispersi dilakukan pengecekan
asumsi terlebih dahulu. Pengecekan dilakukan dengan menggunakan pearson chisquare, menururt Rodriguez (2013) jika chi-square/df bernilai kurang dari satu
berarti data mengalami underdispersi sementara jika lebih dari satu maka data
mengalami overdispersi.
Tabel 4 Hasil pengecekan asumsi pada sebaran Poisson
Model
Model I
Model II

Chi-square/df
1.23
0.35

Pelanggaran asumsi dapat diatasi dengan menggunakan model PoissonGamma yang didasarkan pada marjinal model Poisson-Gamma atau Binomial
negatif, berikut persamaannya:
=

Γ( +�)
!Γ(�)



+�

1−


+�

.

(4.3)

Model ini dapat mengatasi masalah overdispersi atau underdispersi karena
tidak mengharuskan nilai rata-rata sama dengan nilai ragam. Persamaan (4.3)
memiliki nilai harapan marginal
dan ragam marginal
(1 +
) dimana


� adalah nilai dispersi yang akan diduga. Menurut Abdalhalim (2013) jika
� −1 → 0 maka sebaran gamma akan mamiliki
( ) → 0 yang konvergen
terhadap sebaran
. Sama halnya pada persamaan model Poisson-Gamma (4.3)
dimana jika
( )→
maka akan konvergen terhadap sebaran Poisson yang
menyebabkan rata-rata mendekati .
Berdasarkan hal tersebut, berikut hasil penanganan melalui model PoissonGamma yang tersaji pada Tabel 5.
Tabel 5 Hasil penanganan asumsi equidispersi model
Poisson-Gamma
Model
Model I
Model II

Chi-square/df
0.91
0.94

Tabel 5 menunjukkan penanganan asumsi equidispersi model I dan model
II. Pada pengecekan terlihat nilai general chi-square/df pada model II yang

21
mengalami underdispersi menjadi 0.94 sementara model I yang mengalami
overdispersi menjadi 0.91. Pada hasil uji di atas, nilai yang dihasilkan
menunjukkan bahwa melalui model Poisson-Gamma menghasilkan nilai dispersi
yang mampu mendekatkan nilai rata-rata dengan nilai ragam Poisson. Pendugaan
ragam area dan dispersi diduga melalui metode Laplace approximation melalui
program SAS pada Glimmix procedure.
Tabel 6 Pendugaan ragam area dan dispersi
Model
Model I
Model II

Ragam area (� 2 )
0.21
0.02

Dispersi (�)
0.11
0.58

Pada Tabel 6 dijabarkan hasil pendugaan terhadap ragam area dan nilai
dispersi pada setiap model. Ragam area pada model II lebih kecil dibandingkan
pada model I. Pada pendugaan dispersi, model I memiliki dispersi 0.11 dan model
II yakni 0.58. Hasil pendugaan area maupun dispersi ini selanjutnya akan
disubtitusi ke pendugaan pada pendekatan Bayes.
Tabel 7 Pendugaan � pada model I
Pengaruh Tetap

Intercept
X1
X2
X3
Kategori 1
Kategori 2
Kategori 3
Kategori 4
Kategori 5
Kategori 6

Poisson-Gamma
Pendugaan
p-value
1.33