Pemodelan Kejadian Kematian Bayi Di Indonesia Menggunakan Regresi Logistik Terboboti.

PEMODELAN KEJADIAN KEMATIAN BAYI DI INDONESIA
MENGGUNAKAN REGRESI LOGISTIK TERBOBOTI

RAY SASTRI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Kejadian
Kematian Bayi di Indonesia Menggunakan Regresi Logistik Terboboti adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada
Institut Pertanian Bogor.

Bogor, Oktober 2015
Ray Sastri
G152130364

*

Pelimpahan hak cipta atas karya tulis dari penelitian kerja sama dengan pihak
luar IPB harus didasarkan pada perjanjian kerja sama yang terkait.

RINGKASAN
RAY SASTRI. Pemodelan Kejadian Kematian Bayi di Indonesia Menggunakan
Regresi Logistik Terboboti. Dibimbing oleh KHAIRIL ANWAR
NOTODIPUTRO dan INDAHWATI.
Kejadian kematian bayi bersifat multidimensi karena berkaitan dengan
banyak hal; karakteristik bayi, ibu, tempat tinggal, kebijakan pemerintah dan juga
kondisi geografis wilayah. Mengacu pada kebutuhan pemerintah akan informasi
pada level kabupaten/kota, maka unit analisis dalam penelitian ini adalah
kabupaten/kota dimana datanya didapatkan dengan cara menggabungkan data
individu yang bersifat kategorik biner pada setiap kabupaten/kota. Proses
penggabungan data ini menimbulkan masalah statistik. Selain itu, adanya variasi

antar wilayah, dan rumitnya matriks pembobot spasial membuat pemodelan data
kejadian kematian bayi perlu menggunakan cara-cara yang khusus.
Regresi logistik adalah regresi untuk memodelkan peubah respon biner.
Ketergantungan spasial dapat dimasukkan sebagai salah satu peubah penjelas
dalam model. Regresi logistik untuk data dikelompokkan melanggar asumsi
homoskedastisitas. Untuk mengatasi pelanggaran ini, pemodelan akan
menerapkan metode kuadrat terkecil terboboti.
Penelitian ini menggunakan data dari Survei Demografi dan Kesehatan
Indonesia Tahun 2012 (SDKI 2012) dari Badan Pusat Statistik (BPS), dan data
fasilitas kesehatan, tenaga kesehatan, Bantuan Operasional Kesehatan (BOK)
pada tahun 2011 per kabupaten/kota dari Kementerian Kesehatan. Peubah respon
adalah proporsi bayi yang meninggal di setiap kabupaten/kota.
Model yang terbentuk fit dengan data dengan R kuadrat 54.80.
Berdasarkan model tersebut dapat disimpulkan bahwa peubah yang signifikan
mempengaruhi kematian bayi adalah persentase anak dengan urutan kelahiran ke4 atau lebih, persentase anak yang lahir pada saat ibu berusia dibawah dua puluh
tahun dan di atas empat puluh tahun, rasio fasilitas kesehatan per 1000 penduduk,
dan peluang kematian bayi di kabupaten/kota terdekat. Peluang kematian bayi
terendah terdapat di Kabupaten Sukoharjo, Jawa Tengah, yaitu sebesar 0.68
persen dan peluang kematian bayi tertinggi terdapat di Kabupaten Paser,
Kalimantan Timur, yaitu sebesar 14.79 persen. Model kemudian digunakan untuk

membuat peta tematik peluang kematian bayi di Indonesia.
Kata kunci: kematian bayi, ketergantungan spasial, regresi terboboti, SDKI

SUMMARY
RAY SASTRI. Modelling The Infant Mortality Data in Indonesia Using Weigthed
Logistics Regression. Supervised by KHAIRIL ANWAR NOTODIPUTRO and
INDAHWATI.
Infant mortality is multidimensional problem because it related to several
determinants, such as the infant’s characteristics, maternal and fertility factors,
housing condition, government policies and also geographical area. Information
on the district level was very important for goverment policies, so that the unit of
analysis in this study was district. The district data was obtained by aggregating
the binary categorical individual data for every district. The aggregation process
has raised a statistical problem.
Logistic regression is a regression for modelling the binary response
variable. Spatial dependence can be included as one of the explanatory variables
in the model. Logistic regression for grouped data is in violation of the
assumption of homoscedasticity. To overcome this violation, we apply a weighted
least squares method.
This study uses data from Indonesia Demographic and Health Survey Year

2012 (IDHS 2012) from the Statistics Indonesia (Badan Pusat Statistik/BPS), and
data wellness facilities, health workers, Health Operational Assistance (BOK) in
2011 per district / city from the Ministry of Health. The response variable was the
proportion of infants who died in each district.
The weighted model fit the data well with R square 54,80 percent. The
significant variables which affected infant mortality are the percentage of children
with birth order four or more, the ratio of health facilities per 1000 population,
and the infant mortality in neighbor district. The lowest probability estimation of
infant mortality is in Sukoharjo, Central Java, 0.68 percent and the highest is in
Paser Regency, East Kalimantan, 14.79 percent. The model then used to make a
thematic map of probability estimation of infant mortality in Indonesia.
Keywords: infant mortality, spatial dependence, weighted regression, IDHS

© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan
IPB

Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB.

PEMODELAN KEJADIAN KEMATIAN BAYI DI INDONESIA
MENGGUNAKAN REGRESI LOGISTIK TERBOBOTI

RAY SASTRI

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

Penguji Luar Komisi pada Ujian Tesis: Dr Ir Anang Kurnia, MSi


Judul Tesis
Nama
NIM

: Pemodelan Kejadian Kematian Bayi di Indonesia Menggunakan
Regresi Logistik Terboboti
: Ray Sastri
: G152130364

Disetujui oleh
Komisi Pembimbing

Dr Ir Indahwati, MSi
Anggota

Prof Dr Ir Khairil Anwar Notodiputro, MS
Ketua

Diketahui oleh


Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana

Dr Ir Indahwati, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian : 30 Oktober 2015

Tanggal Lulus :

PRAKATA
Alhamdulillah, segala puji dan syukur penulis ucapkan kepada Allah atas
segala karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Tema yang
dipilih dalam penelitian ini adalah kematian bayi, dengan judul Pemodelan
Kematian Bayi di Indonesia Menggunakan Regresi Logistik Terboboti.
Terima kasih penulis ucapkan kepada Bapak Prof Dr Khairil Anwar

Notodiputo, MS dan Ibu Dr Indahwati, MSi sebagai komisi pembimbing yang
telah memberikan banyak bimbingan dan arahan kepada penulis. Terima kasih
juga penulis ucapkan kepada Ibu Dr Erni Tri Astuti, MMat dari Sekolah Tinggi
Ilmu Statistik yang telah memberi semangat dalam proses penulisan dan Bapak
Parwoto, MStat dari Subdit Demografi Badan Pusat Statistik, yang telah
membantu dalam pengumpulan data dan informasi. Ungkapan terima kasih juga
disampaikan kepada suami, anak-anak, dan seluruh keluarga besar atas dukungan
yang tiada tara kepada penulis selama menyelesaikan studi di Institut Pertanian
Bogor.
Semoga karya ilmiah ini bermanfaat.
Bogor, Oktober 2015

Ray Sastri

DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN

vi

vi
vi

1 PENDAHULUAN
Latar Belakang
Rumusan Masalah
Tujuan Penelitian
Keluaran yang Diharapkan

1
1
2
3
3

2 TINJAUAN PUSTAKA
Penelitian Terdahulu
Indeks Kesejahteraan
Bantuan Operasional Kesehatan
Model Regresi Logistik

Model Regresi Logistik dengan Peubah Spasial
Pendugaan Parameter
Pemilihan Model Terbaik
Regresi Bertatar
Pengujian Asumsi
Heteroskedastisitas dan Model Tegresi Terboboti

4
4
5
5
5
6
7
8
8
9
9

3 METODE PENELITIAN

Data
Peubah
Model
Tahapan Penelitian

12
12
12
13
13

4 HASIL DAN PEMBAHASAN
Kejadian Kematian Bayi di Indonesia
Deskripsi Peubah Penjelas
Korelasi Antar Peubah
Regresi Bertatar dan Regresi Himpunan Bagian Terbaik
Masalah Keheterogenan Ragam
Diskusi Hasil Pemodelan
Pemanfaatan Model

15
15
15
17
18
18
20
22

5 SIMPULAN DAN SARAN
Simpulan
Saran

24
24
24

DAFTAR PUSTAKA
LAMPIRAN
RIWAYAT HIDUP

25
27
32

DAFTAR TABEL
1 Peubah yang digunakan dalam pemodelan kematian bayi di
Indonesia
2 Kandidat model terbaik dari regresi bertatar dan regresi himpunan
bagian terbaik
3 Karakteristik kelompok yang disusun dalam model regresi terboboti

13
19
20

DAFTAR GAMBAR
1 Perkembangan Angka Kematian Bayi di Indonesia Tahun 19912012 (Sumber: Publikasi BPS)
2 Ilustrasi kebertetanggaan wilayah
3 Tahapan analisis data
4 Diagram kotak persentase kematian bayi di Indonesia
5 Persentase kematian bayi berdasarkan urutan kelahiran
6 Persentase kematian bayi berdasarkan pendidikan ibu
7 Persentase kematian bayi berdasarkan IK
8 Diagram pencar sisaan terhadap peluang duga dan jumlah contoh
9 Selang kepercayaan simpangan baku sisaan tiap kelompok pada
model regresi logistik dan model regresi terboboti
10 Peta tematik peluang dugaan kematian bayi per provinsi di
Indonesia

1
6
14
15
16
16
17
19
20
23

DAFTAR LAMPIRAN
1 Korelasi Pearson antara log odd kematian bayi dan peubah penjelas
2 Penduga parameter pada model penuh
3 Keluaran hasil olah data untuk regresi bertatar dan regresi himpunan
bagian terbaik
4 Keluaran hasil olah data untuk model regresi logistik terboboti

27
28
29
31

1

1 PENDAHULUAN
Latar Belakang
Kematian bayi merupakan kejadian kematian pada bayi sesaat setelah
dilahirkan sampai dengan sebelum mencapai umur tepat satu tahun (BPS 2013).
Di Indonesia, Angka Kematian Bayi (AKB) diukur melalui Survei Demografi dan
Kesehatan Indonesia (SDKI) yang dilakukan oleh Badan Pusat Statistik (BPS)
setiap lima tahun sekali. AKB di Indonesia tahun 2012 adalah 32 kematian per
1000 kelahiran atau satu dari setiap 31 anak yang dilahirkan meninggal sebelum
ulang tahun yang pertama (BPS 2013). Pada Gambar 1 dapat dilihat bahwa AKB
menurun tajam pada rentang 1991-2003, lalu menurun perlahan selama 20032012. AKB pada tahun 2012 hampir setengah dari AKB pada tahun 1991.
80
70
60
50
40
30
20
10
0

1991

1994

1997

2003

2007

2012

Gambar 1. Perkembangan Angka Kematian Bayi (AKB) di Indonesia tahun
1991-2012 (Sumber: Publikasi BPS)
Meskipun menunjukkan kecenderungan menurun, AKB Indonesia berada
pada urutan keempat teratas dibandingkan negara-negara lain di Asia Tenggara.
Fakta ini kemudian membuat pemerintah pusat menetapkan tingkat kematian bayi
sebagai indikator kunci pembangunan dan harus selalu dimonitor. Untuk
keperluan tersebut, pemerintah menyusun berbagai program dan menyiapkan
anggaran.
Pada era otonomi daerah seperti saat ini, program-program disusun oleh
pemerintah pusat untuk kemudian laksanakan oleh pemerintah kabupaten/kota.
Untuk keperluan tersebut, pemerintah pusat membutuhkan suatu informasi
mengenai kejadian kematian bayi pada level kabupaten/kota beserta faktor-faktor
yang memengaruhinya.
Kejadian kematian bayi bersifat multidimensi karena berkaitan dengan
banyak hal; karakteristik bayi, ibu, tempat tinggal, kebijakan pemerintah dan
sebagainya. Pada level kabupaten/kota, kejadian kematian bayi dapat dipengaruhi
oleh ketergantungan spasial antar wilayah. Hal ini berdasar pada kenyataan bahwa
aktifitas sosial dan ekonomi yang memengaruhi kematian bayi di suatu wilayah

2
tidak dapat lepas dari aktifitas sosial dan ekonomi di wilayah lain, terutama di
wilayah-wilayah yang berdekatan.
Dalam SDKI, data kejadian kematian bayi adalah data individu perorangan
yang bersifat kategorik dengan dua keluaran, ya dan tidak. Dikatakan ya jika anak
meninggal pada umur 1 tahun kebawah, dan dikatakan tidak jika anak mampu
bertahan hidup pada umur di atas 1 tahun. Selanjutnya diberi kode 1 untuk ya, dan
kode 0 untuk tidak. Pemodelan peubah kategorik dengan 2 keluaran biasanya
menggunakan regresi logistik.
Selaras dengan kebutuhan pemerintah akan informasi pada level
kabupaten/kota, maka peubah respon dalam regresi logistik pun berubah. Peubah
respon tidak lagi peubah yang berkode 1 dan 0 pada level individu, melainkan
menjadi proporsi anak yang mati pada usia 1 tahun ke bawah dibandingkan total
anak yang dilahirkan pada level kabupaten/kota. Penggabungan informasi dari
level individu ke level kabupaten/kota menimbulkan masalah baru. Ada 24
kabupaten/kota yang memiliki proporsi bayi mati sama dengan 0. Atau dengan
kata lain, tidak ada satu pun bayi yang mati di kabupaten/kota tersebut. Pada
kenyataannya sangat tidak mungkin kondisi tersebut terjadi. Hal ini sangat
berkaitan dengan jumlah ukuran contoh dan faktor kebetulan. Adanya nilai 0 ini
membutuhkan pendekatan khusus di dalam analisis statistika.
Dalam level wilayah, model spasial yang tengah berkembang seperti Spatial
Autoregressive (SAR) atau Geographically Weighted Regression (GWR) biasa
digunakan oleh peneliti untuk melihat pengaruh ketergantungan wilayah terhadap
peubah respon. Model-model ini selain menghasilkan satu model global yang
berlaku secara keseluruhan, jika ada variasi nilai antar wilayah maka akan
menghasilkan model-model lokal yang berbeda pada tiap-tiap wilayah.
Memodelkan variasi spasial dalam data kematian bayi penting karena dapat
menghasilkan penduga yang lebih tepat. Akan tetapi, proses komputasi dari SAR
dan GWR membutuhkan sebuah matriks pembobot spasial. Jika unit analisis
kabupaten/kota, maka kita membutuhkan matriks pembobot spasial berdimensi
503x503. Masalahnya adalah kabupaten/kota rata-rata memiliki 4 tetangga,
sehingga secara rata-rata akan ada 499 kolom dalam setiap baris yang bernilai 0.
Selain itu, Indonesia adalah sebuah negara kepulauan dengan kondisi geografis
yang tidak beraturan dan banyak kabupaten/kota yang terpisah dari
kabupaten/kota lainnya. Sehingga diperlukan sebuah solusi khusus di dalam
pendugaan pengaruh ketergantungan antar wilayah.
Banyaknya kabupaten/kota yang memiliki proporsi bayi mati yang bernilai
0, adanya variasi antar wilayah, dan rumitnya matriks pembobot spasial membuat
pemodelan data kejadian kematian bayi ini perlu menggunakan cara-cara yang
khusus.
Rumusan Masalah
Berdasarkan latar belakang di atas, masalah yang akan dibahas dalam
penelitian ini adalah:
1. Bagaimana pola sebaran kematian bayi di Indonesia?
2. Peubah apa saja yang memengaruhi kematian bayi di Indonesia?
3. Apakah ada pengaruh spasial terhadap kematian bayi?

3
4.

Bagaimana model terbaik untuk menggambarkan kematian bayi?
Tujuan Penelitian

1.
2.

Penelitian ini betujuan untuk :
Membentuk model yang dapat menggambarkan pengaruh peubah-peubah
penjelas terhadap kejadian kematian bayi di Indonesia.
Memetakan pola sebaran kematian bayi di Indonesia.
Keluaran yang diharapkan

1.
2.

Keluaran yang diharapkan pada penelitian ini adalah :
Model terbaik yang mampu menggambarkan kejadian kematian bayi di
Indonesia.
Peta tematik peluang kematian bayi di Indonesia.

4

2 TINJAUAN PUSTAKA
Penelitian Terdahulu
Hill (2003) mengemukakan bahwa kelangsungan hidup anak dipengaruhi
oleh lima faktor yaitu: faktor ibu, kontaminasi lingkungan, defisiensi gizi,
cedera/kecelakaan, dan kontrol terhadap penyakit. Faktor ibu dan faktor
lingkungan dapat diperoleh datanya melalui survei-survei BPS dengan cakupan
wilayah seluruh Indonesia, sedangkan tiga faktor lainnya sulit untuk mendapatkan
datanya.
Hubungan antara kematian bayi dan faktor-faktor yang memengaruhinya
telah dikaji dalam beberapa penelitian terdahulu. Menurut Bappenas (2009),
setiap peningkatan jumlah persalinan yang dibantu oleh tenaga kesehatan dan
rata-rata lama sekolah, akan berdampak pada menurunnya angka kematian bayi.
Sedangkan Ashani (2010) menyimpulkan bahwa kematian bayi dipengaruhi oleh
usia ibu, usia kawin pertama ibu, kualitas perumahan, dan imunisasi. Poerwanto et
al. (2003) memodelkan data kematian bayi menggunakan regresi logistik dengan
menggunakan teknik pemilihan model Generalized Estimating Equation (GEE).
Penelitian ini menyimpulkan bahwa resiko kematian bayi pada keluarga dengan
Indeks Kesejahteraan (IK) rendah adalah hampir dua kali dibandingkan pada
rumah tangga dengan IK tinggi dan resiko kematian bayi pada ibu yang
menamatkan sekolah formal kurang dari 7 tahun lebih tinggi dibandingkan ibu
yang menamatkan sekolah formal lebih dari 7 tahun.
Graduasi tingkat kematian menurut kelompok umur di Indonesia
berdasarkan jenis kelamin dan tempat tinggal pernah diteliti oleh Astuti (2013).
Dalam penelitiannya, Astuti (2013) mendapatkan kesimpulan bahwa tingkat
kematian laki-laki lebih tinggi dibandingkan perempuan pada semua tingkatan
umur dan tingkat kematian di wilayah perdesaan sedikit lebih tinggi dibandingkan
perkotaan untuk kelompok 0-5 tahun.
Selain bergraduasi, data kematian bayi juga bertingkat berdasarkan
tingkatan wilayahnya. Pengaruh wilayah ini pernah digunakan oleh Titaley (2011)
pada saat meneliti faktor-faktor yang berpengaruh pada kematian bayi berusia di
bawah satu bulan di Indonesia dengan menggunakan analisis tabel kontingensi
dan regresi logistik multilevel.
Selain menggunakan peubah sosio demografi, beberapa peneliti berusaha
memasukkan peubah spasial dalam kajian mengenai kematian bayi. Afri (2012)
menganalisis data kematian bayi di Jawa Timur menggunakan Geographically
Weighted Negative Binomial. Winarno (2009) memodelkan Angka Kematian Bayi
di Jawa Timur menggunakan Spatial Error Model. Data yang digunakan berasal
dari publikasi-publikasi berupa data agregat level kabupaten/kota dengan
menggunakan matriks pembobot spasial. Peubah respon dalam penelitian tersebut
adalah AKB dengan skala rasio dan peubah bebasnya adalah indikator-indikator
makro. Sementara itu, Pramono et al. (2012) mengidentifikasi faktor yang
memengaruhi angka kematian bayi di Jawa Timur dengan menggunakan Regresi
Spatial Durbin Model yaitu menambahkan lag spasial dari peubah respon dan
peubah penjelas secara bersama-sama sebagai kovariat tambahan.

5
Indeks Kesejahteraan
Untuk mengukur tingkat sosial ekonomi sebuah rumah tangga, Macro
International dan World Bank membentuk sebuah indeks yang dinamakan Indeks
Kesejahteraan (IK). IK dibentuk menggunakan analisis komponen utama yang
berdasar pada aset, kenyamanan dan jasa yang dimiliki oleh sebuah rumah tangga.
Peubah ini mencakup informasi kepemilikan peralatan elektronik dan kendaraan
bermotor, dan karakteristik rumah tangga lainnya seperti sumber air minum,
fasilitas sanitasi, jenis lantai, dinding, dan atap rumah. Oleh BPS, IK rumah
tangga dikategorikan menjadi lima; sangat kaya, kaya, menengah, miskin, dan
sangat miskin (BPS 2013).
Dalam penelitian ini, IK digunakan sebagai salah satu pendekatan terhadap
pendapatan rumah tangga karena pendapatan rumah tangga sulit diukur. IK
diduga berpengaruh terhadap kejadian kematian bayi.
Bantuan Operasional Kesehatan
Dalam penurunan AKB, pemerintah pusat membantu pemerintah daerah
dalam melaksanakan pelayanan kesehatan sesuai standar pelayanan minimal pada
Bidang Kesehatan. Pemerintah pusat memberikan Bantuan Operasional Kesehatan
(BOK) kepada pemerintahan kabupaten/kota. Tujuan utama BOK adalah
meningkatkan kinerja Puskesmas dan jaringannya serta Poskesdes dan Posyandu
dalam menyelenggarakan pelayanan kesehatan promotif dan preventif.
Model Regresi Logistik
Variabel respon (Z) dalam penelitian ini berskala biner menggunakan dua
nilai kategorik, Z = 1 jika anak meninggal pada usia di bawah satu tahun dan Z =
0 untuk lainnya. Jika diambil contoh acak sebanyak
untuk kabupaten/kota ke-j
maka kita memiliki
,
, ...
yang bebas satu sama lain. Kemudian, jika
adalah banyaknya bayi yang mati di kabupaten/kota ke-j, maka secara statistik,
=∑
akan mengikuti sebaran binomial ( , ). Peluang kematian bayi di
kabupaten/kota ke- j dapat dihitung melalui formula = / .
Bentuk umum model peluang regresi logistik diformulasikan sebagai
berikut:

=

(

(





)

)

dimana j adalah indeks untuk kabupaten/kota,
adalah peluang terjadinya
kematian bayi di kabupaten ke-j,
...
adalah peubah penjelas,
adalah
intersep, dan
...
adalah koefisien regresi untuk peubah penjelas yang
bersesuaian.

6
Fungsi
merupakan fungsi non linear yang sulit untuk diinterpretasi. Agar
parameter lebih mudah diinterpretasi, fungsi tersebut perlu dibawa kebentuk linier
dengan cara melakukan transformasi menggunakan fungsi hubung logit. Hasil
transformasi adalah sebagai berikut:
=

=

+

+

+

+

+ ⋯+

+⋯+

(

(

)

)

+

+

+

(1)

+

dimana j adalah indeks untuk kabupaten/kota,
adalah peluang terjadinya
kematian bayi di kabupaten/kota ke-j, ... adalah peubah penjelas,
adalah
intersep, ... adalah koefisien regresi untuk peubah penjelas yang bersesuaian,
dan adalah sisaan pada kabupaten/kota ke-j. Model (1) kemudian disebut model
regresi logistik.
Model Regresi Logistik dengan Peubah Spasial
Data spasial ada dua jenis; (1) Data yang mengandung koordinat posisi
suatu wilayah di permukaan bumi, (2) Posisi suatu wilayah terhadap wilayah lain.
Data spasial yang dimaksud dalam penelitian ini adalah posisi suatu wilayah
terhadap wilayah lain. Jika dua wilayah berdekatan saling berbagi garis batas,
maka wilayah tersebut disebut tetangga (Lesage 1999). Pada wilayah-wilayah
berbentuk persegi, ilustrasi wilayah yang dikatakan tetangga disajikan pada
Gambar 2.

Gambar 2. Ilustrasi kebertetanggaan wilayah
Dalam kenyataannya, wilayah-wilayah di Indonesia tidak berbentuk kotakkotak persegi. Gumpertz et al. (1997) mengatakan bahwa tidaklah penting bentuk
areanya, yang paling penting adalah kita dapat menentukan wilayah mana yang
menjadi tetangga first order, second order, dan seterusnya.
Model regresi logistik dengan memasukkan peubah spasial sering
digunakan untuk memodelkan sebaran spesies hewan dan tumbuhan atau pola
penjualan produk tertentu. Model ini pertama kali diperkenalkan oleh Besag pada
tahun 1974. Menurut Besag (1974), jika Z adalah peubah acak yang diamati,
dimana
∈ 0,1 merepresentasikan observasi pada titik ke-i untuk i=1,...,n,
maka persamaan model regresi logistik menjadi sebagai berikut :

7
(

(

)

)

=

+∑

+ ∑

dimana
adalah peubah penjelas ke-p pada observasi ke-j,
adalah parameter
regresi,
adalah parameter ketergantungan jika
dan
bertetanga. Unit
analisis dalam penelitian Besag adalah wilayah sebagai sebuah individu, bukan
sebagai sebuah gabungan dari beberapa individu.
Penelitian ini akan menggunakan model pada persamaan (1) dengan unit
analisis berupa wilayah sebagai gabungan dari beberapa individu. Definisi
wilayah yang bertetangga yang akan digunakan adalah wilayah yang jaraknya
berdekatan.
Menghitung jarak antara dua wilayah berbentuk poligon dapat dilakukan
dengan cara menghitung jarak dari sentroid daerah yang satu ke sentroid daerah
yang lain. Sentroid adalah pusat massa dari sebuah wilayah yang berupa titik
dimana sebuah bidang datar akan menjadi seimbang ketika ditempatkan pada
sebuah tiang. Sentroid lebih dipilih untuk mewakili suatu wilayah dibandingkan
dengan pusat kota karena sentroid bersifat seperti nilai tengah untuk sekumpulan
data spasial yang mampu mewakili semua titik yang berada dalam wilayah
tersebut. Penentuan titik sentroid dan jarak antar wilayah kabupaten/kota
dilakukan dengan menggunakan perangkat lunak ArcGIS.
Log odd kematian bayi pada dua wilayah kabupaten/kota yang jaraknya
paling dekat akan dimasukkan ke dalam model (1) sebagai peubah penjelas
dan
. Dimana ( ) adalah log odd kematian bayi pada
(
)
kabupaten/kota yang paling dekat dan
adalah log odd kematian bayi pada
kabupaten/kota terdekat kedua. Bentuk logaritma dipilih agar hubungannya
dengan peubah respon menjadi linier.
Pendugaan Parameter
Pada model regresi logistik, pendugaan parameter biasanya dilakukan
dengan
Metode Kemungkinan Maksimum (MKM) dengan log fungsi
kemungkinan sebagai berikut:
( ; )= ∑

log

+

+∑



1+



Penduga parameter diperoleh dari nilai vektor
yang mampu
memaksimumkan fungsi kemungkinan. Titik maksimum tidak dapat diselesaikan
dengan cara biasa melainkan harus menggunakan algoritma Newton Raphson.
Proses pendugaan parameter ini secara komputasi dapat diselesaikan dengan
menggunakan perangkat lunak komputer yang menyediakan paket regresi logistik.
Metode lain yang dapat digunakan untuk menduga parameter adalah
Metode Kuadarat Terkecil (MKT). MKT adalah metode yang paling sederhana
dalam menduga parameter. Metode ini fokus kepada mencari sebuah nilai dari
parameter yang mampu meminimumkan jumlah kuadrat sisaan.

8


=∑







− ⋯−

(

)



(2)

Meminimumkan persamaan (2) dapat dilakukan dengan cara membuat
turunan pertama dari persamaan tersebut sama dengan nol. Sehingga didapatkan
vektor penduga bagi parameter , ,...
sebagai berikut:
=(

)



dengan adalah vektor peubah respon (nx1), adalah matrik peubah penjelas (n
x (k+1)), n adalah banyaknya observasi dan k adalah banyaknya parameter.
Dugaan parameter yang diperoleh diuji menggunakan uji t. Hipotesis uji t
adalah sebagai : = 0 melawan : ≠ 0 dengan statistik uji :
dimana

=

adalah galat baku dari penduga parameter

.

Pemilihan Model Terbaik
Pemilihan model regresi terbaik dilakukan dengan regresi bertatar dan
regresi himpunan bagian terbaik. Keduanya memulai pemilihan dengan model
paling sederhana yaitu model dengan satu peubah. Selanjutnya dimasukan peubah
lain satu per satu sampai didapat model yang memenuhi kriteria terbaik. Kriteria
didasarkan pada penambahan
dan
, atau kedekatan nilai
Mallow
dengan jumlah peubah dalam model.
Menurut Hosmer dan Lemeshow (2000), ada suatu saat dimana peubah
respon yang dipelajari termasuk hal yang baru, belum diketahui faktor-faktor yang
memengaruhinya, dan asosiasi antara kovariat dan peubah respon belum terlalu
dipahami. Pada keadaan seperti ini, prosedur bertatar dapat cepat dan efektif untuk
menyaring jumlah peubah yang banyak dan membangun sejumlah persamaan
regresi logistik secara simultan.
Regresi Bertatar
Prosedur regresi bertatar dimulai dengan memilih satu peubah penjelas
yang paling berkorelasi dengan peubah bebas lalu membuat sebuah model regresi
linier. Kemudian diperiksa apakah peubah penjelas berpengaruh signifikan
terhadap peubah bebas. Jika tidak, maka kita berhenti dan menggunakan model
= sebagai model terbaik. Jika ya, peubah tersebut dipertahankan dalam
model. Langkah selanjutnya adalah mencari peubah kedua untuk masuk ke dalam
model.
Penambahan peubah ditentukan oleh nilai uji F parsial untuk menyeleksi
peubah mana yang harus dimasukkan berikutnya. Peubah penjelas dengan nilai uji
F parsial yang terbesar terpilih untuk dimasukkan ke dalam model. Kemudian

9
akan dibuat model regresi kedua. Model yang terbentuk diperiksa
signifikansinya, penamabahan R kuadrat, dan nilai uji F parsial kedua peubah.
Nilai uji F parsial selanjutnya dibandingkan dengan kriteria F yang telah
ditentukan sebagai dasar dipilihnya sebuah peubah. Jika nilai F parsial lebih besar,
maka peubah tersebut tetap dipertahankan di dalam model. Jika F parsial lebih
kecil, maka peubah tersebut dikeluarkan dari model. Begitu seterusnya hingga
tidak ada lagi peubah yang bisa dimasukkan ke dalam model atau dikeluarkan dari
model (Draper dan Smith, 1998).
Pengujian Asumsi
Pendugaan parameter menggunakan OLS membutuhkan asumsi-asumsi
yang harus dipenuhi. Asumsi-asumsi tersebut adalah sisaan menyebar normal,
tidak ada korelasi antar peubah bebas, ragam sisaan homogen, dan sisaan saling
bebas (Draper dan Smith, 1998).
Pada data kematian bayi yang telah dikelompokkan per kabupaten/kota,
sisaan tidak saling bebas karena ada hubungan antar kabupaten/kota.
Kabupaten/kota yang berdekatan nomor urut mempunyai hubungan yang tinggi
karena sebagian besar data yang berurutan nomor urut menunjukkan kedekatan
wilayah geografis. Sedangkan kedekatan geografis telah dicakup dalam salah satu
peubah penjelas. Jika urutan diacak, tanpa mengubah data, maka tidak terjadi
autokorelasi dalam sisaan.
Menurut Gujarati (2004), dalam data yang telah dikelompokkan, jika
jumlah contoh cukup besar dan jika setiap observasi pada X tertentu mengikuti
sebaran binomial, maka sisaannya mengikuti sebaran normal.
Oleh karena itu, asumsi yang sangat diperhatikan di dalam penelitian ini
adalah tidak adanya korelasi antar peubah penjelas dan ragam sisaan homogen.
Heteroskedastisitas dan Model Regresi Terboboti
Salah satu asumsi dalam model regresi adalah adanya kesamaan ragam
antar sisaan. Asumsi ini disebut homoskedastisitas. Ragam bersyarat dari pada
saat
diketahui konstan dan tidak tergantung pada nilai-nilai peubah X. Secara
simbolis dapat ditulis sebagai berikut:
=

j=1,2,....n

=

j=1,2,....n

Jika terjadi ketidaksamaan ragam atau yang biasa disebut
heteroskedastisitas, maka ragam bersyarat dari pada saat diketahui tidak lagi
konstan. Secara simbolis dapat ditulis sebagai berikut:

Menurut Theil (1970), dalam regresi logistik untuk data yang telah
dikelompokkan, jika jumlah contoh cukup besar dan jika setiap observasi pada X

10
tertentu mengikuti sebaran binomial, maka sisaannya mengikuti sebaran normal
dengan ragam yang tidak tetap untuk setiap observasi.
~

(3)

0,

Ketidak samaan ragam dalam suatu kajian yang melibatkan perbedaan
karakteristik antar wilayah dapat terjadi karena basis data dari satu atau lebih
peubah mengandung nilai-nilai dengan jarak antara nilai terkecil dan nilai terbesar
sangat lebar. Selain itu, aktifitas sosial ekonomi sangat berbeda antar wilayah.
Wilayah yang mempunyai sumber daya alam melimpah dan akses transportasi
yang mudah akan mempunyai aktifitas yang lebih bervariasi dibandingkan
wilayah yang miskin dan akses transportasi susah.
Ada beberapa metode yang dapat digunakan untuk mendetesi
heteroskedastisitas baik secara formal maupun non formal.
1. Sifat persoalan. Seringkali, sifat persoalan yang diteliti menyarankan atau
menunjukkan kemungkinan adanya heteroskedastisitas.
2. Metode grafik. Adanya pola tertentu pada plot antara galat dan nilai dugaan
dari peubah respon.
3. Uji Park dan uji White untuk data individu.
4. Uji Bartlet untuk data berkelompok.
Adanya heteroskedastisitas dapat membuat kita salah membuat
kesimpulan dalam pengujian hipotesis. Misalkan model regresi dengan satu
peubah penjelas sebagai berikut:

Maka penduga OLS dari

=

+

+

adalah sebagai berikut:
=

dengan ragam sebagai berikut:





=



=





(∑



(∑


)

)

Jika ragamnya sama antar sisaan, maka ragamnya menjadi :
=∑

adalah penduga tak bias linier terbaik jika asumsi homoskedastisitas terpenuhi.
Jika asumsi tersebut tidak terpenuhi, maka
tetaplah penduga yang linier dan tak
bias tetapi tidak lagi memiliki ragam yang minimum sehingga tidak lagi menjadi
penduga terbaik. Karena ragam tidak minimum, selang kepercayaan dari penduga
parameter akan lebih pendek dari yang seharusnya dan cenderung membuat kita
tidak menolak hipotesis nol dalam uji hipotesis.

11
Sebuah metode pendugaan yang dinamakan kuadrat terkecil yang
digeneralisasi (generalized least qquare-GLS) akan memanfaatkan informasi
mengenai heteroskedastisitas dalam mendapatkan penduga tak bias linier terbaik.
Jika ragam
diketahui, dan jika model (1) dibagi dengan
maka
persamaan menjadi sebagai berikut:



=

=



+

+





+

+





+ ⋯+

+ ⋯+





+

+

(4)


Model pada persamaan (4) kemudian disebut model regresi terboboti.
Notasi ∗ ... ∗ adalah parameter dari model yang telah ditansformasi. Ragam dari
sisaan kemudian menjadi:


= ( ∗) =

=

2

2

=

2

2

=1

Ragam sisaan pada model regresi terboboti adalah konstan dan asumsi
homoskedastisitas terpenuhi. Jika kita menerapkan metode pendugaan OLS pada
model terboboti, maka penduga ∗ ... ∗ adalah penduga tak bias linier terbaik.
Dalam GLS, penduga ∗ ... ∗ diperoleh dengan cara meminimumkan jumlah
kuadarat sisaan terboboti dengan pembobot
= 1/ 2 .

12

3 METODE PENELITIAN
Data
Penelitian ini menggunakan data hasil Survei Demografi dan Kesehatan
Indonesia Tahun 2012. Survei dilaksanakan pada 466 kabupaten/kota di seluruh
Indonesia. Contoh yang diambil adalah 46 000 rumah tangga. Pada seluruh rumah
tangga contoh diperoleh 45 607 wanita berusia 15-49 tahun. Jika wanita tersebut
pernah melahirkan, maka mereka ditanya secara detail satu persatu anak yang
pernah dilahirkan. Kejadian kematian anak dicatat dengan pertanyaan apakah
anak yang dilahirkan masih hidup atau tidak. Jika telah meninggal, dicatat usia
pada saat meninggal. Faktor-faktor yang berhubungan dengan karakteristik bayi,
ibu, dan rumah tangga juga dicatat dalam SDKI.
Selain data SDKI, penelitian ini juga menggunakan tiga data dari
Kementerian Kesehatan yang berkaitan dengan fasilitas kesehatan, tenaga
kesehatan Bantuan Operasional Kesehatan (BOK) Tahun 2011 per
Kabupaten/kota. Ketiga data yang digunakan adalah data untuk tahun 2011 karena
biasanya pengaruhnya tidak langsung terlihat pada periode yang sama melainkan
ada faktor kelambanan yang menyebabkan pengaruhnya terlihat satu atau dua
peride selanjutnya. Ketiga data ini diperoleh dari website kementerian kesehatan
Republik Indonesia. Selain itu, penelitian ini mengasumsikan bahwa BOK,
fasilitas kesehatan dan tenaga kesehatan jumlahnya sama dengan tahun-tahun
sebelumnya.
Peubah
Peubah yang digunakan dalam penelitian ini berkaitan dengan
karakteristik anak, ibu, rumah tangga, kebijakan pemerintah, dan wilayah. Peubah
yang berkaitan dengan karakteristik anak adalah jenis kelamin dan urutan
kelahiran. Peubah yang berkaitan dengan karakteristik ibu adalah pendidikan dan
umur ketika melahirkan. Peubah yg berkaitan dengan rumah tangga adalah Indeks
Kesejahteraan (IK). Dalam penelitian ini diasumsikan bahwa tidak ada perubahan
yg signifikan antara IK rumah tangga pada saat seorang anak meninggal dengan
tahun diadakannya survei.
Peubah kebijakan pemerintah diwakili oleh jumlah Bantuan Operasional
Kesehatan (BOK), rasio fasilitas kesehatan dan rasio tenaga kesehatan untuk tiaptiap kabupaten. Berikut adalah ringkasan dari peubah-peubah yang akan
digunakan.

13
Tabel 1. Peubah yang digunakan dalam pemodelan kematian bayi di Indonesia
Nama Peubah
Peubah
Peubah Proporsi Bayi Yang Meninggal
Respon
Peubah X1 Rasio jenis kelamin laki laki-laki
Bebas
terhadap perempuan
X2 Persentase Anak dengan Urutan
Kelahiran Nomor 4 atau Lebih
X3 Persentase Ibu dengan Pendidikan Tamat
SMP atau di bawahnya
X4 Persentase ibu yang melahirkan pada usia
beresiko (< 20 tahun dan >= 40 tahun)
X5 Persentase Rumah Tangga dengan IK
Menengah kebawah
X6 Jenis Wilayah
X7 Jumlah Bantuan Operasional Kesehatan
X8 Rasio Jumlah Fasiltas Kesehatan per
1000 Penduduk
X9 Rasio Jumlah Tenaga Kesehatan per
Penduduk
X10 Log Odd Kematian Bayi Pada Kabupaten
Tetangga Terdekat Pertama
X11 Log Odd Kematian Bayi Pada Kabupaten
Tetangga Terdekat Kedua

Tipe
Numerik

Satuan

Numerik
Numerik

Persen

Numerik

Persen

Numerik

Persen

Numerik

Persen

Dummy
Numerik
Numerik

Juta Rp

Numerik
Numerik
Numerik

Model
Model dasar yang akan dibangun adalah sebagai berikut:
=

+

+

+

+

+

+

+

+

+

+

+

(5)

Dari persamaan (5) dipilih model yang lebih sederhana dengan
menggunakan regresi bertatar dan regresi himpunan bagian terbaik. Selanjutnya
diperiksa asumsi-asumsinya. Jika terjadi pelanggaran asumsi kehomogenan
ragam, penanganannya akan menggunakan model regresi terboboti.
Tahapan Analisis
Tahapan analisis pada penelitian ini adalah sebagai berikut:
1. Menyiapkan data peubah respon dan peubah penjelas per kabupaten/kota.
2. Menduga parameter dan uji signifikansi parameter.

14
3. Mendapatkan model terbaik dengan regresi bertatar dan regresi himpunan
bagian terbaik.
4. Menguji asumsi mengenai sisaan, jika ada asumsi yang tidak terpenuhi maka
akan dilakukan penanganan.
5. Mendapatkan nilai dugaan peluang kematian bayi pada setiap kabupaten/kota
berdasarkan model terpilih.
6. Membuat peta tematik peluang kematian bayi di Indonesia.
Tahapan analisis tersebut dapat divisualisasikan seperti pada Gambar 3.

Mulai

Ada kab/kota
peluang = 0 ?

Penggabungan data ke
level kab/kota

Data individu

Tambah 0,01

Tidak
Model
terbaik

Pemilihan model terbaik dengan
regresi bertatar dan regresi
himpunan bagian terbaik

Pendugaan parameter

Ya

Uji asumsi: normalitas,
multikolinieritas,
heteroskedastisitas,
autokorelasi

Selesai

Ya

Melanggar
asumsi?

Membuat Peta Tematik

Gambar 3. Tahapan analisis data

Pembobotan

Tidak

Uji signifikansi

Interpretasi

15

4 HASIL DAN PEMBAHASAN
Kejadian Kematian Bayi di Indonesia
Secara umum, wilayah bagian timur dan tengah Indonesia memiliki peluang
kematian bayi lebih tinggi dibandingkan wilayah bagian barat Indonesia. Propinsi
di Indonesia dengan peluang kematian bayi terendah adalah Kalimantan Timur
(2.1 persen), DKI Jakarta (2.2 persen), Riau (2.4 persen), DI Yogyakarta (2.5
persen), Sulawesi Selatan (2.5 persen.). Sedangkan propinsi dengan peluang
kematian bayi tertinggi adalah Papua Barat (7.4 persen), Gorontalo (6.7 persen),
Maluku Utara (6.2 persen), Sulawesi Barat (6.0 persen), dan Sulawesi Tengah (5.8
persen) (BPS 2013).
Sementara itu, berdasarkan penghitungan langsung pada data sampel
SDKI, diketahui bahwa rata-rata peluang kematian bayi di kabupaten/kota di
Indonesia mencapai 5.6 persen. Peluang kematian bayi tertinggi terdapat di
Kabupaten Balangan, Kalimantan Selatan, yaitu sebesar 26.9 persen. Peluang
terendah ada di 24 kabupaten/kota sebesar 0.0. Sedangkan nilai terendah sebelum
0.0 adalah 0.7 persen terdapat di kabupaten Lampung Utara, Lampung. Sebaran
nilai peluang ini disajikan pada Gambar 4.
30
25

Persen

20

15
10
5
0

Gambar 4. Diagram kotak persentase kematian bayi di Indonesia
Deskripsi Peubah Penjelas
Dari 83 650 anak yang disurvei, 51.66 persen adalah laki-laki dan 48.34
persen adalah perempuan. Kejadian kematian bayi lebih banyak terjadi pada anak
laki-laki yaitu sekitar 6.79 persen dari total anak laki-laki yang lahir. Dan
kematian bayi pada anak perempuan sebesar 5.17 persen dari total anal
perempuan yang lahir.
Berdasarkan urutan kelahiran, persentase kematian bayi pada anak pertama
adalah 5.98 persen. Kemudian menurun pada anak ke-2 dan ke-3. Hal ini terjadi
karena anak pertama adalah pengalaman pertama seorang ibu menjadi orang tua
sehingga ada beberapa hal yang belum diketahui mengenai cara merawat anak.
Sedangkan pada saat melahirkan anak ke-2 dan ke-3, ibu telah berpengalaman
dalam merawat anak pada kelahiran sebelumnya. Akan tetapi, persentase
kematian bayi kembali menaik pada anak keempat, begitu seterusnya hingga

16

Persentase Kematian Bayi
(%)

mencapai puncak pada anak kesebelas dan kembali menurun pada anak ke-12.
Bahkan mencapai 0.0 persen pada anak ke-13 dan ke-14. Penurunan ini berkaitan
dengan sangat sedikitnya anak yang lahir pada urutan 12 ke atas.
30.00
25.00
20.00
15.00
10.00
5.00
0.00

1

2

3

4

5

6

7

8

9 10 11 12 13 14

Urutan Kelahiran

Gambar 5. Persentase kematian bayi berdasarkan urutan kelahiran
Pendidikan adalah faktor penting yang mempengaruhi cara berpikir dan
mengambil keputusan. Meskipun demikian, hanya ada 8 persen dari total wanita
yang pernah melahirkan yang menamatkan Sekolah Menengah Atas (SMA).
Sebagian besar dari mereka hanya menamatkan Sekolah Dasar (SD) yaitu 44
persen. Kemudian disusul tamat Sekolah Menengah Pertama (SMP) sebanyak 42
persen dan tidak menamatkan SD sebanyak 6 persen.
Berdasarkan pendidikan ibu, kematian bayi lebih banyak terjadi pada anak
yang memiliki ibu yang tidak tamat SD. Kemudian menurun seiring
meningkatnya jenjang pendidikan ibu.
12,25%
7,90%
3,98%

Tidak
Sekolah

2,27%

Tamat SD Tamat SMP Tamat SMA
ke atas

Gambar 6. Persentase kematian bayi berdasarkan pendidikan ibu
Umur ibu ketika melahirkan anak berada pada rentang 10-49 tahun. 82
persen diantaranya melahirkan pada saat berumur 20-39 tahun. Dari keseluruhan
anak yang dilahirkan pada masing-masing rentang umur ibu ketika melahirkan,
kematian bayi terjadi sekitar 9.50 persen pada rentang umur ibu 10-19 tahun, 5.0
persen pada rentang umur ibu 20-39 tahun dan 10.0 persen pada rentang umur 40
tahun ke atas.
Berdasarkan IK, sebagian besar bayi yang meninggal berasal dari rumah
tangga menengah ke bawah yaitu 44.7 persen berasal dari rumah tangga sangat
miskin, 21.3 persen dari rumah tangga miskin, dan 14.9 persen dari rumah tangga

17
menengah. Sebagaimana yang telah diketahui bersama, bahwa IK sangat
mempengaruhi asupan gizi, kebersihan lingkungan, dan penangan ketika terjadi
penyakit.
Sangat Kaya;
7,2%
Kaya; 11,8%
Sangat
Miskin; 44,7%

Menengah;
14,9%

Miskin; 21,3%

Gambar 7. Persentase kematian bayi berdasarkan IK
Rasio tenaga kesehatan per penduduk belum merata di seluruh Indonesia.
Wilayah bagian timur Indonesia cenderung memiliki rasio tenaga kesehatan per
penduduk yang lebih tinggi dibandingkan wilayah tengah dan barat Indonesia.
Kabupaten Yalimo, Provinsi Papua, memiliki rasio tenaga kesehatan per
penduduk sangat tinggi. Jumlah tenaga kesehatan di Kabupaten Yalimo hanya 11
orang perawat dengan jumlah penduduk 50 763. Hal ini dipengaruhi oleh keadaan
ekonomi dan kondisi geografis wilayah tersebut. Tidak banyak petugas medis
yang bersedia bertugas di daerah terpencil dengan medan yang berat dan gaji yang
sama dengan wilayah lain. Hal ini tentu saja berdampak besar pada kematian bayi.
Korelasi Antar Peubah
Peubah respon dalam penelitian ini adalah proporsi anak yang mati ketika
masih bayi. Metode regresi logistik menggunakan OLS mengharuskan kita
mentransformasi peubah respon tersebut dalam bentuk logaritma dari odd. Jika
berdasarkan data sampel SDKI tahun 2012 ada kabupaten/kota yang memiliki
peluang kematian bayi sama dengan nol, maka log odd tidak dapat diidentifikasi.
Untuk mengatasi hal ini, pada kabupaten/kota yang peluang kematian bayinya
sama dengan 0, maka peluangnya ditambahkan dengan bilangan yang kecil yaitu
0.01 sebagai bentuk intervensi agar hasil log odd dapat diidentifikasi.
Penambahan ini tidak merubah substansi data, karena pada kenyataannya hampir
tidak mungkin ada kabupaten/kota yang peluang kematian bayinya 0.
Log odd kematian bayi memiliki korelasi yang sangat rendah dengan
peubah-peubah bebas. Statistik korelasi Pearson antara peubah-peubah bebas
dengan log odd kematian bayi tidak ada yang mencapai 0.50. Korelasi tertinggi
terdapat pada hubungan dengan persentase bayi yang lahir dengan urutan
kelahiran empat atau lebih yaitu 0.42. Sedangkan korelasi terendah terdapat pada
hubungan dengan rasio jenis kelamin yaitu -0.06. Matriks korelasi selengkapnya
dapat dilihat pada Lampiran 1.
Rendahnya korelasi antara log odd kematian bayi dengan peubah-peubah
bebas tidak berarti bahwa peubah-peubah bebas tersebut tidak berpengaruh. Jika

18
dianalisis secara bersama-sama dalam suatu model, maka ada kemungkinan
peubah-peubah bebas tersebut secara bersama-sama berpengaruh signifikan
terhadap log odd kematian bayi.
Regresi Bertatar dan Regresi Himpunan Bagian Terbaik
Model regresi logistik menghasilkan model yang fit dengan R kuadrat
32.11 persen dan 6 peubah bebas yang tidak signifikan pada taraf nyata 0.05.
Estimasi parameter dapat dilihat pada Lampiran 2. Karena ada banyak peubah
yang tidak signifikan, maka akan dilakukan pemilihan model terbaik dengan
menggunakan regresi bertatar dan regresi himpunan bagian terbaik.
Model regresi himpunan bagian terbaik memberikan tiga kandidat model
terbaik. Ketiga kandidat ini terpilih karena nilai R kuadrat yang tinggi dan nilai
Cp Mallow mendekati jumlah peubah. Akan tetapi, dalam model ini ada peubah
yang tidak signifikan masuk ke dalam model. Kandidat model pertama
mengandung jumlah peubah tidak signifikan yang paling kecil, maka model ini
dipilih menjadi model terbaik dari regresi himpunan bagian terbaik.
Sementara itu, model terpilih dari regresi bertatar terdiri dari lima peubah
dengan R kuadrat yang lebih kecil jika dibandingkan dengan model regresi
himpunan bagian terbaik dan nilai Cp Mallow –nya berbeda dengan jumlah
peubah. Akan tetapi karena semua peubah penjelas yang masuk ke dalam model
memberi pengaruh yang signifikan maka model terbaik yang akan digunakan
dalam analisis selanjutnya adalah model regresi bertatar. Proses pemilihan model
regresi himpunan bagian terbaik dan regresi bertatar dapat dilihat pada Lampiran
3.
Tabel 2. Kandidat model terbaik dari regresi bertatar dan regresi himpunan
bagian terbaik
Model

Jumlah
Peubah

Peubah Penjelas

RHBT 1

6

X1. X2. X4. X5. X8. X10

31.4

30.5

6.8

RHBT 2

7

X1. X2. X4. X5. X7. X8. X10

31.6

30.6

7.4

RHBT 3

7

X1. X2. X4. X5. X8. X10. X11

31.6

30.5

7.5

RB

5

X2. X4. X5. X8. X10

30.9

30.1

8.3

Cp
Mallows

Peubah
Tidak
Sig.
X1
X1 dan
X7
X1 dan
X11
-

Masalah Keheterogenan Ragam
Hasil uji Park dan uji White tidak menunjukkan adanya ketidaksamaan
ragam. Akan tetapi, kedua uji ini digunakan pada unit analisis individu sehingga
hasilnya tidak dapat digunakan dalam penelitian dengan unit analisis
kabupaten/kota.
Seprti disebutkan pada persamaan (3), sisaan memiliki ragam sama dengan
1/
1−
dimana
adalah peluang kematian bayi di kabupaten/kota ke-j

19

2

2

1

1

0

0

Sisaan

Sisaan

dan
adalah jumlah anak yang dilahirkan di kabupaten/kota ke-j. Sehingga.
secara teori, ragam berhubungan terbalik dengan . Semakin besar
semakin
kecil ragam, semakin kecil semakin besar ragam.
Plot antara sisaan dan nilai dugaan adalah plot yang biasa digunakan untuk
mendeteksi ketidaksamaan ragam pada data dengan unit analisis individu. Dalam
Gambar 8(a) tidak terlihat adanya pola khusus dari sisaan. Sebaliknya. jika
diperhatikan plot antara sisaan dan jumlah
pada Gambar 8(b) maka akan
terlihat jelas pola mengerucut. Hal ini menandakan bahwa ketidaksamaan ragam
disebabkan oleh perbedaan jumlah .

-1

-2

-3

-1

-2

-4,0

-3,5

-3,0

-2,5

Dugaan

(a)

-2,0

-1 ,5

-1 ,0

-3

0

1 00

200

300

400

500

600

Jumlah contoh

700

800

900

(b)

Gambar 8. Diagram pencar sisaan terhadap peluang duga dan jumlah contoh
Uji kesamaan ragam sisaan dilakukan dengan uji Bartlet dengan tingkat
kepercayaan 95 persen pada kondisi sebelum dan sesudah diboboti. Hasil
pengujiannya disajikan pada Gambar 9(a) untuk data sebelum diboboti dan
Gambar 9(b) untuk data setelah diboboti. Pada Gambar 9(a) dapat dilihat bahwa
p-value 0.000 yang berarti bahwa ada perbedaan ragam yang nyata pada beberapa
kelompok. Selain itu, Gambar 9(a) juga memperlihatkan garis-garis yang
menunjukkan selang kepercayaan pada tiap kelompok. Selang kepercayaan ragam
kelompok 19 tidak beririsan dengan selang kepercayaan ragam kelompok 1, 3,
dan 4. Sedangkan selang kepercayaan ragam kelompok 17 tidak beririsan dengan
selang kepercayaan ragam kelompok 3 dan 4.
Untuk mengatasi masalah ketidaksamaan ragam sisaan, kabupaten/kota
dikelompokkan ke dalam 19 kelompok berdasarkan rentang jumlah anak yang
dilahirkan. Karakteristik masing-masing kelompok disajikan dalam Tabel 3.
P-value untuk uji Bartlet pada data yang telah diboboti adalah 0.093. Ini
berarti bahwa tidak cukup data untuk mengatakan bahwa ada perbedaan ragam
sisaan pada sembilan belas kelompok. Gambar 9(b) memperlihatkan selang
kepercayaan ragam pada semua kelompok mempunyai nilai yang beririsan.
Dengan demikian, model regresi logistik terboboti dianggap telah memperbaiki
masalah keheterogenan ragam sisaan.

20
Tabel 3. Karakteristik kelompok yang disusun dalam model regresi terboboti
Kelompok

Jumlah n

Jumlah
Observasi

Ragam

Simpangan
Baku

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

26-37
38-50
51-62
63-75
76-86
87-100
101-113
114-125
126-137
138-150
151-175
176-200
201-225
226-250
251-275
276-300
301-400
401-500
> 500

17
21
25
27
33
39
27
23
24
26
39
23
26
16
17
16
32
12
23

0.71
0.45
0.89
0.76
0.47
0.39
0.46
0.57
0.40
0.29
0.35
0.20
0.21
0.15
0.37
0.21
0.15
0.16
0.09

0.84
0.67
0.94
0.87
0.68
0.62
0.68
0.76
0.63
0.54
0.59
0.44
0.46
0.39
0.61
0.46
0.39
0.40
0.30

Berikut adalah hasil uji pada kondisi sebelum dan sesudah diboboti.
1

1

Bartlett’s Test

2

P-Value

3

P-Value

3

4

0,093

4

5

5

7

7

6

6

8

Kelompok

Kelompok

Bartlett’s Test

2

0,000

9
10
11
12

8
9
10
11
12

13

13

14

14

15

15

17

17

16

16

18

18

19

19

0,0

0,2

0,4

0,6

0,8

1 ,0

1 ,2

1 ,4

1 ,6

95% Bonferroni Confidence Intervals for StDevs

1 ,8

0,5

1 ,0

1 ,5

2,0

2,5

3,0

95% Bonferroni Confidence Intervals for StDevs

(a)

3,5

(b)

Gambar 9. Selang kepercayaan simpangan baku sisaan tiap kelompok pada model
regresi logistik dan model regresi terboboti
Diskusi Hasil Pemodelan
Pemodelan dengan regresi logistik terboboti menghasilkan model yang fit
dengan R kuadrat 54.80 persen. Model yang terbentuk tidak mengandung
multikolinieritas antar peubah penjelas. Hal ini dapat dilihat dari nilai VIF yang

21
tidak lebih dari 5 pada setiap peubah. Nilai VIF selengkapnya dapat dilihat pada
Lampiran 4.
Hasil pengujian asumsi kenormalan meunjukkan bahwa sisaan tidak
menyebar normal. Namun hal ini tidak mengherankan karena besarnya jumlah
contoh yang menyebabkan selang kepercayaan menjadi lebar dan peluang untuk
menolak hipotesis nol dalam pengujian kenormalan menjadi besar. Ini berakibat
pada kecenderungan menolak H sehingga disimpulkan data tidak normal.
Model yang terbentuk adalah sebagai berikut:


= −2.1880 + 0.01376
(p=0.000)

+ 0.5986
(p=0.000)

(p=0.002)





+ 0.01034
(p=0.068)



− 0.00154

(p=0.457)



− 0.01750

(p=0.000)



(6)

Dari persamaan (6) terlihat bahwa pada tingkat kepercayaan 90 persen.
pengaruh dari peubah ∗ . ∗ . ∗ . dan ∗ nyata. Sedangkan pengaruh dari peubah

tidak nyata. Interpretasi dari hasil ini adalah sebagai berikut.
Urutan kelahiran ( ∗ ) nyata berarti bahwa anak yang lahir pada urutan ke4, 5, dan seterusnya cenderung mati pada usia satu tahun ke bawah dengan rasio
odd sebesar ,
=1.10. Artinya semakin tinggi persentase anak yang lahir
dengan urutan ke empat atau lebih, semakin besar peluang terjadinya kematian
bayi di suatu kabupaten/kota. Ini berimplikasi perlunya perhatian khusus pada
anak urutan ke-4 dan set