Regresi Cox pada Survei Kompleks (Studi Kasus: Lama Pemberian ASI).

Regresi Cox pada Survei Kompleks
(Studi Kasus: Lama Pemberian ASI)
Endah Budiarti1 Septiadi Padmadisastra2 Bertho Tantular3
1,2,3

Program Magister Statistika Terapan, FMIPA, Universitas Padjadjaran
Email: budiarti.endah85@gmail.com

ABSTRAK
Cox (1972) memperkenalkan metode regresi untuk melihat faktor-faktor yang
menyebabkan terjadinya suatu peristiwa dengan peubah respon berupa waktu
survival. Pada data yang berasal dari survei kompleks, regresi Cox biasa kurang
tepat untuk diterapkan karena peluang setiap unit untuk terpilih sebagai sampel
akan berbeda-beda. Binder (1992) mengembangkan regresi Cox dengan
memperhatikan desain penarikan sampel. Binder menggunakan simulasi penarikan
sampel stratified random sampling. Dalam penelitian ini penggunaan regresi Cox
pada survei kompleks akan diilustrasikan pada kasus lama pemberian ASI di
Provinsi Riau dengan data Survei Sosial Ekonomi Nasional (Susenas) 2012 dimana
desain penarikan sampelnya tiga tahap berstrata. Dari delapan prediktor hanya dua
yang signifikan, yaitu umur ibu saat melahirkan dan penolong persalinan.
Kata-kata Kunci: Regresi Cox, Survei Kompleks, Pembobot Sampel, Subpopulasi

1. Pendahuluan
World Health Organization (WHO) merekomendasikan para ibu di seluruh dunia
untuk memberikan Air Susu Ibu (ASI) eksklusif pada enam bulan pertama kehidupan
bayi untuk mencapai pertumbuhan optimal, perkembangan dan kesehatan. Setelah itu
bayi harus diberi makanan pendamping ASI (MP-ASI) yang bergizi sambil tetap
diberikan ASI sampai bayi berusia dua tahun atau lebih. Data dari Badan Pusat Statistik
(BPS) menunjukkan rata-rata lama pemberian ASI di Indonesia sebesar 20 bulan pada
rentang waktu 2008-2012. Angka ini masih kurang dari yang disarankan WHO yaitu
selama dua tahun.
Data lama pemberian ASI merupakan data survival. Waktu survival adalah
panjang waktu yang diukur dari pertama kali suatu individu masuk ke dalam penelitian
sampai ia keluar dari penelitian. Analisis survival banyak diterapkan di bidang kesehatan
atau medis untuk menguji tingkat ketahanan pasien terhadap suatu penyakit.
Pengumpulan data mengenai lama pemberian ASI diantaranya melalui Survei
Sosial Ekonomi Nasional (Susenas) yang dilakukan oleh BPS. Susenas merupakan survei
triwulanan yang dilakukan empat kali setahun di seluruh Kabupaten/Kota di Indonesia.
Survei ini dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat
luas. Susenas adalah survei dengan desain penarikan sampel tiga tahap berstrata.
Metode regresi Cox menggunakan pembobot sampel diperkenalkan oleh Binder
[4]. Binder melakukan simulasi pengambilan sampel berstrata dengan alokasi sama dan


1

tidak sama. Pada penarikan sampel berstrata dengan alokasi tidak sama, model dengan
pembobot memberikan hasil yang lebih baik dibanding model tanpa pembobot.
Penelitian tentang lama pemberian ASI dengan memperhatikan metode penarikan sampel
berupa sampling kompleks masih jarang ditemukan. Penelitian ini mencoba
mengaplikasikan regresi Cox pada kasus penghentian pemberian ASI menggunakan data
Susenas 2012 triwulan I Provinsi Riau.
2. Model Regresi Cox pada Survei Kompleks
2.1 Metode Pengambilan Sampel Susenas
Susenas menggunakan desain penarikan sampel tiga tahap berstrata. Strata yang
dibentuk adalah strata daerah perkotaan dan perdesaan. Pada tahap pertama, dari
kerangka sampel berupa wilayah pencacahan Sensus Penduduk 2010 (SP2010) dipilih
wilayah pencacahan sebagai primary sampling unit (PSU) secara PPS (proportional
probability to size) dengan ukuran banyak rumah tangga SP2010 pada setiap wilayah
cacah. Selanjutnya karena survei ini dilakukan empat kali dalam setahun dengan sampel
yang berbeda, maka sampel wilayah cacah akan dialokasikan secara acak pada empat
triwulan. Pada tahap kedua, pada tiap sampel wilayah cacah dipilih satu blok sensus
secara PPS dengan ukuran banyak rumah tangga SP2010 pada setiap blok sensus. Pada

tahap ketiga, dari sampel blok sensus dipilih 10 rumah tangga biasa (non institusional)
secara sistematik berdasarkan hasil pemutakhiran rumah tangga.
Secara umum, pembobot dari unit sampel adalah kebalikan dari peluang terpilih
menjadi sampel. Misalkan peluang sebuah unit terpilih sebagai sampel adalah Pi, maka
pembobotnya (wi) dapat dinotasikan dengan wi = 1/ Pi. Secara sederhana, pembobot
sampling adalah jumlah individu dalam populasi yang diwakili oleh masing-masing unit
sampel dan jika semua pembobot pada sampel diakumulasikan nilainya akan sama
dengan jumlah populasi (
= ).
Pada desain penarikan sampel multistage, pembobot harus merefleksikan peluang
pemilihan sampel pada setiap tahapannya. Misalkan pada penarikan sampel dua tahap,
dimana peluang terpilih PSU ke-i pada tahap pertama adalah pi dan pada tahap kedua
peluang pemilihan rumah tangga ke-j pada PSU terpilih sebesar pj(i). Maka peluang setiap
rumah tangga untuk terpilih sebagai sampel adalah pij = pi × pj(i) dan pembobotnya
adalah 1/ pij.
Pembobot sampling Susenas pada strata h, PSU i, blok sensus j, rumah tangga k di
suatu Kabupaten/Kota adalah:
=

(1)


dimana
: jumlah rumah tangga (kerangka sampel) pada Kabupaten/Kota strata h
: jumlah rumah tangga hasil pemutakhiran pada Kabupaten/Kota di strata h, PSU
ke-i, blok sensus ke-j
: jumlah rumah tangga sampel pada Kabupaten/Kota di daerah h, PSU ke-i, blok
sensus ke-j
: jumlah rumah tangga sampel blok sensus triwulanan pada Kabupaten/Kota di
strata h
: jumlah rumah tangga (kerangka sampel) pada Kabupaten/Kota strata h, PSU
ke-i, blok sensus ke-j

2

2.2 Analisis Subpopulasi
Saat menganalisa data hasil survei, seringkali analisa difokuskan hanya pada
subpopulasi tertentu. Dalam penelitian ini, subpopulasi terdiri dari rumah tangga yang di
dalamnya terdapat anak terakhir berusia 0-59 bulan yang pernah diberikan ASI.
Melakukan eliminasi pada data yang tidak masuk dalam subpopulasi dapat
menghilangkan informasi mengenai desain kompleks yang berdampak pada terjadinya

kesalahan dalam penghitungan standar error dari estimasi survei.
Misalkan S adalah subpopulasi yang akan dihitung estimasinya. West, dkk [10]
menyarankan penggunaan indikator pada masing-masing sampel yang bernilai nol untuk
sampel di luar S dan bernilai satu pada sampel yang masuk dalam S.
1 jika individu merupakan anggota subpopulasi S
I, =
0 jika individu bukan merupakan anggota subpopulasi S
Penghitungan derajat bebas pada data subpopulasi yaitu jumlah PSU yang mengandung
observasi subpopulasi dikurangi jumlah strata yang mengandung subpopulasi.
2.3 Model Regresi Cox pada Survei Kompleks
Misalkan t adalah peubah acak kontinu yang menunjukkan waktu survival dan X
adalah vektor kovariat yang independen terhadap waktu. Secara umum model regresi
Cox dapat dituliskan sebagai berikut:
( , )=

( )exp

(2)

dimana ( ) merupakan fungsi baseline hazard pada waktu t yang tidak melibatkan X

dan = ( , , ) adalah vektor koefisien regresi.
Andersen dan Gill (1982) telah membuktikan bahwa estimasi parameter regresi
Cox mempunyai sifat konsisten dan normal asimtotik. Dengan kata lain, estimasinya
akan mendekati unbiased dan distribusi samplingnya akan mendekati normal pada
ukuran sampel yang besar.
Pada survei kompleks, pembobot sampel diikutsertakan untuk mengestimasi
koefisien regresi. Jika data berasal dari pengambilan sampel acak sederhana, pemodelan
regresi Cox standar bisa langsung digunakan. Namun jika data berasal dari survei dengan
desain sampel kompleks, maka perlu penyesuaian dalam analisisnya. Pendekatan yang
banyak digunakan pada data seperti ini adalah weighted partial likelihood yang
diperkenalkan oleh Binder [4].
Misalkan data terdiri dari n pengamatan yang telah diurutkan berdasarkan waktu
survival dengan ti adalah waktu survival amatan ke-i. Vektor kovariat untuk individu ke-i
adalah = ( , , ) . Ri = {l: tl ≥ ti} berisi individu-individu yang berisiko untuk
mengalami kejadian pada waktu ti, baik yang tersensor maupun tidak tersensor. Notasi δ i
melambangkan indikator sensor yang bernilai nol untuk waktu survival amatan ke-i yang
tersensor dan bernilai satu untuk amatan yang tidak tersensor. Pembobot sampel wi
dihitung menggunakan persamaan (1).
Penaksiran koefisien regresi dilakukan dengan weighted partial likelihood
sebagai berikut:

,
(
)
( )=
(3)
(
)
I,
Proses penghitungan estimasi dari β dapat diselesaikan dengan iterasi Newton
Raphson. Proses diawali dengan menggunakan nilai awal β (0)= 0 dan berulang dengan s =

3

1, 2, ... Proses berhenti saat iterasi sudah konvergen. Algoritma yang digunakan:
( )
( )
(
)
= ()
( )

( )
Varians dari estimasi β dihitung dengan formula berikut:
=

(4)
(5)

dimana
=

( )

=

I

I
,

(


,

I

)

(

,

I

(

,

I

)


(

,

)

(6)

)

Vs diestimasi dengan:
=

1

(1

)


(

1

,

,

)(

,

,

)

(7)

dimana residual observasinya adalah:
=

,
,

=

I
=

,

(8)

,
,

(9)

,

1

(10)

,

Skor residual untuk amatan ke-(h, i, j, k) dalam subpopulasi adalah:
=
,
,
,

exp

( )
:

,

,

(11)

dimana
( )

( )

,

,

=
=

1

( )=

I
I

,

,

( ) exp
( ) ( ) exp

( )

(12)
( )

(13)

1 jika
0 lainnya

3. Hasil dan Pembahasan
Data yang digunakan adalah data Susenas 2012 triwulan I Provinsi Riau. Total
seluruh PSU dan blok sensus sebanyak 191 dengan 1.797 rumah tangga sampel. Jumlah
PSU yang masuk dalam subpopulasi sebesar 182 dan rumah tangga subpopulasi sebanyak

4

623. Dari amatan tersebut 42,7 persen merupakan amatan tersensor. Hasil pengolahan
menggunakan paket program Stata versi 10.1 sebagai berikut:
Tabel 1
Hasil Regresi Cox dengan Pembobot Sampel
Model dengan Pembobot
Peubah

Rasio Hazard

Standard error

p-value

(1)

(2)

(3)

(4)

1.000
1.371
1.221

0.171
0.335

0.065
0.550

1.000
1.268

0.191

0.220

1.000
0.852

0.089

0.074

1.000
0.981

0.121

0.870

1.000
1.232
1.537

0.123
0.206

0.091
0.037

1.000
1.039

0.109

0.720

1.000
1.112

0.118

0.370

Umur ibu saat melahirkan
> 35 tahun
20-35 tahun
< 20 tahun
Penolong persalinan
Non Medis
Medis
Jenis kelamin anak
Perempuan
Laki-laki
Jumlah anak lahir hidup
1 anak
> 1 anak
Pendidikan ibu
Rendah
Menengah
Tinggi
Status bekerja ibu
Bekerja
Tidak Kerja
Tempat tinggal
Perdesaan
Perkotaan

Dari delapan prediktor yang digunakan terdapat tiga yang signifikan, yaitu ibu
yang pada saat melahirkan berusia 20-35 tahun, jenis kelamin anak dan pendidikan ibu.
Rasio hazard dari umur ibu saat melahirkan sebesar 1,37 dapat diinterpretasikan bahwa
ibu yang pada saat melahirkan berusia 20-35 tahun yang masih memberikan ASI
mempunyai 1,371 kali kemungkinan untuk berhenti memberikan ASI pada waktu
berikutnya dibandingkan ibu yang melahirkan pada usia di atas 35 tahun. Sementara
untuk jenis kelamin anak, hazard berhenti diberikan ASI pada anak perempuan lebih
besar dibanding anak laki-laki. Untuk pendidikan ibu, ibu dengan pendidikan menengah
dan tinggi mempunyai hazard yang lebih besar dibanding ibu berpendidikan rendah.

5

4. Daftar Pustaka
[1] Andersen, P. K., dan Gill, R. D. 1982. Cox’s Regression Model for Counting
Processes: A Large Sample Study. The Annals of Statistics Vol. 10, No. 4 (December
1982): 1100-1120.
[2] Badan Pusat Statistik. 2009. Indikator Kesejahteraan Rakyat 2009. Jakarta: BPS
[3] _________________. 2013. Indikator Kesejahteraan Rakyat 2013. Jakarta: BPS
[4] Binder, David A. 1992. Fitting Cox’s Proportional Hazard Model from Survey Data.
Biometrika 79: 139-147.
[5] Cox, D. R. 1972. Regression Models and Life-Tables. Journal of the Royal
Statistical Society B34, 187-220
[6] Cox, D. R. 1975. Partial Likelihood. Biometrika Vol. 62, 269-276
[7] Heeringa, S.G., West, B.T., dan Berglund, P.A. 2010. Applied Survey Data Analysis.
Florida: Taylor and Francis Group
[8] Lee, E. T., dan Wang, J. W. 2003. Statistical Methods for Survival Data Analysis
Third Edition. New Jersey: John Wiley & Sons, Inc.
[9] Mukhopadhyay, Pushpal K. 2010. Not Hazardous to Your Health: Proportional
Hazards Modeling for Survey Data with the SURVEYPHREG Procedure. SAS
Global Forum 2010 Statistics and Data Analysis, Paper 254-2010.
[10] West, B. T., Berglund, P., dan Heeringa, S. G. 2008. A Closer Examination of
Subpopulation Analysis of Complex-Sample Survey Data. The Stata Journal (2008)
8, Number 4: 520-531
Lampiran
Syntax Regresi Cox pada Survei Kompleks menggunakan Stata:
· svyset PSU_urut [pweight=weighting], strata (TMPT_TGL) vce(linearized)
singleunit(missing)
· svy linearized, subpop(ASI_if 1) : stcox X1_UMUR X2_SALIN X3_JK X4_PDDKN
X5_KERJA X6_ALH X7_KB X8_TTGL

6