Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol

ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL

NURHAFNI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2008

PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis dengan judul Analisis Regresi
Terpotong dengan Beberapa Nilai Amatan Nol adalah karya saya sendiri dan
belum diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber
informasi dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis
lain disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
tesis ini.

Bogor, Agustus 2008


Nurhafni
G551060251

ABSTRACT
NURHAFNI. Truncated Regression Analysis with Some Zero Observations.
Supervised by SISWADI and N. K. KUTHA ARDANA.
In social research survey, the use of household data is often hindered by the
occurrence of zero consumption or zero expenditure in the sample. Such zero
observations arise as households participating in the survey typically do not
consume certain commodity. The aim of this thesis is to evaluate truncated
regression with some zero observations on dependent variable. This implies on
the method of estimating the regression parameters. The estimation methods used
in this research are Ordinary Least Square (OLS), Weighted Least Square (WLS),
and Heckman’s two step method. The data applied in this paper are generated
using software SAS 9.1 with 8% proportion of zero observations. The following
results are obtained. Based on the bias, variance, and Mean Square Error (MSE)
of the estimates as well as the MSE for model validation, OLS and WLS methods
have relatively similar results. They tend to be better compared to the Heckman’s
two step method. Therefore, for the similar pattern of the data, it is recommended
to use OLS since it is a well known and simple method.

Keywords : truncated regression, Ordinary Least Square (OLS), Weighted Least
Square (WLS), Heckman’s two step estimator

RINGKASAN
NURHAFNI. Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol.
Dibimbing oleh SISWADI dan N. K. KUTHA ARDANA.
Dalam penelitian survei ekonomi sosial, penggunaan data rumah tangga
sering diusik dengan kehadiran zero consumption atau zero expenditure dalam
sampel. Nilai amatan nol tersebut terjadi karena rumah tangga yang berpartisipasi
pada survei tidak mengonsumsi komoditas tertentu, yang disebabkan oleh
beberapa faktor yaitu adanya variasi pada preferensi konsumsi/rumah tangga,
harga komoditas yang relatif tinggi, kesalahan pada pelaporan dan survei hanya
dicatat pada periode tertentu, tidak bertepatan dengan pembelian aktual.
Model regresi merupakan suatu alat untuk menganalisis data survei dan
parameter yang diduga dari suatu model regresi tersebut sering memberikan
gambaran secara umum. Dari sudut pandang pemodelan statistika, masalah
tersebut berimplikasi pada metode pendugaan yang sesuai untuk menduga
parameter dari model yang dipakai.
Penelitian sebelumnya membandingkan model regresi biasa, model Tobit
dan regresi terpotong (Truncated Regression) pada data konsumsi rumah tangga,

dengan mengikutkan zero consumption dan tanpa zero consumption. Dalam
penelitian tersebut digunakan metode pendugaan OLS dan MLE dan hasilnya
menyatakan bahwa metode OLS lebih baik dari MLE.
Penelitian ini dilakukan untuk mengevaluasi regresi terpotong dengan
beberapa nilai amatan nol pada peubah respons pada model, yaitu
. Pendugaan parameter yang digunakan
dalam penelitian ini adalah metode kuadrat terkecil (Ordinary Least Square,
OLS), metode kuadrat terkecil terboboti (Weighted Least Square, WLS) dan
penduga dua tahap Heckman (Heckman’s two step estimator). Selanjutnya adalah
untuk mengetahui metode manakah di antara ketiga metode tersebut yang akan
menghasilkan penduga yang baik pada proporsi nol yang dicobakan.
Data yang digunakan dalam penelitian ini adalah data bangkitan dari
distribusi normal dengan proporsi nilai amatan nol sekitar 8% (16 amatan nol
dari 192 amatan contoh), pembangkitan dilakukan dengan software SAS 9.1
Hasil penelitian menunjukan nilai bias dugaan parameter dari ketiga metode
dapat dikatakan sama antara satu dengan yang lain walaupun ada kecenderungan
metode WLS lebih kecil dibandingkan dengan dua metode yang lain. Nilai bias
dugaan pada
bernilai positif atau nilai dugaan berbias ke atas. Sedangkan
nilai bias dugaan pada

yang bernilai negatif atau berbias ke bawah.
Nilai ragam dugaan dari setiap parameter pada metode dua tahap Heckman relatif
lebih besar dibandingkan dengan dua metode yang lain. Nilai ragam dugaan
metode OLS dan WLS dapat dikatakan sama walaupun ada kecenderungan nilai
ragam metode OLS lebih kecil dibandingkan dengan metode WLS. Nilai MSE
metode dua tahap Heckman relatif paling besar dibandingkan dua metode yang
lain. Nilai MSE metode OLS dan WLS dapat dikatakan sama pada semua
parameter, tetapi secara keseluruhan nilai MSE metode WLS cenderung lebih
kecil dibandingkan dengan OLS. Begitu juga dari nilai MSE validasi model,
metode OLS dan WLS relatif lebih baik dari metode dua tahap Heckman.

Secara umum penduga OLS dan WLS lebih baik dan lebih efisien dari
metode dua tahap Heckman. Dari hasil tersebut maka disarankan untuk data yang
mempunyai pola yang sama, metode OLS dapat digunakan. Selain memberi sifatsifat yang baik, metode ini sudah umum dikenal, mudah dipahami, prosedur
komputasinya sederhana dan banyak tersedia pada software statistika.

©Hak Cipta milik Institut Pertanian Bogor, tahun 2008
Hak Cipta dilindungi undang-undang
1. Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya
ilimiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis
dalam bentuk apapun tanpa izin Institut Pertanian Bogor.

ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL

NURHAFNI

Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Departemen Matematika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2008


Penguji Luar Komisi pada Ujian Tesis : Ir. Retno Budiarti, MS

Judul Tesis

:

Nama
NIM

:
:

Analisis Regresi Terpotong dengan Beberapa Nilai Amatan
Nol
Nurhafni
G551060251

Disetujui,
Komisi Pembimbing


Dr. Ir. Siswadi, M.Sc
Ketua

Ir. N. K. Kutha Ardana, M.Sc
Anggota

Diketahui

Ketua Program Studi Matematika
Terapan

Dr. Ir. Endar H. Nugrahani, MS

Tanggal Ujian : 20 Agustus 2008

Dekan Sekolah Pasca Sarjana

Prof. Dr. Ir. Khairil A. Notodiputro, MS


Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah
melimpahkan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil
diselesaikan. Tema penelitian yang dilaksanakan sejak bulan Juni 2007 ini adalah
membandingkan metode pendugaan parameter, dengan judul Analisis Regresi
Terpotong dengan Beberapa Nilai Amatan Nol.
Penulis sangat berterima kasih kepada Bapak Dr. Ir. Siswadi, M.Sc dan
Bapak Ir. N. K. Kutha Ardana, M.Sc selaku pembimbing atas saran, bimbingan
dan nasehatnya selama penelitian dan penulisan tesis ini. Terima kasih juga
disampaikan kepada Ibu Ir. Retno Budiarti, MS sebagai penguji luar komisi yang
telah banyak memberikan masukan untuk perbaikan tesis ini selama dalam
persidangan tesis. Terima kasih juga disampaikan kepada Departemen Agama
Republik Indonesia yang telah memberikan izin dan bantuan beasiswa kepada
penulis untuk memperoleh gelar Magister Sains pada Program Studi Matematika
Terapan, Sekolah Pascasarjana Institut Pertanian Bogor.
Kepada suamiku Sumarhalin, anakku tersayang Fascha Ahmad, orang tua
serta seluruh keluarga, terima kasih atas segala kasih sayang, pengertian dan
doanya. Terakhir, ucapan terima kasih penulis sampaikan kepada rekan-rekan atas

segala bantuannya dan doanya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Agustus 2008

Nurhafni

ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL

NURHAFNI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2008

PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis dengan judul Analisis Regresi

Terpotong dengan Beberapa Nilai Amatan Nol adalah karya saya sendiri dan
belum diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber
informasi dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis
lain disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
tesis ini.

Bogor, Agustus 2008

Nurhafni
G551060251

ABSTRACT
NURHAFNI. Truncated Regression Analysis with Some Zero Observations.
Supervised by SISWADI and N. K. KUTHA ARDANA.
In social research survey, the use of household data is often hindered by the
occurrence of zero consumption or zero expenditure in the sample. Such zero
observations arise as households participating in the survey typically do not
consume certain commodity. The aim of this thesis is to evaluate truncated
regression with some zero observations on dependent variable. This implies on
the method of estimating the regression parameters. The estimation methods used

in this research are Ordinary Least Square (OLS), Weighted Least Square (WLS),
and Heckman’s two step method. The data applied in this paper are generated
using software SAS 9.1 with 8% proportion of zero observations. The following
results are obtained. Based on the bias, variance, and Mean Square Error (MSE)
of the estimates as well as the MSE for model validation, OLS and WLS methods
have relatively similar results. They tend to be better compared to the Heckman’s
two step method. Therefore, for the similar pattern of the data, it is recommended
to use OLS since it is a well known and simple method.
Keywords : truncated regression, Ordinary Least Square (OLS), Weighted Least
Square (WLS), Heckman’s two step estimator

RINGKASAN
NURHAFNI. Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol.
Dibimbing oleh SISWADI dan N. K. KUTHA ARDANA.
Dalam penelitian survei ekonomi sosial, penggunaan data rumah tangga
sering diusik dengan kehadiran zero consumption atau zero expenditure dalam
sampel. Nilai amatan nol tersebut terjadi karena rumah tangga yang berpartisipasi
pada survei tidak mengonsumsi komoditas tertentu, yang disebabkan oleh
beberapa faktor yaitu adanya variasi pada preferensi konsumsi/rumah tangga,
harga komoditas yang relatif tinggi, kesalahan pada pelaporan dan survei hanya
dicatat pada periode tertentu, tidak bertepatan dengan pembelian aktual.
Model regresi merupakan suatu alat untuk menganalisis data survei dan
parameter yang diduga dari suatu model regresi tersebut sering memberikan
gambaran secara umum. Dari sudut pandang pemodelan statistika, masalah
tersebut berimplikasi pada metode pendugaan yang sesuai untuk menduga
parameter dari model yang dipakai.
Penelitian sebelumnya membandingkan model regresi biasa, model Tobit
dan regresi terpotong (Truncated Regression) pada data konsumsi rumah tangga,
dengan mengikutkan zero consumption dan tanpa zero consumption. Dalam
penelitian tersebut digunakan metode pendugaan OLS dan MLE dan hasilnya
menyatakan bahwa metode OLS lebih baik dari MLE.
Penelitian ini dilakukan untuk mengevaluasi regresi terpotong dengan
beberapa nilai amatan nol pada peubah respons pada model, yaitu
. Pendugaan parameter yang digunakan
dalam penelitian ini adalah metode kuadrat terkecil (Ordinary Least Square,
OLS), metode kuadrat terkecil terboboti (Weighted Least Square, WLS) dan
penduga dua tahap Heckman (Heckman’s two step estimator). Selanjutnya adalah
untuk mengetahui metode manakah di antara ketiga metode tersebut yang akan
menghasilkan penduga yang baik pada proporsi nol yang dicobakan.
Data yang digunakan dalam penelitian ini adalah data bangkitan dari
distribusi normal dengan proporsi nilai amatan nol sekitar 8% (16 amatan nol
dari 192 amatan contoh), pembangkitan dilakukan dengan software SAS 9.1
Hasil penelitian menunjukan nilai bias dugaan parameter dari ketiga metode
dapat dikatakan sama antara satu dengan yang lain walaupun ada kecenderungan
metode WLS lebih kecil dibandingkan dengan dua metode yang lain. Nilai bias
dugaan pada
bernilai positif atau nilai dugaan berbias ke atas. Sedangkan
nilai bias dugaan pada
yang bernilai negatif atau berbias ke bawah.
Nilai ragam dugaan dari setiap parameter pada metode dua tahap Heckman relatif
lebih besar dibandingkan dengan dua metode yang lain. Nilai ragam dugaan
metode OLS dan WLS dapat dikatakan sama walaupun ada kecenderungan nilai
ragam metode OLS lebih kecil dibandingkan dengan metode WLS. Nilai MSE
metode dua tahap Heckman relatif paling besar dibandingkan dua metode yang
lain. Nilai MSE metode OLS dan WLS dapat dikatakan sama pada semua
parameter, tetapi secara keseluruhan nilai MSE metode WLS cenderung lebih
kecil dibandingkan dengan OLS. Begitu juga dari nilai MSE validasi model,
metode OLS dan WLS relatif lebih baik dari metode dua tahap Heckman.

Secara umum penduga OLS dan WLS lebih baik dan lebih efisien dari
metode dua tahap Heckman. Dari hasil tersebut maka disarankan untuk data yang
mempunyai pola yang sama, metode OLS dapat digunakan. Selain memberi sifatsifat yang baik, metode ini sudah umum dikenal, mudah dipahami, prosedur
komputasinya sederhana dan banyak tersedia pada software statistika.

©Hak Cipta milik Institut Pertanian Bogor, tahun 2008
Hak Cipta dilindungi undang-undang
1. Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya
ilimiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis
dalam bentuk apapun tanpa izin Institut Pertanian Bogor.

ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL

NURHAFNI

Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Departemen Matematika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2008

Penguji Luar Komisi pada Ujian Tesis : Ir. Retno Budiarti, MS

Judul Tesis

:

Nama
NIM

:
:

Analisis Regresi Terpotong dengan Beberapa Nilai Amatan
Nol
Nurhafni
G551060251

Disetujui,
Komisi Pembimbing

Dr. Ir. Siswadi, M.Sc
Ketua

Ir. N. K. Kutha Ardana, M.Sc
Anggota

Diketahui

Ketua Program Studi Matematika
Terapan

Dr. Ir. Endar H. Nugrahani, MS

Tanggal Ujian : 20 Agustus 2008

Dekan Sekolah Pasca Sarjana

Prof. Dr. Ir. Khairil A. Notodiputro, MS

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah
melimpahkan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil
diselesaikan. Tema penelitian yang dilaksanakan sejak bulan Juni 2007 ini adalah
membandingkan metode pendugaan parameter, dengan judul Analisis Regresi
Terpotong dengan Beberapa Nilai Amatan Nol.
Penulis sangat berterima kasih kepada Bapak Dr. Ir. Siswadi, M.Sc dan
Bapak Ir. N. K. Kutha Ardana, M.Sc selaku pembimbing atas saran, bimbingan
dan nasehatnya selama penelitian dan penulisan tesis ini. Terima kasih juga
disampaikan kepada Ibu Ir. Retno Budiarti, MS sebagai penguji luar komisi yang
telah banyak memberikan masukan untuk perbaikan tesis ini selama dalam
persidangan tesis. Terima kasih juga disampaikan kepada Departemen Agama
Republik Indonesia yang telah memberikan izin dan bantuan beasiswa kepada
penulis untuk memperoleh gelar Magister Sains pada Program Studi Matematika
Terapan, Sekolah Pascasarjana Institut Pertanian Bogor.
Kepada suamiku Sumarhalin, anakku tersayang Fascha Ahmad, orang tua
serta seluruh keluarga, terima kasih atas segala kasih sayang, pengertian dan
doanya. Terakhir, ucapan terima kasih penulis sampaikan kepada rekan-rekan atas
segala bantuannya dan doanya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Agustus 2008

Nurhafni

RIWAYAT HIDUP
Penulis dilahirkan di Tanjung Pura pada tanggal 28 Agustus 1976 dari ayah
Ahmad Mansyuruddin dan ibu Helmi Yus. Penulis merupakan anak pertama dari
lima bersaudara.
Tahun 1994 penulis lulus dari SMA Negeri Tanjung Pura Kabupaten
Langkat dan pada tahun yang sama lulus seleksi masuk USU Medan. Penulis
memilih Jurusan Matematika pada Fakultas Matematika dan Ilmu Pengetahuan
Alam dan selesai pada tahun 1999.
Tahun 1999 penulis bekerja sebagai tenaga honorer di Madrasah Aliyah
Negeri 2 Tanjung Pura sampai tahun 2006.
Tahun 2005 penulis masuk PNS di Departemen Agama, bekerja sebagai staf
pengajar diperbantukan di Madrasah Tsanawiyah Swasta (MTsS) Jam’iyah
Mahmudiyah Tanjung Pura sampai sekarang.
Pada tahun 2006 penulis masuk Program Magister Program Studi
Matematika Terapan di Institut Pertanian Bogor melalui jalur Beasiswa Utusan
Daerah (BUD) Departemen Agama Republik Indonesia dan menyelesaikannya
pada tahun 2008.

DAFTAR ISI
Halaman
DAFTAR TABEL ..............................................................................................

xi

DAFTAR GAMBAR ........................................................................................ xii
DAFTAR LAMPIRAN ...................................................................................... xiii
PENDAHULUAN
Latar Belakang ..........................................................................................

1

Tujuan dan Manfaat ..................................................................................

3

TINJAUAN PUSTAKA
Metode Kuadrat Terkecil Biasa ...............................................................

4

Metode Kuadrat Terkecil Terboboti .........................................................

5

Regresi Terpotong .....................................................................................

8

Regresi Tobit .............................................................................................

8

Model Probit ............................................................................................. 10
Penduga Dua Tahap Heckman .................................................................. 12
Sifat-sifat Penduga yang Baik ................................................................... 13
METODE PENELITIAN
Sumber Data............................................................................................. 16
Tahap Analisis .......................................................................................... 16
HASIL DAN PEMBAHASAN
Hasil Pendugaan Parameter ...................................................................... 23
Evaluasi Metode Pendugaan ..................................................................... 27
Validasi Model .......................................................................................... 34
KESIMPULAN DAN SARAN .......................................................................... 37
DAFTAR PUSTAKA......................................................................................... 39
LAMPIRAN ....................................................................................................... 40

DAFTAR TABEL
Halaman
1 Nilai peubah penjelas pada data asal ........................................................... 17
2 Nilai bias dugaan dengan metode OLS, WLS dan dua tahap Heckman ...... 28
3 Nilai ragam dugaan dengan metode OLS, WLS dan dua tahap Heckman ... 30
4 Nilai MSE dugaan dengan metode OLS, WLS dan dua tahap Heckman ... 32

DAFTAR GAMBAR
Halaman
1

Flowchart dari tahap analisis penelitian ...................................................... 20

2

Diagram kotak nilai dugaan untuk keseluruhan parameter pada tahap
pendugaan parameter ..................................................................................... 24

3

Diagram kotak nilai dugaan untuk tiap-tiap parameter pada tahap
pendugaan parameter ..................................................................................... 24

4

Grafik nilai bias dugaan dari keseluruhan parameter (

)

dengan metode OLS, WLS dan dua tahap Heckman ................................... 28
5

Grafik nilai bias dugaan dari tiap-tiap parameter (

)

dengan metode OLS, WLS dan dua tahap Heckman ................................... 29
6

Grafik nilai ragam dugaan dari keseluruhan parameter (

)

dengan metode OLS, WLS dan dua tahap Heckman ................................... 30
7

Grafik nilai ragam dugaan dari tiap-tiap parameter (

)

dengan metode OLS, WLS dan dua tahap Heckman ................................... 31
8

Grafik nilai MSE dugaan dari keseluruhan parameter (

)

dengan metode OLS, WLS dan dua tahap Heckman ................................... 32
9

Grafik nilai MSE dugaan dari tiap-tiap parameter (

)

dengan metode OLS, WLS dan dua tahap Heckman ................................... 33
10

Diagram kotak nilai MSE untuk validasi model dengan metode OLS, WLS
dan dua tahap Heckman ................................................................................ 34

DAFTAR LAMPIRAN
Halaman
1

Program simulasi data.................................................................................... 40

2

Program pendugaan parameter ...................................................................... 42
OLS .......................................................................................................... 42
WLS.......................................................................................................... 43
Dua tahap Heckman ................................................................................. 45

3

Hasil pendugaan parameter yang diperoleh dari masing-masing metode
pendugaan parameter ..................................................................................... 48

4

Nilai MSE validasi model dengan metode OLS, WLS dan dua
tahap Heckman .............................................................................................. 51

1

PENDAHULUAN
Latar Belakang
Salah

satu

metode

penelitian

sosial

ekonomi

yang

sangat

luas

penggunaannya adalah metode penelitian survei. Penelitian survei bertujuan untuk
mendeskripsikan fenomena sosial ekonomi tertentu, mengadakan evaluasi dan
melakukan prediksi mengenai fenomena tersebut.
Salah satu penelitian survei yang rutin dilakukan di Indonesia adalah Survei
Sosial Ekonomi Nasional (Susenas) yang diselenggarakan oleh Biro Pusat
Statistik (BPS). Salah satu peubah sasaran adalah konsumsi/pengeluaran rumah
tangga yang dikumpulkan setiap tiga tahun sekali. Survei ini biasanya dilakukan
untuk mendapatkan informasi mengenai barang dan jasa yang dibeli konsumen
serta berapa besar pengeluarannya. Data yang terkumpul digunakan untuk
mempelajari perilaku konsumen, memonitor tingkat kesejahteraan pada kelompok
masyarakat, dan untuk pengambilan kebijakan pajak maupun politik pemerintah
(BPS, 2003).
Perkembangan ilmu sosial ekonomi menuntut analisis kuantitatif untuk
melihat dan menganalisis hubungan peubah-peubah yang saling terkait. Dimulai
dari hubungan dalam teori ekonomi lalu diformulasikan ke persamaan matematika
dengan membuat model, sehingga dapat diukur. Model regresi merupakan suatu
alat untuk menganalisis data survei dan parameter yang diduga dari suatu model
regresi tersebut sering memberikan gambaran secara umum. Dari sudut pandang
pemodelan statistika, masalah tersebut berimplikasi pada metode pendugaan yang
sesuai untuk menduga parameter dari model yang dipakai.
Permasalahan yang sering dihadapi pada survei konsumsi/pengeluaran
rumah tangga adalah diperolehnya nilai amatan nol. Hal tersebut sering dijumpai
karena adanya rumah tangga yang tidak mengonsumsi komoditas tertentu, dikenal
dengan istilah zero consumption/zero expenditure. Akibatnya akan menyulitkan
penggunaan data rumah tangga karena peubah respons pada fungsi permintaannya
mengandung zero consumption/zero expenditure. Ada beberapa faktor yang
menyebabkan fenomena zero consumption/zero expenditure, di antaranya adalah
1) adanya variasi pada preferensi konsumen atau rumah tangga, 2) harga

2

komoditas yang cukup mahal, 3) kesalahan pada pelaporan 4) survei hanya dicatat
pada periode tertentu, tidak bertepatan dengan pembelian aktual. Bagaimanapun
di antara rumah tangga terdapat variasi yang luas dalam kuantitas atau jumlah
yang dikonsumsi, sehingga kemungkinan ada sejumlah nilai amatan nol.
Kemalawaty (1999) yang menggunakan data Susenas dalam penelitian
mengenai sistem permintaan makanan di daerah Aceh menggabungkan beberapa
rumah tangga sesuai dengan interval besar anggaran pengeluaran untuk mencegah
nilai amatan nol, padahal model yang digunakan menghendaki semua rumah
tangga contoh mengkonsumsi semua komoditas yang dianalisis.
Ada juga sebagian peneliti tidak menganalisis data zero consumption, hal ini
tentu saja mengurangi informasi, ukuran sampel dan tidak mencerminkan keadaan
yang sebenarnya karena berkurangnya rumah tangga contoh.
Virgantari (2005), membandingkan model regresi biasa, model Tobit dan
regresi terpotong (Truncated Regression) pada data konsumsi rumah tangga,
dengan mengikutkan zero consumption dan tanpa zero consumption. Dalam kajian
penerapan metode kuadrat terkecil biasa (Ordinary Least Square, OLS) dan
metode kemungkinan maksimum

(Maximum Likelihood, ML), disimpulkan

bahwa berdasarkan nilai Mean Square Error (MSE) serta penyimpangan asumsi,
secara umum dapat dikatakan metode OLS memberikan hasil yang lebih baik
daripada menggunakan metode ML.
Banyak metode pendugaan yang biasa digunakan dalam analisis regresi
atau untuk menduga parameter model yang digunakan. Metode kuadrat terkecil
biasa sangat populer digunakan, karena secara teori metode tersebut mudah dan
cukup baik apabila asumsi klasik dipenuhi. Semakin banyak nilai amatan nol pada
data yang diperoleh akan menyebabkan terjadinya penyimpangan asumsi klasik,
sehingga diperlukan metode pendugaan yang lain, seperti metode kuadrat tekecil
terboboti (Weighted Least Square, WLS) dan metode

penduga dua tahap

Heckman (Probit dan OLS) yang akan dibahas dalam penelitian ini.

3

Tujuan dan Manfaat
Tujuan penelitian ini mengevaluasi model regresi terpotong dengan
beberapa nilai amatan nol, dengan metode kuadrat terkecil biasa (OLS), metode
kuadrat terkecil terboboti (WLS) dan penduga dua tahap Heckman (Probit dan
OLS) untuk memperoleh metode pendugaan yang terbaik.
Dari hasil penelitian ini diharapkan dapat diperoleh suatu metode
pendugaan parameter yang terbaik dalam penelitian yang banyak melibatkan nilai
amatan nol seperti pada pola konsumsi/pengeluaran rumah tangga, sehingga
diharapkan pendugaan pola konsumsi dan model fungsi permintaan dapat
memberikan gambaran yang lebih rinci dan tepat tentang perilaku konsumsi
rumah tangga. Informasi yang dihasilkan dapat bermanfaat lebih jauh bagi
perencanaan kebijakan dan peningkatan konsumsi pangan.

4

TINJAUAN PUSTAKA
Pendugaan parameter pada model regresi dapat diselesaikan dengan metode
pendugaan yang berbeda, seperti OLS, WLS, penduga dua tahap Heckman yang
akan digunakan dalam tulisan ini.
Metode Kuadrat Terkecil Biasa (OLS)
Persamaan regresi linear adalah persamaan antara satu peubah respons (Y)
dengan satu atau lebih peubah penjelas (X1, X2, X3, …, Xp). Hubungan antara
peubah-peubah tersebut dapat dirumuskan dalam bentuk persamaan,
(1)
Atau dalam bentuk matriks,

dengan X adalah matriks peubah penjelas berukuran n × k, Y adalah vektor
peubah respons berukuran n × 1,

adalah vektor parameter berukuran k × 1,

adalah vektor galat atau sisaan berukuran n × 1 (n adalah banyaknya amatan dan
k = p + 1

adalah

,

banyaknya parameter ).

Asumsikan

.

Pendugaan parameter dalam model regresi linear dilakukan dengan
meminimumkan kuadrat sisaan atau

(2)
Sebagai nilai dugaan, maka dipilih ß sedemikian rupa sehingga nilai
minimum. Caranya adalah dengan mendiferensialkan persamaan (2) terhadap ß
dan kemudian disamakan dengan nol, yaitu:
(3)
Sehingga diperoleh:
(4)
dengan matriks koragam dari penduga

adalah :
(5)

dengan

adalah matriks non singular (Draper and Smith, 1981).

5

singular, maka penduga ß dicari dengan matriks

Jika matriks

kebalikan umum. Penduga tersebut tidak bersifat unik, dan solusi umumnya
(Kshirsagar, 1983) adalah:
(6)
adalah matriks idempoten berukuran p × p yang mempunyai

di mana

pangkat H = pangkat S = pangkat X = tr H; dan z adalah

sifat

vektor sembarang, sedangkan
(7)
di mana

adalah kebalikan umum dari S=

.

Metode OLS merupakan metode pendugaan yang sering dipakai pada
analisis regresi klasik. Hal ini berdasarkan pada kenyataan bahwa penduga OLS
relatif lebih mudah dan selalu tersedia pada software statistika, penduga OLS
merupakan penduga tak bias linear terbaik (BLUE).
Metode Kuadrat Terkecil Terboboti (WLS)
Asumsi yang biasa dibuat mengenai model regresi linear
adalah

.

Kadang-kadang

asumsi

tersebut

tidak

terpenuhi, dan modifikasi metode kuadrat terkecil diperlukan ketika
, di mana

merupakan matriks n × n. Jika

matriks diagonal dengan

elemen diagonal yang tidak sama, maka amatan Y tidak berkorelasi tetapi
mempunyai ragam yang berbeda. Jika selain elemen diagonal pada

adalah tak

nol, maka amatan Y ada yang saling berkorelasi.
Secara formal, andaikan model
(8)
diketahui,
penduga kuadrat terkecil biasa

tidak perlu diketahui
tidak lagi sesuai. Pendekatan

masalah ini dilakukan dengan transformasi model pada himpunan amatan baru
yang memenuhi asumsi kuadrat terkecil dan selanjutnya menggunakan OLS pada
data yang telah ditransformasi. Karena

merupakan matriks koragam dari galat,

adalah sebarang matriks tak singular dan definit positif, maka terdapat matriks
simetrik tak singular K berukuran n × n, di mana
disebut akar kuadrat dari

.

Matriks K

6

Definisikan peubah-peubah baru

maka model regresi

menjadi

atau
(10)

Dengan demikian elemen
berkorelasi. Karena

mempunyai nilai tengah nol, ragam konstan dan tak

galat

pada persaman (10) memenuhi asumsi biasa,

sehingga OLS dapat digunakan. Fungsi kuadrat terkecil adalah

(11)
Dengan pendiferensialan secara parsial terhadap

dan menyamakan hasil yang

diperoleh dengan nol, sehingga diperoleh persamaan normal kuadrat terkecil,
(12)
dan solusi persamaan tersebut adalah :
(13)
disebut penduga kuadrat terkecil umum (Generalized Least Square, GLS)
dari , dengan matriks koragam dari penduga

adalah :
(14)

(Montgomery and Peck, 1992).
Jika struktur dari matriks koragam tidak diketahui, atau matriks
diketahui maka

tidak

untuk metode pendugaaan parameter GLS pada persamaan (13)

perlu diduga dari data selain pendugaan parameter dengan menggunakan metode
OLS. Metode GLS secara khusus memerlukan proses iterasi. Dalam prakteknya,
secara khusus tidak diketahui, maka pendugaan parameter dengan metode GLS
tidak dapat diperoleh. Dengan menggantikan penduga

untuk

pada

persamaan (13) menghasilkan penduga yaitu
(15)
dengan

yang berunsur n(n+1)/2 parameter, sehingga terlalu banyak untuk

diduga dari n amatan. Pendugaan yang tepat dari
pembatasan pada elemen
model jika diproses.

tidak akan mungkin kecuali

ditentukan atau strukturnya harus ditentukan pada

7

Jika galat mempunyai ragam tak sama, maka

= diag

dan bentuk

khusus dari GLS ini disebut sebagai metode kuadrat terkecil terboboti (Weighted
Least Square, WLS). Dalam kasus ini K = diag
.

Diasumsikan

struktur

=

sederhana

dan
dari

sehingga

merupakan matriks diagonal dengan elemen diagonal yang mungkin berbeda,

(16)

yang artinya elemen Y tidak berkorelasi tetapi mempunyai ragam yang berbeda.
Untuk menentukan penduga WLS, tansformasi matriks yang diinginkan adalah,

(17)

Algoritma WLS jika struktur

tidak diketahui dapat ditulis dalam langkah-

langkah sebagai berikut :
1 Regresikan Y dengan konstanta dan semua peubah bebas atau menduga
parameter

dengan OLS, menghasilkan

sebagai dugaan awal.

2 Tentukan galat dari regresi pada langkah pertama.
3 Analisis galat dan tentukan pembobot atau dugaan dari

yaitu

yang

merupakan matriks diagonal.
4 Duga kembali parameter dengan menyelesaikan persamaan (15) untuk
memperoleh

yang baru, atau dilakukan dengan memerhatikan bahwa

didekomposisikan sebagai

dan dugaan parameter

dapat

dapat diperoleh

dengan membentuk pembobot dan melakukan regresi kuadrat terkecil terboboti
dengan mentransformasi semua peubah pada langkah pertama dengan
mengalikan setiap peubah termasuk konstanta dengan bobot yang dibentuk
pada langkah sebelumnya.
5 Ulangi langkah 2, 3, 4 sampai

dianggap tidak berubah (konvergen).

8

Regresi Terpotong
Menganalisis data survei rumahtangga misalnya pengeluaran rumahtangga
pada suatu barang dengan menggunakan model regresi dengan memerhatikan
kenyataan bahwa pengeluaran (peubah respons pada model regresi) tidak mungkin
negatif.
Peubah respons dalam model regresi diamati pada seluruh daerah hasil
(range). Peubah respons dikatakan terpotong jika sebagian dari amatan
merupakan nilai minimum atau maksimum, karena peubah terpotong tidak
diamati pada seluruh daerah hasil. Sebuah sampel dikatakan terpotong jika data
hanya diperoleh pada himpunan bagian dari keseluruhan populasi.
Dalam studi ini peubah respons dikatakan terpotong pada titik c bila
nilainya

c dianggap bernilai c atau Y didefinisikan sebagai berikut :
(18)

(Maddala, 1983).
Model Tobit
Model ini pertama kali dibicarakan oleh Tobin (1958), yang menganalisis
pengeluaran rumahtangga pada suatu barang menggunakan model regresi dengan
memerhatikan kenyataan bahwa pengeluaran (peubah respons pada model regresi)
tidak mungkin negatif. Untuk data dengan beberapa nilai amatan nol, metode
kuadrat terkecil tidak sesuai karena asumsi klasik tidak terpenuhi. Karena Tobin
menghubungkan studinya pada analisis Probit, maka model ini juga disebut model
Tobit oleh Goldberger (Amemiya, 1984).
Maddala (1983) mendefinisikan model Tobit sebagai berikut:

(19)

,

Pada model ini

adalah vektor parameter berukuran k × 1,

adalah vektor peubah penjelas berukuran k × 1, termasuk unsur 1 bila dengan
intersep, dan

adalah galat yang saling bebas dan berdistribusi normal dengan

nilai tengah nol dan ragam

.

9

Pendugaan parameter menurut Maddala (1983) dilakukan dengan
memisahkan amatan peubah respons yang bernilai nol dan positif. Misalkan N0
adalah banyaknya amatan di mana yi = 0 dan Ni adalah banyaknya amatan
yi > 0, dan didefinisikan:
(20)
(21)
(22)
(23)
dan

masing-masing merupakan fungsi kepekatan peluang dan fungsi

distribusi kumulatif normal baku yang dievaluasi pada

.

Misalkan,
(24)
merupakan vektor N1 amatan tak nol
merupakan matriks nilai-nilai
nol

berukuran k

untuk amatan

tak

untuk amatan

N0
merupakan vektor nilai-nilai

0 berukuran 1

N1

N1
merupakan matriks nilai-nilai

0 berukuran k

berukuran 1

untuk amatan

N0

Untuk amatan

0, diketahui bahwa

Untuk amatan

0, diperoleh

(25)
Pada model regresi linear fungsi kemungkinan merupakan fungsi kepekatan
peluang bersama dari peubah respons Y. Karena faktor sisaan merupakan peubah

10

acak yang saling bebas, maka

juga merupakan peubah acak yang saling bebas

sehingga fungsi kemungkinan persamaan (19) adalah
(26)
di mana suku pertama meliputi N0 amatan untuk
untuk

0 dan suku kedua N1 amatan

0 dan log-fungsi kemungkinan adalah
(27)

di mana penjumlahan S o meliputi N0 amatan untuk

0 dan S 1 meliputi N1

amatan untuk
Dengan memaksimumkan log-fungsi kemungkinan dengan menggunakan
turunan pertama log L terhadap ß dan s2 akan diperoleh
(28)
(29)
sehingga solusi persamaan (28) dan persamaan (29) adalah
(30)

(31)
di mana

merupakan penduga

yang diperoleh dari N1 nilai amatan tak nol.

Persamaan (31) menunjukkan hubungan antara penduga kemungkinan maksimum
(ML) dan OLS yang diperoleh dari nilai amatan tak nol.

Model Probit
Jika peubah respons merupakan peubah boneka (dummy variable), regresi
OLS tidak sesuai. Regresi OLS akan menghasilkan ramalan-ramalan yang tidak
tepat, yang dapat bernilai lebih besar dari 1 atau kurang dari 0, selain akan
melanggar asumsi homogenitas karena sifat diskret peubah respons (Salvatore and
Reagle, 2002).
Sebuah pendekatan alternatif untuk mengatasi masalah peubah respons
bersifat dikotomi, disebut model analisis Probit (Golberger, 1964), diasumsikan
bahwa terdapat peubah respons yi yang didefinisikan dengan hubungan regresi

11

(32)
dan

berdistribusi normal baku,

. Dalam prakteknya

tidak

teramati, yang diamati peubah boneka Y yang didefinisikan
(33)
Dalam kasus ini nilai-nilai amatan Y merupakan realisasi dari proses binomial
sehingga fungsi kemungkinan diasumsikan mengikuti distribusi binomial.
Dari (32) dan (33), peluang dari amatan

adalah:

=

(34)

merupakan fungsi distribusi kumulatif (cdf) untuk . Asumsikan

di mana

saling bebas, diperoleh fungsi kemungkinan sebagai berikut

(35)
Notasi

dan

masing-masing merupakan fungsi kepekatan dan fungsi distribusi

kumulatif normal baku, sehingga fungsi kemungkinan model Probit yang
berkaitan dengan persamaan (33) dapat ditulis
(36)
dan log fungsi kemungkinan
(37)
Turunan log L terhadap ß menghasilkan

(38)

Penduga kemungkinan maksimum
persamaan

dapat diperoleh sebagai solusi dari

0. Persamaan tersebut tidak memberikan bentuk tertutup

sehingga akan diselesaikan secara numerik (Maddala, 1983).

12

Penduga dua tahap Heckman (Probit dan OLS)
Pendugaan parameter model Tobit dengan OLS untuk semua amatan atau
hanya amatan positif

akan menghasilkan penduga parameter

yang bias dan

tidak konsisten, sehingga diperlukan alternatif lain. Selain menggunakan metode
kemungkinan maksimum, pendugaan parameter model Tobit dapat dilakukan
dengan dua tahap atau lebih dikenal dengan istilah Heckman’s two step estimator
(Maddala, 1983 dan Amemiya, 1985).
Andaikan model pada persamaan (19) dan amatan positif

diperoleh,
(39)

di mana suku terakhir pada ruas kanan secara umum tak nol. Hal ini menyebabkan
sifat bias penduga OLS menggunakan amatan positif
kenormalan pada

. Karena asumsi

, persamaan (39) dapat ditulis menjadi
(40)
dan

di mana

masing-masing merupakan fungsi kepekatan

peluang dan fungsi distribusi kumulatif normal baku yang dievaluasi
pada

.
Alternatif yang ditemukan Heckman (1976b) pada dasarnya terdiri dari dua

tahap, yaitu pendugaan aspek kualitatif dan kemudian pendugaan aspek kuantitatif
dari model Tobit (Maddala, 1983).
Tahap pertama:
Aspek kualitatif dari model Tobit menggunakan model Probit. Didefinisikan
peubah boneka yaitu:

, dimana

dan

Dengan menggunakan model Probit, diperoleh penduga kemungkinan maksimum
dari

sehingga dengan hasil tersebut diperoleh nilai penduga dari

dan .

Tahap kedua:
Aspek kuantitatif dari model Tobit yang berkaitan dengan amatan positif
(41)
Dengan demikian persamaan (41) dapat ditulis,
(42)

13

di mana
Dengan mengunakan metode kuadrat terkecil (OLS) pada persamaan (42)
akan diperoleh penduga parameter
menggantikan posisi

dan

yang konsisten, di mana

sebagai peubah bebas yang nilainya diperoleh pada tahap

sebelumnya.

Sifat-sifat penduga yang baik
Penduga (estimator) adalah fungsi dari contoh acak yang tidak bergantung
pada parameter, sedangkan dugaan (estimate) adalah nilai dari penduga. Ada
beberapa kriteria yang dapat dipakai untuk mendapatkan penduga yang baik
tersebut di antaranya adalah sifat tak bias, ragam minimum, konsisten, minimum
MSE, konsisten serta sifat asimtotis (Koutsoyiannis, 1973).

1 Tak bias
Bias suatu penduga didefinisikan sebagai selisih antara nilai harapan
penduga dengan nilai parameter yang sebenarnya, atau
(43)
Jadi

dikatakan penduga tak bias dari ß jika nilai harapan dari

nilai ß atau

sebaliknya jika

sama dengan

maka dikatakan penduga tak

bias. Dengan kata lain suatu penduga dikatakan tak bias jika nilai biasnya sama
dengan nol.

2 Ragam minimum
Suatu penduga

dikatakan penduga terbaik apabila ragam dari

mempunyai

nilai minimum dibandingkan dengan ragam dari penduga-penduga tak bias
lainnya, atau
(44)
di mana

adalah penduga lain dari parameter ß.

14

3 Konsisten
Suatu penduga

dikatakan penduga konsisten dari ß jika

peluang ke ß , yaitu plim

= ß. Jadi untuk setiap

konvergen

,
(45)

4 Best Linear Unbiased Estimator (BLUE)
Suatu penduga

dikatakan penduga tak bias linear terbaik jika memenuhi:

a.

merupakan fungsi linear dari amatan sampel

b.

bersifat tak bias atau

c.

, di mana

adalah penduga lain dari parameter ß.

5 Mean Square Error (MSE) Minimum
Kriteria ini juga merupakan kombinasi dari sifat ketakbiasan dan ragam
minimum. Suatu penduga

dikatakan mempunyai MSE minimum jika nilai

harapan kuadrat selisih antara penduga dengan nilai parameter populasinya
mempunyai nilai paling kecil, atau dirumuskan sebagai berikut:

6 Sifat Asimtotis
Sifat ini dimaksudkan untuk melihat perilaku dari distribusi sampling
penduga dalam ukuran sampel yang cukup besar. Distribusi sampling penduga
pada umumnya berubah dengan berubahnya ukuran sampel. Sifat-sifat asimtotis
yang diinginkan dari suatu penduga adalah tak bias asimtotis, konsisten dan
efisien asimtotis, sebagai berikut :
a.

adalah penduga tak bias asimtotis dari ß jika

b. Dapat dibuktikan bahwa syarat cukup agar

merupakan penduga konsisten

bagi ß adalah dipenuhi syarat-syarat berikut:
adalah penduga tak bias asimtotis dari ß
konvergen menuju nol jika

15

c.

merupakan penduga yang efisien asimtotis jika
(48)
di mana

merupakan penduga konsisten yang lain dari .

erupakan penduga yang efisien asimtotis dari

ika memenuhi ketiga

syarat berikut:
i.

mempunyai distribusi asimtotis dengan nilai tengah dan ragam
tertentu

ii.
iii.

konsisten
Tidak ada penduga konsisten lain dari
asimtotis yang lebih kecil dari

.

yang mempunyai ragam

16

METODE PENELITIAN

Sumber Data
Data yang digunakan pada penelitian ini adalah data bangkitan (generated)
dari software statistika, yaitu SAS 9.1 dengan proporsi nilai amatan nol 8%
(16 amatan nol dari 192 amatan contoh) seperti kasus yang diperoleh pada
penelitian sebelumnya, yaitu

proporsi nilai amatan nol pada konsumsi ikan

(Virgantari, 2005).

Tahap Analisis
Tahap analisis meliputi hal-hal berikut:
a. Simulasi/pembangkitan data
Data yang digunakan dalam penelitian ini merupakan data simulasi yang
dibangkitkan dengan software SAS 9.1. Simulasi merupakan suatu proses
membuat desain logika matematika dari suatu sistem real dengan melibatkan
batasan-batasan tertentu untuk memecahkan suatu masalah. Jadi langkah awal
yang dilakukan pada tahap simulasi/pembangkitan data adalah pembentukan
model atau penyusunan model.

Spesifikasi Model
Pada penelitian ini model yang digunakan merupakan hasil dari penelitian
sebelumnya (Virgantari, 2005), yaitu model Almost Ideal Demand System (AIDS)
(49)
dengan

anggaran pengeluaran komoditas ke-i
harga unit komoditas ke-j
total pengeluaran
indeks harga Stone, didefinisikan
parameter model, berturut-turut untuk intersep, pengeluaran
harga dan jumlah anggota rumah tangga

Data yang digunakan dalam penelitian sebelumnya adalah data sekunder
berupa data mentah Survei Sosial Ekonomi Nasional (Susenas) tahun 2002 yang

17

dilakukan oleh Biro Pusat Stastistik (BPS), di mana data yang dipakai adalah nilai
pengeluaran dan konsumsi pangan sumber protein hewani yaitu ikan, daging, dan
telur di wilayah DKI Jakarta. Setelah dianalisis dan diduga parameternya
diperoleh model regresi, khususnya untuk konsumsi ikan yang akan digunakan
untuk pembangkitan data dalam penelitian ini. Model regresi yang dikaji adalah:
(50)
Algoritma pembangkitan data dilakukan dengan langkah sebagai berikut:
1 Diberikan

nilai

parameter
=

dari

penelitian

sebelumnya,

yaitu

(0.0206, -6.37E-7, 0.0867, -0.0869, 0.1277,

0.1316).
2 Menentukan nilai X berdasarkan kombinasi berbagai nilai data asal pada
penelitian sebelumnya yang dapat dilihat pada Tabel 1, sehingga diperoleh 192
kombinasi.
Tabel 1 Nilai peubah penjelas pada data asal
Peubah penjelas

Nilai data asal
0.5; 2.5
2.5; 3.5
2.5; 3.5
-1.1; -0.4; 1.0; 1.7
2.5; 3.5; 4.5; 5.5; 6.5; 7.5

3 Merumuskan fungsi
4 Membangkitkan bilangan acak
5 Menggunakan kombinasi X dan nilai

untuk memperoleh nilai Y dengan

proporsi nilai amatan nol sebanyak 8% (16 amatan).
6 Jika pada iterasi pertama belum diperoleh nilai Y

0 sebanyak 16 amatan

maka iterasi akan terus berlanjut dan proses akan berhenti jika sudah diperoleh
16 amatan nol, sehingga data yang dibangkitkan berukuran 192 sesuai dengan
kombinasi nilai X.
7 Langkah 1-6 dilakukan sebanyak 100 kali dan data bangkitan tersebut dibagi
menjadi

dua sampel, di mana sampel yang pertama digunakan untuk

pendugaan dan sampel kedua untuk validasi.

18

b. Pendugaan parameter
Dari sampel pertama yang diperoleh pada tahap simulasi data, ada 50 nilai
amatan (N = 50) dengan proporsi nilai amatan nol yang dicobakan, dan
selanjutnya dilakukan pendugaan dengan menggunakan metode OLS, WLS dan
penduga dua tahap Heckman. Nilai-nilai dugaan tersebut akan dapat digunakan
untuk mendapatkan gambaran tentang distribusi sampling dari

dan selanjutnya

akan digunakan untuk mendapatkan gambaran tentang bias, ragam dan MSE dari
nilai dugaan yang diperoleh.

c. Evaluasi penduga parameter
Penduga-penduga yang dihasilkan pada tahap sebelumnya dievaluasi
dengan kriteria sifat ketakbiasan, ragam penduga, dan nilai kuadrat tengah galat
(MSE) yang minimum. Sifat-sifat distribusi sampling yang diperiksa adalah nilai
harapan dan ragam yang selanjutnya digunakan untuk menduga bias dan kuadrat
tengah galat sebagai berikut:
Nilai bias dugaan
Nilai bias dari

diperoleh dengan mengurangkan rata-rata dari dugaan yag

diperoleh dengan nilai ß yang sebenarnya,
(51)

Ragam dugaan
Ragam dari distribusi sampling

diduga dengan menggunakan rumus biasa

untuk menduga ragam yaitu:
(52)

Kuadrat tengah galat (MSE)
Nilai MSE dari

diduga berdasarkan rata-rata dari kuadrat selisih antara

penduga dengan nilai sebenarnya yaitu:
(53)

19

d. Validasi model
Validasi dilakukan dengan membandingkan nilai amatan yang dibangkitkan,
Y, dengan nilai dugaan padanannya,

, yang diperoleh dengan menggunakan

dugaan parameter pada tahap pendugaan.
Berdasarkan nilai tersebut kemudian dihitung nilai rata-rata penyimpangan
kuadrat (MSE) dari masing-masing contoh dengan cara:
(54)

dan kemudian nilai tersebut dirata-ratakan dari 50 sampel yang ada. Metode yang
terbaik adalah metode yang memberikan nilai MSE yang paling kecil.

20

Tahap-tahap dari analisis tersebut dapat dilihat pada flowchart dan algoritma
berikut:
Mulai

Perumusan Model

i=0
Simulasi Data
i = i +1

Sampel 1 , ulangan ke – i
Yij , j = 1,2, ..., 192

Sampel 2 , ulangan ke – i
Yij , j = 1,2, ..., 192

Pendugaan parameter

OLS

GLS

Heckman

Nilai dugaan dan validasi
ya

i < 50
tidak

Evaluasi penduga dan validasi
tidak

Metode terbaik
Selesai

Gambar 1 Flowchart dari tahap analisis penelitian.

21

Algoritma:
Langkah 1:

Perumusan model, yaitu :

ß = (0.0206, -6.37E-7, 0.0867, -0.0869, 0.1277, 0.1316)
X ditentukan berdasarkan kombinasi beberapa
yaitu:

nilai data

asal,

0.5; 2.5,
2.5; 3.5,
2.5; 3.5,
-1.1; -0.4; 1; 1.7,
2.5; 3.5; 4.5; 5.5; 6.5; 7.5,

Tetapkan : i

0 (belum dilakukan proses ulangan);

N

50 (banyaknya ulangan);

Proporsi nilai amatan nol 8% (16 amatan)
Langkah 2:

Melakukan simulasi data berdasarkan model pada langkah 1
i = i + 1: simulasi untuk ulangan ke –i
Gunakan kombinasi semua peubah
n

,

,

,

,

nrow(X);
;

;

;

;

;

Pembangkitan data dilakukan sekaligus 2 kali untuk memperoleh
dua sampel. Sampel pertama digunakan untuk pendugaan
parameter dan sampel kedua untuk validasi.
Langkah 3:

Melakukan pendugaan parameter pada sampel pertama dengan
metode OLS, GLS, dua tahap Heckman sehingga untuk masingmasing metode diperoleh

Langkah 4:

Melakukan
pada

validasi

dan

dengan

membandingkan

sampel kedua, Y, dengan

pada langkah 3

nilai

amatan

nilai dugaan padanannya,

22

Langkah 5:

Selama i < 50, proses kembali ke langkah 2 untuk ulangan ke – i,
selain itu proses berhenti

Langkah 6:

Mengevaluasi penduga parameter dari distribusi sampling penduga
yang diperoleh pada langkah 4

Langkah 7: Menentukan metode yang terbaik berdasarkan hasil evaluasi dan
validasi pada langkah 7

23

HASIL DAN PEMBAHASAN

Dalam bab ini disajikan hasil utama dari penelitian, yang terdiri atas bagian
utama, yaitu hasil pendugaan parameter, evaluasi dari masing-masing metode
pendugaan parameter dan bagian berikutnya adalah validasi model regresi yang
digunakan.
Dalam penelitian ini hasil pendugaan parameter, nilai MSE validasi model
disajikan dalam bentuk diagram kotak (boxplot), sedangkan untuk evaluasi nilai
dugaan masing-masing metode dan analisis validasi model menggunakan grafik
garis. Dalam statistik deskriptif, diagram kotak merupakan cara yang tepat untuk
menyajikan kelompok data secara ringkas, menyampaikan informasi tentang
lokasi dan variasi kelompok data. Diagram kotak juga berguna untuk
menampilkan perbedaan antara populasi atau kelompok data, spasi antara bagian
berbeda dari kotak membantu untuk menunjukkan tingkat dispersi/penyebaran
dan kecondongan dalam data.

Hasil Pendugaan Parameter
Pada tahap ini model regresi pada persamaan (50) diduga dengan
menggunakan ketiga metode yaitu OLS, WLS dan dua tahap Heckman.
Pendugaan parameter dilakukan dengan menggunakan data pada sampel pertama,
di mana masing-masing metode menghasilkan 50 nilai dugaan untuk tiap
parameter (Lampiran 3). Nilai-nilai dugaan tersebut akan dapat digunakan untuk
mendapat gambaran tentang distribusi sampling dari

. Hasil statistik deskriptif

pendugaan parameter ketiga metode untuk masing-masing parameter dapat dilihat
pada diagram kotak yang diberikan pada Gambar 2 dan 3.

24

Boxplot Nilai Dugaan Parameter
1.5

49

Nilai dugaan

1.0
0.5
19
46
26
2
41

0.0

46
2
45
41

6

41

-0.5
-1.0
25

0 0 0 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5
b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_ b_
L S L S m an LS LS an LS LS man LS LS an LS LS man LS LS an
O W km
O W km O W k
O W k
O W km O W k
ec
ec
ec
ec
ec
ec
H
H
H
H
H
H

Gambar 2 Diagram kotak dari nilai dugaan untuk keseluruhan parameter pada
tahap pendugaan parameter.
Boxplot b_0
1.5

Boxplot b_1
0.10

49

1.0
0.05
Data

Data

0.5
0.0

0.00

-0.5
-0.05

-1.0
25

OLS

WLS

Heckman

OLS

Boxplot b_2
0.3

Heckman

Boxplot b_3
19

0.1

0.2

0.0
Da