Kajian Model Pada Data Dengan Peubah Respon Mengandung Banyak Nilai Nol (Studi Kasus Permintaan LPG Sektor Rumah Tangga).

KAJIAN MODEL PADA DATA DENGAN PEUBAH RESPON
MENGANDUNG BANYAK NILAI NOL
(STUDI KASUS PERMINTAAN LPG SEKTOR RUMAH TANGGA)

ANDRES PURMALINO

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Model pada Data
dengan Peubah Respon Mengandung Banyak Nilai Nol (Studi Kasus Permintaan
LPG Sektor Rumah Tangga)” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Nopember 2015

Andres Purmalino
G152130354

RINGKASAN
ANDRES PURMALINO. Kajian Model pada Data dengan Peubah Respon
Mengandung Banyak Nilai Nol (Studi Kasus Permintaan LPG Sektor Rumah
Tangga). Dibimbing oleh ASEP SAEFUDDIN dan HARI WIJAYANTO.
Pengamatan peubah respon yang bernilai nol dalam bidang sosial ekonomi
sering dijumpai pada model regresi yang digunakan untuk melihat faktor faktor
yang memengaruhi pengeluaran rumah tangga untuk jenis konsumsi tertentu.
Banyaknya nilai amatan nol pada peubah respon berdampak pada metode kuadrat
terkecil (OLS). Penduga OLS menjadi bias dan tidak konsisten. Salah satu
metode yang digunakan pada data dengan banyaknya nilai amatan nol adalah
model tobit. Pada model tobit, nilai nol menjadi tersensor sehingga data dengan
banyak nilai nol pada peubah respon biasa disebut data tersensor. Namun penduga
Tobit sangat rentan terhadap asumsi kenormalan dan homoskedastisitas.
Pelanggaran terhadap asumsi tersebut membuat penduga Tobit menjadi tidak

konsisten. Metode penduga lain yang digunakan adalah Censored Least Absolute
Deviations (CLAD). Metode ini merupakan alternatif dari inkonsistensi penduga
Tobit yang merupakan perluasan dari pendugaan Least Absolute Deviations
(LAD). Keunggulan dari metode ini adalah merupakan penduga konsisten dan
normal asimtotik pada sejumlah kelas sebaran galat dan juga kekar terhadap
kehadiran heteroskedastisitas.
Tujuan dari penelitian ini adalah untuk memfokuskan kajian penerapan
metode pendugaan OLS, Tobit dan CLAD untuk mendapatkan model terbaik dari
ketiga penduga tersebut pada permintaan LPG sektor rumah tangga di Jawa Barat.
Hasil Survei Sosial Ekonomi Nasional 2013 di Propinsi Jawa Barat
memperlihatkan bahwa sebesar 13 persen rumah tangga daerah perkotaan tidak
mengkonsumsi LPG. Sementara pada masyarakat perdesaan jumlah rumah tangga
yang tidak mengkonsumsi LPG sebesar 39 persen. Penelitian dilakukan untuk
mengidentifikasi faktor-faktor yang memengaruhi permintaan LPG pada sektor
rumah tangga di Jawa Barat yang dibagi menjadi wilayah perkotaan dan
perdesaan.
Hasil simulasi ragam penduga pada jumlah contoh yang berbeda
menunjukkan kecenderungan bahwa OLS memiliki ragam penduga yang lebih
kecil dibandingkan yang lainnya. Namun di lain sisi keberadaan banyaknya nilai
nol pada peubah respon membuat penduga ini menjadi bias dan inkonsisten.

Penduga Tobit sebagai solusi juga tidak memperlihatkan performa ysng lebih
baik dari penduga OLS. Penduga CLAD memperlihatkan performa yang lebih
baik dibanding penduga Tobit dan lebih fleksible terhadap asumsi sehingga
dipakai dalam model permintaan LPG.
Penurunan permintaan LPG pada daerah perdesaan terjadi seiring jauhnya
rumah tangga dari ibukota kabupaten/kota dan juga wilayah kawasan hutan.
Sementara pada daerah perkotaan faktor kategori umur mempunyai pengaruh
terhadap penurunan permintaan LPG. Rumah tangga generasi Y dan Z
mempunyai permintaan LPG yang lebih sedikit dibandingkan generasi
sebelumnya.
Kata Kunci: amatan nol, CLAD, konsisten, OLS, permintaan LPG, Tobit

SUMMARY
ANDRES PURMALINO. A STUDY ON MODELLING DATA OF RESPON
VARIABLE WITH FREQUENT ZERO OBSERVATIONS (CASE STUDY OF
LPG DEMAND ON HOUSEHOLD SECTOR). Supervised by ASEP
SAEFUDDIN and HARI WIJAYANTO.
Frequent zero observations of response variable on socio-economic data is a
common thing in a regression model which are used to explain factors on certain
kind of consumption of household expenditure. Frequent zero observations on

response variable affected Ordinary Least Squares (OLS) estimation. OLS
estimators in this condition are biased and inconsistent. One of methods which is
used on data with frequent zero observations is Tobit model. On Tobit model,
zero observations are censored so that data with frequent zero observations are
commonly named censored data. The problem on Tobit model is that the
estimators are tend to violate normality and homoscedasticity assumptions.
Violation on these assumptions makes the estimators inconsistent. Another
estimator which are proposed in this condition is Censored Least Absolute
Deviations (CLAD) estimator. CLAD estimator is known to be alternative for
inconsistency of tobit estimator, as an expansion of Least Absolute Deviations
(LAD) estimation. This method is favorable as it produces an asymptotic normal
and consistent estimator for wide class of error distributions an also robust on the
presence of heteroscedasticity.
The objective of this research was to study the application of OLS, Tobit
and CLAD methods to obtain best model to estimate the demand of LPG in West
Java. Result of National Socio-Economics Survey (Susenas) 2013 in Province of
West Java described that 13 percent of urban households did not use LPG. While
on rural households, 39 percent of the households did not use LPG. Another
objective of this research was to identify factors that affected LPG consumption
on households in West Java either on urban or rural communities.

The simulation results showed that based on different sample sizes OLS
estimators had tendencies to had lower variances, compared to other estimators.
But on the other side, frequent zero observations made OLS estimators biased and
inconsistent. Tobit estimators as an alternative solution was not resulted good
performance either. CLAD estimators presented better performance and more
flexible on assumption violations, compared to Tobit estimators, as an alternative
and used to model LPG demands.
The modelling results showed that there was a decreasing demand of LPG
on rural communities as household away from the capital of the district / city and
this region of forest area. Meanwhile on urban communities, age categories were
affected the decreasing demand on LPG. Y and Z generations households had
lower demand on LPG compared to previous generation.
Keywords: zero observations, CLAD, consistent, OLS, LPG demand, Tobit

© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan

IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB

KAJIAN MODEL PADA DATA DENGAN PEUBAH RESPON
MENGANDUNG BANYAK NILAI NOL
(STUDI KASUS PERMINTAAN LPG SEKTOR RUMAH TANGGA)
TANGGA)

ANDRES PURMALINO

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015


Penguji Luar Komisi pada Ujian Tesis: Dr. Kusman Sadik, S.Si, M.Si

Judul Tesis : Kajian Model pada Data dengan Peubah Respon Mengandung
Banyak Nilai Nol (Studi Kasus Permintaan LPG Sektor Rumah
Tangga)
Nama
: Andres Purmalino
NIM
: G152130354

Disetujui oleh
Komisi Pembimbing

Prof Dr Ir Asep Saefuddin, MSi
Ketua

Dr Ir Hari Wijayanto, MSi
Anggota


Diketahui oleh

Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana

Dr Ir Indahwati, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian : 04 Nopember 2015

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis ucapkan kehadirat Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga penulis dapat menyelesaikan tesis yang berjudul
“Kajian Model pada Data dengan Peubah Respon Mengandung Banyak Nilai Nol
(Studi Kasus Permintaan LPG Sektor Rumah Tangga)”. Keberhasilan penulisan

tesis ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai pihak.
Terima kasih penulis ucapkan kepada Bapak Prof. Dr. Ir. Asep Saefuddin,
M.Si. sebagai ketua komisi pembimbing dan Bapak Dr. Ir. Hari Wijayanto, M.Si
sebagai anggota komisi pembimbing yang telah memberikan bimbingan, arahan
serta saran kepada penulis. Penulis juga mengucapkan terima kasih kepada
Pimpinan Badan Pusat Statistik (BPS) atas kesempatan yang diberikan kepada
penulis untuk menempuh jenjang Magister Statistika Terapan. Ungkapan terima
kasih terkhusus penulis sampaikan kepada orang tua, istri dan ananda tercinta
serta seluruh keluarga besar atas do’a, dukungan dan pengertiannya. Terima kasih
pula kepada seluruh staf Program Studi Statistika Terapan, teman-teman Statistika
(S2 dan S3) dan Statistika Terapan (S2) khususnya Kelas BPS atas bantuan dan
kebersamaannya. Terima kasih tak lupa penulis sampaikan kepada semua pihak
yang tidak dapat penulis sebutkan satu per satu yang telah membantu dalam
penyusunan tesis ini.
Penulis menyadari bahwa tesis ini masih banyak kekurangan. Semoga
penelitian selanjutnya dapat lebih baik dari penelitian ini. Semoga penelitian ini
bermanfaat bagi yang membutuhkan.

Bogor, Nopember 2015


Andres Purmalino

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Identifikasi Masalah
Tujuan Penelitian
Kegunaan Penelitian


1
1
2
2
3

2 TINJAUAN PUSTAKA
Model Permintaan Energi Rumah Tangga
Analisis Regresi
Metode Kuadrat Terkecil Biasa
Model Tobit
Peubah Tersensor
Regresi Tersensor
Pemeriksaan Asumsi Klasik
Uji Conditional Moment
Censoring Least Absolute Deviations
Konsistensi

4
4
4
5
6
8
9
11
12
13
14

3 METODE PENELITIAN
Data
Metode Analisis

15
15
15

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Identifikasi Multikolinieritas
Koefisien Regresi Penduga
Asumsi Kenormalan dan Homoskedastisitas
Konsistensi Penduga
Pemilihan Model

17
17
20
21
22
23
24

5 SIMPULAN DAN SARAN
Simpulan
Saran

26
26
26

DAFTAR PUSTAKA

27

LAMPIRAN

29

RIWAYAT HIDUP

31

DAFTAR TABEL
3.1 Peubah bebas model permintaan LPG sektor rumah tangga
4.1 Perbandingan bahan bakar utama memasak daerah perkotaan dan
perdesaan di Propinsi Jawa Barat tahun 2013
4.2 Distribusi bahan bakar utama memasak daerah perkotaan dan
perdesaan di Propinsi Jawa Barat tahun 2013
4.3 Statistik deskriptif peubah bebas pada model permintaan LPG
4.4 Nilai Variance Inflation Factor (VIF) peubah bebas penyusun model
permintaan LPG
4.5 Uji asumsi kenormalan dan homoskedastisitas penduga OLS
4.6 Uji asumsi kenormalan dan homoskedastisitas penduga Tobit

15
18
18
19
20
22
22

DAFTAR GAMBAR
2.1 Ilustrasi data dengan banyak nilai nol
2.2 Peubah dan peubah tersensor berdistribusi normal
4.1 Persentase desa perkotaan dan desa perdesaan di Propinsi Jawa Barat
tahun 2011
4.2 Rata rata konsumsi LPG perbulan pada rumah tangga di daerah
perkotaan dan perdesaan
4.3 Perbandingan nilai koefisien antar metode OLS, Tobit dan CLAD
untuk daerah perkotaan
4.4 Perbandingan nilai koefisien antar metode OLS, Tobit dan CLAD
untuk daerah perdesaan
4.5 Ragam penduga OLS, Tobit dan CLAD untuk jumlah contoh 300,
1000, 3000 dan 5000 pada daerah perkotaan
4.6 Ragam penduga OLS, Tobit dan CLAD untuk jumlah contoh 300,
1000, 3000 dan 5000 pada daerah perdesaan

7
8
17
18
21
21
23
24

DAFTAR LAMPIRAN
1 Nilai koefisien dan galat baku penduga OLS, Tobit, dan CLAD pada
model permintaan LPG rumah tangga di daerah perkotaan
2 Nilai koefisien dan galat baku penduga OLS, Tobit, dan CLAD pada
model permintaan LPG rumah tangga di daerah perdesaan

29
30

1

1 PENDAHULUAN
Latar Belakang
Analisis regresi seringkali digunakan oleh peneliti sebagai pisau analisis
dalam model bidang sosial ekonomi. Analisis ini banyak digunakan karena
kemudahan dalam menginterpretasikan model. Analisis regresi berkaitan dengan
studi mengenai ketergantungan satu peubah, yaitu peubah respon, terhadap satu
atau lebih peubah lainnya, yaitu peubah penjelas, dengan tujuan untuk
memperkirakan dan/atau memprediksi nilai rata-rata (populasi) peubah respon
dari nilai yang diketahui atau nilai tetap pada peubah penjelas dalam pengambilan
contoh yang berulang (Gujarati 2003).
Pengamatan peubah respon bernilai nol pada model regresi dalam bidang
sosial ekonomi sering dijumpai pada model yang digunakan untuk
mengidentifikasi faktor-faktor yang memengaruhi pengeluaran rumah tangga
untuk jenis konsumsi tertentu. Hal tersebut disebabkan oleh adanya rumah tangga
yang tidak mengkonsumsi jenis barang dan jasa tertentu (zero consumption),
sedangkan rumah tangga lain mengkonsumsi dalam jumlah yang bervariasi. Dey
(2000) menyebutkan bahwa beberapa faktor yang memengaruhi fenomena zero
consumption diantaranya adalah adanya variasi pada pilihan konsumen/rumah
tangga, harga komoditas yang relatif tinggi, anggaran yang terbatas, dan kesalahan
dalam pelaporan.
Banyaknya nilai amatan nol pada peubah respon berdampak pada tidak
terpenuhinya asumsi linier pada model yang telah ditentukan sebelumnya.
Penggunaan metode kuadrat terkecil atau ordinary least square (OLS) menjadi
tidak tepat (Amemiya 1984). Membuang amatan nol dalam analisis dapat
membuang informasi yang ada dan tidak mencerminkan keadaan yang
sebenarnya. Salah satu metode yang digunakan pada data dengan banyaknya nilai
amatan nol adalah model tobit yang dikembangkan oleh Tobin (1958).
Pada model tobit, nilai nol menjadi tersensor sehingga data dengan banyak
nilai nol pada peubah respon biasa disebut data tersensor. Beberapa penelitian
tentang pemakaian model tobit telah dilakukan. Virgantary (2005)
membandingkan antara OLS dan model tobit pada data pengeluaran konsumsi
daging, telur dan ikan, baik dengan mengikutkan nilai nol dan tidak mengikutkan
nilai nol dan hasilnya menunjukkan bahwa penggunaan OLS memberikan hasil
estimasi yang lebih baik dibandingkan model tobit.
Penduga maximum likelihood pada regresi tersensor biasa disebut penduga
Tobit. Penduga Tobit merupakan penduga yang konsisten dan asimtotik normal.
Namun penduga Tobit sangat rentan terhadap asumsi kenormalan dan
homoskedastisitas. Pelanggaran terhadap asumsi tersebut membuat penduga Tobit
menjadi inkonsisten (Greene 2003).
Metode lain yang digunakan adalah Censored Least Absolute Deviations
(CLAD). Metode ini merupakan alternatif dari inkonsistensi penduga Tobit yang
dikembangkan oleh Powell (1984). Metode ini merupakan perluasan dari
pendugaan Least Absolute Deviations (LAD) pada model regresi linier.
Keunggulan dari metode ini adalah merupakan penduga konsisten dan normal

2

asimtotik pada sejumlah kelas sebaran galat dan juga kekar terhadap kehadiran
heteroskedastisitas.
Konsistensi merupakan salah satu sifat yang diharapkan pada penduga
seiring pertambahan jumlah contoh yang semakin besar. Sering terjadi bahwa
sebuah penduga tidak memenuhi satu atau lebih sifat statistik yang diinginkan
dalam contoh kecil. Akan tetapi, seiring peningkatan ukuran contoh secara tidak
terbatas, penduga dapat memenuhi beberapa sifat statistik yang diharapkan.
Sebuah penduga dikatakan konsisten jika ragam penduga menjadi semakin kecil
menuju nol seiring dengan pertambahan jumlah contoh.
Sebagai studi kasus dalam penelitian ini adalah permintaan LPG pada sektor
rumah tangga di Propinsi Jawa Barat. Sebagaimana diketahui bahwa program
konversi minyak tanah bersubsidi ke LPG 3 kg sudah selesai dilaksanakan.
Namun dalam hasil Survei Sosial Ekonomi Nasional tahun 2013 masih banyak
ditemukan rumah tangga yang tidak mengkonsumsi LPG. Pada saat survei
dijalankan ke rumah tangga, dan menanyakan seberapa besar pengeluaran
konsumsi LPG pada rumah tangga tersebut selama sebulan terakhir, maka isian
untuk beberapa rumah tangga bernilai nol, sementara sebagian rumah tangga yang
lain mempunyai nilai konsumsi yang bervariasi. Padahal berdasarkan hasil
PODES 2011 sebanyak 93.8 persen desa sudah terdapat pangkalan/agen/penjual
LPG (termasuk yang dijual di warung, toko, supermarket, pangkalan termasuk
penjual keliling).
Penelitian tentang analisis perilaku penggunaan LPG pada rumah tangga
telah dilakukan oleh Pranadji et. al. (2010) dengan mengambil Kota Bogor
sebagai lokus penelitian. Hasilnya umur istri dan pendapatan perkapita keluarga
memengaruhi frekuensi penggunaan LPG pada rumah tangga di Kota Bogor.
Tersedianya data pengeluaran konsumsi LPG pada sektor rumah tangga dari hasil
survei memungkinkan untuk dilakukan pemodelan terhadap faktor-faktor yang
memengaruhi permintaan LPG untuk skala yang lebih luas.

Identifikasi Masalah
Berdasarkan latar belakang yang telah dijelaskan sebelumnya, maka
masalah yang dibahas dalam penelitian ini adalah :
1. Bagaimana mengatasi banyaknya amatan nol pada peubah respon dalam
pembuatan model regresi.
2. Faktor-faktor apakah yang mempengaruhi permintaan LPG sektor rumah
tangga pada daerah perkotaan dan daerah perdesaan di Propinsi Jawa
Barat.

Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Memfokuskan kajian penerapan metode pendugaan OLS, Tobit dan
CLAD terhadap data dengan banyak nilai nol pada peubah respon .

3

2. Mengidentifikasi faktor-faktor yang memengaruhi permintaan LPG sektor
rumah tangga di Jawa Barat yang dibagi menjadi wilayah perkotaan dan
perdesaan berdasarkan model yang terbaik dari ketiga penduga tersebut.

Kegunaan Penelitian
Manfaat yang didapat dari penelitian ini adalah memperoleh penduga yang
dapat mengatasi data dengan banyak amatan peubah respon bernilai nol. Sehingga
dapat dipergunakan untuk struktur data yang sama pada penelitian lainnya. Selain
itu, model terbaik yang dihasilkan dalam penelitian ini juga berguna untuk
melakukan kajian terhadap faktor-faktor yang memengaruhi permintaan LPG
sektor rumah tangga sehingga dapat diketahui permasalahan dalam permintaan
LPG yang belum secara menyeluruh digunakan oleh rumah tangga baik pada
daerah perdesaan maupun daerah perkotaan.

4

2

TINJAUAN PUSTAKA

Model Permintaan Energi Rumah Tangga
Teori permintaan konsumen bermula dari teori perilaku konsumen. Perilaku
konsumen adalah ilmu tentang bagaimana individu, kelompok, dan organisasi
memilih, membeli, menggunakan dan menentukan akan barang-barang, jasa,
untuk memenuhi kebutuhan dan keinginannya. Menurut Kotler dan Keller (2012)
menyatakan bahwa faktor faktor yang berpengaruh dalam perilaku konsumen
diantaranya adalah faktor budaya, faktor sosial dan faktor pribadi.
Faktor budaya dibagi kedalam budaya, sub-budaya, dan kelas sosial. Budaya
merupakan penyebab paling mendasar dari keinginan dan perilaku seseorang
karena budaya tumbuh dalam suatu masyarakat sejak kecil. Sub-budaya adalah
sekelompok orang yang mempunyai sistem nilai sama berdasarkan kebangsaan,
kelompok ras dan wilayah geografi. Kelas sosial merupakan anggota masyarakat
yang mempunyai nilai-nilai, minat, dan tingkah laku yang serupa. Kelas sosial
menentukan pemilihan produk dan merek tertentu dalam bidang-bidang seperti
pakaian, peralatan rumah tangga dan sebagainya.
Pada faktor sosial, tingkah laku konsumen dipengaruhi oleh kelompok
acuan, keluarga, serta peran dan status dari konsumen. Keputusan pembelian juga
dapat dipengaruhi oleh karakterisitik pribadi diantaranya usia dan tahap siklus
hidup, pekerjaan, keadaan ekonomi dan juga gaya hidup.
Model permintaan energi rumah tangga bermanfaat untuk menganalisis
masalah masalah yang relevan dalam memahami dan mengelola permintaan
energi. Model dalam penelitian ini merupakan model regresi linier berganda
dengan persamaan sebagai berikut :

Dengan Y adalah konsumsi jenis energi rumah tangga dalam sebulan. X1 hingga Xp
merupakan faktor-faktor yang dianggap dapat memengaruhi permintaan energi
rumah tangga meliputi faktor budaya, faktor sosial, faktor pribadi dan faktor
lainnya yang dianggap dapat memengaruhi permintaan energi rumah tangga. β
merupakan parameter yang telah ditetapkan atau dikenal sebagai koefisien regresi
dan merupakan galat dalam model.

Analisis Regresi
Banyak penelitian menggunakan analisis regresi sebagai salah satu pisau
analisis. Analisis regresi berkenaan dengan studi ketergantungan dari satu peubah
yang disebut peubah respon pada satu atau lebih peubah penjelas, dengan tujuan
untuk memperkirakan dan atau meramalkan nilai rata rata dari peubah respon
apabila nilai peubah penjelas diketahui. Pada prinsipnya ada dua tujuan utama
dalam analisis regresi, yaitu :
1. Untuk memperkirakan/memprediksi nilai rata-rata pada peubah respon (Y)

5

2. Untuk mengidentifikasi peubah penjelas (X) yang memberikan pengaruh
yang nyata terhadap peubah respon (Y)
Ilustrasi dari model regresi linier adalah persamaan antara satu peubah
respon (Y) dengan satu atau lebih peubah penjelas (X1, X2, X3, …, Xp). Hubungan
antara peubah-peubah tersebut dapat dirumuskan dalam bentuk persamaan :
,
dapat atau biasa ditulis dalam bentuk notasi matriks sebagai
dengan X adalah matriks peubah penjelas berukuran n × k, Y adalah vektor peubah
respon berukuran n × 1, adalah vektor parameter berukuran k × 1, adalah
vektor galat berukuran n × 1 (n adalah banyaknya amatan dan k = p + 1 adalah
banyaknya parameter). Dengan asumsi bahwa galat merupakan peubah acak
bebas berdistribusi normal, dengan nilai rata-rata nol dan ragam konstan, N(0,σ2).
Pada kenyataannya nilai-nilai β tersebut jarang sekali bisa kita peroleh karena
besarnya jumlah populasi. Yang kita lakukan adalah melakukan pendugaan
melalui hasil contoh dari populasi, dengan fungsi regresi dari contoh adalah
̂

̂

dengan ̂ merupakan vektor penduga parameter dari dan ̂ merupakan sisaan
yang secara konseptual dapat diartikan sebagai penduga dari .
Seiring dengan perkembagan tehnologi komputasi, metode pendugaan untuk
mencari parameter dalam analisis regresi juga semakin berkembang. Secara garis
besarnya ada tiga pendekatan yang dapat dilakukan untuk mendapatkan penduga
parameter, yakni dengan pendekatan parametrik, nonparametrik dan
semiparametrik. Pendekatan parametrik mengasumsikan bahwa model memiliki
bentuk fungsi tertentu baik linier maupun non linier dengan parameter yang telah
ditentukan, sementara pada pendekatan nonparametrik, model tidak mengacu ke
suatu fungsi tertentu, sehingga parameter dalam fungsi tersebut belum dapat
ditentukan tergantung pada data yang diperoleh. Selain itu pada metode
parametrik, sebuah parameter diasumsikan memiliki sebaran peluang tertentu,
sementara metode non parametrik tidak mendasarkan pada sebaran tertentu.
Meskipun mempunyai performa statistik yang lebih kuat, namun metode
parametrik mensyaratkan sejumlah asumsi yang harus dipenuhi.
Bentuk pendekatan yang ketiga adalah semiparametrik yang merupakan
kombinasi dari kedua bentuk sebelumnya. Metode semiparametrik biasanya
memiliki sebuah model yang telah ditetapkan dimana dalam model terdapat dua
komponen parameter, yaitu parametrik dan non parametrik. Komponen parametrik
mengasumsikan bahwa parameter mengikuti sebaran tertentu, sementara
komponen parameter yang lain tidak mempunyai sebaran.

Metode Kuadrat Terkecil Biasa
Metode kuadrat terkecil biasa atau Ordinary Least Square (OLS) merupakan
salah satu metode yang digunakan dalam melakukan pendugaan parameter dalam

6

model regresi linier dengan cara meminimumkan kuadrat sisaan pada contoh yang
terambil. Dengan bahasa matematik, dapat dinyatakan sebagai berikut :
∑̂

̂

∑(

̂

̂

̂

)

Penduga ini menghasilkan koefisien penduga parameter sebagai berikut :
̂

Metode kuadrat terkecil merupakan metode pendugaan yang paling populer
dan sering dipakai pada analisis regresi karena relatif lebih mudah dipahami
dibanding penduga lainnya. Penduga pada metode OLS merupakan penduga
terbaik, linier dan tidak bias / best linear unbiased estimator (BLUE) apabila
asumsi sisaan dari dari model dapat terpenuhi dengan baik. Sebuah penduga ̂
dikatakan penduga terbaik, linier dan tidak bias dari β, jika memiliki sifat-sifat
sebagai berikut :
1. Bersifat linier, dimana merupakan fungsi linier dari sebuah peubah
acak, seperti peubah Ydalam sebuah model regresi.
2. Bersifat tidak bias, dimana nilai rata-rata atau nilai harapan dari
penduga, E( ̂ ), sama dengan nilai sebenarnya, β.
3. Memiliki ragam minimum dari semua kelompok penduga-penduga
yang linier dan tidak bias, sebuah penduga tidak bias dengan ragam
terkecil dikenal sebagai penduga yang efisien.
Ragam peragam dari ̂ diperoleh dari diagonal matriks pada formula berikut :
var-cov ( ̂ ) =

dengan bentuk matriks adalah

̂

( ̂ ) =| ̂ ̂

|

̂ ̂

̂ ̂
̂

̂ ̂

̂ ̂

̂ ̂
̂

|
|

dengan
adalah ragam dari dan
adalah matriks kebalikan dari
∑̂ ⁄
Penduga tidak bias dari
dinyatakan dengan ̂
.

.

Model Tobit
Model Tobit pertama kali dikemukakan oleh James Tobin pada 1958 ketika
ia menganalisa pengeluaran rumah tangga di Amerika Serikat untuk membeli
barang tahan lama menggunakan model regresi yang memperlihatkan kenyataan
bahwa pengeluaran barang tahan lama sebagai peubah respon tidak bernilai

7

negatif. Tobin sendiri menyebut modelnya sebagai model limited dependent
variable. Goldberger (1964) menciptakan ungkapan baru model tersebut dengan
memberi nama model tobit, karena kemiripannya dengan model probit.
Karakteristik yang terpenting dari data pada model Tobit adalah bahwa
terdapat amatan dimana peubah respon mengandung banyak nilai nol. Gambar 2.1
memperlihatkan bahwa banyaknya nilai nol membuat asumsi linieritas menjadi
tidak terpenuhi sehingga metode kuadrat terkecil menjadi tidak tepat. Keberadaan
nilai nol juga membuat tidak bisa digunakannya sebaran kontinu untuk
menjelaskan sebaran bersyarat dari peubah respon pada peubah bebas tertentu,
karena sebaran kontinu menjadi tidak konsisten dengan keberadaan nilai amatan
nol. Oleh karena itu model Tobit digunakan untuk mengatasi hal tersebut.
9
8
7
6
5

Y
4
3
2
1
0
0

1

2

3

4

5

6

X

Gambar 2.1. Ilustrasi data dengan banyak nilai nol
Model tobit ditujukan untuk model regresi tersensor atau model regresi
terpotong, dimana data peubah respon dibatasi pada interval tertentu. Regresi
tersensor terjadi ketika nilai-nilai dari peubah respon kontinu tidak mewakili
seluruh contoh yang ada, namun semua informasi untuk nilai-nilai peubah bebas
pada contoh tersedia. Sementara regresi terpotong terjadi ketika beberapa data
peubah respon dan peubah bebas tidak didapat atau hilang.
Regresi tersensor dan regresi terpotong telah banyak digunakan oleh
berbagai disiplin ilmu. Beberapa penelitian terdahulu telah banyak yang
menggunakan model tobit untuk analisis disebabkan peubah respon yang
mempunyai nilai pada interval tertentu. Beberapa penelitian mengenai model
regresi tersensor terangkum dalam Greene (2003) antara lain penelitian tentang
sejumlah faktor yang memengaruhi hubungan diluar perkawinan yang dilakukan
oleh Fair tahun 1997, faktor yang memengaruhi jam kerja wanita pada kelompok
angkatan kerja yang dilakukan oleh Quester dan Greene tahun 1982, faktor-faktor
yang memengaruhi residivis ditangkap kembali setelah keluar dari penjara oleh
Witte tahun 1980, beberapa faktor yang memengaruhi pengeluaran sejumlah
kelompok komoditi rumah tangga dan pengeluaran rekreasi yang dilakukan oleh
Jarque tahun 1987 dan Melenberg dan Van Soest tahun 1996.

8

Peubah Tersensor
Sebuah peubah dikatakan tersensor, jika distribusi yang digunakan pada
peubah tersebut adalah campuran antara sebaran diskrit dan sebaran kontinu.
Joreskog (2002) memberikan ilustrasi dan penjelasan untuk fungsi dari peubah
tersensor (y) sebagai berikut :
Misalkan y* adalah peubah yang berdistribusi normal dengan nilai tengah µ dan
ragam σ2. Amatan peubah tersensor (y) dengan titik sensor pada batas bawah c
sehingga,
y = c jika y* ≤ c
y = y* jika y* > c
dengan c adalah sebuah konstanta. Ilustrasi disajikan pada gambar 2.2.

Gambar 2.2 Peubah (y*) dan peubah tersensor (y) berdistribusi normal
Peubah laten y* dapat bernilai lebih kecil dari c atau bernilai c, tetapi jika nilai
yang muncul lebih kecil dari c, maka nilai yang teramati adalah c, sehingga
sebaran yang digunakan pada amatan peubah y ketika y=c adalah
Sedangkan sebaran pada amatan y>0 adalah sebaran dari y*, yaitu N (µ,σ2)
sehingga fungsi kepekatan peluang dari y adalah sebagai berikut :
[



]

dengan =0 jika y=c dan =1, untuk y>0. Simbol
adalah fungsi
kepekatan dan kumulatif dari sebaran normal baku. Rata-rata dan ragam dari
peubah tersensor (y) adalah
(1)
(2)
dimana,
(3)
(4)

9

(5)

(6)
Konsekuensi dari persamaan (2) dan (3) adalah bahwa rata-rata dan ragam
contoh dari peubah y adalah tidak konsisten untuk mengestimasi dan .

Regresi Tersensor
Model regresi tersensor dibentuk dengan mengasumsikan ada hubungan
linier antara peubah respon dengan peubah bebas yang dinyatakan dengan
persamaan.
,
~ N(0,σ2)
{

di mana:
: peubah respon laten
: peubah respon yang teramati
X : peubah bebas
β : koefisien vektor yang berukuran kx1 yang tidak diketahui, k adalah banyaknya
parameter
: galat model yang mengikuti sebaran normal, N (0,σ2 )
Pada model tobit standar dengan peubah respon mengandung banyak nilai nol,
titik sensor c=0, fungsi kepekatan peluang dari yi adalah sebagai berikut :



dimana di=1 jika y>0 dan di=0 jika y=0,
dan
merupakan fungsi
kepekatan dan fungsi sebaran dari distribusi normal baku.
Pendugaan parameter regresi tersensor secara terperinci menggunakan metode
Maximum Likelihood Estimation yang disebut sebagai penduga Tobit. Penjelasan
terperinci metode ini dijelaskan oleh Maddala (1983). Fungsi log likelihood
adalah :
∑{

(

)

(

)}

10

Pendugaan parameter didapat dari turunan pertama fungsi log-likelihood yang
menghasilkan sebuah persamaan :

̂

̂

dengan

(

)

,

adalah vektor berukuran 1xni pada pengamatan yi yang lebih
besar dari nol
) adalah matriks berukuran kxn1 bagi nilai xi untuk yi yang
lebih besar dari nol
adalah matriks berukuran kxn1 bagi nilai xi untuk yi sama
dengan nol
(
nol

) adalah vektor 1xn0 bagi nilai

untuk nilai yi sama dengan

Proses metode iterasi yang digunakan adalah metode Newton-Raphson
karena fungsinya yang non linier. Sementara ragam peragam penduga diperoleh
menggunakan fungsi turunan kedua dari fungsi log likelihood yang disebut
matriks hessian. Matriks ragam peragam dari penduga Tobit merupakan kebalikan
(invers) dari matriks hessian. Solusi dari penduga tobit merupakan solusi global
maksimum. Selain itu penduga tobit telah dibuktikan oleh Amemiya (1985)
merupakan penduga yang konsisten dan asimtotik normal.
Nilai harapan dari peubah tersensor pada model tobit dapat dijelaskan
sebagai berikut :
Dengan y* ~ N(

) dan nilai c =0, maka nilai ekspektasinya adalah:

(

)
(

)

Secara umum pendugaan parameter menggunakan OLS akan menjadi bias karena
nilai harapan tidak sama dengan Xβ. Selain itu OLS juga tidak konsisten karena
sebaran kontinu pada peubah respon menjadi tidak konsisten dengan keberadaan
nilai amatan nol. Greene (dalam Amemiya 1984) menunjukkan inkonsistensi
penduga OLS sebagai berikut :

11

̂

Persamaan tersebut memperlihatkan bahwa semakin besar jumlah contoh menuju
tak hingga, penduga OLS tidak menghasilkan nilai parameter sebenarnya ( .

Pemeriksaan Asumsi Klasik
Untuk mendapatkan penduga parameter dalam menghasilkan model regresi
terbaik pada metode OLS, perlu dilakukan pengujian asumsi asumsi klasik. Pada
kasus model dengan peubah respon terbatas, permasalahan yang sering dijumpai
adalah ketaknormalan dan heteroskedastisitas dan juga multikolinieritas apabila
peubah bebas lebih dari satu. Berikut penjabaran dari asumsi-asumsi yang harus
dipenuhi tersebut:
1. Asumsi Kenormalan
Uji normalitas Jarque-Bera (JB) adalah sebuah asimtotik atau pengujian
dengan contoh berukuran besar. Hal ini didasarkan pada sisaan pada
metode OLS. Pengujian ini diawali demgan menghitung kemiringan (S)
dan kurtosis (C) yang mengukur sisaan pada metode OLS dengan
menggunakan uji statistik :

dimana n adalah banyaknya jumlah amatan atau ukuran contoh, S adalah
koefisien kemiringan dan , C adalah koefisien kurtosis yang diperoleh
melalui formula

̅
̂
̂

̂
̂







̅



̅

̅
Jarque dan Bera menunjukkan bahwa uji statistik JB mengikuti distribusi
chi-square dengan derajat bebas 2 secara asimtotik (dalam contoh
berukuran besar). Hipotesis yang digunakan pada pengujian kenormalan
adalah:
H0: Sisaan menyebar normal
H1: Sisaan tidak menyebar normal
Kriteria uji: H0 ditolak jika nilai JB >
.
2. Asumsi Homoskedastisitas
Homoskedastistas merupakan sebuah kondisi dimana ragam dari sisaan
sama atau homogen untuk seluruh amatan. Kebalikannya adalah
heteroskedastisitas, dimana ragam dari sisaan berbeda untuk amatan yang
berbeda. Salah satu cara untuk mendeteksi ada atau tidaknya masalah

12

heteroskedastisitas adalah dengan menggunakan uji white. Pengujian ini
dilakukan dengan meregresikan sisaan kuadrat dengan peubah bebas dan
peubah bebas yang dikuadratkan, kemudian nilai koefisien determinasi
(R2) dikalikan dengan jumlah amatan untuk mendapatkan nilai
.
Hipotesis yang digunakan adalah :
H0 :
(Ragam sisaan sama)
H1 :
(Ragam sisaan berbeda)
Jika nilai
maka keputusannya adalah menolak
hipotesis nol.
3. Asumsi Multikolinieritas
Masalah multikolinieritas akan menyebabkan model regresi yang
dihasilkan tidak tepat karena menyebabkan galat baku menjadi besar
sekali. Selain itu apabila terjadi multikoloniearitas sempurna,
mengakibatkan penduga yang dihasilkan tidak lagi unik. Pengecekan
keberadaan masalah multikolinieritas dilakukan dengan membuat model
regresi yang melibatkan seluruh peubah bebas dan kemudian dilihat nilai
Variance Inflation Factor (VIF) yang muncul. Berikut formula dari VIF
tersebut

R2i adalah koefisien determinasi dari persamaan regresi antara Xi dengan
seluruh peubah bebas lain dalam model. Jika ada peubah yang memiliki
nilai VIF di atas 5 maka dapat disimpulkan bahwa terjadi masalah
multikolinieritas.

Uji Conditional Moment
Uji asumsi pada regresi tersensor ini berbeda dengan uji pada model
regresi linier klasik dikarenakan terjadi kesalahan spesifikasi pada model yang
dibangun dengan menghasilkan sisaan yang berbeda pada peubah respon yang
tidak teramati. Sehingga pengujian yang biasa dilakukan pada regresi linier klasik
tidak bisa dilakukan pada regresi tersensor. Secara umum sisaan yang dihasilkan
pada model tobit untuk regresi tersensor adalah sebagai berikut :

,
dan
merupakan fungsi
kepekatan dan fungsi kumulatif dari distribusi normal baku.
Salah satu pendekatan yang digunakan dalam menguji hasil sisaan pada
model tobit adalah dengan uji conditional moment (cameron dan trivedi 2005). Uji
statistik conditional moment dilakukan untuk meguji apakah galat pada model
tobit homoskedastisitas dan normal. Berikut statistik uji conditional moment
(Greene 2003)
̂ ̂ ̂

̂ ̂( ̂ ̂)

̂ ̂

̂

13

dimana adalah (Nx1) vektor satu, ̂ adalah (Nxr) matriks dari momen contoh
sebagai kendala, ̂ adalah matriks gradien/score (Nxk) pada fungsi log likelihood.
Salah satu keuntungan dari adalah dapat mudah dihitung melalui regresi
artificial tanpa konstanta:
̂
̂
dengan =N-JKG = N x R2 , N adalah jumlah amatan, JKG adalah jumlah kuadrat
galat dan R2 adalah koefisien determinasi. Hipotesis yang digunakan pada
pengujian kenormalan adalah:
H0: Sisaan menyebar normal (E[(ui)3] = 0 dan (E[(ui)4-3σ4] = 0)
Kriteria uji: H0 ditolak jika nilai >
.
Sedangkan hipotesis yang digunakan pada pengujian homoskedastisitas adalah :
H0: Ragam sisaan sama (E{zi[ui2-σ2]} =0)
Kriteria uji H0 ditolak jika nilai >
, dengan p adalah banyaknya peubah
bebas.

Censoring Least Absolute Deviations
Powell (1984) memperkenalkan penduga Censored Least Absolute
Deviations (CLAD) sebagai alternatif dari tidak terpenuhinya asumsi normalitas
dan homoskedastisitas model tobit. Penduga CLAD merupakan penduga yang
konsisten dan asimtotik normal yang didefinisikan sebagai berikut :


∑|

|

Asumsi yang penting sehingga CLAD merupakan penduga yang konsisten
adalah | mempunyai median nol. Sehingga penduga CLAD memiliki kelebihan
yaitu galat tidak harus berdistribusi normal dan homoskedastisitas. Penduga
CLAD merupakan penduga yang memodifikasi metode Least Absolute Deviations
(LAD). Metode LAD mengestimasi koefisien regresi dengan meminimalisasi
jumlah absolute residuals. Bunchinsky (dalam Jolliffe et. al. 2001)
memperkenalkan tehnik iterative (ILPA) untuk mengestimasi model CLAD.
Berikut tahapan prosedure ringkasan pendugaan CLAD:
1. Melakukan pendugaan LAD dengan contoh yang ada kemudian hitunglah
nilai prediksi y pada masing masing amatan.
2. Selanjutnya, contoh dipangkas,yaitu pengamatan dengan prediksi yi