III. METODE PENELITIAN
3.1. Jenis dan Sumber Data
Jenis data yang digunakan dalam penelitian ini adalah data sekunder. Data yang diperlukan meliputi: angka meleh huruf, kepadatan penduduk, tingkat
ketergantungan, pendapatan perkapita, laju pertumbuhan ekonomi DKI Jakarta, PDRB sektor industri, PDRB sektor jasa, tenaga kerja sektor industri, enaga kerja
sektor jasa. Sumber data diperoleh dari Badan Pusat Statistik BPS dan publikasi dari
beberapa penelitian terdahulu. Periode analisis pada penelitian ini adalah tahun 2002 sampai dengan tahun 2009.
3.2. Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah analisis deskriptif dan analisis panel data. Analisis deskriptif digunakan untuk
memberikan gambaran umum tentang keadaan kemiskinan di DKI Jakarta. Sedangkan analisis panel data digunakan untuk menganalisis faktor-faktor yang
mempengaruhi kemiskinan di DKI Jakarta. Pengolahan data dilakukan dengan bantuan perangkat lunak Microsoft Excel dan E-Views 6.
3.2.1. Analisis Panel Data
Data panel adalah data yang memiliki dimensi ruang individu dan waktu. Dalam data panel, jika setiap unit cross section memiliki jumlah observasi time
series yang sama, maka disebut sebagai balanced panel. Sebaliknya, jika observasi berbeda untuk setiap unit cross section maka disebut unbalanced panel.
Penggabungan data cross section dan time series dalam studi data panel digunakan untuk mengatasi kelemahan dan menjawab pertanyaan yang tidak bisa
dijawab oleh model cross section dan time series murni. Secara umum, keunggulan dari penggunaan data panel dalam analisis
ekonometrik antara lain: 1.
Mampu mengontrol heterogenitas individu 2.
Memeberikan informasi yang lebih banyak dan beragam, meminimalkan masalah kolinearitas, meningkatkan jumlah derajat bebas dan lebih efisien.
3. Data panel umumnya lebih baik jika digunakan dalam studi dynamics of
adjustment. 4.
Data panel lebih baik dalam mengukur dan mengidentifikasi efek yang tidak dapat dideteksi apabila menggunakan data cross section dan time
series murni. 5.
Data panel dapat digunakan untuk mengkonstruksi dan menguji model perilaku yang lebih kompleks dibandingkan data cros section atau time
series murni Kendati demikian, analisis panel data juga memiliki beberapa kelemahan
dan keterbatasan dalam penggunaannya khususnya apabila data panel dikumpulkan atau diperoleh dengan metode survei. Permasalahan tersebut antara
lain: 1.
Relatif besarnya data panel karena melibatkan komponen cross section dan time series menimbulkan masalah desain survei panel, pengumpulan
dan manajemen data masalah yang umumnya dihadapi diantaranya:
coverage, nonresponse, kemampuan daya ingat responden, frekuensi dan waktu wawancara
2. Distorsi kesalahan pengamatan measurement error yang umumnya
terjadi karena kegagalan respon contoh: pertanyaan yang tidak jelas dan ketidaktepatan informasi
3. Masalah selektivitas, yakni: selfselectivity, nonrespond, attrition jumlah
responden yang terus berkurang pada survey lanjutan 4.
Cross section dependence contoh: apabila macro panel data dengan unit analisis negara atau wilayah dengan deret waktu yang panjang
mengabaikan cross-country dependence maka dapat mengakibatkan kesimpuln yang tidak tepat
Model umum regresi panel data dapat diformulasikan sebagai berikut: y
it
= α + β
it
+ u
it
……………………………………………….3.1 dimana u
it
~ HD0, σ
2
dan i = 1, 2, 3, …, N adalah jumlah observasi antar individu sementara t = 1, 2, 3, …, T adalah observasi runtut waktu. Dalam persamaan
tersebut, intersep α dan slope β diasumsikan homogenus antara seluruh N
individu dan T runtut waktu. Namun kondisi ini tidak selamanya sesuai dengan kerangka ekonomi yang dianalisis. Ketidaksesuaian ini dimungkinkan atas dua
kemungkinan, yaitu: 1.
Suatu kondisi dimana intersep dalam model bersifat heterogen α
i
≠α
j
sementara slopenya homogen β
i
= β
j
2. Suatu kondisi dimana intersep dalam model bersifat heterogen
α
i
≠α
j
demikian pula dengan slopenya β
i
≠β
j
Dari kedua hal tersebut diatas, model estimasi data panel dapat diekspresikan dalam sejumlah bentuk. Jadi terdapat empat macam model estimasi
data panel yang dapat digunakan: 1.
Apabila diasumsikan bahwa intersep bervariasi antar individu sementara slope bersifat konstan, maka persamaan akan menjadi:
y
it
= α
i
+ βX
it
+ u
it
……..………………………………3.2 2.
Apabila diasumsikan bahwa intersep bervariasi antar individu dan antar waktu sementara slope bersifat konstan, maka persamaan akan menjadi:
y
it
= α
it
+ βX
it
+ u
it
……….……………………………3.3 3.
Apabila diasumsikan bahwa intersep dan slope bervariasi antar individu tetapi konstan antar waktu, maka persamaan akan menjadi:
y
it
= α
i
+ β
i
X
it
+ u
it
……..………………………………3.4 4.
Apabila diasumsikan bahwa intersep dan slope bervariasi antar individu dan antar waktu, maka persamaan akan menjadi:
y
it
= α
it
+ β
it
X
it
+ u
it
……………………………...……3.5 Berdasarkan keempat model tersebut, koefisien
α dan β diasumsikan tertentu. Klasifikasi lainnya adalah ketika diasumsikan bahwa parameter-
parameter ini random generating dan disebut sebagai random coefficient models. Selain itu, dari keempat model diatas, jika asumsi homogenitas baik pada
intersep maupun pada slope ditolak, maka heterogenitas antar individu akan tercermin pada salah satu atau lebih persamaan. Tujuan dari penentuan model
yang sesuai adalah untuk menghilangkan bias dari variabel-variabel yang digunakan dalam model. Bias yang diakibatkan pengabaian heterogenitas dari
koefisien-koefisien estimasi disebut juga sebagai heterogenity bias. Mengabaikan heterogenitas baik intersep maupun slope dapat mengakibatkan hasil estimasi
yang tidak konsisten dan meaningless. Penentuan model analisis data panel dalam rangka menghilangkan
heterogenity bias dapat dilakukan dengan plotting variabel dependen terhadap variabel independen. Analisis plotting ini berfungsi sebagai mekanisme
identifikasi model yang sesuai dalam analisis data panel. Sementara itu untuk menguji terjadi atau tidaknya heterogenity bias dapat dilakukan uji hipotesis
heterogenitas. Uji dilakukan dengan mengestimasi persamaan 3.4 dimana diasumsikan slope bersifat homogen antar individu. Kemudian uji hipotesis
dilakukan terhadap: H
: β
1
= β
2
= ... = β
N
= β
H
a
: β
i
≠ β
j
untuk i ≠ j
dimana : i = 1, ..., N j = 1, ..., N
Uji hipotesis di atas dapat dilakukan dengan mekanisme Wald-test. Jika pengujian tidak menolak hipotesis nol, maka koefisien individual bersifat random
dan identik dengan rata-ratanya. Dalam hal ini, estimasi dilakukan pada model yang mengasumsikan slope bersifat homogen seperti pada persamaan 3.1 sampai
3.2. Terdapat beberapa asumsi dasar yang melandasi penentuan model data
panel. Asumsi dasar ini ditentukan oleh conditionality dari variabel bebas x
i,t
yang digunakan dalam model data panel itu sendiri. Asumsi dasar dimaksud adalah sebagai berikut:
1. Individual-varying time-invariant, dimana nilai variabel baik kuantitatif
maupun kualitatif yang sama untuk sebuah unit kerat lintang sepanjang waktu namun berbeda antar unit kerat lintang. Contohnya adalah jenis kelamin, latar
belakang sosial-ekonomi dan sebagainya. 2.
Period-varying individual-invariant, dimana nilai variabel baik kuantitatif maupun kualitatif sama unutk semua unit kerat lintang namun berubah
menurut runtun waktu. Contohnya adalah tingkat bunga. 3.
Individual time-varying variables, dimana nilai variabel baik kuantitatif maupun kualitatif bervariasi antar unit kerat lintang dan waktu. Contohnya
adalah keuntungan perusahaan, tingkat penjualan. Berdasarkan pemilihan model tersebut di atas kemudian akan menentukan
metode estimasi dari model panel-panel yang dipilih. Terdapat tiga metode dalam mengestimasi data panel, yaitu:
1. Pooled Least Square PLS Dalam metode ini terdapat K regressor dalam x
it
, kecuali konstanta. Metode ini juga dikenal sebagai Common Effect Model CEM. Jika efek
individual α
i
konstan sepanjang waktu t dan spesifik terhadap setiap unit i maka modelnya akan sama dengan model regresi biasa. Jika nilai
α
i
sama untuk setiap unitnya, maka OLS akan menghasilkan estimasi yang konsisten dan efisien
untuk α dan β. Oleh karena itu, metode ini dapat digunakan dalam
mengestimasi persamaan 3.2. Metode ini sederhana namun hasilnya tidak
memadai karena setiap observasi diperlakukan seperti observasi yang berdiri sendiri.
2. Fixed Effect Model FEM Model ini menggunakan semacam peubah boneka untuk menungkinkan
perubahan-perubahan dalam intersep-intersep kerat lintang dan runtut waktu akibat adanya peubah-peubah yang dihilangkan. Intersep hanya bervariasi
terhadap individu namun konstan terhdap waktu sedangkan slopenya konstan baik terhadap individu maupu waktu. Jadi
α
i
adalah sebuah grup dari spesifik nilai konstan pada model regresi. Fornulasi umum model ini mengasumsikan bahwa
perbedaan antar unit dapat diketahui dari perbedaan nilai konstantanya. Kelemahan model efek tetap adalah penggunaan jumlah derajat kebebasan yang
banyak serta penggunaan peubah boneka tidak secara langsung mengidentifikasikan apa yang menyebabkan garis regresi bergeser lintas waktu
dan lintas individu. Modelnya ditulis sebagai y
i
= α
i
+ βx
i
+ ε
i
. 3. Random Effects Models REM
Intersepnya bervariasi terhadap individu dan waktu namun slopenya konstan terhadap individu maupun waktu. Jadi
α
i
adalah sebuah grup dari gangguan khusus, mirip seperti
ε
it
kebuali untuk setiap grup ada nilai khusus yang masuk dalam regresi secara identik untuk setiap periode. Nilai
α
i
terdistribusi secara acak pada unit-unit kerat lintang. Metode ini juga dikenal sebagai variance components estimation. Model ini meningkatkan efisiensi proses
pendugaan kuadrat terkecil dengan memperhitungkan pengganggu-penggangu kerat lintang dan deret waktu. Model estimasinya yang digunakan adalah y
it
= α
i +
β’x
it
+ μ
+
ε
it
dengan μ
i
adalah nilai gangguan acak pada observasi i dan konstan sepanjang waktu.
Berdasarkan penjabaran metode estimasi di atas dapat dikatakan bahwa FEM digunakan atas asumsi bahwa dampak dari gangguan mempunyai pengaruh
yang tetap dianggap sebagai bagian dari intersep. Sedangkan REM digunakan atas asumsi bahwa gangguan diasumsikan bersifat acak. Penentuan model atas
pertimbangan perilaku dari gangguan yang bersifat tetap atau acak pada individu i akan berpengaruh terhadap bias dan hasil estimasi. Bias yang terjadi akibat
kesalahan menetukan model berdasarkan perilaku gangguannya disebut dengan selectivity bias.
3.2.2. Pemilihan Model dalam Pengolahan Data