REGRESI ROBUST DENGAN METODE CONSTRAINED M ESTIMATION PADA PRODUKSI PADI SAWAH DI JAWA TENGAH

  REGRESI ROBUST DENGAN METODE CONSTRAINED M ESTIMATION PADA PRODUKSI PADI SAWAH DI JAWA TENGAH oleh

  IDA YUSWARA DYAH PITALOKA M0108046 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2012

  MOTO

  “Sesungguhnya bersama kesulitan ada kemudahan” (QS. Al-Insyiroh : 6).

  “Barang siapa menempuh jalan untuk memperoleh ilmu, maka Allah akan memudahkan baginya jalan menuju surga”

  (H. R Muslim dari Abi Hurairah)

  PERSEMBAHAN Skripsi ini kupersembahkan khusus untuk Kedua orangtuaku tercinta yang selelu mendoakan yang terbaik untukku,

  Adikku tersayang Nury yang selalu memotivasi dan menyemangatiku.

  ABSTRAK Ida Yuswara Dyah Pitaloka, 2012. REGRESI ROBUST DENGAN METODE CONSTRAINED M ESTIMATION PADA PRODUKSI PADI SAWAH DI JAWA TENGAH, FMIPA, Universitas Sebelas Maret Surakarta.

  Jawa Tengah merupakan provinsi penyangga padi sawah nasional. Produksi padi sawah dapat dipengaruhi oleh faktor luas panen, produktivitas, dan luas pengairan. Hubungan produksi padi sawah dan faktor-faktor tersebut dapat dimodelkan dengan analisis regresi, namun terdapat tujuh data pencilan pada data- data produksi padi dan faktor-faktor tersebut. Regresi robust dengan metode

  constrained M estimation dapat digunakan untuk mengatasi adanya data pencilan.

  Tujuan dari penelitian ini untuk menyusun model regresi robust dengan metode

  constrained M estimation pada produksi padi sawah di Jawa Tengah. Hasil

  penelitian menunjukkan bahwa model regresinya adalah 283520 dengan i adalah kabupaten di provinsi Jawa Tengah,

  5,70 5016 adalah luas panen dan adalah produktivitas. Ini berarti bahwa faktor yang berpengaruh terhadap produksi padi sawah di Jawa Tengah adalah luas panen dan produktivitas.

  Kata kunci: padi sawah, regresi robust, constrained M estimation.

  ABSTRACT Ida Yuswara Dyah Pitaloka, 2012. ROBUST REGRESSION WITH CONSTRAINED M ESTIMATION METHOD IN WET LAND PADDY PRODUCTION IN CENTRAL JAVA, FMIPA, Universitas Sebelas Maret Surakarta.

  Central Java is a province of the national rice buffer. Wet land paddy production can be influenced by factors in harvested area, productivity, and extensive irrigation. The relationship between wet land paddy production and these factors can be modeled with regression analysis, but there are seven outliers in the data of wet land paddy production data and factors. A robust regression with constrained M estimation method can be used to address the existence of data outliers. The purpose of this research is to find the robust regression model by the method of constrained M estimation in wet land paddy production in Central Java. The results showed that the regression model is

  283520 with i is the district in Central Java province, is the 5,70 5016 harvested area and is productivity. It means that factor influence in wet land paddy production in Central Java is the harvested area and productivity.

  Key words: wet land paddy, robust regression, constrained M estimation.

KATA PENGANTAR

  Puji syukur kehadirat Allah SWT yang dengan siraman rahmat dan hidayah-Nya telah memberi kekuatan pada penulis dalam menyusun skripsi ini. Penulis menyadari bahwa tanpa bantuan dan dukungan dari pihak lain, tidak mungkin dapat menyelesaikan skripsi ini. Untuk itulah pada kesempatan ini penulis menyampaikan rasa terima kasih kepada 1.

  Ibu Dra. Yuliana Susanti, M.Si. dan Bapak Drs. Pangadi, M.Si., selaku dosen Pembimbing I dan Pembimbing II yang telah memberikan bimbingan dan pengarahan sehingga dapat diselesaikannya penyusunan tugas akhir ini,

  2. semua pihak yang membantu penyusunan skripsi ini.

  Semoga skripsi ini dapat bermanfaat bagi pembaca.

  Surakarta, Juli 2012 Penulis

  DAFTAR ISI

  HALAMAN JUDUL .......................................................................................... i HALAMAN PENGESAHAN ............................................................................ ii MOTO ................................................................................................................. iii PERSEMBAHAN ............................................................................................... iv ABSTRAK .......................................................................................................... v ABSTRACT ........................................................................................................ vi KATA PENGANTAR ........................................................................................ vii DAFTAR ISI ....................................................................................................... viii DAFTAR TABEL ............................................................................................... x DAFTAR GAMBAR .......................................................................................... xi

  I. PENDAHULUAN 1

  1.1 Latar Belakang .................................................................................... 1

  1.2 Perumusan Masalah ............................................................................. 2

  1.3 Tujuan Penelitian ................................................................................. 3

  1.4 Manfaat Penelitian ............................................................................... 3

  II. LANDASAN TEORI 4

  2.1 Tinjauan Pustaka ................................................................................. 4

  2.1.1 Model Regresi Linier ................................................................. 5

  2.1.2 Metode Kuadrat Terkecil ........................................................... 5

  2.1.3 Pengujian Asumsi Analisis Regresi ............................................ 6

  2.1.4 Pencilan ..................................................................................... 10

  2.1.5 Pengujian Kriteria Statistik ......................................................... 11

  2.1.6 Regresi Robust ............................................................................ 13

  2.1.7 Estimasi-CM ............................................................................... 14

  2.2 Kerangka Pemikiran ............................................................................. 15

  III. METODE PENELITIAN 16

  IV. HASIL DAN PEMBAHASAN 17

  4.1 Data ..................................................................................................... 17

  4.2 Deteksi Pencilan ................................................................................... 18

  4.3 Model Kuadrat Terkecil ...................................................................... 19

  4.3.1 Uji Asumsi Normalitas .............................................................. 19

  4.3.2 Uji Asumsi Homoskedastisitas .................................................. 20

  4.3.3 Uji Asumsi Bebas Autokorelasi ................................................ 21

  4.3.4 Uji Asumsi Bebas Multikolinearitas ......................................... 22

  4.4 Model Regresi Robust dengan Estimasi-CM ....................................... 22

  V. KESIMPULAN DAN SARAN

  5.1 Kesimpulan ........................................................................................... 28

  5.2 Saran ..................................................................................................... 28 DAFTAR PUSTAKA ........................................................................................ 29 LAMPIRAN ..................................................................................................... 30

  DAFTAR TABEL

  Halaman

Tabel 4.1. Hasil uji TRES dan

  19 Tabel 4.2. Hasil uji multikolinearitas

  22 Tabel 4.3. Nilai tiap iterasi pada estimasi-CM dengan empat koefisien

  23 Tabel 4.4. Hasil uji t pada estimasi-CM untuk tiga variabel independen

  25 Tabel 4.5. Nilai tiap iterasi pada estimasi-CM dengan tiga koefisien

  26 Tabel 4.6. Hasil uji t pada estimasi-CM untuk dua variabel independen

  27

  DAFTAR GAMBAR

  Halaman

Gambar 2.1. Pola yang memenuhi asumsi homoskedastisitas

  7 Gambar 2.2. Pola-pola heteroskedastisitas

  8 Gambar 2.3. Statistik d Durbin-Watson

  9 Gambar 4.1. Plot antara produksi padi sawah ( ) dan luas panen ( )

  17 Gambar 4.2. Plot antara produksi padi sawah ( ) dan produktivitas ( )

  17 Gambar 4.3. Plot antara produksi padi sawah ( ) dan luas pengairan teknis ( )

  18 Gambar 4.4. Plot probabilitas sisaan

  20 Gambar 4.5. Plot kuadrat sisaan dengan estimasi Y 21

Gambar 4.6. Uji Durbin Watson 21

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah Jawa Tengah merupakan salah satu provinsi penyangga padi nasional.

  Kebutuhan padi setiap tahun selalu meningkat sebagai akibat dari peningkatan jumlah penduduk. Produksi padi sawah provinsi Jawa Tengah tahun 2010 sebesar 9,86 juta ton Gabah Kering Giling (GKG), naik 479,46 ribu ton atau 5,11% dibandingkan produksi padi sawah Tahun 2009. Peningkatan produksi padi sawah tahun 2010 selain disebabkan adanya kenaikan luas panen seluas 71,62 ribu ha atau 4,31% juga disebabkan oleh kenaikan produktivitas padi sawah sebesar 0,43 kwintal/ha atau 0,76% (Badan Pusat Statistik, 2011). Selain itu, produksi padi bergantung dari adanya pengairan yang baik. Menurut Sutawan (2001) air merupakan salah satu unsur yang sangat penting dalam produksi pangan seperti halnya padi. Jika air tidak tersedia maka produksi pangan akan terhenti. Salah satu jenis pengairan adalah pengairan teknis, yaitu jenis pengairan dimana saluran pemberi terpisah dari saluran pembuang agar penyediaan dan pembagian air ke dalam lahan sawah dapat sepenuhnya diatur dan diukur dengan mudah. Mudakir (2007) menunjukkan bahwa luas pengairan teknis berpengaruh positif terhadap produksi padi sawah. Oleh karena itu, luas panen, produktivitas dan luas pengairan teknis berpengaruh terhadap produksi padi sawah.

  Produksi padi sawah dapat diprediksi menggunakan analisis regresi untuk mengetahui hubungan antara variabel dependen yaitu produksi padi sawah dan variabel independen yaitu luas panen, produktivitas dan luas pengairan teknis. Analisis regresi merupakan teknik statistika yang digunakan untuk menyelidiki dan memodelkan hubungan antara variabel dependen dan variabel independen. Dalam analisis regresi harus dipenuhi asumsi-asumsi, yakni asumsi normalitas, homoskedastisitas, bebas autokorelasi dan bebas multikolinearitas (Gujarati, 1978). Jika asumsi-asumsi tersebut tidak dipenuhi, maka estimator yang dihasilkan tidak lagi merupakan estimator tak bias linier terbaik (best linear

  unbiased estimator/ BLUE). Adakalanya asumsi tidak dipenuhi pada kasus model regresi linear, misalnya sisaan tidak berdistribusi normal atau sisaan tidak menyebar secara acak. Salah satu penyebabnya terdapat data outlier (pencilan), yaitu pengamatan yang sangat berbeda dengan pengamatan yang lain, mungkin nilainya terlalu besar atau lebih kecil (Kartika, 1985). Data pencilan tidak boleh dibuang karena dimungkinkan data pencilan tersebut mengandung informasi yang penting. Oleh karena itu, diperlukan suatu metode agar tidak membuang informasi tersebut, salah satu di antaranya dengan menggunakan metode yang bersifat

  robust yakni regresi robust. Diharapkan dengan regresi robust tersebut nilai estimasinya tidak banyak dipengaruhi oleh perubahan kecil dalam data.

  Regresi robust merupakan metode regresi yang digunakan ketika terdapat beberapa pencilan yang berpengaruh pada model. Metode ini merupakan alat penting untuk menganalisis data yang dipengaruhi oleh pencilan sehingga dihasilkan model yang robust atau resistance terhadap pencilan. Menurut Arslan

  et al. (2002), salah satu estimasi regresi robust adalah estimasi constrained M

  (estimasi-CM) yang pertama kali dikembangkan oleh Mendes dan Tyler pada tahun 1995. Metode estimasi-CM memiliki nilai breakdown point hingga 0,5 (Kent

  and Tyler, 2001). Breakdown point adalah salah satu cara untuk mengukur ke- robust-an suatu estimator (Yohai, 1987). Breakdown point merupakan proporsi

  minimal dari banyaknya pencilan dibandingkan keseluruhan data yang dapat ditangani sebelum pengamatan tersebut mempengaruhi model. Selain itu, metode estimasi-CM ini dapat menangani pencilan pada variabel dependen dan variabel independennya. Metode ini menggunakan nilai pembobot dengan fungsi Tukey’s

  biweight untuk mendapatkan estimator.

1.2 Perumusan Masalah

  Berdasarkan latar belakang masalah dapat dirumuskan suatu permasalahan yaitu bagaimana menyusun model regresi robust dengan metode estimasi-CM pada produksi padi sawah di Jawa Tengah?

1.3 Tujuan Penelitian

  Tujuan dalam penelitian ini adalah menyusun model regresi robust dengan metode estimasi-CM produksi padi sawah di Jawa Tengah.

1.4 Manfaat Penelitian

  Manfaat yang diharapkan dari penelitian ini yakni dapat menambah wawasan serta pengetahuan tentang metode estimasi-CM.

BAB II LANDASAN TEORI Ada dua subbab yang dibahas pada landasan teori ini, yaitu tinjauan

  pustaka dan kerangka pemikiran. Tinjauan pustaka berisi pengertian-pengertian yang berhubungan dengan pembahasan model estimasi regresi robust dengan estimasi-CM. Kerangka pemikiran berisi langkah dan arah penelitian untuk mencapai tujuan.

2.1 Tinjauan Pustaka

  Metode estimasi dalam regresi robust sebelum estimasi-CM yakni estimasi-M, least trimmed square (LTS), dan least median square (LMS) (Chen, 2002). Metode estimasi-M pertama kali diperkenalkan oleh Huber pada tahun 1973. Estimasi-M merupakan metode regresi robust yang sering digunakan dan dipandang baik untuk mengestimasi parameter yang disebabkan oleh -outlier dan memiliki breakdown point

  1/ . Metode estimasi LMS merupakan metode

  high breakdown point yang diperkenalkan pertama kali oleh Rousseeuw pada

  tahun 1984. LMS adalah modifikasi dari metode kuadrat terkecil biasa. Modifikasi yang dilakukan dengan mengubah operator jumlah menjadi median. Parameter dapat diestimasi dengan cara meminimumkan median dari kuadrat sisaan. Metode estimasi LTS merupakan metode high breakdown point yang diperkenalkan pertama kali oleh Rousseeuw pada tahun 1984. LTS merupakan suatu metode pendugaan parameter regresi robust untuk meminimumkan jumlah kuadrat h sisaan (fungsi objektif).

  Kelemahan dari ketiga metode tersebut bahwa ketiganya hanya dapat mengestimasi parameter yang disebabkan oleh pencilan pada variabel independen dengan breakdown point lebih kecil dari 0,5 sehingga dikembangkanlah estimasi- CM.

  Teori-teori yang relevan dan mendukung yang digunakan dalam penelitian meliputi model regresi linear berganda, metode kuadrat terkecil, asumsi analisis

2.1.1. Model Regresi Linear Berganda

  Model regresi adalah model yang memberikan gambaran mengenai hubungan antara variabel independen dengan variabel dependen (Sembiring, 2003). Bentuk umum dari model regresi linear berganda adalah

  … , 1,2, … , 2.1 dengan : harga variabel dependen pada pengamatan ke-i

  , , , … , : parameter koefisien regresi : variabel independen pada pengamatan ke-i

  , , … , : sisaan ke-i dengan

  ~ 0, : banyaknya pengamatan : banyaknya variabel independen.

2.1.2 Metode Kuadrat Terkecil (MKT)

  Metode kuadrat terkecil pada prinsipnya adalah meminimumkan jumlah kuadrat sisaan (JKS) yang dirumuskan sebagai JKS

  ∑ ∑ … . 2.2 Cara untuk meminimumkan (2.2), dicari turunan JKS secara parsial terhadap

  , 0, 1, 2, … , dan disamakan dengan nol sehingga diperoleh JKS 2 … 0, JKS 2 … 0, JKS 2 … 0, JKS 2 … 0. 2.3

  Sistem persamaan (2.3) menghasilkan persamaan normal

  … …

  … … . 2.4

  Jika disusun dalam bentuk matriks maka persamaan (2.4) menjadi

  2.5 dengan

  1

  1 . , ,

  1 Penyelesaian persamaan (2.5) diperoleh dengan mengalikan kedua sisinya dengan invers dari , sehingga estimator adalah .

2.1.3 Pengujian Asumsi Analisis Regresi

  Pengujian untuk mengetahui apakah model regresi memenuhi asumsi regresi atau tidak sangat diperlukan pada model regresi. Uji asumsi tersebut ada empat.

  1. Normalitas Analisis regresi linear mengasumsikan bahwa sisaan ( ) berdistribusi normal. Menurut Gujarati (1978) pada regresi linear klasik diasumsikan bahwa tiap didistribusikan secara random dengan .

  ~ 0, Cara untuk menguji asumsi kenormalan adalah dengan uji Kolmogorov-

  Smirnov. Uji ini didasarkan pada nilai D yang didefiniikan sebagai

  max| | , 1, 2, . . , , dengan adalah fungsi distribusi frekuensi kumulatif relatif dari distribusi teoritis di bawah , adalah distribusi frekuensi kumulatif pengamatan sebanyak sampel, adalah sisaan berdistribusi normal. Selanjutnya, nilai ini dibandingkan dengan nilai kritis dengan signifikansi

  (tabel Kolmogorof-Smirnov). Jika nilai > atau , maka asumsi kenormalan tidak dipenuhi.

2. Homoskedastisitas

  Asumsi penting dalam analisis regresi adalah variasi sisaan ( ) pada setiap variabel independen adalah homoskedastisitas. Asumsi ini dapat ditulis sebagai i =1, 2,…n.

  Pengujian homoskedastisitas yaitu dengan melihat pola tebaran sisaan ( ) terhadap nilai estimasi . Jika tebaran sisaan bersifat acak (tidak membentuk pola tertentu) maka dikatakan bahwa variansi sisaan homogen (Draper dan Smith, 1998).

  Gujarati (1978) menggambarkan beberapa plot sisa terhadap seperti pada Gambar 2.1 dan Gambar 2.2. Jika hasil plot mirip pola pada Gambar 2.1, maka asumsi homoskedastisitas dipenuhi karena titik-titik tersebar rata atau tidak membentuk pola tertentu. Pada Gambar 2.2 (a) sampai (c) terlihat membentuk pola tertentu, artinya terjadi heteroskedastisitas.

Gambar 2.1. Pola yang memenuhi asumsi homoskedastisitas

  (a) (b) (c)

Gambar 2.2. Pola-pola heteroskedastisitas

  Menurut Gujarati (1978) cara untuk mendeteksi heteroskedastisitas adalah dengan pengujian White. Hipotesis untuk pengujian White adalah ,

  : homoskedastisitas, var ( . : heteroskedastisitas, var (

  Langkah-langkah pengujian White adalah a. dan diperoleh meregresikan dengan MKT, sisaan

  ̂ , b. meregresikan kembali berdasarkan hasil (a),

  ̂ ,

  c. , menghitung d. dan , dimana berdasarkan penduga pada membandingkan nilai

  (b). jika , maka ditolak.

  3. Bebas multikolinearitas Menurut Montgomery dan Peck (1992), kolinearitas terjadi karena terdapat korelasi yang cukup tinggi di antara variabel independen. Variance

  

inflation factor (VIF) merupakan salah satu cara untuk mengukur besar

  kolinearitas dan didefinisikan sebagai

  1

  1 dengan 1,2, … , dan adalah banyaknya variabel independen. adalah koefisien determinasi yang dihasilkan dari regresi variabel independen dengan variabel independen lain . Nilai VIF menjadi semakin besar jika terdapat korelasi yang semakin besar diantara variabel independen. Jika nilai VIF lebih dari 10, multikolinearitas memberikan pengaruh yang serius pada pendugaan metode kuadrat terkecil.

  4. Bebas autokorelasi Asumsi penting dari regresi linear adalah bahwa tidak ada autokorelasi antara serangkaian pengamatan yang diurutkan menurut waktu. Kebebasan antar sisaan dapat dideteksi secara grafis dan empiris. Pendeteksian autokorelasi secara grafis yaitu dengan melihat pola tebaran sisaan terhadap urutan waktu. Jika tebaran sisaan terhadap urutan waktu tidak membentuk suatu pola tertentu atau bersifat acak maka dapat disimpulkan tidak ada autokorelasi antar sisaan (Draper dan Smith, 1998).

  Pengujian secara empiris dilakukan dengan menggunakan statistik uji

  Durbin-Watson. Adapun rumusan matematis uji Durbin-Watson adalah:

  ∑ ∑ Kaidah keputusan dalam uji Durbin-Watson adalah sebagai berikut.

  a.

  : 0 vs :

  0. Menolak pada tingkat signifikansi jika yang berarti terdapat autokorelasi positif.

  b.

  : 0 vs :

  0. Menolak pada tingkat signifikansi jika yang berarti terdapat autokorelasi negatif.

  4 c.

  : 0 vs :

  0. Menolak pada tingkat signifikansi 2 jika dan yang berarti terdapat autokorelasi negatif ataupun 4 positif.

  d.

  Untuk uji DW dapat dilihat pada Gambar 2.3.

  

H ditolak

tidak dapat disimpulkan H diterima

  2

  4

  4 Gambar 2.3. Statistik d Durbin-Watson

2.1.4 Pencilan (Outlier)

  Terkadang pada beberapa kasus ditemukan adanya data yang jauh dari pola kumpulan data keseluruhan yang didefinisikan sebagai data pencilan. Menurut Chen (2002) terdapat 3 kelas masalah yang dapat menggunakan teknik regresi robust, yaitu

  1. masalah dengan pencilan yang terdapat pada variabel (variabel dependen), 2. masalah dengan pencilan yang terdapat pada variabel (variabel independen), dan

  3. masalah dengan pencilan yang terdapat pada keduanya yaitu pada variabel (variabel dependen) dan variabel (variabel independen).

  Permasalahan yang muncul akibat adanya pencilan adalah 1. sisaan yang besar dari model yang terbentuk

  0, 2. variansi dari data akan menjadi lebih besar, dan 3. estimasi interval akan memiliki rentang yang lebih besar.

  Menurut Draper dan Smith (1998), metode yang digunakan dalam mengidentifikasi pencilan terhadap variabel adalah studientized deleted residual (TRES) yang didefinisikan sebagai

  1

  1 dengan adalah prediksi dari bila pengamatan ke- tidak diikutsertakan, adalah jumlah variabel independen, adalah banyaknya pengamatan dan adalah simpangan baku beda ( ), ,

  1, 2, … , , ,

  ′ ′

  , 1. Hipotesis untuk menguji adanya pencilan adalah

  : Pengamatan ke- bukan pencilan, : Pengamatan ke- merupakan pencilan. Kriteria pengujian yang melandasi keputusan adalah ditolak jika

  | | .

  ,

  Metode yang digunakan dalam mengidentifikasi pencilan terhadap variabel adalah nilai pengaruh (leverage point). Nilai Pengaruh ( ) dari pengamatan

  , menunjukkan besarnya peranan terhadap dan didefinisikan sebagai

  ′ ′

  , 1, 2, … , , dengan = [ ] adalah vektor baris yang berisi nilai – nilai dari 1 … variabel independen dalam pengamatan ke- . Nilai berada diantara 0 dan 1,

  ∑ ∑ dengan 1 dan / . Jika lebih besar dari 2 dengan

  2 ∑

  2 2 , maka pengamatan ke- dikatakan pencilan terhadap .

2.1.5 Pengujian Kriteria Statistik

  Gujarati (1978) menyatakan bahwa uji signifikansi merupakan prosedur yang digunakan untuk menguji kebenaran atau kesalahan dari hasil hipotesis nol dari sampel. Ide dasar yang melatarbelakangi pengujian signifikansi adalah uji statistik (estimator) dari distribusi sampel dari suatu statistik di bawah hipotesis nol. Keputusan untuk mengolah dibuat berdasarkan nilai uji statistik yang diperoleh dari data yang ada.

  Uji statistik terdiri dari pengujian koefisien regresi secara bersama-sama (uji F), pengujian koefisien regresi parsial (uji t), dan pengujian koefisien determinasi Goodness of fit test

  R .

1. Pengujian Signifikansi Simultan (Uji F)

  Uji F dilakukan untuk mengetahui apakah variabel-variabel independen secara keseluruhan signifikan secara statistik dalam mempengaruhi variabel dependen. Jika nilai F lebih besar dari nilai F tabel, maka variabel-variabel independen secara keseluruhan berpengaruh terhadap variabel dependen. Hipotesis yang digunakan adalah

  : 0, untuk 1, 2, … , , Nilai hitung dirumuskan sebagai /

  /

  1 dimana jumlah parameter yang diestimasi termasuk konstanta jumlah observasi

  Kriteria pengujian yang digunakan pada tingkat signifikansi 5% dinyatakan sebagai a. diterima dan ditolak apabila F< F tabel atau p-value > yang artinya variabel independen secara serentak atau bersama-sama tidak mempengaruhi variabel dependen secara signifikan, b. ditolak dan diterima apabila F hitung > F tabel atau p-value < yang artinya variabel independen secara serentak dan bersama-sama mempengaruhi variabel yang dijelaskan secara signifikan.

2. Pengujian Signifikansi Parameter Individual (Uji t)

  Uji signifikansi parameter individual (uji t) dilakukan untuk melihat signifikansi dari pengaruh variabel independen terhadap variabel dependen secara individual dan menganggap variabel lain konstan. Hipotesis yang digunakan adalah

  : 0, 1, 2, … , , : 0, 1, 2, … , . Nilai t hitung dapat divari dengan rumus dimana parameter yang diestimasi, nilai pada hipotesis, standar error . Pada tingkat signifikansi 5%, pengujian yang digunakan adalah a. jika t-hitung > t-tabel atau p-value < , maka ditolak. Artinya salah satu variabel independen mempengaruhi variabel dependen secara signifikan.

  b. jika t-hitung < t-tabel atau p-value > , maka diterima. Artinya salah satu variabel independen tidak mempengaruhi variabel dependen secara signifikan.

3. Koefisien Determinasi

  Gujarati (1978) menyatakan bahwa koefisien determinasi pada intinya mengukur seberapa jauh kemampuan suatu model dalam menerangkan variasi variabel dependen. Nilai adalah antara nol dan satu. Nilai yang kecil (mendekati nol) berarti kemampuan satu variabel dalam menjelaskan variabel dependen sangat terbatas. Nilai yang mendekati satu berarti variabel- variabel independen memberikan hampir semua informasi dibutuhkan untuk memprediksi variabel dependen.

  Kelemahan mendasar penggunaan determinasi adalah bias terhadap jumlah variabel independen yang dimasukkan ke dalam model. Setiap penambahan satu variabel pasti meningkat tidak peduli apakah variabel tersebut berpengaruh secara signifikan terhadap variabel dependen. Oleh karena itu, banyak peneliti menganjurkan untuk menggunakan adjusted pada saat mengevaluasi model regresi terbaik. Nilai koefisien determinasi diperoleh dengan rumus

  ∑ , 1, 2, . . . ,

  ∑ dimana adalah nilai estimasi, adalah nilai rata-rata dan adalah nilai aktual.

2.1.6 Regresi Robust

  Asumsi regresi klasik sering tidak dipenuhi dalam memprediksi model regresi, misal tidak dipenuhinya asumsi kenormalan atau asumsi homoskedastisitas. Pelanggaran tersebut dapat dikarenakan adanya pencilan. sisaan tidak normal (Draper dan Smith, 1998). Analisis regresi robust merupakan alternatif dari MKT. Seringkali transformasi tidak akan menghilangkan atau melemahkan pengaruh dari pencilan yang akhirnya estimasi menjadi bias dan estimasi parameter menjadi tidak valid. Oleh karena itu, sangat tepat jika menggunakan metode regresi robust yang tahan terhadap pengaruh pencilan sehingga menghasilkan estimasi yang lebih baik.

2.1.7 Estimasi-CM

  Estimasi-CM diperkenalkan pertama kali oleh Mendes dan Tyler pada Tahun 1995 yang memiliki breakdown point min atau 50% ketika

  , 1 0,5 (Arslan et al., 2002). Breakdown point adalah ukuran umum proporsi dari pencilan yang dapat ditangani sebelum pengamatan tersebut mempengaruhi model. Masalah estimasi-CM adalah menentukan global minimum dari fungsi objektif

  , log dengan “ ” adalah rata-rata nilai aritmatik dan untuk ∑

  , 1, 2, … , dan 0, 1, … , , dimana 0, dan subjek constraint adalah

  

  dengan

  ∑ ∑

  1

  dimana adalah sisaan ke- , adalah konstanta, adalah nilai breakdown point, dan adalah jumlah pengamatan.

  Dalam kasus ini, bersifat terbatas, fungsi tidak turun untuk dengan 0 dan didefinisikan sebagai fungsi pembobot Tukey’s beweight

  | | 1

  2

2 6 ,

  1 | | 1. 6,

  

  Fungsi pengaruh merupakan turunan dari yang dituliskan sebagai

   1 , | | 1 0, | | 1

  dengan dan 4.

  Sisaan awal yang digunakan pada estimasi-CM adalah sisaan yang diperoleh dari MKT. Kemudian dengan mencari pembobot untuk melakukan iterasi dengan MKT terboboti secara iterasi yang disebut iteratively reweighted

  least square (IRLS) hingga mencapai konvergen. Adapun pembobot IRLS

  adalah

  1 , | | 1 0, | | 1 1 , | | 1

  0, | | 1.

2.2 Kerangka pemikiran

  Berdasarkan tinjauan pustaka, dapat dibuat kerangka pemikiran bahwa asumsi regresi klasik sering tidak dipenuhi dalam menentukan nilai parameter regresi, misal tidak dipenuhinya asumsi kenormalan atau asumsi homoskedastisitas. Hal ini terjadi karena pada suatu data terdapat observasi pada variabel dependen maupun independen yang mengandung pencilan sehingga mengakibatkan sisaan tidak berdistribusi normal atau sisaan tidak menyebar secara acak. Oleh karena itu, dalam melakukan estimasi parameter tidak bisa membuang data pencilan tersebut ataupun menggunakan metode yang biasa digunakan yaitu MKT.

  Penyelesaian masalah tersebut adalah harus digunakannya suatu metode yang kekar terhadap adanya pencilan yaitu dengan menggunakan regresi robust. Regresi robust yang digunakan adalah estimasi-CM yang meminimumkan fungsi objektif dengan fungsi pembobot Tukey’s biweight. Fungsi pembobot ini digunakan untuk mendapatkan nilai pembobot yang digunakan dalam perhitungan MKT terbobot. Kemudian melakukan iterasi sampai diperoleh kekonvergenan sehingga dapat disusun model regresi robust dengan estimasi-CM.

BAB III METODE PENELITIAN Data yang digunakan dalam penelitian ini adalah produksi padi sawah

  sebagai variabel dependen , sedangkan luas panen , produktivitas , dan luas pengairan teknis sebagai variabel independen. Data diambil sebanyak 35 kabupaten dan kota di Jawa Tengah dari Buku Jawa Tengah Dalam Angka 2011. Langkah-langkah yang digunakan dalam penelitian ini yaitu 1. eksplorasi data,

  2. mendeteksi adanya pencilan, 3. menduga koefisien regresi dengan MKT yang akan digunakan sebagai nilai awal untuk menentukan koefisien regresi robust debgan estimasi-

  CM,

  4. menguji asumsi klasik regresi linier, 5. menduga koefisien regresi dengan estimasi-CM dengan langkah

  a. memperoleh nilai awal dan menghitung sisaan awal yang diperoleh dari MKT pada langkah 3 kemudian dihitung untuk mendapatkan nilai , b. menghitung nilai pembobot

  , c. menggunakan MKT terbobot untuk mendapatkan penduga kuadrat terkecil terbobot

  

  , d. menjadikan sisaan langkah (c) sebagai sisaan awal langkah (b) sehingga diperoleh nilai dan pembobot yang baru, dan e. melakukan iterasi hingga konvergen dan diperoleh

  , , … , yang merupakan estimasi-CM, 6. menyusun model regresi robust dengan estimasi-CM.

BAB IV HASIL DAN PEMBAHASAN

4.1 Data

  Bab ini menyajikan hasil analisis data sekunder produksi padi sawah di Jawa Tengah Tahun 2010 yang diperoleh dari Badan Pusat Statistik. Data tersebut meliputi produksi padi sawah sebagai variabel dependen , luas panen , produktivitas padi sawah dan luas pengairan teknis sebagai variabel independen.

  Adapun plot tiap variabel independen dengan variabel dependen disajikan pada gambar –gambar berikut untuk mengetahui hubungan linier antara masing- masing variabel independen dan variabel dependen.

  100000 200000 300000 400000 500000 600000 700000 800000 20000 40000 60000 80000 100000 140000 120000 X1 Y

Gambar 4.1. Plot antara produksi padi sawah dan luas panen

  65 60 55 50 100000 200000 300000 400000 500000 600000 700000 45 800000 X2 Y

  800000 700000 500000 600000 Y 100000 200000 300000 400000 10000 20000 30000 40000 X3 Gambar 4.3. Plot antara produksi padi sawah dan luas pengairan

  teknis

Gambar 4.1 menunjukkan bahwa titik-titik mengikuti pola garis lurus, yang artinya luas panen dan produksi padi sawah memiliki hubungan linier,

  sedangkan pada Gambar 4.2 dan 4.3 titik-titik juga mengikuti pola garis lurus atau memiliki hubungan linier, tetapi titik-titiknya lebih menyebar sehingga diduga data produksi padi sawah mengandung pencilan.

  Setelah menyelidiki hubungan kelinieran antar variabel, dilanjutkan mendeteksi adanya pencilan.

4.2 Deteksi Pencilan

  Berdasar statistik uji untuk mengetahui pencilan terhadap yaitu TRES dengan menarik kesimpulan menolak apabila nilai TRES > maka diperoleh kesimpulan seperti pada Tabel 4.1 bahwa pengamatan ke 15, 27, 31 dan 33 merupakan pencilan terhadap variabel .

  Berdasar statistik uji untuk mengetahui pencilan terhadap yaitu hii yang dengan menarik kesimpulan menolak apabila nilai > 2 / maka diperoleh kesimpulan seperti pada Tabel 4.1 bahwa pengamatan ke 1, 28 dan 33 merupakan pencilan terhadap variabel . Nilai TRES dan secara lengkap ada pada Lampiran 1.

Tabel 4.1. Hasil uji TRES dan

  TRES t 2k /n tabel Pengamatan

  1 0.260026 

  > 0,2286

> 2,042

  15 3.50196 

  

< -2,042

  27

  • 2.15301 

  > 0,2286

  28   0.259067

  

> 2,042

  31 2.18431 

  > 2,042 > 0,2286

  33 3.66633 0.235876

4.3 Model Kuadrat Terkecil

  Koefisien regresi dari metode kuadrat terkecil digunakan pada penelitian ini sebagai nilai awal yang akan digunakan untuk menduga koefisien regresi dengan estimasi-CM. Model regresi dengan metode kuadrat terkecil adalah

  239519 5,73 4285 0,216 , 1, 2, … , 35 (4.1)

  dengan : estimasi produksi padi sawah (ton) di kabupaten ke-i : luas panen (ha) di kabupaten ke-i : produktivitas padi sawah (kwintal/ha) di kabupaten ke-i : luas pengairan teknis (ha) di kabupaten ke-i.

  Adapun langkah-langkah dan hasil MKT terdapat pada Lampiran 2.

  Selanjutnya dilakukan uji asumsi klasik untuk melihat apakah model yang diteliti memenuhi asumsi klasik atau tidak. Hasil uji asumsi klasik ada empat.

4.3.1 Uji Asumsi Normalitas

  Pengujian kenormalan digunakan untuk mengetahui apakah sisaan berdistribusi normal atau tidak. Plot kenormalan untuk sisaan dari model produksi padi sawah disajikan pada Gambar 4.4.

Gambar 4.4 menunjukkan pola penyebaran sisaan tidak mengikuti pola garis lurus, ini berarti asumsi kenormalan pada sisaan tidak dipenuhi. Pengujian

  kenormalan dapat juga digunakan uji Kolmogorof-Smirnov sebagai berikut.

  1.

  : sisaan tidak berdistribusi normal.

  2. Dipilih α 0,05.

  3. Daerah kritis: H ditolak jika p-value 0,05.

  4. Statistik uji : hasil menunjukkan pada Gambar 4.4 bahwa p-value < 0,010.

  5. Kesimpulan : karena p-value 0,01 0,05, maka ditolak artinya sisaan tidak berdistribusi normal. 99 95 p a b b ta ili s ro 50 60 70 80 30

  90 40 10

  20 1 5 -30000 -20000 -10000 10000 20000 30000 40000 sisaan

  Keterangan : p-value < 0,010

Gambar 4.4. Plot probabilitas sisaan

4.3.2 Uji Asumsi Homoskedastisitas Pendeteksian homoskedastisitas dapat dilakukan dengan melihat pola plot.

  Plot kesamaan variansi untuk data sisaan pada model produksi padi sawah di Jawa Tengah disajikan pada gambar 4.5.

Gambar 4.5 menunjukkan bahwa variansi sisaan dari satu pengamatan ke pengamatan yang lain tidak berpola acak yang mengindikasikan bahwa variansi

  sisaan tidak konstan sehingga dapat disimpulkan asumsi homoskedastisitas tidak dipenuhi. Selain itu, dapat dilakukan uji White. Jika nilai , maka sisaan mengandung masalah heteroskedastisitas. Hasil pengujian menunjukkan bahwa dan nilai Karena nilai ,

  35 0,867 30,345 16,92.

  , ; , ; maka disimpulkan bahwa asumsi homoskedastisitas tidak dipenuhi (Lampiran 3).

  200000000 400000000 600000000 800000000 1000000000 1200000000 1400000000 100000 200000 300000 400000 500000 600000 800000 700000 est imasi Y k u a d ra t s is a a n

Gambar 4.5. Plot kuadrat sisaan dengan estimasi

4.3.3 Uji Asumsi Bebas Autokorelasi

  Autokorelasi diartikan sebagai korelasi antara anggota serangkaian observasi yang diurutkan menurut waktu. Uji bebas autokorelasi dapat dideteksi dengan rumus Durbin Watson. Uji Durbin Watson (Uji DW) 1.

  : 0, artinya tidak ada autokorelasi, : 0, artinya ada autokorelasi.

2. Dipilih 0,05.

  3. Daerah kritis: pengambilan nilai 3 dan 35 serta α 0,05 diperoleh nilai

  1,28 dan 1,65 sehingga 4 2,72 dan 4 2,35.

  H diterima

  1,28 1,65 2,35 2,72

Gambar 4.6 Uji Durbin Watson 4.

  Statistik uji: hasil menunjukkan bahwa nilai 1,98150 .

  tidak dapat disimpulkan H ditolak

  5. Kesimpulan : berdasarkan hasil diperoleh nilai berada

  1.98150

  pada posisi maka tidak ditolak. Artinya, asumsi

  1,65

  bebas autokorelasi pada model produksi padi sawah di Jawa Tengah Tahun 2010 dipenuhi.

4.3.4 Uji Asumsi Bebas Multikolinearitas

  Pengujian multikolinearitas bertujuan untuk mengetahui ada tidaknya hubungan linear antara variabel independen. Pendeteksian adanya mutikolinearitas dapat dilakukan dengan melihat nilai VIF. Hasil uji multikolinearitas dapat dilihat pada Tabel 4.2.

Tabel 4.2. Hasil uji multikolinearitas

  Variabel independen

  VIF Keterangan

  (Luas panen) 3.330 < 10 Tidak terdapat multikolinearitas (Produktivitas padi sawah) 1.153 < 10 Tidak terdapat multikolinearitas (Luas pengairan teknis) 3.145 < 10 Tidak terdapat multikolinearitas

Tabel 4.2 menunjukan bahwa nilai VIF untuk semua variabel independen, baik variabel luas panen , produktivitas padi sawah , dan luas pengairan

  teknis adalah lebih kecil dari 10, sehingga dapat disimpulkan bahwa asumsi bebas multikolinearitas dipenuhi.

  Berdasarkan pengujian asumsi klasik pada model produksi padi sawah di Jawa Tengah tahun 2010 menggunakan analisis regresi diperoleh bahwa asumsi normalitas dan asumsi homoskedastisitas telah dilanggar sehingga diperlukan penanganan terhadap pelanggaran asumsi-asumsi tersebut agar diperoleh model regresi yang tepat di antaranya dengan menggunakan regresi robust estimasi-CM.

4.4 Model Regresi Robust dengan Estimasi-CM

  Proses perhitungan estimasi-CM secara iterasi diawali dengan menentukan estimasi koefisien regresi yang diperoleh dari MKT yaitu = ( ) kemudian berdasarkan langkah-langkah menduga

  239519: 5,73 ; 4285; 0,216

  koefisien regresi dengan estimasi-CM, dihitung nilai , sisa ,

  ,

   dan

  . Proses iterasi menggunakan MKT terboboti dilanjutkan dengan menghitung nilai dan menghitung pembobot yang baru dan dilakukan pendugaan parameter secara berulang-ulang sampai konvergen. Koefisien regresi tiap iterasi ditunjukkan pada Tabel 4.3.

Tabel 4.3. Nilai tiap iterasi pada estimasi-CM dengan empat koefisien iterasi

  1 -252066 5,69 4477 -0,037 2 -261941 5,69 4645 -0,02 3 -269092 5,7 4768 -0,029 4 -274295 5,7 4857 -0,041 5 -277994 5,71 4921 -0,05 6 -280541 5,71 4964 -0,056 7 -282248 5,71 4994 -0,061 8 -283368 5,71 5013 -0,064 9 -284092 5,71 5025 -0,066 10 -284556 5,72 5033 -0,068 11 -284851 5,72 5038 -0,068 12 -285038 5,72 5042 -0,069 13 -285156 5,72 5044 -0,069 14 -285230 5,72 5045 -0,07 15 -285277 5,72 5046 -0,07 16 -285307 5,72 5046 -0,07 17 -285325 5,72 5047 -0,07 18 -285337 5,72 5047 -0,07 19 -285344 5,72 5047 -0,07 20 -285349 5,72 5047 -0,07 21 -285352 5,72 5047 -0,07 22 -285354 5,72 5047 -0,07 23 -285355 5,72 5047 -0,07 24 -285356 5,72 5047 -0,07 25 -285356 5,72 5047 -0,07

Tabel 4.3 menunjukkan kekonvergenan koefisien regresi . Koefisien konvergen ke nilai -285356, koefisien konvergen ke nilai 5,72, koefisien

  regresi konvergen ke nilai 5047, dan koefisien konvergen ke nilai -0,07. Berdasarkan hasil yang diperoleh dapat ditulis model regresi robust dengan estimasi-CM yaitu

  285356 5,72 5047 0,070 dengan

2 R = 99,8% dan s = 8829,31. Interpretasi model yaitu sebesar 99,8%

  adjusted

  produksi padi sawah dapat diterangkan oleh variabel luas panen, produktivitas padi sawah, dan luas pengairan teknis, sedangkan sebesar 0,2 % diterangkan oleh variabel yang lain. Setiap peningkatan satu ha luas panen dan satu kwintal/ha produktivitas padi sawah di kabupaten ke-i akan meningkatkan produksi padi sawah di Jawa tengah di kabupaten ke-i masing-masing sebesar 5,72 ton dan 5047 ton, setiap peningkatan satu ha luas pengairan teknis di kabupaten ke-i akan menurunkan produksi padi sawah di kabupaten ke-i sebesar 0,070 ton.

  Uji serentak digunakan untuk mengetahui apakah variabel-variabel independen secara keseluruhan signifikan dalam mempengaruhi variabel independen.

  1.

  0, 1,2,3 (luas panen, produktivitas padi sawah atau luas pengairan teknis tidak berpengaruh secara signifikan terhadap produksi padi sawah).

  0, untuk suatu 1,2,3 (paling tidak ada salah satu di antara luas panen, produktivitas padi sawah atau luas pengairan teknis berpengaruh secara signifikan terhadap produksi padi sawah).

  2. Dipilih 0,05. 3. ditolak jika

  Daerah kritis: 0,05.

  4. Statistik uji : hasil menunjukkan bahwa nilai 0,000.

  5. Kesimpulan : karena ditolak.

  0,000 0,05 maka Artinya, paling tidak ada salah satu di antara luas panen, produktivitas padi sawah atau luas pengairan teknis berpengaruh secara signifikan terhadap produksi padi sawah.

  Selanjutnya dilakukan uji parsial untuk mengetahui signifikansi atau pengaruh masing-masing variabel independen terhadap model regresi yang dihasilkan.

Tabel 4.4. Hasil uji t pada estimasi-CM untuk tiga variabel independen

  Variabel Kesimpulan Luas panen

  0,000 0,05 Signifikan Produktivitas padi sawah

  0,000 0,05 Signifikan Luas pengairan teknis

  0,881 0,05 Tidak signifikan

Tabel 4.4 menunjukkan bahwa luas panen dan produktivitas padi sawah adalah signifikan dalam mempengaruhi jumlah produksi padi sawah di Jawa

  Tengah, sedangkan luas pengairan teknis tidak berpengaruh signifikan.