Selamat Datang di Website STATSDATA

  

KAMIS, 05 JUNI 2014 Uji Asumsi Klasik Regresi Linier

  Pada penulisan tentang Regresi Linear ini, penulis akan memberikan bahasan mengenaiUji Asumsi Klasik kepada para pembaca untuk memberikan pemahaman dan solusi dalam mengantisipasi asumsi yang diberikan. Pengujian Asumsi Klasik merupakan pengujian asumsi-asumsi statistik yang harus dipenuhi pada analisis regresi linear berganda yang berbasis ordinary least square (OLS). Ketika asumsi tidak terpenuhi, biasanya peneliti menggunakan berbagai solusiagar asumsinya dapat terpenuhi, atau beralih ke metode yang lebih advanceagar asumsinya dapat terselesaikan. Pada penulisan ini, Asumsi Klasik yang akan diberikan adalah Multikolinearitas, Autokorelasi, Heteroskedatisitas, dan Normalitas.

  Pengujian Asumsi Klasik

Pengujian Asumsi Klasik harus dilakukan untuk menguji asumsi-asumsi

  yang ada dalam pemodelan regresi linear berganda. Diberikan bentuk umum dari model regresi linear berganda untuk n pengamatan, yaitu Variabel-variabel prediktor dalam model regresi linear berganda disebut juga sebagai variabel-variabel independen (bebas), artinya variabel- variabel prediktor tidak memiliki hubungan atau keterkaitan satu dengan yang lain (intercorrelation). Dengan kata lain, variabel-variabel prediktor tidak memiliki sifat Multikolinearitas. Diasumsikan Error (ε) bersifat identik dan independen (iid), serta berdistribusi Normal dengan mean nol 2 dan varian σ . Hal ini memberikan arti bahwa komponen error memiliki kecenderungan mendekati nol dan tidak memiliki ketergantungan diantara komponen error berdasarkan waktu tertentu (Autokorelasi), serta error mengikuti distribusi Normal (Normalitas) dan tidak memiliki sifat Heteroskedatisitas (varian tidak konstan). Ketika digunakan data pengamatan (sampel), parameter/koefsien model regresi akan diestimasi dengan metode OLS sehingga akan menghasilkan dugaan dari koefsien regresi β , β 1 , β 2 , …, β p , yaitu b , b 1 , b 2 , …, b p sehingga model regresinya akan menjadi

  

Residual (e) merupakan ukuran kesalahan sampel yang digunakan untuk

  menggambarkan ukuran kesalahan populasi yaitu Error (ε). Residual juga dinyatakan sebagai perbedaan antara data pengamatan (sampel) dari variabel respon (y) dengan data prediksi respon dari estimasi model regresi (y-hat), sehingga diperoleh residual secara matematis Tidak semua uji asumsi klasik harus dilakukan pada analisis regresi linear,seperti: pengujian asumsi Multikolinearitas tidak harus dilakukan pada analisis regresi linear sederhana yang memiliki variabel respon dan prediktor hanya satu.

  Asumsi Multikolinearitas

Asumsi Multikolinearitas adalah asumsi yang menunjukkan adanya

  hubungan linear yang kuat diantara beberapa variabel prediktor dalam suatu model regresi linear berganda. Model regresi yang baik memiliki variabel-variabel prediktor yang independen atau tidak berkorelasi. Pada pengujian asumsi ini, diharapkan asumsi Multikolinieritas tidak terpenuhi. Penyebab terjadinya kasus Multikolinieritas adalah terdapat korelasi atau hubungan linear yang kuat diantara beberapa variabel prediktor yang dimasukkan kedalam model regresi,seperti: variabel- variabel ekonomi yang kebanyakan terkait satu dengan yang lain (intercorrelation). Berikut akan diberikan cara-cara

  mengidentifkasiadanya kasus Multikolinieritas:

  1. Menghitung dan menguji koefsien korelasi diantara variabel-variabel prediktor. Terjadi kasus Multikolinieritas ketika terdapat korelasi yang kuat (atau signifkan) diantara variabel- variabel prediktor.

  2. Mengecek nilai standard error dari masing-masing koefsien regresi [se(β)]. Kasus Multikolinieritas biasanya terjadi ketika nilai standard error dari koefsien regresi membesar, sehingga hasil ini akan cenderung menerima H (menyimpulkan bahwa koefsien regresi tidak signifkan) pada pengujian signifkansi parameter/koefsien regresi. Hal ini dapat terjadi, meskipun nilai koefsien regresinya tidak mendekati nol.

  3. Menjumpai adanya output pengujian serentak koefsien masing variabel prediktor tidak ada yang signifkan.

  4. Membandingkan output koefsien regresi dengan

  koefsien korelasiantara variabel respon dan

  prediktor. Pertama, kasus Multikolinieritas biasanya terjadi ketika terdapat perubahan hasil pengujian signifkansi pada koefsien regresi dan koefsien korelasi, seperti: koefsien korelasi antara y dan X 1 adalah 0,765 dengan p-value = 0,001

  (signifkan karena p-value < 5%), kemudian pada pemodelan regresi diperoleh koefsien regresi antara y dan X 1 sebesar 0,065 dengan p-value = 0,191 (tidak signifkan karena p-value > 5%). Kedua, terjadi kasus Multikolinieritas ketika terdapat perubahan tanda koefsien (+/-) pada koefsien regresi dan koefsien korelasi, seperti: koefsien korelasi antara y dan

  X 1 adalah 0,765 , kemudian pada pemodelan regresi diperoleh koefsien regresi antara y dan X 1 sebesar -0,659 (terjadi perubahan tanda dari positif menjadi negatif).

  5. Melakukan pemeriksaan nilai Variance Infation Factor (VIF) dari masing-masing variabel prediktor. Kasus Multikolinieritas [2] terjadi ketika nilai VIF j > 10 .

  Solusi Kasus Multikolinearitas

Solusi Multikolinearitas pada penulisan ini diberikan dalam empat

  saran, yaitu:

  1. Menambahkan atau menggantikan data sampel baru karena terkadang sampel lain tidak memiliki kasus Multikolineritas yang sangat serius.

  2. Menghapus salah satu variabel prediktor yang mengalami kasus Multikolinearitas, namun cara ini sekaligus memaksa peneliti untuk melakukan kesalahan pengukuran (menghapus variabel penelitian yang seharusnya diukur).

  3. Mengabaikan kasus Multikolineritas selama tidak

  terjadi masalah yang sangat serius, seperti: perubahan hasil

  pengujian signifkansi atauperubahan tanda antara koefsien regresi dengan koefsien korelasi.

  4. Menggunakan metode yang lebih advance, seperti: Stepwise Regression,Best Subset Regression, Principal

  Component Regression, dan Ridge Regression.

  Asumsi Autokorelasi

Asumsi Autokorelasi merupakan asumsi residual yang memiliki

  komponen/nilai yang berkorelasi berdasarkan waktu (urutan waktu) pada himpunan data itu sendiri. Proses Autokorelasi terjadi ketika kovarian antara ε i dengan ε i tidak sama dengan nol dengan

  Pada pengujian asumsi ini, diharapkan asumsi Autokorelasi tidak terpenuhi.Penyebab terjadinya kasus Autokorelasi adalah:

  1. Terdapat variabel prediktor penting yang tidak dimasukkan kedalam model regresi.

  2. Pola hubungan antara y dan X tidak linear (kuadratik, kubik, atau nonlinear) ketika digambarkan dalam scatterplot.

  3. Data pengamatan yang diambil merupakan data yang dicatat menurut waktu tertentu (data time series), seperti: perjam, harian, mingguan, bulanan, triwulan, kuartal, dan tahunan.

  4. Adanya Manipulasi Data yang menyebabkan residual data terbentuk secara sistematik. Berikut diberikan cara-cara mengidentifkasi adanya kasus Autokorelasi:

  1. Pengujian Durbin-Watson yang menguji adanya autokorelasi [4] pada lag-1. Pada Tabel Durbin-Watson diperoleh Output Tabel, yaitu nilai Durbin-Watson batas bawah (d L ) dan batas atas (d U ). Kriteria pemeriksaanasumsi Autokorelasi residual menggunakan Nilai Durbin-Watson (d), yaitu:

  1. Jika d < 2 dan d < d L , maka residual bersifat autokorelasi positif.

  2. Jika d < 2 dan d > d U , maka residual tidak bersifat autokorelasi.

  3. Jika d < 2 dan d L ≤ dd U , maka hasil pengujian tidak dapat disimpulkan.

  4. Jika d > 2 dan 4 – d < d L , maka residual bersifat autokorelasi negatif.

  5. Jika d > 2 dan 4 – d > d U , maka residual tidak bersifat autokorelasi.

  6. Jika d > 2 dan d L ≤ 4 – dd U , maka hasil pengujian tidak dapat disimpulkan.

  2. Pengujian Autocorrelation Function (ACF) yang menguji adanya autokorelasi pada lag-1, lag-2, lag-3, dan seterusnya. Pada uji ACF, kasus autokorelasi terjadi ketika ada lag pada plot ACF yang keluar batas signifkansi (margin error).

  3. Pengujian Autokorelasi lainnya, seperti: Uji Breusch-Godfrey dan Uji Ljung-Box (gunakan software EVIEWS).

  Solusi Kasus Autokorelasi

Solusi Autokorelasi pada penulisan ini diberikan dalam tiga saran, yaitu: terkadang sampel lain tidak memiliki kasus Autokorelasi yang sangat serius.

  2. Menggunakan model regresi linear berganda dengan residualnyamengikuti proses Autoregressive orde 1 atau AR(1) yang diestimasi secara simultan (gunakan software EVIEWS) dengan rumusan

  Asumsi Heteroskedatisitas

Asumsi Heteroskedatisitas adalah asumsi residual dari model regresi

  yang memiliki varian tidak konstan. Pada pemeriksaan ini, diharapkan asumsi Heteroskedatisitas tidak terpenuhi karena model regresi linier berganda memiliki asumsi varian residual yang konstan (Homoskedatisitas). Penyebabterjadinya kasus heteroskedatisitas adalah:

  1. Terdapat kesalahan input komponen/nilai variabel respon pada beberapa prediktor, sehingga pada komponen prediktor yang berbeda memiliki komponen variabel respon yang sama, seperti: Untuk X = 5 dan X = 6, diperoleh nilai y = 0,9 .

  2. Kasus Heteroskedatisitas terjadi secara alami pada variabel-variabel ekonomi, seperti: kasus rumah tangga dengan pendapatan yang berbeda terkadang memiliki pengeluaran yang hampir sama.

  3. Terdapat pengaruh Heteroskedatisitas pada data time

  series yang umum terjadi pada variabel-variabel ekonomi yang memiliki volatilitas (contoh: infasi, return saham, dll).

  4. Adanya Manipulasi Data yang menyebabkan residual data memiliki varian yang sistematik. Berikut diberikan cara-cara mengidentifkasi adanya kasus Heteroskedatisitas:

  1. Dilakukan pemeriksaan dengan metode Grafk, seperti:

  1. Pemeriksaan output scatter plot dari variabel respon (y) pada sumbu-Y dengan masing-masing variabel prediktornya (X) pada sumbu-X.

  2. Pemeriksaan output scatter plot dari variabel residual (e) pada sumbu-Y dengan variabel prediksi respon (y-hat) pada sumbu-X.

  3. Pemeriksaan output scatter plot dari variabel residual (e) pada sumbu-Y dengan masing-masing variabel

  [1]

  pola tertentu sebagai berikut : Gambar 1. Plot Residual dengan pola: (a) plot nol; (b) megafon terbuka kanan; (c) megafon terbuka kiri; (d) double outward box; (e)–(f) nonlinearitas; (g)–(h) kombinasi dari fungsi nonlinearitas dan varian tidak konstan. Plot (a) adalah plot nol yang mengindikasikan tidak ada masalah dengan model regresi (tidak ada kasus Heteroskedatisitas). Plot (b)–(d)mengindikasikan residual dengan varian tidak konstan (ada kasus Heteroskedatisitas). Plot (e)–

  (f) menunjukkan fungsi mean atau model regresi yang tidak

  sesuai (menunjukkkan nonlineritas), misalnya: pola hubungan 2 antara y dan X yang berbentuk kuadratik (y = a + bX + cX + ε) tetapi dimodelkan dengan model linear (y = a + bX + ε).

  Plot (g)–(h)menunjukkan kejadian fungsi mean yang tidak sesuai dan residual dengan varian tidak konstan (ada kasus Heteroskedatisitas).

  2. Dilakukan pengujian dengan metode Formal, meliputi: Uji Park, Uji Glejser, Uji Goldfeld-Quandt, Uji Breusch-Pagan/Godfrey, dan Uji White (gunakan software EVIEWS).

  Solusi Kasus Heteroskedatisitas

Solusi Heteroskedatisitas pada penulisan ini diberikan dalam empat

  saran, yaitu:

  1. Menambahkan atau menggantikan data sampel baru karena terkadang sampel lain tidak memiliki kasus Heteroskedatisitas

  (y) dan variabel prediktor (x), seperti: transformasi ln, akar kuadrat, dan Box-Cox.

  3. Menggunakan metode estimasi yang lebih advance, seperti: generalized least squares (GLS) dan weighted least

  squares (WLS).

  4. Menggunakan model regresi linear berganda dengan residualnyamengikuti Autoregressive Conditionally

  Heteroscedastic orde 1, atau ARCH(1) yang diestimasi secara

  simultan (gunakan software EVIEWS) dengan rumusan atau residualnya mengikuti Generalized ARCH orde 1 dan 1, atau GARCH(1,1) yang diestimasi secara simultan (gunakan software EVIEWS) dengan rumusan

  Asumsi Normalitas

Asumsi Normalitas adalah asumsi residual yang berdistribusi Normal.

  Asumsi ini harus terpenuhi untuk model regresi linear yang baik. Uji Normalitas dilakukan pada nilai residual model regresi. Penyebab terjadinya kasus Normalitas adalah:

  1. Terdapat data residual dari model regresi yang memiliki nilai data yang berada jauh dari himpunan data atau data ekstrim (outliers), sehingga penyebaran datanya menjadi non- Normal.

  2. Terdapat kondisi alami dari data yang pada dasarnya tidak berdistribusi Normal atau berdistribusi lain, seperti: distribusi binormal, multinormal, eksponensial, gamma, dll. Berikut diberikan cara-cara mengidentifkasi adanya kasus Normalitas:

  1. Dilakukan pemeriksaan dengan metode Grafk, yaitu pemeriksaan Normalitas dengan output normal P-P plot atau Q-Q plot. Asumsi Normalitas terpenuhi ketika pencaran data residual berada disekitar garis lurus melintang seperti pada gambar ini.

  Gambar 2. Output plot probabilitas dari residual yang berdistribusi Normal. Berikut diberikan juga beberapa plot probabilitas dari residual yang mungkin terjadi.

  Gambar 3. Variasi bentuk plot probabilitas dari residual.

  2. Dilakukan pengujian dengan metode Formal, seperti: pengujian normalitas yang dilakukan melalui uji Kolmogorov- Smirnov, uji Anderson-Darling, uji Shapiro-Wilk, dan uji Jarque- Bera yang mana semua pengujian ini memiliki hipotesis interpretasi, yaitu:

  H : Residual berdistribusi Normal H 1 : Residual tidak berdistribusi Normal Asumsi Normalitas terpenuhi ketika pengujian normalitas menghasilkan P-value (Sign.) lebih besar dari α dengan nilai α ditentukan sebesar 1%, 5%, atau 10%.

  Solusi Kasus Normalitas

  Solusi Normalitas pada penulisan ini diberikan dalam empat saran, yaitu:

  1. Menghapus data pengamatan yang memiliki nilai outliers pada data residualnya.

  2. Melakukan transformasi variabel terhadap variabel respon (y) dan variabel prediktor (X). Transformasi yang digunakan adalah transformasi ln, akar kuadrat, dan Box-Cox.

  3. Menggunakan transformasi pilihan untuk menstimulasi Normalitas [3] , yaitu: transformasi ln-skewness (gunakan software STATA) yang dilakukan pada variabel respon (y), kemudian transformasi yang terbentuk diterapkan juga pada variabel prediktornya (X). Ketentuan transformasi ini dilakukan dengan mentransformasikan y dalam ln|y – k| secara iteratif sehingga ditemukan suatu nilai k yang menyebabkan nilai skewness-nya mendekati nol.

  4. Menggunakan metode estimasi yang lebih advance, seperti: Regresi dengan pendekatan Bootstrapping (gunakan software SPSS versi 19), Regresi Nonparametrik, dan Regresi dengan pendekatan Bayessian (gunakan software WinBugs).

  REFERENSI

[1] Weisberg, S., (2005), Applied Linear Regression, Third Edition, New Jersey: John Wiley

&

  Sons.

[2] Hocking, R.R., (2003), Methods and Applications of Linear Models: Regression and the

Analysis of Variance, Second Edition, New Jersey: John Wiley & Sons.

  

[3] Aff, A.A., dan Clark, V. (1999), Computer-Aided Multivariate Analysis, Third Edition,

New York: CRC Press.

[4] Draper, N.R. dan Smith, H., (1998), Applied Regression Analysis, Third Edition,

Canada: John Wiley & Sons.

  

Diposkan oleh

  Label: 14 komentar: 1.

  

  ingin tanya pak, saya pernah menulis artikel tentang fungsi autocorrelation dalam hal penentuan pola time series data penjualan barang apakah musiman, tren, ataukah stasioner, adakah teknik selain fungsi autocrrelation ya pak? berikut artikel http://datacomlink.blogspot.com/2015/12/data-mining-identifikasi-pola-data-time.html

  

  1.

7 Desember 2015 20.50

  Umumnya pake ACF dan PACF. Klau lebih mudah pake saja seleksi model automatis seperti yang ada pada software jMulti (automatic model selection). http://www.jmulti.de/

   2.

  mohon maa sebelumnya..apakah ada teori yang mengatan untuk melakukan transformasi data dalam bentuk LN dan sebagainya? jika ada teori siapa dan di buku mana. terima kasih

  1.

  coba cari teori di google tentang Box-Cox Transformation, cari saja file pdfnya.. Klau bukunya banyak coba cari dan download di libgen.info

   3.

  

  ass. pak boleh ngga sih saya memakai uji linear berganda tapi uji asumsi klasik tidak saya masukan?

  1.

  Boleh saja.. Asal pendekatan yang digunakan bukan pendekatan parametrik (atau regresi yang biasa/sering digunakan). Gunakan pendekatan Nonparametrik dengan menggunakan Regresi linear berganda dengan Metode Boottrapping (Gunakan SPSS/STATA) atau Metode Jackknife(STATA).. Atau yang advance gunakan pendekatan Bayessian (WinBugs)..

  

  4.

  Ass pak saya mau tanya apakah data primer (kuesioner) tidak diwajibkan menggunakan uji asumsi klasik krna sudah terdapat uji kualitas data (validitas & reliabilitas) tlong dijawab. Terimakasih

  1.

24 Agustus 2016 14.25

  Uji asumsi itu wajib hukumnya kalau regresinya diestimasi dengan pendekatan parametrik, seperti: estimasi n pengujian parameter model regesi yang didasarkan pada distribusi Normal. Asumsi klasik bisa diabaikan kecuali multikolineritas yang serius (ditunjukkan dari koefisien korelasi dan koefisien regresi berbeda tanda

  • /- nya dan/atau nilai standar error yang sangat besar) ketika regresinya diestimasi dengan pendekatan nonparametrik (Bootstrap, Jackknife, dll) dan Bayessian.

   5.

  

  Mau tanya pak... jika saya melakukan penelitian menggunakan kuesioner dan alat pengukuran menggunakan skala likert, apakah wajib untuk untuk menggunakan uji asumsi klasik? Mohon penjelasannya... trims

  1.

28 September 2016 22.40

  Klau pake regresi linear berganda dengan pendekatan OLS biasa atau parametrik yang wajib memenuhi asumsi klasik. Namun, kalau hasilnya ngak lolos uji asumsi, pertama tetap pake pendekatan parametrik dengan metode cancelasi dan penambahan data satupersatu sampai asumsi data tercapai, atau kedua beralih memakai pendekatan nonparametik (regresi jackknife) atau pendekatan bayessian (regresi bayessian)

   6.

  pak saya mau tanya, skripsi saya menggunakan regresi linier sederhana, uji asumsi klasik yang di pakai apa2 saja?

  terimakasih

  1.

  Asumsi Linearitas, Normalitas, Autokorelasi, dan heteroskedatisitas 7.

  assalamualaikum pak, saya mau tanya pak. skripsi saya menggunakan analisis linear berganda pak, dimana 3 variabel X dan 1 variabel Y. uji analisis apa saja yang harus saya gunakan pak ? dan sebaiknya menggunakan aplikasi apa pak ? terimakasih pak.

  

  1.

  Klau model regresi dibentuk dengan pendekatan parametrik, asumsi klasik hrus terpenuhi semua. SPSS sudah banyak yang pake tp yang jarang pake STATA lebih advance dan ngak jauh beda dengan SPSS karena tinggal klik saja

  

  Link ke posting ini

  Langganan:

TOTAL TAYANGAN 889,500

  Website ini Berisi Penawaran Jasa Pengolahan Data dan Konsultasi Statistik, serta Review Materi Statistika berdasarkan Referensi Statistika yang Ada.

JADILAH YANG TERBAIK TULISAN POPULER

BLOG TEMAN

  

  

    

   o

   o

   o

    o

  

  STATSDATA adalah suatu usaha yang bergerak dibidang Bimbingan, Konsultan, dan Jasa Pengolahan Data Statistik untuk data penelitianSkripsi, Tesis, dan Disertasi pada Semua Disiplin Ilmu Pengetahuan.

  

  

  

  

    

  

  

   