hasil panen gandum, pada suhu, curah hujan, jumlah cahaya matahari, dan pupuk. Ketergantungan seperti itu memungkinkan peramalan hasil panen rata-rata dengan
dasar infomasi mengenai variabel yang menjelaskan. Hasil panen disebut variabel tak bebas dependent variabel, dan suhu, curah hujan, jumlah cahaya matahari,
pupuk disebut variabel yang menjelaskan explanatory variabel. Dalam penulisan ini akan digunkan lambang huruf Y untuk variabel tak bebas dan huruf X untuk
variabel yang menjelaskan,
1
,
2
, … ,
merupakan variabel yang menjelaskan yang ke k.
A. Analisis Regresi Linier Sederhana
Analisis regresi linier sederhana hanya mempelajari dua variabel, yaitu satu variabel tak bebas dan satu variabel yang menjelaskan yang berhubungan
secara linier. Linieritas dalam regresi adalah linieritas dalam parameter yang artinya parameter yang terdapat dalam model regresi berpangkat satu dan tidak
dibagi atau dikalikan dengan parameter lain. Upaya untuk mengetahui hubungan antara variabel tak bebas dengan variabel yang menjelaskan dimulai dengan
mencari bentuk terdekat dari hubungan tersebut dengan cara menyajikan data yang telah diketahui dalam sebuah kurva atau grafik yang disebut diagram pencar
Scaater plot. Diagram pencar menggambarkan titik-titik pengamatan, dan setiap titik pengamatan ditentukan oleh pasangan
, .
Jika diambil suatu garis yang mewakili rata-rata dari seluruh titik-titik pengamatan, maka akan diperoleh garis lurus. Garis lurus tersebut adalah garis
regresi. Secara ilmu ukur, garis regresi merupakan suatu tempat kedudukan rata- rata Y pada X tertentu.
Rata-rata dari seluruh titik-titik pengamatan merupakan rata-rata bersyarat variabel tak bebas Y untuk variabel bebas X tertentu, dilambangkan
| , | juga sering disebut nilai harapan Y pada X tertentu. Jika titik- titik pengamatan tersebut berada di sekitar garis regresi maka menunjukkan bahwa
kedua variabel tersebut saling berhubungan secara linier. Jelas bahwa rata-rata bersyarat
| merupakan fungsi dari .Setelah bentuk hubungan antara
variabel X dan variabel Y tersebut diketahui, lalu selanjutnya merumuskan ke dalam suatu persamaan matematis.
Misalkan terdapat data populasi dari penelitian belanja konsumsi suatu keluarga Y yang dipengaruhi oleh pendapatan keluarga X, dan setelah
digambarkan dalam diagram pencar ternyata data tersebut berada disekitar nilai rata-rata bersyarat Y untuk X tertentu [
| ], maka | merupakan fungsi dari
. Nilai-nilai | ternyata membentuk garis lurus, maka dapat
disimpulkan bahwa | merupakan fungsi linier dari
. Karena dalam keadaan nyata tidak diperoleh data seluruh populasi, maka bentuk fungsi
belum diketahui, sehingga sebagai pendekatan pertama model persamaan garis regresi
populasi PRP dapat dituliskan: =
+
1
3.1.1 dimana
dan
1
merupakan parameter-paremeter yang tidak diketahui besarnya tetapi bersifat tetap dan dikenal sebagai koefisien regresi.
dan
1
secara berturut-turut dikenal sebagai intersep dan koefisien kemiringan.
Karena nilai Y yang sebenarnya tidak selalu sama dengan nilai harapan dari Y, maka model 3.1.1 dapat ditulis:
= + �