Error atau Residual Sum of Squares
Pertemuan 10
- Outline:
- – Multiple Linear Regression and Correlation – Non Linear Regression
STATISTIKA INDUSTRI 2
- – Montgomery, D.C., Runger, G.C., Applied Statistic
th
TIN 4004 and Probability for Engineers , 5 Ed. John Wiley & Sons, Inc., 2011.
- – Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K.,
th
Probability & Statistics for Engineers & Scientists , 9 Ed. Prentice Hall, 2012.
Multiple Linear Regression Multiple Linear Regression
- Terdiri atas lebih dari satu independent • Terdiri atas lebih dari satu independent variable
variable
- Metode yang digunakan untuk estimasi • Metode yang digunakan untuk estimasi koefisien:
koefisien:
- – Least square estimation (metode kuadarat – Least square estimation (metode kuadarat terkecil)
terkecil)
- – Normal equation (Persamaan Normal) – Normal equation (Persamaan Normal)
- – Matrix approach (Sistem Matriks) – Matrix approach (Sistem Matriks)
Multiple Linear Regression Multiple Linear Regression
Estimator of Variance
- Residual:
dengan
- – the difference between the observation
nilai
- –
- Residual:
- Variance Estimator
- – Contoh soal:
- Variance Estimator
- – 2 - 1 = 7, maka:
- – (2,365)(0,303) < B 1 < 0,564 + (2,365)(0
- 0,153 < B 1 < 1,281
- – (2,365)(0,313) < B 2 <
- – (2,365)(0,313) 0,359 < B 2 < 1,839
- ∑
- = Y
- – k - 1
- 2
- – k – 1 SI 2 - Regresi & Korelasi Berganda 16 Pengujian Hipotesis Individual - lan
- Coba uji secara 2 arah parameter B1 dan B2 dengan menggunakan taraf nyata sebesar = 0,05 dari soal di atas secara individual maupun serentak!
- – 3 =7 SI 2 - Regresi & Korelasi Berganda
- strong dependencies among regressor
- Coefficient of multiple determination variables
- – The estimates of the regression coefficients are very imprecise and affects the stability of the
- Adjoint
- – To detect:
- Significant F-test of significance of regression, but tests on the individual regression coefficients are not significant
- Uji Koefisien Subset
- Uji Koefisien Subset
- – Test the siginificance of a set of variables. Test contribution of new variables.
- – Menggunakan uji F Partial F-test
- – Area Penolakan: >
- – Contoh: Kasus Wire Bond Strength
- , … , )/
- GLM is the mathematical framework used in many common statistical analysis, including multiple regression and ANOVA
- – ANOVA is typically prsented as distinct from multiple regression but it IS a multiple regression
- Appropriate when the predictors (independent variables) are all categorical and the outcome (dependent variable) is continous
- Linear, pairs of variables are assumed to have linear relations
- Additive, if one set of variables predict another variable, the effect are thought to be additive
- BUT! This does not preclude testing non-linear or non additive effects (by doing some transformations)
- – Most common application is to analyze data from randomized experiments
- More specifically, randomized experiments that generate more than 2 means
- – If only 2 means thes use:
- Dependent (paired) t-test
- Polynomial Regression Models
- – Bersifat curvilinear
- Logistic Regression
- – For non normal distribution data, binary responses
- Cari kasus permasalahan yang diselesaikan dengan:
- – Multiple Linear Regression – Non Linear Regression
- Selesaikan dengan menggunakan software statistik
- Interpretasikan hasil output software tersebut
- Catatan:
- – Kasus yang digunakan tidak boleh sama antar kelompok
1
» H : B
1
= B
2
= 0 (X
1
dan X
2
tidak mempengaruhi Y) » H
1
: B
B
Pengujian Hipotesis Serentak Langkah-langkah pengujian:
2
0 (X
1
dan X
2
mempengaruhi Y atau paling tidak ada X yang mempengaruhi Y
2. Menentukan taraf nyata (
) dan nilai F tabel » Taraf ( ) dan nilai F tabel ditentukan dengan derajat bebas
1 = k dan 2 = n - k -1 SI 2 - Regresi & Korelasi Berganda 12 F (
1
)(
2
1. Menentukan formulasi hipotesis
Merupakan pengujian hipotesis koefisien regresi berganda dengan hanya satu B (B 1 atau B 2 ) yang mempengaruhi Y.
Multiple Linear Regression Estimator of Variance
b 1 – t (α/2, n-k-1).
Multiple Linear Regression Estimator of Variance
Error atau Residual Sum of Squares Multiple Linear Regression
Estimator of Variance
Contoh soal:
2 =
2 =? ? ? ?
Interval Keyakinan Bagi penduga B
1 dan B
2 SI 2 - Regresi & Korelasi Berganda 10 Pengujian menggunakan distribusi t dengan derajat bebas (db) = n – m,
Dengan contoh soal sebelumnya, dgn ∝ =5%, db = n – m = n – k -1 = 10
Interval keyakinan bagi penduga B 1 adalah
S b1 < B 1 < b 1 + t (α/2, n-k-1).
Pengujian Hipotesis individual
S b1 0,564
Interval keyakinan bagi penduga B2 adalah
b 2 – t (α/2, n-k-1).
S b2 < B 2 < b 2 + t (α/2, n-k-1).
S b2 1,099
Pengujian Parameter Koefisien Regresi Berganda SI 2 - Regresi & Korelasi Berganda 11 Bertujuan untuk menentukan apakah ada sebuah hubungan linear antar
variabel tidak bebas Y dengan variabel bebas X 1 , X 2 ,… ,X k .
Ada 2 bentuk pengujian hipotesis bagi koefisien regresi berganda:
1. Pengujian hipotesis serentak
2. Pengujian hipotesis individual
Pengujian Hipotesis Serentak
Merupakan pengujian hipotesis koefisien regresi berganda dengan B 1 dan B 2 serentak atau secara bersama-sama mempengaruhi Y.
) = …….
3. Menentukan kriteria pengujian
4. Menentukan nilai uji statistik dengan tabel ANOVA
2 Pengujian Hipotesis Individual Langkah-langkah pengujian:
1
terhadap Y) H
i
= 0 (tidak ada pengaruh X
i
H : B
1. Menentukan formulasi hipotesis
1
2
1
2 =
5. Membuat kesimpulan Menyimpulkan apakah H diterima atau ditolak SI 2 - Regresi & Korelasi Berganda 15
) = koefisien penentu atau koefisien determinasi berganda
2
Pengujian Hipotesis Serentak - lanjutan KPB = (R
Dimana: KPB = (R 2 ) = koefisien penentu atau koefisien determinasi berganda n = jumlah sampel atau
: B
> 0 (ada pengaruh positif X
i
Langkah-langkah pengujian:
SI 2 - Regresi & Korelasi Berganda 18
5. Membuat kesimpulan SI 2 - Regresi & Korelasi Berganda 17 Latihan
4. Menentukan nilai uji statistik
(n-m)
H ditolak jika t < t
H diterima jika t ≥ t (n-m)
3. Menentukan kriteria pengujian
) dan nilai t tabel db = n
i
2. Menentukan taraf nyata (
terhadap Y)
i ≠ 0 (ada pengaruh X i
terhadap Y) B
i
< 0 (ada pengaruh negatif X
i
terhadap Y) B
2 n KPB KPB F
1
) 3 (
2
) Error
2
, X
1
Regresi (X
SI 2 - Regresi & Korelasi Berganda 13 Sumber Variasi Jumlah Kuadrat Derajat Bebas Rata-rata Kuadrat F
)
)(
JKR k JKE n - k -1
1
(
) H ditolak jika F > F
2
)(
1
H diterima jika F ≤ F(
Pengujian Hipotesis Serentak - lanjutan Langkah-langkah pengujian:
JKR JKE k n
RKR RKE Total JKT n - 1
nilai Fo dapat pula ditentukan dengan menggunakan rumus:
∑ ∑
1 JKE = JKT - JKR
1
1
2
2
2
X n Y X b Y X n Y X b JKR
1 ( ) ( )
Pengujian Hipotesis Serentak - lanjutan SI 2 - Regresi & Korelasi Berganda 14
1
2
2
y x b y x b JKR
2 Y n Y y JKT
2
2
∑ - = ∑ =
Jawab (pengujian individual)- lanjutan Jawab (pengujian individual)
1. Menentukan formulasi hipotesis
3. Menentukan kriteria pengujian
H : B = 0 (tidak ada pengaruh X terhadap Y) H diterima jika t < t = 2,365 dan t > t = - 2,365 1 1 i (0,025;7) i (0,025;7) H : B terhadap Y) 1 1 ≠ 0 (ada pengaruh X 1 H ditolak jika t > t = 2,365 dan t < t = - 2,365 i (0,025;7) i (0,025;7)
Dan H : B = 0 (tidak ada pengaruh X terhadap Y) 2 2
4. Menentukan nilai uji statistik
Untuk uji B Untuk uji B
1
2
2. Menentukan taraf nyata ( ) dan nilai t tabel
∝ = 0,05 derajat bebas = 10
t = 2,365 (0,025;7) 19 SI 2 - Regresi & Korelasi Berganda 20 Multiple Linear Regression
Jawab (pengujian individual)- lanjutan Correlation
5. Kesimpulan
Karena t
1 1,859 < 2,365 Maka terima hipotesis H : B = 0
1 Karena t
2 3,511 > 2,365 Maka tolak H : B = 0 o
2 Berarti:
tidak ada hubungan linier antara variabel
X dgn Y
1 ada hubungan linier antara variabel
X dgn Y SI 2 - Regresi & Korelasi Berganda 21
2 Multiple Linear Regression Multiple Linear Regression
Correlation Multicollinearity
2
2 regression coefficients.
Multiple Linear Regression Uji Hipotesa
( = , = − )
− ,
= ( | , , … ,
/( − ) =
( , , … , − )/
Multiple Linear Regression Uji Hipotesa
= . / . = .
NOTE: partial F-test to a single variable = t-test General Linear Model (GLM)
Characteristics of GLM
Analysis of Variance (ANOVA)
Nonlinear Regression Beberapa Jenis Nonlinear Regression: