Resume Model Regresi Linier berganda
Resume Model Regresi
Linier
Oleh:
Ivana Gabriella
Rimbi Puspita Dini
Lailatul Putri S.
17 Februari 2014
(111810101021)
(111810101037)
(111810101040)
Model Regresi Linier
3.1 Model Linier
Missal Y menunjukkan variabel yang dihubungkan dengan K variabel bebas
1,
,
dari fungsi .
=
Ketika
1,
,
+
(3.1)
linier, persamaan (3.1) ditulis
=
1 1
+
+
+
(3.2)
yang disebut model regresi linier.
3.2 Prinsip Kuadrat Terkecil Biasa (OLS)
Misal B himpunan vektor-vektor
= ℝk . untuk mencari
. Kita punya
′
= ( 1,
,
)
dari B yaitu meminimumkan jumlah kuadrat-kuadrat residual.
2
=
′
=
−
=
=1
′
−
(3.7)
diberikan oleh X dan y
=
′
+
′
′
−2 ′ ′
(3.8)
dan diturunkan terhadap
=2
2
2
′
−2 ′
(3.9)
=2 ′
(3.10)
Penyamaan derivatif pertama sampai nol disebut persamaan normal
′
= ′
(3.11)
Teorema 3.1
, dugaan dari y, memiliki nilai yang sama untuk semua solusi ′
=
(i)
(ii)
= ′
, jumlah persamaan yang didefinisikan di (3.7), mencapai minimum untuk
beberapa solusi ′
= ′
Bukti :
−
′
=
(i)
′
=
−
dengan
′
=
−
(ii)
′
−
=
′
=
=
′
−
=
′
−
′
′ (w independen)
−
′
−
′
=
+
−
+
−
′
−
−
+
−
−2 ′
′
−
+
−
′
−
′
=
′
′
′
−
′
−
+
−
+2
−
′
′
( − ) , gunakan (3.11)
( −
)
+ ′ ′
′
=
′
− ′
(3.14)
3.3 Sifat-Sifat Geometri dari OLS
Untuk X matriks TxK, didefinisikan daerah kolom
ℛ( ) = θ: θ = Xβ , βϵℝK
merupakan daerah bagian ℝT . Jika x = X′X
1/2
untuk x ∈ ℝT , prinsip kuadrat terkecil
sama seperti meminimumkan y − θ untuk θ ∈ ℛ( ).
Teorema 3.2
Nilai minimum dari y − θ untuk θ ∈ ℛ( ) dicapai pada � yaitu ( − �) ⊥ ℛ( ) oleh
karena itu
− � vektor ortogonal dari ℛ( ) ketika � proyeksi ortogonal y pada ℛ( )
sehingga menghasilkan eksplisit
�=� =
dimana � =
′
−
′
−
′ proyeksi ortogonal pada ℛ( )
′
(3.15)
bukti :
misal θ ∈ ℛ( ) sedemikian hingga ( − � ) ⊥ ℛ( ), sehingga ′
−�
2
−�+�−� ′
=
=
Karena syarat
−� ′
−�+�−�
−� + �−� ′ �−�
−� ′
−�
dicapai ketika � = �.
−�
− � = 0.
2
habis menggunakan kondisi yang ortogonal. Minimum
3.4 Estimasi Tak Bias Linier Terbaik
3.4.1 Teorema Dasar
′ = �2
=0,
(3.17)
dan X telah ditentukan atau matriks non stokastik berorder TxK, dengan rank lengkap K.
Lemma 3.3
< ∞ , �(. ) menyatakan varians, dan dimana �
=� ,�
Misal T statistik sehingga
merupakan parameter skalar. Kondisi perlu dan cukup T adalah MVUE (estimator tak bias
varians minimum) dari parameter � adalah
,
= 0 dan �( ) < ∞
= 0 ∀ sehingga
(3.18)
Bukti perlu :
Misal T MVUE dan t sedemikian hingga
setiap
�
⇒
⇒
+
2
�
∈ ℝ dan
=�
+2
,
2
+
,
�
=0
+2
,
0∀
= 0 dan �( ) < ∞ .
+
tak bias � untuk
�
Bukti cukup :
Misal
estimator tak bias dengan varians terbatas
�( − ) < ∞ , dan
�
=�
+
−
=�
=�
+�
−
+ �( − )
+2
�
−
sedemikian hingga
, −
−
=0,
′
Misal
= ( 1,
) estimasi tak bias dari parameter vektor � ′ = �1 ,
,
matriks.
�( 1 )
−� ′ =
−�
=
disebut sebaran matriks T.
( ,
2)
( ,
2)
…
,
( 1,
…
�( )
(3.19)
adalah MDUE (estimator tak bias sebaran minimum) dari �
0
− ( 0 ) non negatif atau
jika
1)
( 1,
,�
− ( 0)
(3.20)
=�
untuk T sedemikian hingga
Lemma 3.4
Jika
0
Bukti :
adalah MVUE � , = 1,
Pertimbangkan ′
0
,
, ′0 =
10 ,
tak bias untuk ′�. Karena
itu menunjukkan bahwa
,
adalah MDUE �
0
0,
= 0 untuk t sehingga
=0,
( ′ 0 , ) = 0 , yang ditunjukkan
′
�
dimana T estimator alternatif
0
0
=
′
0
′
(3.21)
.
0
(3.22)
Diperoleh persamaan karakteristik MDUE t dari � pada �0 :
, �0 = 0 ∀ sehingga
Misal
+
+ ′ fungsi linier dengan dugaan nol maka
′
′
=
+
⇒
= 0,
′
=0∀
=0
� = 0 ∀�
(3.23)
∈ ℛ( )
dimana Z matriks yang direntangkan pada kolom daerah ortogonal ℛ( ) dengan rank(Z)=Trank(X)
′
= ′ ′
(3.25)
Teorema 3.5
MDLUE (estimator linier tak bias sebaran minimum) dari
=
seperti estimator kuadrat terkecil
−1
′
adalah
′
(3.26)
dan sebaran matriks minimum adalah
�2
−1
′
(3.27)
Bukti :
+
Misal
estimator tak bias
maka
+
Jika
=
∀
+
⇒
= 0,
=
(3.28)
MDLUE gunakan persamaan (3.23)
0=
′
,
= �2
⇒
∀
′
=0⇒
∀
′
=
(3.29)
sehingga
=
′
= ⇔
=
,
′
=
−1
,
′
=
′
−1
′
(3.30)
diberikan MDLUE
=
−1
′
=
′
dengan sebaran matriks
′
=
=
= �2
′
Teorema 3.6
Misal
′
′
−1
−1
′
−1
′
′
fungsi linier
MDLUE dari ′ dimana
dimana
′
−
′
′
−1
−1
= �2
′
−1
sehingga ℛ( ) ⊂ ℛ( ′)
=
invers dari X’X.
′
−
maka
= ′
untuk beberapa
′ , dan sebaran matriks ′ adalah � 2 ′
′
−
.
,
Bukti :
Misal
=
Maka
=
estimator tak bias ′ maka
, ′
′ ′
=
′
⇒
= �2
=
′
′
=
−
′.
′
= ′
=0⇒
′ untuk beberapa B.
=
= ′ , memberikan
MDLUE dari ′ adalah
sehingga ( ′ ) = � 2 ′
bukan estimasi
parametrik
′
−
= ′
.
′
−
−
′
= ′
memiliki satu solusi, dan
′ = ′
tapi dapat digunakan untuk menghitung estimasi-estimasi terbaik fungsi
yang dapat diestimasikan.
3.4.2 Estimator Linier
Definisi 3.7
disebut estimator homogen dari
= 0, dilain sisi
jika
disebut
inhomogeneous.
Fungsi kuadrat dari variabel acak
, ,
dimana
−
=
0
adalah simetris dan
adalah
′
−
× -matrik.
(3.39)
Definisi 3.8 Persamaan Kuadrat dari sebuah estimator
dari
adalah terbatas
sebagai
, ,
−
=
′
Definisi 3.9 (R(A) superior) sebuah estimator
sebuah ( )-peningkatan dari estimator yang lain
1,
−
,
2,
1
−
2
(3.40)
dari
dari
,
disebut
( ) superior atau
jika
0
(3.41)
3.4.3 Kesalahan Rata-Rata Dispersi
Kesalahan rata-rata disperse didefinisikan sebagai matrik
,
=
−
kemudian kita menandakan estimator kovarian matrix
−
′
oleh �
(3.42)
:
=
jika
, maka
�
−
=
akan disebut tak bias untuk
bias. Perbedaan dari
dan
,
tak bias, maka
′
. Jika
adalah
,
jika
−
(3.43)
≠ , maka
disebut
−
=
=0
(3.44)
Berikut ini merupakan dekomposisi dari kesalahan pembubaran rataan:
,
=
�
−
−
+
+
,
,
−
−
+
′
′
=
(3.45)
Hal tersebut adalah kesalahan pembubaran rataan dari sebuah estimator adalah jumlah dari
kovarian matriks dan akar bias.
MDE superior
Definisi 3.10 (criteria I MDE) diberikan
Kemudian
2
disebut MDE-superior ke
1
1 (atau
2
dan
2
sebagai dua estimator dari .
disebut peningkatan MDE dari
1)
jika
turunan dari matriks MDE adalah nonnegatif terbatas, jika
∆
1,
2
=
−
1,
Bentuk fungsi skalar dari MDE yaitu:
, ,
=
2,
0
(3.46)
,
Teorema 3.11 Mempertimbangkan dua estimator
(3.47)
1
dan
2
dari . Berikut ini merupakan
pernyataan yang equivalen:
1,
−
,
=
untuk semua matrik dengan tipe
2,
,
=
′.
∆
∆
1, 2
1,
2
1,
2
0,
(3.48)
0
(3.49)
Bukti : Menggunakan (3.46) dan (3.47) kita mendapatkan
1,
,
dari teorema A.43 berikut bahwa
jika dan hanya jika ∆
1, 2
0.
−
2,
∆
,
1,
=
2
∆
0 untuk semua matrik
(3.50)
=
′
0
3.5
Estimasi (Prediksi) Kesalahan dengan Syarat � dan ��
Perkiraan
oleh
, sehingga diperoleh sisa
−
=
dimana � =
−
′
−�
=
(3.51)
′ adalah operator proyeksi di ℛ( ), sebagi sebuah estimator dari ,
dengan prediksi rataan kesalahan:
−
=
−�
=
= �2
−�
−�
= �2
−�
(3.52)
Teorema 3.12 Prediksi MDLU dari sebagai yang didefinisikan dalam (3.51).
Bukti: Diberikan ′ menjadi prediksi takbias dari . Maka
kesalahan dari dispersi adalah
Ambil −
′
−
=
′
=
′
=
′
′
=0∀ ⟹
′
−
= �2
′
(3.53)
′
−
, maka masalah tersebut menemukan
min
=0
−
=
(3.54)
Ketika � dan Z Memutar keseluruhan ℝ , kita dapat menulis
′
Diberikan
=�
+
′
′
=
=
=
=
dengan persamaan ketika
=
dari
1
2
=
−
=
dengan
1
−
′
−�
′
′
=
=�
′
=
′
−�
′
=
�
+
′
= 0. Maka
dan prediksi terbaik dari adalah
Menggunakan prediksi
′
′
′
−
′
−
′
′
=
−
′
′
+
+
′
−
′
′
,
′
′
=
�
′
−
′
−�
=
kita dapat memperoleh estimator tak bias dari � 2 sebagai
1
−
−�
=
1
−
′
�2
=
−
−�
(3.55)
−�
= �2
−
= �2
−
3.6
Pengelompokkan Regresi dibawah Kesalahan Normal
Semua hasil yang diperoleh adalah benar tanpa tergantung dengan distribusi nyata
dari distibusi acak
vektor
dari distribusi acak
= � 2 . Kita asumsikan bahwa
dibagi menurut suatu T-dimensi distribusi normal
(0, � 2 ), dengan kemungkinan kepadatan:
; 0, � 2
Komponen
′
= 0 dan
dengan ketentuan
2�� 2
=
=1
1
−
2
exp −
1
2� 2
= (2�� 2 )−2 exp − 2� 2
1
=1
2
2
(3.56)
( = 1, … , ) adalah bebas dan identik dengan distribusi
Hal ini merupakan suatu kasus umum dari T-dimensi distribusi normal
kepadatan
(�; , �) =
�
2�
1
2
−
0, � 2 .
= ( , �) dengan
1
exp − (� − )′� −1 (� − )
2
(3.57)
Pengelompokan model regresi linier dibawah kesalahan normal diberikan oleh
=
+ ,
~ (0, � 2 )
,
(3.58)
=
3.6.1 Prinsip Maximum-Likelihood (ML)
Definisi 3.13 Diberikan � = �1 , … , �
′ adalah sebuah variable acak
= �; � dimana parameter vektor � = �1 , … , �
dengan fungsi kepadatan
adalah unsur dari ruang parameter Ω yang berisi semua nilai dapat diterima.
′
Gagasan dasar dari prinsip ML adalah untuk mempertimbangkan kepadatan
= �; � untuk suatu perwujudan spesifik dari sampel�0 dari � sebagai fungsi
dari �:
� =
�1 , … , �
=
= �; �
� akan dikenal sebagai fungsi likelihood dari � yang diberikan oleh �0 .
Prinsip ML mendalilkan pilihan suatu nilai Θ ∈ Ω yang memaksimalkan
fungsi likelihood adalah
Θ
L Θ
3.6.5 Estimasi ML dalam Regresi Normal Klasik
Menurut Teorema A.82, kita mempunyai
Θ∈Ω
dari (3.58)
=
jadi fungsi likelihood dari
, �2
+ ~
diberikan oleh
, � 2 = (2�� 2 )−2 exp − 2� 2
1
(3.59)
−
′
−
(3.60)
Karena perubahan logaritma adalah monoton, dan hal tersebut sesuai untuk
, � 2 sebagai ganti dari
memaksimalkan ln
, � 2 , dengan argumen maksimal
yang tidak dapat berubah:
ln
1
, � 2 = − ln 2�� 2 − 2� 2
2
−
′
−
(3.61)
Jika tidak ada pembatasan utama dari parameter, maka ruang parameter yang
diberikan oleh Ω =
; �2 :
∈ ℝ ; � 2 > 0 . Kita memperoleh estimasi ML dari
dan � 2 dengan penyamaan derivatif pertama dengan nol (Teorema A.91-A.95):
ln
ln
=
=−
�2
1
2� 2
2� 2
+
Persamaan Likelihood diberikan oleh:
�2 =
1
2
′
1
2 �2 2
′
−
Teorema 3.14 Estimator ML dan OLS dari
−
=0
′
−
= ′
′
−
(3.62)
=0
−
(3.63)
(3.64)
adalah identik dalam model (3.59)
regresi normal klasik. Estimaror � 2 dan � 2 adalah asimtot tak bias.
3.7
Pengujian Hipotesis Linier
Dalam bagian ini kita akan mempertimbangkan masalah pengujian hipotesis linier
umum 0 :
= . Dengan R a K x s-matriks dan rank (R) = K-s, terhadap
alternatif 1 :
≠ di mana diasumsikan bahwa R dan r adalah non stokastik.
Hipotesis 0 merupakan vektor parameter β sesuai dengan K-s pembatas linier yang
tepat, independen linier, karena rank (R) = K-s. Hipotesis linier umum memiliki kasus
utama yaitu:
0
Kasus 1: = 0. × −
1 dalam bentuk berikut:
0:
adalah asumsi dari rank (X) = K, dengan
=
−1
=
∗
> 0.
Kasus 2:
−
×
∗
≠
1:
×
melengkapi R tersebut dengan
adalah reguler rank K. Diperoleh:
−1
1
×1
=
=
×
,
−
Kemudian dapat ditulis:
=
−1
×∈ =
1
=
2
=
Hipotesis
0:
2
1:
2
=
0
1
;
�2 > 0
1
+
setara dengan
1
≠ ;
1 1
2 2
,
×
2
×1
2
×
=
=
Ω
Θ
Θ
+� .
Ω=
; �2 :
; �2:
∈ℝ
), dan
1
⊂ Ω sub ruang di mana
∈ ℝ , �2 > 0 ,
= ; �2 > 0
,
Yang dapat diturunkan dengan cara berikut
Diketahui : Θ =
, �2
, �2 =
= 2�� 2
−
, � 2 , maka
, �2
2
−
,
+�
Sebagai uji statistika digunakan rasio likelihood, sebagai berikut:
⋋
−
�2 > 0
Ω seluruh ruang parameter ( 0
hanya 0
, sehingga
=
+�
1
=
−
1
2� 2
−
′
−
= 2�� 2
−
2
exp −
Oleh karena itu; ⋋
Di mana � 2
=
2
−
�2
2
�Ω2
�Ω2 adalah ML estimator dari � 2 bawah
di Ω.
0
Variabel acak ⋋
dapat mengambil nilai diantara 0 dan 1, jika
, pembilang dari ⋋
harus lebih besar dari penyebutnya, sehingga ⋋
harus
0
mendekati 1 dalam sampel berulang. Di sisi lain, ⋋
harus mendekati 0 jika 1 adalah
benar. Transformasi linier dari ⋋
:
=
−
⋋
=
2
� 2 −� Ω2
�Ω2
−
.
−1
−
Jika ⋋→ 0, maka → ∞, dan jika ⋋→ 1 maka
dan F cukup besar jika 1 adalah benar.
−
−
−1
→ 0, sehingga F dekat 0 jika
0
Menentukan F dan distribusi dua kasus hipotesis linier umum sebagai berikut:
Kasus 1: � = �
Model linier di bawah
0
∗
=
diberikan oleh
dan� 2 =
1
Model linier di atas Ω diperoleh dari teorema 3.14:
−
dan �Ω2 =
=
Berdasarkan perhitungan kemudian dihasilkan uji statistika:
− ∗
−
=
Distribusi F
′
′
′
−
∗
−
−
∙
Pembilang:
−
∗
=
−
= +
′
−1
′
′ independen dan dari Rank K,
−
∗ ′
′
−1
−
∗
′
+
−
~
∗
=
′
−
∗
′
∗ ′
∗
, �2
−1
′
−
1
∗
−
′
−
2
~� 2
(� −2
−
~� 2
2
∗ ′
′
0
∗
−
)
Penyebut:
′
−
−� = −
Diketahui :
−�
−1
′
(
′
−
−
=
′
−�
2
2
~� 2
=
′
−�
−
′adalah independen dari Rank T-K
)−1
′
=0
Berdasarkan di atas maka pembilang dan penyebut didistribusikan secara independen.
Dengan demikian rasio F memiliki properti sebagai berikut:
F didistribusikan sebagai , − (� −2 ( − ∗ )′ ′
−
F didistribusikan sebagai pusat , − di bawah 0 : =
0:
Daerah penerimaan
0
>
Daerah kritis :
− , − ,1−
∗
) di bawah
.
1
,
− , − ,1−
Kasus 2 : � > 0
∗
.
Mempertimbangkan dekomposisi model untuk menentukan ML estimator di bawah
membandingkan yang sesuai dengan ML estimator di atas Ω.
′
Diberikan
′
1
=
,
1 ×
Dan masing-masing
=
Menempatkan
′
2
1×
=
−
−
+ =
1 1
+
2 2
+
2
Karena Rank (X) = K, maka
(
1)
×
= ,
′
−1
1 1
sehingga matriks invers
ML estimator di bawah
Dan � 2 =
1
−
( 2)
=
×( − )
rank
1 1
dan
0 diberikan
′
−
1 1
− ,
′
−1
2 2
oleh
2
ada
= ,
2
=
′
−1 ′
1 1
1
0 dan
Pemisah b
−1
′
1 2
′
2 2
′
1 1
′
2 1
=
−1
′
=
′
′
1
′
2
Menggunakan rumus untuk invers dari hasil matriks dipartisi (teorima A.19)
′
−1
1 1
′
′
−1 ′
−1
1 2
2 1
1 1
′
−1
−1 ′
1 1
2
=
Di mana
′
2
1 2 dan
1
= −
′
2
=
1
=
2
2
2
=
−1
′
2
′
2
1
1
+
2( 2
− ) ,
1
=−
=−
′
−1 ′
1 1
1 2
2
′
−1 ′
1 1
1 2
−
−1
′
2
−
′
2 1
=
−1
−
1
− =
1
−
−1
= −�
,
1
′
−1 ′
1 1
1 2
′
2
′
2
−1
′
2
1
1
1
′
−1 ′
1 1
1
=
−1
′
−1 ′
1 1
1 2
−1 ′
2 1
′
−1 ′
1 1
1
=
1
−1
′
−1 ′
1 1
1
1
′
−1 ′
1 1
1
=
2
=
′
−1 ′
1 1
1 2
−1
−
−
2 2
−
−
,
2
2 2
−
.
Dekomposisi ���
Menulis dengan menggunakan simbol u dan v:
−
=
−
2
−
Dengan demikian ML estimator
berikut:
−
′
−
1 1
−
�Ω2 =
=
′
1
1
−
+
′
−
1
′
+
2
2
−
−2 ′ =
−
=
−
dapat diuraikan sebagai
′
−
′
=
� 2 − �Ω2 =
Atau
2
−
−
Diperoleh untuk kasus 2 :
′
1 1
′
−
2
−
−
1 1
2
−
′
∙
−
−
2
−
> 0 yaitu:
−
−
′
2
=
Distribusi F
−
−
2
′
Pembilang:
=
1 2
′
2
−1
1
adalah independen
=
=
=
′
2
1
=
=
−
−
2
1 2
= +
~ (
2
~� 2
~� 2
Penyebut:
2
−
di bawah
Karena
diperoleh
−�
2
−
−
0
−
′
=
−�
−�
2
2
′
2
−�
2
1
−
, �2 )
−
′
−
= ′
2
−�
=
−�
1
−�
=
1
− ,
′
=
1,
2
−1
−
2
� −2
−
=
2
′
2
−1
=
′
2
−1
1 2
~ �2
1,
−�
1 2
−
−1
′
2
2
−�
1
=0
−
2
= 0,0
Sehingga pembilang dan penyebut adalah distribusi independen. Jadi statistika uji F
didistribusikan di bawah 1 sebagai − , − (� −2 2 − ′
) dan sebagai pusat
2−
− , − di bawah 0 .
Daerah penerimaan
0
pada tingkat signifikan α diberikan oleh 0
Dengan demikian, daerah kritis diberikan oleh
>
− , − ,1−
.
− , − ,1−
Linier
Oleh:
Ivana Gabriella
Rimbi Puspita Dini
Lailatul Putri S.
17 Februari 2014
(111810101021)
(111810101037)
(111810101040)
Model Regresi Linier
3.1 Model Linier
Missal Y menunjukkan variabel yang dihubungkan dengan K variabel bebas
1,
,
dari fungsi .
=
Ketika
1,
,
+
(3.1)
linier, persamaan (3.1) ditulis
=
1 1
+
+
+
(3.2)
yang disebut model regresi linier.
3.2 Prinsip Kuadrat Terkecil Biasa (OLS)
Misal B himpunan vektor-vektor
= ℝk . untuk mencari
. Kita punya
′
= ( 1,
,
)
dari B yaitu meminimumkan jumlah kuadrat-kuadrat residual.
2
=
′
=
−
=
=1
′
−
(3.7)
diberikan oleh X dan y
=
′
+
′
′
−2 ′ ′
(3.8)
dan diturunkan terhadap
=2
2
2
′
−2 ′
(3.9)
=2 ′
(3.10)
Penyamaan derivatif pertama sampai nol disebut persamaan normal
′
= ′
(3.11)
Teorema 3.1
, dugaan dari y, memiliki nilai yang sama untuk semua solusi ′
=
(i)
(ii)
= ′
, jumlah persamaan yang didefinisikan di (3.7), mencapai minimum untuk
beberapa solusi ′
= ′
Bukti :
−
′
=
(i)
′
=
−
dengan
′
=
−
(ii)
′
−
=
′
=
=
′
−
=
′
−
′
′ (w independen)
−
′
−
′
=
+
−
+
−
′
−
−
+
−
−2 ′
′
−
+
−
′
−
′
=
′
′
′
−
′
−
+
−
+2
−
′
′
( − ) , gunakan (3.11)
( −
)
+ ′ ′
′
=
′
− ′
(3.14)
3.3 Sifat-Sifat Geometri dari OLS
Untuk X matriks TxK, didefinisikan daerah kolom
ℛ( ) = θ: θ = Xβ , βϵℝK
merupakan daerah bagian ℝT . Jika x = X′X
1/2
untuk x ∈ ℝT , prinsip kuadrat terkecil
sama seperti meminimumkan y − θ untuk θ ∈ ℛ( ).
Teorema 3.2
Nilai minimum dari y − θ untuk θ ∈ ℛ( ) dicapai pada � yaitu ( − �) ⊥ ℛ( ) oleh
karena itu
− � vektor ortogonal dari ℛ( ) ketika � proyeksi ortogonal y pada ℛ( )
sehingga menghasilkan eksplisit
�=� =
dimana � =
′
−
′
−
′ proyeksi ortogonal pada ℛ( )
′
(3.15)
bukti :
misal θ ∈ ℛ( ) sedemikian hingga ( − � ) ⊥ ℛ( ), sehingga ′
−�
2
−�+�−� ′
=
=
Karena syarat
−� ′
−�+�−�
−� + �−� ′ �−�
−� ′
−�
dicapai ketika � = �.
−�
− � = 0.
2
habis menggunakan kondisi yang ortogonal. Minimum
3.4 Estimasi Tak Bias Linier Terbaik
3.4.1 Teorema Dasar
′ = �2
=0,
(3.17)
dan X telah ditentukan atau matriks non stokastik berorder TxK, dengan rank lengkap K.
Lemma 3.3
< ∞ , �(. ) menyatakan varians, dan dimana �
=� ,�
Misal T statistik sehingga
merupakan parameter skalar. Kondisi perlu dan cukup T adalah MVUE (estimator tak bias
varians minimum) dari parameter � adalah
,
= 0 dan �( ) < ∞
= 0 ∀ sehingga
(3.18)
Bukti perlu :
Misal T MVUE dan t sedemikian hingga
setiap
�
⇒
⇒
+
2
�
∈ ℝ dan
=�
+2
,
2
+
,
�
=0
+2
,
0∀
= 0 dan �( ) < ∞ .
+
tak bias � untuk
�
Bukti cukup :
Misal
estimator tak bias dengan varians terbatas
�( − ) < ∞ , dan
�
=�
+
−
=�
=�
+�
−
+ �( − )
+2
�
−
sedemikian hingga
, −
−
=0,
′
Misal
= ( 1,
) estimasi tak bias dari parameter vektor � ′ = �1 ,
,
matriks.
�( 1 )
−� ′ =
−�
=
disebut sebaran matriks T.
( ,
2)
( ,
2)
…
,
( 1,
…
�( )
(3.19)
adalah MDUE (estimator tak bias sebaran minimum) dari �
0
− ( 0 ) non negatif atau
jika
1)
( 1,
,�
− ( 0)
(3.20)
=�
untuk T sedemikian hingga
Lemma 3.4
Jika
0
Bukti :
adalah MVUE � , = 1,
Pertimbangkan ′
0
,
, ′0 =
10 ,
tak bias untuk ′�. Karena
itu menunjukkan bahwa
,
adalah MDUE �
0
0,
= 0 untuk t sehingga
=0,
( ′ 0 , ) = 0 , yang ditunjukkan
′
�
dimana T estimator alternatif
0
0
=
′
0
′
(3.21)
.
0
(3.22)
Diperoleh persamaan karakteristik MDUE t dari � pada �0 :
, �0 = 0 ∀ sehingga
Misal
+
+ ′ fungsi linier dengan dugaan nol maka
′
′
=
+
⇒
= 0,
′
=0∀
=0
� = 0 ∀�
(3.23)
∈ ℛ( )
dimana Z matriks yang direntangkan pada kolom daerah ortogonal ℛ( ) dengan rank(Z)=Trank(X)
′
= ′ ′
(3.25)
Teorema 3.5
MDLUE (estimator linier tak bias sebaran minimum) dari
=
seperti estimator kuadrat terkecil
−1
′
adalah
′
(3.26)
dan sebaran matriks minimum adalah
�2
−1
′
(3.27)
Bukti :
+
Misal
estimator tak bias
maka
+
Jika
=
∀
+
⇒
= 0,
=
(3.28)
MDLUE gunakan persamaan (3.23)
0=
′
,
= �2
⇒
∀
′
=0⇒
∀
′
=
(3.29)
sehingga
=
′
= ⇔
=
,
′
=
−1
,
′
=
′
−1
′
(3.30)
diberikan MDLUE
=
−1
′
=
′
dengan sebaran matriks
′
=
=
= �2
′
Teorema 3.6
Misal
′
′
−1
−1
′
−1
′
′
fungsi linier
MDLUE dari ′ dimana
dimana
′
−
′
′
−1
−1
= �2
′
−1
sehingga ℛ( ) ⊂ ℛ( ′)
=
invers dari X’X.
′
−
maka
= ′
untuk beberapa
′ , dan sebaran matriks ′ adalah � 2 ′
′
−
.
,
Bukti :
Misal
=
Maka
=
estimator tak bias ′ maka
, ′
′ ′
=
′
⇒
= �2
=
′
′
=
−
′.
′
= ′
=0⇒
′ untuk beberapa B.
=
= ′ , memberikan
MDLUE dari ′ adalah
sehingga ( ′ ) = � 2 ′
bukan estimasi
parametrik
′
−
= ′
.
′
−
−
′
= ′
memiliki satu solusi, dan
′ = ′
tapi dapat digunakan untuk menghitung estimasi-estimasi terbaik fungsi
yang dapat diestimasikan.
3.4.2 Estimator Linier
Definisi 3.7
disebut estimator homogen dari
= 0, dilain sisi
jika
disebut
inhomogeneous.
Fungsi kuadrat dari variabel acak
, ,
dimana
−
=
0
adalah simetris dan
adalah
′
−
× -matrik.
(3.39)
Definisi 3.8 Persamaan Kuadrat dari sebuah estimator
dari
adalah terbatas
sebagai
, ,
−
=
′
Definisi 3.9 (R(A) superior) sebuah estimator
sebuah ( )-peningkatan dari estimator yang lain
1,
−
,
2,
1
−
2
(3.40)
dari
dari
,
disebut
( ) superior atau
jika
0
(3.41)
3.4.3 Kesalahan Rata-Rata Dispersi
Kesalahan rata-rata disperse didefinisikan sebagai matrik
,
=
−
kemudian kita menandakan estimator kovarian matrix
−
′
oleh �
(3.42)
:
=
jika
, maka
�
−
=
akan disebut tak bias untuk
bias. Perbedaan dari
dan
,
tak bias, maka
′
. Jika
adalah
,
jika
−
(3.43)
≠ , maka
disebut
−
=
=0
(3.44)
Berikut ini merupakan dekomposisi dari kesalahan pembubaran rataan:
,
=
�
−
−
+
+
,
,
−
−
+
′
′
=
(3.45)
Hal tersebut adalah kesalahan pembubaran rataan dari sebuah estimator adalah jumlah dari
kovarian matriks dan akar bias.
MDE superior
Definisi 3.10 (criteria I MDE) diberikan
Kemudian
2
disebut MDE-superior ke
1
1 (atau
2
dan
2
sebagai dua estimator dari .
disebut peningkatan MDE dari
1)
jika
turunan dari matriks MDE adalah nonnegatif terbatas, jika
∆
1,
2
=
−
1,
Bentuk fungsi skalar dari MDE yaitu:
, ,
=
2,
0
(3.46)
,
Teorema 3.11 Mempertimbangkan dua estimator
(3.47)
1
dan
2
dari . Berikut ini merupakan
pernyataan yang equivalen:
1,
−
,
=
untuk semua matrik dengan tipe
2,
,
=
′.
∆
∆
1, 2
1,
2
1,
2
0,
(3.48)
0
(3.49)
Bukti : Menggunakan (3.46) dan (3.47) kita mendapatkan
1,
,
dari teorema A.43 berikut bahwa
jika dan hanya jika ∆
1, 2
0.
−
2,
∆
,
1,
=
2
∆
0 untuk semua matrik
(3.50)
=
′
0
3.5
Estimasi (Prediksi) Kesalahan dengan Syarat � dan ��
Perkiraan
oleh
, sehingga diperoleh sisa
−
=
dimana � =
−
′
−�
=
(3.51)
′ adalah operator proyeksi di ℛ( ), sebagi sebuah estimator dari ,
dengan prediksi rataan kesalahan:
−
=
−�
=
= �2
−�
−�
= �2
−�
(3.52)
Teorema 3.12 Prediksi MDLU dari sebagai yang didefinisikan dalam (3.51).
Bukti: Diberikan ′ menjadi prediksi takbias dari . Maka
kesalahan dari dispersi adalah
Ambil −
′
−
=
′
=
′
=
′
′
=0∀ ⟹
′
−
= �2
′
(3.53)
′
−
, maka masalah tersebut menemukan
min
=0
−
=
(3.54)
Ketika � dan Z Memutar keseluruhan ℝ , kita dapat menulis
′
Diberikan
=�
+
′
′
=
=
=
=
dengan persamaan ketika
=
dari
1
2
=
−
=
dengan
1
−
′
−�
′
′
=
=�
′
=
′
−�
′
=
�
+
′
= 0. Maka
dan prediksi terbaik dari adalah
Menggunakan prediksi
′
′
′
−
′
−
′
′
=
−
′
′
+
+
′
−
′
′
,
′
′
=
�
′
−
′
−�
=
kita dapat memperoleh estimator tak bias dari � 2 sebagai
1
−
−�
=
1
−
′
�2
=
−
−�
(3.55)
−�
= �2
−
= �2
−
3.6
Pengelompokkan Regresi dibawah Kesalahan Normal
Semua hasil yang diperoleh adalah benar tanpa tergantung dengan distribusi nyata
dari distibusi acak
vektor
dari distribusi acak
= � 2 . Kita asumsikan bahwa
dibagi menurut suatu T-dimensi distribusi normal
(0, � 2 ), dengan kemungkinan kepadatan:
; 0, � 2
Komponen
′
= 0 dan
dengan ketentuan
2�� 2
=
=1
1
−
2
exp −
1
2� 2
= (2�� 2 )−2 exp − 2� 2
1
=1
2
2
(3.56)
( = 1, … , ) adalah bebas dan identik dengan distribusi
Hal ini merupakan suatu kasus umum dari T-dimensi distribusi normal
kepadatan
(�; , �) =
�
2�
1
2
−
0, � 2 .
= ( , �) dengan
1
exp − (� − )′� −1 (� − )
2
(3.57)
Pengelompokan model regresi linier dibawah kesalahan normal diberikan oleh
=
+ ,
~ (0, � 2 )
,
(3.58)
=
3.6.1 Prinsip Maximum-Likelihood (ML)
Definisi 3.13 Diberikan � = �1 , … , �
′ adalah sebuah variable acak
= �; � dimana parameter vektor � = �1 , … , �
dengan fungsi kepadatan
adalah unsur dari ruang parameter Ω yang berisi semua nilai dapat diterima.
′
Gagasan dasar dari prinsip ML adalah untuk mempertimbangkan kepadatan
= �; � untuk suatu perwujudan spesifik dari sampel�0 dari � sebagai fungsi
dari �:
� =
�1 , … , �
=
= �; �
� akan dikenal sebagai fungsi likelihood dari � yang diberikan oleh �0 .
Prinsip ML mendalilkan pilihan suatu nilai Θ ∈ Ω yang memaksimalkan
fungsi likelihood adalah
Θ
L Θ
3.6.5 Estimasi ML dalam Regresi Normal Klasik
Menurut Teorema A.82, kita mempunyai
Θ∈Ω
dari (3.58)
=
jadi fungsi likelihood dari
, �2
+ ~
diberikan oleh
, � 2 = (2�� 2 )−2 exp − 2� 2
1
(3.59)
−
′
−
(3.60)
Karena perubahan logaritma adalah monoton, dan hal tersebut sesuai untuk
, � 2 sebagai ganti dari
memaksimalkan ln
, � 2 , dengan argumen maksimal
yang tidak dapat berubah:
ln
1
, � 2 = − ln 2�� 2 − 2� 2
2
−
′
−
(3.61)
Jika tidak ada pembatasan utama dari parameter, maka ruang parameter yang
diberikan oleh Ω =
; �2 :
∈ ℝ ; � 2 > 0 . Kita memperoleh estimasi ML dari
dan � 2 dengan penyamaan derivatif pertama dengan nol (Teorema A.91-A.95):
ln
ln
=
=−
�2
1
2� 2
2� 2
+
Persamaan Likelihood diberikan oleh:
�2 =
1
2
′
1
2 �2 2
′
−
Teorema 3.14 Estimator ML dan OLS dari
−
=0
′
−
= ′
′
−
(3.62)
=0
−
(3.63)
(3.64)
adalah identik dalam model (3.59)
regresi normal klasik. Estimaror � 2 dan � 2 adalah asimtot tak bias.
3.7
Pengujian Hipotesis Linier
Dalam bagian ini kita akan mempertimbangkan masalah pengujian hipotesis linier
umum 0 :
= . Dengan R a K x s-matriks dan rank (R) = K-s, terhadap
alternatif 1 :
≠ di mana diasumsikan bahwa R dan r adalah non stokastik.
Hipotesis 0 merupakan vektor parameter β sesuai dengan K-s pembatas linier yang
tepat, independen linier, karena rank (R) = K-s. Hipotesis linier umum memiliki kasus
utama yaitu:
0
Kasus 1: = 0. × −
1 dalam bentuk berikut:
0:
adalah asumsi dari rank (X) = K, dengan
=
−1
=
∗
> 0.
Kasus 2:
−
×
∗
≠
1:
×
melengkapi R tersebut dengan
adalah reguler rank K. Diperoleh:
−1
1
×1
=
=
×
,
−
Kemudian dapat ditulis:
=
−1
×∈ =
1
=
2
=
Hipotesis
0:
2
1:
2
=
0
1
;
�2 > 0
1
+
setara dengan
1
≠ ;
1 1
2 2
,
×
2
×1
2
×
=
=
Ω
Θ
Θ
+� .
Ω=
; �2 :
; �2:
∈ℝ
), dan
1
⊂ Ω sub ruang di mana
∈ ℝ , �2 > 0 ,
= ; �2 > 0
,
Yang dapat diturunkan dengan cara berikut
Diketahui : Θ =
, �2
, �2 =
= 2�� 2
−
, � 2 , maka
, �2
2
−
,
+�
Sebagai uji statistika digunakan rasio likelihood, sebagai berikut:
⋋
−
�2 > 0
Ω seluruh ruang parameter ( 0
hanya 0
, sehingga
=
+�
1
=
−
1
2� 2
−
′
−
= 2�� 2
−
2
exp −
Oleh karena itu; ⋋
Di mana � 2
=
2
−
�2
2
�Ω2
�Ω2 adalah ML estimator dari � 2 bawah
di Ω.
0
Variabel acak ⋋
dapat mengambil nilai diantara 0 dan 1, jika
, pembilang dari ⋋
harus lebih besar dari penyebutnya, sehingga ⋋
harus
0
mendekati 1 dalam sampel berulang. Di sisi lain, ⋋
harus mendekati 0 jika 1 adalah
benar. Transformasi linier dari ⋋
:
=
−
⋋
=
2
� 2 −� Ω2
�Ω2
−
.
−1
−
Jika ⋋→ 0, maka → ∞, dan jika ⋋→ 1 maka
dan F cukup besar jika 1 adalah benar.
−
−
−1
→ 0, sehingga F dekat 0 jika
0
Menentukan F dan distribusi dua kasus hipotesis linier umum sebagai berikut:
Kasus 1: � = �
Model linier di bawah
0
∗
=
diberikan oleh
dan� 2 =
1
Model linier di atas Ω diperoleh dari teorema 3.14:
−
dan �Ω2 =
=
Berdasarkan perhitungan kemudian dihasilkan uji statistika:
− ∗
−
=
Distribusi F
′
′
′
−
∗
−
−
∙
Pembilang:
−
∗
=
−
= +
′
−1
′
′ independen dan dari Rank K,
−
∗ ′
′
−1
−
∗
′
+
−
~
∗
=
′
−
∗
′
∗ ′
∗
, �2
−1
′
−
1
∗
−
′
−
2
~� 2
(� −2
−
~� 2
2
∗ ′
′
0
∗
−
)
Penyebut:
′
−
−� = −
Diketahui :
−�
−1
′
(
′
−
−
=
′
−�
2
2
~� 2
=
′
−�
−
′adalah independen dari Rank T-K
)−1
′
=0
Berdasarkan di atas maka pembilang dan penyebut didistribusikan secara independen.
Dengan demikian rasio F memiliki properti sebagai berikut:
F didistribusikan sebagai , − (� −2 ( − ∗ )′ ′
−
F didistribusikan sebagai pusat , − di bawah 0 : =
0:
Daerah penerimaan
0
>
Daerah kritis :
− , − ,1−
∗
) di bawah
.
1
,
− , − ,1−
Kasus 2 : � > 0
∗
.
Mempertimbangkan dekomposisi model untuk menentukan ML estimator di bawah
membandingkan yang sesuai dengan ML estimator di atas Ω.
′
Diberikan
′
1
=
,
1 ×
Dan masing-masing
=
Menempatkan
′
2
1×
=
−
−
+ =
1 1
+
2 2
+
2
Karena Rank (X) = K, maka
(
1)
×
= ,
′
−1
1 1
sehingga matriks invers
ML estimator di bawah
Dan � 2 =
1
−
( 2)
=
×( − )
rank
1 1
dan
0 diberikan
′
−
1 1
− ,
′
−1
2 2
oleh
2
ada
= ,
2
=
′
−1 ′
1 1
1
0 dan
Pemisah b
−1
′
1 2
′
2 2
′
1 1
′
2 1
=
−1
′
=
′
′
1
′
2
Menggunakan rumus untuk invers dari hasil matriks dipartisi (teorima A.19)
′
−1
1 1
′
′
−1 ′
−1
1 2
2 1
1 1
′
−1
−1 ′
1 1
2
=
Di mana
′
2
1 2 dan
1
= −
′
2
=
1
=
2
2
2
=
−1
′
2
′
2
1
1
+
2( 2
− ) ,
1
=−
=−
′
−1 ′
1 1
1 2
2
′
−1 ′
1 1
1 2
−
−1
′
2
−
′
2 1
=
−1
−
1
− =
1
−
−1
= −�
,
1
′
−1 ′
1 1
1 2
′
2
′
2
−1
′
2
1
1
1
′
−1 ′
1 1
1
=
−1
′
−1 ′
1 1
1 2
−1 ′
2 1
′
−1 ′
1 1
1
=
1
−1
′
−1 ′
1 1
1
1
′
−1 ′
1 1
1
=
2
=
′
−1 ′
1 1
1 2
−1
−
−
2 2
−
−
,
2
2 2
−
.
Dekomposisi ���
Menulis dengan menggunakan simbol u dan v:
−
=
−
2
−
Dengan demikian ML estimator
berikut:
−
′
−
1 1
−
�Ω2 =
=
′
1
1
−
+
′
−
1
′
+
2
2
−
−2 ′ =
−
=
−
dapat diuraikan sebagai
′
−
′
=
� 2 − �Ω2 =
Atau
2
−
−
Diperoleh untuk kasus 2 :
′
1 1
′
−
2
−
−
1 1
2
−
′
∙
−
−
2
−
> 0 yaitu:
−
−
′
2
=
Distribusi F
−
−
2
′
Pembilang:
=
1 2
′
2
−1
1
adalah independen
=
=
=
′
2
1
=
=
−
−
2
1 2
= +
~ (
2
~� 2
~� 2
Penyebut:
2
−
di bawah
Karena
diperoleh
−�
2
−
−
0
−
′
=
−�
−�
2
2
′
2
−�
2
1
−
, �2 )
−
′
−
= ′
2
−�
=
−�
1
−�
=
1
− ,
′
=
1,
2
−1
−
2
� −2
−
=
2
′
2
−1
=
′
2
−1
1 2
~ �2
1,
−�
1 2
−
−1
′
2
2
−�
1
=0
−
2
= 0,0
Sehingga pembilang dan penyebut adalah distribusi independen. Jadi statistika uji F
didistribusikan di bawah 1 sebagai − , − (� −2 2 − ′
) dan sebagai pusat
2−
− , − di bawah 0 .
Daerah penerimaan
0
pada tingkat signifikan α diberikan oleh 0
Dengan demikian, daerah kritis diberikan oleh
>
− , − ,1−
.
− , − ,1−