2.2.3. Cara-cara Menaksir
Penaksir terbaik yaitu penaksir tak bias dan bervarians minimum belum tentu memperoleh nilai taksiran parameter yang benar-benar tepat. Keakuratan penaksiran
dapat ditingkatkan dengan memperbesar sampel, tetapi ini tidak menjamin bahwa nilai taksiran yang berasal dari suatu sampel akan sama dengan parameter yang ditaksir.
Untuk itu harus dicari interval taksiran yang di dalamnya diharapkan terdapat nilai parameter yang sebenarnya.
Suatu interval taksiran dari parameter adalah interval yang berbentuk
̂ ̂
. Karena sampel yang berbeda akan menghasilkan nilai ̂ yang berbeda,
demikian pula dengan ̂
dan ̂
,maka kedua titik itu dapat dipandang sebagai nilai bagi peubah padanannya
̂ dan
̂ . Dari sebaran penarikan sampel untuk
̂ dapat ditentukan
̂ dan
̂ sehingga
̂ ̂
dimana , maka akan dihasilkan suatu interval yang mengandung
. Interval ̂ ̂
disebut selang kepercayaan,
disebut koefisien kepercayaan, dan ̂ dan
̂ masing-
masing disebut batas kepercayaan sebelah atas dan sebelah bawah.
2.2. Distribusi Pareto
Distribusi pareto berasal dari nama seorang ekonom yaitu Vilfredo Pareto 1848- 1923 yang mengamati bahwa 85 kekayaan di Milan dimiliki oleh hanya 15 dari
penduduknya. Distribusi pareto disebut juga dengan distribusi
power la w.
Universitas Sumatera Utara
Definisi: 1.
Jika
X
adalah variabel acak berdistribusi pareto, maka probabilitas bahwa
X
lebih besar dari beberapa nilai
x
diberikan oleh :
{
dimana dan adalah parameternya.
2. Jika
X
adalah variabel acak berdistribusi pareto, maka
Cumulative Distribution Function
CDF dari variabel acak Pareto dengan parameter dan adalah :
{
dimana dan adalah parameternya.
3. Jika
X
adalah variabel acak berdistribusi pareto, maka
P robability Density Function
PDF dari variabel acak pareto dengan parameter dan adalah :
{
Universitas Sumatera Utara
Gambar 2.1
Probability Density Function
Distribusi Pareto untuk berbagai nilai
k
Gambar 2.2
Probability Density Function
Distribusi Pareto untuk berbagai nilai
0.000 0.200
0.400 0.600
0.800 1.000
1.200
2 4
6 8
10 12
k = 1 k = 3
k = 5
-1.000 0.000
1.000 2.000
3.000 4.000
5.000 6.000
5 10
15 α = 1
α = 3 α = 3
Universitas Sumatera Utara
Gambar 2.3
Cumulative Distribution Function
Distribusi Pareto untuk berbagai nilai
Gambar 2.4
Cumulative Distribution Function
Distribusi Pareto untuk berbagai nilai
0.2 0.4
0.6 0.8
1 1.2
2 4
6 8
10 12
α = 1 α = 3
α = 3
-0.1 0.1
0.2 0.3
0.4 0.5
0.6 0.7
0.8 0.9
1
2 4
6 8
10 12
k = 1 k = 3
k = 5
Universitas Sumatera Utara
Teorema: 1.
Andaikan
X
adalah variabel acak berdistribusi pareto, maka:
Dimana 2.
andaikan
X
adalah variabel acak berdistribusi pareto, maka:
Dimana
2.3. Metode Kuadrat Terkecil
Metode kuadrat terkecil merupakan teknik yang sangat terkenal dalam statistika. Metode kuadrat terkecil digunakan untuk menghitung taksiran parameter. Metode ini
merupakan salah satu teknik statistika modern yang pertama kali dipublikasikan pada tahun 1805 oleh matematikawan asal Prancis yaitu Legendre dalam sebuah riwayat
klasik. Namun, metode ini telah ada sebelum Legendre mempublikasikannya. Setelah riwayat Legendre dipublikasikan, matematikawan terkenal asal Jerman, yaitu Gauss
mempublikasikan riwayat lain pada tahun 1809 yang menyebutkan bahwa dia sudah menemukan metode ini sebelumnya, dan telah menggunakannya sekitar tahun 1795.
Ini menimbulkan perselisihan, namun tidak mengurangi ketenaran dari teknik ini.
Pearson dan Fisher yang banyak berperan dalam pengembangan statistika, menggunakan dan mengembangkan metode kuadrat terkecil dalam konteks yang
berbeda yaitu analisis faktor dan rancangan percobaan. Sekarang, metode kuadrat terkecil umumnya digunakan untuk menaksir nilai-nilai numerik dari suatu parameter
untuk menentukan fungsi yang tepat untuk sekumpulan data dan untuk menggolongkan sifat-sifat dari taksiran tersebut.
Universitas Sumatera Utara
Metode kuadrat terkecil terdiri dari beberapa macam. Metode kuadrat terkecil yang paling sederhana adalah
Ordina ry Least Square
OLS. Metode yang lebih rumit lagi yaitu
Weighted Least Square
WLS. Metode WLS lebih baik dari pada metode OLS karena WLS bisa mengatur pentingnya setiap observasi dalam menentukan
solusi akhir. Selain OLS dan WLS, ada juga
Alternating Least Square
ALS dan
Partial Least Square
PLS.
Metode kuadrat terkecil yang sering digunakan adalah OLS. OLS biasanya digunakan dalam regresi linier untuk menentukan persamaan garis atau kurva yang
tepat untuk sekumpulan data. Dalam rumus standard, suatu himpunan
n
pasangan dari observasi
{ } digunakan untuk menemukan suatu fungsi yang memberikan nilai
variabel terikat
Y
dari nilai variabel bebas
X
. Dengan 1 variabel bebas dan fungsi linier, diberikan persamaan regresi :
̂ . Persamaan ini memiliki 2 parameter yaitu
a
dan
b
dari garis regresi. Metode kuadrat terkecil mendefinisikan taksiran parameter-parameter ini sebagai nilai minimum
jumlah kuadrat dari selisih antara ukuran dan model taksiran:
∑ ̂
∑ [
] dimana
adalah
error
yang harus diminimalkan dan
n
adalah jumlah sampel. Ini dapat diperoleh dengan menggunakan teknik kalkulus yaitu dengan sifat fungsi
kuadratis yang mencapai nilai minimum ketika turunannya nol. Turunan terhadap
a
dan
b
diberikan oleh persamaan : ∑
∑ dan
∑ ∑
∑ 2 persamaan ini memberi taksiran dari
a
dan
b
yaitu : ̂
Universitas Sumatera Utara
dan ̂
∑ ∑
∑ ∑
Dengan dan
adalah rata-rata
X
dan
Y
yaitu: ∑
dan ∑
OLS bisa diperpanjang untuk lebih dari 1 variabel bebas dengan menggunakan aljabar matriks dan metode ini juga dapat digunakan untuk fungsi nonlinier.
2.4.Regresi
Ridge
Regresi
ridge
merupakan metode yang baik digunakan untuk menyusutkan nilai parameter-parameter regresi mendekati nol, dengan cara demikian menjamin
eksistensi penaksiran. Regresi
ridge
sudah diperkenalkan oleh Hoerl dan Kennard pada tahun 1970 untuk menanggulangi masalah
Ordinary Least Squa re
OLS dan memperoleh taksiran yang lebih baik.
Dalam regresi linier dengan persamaan:
dimana ,
, … , merupakan parameter-parameternya dapat ditaksir dengan
menggunakan regresi
ridge
. ,
, … ,
akan ditaksir oleh ,
, … , . Misalkan
persamaan regresi linier di atas dibuat dalam bentuk:
dimana: dan
Universitas Sumatera Utara
maka taksiran regresi
ridge
dapat ditulis dalam persamaan:
dimana:
Regresi
ridge
merupakan salah satu dari beberapa cara penaksiran yang biasa dilakukan dalam penaksiran bias dengan tujuan memperkecil variansi penaksir
koefisien regresi, walaupun penaksir yang diperoleh bias. Biasanya takiran regresi
ridge
diperoleh dengan meminimumkan jumlah kuadrat
error
untuk persamaan:
dengan kendala tunggal ∑
, bila konstanta positif yang berhingga.
Menurut metode
multiple
Langrange, maka harus dicari turunan : ∑
∑ terhadap
, , …,
. Bila turunan ini disamakan dengan nol, maka diperoleh suatu sistem persamaan :
. Dari persamaan ini dapat dicari taksiran untuk regresi
ridge
, dinyatakan dalam pengali Langrange
d
.
Definisi: Taksiran regresi
ridge
adalah : ,
dimana
Dalam definisi di atas, taksiran regresi
ridge
dihitung untuk beberapa nilai
d
yang semakin besar, sampai dapat ditentukan suatu nilai
d
yang memberikan suatu nilai semua koefisien regresi yang mantap. Beberapa perhitungan mungkin perlu
dikerjakan sebelum taksiran koefisien regresi mencapai kemantapan . Dengan merajah
Universitas Sumatera Utara
grafik nilai-nilai koefisien dengan nilai-nilai
d
padanannya, maka akan diperoleh suatu kurva yang disebut runut
ridge
.
Tabel 2.1 Taksiran Regresi
Ridge
0.000 3.2803
9.0361 9.7245
-0.2647 0.004
5.4449 7.1270
9.0451 -0.2790
0.012 6.3413
6.3189 8.6327
-0.1789 0.020
6.5993 6.0695
8.4053 -0.0634
0.100 6.7426
5.6694 7.1994
0.8067 0.200
6.5000 5.4970
6.3675 1.3844
0.300 6.2533
5.3273 5.8221
1.7013 0.400
6.0225 5.1583
5.4220 1.8870
2.5.
Maximum Product of Spacing
MPS
Metode
maximum product of spacing
MPS digunakan untuk menaksir parameter- parameter distribusi univariat continuous. Metode MPS diusulkan oleh Russel Cheng
dan Nik Amin tahun 1983 dan diperkenalkan oleh Bo Ranneby pada tahun 1984. Mereka menjelaskan bahwa integral probabilitas mengubah parameter-parameter yang
sebenarnya, jarak antara setiap observasi akan didistribusikan secara seragam uniform. Ini berakibat bahwa perbedaan antara nilai CDF pada observasi yang
berderet akan sama. Ini adalah kasus memaksimumkan rata-rata geometrik yang akan menghasilkan keputusan terbaik. Ranneby membenarkan metode ini dengan
mendemonstrasikan bahwa penaksir ini mirip dengan
Maximum Likelihood Estimation
.
Definisi : Andaikan
,…, adalah sampel acak berukuran
n
dari distribusi univariat dengan CDF
, dimana adalah parameter yang belum diketahui dan akan ditaksir.
Universitas Sumatera Utara
maka didefinisikan
spacing
sebagai “celah” antara nilai fungsi distribusi pada titik perintah yang berdekatan :
, dimana . Maka penaksir
maximum spacing
dari didefinisikan sebagai nilai maximum
logaritma rata-rata geometrik dari jarak sampel : ̂
. Dimana
∑ .
Dengan pertidaksamaan rata-rata aritmatik dan geometrik, fungsi berbatas atas
oleh dan dengan demikian maksimum harus ada pada supremum.
Beberapa peneliti mendefinisikan fungsi secara berbeda. Ranneby mengalikan
setiap oleh faktor
, sedangkan Cheng dan Stephens 1989 menghilangkan didepan penjumlahan dan menambahkan “ “ agar mengubah maksimalisasi
kedalam minimalisasi.
Universitas Sumatera Utara
Bab 3
PEMBAHASAN
3.1. Estimasi Parameter Distribusi Pareto dengan Metode Kuadrat Terkecil