Distribusi Pareto Metode Kuadrat Terkecil

2.2.3. Cara-cara Menaksir

Penaksir terbaik yaitu penaksir tak bias dan bervarians minimum belum tentu memperoleh nilai taksiran parameter yang benar-benar tepat. Keakuratan penaksiran dapat ditingkatkan dengan memperbesar sampel, tetapi ini tidak menjamin bahwa nilai taksiran yang berasal dari suatu sampel akan sama dengan parameter yang ditaksir. Untuk itu harus dicari interval taksiran yang di dalamnya diharapkan terdapat nilai parameter yang sebenarnya. Suatu interval taksiran dari parameter adalah interval yang berbentuk ̂ ̂ . Karena sampel yang berbeda akan menghasilkan nilai ̂ yang berbeda, demikian pula dengan ̂ dan ̂ ,maka kedua titik itu dapat dipandang sebagai nilai bagi peubah padanannya ̂ dan ̂ . Dari sebaran penarikan sampel untuk ̂ dapat ditentukan ̂ dan ̂ sehingga ̂ ̂ dimana , maka akan dihasilkan suatu interval yang mengandung . Interval ̂ ̂ disebut selang kepercayaan, disebut koefisien kepercayaan, dan ̂ dan ̂ masing- masing disebut batas kepercayaan sebelah atas dan sebelah bawah.

2.2. Distribusi Pareto

Distribusi pareto berasal dari nama seorang ekonom yaitu Vilfredo Pareto 1848- 1923 yang mengamati bahwa 85 kekayaan di Milan dimiliki oleh hanya 15 dari penduduknya. Distribusi pareto disebut juga dengan distribusi power la w. Universitas Sumatera Utara Definisi: 1. Jika X adalah variabel acak berdistribusi pareto, maka probabilitas bahwa X lebih besar dari beberapa nilai x diberikan oleh : { dimana dan adalah parameternya. 2. Jika X adalah variabel acak berdistribusi pareto, maka Cumulative Distribution Function CDF dari variabel acak Pareto dengan parameter dan adalah : { dimana dan adalah parameternya. 3. Jika X adalah variabel acak berdistribusi pareto, maka P robability Density Function PDF dari variabel acak pareto dengan parameter dan adalah : { Universitas Sumatera Utara Gambar 2.1 Probability Density Function Distribusi Pareto untuk berbagai nilai k Gambar 2.2 Probability Density Function Distribusi Pareto untuk berbagai nilai 0.000 0.200 0.400 0.600 0.800 1.000 1.200 2 4 6 8 10 12 k = 1 k = 3 k = 5 -1.000 0.000 1.000 2.000 3.000 4.000 5.000 6.000 5 10 15 α = 1 α = 3 α = 3 Universitas Sumatera Utara Gambar 2.3 Cumulative Distribution Function Distribusi Pareto untuk berbagai nilai Gambar 2.4 Cumulative Distribution Function Distribusi Pareto untuk berbagai nilai 0.2 0.4 0.6 0.8 1 1.2 2 4 6 8 10 12 α = 1 α = 3 α = 3 -0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 2 4 6 8 10 12 k = 1 k = 3 k = 5 Universitas Sumatera Utara Teorema: 1. Andaikan X adalah variabel acak berdistribusi pareto, maka: Dimana 2. andaikan X adalah variabel acak berdistribusi pareto, maka: Dimana

2.3. Metode Kuadrat Terkecil

Metode kuadrat terkecil merupakan teknik yang sangat terkenal dalam statistika. Metode kuadrat terkecil digunakan untuk menghitung taksiran parameter. Metode ini merupakan salah satu teknik statistika modern yang pertama kali dipublikasikan pada tahun 1805 oleh matematikawan asal Prancis yaitu Legendre dalam sebuah riwayat klasik. Namun, metode ini telah ada sebelum Legendre mempublikasikannya. Setelah riwayat Legendre dipublikasikan, matematikawan terkenal asal Jerman, yaitu Gauss mempublikasikan riwayat lain pada tahun 1809 yang menyebutkan bahwa dia sudah menemukan metode ini sebelumnya, dan telah menggunakannya sekitar tahun 1795. Ini menimbulkan perselisihan, namun tidak mengurangi ketenaran dari teknik ini. Pearson dan Fisher yang banyak berperan dalam pengembangan statistika, menggunakan dan mengembangkan metode kuadrat terkecil dalam konteks yang berbeda yaitu analisis faktor dan rancangan percobaan. Sekarang, metode kuadrat terkecil umumnya digunakan untuk menaksir nilai-nilai numerik dari suatu parameter untuk menentukan fungsi yang tepat untuk sekumpulan data dan untuk menggolongkan sifat-sifat dari taksiran tersebut. Universitas Sumatera Utara Metode kuadrat terkecil terdiri dari beberapa macam. Metode kuadrat terkecil yang paling sederhana adalah Ordina ry Least Square OLS. Metode yang lebih rumit lagi yaitu Weighted Least Square WLS. Metode WLS lebih baik dari pada metode OLS karena WLS bisa mengatur pentingnya setiap observasi dalam menentukan solusi akhir. Selain OLS dan WLS, ada juga Alternating Least Square ALS dan Partial Least Square PLS. Metode kuadrat terkecil yang sering digunakan adalah OLS. OLS biasanya digunakan dalam regresi linier untuk menentukan persamaan garis atau kurva yang tepat untuk sekumpulan data. Dalam rumus standard, suatu himpunan n pasangan dari observasi { } digunakan untuk menemukan suatu fungsi yang memberikan nilai variabel terikat Y dari nilai variabel bebas X . Dengan 1 variabel bebas dan fungsi linier, diberikan persamaan regresi : ̂ . Persamaan ini memiliki 2 parameter yaitu a dan b dari garis regresi. Metode kuadrat terkecil mendefinisikan taksiran parameter-parameter ini sebagai nilai minimum jumlah kuadrat dari selisih antara ukuran dan model taksiran: ∑ ̂ ∑ [ ] dimana adalah error yang harus diminimalkan dan n adalah jumlah sampel. Ini dapat diperoleh dengan menggunakan teknik kalkulus yaitu dengan sifat fungsi kuadratis yang mencapai nilai minimum ketika turunannya nol. Turunan terhadap a dan b diberikan oleh persamaan : ∑ ∑ dan ∑ ∑ ∑ 2 persamaan ini memberi taksiran dari a dan b yaitu : ̂ Universitas Sumatera Utara dan ̂ ∑ ∑ ∑ ∑ Dengan dan adalah rata-rata X dan Y yaitu: ∑ dan ∑ OLS bisa diperpanjang untuk lebih dari 1 variabel bebas dengan menggunakan aljabar matriks dan metode ini juga dapat digunakan untuk fungsi nonlinier. 2.4.Regresi Ridge Regresi ridge merupakan metode yang baik digunakan untuk menyusutkan nilai parameter-parameter regresi mendekati nol, dengan cara demikian menjamin eksistensi penaksiran. Regresi ridge sudah diperkenalkan oleh Hoerl dan Kennard pada tahun 1970 untuk menanggulangi masalah Ordinary Least Squa re OLS dan memperoleh taksiran yang lebih baik. Dalam regresi linier dengan persamaan: dimana , , … , merupakan parameter-parameternya dapat ditaksir dengan menggunakan regresi ridge . , , … , akan ditaksir oleh , , … , . Misalkan persamaan regresi linier di atas dibuat dalam bentuk: dimana: dan Universitas Sumatera Utara maka taksiran regresi ridge dapat ditulis dalam persamaan: dimana: Regresi ridge merupakan salah satu dari beberapa cara penaksiran yang biasa dilakukan dalam penaksiran bias dengan tujuan memperkecil variansi penaksir koefisien regresi, walaupun penaksir yang diperoleh bias. Biasanya takiran regresi ridge diperoleh dengan meminimumkan jumlah kuadrat error untuk persamaan: dengan kendala tunggal ∑ , bila konstanta positif yang berhingga. Menurut metode multiple Langrange, maka harus dicari turunan : ∑ ∑ terhadap , , …, . Bila turunan ini disamakan dengan nol, maka diperoleh suatu sistem persamaan : . Dari persamaan ini dapat dicari taksiran untuk regresi ridge , dinyatakan dalam pengali Langrange d . Definisi: Taksiran regresi ridge adalah : , dimana Dalam definisi di atas, taksiran regresi ridge dihitung untuk beberapa nilai d yang semakin besar, sampai dapat ditentukan suatu nilai d yang memberikan suatu nilai semua koefisien regresi yang mantap. Beberapa perhitungan mungkin perlu dikerjakan sebelum taksiran koefisien regresi mencapai kemantapan . Dengan merajah Universitas Sumatera Utara grafik nilai-nilai koefisien dengan nilai-nilai d padanannya, maka akan diperoleh suatu kurva yang disebut runut ridge . Tabel 2.1 Taksiran Regresi Ridge 0.000 3.2803 9.0361 9.7245 -0.2647 0.004 5.4449 7.1270 9.0451 -0.2790 0.012 6.3413 6.3189 8.6327 -0.1789 0.020 6.5993 6.0695 8.4053 -0.0634 0.100 6.7426 5.6694 7.1994 0.8067 0.200 6.5000 5.4970 6.3675 1.3844 0.300 6.2533 5.3273 5.8221 1.7013 0.400 6.0225 5.1583 5.4220 1.8870 2.5. Maximum Product of Spacing MPS Metode maximum product of spacing MPS digunakan untuk menaksir parameter- parameter distribusi univariat continuous. Metode MPS diusulkan oleh Russel Cheng dan Nik Amin tahun 1983 dan diperkenalkan oleh Bo Ranneby pada tahun 1984. Mereka menjelaskan bahwa integral probabilitas mengubah parameter-parameter yang sebenarnya, jarak antara setiap observasi akan didistribusikan secara seragam uniform. Ini berakibat bahwa perbedaan antara nilai CDF pada observasi yang berderet akan sama. Ini adalah kasus memaksimumkan rata-rata geometrik yang akan menghasilkan keputusan terbaik. Ranneby membenarkan metode ini dengan mendemonstrasikan bahwa penaksir ini mirip dengan Maximum Likelihood Estimation . Definisi : Andaikan ,…, adalah sampel acak berukuran n dari distribusi univariat dengan CDF , dimana adalah parameter yang belum diketahui dan akan ditaksir. Universitas Sumatera Utara maka didefinisikan spacing sebagai “celah” antara nilai fungsi distribusi pada titik perintah yang berdekatan : , dimana . Maka penaksir maximum spacing dari didefinisikan sebagai nilai maximum logaritma rata-rata geometrik dari jarak sampel : ̂ . Dimana ∑ . Dengan pertidaksamaan rata-rata aritmatik dan geometrik, fungsi berbatas atas oleh dan dengan demikian maksimum harus ada pada supremum. Beberapa peneliti mendefinisikan fungsi secara berbeda. Ranneby mengalikan setiap oleh faktor , sedangkan Cheng dan Stephens 1989 menghilangkan didepan penjumlahan dan menambahkan “ “ agar mengubah maksimalisasi kedalam minimalisasi. Universitas Sumatera Utara Bab 3 PEMBAHASAN

3.1. Estimasi Parameter Distribusi Pareto dengan Metode Kuadrat Terkecil