Estimasi Bayes Untuk Parameter Pareto Dengan Menggunakan Fungsi Likelihood

ESTIMASI BAYES UNTUK PARAMETER PARETO DENGAN MENGGUNAKAN FUNGSI LIKELIHOOD
TESIS
Oleh JEMONO 117021005/MT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2013
Universitas Sumatera Utara

ESTIMASI BAYES UNTUK PARAMETER PARETO DENGAN MENGGUNAKAN FUNGSI LIKELIHOOD
TESIS
Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Magister Sains dalam
Program Studi Magister Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Oleh JEMONO 117021005/MT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2013
Universitas Sumatera Utara

Judul Tesis
Nama Mahasiswa Nomor Pokok Program Studi

: ESTIMASI BAYES UNTUK PARAMETER PARETO DENGAN MENGGUNAKAN FUNGSI LIKELIHOOD
: Jemono : 117021005 : Magister Matematika


Menyetujui, Komisi Pembimbing

(Dr. Sutarman, M.Sc) Ketua

(Prof. Dr. Herman Mawengkang) Anggota

Ketua Program Studi

Dekan

(Prof. Dr. Herman Mawengkang)

(Dr. Sutarman, M.Sc)

Tanggal lulus : 3 Juni 2013

Universitas Sumatera Utara

Telah diuji pada Tanggal 3 Juni 2013
PANITIA PENGUJI TESIS Ketua : Dr. Sutarman, M.Sc Anggota : 1. Prof. Dr. Herman Mawengkang

2. Prof. Dr. Muhammad Zarlis 3. Dr. Marwan Ramli, M.Si
Universitas Sumatera Utara

PERNYATAAN
ESTIMASI BAYES UNTUK PARAMETER PARETO DENGAN MENGGUNAKAN FUNGSI LIKELIHOOD
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing dituliskan sumbernya
Medan, 3 Juni 2014 Penulis, Jemono
i
Universitas Sumatera Utara

ABSTRAK Metode Bayes merupakan metode yang menggabungkan informasi dari cuplikan dengan informasi lain yang diketahui atau disebut juga dengan prior sehingga lebih dikenal sebagai peluang subjektif. Andaikan X1, X2, . . . , Xn, . . . merupakan suatu barisan variabel acak yang terdistribusi dan saling bebas dengan suatu distribusi kumulatif, F (x), serta fungsi densitas probabilitas, f(x). Selanjutnya, barisan {U (n), n ≥ 1} disebut dengan jumlah cuplikan informasi. Distribusi Pareto merupakan suatu distribusi yang digunakan di bidang sosial, ilmiah, geofisika, aktuaria dan fenomena di bidang lainnya. Estimasi Bayes yang digunakan pada suatu parameter Pareto merupakan suatu fungsi implisit tanpa adanya penyelesaian secara numerik. Penelitian ini dilakukan dengan tujuan untuk mengkaji estimasi Bayes pada parameter Pareto dengan serta dilakukan penyempurnaan bilangan (iterasi numerik) dengan metode Newton-Raphson. Sehingga, model dapat digunakan di berbagai bidang, khususnya bidang sosio-ekonomi. Kata Kunci : Estimasi bayes, Distribusi pareto, Fungsi likelihood.
ii
Universitas Sumatera Utara

ABSTRACT Bayesian Method is a method that combines information of records with any known other information or also called priors known as subjective probability. Suppose that x1, x2, . . . , Xn, . . . is a sequence of random variables distributed and independent with a cumulative distribution, F (x), and the probability density function, f(x). Furthermore, the sequence {U (n), n ≥ 1} is called by the number of pieces of information records. Pareto distribution is a distribution that is used in the social, scientific, geophysical, actuarial and other phenomena in the field. Bayesian estimation in a Pareto parameter is only an implicit function without any numerical solution. This research is conducted to assess the parameters of Bayesian estimate and made improvements by numerical iterations with the Newton-Raphson method. Thus, the model can be used in many fields, especially in the field of socio-economic development. Keywords : Bayesian estimate, distribution Pareto, likelihood function.
iii
Universitas Sumatera Utara

KATA PENGANTAR

Dengan rasa rendah hati, penulis mengucapkan puju dan syukur kehadirat Allah SWT atas segala rahmat dan karunia yang telah dilimpahkan-Nya, sehingga penulis dapat menyelesaikan penulisan tesis ini. Tesis ini disusun untuk memenuhi salah satu syarat untuk memperoleh gelar Magister Sains di Program Studi Magister Matematika FMIPA Universitas Sumatera Utara Medan.
Dalam penyusunan tesis ini, penulis telah banyak mendapat dukungan, bimbingan dan petunjuk dari berbagai pihak. Pada kesempatan ini penulis mengucapkan terima kasih yang sebesar-besarnya pada:
Prof. Dr. dr. Syahril Pasaribu, DTM&H, MSc(CTM). Sp.A(K) selaku Rektor Universitas Sumatera Utara.
Dr. Sutarman, M.Sc selaku Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara dan Ketua Komisi Pembimbing yang telah memberikan kesempatan kepada penulis untuk mengikuti Program Studi Magister Matematika di Universitas Sumatera Utara.
Prof. Dr. Herman Mawengkang selaku ketua Program Studi Magister Matematika di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara dan juga selaku anggota komisi pembimbing yang telah penuh memberikan motivasi dan bimbingan kepada penulis hingga penulisan tesis ini telah diselesaikan.
Prof. Dr. Saib Suwilo, M.Sc selaku sekretaris Program Studi Magister Matematika di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara yang telah memberikan masukan dalam perbaikan dan kesempurnaan tesis ini.
Prof. Dr. Muhammad Zarlis selaku anggota komisi pembanding yang telah banyak memotivasi dan membimbing dalam penulisan tesis ini.
Dr. Marwan Ramli, M.Si sebagai anggota komisi pembanding yang telah banyak memberikan saran dan arahan dalam penulisan tesis ini.
Bapak Drs. H. Pargino, M.Si selaku Kepala SMA Negeri 1 Teluk Mengkudu.
iv
Universitas Sumatera Utara

Ibunda tercinta Ibunda Ngadiyem dan seluruh keluarga. Istri tercinta, Siti Hidayani, S.Pd dan anak-anakku tersayang, yaitu Aisyah Nabilah dan Muhammad Azmi Pramono. Seluruh teman-teman stambuk 2011 ganjil Program Studi Magister Matematika. Seluruh teman-teman di SMA Negeri 1 Teluk Mengkudu Semoga tesis ini bermanfaat.
Medan, Juni 2013 Penulis, Jemono
v
Universitas Sumatera Utara

RIWAYAT HIDUP Jemono dilahirkan di Kw.Bingai Kabupaten Langkat pada tanggal 18 Juni 1976 dan merupakan anak ke-11 dari 13 bersaudara. Anak dari Ayah Poniman (Alm.) dan Ibu Ngadiyem. Menamatkan Sekolah Dasar (SD) Negeri 050659 di Stabat pada tahuun 1988, Sekolah Menengah Pertama (SMP) Negeri 1 Stabat Kabupaten Langkat pada tahun 1991 dan Sekolah Menengah Atas (SMA) Negeri di Stabat jurusan Fisika pada tahun 1994. Tahun 1996 memasuki perguruan tinggi di Universitas Negeri Medan (UNIMED) jurusan Pendidikan Matematika dan memperoleh gelar sarjana pendidikan pada tahun 2002. Tahun 2003 sampai dengan tahun 2008 mengajar bidang studi Matematika dan sebagai guru kelas di SD Swasta Harapan 2 Medan. Tahun 2008 mengajar bidang studi Matematika di SMA Negeri 1 Teluk Mengkudu Kabupaten Serdang Berdagai sampai sekarang. Tahun 2011 mengikuti sekolah pada Program Studi Magister Matematika Universitas Sumatera Utara (USU) Medan.
vi
Universitas Sumatera Utara


DAFTAR ISI

PERNYATAAN ABSTRAK ABSTRACT KATA PENGANTAR RIWAYAT HIDUP DAFTAR ISI

Halaman i ii
iii iv vi vii

BAB 1 PENDAHULUAN

1

1.1 Latar Belakang 1.2 Perumusan Masalah 1.3 Tujuan Penelitian 1.4 Manfaat Penelitian

1 3 3 3

BAB 2 LANDASAN TEORI DAN KAJIAN PUSTAKA

4


2.1 Estimasi Bayes 2.2 Parameter Pareto 2.3 Distribusi Posterior

4 6 8

BAB 3 LANDASAN TEORI

14

3.1 Metode Estimasi Bayes 3.2 Parameter Pareto 3.3 Distribusi Posterior

14 16 18

BAB 4 ESTIMASI BAYES UNTUK PARAMETER PARETO DENGAN MENG-

GUNAKAN FUNGSI LIKELIHOOD

20

4.1 Estimasi Maximum-Likelihood


20

vii
Universitas Sumatera Utara

4.2 Estimasi Bayes untuk Parameter Pareto 4.2.1 Distribusi prediktif
4.3 Prosedur Algoritma Newton-Raphson
BAB 5 KESIMPULAN
5.1 Kesimpulan 5.2 Riset Lanjutan DAFTAR PUSTAKA

22 23 25
27
27 27 28

viii
Universitas Sumatera Utara

ABSTRAK Metode Bayes merupakan metode yang menggabungkan informasi dari cuplikan dengan informasi lain yang diketahui atau disebut juga dengan prior sehingga lebih dikenal sebagai peluang subjektif. Andaikan X1, X2, . . . , Xn, . . . merupakan suatu barisan variabel acak yang terdistribusi dan saling bebas dengan suatu distribusi kumulatif, F (x), serta fungsi densitas probabilitas, f(x). Selanjutnya, barisan {U (n), n ≥ 1} disebut dengan jumlah cuplikan informasi. Distribusi Pareto merupakan suatu distribusi yang digunakan di bidang sosial, ilmiah, geofisika, aktuaria dan fenomena di bidang lainnya. Estimasi Bayes yang digunakan pada suatu parameter Pareto merupakan suatu fungsi implisit tanpa adanya penyelesaian secara numerik. Penelitian ini dilakukan dengan tujuan untuk mengkaji estimasi Bayes pada parameter Pareto dengan serta dilakukan penyempurnaan bilangan (iterasi numerik) dengan metode Newton-Raphson. Sehingga, model dapat digunakan di berbagai bidang, khususnya bidang sosio-ekonomi. Kata Kunci : Estimasi bayes, Distribusi pareto, Fungsi likelihood.
ii
Universitas Sumatera Utara


ABSTRACT Bayesian Method is a method that combines information of records with any known other information or also called priors known as subjective probability. Suppose that x1, x2, . . . , Xn, . . . is a sequence of random variables distributed and independent with a cumulative distribution, F (x), and the probability density function, f(x). Furthermore, the sequence {U (n), n ≥ 1} is called by the number of pieces of information records. Pareto distribution is a distribution that is used in the social, scientific, geophysical, actuarial and other phenomena in the field. Bayesian estimation in a Pareto parameter is only an implicit function without any numerical solution. This research is conducted to assess the parameters of Bayesian estimate and made improvements by numerical iterations with the Newton-Raphson method. Thus, the model can be used in many fields, especially in the field of socio-economic development. Keywords : Bayesian estimate, distribution Pareto, likelihood function.
iii
Universitas Sumatera Utara

BAB 1 PENDAHULUAN

1.1 Latar Belakang

Teori keputusan statistikal merupakan bentuk solusi persoalan proses pengambilan keputusan dengan adanya unsur ketidakpastian dengan tujuan untuk memperoleh solusi keputusan dalam suatu kerangka kerja rasional. Penaksiran Bayes merupakan suatu cara khusus dalam memformulasikan dan menyelesaikan persoalan pengambilan keputusan statistikal. Lebih jelasnya, penaksiran ini memberikan banyak metode dalam memformulasikan suatu prior tingkat kepercayaan dan menggabungkannya dengan pengamatan yang ada, dengan tujuan digunakan suatu turunan rasional dari kriteria keputusan optimal.

Dalam persoalan estimasi, suatu himpunan semesta mengambil nilai pada suatu himpunan kontinu dengan skalar S ∈ R. Tujuan dari estimasi adalah untuk menentukan pernyataan yang bernilai benar pada suatu himpunan semesta A = S dari pengamatan yang diuji x. Prior ps(s) merupakan fungsi densitas probabilitas karena S adalah kontinu, sehingga fx(x) dan fx(x|s) adalah densitas probabilitas (kontinu X ) atau fungsi bobot (diskrit X ).

Madi dan Raqab (2004) memberikan pandangan mengenai metode Bayes. Andaikan X1, X2, . . . , Xn, . . . merupakan suatu barisan variabel acak yang terdistribusi dan saling bebas dengan suatu distribusi kumulatif, F (x), serta fungsi densitas probabilitas, f(x). Jika {U (n), n ≥ 1} didefinisikan oleh U (1) = 1, U (n) = min{j|j > U (n − 1), Xj > XU(n−1)} untuk n ≥ 2, maka {XU(n), n ≥ 1} dan diperoleh suatu barisan cuplikan informasi maksimum. Selanjutnya, barisan {U (n), n ≥ 1} disebut dengan jumlah cuplikan informasi. Sehingga, diasumsikan bahwa X1, X2, . . . , Xn, . . . , memiliki distribusi Pareto dengan fungsi distribusi kumulatif sebagai berikut

F (x) = 1 −

k x

a

,

k > 0; a > 0; x ≥ k

1
Universitas Sumatera Utara

2
dengan distribusi Pareto mempunyai dua parameter, k dan a, dari data yang diuji. k merupakan batas bawah dari data yang diuji dan dinormalisasikan ke 1, sehingga distribusi dapat dinyatakan menjadi
F (x) = 1 − x−a
dan fungsi densitas dinyatakan sebagai f (x) = ax−(a+1)

Lebih lanjut, (Madi dan Raqab, 2004) menjelaskan bahwa cuplikan informasi dalam statistika didefinisikan sebagai suatu model pada suatu barisan variabel acak yang terdistribusi dan saling bebas, sebagai contoh data perusahaan asuransi dalam jangka waktu yang berturut-turut, ketinggian air atau ketinggian temperatur. Akibatnya, muncul persoalan mengenai penentuan prediksi informasi di masa yang akan datang. Youssef (2009) menjelaskan tentang estimasi Quasi-Bayesian dengan menggunakan fungsi quasi-likelihood. Andaikan x1, x2, . . . , xn adalah suatu sampel acak independen dengan mean µ = µ(θ), dengan θ sebagai parameter vektor dan varians var(x) = φV (µ), dengan V (.) adalah suatu fungsi varians dan φ adalah parameter dispersi yang mungkin diketahui atau tidak diketahui. Sehingga quasi-likelihood Q(x; µ, φ) dapat diturunkan sebagai definisi dari relasi

∂ ∂µi

Q(xi,

µi)


=

xi V

− µi (µi)

dimana eksponensial asli Q(x; µ, φ) akan digunakan sebagai fungsi likelihood.

Distribusi Pareto ganda muncul sebagai fungsi eksponensial pada distribusi eksponensial ganda dan dapat diturunkan dengan menggabungkan distribusi Pareto dan distribusi pada suatu variabel acak Pareto yang memiliki sifat nol dan tak hingga (Reed, 2001; Kotz et al., 2001). Cobo et al., (2010) juga telah menunjukkan suatu algoritma yang diimplementasikan kedalam distribusi Pareto ganda lognormal. Analisis pada parameter Pareto merupakan teknik pengambilan keputusan yang digunakan dalam menentukan keputusan terhadap data yang diuji dari semua data yang ada. Penelitian ini memberikan estimasi Bayes untuk parameter Pareto yang digunakan untuk memperoleh distribusi prediktif Bayes dalam menaksir prior tingkat kepercayaan atau nilai suatu data di masa yang akan datang pada suatu data yang duji.

Universitas Sumatera Utara

3
Distribusi pada parameter Pareto memiliki peran yang sangat penting dalam persoalan sensus penduduk, menentukan adanya sumber daya alam pada suatu daerah tertentu, analisis resiko bisnis dan asuransi. Parameter ini juga dapat digunakan di bidang lainnya seperti bidang biologi, peramalan cuaca, bursa keuangan dan sebagainya. Parameter Pareto dan bentuk generalisasinya digunakan untuk memperoleh suatu distribusi yang bersifat fleksibel dan dapat digunakan dalam memodelkan suatu distribusi pendapatan di bidang sosio-ekonomi seperti klaim asuransi, aset-aset perusahaan, fluktuasi harga stok dan fenomena di bidang sosio-ekonomi lainnya.
1.2 Perumusan Masalah Kelemahan estimasi parameter Pareto dengan metode Maximum-Likelihood adalah
hasil estimasi yang merupakan fungsi implisit. Untuk itu perlu diteliti pemakaian fungsi Likelihood dalam estimasi Bayes untuk parameter Pareto disertai dengan prosedur Newton-Raphson.
1.3 Tujuan Penelitian Tujuan penelitian ini adalah mengkaji estimasi Bayes untuk parameter Pareto.
Hasil yang diperoleh dari estimasi pada parameter Pareto dengan metode MaximumLikelihood yang disertai dengan prosedur Newton-Raphson.
1.4 Manfaat Penelitian Penelitian ini bermanfaat untuk memperkaya literatur tentang estimasi Bayes
dengan adanya pengembangan iterasi numerik. Selain itu penelitian ini juga diharapkan bermanfaat sebagai model distribusi yang dapat digunakan di berbagai bidang, seperti bidang sosio-ekonomi.

Universitas Sumatera Utara

BAB 2 LANDASAN TEORI DAN KAJIAN PUSTAKA

2.1 Estimasi Bayes

Definisi 1 Estimasi Bayes yang paling mungkin dari suatu nilai kebenaran θ0 yang tidak diketahui pada parameter θ adalah nila θˆ yang meminimumkan distribusi posterior

fungsi densitas atau marginal probabilitas π(θ|x). Sehingga estimasi Bayes yang paling

mungkin diberikan oleh

π(θˆ|x) = sup π(θ|x)
θ∈Θ

Sebagai contoh, asumsikan X1, X2, . . . , Xn sebagai suatu sampel acak dari distribusi binomial B(m, θ) dengan m diketahui dan asumsikan suatu distribusi prior Beta (α, β) untuk θ. Sehingga,

n

likelihood = fX (x|θ) =


m xi

θxi(1 − θ)m−xi

i=1

nn nm− xi
∝ θ xi(1 − θ) i=1

i=1

(2.1)

Akibatnya,

π(θ|x) ∝ likelihood . prior



θt(1



θ)nm−t

θα−1(1 − θ)β−1 B(α, β)

∝ θα+t−1(1 − θ)nm−t+β−1

(2.2)

Distribusi posterior yang diperoleh adalah Beta(α + t, nm − t + β) dan

π(θ|x)

=

θα+t−1(1 − θ)nm−t+β−1 B(α + t, nm − t + β)

,

0 1)

i=1

yang diperoleh dari hasil estimasi maximum likelihood yaitu

τˆ

=

1 min(x1, . . . , xn); αˆ

=

n
n
n log τ + log xi)
i=1

dengan ketentuan sebagai berikut.

1. Jika τ diketahui, maka prior konjugasi natural pada densitas untuk α merupakan gamma.
2. Jika α diketahui, maka prior konjugasi natural pada prior τ merupakan Pareto.

Dari dua kondisi diatas, dapat ditentukan densitas pada prior konjugasi. Asumsikan bahwa nilai α dan τ tidak diketahui, maka untuk densitas diperoleh:

1. Diberikan densitas kondisional pada τ adalah α dengan parameter pertidaksamaan γ(τ ) dan parameter intensitas λ(τ ) yaitu

f (α|τ ) ∝ αγ(τ)−1e−α(τ)α

(2.6)

Universitas Sumatera Utara

8

dengan mean dan variansi adalah

E(α|τ

)

=



(1 + a2 (a1 +

+ m12 log τ m11 log τ )

)

(2.7)

var(α|τ

)

=



(1 + (a1

a2 +

+ m12 log τ m11 log τ )2

)

(2.8)

2. Diberikan densitas kondisional pada α adalah τ dengan parameter pertidaksamaan δ(α) dan parameter konsentrasi υ(α) yaitu

f (τ |α) ∝ υ(α)δ(α)[υ(α)τ ]−(τ(α)+1)I(υ(α)τ > 1

(2.9)

dengan

δ(α) = −(1 + b + m11α + m12 log α) dan υ(α) = c

(2.10)

3. Densitas marginal untuk α dan τ masing-masing dapat dinyatakan sebagai

f (α)



exp(a1α

+

a2

log

α) −[b

c−[b+m11α+m12 log α+1] + m11α + m12 log α +

1]

(2.11)

f (τ

)



τ

b

Γ[a2 + m12 log τ + 1] [−a1 − m11 log τ ]a2+m12 log τ +1

I(τ c > 1)

(2.12)

Untuk fungsi densitas probabilitas pada distribusi Pareto adalah

f (x|α, τ ) = ατ αx−(α+1)

(2.13)

dan fungsi densitas kumulatif pada distribusi Pareto adalah

F (x|α, τ ) = 1 −

x −α τ

dengan x ≥ τ (α, τ > 0), ∀x.

(2.14)

2.3 Distribusi Posterior

Asumsikan terdapat m cuplikan informasi yang diindekskan sebagai Y1 = y1, Y2 = y2, . . . , Ym = ym dengan fungsi densitas probabilitas f (x|θ) dan fungsi densitas kumulatif F (x|θ) dengan parameter θ ∈ Rk. Fungsi densitas probabilitas joint pada

Y = (Y1, Y2, . . . , Ym) adalah

m−1
f1,2,...,m(y1, y2, . . . , ym|θ) = h(yi|θ)f (ym|θ), −∞ < y1 < · · · < ym < ∞
i=1

(2.15)

Universitas Sumatera Utara

9

dengan h(y|θ) = f(y|θ)/[1 − F (y|θ)]. Sehingga fungsi densitas probabilitas marginal

pada cuplikan informasi k pada Yk adalah

fk(y|θ)

=

[H

(y|θ)]k−1 Γ(k)

f

(y|θ)

(2.16)

dengan H(y|θ) = − ln(1 − F (y|θ)). Dengan parameter Pareto α dan τ yang belum diketahui, diberikan fungsi likelihood yaitu

L(α, τ |y) ∝ αmτ αym−αI[y1 > τ ]

(2.17)

dengan I[A] merupakan fungsi indikator pada kejadian A.

Suatu prior konjugasi joint untuk (α, τ ) digeneralisasikan dengan prior Lwin atau prior power-gamma yang didenotasikan sebagai P G(υ, λ, µ, L0) yaitu

π(α, τ ) ∝ αυτ λα−1µ−α(α > 0, 0 < τ < L0)

(2.18)

dengan υ, λ, µ, L0 merupakan konstanta positif dan L0 < µ. Prior mengidentifikasikan

π(α) sebagai Ga(υ, ln µ−λ, ln L0) dan π(τ |α) sebagai distribusi fungsi power P F (λα, L0)

yaitu

π(τ |α) ∝ λατ λα−1L0−λα(0 < τ < L0)

(2.19)

Dengan menggabungkan persamaan (3.13) dan (3.14), diperoleh densitas posterior pada

α dan τ sebagai berikut

π(α, τ |y)



αm+υ τ

exp{−α[Λ1

− (λ

+ 1) ln τ ]}I[τ

<

M1]

(2.20)

dengan M1 = min(y1, L0) dan Λ1 = ln µ+ln ym. Integrasikan α dan τ sehingga diperoleh densitas prior pada α dan τ , berturut-turut yaitu

π(α|y) ∝ αm+υ−1 exp{−α[Λ1 − (λ + 1) ln M1]}

(2.21)

dan

π(τ |y)



1 τ

[Λ1

− (λ +

1) ln τ ]−(m+υ+1)I[τ

<

M1]

Sehingga, diperoleh estimator Bayesian pada α secara eksplisit yaitu

αB

=

[Λ1



m+υ (λ + 1) ln M1]

(2.22) (2.23)

Analisis data uji hidup merupakan persoalan analisis data uji statistik terhadap daya tahan hidup suatu benda atau individu didasarkan pada keadaan operasional

Universitas Sumatera Utara

10

tertentu. Penerapan dari analisis ini biasanya banyak digunakan di bidang kedokteran yang berkaitan dengan pemodelan ketahanan hidup penderita penyakit tertentu (Lee, 1992) dan di bidang pertanian yang berkaitan dengan pemodelan ketahanan hidup benda-benda produksi (Barlow dan Proschan, 1996).

Freud (1992) menjelaskan persoalan utama dalam estimasi Bayes adalah menggabungkan suatu parameter dengan sampel tertentu secara langsung dengan menentukan ϕ(θ|x), dengan kondisional densitas pada θ adalah X = x. Reiss dan Thomas (1999) memberikan cara lain dalam menentukan estimasi Bayes pada parameter Pareto. Asumsikan terdapat suatu fungsi distribusi Pareto yaitu
Fα(y) = 1 − (1 + y)−α, y ≥ 0
dengan parameter kondisi yang tidak diketahui, α > 0, dan proses homogen Poisson dengan intensitas yang tidak diketahui, λ > 0.

Diberikan data (t1, y1), . . . , (tk, yk), maka maximum likelihood estimate (MSE) pada

(λ, α)

(λˆ, αˆ) =

k T

,

k i≤k log(1 + yi)

Estimator Bayes, λ, α dinotasikan sebagai prior gamma yang saling independen. De-

ngan fungsi quadratic loss, diperoleh estimasi Bayes pada λ dan α yaitu



(λˆ,

αˆ)

=

r 
c

+ +

k k λˆ

,

s+ d+

k k αˆ

  

Reed (2001) menjelaskan tentang estimasi parameter pada distribusi Pareto yang

berhubungan dengan estimator Hill di bidang asuransi. Ini disebabkan oleh estimator

lain yang digunakan pada distribusi Pareto memiliki kinerja yang kurang baik jika pa-

rameter yang digunakan tidak sama dengan 0 pada model Pareto. Sehingga diperlukan

suatu formula alternatif dalam hal estimasi dengan adanya estimasi Bayes. Andaikan

terdapat fungsi densitas probabilitas dan fungsi distribusi kumulatif pada distribusi

simetrik ganda Pareto berturut-turut





f(x; θ, β)

=

θ 2β

 






x β β x

θ−1 θ+1

0 0, berturut-turut.

0≤x 1)

(3.7)

Untuk fungsi densitas probabilitas pada distribusi Pareto adalah

f (x|α, τ ) = ατ αx−(α+1)

(3.8)

dan fungsi densitas kumulatif pada distribusi Pareto adalah

F (x|α, τ ) = 1 −

x −α τ

dengan x ≥ τ (α, τ > 0), ∀x.

(3.9)

3.3 Distribusi Posterior

Asumsikan terdapat m cuplikan informasi yang diindekskan sebagai Y1 = y1, Y2 = y2, . . . , Ym = ym dengan fungsi densitas probabilitas f (x|θ) dan fungsi densitas kumulatif F (x|θ) dengan parameter θ ∈ Rk. Fungsi densitas probabilitas joint pada

Y = (Y1, Y2, . . . , Ym) adalah

m−1
f1,2,...,m(y1, y2, . . . , ym|θ) = h(yi|θ)f (ym|θ), −∞ < y1 < · · · < ym < ∞
i=1

(3.10)

Universitas Sumatera Utara

19

dengan h(y|θ) = f(y|θ)/[1 − F (y|θ)]. Sehingga fungsi densitas probabilitas marginal pada cuplikan informasi k pada Yk adalah

fk(y|θ)

=

[H

(y|θ)]k−1 Γ(k)

f

(y|θ)

(3.11)

dengan H(y|θ) = − ln(1 − F (y|θ)). Dengan parameter Pareto α dan τ yang belum diketahui, diberikan fungsi likelihood yaitu

L(α, τ |y) ∝ αmτ αym−αI[y1 > τ ]

(3.12)

dengan I[A] merupakan fungsi indikator pada kejadian A.

Suatu prior konjugasi joint untuk (α, τ ) digeneralisasikan dengan prior Lwin atau prior power-gamma yang didenotasikan sebagai P G(υ, λ, µ, L0) yaitu

π(α, τ ) ∝ αυτ λα−1µ−α(α > 0, 0 < τ < L0)

(3.13)

dengan υ, λ, µ, L0 merupakan konstanta positif dan L0 < µ. Prior mengidentifikasikan

π(α) sebagai Ga(υ, ln µ−λ, ln L0) dan π(τ |α) sebagai distribusi fungsi power P F (λα, L0)

yaitu

π(τ |α) ∝ λατ λα−1L−0 λα(0 < τ < L0)

(3.14)

Dengan menggabungkan persamaan (3.13) dan (3.14), diperoleh densitas posterior pada α dan τ sebagai berikut

π(α, τ |y)



αm+υ τ

exp{−α[Λ1

− (λ

+ 1) ln τ ]}I[τ

<

M1]

(3.15)

dengan M1 = min(y1, L0) dan Λ1 = ln µ+ln ym. Integrasikan α dan τ sehingga diperoleh densitas prior pada α dan τ , berturut-turut yaitu

π(α|y) ∝ αm+υ−1 exp{−α[Λ1 − (λ + 1) ln M1]}

(3.16)

dan

π(τ |y)



1 τ

[Λ1

− (λ +

1) ln τ ]−(m+υ+1)I[τ

<

M1]

Sehingga, diperoleh estimator Bayesian pada α secara eksplisit yaitu

αB

=

[Λ1



m+υ (λ + 1) ln M1]

(3.17) (3.18)

Universitas Sumatera Utara

BAB 4
ESTIMASI BAYES UNTUK PARAMETER PARETO DENGAN MENGGUNAKAN FUNGSI LIKELIHOOD

Tesis ini menjabarkan tentang metode estimasi Bayes untuk parameter Pareto. Persoalan ini banyak digunakan dalam persoalan analisis data uji statistik terhadap daya tahan hidup suatu benda atau individu didasarkan pada keadaan operasional tertentu. Penerapan dari analisis ini biasanya banyak digunakan di bidang kedokteran yang berkaitan dengan pemodelan ketahanan hidup penderita penyakit tertentu (Lee, 1992) dan di bidang pertanian yang berkaitan dengan pemodelan ketahanan hidup benda-benda produksi (Barlow dan Proschan, 1996). Ketahanan atau daya tahan tersebut selanjutnya disebut sebagai reliabilitas (realibility). Dalam tesis ini, persoalan estimasi Bayes untuk parameter Pareto dikaji dalam bentuk atau fungsi-fungsi umum sebagai berikut.

4.1 Estimasi Maximum-Likelihood
Suatu variabel acak X mempunyai distribusi Pareto yang didenotasikan sebagai X ∼ P ar(β, α) dengan distribusi Gamma-normal kondisional. Maka, diperoleh fungsi densitas probabilitas yaitu

f (x; β, α) = αβαx−(α+1), x ≥ β > 0, α > 0

(4.1)

dan fungsi densitas kumulatif

F (x; β, α) = 1 −

β x

α
, x ≥ β > 0, α > 0

dengan nilai ekspektasi yang ditentukan oleh

E(x)

=

µ

=

αβ β−

1

,

β>1

dan nilai variansi yang ditentukan oleh

V ar(x) = α − 1 µ2, α > 2 α(α − 2)

(4.2) (4.3) (4.4)

20
Universitas Sumatera Utara

21

Asumsikan terdapat barisan data pengamatan {X1, X2, . . . , Xn} dari suatu distribusi Pareto (β, α), sehingga fungsi likelihood diformulasikan dengan

L(β, α; xi, ki)

=

αm β α
n i=1

n i=1

ki

xαi ki+1

,

dan fungsi log-likelihood adalah

0 < β ≤ xn,

α>0

(4.5)

nn
l(β, α; xi, ki) = m ln α − α ki(ln xi − ln β) − ln xi, 0 < β ≤ xn, α > 0 (4.6)
i=1 i=1

Karena

∂ ∂β

l(β,

α;

xi,

ki)

=

αβ −1

n i=1

ki

>

0, l(β, α; xi, ki),

sehingga

βˆN = Xn dan αˆN = n−1

n

Ki(log xi − log xn)

i=1

(4.7)

Untuk fungsi maximum-likelihood, L, untuk distribusi Pareto mempunyai bentuk yang diyatakan sebagai berikut

L(x,

α|β)

=

n i=1

αxα xiα+1

;

0 < k ≤ min{xi}, α > 0

(4.8)

Maximum likelihood digunakan untuk mengestimasi nilai x dan α dengan tujuan diperoleh hasil estimasi semaksimal mungkin pada data yang diberikan untuk fungsi likelihood L.

Agar diperoleh fungsi maximum likelihood yang dengan nilai paling maksimum untuk parameter α, dapat digunakan logaritma pada fungsi dimana fungsi L merupakan fungsi nonnegatif. Logaritma merupakan fungsi bijektif, sehingga nilai pada α yang dapat memaksimumkan L juga dapat memaksimumkan fungsi log L dengan langkah sebagai berikut.

n
log L(x, α|x) = log
i=1

αxα xαi +1

n

= n log(α) + αn log(k) − (α + 1) log(xi)

i=1

d dα

=

n
n

α + n log(k) − log(xi)

i=1

Universitas Sumatera Utara

22

Set turunan dari fungsi sama dengan 0, sehingga L merupakan maksimum dengan

ketentuan

αˆ = n n log
i=1

xi k

4.2 Estimasi Bayes untuk Parameter Pareto

Dalam penelitian ini diberikan beberapa asumsi dalam estimasi Bayes untuk parameter Pareto sebagai berikut. Asumsikan terdapat barisan data pengamatan yang

saling bebas kontinu {X1, X2, . . . , Xm} dimana Ki adalah jumlah pengamatan yang dilakukan dalam memperoleh nilai minimum Xi agar diperoleh nilai data pengamatan yang baru, Xi+1. Dari barisan data pengamatan yang ada, data yang diuji dinotasikan dengan (x, k) := (x1, k1, x2, k2, . . . , xm, km) dimana xi adalah data pengamatan dan ki menatakan jumlah pengamatan yang dilakukan terhadap data pengamatan xi. Andaikan terdapat dua parameter Pareto P ar(β, α), maka fungsi fungsi kumulatif densitas dinyatakan dengan

F (x; β, α) = 1 −

β x

α
,

x ≥ β > 0,

α>0

(4.9)

dan fungsi probabilitas densitas adalah

f (x; β, α) = αβαx−(α+1), x ≥ β > 0, α > 0

(4.10)

Dari asumsi tersebut diperoleh fungsi probabilitas densitas joint pada X = (X1, X2, . . . , Xm) yaitu

m−1
F1,2,...,m(x1, x2, . . . , xm) = h(xi|θ)f (xm|θ),
i=1

−∞ < x1 < · · · < xm < ∞

dan fungsi probabilitas densitas marginal pada data pengamatan Xk adalah

fk(x|θ)

=

[H

(x|θ)]k−1 Γ(k)

f

(x|θ)

(4.11) (4.12)

dimana H(x|θ) = − ln(1 − F (x|θ)). Maka, untuk parameter Pareto β dan α yang tidak diketahui, diperoleh fungsi likelihood

L(β, α|x) ∝ βmαβxm−βI[x1 > α]

(4.13)

Universitas Sumatera Utara

23

dimana I[A] merupakan fungsi indikator suatu kejadian A.

Suatu prior konjugasi joint untuk (β, α) diperoleh dari prior distribusi Gamma, yaitu Gamma(ν, λ, µ, Lo) yang dinyatakan sebagai berikut

π(β, α) ∝ βνααβ−1µ−β(β > 0, 0 < α < Lo)

(4.14)

dimana ν, λ, µ, Lo merupakan konstanta positif dan Lo < µ dengan prior π(α) sebagai Gamma(ν, lnµ − λ ln Lo) dan π(α|β) adalah fungsi distribusi (λβ, Lo) dengan bentuk

pi(α|β) ∝ λβλβ−1Lo−λβ(0 < α < Lo)

(4.15)

Kombinasikan Persamaan (3.13) dan (3.14), diperoleh densitas posterior pada β dan α

sebagai

π(β, α|x) ∝

β m+ν α

exp

{−β[Λ1 − (λ + 1) ln α]}I[α < M1]

(4.16)

dimana M1 = min(x1, Lo) dan Λ1 = ln µ + ln xm. Integrasikan α dan β dari Persamaan

(3.16), sehingga diperoleh posterior densitas β dan α, berturut-turut, yaitu

π(β|x) ∝ βm+ν−1 exp {−β[Λ1 − (λ + 1) ln M1]}

(4.17)

dan

π(α|x)



1 α

[Λ1





+

1) ln α]−(m+ν−1)I[α

<

M1]

(4.18)

Akibatnya, diperoleh estimator Bayes pada β secara eksplisit dinyatakan dengan

βB

=

[Λ1



m+ν (λ + 1) ln

M1]

(4.19)

dan estimasi Bayes pada fungsi realibilitas R(t) = P (X > t) berdasarkan pada m pengamatan dinyatakan dengan

RB(t)

=

λ λ

+ +

1 2

Λ1 − (λ + 1) ln M1 Λ1 + ln t − (λ + 2) ln M1

(4.20)

4.2.1 Distribusi prediktif
Akan ditunjukkan distribusi prediktif Bayes untuk nilai data pengamatan masa yang akan datang diuji X = (x1, x2, . . . , xm). Gunakan estimator Bayes dari Persamaan (3.19) untuk menentukan nilai data ke-m dari Xn(1 ≤ m < n) dengan tujuan memperoleh fungsi prediktif densitas Xn dengan X = x.

Universitas Sumatera Utara

24

Barisan data pengamatan {Xi, i ≥ 1} merupakan rantai Markov dimana fungsi probabilitas densitas kondisional Xn dengan X = x dan parameter θ ∈ Rk adalah

fn(xn|x, θ)

=

1 Γ(n,

m)

[H

(xn|θ)



H(xm|θ)]n−m−1 [1

f (xn|θ − F (xm|θ)]

(4.21)

dengan 1 ≤ m < n. Untuk distribusi Pareto dengan fungsi kumulatif densitas pada Persamaan (3.9) dan fungsi probabilitas densitas pada Persamaan (3.10) diperoleh

fn(xn|x, β, α)

=

β n−m Γ(n − m)

1 xn

xm xn

β

ln

xm xn

n−m−1
I[α < xm < xn]

(4.22)

Dari hasil perkalian fn(xn|x, β, α) dan hasil perolehan densitas posterior joint β dan α dari Persamaan (3.11), maka model Bayes dapat diformulasikan sebagai berikut

π(β, α, xn|x)



β

n+ν
β

x−n (β+1)

ln

xn xm

n−m−1

exp {−β[ln µ − (λ + 1) ln α]}I[α < M2]

(4.23)

dimana M2 = min(M1, xm). Integrasikan β dan α dimana 1 ≤ m < n, fungsi prediktif densitas xn dengan X = x adalah

fn(xn|x)



[ln xn − ln xm]n−m−1 xn[Λ2 + ln xm]n+ν

I

[xm

<

xn]

(4.24)

dimana Λ2 = ln µ − (λ + 1) ln M2.

Diberikan W > 0 untuk fungsi densitas yang diperoleh pada Persamaan (3.24) dimana Xn = xmeW pada data pengamatan yang diuji x, sehingga fungsi probabilitas densitas kondisional W untuk x adalah

p(w|x)

=

(Λ2 + ln xm)m+ν B(m + ν, n − m)

(Λ2

+

wn−m−1 ln xm +

w)n+ν

,

w>0

(4.25)

dimana W mempunyai distribusi Gamma Gamma(a, b, c) dengan parameter a = m +ν, b = Λ2 + ln xm dan c = n − m. Maka, parameter prediksi Bayes terhadap W adalah

w = E(w|x) = (Λ2 + ln xm)[(n − m)/(m + ν − 1)]

(4.26)

Set suatu himpunan C ⊂ (0, ∞) dari bentuk C = {xn|p(xn|x) ≥ cα} dimana cα adalah konstanta dengan P (Xn ∈ C|x) = 1 − α, yaitu 100(1 − α)% untuk densitas posterior tertinggi untuk Xn. Dari bentuk Persamaan (3.24) dimana interval prediksi densitas

Universitas Sumatera Utara

25

posterior tertinggi adalah 100(1 − α)% dinotasikan sebagai (I1∗, I2∗) untuk Xn harus memenuhi Rxn(I1∗|x)−Rxn(I2∗|x) = 1−β dan pxn (I1∗|x) = pxn (I2∗|x) dimana pxn (t|x) dan Rxn (t|x) masing-masing menyatakan fungsi densitas prediktif dan fungsi realibil