commit to user 2
Proses Markov dikatakan sebagai rantai Markov jika ruang statenya diskrit. Probabilitas bersyarat
] [
1
i X
j X
P
n n
= =
-
biasa disebut dengan probabilitas transisi rantai Markov.
Jika probabilitas transisi tidak diketahui atau probabilitas transisi tersebut merupakan fungsi dari parameter yang tidak diketahui maka perlu untuk membuat
inferensi tentang probabilitas transisi dari data empiris. Dalam statistik, inferensi adalah proses penarikan kesimpulan tentang distribusi populasi berdasarkan
distribusi sampel yang diambil dari populasi tersebut. Salah satu cabang penting dari inferensi statistik adalah estimasi pendugaan yang terdiri dari dua macam
yaitu estimasi titik dan estimasi interval. Tujuan estimasi titik adalah menduga nilai parameter yang tidak diketahui. Estimasi titik sendiri tidak memberikan
informasi akurasinya. Estimasi interval diperlukan untuk mengetahui seberapa dekat atau seberapa besar harapan estimasi titik itu mendekati nilai yang
sebenarnya. Selain itu, estimasi interval sendiri bisa digunakan dalam proses pengambilan kesimpulan.
Dalam banyak literatur, kebanyakan para peneliti mengunakan metode maksimum likelihood untuk mengestimasi probabilitas transisi rantai markov
sebagaimana dalam Spring 2009. Sulistyowati 2003 telah membahas tentang estimasi titik dan uji hipotesis dalam rantai Markov. Oleh karena itu, dalam
skripsi ini akan dibahas mengenai interval konfidensi untuk probabilitas transisi rantai Markov dan dikaji ulang tentang pendugaan probabilitas transisi rantai
Markov dengan metode maksimum likelihood.
1.2 Rumusan Masalah
Permasalahan yang dibahas dalam penulisan skripsi ini adalah bagaimana menentukan interval konfidensi untuk probabilitas transisi rantai Markov diskrit.
commit to user 3
1.3 Batasan Masalah
Berdasarkan pada rumusan masalah di atas, pembahasan dalam skripsi ini dibatasi pada penerapan metode maksimum likelihood dalam mengestimasi
probabilitas transisi rantai Markov orde satu dengan ruang state berhingga diskrit.
1.4 Tujuan dan Manfaat Penulisan
Tujuan dari penulisan skripsi ini adalah mampu menyajikan interval konfidensi untuk probabilitas transisi rantai Markov diskrit. Dengan tercapainya
tujuan ini, penulisan skripsi ini diharapkan dapat menambah pengetahuan tentang inferensi statistik pada rantai Markov khususnya pada estimasi interval konfidensi
probabilitas transisinya.
commit to user
4
BAB II LANDASAN TEORI
2.1 Tinjauan Pustaka
Untuk mendukung pembahasan dalam skripsi ini dibutuhkan teori-teori dasar berikut.
2.1.1. Ruang Sampel, Kejadian, Probabilitas dan Variabel Random Beberapa definisi yang berkaitan dengan ruang sampel, kejadian,
probabilitas dan variabel random berikut diambil dari Bain dan Engelhardt 1992.
Definisi 2.1.1 Ruang sampel S dari suatu percobaan adalah himpunan semua
hasil outcome yang mungkin dari percobaan tersebut.
Definisi 2.1.2 Suatu kejadian event adalah sembarang subset dari hasil yang
termuat dalam ruang sampel.
Definisi 2.1.3
Probabilitas adalah kemungkinan terjadinya suatu peristiwa diantara keseluruhan peristiwa yang mungkin terjadi.
Definisi 2.1.4 Variabel random X adalah suatu fungsi yang memetakan setiap
hasil yang mungkin e dalam ruang sampel S dengan bilangan real sedemikian sehingga Xe = x, x
Î R.
Definisi 2.1.5
Jika himpunan semua nilai yang mungkin dari variabel random X merupakan himpunan terhitung
, , … , atau , , … maka variabel random X disebut variabel random diskrit. Fungsi
= [ = ] untuk x = , , … disebut fungsi kepadatan probabilitas diskrit.
Definisi 2.1.6
Fungsi distribusi kumulatif dari variabel random X didefinisikan untuk sembarang bilangan real dengan
= [ ≤ ].
Definisi 2.1.7 Variabel random X disebut variabel random kontinu jika fungsi
distribusi kumulatifnya bisa dinyatakan sebagai =
.
Definisi 2.1.8 Fungsi kepadatan probabilitas bersama dari variabel random
diskrit X = , … ,
didefinisikan sebagai , , … , = [ = ,
= , … ,
= ].
commit to user 5
Definisi 2.1.9
Jika
1
X dan
2
X merupakan variabel random diskrit atau kontinu dengan fungsi kepadatan probabilitas bersama
, maka fungsi kepadatan probabilitas bersyarat dari
2
x diberikan
1
X =
1
x didefinisikan sebagai | =
,
untuk nilai-nilai
1
x sedemikian sehingga 0 dan nol untuk nilai yang lain.
Definisi 2.1.10 Jika X variabel random dengan fungsi kepadatan probabilitas
x f
maka harga harapan expected value dari X didefinisikan sebagai = ∑
jika X diskrit =
jika X kontinu
Definisi 2.1.11 Variansi dari variabel random X diberikan oleh
l = [ − ]
Definisi 2.1.12 Kovariansi dari pasangan variabel random X dan Y didefinisikan
dengan
] [
,
y x
Y X
E Y
X Cov
m m
- -
=
Definisi 2.1.13 Jika X variabel random maka
tX X
e E
t M
= Disebut fungsi pembangkit momen dari X jika harga harapan ini ada untuk semua
nilai t dalam suatu interval h
t h
- , untuk suatu h 0.
2.1.2. Distribusi Multinomial
Definisi 2.1.10 Lebanon, 2006
Variabel random
k
X X
X ,...,
,
2 1
mempunyai distribusi multinomial dengan parameter n dan
k
p p
p ,...,
,
2 1
dengan ³
i
p ,
1
1
=
å
= k
i i
p
jika mempunyai fungsi kepadatan probabilitas
k
x k
x x
k k
p p
p x
x x
n x
x f
... ...
,...,
2 1
2 1
2 1
1
÷÷ ø
ö çç
è æ
=
jika ³
i
x dan
n x
k i
i
=
å
=1
dan nol untuk yang lain,
commit to user 6
dengan … =
…
. Distribusi multinomial digunakan ketika dipunyai sebuah percobaan dengan k
kemungkinan hasil, yang masing-masing terjadi dengan probabilitas
i
p . Percobaaan diulang sebanyak n kali dan
k
X X
X ,...,
,
2 1
mengukur jumlah kejadian masing-masing kelas hasil. Karena terdapat n percobaan, maka
jumlah keseluruhan hasil adalah
n x
k i
i
=
å
=1
, dan karena probabilitas memperoleh
hasil i sebesar
i
p , maka
1
1
=
å
= k
i i
p
.
2.1.3. Distribusi Normal, Gamma dan Chi Kuadrat Definisi berikut diambil dari Bain dan Engelhardt 1992.
Definisi 2.1.11 Suatu variabel random X mengikuti distribusi normal dengan
mean m dan variansi
2
s jika mempunyai fungsi kepadatan probabilitas
2 ]
[
2
2 1
, ;
s m
s p
s m
-
=
x
e x
f untuk
¥ ¥
- x
dengan
¥ ¥
-
m dan
¥ s
. Notasi yang menyatakan X berdistribusi normal adalah X ~
,
2
s m
N .
Definisi 2.1.12
Fungsi gamma dinotasikan dengan
k G
untuk semua k 0, didefinisikan sebagai
ò
¥ -
-
= G
1
dt e
t k
t k
.
Definisi 2.1.13 Variabel random X dikatakan berdistribusi gamma dengan
parameter k 0 dan q
, jika mempunyai fungsi kepadatan probabilitas
ïî ï
í ì
G =
- -
1 ,
;
1 q
q q
x k
k
e x
k k
x f
untuk x 0 untuk x yang lain.
Notasi khusus yang menunjukkan X berdistribusi gamma yaitu X ~ GAM
k ,
q .
commit to user 7
Definisi 2.1.14 Jika X ~ GAM
2 ,
2 v maka variabel X dikatakan berdistribusi
2
c dengan derajat bebas v dinotasikan dengan X ~
2
c v.
Teorema 2.1.1 Jika X ~
2
c v maka
v X
Var v
X E
t t
M
v x
2 2
1
2
= =
- =
-
Teorema 2.1.2 Jika
~
2 i
i
v X
c , i = 1,..., n, maka
~
1 2
1
å å
= =
=
n i
i n
i i
v X
Y
c .
Teorema 2.1.3 Jika
1 ,
~ N Z
maka 1
~
2 2
c Z
.
Teorema 2.1.4 Teorema Limit Pusat Jika
n
X X ,..,
1
adalah sampel random dari sebuah distribusi dengan mean
m dan variansi
2
s , maka distribusi limit
dari
s m
n n
X Z
n i
i n
- =
å
=1
adalah distribusi normal standar,
1 ,
~ N Z
Z
d n
¾® ¾
untuk ¥
® n
.
Definisi 2.1.15
Misalkan ,...
,
2 1
Y Y
adalah deretan variabel random dengan fungsi distribusi kumulatif
,... ,
2 1
y G
y G
sedemikian sehingga untuk tiap n = 1, 2, ... berlaku
] [
y Y
P y
G
n n
£ =
. Jika untuk suatu fungsi distribusi kumulatif
y G
berlaku
lim y
G y
G
n n
=
¥ ®
untuk semua nilai y dan
y G
kontinu maka ,...
,
2 1
Y Y
dikatakan konvergen dalam distribusi ke
~ y
G Y
yang dinotasikan dengan
Y Y
d n
¾® ¾
.
2.1.4. Metode Maksimum Likelihood Metode maksimum likelihood adalah metode yang cukup sering digunakan
untuk menduga nilai parameter. Ide dasar metode ini adalah menggunakan sebuah
commit to user 8
nilai dari ruang parameter yang menghasilkan peluang terbesar untuk menduga nilai parameter yang tidak diketahui. Berikut ini adalah beberapa definisi tentang
fungsi likelihood dan penduga maksimum likelihood yang dinyatakan oleh Bain dan Engelhardt 1992.
Definisi 2.1.16 Fungsi kepadatan probabilitas bersama dari n variabel random
n
X X ,..,
1
yang diberi nilai
n
x x ,..,
1
adalah ;
,..,
1
q
n
x x
f dan disebut sebagai
fungsi likelihood. Untuk
n
x x ,..,
1
tetap, fungsi likelihood adalah fungsi dari q
yang dinotasikan dengan L q . Jika
n
X X ,..,
1
adalah sampel random dari
;
q
x f
maka L
q = ;
... ;
1
q q
n
x f
x f
.
Definisi 2.1.17
Misalkan L q =
; ,..,
1
q
n
x x
f ,
W Î
q , merupakan fungsi
likelihood. Untuk suatu himpunan pengamatan {
n
x x ,..,
1
}, nilai qˆ di dalam W
yang memaksimumkan L q disebut penduga maksimum likelihood dari q . Jadi,
qˆ adalah nilai dari q yang memenuhi
; ,..,
1
q
n
x x
f =
; ,...,
1
q
q
n
x x
f maks
W Î
.
2.1.5. Metode Pengali Lagrange Metode Pengali Lagrange digunakan untuk mencari nilai maksimum atau
nilai minimum fungsi fx, y, z terhadap kendala gx, y, z = k. Langkahnya adalah a. Menyelesaikan persamaan Lagrange
, ,
, ,
z y
x g
z y
x f
Ñ =
Ñ
l konstanta
l disebut pengali Lagrange. b. Menghitung f di semua titik x, y, z yang dihasilkan dari langkah a. Nilai
yang terbesar adalah nilai maksimum f, sedangkan nilai yang terkecil adalah nilai minimum f.
Dawkins, 2007 .
commit to user 9
2.1.6. Statistik Cukup
Definisi 2.1.18 Bain dan Engelhardt, 1992
Suatu fungsi variabel random yang tidak bergantung pada parameter yang tidak diketahui disebut statistik.
Definisi 2.1.19 Bain dan Engelhardt, 1992
Misalkan X = ,..,
1 n
X X
mempunyai fungsi kepadatan probabilitas bersama ;
,..,
1
q
n
x x
f dan T =
,..,
1 k
T T
adalah sebuah vektor statistik. T adalah statistik cukup bersama untuk
q jika fungsi kepadatan probabilitas bersyarat v
f
t V
tidak bergantung pada
q , dengan V merupakan vektor statistik yang lain. Dalam kasus satu dimensi cukup dikatakan bahwa T adalah statistik cukup untuk
q .
Definisi 2.1.20 Kriteria Faktorisasi Bain dan Engelhardt, 1992
Jika X mempunyai fungsi kepadatan probabilitas bersama ;
,..,
1
q
n
x x
f dan T =
,..,
1 k
T T
maka
k
T T ,..,
1
merupakan statistik cukup bersama untuk q jika dan
hanya jika
,..., ;
; ,..,
1 1
n n
x x
h t
g x
x f
q q
=
dengan gt; q tidak bergantung pada
n
x x ,..,
1
dan h
n
x x ,..,
1
tidak mengandung q.
Menurut Laurence dan Chein-I Chang 1993, dalam model rantai Markov bisa ditunjukkan bahwa state awal dan jumlah transisi membentuk suatu statistik
cukup dengan kriteria faktorisasi.
2.1.7. Interval Konfidensi untuk q
Definisi 2.1.21 Bain dan Engelhardt, 1992
Misalkan
n
X X ,..,
1
mempunyai fungsi kepadatan probabilitas bersama ;
,..,
1
q
n
x x
f . Sedangkan L dan U adalah statistik dengan
,..,
1 n
X X
l L
= dan
,..,
1 n
X X
u U
= . Jika diketahui suatu data percobaan
n
x x ,..,
1
, maka dipunyai nilai pengamatan
,..,
1 n
x x
l dan
,..,
1 n
x x
u . Interval
,..,
1 n
x x
l ,
,..,
1 n
x x
u dikatakan sebagai interval konfidensi 100
a -
1 untuk
q jika
commit to user 10
a q
- =
1 ]
,.., ,..,
[
1 1
n n
X X
u X
X l
P .
Nilai pengamatan ,..,
1 n
x x
l dan
,..,
1 n
x x
u disebut batas konfidensi bawah dan
atas. Untuk menentukan interval konfidensi yang memperhitungkan semua
parameter digunakan interval konfidensi simultan. Dalam menentukan interval konfidensi
simultan, digunakan
pertidaksamaan Bonferroni
untuk mempertimbangkan semua parameter secara simultan. Teknik perhitungan
interval konfidensi ini diperkenalkan oleh Goodman Petrie, 1998.
2.1.8. Rantai Markov Diskrit Menurut Taylor dan Karlin 1994, proses Markov adalah proses stokastik
yang mempunyai sifat jika diberikan nilai
n
X , nilai
1 +
n
X tidak dipengaruhi oleh
nilai
m
X , untuk m n. Secara formal, suatu proses dikatakan proses Markov jika memenuhi sifat Markov yaitu
] ,
,..., [
1 1
1 1
1
i X
i X
i X
j X
P
n n
n n
= =
= =
- -
+
= }
{
1
i X
j X
P
n n
= =
+
. Rantai Markov waktu diskrit adalah proses Markov yang mempunyai ruang
state berhingga atau terhitung dan himpunan indeks T = {0, 1, 2,…}. Probabilitas
1 +
n
X akan berada pada state j dengan syarat
n
X berada pada state i disebut probabilitas transisi satu langkah yang dinotasikan dengan
1 , +
n n
ij
p .
} {
1 1
,
i X
j X
P p
n n
n n
ij
= =
=
+ +
. Notasi ini menyatakan bahwa secara umum, probabilitas transisi selain merupakan
fungsi state awal dan akhir, juga merupakan fungsi selang waktu. Jika probabilitas transisi satu langkah independen terhadap variabel waktu n, maka dikatakan rantai
Markov mempunyai probabilitas transisi stasioner, sehingga
1 , +
n n
ij
p =
ij
p , dengan
ij
p adalah probabilitas bersyarat proses akan bergerak dari state i ke state j. Untuk selanjutnya probabilitas transisi ini dinyatakan dengan bentuk matriks
berikut.
commit to user 11
P =
ú ú
ú ú
û ù
ê ê
ê ê
ë é
rr r
r r
r
p p
p p
p p
p p
p
2 1
2 22
21 1
12 11
dengan
³
ij
p
, 1
1
=
å
= r
j ij
p i, j = 1,2,…,r.
Selain probabilitas transisi, rantai Markov juga ditentukan dengan distribusi probabilitasnya distribusi awal. Misalkan
i
p i
X P
= = ]
[ . Dengan
definisi probabilitas bersyarat diperoleh ]
,..., ,
[
1 1
n n
i X
i X
i X
P =
= =
= ]
,..., ,
[
1 1
1 1
- -
= =
=
n n
i X
i X
i X
P ´
] ,...,
, [
1 1
1 1
- -
= =
= =
n n
n n
i X
i X
i X
i X
P .
Dari definisi proses Markov, ]
,..., [
1 1
- -
= =
=
t n
n n
i X
i X
i X
P =
} {
1 1
- -
= =
n n
n n
i X
i X
P .
=
n n
i i
P
1 -
. Sehingga diperoleh
] ,...,
, [
1 1
n n
i X
i X
i X
P =
= =
= ]
[ i
X P
= ´
} {
1 1
- -
= =
n n
n n
i X
i X
P ´ … ´
} {
1 1
i X
i X
P =
= =
i
p
1
i i
p
...
n n
i i
p
1 -
. Ini menunjukkan bahwa rantai Markov ditentukan oleh probabilitas di awal proses
dan probabilitas transisinya.
Suatu matriks probabilitas transisi P dikatakan regular jika matriks tersebut dipangkatkan oleh suatu konstanta positif k maka matriks P
k
seluruh elemennya bernilai positif. Matriks peluang transisi yang demikian serta rantai
Markov yang berkaitan dengannya disebut regular. Hal yang penting dalam rantai
Markov regular adalah adanya limiting probability distribution p =
r
p p
p ,...,
,
2 1
dimana
j
p 0 untuk j = 1, 2,…, r. dan
1 =
å
j j
p . Secara formal, untuk matriks
probabilitas transisi regular terdapat konvergensi,
commit to user 12
] [
lim =
= =
¥ ®
j n
n
i X
j X
P p
, untuk j = 1, 2,…, r . Konvergensi di atas menyatakan bahwa dalam jangka waktu yang lama
⟶ ∞, probabilitas proses berada di state j adalah
j
p , tanpa memperhatikan dimana rantai tersebut berawal.
Beberapa definisi tentang sifat state rantai Markov berikut dinyatakan oleh Ross 1983.
Definisi 2.1.22 State j dikatakan dapat dicapai dari state i ,
j i
® , jika terdapat ³
n sedemikian sehingga
n ij
p . Jika
j i
® dan i
j ® maka i dan j
dikatakan saling berkomunikasi, ditulis j
i « .
Suatu rantai Markov dikatakan irreducible jika semua state-nya saling berkomunikasi satu sama lain.
Definisi 2.1.23 Untuk sebarang i dan j,
n ij
f menyatakan probabilitas dari state i
pertama kali tiba di j dalam n langkah, yang dinyatakan sebagai }
1 ,...,
2 ,
1 ,
, Pr{
i X
n k
j X
j X
f
k n
n ij
= -
= ¹
= =
.
Definisi 2.1.24 Suatu state i dikatakan recurrent jika
1 =
ii
f probabilitas bahwa
i akan kembali ke i adalah 1 sedangkan state i dikatakan non-recurrent atau transient jika
1
ii
f .
2.2 Kerangka Pemikiran