Permainan dengan penghentian optimal suatu jalan acak

PERMAINAN DENGAN PENGHENTIAN OPTIMAL
SUATU JALAN ACAK

Oleh :
EVA RACHMANIA SAIDAH
G54101049

PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2006

RINGKASAN
EVA RACHMANIA. Permainan dengan Penghentian Optimal Suatu Jalan Acak. Dibimbing oleh I
G. PUTU PURNABA dan I WAYAN MANGKU.
Diketahui sebuah permainan yang terdiri atas dua pemain, memiliki bentuk jalan acak simetrik. Pada
permainan ini, proses jalan acak simetrik pemain I direpresentasikan oleh

x n dan pemain II oleh y n .

Peubah acak tersebut adalah proses jalan acak simetrik yang berada dalam himpunan state

E = {0,1,..., K } . Diasumsikan peluang berpindah pada setiap state adalah sebesar p = 0.5 . Namun
khusus pada state 0 dan K , selain memiliki peluang berpindah sebesar 0.5 menuju state 1 dan K − 1
atau sebaliknya, juga memiliki peluang untuk tidak berpindah (absorbed) sebesar 0.5.
Permainan akan dimulai ketika pemain berada pada sembarang state awal, yaitu a dan b , dimana
1 ≤ a < b ≤ K − 1 . Setelah itu kedua pemain akan berhenti pada waktu Markov τ dan σ yang menjadi
strategi penghentiannya. Setiap pemain hanya mengetahui nilai dari K, a dan b , tetapi tidak
mengetahui tentang tindakan yang diambil oleh pemain lainnya. Adapun peraturan permainannya
adalah sebagai berikut : jika xτ > yσ maka pemain II membayar pemain I sebesar $1 ; jika xτ < y σ
maka pemain I yang membayar kepada pemain II sebesar $1 ; dan jika xτ = yσ
pemainan adalah seri.

maka hasil dari

Keinginan dari setiap pemain adalah untuk dapat memaksimumkan nilai harapan imbalan permainan
tersebut terhadap strategi penghentian yang dilakukan oleh pemain lainnya. Untuk itu, setiap pemain
perlu menerapkan suatu strategi penghentian yang optimal dalam menghadapi strategi penghentian
pemain lainnya. Kemudian dari strategi yang diterapkan oleh kedua pemain tersebut akan ditentukan
keadaan keseimbangan dan nilai dari permainan tersebut.

PERMAINAN DENGAN PENGHENTIAN OPTIMAL

SUATU JALAN ACAK

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains
Pada Fakultas Matematika dan Ilmu Pengetahuan Alam

Oleh :
EVA RACHMANIA SAIDAH
G54101049

PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2006

Judul : Permainan dengan Penghentian Optimal Suatu Jalan Acak
Nama : Eva Rachmania Saidah
Nrp : G54101049


Tangga l Lulus :.................................

RIWAYAT HIDUP

Penulis dilahirkan di Bogor pada tanggal 5 Mei 1983 yang merupakan anak ke-3 dari tiga
bersaudara dari pasangan H.Dudung Murodz Ghani dan Siti Chotidjah.
Pada tahun 1988 penulis memulai pendidikan formalnya di TK AL-IRSYAD Bogor dan
dilanjutkan di SDN Polisi I Bogor (1989-1995). Kemudian penulis melanjutkan pendidikannya ke
SLTP Negeri 2 Bogor (1995-1998) dan diteruskan ke SMU Negeri 1 Bogor (1998-2001). Penulis
diterima di Institut Pertanian Bogor melalui jalur UMPTN pada program studi Matematika, Fakultas
Matematika dan Ilmu Pengetahuan Alam.
Selama kuliah penulis pernah aktif dalam kepengurusan DKM Al-Ghiffari dan beberapa kali
masuk kedalam kepanitiaan di GUMATIKA maupun di BEM FMIPA.

PRAKATA
Assalamualaikum Warahmatullahi Wabarakatuh.
Puji syukur kehadirat Allah SWT penulis ucapkan atas limpahan nikmat yang tiada hentinya,
serta atas rahmat dan ridho-Nya sehingga penulis dapat menyelesaikan skripsi ini.
Pada kesempatan ini, penulis pun ingin mengucapkan terimakasih kepada pihak-pihak yang
telah sangat membantu dalam penulisan skripsi ini, yaitu:

1. Kepada Bapak Putu Purnaba selaku pembimbing I dan Bapak I Wayan Mangku selaku
pembimbing II, yang telah memb erikan nasehat, arahan, serta bimbingannya.
2. Untuk kedua orangtua yang sangat luar biasa, Papa dan Mama yang telah membesarkan penulis
dengan seluruh cinta, doa, kesabaran dan semua nasehatnya untuk mengarungi kehidupan.
3. Untuk kedua kakak penulis , Nuniek dan Irfan yang menjadi teladan bagi penulis, serta seluruh
keluarga besar atas dukungannya.
4. Untuk teman-teman Math’38 yang telah mewarnai hari-hari penulis dengan keceriaan dan
kebersamaan, terutama Nanik, Nia, Feidy, Saidah, Endah, Seny dan Niken. Terima kasih pula pada
Meriyaldi, Yana dan Andri atas kesediaannya menjadi pembahas, serta Linda yang selalu bersedia
berdiskusi dengan penulis.
5. Untuk seluruh kakak angkatan 37, 36 dan 35 yang telah membagi pengalamannya baik dalam hal
pelajaran kuliah maupun pengalaman hidup, khususnya teh Pipit’37. Serta adik angkatan 39 dan
40 atas kebersamaannya.
6. Untuk seluruh staf TU, Bu Ade, Mas Bono, Bu Marissi dan Mas Deni yang telah membantu
dalam akademik penulis. Kepada Bu Susi atas dorongan dan nasehatnya dalam menempuh tugas
akhir serta Mas Yono yang selalu membantu penulis dalam mencari dosen.
Selain itu, penulis pun sangat mengucapkan terimakasih kepada seluruh dosen Matematika
IPB yang telah mendidik, membimbing serta menurunkan ilmu pengetahuan yang sangat berguna
pada penulis. Semoga penulis dapat memanfaatkan seluruh didikan dan ilmu yang telah diberikan
sebaik mungkin. Amin.

Wasalam

Eva Rachmania

DAFTAR ISI

DAFTAR ISI........................................................................................................vi
DAFTAR GRAFIK............................................................................................vii
DAFRAR LAMPIRAN......................................................................................vii
PENDAHULUAN............................................................................................... 1
Latar Belakang............................................................................................. 1
Tujuan.......................................................................................................... 1
LANDASAN TEORI........................................................................................... 1
Ruang Contoh, Kejadian dan Peluang.......................................................... 1
Peubah Acak................................................................................................. 2
Jalan Acak.................................................................................................... 2
Rantai Markov.............................................................................................. 2
Klasifikasi State ........................................................................................... 3
Supremum dan Infimum............................................................................... 3
Waktu Markov.............................................................................................. 3

PEMBAHASAN.................................................................................................. 4
Strategi pemain.............................................................................................. 4
Fungsi imbalan pemain
1. Fungsi imbalan pemain I....................................................................... 5
2. Fungsi imbalan pemain II...................................................................... 6
Keadaan keseimbangan.................................................................................. 6
Contoh kasus................................................................................................... 8
SIMPULAN......................................................................................................... 10
DAFTAR PUSTAKA.......................................................................................... 11

DAFTAR GRAFIK

Grafik 1....................................................................................................................4
Grafik 2....................................................................................................................7
Grafik 3....................................................................................................................8

DAFTAR LAMPIRAN

Lampiran 1.............................................................................................................12
Lampiran 2.............................................................................................................13

Lampiran 3.............................................................................................................14
Lampiran 4.............................................................................................................17

PENDAHULUAN
Latar Belakang
Ada banyak
permasalahan dalam
kehidupan sehari-hari yang termasuk ke dalam
bentuk proses stokastik. Proses stokastik itu
sendiri
merupakan
salah
satu
bentuk
permasalahan yang terkait dengan aturan-aturan
peluang, dimana keadaan yang akan terjadi pada
waktu yang akan datang tidak dapat diketahui
secara pasti.
Salah satu bentuk permasalahan dari suatu
proses stokastik adalah jalan acak (random

walk). Jalan acak umumnya digunakan untuk
memodelkan situasi yang tidak pasti (gambling
situations) ,
misalnya
seperti
model
pembentukan harga di pasar bursa atau dapat
digunakan untuk menganalisis sistem antrian
(queueing system) dan sistem kebangkrutan
(ruin system).
Dalam tulisan ini, dikaji suatu permainan
dengan bentuk khusus jalan acak simetrik
(symmetric random walks). Permainan jalan
acak ini dimainkan oleh 2 orang pemain dalam
suatu himpunan state E={0,1,…,K}. Diketahui
bahwa pemain I memulai permainan pada suatu

state a dan pemain II pada state b, dengan
syarat state a b , maka d bukan batas bawah
A.

[Golberg, 1976]

Waktu Markov
Klasifikasi State
Definisi 13 ( State Terakses)
Suatu state j disebut terakses (accessible) dari
state i, jika ada minimal sebuah bilangan bulat
k=0 sehingga

p i(,kj) > 0 .

Definisi 18 (Filtrasi)
Filtrasi adalah himpunan F= { F t : t ≥ 0 } dari
submedan-σ dari F jika F s ⊆ F t untuk setiap
s≤t .
[Grimmett dan Stirzaker, 1992]

[Ross, 2000]
Definisi 14 (State Berkomunikasi)
Dua state i dan j disebut berkomunikasi

(communicate) , jika state i dapat diakses dari
state j dan state j dapat diakses dari state i.
[Ross, 2000]
Definisi 15 (State Penyerap)
Suatu state i disebut state penyerap (absorbing
state) jika

p ii = 1 .

Definisi 19 (Stopping time)
Peubah acak T yang mengambil nilai dari
{0,1,2,.....} ∪ {∞} disebut dengan stopping time
( yang terkait dengan filtrasi F ) jika
{T=n} ∈ F n untuk setiap n ≥ 0 .
[Grimmett dan Stirzaker, 1992]
Stopping time terkadang disebut dengan waktu
Markov.

PEMBAHASAN


Diketahui sebuah permainan dengan bentuk
jalan acak bebas simetrik . Permainan ini terdiri
atas dua pemain, dimana proses jalan acak dari
kedua pemain masing-masing direpresentasikan
oleh xn dan yn . Peubah acak xn dan yn adalah
proses jalan acak simetrik yang berada dalam
himpunan state E = {0,1,..., K } .
Diasumsikan peluang
berpindah pada
setiap state p i ,i +1 = p = 1 − p i ,i −1 ; i = 0 ,1,..., K
adalah sebesar p = 0.5 . Namun khusus pada
state 0 dan K , selain memiliki peluang
berpindah sebesar 0.5 menuju state 1 dan K − 1
atau sebaliknya. Pada state ini juga memiliki
peluang untuk tidak berpindah (absorbed)
sebesar 0.5.
0.5

0.5

yaitu −1 dan K + 1
untuk
menyatakan
penyerapan yang terjadi pada state 0 dan K .
Dengan kata lain, state −1 dan K + 1 adalah
state penyerap (absorbing state) dalam
permainan ini. Ini berarti, permainan akan
dengan sendirinya berakhir ketika salah satu
dari kedua pemain mencapai state tersebut untuk
pertama kalinya. Dimana jika pemain terserap di
state −1
maka pemain tersebut berarti
mengalami kekalahan dan sebaliknya jika
pemain tersebut berhasil terserap di state K + 1
maka pemain tersebut akan mencapai
kemenangan.
Karena state −1 dan K + 1 adalah state
penyerap
maka
p −1, −1 = 1 = p K +1, K +1 ,
sedangkan pada state lainnya peluang untuk
bertransisi +1 dan -1 adalah sebesar p = 0.5 ,

p i ,i +1 = p = 1 − p i , i −1

atau

0.5
0

K-1

1

0.5

0.5

K
0.5

untuk

setiap

i = 0,1,..., K . Maka bentuk matriks peluang
transisi satu langkah dari permainan ini adalah
sebagai berikut :

Gambar 1.
−1 0

Permainan ini akan dimulai ketika kedua
pemain telah berada pada sembarang state a
dan b , dimana 1 ≤ a < b ≤ K − 1 . Kemu dian
pemain I mengamati jalan acak xn sedangkan
pemain II mengamati jalan acak yn . Setelah itu
kedua pemain akan memutuskan berhenti pada
waktu Markov τ dan σ yang merupakan
strategi penghentian mereka. Diasumsikan
setiap pemain mengetahui nilai K, a dan b ,
akan tetapi mereka tidak mempunyai informasi
mengenai tindakan pemain lain.
Adapun peraturan permainan adalah
sebagai berikut :
• jika xτ > yσ maka pemain II membayar
pemain I sebesar $1 ;
• jika xτ < y σ maka pemain I yang membayar
kepada pemain II sebesar $1 ; dan
• jika xτ = yσ
maka hasil dari pemainan
adalah seri.
Setiap pemain menginginkan agar dapat
memaksimalkan nilai harapan dari hasil
permainannya.
Oleh karena pada state 0 dan K diketahui
memiliki peluang terserap (absorbed) sebesar
0.5 , maka diasumsikan suatu state khayalan

−1
0
1

1
0.5

0

2 0
3 0
P=

4 0
M M

K −1  0

K 0
K +1  0

1

2

LL

3 4

K −1

K K +1

0
0
0

LL
LL
LL

0
0
0

0
0
0

0 0.5 0 0.5 0
0 0 0.5 0 0.5

LL
LL

0
0

0
0

0
M
0

0
M
0

0 0.5 0
M M M
0 0 0

LL
O
O

0
M
0

0
M
0.5

0
0

0
0

0
0

LL
LL

0.5
0

0
0

0 0 0 0
0 0.5 0 0
0.5 0 0.5 0

0
0

0
0

0
0 
0

0
0

0
M

0

0.5
1 

Dari matriks tersebut diketahui bahwa state −1
dan K + 1 dapat di akses dari setiap state
{0,1,..., K} , tetapi tidak sebaliknya. Maka kelas
dari rantai Markov ini adalah {− 1} , {0,1,..., K} ,
dan { K + 1} .
Strategi Pemain
Setiap pemain menginginkan agar dapat
memaksimumkan
nilai
imbalan
yang
diperolehnya dalam permainan. Untuk itu,
kedua pemain perlu menerapkan suatu strategi

penghentian yang optimal dalam menghadapi
strategi pemain lainnya.
Jika dimisalkan vektor s = (s −1, s0 ,..., sK +1 )

dan t = (t − 1, t0 ,..., tK +1) adalah vektor peluang
dari strategi penghentian kedua pemain, yaitu τ
dan σ , dimana si = P{ xτ = i} menyatakan
nilai peluang ketika pemain I berhenti pada saat
titik ke- i ; dan ti = P{ yσ = i} menyatakan nilai
peluang ketika pemain II berhenti pada saat titik
ke- i dengan i = −1,0 ,1,.., K + 1 . Maka vektor si
dan ti disebut vektor peluang
penghentian dari τ dan σ .

strategi

dan


1
;

i = 1;
b

b −1

;
i = 2r,
b(b + 2)

1 ≤ r ≤ min{K - b - 1, b};

2
;
i = 2r + 1,
ti = 
b(b + 2)
1 ≤ r ≤ min{K - b - 1, b - 1};

(b +1) max2b − K, (1− b)  +b −1



(b +1) 

; i = K;

b(b + 2)

selainnya

0;
untuk i ∈ E.

(4)
[ Mazalov dan Kochetov,1998]

Teorema 1.

s = (s −1, s0 ,..., sK +1 )
dan
t = (t − 1, t0 ,..., tK +1) merupakan vektor peluang
dari strategi penghentian τ dan σ yang
optimal, jika dan hanya jika kedua kondisi
berikut terpenuhi :
Sebuah

vektor

K +1

K +1

i = −1

i = −1

∑ is i = a; ∑ s i = 1;

s i ≥ 0 ; i = − 1 , 0 ,..., K + 1 .

(1)
dan
K +1

K +1

i= − 1

i= − 1

Terlihat jelas bahwa (3) dan (4) memenuhi
kondisi (1) dan (2). (lihat Lampiran 1 dan 2).

Fungsi Imbalan
1.

Fungsi imbalan pemain I.
Fungsi imbalan bagi pemain I berdasarkan
aturan permainan adalah

{

H(τ ,σ) = E I{0≤yσ 0 } − I {xτ = −1, yσ >0} − I { yσ =K +1, xτ < K}

∑ it i = b ; ∑ t i = 1;

(5)

t i ≥ 0 ; i = − 1 , 0 ,..., K + 1 .

(2)
Bukti : Lihat Mazalov , 1987.
Berdasarkan Teorema 1, maka untuk
meyelesaikan masalah dari permainan jalan acak
simetrik tersebut, cukup dengan mencari strategi
*

}

*

penghentian optimal ( s , t ) yang memenuhi
kondisi (1) dan (2).
Dengan asumsi bahwa b + 1 < K ≤ 2b , maka
nilai K terbatas dan dipengaruhi oleh state awal
yang diambil oleh pemain II. Strategi
*

*

penghentian optimal dari s dan t yang
memenuhi Teorema 1 adalah sebagai berikut :

b − a +1

;

b+2

a +1

;
si = 
b(b + 2)

max{2b − K +1,0}
;
(a +1)
b(b + 2)

0;


K
xτ −1

 K+1 
H(τ ,σ ) = E− ∑ti I{xτ ≤0} +  ∑ ti − ∑ti +t−1 −t K+1I{0