Two-Person Zero-Sum Game Permainan dengan 2 pemain dengan perolehan
TEORI PERMAINAN
Aplikasi Teori Permainan
Lawan pemain (punya intelegensi yang sama). Setiap pemain mempunyai beberapa strategi untuk saling mengalahkan.
Two-Person Zero-Sum Game Permainan dengan 2 pemain dengan perolehan
(keuntungan) bagi salah satu pemain merupakan kehilangan (kerugian) bagi pemain lainnya.
Matriks/tabel payoff (perolehan) tabel yang menunjukkan perolehan bagi pemain
baris
Strategi Murni
Digunakan jika permainan stabil ada titik saddle (saddle point) Titik sadel minimaks = maksimin Contoh :
Pemain A Pemain B Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5 Strategi 6
Strategi 1
5 10 -20
15
5
7 Strategi 2
15
8 16 -10
13
12 Strategi 3 11 11 12 14 14 12 Tentukan strategi terbaik bagi masing-masing pemain!!
Jawab :
Pemain A Pemain B Minimum Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5 Strategi 6
Strategi 1
5 10 -20
15
5 7 -20 Strategi 2
15
8 16 -10
13 12 -10 Strategi 3 11 11 12 14 14 12
11
maks 15 16 15 13
12
11
Minimaks = maksimin = 11 permainan seimbang (stabil) Titik sadel 11 nilai permainan (v)
Strategi Campuran
Strategi campuran digunakan jika permainan tidak seimbang. Pemilihan strategi dilakukan dengan mengevaluasi kombinasi strategi lawan menggunakan prinsip peluang.
Definisikan : x adalah peluang pemain baris akan menggunakan strategi ke-i
i Y j adalah peluang pemain kolom akan menggunakan strategi ke-j.
y
1 y
2 ... y nStrategi 1 Strategi 2 ... Strategi n x Strategi 1 a a ... a
1
11 12 1n
x
2 Strategi 2 a 21 a 22 ... a 2n . . . .
. . . . . . . . x Strategi m a a ... a
m m1 m2 mn
Solusi GrafikSolusi grafik dapat digunakan jika paling salah satu pemain mempunyai hanya 2 strategi (2 x n atau m x 2).
Perhatikan matriks payoff untuk dua pemain berikut : B y
1 y 2 y 3 ... y n
A x
1 a 11 a 12 a 13 ... a 1n
x = 1-x a a a ... a
2
1
21
22 23 2n
Menghitung x
1 dan x 2 dengan menganggap pemain B menggunakan strategi
murni. Maka ekspektasi perolehan bagi pemain A adalah sbb:
Strategi murni B Ekspektasi perolehan A 1 a
11 x 1 + a 21 x
2
2 a
12 x 1 + a 22 x
2
3 a
13 x 1 + a 23 x
2
. .. . . . n a x + a x
1n 1 2n
2
Ekspektasi digambarkan dengan sumbu horizontal x (0 sampai 1) dan vertikal1 sebagai ekspektasi perolehan.
Nilai optimum (x
1 , x 2 dan v) akan didapat dari titik perpotongan
Titik perpotongan menunjukkan strategi B yang digunakan, maka y
1 , y 2 , ..., y n selanjutnya dapat ditentukan.
Contoh 1: Perhatikan matriks payoff permainan di bawah ini:
Pe Pemain B ma Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5 in
Strategi 1 2 4 5 -2 -1 A
Strategi 2 3 -1 -2
6
5 Permainan di atas memiliki nilai minimaks = 3 dan nilai maksimin = -2 permainan tidak seimbang Dengan solusi grafik:
Pe Pemain B ma y y y y y
1
2
3
4
5
in Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5
A x
2
4 5 -2 -1 x
1 Strategi 1
3 -1 -2
6
5
2 Strategi 2
- 1
- 8x
- 6x
- 5 x
4
Bagi Pemain A :
Strategi murni B Ekspektasi perolehan A 1 2x
1 + 3x 2 =(2-3)x 1 +3
2 5x
1
3
4
5 7x
1 -2
1 +6
1
5 Ada 6 titik perpotongan yang menjadi kandidat solusi optimal untuk x
1
3
5
1
2
4
1
2
- 2
3
1 v = 5x
1
(titik perpotongan garis (1,2), (1,3), (2,4), (2,5), (3,4) dan (3,5)). Karena pemain A adalah pemain baris dimana dia akan memaksimumkan ekspektasi perolehan minimumnya, maka solusi optimalnya adalah titik perpotongan ungu (perpotongan garis (2,4)). Dengan demikian x
1
= 7/13 dan x 2 = 1-7/13 = 6/13.
0.5
1 -1 = 22/13 diperoleh dengan memasukkan nilai x 1 pada pers (2) atau (4).
Bagi Pemain B:
Solusi optimal bagi pemain A di atas merupakan perpotongan garis (2) dan (4), Hal ini menunjukkan bahwa B dapat mengkombinasikan kedua strategi tersebut. Kombinasi strategi 2 dan 4 menunjukkan bahwa y
1 = y 3 = y 5 = 0.
Pe Pemain B ma y
2 y
4
in Strategi 2 Strategi 4
A x
4 -2 x
1 Strategi 1
6 Strategi murni A Ekspektasi perolehan B 1 4y
2 Strategi 2 -1
2 - 2y 4 =(4+2)y 2 -2=6y 2 -2
2 -7y
2 +6
6y -2=-7y +6, maka y = 8/13 dan y = 5/13; y = y = y = 0; v = 22/13 (sama dengan nilai
2
2
2
4
1
3
5 di atas).
Contoh 2: Perhatikan permainan dengan matriks payoff berikut:
B 1 2 1 2 4
A 2 2 3 3 3 2 4 -2 6
Penyelesaian : Tidak ada saddle point, dan pemain B memiliki hanya 2 strategi solusi grafik.
Bagi Pemain B:
Strategi murni A Ekspektasi payoff B 1 -2y
1 +4
2 -y
1 +3
3 y
1 +2
4 -8y
1 +6
5
4
3
3
2
2
1
1
1 y
1
0.5
- 2
4 Ada 3 titik maksimum (perpotongan warna ungu, biru dan hijau). Pemain B sebagai
pemain kolom akan meminimumkan ekspektasi perolehan maksimumnya, maka solusi optimalnya adalah titik hijau y
1 = 2/3 dan y 2 = 1/3; v = -2*2/3 + 4 =8/3 Pemain A Titik optimum bagi pemain B merupakan perpotongan strategi 1 dan 3 pemain A.
B 1 2 1 2 4
A 3 3 2
- x
- x
2
;
v z 1 =
Bentuk umum LP bagi pemain kolom (Dual pemain baris) Maks.
n Y Y Y w + + + = ...
2
1 Sub. To : ,..., , 1 ...
1 ... 1 ...
2
1
2
2
1
1
2
22
X i i
1
21
1
2
12
1
11 ≥ ≤ + + +
≤ + + + ≤ + + + n n mn m m n n n n
Y Y Y Y a Y a Y a Y a Y a Y a Y a Y a Y a
Μ Μ v y
Y j i
=
;
v w 1 =
=
X a Μ Μ v x
Strategi murni B Ekspektasi payoff A
2
1
2
1 +3
2x
1 +2
1 +3 = 2x 1 +2 x 1 = 1/3, x 2 = 0, x
3 = 2/3, x
4 = 0 dan v = 8/3 (sama dengan di atas).Metode Simpleks
Bentuk umum LP bagi pemain baris : Min
m
X X X z + + + = ...
2
1 Sub. To : ,..., , 1 ... 1 ... 1 ...
2
1
2
X a X a X a X a
2
X X a X a X a X a
X X
≥ + + + ≥ + + + m m n m n n m m m m
11 ≥ ≥ + + +
1
21
1
1
12
1
22
2
2
1
Perhatikan kembali matriks payoff berikut:
Pemain B Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5
1 X
2
1
2
1
2
1
2
1 ≥ ≥ + −
≥ + − ≥ − ≥ − ≥ +
X X
X X
X X
X X
X X
X X
Maka bentuk umum LP untuk pemain kolom (pemain B) adalah : Maks.
5
4
3
2
1
1
2
1
Strategi 2 3 -1 -2
6
5 Maka bentuk umum LP untuk pemain baris (pemain A) adalah : Min.
2
X z + =
Sub. To :
,
1
5
6
2
2
1
2
5
1
4
1
3
2
Strategi 1 2 4 5 -2 -1 Pe ma in A
1 Y Y Y Y Y w + + + + =
5
5
≤ − − + +
Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y
Tabel simpleks awal (iterasi-0):
VB Y
1 Y
2 Y
3 Y
4 Y
s
1
1
s
2 NK
w -1 -1 -1 -1 -1 0 0 0
s 1 2 4 5 -2 -1 - 0 1
s
2 3 -1 -2 6 5 0 1 1
Iterasi-1:
1
≥ ≤ + + − −
2
6
4
2
3
1
2
5
4
2
5
3
3
2
1
5
4
3
2
1
5
4
Sub. To: , , , ,
VB Y
8
13
4 = 5/22 y 4 =
; Y
2 = = w Y
4
11
13
22
13
22
2 = 4/11 y 2 =
Y
1 =
13
22
22
13
= 0; w = 13/22 v=1/w=
5
13
= y
1
= =z
2 = = z
3
11
13
22
6
13
X
X 2 = s 2 = 3/11 x 2 =7
22
22
13
22
7
13
1 = s 1 = 7/22 x 1 =
z = w = 13/22; X
4 = = w Y
5
5
3
1 Y
1 Y
2 NK
s
1
s
5
4 Y
3 Y
2 Y
VB Y
Y
3 9/13 11/13 1 0 5/26 15/13 1/13 4/13
Iterasi-2 :
s
2 19/5 3/5 0 26/5 23/5 2 1 7/5
2/5 4/5 1 -2/5 -1/5 1 0 1/5
3
w -3/5 -1/5 0 -7/5 -6/5 1 0 1/5 Y
2 NK
4 Y 5 s 1 s
3 Y
2 Y
w 11/26 -1/26 0 1/26 6/13 7/26 15/26
Y
= y
4
1
= 0 y
5
= Y
3
= Y
1
7/11 0 -3/22 1 0.85839 5/22 2/11 5/22 Y
Y
4 19/26 3/26 0 1 23/26 5/13 5/26 7/26
2 9/11 1 13/11 0 5/22 15/11 1/11 4/11
w 5/11 0 1/22 0 0.0472 7/22 3/11 13/22 Y
2 NK
4 Y 5 s 1 s
3 Y
2 Y
1 Y
VB Y
Iterasi-3: optimal
X