Two-Person Zero-Sum Game Permainan dengan 2 pemain dengan perolehan

TEORI PERMAINAN

  Aplikasi Teori Permainan

  Lawan pemain (punya intelegensi yang sama). Setiap pemain mempunyai beberapa strategi untuk saling mengalahkan.

  Two-Person Zero-Sum Game Permainan dengan 2 pemain dengan perolehan

  (keuntungan) bagi salah satu pemain merupakan kehilangan (kerugian) bagi pemain lainnya.

  Matriks/tabel payoff (perolehan) tabel yang menunjukkan perolehan bagi pemain

  baris

  Strategi Murni

  Digunakan jika permainan stabil ada titik saddle (saddle point) Titik sadel minimaks = maksimin Contoh :

  Pemain A Pemain B Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5 Strategi 6

  Strategi 1

  5 10 -20

  15

  5

  7 Strategi 2

  15

  8 16 -10

  13

  12 Strategi 3 11 11 12 14 14 12 Tentukan strategi terbaik bagi masing-masing pemain!!

  Jawab :

  Pemain A Pemain B Minimum Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5 Strategi 6

  Strategi 1

  5 10 -20

  15

  5 7 -20 Strategi 2

  15

  8 16 -10

  13 12 -10 Strategi 3 11 11 12 14 14 12

  11

  maks 15 16 15 13

  12

  11

  Minimaks = maksimin = 11 permainan seimbang (stabil) Titik sadel 11 nilai permainan (v)

  Strategi Campuran

  Strategi campuran digunakan jika permainan tidak seimbang. Pemilihan strategi dilakukan dengan mengevaluasi kombinasi strategi lawan menggunakan prinsip peluang.

  Definisikan : x adalah peluang pemain baris akan menggunakan strategi ke-i

  i Y j adalah peluang pemain kolom akan menggunakan strategi ke-j.

  y

  

1 y

2 ... y n

  Strategi 1 Strategi 2 ... Strategi n x Strategi 1 a a ... a

  1

  11 12 1n

  x

  2 Strategi 2 a 21 a 22 ... a 2n . . . .

  . . . . . . . . x Strategi m a a ... a

  

m m1 m2 mn

Solusi Grafik

  Solusi grafik dapat digunakan jika paling salah satu pemain mempunyai hanya 2 strategi (2 x n atau m x 2).

  Perhatikan matriks payoff untuk dua pemain berikut : B y

  1 y 2 y 3 ... y n

  A x

  1 a 11 a 12 a 13 ... a 1n

  x = 1-x a a a ... a

  2

  1

  21

  22 23 2n

  Menghitung x

  1 dan x 2 dengan menganggap pemain B menggunakan strategi

  murni. Maka ekspektasi perolehan bagi pemain A adalah sbb:

  Strategi murni B Ekspektasi perolehan A 1 a

  11 x 1 + a 21 x

  

2

  2 a

  12 x 1 + a 22 x

  

2

  3 a

  13 x 1 + a 23 x

  

2

. .

  . . . . n a x + a x

  1n 1 2n

  

2

Ekspektasi digambarkan dengan sumbu horizontal x (0 sampai 1) dan vertikal

  1 sebagai ekspektasi perolehan.

  Nilai optimum (x

  1 , x 2 dan v) akan didapat dari titik perpotongan

  Titik perpotongan menunjukkan strategi B yang digunakan, maka y

  1 , y 2 , ..., y n selanjutnya dapat ditentukan.

  Contoh 1: Perhatikan matriks payoff permainan di bawah ini:

  Pe Pemain B ma Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5 in

  Strategi 1 2 4 5 -2 -1 A

  Strategi 2 3 -1 -2

  6

  5 Permainan di atas memiliki nilai minimaks = 3 dan nilai maksimin = -2 permainan tidak seimbang Dengan solusi grafik:

  Pe Pemain B ma y y y y y

  1

  2

  3

  4

  5

  in Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5

  A x

  2

  4 5 -2 -1 x

  1 Strategi 1

  3 -1 -2

  6

  5

  2 Strategi 2

  • 1
  • 8x
  • 6x
    • 5 x

  4

  Bagi Pemain A :

  Strategi murni B Ekspektasi perolehan A 1 2x

  1 + 3x 2 =(2-3)x 1 +3

  2 5x

  1

  3

  4

  5 7x

  1 -2

  1 +6

  1

5 Ada 6 titik perpotongan yang menjadi kandidat solusi optimal untuk x

  1

  3

  5

  1

  2

  4

  1

  2

  • 2

  3

  1 v = 5x

  1

  (titik perpotongan garis (1,2), (1,3), (2,4), (2,5), (3,4) dan (3,5)). Karena pemain A adalah pemain baris dimana dia akan memaksimumkan ekspektasi perolehan minimumnya, maka solusi optimalnya adalah titik perpotongan ungu (perpotongan garis (2,4)). Dengan demikian x

  1

  = 7/13 dan x 2 = 1-7/13 = 6/13.

  0.5

  1 -1 = 22/13 diperoleh dengan memasukkan nilai x 1 pada pers (2) atau (4).

  Bagi Pemain B:

  Solusi optimal bagi pemain A di atas merupakan perpotongan garis (2) dan (4), Hal ini menunjukkan bahwa B dapat mengkombinasikan kedua strategi tersebut. Kombinasi strategi 2 dan 4 menunjukkan bahwa y

  1 = y 3 = y 5 = 0.

  Pe Pemain B ma y

  2 y

  

4

  in Strategi 2 Strategi 4

  A x

  4 -2 x

  1 Strategi 1

  6 Strategi murni A Ekspektasi perolehan B 1 4y

  2 Strategi 2 -1

  2 - 2y 4 =(4+2)y 2 -2=6y 2 -2

  2 -7y

  2 +6

  6y -2=-7y +6, maka y = 8/13 dan y = 5/13; y = y = y = 0; v = 22/13 (sama dengan nilai

  2

  2

  2

  4

  

1

  3

  5 di atas).

  Contoh 2: Perhatikan permainan dengan matriks payoff berikut:

  B 1 2 1 2 4

  A 2 2 3 3 3 2 4 -2 6

  Penyelesaian : Tidak ada saddle point, dan pemain B memiliki hanya 2 strategi solusi grafik.

  Bagi Pemain B:

  Strategi murni A Ekspektasi payoff B 1 -2y

  1 +4

  2 -y

  1 +3

  3 y

  1 +2

  4 -8y

  1 +6

  5

  4

  3

  3

  2

  2

  1

  1

  1 y

  1

  0.5

  • 2

  4 Ada 3 titik maksimum (perpotongan warna ungu, biru dan hijau). Pemain B sebagai

  pemain kolom akan meminimumkan ekspektasi perolehan maksimumnya, maka solusi optimalnya adalah titik hijau y

  1 = 2/3 dan y 2 = 1/3; v = -2*2/3 + 4 =8/3 Pemain A Titik optimum bagi pemain B merupakan perpotongan strategi 1 dan 3 pemain A.

  B 1 2 1 2 4

  A 3 3 2

  • x
  • x

  2

  ;

  v z 1 =

  Bentuk umum LP bagi pemain kolom (Dual pemain baris) Maks.

  n Y Y Y w + + + = ...

  2

  1 Sub. To : ,..., , 1 ...

  1 ... 1 ...

  2

  1

  2

  2

  1

  1

  2

  22

  X i i

  1

  21

  1

  2

  12

  1

  11 ≥ ≤ + + +

  ≤ + + + ≤ + + + n n mn m m n n n n

  Y Y Y Y a Y a Y a Y a Y a Y a Y a Y a Y a

  Μ Μ v y

  Y j i

  =

  ;

  v w 1 =

  =

  X a Μ Μ v x

  Strategi murni B Ekspektasi payoff A

  2

  1

  2

  1 +3

  2x

  1 +2

  1 +3 = 2x 1 +2 x 1 = 1/3, x 2 = 0, x

3 = 2/3, x

4 = 0 dan v = 8/3 (sama dengan di atas).

  Metode Simpleks

  Bentuk umum LP bagi pemain baris : Min

  m

  X X X z + + + = ...

  2

  1 Sub. To : ,..., , 1 ... 1 ... 1 ...

  2

  1

  2

  X a X a X a X a

  2

  X X a X a X a X a

  X X

  ≥ + + + ≥ + + + m m n m n n m m m m

  11 ≥ ≥ + + +

  1

  21

  1

  1

  12

  1

  22

  2

  2

  1

  Perhatikan kembali matriks payoff berikut:

  Pemain B Strategi 1 Strategi 2 Strategi 3 Strategi 4 Strategi 5

1 X

  2

  1

  2

  1

  2

  1

  2

  1 ≥ ≥ + −

  ≥ + − ≥ − ≥ − ≥ +

  X X

  X X

  X X

  X X

  X X

  X X

  Maka bentuk umum LP untuk pemain kolom (pemain B) adalah : Maks.

  5

  4

  3

  2

  1

  1

  2

  1

  Strategi 2 3 -1 -2

  6

  5 Maka bentuk umum LP untuk pemain baris (pemain A) adalah : Min.

  2

  X z + =

  Sub. To :

  ,

  1

  5

  6

  2

  2

  1

  2

  5

  1

  4

  1

  3

  2

  Strategi 1 2 4 5 -2 -1 Pe ma in A

1 Y Y Y Y Y w + + + + =

  5

  5

  ≤ − − + +

  Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y

  Tabel simpleks awal (iterasi-0):

  VB Y

  1 Y

  2 Y

  3 Y

  4 Y

  s

  1

  1

  s

  2 NK

  w -1 -1 -1 -1 -1 0 0 0

  s 1 2 4 5 -2 -1 - 0 1

  s

  2 3 -1 -2 6 5 0 1 1

  Iterasi-1:

  1

  ≥ ≤ + + − −

  2

  6

  4

  2

  3

  1

  2

  5

  4

  2

  5

  3

  3

  2

  1

  5

  4

  3

  2

  1

  5

  4

  Sub. To: , , , ,

  VB Y

  8

  13

  4 = 5/22 y 4 =

  ; Y

  2 = = w Y

  4

  11

  13

  22

  13

  22

  2 = 4/11 y 2 =

  Y

  1 =

  13

  22

  22

  13

  = 0; w = 13/22 v=1/w=

  5

  13

  = y

  

1

= =

z

  2 = = z

  3

  11

  13

  22

  6

  

13

  

X

X 2 = s 2 = 3/11 x 2 =

  7

  22

  22

  13

  22

  7

  13

  1 = s 1 = 7/22 x 1 =

  z = w = 13/22; X

  4 = = w Y

  5

  5

  3

  1 Y

  1 Y

  2 NK

  s

  1

  s

  5

  4 Y

  3 Y

  2 Y

  VB Y

  Y

3 9/13 11/13 1 0 5/26 15/13 1/13 4/13

  Iterasi-2 :

  s

2 19/5 3/5 0 26/5 23/5 2 1 7/5

  2/5 4/5 1 -2/5 -1/5 1 0 1/5

  3

  w -3/5 -1/5 0 -7/5 -6/5 1 0 1/5 Y

  2 NK

  4 Y 5 s 1 s

  3 Y

  2 Y

  w 11/26 -1/26 0 1/26 6/13 7/26 15/26

  Y

  = y

  4

  1

  = 0 y

  5

  = Y

  3

  = Y

  1

  7/11 0 -3/22 1 0.85839 5/22 2/11 5/22 Y

  Y

  4 19/26 3/26 0 1 23/26 5/13 5/26 7/26

  2 9/11 1 13/11 0 5/22 15/11 1/11 4/11

  w 5/11 0 1/22 0 0.0472 7/22 3/11 13/22 Y

  2 NK

  4 Y 5 s 1 s

  3 Y

  2 Y

  1 Y

  VB Y

  Iterasi-3: optimal

  X