game theori dlm ketidak pastian

Aplikasi Game Theory : Pengambilan Keputusan Pada Situasi Ketidakpastian
Oleh : A. Mashudi dan Siswanto Imam Santoso
Abstraksi.
Strategy pengambilan keputusan oleh individu untuk mengoptimalkan pencapaian obyektif dari
individu yang bersangkutan. Secara garis besar dalam aplikasinya, individu membedakan opponentnya
menjadi lawan yang bersifat netral dan lawan yang akan melakukan kontra strategy terhadap keputusan
yang diambil individu tersebut. Lawan yang bersifat netral dalam arti dia tidak memiliki kepentingan
sehingga tidak terpengaruh oleh apapun keputusan yang diambil oleh individu tersebut, misalnya kondisi
alam (state of nature). Keputusan individu dalam menghadapi kondisi alam ini lebih dipengaruhi oleh
informasi data yang dimiliki atas kemungkinan kejadian alam dimasa datang yang mempengaruhi
pencapaian obyektifnya, disamping sikapnya dalam menghadapi resiko apakah dia risk averter atau risk
seeker.
Sebaliknya,
dalam menghadapi lawan yang melakukan kontra strategy, game theory
menggunakan pendekatan Cournot game untuk mendekati pencapaian obyektif secara optimal. Disini
dipilah-pilah lawan yang bersikap follower atau leader, permainan yang bersifat kerjasama (cooperative)
atau persaingan, lawan yang berjumlah besar atau sedikit dan lain sebagainya. Jadi, game theory sangat
bermanfaat digunakan untuk menganalisa tingkah laku rasional setiap pemain dalam menghadapi situasi
yang berbeda untuk memaksimalkan obyektif yang ditetapkan.
Key word : strategy, tingkah laku ekonomi, ketidak pastian


payoff function mencakup n variable berbeda,
yang ke-i menunjukkan strategi yang tersedia
bagi pemain i = 1, 2, …, n. Misalnya, tidak
ada chance move dalam extensive game, maka
suatu seleksi khusus strategi ( S1 , S 2 ,....., S n ) ,
satu dipilih oleh tiap pemain yang ditunjukkan
dengan  .
Kemudian didefinisikan payoff pemain ke-i
dari strategi mix U i (s1 , s 2 ..., s n )  U i ( ) .
Jika ada kesempatan bergerak, maka tiap
pilihan dari strategi mix akan terjadi dengan
suatu probabilitas p( ) . Expected value
dari permainan keseluruhan adalah (misalnya
ada
K
permainan)

A. Pendahuluan
Game theory berkaitan dengan situasi
dimana individu atau organisasi memiliki

perbedaan kepentingan dalam mencapai
tujuannya dan cenderung bersifat antagonis
(conflicting obyectives). Tehnik ini dapat
digunakan untuk menganalisa berbagai
aktifitas mencakup mempertemukan berbagai
strategi, negosiasi politik/perdagangan dan
tingkah laku ekonomi.
Karakteristik penting dalam konsep game
theory adalah:
a. Adanya informasi yang perfect atau
imperfect
b. Strategi untuk setiap pemain i
c. Setiap pemain menyadari
peraturan
permainan dan fungsi payoff (outcomes)
masing masing pemain karena adanya
kesempatan bergerak (chance move)
sehingga tidak seorangpun tahu kecuali
peluang kejadian dari tiap-tiap chance
move sebagai actual payoff (outcomes).

Oleh karena itu tiap pemain memilih
strateginya
untuk
memaksimumkan
harapan payoff function atau expected
utility dari outcomesnya
Thus, dari payoff yang diberikan
dalam game bentuk ekstensif, didefinisikan

K

U i ( s1 , s 2 ,...s n )   p( )U i ( ) :
 1

Dalam aplikasinya, game theory kita
bedakan penggunaannya dalam menghadapi
lawan yang tidak mengantisipasi strategi
apapun yang kita terapkan karena bersifat
netral seperti kondisi alam (state of nature),
dan intellegent opponent

yang bersikap
melakukan
contra
strategy
untuk
mengantisipasi strategi yang kita terapkan.
Untuk jenis lawan yang kedua ini digunakan
tehnik Cournot Game.

1

misalnya hujan, panas, perubahan cuaca, yang
akan diantisipasi oleh pengambil keputusan.
Informasi yang digunakan dalam
pengambilan keputusan pada situasi ketidak
pastian dapat diringkas dalam bentuk matrix
dengan “baris” menunjukkan pilihan tindakan
yang dapat diambil, dan “lajur” menunjukkan
kemungkinan kejadian alam yang mungkin
terjadi.

Berkaitan dengan pengambilan keputusan
dan kejadian alam yang terjadi, maka
kombinasi dari tiap tindakan dan tiap kejadian
alam akan dievaluasi sebagai keuntungan atau
kerugian.
Thus, jika a i adalah tindakan ke-i

B. State of Nature
Tiga kasus dalam state of nature:
 State of certainty, bila dalam kondisi
perfect information sehingga kejadian
dapat diketahui dengan pasti sebelumnya.
 State of risk, bila probability berbagai
kejadian dapat diestimasi berdasarkan data
tersedia sebelumnya.
 State of uncertainty, bila probability
kejadian yang akan datang tidak diketahui.
Dalam asumsi tidak tersedia data
distribusi probabilitas, sejumlah kriteria dalam
pengambilan keputusan pada kondisi

uncertainty dapat dipresentasikan dengan
menggunakan dasar analisa game theory
sebagai berikut: 1). Laplace criterion, 2).
Minimax criterion, 3). Savage criterion, 4).
Hurwicz criterion, 5). Mixed strategy criterion
Perbedaan pokok diantara kriteria diatas
adalah
merefleksikan
seberapa
jauh
konservatifnya pembuat keputusan berkaitan
dengan kondisi uncertainty yang dihadapinya.
Misalnya, Laplace criterion menunjukkan
situasi yang berdasarkan kondisi yang lebih
optimistik dari pada Minimax criterion.
Selanjutnya, Hurwicz criterion
dapat
digunakan dalam situasi yang perlu
penyesuaian dari kondisi paling optimistik
sampai dengan paling pesimistik. Dalam hal

ini, dari keempat teknik diatas meskipun
mereka
sifatnya
kuantitatif,
namun
merefleksikan penafsirannya secara subyektif
dari lingkungan dimana keputusan dibuat.
Sayangnya, tidak ada petunjuk umum yang
dapat dipedomani untuk memilih tehnik mana
yang
diaplikasikan
mengingat
adanya
perubahan perasaan pengambil keputusan
yang dipengaruhi oleh ketidakpastian situasi
yang menjadi faktor penting dalam keputusan
pemilihan teknik kriteria yang paling cocok.
Pada kriteria diatas, diasumsikan bahwa
pengambil keputusan tidak menghadapi lawan
yang dapat melakukan strategi tandingan

terhadap strategi yang dipilih pengambil
keputusan, karena ia bersifat pasif tidak
merasa dirugikan terhadap keputusan apapun
yang diambil pengambil keputusan. Dalam hal
ini, “alam” dapat dipandang sebagai lawan
pengambil keputusan, sehingga kejadian alam,

( i  1,2,...., m ) dan  j adalah kejadian ke-j

( j  1,2,....., n)

maka

v(ai , j ) adalah

fungsi kontinyu dari a i dan  j . Pada kondisi
diskret, informasi ini dapat ditunjukkan dalam
matrix dibawah ini. Matrix ini akan menjadi
basis
untuk

mengembangkan
kriteria
pengambilan keputusan pada situasi ketidak
pastian
1
2
n

a1 v(a1 ,1 ) v(a1 , 2 )  v(a1 , n )
a 2 v(a 2 ,1 ) v(a 2 , 2 )  v(a1 , n )

am







v(a m ,1 ) v(a 2 , 2 ) 


v(a m , n )

Sebagai ilustrasi sederhana misalkan
dalam Passive type of Two Person Zero Sum
Game (TPG), seorang petani harus memilih
memupuk tanaman (a1 ) atau tidak
memupuknya (a 2 )

mengantisipasi situasi

kemungkinan akan terjadi hujan (1 ) atau

tidak ada hujan ( 2 ) dimana sangat
berpengaruh
terhadap
hasil
produksi
tanamannya (pay off) sebagaimana matrix A
= (aij) berikut ini

Actions

2

State of nature

(1 )

( 2 )

(a1 )
(a 2 )

60

20

80

40

30

70

Probability

0.5

0.5

1,2,…,n. Strategy chosen i = k dimana
U i adalah maximum untuk semua i =
1,2,….m,
atau
optimal
strategy
xk  max U i untuk 1  i  m

1. Bayes or Laplace criterion : principle
of insufficient reason
Kriteria ini berdasarkan apa yang dikenal
dengan prinsip insufficient reason. Oleh karena
probabilitas berkaitan dengan kejadian
1 , 2 , , n tidak diketahui, maka tidak
cukup tersedia informasi yang menyimpulkan
peluang masing-masing kejadian berbeda. Bila
kasus ini terjadi, maka dapat memperkirakan
probabilitasnya sehingga hal ini bukan lagi
pengambilan keputusan dalam kondisi ketidak
pastian. Thus, karena insufficient reason
untuk dipercaya peluang kejadian pay off,
kemungkinan potensi terjadi 1 , 2 , , n
adalah seimbang.. Jika konklusi ini dibangun,
problem ini bergeser menjadi pengambilan
keputusan pada kondisi beresiko, dimana
pengambil keputusan memilih tindakan a i
yang menghasilkan harapan keuntungan yang
paling besar. Yaitu, tindakan a i* yang
memenuhi ketentuan

2. Minimax (maximin) criterion : Wald
criterion
Wald criterion adalah kriteria yang paling
konservatif karena kriteria ini berdasarkan
pilihan terbaik dari alternatif kemungkinan
kejadian dari kondisi yang terjelek. Dengan
kata lain, bila outcome v(ai , j ) adalah
kerugian bagi pengambil keputusan, maka,
untuk pilihan tindakan a i , kerugian terbesar
dari

max  j {v(ai , j )}.

kriteria

Action 2 (a 2 ) adalah 0.5 (70) = 35
Maka Action 1 (a1 ) direkomendasikan untuk
dipilih.
Ciri khas penting dari Bayes criterion:
 Probabilitas diinterpretasikan secara
subyektif.
 Berkaitan dengan von NeumannMorgenstern theory dari maximisasi the
expected utility dari the payoff
ui (aij ) adalah utilitas dari payoff a ij

ij

Minimax

memilih tindakan

max ai min  j {v(ai , j )}.

Untuk

3. Savage Minimax Regret Criterion
Minimax criterion butir dua diatas dinilai
sangat conservative dalam pengertian kadangkadang akan mengarah kepada penarikan
kesimpulan yang tidak logis. Savage criterion
mengkonstruksi suatu matrix kerugian yang
v(ai , j ) diganti dengan
baru dimana

untuk fixed i dan berbagai kejadian j,
maka expected utility (untuk tindakan i
dimana
i
=
1,2,…,m)
adalah
i

Kemudian

adalah

yang terakhir ini disebut Maximin criterion.
Singkatnya Wald criterion adalah strategy
yang merekomendasikan pilihan terbaik dari
kemungkinan outcome yang terjelek. Sebagai
ilustrasi, dari matrix A diatas, jika petani
melakukan pemupukan (a1 ) outcome (pay
off) terjelek yang diterima adalah 20
sedangkan jika ia tidak melakukan pemupukan
(a 2 ) outcome terjeleknya adalah 30, maka
Wald criterion merekomendasikan sebaiknya
petani tidak melakukan pemupukan (a 2 )
sehingga minimal dia mendapatkan hasil
sebesar 30.

Singkatnya, Laplace criterion adalah strategy
yang memilih expected payoff tertinggi.
Contoh: Dari matrix A, expected payoff
Action 1 (a1 ) adalah 0.5 (80) = 40

j 1

j

Dengan pola yang sama, bila v(ai , j ) adalah
keuntungan yang akan diperoleh, Wald
criterion memilih tindakan a i yang memenuhi

Dimana 1/n adalah probabilitas dari
kemungkinan kejadian  j ( j  1,2, , n)

 u (a

kejadian

a i yang
memenuhi kriteria min ai max  j {v(ai , j )}.
criterion

 n

max  1n  v(ai , j )
ai
 j 1


n

kemungkinan

) y j  U i dimana y j adalah

r (ai , j ) yang didefinisikan sebagai berikut :

prior probability dari kejadian j =

3

r (ai , j )  max{v(ak , j )}  v(ai , j ) ,

yaitu 

respective

ak

dan (1   ) ,

dimana

0    1. Dengan kata lain, bila v(ai , j )

bila v adalah keuntungan

merupakan keuntungan, tindakan yang dipilih
akan menghasilkan

r (ai , j )  v(ai , j )  min{v(ak , j )} ,

max{ max v(ai , j )  (1   ) min v(ai , j )}

ak

bila v adalah kerugian
Ini berarti bahwa r (ai , j ) adalah selisih

j

j

ai

Dalam kasus dimana v(ai , j ) merupakan
kerugian, Hurwicz criterion memilih tindakan
yang menghasilkan

antara pilihan terbaik pada column  j dan
nilai dari v(ai , j ) pada column yang sama.
Dalam
pengertian,
r (ai , j ) adalah
representasi dari penyesalan (regret) dari
pembuat keputusan sebagi dampak kehilangan
pilihan terbaik berkaitan dengan kejadian
given future state  j . Fungsi
r ( ai ,  j )

min{ min v(ai , j )  (1   ) max v(ai , j )}
ai

j

j

Parameter  diketahui sebagai “index of
optimism”: jika   1 , Hurwicz criterion
sangat optimistic; jika   0 , adalah sangat
pessimistic. Nilai  antara nol dan satu
dapat diseleksi tergantung pada apakah
pembuat keputusan cenderung mengarah
kepada pesimistik atau optimistik. Dalam hal
yang bersangkutan tidak optimistik dan tidak
pesimistik, nilai   12 kiranya sebagai pilihan
yang reasonable.
Kembali kepada matrix A, bila “index of
optimism”   0,4 maka jika petani

adalah sebagai regret matrix.
Sebagai ilustrasi, dari matrix A untuk tindakan
pemupukan (a1 ) akan memberikan regret
matrix sebesar 40, sedangkan jika petani tidak
melakukan pemupukan (a 2 ) maka regret
matrixnya adalah 10. Oleh karena itu, Savage
minimax regret criterion merekomendasikan
tindakan tanpa pemupukan yang harus dipilih.
Secara lengkapnya, berikut disajikan pilihan
regret matrix
Regret matrix dari matrix A
60-60=0
60-20=40
40-40=0
40-30=10

melakukan pemupukan (a1 ) harapan ratarata outcome yang didapatkan adalah 0.4 (60)
+ (1 - 0,4) 20 = 36
Sebaliknya, ia tidak melakukan pemupukan
(a 2 ) maka harapan rata-rata outcome yang
didapatkan adalah 0.4 (40) + (1 – 0.4) 30 = 34
Oleh karena itu, Hurwicz merekomendasikan
sebaiknya petani tetap melakukan pemupukan

4. Hurwicz
(Optimism-Pessimism)
Criterion
Kriteria ini menunjukkan a range dari
tingkah laku atau sikap dari kondisi yang
paling optimistik sampai dengan kondisi yang
paling pesimistik. Dalam kondisi paling
optimistik, seseorang akan memilih tindakan
yang
menghasilkan
max ai max  j {v(ai , j )} . Dalam hal ini

(a1 )
5. Mixed strategy criterion
m

Expected payoff

R j   xi aij
i 1

v(ai , j ) adalah
diasumsikan bahwa
merupakan keuntungan. Hal yang sama,
dalam kondisi yang paling pesimistik, tindakan
yang
dipilih
berkaitan
dengan
max ai min  j {v(ai , j )} . Hurwicz criterion

untuk tiap pure strategy j dari kejadian
dengan menggunakan random device (coin
atau dadu) untuk menentukan proporsi
m

xi ( xi  0,  xi  1) dan pilih x i sehingga
i 1

membandingkan outcome antara kondisi yang
paling pesimistik dengan yang paling
optimistik dengan melakukan pembobotan
terhadap kedua kondisi diatas secara

minimum

value

v  min R j
1 j  n

adalah

maksimum. Jika v diambil sebagai safety level,
maka minimax mixed strategy criterion akan

4



memaksimumkan payoff safety level. Solusi
optimal mixed strategy
x *  ( x1* , x2* )
diperoleh dengan Linear Programing problem:
Max. v subject to

Divisibility atau kebutuhan input
bersifat kontinyu dengan proporsi
yang tetap untuk memproduksi
satuan output. Untuk input yang
bersifat integer (diskrit) digunakan
integer programming
 Jumlah input yang digunakan tidak
negatif quantity atau penggunaan
input ke-i lebih besar atau sama
dengan nol.
 Koefisien linear programming seperti
kebutuhan
input
(pasokan
sumberdaya), koefisien input-output,
harga sumberdaya dan aktifitas dan
lain sebagainya diketahui dengan pasti
(single valued expectations)
c. Dalam bentuk umum persoalan linear
programming dapat dirumuskan sebagai
berikut:

x

m

x a
i 1

i

ij

 v,

m

x
i 1

 1,

i

xi  0

i=1,2,…,m
J=1,2,…,n
Atau
s. t.
Min . u
y

n

 aij y j  u,
j 1

n

y
j 1

j

 1,

y j  0, j=1,2,….,n
Misalkan ( x * , v * ) dan ( y * , u * )
optimal pair solution, maka u* = v* yaitu
minimax loss of player 2 (nature) = maximin
gain of player 1.

n

Maksimisasi

Z  c j x j

dengan

j 1

n

Penjelasan lebih jauh dapat disampaikan
berikut ini:
a. Linear Programming adalah prosedur
mathematika untuk menentukan aloksi
optimal dari sumberdaya yang langka
sehingga nilai fungsi tujuan (objective)
yang linear menjadi optimum yaitu
maksimum atau minimum (Schrage,
1986).
Untuk
problem
linear
programming ada dua obyek penting yang
pertama adalah sumberdaya yang terbatas,
dan kedua adalah adanya aktifitas. Setiap
aktifitas memerlukan sumberdaya terbatas
sehingga diperlukan berapa kombinasi
masing-masing
aktifitas
untuk
mengoptimalkan
pemanfaatan
sumberdaya langka yang tersedia.
b. Lima asumsi dasar dalam menyusun
model linear programming (Debertin,
1986) yaitu:
 Fungsi obyektif (tujuan) dan kendala
(constraint) adalah linear (Linearity).
 Constant return to scale (additivity).
Jumlah sumberdaya yang digunakan oleh
aktifitas yang berbeda harus sama dengan
total
kuantitas
sumberdaya
yang
digunakan oleh setiap aktifitas untuk
semua sumberdaya secara individual dan
kolektif.

pembatasan (subject to)

a
j 1

xj  0

dimana

ij

x j  bi ,

i  1,2, m

j  1,2, , n .
x j adalah macam

output

dan
yang

diproduksi; c j adalah harga per satuan
output ke-j; bi adalah ketersediaan input
ke- i ; a ij adalah banyaknya input ke- i
yang dipergunakan untuk memproduksi
satu satuan output ke-j.
d. Setiap penyelesaian linear programming
selalu terdapat problem primal dan dualnya dalam satu paket. Jika primal-nya
adalah problem maksimisasi maka dualnya akan selalu problem minimisasi atau
sebaliknya. Nilai optimal dari variabel
dual dikenal sebagai shadow price atau
disebut juga sebagai harga efisiensi dan
nilai Marginal Physical Product (MPP).
C. Cournot Market game
Dalam hal antar pemain terdapat peluang
saling mengantisipasi strategi lawan, maka
Cournot game dapat digunakan untuk
menganalisa pengambilan keputusan masingmasing pemain. Untuk itu game ini dapat

5

X 1  {x1 : 0  x1  1} ,
X 2  {x2 : 0  x2  1} dan CN equilibrium
( x1* , x2* ) satisfies optimal condition profit z1
z1 ( x1* , x2* )  z1 ( x1 , x2* ), all x1  X 1
z 2 ( x1* , x2* )  z 2 ( x1* , x2 ), all x2  X 2
dimana z1 ( x1* , x2* )  12  z 2 ( x1* , x2* )
untuk sebarang  2 dalam X 2 , optimal profit
player 1 adalah z1 ( x1 , 2 )  (1  2 ) 2 / 4
demikian pula untuk sebarang 1 dalam X 1

digeneralisasi kedalam beberapa cara yang
bermanfaat :
 Cooperative dan non cooperative game
 Peluang saling mengancam antara pihak
yang bersaing
 Dapat dikembangkan kepada n-player
game
 Stochastic payoff sehubungan dengan
respon pasar yang tidak sepenuhnya
diketahui
Market demand: p  1  ( x1  x2 ) , x i adalah
output dari produsen i=1,2
Keuntungan masing-masing produsen kefor i=1,2.
i:
z i  xi (1  x1  x2 )
Cournot equilibrium atau Cournot-Nash
(CN) equilibrium ( x1* , x2* ), satisfies:


,



profit

player

2

adalah

z 2 ( x2 , 1 )  (1  1 ) / 4
2

Tiap xi* memaximumkan payoff/profit

Jadi, the worst and the best player 1 adalah 0
dan ¼ untuk 2  1 dan 0
Player 2 adalah 0 dan ¼
untuk 1  1 dan 0

z i dari player/produsen ke-i given fixed

CN equilibrium solution ( x1* , x2* )  ( 19 , 19 )

value dari strategy player lainnya or
output x *j (Rationality postulate)


optimal

Misalkan, x 2 fixed pada x 2* dan diumumkan
oleh player 2, maka player 1 memaksimumkan
keuntungannya dengan menseleksi tingkat
outputnya dalam himpunan strateginya :

Total output x1*  x2* menyeimbangkan
pasar yang menghasilkan positive
equilibrium
price p  1  ( x1*  x2* )
(Market clearing)
Tiap player merubah outputnya x i
sampai kedua kondisi diatas tercapai
(reciprocity condition of passive reaction).

1. Cournot Solution:
Player
i
memaximumkan

zi  xi (1  ( x1  x2 )),

z1 ( x1 , x2* )  x1  x12  x1 x2*
Hal

ini

menghasilkan

x1  (1  x ) / 2  x
*
2

*
1

Demikian juga, jika player 1 mengumumkan
strateginya pada x1  x1* , player 2 akan
mencapai
profit
maximumnya
pada

profitnya:
i=1,2

x2  (1  x1* ) / 2  x2*

Setting z i xi  0 , dua optimal kurva
reaksi:
(1st
x1  (1  2 ) / 2 , x2  (1  1 ) / 2
order condition are sufficient for the
maximum), 1 dan  2 adalah guess made
player 1 dan 2 terhadap rival’s strategy.
x1  x1 (2 ) dan x2  x2 (1 ) optimal

2nd derivative z1 ( x1 , x2* ) untuk given x 2* dan

z 2 ( x1* , x2 ) untuk given x1* adalah negative,
maka x i konvergen terhadap xi* , ini bisa
diperiksa terhadap two linear reaction curves:
2 x1  x2  1 , x1  2 x2  1 , berpotongan
pada titik: x1  x2  xi*  13 , i=1,2
Jadi, implikasi Cournet model adalah mudah
untuk didinamisasi dan diaplikasikan

untuk given guess value 2 , 1 .
The guess equilibrium at x1  2  x1* dan

x2  1  x2* maka x1*  13  x2*

Implikasi Cournot model pada dynamic
demand function:

Himpunan strategy untuk player 1 dan player

6

p  1  ( x1  x2 )  ( Dx1  Dx2 ),
Dx Dxi  dxi / dt

a
, i=1,2,…,n
b(n  1)
As n   , Cournot equilibrium solution
xi  xi* 

Tiap player memaximumkan intertemporal
profit function dengan fixed initial dan
terminal point xi (0)  Ai , xi (T )  Bi
T



Max J i  z i dt dimana z i  pxi , i=1,2

Jika 2  2  3  0 maka

untuk

x2  (1  x1 ) / 2

real

Player 1 (leader) tidak mengikuti reaction
curve nya, namun mengantisipasi rivalnya (as
follower) kedalam fungsi profitnya:

and opposite sign (saddle point equil.)
Particular solution dengan vektor x*

z1 ( x1 , x2 )  x1 (1  x1  x2 )  x1 (1  x1  (1  x1 ) / 2)

1

dan memaksimumkan profitnya terhadap
outputnya (x1) dengan z1 ( x1 , x2 ) / x1  0

 x   1 2  1  13 
     
x *     
1
 x   2 1  1  3 
*
1
*
2

a
na

b b(n  1)

quasi
dimana

2. Stackelberg solution
Asumsi: 1 atau 2 player is the leader dan
lainnya follower
Player 2 (follower) punya reaction curve

s.t. two

1  1
2  3

lim lim S * 

(atau

semua n>0 dan price equal marginal cost (p
= c)

0

dx 2 / dt  2 x1  x2  1
boundry conditions for x i

competitive

n 

Aplikasikan Euler-Lagrange equation untuk
mencapai titik maximum pada i=1,2
diperoleh sepasang linear differential equation:

dx1 / dt  x1  2 x2  1

cenderung
competitive)

Solution:

x1  12 ,

x2  (1  x1 ) / 2 

Kasus n player
Fungsi demand p  a1  bS ,

1
4

z1  12 (1  12  14 ) 

1
8

dan

z 2  161

n

S  xj
j 1

C ( xi )  ci  cxi ,
Fungsi cost
i=1,2,….,n
Marginal cost identik
Maximizing profit z i  pxi  C ( xi )
Optimal
reaction
untuk
tiap
line xi  (a / b)  S ,

3. Pareto Solution (cooperative solution)
Total output:
Total profit:
x  x1  x2

z  z1  z 2  x(1  x)
Necessary condition of maximum:

z / x  0
 Pareto solution:

i  1,2,...., n
a  a1  c  0
n

x
i 1

i

=

1
2

n

S  xj
j 1

C ( xi )  ci  cxi ,
Total cost:
i=1,2,….,n dengan MC equal every player
Total profit:

 S  n(a / b)  nS
value xi* ,

n

z   z i  a  bS 2  A ,

S *   xi*

i 1

na
,
b(n  1)

A   ci ,

7

z

1
4

Untuk n-player: p  a1  bS ,

Equilibrium

S  S* 

x  x1  x2 

a  a1  c  0

Profit maximizing
solution: S  S *  a / 2b ,

Masing-2 player memiliki dua strategy yaitu
u=
x1  u / b atau 0 x2  u / b atau 0
a1 – c > 0
Strategy set X 1  {x1 : 0  x1  u / b}

a
2bn
*
Price: p  a1  bS  (a1  c) / 2
xi  xi*  S * n 

X 2  {x2 : 0  x2  u / b}

4. Solusi Quasi-Competitive (bila n kecil)
Demand p  a1  bS , S 

n

x
j 1

j

dan

Player 1
Action

fungsi biaya total
C ( xi )  ci  cxi ,
i=1,2…,n
diasumsikan setiap produsen
menetapkan price p as given dan
p  a1  bS  c : marginal cost

1
2

Player 2 Actions
1
2
2
2
(0,0)
(u / b,u / b)
(0,0)

(0,0)

7. Solusi Nash Bargaining
Player 1 adalah pengusaha kecil sedang
player 2 adalah pengusaha besar dengan
Awalnya
marginal costs
c2  c1 .

S = S* = a/b dimana a  a1  c  0 dan

xi  xi*  a /( nb)
# agregat output double dan tingkat harga
lebih rendah
# Dari sisi masyarakat, quasi competitive
dipandang sebagai Pareto equilibrium)
solution yang memiliki dua ciri penting: 1)
cooperative, setiap produsen memiliki peran
yang sangat kecil dan bertindak sebagai price
taker. 2) efficient, tidak ada realokasi antar
produsen yang dapat meningkatkan agregat
output atau menurunkan tingkat harga lebih
lanjut dari competitive level.

C ( x1 )  c1 x1 , kemudian player 2 masuk ke
pasar dengan fungsi biaya C ( x2 )  c2 x2 .
Agreement yang dilakukan semua produk
player 1 dibeli oleh player 2.
Player 2 as monopolist:
Maximum
profit

z 2 ( x2 )  px2  c2 x2  (a1  bx2 ) x2  c2 x2
with respect to x 2 .
z 2 / x2  0  x2*  (a1  c2 ) / 2b dan
z 2*  (a1  c2 ) 2 / 2b  s yang harus dibagi

5. Solusi Market-Shares
Two players menghindari conflict dan
perilaku
noncooperative
dengan
mempertahankan
market
share
yang
diinginkan.
Market share player 1 dan player 2 adalah
k  x1 /( x1  x2 ) dan (1 – k).
Dalam contoh mineral spring dengan zero
costs, menghasilkan solusi x1  k / 2

kedua pemain bila persetujuan telah
disepakati.
Kasus nonagreement, individual profit

zi* ( xi )  [a1  b( x1  x2 )]xi  ci xi
Player

(small)
memaximumkan
[ z1 ( x1 )  z 2 ( x2 )] sedangkan Player 2 (big)
meminimumkan persamaan ini., tetapi

dan x2  (1  k ) / 2 dengan profit masing-2

z1  (2k  k 2 ) / 4 dan
z 2  (2  k )(1  k ) / 4

1

z1 ( x1 )  z2 ( x2 )  [(a1  bx1 ) x1  c1 x1 ]  [(a1  bx2 ) x2  c2 x2 ]
, bx1 x 2 cancel out
Maka Max Min [ z1 ( x1 )  z 2 ( x2 )]

6. Solusi Strategy Discrete
Fungsi demand p  a1  b( x1  x2 ) dan

x1

x2

 Max[(a1  bx1 ) x1  c1 x1 ] 

total costs C ( xi )  cxi , i=1,2

x1

Max[(a1  bx2 ) x2  c2 x2 ]
x2

8

= z1* ( x1* )  z 2* ( x2* )
Solusi Nash equilibrium berisi dua hal
bagi masing-2 player.
# Disagreement payoff (threat point
atau status quo)
# Division of excess profits, yaitu
selisih maximum profit hasil dari kerjasama
yang berhu-bungan dengan disagreement pada
awalnya,

diasumsikan utility adalah kardinal dan
memungkinkan
membandingkan
interpersonal.
Payoff space
R  {u A  ui  B}

z (x )  z (x )

Nash solution adalah payoff vector
u  u *  (ui* ) dimana u i* memenuhi rule of
division of utility (or profit):

*
1

*
1

*
2


iN

dimana N adalah himpunan n player dan
A, B adalah positive constanta dimana B > A.
Threat point atau status quo

t  (t1 , t 2 ,....., t n )

*
2

Division rule for profits:
Player 1 (kecil):

u i  t i  1n ( B   t j )  1n B  nn1 t i  ni  t j

z1*  (s  z1*  z 2* ) / 2  z1* / 2
Player 2 (besar):

jN

z  (s  z  z ) / 2  z  z / 2
Dimana z i*  z i* ( xi* ) untuk i=1,2
*
2

*
1

*
2

Misal: a1  1.5

*
2

*
1

b = 1

jN
j i

i=1,2…,n dan j=1,2,…,n
Solusi Nash bargaining memaksimumkan
product

c1  0.9

J  (u1  t1 )(u 2  t 2 )....(u n  t n )

monopoly
profit
c2  0.5 maka
*
2
z1  (a1  c1 ) / 2b  0.18 ;
z 2*  (a1  c2 ) 2 / 2b  0.5 maka player 1
(small) memperoleh z1* / 2  0.09 dengan

semua pemain menerima net payoff yang
sama ui  t i  u j  t j  1n ( B 
tk )



kN

D. Kesimpulan

agreement bekerja sama dan menjual firm nya,
sedangkan player 2 (besar) memperoleh
z 2*  0.5z1*  0.41 dalam solusi nash
equilibrium.
Generalisasi solusi Nash-bargaining terhadap
many strategies dan many player:
Misal t m , t n adalah threat dipilih player 1 dan
2 dari himpunan mereka M dan N.
Sharing profit:

1.

2.

t m  (s  t m  t n ) / 2  s / 2  (t m  t n ) / 2 u
ntuk player 1

t n  (s  t m  t n ) / 2  s / 2  (t n  t m ) / 2 u

3.

ntuk player 2
Untuk meningkatkan payoff nya, player 1
akan memaksimumkan (t n  t m ) demikian
juga player 2 memaksimumkan (t m  t n )
sehingga dengan menjumlahkan kedua payoff
tersebut diperoleh zero-sum game.
Untuk kasus n-person bargaining game G
diasumsikan payoff player i diukur dengan
transferable utility u i (i=1,2….,n) dan

Pengambilan keputusan yang rasional
oleh individu untuk memaksimalkan
pencapaian obyektifnya, ditentukan
oleh
kondisi
lingkungan
yang
mempengaruhi pencapaian hasil baik
yang bersifat alami maupun benturan
pencapaian obyektif dengan opponen
individu yang bersangkutan.
Game theory membantu pengambilan
keputusan yang secara rasional dapat
dipertanggung jawabkan oleh individu
yang terlibat untuk mencapai hasil yang
optimal.
Varian pengambilan keputusan dengan
tehnik game theory dipengaruhi oleh
sikap individu menghadapi resiko dan
kondisi obyektif opponen yang dihadapi
apakah opponen yang netral tidak
terpengaruh keputusan individu atau
opponen yang cerdas membuat kontra
strategi untuk keuntungan dirinya.

Referensi:
1. Debertin, D.L. 1986. Agricultural
Production
Economics.
Macmillan
Publishing Company. New York.

9

2. Petersen, H.C. and Lewis, W.C. 1999.
Managerial Economics, 4th Edition.
Prentice Hall International Inc. New
Jersey.
3. Schrage, L. 1986. LINDO: Linear, Integer
and Quadratic Programming, Third
Edition, The Scientific Press. Palo Alto,
California.
4. Sengupta,
J.K.
1987.
Applied
Mathematics for Economics. D. Reidel
Publishing Company. Boston.
5. Taha, H.A. 1976. Operations Research an
Introduction, 2nd Edition. MacMillan
Publishing Co.,Inc. New York.

10