TEORI PERMAINAN DAN PENYELESAIANNYA DENGAN METODE ALJABAR DAN METODE GRAFIK
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET SURAKARTA 2008
TEORI PERMAINAN
1.1 Pendahuluan Dalam kehidupan sehari-hari sering dijumpai kegiatan-kegiatan yang bersifat kompetitif yang diwarnai persaingan atau konflik. Persaingan atau konflik ini dapat terjadi antara dua orang (dua pihak) atau sejumlah orang (grup). Contohnya adalah :
1. persaingan antara dua perusahaan dalam memasarkan produk baru,
2. permainan catur,
3. dua buah partai politik yang bersaing dalam kampanye untuk memperoleh suara terbanyak.
Tidak setiap keadaan persingan dapat disebut sebagai permainan (game). Kriteria atau ciri-ciri dari suatu permainan adalah :
1. terdapat persaingan kepentingan di antara pemain,
2. setiap pemain mempunyai sejumlah pilihan, terbatas atau tidak terbatas, yang disebut strategi,
3. aturan permainan untuk mengatur pilihan-pilihan itu disebutkan satu-satu dan diketahui oleh semua pemain,
4. hasil permainan dipengaruhi oleh pilihan-pilihan yang dibuat oleh semua pemain dan hasil untuk seluruh kombinasi pilhan dari pemain diketahui dan didefinisikan secara numerik.
Jadi, permainan (game) adalah suatu bentuk persaingan antara antara dua orang atau pihak atau antara dua kelompok atau grup yang saling berhadapan dan menggunakan aturan-aturan yang diketahui oleh kedua belah pihak yang saling berhadapan. Dalam permainan, pihak pertama disebut dengan pemain baris sedangkan pihak kedua disebut pemain kolom. Aturan-aturan dalam permainan meliputi :
1. langkah atau strategi yang dapat dipilih oleh tiap-tiap pemain,
2. informasi yang digunakan oleh setiap pemain yang memilih langkah atau strategi,
3. pembayaran, yang didefinisikansecara numerik, yang harus dipenuhi oleh setiap pemain setelah permainan selesai.
1.2 Klasifikasi Permainan
A. Berdasarkan jumlah langkah dan pilihan.
1. Permainan berhingga (finite game), yaitu suatu permainan yang mempunyai sejumlah langkah yang berhingga dengan setiap langkah yang memuat sejumlah pilihan yang berhingga pula.
2. Permainan tak berhingga (infinite game), yaitu permainan selain permainan berhingga.
B. Berdasarkan jumlah pemain.
1. Permainan dua orang, yaitu permainan dengan jumlah pemain dua orang.
2. Permainan n orang, yaitu permainan dengan jumlah pemain n orang.
C. Berdasarkan jumlah pembayaran.
1. Permainan berjumlah nol (zero sum game), yaitu suatu permainan dengan jumlah kemenangan kedua belah pihak sama dengan nol. Dengan kata lain, jumlah pembayaran yang diterima pemain yang menang sama dengan jumlah pembayaran yang dilakukan pemain yang kalah. Jika permainan ini dilakukan oleh dua orang maka disebut dengan permainan berjumlah nol dari dua orang (two person zero sum game ), sedangkan jika permainan dilakukan oleh n orang maka disebut dengan permainan berjumlah nol dari n orang (n person zero sum game). Misalkan
. Contoh : Dalam persaingan perebutan jumlah pendengar antara dua radio swasta ABC dan PQR di kota X dengan asumsi tidak ada pendengar baru. Penambahan jumlah pendengar radio ABC, misalkan sejumlah 200 orang, merupakan kerugian bagi radio PQR karena pendengar radio PQR sejumlah 200 orang, pindah menjadi pendengar radio ABC .
p i pembayaran untuk pemain P i ; i = 1, 2, ..., n maka
2. Permainan berjumlah tidak nol (non zero sum game), yaitu permainan dengan total pembayaran dari masing-masing pemain pada akhir suatu permainan tidak sama dengan nol. Permainan ini dapat dilakukan oleh dua orang atau lebih.
1.3 Matriks Pembayaran Matriks pembayaran (pay off matrix) adalah suatu tabel berbentuk segi empat dengan elemen-elemennya yang merupakan besarnya nilai pembayaran yang bersesuaian dengan strategi yang digunakan oleh kedua belah pihak.
A. Matriks pembayaran untuk permainan bejumlah nol dari dua orang (two person zero sum game ). Bentuk umumnya :
Pemain Kedua (P 2 )
dengan : m = banyak strategi yang dimiliki pemain P 1 n = banyak strategi yang dimiliki pemain P 2
; i = 1, 2, ..., m dan j = 1, 2, ..., n = nilai pembayaran (didefinisikan secara numerik yang bersesuaian dengan strategi ke-i bagi pemain
P 1 dan strategi ke-j bagi pemain P 2 .
Matriks pembayaran tersebut merupakan matriks pembayaran terhadap pemain pertama (P 1 ) sehingga pemain P 1 disebut pemain baris yang berusaha memaksimumkan pembayaran dan pemain P 2 disebut pemain kolom yang berusaha meminimumkan pembayaran. Contoh : Terdapat persaingan perebutan pasar barang-barang elektronika dari pengusaha A dan pengusaha B dengan mengadakan kampanye promosi. Pengusaha A menggunakan tiga media promosi yaitu televisi, radio dan surat kabar. Sedangkan pengusaha B hanya menggunakan dua media promosi yaitu televisi dan radio. Dengan menggunakan informasi pasar yang diperoleh dari hasil riset pemasaran diperoleh data sebagai berikut :
Bila pengusaha A melakukan promosi melalui media televisi dan pengusaha B juga melakukan promosi dengan media televisi makan pengusaha A akan memperoleh keuntungan Rp 5 juta.
Bila pengusaha A melakukan promosi melalui media radio dan pengusaha B melakukan promosi dengan media televisi maka pengusaha A akan memperoleh keuntungan Rp 6 juta.
Bila pengusaha A melakukan promosi melalui media surat kabar dan pengusaha
B juga melakukan promosi dengan media televisi maka pengusaha A akan rugi sebesar Rp 5 juta. Bila pengusaha A melakukan promosi melalui media televisi dan pengusaha B melakukan promosi dengan media radio maka pengusaha A maupun B tidak akan menikmati keuntungan ataupun kerugian.
Bila kedua pengusaha tersebut sama-sama menggunakan media radio maka pengusaha B akan memperoleh keuntungan sebesar Rp 2 juta. Pengusaha B juga akan memperoleh keuntungan sebesar Rp 3 juta bila berpromosi menggunakan radiodi saat pengusaha A berpromosi menggunakan media surat kabar.
Dari data tersebut dapat disajikan matriks pembayaran sebagai berikut : Pengusaha B Televisi
Radio
5 0 Pengusaha A
Surat Kabar
Keterangan : =5 berarti keuntungan pengusaha A sebesar Rp 5 juta, =6 berarti keuntungan pengusaha A sebesar Rp 6 juta, = -10 berarti keuntungan pengusaha B sebesar Rp 10 juta, =0 berarti tidak yang untung maupun yang rugi, = -2 berarti keuntungan pengusaha B sebesar Rp 2 juta, = -3 berarti keuntungan pengusaha B sebesar Rp 3juta.
B. Matriks pembayaran untuk permainan berjumlah nol dari n orang (n person zero sum game ). Bentuk penyajian matriks pembayaran dapat dilihat pada contoh berikut ini. Misalkan terdapat tiga pemain yaitu A, B dan C.
Pemain A memiliki dua strategi, misalkan A 1 dan A 2 . Pemain B memiliki dua strategi, misalkan B 1 dan B 2 . Pemain C memiliki tiga strategi, misalkan C 1 ,C 2 dan C 3 .
Dengan data sebagai berikut : Strategi
Dengan jumlah pemain n = 3 maka terdapat tiga koalisi yang mungkin yaitu A melawan B dan C; B melawan A dan C; dan A dan B melawan C. Dengan demikian dapat dibuat tiga buah matriks pembayaran yang sesuai koalisi tersebut berdasarkan data diatas sebagai berikut.
1. Matriks pembayaran untuk A melawan B dan C. Pemain A dipandang sebagai pemain baris.
Pemain B dan C
B 1 ,C 1 B 1 ,C 2 B 1 ,C 3 B 2 ,C 1 B 2 ,C 2 B 2 ,C 3 Pemain
2. Matriks pembayaran untuk B melawan A dan C. Pemain B dipandang sebagai pemain baris.
Pemain A dan C
A 1 ,C 1 A 1 ,C 2 A 1 ,C 3 A 2 ,C 1 A 2 ,C 2 A 2 ,C 3 Pemain
B 1 2 -5
B B 2 4 -4
0 -2
1 -1
3. Matriks pembayaran untuk A dan B melawan C. Pemain A dan B dipandang sebagai pemain baris.
Pemain C
1.4 Nilai Permainan Dari matriks pembayaran, kedua belah pihak yang bersaing dapat menentukan strategi optimum, yaitu strategi yang menjadikan seorang pemain berada dalam posisi terbaik tanpa memperhatikan langkah-langkah yang dipilih pemain pesaingnya. Dengan kaitan ini, yang disebut dengan nilai permainan (value of the game) adalah rata-rata pembayaran (ekspektasi perolehan) per permainan jika kedua pihak atau pemain yang saling bersaing tersebut melakukan strategi optimum (strategi terbaik) mereka. Dengan kata lain, nilai permainan adalah suatu pembayaran yang bersesuaian dengan strategi optimum (strategi terbaik) yang dilakukan oleh kedua pemain tersebut.
Nilai permainan dapat dibedakan menjadi dua jenis yaitu :
1. suatu permainan dikatakan adil (fair) jika nilai permainannya sama dengan nol,
2. Suatu permainan dikatakan tidak adil (unfair) jika nilai permainannya tidak sama dengan nol.
PERMAINAN BERJUMLAH NOL DARI DUA ORANG
2.1 Pendahuluan Ada dua macam strategi optimum yang dapat digunakan untuk menentuan solusi optimum bagi kedua pihak yang saling bersaing yaitu :
a. Strategi Murni (Pure Strategy)
b. Strategi Campuran (Mixed Strategy)
2.2 Permainan dengan Strategi Murni Permainan dengan straegi murni adalah suatu permainan dengan posisi pilihan terbaiknya bagi setiap pemain dicapai dengan memilih satu strategi tunggal. Jadi strategi murni adalah strategi dimana setiap pemainnya hanya mempunyai tepat satu langkah yang terbaik. Dalam permainan dengan strategi murni, pemain pertama (pemain baris) yaitu pemain 2.2 Permainan dengan Strategi Murni Permainan dengan straegi murni adalah suatu permainan dengan posisi pilihan terbaiknya bagi setiap pemain dicapai dengan memilih satu strategi tunggal. Jadi strategi murni adalah strategi dimana setiap pemainnya hanya mempunyai tepat satu langkah yang terbaik. Dalam permainan dengan strategi murni, pemain pertama (pemain baris) yaitu pemain
Apabila nilai maximin sama dengan nilai minimax maka permainan ini dapat diselesaikan dengan strategi murni di mana titik keseimbangan (equilibrium point) telah tercapai. Titik keseimbangan ini dikenal sebagai titik pelana (saddle point). Cara menentukan titik pelana adalah sebagai berikut :
a. Untuk pemain pertama (P 1 )
Apabila pemain pertama (P 1 ) memilih strategi i maka dia yakin akan memenangkan apapun strategi yang dipilih atau digunakan oleh pemain kedua P 2 .
Karena pemain pertama (P 1 ) merupakan pemain yang berusaha memaksimumkan kemenangan (keuntungan) yang minimum maka dia akan memilih strategi yang akan
memberikan nilai maksimum dari nilai yan minimum itu
b. Untuk pemain kedua (P 2 )
c. Pemain kedua (P 2 ) akan berusaha menekan kemenangan bagi pemain pertama (P 1 ) sampai sekecil mungkin sehingga jika pemain kedua (P 2 ) memilih strategi j maka dia yakin bahwa kemenangan yang diperoleh pemain pertama (P 1 ) tidak lebih dari apapun strategi yang dipilih atau digunakan oleh pemain pertama (P 1 ).
Karena pemain kedua (P 2 ) merupakan pemain yang berusaha meminimumkan kekalahan (kerugian) yang maksimum maka dia akan memilih strategi yang akan
memberikan nilai minimum dari nilai yang maksimum itu yaitu .
Jika dalam suatu matriks pembayaran (a ij ) sedemikian rupa sehingga berlaku : =a rs ,
maka matriks pembayaran tersebut disebut mempunyai titik pelana pada (r, s) dan elemen a rs merupakan nilai permainan yang bersesuaian dengan strategi optimum bagi
pemain pertama (P 1 ), yaitu i = r dan strategi optimum bagi pemain kedua (P 2 ), yaitu j = s.
Contoh : Diketahui matriks pembayaran di bawah ini :
Pemain P 2
Pemain P 1
Dalam permainan ini pemain P 1 mengharapkan untuk memperoleh a ij ; i = 1, 2, 3 dan j = 1, 2,
3, 4 yang mungkin yang terbesar melalui pemilihan strategi i. Sementara itu pemain P 2 berusaha menekan perolehan (kemenangan) pemain P 1 menjadi sekecil mungkin melalui pemilihan strategi j. Karena pemain P 1 merupakan pemain yang berusaha memaksimumkan sedangkan pemain P 2 merupakan pemain yang berusaha meminimumkan maka secara rasional P 1 mengatakan : “Jika saya memilih i = 1 maka P 2 akan memilih j = 2 sehingga dalam kasus ini saya menang sebesar -4. Bila saya memilih i = 2 maka P 2 akan memilih j = 3 sehingga kemenangan saya hanya sebesar -1 dan bila saya memilih i = 3 maka maka P 2 juga akan memilih j = 3 sehingga kemenangan saya hanya sebesar -3. Dari ketiga perolehan tersebut (-4, -1, -3) saya harus menentukan yang maksimum dari ketiganya itu dan pilihan terbaik saya adalah i = 2 yang menjadikan kemenangan saya sebesar -1”.
Sedangkan pemain P 2 akan mengatakan bahwa : “Saya harus membuat kemenangan P 1 sekecil mungkin. Bila saya memilih j = 1 maka kemenangan pemain P 1 yang paling besar adalah 5. Begitu juga secara berturut-turut bila saya memilih j = 2, 3, dan 4 maka P 1 akan mendapatkan perolehan 3, -1, dan 2. Dengan demikian saya harus memilih j yang dapat meminimumkan perolehan P 1 yang maksimum tersebut. Dengan begitu saya harus memilih
j = 3 yang membuat kemenangan P 1 hanya -1”. =a 23 = -1.
Jadi permainan dengan matriks pembayaran di atas mempunyai titik pelana pada (2, 3) dengan nilai permainan sebesar -1. Dengan demikian berarti bahwa pemain P 2 memenangkan permainan sebesar 1 (pemain P 1 harus membayar sebesar 1 kepada pemain P 2 ) dan strategi optimum bagi pemain P 1 adalah i = 2 dan bagi pemain P 2 adalah j = 3. Hal ini menunjukkan bahwa permainan dengan matriks pembayaran tersebut dapat diselesaikan dengan strategi murni.
Untuk mempermudah penentuan apakah suatu permainan dengan matriks pembayaran tertentu mempunyai titik pelana atau tidak maka diberikan prosedur di bawah ini.
1. Perhatikan baik-baik matriks pembayaran yang ada
2. Pada setiap barisnya, tentukan nilai yang terkecil
3. Dari nilai-nilai terkecil dari setiap barisnya tersebut (yang dipilih sesuai langkah kedua) pilihlah nilai yang terbesar.
4. Pada setiap kolomnya, tentukan nilai yang terbesar.
5. Dari nilai-nilai terbesar dari setiap kolomnya tersebut (yang dipilih sesuai langkah keempat) pilihlah nilai yang terkecil.
6. Periksalah apakah nilai terbesar yang terpilih (dari langkah ketiga) sama dengan nilai terkecil yang terpilih (dari langkah kelima) - Apabila sama maka permainan dengan matriks pembayaran tersebut mempunyai
titik pelana dan nilai yang merupakan titik pelana tersebut merupakan nilai permainannya. Dari sini strategi dari masing-masing pemain dapat dilihat di mana letak nilai permainannya itu. Dengan demikian permainan ini dapat diselesakan dengan strategi murni.
- Apabila tidak sama maka permainan dengan matriks pembayaran tersebut tidak
mempunyai titik pelana dan harus diselesaikan dengan strategi campuran (mixed strategy)
Contoh: Diberikan matriks pembayaran di bawah ini
Pemain P 2
1 2 3 4 Minimum
tiap baris
Pemain P 1
2 3 1 -1
2 -1
Maximum dari
yang minimum Max tiap
Minimum dari yang maximum
Jika nilai minimum tiap barisnya diperhatikan maka nilai maksimum dari yang minimum tersebut sebesar -1. Demikian juga kalau nilai maksimum dari setiap kolomnya diperhatikan maka nilai minimum dari yang maksimum tersebut sebesar -1 juga. Terlihat bahwa
= -1.
Jadi permainan itu dapat diselesaikan dengan strategi murni, yaitu :
- Strategi optimum bagi pemain P 1 adalah i = 2, dan - Strategi optimum bagi pemain P 2 adalah j = 3 dengan
- Nilai permainan sebesar -1.
2.3 Permainan dengan Strategi Campuran Dalam permainan di mana permainan tersebut tidak mempunyai titik pelana maka para pemain akan bersandar kepada apa yang disebut sebagai strategi campuran. Hal ini berarti pemain pertama akan memainkan setiap strategi baris dengan proporsi waktu (probabilitas) tertentu. Oleh karena itu dalam suatu permainan yang diselesaikan dengan strategi campuran, strategi dari setiap pemain akan mempunyai probabilitas yang menunjukkan proporsi waktu atau banyaknya bagian yang dipergunakan untuk melakukan strategi tersebut. Jadi tugas dari setiu ap pemain adalah menentukan proporsi waktu (probabilitas) yang diperlukan untuk menentukan strateginya. Untuk lebih jelasnya dapat diperhatikan ilustrasi permainan matriks pembayaran 2 x 2 di bawah ini.
Pemain P 2 j
1 1 5 Pemain P 1
Matriks pembayaran dari permainan berjumlah nol dari dua orang di atas tidak mempunyai titik pelana sehingga strategi murni tidak dapat dipergunakan. Dengan demikian tugas para pemain adalah menentukan proporsi waktu (probabilitas) yang diperlukan untuk
memainkan strategi pada baris bagi Pemain P 1 dan strategi komlom bagi Pemian P 2 . - Bagi Pemain P 1 Misalnya x, dengan 0 x 1 adalah proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada baris pertama maka proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada baris kedua adalah 1-x sehingga jumlah semua proporsi waktu yang diperlukan untuk memainkan strateginya adalah x+1-x =1.
- Bagi Pemain P 2 Misalnya y, dengan 0 y 1 adalah proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada kolom pertama maka proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada kolom kedua adalah 1-y sehingga jumlah semua proporsi waktu yang diperlukan untuk memainkan strateginya adalah y+1-y =1.
1-y
1-x
Dengan demikian tugas dari masng-masing pemain adalah menentukan besarnya pecahan yang tidak diketahui x dan y dimana pemain pertama P 1 menginginkan untuk mencari strategi yang akan memaksimumkan kemenangannya (atau meminimumkan kekalahannya) tanpa memperhatikan langkah yang dilakukan oleh pihak lawan (pesaing), yaitu pemain P 2.
Secara logika, pemain pertama P 1 ingin membagi permainannya di antara baris-barisnya sedemikian rupa sehingga kemenangan atau kekalahan harapannya (expected) di saat pemain kedua. Sudah barang tentu pemain kedua P 2 (yang diasumsikan mempunyai kecerdasan yang sama dengan dengan pemain pertama P 1 ) akan mengikuti logika yang serupa di dalam penghitungan proporsi waktu yang diperlukan untuk setiap kolomnya seperti yang dilakukan oleh pemain pertama P 1 , yaitu pemain kedua P 2 akan membagi waktu bermainnya di antara kolom-kolomnya sedemikian rupa sehingga kemenangan atau kekalahan harapannya (expected) di saat pemain P 1 memainkan baris kesatu akan sama dengan kemenangan atau kekalahan harapannya (expected) di saat pemain P 1 memainkan baris kedua. Jadi strategi campuran adalah strategi dengan setiap pemain menggunakan distribusi probabilitas dalam memilih strateginya.
2.4 Aturan Dominansi Sebelum menyelesaikan suatu permainan perlu dipertinmbangkan apakah ada baris atau kolom dalam matriks pembayarannya yang tidak efektif pengaruhnya di dalam penentuan strategi optimum dan nilai permainan. Bila ada maka baris atau kolom yang seperti itu bisa dihapus atau tidak dipakai,Hal itu berarti bahwa probabilitas untuk memilih strategi sesuai baris atau kolom tersebut sama dengan nol. Dengan demikian ukuran matriks pembayaran yang tersisa akan lebih kecil. Hal ini akan lebih mempermudah untuk menyelesaikannya. Aturan demikian ini dinamakan aturan dominansi.
A. Aturan dominansi bagi pemain pertama P 1 (pemain baris). Karena pemain P 1 (pemain baris)
memaksimumkan kemenangan/perolehannya maka aturan dominansinya adalah sebagai berikut : bila terdapat suatu baris dengan semua elemen dari baris tersebut adalah sama (sekolom) dari baris yang lain maka baris tersebut dikatakan didominansi dan baris itu telah dihapus.
B. Aturan dominansi bagi pemain kedua P 2 (pemain kolom). Karena pemain kedua P 2 merupakan pemain yang berusaha untuk meminimumkan kekalahan/kerugiannya maka aturan dominansinya adalah sebagai berikut :
bila terdapat suatu kolom dengan semua elemen dari kolom tersebut adalah sama atau lebh besar dari elemen dalam posisi yang sama (sebaris) dari kolom yang lain maka kolom tersebut dikatakan didominansi dan kolom itu dapat dihapus.
Aturan dominansi ini dapat diulang lagi jika masih ada baris atau kolomnya yang didominansi oleh baris atau kolom yang lain. Dan ini memungkinkan matriks pembayaran semula akan tersisa menjadi matriks pembayaran dengan satu elemen saja. Bila hal ini dapat terjadi maka permainannya dapat diselesaikan dengan strategi murni dengan nilai permainan sesuai dengan elemen yang tersisa tersebut. Tetapi tidak semua permainan yang mempunyai titik pelana dapat diselesaikan dengan aturan dominansi yang berulang-ulang tersebut. Contoh : Diberikan matriks pembayaran di bawah ini
Pemain P
1 4 -9
7 -2
Pemain P 1 2 -8
4 -4
3 -2
- Bagi pemain P 1
Perhatikan elemen-elemen pada baris kesatu, kedua, dan keempat. Untuk setiap j ; j = 1,
2, 3, 4, 5 berlaku a1j<a4j dan a2j<a4j. Dengan demikian pemain P 1 tidak akan memilih strategi sesuai baris kesatu dan kedua apapun pilihan strategi dari P 2 . Oleh karena itu baris kesatu dan kedua dapat dihapus sehingga matriksnya menjadi
Pemain P 2
3 -2
Pemain P 1
Sekarang pandang matriks pembayaran tersisa dari tabel di atas. Untuk pemain P 1 sudah tidak ada baris yang dapat didominansi oleh baris yang lain.
- Bagi pemain P 2
Pada kolom ke 2,3,4, dan 5 untuk setiap i; i = 3, 4 berlaku ai2>ai4, ai3>ai4. Dengan demikian pemain P 2 tidak akan memilih strategi sesuai kolom 2, 3, dan 5 apapun pilihan dari P 1 . Dari sini maka kolom ke 2,3,5 dapat dihapus sehingga matriks pembayarannya menjadi :
Pemain P 2
3 -2
Pemain P 1
Pada matriks pembayaran tersisa pada tabel di atas dapat diperiksa lagi apakah masih ada baris atau kolom yang memungkinkan untuk didominansi. Ternyata tidak ada maka aturan dominansi tidak dapat diulang lagi. Tampak bahwa matriks pembayaran pada tabel di atas akan lebih mudah untuk diselesaikan karena ukuran matriks pembayaran ini lebih kecil bila dibandingkan dengan ukuran matriks pembayaran semula. Di dalam memeriksa apakah aturan dominansi dapat digunakan atau tidak, tidak harus dimulai
dari pemain P 1 dahulu tetapi bisa dimulai sembarang.
METODE PENYELESAIAN
1. Metode Aljabar
Metode aljabar dapat digunakan untuk menyelesaikan suatu permainan berjumlah nol dari dua orang dengan masing-masing pemain mempunyai dua pilihan strategi (langkah). Matriks pembayaran dari permainan berjumlah nol dari dua orang dengan masing-masing pemain mempunyai dua pilihan strategi sebagai berikut.
Pemain P 2
1 a 11 a 12 Pemain P 1
2 a 21 a 22
Prinsip untuk menggunakan metode aljabar untuk menyelesaikan permainan ini adalah bahwa kedua pemain P1 dan P2 membagi waktu (sesuai proporsinya) yang diperlukan untuk memilih suatu strategi.
Misalkan x = Proporsi waktu yang digunakan oleh pemain P1 untuk memainkan strategi pertama. Berarti bahwa:
1 - x = Proporsi waktu yang digunakan oleh pemain P1 untuk memainkan strategi kedua. Misalkan y = Proporsi waktu yang digunakan oleh pemain P2 untuk memainkan strategi pertama. Berarti bahwa:
1 - y = Proporsi waktu yang digunakan oleh pemain P2 untuk memainkan strategi kedua. Matriks pembayaran menjadi:
Pemain P 2
1-y
1 a 11 a 12
Pemain P 1
1-x
2 a 21 a 22
• Bagi pemain P 1 Karena dasar pemikiran pemain P 1 adalah berusaha memaksimumkan kemenangannya maka ia merancang suatu strategi yang dapat memaksimumkan kemenangan
(meminimumkan kekalahan) tanpa memperhatikan langkah balasan yang dilakukan oleh pihak lawannya (P 2 ). Kemenangan harapan bagi pemain P 1 dapat dilihat pada tabel berikut.
Ketika P 2 memainkan Ketika P 2 memainkan
strategi ke 2 P 1 memainkan P 1 memenangkan a 11 P 1 memenangkan a 12 strategi ke 1, x kali
strategi ke1
unit, x kali
unit, x kali
----------------
P 1 memainkan P 1 memenangkan a 21 P 1 memenangkan a 22 strategi ke 2, (1-x) unit, (1-x) kali
unit, (1-x) kali kali Total
kemenangan x a 11 + (1-x) a 21 x a 12 + (1-x) a 22
harapan bagi P 1
Besarnya bilai x ditentukan dengan menggunakan prinsip pemikiran pemain P 1 , yaitu bahwa total kemenangan harapan P 1 ketika pemain P 2 memainkan strategi ke 1 sama dengan total kemenangan harapan P 1 ketika pemain P 2 memainkan strategi ke 2. Dari tabel di atas diperoleh bahwa:
x a 11 + (1-x) a 21 =xa 12 + (1-x) a 22 x (a 11 +a 22 –a 12 –a 21 )=a 22 –a 21 x =a 22 –a 21 =x 1 *
11 +a a 22 +a 12 –a 21
22 − a 21 a 11 − a 12
a 11 + a 22 − a 12 − a 21 a 11 + a 22 − a 12 − a 21 Jadi strategi optimum pemain P 1 adalah X* = [x 1 *,x 2 *]
• Bagi pemain P 2 Pemain P 2 bermaksud memaksimumkan kemenangan atau meminimumkan kekalahannya
tanpa memperhatikan strategi yang dimainkan oleh pemain P 1 .
Ketika
P 2 Ketika
P 2 Total kekalahan memainkan strategi memainkan strategi harapan bagi P 2
ke 1, y kali
ke 2, (1-y) kali
P 1 memainkan P 2 kalah a 11 unit, y P 2 kalah a 12 unit, ya 11 + (1-y) a 12 strategi ke 1
kali
(1-y) kali
P 1 memainkan P 2 kalah a 21 unit, y P 2 kalah a 22 unit, ya 21 + (1-y) a 22 strategi ke 2
kali
(1-x) kali
Dari di atas diperoleh bahwa
y a 11 + (1-y) a 12 =ya 21 + (1-y) a 22 y (a 11 +a 22 –a 12 –a 21 )=a 22 –a 12 y =a 22 –a 12 =y 1 *
Jadi strategi optimum pemain P 2 adalah Y* = [y 1 *,y 2 *]
Dengan demikian strategi optimum bagi masing-masing pemain telah diperoleh, yaitu
X* = [x 1 *,x 2 *] dan Y* = [y 1 *,y 2 *]. Penghitungan nilai permainan dipandang dari pemain P 1 maupun P 2
a. Jika nilai permainan dihitung menurut pandangan pemain P 1 maka perlu diperhatikan:
i. Selama pemain P 2 menggunakan y 1 * waktunya untuk memainkan (strategi) kesatu, pemain P 1 menang a 11 unit sebanyak x 1 * kali dan pemain P 1 menang a 21 unit sebanyak x 2 * kali.
ii. Selama pemain P 2 menggunakan y 2 * waktunya untuk memainkan kolom (strategi) kedua, pemain P 1 menang a 12 unit sebanyak x 1 * kali dan pemain P 1 menang a 22 unit sebanyak x 2 * kali. Nilai permainannya sama dengan total kemenangan harapan bagi pemain P 1 yaitu:
v *=y 1 * [x 1 *a 11 +x 2 *a 21 ]+y 2 * [x 1 *a 12 +x 2 *a 22 ]
b. Jika nilai permainan dihitung menurut pandangan pemain P 2 maka perlu diperhatikan:
i. Selama pemain P 1 menggunakan x 1 * waktunya untuk memainkan (strategi) kesatu, pemain P 2 akan kalah a 11 unit y 1 * kali dan pemain P 2 kalah a 12 unit y 2 * kali.
ii. Selama pemain P 1 menggunakan x 2 * waktunya untuk memainkan kolom (strategi) kedua, pemain P 2 akan kalah a 12 unit y1* kali dan pemain P 2 kalah a 22 unit y 2 * kali. Nilai permainannya sama dengan total kekalahan harapan bagi pemain P 2 yaitu:
v*=x 1 * [y 1 *a 11 +y 2 *a 21 ] + x2* [y 1 *a 12 +y 2 *a 22 ]
Contoh: Diberikan matriks pembayaran sebagai berikut. Akan dicari strategi optimum untuk P 1 dan P 2 .
Pemain P 2
1 5 3 Pemain P 1
Misalkan x = Proporsi waktu yang digunakan oleh pemain P 1 yang digunakan untuk memainkan strategi ke 1. y = Proporsi waktu yang digunakan oleh pemain P2 untuk memainkan strategi pertama. Matriks pembayaran menjadi: Pemain P 2
1-y
Pemain P 1
1-x
• Bagi pemain P 1 Tabel kemenangan harapan bagi pemain P 1 dapat dilihat pada tabel berikut.
Ketika P 2 memainkan Ketika P 2 memainkan
strategi ke 2 P 1 memainkan P 1 memenangkan 5 P 1 memenangkan 3 strategi ke 1, x kali
strategi ke1
unit, x kali
unit, x kali
----------------
P 1 memainkan P 1 memenangkan 1 P 1 memenangkan 4 strategi ke 2, (1-x) unit, (1-x) kali
unit, (1-x) kali kali Total
kemenangan 5x + 1(1-x) 3x + 4(1-x)
harapan bagi P 1 Bagi pemain P 1 agar dapat mencapai strategi optimum makaperlu menyamakan kemenangan harapan yang diperoleh ketika pemain P 2 memainkan strategi ke-1 yaitu [5x+(1-x)] dengan kemenangan harapan yang diperoleh ketika pemain Dari di atas diperoleh bahwa:
5x + (1-x) = 3x + 4(1-x) 5x – x – 3x+4x = 4-1
5x =3 x = 3/5 = x 1 * Karena x 2 * = 1- x maka x 2 * = 1- 3/5 = 2/5
Jadi strategi optimum bagi pemain P 1 dicapai bila ia menggunakan 3/5 waktunya untuk memainkan strategi ke 1 dan 2/5 waktunya untuk memainkan strategi ke 2.
Jadi strategi optimum pemain P 1 adalah X* = [3/5,2/5]
• Bagi pemain P 2 Tabel kekalahan harapan bagi pemain P 2 dapat dilihat pada tabel berikut.
Ketika
P 2 Ketika P 2 memainkan Total kekalahan memainkan strategi strategi ke 2, (1-y) harapan bagi P 2
ke 1, y kali
kali
5y + 3(1-y) strategi ke 1
P 1 memainkan P 2 kalah 5 unit, y P 2 kalah 3 unit, (1-y)
kali
kali
y + 4(1-y) strategi ke 2
P 1 memainkan P 2 kalah 1 unit, y P 2 kalah 4 unit, (1-y)
kali
kali
Agar pemain P 2 dapat mencapai strategi optimum ia perlu menyamakan rata-rata kekalahan (kekalahan harapan) yang dideritanya ketika pemain P 1 memainkan strategi ke-1, yaitu [5y+3(1-y)] dengan rata-rata kekalahan yang diderita ketika pemain P 1 memainkan strategi ke 2 yaitu [y+4(1-y)]. Dari di atas diperoleh bahwa
5y + 3(1-y) = y + 4(1-y) 5y – 3y – y + 4y = 4 – 3
5y = 1 y = 1/5 = y 1 *. Karena y 2 * = 1- y maka y 2 * = 1 – 1/5 = 4/5.
Jadi strategi campuran optimum bagi pemain P 2 dicapai bila ia menggunakan 1/5 waktunya untuk memainkan strategi ke 1 dan 4/5 waktunya untuk memainkan strategi ke-2.
Jadi strategi optimum pemain P 2 adalah Y* = [1/5,4/5]
Dengan demikian strategi optimum bagi masing-masing pemain telah diperoleh, yaitu X* = [3/5,2/5] dan Y* = [1/5,4/5].
Penghitungan nilai permainan dipandang dari pemain P 1 maupun P 2
a. Jika nilai permainan dihitung menurut pandangan pemain P 1 maka perlu diperhatikan:
i. Selama pemain P 2 menggunakan 1/5 waktunya untuk memainkan strategi kesatu, pemain P 1 menang 5 unit sebanyak 3/5 kali dan 1 unit sebanyak 2/5 kali.
ii. Selama pemain P 2 menggunakan 4/5 waktunya untuk memainkan strategi kedua, pemain P 1 menang 3 unit sebanyak 3/5 kali dan 4 unit sebanyak 2/5 kali. Nilai permainannya sama dengan total kemenangan harapan bagi pemain P 1 yaitu: v*= 1/5 [5(3/5) + 1(2/5)] + 4/5[3(3/5) + 4(2/5)]
= 85/25 = 17/5 = nilai permainan
Ini berarti bahwa bila pemain P 1 bermain dengan menggunakan strategi optimumnya maka ia dapat mengharapkan kemenangan harapan sebesar 17/5 unit per permainan.
b. Jika nilai permainan dihitung menurut pandangan pemain P 2 maka perlu diperhatikan:
i. Selama pemain P 1 menggunakan 3/5 waktunya untuk memainkan strategi kesatu, pemain P 2 akan kalah 5 unit 1/5 kali dan 3 unit 4/5 kali.
ii. Selama pemain P 1 menggunakan 2/5 waktunya untuk memainkan strategi kedua, pemain P 2 akan kalah 1 unit sebanyak 1/5 kali dan 4 unit 4/5 kali. Nilai permainannya sama dengan total kekalahan harapan bagi pemain P 2 yaitu: v*= 3/5 [5(1/5) + 3(4/5)] + 2/5[1(1/5) + 4(4/5)]
= 1/25 [ 15 + 36 + 2 + 32] = 85/25 = 17/5 = nilai permainan.
Karena nilai permainan bertanda positif maka pemain P 1 dinyatakan sebagai pemenang dengan rata-rata kemenangan per permainan sebesar 17/5 unit.
c. Prosedur penghitungan nilai permainan dapat disederhanakan menjadi: • Pemain P 1 memainkan strategi yang telah dibentuk sedemikian rupa sehingga kemenangan yang diperoleh ketika pemain P 2 memainkan strategi kesatu sama dengan kemenangan yang diperolehnya ketika pemain P 2 memainkan strategi kedua. • Alasan tersebut juga dapat diterapkan pada harapan kemenangan pemain P 2 .
4 dengan X* = [x 1 *, x 2 *] adalah strategi optimum pemain P 1 .
Y* = [y 1 *, y 2 *] adalah strategi campuran optimum pemain P 2 . Dari di atas terdapat 4 pasang perkalian yang mungkin akan memberikan nilai sama dan merupakan nilai permainan adalah:
1. v* = x 1 *a 11 +x 2 *a 21 berdasarkan kemenangan harapan bagi pemain P 1
3. v* = y 1 *a 11 +y 2 *a 21 berdasarkan kemenangan harapan bagi pemain P 2
Terdapat 4 pasang perkalian yang mungkin akan memberikan nilai sama dan merupakan nilai permainan adalah:
1. v* = 1/4 (-2) + 3/4 (3) = 7/4 berdasarkan kemenangan harapan bagi pemain P 1
2. v* = 1/4 (4) + 3/4 (1) = 7/4 ketika pemain P 2 memainkan kolom 1 atau kolom 2.
3. v* = 3/8 (-2) + 5/8 (4) = 7/4 berdasarkan kemenangan harapan bagi pemain P 2
4. v* = 3/8 (3) + 5/8 (1) = 7/4 ketika pemain P 1 memainkan baris 1 atau baris 2.
d. Menghitung nilai permainan dengan menggunakan probabilitas dan nilai harapan permainan
Pemain P 2
1 a 11 a 12
Pemain P 1
2 a 21 a 22
Probabilitas bagi pemain P 1 adalah [x 1 *,x 2 *] dan probabilitas P 2 adalah [y 1 *,y 2 *] Penghitungan probabilitas untuk setiap pembayaran:
Nilai Pembayaran
Strategi penghasil
a 11 Baris 1, kolom 1
P 11 =x 1 *x y 1 *
a 11 xP 11
a 12 Baris 1, kolom 2
P 12 =x 1 *x y 2 *
a 12 xP 12 a 12 xP 12
P 21 =x 2 *x y 1 *
a 21 xP 21
a 22 Baris 2, kolom 1
Nilai harapan permainan v* =
Pemain P 2
Pemain P 1
Penghitungan probabilitas untuk setiap pembayaran:
Strategi penghasil
Probabilitas
Pembayaran Nilai harapan
Baris 1, kolom 1
P 11 = 1/4 x 3/8 = 3/32 a 11 xP 11 = -6/ 32
4 Baris 1, kolom 2
P 12 = 1/4 x 5/8 = 5/32 a 12 xP 12 = 20/32
3 Baris 2, kolom 1
P 21 = 3/4 x 3/8 = 9/32 a 21 xP 21 = 27/32
1 Baris 2, kolom 1
P 22 = 3/4 x 5/8 =15/32 a 22 xP 22 = 15/32
Jumlah
Nilai permainan = nilai harapan permainan = v* = 7/4
2. Metode Grafik
Yaitu metode penyelesaian permainan dengan menggunakan grafik. Metode grafik ini dapat digunakan untuk menyelesaikan kasus permainan di antaranya adalah sebagai berikut:
a. Matriks berukuran 2 x n Matriks pembayaran dari permainan berukuran 2 x n adalah
Pemain P 2
iI j
1 2 … n Pemain P 1 x 1 1 a11 a12 … a1n
x 2 =1–x 1 2 a21 a22 … a2n
0 dan y 1 1 untuk setiap i, j. Pembayaran harapan yang berkaitan dengan strategi murni pemain P 2.
Strategi murni Pembayaran harapan pemain 1 pemain 2
1 a 11.x1 + a21.(1 – x1) = (a11 – a21).x1 + a21
2 a 12.x1 + a22.(1 – x1) = (a12 – a22).x1 + a22 . . .
a 1n.x1 + a2n.(1 – x1) = (a1n – a2n).x1 + a2n
Tabel di atas menunjukkan bahwa pembayaran harapan (rata-rata pembayaran) bagi pemain P 1 bervariasi secara linear dengan x 1 . Berdasarkan kriteria minimax untuk pemain P 1 harus memilih nilai x 1 yang akan memaksimalkan pembayaran harapan (rata-rata pembayaran) minimumnya (prinsip maximin). Hal ini dapat dilakukan dengan cara menggambarkan garis-garis lurus di atas sebagai fungsi dari x 1 . Sumbu vertikal menunjukkan pembayaran harapan (rata-rata pembayaran) dan sumbu horizontal menunjukkan variasi dari x 1 (0 x 1 1). Dalam grafik ini dicari titik maximinnya. Contoh: Diberikan matriks pembayaran sebagai berikut. Akan dicari strategi optimum untuk P 1 dan P 2 .
1 y 2 y3
i x 1 -1 1 3
x 2 = 1-x1
5 3 -3
Penyelesaian x 1 = probabilitas pemain 1 memainkan strategi kesatu x 2 = probabilitas pemain 2 memainkan strategi kedua yj = probabilitas pemain 2 memainkan strategi ke-j
maka pembayaran harapan bagi pemain P 1 yang berkaitan dengan strategi murni P 2 adalah
Strategi murni P2
Pembayaran harapan P1
1 -x 1 + 5(1-x 1 ) = -6. x 1 +5
2 x 1 + 3(1- x 1 ) = -2. x 1 +3
3 3. x 1 - 3(1-x1) = 6. x 1 -3
Ketiga garis lurus fungsi dari x 1 tersebut dapat digambarkan pada grafik
garis 1
garis 2 0 garis 3
Menurut kriteria minimax P 1 , harus memilih nilai x 1 yang akan memaksimalkan pembayaran harapan minimumnya yaitu
v * = max(x 1 ) { min (-6x 1 + 5, -2x 1 + 3 , 6x 1 - 3)}
karena hanya garis (1) dan (3) yang melalui titik maximin maka
v * = max(x 1 ) { min (-6 x 1 + 5, 6 x 1 - 3)}
dari sini nilai optimum x 1 titik potong garis (1) dengan garis (3)
-6 x 1 +5=6x 1 –3
12 x 1 =8
x 1 =x 1 * = 2/3
2 * = 1- x x 1 * = 1/3 jadi strategi campuran optimum P 1 X* = [2/3, 1/3]
Nilai permainan yang diperoleh v *= -6x1* + 5 = -6. 2/3 + 5 = 1 atau v* = 6x1* – 3 = 1 Selanjutnya akan dihitung strategi optimum pemain P 2 . Nilai yang optimum bagi pemain pembayaran P 2 dapat diperoleh dari nilai pembayaran harapan permainan,
yaitu: v * =
a ij x 2 * y j *
i = 1 j = 1 sehingga
y 1*(-6x1* + 5 ) + y2* (-2x1* + 3) + y3* (6x1*-3) = v* y 1* + 5/3 y2* + y3* = 1 y 1* + y3* = 1 (y2* = 0 karena tidak melalui titik maximin dimana v* > 1)
Jadi strategi kedua pe pemain P 2 tidak dimainkan, sehingga matriks ks pembayarannya menjadi
P1
P2
1 y3=1-y1
i x 1 -1 3
x 2 5 -3
maka pembayaran hara arapan bagi pemain P 2 yang berkaitan dengan s strategi murni P 1 adalah
Strategi gi murni P1 Pembayaran harapan P2
1 -y1 + 3(1-y1) = 3 - 4y1
2 5y1 - 3(1-y1) = 8x1 – 3 Kedua garis lurus fungs ngsi dari y 1 tersebut dapat digambarkan pada grafi afik
Karena P 2 mengingink inkan untuk meminimumkan kekalahan yang m maksimum maka pemain P 2 harus memi milih nilai y1 yang akan meminimumkan pemb mbayaran harapan yang maksimum, yaitu itu: v* = min(y1) { { max (3 – 4 y 1, 8y1 - 3)} karena kedua garis (1) (1) dan (2) melalui titik minimax maka nilai opti ptimum y 1 * adalah titik potong kedua garis aris tersebut, diperoleh y 1 = y1* = ½ karena y1 + y3 = 1 mak aka y3* = 1 – y1* = ½ jadi strategi optimum P P2 y* = [ ½ , 0, ½], dan nilai permainan v* = 1 Karena P 2 mengingink inkan untuk meminimumkan kekalahan yang m maksimum maka pemain P 2 harus memi milih nilai y1 yang akan meminimumkan pemb mbayaran harapan yang maksimum, yaitu itu: v* = min(y1) { { max (3 – 4 y 1, 8y1 - 3)} karena kedua garis (1) (1) dan (2) melalui titik minimax maka nilai opti ptimum y 1 * adalah titik potong kedua garis aris tersebut, diperoleh y 1 = y1* = ½ karena y1 + y3 = 1 mak aka y3* = 1 – y1* = ½ jadi strategi optimum P P2 y* = [ ½ , 0, ½], dan nilai permainan v* = 1
Pemain P 2
2 = 1 – y1 y
x 1 1 a11 a12 Pemain P 1 x 2 2 a21 a22
xm
am1 am2
Pembayaran harapan yang berkaitan dengan strategi murni pemain P 2
Strategi murni Pembayaran harapan pemain 2 pemain 1
(P2)
1 (a11 – a21)y1 + a12
2 (a12 – a22)y1 + a22
(am1 – am2)y1 + am2
Tabel di atas menunjukkan bahwa pembayaran harapan (rata-rata pembayaran) bagi pemain P 2 bervariasi secara linear dengan y 1 . Berdasarkan kriteria minimax untuk pemain P 2 harus memilih nilai y 1 yang akan meminimumkan pembayaran harapan (rata-rata pembayaran) maksimumnya (prinsip minimax). Hal ini dapat dilakukan dengan cara menggambarkan garis-garis lurus di atas sebagai fungsi dari y 1 . Sumbu vertikal menunjukkan pembayaran harapan (rata-rata pembayaran) dan sumbu horizontal menunjukkan variasi dari y 1 (0 y 1 1). Dalam grafik ini dicari titik minimaxnya.
Teori Dualitas
Yaitu salah satu metode penyelesaian yang dapat digunakan untuk menghitung strategi optimum pemain yang mempunyai lebih dari dua pilihan strategi. Matriks pembayarannya dapat disajikan sebagai berikut
Hal ini berdasarkan pada:
a. Prinsip pemain P 1
Memaksimumkan v (nilai permainan) sedemikian rupa sehingga v ; j = 1, 2, …, n Dengan
=1, x i
0 ; untuk setiap i dan
b. Prinsip pemain P 2
Meminimumkan v (nilai permainan) sedemikian rupa sehingga v ; i = 1, 2, …, n Dengan
,y j
0 ; untuk setiap j dan
Permainan Berjumlah Nol dari n Orang
Ada dua asumsi yang dipakai di dalam pembahasan permainan berjumlah nol dari n orang ini, yaitu:
1. Setiap pemain dalam permainan ini dapat berkomunikasi dan berunding dengan pemain yang lain untuk membuat suatu perjanjian yang mengikat. Jika suatu kelompok menyatakan untuk bekerja sama maka mereka membentuk koalisi. Suatu koalisi adalah persetujuan di antara beberapa pemain untuk mengkoordinasikan strategi mereka yang ada di dalam suatu cara sedemikian sehingga seluruh anggota koalisi itu beruntung.
2. Para pemain dapat membuat pembayaran sampingan (side payment) yaitu transfer pembayaran di antara pemain. Setelah koalisi memaksimumkan total pembayarannya, pembayaran untuk para koalisi itu diatur dengan pembuatan pembayaran sampingan.
Banyak cara yang mungkin untuk mengelompokkan ke dalam koalisi adalah 2 n-1 Contoh : Diberikan permainan berjumlah nol dari 3 orang (A, B, C) masing-masing pemain mempunyai 2 pilihan strategi.
A mempunyai strategi : X1, X2
B mempunyai strategi : Y1, Y2
C mempunyai strategi : Z1, Z2 Diperoleh matriks pembayaran
koalisi yang mungkin terbentuk adalah grup I
grup II
Diperoleh matriks pembayaran dari tiap koalisi sebagai berikut • Matriks pembayaran A melawan B, C
Y1, Z1 Y1, Z2 Y1, Z1 Y2, Z2
X1 -1 -3 0 3 X2 -2 0 -1 -2
• Matriks pembayaran B melawan A, C X1, Z1 X1, Z2 X2, Z1 X2, Z2
• Matriks pembayaran C melawan A, B X1, Y1 X1, Y2 X2, Y1 X2, Y2
Dengan metode grafik didapatkan :
1. Nilai permainan untuk A yaitu V(A) = -3/2 dan V(BC)= 3/2
2. Nilai permainan untuk B yaitu V(B) = -1/2 dan V(AC)= 1/2
3. Nilai permainan untuk C yaitu V(C) = -9/7 dan V(AB)= 9/7