Tujuan kelebihan dan kekurangan teori permainan. Teori permainan

Teori permainan adalah teori matematika tentang situasi konflik.

Tugas teori permainan adalah mengembangkan rekomendasi untuk tindakan rasional para pihak yang berkonflik. Artinya, dimungkinkan untuk mengembangkan aturan perilaku yang optimal bagi masing-masing pihak yang terlibat dalam menyelesaikan situasi konflik. Dalam hal ini dibangun model situasi konflik yang disederhanakan, yang disebut permainan.

Pihak-pihak yang terlibat konflik disebut pemain, dan hasil konflik disebut menang (kalah).

Permainan ini berbeda dari situasi konflik nyata karena permainan ini dimainkan sesuai dengan aturan yang telah ditentukan dengan jelas yang mendefinisikan:

1. opsi pemain

2.jumlah informasi yang dimiliki setiap pemain tentang perilaku mitranya

3. keuntungan (kerugian) yang dihasilkan oleh setiap rangkaian tindakan.

Memilih dan melaksanakan salah satu tindakan yang ditentukan oleh aturan disebut gerakan pemain .

Kasus paling sederhana, yang dikembangkan secara rinci dalam teori permainan, adalah permainan berpasangan zero-sum yang terbatas (permainan antagonis antara dua individu atau dua koalisi, yaitu situasi konflik).

Bentuk matematis dari situasi konflik seperti itu adalah permainan matriks dalam strategi murni.

Tabel 1

B 1

B 2

B N

A 1

A 11

A 12

.

A 1 N

A 2

A 2 1

A 22

..

A 2n

..

.

..

..

A M

A M 1

A m2

..

A M N

Jika tabel seperti itu dikompilasi, maka mereka mengatakan bahwa permainan G telah direduksi menjadi bentuk matriks (dengan sendirinya, membawa permainan ke bentuk seperti itu sudah menjadi tugas yang sulit, dan terkadang hampir tidak mungkin, karena banyaknya variasi. strategi).

Perhatikan bahwa jika permainan direduksi menjadi bentuk matriks, maka permainan multi-gerakan sebenarnya direduksi menjadi permainan satu gerakan - pemain hanya perlu melakukan satu gerakan: memilih strategi.

Kekurangan teori permainan.

1. Pertama, dalam praktiknya, konflik yang sangat antagonis tidak begitu umum - kecuali dalam permainan nyata (catur, catur, kartu). Di luar situasi-situasi yang dibuat-buat ini, di mana satu pihak berupaya sekuat tenaga untuk memaksimalkan keuntungan, dan pihak lainnya berupaya meminimalkan, konflik-konflik seperti itu hampir tidak pernah terjadi.

2. Kelemahan kedua adalah mengenai konsep “strategi campuran”. Jika kita menghadapi situasi berulang di mana masing-masing pihak dapat dengan mudah (tanpa biaya tambahan) memvariasikan perilakunya dari kasus ke kasus, strategi campuran yang optimal memang dapat meningkatkan hasil rata-rata. Namun ada situasi ketika hanya satu keputusan yang perlu diambil (misalnya, memilih rencana untuk membangun sistem benteng pertahanan). Apakah bijaksana untuk “menyerahkan pilihan Anda pada kebetulan” - secara kasar, melempar koin, dan jika lambang muncul, pilih opsi pertama dari rencana tersebut, dan jika unggul, pilih yang kedua? Kecil kemungkinannya akan ada seorang pemimpin yang, dalam situasi yang kompleks dan bertanggung jawab, akan memutuskan untuk membuat pilihan secara acak, meskipun hal ini mengikuti teori permainan.

3. Ketiga, dalam teori permainan diyakini bahwa setiap pemain mengetahui semua kemungkinan strategi musuh. Satu-satunya yang tidak diketahui adalah yang mana yang akan dia gunakan dalam game ini. Dalam konflik nyata, hal ini biasanya tidak terjadi: daftar kemungkinan strategi musuh tidak diketahui secara pasti, dan solusi terbaik dalam situasi konflik sering kali adalah melampaui batas strategi yang diketahui musuh, dengan “menyetrum” dia dengan sesuatu yang benar-benar baru dan tidak terduga.

Seperti yang Anda lihat, teori permainan memiliki banyak kelemahan. Tetapi teori permainan berharga terutama karena perumusan masalah, yang mengajarkan, ketika memilih solusi dalam situasi konflik, untuk tidak melupakan apa yang dipikirkan musuh, dan memperhitungkan kemungkinan trik dan triknya.

Tentu saja teori ini harus digunakan, namun kesimpulan yang timbul dari model ini tidak boleh dianggap final dan tidak dapat disangkal.

Teori keputusan statistik

Ide dan metode yang mirip dengan teori permainan adalah teori keputusan statistik. Hal ini berbeda dengan teori permainan karena situasi yang tidak pasti tidak memiliki nuansa konflik - tidak ada yang menentang siapa pun , tapi ada unsur ketidakpastian.

Dalam situasi ini, kondisi yang tidak menentu tidak bergantung pada pesaing yang bertindak secara sadar, melainkan pada realitas obyektif, yang dalam teori keputusan statistik biasa disebut “alam”. Situasi terkait disebut “permainan dengan alam.” Namun tidak adanya musuh yang bertindak secara sadar tidak hanya tidak menyederhanakan situasi, namun sebaliknya, memperumitnya.

Karena kita sedang mempertimbangkan kasus “ketidakpastian yang buruk”, ketika probabilitas keadaan alamiah tidak ada sama sekali atau bahkan tidak dapat diperkirakan secara perkiraan, bagaimana kita harus melanjutkannya?

Situasinya tidak menguntungkan untuk membuat keputusan yang "baik" - mari kita coba menemukan setidaknya satu keputusan yang bukan yang terburuk. Itu semua tergantung pada sudut pandang situasi, pada posisi peneliti, pada masalah apa yang mengancam pilihan yang buruk.

Oleh karena itu, dalam hal ini ada beberapa kriteria dalam memilih solusi:

1. maksimal - ini kriteria menemukan alternatif yang memaksimalkan keluaran atau konsekuensi maksimum untuk setiap alternatif.

Kita mencari keluaran maksimum dalam setiap alternatif dan kemudian memilih alternatif dengan nilai maksimum. Karena kriteria keputusan ini terletak pada alternatif yang mempunyai kemungkinan hasil tertinggi, maka dapat disebut kriteria optimis solusi.

2. maksimal – Kriteria ini mencari alternatif yang memaksimalkan output atau konsekuensi minimum untuk setiap alternatif, yaitu pertama-tama kita mencari output minimum dalam setiap alternatif, kemudian memilih alternatif yang memiliki nilai maksimum.

maksimal – ini adalah jaminan kemenangan Anda, yaitu harga permainan terendah. Anda tidak bisa mendapatkan yang lebih rendah dari nilai ini, tetapi Anda bisa mendapatkan yang lebih tinggi.

Ini adalah kemenangan maksimal Anda dari kemungkinan minimum. Karena kriteria keputusan ini memungkinkan kita menemukan alternatif dengan kemungkinan kerugian sekecil mungkin, maka kriteria tersebut dapat disebut kriteria keputusan pesimis atau kriteria Wald. Menurut kriteria ini, permainan dengan alam dimainkan dengan lawan yang masuk akal, dan terlebih lagi, agresif, melakukan segala sesuatu untuk mencegah kita mencapai kesuksesan.

Kriteria Wald ( maksimal A aku j . ) adalah kriteria pesimisme ekstrem dan maknanya adalah berfokus pada kondisi yang lebih buruk, dengan mengetahui secara pasti bahwa kondisi tersebut tidak akan menjadi lebih buruk.

Jika kita berpedoman pada kriteria ini, yang melambangkan “posisi pesimisme ekstrim”, kita harus selalu fokus pada kondisi terburuk, dengan mengetahui dengan pasti bahwa kondisi tersebut tidak akan menjadi lebih buruk.

3. Minimaks adalah kriteria yang mencari alternatif-alternatif yang meminimalkan keluaran atau konsekuensi maksimum dari setiap alternatif, yaitu pertama-tama kita mencari keluaran maksimum dalam setiap alternatif kemudian memilih alternatif yang memiliki nilai minimum.

Ini adalah kemenangan minimum Anda dari kemungkinan maksimum. Strategi yang dipilih adalah yang meminimalkan risiko dalam kondisi terburuk.

Kriteria ini disebut juga kriteria risiko minimax Savage.

Kriteria buas ( menit maks A aku j ) juga sangat pesimistis, tetapi ketika memilih strategi yang optimal, ia tidak fokus pada kemenangan, tetapi pada risiko.

Inti dari pendekatan ini adalah untuk menghindari risiko besar dengan segala cara ketika mengambil keputusan.

4. Kriteria yang sama kemungkinannya – Kriteria keputusan ini mencari alternatif dengan rata-rata output tertinggi.

Pertama-tama kita menghitung rata-rata keluaran untuk setiap alternatif, yaitu jumlah seluruh hasil dibagi dengan jumlah hasil. Kemudian kita pilih alternatif yang mempunyai nilai maksimum. Pendekatan ekiprobabilitas mengasumsikan bahwa peluang terjadinya keadaan alamiah adalah sama dan oleh karena itu setiap keadaan alam mempunyai kemungkinan yang sama.

Sebagai hasil dari mempelajari bab ini, siswa harus:

tahu

Konsep permainan berdasarkan prinsip dominasi, keseimbangan Nash, apa itu induksi mundur, dll; pendekatan konseptual penyelesaian permainan, makna konsep rasionalitas dan keseimbangan dalam kerangka strategi interaksi;

mampu untuk

Membedakan permainan dalam bentuk yang strategis dan rinci, membangun “pohon permainan”; merumuskan model permainan persaingan untuk berbagai jenis pasar;

memiliki

Metode untuk menentukan hasil permainan.

Permainan: konsep dan prinsip dasar

Upaya pertama untuk menciptakan teori permainan matematika dilakukan pada tahun 1921 oleh E. Borel. Sebagai bidang ilmu yang independen, teori permainan pertama kali disajikan secara sistematis dalam monografi oleh J. von Neumann dan O. Morgenstern “Teori Permainan dan Perilaku Ekonomi” pada tahun 1944. Sejak itu, banyak cabang teori ekonomi (misalnya teori permainan persaingan tidak sempurna, teori insentif ekonomi, dll.) .) dikembangkan dalam kontak erat dengan teori permainan. Teori permainan juga berhasil digunakan dalam ilmu-ilmu sosial (misalnya analisis prosedur pemungutan suara, pencarian konsep keseimbangan yang menentukan perilaku kooperatif dan non-kooperatif individu). Para pemilih biasanya lebih memilih kandidat yang mewakili sudut pandang ekstrem, namun terjadi perselisihan ketika memilih salah satu dari dua kandidat yang menawarkan kompromi berbeda. Bahkan gagasan Rousseau tentang evolusi dari "kebebasan alami" ke "kebebasan sipil" secara formal sesuai, dari sudut pandang teori permainan, dengan sudut pandang kerja sama.

Permainan merupakan model matematis yang diidealkan dari perilaku kolektif beberapa individu (pemain) yang kepentingannya berbeda sehingga menimbulkan konflik. Konflik tidak serta merta menyiratkan adanya kontradiksi antagonistik antar pihak, namun selalu dikaitkan dengan semacam perselisihan. Situasi konflik akan bersifat antagonis jika peningkatan kemenangan salah satu pihak sebesar tertentu menyebabkan penurunan kemenangan pihak lain dengan jumlah yang sama dan sebaliknya. Antagonisme kepentingan menimbulkan konflik, dan kebetulan kepentingan mereduksi permainan menjadi koordinasi tindakan (kerjasama).

Contoh situasi konflik adalah situasi yang timbul dalam hubungan antara pembeli dan penjual; dalam kondisi persaingan antar perusahaan yang berbeda; selama operasi tempur, dll. Contoh permainan adalah permainan biasa: catur, catur, kartu, permainan ruang tamu, dll. (karena itulah dinamakan “teori permainan” dan terminologinya).

Dalam sebagian besar permainan yang muncul dari analisis situasi keuangan, ekonomi, dan manajemen, kepentingan para pemain (pihak-pihak) tidak sepenuhnya bertentangan atau sepenuhnya sejalan. Pembeli dan penjual sepakat bahwa merupakan kepentingan bersama untuk menyepakati pembelian dan penjualan, namun mereka bernegosiasi dengan penuh semangat mengenai harga tertentu dalam batas keuntungan bersama.

Teori permainan adalah teori matematika tentang situasi konflik.

Permainan ini berbeda dari konflik nyata karena dimainkan menurut aturan tertentu. Aturan-aturan ini menetapkan urutan gerakan, jumlah informasi yang dimiliki masing-masing pihak tentang perilaku pihak lain, dan hasil permainan bergantung pada situasi saat ini. Peraturan juga menetapkan akhir permainan ketika rangkaian gerakan tertentu telah dilakukan, dan tidak ada lagi gerakan yang diperbolehkan.

Teori permainan, seperti model matematika lainnya, memiliki keterbatasan. Salah satunya adalah asumsi kecerdasan lawan yang utuh (ideal). Dalam konflik nyata, sering kali strategi terbaik adalah menebak kebodohan musuh dan menggunakan kebodohan itu untuk keuntungan Anda.

Kelemahan lain dari teori permainan adalah bahwa setiap pemain harus mengetahui semua kemungkinan tindakan (strategi) lawan, hanya saja tidak diketahui tindakan mana yang akan ia gunakan dalam permainan tertentu. Dalam konflik nyata, hal ini biasanya tidak terjadi: daftar semua kemungkinan strategi musuh tidak diketahui secara pasti, dan solusi terbaik dalam situasi konflik sering kali adalah melampaui strategi yang diketahui musuh, untuk “menyetrum” dia dengan sesuatu yang benar-benar baru, tidak terduga.

Teori permainan tidak memasukkan unsur-unsur risiko yang pasti menyertai keputusan-keputusan yang masuk akal dalam konflik-konflik nyata. Ini menentukan perilaku reasuransi yang paling hati-hati dari pihak-pihak yang berkonflik.

Selain itu, dalam teori permainan, strategi optimal ditemukan berdasarkan satu indikator (kriteria). Dalam situasi praktis, sering kali perlu mempertimbangkan bukan hanya satu, tetapi beberapa kriteria numerik. Strategi yang optimal untuk satu indikator belum tentu optimal untuk indikator lainnya.

Dengan menyadari keterbatasan ini dan oleh karena itu tidak begitu saja mengikuti rekomendasi yang diberikan oleh teori permainan, masih mungkin untuk mengembangkan strategi yang sepenuhnya dapat diterima untuk banyak situasi konflik di kehidupan nyata.

Saat ini, penelitian ilmiah sedang dilakukan yang bertujuan untuk memperluas bidang penerapan teori permainan.

Definisi unsur-unsur pembentuk permainan berikut ini terdapat dalam literatur.

Pemain- ini adalah subjek yang terlibat dalam interaksi, disajikan dalam bentuk permainan. Dalam kasus kami, mereka adalah rumah tangga, perusahaan, dan pemerintah. Namun, dalam kasus ketidakpastian keadaan eksternal, akan lebih mudah untuk merepresentasikan komponen acak permainan, terlepas dari perilaku para pemain, sebagai tindakan “alam”.

Aturan mainnya. Aturan permainan mengacu pada serangkaian tindakan atau gerakan yang tersedia bagi pemain. Dalam hal ini, tindakannya bisa sangat beragam: keputusan pembeli tentang volume barang atau jasa yang dibeli; perusahaan - berdasarkan volume produksi; besarnya pajak yang ditetapkan pemerintah.

Menentukan hasil (hasil) permainan. Untuk setiap kombinasi tindakan pemain, hasil permainan ditentukan hampir secara mekanis. Hasilnya dapat berupa: komposisi keranjang konsumen, vektor output perusahaan, atau serangkaian indikator kuantitatif lainnya.

Kemenangan. Arti dari konsep menang mungkin berbeda-beda untuk berbagai jenis permainan. Dalam hal ini, perlu dibedakan dengan jelas antara keuntungan yang diukur pada skala ordinal (misalnya, tingkat utilitas) dan nilai yang perbandingan intervalnya masuk akal (misalnya, keuntungan, tingkat kesejahteraan).

Informasi dan harapan. Ketidakpastian dan informasi yang terus berubah dapat berdampak sangat serius pada kemungkinan hasil suatu interaksi. Oleh karena itu, peran informasi dalam perkembangan game perlu diperhatikan. Dalam hal ini, konsep tersebut mengemuka kumpulan informasi pemain, yaitu totalitas semua informasi tentang keadaan permainan yang dia miliki pada momen-momen penting.

Saat mempertimbangkan akses pemain terhadap informasi, gagasan intuitif tentang pengetahuan bersama, atau publisitas, maksudnya sebagai berikut: suatu fakta diketahui secara umum jika semua pemain mengetahuinya dan semua pemain mengetahui bahwa pemain lain juga mengetahuinya.

Untuk kasus dimana penerapan konsep pengetahuan umum saja tidak cukup, maka digunakanlah konsep individu harapan peserta - gagasan tentang bagaimana situasi permainan pada tahap ini.

Dalam teori permainan, diasumsikan bahwa suatu permainan terdiri dari bergerak, dilakukan oleh pemain secara bersamaan atau berurutan.

Gerakan bersifat pribadi dan acak. Gerakan itu disebut pribadi, jika pemain secara sadar memilihnya dari serangkaian kemungkinan tindakan dan melaksanakannya (misalnya, gerakan apa pun dalam permainan catur). Gerakan itu disebut acak, jika pilihannya dibuat bukan oleh pemain, tetapi melalui mekanisme pemilihan acak (misalnya, berdasarkan hasil pelemparan koin).

Himpunan gerak yang dilakukan pemain dari awal sampai akhir permainan disebut berpesta.

Salah satu konsep dasar teori permainan adalah konsep strategi. Strategi Seorang pemain adalah seperangkat aturan yang menentukan pilihan tindakan untuk setiap gerakan pribadi, tergantung pada situasi yang muncul selama permainan. Dalam permainan sederhana (satu gerakan), ketika seorang pemain hanya dapat melakukan satu gerakan dalam setiap permainan, konsep strategi dan kemungkinan tindakan akan terjadi bersamaan. Dalam hal ini, serangkaian strategi pemain mencakup semua kemungkinan tindakannya, dan segala kemungkinan yang dilakukan pemain Saya tindakan adalah strateginya. Dalam kompleks (permainan multi-putaran), konsep “pilihan tindakan yang mungkin” dan “strategi” mungkin berbeda satu sama lain.

Strategi pemain disebut optimal, jika hal tersebut memberikan pemain tertentu pengulangan permainan yang rata-rata kemenangan maksimum yang mungkin atau kerugian rata-rata minimum yang mungkin, terlepas dari strategi apa yang digunakan lawan. Kriteria optimalitas lainnya dapat digunakan.

Ada kemungkinan bahwa strategi yang memberikan keuntungan maksimal tidak memiliki representasi optimalitas penting lainnya, seperti stabilitas (keseimbangan) solusi. Solusi dari permainan ini adalah berkelanjutan(keseimbangan) jika strategi yang sesuai dengan keputusan ini membentuk situasi yang tidak ada pemain yang tertarik untuk mengubahnya.

Mari kita ulangi bahwa tugas teori permainan adalah menemukan strategi yang optimal.

Klasifikasi permainan disajikan pada Gambar. 8.1.

  • 1. Tergantung pada jenis gerakannya, permainan dibagi menjadi strategis dan perjudian. Berjudi permainan hanya terdiri dari gerakan acak, yang tidak dibahas dalam teori permainan. Jika, bersama dengan gerakan acak, ada gerakan pribadi atau semua gerakan bersifat pribadi, maka permainan seperti itu disebut strategis.
  • 2. Tergantung pada jumlah pemain, permainan dibagi menjadi permainan ganda dan ganda. DI DALAM permainan ganda jumlah pesertanya dua, masuk banyak- lebih dari dua.
  • 3. Peserta dalam permainan ganda dapat membentuk koalisi, baik permanen maupun sementara. Berdasarkan sifat hubungan antar pemainnya, permainan dibedakan menjadi non-koalisi, koalisi, dan kooperatif.

Non-koalisi Ini adalah permainan di mana pemain tidak mempunyai hak untuk membuat perjanjian atau membentuk koalisi, dan tujuan setiap pemain adalah memperoleh kemenangan individu sebesar mungkin.

Permainan yang tindakan para pemainnya ditujukan untuk memaksimalkan kemenangan kelompok (koalisi) tanpa pembagian selanjutnya antar pemain disebut koalisi.

Beras. 8.1.

Hasilnya kooperatif Permainan ini merupakan pembagian kemenangan koalisi, yang timbul bukan sebagai akibat dari tindakan tertentu para pemainnya, melainkan sebagai akibat dari kesepakatan yang telah mereka tentukan sebelumnya.

Sejalan dengan itu, dalam permainan kooperatif, yang dibandingkan berdasarkan preferensi bukanlah situasi, seperti halnya dalam permainan non-kooperatif, melainkan pembagian; dan perbandingan ini tidak sebatas mempertimbangkan kemenangan individu, namun lebih kompleks.

  • 4. Menurut jumlah strategi masing-masing pemain, permainan dibagi menjadi terakhir(jumlah strategi untuk setiap pemain terbatas) dan tak ada habisnya(rangkaian strategi untuk setiap pemain tidak terbatas).
  • 5. Menurut jumlah informasi yang tersedia bagi pemain mengenai gerakan masa lalu, permainan dibagi menjadi permainan dengan informasi lengkap(semua informasi tentang gerakan sebelumnya tersedia) dan informasi yang tidak lengkap. Contoh permainan yang informasinya lengkap antara lain catur, catur, dll.
  • 6. Berdasarkan uraian jenis permainannya, dibedakan menjadi permainan posisi (atau permainan dalam bentuk diperluas) dan permainan dalam bentuk normal. Permainan posisi diberikan dalam bentuk pohon permainan. Tapi permainan posisi apa pun bisa dikurangi menjadi bentuk biasa, di mana setiap pemain hanya melakukan satu gerakan independen. Dalam permainan posisi, gerakan dilakukan pada saat-saat tertentu. Ada permainan diferensial, dimana gerakan dilakukan terus menerus. Permainan ini mempelajari masalah pengejaran suatu benda yang dikendalikan oleh benda lain yang dikendalikan, dengan memperhatikan dinamika perilakunya, yang digambarkan dengan persamaan diferensial.

ada juga permainan reflektif, yang mempertimbangkan situasi dengan mempertimbangkan reproduksi mental dari kemungkinan tindakan dan perilaku musuh.

7. Jika ada kemungkinan permainan dari suatu permainan yang jumlah kemenangannya nol N pemain(), lalu kita bicarakan permainan jumlah nol. Kalau tidak, permainannya disebut permainan dengan jumlah bukan nol.

Jelas sekali, permainan pasangan zero-sum adalah bermusuhan, karena keuntungan satu pemain sama dengan kerugian pemain kedua, dan oleh karena itu, tujuan para pemain ini berbanding terbalik.

Permainan pasangan zero-sum berhingga disebut permainan matriks. Permainan seperti itu dijelaskan oleh matriks pembayaran yang menentukan kemenangan pemain pertama. Nomor baris matriks sesuai dengan nomor strategi yang diterapkan pemain pertama, kolom – nomor strategi yang diterapkan pemain kedua; pada perpotongan baris dan kolom terdapat keuntungan yang sesuai dari pemain pertama (kekalahan pemain kedua).

Permainan jumlah bukan nol yang berhingga disebut permainan bimatriks. Permainan seperti itu dijelaskan oleh dua matriks pembayaran, masing-masing untuk pemain yang bersesuaian.

Mari kita ambil contoh berikut. Permainan "Tes". Biarkan pemain 1 menjadi siswa yang mempersiapkan ujian, dan pemain 2 menjadi guru yang mengerjakan ujian. Kita asumsikan siswa mempunyai dua strategi: A1 – mempersiapkan diri dengan baik untuk ujian; A 2 – tidak siap. Guru juga mempunyai dua strategi: B1 – memberikan tes; B 2 – jangan memberi penghargaan. Dasar penilaian nilai imbalan pemain dapat didasarkan, misalnya, pada pertimbangan berikut yang tercermin dalam matriks imbalan:

Permainan ini sesuai dengan klasifikasi di atas bersifat strategis, berpasangan, non-kooperatif, terbatas, dijelaskan dalam bentuk normal, dengan jumlah bukan nol. Lebih singkatnya, game ini bisa disebut bimatrix.

Tugasnya adalah menentukan strategi yang optimal bagi siswa dan guru.

Contoh lain dari permainan bimatrix terkenal "Dilema Tahanan".

Masing-masing dari dua pemain memiliki dua strategi: A 2 dan B 2 – strategi perilaku agresif, a A saya dan B i – perilaku damai. Mari kita asumsikan bahwa "perdamaian" (kedua pemain bersifat damai) lebih baik bagi kedua pemain daripada "perang". Kasus ketika satu pemain agresif dan pemain lainnya damai lebih menguntungkan bagi agresor. Biarkan matriks pembayaran pemain 1 dan 2 dalam permainan bimatrix ini berbentuk

Bagi kedua pemain, strategi agresif A2 dan B2 mendominasi strategi damai A dan B v Jadi, satu-satunya keseimbangan dalam strategi dominan adalah (A2, B 2), yaitu Ada anggapan bahwa akibat dari perilaku non-kooperatif adalah perang. Pada saat yang sama, hasil (A1, B1) (dunia) memberikan imbalan yang lebih besar bagi kedua pemain. Dengan demikian, perilaku egoistik non-kooperatif bertentangan dengan kepentingan kolektif. Kepentingan kolektif menentukan pilihan strategi damai. Pada saat yang sama, jika para pemain tidak bertukar informasi, kemungkinan besar akan terjadi perang.

Dalam hal ini, situasi (A1, B1) adalah Pareto optimal. Namun situasi ini tidak stabil sehingga membuka kemungkinan pemain melanggar kesepakatan yang telah ditetapkan. Memang benar, jika pemain pertama melanggar perjanjian, tetapi pemain kedua tidak, maka bayaran pemain pertama akan bertambah menjadi tiga, dan pemain kedua akan turun menjadi nol, dan sebaliknya. Selain itu, setiap pemain yang tidak melanggar perjanjian akan rugi lebih banyak jika pemain kedua melanggar perjanjian dibandingkan jika keduanya melanggar perjanjian.

Ada dua bentuk utama permainan. Permainan dari bentuk yang luas disajikan sebagai diagram pohon pengambilan keputusan, dengan “akar” yang sesuai dengan titik awal permainan, dan awal dari setiap “cabang” baru, yang disebut simpul,– keadaan yang dicapai pada tahap ini dengan tindakan yang telah diambil oleh para pemain. Setiap simpul akhir—setiap titik akhir permainan—diberikan vektor pembayaran, satu komponen untuk setiap pemain.

Strategis, sebaliknya disebut biasa, bentuk Representasi permainan sesuai dengan matriks multidimensi, dengan setiap dimensi (dalam kasus dua dimensi, baris dan kolom) mencakup serangkaian tindakan yang mungkin untuk satu agen.

Sel terpisah dari matriks berisi vektor pembayaran yang sesuai dengan kombinasi strategi pemain tertentu.

Pada Gambar. 8.2 menunjukkan bentuk permainan yang luas, dan tabel. 8.1 – bentuk strategis.

Beras. 8.2.

Tabel 8.1. Permainan dengan pengambilan keputusan secara simultan dalam bentuk yang strategis

Terdapat klasifikasi yang cukup rinci tentang komponen teori permainan. Salah satu kriteria paling umum untuk klasifikasi tersebut adalah pembagian teori permainan menjadi teori permainan non-kooperatif, yang subjek pengambilan keputusannya adalah individu itu sendiri, dan teori permainan kooperatif, yang subjek pengambilan keputusannya adalah individu. -pembuatan adalah kelompok atau koalisi individu.

Permainan non kooperatif biasanya disajikan dalam bentuk normal (strategis) dan diperluas (ekstensif).

  • Vorobyov N.Sejarah pertemuanVorobyov N. N. Teori permainan untuk ahli eko-siberetik. M.: Nauka, 1985.
  • Ventzel E.S. Operasi pencarian. M.: Nauka, 1980.

Institusi pendidikan kota
sekolah menengah No.___

distrik perkotaan - kota Volzhsky, wilayah Volgograd

Konferensi kota karya kreatif dan penelitian mahasiswa

"Matematika untuk Kehidupan"

Arah ilmiah – matematika

“Teori permainan dan penerapan praktisnya”

siswa kelas 9b

Sekolah menengah lembaga pendidikan kota No.2

Penasihat ilmiah:

guru matematika N.D. Grigorieva



Perkenalan

Relevansi topik yang dipilih ditentukan oleh luasnya penerapannya. Teori permainan memainkan peran sentral dalam teori organisasi industri, teori kontrak, teori keuangan perusahaan, dan banyak bidang lainnya. Bidang penerapan teori permainan tidak hanya mencakup disiplin ilmu ekonomi, tetapi juga biologi, ilmu politik, ilmu militer, dll.

Tujuan Proyek ini bertujuan untuk mengembangkan studi tentang jenis permainan yang ada, serta kemungkinan penerapan praktisnya di berbagai industri.

Tujuan proyek telah menentukan tugasnya:

Mengenal sejarah asal usul teori permainan;

Mendefinisikan konsep dan esensi teori permainan;

Jelaskan jenis-jenis permainan utama;

Pertimbangkan kemungkinan penerapan teori ini dalam praktik.

Objek dari proyek ini adalah teori permainan.

Subyek kajiannya adalah esensi dan penerapan teori permainan dalam praktik.

Dasar teori untuk menulis karya ini adalah literatur ekonomi dari penulis seperti J. von Neumann, Owen G., Vasin A.A., Morozov V.V., Zamkov O.O., Tolstopyatenko A.V., Cheremnykh Yu.N.

1. Pengantar Teori Permainan

1.1 Sejarah

Permainan, sebagai bentuk khusus dari aktivitas pertunjukan, muncul sejak dahulu kala. Penggalian arkeologi mengungkap benda-benda yang digunakan untuk permainan tersebut. Lukisan batu menunjukkan kepada kita tanda-tanda pertama permainan taktis antar suku. Seiring berjalannya waktu, permainan tersebut berkembang dan mencapai bentuk konflik yang biasa antara beberapa pihak. Hubungan kekeluargaan antara bermain dan kegiatan praktis menjadi kurang terlihat, dan bermain berubah menjadi kegiatan khusus masyarakat.

Jika sejarah permainan catur atau kartu dimulai beberapa ribu tahun yang lalu, maka sketsa pertama teori tersebut baru muncul tiga abad yang lalu dalam karya Bernoulli. Pada awalnya, karya Poincaré dan Borel memberi kita sebagian informasi tentang sifat teori permainan, dan hanya karya mendasar J. von Neumann dan O. Morgenstern yang memberi kita seluruh integritas dan keserbagunaan cabang ilmu ini.

Momen lahirnya teori permainan dianggap sebagai monografi karya J. Neumann dan O. Morgenstern “Teori Permainan dan Perilaku Ekonomi”. Setelah diterbitkan pada tahun 1944, banyak ilmuwan memperkirakan akan terjadi revolusi dalam ilmu ekonomi berkat pendekatan baru ini. Teori ini menggambarkan perilaku pengambilan keputusan rasional dalam situasi yang saling terkait, membantu memecahkan banyak masalah mendesak di berbagai bidang ilmu pengetahuan. Monograf tersebut menekankan bahwa perilaku strategis, persaingan, kerjasama, risiko dan ketidakpastian merupakan elemen utama dalam teori permainan dan berkaitan langsung dengan masalah manajemen.

Karya awal teori permainan ditandai dengan kesederhanaan asumsinya, sehingga kurang cocok untuk penggunaan praktis. Selama 10-15 tahun terakhir, situasinya telah berubah secara dramatis. Kemajuan di bidang industri telah menunjukkan keberhasilan metode permainan dalam kegiatan terapan.

Baru-baru ini, metode ini telah merambah ke dalam praktik manajemen. Perlu dicatat bahwa pada akhir abad ke-20, M. Porter memperkenalkan beberapa konsep teori, seperti “langkah strategis” dan “pemain”, yang kemudian menjadi salah satu konsep utama.

Saat ini, pentingnya teori permainan telah meningkat secara signifikan di banyak bidang ilmu ekonomi dan sosial. Di bidang ekonomi, ini berlaku tidak hanya untuk menyelesaikan berbagai masalah yang memiliki kepentingan ekonomi secara umum, tetapi juga untuk menganalisis masalah strategis perusahaan, mengembangkan struktur manajemen dan sistem insentif.

Pada tahun 1958-1959 pada tahun 1965-1966 Sekolah teori permainan Soviet diciptakan, yang ditandai dengan konsentrasi upaya di bidang permainan zero-sum dan penerapan militer yang ketat. Awalnya, hal ini menyebabkan ketertinggalan dari sekolah Amerika, karena pada saat itu penemuan-penemuan utama dalam permainan antagonis sudah dibuat. Di Uni Soviet, ahli matematika hingga pertengahan tahun 1970-an. tidak diperbolehkan masuk ke bidang manajemen dan perekonomian. Dan bahkan ketika sistem ekonomi Soviet mulai runtuh, ekonomi tidak menjadi fokus utama penelitian teori permainan. Lembaga khusus yang pernah dan saat ini terlibat dalam teori permainan adalah Institut Analisis Sistem dari Akademi Ilmu Pengetahuan Rusia.

1.2 Definisi teori permainan

Teori permainan adalah metode matematika untuk mempelajari strategi optimal dalam permainan. Permainan adalah suatu proses di mana dua pihak atau lebih berpartisipasi, berjuang untuk mewujudkan kepentingan mereka. Masing-masing pihak memiliki tujuannya masing-masing dan menggunakan strategi tertentu yang dapat menghasilkan menang atau kalah, tergantung pada perilakunya dan perilaku pemain lain. Teori permainan membantu memilih strategi yang paling menguntungkan, dengan mempertimbangkan pertimbangan peserta lain, sumber daya mereka, dan tindakan yang dimaksudkan.

Teori ini merupakan salah satu cabang matematika yang mempelajari situasi konflik.

Bagaimana cara membagi kue agar semua anggota keluarga menganggapnya adil? Bagaimana cara menyelesaikan perselisihan upah antara klub olahraga dan serikat pemain? Bagaimana cara mencegah perang harga saat lelang? Ini hanyalah tiga contoh masalah yang ditangani oleh salah satu bidang utama ilmu ekonomi - teori permainan

Cabang ilmu ini menganalisis konflik dengan menggunakan metode matematika. Teori ini mendapat namanya karena contoh konflik yang paling sederhana adalah permainan (misalnya catur atau tic-tac-toe). Baik dalam permainan maupun konflik, setiap pemain memiliki tujuannya masing-masing dan berusaha mencapainya dengan membuat keputusan strategis yang berbeda.

1.3 Jenis situasi konflik

Salah satu ciri khas dari setiap fenomena sosial, sosial ekonomi adalah banyaknya dan beragamnya kepentingan, serta adanya pihak-pihak yang mampu mengungkapkan kepentingan tersebut. Contoh klasik di sini adalah situasi ketika, di satu sisi, ada satu pembeli, di sisi lain, ada penjual, ketika beberapa produsen memasuki pasar dengan kekuatan yang cukup untuk mempengaruhi harga suatu produk. Situasi yang lebih kompleks muncul ketika terdapat asosiasi atau kelompok individu yang terlibat dalam konflik kepentingan, misalnya ketika tingkat upah ditentukan oleh serikat pekerja atau asosiasi pekerja dan pengusaha, ketika menganalisis hasil pemungutan suara di parlemen, dan sebagainya.

Konflik juga dapat muncul karena perbedaan tujuan yang mencerminkan kepentingan berbagai pihak, namun juga kepentingan multilateral satu orang yang sama. Misalnya, pembuat kebijakan ekonomi biasanya mengejar tujuan yang berbeda, merekonsiliasi tuntutan-tuntutan yang bertentangan dengan situasi tersebut (meningkatkan volume produksi, meningkatkan pendapatan, mengurangi beban lingkungan, dll.). Konflik dapat memanifestasikan dirinya tidak hanya sebagai akibat dari tindakan sadar dari berbagai partisipan, tetapi juga sebagai akibat dari tindakan “kekuatan spontan” tertentu (kasus yang disebut “permainan dengan alam”)

Permainan adalah model matematika untuk menggambarkan suatu konflik.

Permainan adalah objek matematika yang didefinisikan secara ketat. Sebuah permainan dibentuk oleh para pemain, serangkaian strategi untuk setiap pemain, dan imbalan atau imbalan para pemain untuk setiap kombinasi strategi.

Dan terakhir, contoh permainan adalah permainan biasa: permainan ruang tamu, permainan olahraga, permainan kartu, dll. Teori permainan matematika dimulai dengan analisis permainan tersebut; sampai hari ini mereka berfungsi sebagai bahan yang sangat baik untuk menggambarkan pernyataan dan kesimpulan teori ini. Permainan-permainan ini masih relevan hingga saat ini.

Jadi, setiap model matematika dari suatu fenomena sosio-ekonomi pasti memiliki ciri-ciri konflik yang melekat, yaitu. menggambarkan:

a) banyak pemangku kepentingan. Jika jumlah pemain terbatas (tentu saja), mereka dibedakan berdasarkan nomor atau nama yang diberikan kepada mereka;

b) kemungkinan tindakan masing-masing pihak, disebut juga strategi atau gerakan;

c) kepentingan para pihak yang diwakili oleh fungsi payoff (pembayaran) bagi masing-masing pemain.

Dalam teori permainan, diasumsikan bahwa fungsi pembayaran dan serangkaian strategi yang tersedia untuk setiap pemain telah diketahui secara umum, yaitu. Setiap pemain mengetahui fungsi pembayarannya sendiri dan serangkaian strategi yang dimilikinya, serta fungsi pembayaran dan strategi semua pemain lainnya, dan membentuk perilakunya sesuai dengan informasi ini.

2 Jenis permainan

2.1 Dilema narapidana

Salah satu contoh teori permainan yang paling terkenal dan klasik, yang turut mempopulerkannya, adalah dilema tahanan. Dalam teori permainan dilema tahanan(nama "lebih jarang digunakan" dilema bandit") adalah permainan non-kooperatif di mana para pemain berusaha mendapatkan keuntungan, dan mereka bekerja sama atau mengkhianati satu sama lain. Seperti dalam semua hal teori permainan , diasumsikan bahwa pemain memaksimalkan, yaitu meningkatkan kemenangannya sendiri, tanpa mempedulikan keuntungan orang lain.

Mari kita pertimbangkan situasi ini. Dua tersangka sedang diselidiki. Investigasi tidak memiliki cukup bukti, sehingga setelah membagi tersangka, masing-masing ditawari kesepakatan. Jika salah satu dari mereka tetap bungkam dan yang lain bersaksi melawannya, maka yang pertama akan menerima hukuman 10 tahun, dan yang kedua akan dibebaskan karena membantu penyelidikan. Jika keduanya diam saja, maka mereka mendapat hukuman 6 bulan. Terakhir, jika keduanya saling menggadaikan, maka mendapat waktu 2 tahun. Pertanyaannya adalah: pilihan apa yang akan mereka ambil?

Tabel 1 – Matriks pembayaran dalam permainan “Dilema Tahanan”

Anggap saja keduanya adalah orang rasional yang ingin meminimalkan kerugiannya. Lalu yang pertama bisa beralasan seperti ini: kalau yang kedua menggadaikan saya, lebih baik saya menggadaikannya juga: begini kita mendapat masing-masing 2 tahun, kalau tidak saya akan mendapat 10 tahun. Tetapi jika orang kedua tidak menggadaikan saya, maka lebih baik saya menggadaikannya - maka mereka akan segera melepaskan saya. Oleh karena itu, apa pun yang dilakukan orang lain, lebih menguntungkan bagi saya untuk menggadaikannya. Yang kedua juga memahami bahwa bagaimanapun juga, lebih baik dia meletakkan yang pertama. Hasilnya, keduanya mendapat hukuman dua tahun. Meskipun jika mereka tidak bersaksi melawan satu sama lain, mereka hanya akan menerima hukuman 6 bulan.

Dalam dilema tahanan, pengkhianatan sangat mendominasi atas kerjasama, jadi satu-satunya keseimbangan yang mungkin adalah pengkhianatan kedua pihak. Sederhananya, tidak peduli apa yang dilakukan pemain lain, semua orang akan menang lebih banyak jika mereka berkhianat. Karena dalam situasi apa pun lebih menguntungkan berkhianat daripada bekerja sama, semua pemain rasional akan memilih pengkhianatan.

Meskipun secara individu berperilaku rasional, secara bersama-sama para peserta mengambil keputusan yang tidak rasional. Di sinilah letak dilemanya.

Konflik-konflik seperti dilema ini sering terjadi dalam kehidupan, misalnya dalam bidang ekonomi (menentukan anggaran periklanan), politik (perlombaan senjata), olahraga (penggunaan steroid). Oleh karena itu, dilema tahanan dan prediksi menyedihkan teori permainan menjadi dikenal luas, dan bekerja di bidang teori permainan adalah satu-satunya kesempatan bagi seorang ahli matematika untuk menerima Hadiah Nobel.

2.2 Klasifikasi permainan

Klasifikasi berbagai permainan dilakukan berdasarkan prinsip tertentu: berdasarkan jumlah pemain, berdasarkan jumlah strategi, berdasarkan sifat fungsi kemenangan, berdasarkan kemungkinan negosiasi awal dan interaksi antar pemain selama permainan.

Ada permainan dengan dua, tiga atau lebih peserta, tergantung jumlah pemainnya. Pada prinsipnya, permainan dengan jumlah pemain yang tidak terbatas juga dimungkinkan.

Menurut prinsip klasifikasi lain, permainan dibedakan berdasarkan jumlah strategi - terbatas dan tidak terbatas. Dalam permainan berhingga, peserta memiliki sejumlah kemungkinan strategi yang terbatas (misalnya, dalam permainan lempar, pemain memiliki dua kemungkinan gerakan - mereka dapat memilih "kepala" atau "ekor"). Strategi itu sendiri dalam permainan terbatas sering disebut strategi murni. Oleh karena itu, dalam permainan tak terbatas, pemain memiliki kemungkinan strategi yang tak terbatas - misalnya, dalam situasi Penjual-Pembeli, setiap pemain dapat menyebutkan harga dan jumlah produk yang dijual (dibeli) yang cocok untuknya.

Metode ketiga adalah mengklasifikasikan permainan - menurut sifat fungsi pemenang (fungsi pembayaran). Kasus penting dalam teori permainan adalah situasi ketika keuntungan salah satu pemain sama dengan kerugian pemain lainnya, yaitu. ada konflik langsung antar pemain. Permainan seperti ini disebut permainan zero-sum, atau permainan zero-sum. Permainan lempar atau lempar poin adalah contoh khas permainan antagonis. Kebalikan langsung dari permainan jenis ini adalah permainan dengan perbedaan yang konstan, dimana para pemainnya menang dan kalah pada saat yang bersamaan, sehingga menguntungkan bagi mereka untuk bertindak bersama-sama. Di antara kasus-kasus ekstrem ini, terdapat banyak permainan non-zero-sum di mana terdapat konflik dan tindakan bersama di antara para pemainnya.

Tergantung pada kemungkinan negosiasi awal antar pemain, permainan kooperatif dan non-kooperatif dibedakan. Kooperatif adalah permainan yang sebelum permainan dimulai, para pemain membentuk koalisi dan membuat kesepakatan yang saling mengikat mengenai strategi mereka. Non-kooperatif adalah permainan di mana pemain tidak dapat mengoordinasikan strategi mereka dengan cara ini. Jelasnya, semua permainan antagonis dapat menjadi contoh permainan non-kooperatif. Contoh permainan kooperatif adalah situasi pembentukan koalisi di parlemen untuk mengambil keputusan melalui pemungutan suara, yang dengan satu atau lain cara mempengaruhi kepentingan peserta pemungutan suara.

2.3 Jenis permainan

Simetris dan asimetris

A B
A 1, 2 0, 0
B 0, 0 1, 2
Permainan asimetris

Permainan akan simetris jika strategi masing-masing pemain mempunyai hasil yang sama, yaitu sama. Itu. jika kemenangan untuk gerakan yang sama tidak berubah, meskipun para pemain berpindah tempat. Banyak permainan dua pemain yang dipelajari bersifat simetris. Secara khusus, ini adalah: “Dilema Tahanan”, “Perburuan Rusa”, “Elang dan Merpati”. Permainan asimetris termasuk “Ultimatum” atau “Dictator”.

Pada contoh di sebelah kanan, permainan pada pandangan pertama mungkin tampak simetris karena strategi yang serupa, tetapi tidak demikian - lagi pula, hasil pemain kedua untuk salah satu strategi (1, 1) dan (2, 2) akan menjadi lebih besar dari yang pertama.

Jumlah nol dan bukan jumlah nol

Permainan zero-sum adalah jenis permainan jumlah konstan khusus, yaitu permainan yang pemainnya tidak dapat menambah atau mengurangi sumber daya atau dana permainan yang tersedia. Dalam hal ini, jumlah seluruh kemenangan sama dengan jumlah seluruh kekalahan pada setiap pergerakan. Lihat ke kanan - angka tersebut mewakili pembayaran kepada para pemain - dan jumlah mereka di setiap sel adalah nol. Contoh permainan tersebut termasuk poker, di mana yang satu memenangkan semua taruhan yang lain; reversi, tempat bidak musuh ditangkap; atau pencurian sederhana.

Banyak permainan yang dipelajari oleh para ahli matematika, termasuk Dilema Tahanan yang telah disebutkan, memiliki jenis yang berbeda: dalam permainan non-zero-sum, kemenangan satu pemain tidak selalu berarti kekalahan pemain lain, dan sebaliknya. Hasil dari permainan seperti itu bisa kurang atau lebih dari nol. Permainan semacam itu dapat diubah menjadi zero-sum - hal ini dilakukan dengan memperkenalkan pemain fiktif yang "mengambil" surplus atau menambah defisit.

Yang juga merupakan permainan non-zero sum adalah perdagangan, di mana setiap peserta mendapatkan keuntungan. Jenis ini mencakup permainan seperti catur dan catur; dalam dua bidak terakhir, pemain dapat mengubah bidak biasa menjadi bidak yang lebih kuat, sehingga mendapatkan keuntungan. Dalam semua kasus ini, jumlah permainan meningkat.

Kooperatif dan non-kooperatif

Suatu permainan disebut kooperatif atau koalisi jika para pemainnya dapat membentuk kelompok, memikul kewajiban tertentu kepada pemain lain dan mengoordinasikan tindakan mereka. Hal ini berbeda dengan permainan non-kooperatif di mana setiap orang harus bermain sendiri. Permainan hiburan jarang bersifat kooperatif, namun mekanisme seperti itu tidak jarang terjadi dalam kehidupan sehari-hari.

Seringkali diasumsikan bahwa yang membuat permainan kooperatif berbeda adalah kemampuan pemainnya untuk berkomunikasi satu sama lain. Namun hal ini tidak selalu benar, karena ada permainan yang diperbolehkan berkomunikasi, tetapi pesertanya mengejar tujuan pribadi, begitu pula sebaliknya.

Dari kedua jenis permainan tersebut, permainan non-kooperatif menggambarkan situasi dengan sangat rinci dan memberikan hasil yang lebih akurat. Koperasi mempertimbangkan proses permainan secara keseluruhan.

Permainan hybrid mencakup unsur permainan kooperatif dan non kooperatif.

Misalnya, pemain dapat membentuk kelompok, namun permainan akan dimainkan dengan gaya non-kooperatif. Artinya setiap pemain akan mengejar kepentingan kelompoknya, sekaligus berusaha meraih keuntungan pribadi.

Paralel dan serial

Dalam permainan paralel, pemain bergerak pada waktu yang sama, atau mereka tidak diberitahu tentang pilihan pemain lain sampai semua orang sudah mengambil tindakan. Dalam permainan berurutan atau dinamis, peserta dapat melakukan gerakan dalam urutan yang telah ditentukan atau acak, namun mereka juga menerima beberapa informasi tentang tindakan orang lain sebelumnya. Informasi ini bahkan mungkin tidak sepenuhnya lengkap; misalnya, seorang pemain mungkin mengetahui bahwa lawannya, dari sepuluh strateginya, tidak memilih strategi kelima, tanpa mempelajari apa pun tentang strategi lainnya.

Dengan informasi lengkap atau tidak lengkap

Bagian penting dari permainan sekuensial adalah permainan dengan informasi lengkap. Dalam permainan seperti itu, para peserta mengetahui semua gerakan yang dilakukan hingga saat ini, serta kemungkinan strategi lawan mereka, yang memungkinkan mereka sampai batas tertentu memprediksi perkembangan permainan selanjutnya. Informasi lengkap tidak tersedia dalam permainan paralel, karena pergerakan lawan saat ini tidak diketahui. Kebanyakan permainan yang dipelajari dalam matematika melibatkan informasi yang tidak lengkap. Misalnya, inti dari Dilema Tahanan adalah ketidaklengkapannya.

Sekaligus terdapat contoh permainan menarik yang informasinya lengkap: catur, catur, dan lain-lain.

Konsep informasi lengkap sering dikacaukan dengan konsep serupa – informasi sempurna. Untuk yang terakhir, cukup mengetahui semua strategi yang tersedia bagi lawan; pengetahuan tentang semua gerakan mereka tidak diperlukan.

Game dengan jumlah langkah tak terbatas

Game di dunia nyata, atau game yang dipelajari di bidang ekonomi, biasanya berlangsung dalam jumlah putaran yang terbatas. Matematika tidak begitu terbatas, dan teori himpunan khususnya berkaitan dengan permainan yang dapat berlanjut tanpa batas waktu. Selain itu, pemenang dan kemenangannya tidak ditentukan sampai akhir semua gerakan...

Di sini pertanyaannya biasanya bukan untuk menemukan solusi optimal, tapi setidaknya strategi kemenangan. (Dengan menggunakan aksioma pilihan, seseorang dapat membuktikan bahwa terkadang bahkan untuk permainan dengan informasi sempurna dan dua hasil - “menang” atau “kalah” - tidak ada pemain yang memiliki strategi seperti itu.)

Permainan diskrit dan berkelanjutan

Di sebagian besar permainan yang dipelajari, jumlah pemain, gerakan, hasil, dan kejadian terbatas, yaitu. mereka terpisah. Namun, komponen-komponen ini dapat diperluas ke banyak bilangan real (materi). Permainan yang memuat unsur-unsur tersebut sering disebut permainan diferensial. Mereka selalu dikaitkan dengan semacam skala material (biasanya skala waktu), meskipun peristiwa-peristiwa yang terjadi di dalamnya dapat bersifat tersendiri. Permainan diferensial menemukan penerapannya dalam bidang teknik dan teknologi, fisika.

3. Penerapan teori permainan

Teori permainan adalah salah satu cabang matematika terapan. Paling sering, metode teori permainan digunakan dalam bidang ekonomi, dan lebih jarang dalam ilmu-ilmu sosial lainnya - sosiologi, ilmu politik, psikologi, etika, dan lain-lain. Sejak tahun 1970-an, teori ini telah diadopsi oleh para ahli biologi untuk mempelajari perilaku hewan dan teori evolusi. Cabang matematika ini sangat penting untuk kecerdasan buatan dan sibernetika, terutama yang berkaitan dengan agen cerdas.

Neumann dan Morgenstern menulis buku aslinya, yang sebagian besar berisi contoh-contoh ekonomi, karena konflik ekonomi paling mudah dirumuskan dalam bentuk numerik. Selama Perang Dunia Kedua dan segera setelahnya, militer menjadi sangat tertarik pada teori permainan, yang melihatnya sebagai alat untuk mempelajari keputusan strategis. Kemudian perhatian utama kembali diberikan pada masalah ekonomi. Saat ini, banyak pekerjaan yang dilakukan untuk memperluas cakupan teori permainan.

Dua bidang penerapan utama adalah militer dan ekonomi. Perkembangan teori permainan digunakan dalam perancangan sistem kendali otomatis senjata rudal/anti-rudal, pemilihan bentuk lelang penjualan frekuensi radio, penerapan pemodelan pola peredaran moneter untuk kepentingan bank sentral, dll. Hubungan internasional dan keamanan strategis terutama bergantung pada teori permainan (dan teori keputusan) pada konsep kehancuran yang saling menguntungkan. Hal ini disebabkan oleh galaksi pemikiran yang cemerlang (termasuk yang terkait dengan RAND Corporation di Santa Monica, California), yang semangatnya dibawa ke posisi kepemimpinan tertinggi dalam pribadi Robert McNamara. Namun harus diakui bahwa McNamara sendiri tidak menyalahgunakan teori permainan.

3.1 Dalam urusan militer

Informasi adalah salah satu sumber daya paling penting saat ini. Dan sekarang semuanya

Pepatah yang mengatakan “Siapa yang punya informasi, dialah yang menguasai dunia” juga ada benarnya. Selain itu, kebutuhan untuk menggunakan informasi yang tersedia secara efektif semakin mengemuka. Teori permainan, ditambah dengan teori pengendalian optimal, memungkinkan kita mengambil keputusan yang tepat dalam berbagai situasi konflik dan non-konflik.

Teori permainan adalah disiplin matematika yang berhubungan dengan masalah konflik. Militer

kasus ini, sebagai inti konflik yang diungkapkan dengan jelas, menjadi salah satu tempat pengujian pertama bagi penerapan praktis perkembangan teori permainan.

Studi tentang masalah pertempuran militer dengan menggunakan teori permainan (termasuk teori diferensial) adalah subjek yang besar dan sulit. Penerapan teori permainan pada masalah militer berarti bahwa solusi efektif dapat ditemukan untuk semua peserta - tindakan optimal yang memungkinkan solusi maksimal terhadap tugas yang diberikan.

Upaya untuk membongkar permainan perang pada model meja telah dilakukan berkali-kali. Namun eksperimen dalam urusan militer (seperti dalam ilmu pengetahuan lainnya) merupakan sarana untuk mengkonfirmasi teori dan menemukan cara baru untuk menganalisis.

Analisis militer adalah hal yang jauh lebih tidak pasti dalam hal hukum, prediksi dan logika dibandingkan ilmu fisika. Oleh karena itu, simulasi dengan detail realistis yang terperinci dan dipilih dengan cermat tidak dapat memberikan hasil yang dapat diandalkan secara keseluruhan kecuali batch tersebut diulang berkali-kali. Dari sudut pandang permainan diferensial, satu-satunya hal yang bisa diharapkan adalah konfirmasi kesimpulan teori tersebut. Yang paling penting adalah kasus ketika kesimpulan tersebut diambil dari model yang disederhanakan (hal ini selalu terjadi, jika diperlukan).

Dalam beberapa kasus, permainan diferensial memainkan peran yang sangat jelas dalam masalah militer yang tidak memerlukan komentar khusus. Ini benar, misalnya, untuk

sebagian besar model melibatkan pengejaran, mundur, dan manuver serupa lainnya. Jadi, dalam kasus pengendalian jaringan komunikasi otomatis dalam lingkungan elektronik yang kompleks, upaya dilakukan untuk hanya menggunakan permainan antagonis multi-langkah stokastik. Tampaknya disarankan untuk menggunakan permainan diferensial, karena penggunaannya dalam banyak kasus memungkinkan untuk menggambarkan proses yang diperlukan dengan tingkat keandalan yang tinggi dan menemukan solusi optimal untuk masalah tersebut.

Seringkali dalam situasi konflik, pihak-pihak yang berseberangan bersatu dalam aliansi untuk mencapai hasil yang lebih baik. Oleh karena itu, ada kebutuhan untuk mempelajari permainan diferensial koalisi. Selain itu, tidak ada situasi ideal di dunia ini yang tidak mempunyai campur tangan apa pun. Artinya, disarankan untuk mempelajari permainan diferensial koalisi dalam kondisi ketidakpastian. Ada berbagai pendekatan untuk membangun solusi terhadap permainan diferensial.

Selama Perang Dunia II, perkembangan ilmiah von Neumann terbukti sangat berharga bagi tentara Amerika - komandan militer mengatakan bahwa bagi Pentagon, ilmuwan sama pentingnya dengan seluruh divisi tentara. Berikut adalah contoh penggunaan Game Theory dalam urusan militer. Senjata antipesawat dipasang di kapal dagang Amerika. Namun, sepanjang perang, tidak ada satu pun pesawat musuh yang ditembak jatuh oleh instalasi ini. Sebuah pertanyaan wajar muncul: apakah layak melengkapi kapal yang tidak dimaksudkan untuk operasi tempur dengan senjata seperti itu? Sekelompok ilmuwan yang dipimpin oleh von Neumann, setelah mempelajari masalah ini, sampai pada kesimpulan bahwa pengetahuan musuh tentang keberadaan senjata semacam itu di kapal dagang secara tajam mengurangi kemungkinan dan keakuratan penembakan dan pemboman, dan oleh karena itu penempatan “ senjata anti-pesawat” di kapal-kapal ini telah terbukti sepenuhnya keefektifannya.

CIA, Departemen Pertahanan AS, dan perusahaan-perusahaan besar Fortune 500 secara aktif berkolaborasi dengan para futuris. Tentu saja, kita berbicara tentang futurologi yang sepenuhnya ilmiah, yaitu tentang perhitungan matematis dari probabilitas objektif kejadian di masa depan. Ini adalah karya teori permainan - salah satu bidang baru ilmu matematika, yang dapat diterapkan pada hampir semua bidang kehidupan manusia. Mungkin masa depan komputasi, yang dulu dilakukan dengan sangat rahasia untuk klien "elit", akan segera memasuki pasar komersial publik. Setidaknya hal ini dibuktikan dengan fakta bahwa pada saat yang sama dua majalah besar Amerika menerbitkan materi tentang topik ini, dan keduanya menerbitkan wawancara dengan profesor Universitas New York Bruce Bueno de Mesquita. Profesor tersebut memiliki perusahaan konsultan yang menangani perhitungan komputer berdasarkan teori permainan. Selama dua puluh tahun bekerja sama dengan CIA, ilmuwan tersebut secara akurat menghitung beberapa peristiwa penting dan tidak terduga (misalnya, naiknya Andropov ke tampuk kekuasaan di Uni Soviet dan penaklukan Hong Kong oleh Tiongkok). Secara total, dia menghitung lebih dari seribu peristiwa dengan akurasi lebih dari 90%.Bruce kini menjadi penasihat badan intelijen Amerika mengenai kebijakan di Iran. Misalnya, perhitungannya menunjukkan bahwa Amerika Serikat tidak mempunyai peluang untuk mencegah Iran meluncurkan reaktor nuklir untuk keperluan sipil.

3.2 Dalam manajemen

Contoh penerapan teori permainan dalam manajemen meliputi keputusan mengenai penerapan kebijakan penetapan harga yang mendasar, memasuki pasar baru, kerja sama dan penciptaan usaha patungan, mengidentifikasi pemimpin dan pelaku di bidang inovasi, dll. Ketentuan teori ini pada prinsipnya dapat digunakan untuk semua jenis keputusan jika pengambilannya dipengaruhi oleh aktor lain. Individu atau pemain ini tidak harus menjadi pesaing pasar; peran mereka mungkin sebagai subpemasok, pelanggan terkemuka, karyawan organisasi, serta rekan kerja.

Bagaimana perusahaan dapat memperoleh manfaat dari analisis berbasis teori permainan? Misalnya, terdapat kasus konflik kepentingan antara IBM dan Telex. Telex mengumumkan masuknya ke pasar penjualan, sehubungan dengan ini, pertemuan "krisis" manajemen IBM diadakan, di mana tindakan dianalisis untuk memaksa pesaing baru membatalkan niatnya untuk menembus pasar baru. Telex rupanya menyadari tindakan tersebut. Namun analisis berdasarkan teori permainan menunjukkan bahwa ancaman terhadap IBM karena tingginya biaya tidak berdasar. Hal ini membuktikan bahwa penting bagi perusahaan untuk mempertimbangkan kemungkinan reaksi dari mitra game mereka. Perhitungan ekonomi yang terisolasi, bahkan yang didasarkan pada teori pengambilan keputusan, sering kali, seperti dalam situasi yang digambarkan, bersifat terbatas. Dengan demikian, perusahaan luar dapat memilih langkah “tidak masuk” jika analisis awal meyakinkannya bahwa penetrasi pasar akan menimbulkan reaksi agresif dari perusahaan monopoli. Dalam situasi ini, masuk akal untuk memilih langkah “non-intervensi” dengan probabilitas respons agresif sebesar 0,5, sesuai dengan kriteria biaya yang diharapkan.

Kontribusi penting terhadap penggunaan teori permainan datang dari pekerjaan eksperimental. Banyak perhitungan teoretis yang diuji dalam kondisi laboratorium, dan hasil yang diperoleh menjadi elemen penting bagi para praktisi. Secara teoritis, ditemukan dalam kondisi apa yang menguntungkan bagi dua mitra yang egois untuk bekerja sama dan mencapai hasil yang lebih baik untuk diri mereka sendiri.

Pengetahuan ini dapat digunakan dalam praktik perusahaan untuk membantu dua perusahaan mencapai situasi win/win. Saat ini, konsultan yang terlatih dalam bidang game dengan cepat dan jelas mengidentifikasi peluang yang dapat dimanfaatkan oleh bisnis untuk mendapatkan kontrak jangka panjang yang stabil dengan pelanggan, sub-pemasok, mitra pengembangan, dan sejenisnya. .

3.3 Penerapan di bidang lain

Dalam biologi

Arah yang sangat penting adalah upaya menerapkan teori permainan pada biologi dan memahami bagaimana evolusi itu sendiri membangun strategi yang optimal. Ini pada dasarnya adalah metode yang sama yang membantu kita menjelaskan perilaku manusia. Bagaimanapun, teori permainan tidak mengatakan bahwa orang selalu bertindak secara sadar, strategis, dan rasional. Sebaliknya, ini tentang evolusi aturan-aturan tertentu yang memberikan hasil yang lebih bermanfaat jika dipatuhi. Artinya, orang sering kali tidak memperhitungkan strateginya; strategi itu perlahan-lahan terbentuk seiring bertambahnya pengalaman. Ide ini kini telah diadopsi dalam biologi.

Dalam teknologi komputer

Penelitian di bidang teknologi komputer pun semakin diminati, misalnya analisis lelang yang dilakukan secara otomatis oleh komputer. Selain itu, teori permainan saat ini memungkinkan kita untuk sekali lagi memikirkan bagaimana komputer bekerja, bagaimana kerjasama dibangun di antara mereka. Misalnya, server di jaringan dapat dianggap sebagai pemain yang mencoba mengoordinasikan tindakan mereka.

Dalam permainan (catur)

Catur adalah kasus utama teori permainan karena semua yang Anda lakukan ditujukan semata-mata untuk kemenangan Anda dan Anda tidak perlu khawatir tentang bagaimana reaksi pasangan Anda terhadapnya. Cukup untuk memastikan bahwa dia tidak akan mampu merespons secara efektif. Artinya, ini adalah permainan zero-sum. Dan tentu saja, dalam permainan lain, budaya mungkin memiliki arti penting.

Contoh dari daerah lain

Teori permainan digunakan untuk menemukan pasangan yang cocok antara donor dan penerima ginjal. Ada yang ingin mendonorkan ginjalnya kepada orang lain, namun ternyata golongan darahnya tidak cocok. Dan apa yang harus dilakukan dalam kasus ini? Pertama-tama, perluas daftar donor dan penerima, lalu terapkan metode seleksi yang disediakan oleh teori permainan. Ini sangat mirip dengan perjodohan. Atau lebih tepatnya, ini sama sekali tidak terlihat seperti pernikahan, tetapi model matematika dari situasi ini sama, metode dan perhitungan yang digunakan sama. Sekarang, berdasarkan ide-ide para ahli teori seperti David Gale, Lloyd Shapley dan lain-lain, industri nyata telah berkembang - penerapan praktis teori tersebut dalam permainan kooperatif.

3.4 Mengapa teori permainan tidak digunakan secara lebih luas

Dalam bidang politik, ekonomi, dan militer, para praktisi telah menghadapi keterbatasan mendasar dari landasan teori permainan modern - rasionalitas Nash.

Pertama, seseorang tidak begitu sempurna untuk selalu berpikir strategis. Untuk mengatasi keterbatasan ini, para ahli teori mulai mengeksplorasi formulasi keseimbangan evolusioner yang memiliki asumsi rasionalitas yang lebih lemah.

Kedua, premis awal teori permainan mengenai kesadaran pemain terhadap struktur permainan dan pembayaran dalam kehidupan nyata tidak diamati sesering yang kita inginkan. Teori permainan bereaksi sangat menyakitkan terhadap perubahan sekecil apa pun (dari sudut pandang orang kebanyakan) dalam aturan permainan dengan perubahan tajam dalam keseimbangan yang diprediksi.

Sebagai konsekuensi dari permasalahan ini, teori permainan modern berada pada "kebuntuan yang bermanfaat". Solusi yang diusulkan angsa, udang karang, dan tombak menarik teori permainan ke arah yang berbeda. Lusinan makalah ditulis di setiap arah... namun, “segala sesuatunya masih ada.”

Contoh masalah

Definisi diperlukan untuk memecahkan masalah

1. Suatu keadaan disebut konflik apabila melibatkan pihak-pihak yang kepentingannya berlawanan seluruhnya atau sebagian.

2. Permainan adalah suatu konflik aktual atau formal yang didalamnya paling sedikit terdapat dua peserta (pemain) yang masing-masing berusaha mencapai tujuannya masing-masing.

3. Perbuatan yang diperbolehkan setiap pemain, yang bertujuan untuk mencapai tujuan tertentu, disebut aturan main.

4. Penilaian kuantitatif terhadap hasil permainan disebut pembayaran.

5. Suatu permainan disebut permainan ganda apabila hanya dua pihak (dua orang) yang ikut serta di dalamnya.

6. Permainan berpasangan disebut permainan zero-sum jika jumlah pembayarannya nol, yaitu. jika kerugian satu pemain sama dengan keuntungan pemain lainnya.

7. Deskripsi yang jelas tentang pilihan pemain dalam setiap kemungkinan situasi di mana ia harus mengambil tindakan disebut strategi pemain.

8. Strategi seorang pemain disebut optimal jika, ketika permainan diulang berkali-kali, strategi tersebut memberikan pemain kemungkinan kemenangan maksimum (atau, dengan kata lain, kerugian rata-rata minimum yang mungkin).

Misalkan ada dua pemain, salah satunya dapat memilih strategi ke-i dari m kemungkinan strategi (i=1,m), dan pemain kedua, tanpa mengetahui pilihan strategi pertama, memilih strategi ke-j dari n kemungkinan strategi (j=1,n) Hasilnya, pemain pertama mendapatkan nilai aij, dan pemain kedua kehilangan nilai tersebut.

Dari bilangan aij kita buat matriksnya

Baris-baris matriks A sesuai dengan strategi pemain pertama, dan kolom-kolomnya sesuai dengan strategi pemain kedua. Strategi ini disebut murni.

9. Matriks A disebut matriks hasil (atau matriks permainan).

10. Permainan yang didefinisikan oleh matriks A yang mempunyai m baris dan n kolom disebut permainan berhingga berdimensi m x n.

11. Nomor disebut harga permainan yang lebih rendah atau maximin, dan strategi (baris) yang sesuai disebut maximin.

12. Nomor disebut harga atas permainan atau minimax, dan strategi (kolom) yang sesuai disebut minimax.

13. Jika α=β=v, maka bilangan v disebut harga permainan.

14. Permainan yang α=βnya disebut permainan dengan titik pelana.

Untuk permainan dengan saddle point, mencari solusinya terdiri dari pemilihan strategi maximin dan minimax yang optimal.

Jika permainan yang ditentukan oleh matriks tidak mempunyai titik pelana, maka strategi campuran digunakan untuk mencari solusinya.
Tugas

1. Orlyanka. Ini adalah permainan zero-sum. Prinsipnya adalah jika pemain memilih strategi yang sama, pemain pertama akan memenangkan satu rubel, dan jika pemain memilih strategi berbeda, pemain pertama akan kehilangan satu rubel.

Jika Anda menghitung strategi berdasarkan prinsip maxmin dan minmax, Anda dapat melihat bahwa tidak mungkin menghitung strategi yang optimal, dalam permainan ini kemungkinan kalah dan menang adalah sama.

2. Angka. Inti dari permainan ini adalah setiap pemain menebak bilangan bulat dari 1 sampai 4, dan kemenangan pemain pertama sama dengan selisih antara angka yang ditebaknya dan angka yang ditebak pemain lain.

nama Pemain B
Pemain A strategi 1 2 3 4
1 0 -1 -2 -3
2 1 0 -1 -2
3 2 1 0 -1
4 3 2 1 0

Kita selesaikan soal sesuai teori maxmin dan minmax, sama dengan soal sebelumnya, ternyata maxmin = 0, minmax = 0, muncul titik pelana, karena harga atas dan bawah sama. Strategi kedua pemain sama dengan 4.

3. Pertimbangkan masalah mengevakuasi orang-orang jika terjadi kebakaran.

Situasi kebakaran 1: Waktu terjadinya kebakaran - jam 10, musim panas.

Massa jenis aliran manusia D = 0,2 jam/m 2, kecepatan aliran v = 60

m/mnt. Waktu evakuasi yang diperlukan TeV = 0,5 menit.

Situasi kebakaran 2: Waktu terjadinya kebakaran 20 jam, musim panas. Kepadatan aliran manusia D = 0,83 jam/menit. kecepatan aliran

v = 17 m/menit. Waktu evakuasi yang diperlukan TeV = 1,6 menit.

Berbagai pilihan evakuasi Li dimungkinkan dan ditentukan

fitur struktural dan perencanaan bangunan, keberadaan

tangga bebas asap rokok, jumlah lantai dalam gedung dan faktor lainnya.

Dalam contoh tersebut, kami menganggap opsi evakuasi sebagai rute yang harus diambil orang ketika mengevakuasi sebuah bangunan. Situasi kebakaran 1 akan sesuai dengan opsi evakuasi L1, di mana evakuasi terjadi sepanjang koridor dua tangga. Tetapi opsi evakuasi terburuk juga mungkin terjadi - L2, di mana evakuasi

terjadi di satu tangga dan jalur keluarnya maksimal.

Namun, untuk situasi 2, opsi evakuasi L1 dan L2 jelas cocok

L1 lebih disukai. Uraian kemungkinan situasi kebakaran di lokasi perlindungan dan pilihan evakuasi disusun dalam bentuk matriks pembayaran, sedangkan:

N - kemungkinan situasi kebakaran:

L - opsi evakuasi;

a 11 – hasil evakuasi nm: “a” bervariasi dari 0 (kerugian absolut) hingga 1 (keuntungan maksimum).

Misalnya, dalam situasi kebakaran:

N1 - asap muncul di koridor umum dan dilalap api

dalam 5 menit setelah terjadi kebakaran;

N2 - asap dan api yang menyelimuti koridor terjadi setelah 7 menit;

N3 - asap dan api yang melanda koridor terjadi setelah 10 menit.

Pilihan evakuasi berikut ini dimungkinkan:

L1 - menyediakan evakuasi dalam 6 menit;

L2 - menyediakan evakuasi dalam 8 menit;

L3 - menyediakan evakuasi dalam 12 menit.

a 11 = N1 / L1 = 5/ 6 = 0,83

a 12 = N1 / L2 = 5/ 8 = 0,62

a 13 = N1 / L3 = 5/ 12 = 0,42

a 21 = N2 / L1 = 7/ 6 = 1

a 22 = N2 / L2 = 7/ 8 = 0,87

a 23 = N2 / L3 = 7/ 12 = 0,58

a 31 = N3 / L1 = 10/ 6 = 1

a 32 = N3 / L2 = 10/ 8 = 1

a 33 = N3 / L3 = 10/ 12 = 0,83

Meja. Matriks pembayaran hasil evakuasi

L1 L2 L3
N1 0,83 0,6 0,42
N2 1 0,87 0,58
N3 1 1 0,83

Hitung waktu evakuasi yang diperlukan selama proses pengelolaan

tidak perlu evakuasi, bisa dimasukkan ke dalam program dalam bentuk jadi.

Matriks ini dimasukkan ke dalam komputer dan sesuai dengan nilai numerik besarannya dan ij subsistem secara otomatis memilih opsi evakuasi optimal.

Kesimpulan

Sebagai kesimpulan, perlu ditekankan secara khusus bahwa teori permainan adalah bidang pengetahuan yang sangat kompleks. Saat menanganinya, Anda harus berhati-hati dan mengetahui dengan jelas batasan penggunaannya. Penafsiran yang terlalu sederhana, baik yang diadopsi oleh perusahaan itu sendiri atau dengan bantuan konsultan, mengandung bahaya tersembunyi. Karena kompleksitasnya, analisis dan konsultasi teori permainan direkomendasikan hanya untuk bidang masalah yang sangat penting. Pengalaman perusahaan menunjukkan bahwa penggunaan alat yang tepat lebih disukai ketika membuat keputusan strategis terencana yang penting dan penting satu kali, termasuk ketika menyiapkan perjanjian kerja sama besar. Namun, penggunaan teori permainan memudahkan kita untuk memahami esensi dari apa yang terjadi, dan keserbagunaan cabang ilmu ini memungkinkan kita untuk berhasil menggunakan metode dan sifat teori ini di berbagai bidang aktivitas kita.

Teori permainan menanamkan disiplin mental dalam diri seseorang. Dari pengambil keputusan diperlukan perumusan sistematis tentang kemungkinan alternatif perilaku, evaluasi hasilnya, dan yang terpenting, dengan mempertimbangkan perilaku objek lain. Seseorang yang akrab dengan teori permainan cenderung tidak menganggap orang lain lebih bodoh daripada dirinya sendiri, dan karena itu menghindari banyak kesalahan yang tidak dapat dimaafkan. Namun, teori permainan tidak bisa, dan tidak dirancang untuk, memberikan tekad dan ketekunan dalam mencapai tujuan, meskipun ada ketidakpastian dan risiko. Pengetahuan tentang dasar-dasar teori permainan tidak memberikan kita kemenangan yang jelas, namun melindungi kita dari membuat kesalahan bodoh dan tidak perlu.

Teori permainan selalu berhubungan dengan jenis pemikiran khusus, strategis.


Bibliografi

1. J. von Neumann, O. Morgenstern. "Teori Permainan dan Perilaku Ekonomi", Sains, 1970.

2. Zamkov O.O., Tolstopyatenko A.V., Cheremnykh Yu.N. “Metode matematika dalam perekonomian”, Moskow 1997, ed. "DIS".

3. Owen G. “Teori Permainan”. – M.: Mir, 1970.

4. Raskin M. A. “Pengantar Teori Permainan” // Sekolah Musim Panas “Matematika Modern”. – Dubna: 2008.

5.http://ru.wikipedia.org/wiki

6.http://dic.academic.ru/dic.nsf/ruwiki/104891

7.http://ru.wikipedia.org/wiki

8.http://www.rae.ru/zk/arj/2007/12/Stepanenko.pdf

9. http://banzay-kz.livejournal.com/13890.html

10.http://propolis.com.ua/node/21

11.http://www.cfin.ru/management/game_theory.shtml

12.http://konflickt.ru/16/

13.http://www.krugosvet.ru/enc/nauka_i_tehnika/matematika/IGR_TEORIYA.html

14.http://matmodel.ru/article.php/20081126162627533

15.http://www.nsu.ru/ef/tsy/ec_cs/kokgames/prog3k.htm

ekonomi eksperimental

Dan metode analisis lainnya

Seperti ilmu pengetahuan lain yang tidak sepenuhnya konvensional, ilmu ekonomi institusional menggunakan metode analisis yang berbeda. Ini termasuk alat mikroekonomi tradisional, metode ekonometrik, analisis informasi statistik, dll. Pada bagian ini, kita akan membahas secara singkat penggunaan teori permainan, ekonomi eksperimental, dan metode lain yang disesuaikan dengan analisis kelembagaan.

Teori permainan. Teori permainan- metode analitis yang dikembangkan setelah Perang Dunia Kedua dan digunakan untuk menganalisis situasi di mana individu berinteraksi secara strategis. Catur merupakan prototipe permainan strategis, karena hasilnya bergantung pada perilaku lawan, serta perilaku pemain itu sendiri. Karena analogi yang ditemukan antara permainan strategis dan bentuk interaksi politik dan ekonomi, teori permainan mendapat perhatian yang meningkat dalam ilmu-ilmu sosial. Teori permainan modern dimulai dengan karya D. Neumann dan O. Morgenstern “Game Theory and Economic Behavior” (1944, versi Rusia - 1970). Teori tersebut mengkaji interaksi keputusan individu berdasarkan asumsi tertentu mengenai pengambilan keputusan dalam kondisi risiko, keadaan lingkungan secara umum, dan perilaku kooperatif atau non-kooperatif individu lain. Jelasnya, individu yang rasional harus mengambil keputusan dalam kondisi ketidakpastian dan interaksi. Jika keuntungan satu orang dirugikan oleh orang lain, maka itu adalah permainan zero-sum. Ketika masing-masing individu mendapatkan keuntungan dari keputusan salah satu dari mereka, maka terjadilah permainan non-zero-sum. Sebuah permainan bisa bersifat kooperatif jika kolusi dimungkinkan, dan non-kooperatif jika antagonisme mendominasi. Salah satu contoh permainan non-zero-sum yang terkenal adalah dilema tahanan (PD). Contoh ini menunjukkan bahwa, bertentangan dengan klaim liberalisme, upaya individu untuk mementingkan kepentingan pribadi menghasilkan keputusan yang kurang memuaskan dibandingkan alternatif yang ada.

Batasi teorema F.I. Edgeworth dianggap sebagai contoh awal permainan kooperatif N peserta. Teorema tersebut menyatakan bahwa ketika jumlah peserta dalam perekonomian pertukaran murni meningkat, kolusi menjadi kurang berguna dan kumpulan harga relatif keseimbangan (inti) yang mungkin terjadi menurun. Jika jumlah peserta cenderung tak terhingga, maka hanya tersisa satu sistem harga relatif, yang sesuai dengan harga keseimbangan umum.

Konsep solusi optimal (keseimbangan Nash) adalah salah satu konsep kunci dalam teori permainan. Ini diperkenalkan pada tahun 1951 oleh ekonom matematika Amerika John F. Nash.

Dalam konteks ini, cukup mempertimbangkan konsep ini dalam kaitannya dengan model teori permainan dua orang 25. Dalam model ini, setiap peserta mempunyai serangkaian strategi tertentu yang tidak kosong S Saya , Saya= 1, 2. Dalam hal ini, pemilihan strategi tertentu dari strategi yang tersedia bagi pemain dilakukan sedemikian rupa untuk memaksimalkan nilai fungsi pembayarannya sendiri (utilitas) kamu Saya , Saya= 1, 2. Nilai fungsi pembayaran diberikan pada himpunan strategi pemain berpasangan terurut S 1 S 2, yang elemennya merupakan semua kemungkinan kombinasi strategi pemain ( S 1 , S 2) (urutan pasangan strategi adalah pada setiap kombinasi strategi pemain pertama menempati urutan pertama, dan pemain kedua menempati posisi kedua), yaitu. kamu Saya = kamu Saya (S 1 , S 2), Saya= 1, 2. Dengan kata lain, hasil yang didapat setiap pemain tidak hanya bergantung pada strategi yang dipilihnya, tetapi juga pada strategi yang diterapkan lawannya.

Solusi optimal Nash adalah sepasang strategi ( S 1 *, S 2 *), S SayaS Saya , Saya= 1, 2, mempunyai sifat sebagai berikut: strategi S 1 * menyediakan pemain 1 hasil maksimum ketika pemain 2 memilih strategi S 2 *, dan simetris S 2 * memberikan nilai maksimum fungsi pembayaran pemain 2 ketika pemain 1 strategi diadopsi S 1 *. Sepasang strategi mengarah pada keseimbangan Nash jika pilihan pemain 1 , optimal untuk pilihan pemain tertentu 2 , dan pilihan yang dibuat oleh pemain 2 adalah optimal berdasarkan pilihan pemain 1 . Konsep optimalitas Nash jelas digeneralisasikan pada kasus permainan N orang Perlu dicatat bahwa keberadaan ekuilibrium Nash tidak berarti bahwa ekuilibrium Nash merupakan optimal Pareto, dan serangkaian strategi optimal Pareto belum tentu memenuhi ekuilibrium Nash. Pada tahun 1994, J. F. Nash, R. Selten, dan J. C. Harsanyi dianugerahi Hadiah Nobel Ekonomi atas kontribusi mereka terhadap pengembangan teori permainan dan penerapannya pada perekonomian.

Penggunaan metode ini bergantung pada kekuatannya dalam menjelaskan penyebab dan konsekuensi perubahan institusional. Kemampuan teori permainan untuk membantu menganalisis konsekuensi perubahan peraturan tidak dapat disangkal; kekuatannya dalam mengungkap penyebab masih ambigu. Analisis teori permainan apa pun harus mengandaikan penentuan aturan dasar permainan terlebih dahulu. Jadi, O. Morgenstern menulis pada tahun 1968: “Permainan digambarkan dengan mendefinisikan kemungkinan perilaku dalam aturan permainan. Aturannya jelas dalam setiap kasus; misalnya, dalam catur, gerakan tertentu diperbolehkan untuk bidak tertentu, tetapi dilarang untuk bidak lainnya. Aturannya juga tidak bisa dilanggar. Ketika situasi sosial dipandang sebagai suatu permainan, aturan-aturan tersebut diberikan oleh lingkungan fisik dan hukum di mana tindakan individu berlangsung.” 26

Jika pandangan ini diterima, teori permainan tidak dapat diharapkan untuk menjelaskan penyebab perubahan aturan-aturan mendasar dalam organisasi kehidupan ekonomi, politik dan sosial: identifikasi aturan-aturan tersebut jelas merupakan prasyarat untuk melakukan analisis semacam itu.

Permainan koordinasi dan model dilema narapidana digunakan untuk memahami makna institusi.

Mari kita pertimbangkan masalah koordinasi murni dan umum. Permainan koordinasi yang murni menunjukkan bahwa pelaku ekonomi tidak dapat dijamin untuk mewujudkan manfaat bersama dari kerja sama, meskipun tidak ada konflik kepentingan. Dengan kata lain, dalam situasi koordinasi “murni” terdapat keseimbangan ganda yang sama-sama disukai oleh masing-masing pihak. Dalam hal ini, tidak ada konflik kepentingan, namun tidak ada jaminan bahwa setiap orang akan mengupayakan hasil keseimbangan yang sama. Contoh yang terkenal adalah pemilihan sisi jalan (kanan atau kiri) yang harus dilalui orang (Gbr. 2.1). Permainan ini memiliki dua keseimbangan Nash, sesuai dengan set strategi (kiri, kiri) dan (kanan, kanan). Tidak seorang pun berkeberatan terlebih dahulu untuk bergerak ke kanan atau ke kiri, namun mencapai hasil yang terkoordinasi dengan sejumlah besar negosiator akan memerlukan biaya transaksi yang tinggi. Diperlukan suatu lembaga yang dapat menjalankan fungsi fokal point, yaitu. memperkenalkan solusi konsensus. Lembaga tersebut mungkin merupakan hasil pengetahuan umum yang diperoleh berdasarkan analisis situasi yang serupa, atau mungkin merupakan negara yang melakukan intervensi untuk memperkenalkan aturan koordinasi dan mengurangi biaya transaksi. Secara umum, institusi menjalankan fungsi koordinasi, mengurangi ketidakpastian.

Masalah koordinasi yang umum terjadi jika matriks pembayaran sedemikian rupa sehingga pada titik ekuilibrium mana pun, tidak ada pemain yang memiliki insentif untuk mengubah perilaku mereka mengingat perilaku pemain lain, namun tidak ada pemain yang ingin pemain lain mengubahnya. Dalam hal ini, semua orang lebih memilih hasil yang terkoordinasi daripada hasil yang tidak terkoordinasi, namun mungkin semua orang lebih memilih hasil terkoordinasi tertentu (Gambar 2.2). Misalnya dua pabrikan A Dan B menggunakan teknologi yang berbeda X Dan Y, namun ingin memperkenalkan standar produk nasional yang akan menyebabkan eksternalitas jaringan. Pabrikan A lebih banyak keuntungan jika teknologi menjadi standar X, dan pabrikan B- teknologi Y. Kemenangan didistribusikan secara asimetris. Jadi, pabrikannya A(B) lebih suka jika itu menjadi standar X(Y)-teknologi, tetapi keduanya akan lebih memilih hasil yang terkoordinasi daripada hasil yang tidak terkoordinasi. Biaya transaksi pada model ini akan lebih tinggi dibandingkan model sebelumnya (apalagi jika melibatkan banyak pihak), karena terdapat konflik kepentingan. Mengganti upaya koordinasi swasta dengan intervensi pemerintah akan mengurangi biaya transaksi dalam perekonomian. Contohnya adalah pengenalan standar teknologi oleh pemerintah, standar pengukuran dan kualitas, dll. Model koordinasi umum menggambarkan pentingnya tidak hanya fungsi koordinasi lembaga, tetapi juga fungsi distribusi, yang bergantung pada metode yang membatasi kemungkinan alternatif pemain dan, pada akhirnya, efektivitas interaksi.

Dilema tahanan sering disebut-sebut sebagai contoh masalah menjalin kerjasama antar individu. Permainan ini melibatkan dua pemain, dua tahanan yang dipisahkan oleh penjaganya. Setiap orang mempunyai dua pilihan: bekerja sama, yaitu bekerja sama. tetap diam, atau menolak kerja sama, yaitu. mengkhianati yang lain. Masing-masing harus bertindak tanpa mengetahui apa yang akan dilakukan pihak lain. Masing-masing diberitahu bahwa pengakuan, jika yang lain tetap diam, akan membawa pada kebebasan. Penolakan untuk mengaku jika terjadi pengkhianatan dengan cara lain berarti kematian. Jika keduanya mengaku, mereka akan menghabiskan beberapa tahun penjara bersama. Jika masing-masing dari mereka menolak mengaku, mereka akan ditangkap sebentar dan kemudian dibebaskan. Dengan asumsi bahwa penjara lebih disukai daripada kematian dan kebebasan adalah keadaan yang paling diinginkan, para tahanan dihadapkan pada sebuah paradoks: meskipun mereka berdua memilih untuk tidak mengkhianati satu sama lain dan menghabiskan waktu singkat di penjara, masing-masing akan lebih baik jika mengkhianati yang lain. , terlepas dari kenyataan bahwa orang lain akan melakukan. Secara analitis, kemampuan narapidana untuk menjalin hubungan berada di latar belakang, karena insentif untuk berkhianat tetap sama kuatnya dengan atau tanpa adanya hubungan. Pengkhianatan tetap menjadi strategi dominan.

Analisis ini membantu menjelaskan mengapa agen-agen yang memaksimalkan kepentingan diri sendiri tidak dapat mencapai atau mempertahankan hasil kerja sama secara rasional (paradoks rasionalitas individu). Hal ini berguna dalam menjelaskan kehancuran ex post suatu kartel atau perjanjian koperasi lainnya, namun tidak menjelaskan bagaimana kartel atau perjanjian koperasi itu terbentuk. Jika para tahanan mampu mencapai kesepakatan, maka masalahnya akan hilang: mereka sepakat untuk tidak saling mengkhianati dan sampai pada titik memaksimalkan keuntungan bersama. Jadi, cukup dengan membuat kesepakatan yang diinginkan bersama, namun membuat masing-masing individu berpotensi lebih rentan terhadap kerugian dibandingkan jika tidak ada kesepakatan tersebut. Analisis ini mengalihkan perhatian pada lembaga-lembaga yang, dari sudut pandang individu, dapat mengurangi risiko perjanjian tersebut.

Literatur teori membedakan antara analisis permainan kooperatif dan non kooperatif. Seperti yang sudah dijelaskan, pemain bisa membuat perjanjian yang mengikat mereka. Penjamin perjanjian tersebut bersifat implisit. Banyak ahli teori permainan bersikeras bahwa kecurangan dan pelanggaran perjanjian adalah ciri umum hubungan manusia, sehingga perilaku seperti itu harus tetap berada dalam ruang strategis. Mereka mencoba menjelaskan kemunculan dan terpeliharanya kerjasama dalam model permainan non-kooperatif, khususnya dalam model permainan PD yang berulang tanpa batas. Urutan permainan terakhir tidak akan membuahkan hasil, karena sejak saat strategi dominan dalam permainan terakhir menjadi jelas-jelas memberontak, dan sejak saat hal itu diharapkan, hal yang sama juga berlaku untuk permainan kedua dari belakang, dan seterusnya, hingga permainan terakhir. permainan pertama. Dalam rangkaian permainan yang tak terbatas, dengan asumsi tertentu tentang pengurangan imbalan, kerja sama mungkin muncul sebagai strategi keseimbangan. Dengan demikian, analisis non-kooperatif tidak menghindari kebutuhan untuk menerima aturan dasar permainan sebagai bagian dari deskripsi ruang strategis. Ini hanya mengasumsikan seperangkat aturan yang berbeda dan tidak terlalu membatasi. Berbeda dengan analisis kooperatif, kesepakatan dapat dilanggar sesuka hati. Di sisi lain, jalan keluar dari permainan berkelanjutan terbatas. Tidak ada pendekatan yang menghindari kebutuhan untuk menentukan aturan main sebelum memulai analisis.

Salah satu perkembangan terbaru yang paling menarik dalam penelitian PD adalah pengorganisasian turnamen antara strategi yang telah ditentukan untuk melakukan permainan PD yang berulang-ulang dengan dua peserta. Yang pertama diorganisir oleh Robert Axelrod (dijelaskan pada tahun 1984) dan melibatkan permainan dalam rangkaian 200 permainan. Program komputer diusulkan oleh peserta yang berpengalaman di bidang penginderaan jauh, yang kemudian saling berkompetisi.

R. Axelrod memberi tahu para pemain bahwa strategi tidak akan dinilai berdasarkan jumlah kemenangan, tetapi berdasarkan jumlah poin terhadap semua strategi lainnya, dengan masing-masing menerima tiga poin untuk kerja sama, satu poin untuk saling membelot, dan skor 5 banding 0. menang karena pembelotan/kerja sama. Seperti disebutkan sebelumnya, secara analitis jelas bahwa pembelotan adalah strategi dominan pada game terakhir dan, oleh karena itu, pada setiap game sebelumnya.

Mari kita perhatikan matriks pembayaran dalam kendali jarak jauh, dianalisis oleh R. Axelrod 27 (Gbr. 2.3). Terlepas dari apa yang dilakukan pemain lain, pengkhianatan memiliki imbalan yang lebih tinggi daripada kerja sama. Jika pemain pertama berpikir bahwa pemain lain akan tetap diam, maka lebih menguntungkan baginya untuk berkhianat ($5>$3). Di sisi lain, jika pemain pertama mengira pemain lain akan berkhianat, masih lebih menguntungkan baginya untuk mengkhianati dirinya sendiri ($1 lebih baik daripada tidak sama sekali). Akibatnya, godaan mengarah pada pengkhianatan. Namun jika keduanya berkhianat, maka keduanya menerima lebih sedikit daripada dalam situasi kerja sama ($1+$1<$3+$3).

Pemain kedua

Bekerja sama

Pemain pertama

Bekerja sama

Beras. 2.3. Matriks imbalan dalam dilema narapidana

Dilema tahanan, sebuah masalah yang terkenal di bidang ekonomi, menunjukkan bahwa apa yang rasional atau optimal bagi satu agen belum tentu rasional atau optimal bagi sekelompok individu yang dipertimbangkan bersama. Perilaku egois yang dilakukan seseorang dapat merugikan atau merusak kelompok. Dalam permainan DM yang berulang, strategi yang tepat tidak jelas. Untuk menemukan strategi yang baik, turnamen diselenggarakan. Jika kemenangan harus diperoleh secara ketat berdasarkan menang-kalah, maka setiap peserta turnamen harus melakukan pembelotan terus menerus. Namun, peraturan yang menang memperjelas bahwa mengorganisir beberapa kerja sama dapat membawa hasil yang lebih tinggi secara keseluruhan. Yang mengejutkan banyak orang, strategi balas dendam sederhana yang diusulkan oleh A. Rapoport menang: pemain bekerja sama pada langkah pertama dan kemudian melakukan gerakan yang dilakukan pemain lain pada langkah sebelumnya.

Turnamen kedua menampilkan lebih banyak pemain, termasuk profesional, serta mereka yang mengetahui hasil putaran pertama. Hasilnya adalah kemenangan lain bagi strategi penyalinan (“tit for tat”).

Analisis hasil turnamen mengungkapkan empat sifat yang mengarah pada keberhasilan strategi: 1) keinginan untuk menghindari konflik yang tidak perlu dan bekerja sama selama pihak lain melakukannya; 2) kemampuan untuk menantang ketika menghadapi pengkhianatan yang tidak beralasan terhadap orang lain; 3) pengampunan setelah menjawab tantangan; 4) kejelasan perilaku sehingga pemain lain dapat mengenali dan beradaptasi dengan modus operandi pemain pertama.

R. Axelrod menunjukkan bahwa kerja sama dapat dimulai, berkembang, dan stabil dalam situasi yang luar biasa dan bukan pertanda baik. Orang mungkin setuju bahwa strategi balas dendam secara analitis tidak rasional dalam permainan yang diulang-ulang, namun secara empiris jelas tidak rasional. Jika strategi tit-for-tat bersaing dengan strategi analitis lainnya yang semuanya terdiri dari pembelotan terus menerus, maka tidak akan mampu memenangkan turnamen.

Teori permainan dapat menjadi alat penting untuk mempelajari interaksi manusia dalam keadaan yang terikat aturan. Karena kemampuannya untuk mempelajari konsekuensi dari pengaturan kelembagaan yang berbeda, hal ini juga dapat berguna dari sudut pandang kebijakan publik dalam merancang pengaturan kelembagaan baru. Teori permainan telah digunakan dalam analisis barang publik, oligopoli, kartel, dan kolusi di pasar barang dan tenaga kerja. Terlepas dari segala kelebihannya, teori permainan juga memiliki kelemahan relatif. Beberapa penulis telah menyatakan keraguannya terhadap penerapan model dilema narapidana dalam ilmu sosial. Misalnya, M. Taylor pada tahun 1987 mengemukakan bahwa permainan semacam itu sesuai dengan keadaan penyediaan barang publik. Pada tahun 1985, N. Schofield berpendapat bahwa agen harus membentuk konsep yang koheren tentang keyakinan dan keinginan agen lain, yang melibatkan masalah kognisi dan interpretasi yang tidak mudah untuk dimodelkan28 . Banyak ekonom mencatat bahwa penggunaan teori permainan tanpa kualifikasi dapat mengurangi aktivitas ekonomi ke pola yang terlalu statis. Secara khusus, peraih Nobel R. Stone menulis pada tahun 1948: “Ciri utama yang menyebabkan teori permainan bertentangan dengan kenyataan hidup adalah bahwa objek penelitiannya terbatas dalam waktu - permainan memiliki awal dan akhir. Hal yang sama tidak dapat dikatakan mengenai realitas ekonomi. Justru pada kemampuan untuk mengisolasi “permainan” dari “permainan” itulah letak kesenjangan yang mendalam antara teori dan kenyataan, dan kesenjangan ini membatasi penerapannya”29 . Namun, sejak saat itu, banyak yang telah dilakukan untuk mengatasi kesenjangan ini dan memperluas penerapan teori permainan di bidang ekonomi.

Ekonomi Eksperimental. Pendekatan metodologis lain yang digunakan untuk menguji postulat teori ekonomi dan ilmu-ilmu terkait, serta menjelaskan permasalahan kelembagaan, adalah ekonomi eksperimental. Dampak lembaga yang dirancang terhadap efisiensi alokasi sumber daya tidak selalu dapat diprediksi sebelumnya. Salah satu pilihan untuk menghemat biaya ex post adalah dengan mensimulasikan kerja lembaga dalam kondisi laboratorium.

Secara umum, eksperimen ekonomi adalah reproduksi suatu fenomena atau proses ekonomi dengan tujuan mempelajarinya dalam kondisi yang paling menguntungkan dan perubahan praktis lebih lanjut. Eksperimen yang dilakukan dalam kondisi nyata disebut eksperimen alami atau lapangan, dan eksperimen yang dilakukan dalam kondisi buatan disebut eksperimen laboratorium. Yang terakhir ini seringkali memerlukan penggunaan metode dan model ekonomi dan matematika. Eksperimen alami dapat dilakukan di tingkat mikro (eksperimen R. Owen, F. Taylor, tentang pengenalan pembiayaan mandiri di suatu perusahaan, dll.) dan di tingkat makro (opsi kebijakan ekonomi, zona ekonomi bebas, dll.) .). Eksperimen laboratorium adalah situasi ekonomi yang direproduksi secara artifisial, model ekonomi tertentu, yang lingkungannya (kondisi eksperimen) dikendalikan oleh peneliti di laboratorium.

Ekonom Amerika El. Roth, sejak akhir tahun 70an. bekerja di bidang ekonomi eksperimental, mencatat sejumlah keunggulan eksperimen laboratorium dibandingkan eksperimen “lapangan” 30. Dalam kondisi laboratorium, kendali penuh oleh pelaku eksperimen terhadap lingkungan dan perilaku subjek dimungkinkan, sedangkan dalam eksperimen “lapangan” dimungkinkan untuk mengontrol hanya sejumlah kecil faktor lingkungan dan hampir tidak mungkin untuk mengontrol perilaku subjek ekonomi. Karena itulah eksperimen laboratorium memungkinkan untuk menentukan secara lebih akurat kondisi di mana fenomena tertentu diperkirakan akan terulang kembali. Selain itu, eksperimen alam membutuhkan biaya yang mahal dan, jika gagal, akan berdampak pada kehidupan banyak orang.

Bidang minat ilmu ekonomi eksperimental cukup luas: ketentuan teori permainan, teori pasar industri, model pilihan rasional, fenomena keseimbangan pasar, masalah barang publik, dll.

Sebagai contoh, mari kita lihat hasil studi tentang efektivitas komparatif lembaga pasar yang diterbitkan oleh C.A. Holt dan dibawakan oleh A.E. Shastitko 31. Studi ini membandingkan temuan model pasar teoritis dan eksperimental yang diperoleh melalui eksperimen terkontrol. Hasil perilaku agen diukur dengan menggunakan koefisien deplesi dari jumlah potensi sewa pembeli dan penjual, yang sesuai dengan efisiensi pertukaran. Koefisien kelelahan - rasio sewa yang sebenarnya (secara eksperimental) diterima dengan nilai maksimum yang mungkin - bervariasi dari 0 hingga 1. Perbandingan dilakukan dengan menggunakan bentuk pasar berikut: lelang bilateral, perdagangan berdasarkan penawaran harga dari salah satu pihak, clearing house, negosiasi harga terdesentralisasi, perdagangan berdasarkan aplikasi yang diikuti dengan negosiasi. Hasil eksperimen yang paling menarik diperoleh oleh kelompok peneliti yang berbeda pada dua bentuk pasar pertama (Tabel 2.1).

Teori permainan

1. Pokok bahasan dan tugas teori permainan, konsep permainan.

2. Konsep dasar teori permainan.

3. Klasifikasi permainan.

Permainan matriks antagonis: strategi murni dan campuran.

4. Metode penyelesaian permainan berhingga: mereduksi permainan mxn menjadi masalah pemrograman linier, metode numerik - metode iterasi.

Pokok bahasan dan tugas teori permainan, konsep permainan.

Dalam kegiatan praktis, sering kali perlu mempertimbangkan fenomena dan situasi di mana dua (atau lebih) pihak yang mempunyai kepentingan berbeda dan mampu menggunakan berbagai tindakan untuk mencapai tujuan mereka berpartisipasi. Fenomena dan situasi seperti itu biasa disebut konflik, atau sekadar konflik.

Misalnya, seorang siswa datang ke ujian, mengeluarkan tiket dan... situasi konflik muncul. Tindakan para pihak - siswa dan guru - berbeda, dan kepentingan mereka tidak sama dalam segala hal. Para perampok membagi rampasan - konflik lagi.

Konflik yang khas dicirikan oleh tiga komponen utama: pihak-pihak yang terlibat, kepentingan pihak-pihak tersebut, dan kemungkinan tindakan mereka.

Situasi konflik apa pun, diambil dari kehidupan nyata, itu rumit. Terlebih lagi, kajiannya menjadi rumit karena terdapat banyak keadaan yang sangat berbeda, beberapa di antaranya tidak mempunyai dampak signifikan terhadap perkembangan konflik atau dampaknya.

Sifat spesifik dari suatu kegiatan sering kali sedemikian rupa sehingga faktor-faktor yang diperhitungkan ketika mengambil keputusan seringkali memiliki apa yang disebut sifat ketidakpastian, karena tidak mungkin untuk menentukan terlebih dahulu dengan tepat berapa nilai dari suatu faktor atau indikator tertentu. Oleh karena itu, hasil keputusan juga akan bersifat ketidakpastian.

Misalnya,

Volume penjualan sangat bergantung pada permintaan penduduk terhadap produk tertentu.

Tuntutan, seperti diketahui, ini adalah besaran acak, oleh karena itu, nilainya memiliki penyebaran tertentu dan justru tidak pasti.

Ketidakpastian nilai berbagai faktor mengarah pada fakta bahwa rekomendasi untuk memecahkan masalah tidak bisa sejelas dan sejelas dalam kasus yang benar-benar pasti.

Dalam proses mencari solusi, mungkin pilihan keputusan. Oleh karena itu, pengambilan keputusan adalah dalam memilih opsi terbaik dari opsi yang tersedia.

Pengambil keputusan adalah individu (atau kelompok) dalam kehidupan nyata yang tidak puas dengan keadaan atau prospek perkembangan mereka di masa depan dan mempunyai wewenang untuk bertindak sedemikian rupa untuk mengubah keadaan ini.

Saat ini, metode matematika khusus telah dikembangkan untuk membenarkan keputusan dalam kondisi ketidakpastian.

Dalam beberapa kasus paling sederhana, metode ini memungkinkan Anda menemukan banyak solusi dan memilih solusi terbaik.

Dalam kasus yang lebih kompleks, metode ini memberikan bahan tambahan yang memungkinkan seseorang untuk lebih memahami esensi fenomena dan mengevaluasi setiap solusi yang mungkin dari sudut pandang yang berbeda, menimbang kelebihan dan kekurangannya dan pada akhirnya membuat, jika bukan satu-satunya yang benar, maka di paling tidak mendekati solusi optimal.

Perlu dicatat bahwa ketika memilih solusi dalam kondisi ketidakpastian, unsur kesewenang-wenangan, dan akibatnya, risiko, selalu tidak dapat dihindari. Kurangnya informasi selalu berbahaya, dan ada harga yang harus dibayar untuk itu. Oleh karena itu, dalam situasi yang sulit, pilihan solusi dan konsekuensinya perlu dihadirkan sedemikian rupa sehingga kesewenang-wenangan dalam memilih menjadi kurang kuat dan risikonya minimal.

Selain itu, dalam aktivitas komersial, seseorang harus mengambil keputusan ketika ada pertentangan dari pihak lain, yang mungkin mengejar tujuan yang berlawanan atau tujuan lain, mencari cara lain untuk mencapai tujuan, atau mencegah tindakan atau keadaan lingkungan eksternal tertentu untuk mencapai tujuan tersebut. tujuan yang dimaksudkan. Selain itu, perlawanan dari pihak lawan ini bisa bersifat pasif atau aktif. Dalam kasus seperti itu, perlu untuk mempertimbangkan kemungkinan perilaku pihak lawan, tindakan respons, kemungkinan reaksi, dan, karenanya, hasil.

Pilihan perilaku yang mungkin bagi kedua belah pihak dan hasilnya untuk setiap kombinasi alternatif dan keadaan dapat direpresentasikan dalam bentuk model matematika yang disebut permainan.

Jika yang sebaliknya adalah pihak yang tidak aktif, pasif, yang jelas-jelas tidak aktif menentang pencapaian tujuan yang diinginkan, maka permainan seperti itu disebut permainan dengan “alam”.

Sisi dalam perdagangan tersebut adalah perilaku pelanggan yang tidak diketahui, reaksi masyarakat terhadap jenis barang baru, ketidakpastian kondisi cuaca saat mengangkut barang atau mengadakan pameran, kurangnya kesadaran akan operasi komersial, pembelian, transaksi, dll.

Dalam situasi lain, pihak lawan mungkin secara aktif dan sadar menolak mencapai tujuan yang diinginkan. Dalam kasus seperti ini, terjadi benturan kepentingan, pendapat, dan tujuan yang berlawanan.

Situasi seperti ini disebut bertentangan, dan pengambilan keputusan dalam situasi konflik menjadi sulit karena ketidakpastian perilaku musuh.

Diketahui bahwa musuh dengan sengaja berusaha mengambil tindakan yang paling tidak menguntungkan Anda untuk memastikan kesuksesan terbesar.

Tidak diketahui sejauh mana musuh mengetahui bagaimana menilai situasi dan kemungkinan konsekuensinya, bagaimana dia menilai kemampuan dan niat Anda.

Kedua pihak yang berkonflik tidak dapat secara akurat memprediksi tindakan timbal balik. Meskipun ada ketidakpastian, masing-masing pihak yang berkonflik harus mengambil keputusan.

Kebutuhan untuk membenarkan keputusan yang optimal dalam situasi konflik menyebabkan munculnya teori permainan.

Teori permainan adalah teori matematika tentang situasi konflik.

Keterbatasan utama teori ini adalah asumsi rasionalitas musuh yang “ideal” dan pengambilan keputusan yang paling hati-hati dalam menyelesaikan konflik.

Konsep dasar yang digunakan dalam teori permainan.

Pihak-pihak yang berkonflik disebut pemain, satu pelaksanaan permainan - berdasarkan pihak, Hasil dari permainan ini adalah menang atau kalah.

Perkembangan permainan dari waktu ke waktu terjadi secara berurutan, bertahap atau bergerak. Sedang bepergian dalam teori permainan yang mereka sebut pemilihan salah satu tindakan yang ditentukan oleh aturan permainan dan pelaksanaannya.

Gerakan bersifat pribadi dan acak.

Sendiri sebut pilihan sadar pemain atas salah satu opsi tindakan yang mungkin dan implementasinya.

Gerakan acak mereka menyebut pilihan yang dibuat bukan berdasarkan keputusan kemauan pemain, tetapi oleh beberapa mekanisme pilihan acak (melempar koin, mengoper, membagikan kartu, dll.).

Salah satu konsep dasar teori permainan adalah strategi.

Strategi pemain adalah seperangkat aturan yang menentukan pilihan tindakan untuk setiap gerakan pribadi pemain ini, tergantung pada situasi yang muncul selama permainan.

Strategi optimal pemain adalah strategi yang, jika diulang berkali-kali dalam permainan yang berisi gerakan pribadi dan acak, akan memberikan pemain rata-rata kemenangan maksimum yang mungkin atau rata-rata kerugian minimum yang mungkin terjadi.

Salah satu bentuk penerapan gagasan optimalitas yang bermanfaat dapat dianggap sebagai konsep keseimbangan, di mana situasi (keseimbangan) berkembang di mana tidak ada pemain yang tertarik untuk melanggarnya.

Ini adalah situasi keseimbangan dapat menjadi subjek perjanjian yang stabil antar pemain (tidak ada pemain yang memiliki insentif untuk melanggar perjanjian). Selain itu, situasi seperti ini bermanfaat bagi setiap pemain: dalam situasi keseimbangan, setiap pemain menerima pembayaran terbesar (tentu saja, sejauh hal ini bergantung padanya).

Jika tidak ada situasi keseimbangan dalam permainan (dalam kemungkinan yang tersedia), maka, dengan tetap berada dalam kondisi strategi yang tersedia bagi para pemain, kita dihadapkan pada masalah yang tidak dapat dipecahkan.

Ketika kasus-kasus seperti itu muncul, wajar untuk mengajukan pertanyaan tentang perluasan konsep awal strategi sedemikian rupa sehingga di antara situasi-situasi yang terdiri dari strategi-strategi baru, dalam satu atau lain cara yang digeneralisasikan, keseimbangan pasti akan ditemukan.

Jika strategi umum seperti itu ada, maka strategi tersebut biasanya diwakili oleh beberapa kombinasi dari strategi aslinya (tentu saja, diasumsikan bahwa permainan tersebut diulang berkali-kali).

Untuk membedakan strategi lama dari strategi baru, strategi lama disebut strategi murni, dan strategi campuran disebut strategi kedua.

Dalam sebagian besar situasi konflik, ketika memilih strategi yang masuk akal, Anda harus mempertimbangkan bukan hanya satu, tetapi beberapa indikator dan faktor. Selain itu, strategi yang optimal untuk satu indikator belum tentu optimal untuk indikator lainnya.

Studi tentang permainan dapat dilakukan dari berbagai sudut pandang. Kami akan berusaha untuk itu

~ pengembangan prinsip optimalitas, yaitu perilaku pemain seperti apa yang dianggap wajar atau pantas,

~ memperjelas kelayakan prinsip-prinsip ini, yaitu menetapkan adanya situasi optimal dalam pengertian yang dikembangkan dan

~ menemukan realisasi ini.

Jadi, konsep dasar yang terkait dengan permainan antara lain:

permainan, pemain, permainan, menang, kalah, gerakan, gerakan pribadi dan acak, permainan strategis, strategi, strategi optimal, dll.

Klasifikasi permainan.

Tergantung pada alasan yang menyebabkan ketidakpastian hasil, permainan dapat dibagi menjadi beberapa kelompok utama berikut:

- permainan kombinatorial, di mana aturan pada prinsipnya memberikan kesempatan bagi setiap pemain untuk menganalisis semua opsi yang berbeda untuk perilakunya dan, setelah membandingkan opsi ini, memilih salah satu yang memberikan hasil terbaik untuk pemain tersebut. Ketidakpastian hasil biasanya disebabkan oleh fakta bahwa jumlah kemungkinan pilihan perilaku (gerakan) terlalu besar dan pemain praktis tidak dapat memilah dan menganalisis semuanya;

- berjudi, di mana hasilnya tidak pasti karena pengaruh berbagai faktor acak. Permainan judi hanya terdiri dari gerakan acak yang analisisnya menggunakan teori probabilitas. Teori permainan tidak berkaitan dengan perjudian;

- permainan strategi, di mana ketidakpastian total dari hasil disebabkan oleh fakta bahwa masing-masing pemain, ketika memutuskan langkah yang akan datang, tidak mengetahui strategi apa yang akan diikuti oleh peserta lain dalam permainan, dan ketidaktahuan pemain tentang perilaku dan niatnya. mitranya sangat penting, karena tidak ada informasi tentang tindakan selanjutnya dari musuh (mitra).

Ada permainan yang menggabungkan sifat-sifat permainan kombinatorial dan perjudian; sifat permainan yang strategis dapat dikombinasikan dengan kombinatorialitas, dll.

Kepentingan dua pemain atau lebih mungkin bertabrakan dalam permainan.

Bila permainan itu melibatkan dua orang pemain, maka permainan itu disebut ganda, dan bila jumlah pemainnya lebih dari dua, disebut kelipatan.

Peserta dalam beberapa permainan dapat membentuk koalisi (permanen atau sementara). Permainan berganda dengan dua koalisi permanen berubah menjadi permainan ganda.

Permainan berpasangan mendapatkan distribusi terbesar dalam praktik analisis situasi permainan.

Bergantung pada jumlah strategi yang mungkin, permainan dibagi menjadi terbatas dan tidak terbatas.

Permainan ini disebut terbatas, jika setiap pemain hanya memiliki sejumlah strategi yang terbatas. Permainan ini disebut tanpa akhir, jika setidaknya satu pemain memiliki jumlah strategi yang tidak terbatas.

Permainan juga dibedakan berdasarkan jumlah kemenangan.

Permainan itu disebut permainan jumlah nol, jika masing-masing pemain menang dengan mengorbankan pemain lain, dan jumlah kemenangan satu pihak sama dengan kekalahan pihak lain. Dalam permainan ganda zero-sum, kepentingan para pemain ditentang secara langsung.

Permainan zero-sum disebut permainan antagonis.

Paling banyak dipelajari dalam teori permainan permainan antagonis. Permainan yang keuntungan satu pemain dan kerugian pemain lainnya tidak sama disebut permainan dengan jumlah bukan nol.

Bergantung pada jumlah gerakan yang dilakukan pemain untuk mencapai tujuan mereka, permainan bisa berupa satu langkah atau banyak langkah.

Permainan satu langkah terdiri dari fakta bahwa pemain memilih salah satu strategi yang tersedia baginya dan hanya melakukan satu gerakan.

Dalam permainan multi-langkah Untuk mencapai tujuannya, pemain melakukan serangkaian gerakan berurutan, yang mungkin diakhiri dengan aturan permainan atau dapat berlanjut hingga salah satu pemain tidak memiliki sumber daya tersisa untuk melanjutkan permainan.

Baru-baru ini, yang disebut permainan bisnis.

Permainan bisnis meniru interaksi orang-orang dan memanifestasikan dirinya sebagai latihan pengambilan banyak keputusan secara berurutan, berdasarkan beberapa model aktivitas komersial dan pada kinerja peran dan posisi tertentu oleh para peserta dalam permainan.

Permainan bisnis meniru interaksi organisasi dan ekonomi di berbagai tingkat organisasi dan perusahaan komersial.

Unsur-unsur model permainan adalah: peserta permainan; aturan main; susunan informasi yang mencerminkan keadaan dan pergerakan sumber daya dari sistem ekonomi yang dimodelkan.

Kelebihan simulasi permainan dibandingkan objek nyata adalah sebagai berikut::

Visibilitas konsekuensi dari keputusan yang diambil, skala waktu yang bervariasi;

Pengulangan pengalaman yang ada dengan perubahan pengaturan;

Skala variabel cakupan fenomena dan objek komersial.

Area utama penggunaan permainan bisnis adalah sebagai berikut:

Proses pendidikan, seperti pelatihan simulasi transaksi komersial;

Sertifikasi personel, verifikasi kompetensinya;

Penelitian ilmiah;

Pengembangan rencana bisnis.

Dalam permainan bisnis, pemain biasanya diberikan kondisi awal di mana mereka berada, aturan permainan dikomunikasikan, pilihan untuk keputusan yang mungkin disajikan, dan konsekuensinya dinilai.

Permainan harus memiliki “pemimpin” yang mengarahkan permainan, mengevaluasi keputusan yang dibuat oleh para pemain, keadaan di mana mereka berada selama permainan, dan menentukan menang dan kalah berdasarkan hasil permainan.

Daftar game yang ada saat ini masih jauh dari lengkap.

Pertanyaan utama teori permainan yang muncul dalam aktivitas komersial adalah:

1. Bagaimana perilaku optimal setiap pemain dalam permainan, sifat strategi apa yang harus diperhatikan sebagai tanda optimalitas;

2. Apakah ada strategi pemain yang memiliki atribut optimalitas;

3. Jika ada strategi optimal, bagaimana cara menemukannya?


Informasi terkait.