Dylemat więźnia

Dylemat więźnia
Polecane artykuły

Dylemat więźnia

Jest to przykład gry o sumie niezerowej. Występuje w niej kooperacja pomiędzy dwoma osobami lub takżę grupami ludzi. Jest to współpraca, która polega na jednoczesnym i naprzemiennej konkurencji. Otrzymała miano koopetycji (co-opetition). Gra ta jest odzwierciedleniem wspólnego działania i wzajemnego zaufania (dylemat wspólnych zasobów). Ukazuje konflikt między wspólnym interesem a indywidualną racjonalnością. Występuje wszędzie tam, gdzie różne podmioty gospodarcze eksploatują pewien dostępny dla wszystkich zasób.Przez brak zdolności do kooperacji, a szczególnie wzajemnego zaufania traci społeczna efektywność systemu.[1]

Według Jana Powolczyka "jeżeli gracze grają tylko raz, to mają skłonność do oszukiwania. Gdy gra jest powtarzana i nikt nie wie, kiedy się zakończy, to zachowania stają się bardziej złożone. Oszukujący może być karany przez oszukiwanego, nawet, jeżeli ten ostatni ponosi związane z tym koszty. Po okresie rywalizacji, gracze ponownie mogą wrócić do współpracy w nadziei na korzyści i z wiarą, że tym razem partner, po zrozumieniu swoich błędów, będzie grał uczciwie. W przypadku ponownego oszustwa szanse na wybaczenie radykalnie spadną, a rewanż może być jeszcze bardziej srogi. Dylemat więźnia jest dobrym przykładem gry bez współpracy – tylko w sytuacji współpracy pomiędzy obydwoma graczami w tej grze mogą oni osiągnąć całkowite minimum wyroku. Natomiast bez współpracy nie mogą oni rozważać wspólnej strategii, a jedynie indywidualne, w ramach których wybierają najlepszą dla siebie opcję, w warunkach braku wiedzy o wyborze strategii dokonanym przez drugiego gracza."[2]

Ujęcie modelowe Podstawowy problem sformułował A. Tucker w latach pięćdziesiątych. W późniejszych latach model był wykorzystywany między innymi w RAND Corporation. Jest to ogólny model takich sytuacji konfliktowych, w których zdradzenie drugiego uczestnika gry i wykorzystanie jego zaufania jest zachowaniem racjonalnym. "Czy w świecie egoistów w ogóle mogą pojawić się zachowania kooperacyjne?" - jest to pytanie, które stanowi istotę dylematu. Już od kilkudziesięciu lat co roku publikuje się na ten temat od kilkudziesięciu do kilkuset opracowań naukowych, w których takie sytuacje poddawane są analizie.[3]

Przykład dylematu więźnia

Dwóch ludzi popełniło przestępstwo, lecz brak na to dowodów, zaś policja złapała ich i umieściła w dwóch osobnych celach. Ponieważ nie ma dowodów popełnienia przez nich przestępstwa, nie można im udowodnić winy. Dlatego policja stara się nakłonić ich do zeznań przeciwko sobie. Każdemu z więźniów dano dwie możliwości: przyznać się do popełnienia przestępstwa, albo zaprzeczyć. Jeśli więzień I się przyzna, lecz więzień II zaprzeczy, to wówczas więzień I będzie występował w roli świadka przeciwko drugiemu i nie zostanie ukarany więzieniem, natomiast wówczas drugi więzień dostanie pełny wyrok 10 lat więzienia (i vice versa). Jeśli obaj się przyznają, to obydwaj dostaną po 5 lat odsiadki, ponieważ wówczas policja będzie miała dowody przeciwko obydwu. Jeśli obydwaj zaprzeczą oskarżeniu, że popełnili przestępstwo, to nie będzie na to dowodów, więc dostaną tylko po roku więzienia, za brawurową ucieczkę samochodem przed policją. Sytuację tę można przedstawić przy pomocy następującej tabelki (macierzy):

I/II Przyznać się Zaprzeczyć
Przyznać się 5,5 0,10
Zaprzeczyć 10,0 1,1


Taka tabelka jest typowym sposobem przedstawiania gry, w której uczestniczy dwóch graczy posiadających skończoną liczbę strategii. Pierwsza liczba przed przecinkiem oznacza wypłatę (wyrok) dla gracza I, zaś druga liczba oznacza wypłatę dla gracza II. Każdy wiersz reprezentuje strategię gracza I, zaś każda kolumna określa pewną strategię gracza II. Zatem prawa dolna komórka oznacza, że jeśli gracz I zaprzeczy oraz gracz II zaprzeczy, to wyrok (wypłata) dla obydwu graczy wynosi 1 rok. Przeprowadźmy teraz analizę tej gry z perspektywy gracza I. Chce on zminimalizować wyrok, ale nie wie, czy gracz II zamierza przyznać się, czy też zaprzeczyć. W związku z tym gracz I rozważa dwie sytuacje:

a) Jeśli gracz II się przyzna: W tej sytuacji przyznanie się przez gracza I daje 5 lat więzienia, podczas zaprzeczanie doprowadzi do 10 lat więzienia. Zatem lepiej się przyznać.

b) Jeśli gracz II zaprzeczy: W tej sytuacji przyznanie się przez gracza I daje 0 lat więzienia (wolność za bycie świadkiem oskarżenia), podczas gdy zaprzeczanie spowoduje 1 rok więzienia. Zatem w tej sytuacji również lepiej się przyznać.

Ponieważ gracz I jest graczem racjonalnym i chce zminimalizować swoją wypłatę, przyzna się do winy. Co ciekawe, ponieważ gracz II jest również graczem racjonalnym, zaś sytuacja jest symetryczna (co jest wyrażone w symetrii powyższej tabelki), to również on się przyzna. Paradoks tej sytuacji polega na tym, że jeśli obydwaj postąpią zgodnie ze swoją racjonalnością, to dostaną po pięć lat, zaś gdyby obydwaj zaprzeczyli, to dostaliby tylko po roku. Jednak żaden z nich nie wie, jak postąpi drugi, dlatego też wybór każdego z nich był najbardziej racjonalny. Dylemat więźnia jest dobrym przykładem gry bez współpracy – tylko w sytuacji współpracy pomiędzy obydwoma graczami w tej grze mogą oni osiągnąć całkowite minimum wyroku. Natomiast bez współpracy nie mogą oni rozważać wspólnej strategii, a jedynie indywidualne, w ramach których wybierają najlepszą dla siebie opcję, w warunkach braku wiedzy o wyborze strategii dokonanym przez drugiego gracza. Korzystając teraz z teorii prawdopodobieństwa, możemy policzyć ile wynosi oczekiwana liczba lat odsiadki w więzieniu, w zależności od prawdopodobieństwa przypisywanego przez jednego gracza poszczególnym decyzjom które może dokonać drugi gracz.

Jeśli gracz I zakłada, że są równe szanse na przyznanie się lub zaprzeczenie przez gracza II oraz przez samego siebie, to obydwu decyzjom każdego z nich przypisze prawdopodobieństwo 0.5. Wówczas może policzyć oczekiwaną liczbę lat swojej odsiadki jako:


szansa, że I się przyzna * szansa, że II się przyzna * wypłata dla gracza I + szansa, że I się nie przyzna * szansa, że II się przyzna * wypłata dla gracza I + szansa, że I się przyzna * szansa, że II się nie przyzna * wypłata dla gracza I + szansa, że I się nie przyzna * szansa, że II się nie przyzna * wypłata dla gracza I, czyli:


0.5 * 0.5 * 5 + 0.5 * 0.5 * 10 + 0.5 * 0.5 * 1 + 0.5 * 0.5 * 0 = 0.5 * 0.5 * (5+10+1+0) = 4.


Jeśli jednak gracz I zakłada, że jest 60% szans na to zaprzeczy i 40% na to, że się przyzna, to (przyjmując 50% szans obydwu możliwościom decyzji II gracza) oczekiwana liczba lat odsiadki I gracza wynosi:


0.5 * 0.4 * 5 + 0.5 * 0.6 * 10 + 0.5 * 0.4 * 0 + 0.5 * 0.6 * 1 = 4.3.


Widać wyraźnie, że im bardziej gracz I chce zaprzeczyć, tym bardziej jego oczekiwany wyrok rośnie, i odwrotnie: jego wyrok maleje tym bardziej, im jest większa szansa, że się przyzna.[4]


Bibliografia

Przypisy

  1. K.Nowakowski 2008, s.215
  2. J.Polowczyk 2018, s.9
  3. Z.J. Pietraś 2000, s. 229
  4. R.P.Kostecki 2018, s.3

Autor: Aleksandra Kotapka