Dylemat więźnia: Różnice pomiędzy wersjami
m (Dodanie MetaData Description) |
m (cleanup bibliografii i rotten links) |
||
Linia 13: | Linia 13: | ||
</ul> | </ul> | ||
}} | }} | ||
==TL;DR== | ==TL;DR== | ||
Dylemat więźnia to przykład gry o sumie niezerowej, w której występuje konflikt między wspólnym interesem a indywidualną racjonalnością. Przykładem jest sytuacja, w której dwóch więźniów musi zdecydować, czy się przyznać do przestępstwa czy zaprzeczyć. Optymalnym wyborem dla każdego z nich jest przyznanie się, co prowadzi do równego podziału kary. Jednakże, gdyby obaj zaprzeczyli, dostaliby mniejszą karę. Dylemat więźnia pokazuje, że brak współpracy prowadzi do gorszych wyników dla obu stron. | Dylemat więźnia to przykład gry o sumie niezerowej, w której występuje konflikt między wspólnym interesem a indywidualną racjonalnością. Przykładem jest sytuacja, w której dwóch więźniów musi zdecydować, czy się przyznać do przestępstwa czy zaprzeczyć. Optymalnym wyborem dla każdego z nich jest przyznanie się, co prowadzi do równego podziału kary. Jednakże, gdyby obaj zaprzeczyli, dostaliby mniejszą karę. Dylemat więźnia pokazuje, że brak współpracy prowadzi do gorszych wyników dla obu stron. | ||
== Dylemat więźnia == | == Dylemat więźnia == | ||
Jest to przykład gry o sumie niezerowej. Występuje w niej [[kooperacja]] pomiędzy dwoma osobami lub takżę grupami ludzi. Jest to współ[[praca]], która polega na jednoczesnym i naprzemiennej [[konkurencja|konkurencji]]. Otrzymała miano koopetycji (co-opetition). | Jest to przykład gry o sumie niezerowej. Występuje w niej [[kooperacja]] pomiędzy dwoma osobami lub takżę grupami ludzi. Jest to współ[[praca]], która polega na jednoczesnym i naprzemiennej [[konkurencja|konkurencji]]. Otrzymała miano koopetycji (co-opetition). | ||
Linia 47: | Linia 46: | ||
| '''1,1''' | | '''1,1''' | ||
|} | |} | ||
Taka tabelka jest typowym sposobem przedstawiania gry, w której uczestniczy dwóch graczy posiadających skończoną liczbę strategii. Pierwsza liczba przed przecinkiem oznacza wypłatę (wyrok) dla gracza I, zaś druga liczba oznacza wypłatę dla gracza II. Każdy wiersz reprezentuje strategię gracza I, zaś każda kolumna określa pewną strategię gracza II. Zatem prawa dolna komórka oznacza, że jeśli gracz I zaprzeczy oraz gracz II zaprzeczy, to wyrok (wypłata) dla obydwu graczy wynosi 1 rok. | Taka tabelka jest typowym sposobem przedstawiania gry, w której uczestniczy dwóch graczy posiadających skończoną liczbę strategii. Pierwsza liczba przed przecinkiem oznacza wypłatę (wyrok) dla gracza I, zaś druga liczba oznacza wypłatę dla gracza II. Każdy wiersz reprezentuje strategię gracza I, zaś każda kolumna określa pewną strategię gracza II. Zatem prawa dolna komórka oznacza, że jeśli gracz I zaprzeczy oraz gracz II zaprzeczy, to wyrok (wypłata) dla obydwu graczy wynosi 1 rok. | ||
Linia 56: | Linia 54: | ||
b) Jeśli gracz II zaprzeczy: W tej sytuacji przyznanie się przez gracza I daje 0 lat więzienia (wolność za bycie świadkiem oskarżenia), podczas gdy zaprzeczanie spowoduje 1 rok więzienia. Zatem w tej sytuacji również lepiej się przyznać. | b) Jeśli gracz II zaprzeczy: W tej sytuacji przyznanie się przez gracza I daje 0 lat więzienia (wolność za bycie świadkiem oskarżenia), podczas gdy zaprzeczanie spowoduje 1 rok więzienia. Zatem w tej sytuacji również lepiej się przyznać. | ||
Ponieważ gracz I jest graczem racjonalnym i chce zminimalizować swoją wypłatę, przyzna się do winy. Co ciekawe, ponieważ gracz II jest również graczem racjonalnym, zaś sytuacja jest symetryczna (co jest wyrażone w symetrii powyższej tabelki), to również on się przyzna. [[Paradoks]] tej sytuacji polega na tym, że jeśli obydwaj postąpią zgodnie ze swoją racjonalnością, to dostaną po pięć lat, zaś gdyby obydwaj zaprzeczyli, to dostaliby tylko po roku. Jednak żaden z nich nie wie, jak postąpi drugi, dlatego też wybór każdego z nich był najbardziej racjonalny. Dylemat więźnia jest dobrym przykładem gry bez współpracy – tylko w sytuacji współpracy pomiędzy obydwoma graczami w tej grze mogą oni osiągnąć całkowite minimum wyroku. Natomiast bez współpracy nie mogą oni rozważać wspólnej strategii, a jedynie indywidualne, w ramach których wybierają najlepszą dla siebie opcję, w warunkach braku wiedzy o wyborze strategii dokonanym przez drugiego gracza. Korzystając teraz z teorii prawdopodobieństwa, możemy policzyć ile wynosi oczekiwana liczba lat odsiadki w więzieniu, w zależności od [[Prawdopodobieństwo|prawdopodobieństwa]] przypisywanego przez jednego gracza poszczególnym decyzjom które może dokonać drugi gracz. | Ponieważ gracz I jest graczem racjonalnym i chce zminimalizować swoją wypłatę, przyzna się do winy. Co ciekawe, ponieważ gracz II jest również graczem racjonalnym, zaś sytuacja jest symetryczna (co jest wyrażone w symetrii powyższej tabelki), to również on się przyzna. [[Paradoks]] tej sytuacji polega na tym, że jeśli obydwaj postąpią zgodnie ze swoją racjonalnością, to dostaną po pięć lat, zaś gdyby obydwaj zaprzeczyli, to dostaliby tylko po roku. Jednak żaden z nich nie wie, jak postąpi drugi, dlatego też wybór każdego z nich był najbardziej racjonalny. Dylemat więźnia jest dobrym przykładem gry bez współpracy – tylko w sytuacji współpracy pomiędzy obydwoma graczami w tej grze mogą oni osiągnąć całkowite minimum wyroku. Natomiast bez współpracy nie mogą oni rozważać wspólnej strategii, a jedynie indywidualne, w ramach których wybierają najlepszą dla siebie opcję, w warunkach braku wiedzy o wyborze strategii dokonanym przez drugiego gracza. Korzystając teraz z teorii prawdopodobieństwa, możemy policzyć ile wynosi oczekiwana liczba lat odsiadki w więzieniu, w zależności od [[Prawdopodobieństwo|prawdopodobieństwa]] przypisywanego przez jednego gracza poszczególnym decyzjom które może dokonać drugi gracz. | ||
'''Jeśli gracz I zakłada, że są równe szanse na przyznanie się lub zaprzeczenie przez gracza II oraz przez samego siebie, to obydwu decyzjom każdego z nich przypisze [[prawdopodobieństwo]] 0.5. Wówczas może policzyć oczekiwaną liczbę lat swojej odsiadki jako:''' | '''Jeśli gracz I zakłada, że są równe szanse na przyznanie się lub zaprzeczenie przez gracza II oraz przez samego siebie, to obydwu decyzjom każdego z nich przypisze [[prawdopodobieństwo]] 0.5. Wówczas może policzyć oczekiwaną liczbę lat swojej odsiadki jako:''' | ||
szansa, że I się przyzna * szansa, że II się przyzna * wypłata dla gracza I + szansa, że I się | szansa, że I się przyzna * szansa, że II się przyzna * wypłata dla gracza I + szansa, że I się | ||
Linia 65: | Linia 62: | ||
szansa, że II się nie przyzna * wypłata dla gracza I + szansa, że I się nie przyzna * szansa, | szansa, że II się nie przyzna * wypłata dla gracza I + szansa, że I się nie przyzna * szansa, | ||
że II się nie przyzna * wypłata dla gracza I, czyli: | że II się nie przyzna * wypłata dla gracza I, czyli: | ||
0.5 * 0.5 * 5 + 0.5 * 0.5 * 10 + 0.5 * 0.5 * 1 + 0.5 * 0.5 * 0 = 0.5 * 0.5 * (5+10+1+0) = 4. | 0.5 * 0.5 * 5 + 0.5 * 0.5 * 10 + 0.5 * 0.5 * 1 + 0.5 * 0.5 * 0 = 0.5 * 0.5 * (5+10+1+0) = 4. | ||
'''Jeśli jednak gracz I zakłada, że jest 60% szans na to zaprzeczy i 40% na to, że się przyzna, to (przyjmując 50% szans obydwu możliwościom decyzji II gracza) oczekiwana liczba lat odsiadki I gracza wynosi:''' | '''Jeśli jednak gracz I zakłada, że jest 60% szans na to zaprzeczy i 40% na to, że się przyzna, to (przyjmując 50% szans obydwu możliwościom decyzji II gracza) oczekiwana liczba lat odsiadki I gracza wynosi:''' | ||
0.5 * 0.4 * 5 + 0.5 * 0.6 * 10 + 0.5 * 0.4 * 0 + 0.5 * 0.6 * 1 = 4.3. | 0.5 * 0.4 * 5 + 0.5 * 0.6 * 10 + 0.5 * 0.4 * 0 + 0.5 * 0.6 * 1 = 4.3. | ||
'''Widać wyraźnie, że im bardziej gracz I chce zaprzeczyć, tym bardziej jego oczekiwany wyrok rośnie, i odwrotnie: jego wyrok maleje tym bardziej, im jest większa szansa, że się przyzna.'''<ref>R.P.Kostecki 2018, s.3</ref> | '''Widać wyraźnie, że im bardziej gracz I chce zaprzeczyć, tym bardziej jego oczekiwany wyrok rośnie, i odwrotnie: jego wyrok maleje tym bardziej, im jest większa szansa, że się przyzna.'''<ref>R.P.Kostecki 2018, s.3</ref> | ||
==Przypisy== | |||
<references /> | |||
==Bibliografia== | ==Bibliografia== | ||
*Kostecki R.P. (2018), ''[http://www.fuw.edu.pl/~kostecki/teoria_gier.pdf Wprowadzenie do teorii gier]'' | <noautolinks> | ||
*Nowakowski K. (2008),''[https://repozytorium.amu.edu.pl/bitstream/10593/5062/1/15_Krzysztof_Nowakowski_Wymiary%20zaufania%20i%20problem%20zaufania%20negatywnego%20w%20Polsce_213-233.pdf Wymiary zaufania i problem zaufania negatywnego w Polsce]'', "Ruch prawniczy, ekonomiczny i socjologiczny rok LXX", nr 1 | * Kostecki R.P. (2018), ''[http://www.fuw.edu.pl/~kostecki/teoria_gier.pdf Wprowadzenie do teorii gier]'' | ||
*Pietraś Z.J. (2000), ''Decydowanie polityczne'', Wydawnictwo Naukowe PWN, Warszawa-Kraków | * Nowakowski K. (2008),''[https://repozytorium.amu.edu.pl/bitstream/10593/5062/1/15_Krzysztof_Nowakowski_Wymiary%20zaufania%20i%20problem%20zaufania%20negatywnego%20w%20Polsce_213-233.pdf Wymiary zaufania i problem zaufania negatywnego w Polsce]'', "Ruch prawniczy, ekonomiczny i socjologiczny rok LXX", nr 1 | ||
*Polowczyk J. (2018), '' | * Pietraś Z.J. (2000), ''Decydowanie polityczne'', Wydawnictwo Naukowe PWN, Warszawa-Kraków | ||
* Polowczyk J. (2018), ''Elementy ekonomii behawioralnej w dziełach Adama Smitha'', "Ekonomista", nr 4 | |||
</noautolinks> | |||
< | |||
{{a|Aleksandra Kotapka}} | {{a|Aleksandra Kotapka}} |
Wersja z 15:01, 28 paź 2023
Dylemat więźnia |
---|
Polecane artykuły |
TL;DR
Dylemat więźnia to przykład gry o sumie niezerowej, w której występuje konflikt między wspólnym interesem a indywidualną racjonalnością. Przykładem jest sytuacja, w której dwóch więźniów musi zdecydować, czy się przyznać do przestępstwa czy zaprzeczyć. Optymalnym wyborem dla każdego z nich jest przyznanie się, co prowadzi do równego podziału kary. Jednakże, gdyby obaj zaprzeczyli, dostaliby mniejszą karę. Dylemat więźnia pokazuje, że brak współpracy prowadzi do gorszych wyników dla obu stron.
Dylemat więźnia
Jest to przykład gry o sumie niezerowej. Występuje w niej kooperacja pomiędzy dwoma osobami lub takżę grupami ludzi. Jest to współpraca, która polega na jednoczesnym i naprzemiennej konkurencji. Otrzymała miano koopetycji (co-opetition). Gra ta jest odzwierciedleniem wspólnego działania i wzajemnego zaufania (dylemat wspólnych zasobów). Ukazuje konflikt między wspólnym interesem a indywidualną racjonalnością. Występuje wszędzie tam, gdzie różne podmioty gospodarcze eksploatują pewien dostępny dla wszystkich zasób.Przez brak zdolności do kooperacji, a szczególnie wzajemnego zaufania traci społeczna efektywność systemu.[1]
Według Jana Powolczyka "jeżeli gracze grają tylko raz, to mają skłonność do oszukiwania. Gdy gra jest powtarzana i nikt nie wie, kiedy się zakończy, to zachowania stają się bardziej złożone. Oszukujący może być karany przez oszukiwanego, nawet, jeżeli ten ostatni ponosi związane z tym koszty. Po okresie rywalizacji, gracze ponownie mogą wrócić do współpracy w nadziei na korzyści i z wiarą, że tym razem partner, po zrozumieniu swoich błędów, będzie grał uczciwie. W przypadku ponownego oszustwa szanse na wybaczenie radykalnie spadną, a rewanż może być jeszcze bardziej srogi. Dylemat więźnia jest dobrym przykładem gry bez współpracy – tylko w sytuacji współpracy pomiędzy obydwoma graczami w tej grze mogą oni osiągnąć całkowite minimum wyroku. Natomiast bez współpracy nie mogą oni rozważać wspólnej strategii, a jedynie indywidualne, w ramach których wybierają najlepszą dla siebie opcję, w warunkach braku wiedzy o wyborze strategii dokonanym przez drugiego gracza."[2]
Ujęcie modelowe Podstawowy problem sformułował A. Tucker w latach pięćdziesiątych. W późniejszych latach model był wykorzystywany między innymi w RAND Corporation. Jest to ogólny model takich sytuacji konfliktowych, w których zdradzenie drugiego uczestnika gry i wykorzystanie jego zaufania jest zachowaniem racjonalnym. "Czy w świecie egoistów w ogóle mogą pojawić się zachowania kooperacyjne?" - jest to pytanie, które stanowi istotę dylematu. Już od kilkudziesięciu lat co roku publikuje się na ten temat od kilkudziesięciu do kilkuset opracowań naukowych, w których takie sytuacje poddawane są analizie.[3]
Przykład dylematu więźnia
Dwóch ludzi popełniło przestępstwo, lecz brak na to dowodów, zaś policja złapała ich i umieściła w dwóch osobnych celach. Ponieważ nie ma dowodów popełnienia przez nich przestępstwa, nie można im udowodnić winy. Dlatego policja stara się nakłonić ich do zeznań przeciwko sobie. Każdemu z więźniów dano dwie możliwości: przyznać się do popełnienia przestępstwa, albo zaprzeczyć. Jeśli więzień I się przyzna, lecz więzień II zaprzeczy, to wówczas więzień I będzie występował w roli świadka przeciwko drugiemu i nie zostanie ukarany więzieniem, natomiast wówczas drugi więzień dostanie pełny wyrok 10 lat więzienia (i vice versa). Jeśli obaj się przyznają, to obydwaj dostaną po 5 lat odsiadki, ponieważ wówczas policja będzie miała dowody przeciwko obydwu. Jeśli obydwaj zaprzeczą oskarżeniu, że popełnili przestępstwo, to nie będzie na to dowodów, więc dostaną tylko po roku więzienia, za brawurową ucieczkę samochodem przed policją. Sytuację tę można przedstawić przy pomocy następującej tabelki (macierzy):
I/II | Przyznać się | Zaprzeczyć |
Przyznać się | 5,5 | 0,10 |
Zaprzeczyć | 10,0 | 1,1 |
Taka tabelka jest typowym sposobem przedstawiania gry, w której uczestniczy dwóch graczy posiadających skończoną liczbę strategii. Pierwsza liczba przed przecinkiem oznacza wypłatę (wyrok) dla gracza I, zaś druga liczba oznacza wypłatę dla gracza II. Każdy wiersz reprezentuje strategię gracza I, zaś każda kolumna określa pewną strategię gracza II. Zatem prawa dolna komórka oznacza, że jeśli gracz I zaprzeczy oraz gracz II zaprzeczy, to wyrok (wypłata) dla obydwu graczy wynosi 1 rok. Przeprowadźmy teraz analizę tej gry z perspektywy gracza I. Chce on zminimalizować wyrok, ale nie wie, czy gracz II zamierza przyznać się, czy też zaprzeczyć. W związku z tym gracz I rozważa dwie sytuacje:
a) Jeśli gracz II się przyzna: W tej sytuacji przyznanie się przez gracza I daje 5 lat więzienia, podczas zaprzeczanie doprowadzi do 10 lat więzienia. Zatem lepiej się przyznać.
b) Jeśli gracz II zaprzeczy: W tej sytuacji przyznanie się przez gracza I daje 0 lat więzienia (wolność za bycie świadkiem oskarżenia), podczas gdy zaprzeczanie spowoduje 1 rok więzienia. Zatem w tej sytuacji również lepiej się przyznać.
Ponieważ gracz I jest graczem racjonalnym i chce zminimalizować swoją wypłatę, przyzna się do winy. Co ciekawe, ponieważ gracz II jest również graczem racjonalnym, zaś sytuacja jest symetryczna (co jest wyrażone w symetrii powyższej tabelki), to również on się przyzna. Paradoks tej sytuacji polega na tym, że jeśli obydwaj postąpią zgodnie ze swoją racjonalnością, to dostaną po pięć lat, zaś gdyby obydwaj zaprzeczyli, to dostaliby tylko po roku. Jednak żaden z nich nie wie, jak postąpi drugi, dlatego też wybór każdego z nich był najbardziej racjonalny. Dylemat więźnia jest dobrym przykładem gry bez współpracy – tylko w sytuacji współpracy pomiędzy obydwoma graczami w tej grze mogą oni osiągnąć całkowite minimum wyroku. Natomiast bez współpracy nie mogą oni rozważać wspólnej strategii, a jedynie indywidualne, w ramach których wybierają najlepszą dla siebie opcję, w warunkach braku wiedzy o wyborze strategii dokonanym przez drugiego gracza. Korzystając teraz z teorii prawdopodobieństwa, możemy policzyć ile wynosi oczekiwana liczba lat odsiadki w więzieniu, w zależności od prawdopodobieństwa przypisywanego przez jednego gracza poszczególnym decyzjom które może dokonać drugi gracz.
Jeśli gracz I zakłada, że są równe szanse na przyznanie się lub zaprzeczenie przez gracza II oraz przez samego siebie, to obydwu decyzjom każdego z nich przypisze prawdopodobieństwo 0.5. Wówczas może policzyć oczekiwaną liczbę lat swojej odsiadki jako:
szansa, że I się przyzna * szansa, że II się przyzna * wypłata dla gracza I + szansa, że I się nie przyzna * szansa, że II się przyzna * wypłata dla gracza I + szansa, że I się przyzna * szansa, że II się nie przyzna * wypłata dla gracza I + szansa, że I się nie przyzna * szansa, że II się nie przyzna * wypłata dla gracza I, czyli:
0.5 * 0.5 * 5 + 0.5 * 0.5 * 10 + 0.5 * 0.5 * 1 + 0.5 * 0.5 * 0 = 0.5 * 0.5 * (5+10+1+0) = 4.
Jeśli jednak gracz I zakłada, że jest 60% szans na to zaprzeczy i 40% na to, że się przyzna, to (przyjmując 50% szans obydwu możliwościom decyzji II gracza) oczekiwana liczba lat odsiadki I gracza wynosi:
0.5 * 0.4 * 5 + 0.5 * 0.6 * 10 + 0.5 * 0.4 * 0 + 0.5 * 0.6 * 1 = 4.3.
Widać wyraźnie, że im bardziej gracz I chce zaprzeczyć, tym bardziej jego oczekiwany wyrok rośnie, i odwrotnie: jego wyrok maleje tym bardziej, im jest większa szansa, że się przyzna.[4]
Przypisy
Bibliografia
- Kostecki R.P. (2018), Wprowadzenie do teorii gier
- Nowakowski K. (2008),Wymiary zaufania i problem zaufania negatywnego w Polsce, "Ruch prawniczy, ekonomiczny i socjologiczny rok LXX", nr 1
- Pietraś Z.J. (2000), Decydowanie polityczne, Wydawnictwo Naukowe PWN, Warszawa-Kraków
- Polowczyk J. (2018), Elementy ekonomii behawioralnej w dziełach Adama Smitha, "Ekonomista", nr 4
Autor: Aleksandra Kotapka