Gefangenendilemma
B A | B bleibt Leise | B Verartigung |
---|---|---|
Ein Aufenthalt Leise | -1 -1 | 0 -3 |
A Verartigung | -3 0 | -2 -2 |
Das Gefangenendilemma ist ein Standardbeispiel für ein Spiel, das in analysiert wurde Spieltheorie Das zeigt, warum zwei vollständig rational Einzelpersonen kooperieren möglicherweise nicht, auch wenn es so aussieht, als ob es in ihrem besten Interesse ist, dies zu tun. Es wurde ursprünglich von gerahmt von Merrill Flut und Melvin Dresher während der Arbeit bei Rand 1950. Albert W. Tucker formalisierte das Spiel mit Gefängnisstrafe und nannte es "Gefangenendilemma".[1] Eine Version davon wurde von William Poundstone in seinem Buch von 1993 angegeben Gefangenendilemma wie:
Zwei Mitglieder einer kriminellen Bande werden verhaftet und eingesperrt. Jeder Gefangene befindet sich in Einzelhaft ohne Mittel, um mit dem anderen Nachrichten zu sprechen oder Nachrichten auszutauschen. Die Polizei gibt zu, dass sie nicht genügend Beweise haben, um das Paar wegen der Hauptbeschuldigung zu verurteilen. Sie planen, beide Haftstrafen wegen geringer Anklage zu verurteilen. Gleichzeitig bietet die Polizei jedem Gefangenen ein faustisches Schnäppchen an.
Die möglichen Ergebnisse sind:
- Wenn A und B jeweils den anderen verraten, dient jeder von ihnen zwei Jahre im Gefängnis
- Wenn a verrät B, aber B schweigt, wird A freigesetzt und B wird drei Jahre im Gefängnis dienen
- Wenn A still bleibt, aber B verrät A, wird A drei Jahre im Gefängnis dienen und B wird freigesetzt
- Wenn A und B beide schweigen, werden beide ein Jahr Gefängnis (unter der geringeren Anklage) dienen.
Es wird impliziert, dass die Gefangenen keine Gelegenheit haben werden, ihren Partner zu belohnen oder zu bestrafen, außer den Gefängnisstrafen, die sie erhalten, und dass ihre Entscheidung an sich nicht in Zukunft ihren Ruf beeinflussen wird. Wenn ein Partner verriet, bietet es eine größere Belohnung als mit ihm zusammenzuarbeiten, alle rein rationalen selbstinteressierten Gefangenen werden den anderen verraten, was bedeutet, dass das einzig mögliche Ergebnis für zwei rein rationale Gefangene darin besteht belohnen.[2]
In diesem Fall ist "zu verraten" das dominante Strategie Für beide Spieler, was bedeutet, dass es unter allen Umständen die beste Antwort des Spielers ist und mit dem übereinstimmt Sicheres Prinzip.[3] Das Dilemma des Gefangenen zeigt auch, dass die Entscheidungen, die unter kollektiver Rationalität getroffen wurden, möglicherweise nicht unbedingt dasselbe sind wie die unter individuelle Rationalität, und dieser Konflikt kann auch in einer Situation beobachtet werden, die genannt wird. "Tragödie der Commons"Dieser Fall zeigt die Tatsache an, dass öffentliche Güter immer anfällig für Überwendungen sind.[3]
In Wirklichkeit so Systemische Voreingenommenheit Auf dem kooperativen Verhalten geschieht trotz der vorhergesagten einfachen Modelle "rationaler" selbstinteressierte Handlungen.[4][5][6][7] Diese Verzerrung zur Zusammenarbeit ist seit dem ersten Durchführung des Tests bei Rand bekannt. Die Sekretäre vertrauten sich gegenseitig und arbeiteten zusammen, um das beste gemeinsame Ergebnis zu erzielen.[8] Das Dilemma des Gefangenen wurde zum Schwerpunkt umfassender experimenteller Forschung.[9][10] Diese experimentellen Forschungen nehmen normalerweise eines dieser drei Formen an: Einzelspiel, iteriertes Spiel und iteriertes Spiel gegen einen programmierten Spieler, jeweils unterschiedliche Zwecke.[3] Und als Zusammenfassung dieser Experimente rechtfertigen ihre Ergebnisse die kategorischer Imperativ aufgezogen von Immanuel Kant, was besagt, dass ein rationaler Agent erwartet wird, dass er "so handelt, wie Sie andere handeln sollen. Diese Theorie ist für eine Situation von entscheidender Bedeutung, in der jeweils unterschiedliche Spieler für ihr bestes Interesse wirken und die Handlungen anderer berücksichtigen müssen, um ihre eigene Wahl zu treffen. Es unterstreicht die Vernetzung von Spielern in einem solchen Spiel und betonte so die Tatsache, dass eine Strategie die Reaktionen anderer als erfolgreich betrachten muss, einschließlich ihrer Reaktionsfähigkeit, ihrer Tendenz zu imitieren usw.[3]
Es gibt auch eine erweiterte "iterierte" Version des Spiels. In dieser Version wird das klassische Spiel wiederholt zwischen denselben Gefangenen gespielt, die kontinuierlich die Möglichkeit haben, den anderen für frühere Entscheidungen zu bestrafen. Wenn die Häufigkeit, mit der das Spiel gespielt wird, den Spielern bekannt ist, dann von Rückwirkende Induktion Zwei klassisch rationale Spieler werden sich aus den gleichen Gründen wie die Single-Shot-Variante wiederholt verraten. In einem unendlichen oder unbekannten Längenspiel gibt es keine feste optimale Strategie, und für solche Fälle wurden keine Dilemma -Turniere des Gefangenen zur Wettbewerbs- und Testalgorithmen durchgeführt.[11]
Die iterierte Version des Dilemmas des Gefangenen ist für Forscher von besonderem Interesse. Aufgrund seiner iterativen Natur stellten frühere Forscher fest, dass sich die Häufigkeit für die Zusammenarbeit der Spieler ändern könnte, basierend auf den Ergebnissen jeder Iteration. Insbesondere sind die Spieler möglicherweise weniger bereit zu kooperieren, wenn sein Gegenüber nicht mehrmals zusammenarbeitet, was die Enttäuschung enttäuscht. Umgekehrt könnte die Zusammenarbeit im Laufe der Zeit hauptsächlich auf die Tatsache zurückzuführen sein, dass eine "stillschweigende Vereinbarung" zwischen den Spielern eingerichtet wurde. Ein weiterer interessanter Aspekt in Bezug auf die iterierte Version des Experiments ist jedoch, dass diese stillschweigende Vereinbarung zwischen den Spielern immer erfolgreich festgelegt wurde, obwohl die Anzahl der Iterationen für beide Seiten veröffentlicht wird.[3]
Das Dilemma -Spiel des Gefangenen kann für viele als Modell verwendet werden Situationen reale Welt kooperatives Verhalten einbeziehen. In der ungezwungenen Verwendung kann das Label "Gefangenendilemma" auf Situationen angewendet werden, die nicht ausschließlich den formalen Kriterien der klassischen oder iterativen Spiele entsprechen: beispielsweise können diejenigen, in denen zwei Einheiten wichtige Vorteile aus der Zusammenarbeit nutzen oder unter dem Versäumnis leiden, dies zu tun. , aber fällt es schwierig oder teuer - nicht unbedingt unmöglich -, ihre Aktivitäten zu koordinieren.
Strategie für das Dilemma des Gefangenen
Zwei Gefangene werden in einzelne Räume unterteilt und können nicht miteinander kommunizieren. Das normale Spiel ist unten gezeigt:
Gefangener b Gefangener a | Gefangener B schweigen (kooperiert) | Gefangene B verrät (Mängel)) |
---|---|---|
Gefangener schweigen (kooperiert)) | Jedes dient 1 Jahr | Gefangener A: 3 Jahre Gefangener B: Geht frei |
Gefangener A BRETAUS (Mängel)) | Gefangener A: Geht frei Gefangener B: 3 Jahre | Jeder dient 2 Jahren |
Es wird angenommen, dass beide Gefangene die Art des Spiels verstehen, keine Loyalität zueinander haben und außerhalb des Spiels keine Gelegenheit zur Vergeltung oder Belohnung haben. Unabhängig davon, was der andere entscheidet, erhält jeder Gefangene eine höhere Belohnung, indem er den anderen verrät ("Defekt"). Die Argumentation beinhaltet die Analyse beider Spieler. Beste Antworten: B wird entweder kooperiert oder defekt. Wenn B kooperiert, sollte A nicht defekt sein, weil das freie Gehen besser ist als 1 Jahr zu dienen. Wenn B -Defekte, sollte auch ein Defekt sein, da es besser ist, 2 Jahre zu dienen. Parallele Argumentation zeigt, dass B einlösen sollte.
Da ein Defekt immer zu einer besseren Auszahlung führt als die Zusammenarbeit, unabhängig von der Wahl des anderen Spielers, ist dies streng dominante Strategie Für A- und B. ist gegenseitiger Defekt der einzige starke Nash -Gleichgewicht im Spiel (d. H. Das einzige Ergebnis, aus dem jeder Spieler nur durch einseitig verändernde Strategie schlechter werden konnte). Das Dilemma ist also, dass die gegenseitige Kooperation ein besseres Ergebnis als ein gegenseitiger Defekt liefert, aber nicht das rationale Ergebnis ist, da die Entscheidung zur Zusammenarbeit aus eigennütziger Perspektive irrational ist. Somit ist das Dilemma des Gefangenen ein Spiel, in dem die Nash -Gleichgewicht ist nicht Pareto effizient.
Verallgemeinerte Form
Die Struktur des traditionellen Dilemmas des Gefangenen kann aus seiner ursprünglichen Gefangenen verallgemeinert werden. Angenommen, die beiden Spieler werden durch die Farben Rot und Blau dargestellt und jeder Spieler entscheidet sich dafür, entweder "zusammenzuarbeiten" (schweigen) oder "Defekt" (Verrat).
Wenn beide Spieler zusammenarbeiten, erhalten beide die Belohnung R zum Kooperieren. Wenn beide Spieler defekt sind, erhalten beide die Bestrafungsauszahlung P. Wenn Blau defekt während der roten Kooperation, erhält Blue die Versuchungsauszahlung T, während Red die Auszahlung des "Sucker" erhält, S. In ähnlicher Weise erhält Blue, wenn Blue während der RED -Defekt zusammenarbeitet, die Auszahlung des Saugers erhält S, während Red die Versuchungsauszahlung erhält T.
Dies kann in ausgedrückt werden in Normale Form:
Rot Blau | Kooperieren | Defekt |
---|---|---|
Kooperieren | R R | T S |
Defekt | S T | P P |
Und um das Dilemma -Spiel eines Gefangenen im starken Sinne zu sein, muss die folgende Bedingung für die Auszahlungen gelten:
Die Auszahlungsbeziehung Impliziert, dass die gegenseitige Zusammenarbeit gegenseitig dem gegenseitigen Defekt überlegen ist, während die Auszahlungsbeziehungen und implizieren, dass Defekt der ist dominante Strategie Für beide Agenten.
Sonderfall: Spendenspiel
Das "Spendenspiel"[12] ist eine Form des Gefangenendilemmas, in dem die Zusammenarbeit dem Anbieten des anderen Spielers einen Vorteil entspricht b persönliche Kosten c mit b > c. Defekt bedeutet nichts anzubieten. Die Auszahlungsmatrix ist also
Rot Blau | Kooperieren | Defekt |
---|---|---|
Kooperieren | b−c b−c | b −c |
Defekt | −c b | 0 0 |
Beachten Sie, dass (d.h. ) Das qualifiziert das Spendenspiel als iteriertes Spiel (siehe nächster Abschnitt).
Das Spendenspiel kann auf Märkte angewendet werden. Angenommen, x wächst Orangen, y wächst Äpfel. Das Grenznutzen eines Apfels zum Orangenbauer x ist b, was höher ist als der Grenznutzung (c) einer Orange, da X einen Überschuss an Orangen und keine Äpfel hat. In ähnlicher Weise ist für Apfelbauer y der Grenznutzung einer Orange b Während der marginale Nutzen eines Apfels ist c. Wenn x und y einen Apfel und eine Orange austauschen und alle ihr Ende des Deals erfüllen, erhalten jeweils eine Auszahlung von b-c. Wenn man "defekt" und nicht wie versprochen liefert, erhält der Überläufer eine Auszahlung von b, während der Cooperator verliert c. Wenn beide defekt sind, gewinnt oder verliert weder ein oder verliert etwas.
Das iterierte Dilemma des Gefangenen
Wenn zwei Spieler mehr als einmal in Folge das Dilemma des Gefangenen spielen und sich an frühere Handlungen ihres Gegners erinnern und ihre Strategie entsprechend ändern, wird das Spiel als Dilemma des Iterated Prisoners bezeichnet.
Zusätzlich zu der oben genannten allgemeinen Form erfordert die iterative Version dies auch zu verhindern, dass sich die Zusammenarbeit und Defekt wechselte, eine größere Belohnung als die gegenseitige Zusammenarbeit.
Das Dilemma -Spiel des iterierten Gefangenen ist für einige Theorien der menschlichen Zusammenarbeit und des Vertrauens von grundlegender Bedeutung. Unter der Annahme, dass das Spiel Transaktionen zwischen zwei Personen modellieren kann, die Vertrauen benötigen, können das kooperative Verhalten in Populationen von einem mehrfach iterierten Multi-Spieler-Version des Spiels modelliert werden. Infolgedessen hat es im Laufe der Jahre viele Gelehrte fasziniert. 1975 schätzten Grofman und Pool die Anzahl wissenschaftlicher Artikel, die ihm über 2.000 gewidmet waren. Das iterierte Dilemma des Gefangenen wurde auch als das bezeichnet "Friedenskriegsspiel".[13]
Wenn das Spiel genau gespielt wird N Zeiten und beide Spieler wissen das, dann ist es optimal, in allen Runden zu fällen. Das einzige mögliche Nash -Gleichgewicht ist immer zu fördern. Der Beweis ist induktiv: Man könnte in der letzten Kurve genauso neigen, da der Gegner keine Chance hat, sich später zu revanchieren. Daher werden beide in der letzten Kurve defekt. Daher könnte der Spieler die zweitletzte Wendung genauso neigen, da der Gegner die letzte, egal was getan wird, und so weiter auffällt. Gleiches gilt, wenn die Spiellänge unbekannt ist, aber eine bekannte Obergrenze hat.
Im Gegensatz zum Dilemma des Standard-Gefangenen ist die Defektstrategie im iterierten Gefangenen Dilemma kontraintuitiv und scheitert schlecht, um das Verhalten menschlicher Spieler vorherzusagen. Innerhalb der Standard -Wirtschaftstheorie ist dies jedoch die einzige richtige Antwort. Das überrational Strategie im iterierten Gefangenen Dilemma mit festen N ist gegen einen überrationalen Gegner zusammenzuarbeiten und unter der Grenze von großer N, experimentelle Ergebnisse zu Strategien stimmen mit der superrationalen Version überein, nicht der spieltheoretischen rationalen.
Zum Zusammenarbeit zwischen spiele theoretischen rationalen Spielern auftreten, die Gesamtzahl der Runden N Muss den Spielern unbekannt sein. In diesem Fall ist "immer Defekt" möglicherweise keine streng dominante Strategie mehr, nur ein Nash -Gleichgewicht. Unter den Ergebnissen von gezeigt von Robert Aumann In einem Artikel von 1959 können rationale Spieler wiederholt mit unbegrenzten Langen Spielen das kooperative Ergebnis aufrechterhalten.
Laut einer experimentellen Studie von 2019 in der Amerikanische wirtschaftliche Überprüfung Was testete, welche Strategien reale Probanden in iterierten Gefangenen-Dilemma-Situationen mit perfekter Überwachung verwendeten, war die Mehrheit der ausgewählten Strategien immer Fehler. wie du mir so ich dir, und düsterer Abzug. Welche Strategie, die die Probanden ausgewählt haben, hing von den Parametern des Spiels ab.[14]
Strategie für das iterierte Dilemma des Gefangenen
Das Interesse an dem iterierten Gefangenen Dilemma (IPD) wurde von entzündet Robert Axelrod in seinem Buch Die Entwicklung der Zusammenarbeit (1984). Darin berichtet er über ein Turnier, das er von der organisiert hat N Stiefgefangene Dilemma (mit N behoben), in dem die Teilnehmer ihre gegenseitige Strategie immer wieder wählen müssen und sich an ihre früheren Begegnungen erinnern. Axelrod lud akademische Kollegen auf der ganzen Welt ein, Computerstrategien zu entwickeln, um an einem IPD -Turnier teilzunehmen. Die Programme, die in die algorithmische Komplexität, die anfängliche Feindseligkeit, die Kapazität der Vergebung usw. sehr unterschiedlich waren.
Axelrod stellte fest, dass bei vielen Spielern, die jeweils unterschiedliche Strategien mit unterschiedlichen Strategien mit unterschiedlichen Strategien, auf lange Sicht sehr schlecht abschneiden, als diese Begegnungen über einen langen Zeitraum wiederholt wurden, während mehr, während mehr sehr schlecht abschneidet altruistisch Strategien haben es besser gemacht, wie nur von Eigeninteresse beurteilt. Er nutzte dies, um einen möglichen Mechanismus für die Entwicklung altruistisches Verhaltensmechanismen durch Mechanismen zu zeigen, die anfangs rein egoistisch sind, von natürliche Auslese.
Das Gewinnen deterministisch Strategie war wie du mir so ich dir, die Anatol Rapoport entwickelt und trat in das Turnier ein. Es war das einfachste eines eingegebenen Programms, das nur vier Zeilen von enthielt BASICund gewann den Wettbewerb. Die Strategie besteht einfach darin, bei der ersten Iteration des Spiels zusammenzuarbeiten. Danach macht der Spieler das, was sein Gegner auf dem vorherigen Schritt getan hat. Abhängig von der Situation kann eine etwas bessere Strategie "Tit für Tat mit Vergebung" sein. Wenn der Gegner beim nächsten Schritt definiert, kooperiert der Spieler sowieso manchmal mit einer geringen Wahrscheinlichkeit (ca. 1–5%). Dies ermöglicht eine gelegentliche Erholung, in einem Zyklus von Defekten eingeschlossen zu werden. Die genaue Wahrscheinlichkeit hängt von der Einstellung der Gegner ab.
Durch die Analyse der Top-Scoring-Strategien erklärte Axelrod mehrere Bedingungen, die für eine erfolgreiche Strategie erforderlich sind.
- nett
- Die wichtigste Bedingung ist, dass die Strategie "nett" sein muss, dh sie wird nicht vor ihrem Gegner defekt sein (dies wird manchmal als "optimistischer" Algorithmus bezeichnet). Fast alle Top-Scoring-Strategien waren nett. Eine rein egoistische Strategie wird seinem Gegner zuerst aus rein eigenständigen Gründen nicht "betrügen".
- Vergeltung
- Axelrod behauptete jedoch, die erfolgreiche Strategie darf kein blinder Optimist sein. Es muss manchmal revanchieren. Ein Beispiel für eine nicht-retalierende Strategie ist immer kooperiert. Dies ist eine sehr schlechte Wahl, da "böse" Strategien solche Spieler rücksichtslos ausnutzen werden.
- Versöhnlich
- Erfolgreiche Strategien müssen ebenfalls vergeblich sein. Obwohl die Spieler sich rächen werden, werden sie erneut in die Zusammenarbeit zurückfallen, wenn der Gegner nicht weiter fällt. Dies stoppt lange Rache- und Gegenreden und maximiert die Punkte.
- Nicht berücksichtigt
- Die letzte Qualität ist nicht berücksichtigt, das ist nicht bestrebt, mehr zu punkten als der Gegner.
Die optimale (Punktmaximierungs-) Strategie für das einmalige PD-Spiel ist einfach einen Überfall. Wie oben erläutert, gilt dies, unabhängig von der Zusammensetzung der Gegner. Im iterierten PD-Spiel hängt die optimale Strategie jedoch von den Strategien wahrscheinlicher Gegner und der Art und Weise ab, wie sie auf Defekte und Kooperationen reagieren. Betrachten Sie beispielsweise eine Bevölkerung, bei der jeder jedes Mal defekt ist, mit Ausnahme einer einzigen Person, die der Tit for TAT -Strategie folgt. Diese Person ist aufgrund des Verlustes in der ersten Runde leicht benachteiligt. In einer solchen Bevölkerung besteht die optimale Strategie für dieses Individuum jedes Mal darin, zu defekt. In einer Bevölkerung mit einem bestimmten Prozentsatz an immer Defektoren und dem Rest ist Tit für TAT-Spieler, hängt die optimale Strategie für eine Person vom Prozentsatz und von der Länge des Spiels ab.
In der Strategie namens Pavlov, Win-Stay, Lose-SwitchAngesichts des Versagens, zusammenzuarbeiten, wechselt der Spieler die Strategie in der nächsten Runde.[15] Unter Umständen,[angeben] Pavlov schlägt alle anderen Strategien, indem sie Co-Spielern mit einer ähnlichen Strategie bevorzugt behandelt werden.
Das Abfertigung der optimalen Strategie wird im Allgemeinen auf zwei Arten durchgeführt:
- Bayes'sche Nash -Gleichgewicht: Wenn die statistische Verteilung der gegnerischen Strategien bestimmt werden kann (z. B. 50% Tit für TAT, 50% immer kooperieren), kann analytisch ein optimales Gegenstrategie abgeleitet werden.[a]
- Monte Carlo Es wurden Simulationen von Populationen gemacht, bei denen Personen mit niedrigen Punktzahlen absterben und Personen mit hohen Punktzahlen vermehren (a genetischen Algorithmus für die Suche nach einer optimalen Strategie). Die Mischung von Algorithmen in der endgültigen Bevölkerung hängt im Allgemeinen von der Mischung in der anfänglichen Bevölkerung ab. Die Einführung der Mutation (zufällige Variation während der Reproduktion) verringert die Abhängigkeit von der Anfangspopulation; Empirische Experimente mit solchen Systemen produzieren tendenziell Tit für TAT -Spieler (siehe zum Beispiel Schach 1988).[Klarstellung erforderlich] Es gibt jedoch keinen analytischen Beweis dafür, dass dies immer auftreten wird.[17]
Obwohl Tit für TAT als am meisten angesehen wird robust Grundlegende Strategie, ein Team von Southampton University In England führte eine neue Strategie beim 20.-jährigen iterierten Dilemma-Wettbewerb des Gefangenen ein, der sich als erfolgreicher als Tit für TAT erwies. Diese Strategie stützte sich auf die Absprache zwischen Programmen, um die höchste Anzahl von Punkten für ein einzelnes Programm zu erreichen. Die Universität reichte 60 Programme für den Wettbewerb ein, die sich zu Beginn durch eine Reihe von fünf bis zehn Schritten gegenseitig anerkennen sollten.[18] Sobald diese Anerkennung vorgenommen wurde, würde ein Programm immer kooperieren und das andere stand immer auf, um die maximale Anzahl von Punkten für den Überläufer zu sichern. Wenn das Programm erkannte, dass es einen Nicht-Südampton-Spieler spielte, würde es kontinuierlich ununterbrochen defekt sein, um die Punktzahl des konkurrierenden Programms zu minimieren. Infolgedessen zeigen die Ergebnisse des Dilemma -Turniers von 2004 2004 Universität von SouthamptonDie Strategien an den ersten drei Orten, obwohl weniger Siege und viel mehr Verluste als die düstere Strategie erzielten. (In einem PD -Turnier ist es das Ziel des Spiels nicht, Spiele zu "gewinnen" - was durch häufige Defekt leicht erreicht werden kann). Diese Strategie nahm die drei besten Positionen im Wettbewerb sowie eine Reihe von Positionen nach unten ein.
Die Southampton-Strategie nutzt die Tatsache, dass in diesem bestimmten Wettbewerb mehrere Einträge zulässig waren und dass die Leistung eines Teams an der des Spielers mit der höchsten Punktzahl gemessen wurde (was bedeutet, dass die Verwendung selbstaufzudererer Spieler eine Form von war Minmaxing). In einem Wettbewerb, bei dem man nur einen einzelnen Spieler hat, ist Tit für TAT sicherlich eine bessere Strategie. Aufgrund dieser neuen Regel hat dieser Wettbewerb auch bei der Analyse von Einzelagentenstrategien im Vergleich zu Axelrods wegweisendes Turnier eine geringe theoretische Bedeutung. Es bildete jedoch eine Grundlage für die Analyse, wie kooperative Strategien in Multi-Agent-Frameworks, insbesondere in Gegenwart von Rauschen, erreicht werden können. Tatsächlich, lange bevor dieses New-Rules-Turnier Dawkins in seinem Buch gespielt wurde Das egoistische Gen, wies darauf hin, dass solche Strategien gewonnen werden, wenn mehrere Einträge erlaubt wären, aber er bemerkte, dass Axelrod ihnen höchstwahrscheinlich nicht erlaubt hätte, wenn sie eingereicht worden wären. Es stützt sich auch auf die Umgehung von Regeln für das Dilemma des Gefangenen, da es keine Kommunikation zwischen den beiden Spielern erlaubt hat, die die Southampton -Programme wohl mit ihren vorprogrammierten "zehn Bewegungstanz" gemacht haben, um sich gegenseitig zu erkennen. Dies verstärkt nur, wie wertvoll die Kommunikation sein kann, um das Gleichgewicht des Spiels zu verschieben.
Auch ohne implizite Absprachen zwischen Software -Strategien (Ausgenutzt vom Southampton -Team) Tit für TAT ist nicht immer der absolute Gewinner eines bestimmten Turniers; Es wäre genauer zu sagen, dass seine langfristigen Ergebnisse in einer Reihe von Turnieren seine Konkurrenten übertreffen. (In jedem Ereignis kann eine bestimmte Strategie etwas besser an die Konkurrenz angepasst werden als Tit für TAT, aber Tit für TAT ist robuster). Gleiches gilt für die Tit für TAT mit Vergebungvariante und andere optimale Strategien: An einem bestimmten Tag "gewinnen" sie möglicherweise nicht gegen eine bestimmte Mischung aus Gegenstrategien. Eine alternative Möglichkeit, es zu sagen, besteht darin, den Darwinianer zu verwenden ESS Simulation. In einer solchen Simulation wird Tit for Tat fast immer dominieren, obwohl böse Strategien in die Bevölkerung ein- und aussteigen werden, da eine Tit für die TAT Strategien. Richard Dawkins zeigten, dass hier keine statische Mischung von Strategien ein stabiles Gleichgewicht bildet und das System immer zwischen den Grenzen schwingt.
Stochastisches iteriertes Dilemma des Gefangenen
In einem stochastischen iterierten Dilemma -Spiel eines Gefangenen werden Strategien in Bezug auf "Kooperationswahrscheinlichkeiten" angegeben.[19] In einer Begegnung zwischen Spieler X und Spieler Y, X'Die Strategie wird durch eine Reihe von Wahrscheinlichkeiten angegeben P der Zusammenarbeit mit Y. P ist eine Funktion der Ergebnisse ihrer früheren Begegnungen oder einer Teilmenge davon. Wenn P ist eine Funktion von nur ihrer neuesten n Begegnungen, es wird als "Memory-N" -Strategie bezeichnet. Eine Speicher-1-Strategie wird dann durch vier Kooperationswahrscheinlichkeiten angegeben: , wo ist die Wahrscheinlichkeit, dass X wird in der vorliegenden Begegnung zusammenarbeiten, da die vorherige Begegnung durch (AB) charakterisiert wurde. Zum Beispiel, wenn die vorherige Begegnung eine war, in der X kooperiert und Y Dann überlegt ist die Wahrscheinlichkeit, dass X wird in der vorliegenden Begegnung zusammenarbeiten. Wenn jede der Wahrscheinlichkeiten entweder 1 oder 0 ist, wird die Strategie als deterministisch bezeichnet. Ein Beispiel für eine deterministische Strategie ist die Tit for TAT -Strategie als P= {1,0,1,0}, in dem X reagiert als Y tat in der vorherigen Begegnung. Ein anderer ist das Gewinnen Sie auftreten, verlieren - witch Strategie geschrieben als P= {1,0,0,1}, in dem X antwortet wie in der vorherigen Begegnung, wenn es sich um einen "Gewinn" handelte (d. H. CC oder DC), ändert jedoch die Strategie, wenn es sich um einen Verlust (d. H. CD oder DD) handelte. Es wurde gezeigt, dass für jede Speicher-N-Strategie eine entsprechende Speicher-1-Strategie vorliegt, die die gleichen statistischen Ergebnisse liefert, so dass nur Gedächtnis-1-Strategien berücksichtigt werden müssen.[19]
Wenn wir definieren P Wie der oben genannte 4-Element-Strategievektor von X und als 4-Element-Strategievektor von Y, eine Übergangsmatrix M kann definiert werden für X Deren ij TH -Eintrag ist die Wahrscheinlichkeit, dass das Ergebnis einer bestimmten Begegnung zwischen X und Y wird sein j da die vorherige Begegnung war i, wo i und j sind einer der vier Ergebnisindizes: CC, CD, DC, oder dd. Zum Beispiel von X'S Standpunkt der Wahrscheinlichkeit, dass das Ergebnis der vorliegenden Begegnung ist CD da die vorherige Begegnung war CD ist gleich . (Die Indizes für Q stammen aus Y'S Sichtweise: a CD Ergebnis für X ist ein DC Ergebnis für Y.) Nach diesen Definitionen qualifiziert sich das iterierte Dilemma des Gefangenen als a stochastischer Prozess und M ist ein Stochastische Matrixund ermöglichen, dass alle Theorien der stochastischen Prozesse angewendet werden.[19]
Ein Ergebnis der stochastischen Theorie ist, dass es einen stationären Vektor gibt v für die Matrix M so dass . Ohne Verlust der Allgemeinheit kann angegeben werden v wird so normalisiert, dass die Summe seiner vier Komponenten Einheit ist. Das ij TH -Eintrag in wird die Wahrscheinlichkeit geben, dass das Ergebnis einer Begegnung zwischen X und Y wird sein j Angesichts der Tatsache, dass die Begegnung n Schritte vorher sind i. In der Grenze als n nähert sich unendlich, M Konvergiert mit festen Werten zu einer Matrix, wobei die langfristigen Wahrscheinlichkeiten einer Begegnung erzeugt werden j das wird unabhängig sein von i. Mit anderen Worten, die Reihen von wird identisch sein und das langfristige Gleichgewichtsergebniswahrscheinlichkeiten des iterierten Gefangenen-Dilemmas geben, ohne dass eine große Anzahl von Wechselwirkungen explizit bewertet werden mussten. Man kann sehen, dass v ist ein stationärer Vektor für und besonders so dass jede Reihe von wird gleich sein v. Somit gibt der stationäre Vektor die Gleichgewichtsergebniswahrscheinlichkeiten für an X. Definition und Als kurzfristige Auszahlungsvektoren für die Ergebnisse {CC, CD, DC, DD} (von X'S Sichtweise), die Gleichgewichtsauszahlungen für X und Y kann jetzt als angegeben werden als und die beiden Strategien zulassen P und Q für ihre langfristigen Auszahlungen verglichen werden.
Zero-determinante Strategien
In 2012, William H. Press und Freeman Dyson veröffentlichte eine neue Klasse von Strategien für das stochastische iterierte Dilemma des Gefangenen mit dem Namen "Zero-Determinant" (ZD) Strategien.[19] Die langfristigen Auszahlungen für Begegnungen zwischen X und Y kann als Determinante einer Matrix ausgedrückt werden, die eine Funktion der beiden Strategien und der kurzfristigen Auszahlungsvektoren ist: und , die nicht den stationären Vektor betreffen v. Seit der Determinantenfunktion ist linear in f, es folgt dem (wo U= {1,1,1,1}). Alle Strategien für welche ist per Definition eine ZD -Strategie, und die langfristigen Auszahlungen folgen der Beziehung .
Tit-for-Tat ist eine ZD-Strategie, die im Sinne dessen, dass er nicht gegenüber dem anderen Spieler einen Vorteil hat, "fair" ist. Der ZD -Raum enthält jedoch auch Strategien, die es im Fall von zwei Spielern ermöglichen können, einen Spieler einseitig die Punktzahl des anderen Spielers zu setzen oder alternativ alternativ einen evolutionären Spieler zu erzwingen, um eine Auszahlung zu erzielen, die ein prozentualeres prozentualeres niedrigeres als seine eigenen ist. Der erpresste Spieler konnte sich anschließen, würde sich aber dadurch verletzen, indem sie eine geringere Auszahlung erzielte. Erpressungslösungen verwandeln daher das Dilemma des iterierten Gefangenen in eine Art Art von Ultimatum -Spiel. Speziell, X ist in der Lage, eine Strategie zu wählen, für die , einseitig Einstellung zu einem bestimmten Wert innerhalb eines bestimmten Wertebereichs unabhängig von Y's Strategie, die die Möglichkeit bietet X Spieler "erpressen" Y (und umgekehrt). (Es stellt sich heraus, dass wenn X versucht zu setzen Zu einem bestimmten Wert ist der Bereich der Möglichkeiten viel kleiner und besteht nur aus vollständiger Zusammenarbeit oder vollständigem Defekt.[19]))
Eine Erweiterung des IPD ist ein evolutionäres stochastisches IPD, bei dem sich die relative Häufigkeit bestimmter Strategien ändern kann, wobei erfolgreichere Strategien relativ zunehmen. Dieser Prozess kann durchgeführt werden, indem weniger erfolgreiche Spieler die erfolgreicheren Strategien imitieren oder weniger erfolgreiche Spieler aus dem Spiel eliminieren und gleichzeitig die erfolgreicheren Multiplikation multiplizieren. Es wurde gezeigt, dass unfaire ZD -Strategien nicht sind evolutionär stabil. Die wichtigste Intuition ist, dass eine evolutionär stabile Strategie nicht nur in einer anderen Bevölkerung eindringen kann (was Erpresser -ZD Überschuss des anderen).[20]
Theorie und Simulationen bestätigen, dass die ZD -Erpressung über eine kritische Bevölkerungsgröße im evolutionären Wettbewerb gegen kooperativere Strategien verliert, und infolgedessen steigt die durchschnittliche Auszahlung der Bevölkerung, wenn die Bevölkerung größer ist. Darüber hinaus gibt es einige Fälle, in denen Erpresser sogar die Zusammenarbeit katalysieren können, indem sie dazu beitragen, aus einem Anspiel zwischen einheitlichen Überläufern und auszubrechen Gewinnen Sie auftreten, verlieren - witch Agenten.[12]
Während Erpresser -ZD ist sowohl stabil als auch robust. Wenn die Bevölkerung nicht zu klein ist, können diese Strategien jede andere ZD -Strategie ersetzen und sogar eine breite Palette generischer Strategien für das Dilemma des iterierten Gefangenen, einschließlich Win - Stay, Lose - abgeben. Dies wurde speziell für die nachgewiesen Spendenspiel von Alexander Stewart und Joshua Plotkin im Jahr 2013.[21] Großzügige Strategien werden mit anderen kooperativen Spielern zusammenarbeiten, und angesichts des Überfalls verliert der großzügige Spieler mehr Nützlichkeit als seinen Rivalen. Großzügige Strategien sind die Schnittstelle von ZD-Strategien und sogenannten "guten" Strategien, die von Akin (2013) definiert wurden[22] Um diejenigen zu sein, für die der Spieler auf die gegenseitige Zusammenarbeit mit der zukünftigen Zusammenarbeit und auf die erwartete Auszahlung der erwarteten Auszahlungen zu gleichen Teilen reagiert, wenn er mindestens die mit Genossenschaft erwartete Auszahlung erhält. Unter guten Strategien funktioniert die großzügige (ZD) -Submenge gut, wenn die Bevölkerung nicht zu klein ist. Wenn die Bevölkerung sehr klein ist, dominieren Defektstrategien tendenziell.[21]
Dilemma des kontinuierlichen iterierten Gefangenen
Die meisten Arbeiten an dem iterierten Dilemma des Gefangenen haben sich auf den diskreten Fall konzentriert, in dem die Spieler entweder kooperieren oder defekt sind, da dieses Modell relativ einfach zu analysieren ist. Einige Forscher haben jedoch Modelle des kontinuierlichen iterierten Dilemmas des Gefangenen untersucht, in dem Spieler in der Lage sind, einen variablen Beitrag zum anderen Spieler zu leisten. Le und Boyd[23] stellte fest, dass in solchen Situationen die Zusammenarbeit viel schwerer zu entwickeln ist als im diskreten iterierten Gefangenendilemma. Die grundlegende Intuition für dieses Ergebnis ist einfach verschiedene miteinander. Im Gegensatz dazu erhält Tit for Tat Cooperators im diskreten Dilemma eines Gefangenen einen großen Auszahlungsschub, wenn er in einem nicht kooperativen Gleichgewicht im Verhältnis zu Nicht-Kooperatoren miteinander miteinander sorgt. Da Nature wohl mehr Möglichkeiten für eine variable Zusammenarbeit als eine strenge Dichotomie der Zusammenarbeit oder des Abschieds bietet, kann das Dilemma des kontinuierlichen Gefangenen helfen[24]) Obwohl Tit für TAT in theoretischen Modellen robust erscheint.
Entstehung stabiler Strategien
Die Spieler scheinen die gegenseitige Zusammenarbeit nicht zu koordinieren und werden daher oft in die minderwertige, aber stabile Strategie des Defekts eingeschlossen. Auf diese Weise erleichtern iterierte Runden die Entwicklung stabiler Strategien.[25] Iterierte Runden produzieren häufig neue Strategien, die Auswirkungen auf komplexe soziale Interaktion haben. Eine solche Strategie ist Win-Stay Lose-Shift. Diese Strategie übertrifft eine einfache Tit-for-Tat-Strategie. Wenn Sie mit Betrug davonkommen können, wiederholen Sie dieses Verhalten. Wenn Sie jedoch erwischt werden, wechseln Sie.[26]
Das einzige Problem dieser Tit-for-Tat-Strategie ist, dass sie anfällig für Signalfehler sind. Das Problem tritt auf, wenn eine einzelne Vergeltung betrügt, das andere es als Betrug interpretiert. Infolgedessen betrügt die zweite Person nun betrügt und beginnt dann ein wachsendes Betrugsmuster in einer Kettenreaktion.
Auch ohne wiederholte Spiele stark Erklärter Eigeninteresse kann zu einem stabilen und effizienten Ergebnis führen.[27]
Beispiele im wirklichen Leben
Die Gefangenen können erfunden erscheinen, aber es gibt tatsächlich viele Beispiele in der menschlichen Wechselwirkung sowie in der Natur in der Natur, die die gleiche Auszahlungsmatrix haben. Das Dilemma des Gefangenen ist daher von Interesse für die Sozialwissenschaften wie zum Beispiel Wirtschaft, Politik, und Soziologiesowie für die biologischen Wissenschaften wie z. Ethologie und Evolutionsbiologie. Viele natürliche Prozesse wurden in Modelle, in denen Lebewesen in endlosen Spielen des Dilemmas von Gefangenen beteiligt sind, abstrahiert. Diese breite Anwendbarkeit der PD gibt dem Spiel seine wesentliche Bedeutung.
Umweltstudien
Im Umweltstudien, Die PD ist in Krisen wie Global erkennbar Klimawandel. Es wird argumentiert, dass alle Länder von einem stabilen Klima profitieren werden, aber jedes einzelne Land zögert oft, einzudämmen CO2 Emissionen. Der unmittelbare Nutzen für ein Land, wenn es darum geht, das aktuelle Verhalten aufrechtzuerhalten, wird als größer angesehen als der angebliche eventuelle Nutzen für dieses Land, wenn sich das Verhalten aller Länder geändert hat, wodurch die Sackgasse im Zusammenhang mit dem Klimawandel im Jahr 2007 erklärt wird.[28]
Ein wichtiger Unterschied zwischen der Politik der Klimawandel und dem Dilemma des Gefangenen ist die Unsicherheit. Das Ausmaß und das Tempo, in dem Verschmutzung das Klima verändern kann, ist nicht bekannt. Das Dilemma der Regierungen unterscheidet sich daher von dem Dilemma des Gefangenen darin, dass die Auszahlungen der Zusammenarbeit unbekannt sind. Dieser Unterschied legt nahe, dass die Staaten viel weniger kooperieren werden als in einem realen Dilemma eines iterierten Gefangenen, so dass die Wahrscheinlichkeit, eine mögliche Klimakatastrophe zu vermeiden, viel kleiner ist als das, was durch eine spieltheoretische Analyse der Situation unter Verwendung eines realen Dilemmas eines realen iterierten Gefangenen vorgeschlagen wird.[29]
Osang und Nandy (2003) liefern eine theoretische Erklärung mit Beweisen für eine regulationsgetriebene Win-Win-Situation in der Sicht von Michael PorterHypothese, in der die Regulierung der Regierung von konkurrierenden Unternehmen erheblich ist.[30]
Tiere
Das kooperative Verhalten vieler Tiere kann als Beispiel für das Dilemma des Gefangenen verstanden werden. Oft beteiligen sich Tiere langfristige Partnerschaften, die spezifischer als iteriertes Dilemma des Gefangenen modelliert werden können. Zum Beispiel, Guppies Überprüfen Sie Raubtiere in Gruppen kooperativ, und es wird angenommen, dass sie nicht kooperative Inspektoren bestrafen.[31]
Vampir Fledermäuse sind soziale Tiere, die sich gegen gegenseitige Lebensmittelaustausch einlassen. Die Anwendung der Auszahlungen aus dem Dilemma des Gefangenen kann helfen, dieses Verhalten zu erklären:[32]
- Zusammenarbeit/Zusammenarbeit: "Belohnung: Ich bekomme Blut in meinen unglücklichen Nächten, was mich vor Hungern rettet. Ich muss in meinen Glücksnächten Blut geben, was mich nicht zu viel kostet."
- Defekt/Zusammenarbeit: "Versuchung: Sie retten mein Leben in meiner schlechten Nacht. Aber dann habe ich den zusätzlichen Vorteil, dass ich nicht die leichten Kosten für die Fütterung in meiner guten Nacht zahlen muss."
- Kooperieren/Defekt: "Suckers Auszahlung: Ich zahle die Kosten für die Rettung Ihres Lebens in meiner guten Nacht. Aber in meiner schlechten Nacht füttern Sie mich nicht und ich gehe ein echtes Risiko ein, zu verhungern."
- Defekt/Defekt: "Bestrafung: Ich muss nicht die leichten Kosten dafür bezahlen, Sie in meinen guten Nächten zu füttern. Aber ich gehe ein echtes Risiko ein, in meinen schlechten Nächten zu hungern."
Psychologie
Im Sucht Forschung / Verhaltensökonomie, George Ainslie weist darauf hin[33] Diese Sucht kann als intertemporales PD -Problem zwischen dem gegenwärtigen und zukünftigen Selbst des Süchtigen gegossen werden. In diesem Fall, Defekt meint Rückfallund es ist leicht zu erkennen, dass es heute in Zukunft das beste Ergebnis ist. Der Fall, in dem man sich heute enthält, aber in Zukunft zurückfällt, ist das schlechteste Ergebnis-in gewissem Sinne ist die Disziplin und die Selbstaufopferung, die mit der Enthaltung heute "verschwendet" werden, "verschwendet", weil der zukünftige Rückfall bedeutet Ich muss von vorne beginnen (was ziemlich demoralisierend ist und es schwieriger macht). Rückfälliger heute und morgen ist ein etwas "besseres" Ergebnis, denn während der Süchtige noch süchtig ist, haben er sich zwar nicht bemüht, zu versuchen, aufzuhören. Der letzte Fall, in dem man heute das süchtig machende Verhalten einnimmt und sich mit "morgen" enthält, wird jedem, der mit einer Sucht zu kämpfen hat, vertraut sein. Das Problem hier ist, dass (wie bei anderen PDs) die Defekte "heute" offensichtlich ist, aber morgen wird man demselben PD konfrontiert, und der gleiche offensichtliche Nutzen wird dann zu einer endlosen Reihe von Defekten vorhanden sein.
John Gottman In seiner in "The Science of Trust" beschriebenen Forschung definiert gute Beziehungen als solche, in denen Partner wissen, dass sie nicht in die Zelle (d, d) eintreten oder zumindest nicht dynamisch in einer Schleife stecken bleiben. Im Kognitive Neurowissenschaften, schnelle Hirnsignale, die mit der Verarbeitung verschiedener Runden verbunden sind, können in der nächsten Runde die Auswahl angeben. Die gegenseitigen Kooperationsergebnisse führen zu einer Veränderung der Gehirnaktivität, die die Vorhersage dessen, wie schnell eine Person bei der nächsten Gelegenheit mit Sachleistungen zusammenarbeiten wird.[34] Diese Aktivität kann mit grundlegenden homöostatischen und motivierenden Prozessen in Verbindung gebracht werden, was möglicherweise die Wahrscheinlichkeit erhöht, dass sie in die Zelle des Spiels (c, c) in die (c, c).
Wirtschaft
Das Dilemma des Gefangenen wurde das genannt E coli der Sozialpsychologie, und es wurde weit verbreitet, um verschiedene Themen zu erforschen, wie z. Oligopolistisch Wettbewerb und kollektive Aktion, um ein kollektives Gut zu produzieren.[35]
Werbung wird manchmal als Realbeispiel des Dilemmas des Gefangenen zitiert. Wann Zigarettenwerbung In den USA war legal, konkurrierende Zigarettenhersteller mussten entscheiden, wie viel Geld für Werbung ausgeben sollte. Die Effektivität der Werbung von Unternehmen A wurde teilweise von der Werbung von Unternehmen B bestimmt, auch der Gewinn, der aus der Werbung für Unternehmen B erzielt wurde, wird von der Werbung von Unternehmen A betroffen Die Zeit, dann negiert die Anzeige der einzelnen Firma die des anderen, die Einnahmen bleiben konstant und die Kosten steigen aufgrund der Werbekosten. Beide Unternehmen würden von einer Reduzierung der Werbung profitieren. Sollte Unternehmen B jedoch nicht Werbung entscheiden, könnte Firma A durch Werbung stark profitieren. Dennoch hängt die optimale Werbung durch ein Unternehmen davon ab, wie viel Werbung die anderen veranstaltet. Da die beste Strategie davon abhängt, was die andere Firma wählt, gibt es keine dominante Strategie, was sie etwas von dem Dilemma eines Gefangenen unterscheidet. Das Ergebnis ist jedoch ähnlich, da beide Unternehmen besser dran würden, wenn sie weniger als im Gleichgewicht werben würden. Manchmal entstehen in Geschäftssituationen kooperative Verhaltensweisen. Zum Beispiel befürworteten Zigarettenhersteller die Erstellung von Gesetzen, die Zigarettenwerbung verbieten und verstehen, dass dies die Kosten senken und die Gewinne in der gesamten Branche steigern würde.[36][b] Diese Analyse dürfte in vielen anderen Geschäftssituationen mit Werbung relevant sein.
Ohne durchsetzbare Vereinbarungen, Mitglieder von a Kartell sind auch an einem (Multi-Player-) Gefangenendilemma beteiligt.[37] "Kooperieren" bedeutet in der Regel, die Preise auf einem Mindestniveau vor einem vorgefertigten Mindestniveau zu halten. "Defekt" bedeutet, unter diesem Mindestniveau zu verkaufen und sofort Geschäfte (und Gewinne) von anderen Kartellmitgliedern zu nehmen. Kartellvertrauen Die Behörden möchten, dass potenzielle Kartellmitglieder gegenseitig defekt sind und die niedrigstmöglichen Preise für sicherstellen Verbraucher.
Sport
Doping im Sport wurde als Beispiel für das Dilemma eines Gefangenen zitiert.[38]
Zwei konkurrierende Athleten haben die Möglichkeit, ein illegales und/oder gefährliches Medikament zu nutzen, um ihre Leistung zu steigern. Wenn kein Athlet die Droge einnimmt, hat keiner einen Vorteil. Wenn nur einer, hat dieser Athlet einen erheblichen Vorteil gegenüber ihrem Konkurrenten, der durch die rechtlichen und/oder medizinischen Gefahren reduziert wird, das Medikament genommen zu haben. Wenn beide Athleten das Medikament einnehmen, stornieren die Vorteile und nur die Gefahren, was beide in eine schlechtere Position versetzt, als wenn keiner Doping verwendet worden wäre.[38]
In einem Gespräch mit Ken Griffey Jr. Nach dem 1998 MLB Jahreszeit, Barry Bonds drückte seine Frustration über die Verwendung von Steroiden durch andere Spieler aus. Bonds erklärte: "Ich hatte letztes Jahr eine Helluva -Saison und niemand hat einen Mist gegeben. Niemand. So sehr ich mich über McGwire und Canseco und alle Bullen mit Steroiden beschwert habe, ich bin es leid, gegen ihn zu kämpfen. Jahr. Ich habe noch drei oder vier gute Jahreszeiten übrig und ich möchte bezahlt werden. Ich werde einfach anfangen, ein paar Hardcore-Sachen zu verwenden, und hoffentlich wird es meinen Körper nicht verletzen. Dann werde ich aus dem rauskommen Spiel und damit fertig sein. "[39] Bonds befand sich im Dilemma des Gefangenen, das im Baseball dotiert, das Gefühl, Steroide zu verwenden, damit seine Konkurrenten keinen so bedeutenden Vorteil gegenüber ihm haben und ihn auf ein gleichmäßiges Spielfeld setzen, obwohl es allen schlechter geht als Wenn niemand Steroide verwendet hätte.
Internationale Politik
Im Internationale politische TheorieDas Dilemma des Gefangenen wird oft verwendet, um die Kohärenz des strategischen Realismus zu demonstrieren, der besagt Internationale Anarchie. Ein klassisches Beispiel ist ein Wettrüsten wie das Kalter Krieg und ähnliche Konflikte.[40] Während des Kalten Krieges die gegnerischen Allianzen von NATO und die Warschauer Pakt Beide hatten die Wahl, sich zu bewaffnen oder zu entwaffnen. Aus der Sicht der einzelnen Seite hätte sich die Entwaffnung, während ihr Gegner weiterhin zu arm war, zu militärischer Minderwertigkeit und einer möglichen Vernichtung geführt. Umgekehrt hätte sich die Bewaffnung, während ihr Gegner entwaffnet, zu Überlegenheit geführt. Wenn beide Seiten sich für den Arm entschieden hatten, konnte es sich auch nicht leisten, den anderen anzugreifen, aber beide entstanden den hohen Kosten für die Entwicklung und Aufrechterhaltung eines nuklearen Arsenals. Wenn beide Seiten entwaffnet worden sein würden, würde der Krieg vermieden und es gäbe keine Kosten.
Obwohl das „beste“ Gesamtergebnis für beide Seiten besteht, sich zu entwaffnen, ist der rationale Kurs für beide Seiten zu Army, und das ist in der Tat passiert. Beide Seiten gaben enorme Ressourcen in militärische Forschung und Bewaffnung in a Zermürbungskrieg In den nächsten dreißig Jahren konnte die Sowjetunion den wirtschaftlichen Kosten nicht standhalten.[41] Die gleiche Logik könnte in einem ähnlichen Szenario angewendet werden, sei es wirtschaftlicher oder technologischer Wettbewerb zwischen souveränen Zuständen.
Multiplayer -Dilemmata
Viele reale Dilemmata betreffen mehrere Spieler.[42] Obwohl metaphorisch, Hardin's Tragödie der Commons Kann als Beispiel für eine Mehrspielerverallgemeinerung der PD angesehen werden: Jeder Dorfbewohner trifft eine Wahl für persönlichen Gewinn oder Zurückhaltung. Die kollektive Belohnung für einstimmig (oder sogar häufige) Defekte beträgt sehr niedrige Auszahlungen (die die Zerstörung der "Commons" darstellen). Ein Commons -Dilemma, mit dem sich die meisten Menschen beziehen können, ist das Waschen des Geschirrs in einem gemeinsamen Haus. Durch das Nichtwaschen von Gerichten kann ein Individuum gewinnen, indem er seine Zeit spart. Wenn dieses Verhalten jedoch von jedem Bewohner übernommen wird, sind die kollektiven Kosten für niemanden saubere Teller.
Die Commons werden nicht immer ausgenutzt: William Poundstonebeschreibt in einem Buch über das Dilemma des Gefangenen eine Situation in Neuseeland, in der Zeitungskästen freigeschaltet bleiben. Es ist für Menschen möglich ein Papier nehmen, ohne zu bezahlen (Defekt) Aber nur sehr wenige tun, wenn sie nicht bezahlen, dann auch andere, die das System zerstören.[43] Nachfolgende Forschung von Elinor Ostrom, Gewinner des 2009 Nobel -Gedenkpreis in Wirtschaftswissenschaften, hypotheses, dass die Tragödie der Commons mit dem negativen Ergebnis von externen Einflüssen beeinflusst wird. Ohne komplizierende Druck kommunizieren und verwalten Gruppen die Commons für ihren gegenseitigen Nutzen untereinander und setzen soziale Normen zur Erhaltung der Ressource und zum Erreichen des maximalen Gutes für die Gruppe durch, ein Beispiel dafür, das beste Fall für PD zu erzielen.[44][45]
Verwandte Spiele
Austausch geschlossen
Douglas Hofstadter[46] Einmal vorgeschlagen, dass Menschen häufig Probleme wie das PD-Problem finden, leichter zu verstehen, wenn es in Form eines einfachen Spiels oder eines Kompromisses veranschaulicht wird. Eines von mehreren Beispielen, die er verwendete, war "Closed Bag Exchange":
Zwei Personen treffen und tauschen geschlossene Taschen aus, mit dem Verständnis, dass einer von ihnen Geld enthält und der andere einen Kauf enthält. Entweder die Spielerin kann sich dafür entscheiden, den Deal zu ehren, indem er in seine oder ihre Tasche steckt, was er oder sie zustimmte, oder er oder sie kann durchgeben, indem er eine leere Tasche übergibt.
Freund oder Feind?
Freund oder Feind? ist eine Spielshow, die von 2002 bis 2003 auf dem ausgestrahlt wurde Spielshow -Netzwerk in den USA. Es ist ein Beispiel für das Dilemma -Spiel des Gefangenen, das auf echte Menschen getestet wurde, aber in einer künstlichen Umgebung. In der Spielshow treten drei Paare von Menschen an. Wenn ein Paar beseitigt wird, spielen sie ein Spiel ähnlich wie das Dilemma des Gefangenen, um festzustellen, wie die Gewinne geteilt werden. Wenn beide zusammenarbeiten (Freund), teilen sie die Gewinne 50–50. Wenn eine kooperierte und die anderen Mängel (Feinde) zusammenfassen, bekommt der Überläufer alle Gewinne und der Cooperator nichts. Wenn beide Defekte haben, gehen beide mit nichts. Beachten Sie, dass sich die Belohnungsmatrix geringfügig vom oben angegebenen Standard unterscheidet. Dies macht den Fall "beide Defekt" zu einem schwachen Gleichgewicht, verglichen mit einem strengen Gleichgewicht im Standard -Dilemma des Gefangenen. Wenn ein Kandidat weiß, dass sein Gegner "Feind" wählen wird, hat seine eigene Wahl nicht ihre eigenen Gewinne. In einem bestimmten Sinne, Freund oder Feind hat ein Belohnungsmodell zwischen dem Dilemma des Gefangenen und der Hühnchenspiel.
Die Belohnungsmatrix ist
Paar 2 Paar 1 | "Freund" (kooperieren) | "Feind" (Defekt) |
---|---|---|
"Freund" (kooperieren) | 1 1 | 2 0 |
"Feind" (Defekt) | 0 2 | 0 0 |
Diese Auszahlungsmatrix wurde auch für die verwendet britisch Fernsehen Programme Vertrau mir, Verändert, Bank Job und Goldene Bälleund auf der amerikanisch Spielshows Nimm allessowie für das Gewinnerpaar der Reality -Shows Shows Junggesellenbude und Liebesinsel. Spieldaten aus der Goldene Bälle Die Serie wurde von einem Team von Ökonomen analysiert, das feststellte, dass die Zusammenarbeit für Geldbeträge "überraschend hoch" war, die in der realen Welt konsequent erscheinen, aber im Kontext des Spiels vergleichsweise niedrig waren.[47]
Iterierte Schneeverwehung
Forscher aus dem Universität Lausanne und die Universität von Edinburgh haben vorgeschlagen, dass das "iterierte Schneeverwickungsspiel" die realen sozialen Situationen eher widerspiegeln. Obwohl dieses Modell tatsächlich ein ist HühnerspielEs wird hier beschrieben. In diesem Modell ist das Risiko, durch Defekte ausgenutzt zu werden, niedriger, und Einzelpersonen gewinnen immer von der Kooperationswahl. Das Schneeverwöhnungsspiel stellt sich zwei Treiber vor, die auf gegenüberliegenden Seiten von a stecken bleiben SchneeverwehungJeder von ihnen wird die Möglichkeit, Schnee zu schaufeln, um einen Weg zu räumen oder in ihrem Auto zu bleiben. Die höchste Auszahlung eines Spielers kommt davon, den Gegner zu verlassen, um den gesamten Schnee selbst zu räumen, aber der Gegner wird für seine Arbeit immer noch nominell belohnt.
Dies kann bessere Szenarien der realen Welt widerspiegeln. Die Forscher geben dem Beispiel zwei Wissenschaftler, die an einem Bericht zusammenarbeiten, beide würden davon profitieren, wenn die anderen härter arbeiten. "Aber wenn Ihr Mitarbeiter keine Arbeit leistet, ist es wahrscheinlich besser für Sie, die ganze Arbeit selbst zu erledigen. Sie werden immer noch ein abgeschlossenes Projekt haben."[48]
|
|
Koordinationsspiele
In Koordinationsspielen müssen die Spieler ihre Strategien für ein gutes Ergebnis koordinieren. Ein Beispiel sind zwei Autos, die sich abrupt in einem Schneesturm treffen. Jeder muss wählen, ob sie nach links oder rechts ausweichen sollen. Wenn beide links oder beides rechts ausweichen, kollidieren die Autos nicht. Die lokale links- und rechter Verkehr Die Konvention hilft, ihre Handlungen zu koordinieren.
Zu den symmetrischen Koordinierungsspielen gehören Hirschjagd und Bach oder Strawinsky.
Asymmetrische Dilemmata des Gefangenen
Eine allgemeinere Reihe von Spielen ist asymmetrisch. Wie im Dilemma des Gefangenen ist das beste Ergebnis die Zusammenarbeit, und es gibt Motive für einen Überblick. Im Gegensatz zum Dilemma des symmetrischen Gefangenen hat ein Spieler jedoch mehr zu verlieren und/oder mehr zu gewinnen als der andere. Einige solche Spiele wurden als Dilemma eines Gefangenen beschrieben, in dem ein Gefangener eine hat AlibiWoher der Begriff "Alibi -Spiel".[49]
In Experimenten können Spieler, die bei wiederholten Spielen ungleiche Auszahlungen erhalten, möglicherweise versuchen, den Gewinn zu maximieren, aber nur unter der Bedingung, dass beide Spieler gleiche Auszahlungen erhalten. Dies kann zu einer stabilen Gleichgewichtsstrategie führen, bei der der benachteiligte Spieler alle X-Spiele definiert, während der andere immer mitwirkt. Ein solches Verhalten kann von den sozialen Normen des Experiments um Fairness abhängen.[50]
Guardian's Dilemma
Es sind nicht nur Gefangene, die Dilemmata ausgesetzt sind. Wächter konfrontieren auch Situationen, in denen es nur unattraktive Auswahlmöglichkeiten gibt. Beispiele finden sich leicht in Fällen, in denen ein Agent die Spannungen zwischen seinen eigenen Partnern reibungslosen Anteilsbekenntnissen musste Geschäftsführer; zwei Beamte, die um Beförderung und Spannung kämpfen, die dies für den Hauptsitz ihres Büros verursacht; oder in Erziehung Wenn zwei Geschwister um Aufmerksamkeit und die Angst wetteifern, verursacht dies ihre Eltern. Wenn das Verhalten des Wächters eine Seite erfüllt, fühlt sich die andere Seite freigelegt und entfremdet an.
Von einem internationale Beziehungen Perspektive führt Dr. Spyros Katsoulas das Konzept des Dilemmas des Guardian ein.[51] Das Dilemma des Wächters ist definiert als die Bedingung, in der zwei Staaten ihre Feindschaft gegenseitig aufrechterhalten, obwohl er einen stärkeren gemeinsamen Verbündeten teilt. Standardmäßig ist ein Dilemma eine Situation mit unbefriedigenden Entscheidungen. Das Dilemma des Wächters liegt in der Tatsache, dass der stärkere Zustand weder aus einer Krise zwischen seinen Verbündeten heraushalten und sich nicht aktiv engagiert, ohne das fragile Gleichgewicht zu beeinflussen. Wenn sich der Vormund enthält, kann die Situation außer Kontrolle geraten; Wenn der Wächter involviert wird, kann jede Neigung gegen eine Seite als Sieg oder ein Fenster der Gelegenheit für die andere angesehen werden. Erweiterung auf Glenn SnyderKonzept des Alliance Security Dilemma,[52] Die Ergebnisse der Wechselwirkung zwischen dem Guardian und den beiden kleineren Partnern werden als Verlassen, Einschluss und Ermutigung beschrieben.
Software
Es wurden mehrere Softwarepakete erstellt, um die Dilemma -Simulationen und -Turniere des Gefangenen durchzuführen, von denen einige zum Quellcode verfügbar sind.
- Der Quellcode für die zweites Turnier betrieben von Robert Axelrod (geschrieben von Axelrod und vielen Mitwirkenden in Forran) ist verfügbar online
- Gefängnis, eine Bibliothek in geschrieben Java, zuletzt aktualisiert 1998
- Axelrod-Python, geschrieben in Python
- Evoplex, ein schnelles, agentenbasiertes Modellierungsprogramm, das 2018 von Marcos Cardinot veröffentlicht wurde
In der Fiktion
Hannu Rajaniemi Setzen Sie die Eröffnungsszene seiner Der Quantendieb Trilogie in einem "Dilemma -Gefängnis". Das Hauptthema der Serie wurde als "Unzulänglichkeit eines binären Universums" beschrieben und der ultimative Antagonist ist eine Figur, die als All-Defektor bezeichnet wird. Rajaniemi ist besonders interessant als Künstler, der dieses Thema darin behandelt, als er ein von Cambridge ausgebildeter Mathematiker ist und einen Doktortitel in hat Mathematische Physik-Die Austauschbarkeit von Materie und Informationen ist ein Hauptmerkmal der Bücher, das in einer "Zukunft nach Singularität" stattfindet. Das erste Buch in der Serie wurde 2010 mit den beiden Fortsetzungen veröffentlicht. Der fraktale Prinz und Der kausale Engel, veröffentlicht in den Jahren 2012 bzw. 2014.
Ein Spiel, das dem (iterierten) Dilemma des Gefangenen nachempfunden ist, ist ein zentraler Schwerpunkt des Videospiels 2012 Zero Escape: Tugend letzte Belohnung und ein kleiner Teil in seiner Fortsetzung 2016 Zero Escape: Zero Time Dilemma.
Im Die mysteriöse Benediktgesellschaft und das Dilemma des Gefangenen durch Trenton Lee StewartDie Hauptfiguren spielen zunächst eine Version des Spiels und entkommen insgesamt aus dem "Gefängnis". Später werden sie tatsächliche Gefangene und entkommen erneut.
Im Die Abenteuerzone: Gleichgewicht während Das leidensspiele Spiel Subarc, die Spielercharaktere werden während ihrer Zeit im Domäne der Gefangenen zweimal mit dem Dilemma des Gefangenen übertragen, einst kooperieren und einst mit Defekten versehen.
Im 8. Roman des Autors James S. A. Corey Tiamats Zorn, Winston Duarte erklärt seine 14-jährige Tochter Teresa das Dilemma der Gefangenen, sie im strategischen Denken auszubilden.
Eine extreme Version des Dilemmas des Gefangenen ist im Film 2008 vorgestellt Der dunkle Ritter in welcher Joker Rigs zwei Fähren, eine mit Gefangenen und die andere, die Zivilisten enthalten, bewaffnen beide Gruppen mit den Mitteln, um die Bombe gegenseitig die Fähren zu detonieren. Letztendlich beschließen die beiden Seiten, nicht zu handeln.
Siehe auch
- Abilene Paradox
- Centipede -Spiel
- Weihnachtswaffenstillstand
- Externalität
- Volkstheorem (Spieltheorie)
- Trittbrettfahrerproblem
- Hobbesische Falle
- Dilemma des unschuldigen Gefangenen
- Lügenspiel
- Optionales Dilemma des Gefangenen
- Dilemma und Zusammenarbeit des Gefangenen
- Öffentliches Güterspiel
- Geschenkaustauschspiel
- Gegenseitiger Altruismus
- Mietsuchung
- Soziale Vorlieben
- Swift Trust Theory
- Tragödie der Commons
- Skrupelloser Diner -Dilemma
Verweise
- ^ Zum Beispiel siehe die Studie von 2003[16] zur Diskussion des Konzepts und ob es real gelten kann wirtschaftlich oder strategische Situationen.
- ^ Dieses Argument für die Entwicklung der Zusammenarbeit durch Vertrauen ist in gegeben Die Weisheit der Menschenmenge, wo es so argumentiert, dass diese Langstrecke Kapitalismus war in der Lage, um einen Kern von zu bilden Quäker, der sich immer ehrenhaft mit ihren Geschäftspartnern befasste. (Anstatt sich mit Versprechen zu befassen und abzufinden-ein Phänomen, das frühere langfristige nicht durchsetzbare Überseeverträge entmutigt hatte). Es wird argumentiert, dass der Umgang mit zuverlässigen Händlern das erlaubte Meme Damit sich die Zusammenarbeit auf andere Händler ausbreitete, die es weiter verbreiten, bis ein hohes Maß an Zusammenarbeit zu einer profitablen Strategie im Allgemeinen wurde Handel
- ^ Poundstone 1993, S. 8, 117.
- ^ Milovsky, Nicholas. "Die Grundlagen der Spieltheorie und der damit verbundenen Spiele". Abgerufen 11. Februar 2014.
- ^ a b c d e Rapoport, Anatol (2016), "Gefangenendilemma", Das neue Palgrave Dictionary of Economics, London: Palgrave Macmillan UK, S. 1–5, doi:10.1057/978-1-349-95121-5_1850-1, ISBN 978-1-349-95121-5, abgerufen 2021-11-29
- ^ Fehr, Ernst; Fischbacher, URS (23. Oktober 2003). "Die Natur des menschlichen Altruismus" (PDF). Natur. 425 (6960): 785–91. Bibcode:2003Natur.425..785f. doi:10.1038/nature02043. PMID 14574401. S2CID 4305295. Abgerufen 27. Februar, 2013.
- ^ Tversky, Amos; Shafir, Eldar (2004). Präferenz, Glauben und Ähnlichkeit: Ausgewählte Schriften (PDF). Massachusetts Institute of Technology Press. ISBN 9780262700931. Abgerufen 27. Februar, 2013.
- ^ Toh-kyeong, Ahn; Ostrom, Elinor; Walker, James (5. September 2002). "Einbeziehung der Motivationsheterogenität in spieltheoretische Modelle kollektiver Aktionen" (PDF). Öffentliche Wahl. 117 (3–4): 295–314. doi:10.1023/b: puch.0000003739.54365.fd. HDL:10535/4697. S2CID 153414274. Abgerufen 27. Juni, 2015.
- ^ Oosterbeek, Hessel; Sloof, Randolph; Van de Kuilen, Gus (3. Dezember 2003). "Kulturelle Unterschiede in Ultimatum-Spielexperimenten: Beweise aus einer Metaanalyse" (PDF). Versuchsökonomie. 7 (2): 171–88. doi:10.1023/b: exec.0000026978.14316.74. S2CID 17659329. Archiviert von das Original (PDF) am 12. Mai 2013. Abgerufen 27. Februar, 2013.
- ^ Ormerod, Paul (2010-12-22). Warum die meisten Dinge scheitern. ISBN 9780571266142.
- ^ Deutsch, M. (1958). Vertrauen und Verdacht. Journal of Conflict Resolution, 2 (4), 265–279. https://doi.org/10.1177/002200275800200401
- ^ Rapoport, A. & Chammah, A. M. (1965). Dilemma des Gefangenen: Eine Studie über Konflikte und Zusammenarbeit. Ann Arbor, MI: Universität von Michigan Press.
- ^ Kaznatcheev, Artem (2. März 2015). "Kurzgeschichte der Iterated Dilemma -Turniere des Gefangenen". Zeitschrift für Konfliktlösung. 24 (3): 379–403. doi:10.1177/002200278002400301. S2CID 145555261. Abgerufen 8. Februar, 2016.
- ^ a b Hilbe, Christus; Martin A. Nowak; Karl Sigmund (April 2013). "Entwicklung der Erpressung bei iterierten Dilemma -Spielen des Gefangenen". PNAs. 110 (17): 6913–18. Arxiv:1212.1067. Bibcode:2013pnas..110.6913h. doi:10.1073/pnas.1214834110. PMC 3637695. PMID 23572576.
- ^ Shy, Oz (1995). Industrieorganisation: Theorie und Anwendungen. Massachusetts Institute of Technology Press. ISBN 978-0262193665. Abgerufen 27. Februar, 2013.
- ^ Dal Bó, Pedro; Fréchette, Guillaume R. (2019). "Strategieauswahl im unendlich wiederholten Dilemma des Gefangenen". Amerikanische wirtschaftliche Überprüfung. 109 (11): 3929–3952. doi:10.1257/aer.20181480. ISSN 0002-8282. S2CID 216726890.
- ^ Wedekind, C.; Milinski, M. (2. April 1996). "Menschliche Zusammenarbeit im gleichzeitigen und wechselnden Gefangenendilemma: Pavlov gegen großzügige Tit-for-Tat". Verfahren der National Academy of Sciences. 93 (7): 2686–2689. Bibcode:1996pnas ... 93.2686w. doi:10.1073/pnas.93.7.2686. PMC 39691. PMID 11607644.
- ^ "Bayes'sche Nash -Gleichgewicht; ein statistischer Test der Hypothese" (PDF). Tel Aviv University. Archiviert von das Original (PDF) Am 2005-10-02.
- ^ Wu, Jiadong; Zhao, Chengye (2019), Sun, Xiaoming; Er, Kun; Chen, Xiaoyun (Hrsg.), "Zusammenarbeit mit der Monte -Carlo -Regel: Gefangenen -Dilemma -Spiel am Raster", Theoretische Informatik, Springer Singapore, Vol. 1069, S. 3–15, doi:10.1007/978-981-15-0105-0_1, ISBN 978-981-15-0104-3, S2CID 118687103
- ^ "Das Team der University of Southampton gewinnt das Dilemma -Wettbewerb des Gefangenen" (Pressemitteilung). Universität von Southampton. 7. Oktober 2004. archiviert von das Original Am 2014-04-21.
- ^ a b c d e Presse, WH; Dyson, FJ (26. Juni 2012). "Iteratiertes Dilemma des Gefangenen enthält Strategien, die jeden evolutionären Gegner dominieren". Verfahren der Nationalen Akademie der Wissenschaften der Vereinigten Staaten von Amerika. 109 (26): 10409–13. Bibcode:2012pnas..10910409p. doi:10.1073/pnas.1206569109. PMC 3387070. PMID 22615375.
- ^ Adami, Christoph; Arend Hintze (2013). "Evolutionäre Instabilität von Null -Determinanten -Strategien zeigt, dass das Gewinnen nicht alles ist". Naturkommunikation. 4: 3. Arxiv:1208.2666. Bibcode:2013natco ... 4.2193a. doi:10.1038/ncomms3193. PMC 3741637. PMID 23903782.
- ^ a b Stewart, Alexander J.; Joshua B. Plotkin (2013). "Von der Erpressung bis zur Großzügigkeit, der Entwicklung des iterierten Dilemmas des Iterierten". ". Verfahren der Nationalen Akademie der Wissenschaften der Vereinigten Staaten von Amerika. 110 (38): 15348–53. Bibcode:2013pnas..11015348s. doi:10.1073/pnas.1306246110. PMC 3780848. PMID 24003115.
- ^ Akin, Ethan (2013). "Stabile kooperative Lösungen für das iterierte Dilemma des Gefangenen". p. 9. Arxiv:1211.0969 [math.ds]. Bibcode:2012ArXIV1211.0969a
- ^ Le S, Boyd R (2007). "Evolutionsdynamik des kontinuierlichen iterierten Dilemmas des Gefangenen". Journal of Theoretical Biology. 245 (2): 258–67. Bibcode:2007jthbi.245..258l. doi:10.1016/j.jtbi.2006.09.016. PMID 17125798.
- ^ Hammerstein, P. (2003). Warum ist Reziprozität bei sozialen Tieren so selten? Eine protestantische Berufung. In: P. Hammerstein, Herausgeber, genetische und kulturelle Entwicklung der Zusammenarbeit, MIT Press. S. 83–94.
- ^ Spaniel, William (2011). Spieltheorie 101: Das vollständige Lehrbuch.
- ^ Nowak, Martin; Karl Sigmund (1993). "Eine Strategie von Win-Stay, Lose-Shift, der Tit-for-tat im Dilemma-Spiel des Gefangenen übertrifft." Natur. 364 (6432): 56–58. Bibcode:1993Natur.364 ... 56n. doi:10.1038/364056a0. PMID 8316296. S2CID 4238908.
- ^ Stark, Oded (1989). "Altruismus und die Lebensqualität". Die amerikanische wirtschaftliche Überprüfung. 79 (2): 86–90. ISSN 0002-8282. Abgerufen 25. Juli 2022.
- ^ "Märkte & Daten". Der Ökonom. 2007-09-27.
- ^ Rehmeyer, Julie (2012-10-29). "Die Spieltheorie schlägt vor, dass aktuelle Klimaverhandlungen die Katastrophe nicht abwenden werden.". Wissenschaftsnachrichten. Gesellschaft für Wissenschaft und Öffentlichkeit.
- ^ Osang, Thomas; Nandyyz, Arundhati (August 2003). Umweltregulierung von Umweltverschmutzungsunternehmen: Porters Hypothese überarbeitet (PDF) (Papier).
- ^ Brosnan, Sarah F.; Earley, Ryan L.; Dugatkin, Lee A. (Oktober 2003). "Beobachtungslernen und Raubtierinspektion in Guppies (Poecilia reticulata): Soziales Lernen in Guppies". Ethologie. 109 (10): 823–833. doi:10.1046/j.0179-1613.2003.00928.x.
- ^ Dawkins, Richard (1976). Das egoistische Gen. Oxford University Press.
- ^ Ainslie, George (2001). Aufschlüsselung des Willens. ISBN 978-0-521-59694-7.
- ^ Cervantes Constantino, Garat, Nicolaisen, Paz, Martínez-Montes, Kessel, Cabana und Gradin (2020). "Die neuronale Verarbeitung iteratter Dilemma-Ergebnisse des Gefangenen zeigt die Auswahl der nächsten Runde und die Geschwindigkeit, um Zusammenarbeit zu erwidern.". Soziale Neurowissenschaften. 16 (2): 103–120. doi:10.1080/17470919.2020.1859410. PMID 33297873. S2CID 228087900.
{{}}
: Cs1 montiert: Mehrfachnamen: Autorenliste (Link) - ^ Axelrod, Robert (1980). "Effektive Wahl im Dilemma des Gefangenen". Das Journal of Conflict Resolution. 24 (1): 3–25. doi:10.1177/002200278002400101. ISSN 0022-0027. JStor 173932. S2CID 143112198.
- ^ Henriksen, Lisa (März 2012). "Umfassende Einschränkungen des Tabakmarketings: Werbung, Verpackung, Preis und Ort". Tabakkontrolle. 21 (2): 147–153. doi:10.1136/tabaccocontrol-2011-050416. PMC 4256379. PMID 22345238.
- ^ Nicholson, Walter (2000). Zwischenmikroökonomie und ihre Anwendung (8. Aufl.). Fort Worth, TX: Dryden Press: Harcourt College Publishers. ISBN 978-0-030-25916-6.
- ^ a b Schneier, Bruce (2012-10-26). "Lance Armstrong und das Dilemma der Gefangenen, im professionellen Sport zu dopieren, | Wired Opinion". Verdrahtet. Wired.com. Abgerufen 2012-10-29.
- ^ "Pearlman: Großartig war nicht gut genug". ESPN.com. 2006-03-14. Abgerufen 2021-12-08.
- ^ Stephen J. Majeski (1984). "Die Wettrüsten wie durch das Dilemma -Spiel des Gefangenen". Mathematische Sozialwissenschaften. 7 (3): 253–66. doi:10.1016/0165-4896 (84) 90022-2.
- ^ Kuhn, Steven (2019), "Gefangenendilemma"in Zalta, Edward N. (Hrsg.), Die Stanford -Enzyklopädie der Philosophie (Winter 2019 Hrsg.), Metaphysics Research Lab, Stanford University, abgerufen 2020-04-12
- ^ Gokhale CS, Traulsen A. Evolutionsspiele im Multiversum. Verfahren der Nationalen Akademie der Wissenschaften. 2010 März 23. 107 (12): 5500–04.
- ^ Poundstone 1993, S. 126–127.
- ^ "The Volokh Verschwörung" Elinor Ostrom und die Tragödie der Commons ". Volokh.com. 2009-10-12. Abgerufen 2011-12-17.
- ^ Ostrom, Elinor (2015) [1990]. Leitende der Commons: Die Entwicklung von Institutionen für kollektives Handeln. Cambridge University Press. doi:10.1017/CBO9781316423936. ISBN 978-1-107-56978-2.
- ^ Hofstadter, Douglas R. (1985). "Ch.29 Die Dilemma -Computerturniere des Gefangenen und die Entwicklung der Zusammenarbeit. ". Metamagische Themen: Suche nach der Essenz des Geistes und des Musters. Bantam Dell Pub Group. ISBN 978-0-465-04566-2.
- ^ Van Den Assemon, Martijn J. (Januar 2012). "Spalten oder stehlen? Genossenschaftsverhalten, wenn die Einsätze groß sind". Managementwissenschaft. 58 (1): 2–20. doi:10.1287/mnsc.1110.1413. HDL:1765/31292. S2CID 1371739. SSRN 1592456.
- ^ Kümmerli, Rolf. ""Snowdrift" -Spielde "Gefangene" Dilemma des Gefangenen bei der Erklärung der Zusammenarbeit ". Abgerufen 11. April 2012.
- ^ Robinson, D.R.; Goforth, D.J. (5. Mai 2004). Alibi -Spiele: Die Dilemmata des asymmetrischen Gefangenen (PDF). Treffen der Canadian Economics Association, Toronto, 4. bis 6. Juni 2004.
- ^ Beckenkamp, Martin; Hennig-Schmidt, Heike; Maier-Rigaud, Frank P. (4. März 2007). "Zusammenarbeit bei symmetrischen und asymmetrischen Dilemma -Spielen" Gefangene " (PDF). Max Planck Institute für Forschung zu Kollektivgütern.
- ^ Katsoulas, Spyros (2022). Die Vereinigten Staaten und griechisch-türkischen Beziehungen: Das Dilemma des Wächters. Routledge, Taylor & Francis Group. ISBN 9781032123370.
- ^ Glenn H. Snyder, "The Security Dilemma in Alliance Politics" World Politics, Band 36, Ausgabe 4, Juli 1984, S. 461 - 495 https://doi.org/10.2307/2010183
Weitere Lektüre
- Amadae, S. (2016). "Gefangenendilemma", Gefangene der Vernunft. Cambridge University Press, NY, S. 24–61.
- Aumann, Robert (1959). "Akzeptable Punkte im Allgemeinen Genossenschaft n-Person Games ". In Luce, R. D .; Tucker, A. W. (Hrsg.). Beiträge zur Theorie 23 der Spiele IV. Annalen der Mathematikstudie. Vol. 40. Princeton NJ: Princeton University Press. S. 287–324. HERR 0104521.
- Axelrod, R. (1984). Die Entwicklung der Zusammenarbeit. ISBN0-465-02121-2
- Bicchieri, Cristina (1993). Rationalität und Koordination. Cambridge University Press.
- Schach, David M. (Dezember 1988). "Simulation der Entwicklung des Verhaltens: Das iterierte Problem der Gefangenen des Gefangenen" (PDF). Komplexe Systeme. 2 (6): 663–70.
- Dresher, M. (1961). Die Mathematik von Strategiespielen: Theorie und Anwendungen Prentice-Hall, Englewood Cliffs, NJ.
- Greif, A. (2006). Institutionen und der Weg zur modernen Wirtschaft: Lehren aus dem mittelalterlichen Handel. Cambridge University Press, Cambridge, Großbritannien.
- Kopelman, Shirli (Februar 2020). "Tit für Tat und darüber hinaus: Die legendäre Arbeit von Anatol Rapoport". Verhandlungs- und Konfliktmanagementforschung. 13 (1): 60–84. doi:10.1111/ncmr.12172.
- Poundstone, William (1993). Gefangenendilemma (1. Ankerbücher ed.). New York: Anker. ISBN 0-385-41580-x.
- Rapoport, Anatol und Albert M. Chammah (1965). Gefangenendilemma. Presse der Universität von Michigan.
Externe Links
- Medien im Zusammenhang mit dem Dilemma des Gefangenen bei Wikimedia Commons
- Gefangenendilemma (Stanford Encyclopedia of Philosophy)
- Das Dilemma des Bowerbird Das Dilemma des Gefangenen in Ornithologie - Mathematischer Cartoon von Larry Gonick.
- Das Dilemma des Gefangenen Das Dilemma des Gefangenen mit Lego -Minifiguren.
- Dixit, Avinash; Nalebuff, Barry (2008). "Gefangenendilemma". Im David R. Henderson (ed.). Präzise Enzyklopädie der Wirtschaftswissenschaften (2. Aufl.). Indianapolis: Bibliothek für Wirtschaft und Freiheit. ISBN 978-0865976658. OCLC 237794267.
- Spieltheorie 101: Dilemma des Gefangenen
- Dawkins: Nette Jungs beenden zuerst
- Axelrod Iteratiertes Dilemma des Gefangenen Python Bibliothek
- Spielen Sie das Dilemma des Gefangenen otree (N/A 11-5-17)
- Nicky Case Vertrauenentwicklung, ein Beispiel für das Spendenspiel
- Iteratiertes Dilemma Online -Spiel des Gefangenen von Wayne Davis