Vad är fångarnas dilemma?

I själva spelet representeras straff (och belöningar, där det är relevant) av verktyg tal. Positiva siffror representerar goda resultat, negativa siffror representerar dåliga resultat, och ett resultat är bättre än ett annat om antalet som är associerat med det är större. (Var dock försiktig med hur detta fungerar för negativa siffror, eftersom -5 till exempel är större än -20!)

I tabellen ovan hänvisar det första numret i varje ruta till resultatet för spelare 1 och det andra numret representerar resultatet för spelare 2. Dessa nummer representerar bara en av många uppsättningar av nummer som överensstämmer med fångarnas dilemma.

När ett spel har definierats är nästa steg i analysen av spelet att utvärdera spelarnas strategier och försöka förstå hur spelarna sannolikt kommer att bete sig. Ekonomer gör några antaganden när de analyserar spel - först antar de att båda spelarna är medvetna om utbetalningarna både för sig själva och för den andra spelaren, och för det andra antar de att båda spelarna letar till rationellt maximera sin egen vinst från spelet.

instagram viewer

En enkel initial inställning är att leta efter vad som kallas dominerande strategier- Strategier som är bäst oavsett vilken strategi den andra spelaren väljer. I exemplet ovan är valet att erkänna en dominerande strategi för båda spelarna:

Med tanke på att bekännande är bäst för båda spelarna är det inte förvånande att resultatet där båda spelarna erkänner är ett jämviktsutfall av spelet. Som sagt är det viktigt att vara lite mer exakt med vår definition.

Begreppet a Nash jämvikt kodifierades av matematiker och spelteoretiker John Nash. Enkelt uttryckt är en Nash Equilibrium en uppsättning strategier för bästa respons. För ett tvåspelarspel är en Nash-jämvikt ett resultat där spelarens 2-strategi är det bästa svaret på spelarens 1-strategi och spelarens 1-strategi är det bästa svaret på spelarens 2-strategi.

Att hitta Nash-jämvikten via denna princip kan illustreras i tabellen över resultat. I det här exemplet cirkuleras spelarens 2 bästa svar på spelare ett med grönt. Om spelare 1 bekänner är spelarens bästa svar att bekänna, eftersom -6 är bättre än -10. Om spelare 1 inte erkänner är spelarens bästa svar att bekänna, eftersom 0 är bättre än -1. (Observera att detta resonemang är mycket likt det resonemang som används för att identifiera dominerande strategier.)

Player 1s bästa svar är cirklade i blått. Om spelare 2 bekänner är spelarens bästa svar att bekänna, eftersom -6 är bättre än -10. Om spelare 2 inte erkänner är spelarens bästa svar att bekänna, eftersom 0 är bättre än -1.

Nash-jämvikten är resultatet där det finns både en grön cirkel och en blå cirkel eftersom detta representerar en uppsättning bästa svarstrategier för båda spelarna. I allmänhet är det möjligt att ha flera Nash-jämvikt eller ingen alls (åtminstone i rena strategier som beskrivs här).

Du kanske har lagt märke till att Nash-jämvikten i det här exemplet verkar suboptimalt på ett sätt (särskilt genom att det inte är Pareto optimalt) eftersom det är möjligt för båda spelarna att få -1 snarare än -6. Detta är ett naturligt resultat av den interaktion som finns i spelet - i teorin, att inte erkänna skulle vara ett optimal strategi för gruppen kollektivt, men individuella incitament förhindrar att detta resultat blir uppnått. Till exempel, om spelare 1 trodde att spelare 2 skulle hålla sig tyst, skulle han ha ett incitament att ratta ut honom snarare än att tyst och vice versa.

Av denna anledning kan en Nash-jämvikt också ses som ett resultat där ingen spelare har incitament att ensidigt (dvs av sig själv) avvika från strategin som ledde till det resultatet. I exemplet ovan, när spelarna väljer att bekänna, kan ingen av spelarna göra det bättre genom att ändra sig själv.