Nash-ligevægt. Spilteori for økonomer (John Nash)

I 1930'erne blev John von Neumann og Oscar Morgenstern grundlæggere af et nyt interessant matematikområde, der blev kaldt "spilteori". I 1950'erne blev den unge matematiker John Nash interesseret i dette område. Ligevægtsteorien blev genstand for hans afhandling, som han skrev da han var 21 år gammel. Således blev der født en ny strategi for spil kaldet Nash Equilibrium, som vandt Nobelprisen mange år senere, i 1994.

Den lange kløft mellem skrivning af en afhandling og universel accept var en test for matematikeren. Geni uden anerkendelse resulterede i alvorlige mentale krænkelser, men John Nash var i stand til at løse dette problem takket være hans fremragende logiske sind. Hans teori om "Nash-ligevægt" blev tildelt Nobelprisen, og hans filmatisering i filmen "Beautiful mind" ("Mind Games").

Spilteori kort

Da teorien om Nash-ligevægt forklarer menneskers adfærd med hensyn til interaktion, er det derfor værd at overveje de grundlæggende begreber i spilteori.

Spilteori studerer opførsel af deltagere (agenter) under betingelser for interaktion med hinanden afhængigt af typen af spil, når resultatet afhænger af flere menneskers beslutning og opførsel. Deltageren træffer beslutninger, styret af sine prognoser for de andres opførsel, der kaldes spilstrategien.

Der er også en dominerende strategi, hvor deltageren får det optimale resultat for enhver deltagers adfærd. Dette er spillerens bedste win-win-strategi.

Fangens dilemma og videnskabelige gennembrud

Fangens dilemma er et tilfælde med et spil, hvor deltagerne tvinges til at træffe rationelle beslutninger og nå et fælles mål i sammenhæng med en alternativ konflikt. Spørgsmålet er, hvilken af disse muligheder han vil vælge, ved at anerkende hans personlige og fælles interesse samt manglende evne til at få begge dele. Spillere ser ud til at være indkapslet under barske spilforhold, hvilket nogle gange får dem til at tænke meget produktivt.

Dette dilemma blev undersøgt af den amerikanske matematiker John Nash. Den ligevægt, han bragte ud, blev revolutionær af sin art. Særligt levende påvirkede denne nye tanke økonomernes mening om, hvordan markedsaktører træffer valg under hensyntagen til andres interesser med tæt interaktion og skæringspunkt mellem interesser.

Det er bedst at studere spilteori med specifikke eksempler, da denne matematiske disciplin i sig selv ikke er en tør teoretisk.

Eksempel på fange-dilemma

Eksempel to personer, der blev frarøvet, faldt i politiets hænder og bliver forhørt i separate celler. På samme tid tilbyder politifolk hver deltager gunstige betingelser, under hvilke han vil blive løslat, hvis han vidner mod sin partner. Hver af de kriminelle har følgende sæt strategier, som han vil overveje:

Begge vidner samtidig og modtager 2, 5 års fængsel.
Begge er tavse på samme tid og modtager 1 år hver, da bevisbasen for deres skyld i dette tilfælde vil være lille.
Den ene giver bevis og får frihed, mens den anden er tavs og får 5 års fængsel.

Naturligvis afhænger resultatet af sagen af beslutningen fra begge deltagere, men de kan ikke komme til enighed, fordi de sidder i forskellige celler. Konflikten mellem deres personlige interesser i kampen for en fælles interesse er også tydeligt synlig. Hver fange har to muligheder for handling og 4 muligheder for resultater.

Inferenskæde

Så overvejer kriminel A følgende muligheder:

Jeg er tavs, og min partner er tavs - vi begge får 1 års fængsel.
Jeg giver min partner, og han giver mig - vi får begge 2, 5 års fængsel.
Jeg er tavs, og min partner overleverer mig - jeg får 5 års fængsel, og han vil være fri.
Jeg lejer min partner, og han er tavs - jeg får frihed, og han er 5 års fængsel.

Vi giver en matrix af mulige løsninger og resultater for klarhed.

Tabellen over sandsynlige resultater af fangens dilemma.

Spørgsmålet er, hvad vælger hver deltager?

"Stilhed, du kan ikke tale" eller "Stilhed kan du ikke tale"

For at forstå deltagerens valg, skal du gennem kæden af hans tanker. Efter den kriminelle A-ræsonnement: Hvis jeg tier og tavser min partner, får vi en minimumsperiode (1 år), men jeg kan ikke finde ud af, hvordan han vil opføre sig. Hvis han vidner mod mig, er det også bedre for mig at vidne, ellers kan jeg sætte mig ned i 5 år. Jeg vil hellere sidde 2, 5 år end 5 år. Hvis han ikke siger noget, så er jeg meget nødt til at vidne, fordi jeg får frihed på denne måde. Medlem B argumenterer også på samme måde.

Det er let at forstå, at den dominerende strategi for hver af de kriminelle er at vidne. Det optimale punkt med dette spil opstår, når begge kriminelle giver bevis og modtager deres "præmie" - 2, 5 års fængsel. Nashs spilteori kalder det ligevægt.

Nash Optimal Optimal løsning

Revolutionen af Nashev-synet er, at en sådan balance ikke er optimal, hvis vi tager den enkelte deltager og hans personlige interesse i betragtning. Når alt kommer til alt er den bedste mulighed at tie stille og gå fri.

Nash-ligevægt er et kontaktpunkt, hvor hver deltager kun vælger en mulighed, der er optimal for ham, hvis de andre deltagere vælger en bestemt strategi.

I betragtning af muligheden, når begge kriminelle er tavse og kun modtager 1 år hver, kan vi kalde det den Pareto-optimale mulighed. Det er dog kun muligt, hvis de kriminelle kunne have aftalt på forhånd. Men selv dette ville ikke garantere dette resultat, da fristelsen til at spore tilbage fra overtalelse og undgå straf er stor. Manglen på fuld tillid til hinanden og faren ved at være 5 år tvinger en til at vælge muligheden med anerkendelse. At reflektere over det faktum, at deltagerne vil overholde muligheden med stilhed, optræde i koncert, er simpelthen irrationelt. En sådan konklusion kan gøres, hvis vi studerer Nash-ligevægten. Eksempler beviser det kun.

Egoistisk eller rationel

Teorien om Nash-ligevægt har givet fantastiske konklusioner og tilbagevist de principper, der eksisterede før. For eksempel betragtede Adam Smith hver af deltagernes opførsel som absolut egoistisk, hvilket bragte systemet i ligevægt. Denne teori blev kaldt "markedets usynlige hånd."

John Nash så, at hvis alle deltagere handler efter deres egne interesser, vil dette aldrig føre til et optimalt grupperesultat. I betragtning af at rationel tænkning er iboende hos hver deltager, er det valg, som Nash-ligevægtsstrategien tilbyder, mere sandsynligt.

Rent mandligt eksperiment

Et levende eksempel er “blonde paradox” -spelet, som, selvom det forekommer upassende, er en levende illustration, der viser, hvordan Nash-spilteorien fungerer.

I dette spil skal du forestille dig, at selskabet med gratis fyre kom i baren. Dernæst er et selskab med piger, hvoraf den ene er at foretrække frem for de andre, siger en blondine. Hvordan opfører fyre sig for at få den bedste kæreste til sig selv?

Så fyrenes ræsonnement: Hvis alle begynder at blive bekendt med den blonde, så vil hun sandsynligvis ikke komme til nogen, så vil hendes venner ikke ønske at mødes. Ingen vil være den anden tilbagevenden. Men hvis fyre vælger at undgå blondinen, er sandsynligheden for, at hver af fyrene finder en god kæreste blandt pigerne, stor.

Situationen med Nash-ligevægt er ikke optimal for fyre, for når de kun forfølger deres egoistiske interesser, ville alle vælge en blondine. Det er tydeligt, at forfølgelsen af kun egoistiske interesser vil svare til sammenbruddet af gruppeinteresser. Nash-ligevægt betyder, at hver fyr handler i sine egne personlige interesser, som er i kontakt med interesserne for hele gruppen. Dette er ikke en optimal mulighed for alle personligt, men optimal for alle, baseret på den overordnede successtrategi.

Vores hele liv er et spil

At tage beslutninger under reelle forhold ligner meget et spil, når du forventer en vis rationel adfærd fra andre deltagere. I erhvervslivet, i arbejde, i et team, i en virksomhed og endda i forhold til det modsatte køn. Fra store transaktioner til almindelige livssituationer adlyder alt en eller anden lov.

Naturligvis er de betragtede spilsituationer med kriminelle og baren bare fremragende illustrationer, der demonstrerer Nash's balance. Eksempler på sådanne dilemmaer opstår ofte på det reelle marked, og dette fungerer især i tilfælde med to monopolister, der kontrollerer markedet.

Blandede strategier

Vi er ofte ikke involveret i et, men flere spil på én gang. At vælge en af mulighederne for et spil, styret af en rationel strategi, men du kommer ind i et andet spil. Efter flere rationelle beslutninger kan du opleve, at dit resultat ikke passer dig. Hvad skal man gøre?

Overvej to typer strategi:

En ren strategi er en deltagers adfærd, der kommer fra at tænke på andre deltagers mulige adfærd.
En blandet strategi eller en tilfældig strategi er vekslingen af rene strategier tilfældigt eller valget af en ren strategi med en bestemt sandsynlighed. Denne strategi kaldes også randomiseret.

I betragtning af denne opførsel får vi et nyt blik på Nash-ligevægt. Hvis det tidligere blev sagt, at spilleren vælger en strategi én gang, kan man forestille sig en anden opførsel. Vi kan indrømme muligheden for, at spillere vælger en strategi tilfældigt med en vis sandsynlighed. Spil, hvor Nash-ligevægte ikke kan findes i rene strategier, har dem altid i blandede.

Nash-ligevægt i blandede strategier kaldes blandet ligevægt. Dette er sådan en balance, hvor hver deltager vælger den optimale frekvens til valg af deres strategier, forudsat at andre deltagere vælger deres strategier med en given frekvens.

Nash-ligevægt. Spilteori for økonomer (John Nash)

Indholdsfortegnelse:

Video: spilteori 2024, Juli