3. Statische Spiele in:

Thomas Riechmann

Spieltheorie, page 36 - 61

4. Edition 2013, ISBN print: 978-3-8006-4750-7, ISBN online: 978-3-8006-4751-4, https://doi.org/10.15358/9783800647514_36

Series: Vahlens Kurzlehrbücher

Bibliographic information
3. Statische Spiele Statische Spiele sind Spiele, in denen die beteiligten Spieler (Entscheidungsträger) ihre Entscheidung gleichzeitig fällen. Wichtig ist aber weniger der Zeitbezug der Entscheidungen, sondern vielmehr der Effekt der Gleichzeitigkeit der Entscheidungen auf den Informationsstand der Spieler. In statischen Spielen weiß zum Zeitpunkt seiner eigenen Entscheidung keiner der Spieler, was seine Gegenspieler tun werden. Aus diesem Grund werden statische Spiele auch häufig „Spiele mit imperfekter Information“ oder „Spiele mit unvollkommener Information“ genannt. Die Theorie statischer Spiele bildet die Basis vieler Konzepte der Spieltheorie. 3.1 Beste Antworten 3.1.1 Grundlagen Die grundlegende Technik bei der spieltheoretischen Analyse ist die Suche nach „besten Antworten“. Um das jeweils beste Vorgehen (oder „Strategie“ oder „Aktion“) eines Spielers in einer interaktiven Entscheidungssituation zu finden, versucht man festzustellen, was der Spieler in jeder denkbaren Situation, d.h. für jede denkbare Handlungsweise seiner Gegenspieler, bestenfalls tun sollte. Als Beispiel soll ein berühmtes Spiel dienen, das Spiel „Stein–Schere– Papier“.1 Zwei Spieler, Herr A und Frau B, sind am Spiel beteiligt. Sie entscheiden, jeweils unbeobachtet vom anderen Spieler, welche Alternative (Strategie) sie wählen, „Stein“, „Schere“ oder „Papier“. Die weiteren Regeln lauten wie folgt: Stein schlägt Schere, Schere schlägt Papier und Papier schlägt Stein. Der Spieler mit der besseren Strategie erhält vom unterlegenen Spieler eine Portion eines beliebigen Erfrischungsgetränkes. Die Auszahlung des Siegers wird als 1 bezeichnet, die des Verlierers als −1. Wählen beide Spieler dieselbe Strategie, endet das Spiel unentschieden, für beide Spieler eine Auszahlung von 0. Tabelle 3.1 fasst das Spiel zusammen. Tabelle 3.1 enthält alle wichtigen Elemente eines „Spiels“, die Spieler, die Strategien der Spieler, und die Auszahlungen, die den Spielern aus den verschiedenen möglichen Kombinationen von Strategien entstehen. Die Auszahlungen sind im Inneren der Tabelle notiert. Es lohnt sich, in Erinnerung 1 Böse Zungen behaupten, dieses Spiel werde in Deutschland auch als billige gefälschte Version „Sching–Schang–Schong“ verbreitet. 22 3. Statische Spiele Spieler B Stein Schere Papier Stein 0, 0 1,-1 -1, 1 Spieler A Schere -1, 1 0, 0 1,-1 Papier 1,-1 -1, 1 0, 0 Tabelle 3.1: Stein–Schere–Papier, Auszahlungen an A, B zu behalten, dass die jeweils erste Zahl die Auszahlung an den Zeilenspieler angibt (hier: Spieler A), die zweite Zahl die des Spaltenspielers (hier: B). Die Analyse des Spiels besteht nun darin, für jeden der Spieler herauszufinden, welche Strategie er wählen würde, wenn er wüsste, was der andere Spieler wählt. (In Wahrheit weiß er das in statischen Spielen natürlich nicht, zur Analyse des Spiels ist diese Annahmen aber recht nützlich.) Für Spieler A bedeutet dies folgendes: Es wird zunächst angenommen, Frau B entscheide sich für „Stein“ (erste Spalte der Tabelle). In diesem Fall könnte Spieler A „Stein“ wählen, was für ihn zu einer Auszahlung von 0 führen würde. Entschiede er sich in diesem Fall für „Schere“, wäre seine Auszahlung -1, eine Entscheidung für „Papier“ würde eine Auszahlung von 1 nach sich ziehen. Für den Fall, dass Spieler B „Stein“ wählt, ist also Spieler As beste Wahl „Papier“, denn diese Wahl führt (unter den gegebenen Umständen) zur höchsten erreichbaren Auszahlung. Man sagt „Papier“ ist Spieler As beste Antwort auf Spieler Bs Strategie „Stein“. Entsprechend gilt es nun, As beste Antworten auf Bs übrige Strategien zu bestimmen. Dies sind „Stein“, falls B „Schere“ wählt, und „Schere“ für Bs „Papier“. Der zweite „große“ Schritt der Analyse besteht darin, Bs beste Antwort auf jede von As Strategien zu bestimmen. Dabei ist es wichtig, darauf zu achten, dass nun die Auszahlungen jeweils einer Zeile der Tabelle verglichen werden müssen, und dass Bs Auszahlung jeweils die zweite Auszahlung in einem Eintrag der Tabelle ist. Für B sind die besten Antworten „Schere“ für As „Stein“, „Stein“ auf As „Schere“ und „Schere“ auf As „Papier“. Die besten Antworten sind in Tab. 3.2 dadurch markiert, dass die jeweils zugehörigen Auszahlungen von einem Kästchen umgeben sind. Spieler B Stein Schere Papier Stein 0, 0 1 , -1 -1, 1 Spieler A Schere -1, 1 0, 0 1 , -1 Papier 1 , -1 -1, 1 0, 0 Tabelle 3.2: Stein–Schere–Papier, beste Antworten 3.1 Beste Antworten 23 Nachzuliefern ist nur noch die formale Definition einer besten Antwort. Eine Strategie s⋆ des Spielers i, s⋆i , ist dann eine beste Antwort auf Strategie s des Spielers −i, s−i, wenn s⋆i eine höhere oder zumindest gleich hohe Auszahlung gegen die Strategie s−i des Gegenspielers −i erzielt als jede andere Strategie s′i, die Spieler i zur Verfügung steht. Die Gesamtheit aller Strategien, die Spieler i zur Verfügung stehen, ist in Spieler is Strategiemenge Si zusammengefasst. Definition 3.1.1 (Beste Antwort). Strategie s⋆i ist eine beste Antwort auf Strategie s−i, wenn gilt, dass πi (s⋆i , s−i) ≥ πi ( s′i, s−i ) ∀s′i ∈ Si . 3.1.2 Streng beste und schwach beste Antworten Laut Definition 3.1.1 ist eine Strategie eines Spielers eine beste Antwort auf eine Strategie des Gegners, wenn der Spieler keine Strategie zur Verfügung hat, die besser ist als die beste Antwort. Dies kann bei genauerer Betrachtung zweierlei bedeuten: Entweder die beste Antwort ist eine („allerbeste“) Strategie, die besser ist als alle anderen, oder es gibt mehrere beste Strategien, die alle gleich gut sind, aber besser als die nicht–besten–Strategien. Der Unterschied wird an einer erweiterten Version des obigen Beispiels deutlich. Eine norddeutsche Variante von „Stein–Schere–Papier“ ist „Stein– Schere–Papier–LabskausausderDose“. Bei dieser Variante hat jeder Spieler eine Strategie mehr zur Verfügung. (Spieltheoretiker sagen: Bei dieser Variante vergrößert sich die Strategiemenge jedes Spielers.) Die zusätzliche verfügbare Strategie ist „LabskausausderDose“, kurz LadD. „LabskausausderDose“ ist eine Art Joker: Sie gewinnt gegen Stein, Schere und Papier und spielt unentschieden gegen sich selbst. Tabelle 3.3 gibt die Auszahlungen an. Spieler B Stein Schere Papier LadD Stein 0, 0 1 , -1 -1, 1 -1, 1 Spieler A Schere -1, 1 0, 0 1 , -1 -1, 1 Papier 1 , -1 -1, 1 0, 0 -1, 1 LadD 1 , -1 1 , -1 1 , -1 0, 0 Tabelle 3.3: Stein–Schere–Papier–LabskausausderDose, beste Antworten In diesem Spiel eine andere Art bester Antworten. Im Fall, dass Spielerin B Strategie „Stein“ auswählt, existieren für Spieler A zwei beste Antworten, „Papier“ und „LadD“. Da keine der beiden besten Antworten die einzige beste Antwort ist, heißen sie beide „schwach beste Antwort“. 24 3. Statische Spiele Die Definition einer schwach besten Antwort lautet, dass Strategie s⋆i eine schwach beste Antwort auf s−i ist, wenn sie gegen s−i eine höhere oder gleich große Auszahlung erreicht als alle anderen verfügbaren Strategien, und wenn es mindestens eine andere Strategie (hier s̃i genannt) gibt, die gegen s−i eine genau so hohe Auszahlung erzielt wie s⋆i . s ⋆ i ist also dann eine schwach beste Antwort auf s−i, wenn sie eine beste Antwort auf s−i ist und es (mindestens) eine weitere beste Antwort auf s−i gibt. Definition 3.1.2 (Schwach beste Antwort). Strategie s⋆i ist eine schwach beste Antwort auf Strategie s−i, wenn gilt, dass π (s⋆i , s−i) ≥ π ( s′i, s−i ) ∀s′i ∈ Si und ∃ s̃i ∈ Si \ s⋆i mit π (s̃i, s−i) = π (s⋆i , s−i) . Zurück zum originalen Spiel „Stein–Schere–Papier“ aus Tabelle 3.1. Hier gibt es eine andere Art von bester Antwort. Spielt Spielerin B Strategie „Papier“, dann gibt es für Spieler A nur eine beste Antwort, „Schere“. Diese beste Antwort ist die einzig beste Antwort auf „Papier“. Eine solche „allerbeste“ Antwort heißt “streng beste Antwort“ oder „strikt beste Antwort“. Die formale Definition stützt sich auf die Tatsache, dass eine streng beste Antwort immer einzigartig ist. Es kann keine zweite geben! Eine Strategie s⋆i ist dann streng beste Antwort auf s−i, wenn sie gegen s−i zu einer höheren Auszahlung führt als alle anderen verfügbaren Strategien. Definition 3.1.3 (Streng beste Antwort). Strategie s⋆i ist eine streng beste Antwort auf Strategie s−i, wenn gilt, dass π (s⋆i , s−i) > π ( s′i, s−i ) ∀s′i ∈ Si \ s⋆i . Das Konzept der besten Antworten bildet die Grundlage aller weiteren Konzepte der Spieltheorie, insbesondere der Dominanz (Abschnitt 3.2) und des Nash–Gleichgewichts (Abschnitt 3.3). An dieser Stelle müsste eigentlich die „Lösung“ des Spiels folgen, also eine Antwort auf mindestens eine der zentralen Fragen der Spieltheorie, nämlich “Wie sollten sich die Spieler im betrachteten Spiel verhalten?“ und „Wie werden sich die Spieler im betrachteten Spiel verhalten?“. Die beiden vorgestellten Spiele sind aber ein wenig kompliziert, so dass die Ermittlung einer „Lösung“ erst später möglich wird. Der Grund, warum diese Spiele an dieser Stelle des Buches vorgestellt werden, ist ein schlicht pädagogischer: Fast jeder kennt sie, und sie sind nützlich, das Konzept der besten Antworten zu erläutern. 3.2 Dominanz 25 3.2 Dominanz 3.2.1 Strenge Dominanz Fußball ist bekanntlich Denksport. Das ist allein schon daran zu erkennen, dass es in diesem Spiel zwei Strategien pro Mannschaft gibt: Eine Mannschaft kann offensiv oder defensiv eingestellt sein. Durch die Wahl der Strategien liegt das Ergebnis fest: Spielen etwa in einem Bundesligaspiel beide Mannschaften die gleiche Strategie, dann endet das Spiel unentschieden, und jede Mannschaft erhält einen Punkt für die Bundesligatabelle. Spielt eine Mannschaft offensiv und die andere defensiv, so gewinnt die offensive Mannschaft und erhält drei Punkte, der Gegner bekommt keinen Punkt. Die Auszahlungmatrix ist in Tab. 3.4 gegeben. Mannschaft B defensiv offensiv Mannschaft A defensiv 1, 1 0, 3 offensiv 3, 0 1, 1 Tabelle 3.4: Fußball–Spiel Für Mannschaft A ist es in jedem Fall besser, offensiv zu spielen: Spielt B defensiv, bekommt A bei offensiver Taktik drei Punkte statt einem Punkt bei defensiver Spielweise. Spielt B offensiv, kann A bei offensivem Spiel wenigstens einen Punkt retten, bei defensiver Einstellung verliert A alle Punkte. Egal, was B tut: Für A ist es in jedem Fall besser, offensiv zu wählen. Die Strategie „offensiv“ ist für A streng beste Antwort auf jede denkbare Strategie von B. Man sagt, die Alternative „offensiv“ sei für A streng dominant. Definition 3.2.1 (strenge Dominanz). Eine Strategie s⋆i ∈ Si des Spielers i heißt streng dominant, wenn sie für jede denkbare Strategie s−i ∈ S−i des Gegners −i zu einer höheren Auszahlung führt als jede andere Strategie s′i ∈ Si \ s⋆i von i, d.h. wenn gilt, dass πi (s⋆i , s−i) > πi ( s′i, s−i ) ∀s′i ∈ Si \ s⋆i und ∀s−i ∈ S−i . Im Fußball–Beispiel bedeutet dies folgendes: Jede Mannschaft (jeder Spieler im spieltheoretischen Sinne) kann eine Strategie aus einer Menge von Strategien auswählen. Die Menge der auswählbaren Strategien heißt „Strategiemenge“. Im Beispiel sind die Strategiemengen der beiden Spieler sehr einfach: Jeder Mannschaft steht jeweils die Strategiemenge S = {offensiv, defensiv} zur Verfügung. Die Strategiemenge von Mannschaft i = A ist also SA = {offensiv, defensiv}. Die Strategiemenge der gegnerischen Mannschaft −i = B lautet SB = {offensiv, defensiv}. 26 3. Statische Spiele Definition 3.2.1 gibt nun eine Bedingung an, die erfüllt sein muss, damit man eine Strategie von Mannschaft A „streng dominant“ nennen kann. Die dominante Strategie von Mannschaft i = A wird (vorläufig) s⋆i genannt. Ob es eine solche dominante Strategie überhaupt gibt, und welche Strategie dies ist, wird sich im Laufe der Analyse herausstellen. Sicher ist zunächst einmal, dass die gesuchte Strategie aus der Menge der Strategien stammen muss, die i = A zur Verfügung stehen, also s⋆i ∈ Si. Die gesuchte Strategie s⋆i soll nun eine höhere Auszahlung erreichen als jede andere Strategie, die A wählen könnte, also höher als alle anderen s′i ∈ Si \ s⋆i . Die erreichte Auszahlung muss in jedem Fall die Höchsterreichbare sein, d.h. für jede Strategie s−i, die Mannschaft −i = B auswählen könnte, für s−i ∈ S−i. Laut dieser Definition ist nun für Mannschaft A eine Strategie, genannt s⋆i , aus der Strategiemenge SA streng dominant, wenn Sie für jede mögliche Strategie s−i, die der Gegenspieler B auswählen könnte, also für alle Strategien sB ∈ SB, eine höhere Auszahlung erreicht als jede andere Strategie von A, s′A ∈ SA \ s⋆A, also wenn π (s⋆A, sB) > π (s′A, sB) ∀sB ∈ SB. Es hat sich bereits herausgestellt, dass für Mannschaft A die Strategie „offensiv“ zu mehr Punkten führt als Strategie „defensiv“, und zwar für jede denkbare Strategie des Gegners. Mit anderen Worten: Für A ist „offensiv“ eine streng beste Antwort auf jede Strategie von B. Damit ist für Mannschaft A die Strategie „offensiv“ streng dominant. Kurz gesagt ist für einen Spieler immer dann eine Strategie streng dominant gegenüber einer anderen, wenn die eine Strategie in jedem Fall, d.h. egal, was der Gegner tut, eine höhere Auszahlung bringt als die andere Strategie. Aus der Definition von strenger Dominanz folgt unmittelbar, dass es für jeden Spieler in einem Spiel maximal eine streng dominante Strategie geben kann. Dieselbe Untersuchung wie die oben angestellte ließe sich nun auch für Mannschaft B anstellen. Dies ist aber im gegebenen Fall unnötig, denn das Spiel ist ein symmetrisches Spiel. Pragmatisch gesehen ist ein symmetrisches Spiel ein Spiel, bei dem man die Zeilen– und Spaltenspieler in der Spielmatrix gegeneinander austauschen könnte, ohne dass sich dadurch deren strategische Situation verändern würde. Besitzt in einem symmetrischen Spiel ein Spieler eine dominante Strategie, so ist diese Strategie auch für den anderen Spieler dominant. Auch für Mannschaft B ist also „offensiv“ streng dominant. Damit lässt sich voraussagen, was A und B wählen werden: Beide Mannschaften werden offensiv agieren. Wenn in einem Spiel für beide Spieler dominante Alternativen existieren, lässt sich der Ausgang des Spiels prognostizieren. 3.2 Dominanz 27 3.2.2 Dominierte Strategien und deren Eliminierung Das Gegenteil von dominanten Strategien sind dominierte Strategien. Eine dominierte Strategie ist eine Strategie, die auf keine Strategie des Gegenspielers eine streng beste Antwort ist. Man unterscheidet zwischen streng dominierten und schwach dominierten Strategien. Eine streng dominierte Strategie ist in keinem Fall eine beste Antwort. Eine schwach dominierte Strategie ist niemals eine streng beste Antwort, möglicherweise aber auf manche Strategien des Gegners eine schwach beste Antwort. Im Fußball–Beispiel ist „defensiv“ eine streng dominierte Strategie: Egal, was der Gegner tut, „defensiv“ ist die schlechtere Wahl. Ein Beispiel für eine schwach dominierte Strategie ist die Strategie „Papier“ im Spiel „Stein–Schere–Papier– LabskausausderDose“ aus Abschnitt 3.1.2, Tab. 3.3 (S. 23). „Papier“ ist eine schwach beste Antwort auf die Strategie „Stein“ des Gegners. Eine alternative beste Antwort auf „Stein“ ist auch „LadD“. „Papier“ ist keine streng beste Antwort auf irgend eine andere Strategie des Gegners. Es gibt also keinen Grund, „Papier“ zu spielen. Falls der Gegner „Stein“ wählt, kann man genau so gut „LadD“ wählen, ansonsten empfiehlt sich die Strategie „Papier“ ohnehin nicht. Für einen Spieler existiert in jedem Fall eine genau so gute, im Fall strenger Dominanz sogar eine bessere Strategie als eine dominierte. Ein rationaler Spieler wird niemals eine streng dominierte Strategie anwenden. Aus dieser Überlegung entsteht eine Möglichkeit, die häufig zur Vereinfachung komplexerer Spiele hilfreich ist, die Eliminierung dominierter Strategien. Hierbei werden die streng dominierten Strategien aus der Spielmatrix eliminiert. Damit würde die obige Matrix zu einem einzigen Feld zusammenschrumpfen (Tab 3.5). Mannschaft B offensiv Mannschaft A offensiv 1, 1 Tabelle 3.5: Fußball–Spiel. Geschrumpft Aus der geschrumpften Tabelle wird das zu erwartende Ergebnis (immer unentschieden) deutlich. In Spielen, in denen mindestens einem der Spieler mehr als zwei Strategien zur Verfügung stehen, kann es zu folgendem Phänomen kommen: Es gibt eine streng dominierte Strategie, ohne dass eine streng dominante Strategie existiert. Ein Beispiel zeigt Tabelle 3.6. Spieler B hat hier keinen Grund, jemals b3 zu spielen: Wählt Spieler A Strategie a1, dann ist für B b1, die beste Wahl. Wählt Spieler A Strategie a2, sollte B Strategie b2 spielen. Strategie b3 28 3. Statische Spiele Spieler B b1 b2 b3 Spieler A a1 4, 4 3, 0 1, 3 a2 0, 0 2, 4 10, 3 Tabelle 3.6: Dominierte Strategie ohne dominante Strategie ist in jedem Fall die schlechtere Wahl, b3 ist also streng dominiert. Dennoch gibt es keine Strategie für B, die immer die beste Wahl ist, also keine streng dominante Strategie. In jeder Art von Spiel ist es sinnvoll, zuerst nach Dominanzen zu suchen. Dominante Gleichgewichte, Kombinationen dominanter Strategien aller Spieler, sind immer gut prognostizierbare Zustände für den Ausgang eines Spiels. In Laborexperimenten wird dennoch häufig das Dominanzkriterium nicht beachtet. Fudenberg und Tirole (1991, S. 8) berichten von Experimenten mit den folgenden Auszahlungen: Spieler II L R Spieler I U 8, 10 -100, 9 D 7, 6 6, 5 Tabelle 3.7: Dominanzexperiment nach Fudenberg und Tirole (1991) Für Spieler II ist die Strategie „L“ streng dominant gegenüber „R“. Dies müsste auch Spieler I wissen, die Möglichkeit, dass II „R“ spielt, ausschlie- ßen, und deshalb „U“ spielen. In Experimenten ergab sich aber, dass häufig von Spielern in der Position von Spieler I dennoch die Strategie „D“ gespielt wurde. Über die Gründe (Vorsicht, Misstrauen bezüglich der geistigen Kapazitäten von Spieler II, . . . ?) kann spekuliert werden. Als Erkenntnis bleibt festzuhalten, dass die theoretische Vorhersage von Verhaltensweisen auf Basis der Methode des Eliminierens streng dominierter Strategien nicht immer realtypische Ergebnisse generiert. 3.2.3 Schwache und iterierte Dominanz Im zweiten Weltkrieg stehen sich im Pazifik zwei Marineoffiziere gegen- über. Der Japaner Kimura muss mit Transportschiffen Soldaten nach Neuguinea bringen. Sein Gegner, der Amerikaner Kenney, soll das mit Hilfe seiner Flugzeuge verhindern. Kimura kann für seinen Flottenverband zwei Wege wählen. Für die Nordroute benötigt er zwei Tage, für die Südroute 3.2 Dominanz 29 drei. Kenney muss wählen, ob er seine Flugzeuge nach Norden oder nach Süden schickt. Treffen seine Flugzeuge Kimuras Flottenverband auf der von Kenney gewählten Route nicht an, so müssen sie umkehren, was zusätzlich Zeit beansprucht. Als Auszahlungen ergeben sich die Tage, an denen Kenney Kimura bombardieren kann, bzw. die Tage, an denen Kimura von Kenney bombardiert wird. Die Auszahlungsmatrix ist in Tab. 3.8 angegeben. Kimura nord süd Kenney nord 2, -2 2, -2 süd 1, -1 3, -3 Tabelle 3.8: Iterierte Dominanz Es lässt sich feststellen, dass für Kenney keine dominante Strategie existiert: Wählt Kimura „nord“, so ist für Kenney „nord“ die beste Wahl, wählt Kimura „süd“, so sollte sich auch Kenney für „süd“ entscheiden. Die Untersuchung nach Dominanzen für Kimura ergibt ein undeutliches Bild: Wählt Kenney „süd“, so ist für Kimura „nord“ die beste Wahl. Wählt Kenney „nord“, so sind für Kimura beide Strategien gleich gut, er ist indifferent zwischen „nord“ und „süd“. Es lässt sich also feststellen, dass für Kimura die Strategie „nord“ nie schlechter ist als die Strategie „süd“, im Fall, dass Kenney „süd“ wählt, sogar besser. Ist eine Strategie in jedem Fall mindestens so gut wie jede andere, in zumindest einem Fall aber sogar besser, so ist dies eine schwach dominante Strategie. Gibt es für einen Spieler eine schwach dominante Strategie, so kann angenommen werden, dass er die schwach dominante Strategie auswählt.2 Definition 3.2.2 (schwache Dominanz). Eine Strategie s⋆i ist schwach dominant, wenn sie auf jede denkbare Strategie s−i ∈ S−i des Gegners eine schwach beste Antwort und auf wenigstens eine Strategie des Gegners eine streng beste Antwort ist, d.h. wenn gilt, dass πi (s⋆i , s−i) ≥ πi ( s′i, s−i ) ∀s−i ∈ S−i und ∃s−i ∈ S−i mit πi (s⋆i , s−i) > πi ( s′i, s−i ) . 2 Es können nie eine schwach dominante und eine streng dominante Strategie gleichzeitig existieren. 30 3. Statische Spiele Es kann also angenommen werden, dass Kimura „nord“ wählt. Nach Identifizierung der schwach dominierten Strategie kann diese aus der Auszahlungsmatrix eliminiert werden. Es resultiert die Tabelle 3.9. Kimura nord Kenney nord 2, -2 süd 1, -1 Tabelle 3.9: Iterierte Dominanz. Geschrumpfte Matrix Unter dieser Voraussetzung wählt auch Kenney „nord“. Das Gleichgewicht der Strategien („nord“, „nord“), das sich aus einer schwach dominanten Strategie und einer darauf aufbauenden Antwort ergibt, heißt Gleichgewicht bei iterierter Dominanz. Schwach dominante Strategien sind nicht grundsätzlich eindeutig. Es ist denkbar, dass für einen Spieler in einem Spiel mehr als eine schwach dominante Strategie existiert. In diesem Fall führt der Prozess der iterierten Eliminierung schwach dominanter Strategien zu einer Pfadabhängigkeit: Für die Antwort auf die Frage, welche Strategien letztendlich von den Spielern gewählt werden, spielt die Reihenfolge eine Rolle, in der schwach dominierte Strategien eliminiert werden. Das Resultat der spieltheoretischen Analyse ist abhängig von dem Weg („Pfad“), den die Analyse nimmt. Diese Behauptung lässt sich beispielsweise anhand des Spiels belegen, das in 3.10 dargestellt ist. Spieler II c1 c2 c3 r1 2, 12 1, 10 1, 12 Spieler I r2 0, 12 0, 10 0, 11 r3 0, 12 0, 10 0, 13 Tabelle 3.10: Mehrdeutigkeit iterierter Dominanzgleichgewichte Beispielsweise lässt sich folgende Reihenfolge der Eliminierung wählen: 1. Eliminiere c2 (wird von c1 und c3 streng dominiert). 2. Eliminiere r3 (wird von r1 streng dominiert). 3. Eliminiere c3 (wird von c1 schwach dominiert). 4. Eliminiere r2 (wird von r1 streng dominiert). Es resultiert die iterierte Lösung (r1, c1). 3.2 Dominanz 31 c1 c2 c3 r1 2, 12 1, 10 1, 12 r2 0, 12 0, 10 0, 11 r3 0, 12 0, 10 0, 13 ⇒ c1 c2 c3 r1 2, 12 1, 10 1, 12 r2 0, 12 0, 10 0, 11 r3 0, 12 0, 10 0, 13 ⇒ c1 c2 c3 r1 2, 12 1, 10 1, 12 r2 0, 12 0, 10 0, 11 r3 0, 12 0, 10 0, 13 ⇒ c1 c2 c3 r1 2, 12 1, 10 1, 12 r2 0, 12 0, 10 0, 11 r3 0, 12 0, 10 0, 13 Tabelle 3.11: Mehrdeutigkeit iterierter Dominanzgleichgewichte, erster Fall Für folgende Reihenfolge ergibt sich ein anderes Resultat: Eliminierung in der Reihenfolge c2, r2, c1 und schließlich r3 ergibt eine iterierte Lösung von (r1, c3). 3.2.4 Common Knowledge Obwohl das Konzept der Dominanz recht einfach erscheint, gibt es Entscheidungssituationen, die den Entscheidern offensichtlich so kompliziert vorkommen, dass sie sich bei ihren Entscheidungen nicht daran halten. Ein Beispiel ist das Zahlenwahlspiel (englisch: guessing game). Beteiligt an diesem Spiel sind viele (mehr als zwei!) Spieler. Aufgabe jedes Spielers ist es, eine natürliche Zahl zwischen (inklusive) Null und Einhundert auszuwählen und auf einem Zettel zu notieren. Der Schiedsrichter des Spiels sammelt alle Zettel ein und errechnet den Durchschnitt aller ausgewählten Zahlen. Dann wird ein Gewinner ermittelt: Gewinner ist der Spieler, dessen gewählte Zahl am dichtesten an zwei Dritteln des Durchschnitts aller gewählten Zahlen liegt. Welches ist nun die beste Wahl? Theoretisch ganz einfach: Jeder sollte die Null wählen. Diese Lösung entsteht durch simple Anwendung der iterierten Dominanz. Weil die höchste wählbare Zahl 100 ist, kann auch der Durchschnitt der gewählten Zahlen höchsten gleich 100 sein. Die höchstmögliche Gewinnerzahl ist dann gleich 100×2/3 = 66.6, also ungefähr 67. Wählt man eine höhere Zahl als 67, kann man niemals der Gewinner sein. Alle Zahlen als 67 sind dominiert. Wenn dies (Dominiertheit aller Zahlen größer als 67) jeder Mitspieler weiß, sollte niemand mehr als 67 wählen. Damit ist dann der höchstmögliche Durchschnitt gleich 67, die Gewinnerzahl also höchstens 2/3 · 67, ungefähr gleich 45. Alle Zahlen höher als 45 sind damit (iteriert) dominiert. Sie sollten nicht gewählt werden. Wenn dies jeder Mitspieler weiß und sich gleichzeitig darauf verlassen kann, dass dies jeder andere Mitspieler ebenfalls weiß, dann wird niemand eine höhere Zahl wählen als 45. Daraus folgt, dass der Durchschnitt maximal 32 3. Statische Spiele gleich 45 sein kann und dass die Gewinnerzahl nicht höher liegt als 2/3 ·45≈ 30. Alle Zahlen größer als 30 sind dominiert. Wenn dies jeder weiß, und jeder weiß, dass dies jeder weiß, und jeder weiß, dass jeder weiß, dass dies jeder weiß, ist die maximal mögliche Auswahl 30, der maximale Durchschnitt 30 und die Gewinnerzahl nicht höher als 2/3 ·30 = 20. Alle Zahlen größer als 20 sind dominiert. Wenn dies jeder weiß, und jeder weiß, dass dies jeder weiß, und jeder weiß, dass jeder weiß, das dies jeder weiß, und jeder weiß, dass jeder weiß, dass . . . Diese Argumentationskette lässt sich so lange fortsetzen, bis die einzige undominierte Zahl gleich Null ist. Wenn alle 0 wählen, ist auch die Gewinnerzahl gleich 0. Dennoch ist es beim Zahlenwahlspiel beinahe nie eine gute Idee, die Null zu wählen. Denn wenn man das Zahlenwahlspiel tatsächlich spielt, ist die Gewinnerzahl sehr selten die Null. Meistens werden sehr viel höhere Zahlen gewählt. Dies ist selbst so, wenn die Spieler Professoren der Mathematik sind, von denen man eigentlich erwarten sollte, dass sie das oben erläuterte Prinzip verstehen können.3 Das Problem liegt auch weniger in der mathematischen Struktur des Spiels, sondern darin, dass es ein Spiel (in spieltheoretischen Sinne) ist, eine interdependente Entscheidungssituation. Wie oben erwähnt, muss man, um die „richtige“ Zahl zu wählen, wissen, was die anderen Spieler tun werden. Nur, wer die Auswahl jedes anderen Gegners weiß, kann die Gewinnerzahl auswählen. Hier liegt ein Kernproblem guter Entscheidungen: Man muss wissen, was die anderen tun werden. Dies ist aber oft schwer möglich oder unmöglich. Dies hängt wiederum davon ab, was jeder der anderen von den von ihm aus gesehen anderen und von einem selbst weiß. Wie soll man also in der Spieltheorie damit umgehen, dass Wissen über das Wissen aller Spieler und deren Wissen über deren Wissen etc. gefragt ist? Die Lösung der klassischen Spieltheorie ist radikal (und unrealistisch): Man nimmt an, jeder Spieler wisse alles über jeden anderen Spieler, auch dass der andere dasselbe über ihn weiß. Ein wichtiger Bestandteil der obigen Argumentation, die zur theoretischen Lösung führt, sind die Teile „Wenn dies jeder weiß, und jeder weiß, dass jeder weiß, dass jeder . . . “. Dieses Konzept über das Wissen der Spieler übereinander heißt common knowledge. Die Annahme, die Spieler besäßen common knowledge ist eine Vorrausetzung der Analyse der allermeisten Spiele. 3 Eine gute Beschreibung des Spiels und viele Ergebnisse von teilweise sehr großen realen Spielen des Zahlenwahlspiels findet sich in einem Aufsatz von Bosch-Domenech et al. (2002). 3.3 Nash-Gleichgewichte 33 3.3 Nash-Gleichgewichte Der Fall reiner oder iterierter Dominanzen ist bei Spielen nur selten anzutreffen. Häufig kann sich aber wenigstens ein so genanntes Nash-Gleichgewicht ergeben. Im folgenden Beispiel ist der Fall der „Schlacht der Geschlechter“ dargestellt (Original: battle of the sexes, ein beliebtes angelsächsisches Lehrbuchbeispiel). Es beschreibt die Abendplanung eines Paares. Der Mann möchte am liebsten mit seiner Freundin ein Fußballspiel besuchen (Nutzenindex: 3), am zweitliebsten mit seiner Freundin (zum Anschauen eines Films!) ins Kino gehen (Nutzen: 2) und am wenigsten gern allein irgendetwas unternehmen (Nutzen: 1). Die Freundin möchte am liebsten mit ihrem Freund ins Kino („. . . am besten was mit Tom Kreuzfahrt, dem Schönling. . . “, Nutzen: 3), am zweitliebsten mit ihrem Freund zum Fußball (Nutzen: 2) und am wenigsten gern etwas ohne ihren Freund unternehmen (Nutzen: 1). Handlungsalt. der Frau Kino Fußball Handlungsalt. Kino 2 , 3 1, 1 des Mannes Fußball 1, 1 3 , 2 Tabelle 3.12: Battle of the Sexes In dieser Situation existiert kein Dominanzgleichgewicht mehr. Es gibt nun für den Mann keine Handlungsalternative, die für jede Entscheidung seiner Freundin die beste Antwort ist. Stattdessen gilt es nun, für den Mann herauszufinden, was er tun sollte, falls die Frau „Fußball“ oder falls die Frau „Kino“ wählt. Das entsprechende Verfahren muss dann auch für die Frau durchgeführt werden. Man macht sich also auf die Suche nach besten Antworten des Mannes: Man nimmt an, die Frau entscheide zuerst und der Mann erst nach ihr. Wählt nun die Frau (warum auch immer) die Alternative „Kino“, so ist es für ihren Freund sinnvoll, auch „Kino“ zu wählen. Nun sollte geprüft werden, ob das Entscheidungspaar (Kino, Kino) auch bei der anderen Entscheidungsreihenfolge zustande käme. Würde also der Mann zuerst wählen und sich für „Kino“ entscheiden, so würde seine Freundin tatsächlich auch „Kino“ wählen. Es ist also in diesem Fall egal, wer zuerst entscheidet — wenn die Frau „Kino“ wählt, wählt der Mann „Kino“ und anders herum. „Kino“ ist die beste Antwort des Mannes auf „Kino“ der Frau und „Kino“ der Frau ist eine beste Antwort auf „Kino“ des Mannes. Man sagt, die Strategien „Kino“ der Frau und „Kino“ des Mannes seien wechselseitig beste Antwor- 34 3. Statische Spiele ten. Das „stabile Paar“ (Kino, Kino) ist ein Entscheidungsgleichgewicht. Es wird Nash-Gleichgewicht genannt. Nash-Gleichgewicht: Frau : Kino → Mann : Kino ⇔ Mann : Kino → Frau : Kino Problematisch am Konzept der Nash-Gleichgewichte ist allerdings die Tatsache, dass Nash-Gleichgewichte nicht immer eindeutig sind. Eine Entscheidungssituation kann zu verschiedenen Nash-Gleichgewichten führen. Dann lässt sich nicht vorhersagen, welche Entscheidung zustande kommen wird. Im Beispiel ist auch das Paar (Fußball, Fußball) ein Nash-Gleichgewicht. Allgemein gelten folgende Definitionen: Definition 3.3.1 (Nash–Gleichgewicht). Ein Strategieprofil s⋆, die Sammlung je einer Strategie für jeden Spieler, ist ein Nash–Gleichgewicht, wenn die darin enthaltene Strategie jedes einzelnen Spielers jeweils eine beste Antwort auf die enthaltenen Strategien der restlichen Spieler ist, d.h. wenn gilt, dass πi ( s⋆i ,s ⋆ −i ) ≥ πi ( s′i,s ⋆ −i ) ∀s′i ∈ Si, ∀i . Definition 3.3.2 (strenges Nash–Gleichgewicht). Ein Strategieprofil s⋆ ist ein strenges Nash–Gleichgewicht, wenn die darin enthaltene Strategie jedes einzelnen Spielers jeweils eine streng beste Antwort auf die enthaltenen Strategien der restlichen Spieler ist, d.h. wenn gilt, dass πi ( s⋆i ,s ⋆ −i ) > πi ( s′i,s ⋆ −i ) ∀s′i ∈ Si \ s⋆i , ∀i . Da eine streng dominante Strategie eine beste Antwort auf jede Strategie der Gegner ist, ist sie natürlich auch die streng beste Antwort auf eine gegebene Strategie der Gegner. Analog ist ein Dominanzgleichgewicht immer auch ein Nash–Gleichgewicht. Zudem lässt sich sagen, dass in Spielen, in denen ein eindeutiges strenges Dominanzgleichgewicht existiert, auch keine weiteren Nash–Gleichgewichte zu finden sind. Als Nash–Strategie wird jeweils die Handlungsalternative eines Spielers bezeichnet, die sich als beste Antwort auf eine bereits gegebene Handlung des Gegners ergibt. Im Beispiel ist für den Mann die Alternative „Kino“ die beste Antwort auf die gegebene Alternative „Kino“ der Frau, weil diese Alternative in diesem Fall (wenn die Frau bereits „Kino“ gewählt hat) dem Mann den höchsten Nutzen gewährt, den er nun noch erreichen kann. Man sagt, „Kino“ ist die Nash–Strategie des Mannes für die Strategie „Kino“ der Frau. Analog lassen sich die übrigen bereits untersuchten Fälle formulieren. 3.4 Gleichgewichtsselektion 35 Ein Nash–Gleichgewicht ist dort erreicht, wo sich zwei Nash–Strategien der Gegner aufeinander beziehen. Im Beispiel ist unter anderem „Fußball“ die Nash–Strategie des Mannes für die gegebene Strategie „Fußball“ der Frau. Außerdem ist „Fußball“ die Nash–Strategie der Frau für die gegebene Strategie „Fußball“ des Mannes. Damit ist (Fußball, Fußball) ein Nash– Gleichgewicht. Was ein Nash–Gleichgewicht zum Gleichgewicht macht, ist die Tatsache, dass es ausschließlich aus besten Antworten besteht. Im Nash–Gleichgewicht hat keiner der Spieler einen Grund, seine Strategie zu wechseln, solange es nicht ein anderer tut. Im Beispiel ist (Kino, Kino) ein Nash–Gleichgewicht. Der Mann hat keinen Anlass, nicht „Kino“ zu wählen, solange die Frau bei ihrer Auswahl „Kino“ bleibt. Analoges gilt für die Frau. Ein Nash– Gleichgewicht ist dadurch gekennzeichnet, dass sich kein Spieler durch „unilaterales Abweichen“ von den im Gleichgewicht gespielten Strategien verbessern kann. Dies bedeutet allerdings noch lange nicht, dass die Spieler in der Realität auch wirklich ein Nash–Gleichgewicht spielen. Ob Nash– Gleichgewichte beispielsweise durch Wiederholung eines Spiels erreicht werden können oder nicht, ist Gegenstand von Abschnitt 9. Nash–Gleichgewichte lassen sich in einfachen Spielen wie diesem recht leicht auffinden. Für den Zeilenspieler (hier: Mann) markiere man für jede Spalte die höchste Auszahlung, also die beste Antwort auf die jeweilige Strategie des Gegners. Gibt es mehrere größte Auszahlungen, werden diese alle markiert. In der Auszahlungsmatrix ist dies bereits geschehen. Dann markiere man für den Spaltenspieler (hier: Frau) in jeder Zeile die höchste Auszahlung. Zellen der Matrix, in der für beide Spieler Markierungen zu finden sind, repräsentieren wechselseitig beste Antworten und sind Nash– Gleichgewichte. Dieses Vorgehen ist auf Tab. 3.12 angewandt worden. Es ist zu erkennen, dass tatsächlich bei den Nash–Gleichgewichten die Auszahlungen jedes Spielers markiert sind. 3.4 Gleichgewichtsselektion Es zeigt sich also, dass ein Spiel möglicherweise mehr als ein Nash–Gleichgewicht besitzt. Daher stellt sich die Frage, welches dieser Gleichgewichte das ist, das tatsächlich erreicht werden wird. Diese Frage ist die Frage der Gleichgewichtsselektion. Mögliche Kriterien zur Auswahl von Gleichgewichten bieten das Konzept der Pareto–Effizienz oder Erwägungen bezüglich des Risikos der denkbaren Strategien. 3.4.1 Pareto–Effizienz Zwei Firmen wollen beginnen, Geruchsfernseher herzustellen, Fernseher also, die (zusätzlich zu Bild und Ton) Gerüche übertragen können. Dazu stehen 36 3. Statische Spiele zwei Systeme zur Auswahl: „Really Stinky“ (RS), bei dem ein nasser Hund in den Fernseher eingebaut wird, und „TrueSmell“ (TS), das sich eines modernen elektro–nasalen Verfahrens bedient. Aus Gründen der Verbreitung eines Systems (zu erwartende Skaleneffekte) ist es von Vorteil, wenn beide Hersteller auf dasselbe System setzen, also ihre Strategien koordinieren. Die Auszahlungen ergeben sich aus den zu erwartenden Gewinnen: Firma B RS TS RS 1, 1 -1, -1Firma A TS -1, -1 2, 2 Tabelle 3.13: Koordinationsspiel Das Spiel besitzt keine Dominanzen. Nash–Gleichgewichte sind (RS, RS) und (TS, TS). Auch hier stellt sich die Frage, welches Nash–Gleichgewicht eintreffen wird. Die Antwort fällt hier aber auch ohne Zusatzinformationen leichter: Beide Firmen müssten ein Interesse daran haben, mehr Gewinn zu machen. Da (TS, TS) für beide Firmen zu höheren Auszahlungen führt als (RS, RS), kann davon ausgegangen werden, dass (TS, TS) gespielt wird. Hier ist das Konzept der Pareto–Verbesserung und der Pareto–Effizienz von Bedeutung. Ausgehend von der Strategienkombination (RS, RS) ist der Übergang zu (TS, TS) für beide Spieler eine Verbesserung. Jeder Wechsel, der mindestens einen Spieler besser stellt als zuvor, ohne gleichzeitig einen Spieler schlechter zu stellen, ist eine Pareto–Verbesserung. Strategieprofile, von denen aus keine weiteren Pareto–Verbesserungen mehr möglich sind, sind Pareto–effizient. Spiel 3.13 hat eine eindeutige Pareto–effizientes Strategienkombination in (TS, TS). Da sich im Spiel 3.13 die Nash–Gleichgewichte mit Hilfe des Pareto– Kriteriums ordnen lassen, wird dieses Spiel auch „geordnete Koordination“ (ranked coordination) genannt. Es ist zu erwarten, dass die Koordination in dem Strategieprofil enden wird, in dem beide Spieler am besten gestellt sind, also in (TS, TS). Ein solches eindeutiges Pareto–effizientes Nash– Gleichgewicht heißt Pareto–perfekt. Ähnlich wie gegen die behavioralistischen Vorhersagen, die sich auf das Konzept der Dominanz stützen, gibt es auch gegen die Vorhersagen der geordneten Koordination Einwände. Obwohl das Spiel 3.14 strukturell das gleiche Spiel ist wie 3.13, erscheint aus psychologischer Sicht die Entscheidung weniger verlässlich. Obwohl A, auf die perfekte Rationalität von B vertrauend, a2 wählen sollte, erscheint diese Wahl zumindest zweifelhaft. 3.4 Gleichgewichtsselektion 37 B b1 b2 a1 1, 1 -1, -1A a2 -1 000 000, -1 2, 2 Tabelle 3.14: Gefährliche Koordination 3.4.2 Risikodominanz Ähnlich wie im Beispiel 3.14 lässt sich in vielen Fällen bezweifeln, ob zwei Spieler tatsächlich ein Pareto–perfektes Gleichgewicht einem anderen Gleichgewicht vorziehen würden. Auf diesem Gedanken basiert die Idee eines risikodominanten Gleichgewichts (Harsanyi und Selten, 1988). Das Konzept der Risikodominanz lässt sich für symmetrische Zwei– Personen–Zwei–Strategien–Spiele am Beispiel des Risikodominanz–Spiels (Tab. 3.15) leicht erläutern. B b1 b2 A a1 9, 9 0, 8 a2 8, 0 7, 7 Tabelle 3.15: Risikodominanz–Spiel Das Spiel besitzt zwei Nash–Gleichgewichte: (a1, b1) und (a2, b2). Das Gleichgewicht (a1, b1) ist Pareto–perfekt. Dennoch ist es denkbar, dass zumindest einer der Spieler a2 bzw. b2 spielen würde: Spielt beispielsweise Spieler A a1, so erhält er in dem Fall, dass Spieler B b2 wählt, eine Auszahlung von Null. Spielt A dagegen a2, so ist die kleinste Auszahlung, die er erhalten kann, 7, also deutlich besser als für die Wahl, a1 zu spielen. Eine analoge Argumentation gilt für Spieler B. Insgesamt ist es für beide Spiele weniger „gefährlich“, (a2, b2) zu spielen. Dieses Gleichgewicht ist gegen- über (a1, b1) risikodominant. Formal gilt für symmetrische Spiele mit zwei Spielern und zwei Strategien pro Spieler folgender Zusammenhang: Es sei vorausgesetzt, jeder Spieler nehme an, sein Gegner spiele jede seiner Strategien mit der Wahrscheinlichkeit 12 . Beide Spieler entscheiden annahmegemäß anhand der Erwartungswerte ihrer Auszahlungen. Dann ist das Gleichgewicht, das beide Spieler streng vorziehen, das risikodominante Gleichgewicht.4 4 Formal entspricht das Vorgehen zur Bestimmung der risikodominanten Strategie eines Spielers also dem Vorgehen nach der Laplace–Regel (Abschnitt. 2.3.5, S. 13). 38 3. Statische Spiele Für das Beispiel aus Tabelle 3.15 bedeutet dies folgendes: Spielt Spieler A Strategie a1, beträgt der Erwartungswert seiner Auszahlung E [πA(a1)] = 1 2 ·9+ 1 2 ·0 = 4.5 . Die erwartete Auszahlung aus a2 ist E [πA(a2)] = 7.5 . A wird also a2 gegenüber a1 vorziehen. Da es sich um ein symmetrisches Spiel handelt, folgt aus der analogen Überlegung für B, dass auch B eher b2 als b1 spielen wird. Damit ist (a2, b2) das risikodominante Nash– Gleichgewicht. Warum das Gleichgewicht risikodominant genannt wird, lässt sich leicht erkennen, wenn man die Auszahlungstabelle 3.15 umformuliert, wie dies in Tab. 3.16 geschehen ist: Hier sind für die Spieler jeweils die Erwartungswerte der Auszahlungen notiert, also bei A E [πA(a1)] = 4.5 für Strategie a1 und E [πA(a2)] = 7.5 für a2 sowie bei B E [πB(b1)] = 4.5 für b1 und E [πB(b2)] = 7.5 für b2. B b1 b2 A a1 4.5, 4.5 4.5, 7.5 a2 7.5, 4.5 7.5, 7.5 Tabelle 3.16: Risikodominanz–Spiel. Erwartete Auszahlungen Es ist zu erkennen, dass für jeden Spieler die jeweils zweite Strategie (also a2 bzw. b2) die jeweils erste Strategie streng dominiert. Insofern ist das verbleibende Gleichgewicht (a2, b2) unter Risiko–Gesichtspunkten dominant. 3.4.3 Trembling–Hand–Perfektion Ein weiteres Kriterium zur Selektion von Nash–Gleichgewichten ist die Frage, wie robust ein Gleichgewicht gegenüber „Fehlern“ des Gegners bei seiner Strategiewahl ist. Als Beispiel soll das Spiel aus Tabelle 3.17 dienen. Die beiden Nash–Gleichgewichte liegen bei (a2, b1) und (a1, b2). Weitere Analyse ergibt, dass die Strategie a2 von der Strategie a1 schwach dominiert wird. Nach dem Kriterium der iterierten (schwachen) Dominanz wäre die Gleichgewichtsselektion einfach: (a1, b2) wäre das plausiblere Gleichgewicht. 3.4 Gleichgewichtsselektion 39 Spieler B b1 b2 a1 10 , 0 4 , 4Spieler A a2 10 , 0 −1 ,−1 Tabelle 3.17: Zitterspiel An dieser Stelle soll aber ein anderes Kriterium betrachtet werden: Das Trembling–Hand–Kriterium.5 Angenommen, Spieler A plane, a1 zu spielen. Diese Wahl scheint sinnvoll, denn B könnte ja die Strategie b2 wählen, womit beide Spieler eine Auszahlung von je 4 erhielten. Aber ist diese Strategiewahl von A auch sicher? Angenommen, A glaube relativ fest daran, B werde seine beste Antwort b2 spielen, sei sich dessen aber nicht völlig sicher. Was ist, wenn B einen Fehler macht und doch (aus Versehen) b1 wählt? Beim Trembling–Hand–Kriterium geht es genau um diese Frage: Es soll ermittelt werden, ob eine Strategie eines Spielers auch dann noch die beste Wahl ist, falls es eine geringe Wahrscheinlichkeit gibt, dass sich der Gegner nicht erwartungsgemäß entscheidet, sondern (irrtümlich) eine andere als die erwartete Strategie wählt. Ist eine Strategie auch im Fall eines sehr unwahrscheinlichen Fehlers des Gegners die beste Wahl, nennt man diese Strategie Trembling–Hand–perfekt. Um im Beispiel herauszufinden, ob a1 Trembling–Hand–perfekt ist, muss folgende Prüfung angestellt werden: Man nimmt an, B spiele beinahe sicher Strategie b2, könne sich aber mit der geringen Wahrscheinlichkeit εb1 irren und b1 spielen. Für diesen Fall gilt es zu ermitteln, ob A aus der Strategie a1 oder aus a2 die höheren Auszahlungen zu erwarten hat. Der Erwartungswert der Auszahlung an A, falls er a1 wählt, beträgt E [πA(a1)] = (1− εb1)πA (a1, b2)+ εb1 πA (a1, b1) = (1− εb1) ·4+ εb1 ·10 . Die erwartete Auszahlung der Strategie a2 beträgt E [πA(a2)] = (1− εb1)πA (a2, b2)+ εb1 πA (a2, b1) = (1− εb1) · (−1)+ εb1 ·10 . Es ist leicht zu erkennen, dass die erwartete Auszahlung größer ist, wenn A a1 und nicht etwa a2 wählt. Strategie a1 ist also auch dann As beste Wahl, wenn B im Verdacht steht, einen Fehler begehen zu können. Strategie a1 ist Trembling–Hand–perfekt. 5 Tatsächlich handelt es sich bei der Darstellung an dieser Stelle um eine eher pragmatische Darstellung des Konzepts des Trembling–Hand–Kriteriums. Die formal aufwändige, aber korrekte Darstellung findet sich in Abschnitt 6.5.1 auf S. 94. 40 3. Statische Spiele Ein Trembling–Hand–perfektes Nash–Gleichgewicht ist ein Nash–Gleichgewicht, das aus Trembling–Hand–perfekten Strategien besteht. Um also festzustellen, ob das Gleichgewicht (a1, b2) tatsächlich Trembling–Hand– perfekt ist, muss nun noch die Strategie b2 auf ihre Trembling–Hand–Perfektion geprüft werden. Dies bedeutet anzunehmen, dass A beinahe sicher a1, aber mit geringer Fehlerwahrscheinlichkeit εa2 a2 spiele. Unter dieser Annahme gilt es, die erwarteten Auszahlungen aus Bs Strategien zu errechnen und miteinander zu vergleichen. Das Resultat ist6 E [πB(b1)] = 0 < 4−5εa2 = E [πB(b2)] . Auch Strategie b2 ist also Trembling–Hand–perfekt, womit insgesamt das Gleichgewicht (a1, b2) ein Trembling –Hand–perfektes Nash–Gleichgewicht ist. Die Tatsache, dass das Nash–Gleichgewicht (a1, b2) Trembling–Hand– perfekt ist, bedeutet aber noch lange nicht, dass das verbleibende Nash– Gleichgewicht, also (a2, b1), automatisch nicht Trembling–Hand–perfekt ist! Um beispielsweise sagen zu können, ob die verbleibende Strategie b1 von Spieler B Trembling–Hand–perfekt ist, muss dies explizit überprüft werden. Es muss also nun angenommen werden, A spiele beinahe sicher a2, mit einer kleinen Wahrscheinlichkeit εa1 jedoch Strategie a1. Der notwendige Vergleich der erwarteten Auszahlungen an B ergibt E [πB(b1)] = 0 > 5εa1 −1 = E [πB(b2)] . Auch b1 ist also Trembling–Hand–perfekt. Erst die letzte Prüfung fällt negativ aus: Strategie a2 ist nicht Trembling– Hand–perfekt. E [πA(a1)] = 10(1− εb2)+4εb2 > 10(1− εb2)− εb2 = E [πA(a2)] . Damit handelt es sich beim Strategieprofil (a2, b1) nicht um ein Trembling– Hand–perfektes Nash–Gleichgewicht. Zwischen dem Konzept der Trembling–Hand–Perfektion und der Methode der iterierten Eliminierung dominierter Strategien besteht ein Zusammenhang: Besitzt ein Spieler eine dominante und eine dominierte Strategie, dann kann er der „Zittergefahr“, der die dominierte Strategie ausgesetzt ist, einfach dadurch ausweichen, dass er statt der dominierten die dominante Strategie wählt. Im Beispiel des Zitterspiels 3.17 ist dies leicht zu erkennen: Falls Spieler A Strategie a2 wählt, muss er befürchten, dass sich sein Gegner für b2 entscheidet. Dieser Gefahr kann er dadurch entgehen, dass es stattdessen a1 wählt. Entscheidet sich B nun für b2, ist der erreichte Zustand für A optimal 6 Die Ungleichheit in der folgenden (Un–)Gleichung gilt deshalb in der angegebenen Richtung, weil es sich bei εa2 annahmegemäß um eine sehr kleine Wahrscheinlichkeit handelt. 3.5 Spiele ohne Gleichgewichte 41 (Nash–Gleichgewicht). Aber selbst wenn sich B für b1 entscheidet, geht es A nicht schlechter als in dem Fall, dass er a2 gewählt hätte. Dies ist natürlich nichts als eine Wiederholung der Idee der Dominanz. Allgemein lässt sich damit sagen: Jede Strategie, die in einem Trembling– Hand–perfekten Gleichgewicht gespielt wird, ist nicht dominiert. Die Umkehrung dieses Satzes gilt aber nicht: Nicht jede undominierte Strategie ist auch automatisch Trembling–Hand–perfekt. Die Beziehung zwischen Nash–Gleichgewichten, Nash–Gleichgewichten nach Eliminierung dominierter Strategien und Trembling–Hand–perfekten Nash–Gleichgewichten ist in Abb. 3.1 (nach Holler und Illing 2003, S. 100) zusammengefasst. Nash−GG Trembling−Hand−perfekte Nash−GG nach Eliminierung dominierter Strategien Nash−GG Abbildung 3.1: Beziehungen zwischen verschiedenen Gleichgewichtskonzepten Obwohl also nicht jedes undominierte Gleichgewicht automatisch Trembling–Hand–perfekt ist, ist bei der Suche nach Trembling–Hand–perfekten Strategien die Eliminierung dominierter Strategien ein geeigneter Schritt, um die Menge der „verdächtigen“ Strategien einzugrenzen. Allerdings ist zudem anzumerken, dass auch Trembling–Hand–perfekte Gleichgewichte nicht grundsätzlich eindeutig sind. In vielen Spielen gibt es mehrere solcher Gleichgewichte. 3.5 Spiele ohne Gleichgewichte Es existieren auch Spiele ohne Gleichgewichte.7 Auch hierfür lässt sich ein Beispiel im Sinne des Geschlechterkampfes finden. Der Mann hat Präferen- 7 Exakt muss es heißen: Es existieren auch Spiele ohne Gleichgewichte in reinen Strategien. Außer den bisher betrachteten Strategien gibt es auch so genannte gemischte Strategien und entsprechend Gleichgewichte in gemischten Strategien. Genaueres hierzu findet sich in Abschnitt 6. 42 3. Statische Spiele zen in folgender Reihenfolge: Fußball ohne Freundin (3), Kino ohne Freundin (2), Abendgestaltung mit seiner Freundin (1). Die Präferenzen der Frau sind: Kino mit Freund (3), Fußball mit Freund (2), Abend allein verbringen (1). Handlungsalt. der Frau Kino Fußball Handlungsalt. Kino 1, 3 2, 1 des Mannes Fußball 3, 1 1, 2 Tabelle 3.18: Völliges Zerwürfnis der Geschlechter Eine Prüfung auf ein Nash-Gleichgewicht müsste wie folgt ablaufen: Entscheidet sich die Frau fürs Kino, wählt ihr Freund Fußball. Wählt der Mann Fußball, geht seine Freundin auch zum Fußball. Geht die Frau zum Fußball, geht ihr Mann lieber ins Kino. Wählt der Mann Kino, will sie auch ins Kino. Geht sie ins Kino, will er zum Fußball, u.s.w. Anstelle eines Nash-Gleichgewichts lässt sich ein zyklisches Verhalten beobachten, das nie zum Stillstand kommt:8 Frau: Kino → Mann: Fußball Mann: Fußball → Frau: Fußball Frau: Fußball → Mann: Kino Mann: Kino → Frau: Kino Es findet sich also niemals ein Plan zur Abendgestaltung, dem beide zustimmen würden. Mit anderen Worten: Es existiert kein Nash-Gleichgewicht. Wird das Spiel häufig wiederholt, kommt es zu zyklischem Verhalten. 3.6 Beispiele 3.6.1 Gefangenendilemma Das wohl berühmteste Spiel ist das so genannte Gefangenendilemma.9 Ursprünglich wurde hiermit die Situation zweier Personen beschrieben, die gemeinsam ein Verbrechen begangen haben, verhaftet worden sind und in getrennten Zellen gefangen gehalten werden. Für jeden Gefangenen gilt nun 8 Zyklisches Verhalten zu postulieren bedeutet aber, einen Ausflug in die dynamische Spieltheorie, insbesondere die Lerntheorie zu wagen. Genaueres hierzu findet sich in den Abschnitten 8, 9 und 12. 9 „Erfinder“ des Gefangenendilemmas — oder zumindest der „Geschichte“ zur Auszahlungstabelle — ist laut Straffin (1980) Albert W. Tucker, der Doktorvater von John Nash. Tucker konzipierte das Gefangenendilemma 1950 in einer Notiz eher als Anekdote für einen Vortrag. Erstmals veröffentlicht worden ist diese Notiz in Tucker (1980). 3.6 Beispiele 43 folgende Regel. Gesteht er das Verbrechen, und sein Partner gesteht nicht (leugnet), so wird der Partner wegen Falschaussagens und wegen des eigentlichen Verbrechens für sechs Jahre eingesperrt, der Geständige wird freigelassen (Kronzeugenregelung). Gesteht der Partner ebenfalls, so werden beide für drei Jahre inhaftiert. Gesteht keiner der beiden, werden beide wegen geringer Vergehen für ein Jahr festgehalten. Handlungsalt. von B Gestehen Leugnen Handlungsalt. Gestehen -3, -3 0, -6 von A Leugnen -6, 0 -1, -1 Tabelle 3.19: Gefangenendilemma Es lässt sich leicht feststellen, dass für jeden der beiden Verbrecher die Handlungsalternative „Gestehen“ dominant ist. Die stabile Gleichgewichtslösung der dominanten Strategien ist natürlich das einzige Nash-Gleichgewicht. Aber die stabile Gleichgewichtslösung (Gestehen, Gestehen) ist nicht Pareto–effizient: Würden beide Spieler leugnen, so könnte sich jeder zwei Jahre Haft ersparen, beide könnten also zu einer Pareto–Verbesserung gelangen. Die Pareto–effiziente Lösung (Leugnen, Leugnen) ist aber kein Gleichgewicht des Spiels: Könnten sich die beiden Verbrecher beraten, so würden sie wohl vereinbaren, beide zu leugnen. Danach besteht aber dennoch die Gefahr, dass sich einer der Partner nicht an die Absprache hält, um sich noch besser zu stellen. Tatsächlich ist zu erwarten, dass beide bei einer Absprache vereinbaren würden, gemeinsam zu leugnen. Dann aber würde jeder seinen Partner betrügen und gestehen, in der Hoffnung, der Partner würde sich an das gemeinsame Abkommen halten. So werden beide den Partner betrügen und anstatt in der besten gemeinsamen Lösung in der schlechtesten gemeinsamen Situation landen: Beide bleiben für je drei Jahre im Gefängnis. Hierin besteht das erwähnte Gefangenendilemma. Technisch interessant am Gefangenendilemma ist also die Tatsache, dass das Pareto–effiziente Resultat kein Gleichgewicht ist. Am Gefangenendilemma wird deutlich, dass weitere spieltheoretische Untersuchungen sich auch mit der Frage beschäftigen müssen, welche Entscheidungen zustande kommen, wenn sich die Spieler untereinander absprechen. Dieser Zweig der Spieltheorie ist die Theorie kooperativer Spiele. Teile der kooperativen Spieltheorie werden im Abschnitt 10 behandelt. Dabei gewinnt vor allem die Problematik des Betruges große Bedeutung. Es zeigt sich, dass sich Betrug oft dann nicht lohnt, wenn Spiele mit denselben Mitspielern mehr als einmal gespielt werden. Es lässt sich nachweisen, dass 44 3. Statische Spiele sich bei unbekannt häufiger Wiederholung des Gefangenendilemma-Spiels im Laufe der Zeit die Kooperationslösung, also die Situation gemeinsamen Leugnens etablieren kann. Eine ausführliche Behandlung des Gefangenendilemmas als wiederholtem Spiel findet sich in Abschnitt 8.1. Das Gefangenendilemma ist Modell für viele ökonomische Situationen. Dies sind häufig Situationen, in denen individuell rationale Entscheidungen zu Situationen führen, die gesellschaftlich (d.h. in ihrer Gesamtwirkung) nicht optimal sind. Ein prominentes Beispiel ist die Thematik der öffentlichen Güter. Auch die Frage, ob Kartellvereinbarungen aufrechterhalten sollten oder nicht, entpuppt sich als Gefangenendilemma (vgl. Abschnitt 7.3 ab S. 123). 3.6.2 Das Chicken–Game Ein Spiel, bei dem es darum geht, dass sich die Spieler miteinander koordinieren, ist das berühmte Chicken–Game (hat nichts mit „Broilern“ zu tun, wohl aber mit Hühnern). Es geht um eine legendäre Mutprobe pubertierender Amerikaner. Zwei 16-jährige, Tom und Joe, fahren in den Autos ihrer Väter mit 120 mph (each) auf einer geraden Straße aufeinander zu, jeder in der Straßenmitte. Beide haben zwei Handlungsalternativen, in der Mitte bleiben (aus traditionellen Gründen abgekürzt als „D“) und nach rechts ausweichen (Abkürzung: „C“). Weicht nur einer aus, der andere aber nicht, so ist der Ausweicher als Feigling enttarnt, kann nicht erwarten in seinem Leben jemals das Herz einer Frau zu erobern und erhält deswegen eine Auszahlung von 1. Der Nicht–Ausweicher ist zum Held geworden, alle Frauen liegen ihm zu Füßen: Auszahlung = 3. Weichen beide aus, teilen sie sich die Frauen (und die Auszahlung). Die Auszahlung an jeden beträgt 2. Weicht keiner aus, kann auch keiner eine Auszahlung erwarten: 0 für jeden. Joe D C Tom D 0, 0 3, 1 C 1, 3 2, 2 Tabelle 3.20: Chicken–Game Es gibt keine dominanten Strategien. Nash-Gleichgewichte liegen bei (C, D) und bei (D,C). Problematisch ist die Tatsache, dass die Nash–Gleichgewichte asymmetrisch sind: Im Gleichgewicht müssen die Spieler unterschiedliche Strategien wählen. Eine Koordination wird hierdurch wesentlich erschwert. So entsteht folgende Gefahr: Streben beide Spieler mit Macht die 3.6 Beispiele 45 von ihnen persönlich präferierte Lösung an, kann nicht ausgeschlossen werden, dass der Fall (D, D) eintritt, der einzige Fall, in dem die gesamte Gesellschaft schlecht gestellt wird. Allerdings ließe sich ausgehend von der denkbar schlechtesten Lösung, (D, D), die Situation für beide Beteiligten verbessern, was etwa durch Absprache oder Verhandlung zwischen den beiden geschehen könnte. Im Fall (D, D) erhalten beide keine Auszahlung. Würde nun mindestens einer der beiden Spieler ausweichen, d.h. C wählen, so würden sich beide Spieler verbessern. Alle weiteren Situationen sind Pareto–effizient. 3.6.3 Stag–Hunt Ein weiteres Koordinationsspiel ist das Stag–Hunt Spiel („Hirschjagd“-Spiel), oft auch Assurance–Game genannt. Angeblich geht „die Geschichte“ zum Spiel auf Jean–Jacques Rousseau zurück, der die Jagd zweier Jäger auf Hirsche oder Hasen beschreibt. Spieltheoretisch gesehen geht es um einen technischen Konflikt zwischen zwei Arten von Kriterien zur Gleichgewichtsselektion, dem Kriterium der Pareto–Effizienz (Abschnitt 3.4.1) und dem Kriterium der Risikodominanz (Abschnitt 3.4.2). Um diesen Konflikt deutlicher zu illustrieren, soll hier eine mittelalterliche Variante des Spiels vorgestellt werden, das Drachenjagd– Spiel.10 Zwei mittelalterliche Gesellen, Archibald und Bertram, haben dasselbe Problem: Der Kühlschrank muss gefüllt werden. Am nächsten Tag wollen Sie auf die Jagd gehen. Die beiden treffen sich zur Vorbesprechung auf einem Humpen Honigmet mit Aspirin. Für jeden gibt es zwei Alternativen, man kann eine Maus jagen oder einen Drachen. Beides hat Vor– und Nachteile. Mäuse sind nicht besonders groß, relativ knochig und wenig schmackhaft. Wer eine Maus zur Strecke bringt, hat damit nur für einen Tag Vorrat (Auszahlung:1). Der Vorteil der Mäusejagd liegt in der Tatsache, dass Mäuse vergleichsweise ungefährlich sind. Wer sich aufs Jagen von Mäusen verlegt, hat vom Beutetier kaum etwas zu befürchten. Insbesondere kann man Mäuse gefahrlos auch allein, also ohne Hilfe eines anderen, erlegen. Drachen dagegen haben den Vorteil ihrer Größe. Ein Drache ist schmackhaft, sein Blut (als Badezusatz) ist gut für die Haut, und er füllt den Kühlschrank für gut und gern vier Tage. (Dabei müssen die Getränke zuerst rausgeräumt werden!) Die Auszahlung, wenn zwei Jäger einen Drachen erlegen, beträgt also für jeden Jäger 2. Allerdings haben Drachen auch Nachteile, die weit über deren schlechten Atem hinausgehen: Sie sind gefährlich. So einfach wie eine 10 Die Erfahrung lehrt, dass es angebracht ist, zu betonen, dass in Deutschland (anders als in einigen asiatischen Ländern) der Drache nicht als heiliges Tier gilt, sondern vielmehr als üble Landplage. 46 3. Statische Spiele Maus erlegt man einen Drachen nicht. Wenn nicht zwei Jäger zusammenarbeiten, erlegt nicht der Jäger den Drachen, sondern anders herum. Ein Jäger, der allein einen Drachen jagt, muss daher mit einer Auszahlung von -1 rechnen, was der letalen Ausgang der Jagd symbolisiert. Tabelle 3.21 fasst die Überlegungen zusammen. B Drache Maus A Drache 2, 2 -1, 1 Maus 1, -1 1, 1 Tabelle 3.21: Drachenjagd Wie das Koordinationsspiel hat auch das Drachenjad–Spiel zwei Nash– Gleichgewichte. Das Gleichgewicht (Drache, Drache) ist Pareto–effizient. Stehen beide Jäger am Jagdtag vor der Drachenhöhle, hat der Drache keine Chance, und bei den Jägern gibt es zum Mittag leckeren Drachenauflauf. Der Nachteil dieses Gleichgewichts ist die Tatsache, dass es gefährlich ist. Erscheint nämlich einer der beiden Jäger nicht zur Drachenjagd, geht es dem anderen schlecht. Beim Drachen gibt es Jägerschnitzel. Das Gleichgewicht (Maus, Maus) dagegen ist lange nicht so ertragreich wie (Drache, Drache), aber für jeden Jäger viel sicherer. Dieses Gleichgewicht ist risikodominant. Der hier zu beobachtende Konflikt zwischen zwei Arten von Gleichgewichten, einem effizienten und einem sicheren, ist ein Kennzeichen von vielen Spielen. Theoretisch lässt sich kaum festlegen, welches Konzept der Gleichgewichtsauswahl das überlegene ist. Ergebnisse der experimentellen Wirtschaftsforschung11 deuten darauf hin, dass die meisten Menschen das sichere Gleichgewicht dem effizienten vorziehen. 11 Ein Beispiel ist das Papier von Battalio et al. (2001).

Chapter Preview

References

Zusammenfassung

Vorteile

- Alle wichtigen Konzepte der modernen Spieltheorie

- Ein Klassiker in Neuauflage

Stimmen zum Werk

"(…) Wer eine kompakte und verständliche Einführung in die moderne Spieltheorie sucht, ist mit dem "Riechmann" hervorragend bedient. Das Buch enthält nicht nur alles Wissenswerte zu diesem Thema, es überzeugt auch durch eine sehr eingängige Stoffvermittlung, durch die selbst komplizierte Zusammenhänge verständlich werden. (…)"

in: Studium, 20.04.2008, 2. Auflage 2008

Zum Werk

Spieltheorie intuitiv - das muss nicht bedeuten: Spieltheorie ohne Mathematik. Dieses Lehrbuch gibt eine Einführung in alle wichtigen Konzepte der modernen Spieltheorie, indem es die "Idee" in den Mittelpunkt stellt, ohne dabei die notwendigen Formalia zu vernachlässigen.

Der Inhalt des Buches erstreckt sich von den Grundlagen der Spieltheorie über fortgeschrittene Themen wie Lernen in Spielen oder dynamische Gleichgewichtskonzepte in der evolutionären Spieltheorie.

Die Einbeziehung von Resultaten ökonomischer Laborexperimente erweitert die Perspektive des Buches über den Horizont herkömmlicher Werke zur Spieltheorie hinaus.

Insofern ist das Buch sowohl für Anfänger als auch für fortgeschrittene Spieltheoretiker gleichermaßen geeignet und nützlich.

Autor

Prof. Dr. Thomas Riechmann, Kaiserslautern.

Zielgruppe

Studierende der Wirtschaftswissenschaften.