In der Spieltheorie wird versucht, für jeden der beiden rationalen Spieler eine rationale Strategie zu spezifizieren. Dabei wird angenommen, dass jeder Spieler die Auszahlungen kennt und auch weiss, dass sein Mitspieler ebenso rational ist wie er selbst. Jeder Spieler muss sich also überlegen, dass jede Strategie, die er selbst als in seinem Sinne rational rechtfertigen kann, von seinem Mitspieler antizipiert werden kann, der dieses Wissen bei der Planung einer eigenen Strategie auszunutzen suchen wird. Im Falle von NuIIsummenspieIen empfiehlt die Spieltheorie eine reine Maximin-Strategie, in anderen Fällen eine gemischte Maximin-Strategie.
Es ist leicht feststellbar, ob eine Lösung akzeptabel ist. Man suche die reine Maximin-Strategie für jeden Spieler; dies seien a; und b. Angenommen, beide Spieler würden a, bzw. bi wählen — dann bestimme man die schlechteste Konsequenz, die es dabei für PA geben kann, sowie die schlechteste Konsequenz, die es für PB geben kann. Wenn die schlechteste Konsequenz für beide Spieler die gleiche Konsequenz o; ist, dann ist für P die Strategie a und für PB die Strategie b die Lösung. Die Konsequenz oii heißt in einem solchen Fall der Sattelpunkt des Spieles.
In Tabelle (a) ist für PA die reine Maximin-Strategie a2, da sie im schlechtesten Fall — der Konsequenz o21— 4 EUR liefert; für PB ist die reine Maximin-Strategie b1, denn sie bringt im schlechtesten Fall — ebenfalls der Konsequenz 021 — eine Auszahlung von EUR. Die Konsequenz 021 stellt also einen Sattelpunkt des Spieles dar; die Lösung ist das Strategiepaar a2b1. Eine Matrix kann übrigens mehrere Sattelpunkte haben — der Spieler kann dann irgendeine der Sattelpunktstrategien wählen, vorausgesetzt, er wählt keine dominierte Strategie; alle diese Strategien bringen beiden Spielern die gleichen Auszahlungen.
In Tabelle (b) ist für PA die reine Maximin-Strategie a2, denn sie bringt im schlechtesten Fall — der Konsequenz 022 — 2 EUR, während für PB die reine Maximin-Strategie b1 ist, die im schlechtesten Fall — der Konsequenz 021 — die Auszahlung EUR bringt. Wenn demnach PA und PB beide jeweils ihre reine Maximin-Strategie spielen, führt dies zu unterschiedlichen schlechtesten Konsequenzen (022 bzw. 021). Es gibt also keinen Sattelpunkt; das Strategiepaar a2b1 stellt spieltheoretisch keine Lösung dar. Der Grund läßt sich schnell erkennen: Beide Spieler sind in gleicher Weise rational. Wenn dann PA die Strategie a2 als für ihn am günstigsten ermittelt, da sie ihm im schlimmsten Fall noch 2 EUR bringt, würde PB am besten die Strategie b2 wählen, da sein Verlust dann nur -2 EUR beträgt. Aber PA — ebenso rational wie PB — kann diese Überlegungen antizipieren und würde dann am besten die Strategie a1 wählen, die ihm 8 EUR eintrüge, was wiederum PB dazu veranlassen würde, Strategie b3 zu; wählen, die ihm 5 EUR bringt, etc. — ein endloser Zyklus. Eine solche zyklische Argumentation kann sich dann nicht ergeben, wenn es — wie bei der in Tabelle (a) gezeigten Auszahlungsmatrix — einen Sattelpunkt gibt. Hier stellen a2 und b1 die reinen Maximin-Strategien dar. Selbst wenn PA in diesem Fall die Wahl von b1 durch PB antizipiert, gibt es für ihn keinen Anlass zur Änderung seiner Entscheidung, da er sich bei einer anderen Strategie nur schlechter stehen kann. Ebenso gibt es für PB auch bei Antizipation der Wahl von a2 durch PA keinen Grund zum Wechsel der Strategie. Wenn es für keinen Spieler — auch wenn er die Wahl des Opponenten kennt und sicher ist, dass dieser seine Richtung nicht ändern würde — einen Grund gibt, die eigene Entscheidung zu ändern, dann ist a;bi ein Gleichgewichtspaar. Sattelpunktstrategien bilden stets ein Gleichgewichtspaar; aber auch wenn kein Sattelpunkt existiert, kann immer ein Gleichgewichtspaar gemischter Strategien gefunden werden, nämlich gemischter Maximin-Strategien. Das Konzept des Gleichgewichts ist für die Rechtfertigung, der Maximinlösung bei Nullsummenspielen zwischen rationalen Spielern entscheidend, da ohne die Möglichkeit eines Gleichgewichts die Festlegung eines rationalen Spielers auf eine bestimmte Strategie schwer zu begründen wäre.
Mit Hilfe gemischter Maximin-Strategien läßt sich die Lösung für die Matrix in Tabelle (b) ableiten. Sie ist nicht schwer zu finden, da es nur zwei Strategien a; gibt. Bei nur zwei a;s müssen alle für PA möglichen gemischten Strategien die Form (p1a1, p2a2) haben; dabei sind p1 und p2 in diesem Zusammenhang allerdings p,,s und nicht pi,s. Da p2 = 1 — p2 ist, kann durch Festlegung von p1 jede gemischte Strategie erhalten werden. Es sei g der Erwartungswert einer Strategie für PA bei einer gegebenen Wahl von bi durch PB; dann ist
Die Gleichung zeigt, dass der Erwartungswert gi bei einer gegebenen Auszahlungsmatrix eine lineare Funktion von p1 ist. Der Erwartungswert gi einer gemischten Strategie (p181 p2B2) für den Protagonisten, wenn der Opponent die Strategie bi wählt. Die Darstellung bezieht sich auf die Auszahlungsmatrix in Tabelle (b).
Für jede gemischte Strategie - also für jede Wahrscheinlichkeit p - existiert ein niedrigster Erwartungswert für PA bei den drei Wahlen von b durch PB. Wenn p, gering ist, ist der kleinste EV mit b2 gegeben; für mittlere p, ist er mit b, gegeben; und für die höheren p, ist er mit b3 gegeben. In der Abbildung kennzeichnet eine stärkere Linie den geringsten EV als eine Funktion von p,; sie zeigt den niedrigsten EV für e; jeder von ihm gewählten Strategie. Die Linie repräsentiert die Sicherheitsniveaus bezüglich der gemischten Strategien”. Der Pfeil weist auf das maximale Sicherheitsniveau; die entsprechende Wahrscheinlichkeit p, kann auf der Abszisse abgelesen werden. Es kann auch analytisch eine Lösung gefunden werden, wenn man weiss, dass die Lösung bei g, = g2 liegt; dann kann man schreiben:
p1 (v11 - v21 + v21 = p1 (v12 - v22) + v22
Bei bekannten Werten für vti hat die Gleichung eine Unbekannte, nämlich p1; im Beispiel errechnet sich p, als 1/6. Mit Bekannter p, kann man dann den Erwartungswert des Spieles für P mit Hilfe von Gleichung für g, oder g2 berechnen und erhält g =
3. Das gleiche graphische und analytische Verfahren kann bei der Auszahlungsmatrix in Tabelle (a) - einer Sattelpunktmatrix also - angewandt werden, die das Sicherheitsniveau repräsentierende Linie wäre maximal bei p, = 0, d.h. bei der reinen Strategie a2.
Aus der obigen Graphik kann man entnehmen, dass eine Strategie die Form (p1b1, p2b2) haben muss, da nur die Strategien b, und b2 die Auszahlung für PA so gering wie möglich halten können - bei einem Nullsummenspiel stehen ja die Auszahlungen für PB in umgekehrter Beziehung zu den Auszahlungen für PA; in diesem Fall sind p, und p2 wieder pä. Da es nur um eine einzige Variable, die Wahrscheinlichkeit p, zu tun haben, kann man die Lösung für PB in der gleichen Weise wie für PA ermitteln; allerdings muss man als PB,s Werte v die ij Einträge in der Matrix mit negativen Vorzeichen versehen.
Die Maximin-Strategien für PA und PB bilden bei Nullsummen-Spielen stets ein Gleichgewichtspaar; selbst wenn also ein Spieler die Maximin-Strategie seines Opponenten antizipiert, gibt es für ihn keinen Grund, von seiner eigenen Maximin-Strategie abzuweichen. Natürlich, wenn das Spiel wirklich losgeht, muss PA sich für a, oder a2 und muss PB sich für b, oder b2 entscheiden; aber da jede Wahl ja nur mit einer gewissen Wahrscheinlichkeit getroffen wird, kann ein Spieler die Entscheidung seines Opponenten nie mit Sicherheit antizipieren. Allerdings kann er, wenn er seinen Opponenten für rational hält, die Wahrscheinlichkeiten von dessen Entscheidungen abschätzen.
- Entscheidungstheorie
Vorhergehender Fachbegriff: Satisfizierungsprinzip | Nächster Fachbegriff: Sattelpunkt-Lösung
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|