Entscheidungstheorie
Beschreibung und Erklärung des Entscheidungsverhaltens von Wirtschaftssubjekten angesichts einer teilweise unbekannten Umwelt. Die Theorie kann deskriptiv oder normativ gefaßt sein. In einer deskriptiven Entscheidungstheorie wird das tatsächliche Entscheidungsverhalten aufgrund empirischer Befunde erforscht und dargestellt. Dies kann anhand von Beobachtungen echter wirtschaftlicher Entscheidungen oder auf dem Wege des Experiments durch Simulation von Entscheidungen im Rahmen künstlich aufgebauter Entscheidungssituationen erfolgen. Letzterer Zugang hat den Vorteil, dass das Entscheidungsfeld klar umrissen ist und die entscheidenden Subjekte um die Beweggründe ihrer Entscheidung befragt werden können. Die normative Entscheidungstheorie geht i.d.R. vom Postulat des Rationalverhaltens aus und stellt Kriterien auf, nach denen rational handelnde Wirtschaftssubjekte ihre Entscheidungen fällen sollten. Diese Kriterien können natürlich nur ganz allgemeiner Art sein und nicht von sich aus schon zu einer konkreten Entscheidung führen. Sie hängen im übrigen von der jeweiligen Entscheidungssituation ab. Im Hinblick auf die Zahl der Entscheidungsträger unterscheidet man zwischen Mehrpersonen- und Einzelpersonen-Entscheidungssituationen. Haben mehrere Personen gleiche Präferenzen bzw. das gleiche Ziel, dann liegt ein Team vor. Dieses kann wie ein einzelner Entscheidungsträger aufgefaßt werden. Probleme ergeben sich nur bei der Aufteilung der Entscheidungaufgaben auf die einzelnen Mitglieder des Teams; das sind Probleme organisatorischer Art. Stimmen die Präferenzen nicht überein bzw. gehen die Ziele auseinander, dann ist eine Abstimmung der Präferenzen bzw. der Ziele erforderlich. Nach Kenneth J. ARROW ist das nicht restlos möglich, ohne dass gewisse plausible Rationalitätspostulate verletzt werden, eine Aussage, die für die Wohlfahrtstheorie Konsequenzen hat. Eine spezielle Entscheidungssituation mit mehreren Entscheidungsträgern ist die Spielsituation. Hier haben alle Entscheidungsträger die Möglichkeit, unabhängig voneinander Entscheidungen zu fällen mit Konsequenzen, die alle in verschiedener Weise tangieren (Spieltheorie). Das Grundmodell der Entscheidungstheorie für einen Entscheidungsträger sieht wie folgt aus: Der Entscheidungsträger steht einer Umwelt gegenüber, die in einem von m möglichen Zuständen s;, ..., s~ vorliegt. Ihm stehen n verschiedene Aktionsmöglichkeiten a;, ..., ao zur Verfügung. Ergreift er die Aktion a; und liegt der Umweltzustand si vor, dann resultiert ein Ergebnis ei. Es gehört zur Methodik der Entscheidungstheorie, konkrete Entscheidungssituationen so zu strukturieren, dass auf sie dieses Grundmodell paßt. Beispielsweise können dynamische Entscheidungsmodelle dadurch auf das Grundmodell zurückgeführt werden, dass man ganze Entscheidungsstrategien an Stelle der punktuellen, zeitabhängigen Einzelentscheidungen zu den Aktionen a; des Modells erklärt. Ältliches gilt für solche Fälle, in denen der Entscheidungsträger die Umweltzustände beeinflussen kann (z.B. im Marketing durch Werbung). Ein erstes Problem der Entscheidungstheorie besteht darin, eine für die jeweilige Situation angemessene Nutzenbewertung der Ergebnisse el zu finden (Nutzenmessung). Sind die Ergebnisse bezüglich mehrerer Ziele zu bewerten, so spricht man von Mehrzielentscheidungen. Das Ergebnis e; liegt dann in Form eines Bewertungsvektors vor:
Man kann nun entweder eine Lösung des Entscheidungsproblems bezüglich jeder einzelnen Bewertungskomponente anstreben (Vektoroptimierung) oder aber eine Aggregation der Einzelbewertungen zu einer Gesamtbewertung versuchen, um dann nur noch bezüglich dieser das Entscheidungsproblem zu lösen. Eine einfache Aggregationsmethode ist die Bildung des arithmetischen Mittels, wobei auch Gewichte verwendet werden können. Natürlich entfällt eine Aggregation, wenn von vornherein nur ein Ziel vorliegt. Ist IN die (sei es durch Aggregation, sei es durch Einzelbewertung gewonnene) Nutzenbewertung von e;j, dann können diese Werte zu einer Entscheidungsmatrix (u1i) zusammengefaßt werden. Sie ist die Grundlage für das weitere Vorgehen. Die Auswahl einer optimalen Entscheidung erfolgt nach bestimmten Kriterien, und diese richten sich nach dem Kenntnisstand des Entscheidungsträgers über die Umwelt. Man unterscheidet a) die vollständige Gewißheit: der Umweltzustand si ist bekannt, und die optimale Aktion a; ist diejenige, die den Nutzen u;i maximiert; b) die vollständige Ungewißheit: über den Umweltzustand ist nichts bekannt, eine Entscheidung ist trotzdem zu fällen; c) die Risikosituation: man kennt Wahrscheinlichkeiten pi für das Eintreten der Umweltzustände sj; d) die Spielsituation: die Umweltzustände sind die Strategien sj eines rational handelnden Gegenspielers. Unter Fall a) werden diverse Optimierungsverfahren behandelt (z.B. die - lineare Programmierung), Fall d) ist Gegenstand der Spieltheorie, die Fälle b) und c) (Risiko und Unsicherheit) gehören im engeren Sinne zur Entscheidungstheorie. Zwei Entscheidungskriterien sind für den Fall der vollständigen Ungewißheit besonders prominent geworden: das LAPLACE-Kriterium (wähle die Aktion ai mit maximalem Durchschnittsergebnis:
und das Minimax-Kriterium (wähle die Aktion a; mit maximalem Mindestergebnis:
Ersteres geht von der Vorstellung aus, dass bei vollständiger Ungwißheit über die Umweltzustände jeder gleich möglich ist (Prinzip vom unzureichenden Grund) und daher mit gleichem Gewicht berücksichtigt werden sollte; letzteres stammt aus der Spieltheorie und richtet sich immer nach dem schlechtestmöglichen Ergebnis, führt also zu extrem vorsichtigem Verhalten. Im Falle der Risikosituation ist zwischen verschiedenen Wahrscheinlichkeitsverteilungen der nutzenbewerteten Ergebnisse auszuwählen. Das BERNOULLI-Kriterium schlägt vor, diejenige Aktion a; zu wählen, die den erwarteten Nutzen pi maximiert: Dies setzt freilich eine Nutzenbewertung voraus, welche die alleinige Berücksichtigung des Erwartungswertes erlaubt. Dass ein solcher BERNOULLI-Nutzen unter Rationalitätsgesichtspunkten existiert, ist das Ergebnis einer von John von NEUMANN und Oskar MORGENSTERN durchgeführten Axiomatisierung der Nutzentheorie. Wird auf die Einführung einer BERNOULLI-Nutzenfunktion verzichtet, wird also eine nicht das Risikoverhalten berücksichtigende Nutzenbewertung uj oder einfach nur eine Geldbewertung verwendet, dann muss i.d.R. neben dem Erwartungswert pi zumindest noch die Varianz a, der Wahscheinlichkeitsverteilung des Nutzens (bzw. des Geldes) zur Entscheidungsfindung mit herangezogen werden. Man kombiniert beide zu einem sogenannten (,a)-Kriterium, also einer die Aktion a; bewertenden Funktion yr(;,a,) und wählt diejenige Aktion als optimal, die diese Funktion maximiert:
Dieses Kriterium wird in der PortfolioSelection-Theorie gern angewandt. Gleichgültig, welchen Weg man wählt, durch die Wahl einer geeigneten BERNOULLI-Nutzenfunktion u(e), e = Einkommen oder Gewinn, oder eines (p,(s)-Kriteriums tp lassen sich verschiedene Verhaltensweisen gegenüber dem Risiko adäquat ausdrücken. Risikoaversion wird z.B. durch eine konkave Nutzenfunktion (Abb. 1) oder durch nach rechts gebogene Indifferenzlinien im (A,a)-Diagramm ausgedrückt (Abb. 2).
Eine teils konkav, teils konvex verlaufende Nutzenfunktion gestattet es, ein Risikoverhalten zu modellieren, das durch Risikoaversion in gewissen Einkommensbereichen und durch Risikovorliebe in anderen Bereichen gekennzeichnet ist. Die Größe - e u"(e) / u\'(e) wird nach Kenneth J. ARROW und John W. PRATT als relativer Risikoaversionskoeffizient bezeichnet. Er bestimmt das lokale Risikoverhalten in der Umgebung eines Einkommens e. Das BERNOULLI-Kriterium ist also sehr flexibel. Gegenüber dem (p,o)-Kriterium hat es den Vorteil, aus Prinzipien des Rationalverhaltens herleitbar zu sein, während dies beim (p,a)-Kriterium nur für spezielle Funktionen tp oder spezielle Wahrscheinlichkeitsverteilungen gilt. Andererseits ist das (p,a)-Kriterium operationaler und für Anwendungen oft besser geeignet. Neben der Portfolio-Selection-Theorie und der Spieltheorie finden sich Anwendungen der Entscheidungstheorie v.a. in der Theorie spekulativer Märkte und im Versicherungswesen. Literatur: Sinn, H.-W. (1989). Kreps, D.M. (1988). Gärdenfors, P., Sahlin, N.-E. (1988). Hogart, R.M., Reder, M.W. (1987). Ferschl, F. (1975). Schneeweiß, H. (1967)
(Entscheidungslogik): Unter Entscheidungstheorie wird traditionell eine formale, interdisziplinäre Theorie über die rationale - Entscheidung eines Individuums oder einer sozialen Institution verstanden; ein Aussagesystem über die Wahl einer Alternative, wenn mehrere Alternativen möglich sind.
Neben dieser auch als Entscheidungslogik bezeichneten normativen Entscheidungstheorie hat sich eine verhaltenswissenschaftliche, deskriptive Entscheidungstheorie herausgebildet, die den Entscheidungsprozess als formalen Oberbau zur Funktionalbetrachtung (Planung, Organisation, Kontrolle etc.) heranzieht, zugleich aber erkennt, dass Management als Funktion und Prozess nicht getrennt gesehen werden kann von den Strukturen (der Organisation), in denen es abläuft.
Die Grundkonfiguration der statistischen oder mathematischen Entscheidungstheorie ist eine Situation, in der zwei Personen jeweils eine Entscheidung treffen und in der diese beiden Entscheidungen zu einer bestimmten Konsequenz führen.
In der Spieltheorie werden die Personen in einer solchen Situation Spieler (players) genannt, in der Entscheidungstheorie spricht man von Entscheidern (decision makers) oder Aktoren (actors). Manchmal wird die entscheidende Person als ein komplexes, vielfältige Interessen verkörperndes Gebilde verstanden, etwa als eine Nation oder eine Gesellschaft, meist jedoch als reales oder ideales Individuum. Die Personen werden oft mit PA und PB bezeichnet. PA ist der Protagonist (protagonist), PB der Mitspieler (co-player), Konkurrent (competitor) oder Opponent (opponent) von PA.
Die Annahme einer Situation mit zwei Personen erlaubt die Darstellung der Elemente der ZweiPersonen-Spieltheorie. Aber man kann auch das Entscheidungsverhalten einer einzelnen Person betrachten, indem man PB als die “Natur” — und nicht als eine “Person” — deutet.
Allgemein bezeichnet “Natur” eine Menge möglicher Ereignisse, deren jeweiliges Eintreten nicht als Resultat der Entscheidung einer Person betrachtet werden kann. Dabei wird unterstellt, dass das eintretende Ereignis ebenso wie die Entscheidung von PA Entscheidung in einer Beziehung zu der sich ergebenden Konsequenz steht. Für die Analyse einer Entscheidungssituation ist bedeutsam, ob es sich bei PB um eine rationale und egoistische Person oder um eine desinteressierte Natur handelt.
Es seien a1, a2,..., am Alternativen für PA und b1, b2..., Ion die möglichen Handlungsalterungsalternativen für PB. PA kann eine — und nur eine — der m Möglichkeiten wählen und ebenso kann PB eine und nur eine der n Möglichkeiten wählen, wobei jede der möglichen Entscheidungen mit der gleichen Leichtigkeit getroffen werden kann. Unterschiede der Anstrengung und Mühe bei der Entscheidung bzw. der Realisierung einer Entscheidung können als Aspekt der sich ergebenden Konsequenz in die Formalisierung der Situation miteinbezogen werden.
Man bezieht sich auf die a; als potentielle Wahlen von PA und bezeichnet sie als Optionen (options) Alternativen (alternatives). Spricht man von der Entscheidung (decision) oder Wahl (choice), die PA getroffen hat, so meint man das Ergebnis eines Wahlakts, d.h. eine spezielle gewählte a. Spricht man von möglichen, potentiellen oder verfügbaren Entscheidungen oder Wahlen, so bezieht man sich stets auf Optionen bzw. Alternativen.
Der Begriff der Strategie (strategy) wird unterschiedlich verwendet. Manchmal wird er synonym mit Option oder Entscheidung gebraucht. Häufig bezeichnet er auch einen Plan für eine terminale Entscheidung; wenn beispielsweise eine Option die Form eines Plans für je nach möglichen Kontingenzen unterschiedliche terminale Entscheidungen hat, nennt man sie meist eine Strategie. Schließlich wird der Begriff auch synonym mit dem Begriff “Entscheidungsprinzip” verwendet, der eine Regel für die Wahl unter Optionen bezeichnet.
Wird PB als Natur interpretiert, so werden die Optionen üblicherweise Zustände der Natur (states of nature), Zustände der Welt (states of the world) oder auch Hypothesen (hypotheses) genannt. Das als Folge einer Wahl der Natur eintretende Ereignis wird als der wahre Zustand der Natur der wahre Zustand der Welt bzw. die wahre Hypothese oder aber als das Ergebnis bezeichnet.
Eine gemeinsame Entscheidung läßt sich in der Form abl darstellen. Dabei impliziert das nicht zwangsläufig Konkurrenz oder Kooperation zwischen PA und PB, sondern verweist lediglich auf Kombinationen der jeweiligen Optionen oder Entscheidungen beider Personen. Der aus dieser gemeinsamen Entscheidung resultierende Zustand heißt Konsequenz (consequence). Eine sich aus der gemeinsamen Entscheidung a;bi ergebende Konsequenz wird mit o;l symbolisiert.
Verbal wird eine Konsequenz normalerweise beschrieben in der Form “PA erhält von PB X DM”. Es gibt m x n mögliche gemeinsame Entscheidungen und ebensoviele mögliche Konsequenzen. Die möglichen Entscheidungen von PA und PB sowie die entsprechenden Konsequenzen können nach dem folgenden Muster in einer Spielmatrix (game matrix) dargestellt werden:
Im allgemeinen wäre es für PA vorteilhaft, die Entscheidung von PB zu kennen, bevor er selbst entscheidet; und für PB gilt das gleiche. Nimmt man jedoch an, dass PA und PB sich zu ihren jeweiligen Entscheidungen ohne vorherige Kenntnis der Wahl des anderen entschließen müssen, so beschreibt die Formalisierung die sogenannte Normalform eines Spiels. Da in vielen tatsächlichen Entscheidungssituationen die Spieler abwechselnd ihren Zug machen, also nicht gleichzeitig entscheiden, könnten die bei der Normalform zugrundegelegten Annahmen die Anwendbarkeit der Theorie einschränkend erscheinen. Jedoch kann ein in der Form abwechselnder Züge zwischen den Personen beschriebenes Spiel (extensive Form eines Spiels) auch in Normalform dargestellt werden.
Die mathematische Analyse rationalen Entscheidungsverhaltens erfordert die quantitative Bewertung der Konsequenzen für jede Person, nicht jedoch für die Natur. Im allgemeinen geht man davon aus, dass der Wert einer Konsequenz für eine Person durch einen einzelnen - Nutzen (utility) repräsentiert werden kann; manchmal werden auch multidimensionale Nutzenwerte in Betracht gezogen.
Die Nutzenmatrix (utility matrix) ist der Spielmatrix ähnlich, nur enthält sie Nutzenwerte anstelle von Konsequenzen. Der Nutzen einer Konsequenz wird im allgemeinen bei zwei Personen, PA und PB unterschiedlich sein, so dass man für jede Konsequenz zwei Nutzenwerte benötigt. Der Nutzen einer Konsequenz oii für PA wird mit uiiA symbolisiert und der Nutzen dieser Konsequenz für PB mit u.B. In der folgenden Tabelle ist die Nutzenmatrix dargestellt.
Im Falle nur einer einzelnen entscheidenden Person wäre für jede Zelle der Matrix nur ein einzelner Wert u1A erforderlich, da davon ausgegangen wird, dass die Natur weder die Konsequenzen bewertet noch bei ihrer ,Wahl\' solche Werte berücksichtigt; hier ist daher das Superskript A bzw. B überflüssig und es genügt zur Repräsentation des Nutzens einer Konsequenz das Symbol u;i.
Häufig ist die Art, in der Zahlen in eine Nutzen-matrix eingesetzt werden, nutzentheoretisch eigentlich nicht zu rechtfertigen. Oft handelt es sich um Geldbeträge, die eine Person je nach der sich ergebenden Konsequenz erhalten oder verlieren wird; aber man kann im allgemeinen nicht einfach voraussetzen, dass die quantitative Menge an Geld als solche genau dem Nutzen dieser Geldmenge für eine Person entspricht. Dennoch wird oft mit Geldbeträgen anstelle von Nutzen-werten gearbeitet, da Geldbeträge jedem vertraut sind und zudem vermutlich innerhalb des Bereiche der Beträge, um die es normalerweise geht, den Nutzenwerten in etwa entsprechen. Man spricht deshalb häufig auch von Auszahlungsmatrix (payoff matrix). Desgleichen spricht man vom Wert (value) einer Konsequenz, symbolisiert durch vii; bei einem Wert mag es sich um einen Nutzen oder nur um ein anerkanntermaßen vergleichbares Surrogat handeln.
Je nach den situativen Bedingungen des Entscheidens trifft jemand seine Entscheidung unter einer der folgenden Bedingungen: Gewißheit (certainty), Risiko (risk), Ungewißheit (uncertainty) oder rationaler Wettbewerb (rational competition).
Der Protagonist PA trifft seine Entscheidung unter Gewißheit, wenn bei jeder Option nur eine einzige Konsequenz möglich ist; diese Situation läßt sich durch eine Spielmatrix mit nur einer Spalte darstellen. Das einzige Entscheidungskriterium für diese Situationen lautet, PA solle diejenige Entscheidung treffen, deren Konsequenz den höchsten Nutzen hat.
“Gewißheit” ist eine mathematische Abstraktion. Entscheidungssituationen im Alltag enthalten stets Momente der Unsicherheit — auch diejenigen, die als Situationen der Gewißheit charakterisiert werden. Die mit dem Wert einer Konsequenz verbundene Unsicherheit findet sich nicht nur unter der Bedingung der Gewißheit.
Der Protagonist PA trifft eine Entscheidung unter Risiko, wenn er sich der Wahrscheinlichkeiten der verschiedenen für PB möglichen Alternativen bewußt ist. PB wird in einer solchen Situation im allgemeinen eher als Natur denn als Mitspieler interpretiert.
In einer Entscheidungssituation unter Risiko kann jede der Optionen, die PA hat, als eine Art Glücksspiel (gamble) oder als Wette oder Lotterie verstanden werden. In der Entscheidungstheorie ist ein solches Spiel um Geld als eine Handlungsalternative definiert, bei der die Wahrscheinlichkeiten der möglichen Konsequenzen bekannt oder zumindest kalkulierbar sind; die Alternativen bei Spielen wie etwa Roulette führen mit bestimmten bekannten Wahrscheinlichkeiten zu Konsequenzen bzw. Auszahlungen und stellen daher im entscheidungstheoretischen Sinne Glücksspiele dar.
Der Protagonist PA trifft seine Entscheidung unter Ungewißheit, wenn er zwar sieht, dass eine Entscheidung zu unterschiedlichen Konsequenzen führen kann, er sich aber völlig darüber im unklaren ist, welche dieser Konsequenzen eintreten könnte. Weder gibt es für ihn einen Grund zu der Annahme, sie komme durch die Wahl eines rationalen Opponenten zustande, noch gibt es für ihn Anhaltspunkte zur Abschätzung der Wahrscheinlichkeiten der Konsequenzen. Der Protagonist weiss also, dass seine Entscheidung zu irgendeiner von mehreren denkbaren Konsequenzen führen kann — aber das ist auch alles.
Der Protagonist PA trifft eine Entscheidung unter der Bedingung rationalen Wettbewerbs, wenn sein Konkurrent PB ein “rationales Wesen” ist, das also jede dem eigenen Interesse entsprechende Strategie wählen kann und wird. Das für eine solche Situation empfohlene Entscheidungskriterium basiert auf der Annahme, dass jede für einen völlig rationalen Protagonisten akzeptable Strategie für den rationalen Konkurrenten gleichermaßen akzeptabel und auch evident ist. In einem wirklichen Spiel zwischen zwei Personen mag die Annahme allerdings unrealistisch sein, die Versuchsperson in der Rolle von PB sei ein rationaler Konkurrent. Immerhin jedoch dürfte eine reale Person eher einem rationalen Mitspieler als der Natur ähneln.
Die vier Bedingungen, unter denen Entscheidungen getroffen werden können, stellen Idealtypen dar. Viele reale Entscheidungssituationen scheinen irgendwo in der Mitte zwischen den Kategorien Risiko und Ungewißheit angesiedelt zu sein.
Oft empfiehlt es sich für PA, einen Zufallsmechanismus bestimmen zu lassen, welche Alternative gewählt werden soll. PA kann sich z.B. vornehmen, al zu wählen, wenn bei einem Münzwurf die Zahl oben liegt, und a3 zu wählen, wenn die Münze den Adler zeigt. Ein solches Vorgehen stellt entscheidungstheoretisch eine zufallsgesteuerte oder — randomisierte gemischte Strategie dar.
Allgemein formuliert besteht eine gemischte Strategie aus einer Untermenge der ursprünglichen Menge an Optionen sowie einer Angabe der Wahrscheinlichkeit der Wahl jeder zu dieser Untermenge gehörenden Option. Eine derartige Strategie wird meistens symbolisiert mit (p1a1, p2a2,..., pmam). Die Optionen mit Wahrscheinlichkeiten von Null werden nicht miteinbezogen. Die Annahme geht dahin, dass PA zunächst die Wahrscheinlichkeiten — einschließlich der Wahrscheinlichkeiten von Null — für seine gemischte Strategie spezifiziert, dann aber keinen weiteren Einfluss mehr auf die reine Strategie nimmt, auf die er sich festgelegt hat; diese wird vielmehr durch irgendeinen Zufallsmechanismus mit entsprechenden Wahrscheinlichkeiten gesteuert. Die ursprünglichen, also nicht durch Wahrscheinlichkeiten näher spezifizierten Optionen a,, a2,..., ; nennt man demgegenüber reine Strategien. Das Symbol a; wird auch bei der Behandlung gemischter Strategien zur Bezeichnung einer beliebigen Strategie aus der Gesamtmenge reiner und gemischter Strategien benutzt.
Wenn man alle überhaupt möglichen gemischten Strategien in Betracht zieht, so gibt es eine unendlich große Anzahl möglicher Strategien, aus denen PA wählen kann; sogar bei nur zwei reinen Strategien a1 und a2 gibt es bereits unendlich viele Werte für p1 bzw. p2.
In manchen Situationen kann es für PA empfehlenswert sein, seine Wahlen in der Weise zu mischen, dass er sie von Fall zu Fall ändert — allerdings in einem systematischen und nicht einem zufallsähnlichen Verfahren. Insbesondere könnte PA gut daran tun, seine Entscheidungen in Abstimmung mit PB zu variieren; die aufeinander folgenden gemeinsamen Entscheidungen wären dann etwa a1b1, a2b2, a1b1, a2b2, usw. Dies nennt man eine korrelierte oder koordinierte gemischte Strategie. Sie ist manchmal bei sogenannten Verhandlungsspielen angebracht.
Die folgende Abbildung zeigt eine Auszahlungsmatrix sowie die graphische Darstellung der ihr entsprechenden Strategiemengen der reinen und der gemischten Strategien eines Zwei-Personen-Spiels in einem Strategie-Mengen-Diagramm.
Die Strategiemenge besteht aus den Punkten auf den Grenzen und innerhalb der Grenzen des Dreiecks. Jeder Punkt in der Darstellung repräsentiert eine mögliche Strategie für PA — rein oder gemischt. Die Abszisse g1 zeigt die erwartete Auszahlung_ für PA bei einer bestimmten Strategie, wenn Pb die Alternative b1 wählt; die Ordinate g2 zeigt die erwartete Auszahlung für PA, wenn PB die Alternative b2 wählt. Eine erwartete Auszahlung ist die durchschnittliche Auszahlung pro Durchgang, die sich ergibt, wenn sehr viele Durchgänge des Spiels abgewickelt werden. Die Berechnung von g1 erfolgt unter der Annahme, PB habe b1 gewählt, die Berechnung von g2 demgegenüber unter der Annahme, PB habe b2 gewählt. Für eine reine Strategie ergibt sich die erwartete Auszahlung durch den Eintrag in der Auszahlungsmatrix; jeder Durchgang bringt PA — bei konstanter Strategie ai und konstantem bi — die gleiche Auszahlung.
Für eine gemischte Strategie ist die erwartete Auszahlung der Durchschnitt der mit den Wahrscheinlichkeiten der StrategienwahI gewichteten Auszahlung. Jede der drei reinen Strategien ist in dem Strategie-Mengen-Diagramm in der Abbildung links dargestellt. Die durch Mischung von je zwei reinen Strategien sich ergebenden möglichen Strategien werden durch die Punkte auf der geraden Linie zwischen den zwei Punkten abgebildet, die diese zwei reinen Strategien repräsentieren. Jeder Punkt innerhalb des durch die drei reinen Strategien gebildeten Dreiecks stellt eine zumindest denkbare Strategie dar. Alle überhaupt möglichen Strategien liegen innerhalb des Dreiecks oder auf seinen Grenzlinien.
Die gesamte PA verfügbare Menge an Strategien heißt eine konvexe Menge; damit ist gemeint, dass alle Punkte auf der geraden Linie zwischen jeweils zwei reine Strategien repräsentierenden Punkten ebenfalls in der Strategiemenge enthalten sind. Die Menge der reinen und gemischten Strategien bildet immer eine konvexe Menge, ganz unabhängig von der Anzahl der für PA bzw. PB verfügbaren Handlungsalternativen und von den Auszahlungen bei den verschiedenen Konsequenzen. Graphisch dargestellt braucht die Strategiemenge kein Dreieck zu bilden.
Wenn P mehr als zwei Optionen zur Verfügung stehen, kann die Strategiemenge graphisch nicht mehr in zwei Dimensionen dargestellt werden, da jede Option b eine eigene Dimension erfordert.
Im Falle dreier Optionen jann die Menge der für PA möglichen reinen und gemischten Strategien als ein dreidimensionaler Körper vorgestellt werden. Wenn es um mehr als drei Optionen geht, läßt sich die Strategiemenge von PA als ein n-dimensionaler konvexer Körper beschreiben, wenn PB über n reine Strategien verfügt.
Wenn Strategie ai für PA mindestens bei einer Option von P eine höhere Auszahlung bietet als Strategie a; und eine ebenso hohe oder höhere Auszahlung bei allen anderen Optionen, so sagt man, dass Strategie a; die Strategie a; schwach dominiere. Von strenger Dominanz spricht man, wenn Strategie a1\' bei jeder Option von PB eine höhere Auszahlung bietet als Strategie a. Ohne weitere Spezifikation wird der Begriff “Dominanz” im Sinne schwacher Dominanz verstanden, d.h. für Strategie a und Strategie a; kann die Auszahlung bei mindestens einer Option bi gleich sein - muss es aber nicht. Strenge Dominanz ist ein Spezialfall der (schwachen) Dominanz. Wenn also eine Strategie a;\' eine andere Strategie a; streng dominiert, dann muss sie a; auch (schwach) dominieren, aber nicht umgekehrt. Alle Strategien einer Strategiemenge, die nicht durch irgendeine andere Strategie dieser Menge dominiert werden, heißen zulässige Strategien.
Die am häufigsten für das Handeln in Entscheidungssituationen verfochtene Regel ist das Erwartungswert-Prinzip (expected value principle), das auch als Bayes-Regel bekannt ist.
Bei der Lösung eines Entscheidungsproblems nach dem Erwartungswert-Prinzip kann man gemischte Strategien ignorieren; bei der Anwendung des Maximin-Prinzips kann man das nicht tun, da eine gemischte Strategie ein höheres Sicherheitsniveau haben mag als irgendeine reine Strategie.
Das Maximin-Prinzip wird oft auch Minimax-Prinzip genannt: Stellen die Einträge in der Auszahlungsmatrix potentielle Verluste dar, so ist eine Konsequenz um so weniger wünschenswert, je größer der Eintrag ist. Hier muss es PA also um eine Minimierung der maximalen Verluste gehen. Beide Prinzipien sind jedoch äquivalent.
Das Erwartungswert- und das Maximin-Prinzip stellen neben dem Dominanzprinzip die wichtigsten Entscheidungsprinzipien dar. Weitere bekannte Entscheidungsprinzipien sind das Laplace-Prinzip und das MinimaxRegret-Prinzip.
<< vorhergehender Fachbegriff |
|
nächster Fachbegriff >> |
|
|
|
|