Content

9.4 Mehrstufige Entscheidungen bei Risiko in:

Günter Bamberg, Adolf Gerhard Coenenberg, Michael Krapp

Betriebswirtschaftliche Entscheidungslehre, page 254 - 261

15. Edition 2012, ISBN print: 978-3-8006-4518-3, ISBN online: 978-3-8006-4519-0, https://doi.org/10.15358/9783800645190_254

Series: Vahlens Kurzlehrbücher

Bibliographic information
9.4 Mehrstu ge Entscheidungen bei Risiko 245 z1 und a2 aus und lassen wir die für die Maximalstelle irrelevanten konstanten Summanden weg, so lautet die zu maximierende Funktion: 2 10 000 · a22 − 3 · (z1 + a2 − 2 250) + 1 10 000 · (10 500 − z1 − a2)2 . Analog zum zweiten Schri erkennt man, dass das Maximum am linken Rand des SteuerbereichsA2 liegenmuss. Demnach ist die Maximalstelle dieser Funktion durch a2(z1) = 4 500 − z1 und der Maximalwert durch 1 10 000 · 60002 + 2 10 000 · (4 500 − z1)2 − 3 · 2 250 gegeben. Im le ten Schri ist (wenn wir irrelevante Summanden wieder weglassen) a1 als Maximalstelle von 6 10 000 · a21 − 3 · (a1 − 1 500) + 2 10 000 · (7 500 − a1)2 zu bestimmen. Diesmal liegt das Randmaximum am rechten Rand des Steuerbereichs A1; deshalb ist schließlich a∗1 = 7 000 . Nun können wir durch die Vorwärtsrechnung alle Entscheidungen a∗1 , . . . , a∗4 der optimalen Politik sowie alle dabei zu durchlaufenden Zustände z∗1 , . . . , z∗4 explizit bestimmen: Durch schlichtes Einse en ergeben sich der Reihe nach z∗1 = z0 + a∗1 − b1 = 0 + 7 000 − 3 000 = 4 000 , a∗2 = a2(z∗1 ) = 4 500 − 4 000 = 500 , z∗2 = z∗1 + a∗2 − b2 = 4 000 + 500 − 4 500 = 0 , a∗3 = a3(z∗2 ) = 6 000 − 0 = 6 000 , z∗3 = z∗2 + a∗3 − b3 = 0 + 6 000 − 6 000 = 0 , a∗4 = 3 000 , z∗4 = 0 . Die optimale Lagerhaltungspolitik lautet demnach (a∗1 , a ∗ 2 , a ∗ 3 , a ∗ 4 ) = (7 000, 500, 6 000, 3 000) . Das heißt, es sind am 1. Januar 7 000 Stück, am 1. April 500 Stück, am 1. Juli 6 000 Stück und am 1. Oktober 3 000 Stück zu bestellen. 9.4 Mehrstu ge Entscheidungen bei Risiko Bisher ha en wir angenommen, dass in jeder Zeitperiode t sowohl der resultierende Endzustand zt als auch das resultierende Periodenergebnis ut eindeutig durch den Anfangszustand zt−1 und die getroffene Entscheidung at bestimmt sind. Diese Annahme trifft nicht für alle Anwendungsfälle zu. So gibt es Lager- 246 9. Mehrstu ge Entscheidungen haltungsprobleme, die durch eine stark streuende Nachfrage gekennzeichnet sind und bei denen aus Vergangenheitsdaten allenfalls die Wahrscheinlichkeitsverteilung der Nachfrage geschä t werden kann; infolgedessen unterliegt der Endzustand zt (und auch das Ergebnis ut) einer Wahrscheinlichkeitsverteilung. Ähnlich ist die Lage bei mehrstufigen Werbeentscheidungen; auch hier sind der resultierendeMark ustand zt und das resultierende Periodenergebnis ut durch zt−1 und at meist nicht eindeutig bestimmt. Weitere Beispiele liefern die Instandhaltungsprobleme. Die vielfältigen Entscheidungen, die bei der Instandhaltung eines Maschinenparks getroffen werden können,¹² sind ebenfalls von sequenzieller Natur; der resultierende Endzustand zt und das resultierende Periodenergebnis ut hängen von der (stochastischen) Lebensdauer der Maschinen bzw. der Maschinenteile, von der Wahrscheinlichkeitsverteilung der Reparaturdauer usw. ab. Sobald aber zt oder ut nicht eindeutig bestimmt sind, sondern einer (als bekannt vorausgese ten) Wahrscheinlichkeitsverteilung unterliegen, haben wir es mit Risikosituationen zu tun. Naturgemäß sind die Beschreibung und die Lösung der Entscheidungssituationen dann komplizierter als bei den in Abschni 9.3 betrachteten Sicherheitssituationen. Wir beschränken uns hier auf markoffsche Entscheidungsprozesse, bei denen in jeder Stufe nur endlich viele Zustände und endlich viele Entscheidungen möglich sind. Aber auch bei der Beschränkung auf diese relativ einfachen Fälle erfordert eine formelmäßige Präzisierung des Problems und des Lösungsweges einen Aufwand, der für unsere Zwecke zu groß ist; beispielsweise müssten Übergangswahrscheinlichkeiten eingeführt werden, die von der Stufennummer t, vom Anfangszustand zt−1, von der Entscheidung at und vom Endzustand zt abhängen. Wir wollen deshalb für die Erläuterungen auf die anschaulichere Baumdarstellung zurückgreifen und in erster Linie die Analogie zu dem in Abschni 9.3 besprochenen Lösungsweg herausarbeiten. 9.4.1 Entscheidungsbaumanalyse bei Risikoneutralität Abbildung 9.7 zeigt den Entscheidungsbaum eines markoffschen Entscheidungsprozesses. Man sieht, dass zwei Zustände zt−1 und zt nicht wie bei der Sicherheitssituation jeweils durch eine einzige Kante (vgl. Abbildung 9.2), sondern vielmehr durch zwei Kanten verbunden sind; die erste Kante entspricht der getroffenen Entscheidung at, die zweite Kante entspricht dem zufallsbedingten Übergang zum Zustand zt. An der le teren Kante wurde in Abbildung 9.7 die Übergangswahrscheinlichkeit notiert. Für die Zwecke der Rückwärtsrechnung müssen wir an dieser Kante zusä lich noch das Periodenergebnis ut notieren. Wir tragen deshalb jeweils oberhalb der Kante die Übergangswahrscheinlichkeit und unterhalb der Kante das Periodenergebnis ein. ¹² Wie beispielsweise Überholung einer Maschine erst nach einem Defekt, Überholung einer Maschine nach zehn Zeitperioden, präventive Überholung nach jeder Zeitperiode usw. 9.4 Mehrstu ge Entscheidungen bei Risiko 247 Beispielsweise kann aus Abbildung 9.7 abgelesen werden, dass infolge der Entscheidung a1 mit der Wahrscheinlichkeit 0,3 ein Übergang vom Zustand z0 in den Zustand z1 erfolgt und dass damit ein Periodenergebnis von u1 = 180 verknüpft ist. Weiterhin liest man ab, dass mit der Wahrscheinlichkeit 0,7 auch ein Übergang in den Zustand z′1 möglich ist und dass das Periodenergebnis dann nur 140 beträgt. Hierbei wurde also einerseits angenommen, dass die Übergänge (von z0 nach z1 bzw. von z0 nach z′1) stochastisch sind und mit den Wahrscheinlichkeiten 0,3 bzw. 0,7 erfolgen, dass aber andererseits mit jedem der Übergänge ein eindeutig bestimmtes Periodenergebnis von 180 bzw. 140 verknüpft ist. Im allgemeinen Fall kann auch das mit einem festen Übergang verknüpfte Periodenergebnis stochastisch sein. z0 a1 z1 z 1 0,3 0,7 180 140 Abb. 9.7: Beschriftung des Entscheidungsbaumes eines markoffschen Entscheidungsprozesses Aus zweierlei Gründen können wir uns aber auf eindeutig bestimmte Periodenergebnisse beschränken. Erstens suchen wir nur Politiken, deren zu erwartendes Gesamtergebnis maximal ist; in die Berechnungen gehen deshalb nur die Erwartungswerte der Periodenergebnisse ein. Diese Erwartungswerte sind aber eindeutig bestimmte Zahlen, die unterhalb der jeweiligen Kante notiert werden können. Zweitens ist es, wie in Abschni 2.4 ausgeführt, durch die Einführung zusä licher Knoten und Kanten möglich, ein eindeutig bestimmtes Periodenergebnis zu erreichen. Wäre beispielsweise in Abbildung 9.7 mit dem Übergang z0 → z′1 nicht das eindeutig bestimmte Ergebnis von 140, sondern ein stochastisches Ergebnis verknüpft, das jeweils mit derWahrscheinlichkeit 12 die Werte 120 und 160 annimmt, so könnten wir durch die Aufspaltung des Zustands z′1 in die beiden Zustände z′1 und z′′1 ein eindeutig bestimmtes Ergebnis erreichen (vgl. Abbildung 9.8). Wie eben erwähnt, tri bei Risikosituationen an die Stelle der in Abschni 9.3 angestrebten Maximierung der Summe u1 + u2 + · · · + uT der Periodenergebnisse die Maximierung des Erwartungswertes E ( T∑ t=1 ut ) der summierten Periodenergebnisse. Der Begriff der optimalen Politik muss ebenfalls gegenüber dem des Abschni s 9.3 modifiziert werden. Nur bei deterministischen Übergängen ist gewährleistet, dass eine vorgegebene (zulässige) Entscheidungsfolge (a1, a2, . . . , aT) auch mit Sicherheit realisiert werden kann; 248 9. Mehrstu ge Entscheidungen z0 a1 z1 z 1 z 1 0,35 160 0,3 0,35 180 120 Abb. 9.8: Reduzierung auf eindeutig bestimmte Periodenergebnisse deshalb ist es auch nur hierbei sinnvoll, nach einer Politik (a∗1 , . . . , a∗T) zu fragen, die die Summe u1 + u2 + · · · + uT bzw. (bei stochastischen Periodenergebnissen) den Erwartungswert E(u1 + u2 + · · · + uT) maximiert. Bei stochastischen Übergängen ist die Wahrscheinlichkeit gering, dass eine vorgegebene Folge (a∗1 , a∗2 , . . . , a∗T) von Entscheidungen realisiert werden kann. Nehmen wir als Beispiel wieder ein Lagerhaltungsproblem: Nachdem der Entscheidungsträger die Aktion a∗1 ergriffen hat (das heißt eine bestimmte Stückzahl bestellt hat), ist der Zufall am Zuge und führt einen Zustand (das heißt einen Lagerbestand) z∗1 herbei. Möglicherweise lässt der realisierte Zustand z∗1 die eingeplante Entscheidung a∗2 gar nicht zu, etwa dann, wenn a∗2 wegen günstiger Konditionen die Bestellung einer großen Stückzahl vorsieht, der Lagerbestand z∗1 aber wegen einer schwachen Nachfrage in der ersten Zeitperiode noch so groß ist, dass z∗1 + a∗2 die Lagerkapazität überschreitet. Das Entsprechende gilt auch für die restlichen Entscheidungen a∗3 , a∗4 , . . . , a∗T. Bei stochastischen Übergängen darf eine Politik demnach nicht als eine starre Folge von Entscheidungen eingeführt werden. Damit die erforderliche Flexibilität gewährleistet ist, muss eine Politik vielmehr (wie in Abschni 7.2) als eine Folge (δ1, δ2, . . . , δT) von bedingten Anweisungen eingeführt werden. Die bedingte Anweisung δt ordnet jedem möglichen Zustand zt−1 eine der zugelassenen Entscheidungen zu: δt(zt−1) = at ∈ At . Eine optimale Politik (δ∗1 , δ∗2 , . . . , δ∗T) ist daher eine Folge von bedingten Anweisungen, die den Erwartungswert E ( T∑ t=1 ut(zt−1, δt ( zt−1) )) maximiert. Die Ermi lung einer optimalen Politik geschieht wieder mit dem Roll-Back-Verfahren; die einzige Änderung gegenüber Abschni 9.3 besteht darin, dass bei jedem Schri an Stelle eines Ergebnisses ein Ergebniserwartungswert zu maximieren ist. 9.4 Mehrstu ge Entscheidungen bei Risiko 249 zT 1 162 162 zT z TaT a T a T 152 110 0,3 0,7 0,5 0,5 0,6 0,4 180 140 140 80 170 150 Abb. 9.9: Erster Schri der Rückwärtsrechnung Abbildung 9.9 erläutert den ersten Schri der Rückwärtsrechnung. Der speziell betrachtete Zustand zT−1 lässt die drei Entscheidungen aT, a′T und a′′T zu. Für jede dieser Entscheidungen ist das zu erwartende Periodenergebnis zu berechnen; der Erwartungswert ist unterhalb der Kante notiert. Das Maximum der drei Erwartungswerte wird für die Zwecke des nächsten Schri es am Knoten zT−1 notiert; das Maximum ist das Ergebnis, das im Falle der günstigsten Entscheidung (in unserem Falle a′′T ) zu erwarten ist. Damit haben wir einen speziellen Funktionswert der bedingten Anweisung δ∗T einer optimalen Politik (δ∗1 , δ ∗ 2 , . . . , δ ∗ T) berechnet; es ist nämlich δ∗T(zT−1) = a ′′ T . Führt man diesen Schri auch für die restlichen Zustände z′T−1, z′′T−1, . . . aus, so ist δ∗T völlig berechnet. Der nächste Schri verläuft entsprechend und sei durch Abbildung 9.10 erläutert. Hier wurde ein spezieller Zustand zT−2 betrachtet, der die beiden Entscheidungen aT−1 und a′T−1 zulässt; diese führen zu den vier Zuständen zT−1, z′T−1, z′′T−1, z′′′T−1, an denen die im ersten Schri berechneten maximalen Erwartungswerte notiert sind. Addiert man diese maximalen Erwartungswerte zu dem Stufenergebnis und bildetman hierauswiederumden Erwartungswert, so kommt man zu den in Abbildung 9.10 eingetragenen Zahlen. Damit ist ein Funktionswert von δ∗T−1 berechnet, nämlich δ∗T−1(zT−2) = a ′ T−1 . Diese Rechnungmuss dann für alle restlichen Anfangszustände z′T−2, z′′T−2, . . . der (T − 1)-ten Zeitperiode durchgeführt werden. Danach berechnet man in den weiteren Schri en sukzessive δ∗T−2, δ∗T−3, . . . , δ∗2 , δ∗1 . 250 9. Mehrstu ge Entscheidungen zT 2 285 285 zT 1 z T 1 z T 1 z T 1 aT 1 a T 1 200 200 0,5 0,5 0,7 0,3 50 50 100 100 150 162 138 Abb. 9.10: Zweiter Schri der Rückwärtsrechnung In Abschni 9.3 ha en wir der Rückwärtsrechnung eine Vorwärtsrechnung angefügt. Le tere diente dazu, aus den in der Rückwärtsrechnung ermi elten bedingten Anweisungen den tatsächlichen Prozessverlauf und die optimalen Entscheidungen (also die unbedingten Anweisungen) a∗1 , a∗2 , . . . , a∗T zu berechnen. Infolge der stochastischen Übergänge ist eine Politik (δ1, δ2, . . . , δT) mit vielen potenziell möglichen Prozessverläufen verträglich; der tatsächlich realisierte Verlauf ist durch eine Politik, also auch durch eine optimale Politik (δ∗1 , . . . , δ ∗ T), nicht determiniert. Deshalb erübrigt sich bei der Einbeziehung von stochastischen Übergängen eine Vorwärtsrechnung. In der Praxis kommt es gelegentlich vor, z. B. bei der Vermögensendwertmaximierung, dass zwar dem gesamten Prozessverlauf, nicht aber den einzelnen Zeitperioden, ein Ergebnis zugeordnet werden kann. Aber auch bei primär gegebenen Periodenergebnissen ist es (durch Addition und ggf. Aufzinsung) problemlos möglich, dem jeweiligen Prozessverlauf ein Ergebnis zuzuordnen. Notiert man das jeweilige Ergebnis an den (den Prozessverläufen entsprechenden) Baumenden und se t man die (evtl. primär gegebenen) Periodenergebnisse auf null, so ist ein gleichwertiger Entscheidungsbaum entstanden. Die Baumendenmüssen natürlich wie jeder andere Knoten behandelt werden.Man spricht dann von einem Entscheidungsbaum mit Endbewertung bzw. von einer Optimierung im Endpunkt. Ein Beispiel ist uns bereits im Rahmen von Aufgabe 6.7 begegnet; dabei war sogar ein risikoaverser Entscheidungsträger involviert. Ein weiteres Beispiel (diesmal mit Risikoneutralität) ist in Aufgabe 9.3 zu finden. Bei einem Entscheidungsbaum mit Endbewertung lässt sich das Rezept zur Durchführung des Roll-Back-Verfahrens besonders einfach formulieren: Ausgehend von den Baumenden (an denen noch keine Rechen- oder Vergleichoperation erforderlich ist) wird an jedem Ereignisknoten der Erwartungswert 9.4 Mehrstu ge Entscheidungen bei Risiko 251 berechnet und an jedem Entscheidungsknoten das Maximum der unmi elbar nachfolgenden Erwartungswerte festgestellt. DieserMaximalwertwird amEntscheidungsknoten notiert. Der sich im Zuge der Rückwärtsrechnung an der Baumwurzel ergebende Wert ist der Ergebniserwartungswert einer optimalen Politik. Um diese (bzw. eine) optimale Politik selbst zu bestimmen, muss man jeweils noch registriert haben, welche Periodenentscheidung (bzw. grafentheoretisch: welcher Pfeil oder welche Kante) das Maximum lieferte, denn diese Periodenentscheidung schreibt die optimale Politik vor. Eine optimale Politik besteht demnach aus einer unbedingten Anweisung (an der Baumwurzel), gefolgt von einer Reihe von bedingten Anweisungen: Wenn ein bestimmter Entscheidungsknoten beim realisierten Prozessverlauf passiert wird, so ist diejenige Entscheidung, die bei diesem Knoten das Maximum geliefert hat, zu treffen. 9.4.2 Entscheidungsbaumanalyse bei beliebiger Risikonutzenfunktion Wegen der Nichtlinearität der Risikonu enfunktion ist es nicht möglich, in den einzelnen Schri en der Rückwärtsrechnung die Periodenergebnisse (oder ihre entsprechenden Nu enwerte) additiv zu berücksichtigen. Deshalb muss zunächst ein Entscheidungsbaum mit Endbewertung hergestellt werden. Die an den Baumenden vermerkten Ergebnisse (des jeweiligen Prozessverlaufs) müssen anschließend durch Einse en in die gegebene Risikonu enfunktion in Nu enwerte umgerechnet werden. Auf dem so erhaltenen Entscheidungsbaum wird obiges Rezept angewandt. Als Beispiel sei wiederum auf Aufgabe 6.7 verwiesen. Man kann sich natürlich fragen, ob dieses Rezept nur beim Bernoulli-Prinzip funktioniert. Orientiert man sich nicht am Erwartungswert oder Nu enerwartungswert, sondern sta dessen am Modalwert, so lassen sich Beispiele konstruieren, bei denen das (sinngemäß übertragene) Rezept keine optimale Politik liefert. Das heißt, das Roll-Back-Verfahren ist nicht bei beliebigen Entscheidungskriterien verwendbar. Es lässt sich allgemein zeigen (vgl. La Valle/ Wapman, 1986), dass das Roll-Back-Verfahren bei allen Entscheidungskriterien, die das (für das Bernoulli-Prinzip gültige) Substitutionsaxiom verle en, nicht mehr anwendbar ist. Auch imRahmen des Bernoulli-Prinzips ist die oben angesprochene Endbewertung problematisch.Wird sie finanzmathematisch durch Aufzinsung der jeweiligen Ein- und Auszahlungen erzeugt, so kann es zu einer Zeitinkonsistenz kommen. Das heißt, es wird in späteren Entscheidungszeitpunkten anders entschieden, als es zu Beginn des Entscheidungsprozessses vorgesehen war. Ursächlich hierfür sind die Einstufung früherer Ein- und Auszahlungen als irreversibel (vgl. sunk costs) und die daraus resultierenden neuen Endbewertungen. 252 9. Mehrstu ge Entscheidungen 9.5 Aufgaben Die nachfolgenden vier Aufgaben dienen der Einübung der in Kapitel 9 behandelten Konzepte. Lösungen zu diesen Aufgaben findet der interessierte Leser im Anhang ab Seite 279. Weitere Übungsaufgaben, darunter 16 zu mehrstufigen Entscheidungen, inklusive ausführlicher Lösungen können beispielsweise Bamberg et al. (2012a) entnommen werden. . Aufgabe 9.1 In dem Lagerhaltungsbeispiel aus Abschni 9.3 wurden die Lagerkosten mit 3 Euro pro Stück und Quartal angese t. Welches ist die optimale Lagerhaltungspolitik, wenn die Lagerkosten 6 Euro pro Stück und Quartal betragen und alle übrigen Annahmen unverändert gelten? . Aufgabe 9.2 Eine risikoneutrale Firma stellt elektronische Bausteine her.¹³ Sie hat vier halbautomatische Montageanlagen in Betrieb, die mit der Produktion völlig ausgelastet sind. Deshalb stellt sich die Frage, ob eine weitere Anlage angeschafft oder Überstundenarbeit eingeführt werden soll. In der nächsten Zeitperiode stehen dann (je nach Absa lage und Anfangsentscheidung) die in der nachfolgenden Abbildung eingetragenen Folgeentscheidungen zur Deba e. Die von Vertriebsleiter und Finanzdirektor gemeinsam erarbeiteten Schä ungen der Übergangswahrscheinlichkeiten sind ebenfalls im Entscheidungsbaum eingetragen; im ersten Jahr wird sowohl eine Absa steigerung wie eine Absa verringerung für möglich gehalten, im zweiten Jahr kommt nach den Schä ungen nur eine Absa steigerung (um 10% bzw. 20%) in Betracht. Die Ergebnisse sind nicht den einzelnen Zeitperioden, sondern dem jeweiligen Prozessverlauf zugerechnet worden (Eintragungen an den Baumenden). Welches ist die optimale Politik? ¹³ Diese Aufgabe stammt ebenfalls (wie Aufgabe 9.2) aus der Fülle der in der Literatur benu ten Demonstrationsbeispiele für die Konstruktion eines Entscheidungsbaumes (vgl. McCreary, 1967).

Chapter Preview

References

Zusammenfassung

Vorteile

- Ein Lehr- und Lernbuch für einen einführenden Kurs in die Entscheidungstheorie

- Mit zahlreichen Aufgaben und Lösungen

Zum Werk

In Unternehmen werden und müssen Entscheidungen getroffen werden, deren Auswirkungen zum Teil große Konsequenzen auf die eigene Geschäftstätigkeit haben können.

Dieses Lehrbuch führt den Leser in die Entscheidungstheorie ein und stellt Entscheidungen bei Sicherheit, Risiko und Unsicherheit ausführlich dar. Es erläutert die Grundbegriffe der Spieltheorie ebenso wie die der dynamischen Programmierung.

Autoren

Prof. em. Dr. Dr. h.c. Günter Bamberg war Inhaber des Lehrstuhls für Statistik an der Universität Augsburg.

Prof. em. Dr. Dres. h.c. Adolf G. Coenenberg war Inhaber des Lehrstuhls für Betriebswirtschaftslehre, insbesondere Wirtschaftsprüfung und Controlling, an der Universität Augsburg.

Prof. Dr. Michael Krapp ist Extraordinarius für Quantitative Methoden an der Universität Augsburg.

Zielgruppe

Studierende der Wirtschaftswissenschaften an Universitäten, Fachhochschulen und Berufsakademien.