Content

9.3 Mehrstufige Entscheidungen bei Sicherheit in:

Günter Bamberg, Adolf Gerhard Coenenberg, Michael Krapp

Betriebswirtschaftliche Entscheidungslehre, page 247 - 254

15. Edition 2012, ISBN print: 978-3-8006-4518-3, ISBN online: 978-3-8006-4519-0, https://doi.org/10.15358/9783800645190_247

Series: Vahlens Kurzlehrbücher

Bibliographic information
238 9. Mehrstu ge Entscheidungen der Stufenergebnisse ut bzw. auf der Maximierung des langfristigen Durchschni sergebnisses⁴ lim T→∞ 1 T T∑ t=1 ut . Wirwollen uns hier auf Prozessemit endlichem Planungshorizont beschränken und verweisen den an Prozessen mit unendlichem Planungshorizont interessierten Leser auf die einschlägige Literatur.⁵ b) Je nach der Größe der Zeitperioden unterscheidet man die bisher ausschließlich betrachteten Entscheidungsprozesse mit diskreten Stufen und die Entscheidungsprozesse mit einem Kontinuum von Stufen. Im le teren Fall ist t ein kontinuierlich variierender Parameter; jede Stufe ist „infinitesimal klein“. Solche Entscheidungsprozesse kommen vorwiegend in technischen Anwendungen vor. Die Transformation der Zustände wird in der Regel durch Differenzialgleichungen beschrieben; bei der Zielfunktion tri an die Stelle der Summe ein Integral. Entscheidungsprozesse mit einem Kontinuum von Stufen führen in das Gebiet der Variationsrechnung und der Kontrolltheorie; eine umfassende Darstellung (mit ökonomischen Beispielen) ist in Feichtinger/Hartl (1986) und Kosmol (2010) zu finden. c) Auch bei mehrstufigen Entscheidungsprozessen lässt sich eine Unterscheidung bezüglich einfacher und mehrfacher Zielse ung vornehmen. Es versteht sich von selbst, dass wir uns auf den elementarsten Fall, nämlich den der einfachen Zielse ung, beschränken müssen. Exemplarisch für die vielfältigen Problemstellungen des dynamischen Programmierens werden wir in Abschni 9.3 mehrstufige Entscheidungen bei Sicherheit (einfacher Zielse ung, diskreten Stufen und endlichem Planungshorizont) behandeln sowie in Abschni 9.4 mehrstufige Entscheidungen bei Risiko (und ebenfalls wieder einfacher Zielse ung, diskreten Stufen und endlichem Planungshorizont). 9.3 Mehrstu ge Entscheidungen bei Sicherheit Wir greifen das Maximierungsproblem des vorangehenden Abschni s wieder auf. Zunächst wird das Optimalitätsprinzip von R. E. Bellman erläutert; anschließend wird das Optimalitätsprinzip auf ein Lagerhaltungsproblem angewandt. ⁴ Da die Folge 1T (u1 + u2 + · · · + uT) im Allgemeinen mehrere Häufungspunkte besi t, muss streng genommen an Stelle dieses Limes (der im Allgemeinen nicht existiert) der Limes inferior genommen werden. ⁵ Bellman (2003); Beckmann (1968); Schneeweiß (1974); Neumann/Morlock (2002). 9.3 Mehrstu ge Entscheidungen bei Sicherheit 239 9.3.1 Das Optimalitätsprinzip Bellman (2003, S. 83) drückt das nach ihm benannte Optimalitätsprinzip etwa folgendermaßen aus: Eine optimale Politik (a∗1 , a∗2 , . . . , a∗T) eines T-stufigen Entscheidungsprozesses besi t die Eigenschaft, dass unabhängig vom Anfangszustand z0 und der ersten Entscheidung a∗1 die restlichen T − 1 Entscheidungen (a∗2 , a∗3 , . . . , a∗T) eine optimale Politik bezüglich des aus der ersten Entscheidung resultierenden Zustands bilden. Das Optimalitätsprinzip ermöglicht die Zurückführung der Lösung des T-stufigen Entscheidungsproblems auf die Lösung eines einstufigen Entscheidungsproblems (Bestimmung von a∗1 ) und die Lösung einer Schar⁶ von (T − 1)stufigen Entscheidungsproblemen. Durch Anwendung des Optimalitätsprinzips kann die Lösung der (T − 1)-stufigen Entscheidungsprobleme ihrerseits auf die Lösung eines einstufigen Entscheidungsproblems und die Lösung einer Schar von (T − 2)-stufigen Entscheidungsproblemen zurückgeführt werden. Fährt man in dieser Weise fort, so kann man die Lösung des T-stufigen Entscheidungsproblems völlig auf die Lösung von einstufigen Entscheidungsproblemen zurückführen. Üblicherweise beginnt man bei der Lösung dieser einstufigen Entscheidungsprobleme mit der le ten Stufe und arbeitet sich dann in einer so genannten Rückwärtsrechnung Stufe um Stufe bis zur ersten Stufe vor. Diese Rückwärtsrechnung, die auch Roll-Back-Verfahren genannt wird, verläuft nach dem folgenden Schema: Im ersten Schri wird die Entscheidung aT so (in Abhängigkeit vom Zustand zT−1) aus AT ausgewählt, dass das Stufenergebnis uT(zT−1, aT) maximiert wird⁷. DieseMaximalstelle (bzw., falls mehrereMaximalstellen existieren, eine willkürlich ausgewählte) bezeichnen wir mit aT(zT−1) . Das vom Zustand zT−1 aus in der T-ten Stufe maximal erzielbare Ergebnis beträgt demnach uT(zT−1, aT(zT−1)) . Im zweiten Schri wird die Entscheidung aT−1 so (in Abhängigkeit vom Zustand zT−2) aus AT−1 ausgewählt, dass die Summe aus dem Stufenergebnis uT−1 und des im Falle der (von zT−1 aus) optimalen Fortführung des Prozesses erzielbaren Ergebnisses, also die Summe uT−1(zT−2, aT−1) + uT(zT−1, aT(zT−1)) ⁶ Jeder Zustand z1, der aus der (noch unbekannten) ersten Entscheidung a∗1 resultieren kann (das sind in der Regel alle überhaupt möglichen Zustände z1), liefert ein (T − 1)stufiges Entscheidungsproblem. ⁷ Fallen am Planungshorizont T Veräußerungsgewinne, Entsorgungskosten oder dergleichen an, so sind diese in uT zu berücksichtigen. 240 9. Mehrstu ge Entscheidungen maximal wird; dabei ist in dem rechten Summanden der Zustand zT−1 gemäß der Transformation zT−1 = gT−1(zT−2, aT−1) durch zT−2 und aT−1 auszudrücken. Die Maximalstelle (bzw. eine ausgewählte der Maximalstellen) bezeichnen wir mit aT−1(zT−2) . Im dri en Schri wird analog die Entscheidung aT−2 so (in Abhängigkeit von zT−3) ausgewählt, dass die Summe aus dem Stufenergebnis uT−2 und dem Ergebnis, das im Falle der optimalen Fortführung des Prozesses erzielt werden kann, maximal wird; damit kennen wir auch aT−2(zT−3) . Entsprechend verlaufen die weiteren Schri e. So wird im vorle ten Schri a2(z1) und im le ten Schri schließlich a1(z0) ermi elt. Damit sind – allerdings nicht explizit, sondern noch in Abhängigkeit vom jeweiligen Anfangszustand – alle Entscheidungen einer optimalen Politik bestimmt. Die expliziten Entscheidungen ermi elt man in einer Vorwärtsrechnung, die nur aus Einse en besteht. Sie verläuft nach folgendem Schema: Der Zustand z0 ist annahmegemäß bekannt; wird der bekannte Wert z0 in a1(z0) eingese t, so ergibt sich die Startentscheidung a∗1 einer optimalen Politik: a∗1 = a1(z0) . Der durch diese Entscheidung realisierte Zustand z∗1 ist z∗1 = g1(z0, a ∗ 1 ) . Aus diesem Zustand ergibt sich die zweite Entscheidung a∗2 einer optimalen Politik gemäß a∗2 = a2(z ∗ 1 ) . Entsprechend wird nun z∗2 = g2(z ∗ 1 , a ∗ 2 ) und a∗3 = a3(z ∗ 2 ) ermi elt usw. Den schematischen Ablauf dieser Rechnungen kann man sich anhand eines Entscheidungsbaumes verdeutlichen. Abbildung 9.4 zeigt den Entscheidungsbaum⁸ eines einfachen 3-stufigen Entscheidungsproblems. Die Zahlen an den Kanten geben das jeweilige Stufenergebnis an. Es ist nicht schwer, die oben geschilderten Rückwärts- und Vorwärtsrechnungen daran nachzuvollziehen. Bei der Rückwärtsrechnung empfiehlt es sich, das Ergebnis, das im Falle der optimalen Fortführung zu erzielen ist, jeweils an den Knoten zu notieren (dies ⁸ Dass dies keinen „Baum“ im grafentheoretischen Sinne darstellt, ist für unsere Zwecke belanglos; durch geeignete Definition der Zustände kann die Baumeigenschaft übrigens stets erreicht werden. 9.3 Mehrstu ge Entscheidungen bei Sicherheit 241 6 4 8 8 8 11 1111 10 40 34 30 33 20 20 20 12 14 9 17 13 13 Abb. 9.4: Entscheidungsbaum und optimale Politik eines 3-stufigen Entscheidungsproblems ist auch in Abbildung 9.4 geschehen). Der dick eingezeichnete Weg entspricht einer optimalen Politik; der damit realisierte Maximalwert der Zielfunktion ist 40. Dem Leser, der etwas mit der Ne plantechnik vertraut ist, wird dies sehr bekannt vorkommen. In der Tat bestehen enge Parallelen: Deutet man den Entscheidungsbaum als Ne plan eines Projekts und die Stufenergebnisse als Vorgangsdauern, so entspricht der längste, also kritische Weg, gerade einer optimalen Politik; der frühestmögliche Projektabschluss entspricht demmaximalen Gesamtergebnis. 9.3.2 Ein Beispiel aus der Lagerhaltung Ein Kau aus bestellt einen bestimmten Artikel jeweils zu Beginn eines Quartals, das heißt am 1. Januar, 1. April, 1. Juli und am 1. Oktober. Wir bezeichnen die zu Beginn des t-ten Quartals bestellte Stückzahl mit at und den Quartalsbedarf (in Stück) mit bt (t = 1, . . . , 4). Die Bedarfsmenge bt ist saisonabhängig und verteilt sich gleichmäßig innerhalb des jeweiligen Quartals: t 1 2 3 4 bt 3 000 4 500 6 000 3 000 Das Kau aus will Fehlmengen unter allen Umständen vermeiden, das heißt, es will die bestellten Stückzahlen a1, . . . , a4 so groß wählen, dass der Bedarf jederzeit befriedigt werden kann. Die Lagerkapazität betrage 7 000 Stück, die Lagerkosten betragen 3 Euro pro Stück und Quartal; die Lieferfrist sei vernachlässigbar klein. Der Lieferant ist bestrebt, seine Produktion möglichst gut zu glä en und räumt deshalb saisonabhängige Raba e ein. Die Raba funktion rt(x) besi e die Form⁹ rt(x) = { βt · x10 000 , für 0 ≦ x ≦ 10 000 βt, für x > 10 000 . ⁹ Um bei der Rechnung lästige Fallunterscheidungen zu vermeiden, wird die Raba funktion als stetig, und nicht wie meist in der Praxis treppenförmig, angenommen. 242 9. Mehrstu ge Entscheidungen rt(x) ist der im Quartal t bei Bestellung von x Stück eingeräumte Raba (in Euro pro Stück). Es gelte: β1 = 6, β2 = 2, β3 = 1 und β4 = 4 . Zu Beginn des betrachteten Jahres sei das Lager leer, zum Jahresende soll es ebenfalls wieder leer sein. Welches ist unter diesen Umständen die optimale Lagerhaltungspolitik (a∗1 , a∗2 , a∗3 , a∗4 )? Zuerst wollen wir uns überlegen, wie die in Abschni 9.2 allgemein eingeführten Begriffe (Zustände zt, Transformationsfunktionen gt, Steuerbereiche At, Periodenergebnisse ut, Zielfunktion U) in diesem speziellen Beispiel aussehen. Damit die Begriffe vertrauter werden, ist dieser Teil bewusst etwas ausführlicher gehalten als es für die Rechnung erforderlich wäre. Der Zustand zt−1 ist der zu Beginn der Zeitperiode t vorhandene Lagerbestand. Es ist z0 = 0 , zt = zt−1 + at − bt für t = 1, 2, 3 und z4 = z3 + a4 − b4 = 0 . Damit sind die Transformationsfunktionen gt bekannt. Auch die Steuerbereiche At sind leicht anzugeben. Auf Grund der Kapazitätsrestriktion muss für alle Quartale zt−1 + at ≦ 7 000, also at ≦ 7 000 − zt−1 gelten. Da außerdem der Bedarf gedeckt werden soll, muss auch zt−1 + at ≧ bt, also at ≧ bt − zt−1 gelten. Damit ist für t = 1, 2, 3 der Steuerbereich At(zt−1) das Intervall [bt − zt−1; 7 000 − zt−1] . Eine Ausnahme bildet A4; da das Lager am Jahresende leer sein soll, besteht A4 nur aus einer einzigen Entscheidung, nämlich a4 = b4 − z3 = 3 000 − z3 . Abbildung 9.5 veranschaulicht die Situation grafisch. Nun müssen wir uns noch mit dem Periodenergebnis ut bzw. mit der Zielfunktion U beschäftigen. Für die Zielfunktion U sind nur diejenigen Konsequenzen relevant, die durch die Lagerhaltungspolitik (a1, a2, a3, a4) beeinflussbar sind. Auf Grund der Nebenbedingungen (Lagerkapazität und Bedarf) muss in jeder Zeitperiode eine Bestellung getätigt werden, so dass wir die Bestellkosten (die auch gar nicht angegeben wurden) außer Acht lassen können. Auch Fehlmengenkosten können vernachlässigt werden, da Fehlmengen ausgeschlossen werden. Schließlich können auch die (Bru o-)Verkaufsgewinne unberücksichtigt bleiben, da – unabhängig von der Lagerhaltungspolitik – im Jahr genau 16 500 Stück verkauft werden. Es bleiben die Lagerkosten und die eingesparten Raba e übrig. Da wir maximieren wollen, müssen wir die eingesparten 9.3 Mehrstu ge Entscheidungen bei Sicherheit 243 kumulierter Lagerzugang kumulierter Bedarf a1 a2 z1 b1 a3 z2 b2 a4 z3 b3 t 0 1 2 3 4 5 000 10 000 15 000 Abb. 9.5: Kurve des kumulierten Bedarfs und des kumulierten Lagerzugangs Raba e, vermindert um die Lagerkosten, als Periodenergebnis betrachten: ut(zt−1, at) = atrt(at) − ℓt(zt−1, at) ; dabei sind ℓt die in der Periode t anfallenden Lagerkosten. Zur Berechnung von ℓt müssen wir uns überlegen, dass der Lagerbestand zu Beginn der Periode t zt−1 + at und zu Ende der Periode t zt−1 + at − bt beträgt. Da der durchschni liche Lagerbestand der Periode t also zt−1 + at − 12bt ist, betragen die Lagerkosten für die Periode t gerade ℓt(zt−1, at) = 3 · ( zt−1 + at − 12bt ) . Se en wir noch die gegebene Raba funktion rt ein, so ergibt sich für das Periodenergebnis ut(zt−1, at) = βt · a2t 10 000 − 3 · ( zt−1 + at − 12bt ) . Die Zielfunktion U sei wie bisher die Summe der Periodenergebnisse:¹⁰ U = 4∑ t=1 ut(zt−1, at) . ¹⁰ Der prinzipielle Verlauf des Rechengangs bliebe unverändert, wenn noch eine Diskontierung eingeführt, also ut durch utλt−1 erse t würde. 244 9. Mehrstu ge Entscheidungen Beginnen wir nunmit der Rückwärtsrechnung. Der erste Schri ist noch trivial: Da A4 einelementig ist, muss a4(z3) = 3 000 − z3 gelten. Mit dieser Entscheidung entsteht für die vierte Periode ein Ergebnis von 4 10 000 · (3 000 − z3)2 − 3 · 1 500 . Im zweiten Schri muss hierzu das Ergebnis der dri en Periode addiert und a3(z2) als Maximalstelle dieser Summe berechnet werden. Drückt man z3 durch z2 und a3 aus, so lautet die zu maximierende Funktion: 1 10 000 · a23 − 3 · (z2 + a3 − 3 000) + 4 10 000 · (9 000 − z2 − a3)2 − 4 500 . Dies ist eine konvexe Parabel, so dass nur ein Randmaximum infrage kommt. Durch Ableiten und Nullse en erkennt man,¹¹ dass das (globale) Minimum dieser Parabel rechts vom Steuerbereich A3 liegt (vgl. Abbildung 9.6). 6 000 z2 7 000 z2 a3 A3 Abb. 9.6: Steuerbereich A3 und zu maximierende Funktion Demnach liegt das Maximum am linken Rand von A3, und die Maximalstelle ist a3(z2) = 6 000 − z2 ; der Maximalwert beträgt 1 10 000 · (6 000 − z2)2 − 3 · 3 000 + 4 10 000 · 3 0002 − 4 500 . Im dri en Schri muss hierzu das Ergebnis der zweiten Periode addiert und a2(z1) als Maximalstelle der Summe bestimmt werden. Drücken wir z2 durch ¹¹ Die Nullstelle der Ableitung ist a3 = 10 200 − 0,8 · z2; sie ist damit größer als der rechte Randpunkt (= 7 000 − z2) von A3. 9.4 Mehrstu ge Entscheidungen bei Risiko 245 z1 und a2 aus und lassen wir die für die Maximalstelle irrelevanten konstanten Summanden weg, so lautet die zu maximierende Funktion: 2 10 000 · a22 − 3 · (z1 + a2 − 2 250) + 1 10 000 · (10 500 − z1 − a2)2 . Analog zum zweiten Schri erkennt man, dass das Maximum am linken Rand des SteuerbereichsA2 liegenmuss. Demnach ist die Maximalstelle dieser Funktion durch a2(z1) = 4 500 − z1 und der Maximalwert durch 1 10 000 · 60002 + 2 10 000 · (4 500 − z1)2 − 3 · 2 250 gegeben. Im le ten Schri ist (wenn wir irrelevante Summanden wieder weglassen) a1 als Maximalstelle von 6 10 000 · a21 − 3 · (a1 − 1 500) + 2 10 000 · (7 500 − a1)2 zu bestimmen. Diesmal liegt das Randmaximum am rechten Rand des Steuerbereichs A1; deshalb ist schließlich a∗1 = 7 000 . Nun können wir durch die Vorwärtsrechnung alle Entscheidungen a∗1 , . . . , a∗4 der optimalen Politik sowie alle dabei zu durchlaufenden Zustände z∗1 , . . . , z∗4 explizit bestimmen: Durch schlichtes Einse en ergeben sich der Reihe nach z∗1 = z0 + a∗1 − b1 = 0 + 7 000 − 3 000 = 4 000 , a∗2 = a2(z∗1 ) = 4 500 − 4 000 = 500 , z∗2 = z∗1 + a∗2 − b2 = 4 000 + 500 − 4 500 = 0 , a∗3 = a3(z∗2 ) = 6 000 − 0 = 6 000 , z∗3 = z∗2 + a∗3 − b3 = 0 + 6 000 − 6 000 = 0 , a∗4 = 3 000 , z∗4 = 0 . Die optimale Lagerhaltungspolitik lautet demnach (a∗1 , a ∗ 2 , a ∗ 3 , a ∗ 4 ) = (7 000, 500, 6 000, 3 000) . Das heißt, es sind am 1. Januar 7 000 Stück, am 1. April 500 Stück, am 1. Juli 6 000 Stück und am 1. Oktober 3 000 Stück zu bestellen. 9.4 Mehrstu ge Entscheidungen bei Risiko Bisher ha en wir angenommen, dass in jeder Zeitperiode t sowohl der resultierende Endzustand zt als auch das resultierende Periodenergebnis ut eindeutig durch den Anfangszustand zt−1 und die getroffene Entscheidung at bestimmt sind. Diese Annahme trifft nicht für alle Anwendungsfälle zu. So gibt es Lager-

Chapter Preview

References

Zusammenfassung

Vorteile

- Ein Lehr- und Lernbuch für einen einführenden Kurs in die Entscheidungstheorie

- Mit zahlreichen Aufgaben und Lösungen

Zum Werk

In Unternehmen werden und müssen Entscheidungen getroffen werden, deren Auswirkungen zum Teil große Konsequenzen auf die eigene Geschäftstätigkeit haben können.

Dieses Lehrbuch führt den Leser in die Entscheidungstheorie ein und stellt Entscheidungen bei Sicherheit, Risiko und Unsicherheit ausführlich dar. Es erläutert die Grundbegriffe der Spieltheorie ebenso wie die der dynamischen Programmierung.

Autoren

Prof. em. Dr. Dr. h.c. Günter Bamberg war Inhaber des Lehrstuhls für Statistik an der Universität Augsburg.

Prof. em. Dr. Dres. h.c. Adolf G. Coenenberg war Inhaber des Lehrstuhls für Betriebswirtschaftslehre, insbesondere Wirtschaftsprüfung und Controlling, an der Universität Augsburg.

Prof. Dr. Michael Krapp ist Extraordinarius für Quantitative Methoden an der Universität Augsburg.

Zielgruppe

Studierende der Wirtschaftswissenschaften an Universitäten, Fachhochschulen und Berufsakademien.