Content

9.2 Klassifikation und grundlegende Definitionen in:

Günter Bamberg, Adolf Gerhard Coenenberg, Michael Krapp

Betriebswirtschaftliche Entscheidungslehre, page 243 - 247

15. Edition 2012, ISBN print: 978-3-8006-4518-3, ISBN online: 978-3-8006-4519-0, https://doi.org/10.15358/9783800645190_243

Series: Vahlens Kurzlehrbücher

Bibliographic information
234 9. Mehrstu ge Entscheidungen ler Optimierungsprobleme aufgespalten werden. Ein kleines Lagerhaltungsproblem wird in Abschni 9.3 noch eingehender behandelt. Wagner (1975, S. 255) spricht von 25%igen Einsparungen an Lagerhaltungskosten (bei gleichbleibend gutem Service), den größere amerikanische Unternehmen durch den konsequenten Einsa dynamischer Programmierungsmodelle erzielt haben. In den vergangenen Kapiteln traten die rechentechnischen Probleme in den Hintergrund; primär wurde die allgemeine Problematik der in der Literatur vorgeschlagenen Entscheidungsregeln diskutiert. Die dynamische Programmierung fällt insofern etwas aus dem Rahmen der bisher behandelten Themen, als sie primär der rechentechnischen Erleichterung dient. Wird die dynamische Programmierung allerdings bei mehrfacher Zielse ung, bei Risiko- oder Ungewissheitssituationen angewandt, so tri die allgemeine Problematik auch hier zu Tage. Wir wollen in diesem Kapitel auf eine kritische Zusammenfassung verzichten, da sie im Wesentlichen aus der Wiederholung früher gebrachter Argumente bestünde. 9.2 Klassi kation und grundlegende De nitionen Wir betrachten einen wirtschaftlichen Prozess, der für jede der untersuchten T Zeitperioden eine Entscheidung erforderlich macht. Die T Zeitperioden wollen wirmit t = 1, 2, . . . , T und die (sich gegenseitig beeinflussenden) Entscheidungen mit a1, a2, . . . , aT bezeichnen. Der Prozess starte zu Beginn der ersten Periode mit einem Anfangszustand z0. Die in der ersten Zeitperiode zu treffende Entscheidung a1 ∈ A1 habe (in Verbindung mit z0) dreierlei Konsequenzen: a) In der ersten Periode resultiert ein Ergebnis (Periodenergebnis, Stufenergebnis) in Höhe von u1(z0, a1). b) Der Prozess geht am Ende der ersten (= Anfang der zweiten) Zeitperiode in einen Zustand z1 über, der die relevanten Daten für die nachfolgende Entscheidung a2 se t. Die Funktion, die die Transformation von z0 in z1 beschreibt, wollen wir mit g1 bezeichnen: z1 = g1(z0, a1). c) Der (durch z0 und a1 bestimmte) Zustand z1 legt den Bereich A2(z1) fest, innerhalb dessen die nachfolgende Entscheidung a2 variieren kann. Entsprechendes gilt auch für alle anderen Zeitperioden. Allgemein ist also die t-te Zeitperiode charakterisiert durch • ihren Anfangszustand zt−1, • den (imAllgemeinen von zt−1 abhängenden) BereichAt, in demdie Entscheidung at variieren kann; At wird Menge der (für die t-te Periode) zulässigen Entscheidungen, Menge der zulässigen Aktionen oder auch Steuerbereich genannt, • ihr Ergebnis ut(zt−1, at), • ihren Endzustand zt, der sich aus dem Anfangszustand zt−1 und der getroffenen Entscheidung at gemäß der Transformation zt = gt(zt−1, at) ergibt. 9.2 Klassi kation und grundlegende De nitionen 235 Wird z. B. ein Lagerhaltungsprozess betrachtet, so führt man zweckmäßigerweise den Lagerbestand als relevante Zustandsvariable ein. Die Entscheidung at ist dann mit der zu Beginn der Periode t bestellten Menge identisch. Der Steuerbereich At ist durch Budgetrestriktionen, Lagerkapazität usw. eingeschränkt. Das Ergebnis ut ist durch die Bestell-, Lager- und Fehlmengenkosten, durch Einsparungen infolge von Raba en usw. bestimmt. Die Transformation gt ergibt sich aus der Nachfrage der t-ten Periode und der Lieferfrist. Den T-stufigen¹ Entscheidungsprozess veranschaulicht das Schema der Abbildung 9.1. a1 a2 aT u1 uT 1 uT z0 z1 zT 1 zT Abb. 9.1: T-stufiger Entscheidungsprozess Das Ziel besteht darin, das aus den T Stufen resultierende Gesamtergebnis U = T∑ t=1 ut zu maximieren.² Ausführlicher geschrieben, lautet das Problem: Maximiere U = T∑ t=1 ut(zt−1, at) bezüglich a1, . . . , aT (bei fest gegebenem z0, ut, gt) unter den Nebenbedingungen zt = gt(zt−1, at) at ∈ At(zt−1) } jeweils für t = 1, 2, . . . , T . Eine Lösung (a∗1 , a∗2 , . . . , a∗T) dieses Maximierungsproblems wird optimale Entscheidungsfolge, optimale Politik oder auch optimale Steuerung genannt. Das Maximierungsproblem kann auf vielfältige Weise modifiziert oder verallgemeinert werden. Des leichteren Verständnisses wegen ha en wir uns bisher auf den einfachsten Fall, nämlich den endlichstufigen Entscheidungsprozess bei ¹ Da der Index t nicht notwendigerweise die Zeit bedeuten muss, benu t man in der Literatur bevorzugt die allgemeine Bezeichnung „T-stufig“ an Stelle von „Tperiodig“. ² Misst ut jedoch Schäden, Verluste, Kosten oder dergleichen, so ist U natürlich zu minimieren; ohne Einschränkung der Allgemeinheit können wir uns auf den Fall der Maximierung beschränken. Man beachte, dass hier und im Rest des Kapitels ut eine monetäre Größe ist und keine subjektive (Stufen-)Risikonu enfunktion. 236 9. Mehrstu ge Entscheidungen Sicherheit, beschränkt. Sind in diesem Falle außerdem in jeder Stufe nur endlich viele Entscheidungen und endlich viele Zustände möglich, so kann der Prozess durch einen Entscheidungsbaum veranschaulicht werden, dessen Knoten die verschiedenen Zustände und dessen Kanten die verschiedenen Entscheidungen darstellen (vgl. Abbildung 9.2). a1 a 1 a2 a2 a 2 a 2 z0 z1 z 1 z2 z 2 z 2 z 2 erste Stufe zweite Stufe Abb. 9.2: Entscheidungsbaum eines Entscheidungsprozesses bei Sicherheit Liegen einzelne Daten, beispielsweise das Periodenergebnis ut, nicht deterministisch fest, sondern unterliegen sie einer (bekannten)Wahrscheinlichkeitsverteilung, so wird die Entscheidungssituation natürlich zur Risikosituation. Auch bei stochastischen Übergängen vom Zustand zt−1 in den Zustand zt gelangt man zu einer Risikosituation. Hängen die Übergangswahrscheinlichkeiten nur vom unmi elbar vorangehenden Zustand ab (nicht aber den Zuständen, die in weiter zurückliegenden Stufen realisiert wurden), so bezeichnet man den Entscheidungsprozess als markoffschen Entscheidungsprozess.³ Ein markoffscher Entscheidungsprozess mit diskreten Übergangswahrscheinlichkeiten kann ebenfalls durch einen Entscheidungsbaum dargestellt werden. Zu diesem Zweck führt man zu den in Abbildung 9.2 benu ten (rechteckigen) Entscheidungsknoten zusä lich noch (runde) Zufalls- bzw. Ereignisknoten ein, bei denen der Zufall am Zuge ist (wie bereits in Abschni 6.5); an die entsprechenden Kanten schreibt man die Übergangswahrscheinlichkeiten (vgl. Abbildung 9.3). In Abschni 9.4 sowie bei den Aufgaben (in Abschni 9.5) werden einige Beispiele markoffscher Entscheidungsprozesse behandelt. ³ Wir ha en bisher angenommen, dass auch die Transformationsfunktionen gt (außer von at) nur vom Zustand zt−1 abhängen; insofern ha en wir bisher spezielle markoffsche Entscheidungsprozesse, bei denen alle Übergangswahrscheinlichkeiten 1 sind, behandelt. 9.2 Klassi kation und grundlegende De nitionen 237 a1 a 1 p1 1 p1 p2 1 p2 z0 erste Stufe zweite Stufe Abb. 9.3: Entscheidungsbaum eines markoffschen Entscheidungsprozesses Sind einzelne Daten – beispielsweise das Periodenergebnis ut oder der resultierende Zustand zt – ungewiss, so liegt natürlich eine Ungewissheitssituation (mit ihrer ganzen Problematik, die in Kapitel 5 anhand des einstufigenModells bereits diskutiert wurde) vor. Neben der Unterscheidung in Sicherheits-, Risiko- und Ungewissheitssituationen sind einige andere Klassifikationsgesichtspunkte zu erwähnen: a) Je nach Wahl von T lassen sich Entscheidungsprozesse mit endlichem oder unendlichem Planungshorizont unterscheiden. Modelle mit einem unendlichen Planungshorizont werden dann verwendet, wenn der reale Planungszeitraum sehr groß ist oder nicht ohneWillkür abgegrenzt werden kann. Bei Entscheidungsprozessen mit unendlichem Planungshorizont ergeben sich Folgen (u1, u2, . . . ) von Stufenergebnissen. Die bisher benu te Zielfunktion T∑ t=1 ut wird dabei im Allgemeinen sinnlos. Die adäquate Bewertung solcher Ergebnisfolgen (u1, u2, . . . ) wirft zusä liche Probleme auf. Die beiden Ansä e, die am häufigsten benu t werden, beruhen auf der Maximierung der diskontierten Summe ∞∑ t=1 utλt−1 238 9. Mehrstu ge Entscheidungen der Stufenergebnisse ut bzw. auf der Maximierung des langfristigen Durchschni sergebnisses⁴ lim T→∞ 1 T T∑ t=1 ut . Wirwollen uns hier auf Prozessemit endlichem Planungshorizont beschränken und verweisen den an Prozessen mit unendlichem Planungshorizont interessierten Leser auf die einschlägige Literatur.⁵ b) Je nach der Größe der Zeitperioden unterscheidet man die bisher ausschließlich betrachteten Entscheidungsprozesse mit diskreten Stufen und die Entscheidungsprozesse mit einem Kontinuum von Stufen. Im le teren Fall ist t ein kontinuierlich variierender Parameter; jede Stufe ist „infinitesimal klein“. Solche Entscheidungsprozesse kommen vorwiegend in technischen Anwendungen vor. Die Transformation der Zustände wird in der Regel durch Differenzialgleichungen beschrieben; bei der Zielfunktion tri an die Stelle der Summe ein Integral. Entscheidungsprozesse mit einem Kontinuum von Stufen führen in das Gebiet der Variationsrechnung und der Kontrolltheorie; eine umfassende Darstellung (mit ökonomischen Beispielen) ist in Feichtinger/Hartl (1986) und Kosmol (2010) zu finden. c) Auch bei mehrstufigen Entscheidungsprozessen lässt sich eine Unterscheidung bezüglich einfacher und mehrfacher Zielse ung vornehmen. Es versteht sich von selbst, dass wir uns auf den elementarsten Fall, nämlich den der einfachen Zielse ung, beschränken müssen. Exemplarisch für die vielfältigen Problemstellungen des dynamischen Programmierens werden wir in Abschni 9.3 mehrstufige Entscheidungen bei Sicherheit (einfacher Zielse ung, diskreten Stufen und endlichem Planungshorizont) behandeln sowie in Abschni 9.4 mehrstufige Entscheidungen bei Risiko (und ebenfalls wieder einfacher Zielse ung, diskreten Stufen und endlichem Planungshorizont). 9.3 Mehrstu ge Entscheidungen bei Sicherheit Wir greifen das Maximierungsproblem des vorangehenden Abschni s wieder auf. Zunächst wird das Optimalitätsprinzip von R. E. Bellman erläutert; anschließend wird das Optimalitätsprinzip auf ein Lagerhaltungsproblem angewandt. ⁴ Da die Folge 1T (u1 + u2 + · · · + uT) im Allgemeinen mehrere Häufungspunkte besi t, muss streng genommen an Stelle dieses Limes (der im Allgemeinen nicht existiert) der Limes inferior genommen werden. ⁵ Bellman (2003); Beckmann (1968); Schneeweiß (1974); Neumann/Morlock (2002).

Chapter Preview

References

Zusammenfassung

Vorteile

- Ein Lehr- und Lernbuch für einen einführenden Kurs in die Entscheidungstheorie

- Mit zahlreichen Aufgaben und Lösungen

Zum Werk

In Unternehmen werden und müssen Entscheidungen getroffen werden, deren Auswirkungen zum Teil große Konsequenzen auf die eigene Geschäftstätigkeit haben können.

Dieses Lehrbuch führt den Leser in die Entscheidungstheorie ein und stellt Entscheidungen bei Sicherheit, Risiko und Unsicherheit ausführlich dar. Es erläutert die Grundbegriffe der Spieltheorie ebenso wie die der dynamischen Programmierung.

Autoren

Prof. em. Dr. Dr. h.c. Günter Bamberg war Inhaber des Lehrstuhls für Statistik an der Universität Augsburg.

Prof. em. Dr. Dres. h.c. Adolf G. Coenenberg war Inhaber des Lehrstuhls für Betriebswirtschaftslehre, insbesondere Wirtschaftsprüfung und Controlling, an der Universität Augsburg.

Prof. Dr. Michael Krapp ist Extraordinarius für Quantitative Methoden an der Universität Augsburg.

Zielgruppe

Studierende der Wirtschaftswissenschaften an Universitäten, Fachhochschulen und Berufsakademien.