Content

21. Folgen, Reihen und reellwertige Funktionen im Rn in:

Michael Merz, Mario V. Wüthrich

Mathematik für Wirtschaftswissenschaftler, page 615 - 646

Die Einführung mit vielen ökonomischen Beispielen

1. Edition 2012, ISBN print: 978-3-8006-4482-7, ISBN online: 978-3-8006-4483-4, https://doi.org/10.15358/9783800644834_615

Bibliographic information
Teil VII Differential- und Integralrechnung im Rn Kapitel21 Folgen, Reihen und reellwertige Funktionen im Rn Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn 21.1 Folgen und Reihen A. Einstein Vom deutschstämmigen Physiker und Nobelpreisträger Albert Einstein (1879–1955) ist das folgende bekannte Zitat überliefert, das sich zwar auf Physiker bezieht, aber auch für Wirtschaftswissenschaftler Gültigkeit besitzt: „Auch meinte ich in meiner Unschuld, dass es für den Physiker genüge, die elementaren mathematischen Begriffe klar erfasst und für die Anwendung bereit zu haben, und dass der Rest in für den Physiker unfruchtbaren Subtilitäten bestehe – ein Irrtum, den ich später mit Bedauern einsah.“ In den Kapiteln 11 und 12 wurden Folgen und Reihen von reellen Zahlen ausführlich untersucht. Die dabei gewonnenen Erkenntnisse und Resultate haben sich dann in den nachfolgenden Kapiteln bei der Untersuchung reeller Funktionen f : D ⊆ R −→ R, x %→ f (x) auf Eigenschaften wie Konvergenz, Stetigkeit, Differenzierbarkeit und Integrierbarkeit als unentbehrliche Hilfsmittel erwiesen. Für die in diesem Kapitel und die in den nachfolgenden Kapiteln 22 bis 25 anstehende Verallgemeinerung der Differential- und Integralrechnung sowie Optimierungstheorie auf Funktionen f : D ⊆ Rn −→ R, x %→ f (x) mit einem Definitionsbereich D aus dem n-dimensionalen euklidischen RaumRn ist es daher zwingend erforderlich, zuvor die Begriffe „Folge“ und „Reihe“ von reellen Zahlen auf Vektoren aus dem n-dimensionalen euklidischen RaumRn zu erweitern. Bei dieser Erweiterung wird sich zeigen, dass die betrachteten Begriffe und Konzepte zum großen Teil bereits aus früheren Kapiteln bekannt und weitgehend analog zum eindimensionalen Fall definiert sind. Im Folgenden besteht somit die Schwierigkeit weniger im Verständnis als vielmehr in der Gewöhnung an eine etwas komplexere Notation, die sich aufgrund der größeren Anzahl von Variablen zwangsläufig ergibt. Folgen im Rn Eine Folge im n-dimensionalen euklidischen Raum Rn ist eine Funktion a mit einem Definitionsbereich aus der Menge N0 und Funktionswerten aus dem Rn: Definition 21.1 (Folge im Rn) Eine Funktion a : D −→ Rn, k %→ ak := a(k) mit D ⊆ N0 heißt Folge und die n-dimensionalen Vektoren ak ∈ Rn werden als Folgenglieder der Folge a bezeichnet. Für eine Folge im Rn schreibt man (ak)k∈D oder auch kurz (ak). Das k-te Folgenglied ak gibt den Wert der Folge (ak)k∈D an der Stelle k ∈ D an. Analog zur eindimensionalen Analysis sind auch in der mehrdimensionalen Analysis vor allem Folgen mit der Indexmenge D = N oder D = N0 von Bedeutung. Daher werden auch für Folgen im Rn alle Definitionen und Sätze für die Indexmenge N0 formuliert. Die Definitionen und Sätze besitzen jedoch für alle unendlichen Teilmengen von N0 als Indexmenge Gültigkeit. Für die Folgenglieder einer Folge (ak)k∈N0 im R n gilt ak = ⎛ ⎜⎜ ⎝ a (1) k ... a (n) k ⎞ ⎟⎟ ⎠ (21.1) für alle k ∈ N0. Dabei ist a(i)k für i = 1, . . . , n die i-te Koordinate des k-ten Folgenglieds ak . Das heißt, eine Folge (ak)k∈N0 im Rn lässt sich in n Koordinatenfolgen ( a (1) k ) k∈N0 , . . . , ( a (n) k ) k∈N0 (21.2) zerlegen. Bei diesen Koordinatenfolgen handelt es sich um gewöhnliche Folgen reeller Zahlen, wie sie in Kapitel 11 untersucht wurden. Durch jede Folge (ak)k∈N0 von Vektoren im R n sind n Koordinatenfolgen in R eindeutig festgelegt. Umgekehrt definieren n Koordinatenfolgen in R über (21.1) genau eine Folge (ak)k∈N0 im R n. So gut wie alle Begriffe lassen sich nun von Folgen reeller Zahlen auf Folgen von Vektoren sinngemäß übertragen. Insbesondere lautet die Definition der Konvergenz bzw. Divergenz einer Folge (ak)k∈N0 im R n fast genauso wie bei Folgen reeller Zahlen. Der einzige Unterschied besteht darin, dass nun zur Abstandsmessung zwischen zwei Folgengliedern an 620 Kapitel 2121.1 Folgen und Reihen die Stelle des Betrages die euklidische Norm (vgl. Definition 7.10) tritt: Definition 21.2 (Konvergenz und Divergenz einer Folge im Rn) Eine Folge (ak)k∈N0 konvergiert gegen den Grenzwert (Limes) a ∈ Rn, wenn es zu jedem ε > 0 ein k0 ∈ N0 gibt, so dass ‖ak − a‖ < ε für alle natürlichen Zahlen k ≥ k0 gilt. Man schreibt dann lim k→∞ ak = a oder ak → a für k → ∞. Eine konvergente Folge (ak)k∈N0 mit dem Grenzwert a = 0 wird als Nullfolge bezeichnet und eine Folge, die nicht konvergiert, heißt divergent. In Abschnitt 7.6 wurden für einen beliebigen Vektor a ∈ Rn und eine Konstante r > 0 bereits die beiden Mengen K<(a, r) = {x ∈ Rn : ‖x − a‖ < r} und K≤(a, r) = {x ∈ Rn : ‖x − a‖ ≤ r} (21.3) definiert. Sie werden als offene bzw. abgeschlossene Kugel mit Radius r um a bezeichnet. Man nennt beide Mengen auch Kugelumgebungen von a im Rn. Die Sprechweise „Kugel“ ist dabei an den Spezialfall n = 3 angelehnt. Im Fall n = 1 ist K<(a, r) das offene Intervall (a− r, a+ r) und K≤(a, r) das abgeschlossene Intervall [a− r, a+ r]. Im Fall n = 2 ist die Menge K<(a, r) eine Kreisscheibe ohne und K≤(a, r) eine Kreisscheibe mit Rand, also inklusive den Punkten, die zu a genau den Abstand r haben. Analog handelt es sich im Fall n = 3 bei K<(a, r) und K≤(a, r) um eine dreidimensionale Kugel ohne bzw. mit Rand (vgl. Abbildungen 21.1 und 21.2). a r a r Abb. 21.1: Offene Kugel K<(a, r) (links) und abgeschlossene Kugel K≤(a, r) (rechts) mit Radius r um a ∈ R2 Eine Folge (ak)k∈N0 konvergiert somit genau dann gegen einen Grenzwert a, wenn in jeder offenen Kugel K<(a, ε) um a mit einem Radius ε > 0 fast alle Folgenglieder von (ak)k∈N0 liegen. Das heißt, für jedes beliebige ε > 0 liegen ab einem hinreichend großen Index k0 ∈ N0 alle Folgenglieder ak mit k ≥ k0 in der offenen Kugel K<(a, ε) und nur endlich viele Folgenglieder liegen außerhalb. Für k = 2 und k = 3 bedeutet dies, dass für ein beliebiges ε > 0 fast alle Folgenglieder einer konvergenten Folge (ak)k∈N0 mit Grenzwert a innerhalb der offenen Kreisscheibe K<(a, ε) bzw. der offenen dreidimensionalen Kugel K<(a, ε) liegen (vgl. Abbildung 21.2). Gemäß der Definition 21.2 und der Definition der euklidischen Norm im Rn (vgl. (7.15)) konvergiert eine Folge (ak)k∈N0 von Vektoren somit genau dann, wenn es zu jedem ε > 0 ein k0 ∈ N0 gibt, so dass ‖ak − a‖ = √√√√ n∑ i=1 ( a (i) k − a(i) )2 < ε (21.4) für alle k ≥ k0 gilt. Das heißt, die Konvergenzeigenschaften einer Folge (ak)k∈N0 von Vektoren werden durch die Konvergenzeigenschaften ihrer n Koordinatenfolgen (21.2) bestimmt. Genauer gilt, dass eine Folge (ak)k∈N0 genau dann konvergiert, wenn alle n Koordinatenfolgen konvergieren. Satz 21.3 (Koordinatenweise Konvergenz im Rn) Eine Folge (ak)k∈N0 im R n konvergiert gegen den Grenzwert a = (a(1), . . . , a(n))T genau dann, wenn jede der n Koordinatenfolgen ( a (1) k ) k∈N0 , . . . , ( a (n) k ) k∈N0 gegen die entsprechende Koordinate von a konvergiert. Beweis: Es gelte lim k→∞‖ak − a‖ = 0. Wegen |a (i) k − a(i)| ≤ ‖ak − a‖ für alle i = 1, . . . , n (vgl. (21.4)) folgt dann lim k→∞ |a (i) k −a(i)| = 0 für alle i = 1, . . . , n, also die Konvergenz der Koordinatenfolge ( a (i) k ) k∈N0 gegen die Koordinate a (i) für i = 1, . . . , n. Gilt umgekehrt lim k→∞ |a (i) k − a(i)| = 0 für alle i = 1, . . . , n, dann folgt mit den Rechenregeln für die Grenzwerte konvergenter Folgen (vgl. Satz 11.39) lim k→∞‖ak − a‖ = limk→∞ √√√√ n∑ i=1 ( a (i) k − a(i) )2 = 0, also die Konvergenz der Folge (ak)k∈N0 gegen den Grenzwert a. 621 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn x 2 x 3 x 1 a ε K < (a, ε) x 1 x 2 a ε K < (a, ε) Abb. 21.2: Konvergente Folge (ak)k∈N0 mit nur endlich vielen Folgengliedern außerhalb der offenen dreidimensionalen Kugel K<(a, ε) im R3 (links) und der offenen Kreisscheibe K<(a, ε) R2 (rechts) Die Abbildungen 21.3 und 21.4 zeigen eine divergente bzw. konvergente Folge (ak)k∈N0 im dreidimensionalen euklidischen Raum R3. l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l ll l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l ll l l l l l l l l l l l l l l l l l l l l l ll l l l l l l ll l l l l l l l l l l l l l l l l 0 2 4 6 8 10 02 46 810 0 2 4 6 8 10 ak (1) ak (2) ak (3) Abb. 21.3: Divergente Folge (ak)k∈N0 im R 3 Der Satz 21.3 besagt, dass die Konvergenz einer Folge (ak)k∈N0 im R n auf den Konvergenzbegriff für Folgen reeller Zahlen zurückgeführt werden kann. Das heißt insbesondere, dass sich alle Sätze über die Konvergenz von Folgen reeller Zahlen fast von selbst auf Folgen im Rn übertragen. Zum Beispiel gilt die Eindeutigkeit von Grenzwerten auch für Folgen von Vektoren: Folgerung 21.4 (Eindeutigkeit des Grenzwertes einer Folge im Rn) Der Grenzwert einer konvergenten Folge (ak)k∈N0 im R n ist eindeutig. Beweis: Es sei angenommen, dass lim k→∞ak=a und limk→∞ak=b gilt. Aus Satz 21.3 und Satz 11.15 folgt dann, dass jede der n Koordinaten von a mit der entsprechenden Koordinate von b übereinstimmt. Als weitere unmittelbare Folgerung erhält man für die Grenzwerte konvergenter Folgen die folgenden Rechenregeln: Folgerung 21.5 (Rechenregeln für Grenzwerte konvergenter Folgen im Rn) Die Folgen (ak)k∈N0 und (bk)k∈N0 im R n seien konvergent mit dem Grenzwert lim k→∞ ak = a bzw. lim k→∞ bk = b. Dann sind auch die Folgen (ak + bk)k∈N0 , (ak − bk)k∈N0 , (c ak)k∈N0 mit c ∈ R und (〈ak, bk〉)k∈N0 konvergent und besitzen die folgenden Grenzwerte: a) lim k→∞ (ak + bk) = lim k→∞ ak + lim k→∞ bk = a + b b) lim k→∞ (ak − bk) = lim k→∞ ak − lim k→∞ bk = a − b c) lim k→∞ c ak = c lim k→∞ ak = c a d) lim k→∞ 〈ak, bk〉= 〈 lim k→∞ ak, lim k→∞ bk 〉 =〈a, b〉 = n∑ i=1 aibi 622 Kapitel 2121.1 Folgen und Reihen Beweis: Folgt unmittelbar aus Satz 21.3 und Satz 11.39a), b), c) und d). Das folgende Beispiel zeigt, wie eine Folge von Vektoren koordinatenweise auf Konvergenz untersucht werden kann: Beispiel 21.6 (Konvergenz von Folgen im Rn) a) Für die Folge (ak)k∈N von dreidimensionalen Vektoren ak := ⎛ ⎝ 2 + 8 2k 7 − 6 k 1 + 8 k ⎞ ⎠ ∈ R3 für alle k ∈ N gilt lim k→∞ ( 2 + 8 2k ) = 2, lim k→∞ ( 7 − 6 k ) = 7 und lim k→∞ ( 1 + 8 k ) = 1. Das heißt, die Folge (ak)k∈N ist konvergent und besitzt den Grenzwert lim k→∞ ak = ⎛ ⎝ 2 7 1 ⎞ ⎠ (vgl. Abbildung 21.4). b) Die Folge (ak)k∈N von dreidimensionalen Vektoren ak := ⎛ ⎝ k 10 7 − 6 k 1 + 8 k ⎞ ⎠ ∈ R3 für alle k ∈ N ist dagegen nicht konvergent, also divergent. Denn die erste Koordinatenfolge ( a (1) k ) k∈N mit a(1)k = k10 für alle k ∈ N ist offensichtlich divergent für k → ∞. Cauchy-Folgen Nach A. L. Cauchy benannte Straße in Paris Ist (ak)k∈N0 eine konvergente Folge mit dem Grenzwert a, dann gibt es für jedes ε>0 ein k0 ∈N0, so dass ‖ak − a‖ < ε 2 für alle k ≥ k0 gilt. Für zwei Folgenglieder ak und al mit k, l≥k0 erhält man somit mit der Dreiecksungleichung (vgl. Satz 7.11d)) die Abschätzung l l l l l l l llllllllll l l ll 0 2 4 6 8 10 02 46 810 0 2 4 6 8 10 ak (1) ak (2) ak (3) Abb. 21.4: Konvergente Folge (ak)k∈N0 im R 3 mit Grenzwert (2, 7, 1)T ‖ak − al‖ ≤ ‖ak − a‖ + ‖a − al‖ < ε 2 + ε 2 = ε. (21.5) Das heißt, zwei Folgenglieder ak und al liegen beliebig dicht beieinander, wenn die Indizes k und l nur hinreichend groß sind. Folgen von Vektoren mit dieser Verdichtungseigenschaft werden analog zu Folgen reeller Zahlen nach dem französischen Mathematiker Augustin Louis Cauchy (1789– 1857) als Cauchy-Folgen bezeichnet. Definition 21.7 (Cauchy-Folge im Rn) Eine Folge (ak)k∈N0 heißt Cauchy-Folge, wenn für jedes ε > 0 ein k0 ∈ N0 existiert, so dass ‖ak − al‖ < ε für alle k, l ≥ k0 gilt. Natürlich gilt auch wieder das Konvergenzkriterium von Cauchy: Folgerung 21.8 (Konvergenzkriterium von Cauchy im Rn) Eine Folge (ak)k∈N0 konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Beweis: Durch (21.5) ist gezeigt, dass jede konvergente Folge (ak)k∈N0 im Rn auch eine Cauchy-Folge ist. Ist umgekehrt (ak)k∈N0 eine Cauchy-Folge, dann folgt wegen |a(i)k −a(i)l | ≤ ‖ak−al‖ für alle i = 1, . . . , n (vgl. (21.4)), dass 623 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn auch die n Koordinatenfolgen ( a (i) k ) k∈N0 von (ak)k∈N0 Cauchy- Folgen sind. Gemäß Satz 11.37 konvergieren diese jeweils gegen einen Grenzwert a(i) für i = 1, . . . , n. Zusammen mit Satz 21.3 folgt daraus, dass die Folge von Vektoren (ak)k∈N0 gegen den Vektor a := (a(1), . . . , a(n))T konvergiert. Beschränkte Folgen Die Beschränktheit einer Folge im euklidischen Raum Rn ist wie folgt definiert: Definition 21.9 (Beschränkte Folge im Rn) Eine Folge (ak)k∈N0 heißt beschränkt, falls eine Schranke c ∈ R existiert mit ‖ak‖ ≤ c für alle k ∈ N0. Eine nicht beschränkte Folge wird als unbeschränkt bezeichnet. Für n = 2 und n = 3 bedeutet Beschränktheit einer Folge (ak)k∈N0 somit, dass alle Folgenglieder innerhalb einer abgeschlossenen Kreisscheibe K≤(0, r) bzw. einer abgeschlossenen dreidimensionalen Kugel K≤(0, r) um den Ursprung 0 mit einem hinreichend großen Radius r > 0 liegen. Es ist leicht einzusehen, dass neben der Konvergenz auch die Beschränktheit einer Folge koordinatenweise überprüft werden kann. Analog zu Folgen in R gilt für Folgen im Rn, dass jede konvergente Folge beschränkt ist. Das heißt, für die Konvergenz von Folgen (ak)k∈N0 gilt die folgende notwendige Bedingung. Folgerung 21.10 (Notwendige Bedingung für Konvergenz im Rn) Eine konvergente Folge (ak)k∈N0 ist beschränkt. Beweis: Der Beweis verläuft völlig analog zum Beweis von Satz 11.18. Es muss lediglich der Betrag durch die euklidische Norm ersetzt werden. Geburtshaus von K. Weierstraß in Ostenfelde Auch der nach dem böhmischen Mathematiker Bernard Bolzano (1781–1848) und dem deutschen Mathematiker Karl Weierstraß (1815–1897) benannte Satz von Bolzano-Weierstraß kann problemlos auf Folgen im Rn verallgemeinert werden: Satz 21.11 (Satz von Bolzano-Weierstraß im Rn) Jede beschränkte Folge (ak)k∈N0 besitzt eine konvergente Teilfolge. Beweis: Die n Koordinatenfolgen von (ak)k∈N0 seien beschränkt. Gemäß Satz 11.31 besitzt daher die erste Koordinatenfolge ( a (1) k ) k∈N0 eine konvergente Teilfolge ( a (1) kl ) l∈N0 . Die Folgenglieder der zweiten Koordinatenfolge ( a (2) k ) k∈N0 zu den Indizes k = k0, k1, k2, . . . bilden ebenfalls eine beschränkte Folge, so dass sich erneut eine (der besseren Übersichtlichkeit wegen ebenfalls mit ( a (2) kl ) l∈N0 bezeichnete) konvergente Teilfolge auswählen lässt. Dieses Vorgehen kann solange wiederholt werden, bis auch aus der letzten Koordinatenfolge( a (n) k ) k∈N0 eine konvergente Teilfolge ( a (n) kl ) l∈N0 ausgewählt wurde. Das heißt, die n Koordinatenfolgen ( a (i) kl ) l∈N0 für i = 1, . . . , n konvergieren. Mit Satz 21.3 folgt daher, dass auch die Folge (akl )l∈N0 konvergiert. Reihen Analog zur Verallgemeinerung des Folgenbegriffs kann auch der Reihenbegriff problemlos auf den euklidischen Raum Rn verallgemeinert werden. Dies führt dann für eine Reihe im R n zu der folgenden Definition: Definition 21.12 (Reihe im Rn) Für eine Folge (ak)k∈N0 im R n heißt für k ∈ N0 die Summe sk := a0 + a1 + . . .+ ak = k∑ l=0 al = ⎛ ⎜⎜ ⎝ ∑k l=0 a (1) l ...∑k l=0 a (n) l ⎞ ⎟⎟ ⎠ k-te Partialsumme der Folge (ak)k∈N0 und die Folge (sk)k∈N0 der Partialsummen von (ak)k∈N0 wird als (unendliche) Reihe im Rn bezeichnet. Die Vektoren al heißen Reihenglieder und für die Reihe (sk)k∈N0 schreibt man – unabhängig davon, ob (sk)k∈N0 konvergiert oder nicht – symbolisch ∞∑ l=0 al . 624 Kapitel 2121.2 Topologische Grundbegriffe Mit dieser Definition sind Reihen im Rn auf Folgen im Rn zurückgeführt, weshalb auch bereits alles Wesentliche gesagt ist. Für die Begriffe Konvergenz und Divergenz einer Reihe im Rn erhält man zum Beispiel die folgende Definition: Definition 21.13 (Konvergenz und Divergenz einer Reihe im Rn) Eine Reihe ∑∞ l=0 al im R n konvergiert genau dann gegen s ∈ Rn, wenn die Folge (sk)k∈N0 ihrer Partialsummen sk gegen s konvergiert. Das heißt, wenn s = lim k→∞ sk gilt. Man schreibt dann s = ∞∑ l=0 al und sagt, dass die Reihe den Wert (Grenzwert, Summe, Limes) s besitzt. Die Reihe heißt divergent, falls die Folge (sk)k∈N0 divergent ist. Da es sich bei Reihen im Rn um spezielle Folgen von Vektoren handelt und die Konvergenz von Folgen im Rn gemäß Satz 21.3 koordinatenweise untersucht werden kann, lassen sich bei der Untersuchung von Reihen im Rn auf Konvergenz alle Ergebnisse aus Kapitel 12 für Reihen von reellen Zahlen koordinatenweise anwenden. 21.2 Topologische Grundbegriffe In diesem Abschnitt werden einige topologische (gr. topos für Ort) Grundbegriffe eingeführt. Dabei handelt es sich um anschauliche Begriffe und Eigenschaften von Teilmengen des euklidischen Raums Rn sowie um Lagebeziehungen zwischen Punkten und Mengen des Rn. Hierzu gehören unter anderem Begriffe wie Umgebung eines Punktes, innerer Punkt und Randpunkt einer Menge sowie offene, abgeschlossene und kompakte Teilmenge des Rn. Umgebungen, innere Punkte und Randpunkte Neben Kugelumgebungen (21.3) sind für das Folgende auch allgemeine Umgebungen eines Punktes a ∈ Rn von Interesse: Definition 21.14 (Umgebung eines Punktes) Eine Teilmenge U ⊆ Rn heißt Umgebung von a ∈ Rn, wenn es ein r > 0 gibt, so dass K≤(a, r) ⊆ U gilt. Eine Umgebung U eines Punktes a ∈ Rn besitzt somit die Eigenschaft, dass eine abgeschlossene Kugel K≤(a, r) um a mit hinreichend kleinem Radius r > 0 vollständig in U enthalten ist. Zum Beispiel ist die Menge U in der Abbildung 21.5, links eine Umgebung des Punktes b, aber keine Umgebung des Punktes a. Denn für jedes r > 0 enthält K≤(a, r) auch Punkte, die außerhalb von U liegen. Offensichtlich ist auch jede abgeschlossene Kugel K≤(a, r) mit einem Radius r > 0 eine Umgebung von a ∈ Rn und damit auch jede offene Kugel K<(a, r), denn es gilt K<(a, r) ⊆ K≤(a, r). Aufbauend auf dem Umgebungsbegriff können nun die beiden Begriffe innerer Punkt und Randpunkt einer Menge definiert werden: Definition 21.15 (Innerer Punkt und Randpunkt) Es sei M eine Teilmenge des Rn. Dann gilt: a) Ein Punkt a ∈ M heißt innerer Punkt von M , falls es eine Umgebung U von a mit U ⊆ M gibt. Die Menge der inneren Punkte von M heißt Inneres von M und wird mit M◦ bezeichnet. b) Ein Punkt a ∈ Rn heißt Randpunkt von M , falls jede Umgebung U von a mindestens einen Punkt aus M und mindestens einen Punkt aus Rn \M enthält, also U ∩M = ∅ und U ∩ (Rn \M) = ∅ gilt. Die Menge aller Randpunkte von M heißt Rand von M und wird mit ∂M bezeichnet. Die Definition des Randes formalisiert den Sachverhalt, dass sich ein Randpunkt a einer Menge M dadurch auszeichnet, dass eine beliebig kleine Umgebung von a sowohl Punkte aus M als auch Punkte außerhalb von M enthält (vgl. Abbildung 21.5, links). Es ist zu beachten, dass ein innerer Punkt von M gemäß Definition 21.15 zur Menge M gehört, also insgesamt M◦ ⊆ M gilt. Dies gilt jedoch nicht für Randpunkte. Ein Randpunkt einer Menge M kann zu M gehören, muss es jedoch nicht. Zum Beispiel besitzt das Intervall [a, b) die beiden Randpunkte a und b, wobei jedoch lediglich der Randpunkt a ein Element des Intervalles ist. Weiter ist zu beachten, dass ein Punkt nicht gleichzeitig ein innerer Punkt und ein Randpunkt von M sein kann. Das heißt, es gilt stets M◦ ∩ ∂M = ∅. 625 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn a b U x1 x2 M = ∂ M x1 x2 ∂ K< (0, r) K< (0, r) r Abb. 21.5: Menge U mit Randpunkt a und innerem Punkt b (links), Menge M mit M = ∂M (Mitte) und Menge K<(0, r) mit K<(0, r) ∩ ∂K<(0, r) = ∅ (rechts) Beispiel 21.16 (Innere Punkte und Randpunkte) a) Bei den beiden Punkten a und b in Abbildung 21.5, links handelt es sich um einen Randpunkt bzw. um einen inneren Punkt der Menge U ⊆ R2. b) Die Menge M = {x = (x1, x2)T ∈ R2 : x2 = x1} besitzt die Eigenschaft, dass für einen beliebigen Punkt x ∈ M jede Umgebung U von x auch Punkte außerhalb von M enthält. Das heißt, es gilt U ∩ (R2\M) = ∅. Folglich besitztM keine inneren Punkte, sondern besteht ausschließlich aus Randpunkten. Folglich gilt M◦ = ∅ und M = ∂M (vgl. Abbildung 21.5, Mitte). c) Die offene Kugel K<(a, r) = {x ∈ Rn : ‖x − a‖ < r} um a mit dem Radius r > 0 besteht nur aus inneren Punkten und enthält keine Randpunkte. Es gilt somit K<(a, r) = K◦<(a, r). Denn ist b ∈ K<(a, r) beliebig gewählt und δ := r − ‖b − a‖ > 0, dann gilt K<(b, δ/2) ⊆ K<(a, r). Zum Nachweis sei x ∈ K<(b, δ/2) beliebig gewählt. Wegen ‖x − b‖ < δ2 erhält man dann mit der Dreiecksungleichung (vgl. Definition 7.11d)) die Abschätzung ‖x − a‖ = ‖x − b + b − a‖ ≤ ‖x − b‖ + ‖b − a‖ ≤ δ 2 + r − δ < r. Folglich gilt x ∈ K<(a, r), also auch K<(b, δ/2) ⊆ K<(a, r). Analog zeigt man, dass ∂K<(a, r) = {x ∈ Rn : ‖x − a‖ = r} gilt. Die Randpunkte von K<(a, r) gehören nicht zur Menge K<(a, r). Das heißt, es gilt K<(a, r)∩∂K<(a, r) = ∅ (für den Fall n = 2 und a = 0, vgl. Abbildung 21.5, rechts). Offene und abgeschlossene Mengen In der Analysis unterscheidet man zwischen offenen und abgeschlossenen Mengen: Definition 21.17 (Offene und abgeschlossene Menge) Es sei M eine Teilmenge des Rn. Dann gilt: a) M heißt offen, wenn sie nur innere Punkte enthält, also M = M◦ erfüllt ist. b) M heißt abgeschlossen, wenn sie ihren Rand enthält, also ∂M ⊆ M erfüllt ist. c) Die Vereinigung M ∪ ∂M der Menge M mit ihrem Rand ∂M heißt abgeschlossene Hülle von M und wird mit M bezeichnet. Bei offenen und abgeschlossenen Mengen handelt es sich um eine Verallgemeinerung offener bzw. abgeschlossener Intervalle. Für jede Menge M ⊆ Rn gilt M◦ ⊆ M ⊆ M und M = M ∪ ∂M = M◦ ∪ ∂M. Weiter folgt aus Definition 21.17, dass das Innere M◦, der Rand ∂M und das Äußere (Rn \M)◦ einer Menge M paarweise disjunkt sind und zusammen den ganzen euklidischen Raum Rn ausfüllen, also R n = M◦ ∪ ∂M ∪ (Rn \M)◦ (21.6) gilt. Da die beiden Mengen R n und ∅ (21.7) die einzigen Teilmengen des Rn sind, die keine Randpunkte besitzen, sind sie auch die einzigen Teilmengen des Rn, 626 Kapitel 2121.2 Topologische Grundbegriffe die sowohl offen als auch abgeschlossen sind. Alle anderen Teilmengen M ⊆ Rn besitzen Randpunkte und sind somit entweder abgeschlossen (alle Randpunkte gehören zuM), offen (kein Randpunkt gehört zu M) oder keines von beidem (manche Randpunkte gehören zu M und manche nicht). Der folgende Satz liefert eine Charakterisierung für abgeschlossene Mengen: Satz 21.18 (Charakterisierung abgeschlossener Mengen) Es sei M eine Teilmenge des Rn. Dann gilt: a) M ist genau dann abgeschlossen, wenn ihr Komplement Rn \M offen ist. b) M ist genau dann abgeschlossen, wenn der Grenzwert jeder konvergenten Folge (ak)k∈N0 mit ak ∈ M für alle k ∈ N0 ebenfalls zu M gehört. Beweis: Zu a): Es sei Rn \M offen und x ∈ ∂M beliebig gewählt. Angenommen, es gelte x ∈ Rn \ M , dann gibt es eine Umgebung U von x mit U ⊆ Rn \M . Dies ist jedoch ein Widerspruch zur Annahme x ∈ ∂M . Folglich gilt x ∈ M und, da x ∈ ∂M beliebig gewählt war, gilt auch ∂M ⊆ M . Das heißt, dass M abgeschlossen ist. Die andere Implikation ergibt sich analog. Zu b): Ist M abgeschlossen, dann ist nach Aussage a) die Komplementärmenge Rn \M offen. Es gibt somit zu jedem Punkt x ∈ Rn \ M eine Umgebung U mit U ⊆ Rn \ M . Mit anderen Worten: Kein Punkt aus Rn \M kann Grenzwert einer Folge (ak)k∈N0 mit Folgengliedern ausschließlich in M sein. Das heißt, jede konvergente Folge mit Folgengliedern aus M hat ihren Grenzwert in M . Das folgende Beispiel zeigt eine Anwendung dieser Resultate: Beispiel 21.19 (Offene und abgeschlossene Mengen) a) Für die Menge M = {x = (x1, x2)T ∈ R2 : x2 = x1} gilt M=∂M (vgl. Beispiel 21.16b)). Folglich ist M abgeschlossen und damit das Komplement R2 \M= {x=(x1, x2)T ∈ R2 : x2 = x1} offen. b) Für die offene Kugel K<(a, r) = {x ∈ Rn : ‖x−a‖ 0 mit K<(x, ε1) ⊆ M1 und K<(x, ε2) ⊆ M2. Es sei nun ε := min {ε1, ε2}. Dann gilt K<(x, ε) ⊆ Mi für i = 1, 2. Folglich liegt jeder Punkt y ∈ K<(x, ε) sowohl in M1 als auch in M2. Damit folgt K<(x, ε) ⊆ M1 ∩M2, was zu zeigen war. Durch Induktion erhält man, dass auch der Schnitt von n offenen Mengen M1, . . . ,Mn wieder offen ist. Es sei nun M := ⋃i∈I Mi für eine beliebige Indexmenge I und offene MengenMi für i ∈ I . Für x ∈ M gibt es dann einen Index i ∈ I mit x ∈ Mi . Da Mi offen ist, gibt es eine offene Kugel K<(x, εi ) ⊆ Mi ⊆ M . Folglich ist auch die Menge M offen. Zu b): Folgt aus Aussage a) zusammen mit den Regeln von De Morgan (vgl. (2.7)). 627 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn Bei der Anwendung des obigen Satzes ist zu beachten, dass der Durchschnitt von unendlich vielen offenen Mengen und die Vereinigung von unendlich vielen abgeschlossenen Mengen im Allgemeinen nicht wieder offen bzw. abgeschlossen ist. Für die offenen Kugeln K<(a, 1/k) um a mit den Radien 1 k erhält man zum Beispiel die abgeschlossene Menge ∞⋂ k=1 K<(a, 1/k) = {a} (vgl. Beispiel 21.19c)). Die nächste Folgerung fasst einige intuitive topologische Eigenschaften des Inneren, des Randes und des Abschlusses einer Menge M zusammen: Folgerung 21.21 (Topologische Eigenschaften von M◦, ∂M und M) Das Innere M◦ einer Menge M ⊆ Rn ist offen und der Rand ∂M sowie die abgeschlossene HülleM einer Menge M sind abgeschlossen. Beweis: Zu M◦: Für ein beliebiges x ∈ M◦ existiert gemäß der Definition des Inneren einer Menge ein ε > 0 mit K<(x, ε) ⊆ M . Ferner gibt es zu jedem y ∈ K<(x, ε) ⊆ M ein ε′ > 0 mit K<(y, ε′) ⊆ K<(x, ε) ⊆ M (vgl. Beispiel 21.16c)). Also gilt K<(x, ε) ⊆ M◦ und M◦ ist damit offen. Zu ∂M und M: Die erste Aussage dieser Folgerung besagt, dass das Innere M◦ einer beliebigen Menge M ⊆ Rn offen ist. Folglich ist (Rn \M)◦ offen. Nach Satz 21.20a) ist damit auch die Vereinigung M◦∪(Rn \M)◦ offen. Mit Satz 21.18a) erhält man somit, dass der Rand ∂M als Komplement der offenen Menge M◦ ∪ (Rn \M)◦ (vgl. (21.6)) abgeschlossen ist. Analog erhält man, dass die abgeschlossene Hülle M als Komplement der offenen Menge (Rn \M)◦ abgeschlossen ist. Beschränkte und kompakte Mengen Analog zur Beschränktheit einer Folge von Vektoren (vgl. Definition 21.9) wird eine Menge M ⊆ Rn als beschränkt bezeichnet, wenn eine Konstante c > 0 mit der Eigenschaft ‖x‖ ≤ c für alle x ∈ M existiert. Eine beschränkte Teilmenge M des Rn ist somit in einer hinreichend großen Kugelumgebung um den Ursprung 0 enthalten. Eine nicht beschränkte Menge heißt unbeschränkt. Ist eine beschränkte Menge M zusätzlich abgeschlossen, dann wird sie als kompakt bezeichnet. Definition 21.22 (Kompakte Menge) Eine Teilmenge M des Rn heißt kompakt, wenn sie beschränkt und abgeschlossen ist. Kompakte Mengen sind Verallgemeinerungen von endlichen abgeschlossenen Intervallen [a, b]. Kompakte Mengen besitzen für eine Reihe von theoretischen Überlegungen in den Wirtschaftswissenschaften im Zusammenhang mit stetigen Funktionen eine große Bedeutung (siehe Abschnitte 15.7 bis 15.10 und Abschnitt 21.7). Einer der Gründe hierfür ist, dass eine kompakte Menge M die schöne Eigenschaft besitzt, dass jede Folge aus M eine konvergente Teilfolge besitzt, deren Grenzwert ebenfalls in M liegt: Satz 21.23 (Charakterisierung kompakter Mengen) Eine Teilmenge M des Rn ist genau dann kompakt, wenn jede Folge (ak)k∈N0 mit ak ∈ M für alle k ∈ N0 eine Teilfolge besitzt, die gegen einen Grenzwert in M konvergiert. Beweis: Die Menge M sei kompakt, also beschränkt und abgeschlossen, und (ak)k∈N0 eine Folge mit ak ∈ M für alle k ∈ N0. Die Folge (ak)k∈N0 ist daher ebenfalls beschränkt und mit dem Satz von Bolzano-Weierstraß (vgl. Satz 21.11) erhält man somit, dass sie eine konvergente Teilfolge besitzt. Mit Satz 21.18b) folgt, dass der Grenzwert dieser Teilfolge in M liegt. Es gelte nun umgekehrt, dass jede Folge in M eine konvergente Teilfolge mit einem Grenzwert in M besitzt. Die Menge M ist dann beschränkt, denn sonst würde eine Folge (ak)k∈N0 mit ‖ak‖ → ∞ für k → ∞ existieren, und eine solche Folge besitzt im Widerspruch zur Annahme keine konvergente Teilfolge. Die Abgeschlossenheit von M folgt unmittelbar aus Satz 21.18b). Im folgenden Beispiel sind einige kompakte und nicht kompakte Mengen aufgeführt: Beispiel 21.24 (Kompakte und nicht kompakte Mengen) a) Die leere Menge ∅ ist beschränkt und abgeschlossen (vgl. (21.7)), also auch kompakt. Der euklidische Raum Rn ist dagegen nicht kompakt, da er nicht beschränkt ist. b) Die Menge {a} ist für einen beliebigen Punkt a ∈ Rn beschränkt und abgeschlossen (vgl. Beispiel 21.19c)), also auch kompakt. 628 Kapitel 2121.3 Reellwertige Funktionen in n Variablen c) Das rechtsseitig offene Intervall [0, 1) in R ist zwar beschränkt, aber nicht abgeschlossen, also auch nicht kompakt. Zum Beispiel liegen alle Folgeglieder von( 1 − 1 k ) k∈N im Intervall [0, 1). Die Folge und damit auch jede Teilfolge konvergiert aber gegen 1. Das heißt, ihr Grenzwert liegt nicht im Intervall [0, 1). d) Die abgeschlossene Kugel K≤(a, r) ist beschränkt und abgeschlossen, also auch kompakt. Die offene Kugel K<(a, r) ist dagegen nicht kompakt, da sie nicht abgeschlossen ist (vgl. Beispiel 21.19b)). e) Das abgeschlossene Intervall [a, b] im Rn mit a ≤ b ist beschränkt und abgeschlossen, also auch kompakt. Die Intervalle ]a, b], [a, b[ und ]a, b[ sind dagegen für a < b nicht abgeschlossen und folglich auch nicht kompakt (vgl. Beispiel 21.19d)). 21.3 Reellwertige Funktionen in n Variablen In Kapitel 13 wurden reellwertige Funktionen in einer Variablen (sogenannte reelle Funktionen) f : D ⊆ R −→ R, x %→ f (x) als Abbildungen eingeführt, die jedem x aus einer Teilmenge D der Menge R der reellen Zahlen genau eine reelle Zahl y = f (x) zuordnen. Reelle Funktionen sind damit zur Beschreibung wirtschaftswissenschaftlicher Zusammenhänge zwischen einer unabhängigen reellen Variablen x und einer abhängigen reellen Variablen y geeignet. In der Regel hängen jedoch ökonomische Größen nicht nur von einer, sondern von mehreren Einflussfaktoren ab. Zum Beispiel ist a) der Output bei einem Produktionsprozess vom Einsatz mehrerer Produktionsfaktoren, wie z. B. Rohstoffmengen, Kapital, Maschinenstunden, Anzahl von Arbeitskräften usw., abhängig (vgl. Beispiel 21.35) und b) der Wert einer Aktienoption wird vom aktuellen Preis der Aktie, dem Ausübungspreis, dem Ausübungszeitpunkt, der Volatilität des Aktienkurses und dem risikofreien Zinssatz am Finanzmarkt beeinflusst (vgl. Beispiel 21.52). Das heißt, viele wirtschaftswissenschaftliche Problemstellungen führen zu einer funktionalen Beziehung zwischen einer abhängigen Variablen y ∈ R und mehreren unabhängigen Variablen x1, . . . , xn ∈ R. Mit anderen Worten: Die wirtschaftswissenschaftliche Praxis ist in der Regel nicht eindimensional, sondern mehrdimensional. Dieses Kapitel und die Kapitel 22–25 sind daher der Erweiterung der Differentialund Integralrechnung sowie der Optimierungstheorie von reellwertigen Funktionen in einer reellen Variablen auf reellwertige Funktionen in mehreren reellen Variablen gewidmet. Bei einer reellwertigen Funktion in n reellen Variablen handelt es sich um eine Abbildung, die jedem n-dimensionalen Vektor x aus einer Teilmenge D des euklidischen Vektorraumes Rn genau eine reelle Zahl y = f (x) zuordnet. Definition 21.25 (Reellwertige Funktion in n reellen Variablen) Eine Funktion f : D ⊆ Rn −→ R, x %→ f (x) wird als reellwertige Funktion in n reellen Variablen bezeichnet. Für den Funktionswert einer reellwertigen Funktion in n reellen Variablen an der Stelle x = (x1, . . . , xn)T ∈ D schreibt man anstelle von f (x) häufig auch f (x1, . . . , xn). Im wichtigen Spezialfall einer reellwertigen Funktion f : D⊆R2 →R in zwei Variablen werden die beiden Variablen in der Regel nicht mit x1 und x2, sondern mit x und y bezeichnet. Analog werden im Fall einer reellwertigen Funktion f : D⊆R3→R für die drei Variablen x1, x2 und x3 die Bezeichnungen x, y und z verwendet. Graphische Darstellung Für viele Fragestellungen sind graphische Darstellungen von reellwertigen Funktionen in mehreren Variablen f : D ⊆ R n −→ R ein nützliches Hilfsmittel, um einen ersten Eindruck bezüglich des funktionalen Zusammenhangs zwischen den unabhängigen Variablen x1, . . . , xn und der abhängigen Variablen y zu erhalten. Der Graph der Funktion f , d. h. die Menge graph(f ) = {(x1, . . . , xn, f (x1, . . . , xn)) ∈ Rn+1 : x ∈ D } , ist eine solche Möglichkeit, die Funktion darzustellen. Dabei ist allerdings zu beachten, dass es sich bei graph(f ) um eine Teilmenge des Rn+1 handelt. Das heißt, der Graph einer reellwertigen Funktion in n Variablen kann nur in den beiden einfachsten Fällen n = 1 (eine unabhängige Variable) und n = 2 (zwei unabhängige Variablen) in einem kartesischen Koordinatensystem im R2 bzw. R3 veranschaulicht werden. Graphen von reellwertigen Funktionen in n = 1 reellen Va- 629 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn x −4 −2 0 2 4 y −4 −2 0 2 410 20 30 40 50 p1(x, y) = x2 + y2 x −4 −2 0 2 4 y −4 −2 0 2 4 −20 −10 0 10 20 p2(x, y) = x2 − y2 Abb. 21.6: Graphen der reellwertigen Funktionen p1 : R2 −→ R, (x, y) %→ x2 + y2 (links) und p2 : R2 −→ R, (x, y) %→ x2 − y2 (rechts) riablen wurden in den Kapiteln 13 bis 18 in großer Zahl gezeigt. In diesem und dem folgenden Kapitel werden nun viele Graphen reellwertiger Funktionen speziell in n = 2 Variablen dargestellt. Denn zum einen können – wie bereits erwähnt – die Graphen von reellwertigen Funktionen in mehr als zwei Variablen nicht mehr veranschaulicht werden und zum anderen lassen sich die wesentlichen Gesichtspunkte der Differential- und Integralrechnung sowie der Optimierungstheorie für Funktionen in mehreren Variablen bereits anhand von reellwertigen Funktionen in zwei Variablen verdeutlichen. Der Graph einer reellwertigen Funktion f : D ⊆ R2 −→ R, (x, y) %→ f (x, y) in zwei Variablen x und y kann dagegen im dreidimensionalen euklidischen Raum (Anschauungsraum) R3 eingezeichnet werden und ist gegeben durch die Menge graph(f )={(x, y, z)∈R3 : (x, y)∈D und z=f (x, y)}⊆R3. Die Menge graph(f ) stellt ein flächenartiges Gebilde im Anschauungsraum R3 dar, so dass jede Senkrechte, d. h. jede Parallele zur z-Achse (sogenannte Applikate), die Fläche höchstens einmal schneidet. Die Abbildung 21.6 zeigt zwei solche flächenartigen Gebilde. Bei diesen Flächen handelt es sich um die Graphen der beiden reellwertigen Funktionen p1 : R2 −→ R, (x, y) %→ x2 + y2 und p2 : R2 −→ R, (x, y) %→ x2 − y2. (21.8) Der Graph von p1 wird als Paraboloid bezeichnet. Diese Bezeichnung ist dadurch motiviert, dass für jede auf der x-y- Ebene senkrecht stehende Ebene, die den Ursprung enthält, die Schnittkurve mit dem Graphen von p1 eine Parabel ist. Dagegen heißt der Graph der Funktion p2 Sattelfläche, da er einem Pferdesattel bzw. einem Sattel im Gelände, der gleichzeitig einen Übergang zwischen zwei Bergen und zwei Tälern darstellt, ähnelt. Isohöhenlinienbilder Die Darstellung des Graphen ist jedoch auch bei reellwertigen Funktionen f von R2 nach R schnell relativ unübersichtlich. Aus diesem Grund werden in den Wirtschaftswissenschaften reellwertige Funktionen f in zwei Variablen häufig auch mit Hilfe sogenannter Isohöhenlinien (vom altgriechischen Wort „isos“ für „gleich“) – oder auch Niveaulinien genannt – veranschaulicht. Bei einer Isohöhenlinie zum Niveau c handelt es sich um die Menge aller Punkte der x-y- Ebene, für welche die Funktion f den Wert c annimmt, also f (x, y) = c gilt. Für eine reellwertige Funktion in n Variablen sind Isohöhenlinien wie folgt definiert: 630 Kapitel 2121.3 Reellwertige Funktionen in n Variablen p1(x, y) = x2 + y2 p2(x, y) = x2 − y2 Abb. 21.7: Isohöhenlinienbilder der reellwertigen Funktionp1 : R2 −→ R, (x, y) %→ x2+y2 mit den Isohöhenlinien zu den Niveaus c = 5, 10, 15, 20, 25, 30, 35, 40, 45 (links) und der reellwertigen Funktion p2 : R2 −→ R, (x, y) %→ x2 − y2 mit den Isohöhenlinien zu den Niveaus c = −20,−15,−10,−5, 0, 5, 10, 15, 20 (rechts) Definition 21.26 (Isohöhenlinie) Für eine reellwertige Funktion f : D ⊆ Rn −→ R in n Variablen und eine Konstante c ∈ R heißt die Menge If (c) := {(x1, . . . , xn) ∈ D : f (x1, . . . , xn) = c} Isohöhenlinie oder Niveaulinie der Funktion f zum Niveau c. Ein x ∈ If (c) wird als c-Stelle und speziell ein x ∈ If (0) als Nullstelle von f bezeichnet. Zum Beispiel sind auf einer Wetterkarte die Isohöhenlinien die Orte, die den gleichen Luftdruck (sogenannte Isobaren) oder die gleiche Temperatur (Isothermen) aufweisen. In der Ökonomie treten Isohöhenlinien beispielsweise in der Gestalt von Güterbündeln mit gleichem Nutzen (sogenannte Indifferenzkurven) oder als Inputkombinationen mit demselben Output (sogenannte Isoquanten) auf (vgl. auch Beispiel 21.35). Bei der Verwendung der Bezeichnung Isohöhenlinie oder Niveaulinie muss jedoch beachtet werden, dass If (c) selbst im Falle von n = 2 nicht unbedingt eine Linie (Kurve) sein muss und durchaus ganze Flächen umfassen kann. Werden für verschiedene Niveaus c die zugehörigen Isohöhenlinien einer reellwertigen Funktion f : D ⊆ R2 → R in die x-y-Ebene eingezeichnet, dann erhält man ein Isohöhenlinienbild der Funktion f . Ein Isohöhenlinienbild liefert oftmals eine gute Veranschaulichung des Verhaltens von f und ihres Graphen graph(f ). Zum Beispiel ist die Dichte der Isohöhenlinien ein Maß für die Steigung des Graphen. Liegen nämlich die Isohöhenlinien If (c) zu äquidistanten Niveaus c0, . . . , cn mit cn = c0 +nd in einem bestimmten Bereich eng beieinander, so ist der Graph über diesem Gebiet steil. Ist der Abstand zwischen den Isohöhenlinien dagegen weit, dann verläuft der Graph in diesem Bereich flach. Dies wird deutlich, wenn man die beiden Isohöhenlinienbilder in Abbildung 21.7 mit den zugehörigen Graphen in Abbildung 21.6 vergleicht. Die Isohöhenlinien If (c) einer Funktion f : R2 −→ R erhält man in der Regel dadurch, dass man die Gleichung f (x, y) = c nach der Variablen y auflöst. Für die beiden reellwertigen Funktionen p1 und p2 in (21.8) erhält man zum Beispiel c = x2 + y2 ⇒ y = ± √ c − x2 für |x| ≤ √c bzw. c = x2 − y2 ⇒ y = ± √ x2 − c für |x| ≥ √c. Somit ist z. B. die Isohöhenlinie zum Niveau c = 0 gegeben durch Ip1(0)={(0, 0)} bzw. Ip2 (0)= { (x, y)∈R2 : |x|=|y|} . Das heißt, bei der Funktion p1 besteht die Isohöhenlinie zum Niveau c = 0 nur aus dem Ursprung und bei der Funktion 631 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn p2 ist sie gegeben durch die beiden Diagonalen y = x und y = −x (vgl. Abbildung 21.7). Die Frage, wann eine Gleichung der Form c = f (x1, . . . , xn) nach einer der reellen Variablen x1, . . . , xn aufgelöst werden kann (analytisch oder numerisch), ist Gegenstand des Satzes über implizite Funktionen (siehe Satz 22.36 in Abschnitt 22.6). Rechenoperationen Der folgende Satz ist das Analogon zu Satz 13.2 für reelle Funktionen. Er besagt, dass die Rechenoperationen Addition, Subtraktion, Multiplikation und Division sowie die Maximums- und Minimumsbildung bei reellwertigen Funktionen in n Variablen f und g punktweise definiert werden können und dabei jeweils wieder eine reellwertige Funktion in n Variablen resultiert. Satz 21.27 (Rechenoperationen bei reellwertigen Funktionen in n Variablen) Es seien f : Df ⊆ Rn −→ R und g : Dg ⊆ Rn −→ R zwei reellwertige Funktionen in n Variablen mit Df ∩ Dg = ∅ und α ∈ R. Dann sind auch a) (αf ) : Df −→ R, x %→ (αf )(x) := αf (x), b) (f + g) : Df ∩Dg −→ R, x %→ (f + g)(x) := f (x)+ g(x), c) (f − g) : Df ∩Dg −→ R, x %→ (f − g)(x) := f (x)− g(x), d) (f · g) : Df∩Dg−→R, x %→(f ·g)(x) :=f (x)·g(x), e) ( f g ) : Df ∩Dg \ {x ∈ Dg : g(x) = 0} −→ R, x %→ ( f g ) (x) := f (x) g(x) , f) max {f, g} : Df ∩Dg−→R, x %→max{f, g} (x) :=max {f (x), g(x)} und g) min {f, g} : Df ∩Dg −→ R, x %→ min {f, g} (x) := min {f (x), g(x)} reellwertige Funktionen in n Variablen. Beweis: Die Aussagen sind unmittelbar einleuchtend. 21.4 Spezielle reellwertige Funktionen in n Variablen Nachfolgend werden einige wichtige Klassen von reellwertigen Funktionen in mehreren Variablen eingeführt. Bei diesen Funktionsklassen handelt es sich zum großen Teil um direkte Verallgemeinerungen der in Kapitel 14 eingeführten Klassen von reellwertigen Funktionen in einer Variablen, wie zum Beispiel der Klasse der Polynome oder der rationalen Funktionen. Die folgende Darstellung ist daher bewusst kurz gehalten. Polynome Analog zu reellwertigen Funktionen in einer Variablen stellen Polynome in n Variablen eine besonders einfache und bedeutende Klasse von Funktionen dar. Sie besitzen viele gute mathematische Eigenschaften und sind analytisch besonders leicht handhabbar. Definition 21.28 (Polynom m-ten Grades in n Variablen) Eine reellwertige Funktion f : D ⊆ Rn −→ R mit p(x1, . . . , xn) = m1∑ k1=0 m2∑ k2=0 · · · mn∑ kn=0 ak1k2 ...knx k1 1 x k2 2 · · · xknn (21.9) und ak1k2 ...kn ∈ R für ki = 0, . . . , mi , mi ∈ N0 und i = 1, . . . , n heißt Polynom (ganz-rationale Funktion) m-ten Grades in n Variablen, falls m=max { n∑ i=1 ki: ak1k2 ...kn =0 } gilt. Die Zahl m wird dann Grad des Polynoms genannt und mit Grad(p) := m bezeichnet. Die reellen Zahlen ak1k2 ...kn ∈ R heißen Koeffizienten des Polynoms p. Durch Addition, Subtraktion und Multiplikation zweier Polynome p1 und p2 entsteht mit p1 + p2, p1 − p2 bzw. p1p2 wieder ein Polynom in n Variablen. Für den Grad des resultierenden Polynoms gilt dabei: Grad(p1 + p2) ≤ max {Grad(p1),Grad(p2)} Grad(p1 − p2) ≤ max {Grad(p1),Grad(p2)} Grad(p1p2) = Grad(p1)+ Grad(p2) Wichtige Spezialfälle eines Polynoms p in n Variablen resultieren für den Grad m = 1 und den Grad m = 2: 632 Kapitel 2121.4 Spezielle reellwertige Funktionen in n Variablen • m = 1 führt zu affin-linearen Funktionen in n Variablen: p(x1, . . . , xn) = a0 + a1x1 + . . .+ anxn = a0 + n∑ i=1 aixi Mit a = (a1, . . . , an)T und x = (x1, . . . , xn)T erhält man für p die alternative Darstellung p(x1, . . . , xn) = a0 + aT x. Gilt speziell a0 = 0, dann wird p auch als Linearform bezeichnet (vgl. (10.39)). • m = 2 führt zu quadratischen Funktionen in n Variablen: p(x1, . . . , xn) = a0 + a1x1 + . . .+ anxn + a11x1x1 + a12x1x2 + . . .+ a1nx1xn + a21x2x1 + a22x2x2 + . . .+ a2nx2xn ... ... ... + an1xnx1 + an2xnx2 + . . .+ annxnxn = a0 + n∑ i=1 aixi + n∑ i=1 n∑ j=1 aij xixj Mit a = (a1, . . . , an)T , A = ⎛ ⎜ ⎝ a11 . . . a1n ... . . . ... an1 . . . ann ⎞ ⎟ ⎠ und x = (x1, . . . , xn)T erhält man für p die deutlich kompaktere Darstellung p(x1, . . . , xn) = a0 + aT x + xT A x. Gilt speziell a0 = 0 und a = 0, dann geht die quadratische Funktion p in eine quadratische Form p(x1, . . . , xn) = xT A x = n∑ i=1 n∑ j=1 aij xixj über, die bereits Gegenstand von Abschnitt 10.6 war. Beispiel 21.29 (Polynome in n Variablen) a) Bei den drei reellwertigen Funktionen p1 : R2 −→ R, (x, y) %→ x2 + y2, p2 : R2 −→ R, (x, y) %→ x2 − y2 und p3 : R2 −→ R, (x, y) %→ 3 + x − 7y + 3xy + x2 handelt es sich jeweils um ein Polynom in zwei Variablen vom Grad m = 2 (vgl. Abbildung 21.6). b) Bei den beiden reellwertigen Funktionen p1 : R2 −→ R, (x, y) %→ 3+x−4y+3x2y+ 1 10 x4 und p2 : R2 −→ R, (x, y) %→ 2+x−7xy+ 3 10 x2y−xy3+ 1 100 y5 handelt es sich jeweils um ein Polynom in zwei Variablen vom Grad m = 4 bzw. m = 5 (vgl. Abbildung 21.8). c) Bei den beiden reellwertigen Funktionen p1 :R3−→R, (x1, x2, x3) %→ x1 + 2x3 + 5x1x2 − 3x1x2x3 + 2x31x2 + 5x21x32x23 und p2 :R4 −→R, (x1, x2, x3, x4) %→ 1 + x1x2x3x4 + 2x31x22x34 handelt es sich jeweils um ein Polynom in drei bzw. vier Variablen vom Grad m = 7 bzw. m = 8. Rationale Funktionen Analog zu rationalen Funktionen in einer Variablen sind rationale Funktionen in n Variablen als Quotienten zweier Polynome definiert. Definition 21.30 (Rationale Funktionen in n Variablen) Es seien p1(x) und p2(x) zwei Polynome in n Variablen. Dann heißt die reelle Funktion q : D ⊆ Rn −→ R, x %→ q(x) : = p1(x) p2(x) mit D = {x ∈ Rn : p2(x) = 0} rationale Funktion in n Variablen. Offensichtlich ist die Klasse der Polynome in nVariablen eine Teilklasse der rationalen Funktionen in n Variablen. Für eine kleine Auswahl von expliziten rationalen Funktionen siehe das folgende Beispiel: 633 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn x −4 −2 0 2 4 y −4 −2 0 2 4 −200 0 200 400 p1(x, y) = 3 + x − 4y + 3x2y + 1 10 x4 x −4 −2 0 2 4 y −4 −2 0 2 4−500 0 500 p2(x, y) = 2 + x − 7xy + 3 10 x2y − xy3 + 1 100 y5 Abb. 21.8: Graphen der Polynome p1 : R2 −→ R, (x, y) %→ 3 + x − 4y + 3x2y + 110 x4 (links) und p2 : R2 −→ R, (x, y) %→ 2 + x − 7xy + 310 x2y − xy3 + 1100 y5 (rechts) Beispiel 21.31 (Rationale Funktionen in nVariablen) a) Bei den beiden reellwertigen Funktionen q1 : R2 −→ R, (x, y) %→ 2xy x2 + y2 + 1 und q2 : R2 −→ R, (x, y) %→ x 3 + y3 (x2 + y2)2 + 1 handelt es sich jeweils um eine rationale Funktion in zwei Variablen. Da der Nenner für alle (x, y) ∈ R2 jeweils ungleich Null ist, sind q1 und q2 auf ganz R2 definiert (vgl. Abbildung 21.9). b) Bei den beiden reellwertigen Funktionen q1 : D1 ⊆ R3 −→ R, (x1, x2, x3) %→ x1 + x 2 2 + x3 x1x2 + x22x23 + x1x3 und q2 : D2 ⊆ R4 −→ R, (x1, x2, x3, x4) %→ x1x3 + x 3 3 − 3x2x34 2 + 2x1x2x23 + x22x24 mit D1= { (x1, x2, x3)∈R3 : x1x2+x22x23 +x1x3 =0 } und D2 = { (x1, x2, x3, x4)∈R4 : 2+2x1x2x23 +x22x24 =0 } handelt es sich um rationale Funktionen in drei bzw. vier Variablen. Algebraische und transzendente Funktionen Rationale Funktionen in n reellen Variablen x1, . . . , xn sind dadurch charakterisiert, dass sie sich durch endlich viele Additionen, Subtraktionen, Multiplikationen und Divisionen aus den Variablen x1, . . . , xn erzeugen lassen. Lässt man auch die algebraischen Operationen Potenzieren und Radizieren zu, dann gelangt man zur großen Klasse der algebraischen Funktionen in n Variablen. Definition 21.32 (Algebraische und transzendente Funktionen in n Variablen) Eine reellwertige Funktion f : D ⊆ Rn −→ R in n Variablen x1, . . . , xn heißt algebraisch, wenn sie sich in endlich vielen Schritten durch Addition, Subtraktion, Multiplikation, Division, Potenzieren und Radizieren aus den n Variablen x1, . . . , xn konstruieren lässt. Andernfalls wird die Funktion f als transzendent bezeichnet. Wurzelfunktionen sind Beispiele für algebraische Funktionen, die nicht zur Klasse der rationalen Funktionen in nVariablen gehören. Beispiele für transzendente Funktionen in nVariablen sind alle Funktionen, in denen Exponential-, Winkeloder Logarithmusfunktionen vorkommen. 634 Kapitel 2121.4 Spezielle reellwertige Funktionen in n Variablen x −4 −2 0 2 4 y −4 −2 0 2 4 −0.5 0.0 0.5 q1(x, y) = 2xy x2 + y2 + 1 x −4 −2 0 2 4 y −4 −2 0 2 4−0.4 −0.2 0.0 0.2 0.4 q2(x, y) = x3 + y3 (x2 + y2)2 + 1 Abb. 21.9: Graphen der rationalen Funktionen q1 : R2 −→ R, (x, y) %→ 2xyx2+y2+1 (links) und q2 : R 2 −→ R, (x, y) %→ x3+y3 (x2+y2)2+1 (rechts) Beispiel 21.33 (Algebraische und transzendente Funktionen in n Variablen) a) Bei den drei reellwertigen Funktionen f1 : D1 ⊆ R2 −→ R, (x, y) %→ √ x2 + y2 1 +√1 − y2 , f2 : D2 ⊆ R2 −→ R, (x, y) %→ x 32 y− 14 und f3 : D3 ⊆ R4 −→ R, (x1, x2, x3, x4) %→ x 1 2 1 x 4 2x 3 2 3 x − 14 4√ 2x21 + x43 + 2x24 mit D1 = { (x, y) ∈ R2 : y ∈ [−1, 1]} , D2 = { (x, y) ∈ R2 : x ≥ 0, y > 0} und D3 = { (x1, x2, x3, x4) ∈ R4 : x1, x3 ≥ 0, x4 > 0 } handelt es sich um algebraische Funktionen in zwei bzw. vier Variablen, die keine rationalen Funktionen sind (vgl. Abbildung 21.10). b) Bei den vier reellwertigen Funktionen f1 : R2 −→ R, (x, y) %→ sin(x) cos(y), f2 : R2 \ {0} −→ R, (x, y) %→ 10√ x2 + y2 sin (√ x2 + y2 ) , f3 : R3 −→ R, (x1, x2, x3) %→ ( x21 + x22 + x23 ) exp(x1x2x3) und f4 : R4 \ {0} −→ R, (x1, x2, x3, x4) %→sin (e x1 + ex2 + ex3 + ex4 ) ln(x21 + x22 + x23 + x24 ) handelt es sich um transzendente Funktionen in zwei, drei bzw. vier Variablen (vgl. Abbildung 21.11). C. F. Gauß auf seinem Totenbett 1855 In Beispiel 18.19 wurde bereits die nach dem deutschen Mathematiker Carl Friedrich Gauß (1777–1855) benannte eindimensionale Gauß-Verteilung betrachtet. Im folgenden Beispiel wird nun ihr mehrdimensionales Gegenstück, die n-dimensionale Gauß-Verteilung (Normal-Verteilung) vorgestellt. Ihre Dichtefunktion ist eine Exponentialfunktion in n Variablen und damit eine transzendente 635 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn x −2 −1 0 1 2 y −1.0 −0.5 0.0 0.5 1.00.5 1.0 1.5 2.0 f1(x, y) = x2 + y2 1 + 1 − y2 x 0.0 0.2 0.4 0.6 0.8 1.0 y 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 f2(x, y) = x 3 2y− 1 4 Abb. 21.10: Graphen der algebraischen Funktionen f1 : D1 ⊆ R2 −→ R, (x, y) %→ √ x2+y2 1+ √ 1−y2 (links) und f2 : D2 ⊆ R 2 −→ R, (x, y) %→ x 32 y− 14 (rechts) x −2 0 2 4 6 y −2 0 2 4 6−0.5 0.0 0.5 f1(x, y) = sin(x)cos (y) x −10 −5 0 5 10 y −10 −5 0 5 10 −2 0 2 4 6 8 f2(x, y) = 10 x2 + y2 s in⎛⎝ x 2 + y2 ⎞⎠ Abb. 21.11: Graphen der transzendenten Funktionen f1 : R2 −→ R, (x, y) %→ sin(x) cos(y) (links) und f2 : R2 \ {0} −→ R, (x, y) %→ 10√ x2+y2 sin (√ x2 + y2 ) (rechts) Funktion. Die n-dimensionale Gauß-Verteilung ist die bedeutendste Wahrscheinlichkeitsverteilung der multivariaten Statistik. 636 Kapitel 2121.4 Spezielle reellwertige Funktionen in n Variablen x −4 −2 0 2 4 y −4 −2 0 2 4 0.05 0.10 0.15 f1(x, y) = 1 2π exp ⎛ ⎝⎜ − 1 2 (x2 + y2)⎞ ⎠⎟ x 20 30 40 50 60 y 10 15 20 25 30 0.000 0.001 0.002 0.003 0.004 0.005 f2(x, y) = 1 2πσ1σ2 1 − ρ2 exp ⎛ ⎝⎜ − 1 2 r(x, y)⎞ ⎠⎟ Abb. 21.12: Dichtefunktion f1 : R2 −→ R, (x, y) %→ f (x, y) = 12π exp ( − 12 ( x2 + y2 )) einer zweidimensionalen Standardnormalverteilung (links) und Dichtefunktion f2 : R2 −→ R, (x, y) %→ f (x, y) = 1 2πσ1σ2 √ 1−ρ2 exp ( − 12 r(x, y) ) einer zweidimensionalen Gauß-Verteilung mit μ1 = 40, μ2 = 20, σ1 = 4, σ2 = 10 und ρ = 0,7 (rechts) Beispiel 21.34 (n-dimensionale Gauß-Verteilung) Die n-dimensionale Gauß-Verteilung besitzt die n-dimensionale Dichtefunktion f : Rn −→ R, (21.10) x %→ f (x) = 1 (2π) n 2 √ det( ) · exp ( −1 2 (x − μ)T −1 (x − μ) ) . Dabei bezeichnen μ ∈ Rn und ∈M(n, n) mit det( ) >0 den sogenannten n-dimensionalen Erwartungswertvektor bzw. die (symmetrische) n× n-Kovarianzmatrix der Gauß-Verteilung. Für n = 2 mit dem zweidimensionalen Erwartungswertvektor μ = (μ1, μ2)T und der 2 × 2-Kovarianzmatrix = ( σ 21 σ1σ2ρ σ1σ2ρ σ 2 2 ) mit σ1, σ2 >0 und ρ∈(−1, 1) erhält man det( ) = σ 21 σ 22 (1 − ρ2) und −1 = ( 1 σ 21 (1−ρ2) − ρ σ1σ2(1−ρ2) − ρ σ1σ2(1−ρ2) 1 σ 22 (1−ρ2) ) (vgl. (8.42)–(8.43)) und damit aus (21.10) die zweidimensionale Dichtefunktion f : R2 −→ R, (x, y) %→ f (x, y) = 1 2πσ1σ2 √ 1 − ρ2 exp ( −1 2 r(x, y) ) mit r(x, y) := 1 1 − ρ2 · [( x−μ1 σ1 )2 −2ρ ( x−μ1 σ1 )( y−μ2 σ2 ) + ( y−μ2 σ2 )2] (vgl. Abbildung 21.12, rechts). Für μ1 = μ2 = 0, σ1 = σ2 = 1 und ρ = 0 erhält man daraus mit f : R2 →R, (x, y) %→f (x, y)= 1 2π exp ( −1 2 ( x2 + y2) ) die Dichtefunktion der zweidimensionalen Standardnormalverteilung zweier (stochastisch) unabhängiger Zufallsvariablen (vgl. Abbildung 21.12, links). 637 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn Homogene Funktionen Eine reellwertige Funktion f : D −→ R mit D ⊆ Rn heißt homogen vom Grad β ∈ R, wenn f (γ x1, . . . , γ xn) = γ βf (x1, . . . , xn) für alle x ∈ D und γ > 0 gilt. Eine homogene Funktion vom Grad β heißt auch a) unterlinear-homogen, falls β < 1, b) linear-homogen, falls β = 1, und c) oberlinear-homogen, falls β > 1 gilt. Bei einer homogenen Funktion vom Grad β führt eine proportionale Änderung aller n Variablen x1, . . . , xn um einen Proportionalitätsfaktor γ zu einer Veränderung des Funktionswertes f (x1, . . . , xn) um den Faktor γ β . Viele Funktionen in den Wirtschaftswissenschaften besitzen die Eigenschaft der Homogenität. Hierzu zählen zum Beispiel Produktionsfunktionen, die bei der Beschreibung der Produktionsmenge eines Unternehmens in Abhängigkeit von Produktionsfaktoren verwendet werden. Speziell von linearhomogenen Produktionsfunktionen sagt man, dass sie das ökonomische Phänomen der konstanten Skalenerträge darstellen. Bei solchen Produktionsfunktionen f führt eine Verdopplung aller Inputs x1, . . . , xn zu einer Verdopplung des Outputs y = f (x1, . . . , xn). Das folgende Beispiel liefert eine kleine Aufstellung der wichtigsten (homogenen) Produktionsfunktionen: Beispiel 21.35 (Produktionsfunktionen) In den Wirtschaftswissenschaften werden die unterschiedlichsten Produktionsfunktionen betrachtet. Dabei handelt es sich um reellwertige Funktionen f : (0,∞)n → R in n Variablen, welche die Beziehung zwischen den eingesetzten Mengen von n Produktionsfaktoren (Inputs) x1, . . . , xn und der sich daraus ergebenden Menge y = f (x1, . . . , xn) des produzierten Produktes (Output) beschreiben. Für einen Output c∈R enthält die Isohöhenlinie If (c)={(x1, . . . , xn)∈(0,∞)n : f (x1, . . . , xn) = c} alle möglichen Mengenkombinationen der n Inputs, mit denen der Output c erzeugt werden kann. Die Menge If (c) wird deshalb auch als Isoquante von f zum Produktionsniveau c bezeichnet. Bekannte Produktionsfunktionen sind: a) Die CES-Produktionsfunktion f : (0,∞)n −→ R, x %→ f (x) := α0 ( n∑ i=1 αix d i ) 1 d mit α0, . . . , αn, d ∈ (0,∞). Dabei steht die Abkürzung CES für „constant elasticity of substitution“. Die CES-Produktionsfunktion wurde 1961 von den US-amerikanischen Ökonomen und Wirtschaftsnobelpreisträgern Kenneth Arrow (*1921) und Robert Merton Solow (*1924) sowie von dem US-amerikanischen Ökonomen Hollis Burnley Chenery (1918–1994) und dem indischen Ökonomen Bagicha Singh Minhas (1929–2005) (sogenannte K. Arrow (sogenannte Stanford-Gruppe) entwickelt. Für die CES-Produktionsfunktion gilt f (γ x) = γf (x) für alle x ∈ (0,∞)n und γ > 0, sie ist also linearhomogen (vgl. Abbildung 21.13, links). b) Die Cobb-Douglas-Produktionsfunktion f : (0,∞)n −→ R, x %→ f (x) := α0 n∏ i=1 x αi i mit α0, . . . , αn ∈ (0,∞) ist nach den beiden US-amerikanischen Ökonomen Charles Wiggins Cobb (1875–1949) und Paul Howard Douglas (1892–1976) benannt. Für die Cobb-Douglas-Produktionsfunktion gilt P. H. Douglas f (γ x) = γ∑ni=1 αi f (x) für alle x ∈ (0,∞)n und γ > 0. Sie ist also homogen vom Grad ∑n i=1 αi (vgl. Abbildung 21.13, rechts). 638 Kapitel 2121.5 Eigenschaften von reellwertigenFunktionen in n Variablen x 0 2 4 6 8 10 y 0 2 4 6 8 10 0 5 10 f (x, y) = 3 x3 + y3 x 0 2 4 6 8 10 y 0 2 4 6 8 10 0 2 4 6 8 10 f (x, y) = x13 y23 Abb. 21.13: CES-Produktionsfunktion f : (0,∞)2 −→ R, (x, y) %→ 3 √ x3 + y3 für α0 = α1 = α2 = 1 und d = 3 (links) und Cobb-Douglas-Produktionsfunktion f : (0,∞)2 −→ R, (x, y) %→ x 13 y 23 für α0 = 1, α1 = 13 und α2 = 23 (rechts) c) Die Leontief-Produktionsfunktion f : (0,∞)n −→ R, x %→f (x) :=α0 min i=1,...,n {αixi} mit α0, . . . , αn ∈ (0,∞) geht auf den russischen Ökonomen und Wirtschaftsnobelpreisträger Wassily Leontief (1905–1999) zurück. Für die Leontief-Produktionsfunktion gilt f (γ x) = γf (x) für alle x ∈ (0,∞)n und γ > 0, sie ist also linear-homogen. W. Leontief 21.5 Eigenschaften von reellwertigen Funktionen in n Variablen In diesem Abschnitt werden die in Kapitel 13 für reellwertige Funktionen in einer Variablen eingeführten Begriffe Beschränktheit, Konvexität, Konkavität, Minimum und Maximum auf reellwertige Funktionen in nVariablen verallgemeinert. Beschränktheit Der Begriff Beschränktheit ist für reellwertige Funktionen in n Variablen völlig analog zu reellen Funktionen definiert (vgl. Definition 13.5). Definition 21.36 (Beschränkte reellwertige Funktion in n Variablen) Eine reellwertige Funktion f : D ⊆ Rn −→ R heißt auf A ⊆ D nach unten (oben) beschränkt, falls f (x) ≥ c (bzw. f (x) ≤ c) für ein c ∈ R und alle x ∈ A gilt. Die Funktion f wird als beschränkt auf A ⊆ D bezeichnet, falls |f (x)| ≤ c für ein c ∈ R und alle x ∈ A erfüllt ist. Ist f auf A ⊆ D nicht nach unten (oben) beschränkt, dann heißt f nach unten (oben) unbeschränkt auf A ⊆ D. 639 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn Eine reellwertige Funktion f : D ⊆ Rn −→ R ist also genau dann beschränkt, wenn f (x) ∈ [−c, c] für alle x ∈ D und ein c ∈ R gilt. Ein solcher Wert c heißt Schranke von f . Analog wird ein Wert c mit f (x) ≤ c für alle x ∈ D als obere Schranke und ein Wert c mit f (x) ≥ c für alle x ∈ D als untere Schranke von f bezeichnet. Beispiel 21.37 (Beschränktheit bei reellwertigen Funktionen in n Variablen) a) Das Polynom p1 : R2 −→ R, (x, y) %→ x2 + y2 besitzt zum Beispiel die untere Schranke c = 0 und ist auf R2 nach oben unbeschränkt. Dagegen ist das Polynom p2 : R2 −→ R, (x, y) %→ x2 − y2 auf R2 sowohl nach unten als auch nach oben unbeschränkt (vgl. Abbildung 21.6). b) Die rationale Funktion q1 : R2 −→ R, (x, y) %→ 2xy x2+y2+1 ist auf R 2 sowohl nach unten als auch nach oben beschränkt. Zum Beispiel ist c = −1 eine untere und c = 1 eine obere Schranke von q1 (vgl. Abbildung 21.9, links). Konvexität und Konkavität In Definition 13.14 wurden (streng) konvexe und (streng) konkave Funktionen in einer Variablen definiert. Für reellwertige Funktionen in n Variablen sind die Krümmungseigenschaften Konvexität und Konkavität völlig analog erklärt. Konvexe und konkave Funktionen in einer oder mehreren Variablen spielen in der Praxis der Optimierungstheorie eine große Rolle (siehe hierzu auch Abschnitt 24.5). Zum Beispiel führen in vielen ökonomischen Problemstellungen Annahmen an die Risikoaversion, Mischungspräferenz, sinkende Skalenerträge usw. auf natürliche Weise zu konvexen bzw. konkaven reellwertigen Funktionen. Darüber hinaus besitzen konvexe und konkave Funktionen für die Optimierungstheorie „angenehme Eigenschaften“ (siehe z. B. Satz 21.43). Definition 21.38 (Konvexe und konkave Funktion) Es seien f : D ⊆ Rn −→ R eine reellwertige Funktion und D eine konvexe Teilmenge des Rn. Dann gilt: a) Die Funktion f heißt konvex, falls f (λx1+(1−λ)x2)≤λf (x1)+(1−λ)f (x2) (21.11) für alle x1, x2 ∈ D mit x1 = x2 und λ ∈ (0, 1) gilt, und streng konvex, falls in (21.11) auch die strikte Ungleichung < erfüllt ist. b) Die Funktion f heißt konkav, falls f (λx1 + (1 − λ)x2) ≥ λf (x1)+ (1 − λ)f (x2) (21.12) für alle x1, x2 ∈ D mit x1 = x2 und λ ∈ (0, 1) gilt, und streng konkav, falls in (21.12) auch die strikte Ungleichung > erfüllt ist. Eine konvexe (konkave) Funktion f : D ⊆ Rn −→ R besitzt die Eigenschaft, dass der Funktionswert f (λx1 + (1 − λ)x2) einer beliebigen Konvexkombination λx1 + (1 − λ)x2 von x1, x2 ∈ D stets unterhalb (oberhalb) oder auf der Verbindungsgeraden (Sehne) y = λf (x1) + (1 − λ)f (x2) mit λ ∈ [0, 1] der beiden Punkte (x1, f (x1)) und (x2, f (x2)) liegt. Eine Funktion f : D ⊆ Rn −→ R ist damit genau dann (streng) konkav, wenn die Funktion −f (streng) konvex ist und umgekehrt. Beispiel 21.39 (Krümmungseigenschaften bei Funktionen in n Variablen) Für das Polynom p1 : R2 −→ R, (x, y) %→ x2 + y2 erhält man mit x1 := (x1, y1)T , x2 := (x2, y2)T und dem Ergebnis aus Beispiel 13.16a) p1(λx1 + (1 − λ)x2) = p1(λx1 + (1 − λ)x2, λy1 + (1 − λ)y2) = (λx1 + (1 − λ)x2)2 + (λy1 + (1 − λ)y2)2 < λx21 + (1 − λ)x22 + λy21 + (1 − λ)y22 = λ(x21 + y21 )+ (1 − λ)(x22 + y22 ) = λp1(x1)+ (1 − λ)p1(x2) für alle λ ∈ (0, 1). Das heißt, das Polynom p1 ist streng konvex und das Polynomp2 := −p1, alsop2 : R2 −→ R, (x, y) %→ −x2 − y2, damit streng konkav (vgl. Abbildung 21.6, links). Viele der für konvexe und konkave Funktionen in einer Variablen geltenden Resultate, wie z. B. die Sätze 13.17 und 13.21, lassen sich problemlos auch auf konvexe und konkave Funktionen in nVariablen verallgemeinern. In Abschnitt 22.7 wird sich ferner zeigen, dass analog zu reellwertigen Funktionen 640 Kapitel 2121.5 Eigenschaften von reellwertigen Funktionen in n Variablen in einer Variablen auch die Krümmungseigenschaften von reellwertigen Funktionen in n Variablen häufig sehr einfach mit Hilfe der Differentialrechnung ermittelt werden können (siehe Satz 22.45). Minimum und Maximum Auch bei reellwertigen Funktionen f :D⊆Rn→R in n Variablen unterscheidet man zwischen globalem Minimum und Maximum und lokalem Minimum und Maximum. In einer globalen Minimalstelle nimmt die Funktion f ihren kleinsten und in einer globalen Maximalstelle ihren größten Funktionswert an. Definition 21.40 (Globale Extrema bei einer Funktion in n Variablen) Für eine reellwertige Funktion f : D ⊆ Rn −→ R gilt: a) Ein x0 ∈ U ⊆ D mit f (x0) ≤ f (x) für alle x ∈ U wird als globale (absolute) Minimalstelle und der zugehörige Funktionswert f (x0) als globales (absolutes) Minimum von f auf U bezeichnet. Für f (x0) schreibt man dann minx∈U f (x). Ist U = D, so sagt man, dass die Funktion f das globale (absolute) Minimum minx∈D f (x) besitzt. b) Ein x0 ∈ U ⊆ D mit f (x0) ≥ f (x) für alle x ∈ U wird als globale (absolute) Maximalstelle und der zugehörige Funktionswert f (x0) als globales (absolutes) Maximum von f auf U bezeichnet. Für f (x0) schreibt man dann maxx∈U f (x). Ist U = D, so sagt man, dass die Funktion f das globale (absolute) Maximum maxx∈D f (x) besitzt. Die globalen Minimal- und Maximalstellen einer Funktion f : D ⊆ Rn −→ R auf einer Teilmenge U ⊆ D werden oft zusammenfassend als globale Extremalstellen oder globale Optimalstellen von f auf U bezeichnet. Analog werden das zugehörige globale Minimum und Maximum unter der Bezeichnung globale Extremalwerte oder globale Optimalwerte von f auf U zusammengefasst. Während ein globales Minimum und Maximum auf einer Teilmenge U ⊆ D den kleinsten bzw. den größten Funktionswert darstellen, wird mit lokalem Minimum und lokalem Maximum an einer Stelle x0 der kleinste bzw. der größte Funktionswert von f lediglich in einer lokalen Umgebung K<(x0, ε) = {x ∈ Rn : ‖x − x0‖ < ε} um x0 für ein geeignetes ε > 0 bezeichnet. Die präzise Definition lautet wie folgt: Definition 21.41 (Lokale Extrema bei einer Funktion in n Variablen) Für eine reellwertige Funktion f : D ⊆ Rn −→ R gilt: a) Ein x0 ∈ D mit f (x0) ≤ f (x) für alle x ∈ D ∩ K<(x0, ε) und ein geeignetes ε > 0 wird als lokale (relative) Minimalstelle und der zugehörige Funktionswert f (x0) als lokales (relatives) Minimum von f bezeichnet. Für f (x0) schreibt man dann minx∈D∩K<(x0,ε) f (x). b) Ein x0 ∈ D mit f (x0) ≥ f (x) für alle x ∈ D ∩ K<(x0, ε) und ein geeignetes ε > 0 wird als lokale (relative) Maximalstelle und der zugehörige Funktionswert f (x0) als lokales (relatives) Maximum von f bezeichnet. Für f (x0) schreibt man dann maxx∈D∩K<(x0,ε) f (x). Für (globale und lokale) Minima und Maxima wird oft der Sammelbegriff Extremal- oder Optimalwerte verwendet. Analog verwendet man für (globale und lokale) Minimalund Maximalstellen häufig die zusammenfassende Bezeichnung Extremal- oder Optimalstellen. Eine lokale Extremalstelle ist im Allgemeinen keine globale Extremalstelle (vgl. Beispiel 21.42c)). Umgekehrt ist jedoch eine globale Extremalstelle stets auch eine lokale Extremalstelle. Analog zu reellwertigen Funktionen in einer Variablen können auch reellwertige Funktionen in n Variablen mehrere lokale und globale Minimal- und Maximalstellen besitzen. Ferner können sie auch mehrere lokale Minima und Maxima aufweisen, während sie jedoch höchstens ein globales Minimum und höchstens ein globales Maximum besitzen (vgl. Beispiel 21.42c)). Beispiel 21.42 (Extremalstellen bei reellwertigen Funktionen in n Variablen) a) Für das Polynom p : R2 →R, (x, y) %→ p(x, y) = − 12 ( x2 + y2) gilt für alle (x, y) ∈ R2: p(x, y) ≤ 0 und p(0, 0) = 0 641 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn x −6 −4 −2 0 2 y −2 0 2 420 40 60 80 100 p(x, y) = 4(x + 2)2 + 3(y − 1)2 + 1 x −1.0 −0.5 0.0 0.5 1.0 y −1.0 −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 1.0 p(x, y) = 2x4 + y4 − 2x2 − 2y2 Abb. 21.14: Polynom p : R2 −→ R, (x, y) %→ p(x, y) = 4(x + 2)2 + 3(y − 1)2 + 1 (links) und Polynom p : R2 −→ R, (x, y) %→ p(x, y) = 2x4 + y4 − 2x2 − 2y2 (rechts) Es besitzt also im Ursprung (0, 0) eine globale Maximalstelle mit maxx∈R2 p(x) = 0. Da die Exponentialfunktion streng monoton wachsend ist, folgt daraus, dass die Dichtefunktion der zweidimensionalen Standardnormalverteilung f : R2 −→ R, (x, y) %→ f (x,y) = 12π exp (− 12 ( x2+y2)) im Ursprung (0, 0) ebenfalls ein globales Maximum besitzt und maxx∈R2 f (x)= 12π gilt (vgl. Abbildung 21.12, links). b) Für das Polynom p : R2 −→R, (x, y) %→p(x, y) = 4(x + 2)2 + 3(y − 1)2 + 1 gilt für alle (x, y) ∈ R2 p(x, y) ≥ 1 und p(−2, 1) = 1. Das Polynom p besitzt somit eine globale Minimalstelle bei (−2, 1) ∈ R2 mit minx∈R2 p(x) = 1 (vgl. Abbildung 21.14, links). c) Das Polynom p : R2 −→ R, (x, y) %→ p(x, y) = 2x4+y4−2x2−2y2 besitzt an der Stelle (0, 0) ein lokales (aber kein globales) Maximum mit dem Funktionswert 0 und an den vier Stellen ( 1√ 2 ,1 ) , ( 1√ 2 ,−1 ) , ( − 1√ 2 ,1 ) und ( − 1√ 2 ,−1 ) jeweils ein globales Minimum mit minx∈R2 p(x) = − 32 (vgl. die beiden Beispiele 24.2b) und 24.11a) in Abschnitt 24.2 sowie Abbildung 21.14, rechts). Ein lokales Maximum (Minimum) einer reellwertigen Funktion in n Variablen ist wie bereits erwähnt im Allgemeinen kein globales Maximum (Minimum). Für konvexe (konkave) Funktionen mit einer konvexen Menge als Definitionsbereich gilt dies jedoch nicht, denn der Satz 13.35 für reellwertige Funktionen in einer Variablen lässt sich auf reellwertige Funktionen in n Variablen verallgemeinern: Satz 21.43 (Globale Extremalwerte bei konvexen und konkaven Funktionen) Es sei f : D ⊆ Rn −→ R eine reellwertige Funktion auf einer konvexen Menge D ⊆ Rn. Ist f konvex, dann ist ein lokales Minimum auch das globale Minimum. Ist f dagegen konkav, dann ist ein lokales Maximum auch das globale Maximum. Beweis: Der Beweis verläuft völlig analog zum Beweis von Satz 13.35. 642 Kapitel 2121.6 Grenzwerte von reellwertigen Funktionen in n Variablen In Kapitel 24 wird gezeigt, wie mit Hilfe der Differentialrechnung auch die Minima und Maxima von reellwertigen Funktionen in n Variablen ermittelt werden können. 21.6 Grenzwerte von reellwertigen Funktionen in n Variablen In den Kapiteln 15 und 16 hat sich bei der Untersuchung der Eigenschaften von reellwertigen Funktionen in einer Variablen der Konvergenzbegriff als sehr hilfreich erwiesen. Aufbauend auf dem in Abschnitt 21.1 definierten Grenzwertbegriff für Folgen im Rn kann das Konzept der Konvergenz – völlig analog zu Funktionen in einer Variablen in Abschnitt 13.10 – auch für reellwertige Funktionen in n Variablen eingeführt werden. Häufungspunkte einer Menge im Rn Zur Formulierung des Konvergenzbegriffes für eine reellwertige Funktion in n Variablen ist es jedoch erforderlich, zuerst den Begriff des Häufungspunktes einer Menge von D ⊆ R auf D ⊆ Rn zu verallgemeinern. Definition 21.44 (Häufungspunkt einer Menge im Rn) Ein x0 ∈ Rn heißt Häufungspunkt der Menge D ⊆ Rn, wenn zu jedem ε > 0 unendlich viele x ∈ D mit ‖x − x0‖ < ε existieren. Ist x0 kein Häufungspunkt der Menge D, aber gilt x0 ∈ D, dann wird x0 als isolierter Punkt der Menge D bezeichnet. Ein Häufungspunkt x0 einer Menge D ⊆ Rn besitzt somit die Eigenschaft, dass in seiner unmittelbaren Nähe unendlich viele Elemente x aus D liegen. Das heißt, für jedes ε > 0 enthält die zugehörige Kugelumgebung von x0, also die offene Kugel K<(x0, ε) = {x ∈ Rn : ‖x − x0‖ < ε}, unendlich viele Elemente aus D. Folglich ist ein x0 ∈ Rn genau dann Häufungspunkt einer Menge D ⊆ Rn, wenn es eine Folge (xk)k∈N ⊆ D gibt, die gegen x0 konvergiert, also lim k→∞ xk = x0 gilt. Grenzwerte für x → x0 und ‖x‖ → ∞ Der Grenzwert einer reellwertigen Funktion in n Variablen ist wie folgt definiert: Definition 21.45 (Grenzwert einer Funktion in n Variablen für x → x0) Es sei f : D ⊆ Rn −→ R eine reellwertige Funktion und x0 ∈ Rn ein Häufungspunkt der Menge D. Dann sagt man, dass die Funktion f für x → x0 gegen c ∈ R konvergiert, wenn für jede Folge (xk)k∈N ⊆ D mit xk = x0 für alle k ∈ N und lim k→∞ xk = x0 stets lim k→∞ f (xk) = c (21.13) gilt. Der Wert c wird dann als Grenzwert (Limes) von f für x → x0 bezeichnet und man schreibt lim x→x0 f (x) = c oder f (x) → c für x → x0 oder f (x) x→x0−→ c. Konvergiert die Funktion f für x → x0 nicht, dann sagt man, dass f für x → x0 divergiert, oder auch, dass der Grenzwert von f für x → x0 nicht existiert. Eine Funktion f : D ⊆ Rn −→ R ist somit für x → x0 genau dann konvergent, wenn es sich bei (f (xk))k∈N um eine konvergente Folge in R handelt. Die Definition 21.45 stimmt somit exakt mit der Definition 13.40 für reellwertige Funktionen in einer Variablen überein und folglich übertragen sich auch alle Rechenregeln in Satz 13.41 auf die Grenzwerte konvergenter reellwertiger Funktionen in n Variablen. Für eine Funktion f : D ⊆ Rn −→ R lassen sich ferner auch der Grenzwert für ‖x‖ → ∞ und die uneigentlichen Grenzwerte lim x→x0 f (x) = ∞ (−∞) und lim ‖x‖→∞ f (x) = ∞ (−∞) völlig entsprechend zu reellwertigen Funktionen in einer Variablen definieren. Man erhält dann das Analogon zu Definition 13.47 bzw. 13.49. Beispiel 21.46 (Grenzwerte von reellwertigen Funktionen in n Variablen) a) Die reellwertige Funktion f : R2 −→ R, (x, y) %→ sin(x) cos(y) konvergiert für x → x0 mit x0 :=( π 2 , 0 )T gegen den Grenzwert 1. Denn für eine beliebige Folge (xk)k∈N ⊆ R2 643 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn mit xk → x0 für k → ∞ erhält man lim xk→x0 f (xk) = lim xk→x0 f (xk, yk) = lim xk→x0 sin (xk) cos (yk) = sin (π 2 ) cos(0) = 1. Es gilt somit lim x→x0 f (x) = 1 (vgl. Abbildung 21.11, links). b) Die reellwertige Funktion f : R3−→R, (x, y, z) %→( x2 + y2 + z2) exp(xyz) konvergiert für x → x0 mit x0 := (1, 2, 1)T gegen den Grenzwert 6e2. Denn für eine beliebige Folge (xk)k∈N ⊆ R3 mit xk → x0 für k → ∞ folgt lim xk→x0 f (xk)= lim xk→x0 f (xk, yk, zk) = lim xk→x0 ( x2k + y2k + z2k ) exp (xkykzk)=6e2. Folglich gilt limx→x0 f (x) = 6e2. c) Die reellwertige Funktion f : R2 −→ R, (x, y) %→ 1 2π exp (− 12 ( x2 + y2)) konvergiert für ‖x‖ → ∞ gegen den Grenzwert 0. Für eine beliebige Folge (xk)k∈N ⊆ R2 mit ‖xk‖ → ∞ für k → ∞ erhält man nämlich lim ‖xk‖→∞ f (xk)= lim‖xk‖→∞ f (xk, yk) = lim ‖xk‖→∞ 1 2π exp ( −1 2 ( x2k + y2k ) ) =0. Das heißt, es gilt lim ‖x‖→∞ f (x) = 0 (vgl. Abbildung 21.12, links). d) Die reellwertige Funktion f : D ⊆ R2 −→ R mit D := {(x, y) ∈ R2 : x ≥ 0, y > 0} und der Zuordnungsvorschrift f (x, y) = x 32 y− 14 ist für x → x0 mit x0 := (1, 0)T bestimmt divergent gegen den uneigentlichen Grenzwert ∞. Denn für eine beliebige Folge (xk)k∈N ⊆ D mit xk → x0 für k → ∞ folgt lim xk→x0 f (xk)= lim xk→x0 f (xk, yk)= lim xk→x0 x 3 2 k y − 14 k =∞. Das heißt, es gilt limx→x0 f (x) = ∞ und bei x0 = (1, 0)T handelt es sich somit um eine Polstelle von f (vgl. Abbildung 21.10, rechts). e) Die reellwertige Funktion f : R2 −→ R, f (x, y) = xy x2+y2 besitzt für x → x0 mit x0 := (0, 0)T keinen Grenzwert. Denn die beiden Folgen ( 1 k , 1 k ) k∈N und( 2 k , 1 k ) k∈N konvergieren zum Beispiel für k → ∞ gegen x0. Aber es gilt lim k→∞ f ( 1 k , 1 k ) = lim k→∞ 1 k2 2 k2 = 1 2 = lim k→∞ f ( 2 k , 1 k ) = lim k→∞ 2 k2 5 k2 = 2 5 . 21.7 Stetige Funktionen Genau wie bei reellwertigen Funktionen in einer Variablen ist auch bei reellwertigen Funktionen in n Variablen der Begriff des Grenzwertes einer Funktion f : D ⊆ Rn −→ R an einer Stelle x0 ∈ D eng mit dem Begriff der Stetigkeit von f an der Stelle x0 verbunden. Die fast wortwörtliche Übertragung von Definition 15.2 liefert das folgende Folgenkriterium: Definition 21.47 (Stetigkeit einer reellwertigen Funktion in n Variablen) Es seien f : D ⊆ Rn −→ R eine reellwertige Funktion und x0 ∈ D. Dann heißt f an der Stelle x0 stetig, falls x0 kein Häufungspunkt der Menge D ist oder falls x0 ein Häufungspunkt der Menge D ist und die Funktion f für x → x0 gegen den Grenzwert f (x0) konvergiert, d. h. wenn lim x→x0 f (x) = f (x0) (21.14) gilt. Andernfalls sagt man, dass f an der Stelle x0 unstetig ist, und x0 wird in diesem Fall als Unstetigkeitsstelle von f bezeichnet. Die Funktion f heißt stetig auf der Menge E ⊆ D, falls f an allen Stellen x0 ∈ E stetig ist. Gilt sogar E = D, dann wird f als stetige Funktion oder einfach kurz als stetig bezeichnet. Entsprechend der Definition 21.47 ist eine Funktion f : D ⊆ R n −→ R in einem Häufungspunkt x0 ∈ D genau dann stetig, wenn lim x→x0 f (x) = f ( lim x→x0 x ) gilt, also wenn die Reihenfolge von lim x→x0 und f vertauscht werden darf. Die Funktion f ist in einem Häufungspunkt 644 Kapitel 2121.7 Stetige Funktionen x0 ∈ D genau dann stetig, wenn zwei Funktionswerte f (x0) und f (x) mit x ∈ D beliebig nahe beieinander liegen, falls der Abstand zwischen den beiden Urbildern x0 und x nur hinreichend klein ist. Für Funktionen in n Variablen kann völlig analog zu reellwertigen Funktionen in einer Variablen auch ein ε-δ-Kriterium (vgl. Definition 15.1) formuliert und der Begriff der gleichmäßigen Stetigkeit (vgl. Definition 15.34) definiert werden. Dazu ist in den beiden Definitionen lediglich der Betrag durch die euklidische Norm zu ersetzen. Das folgende Beispiel demonstriert die Überprüfung von Funktionen in n Variablen auf Stetigkeit anhand des Folgenkriteriums 21.47: Beispiel 21.48 (Stetigkeit von reellwertigen Funktionen in n Variablen) a) Die reellwertige Funktion f : R2 −→ R, (x, y) %→ sin(x) cos(y) ist stetig. Denn für ein beliebiges x0 := (x0, y0)T ∈ R2 gilt lim x→x0 f (x) = lim x→x0 f (x, y) = lim x→x0 sin (x) cos (y) = sin(x0) cos(y0) = f (x0) (vgl. Abbildung 21.11, links). b) Die reellwertige Funktion f : R3−→R, (x, y, z) %→( x2 + y2 + z2) exp (xyz) ist stetig. Für ein beliebiges x0 := (x0, y0, z0)T ∈ R3 folgt lim x→x0 f (x) = lim x→x0 f (x, y, z) = lim x→x0 ( x2 + y2 + z2) exp(xyz) = (x20 + y20 + z20 ) exp(x0y0z0) = f (x0). c) Die reellwertige Funktion f : R2 −→R, (x, y) %→f (x, y)= { 2xy2 x2+y4 für x>0 0 für x≤0 ist an jeder Stelle x0 := (x0, y0)T = (0, 0)T stetig. Denn für ein beliebiges x0 = (0, 0)T gilt lim x→x0 f (x) = lim x→x0 f (x, y) = lim x→x0 2xy2 x2 + y4 = 2x0y20 x20 + y40 = f (x0). Die Funktion f ist jedoch an der Stelle x0 = (0, 0)T unstetig. Denn die Folge ( 1 k2 , 1 k ) k∈N konvergiert gegen x0 für k → ∞ und man erhält lim k→∞ f ( 1 k2 , 1 k ) = lim k→∞ 2 k4 2 k4 = 1 = 0 = f (x0). Der Graph von f wird als Parabelfalte bezeichnet (vgl. Abbildung 21.15, links). d) Die reellwertige Funktion f : R2 −→ R, (x, y) %→ f (x, y) = { xy x2+y2 für (x, y) = (0, 0) 0 für (x, y) = (0, 0) ist an jeder Stelle x0 := (x0, y0)T = (0, 0)T stetig. Für ein beliebiges x0 = (0, 0)T folgt nämlich lim x→x0 f (x) = lim x→x0 f (x, y) = lim x→x0 xy x2 + y2 = x0y0 x20 + y20 = f (x0). Gemäß Beispiel 21.46e) besitzt f jedoch für x → (0, 0)T keinen Grenzwert und (21.14) ist damit für x0 = (0, 0)T nicht erfüllt. Das heißt, die Funktion f ist an der Stelle x0 = (0, 0)T unstetig (vgl. Abbildung 21.15, rechts). Eigenschaften stetiger Funktionen Der Satz 15.13 bezüglich Summen, Differenzen, Produkten und Quotienten stetiger Funktionen in einer Variablen lässt sich samt Beweis auf stetige Funktionen in n Variablen übertragen. Man erhält dann: Satz 21.49 (Rechenregeln für stetige Funktionen) Es seien f : D ⊆ Rn −→ R und g : D ⊆ Rn −→ R zwei reellwertige Funktionen, die an der Stelle x0 ∈ D stetig sind, und α ∈ R. Dann sind die Funktionen αf, f + g, f − g und fg ebenfalls an der Stelle x0 stetig. Gilt zusätzlich g(x0) = 0, dann ist auch die Funktion f g an der Stelle x0 stetig. Beweis: Der Beweis kann völlig analog zu Satz 15.13 geführt werden. 645 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn x −2 −1 0 1 2 3 4 y −2 −1 0 1 2 3 4 0.0 0.2 0.4 0.6 0.8 1.0 f (x, y) = 2xy 2 x2 + y4 für x > 0 x −4 −2 0 2 4 y −4 −2 0 2 4 −0.4 −0.2 0.0 0.2 0.4 f (x, y) = xy x2 + y2 für (x, y) ≠ (0, 0) Abb. 21.15: Reellwertige Funktionen f : R2 −→ R, f (x, y) = 2xy2 x2+y4 für x > 0 und f (x, y) = 0 für x ≤ 0 (links) und f : R 2 −→ R, f (x, y) = xy x2+y2 für (x, y) = (0, 0) und f (0, 0) = 0 (rechts) Mit Satz 21.49 folgt die Stetigkeit von vielen Funktionen in n Variablen. Beispiel 21.50 (Stetigkeit von reellwertigen Funktionen in n Variablen) a) Die reellwertige Funktion fi : Rn −→ R, (x1, . . . , xn) %→ fi(x1, . . . , xn) := xi für ein i ∈ {1,. . . ,n} wird als i-te Projektion oder i-te Koordinatenfunktion bezeichnet, da sie jedem Vektor x ∈ Rn dessen i-te Koordinate zuordnet. Die i-te Projektion fi ist stetig, denn für ein beliebiges a := (a1, . . . , an) ∈ Rn gilt lim x→a fi(x)= limx→a fi(x1, . . . , xn)= limx→a xi = ai=fi (a) . b) Zusammen mit Satz 21.49 folgt aus Beispiel a), dass – affin-lineare Funktionen f : Rn −→ R, x %→ a0 + aT x = a0 + n∑ i=1 aixi mit a0 ∈ R und a = (a1, . . . , an)T ∈ Rn, – quadratische Formen f : Rn −→ R, x %→ xT A x = n∑ i=1 n∑ j=1 aij xixj mit A = (aij )n,n ∈ M(n, n), – Polynome p : Rn −→ R, x %→ m1∑ k1=0 m2∑ k2=0 · · · mn∑ kn=0 ak1k2 ...knx k1 1 x k2 2 · · · xknn mit ak1k2 ...kn ∈ R und mi ∈ N0 für i = 1, . . . , n sowie – rationale Funktionen q : D ⊆ Rn −→ R, x %→ q(x) = p1(x) p2(x) mit D = {x ∈ Rn : p2(x) = 0} und zwei Polynomen p1 und p2 stetig sind. Ein weiteres wichtiges Ergebnis über die Erhaltung der Stetigkeit bezieht sich auf die Komposition zweier Funktionen und ist die Verallgemeinerung von Satz 15.15. 646 Kapitel 2121.7 Stetige Funktionen Satz 21.51 (Stetigkeit von Kompositionen bei Funktionen in n Variablen) Es seien f : Df ⊆ R −→ R und g : Dg ⊆ Rn −→ R zwei reelle Funktionen mit g(Dg) ⊆ Df . Weiter seien g an der Stelle x0 ∈ Dg und f an der Stelle y0 = g(x0) stetig. Dann ist auch die Komposition f ◦g : Dg ⊆ Rn −→ R an der Stelle x0 stetig. Beweis: Der Beweis kann völlig analog zu Satz 15.15 geführt werden. Mit den beiden Sätzen 21.49 und 21.51 sowie der Stetigkeit von Exponential-, Logarithmus-, Potenz- und Arcusfunktionen sowie trigonometrischen Funktionen (vgl. Abschnitt 15.6) folgt die Stetigkeit einer Vielzahl reellwertiger Funktionen in n Variablen. Beispiel 21.52 (Bewertung europäischer Call- und Put-Optionen) M. Scholes und F. Black Europäische Call- und Put-Optionen auf ein Basisinstrument (z. B. Aktien, Rohstoffe, Anleihen, Währungen, Nahrungsmittel, Strom usw.) sind Wertpapiere, welche dem Inhaber das Recht einräumen, zu einem bestimmten Zeitpunkt T (Ausübungszeitpunkt) das Basisinstrument zu einem im Voraus festgelegten Preis K (Ausübungspreis) zu kaufen (Call) bzw. zu verkaufen (Put). Ein rational handelnder Inhaber einer Call- oder Put-Option wird sein Recht jedoch nur dann ausüben, wenn der Kurs St des zugrunde liegenden Basisinstrumentes zum Zeitpunkt t = T über bzw. unter dem Ausübungspreis K liegt. Das heißt, europäische Call- und Put-Optionen erbringen am Ende der Laufzeit zum Zeitpunkt T bei einem Ausübungspreis K für ihren Inhaber den Payoff (Cashflow) max {ST −K, 0} bzw. max {K − ST , 0} (21.15) (vgl. Abbildung 21.16). Call- und Put-Optionen werden von Investoren z. B. sehr häufig zur Absicherung von Wertpapiergeschäften eingesetzt (sogenanntes Hedging). Für Finanzinstitutionen, die mit Call- und Put-Optionen handeln, stellt sich daher unmittelbar die Frage, wie der „faire Preis“ einer europäischen Call- und Put-Option zu einem Zeitpunkt t < T berechnet werden kann. Eine solche Bewertung von europäischen Call- und Put-Optionen ist eine nicht-triviale Problemstellung, da mit dem Kurs ST des Basisinstrumentes auch der Payoff (21.15) zum Bewertungszeitpunkt t < T noch unbekannt ist. R. Merton Im Jahre 1973 veröffentlichten der US-amerikanische Mathematiker und Ökonom Fischer Black (1938–1995) und der kanadische Ökonom Myron Scholes (*1941) im Journal of Political Economy ihren bahnbrechenden Artikel „The Pricing of Options and Corporate Liabilities“, der mittlerweile als Meilenstein der Finanzwirtschaft gilt. In dieser Arbeit beschreiben sie ein finanzmathematisches Modell, welches schnell als Black-Scholes-Modell bekannt geworden ist und eine „faire Bewertung“ von Call- und Put-Optionen ermöglicht. Für diese Leistung haben Scholes und Robert Merton (*1944), welcher ebenfalls maßgeblich an der Entwicklung beteiligt war, 1997 den Wirtschaftsnobelpreis erhalten. Black blieb dies aufgrund seines Todes im Jahre 1995 verwehrt. Im Black-Scholes- Modell berechnet sich der Preis einer europäischen Option zum Zeitpunkt t < T mittels der berühmten Black-Scholes-Formel. Für eine Call-Option lautet diese C (r, σ, St ,K, T − t) = St (d1) (21.16) −K exp (−r(T − t)) (d2) und für eine Put-Option P (r, σ, St ,K, T − t) = K exp (−r(T − t)) (−d2) − St (−d1) (21.17) mit d1 := ln ( St K ) σ √ T − t + √ T − t σ ( r + σ 2 2 ) und d2 := d1 − σ √ T − t . (21.18) 647 Kapitel 21 Folgen, Reihen und reellwertige Funktionen im Rn 0 20 40 60 80 100 0 20 40 60 80 max{S T − K, 0} S T 0 20 40 60 80 100 0 20 40 60 80 max{K − S T, 0} S T Abb. 21.16: Payoffs max {ST −K, 0} und max {K − ST , 0} einer europäischen Call-Option (links) bzw. Put-Option (rechts) für den Ausübungspreis K = 40€ Das heißt, im Black-Scholes-Modell ist der Preis einer europäischen Call- und Put-Option zum Zeitpunkt t < T eine reellwertige Funktion in den fünf Variablen K, T − t, St , r und σ. Dabei bezeichnet K den Ausübungspreis, T − t die Restlaufzeit, St den Preis des Basisinstrumentes zum Zeitpunkt t , r den risikolosen Zinssatz auf dem Finanzmarkt und σ die Volatilität des Aktienkurses, die ein Maß für die Kursschwankung des Basisinstrumentes ist. Die Werte (d1) und (d2) sind die Werte der Standardnormalverteilung an den Stellen d1 bzw. d2 (vgl. Beispiel 19.48). Mit den beiden Sätzen 21.49 und 21.51 sowie der Stetigkeit der Standardnormalverteilung und von Exponential-, Logarithmus- und Wurzelfunktionen folgt, dass die beiden Bewertungsformeln (21.16)–(21.17) stetig sind (vgl. Abbildung 21.17). Satz vom Minimum und Maximum In Kapitel 15 hat sich gezeigt, dass stetige reellwertige Funktionen in einer Variablen auf abgeschlossenen und beschränkten Intervallen eine Reihe guter Eigenschaften besitzen. Eine dieser Eigenschaften ist der Satz vom Minimum und Maximum, der auch Extremalwertsatz oder Satz von Weierstraß genannt wird und ein Existenzsatz für globale Extrema ist (vgl. Satz 15.25). Dieses bedeutende Resultat lässt sich ebenfalls auf reellwertige Funktionen in n Variablen verallgemeinern. Satz 21.53 (Satz vom Minimum und Maximum) Eine auf einer kompakten (d. h. beschränkten und abgeschlossenen) MengeM ⊆ Rn definierte stetige reellwertige Funktion f : M ⊆ Rn −→ R ist beschränkt und nimmt ihr globales Minimum und Maximum an. Das heißt, es gibt eine globale Minimalstelle x1 ∈ M und eine globale Maximalstelle x2 ∈ M , so dass für alle x ∈ M gilt: f (x1) ≤ f (x) ≤ f (x2) Beweis: Der Beweis kann weitgehend analog zu Satz 15.25 geführt werden. 648 Kapitel 2121.7 Stetige Funktionen S 0 20 40 60 80 100 T −t 0 20 40 60 80 100 0 20 40 60 80 C(r, σ, S t, K, T − t) S 0 20 40 60 80 100 T −t 0 20 40 60 80 100 0 10 20 30 40 P(r, σ, S t, K, T − t) Abb. 21.17: Preis C (r, σ, St ,K, T − t) einer europäischen Call-Option (links) und Preis P (r, σ, St ,K, T − t) einer europäischen Put-Option (rechts) in Abhängigkeit der beiden Variablen ST und T − t für r = 0,1, σ = 0,2 und K = 40€ Das folgende Beispiel demonstriert den Nutzen von Satz 21.53 anhand einer Anwendung aus der Haushaltstheorie: Beispiel 21.54 (Satz vom Minimum und Maximum in der Haushaltstheorie) Betrachtet wird ein Konsument K mit dem Vermögen w > 0, der ein Warenbündel aus seiner Budgetmenge Bw := { x ∈ Rn+ : p1x1 + . . .+ pnxn ≤ w } auswählt, wobei p1,. . . ,pn >0 die Preise und x1,. . . ,xn ≥ 0 die Mengeneinheiten der einzelnen Waren bezeichnen. Die Budgetmenge Bw enthält alle Warenbündel, die das Budget w des Konsumenten nicht übersteigen. In der Haushaltstheorie wird angenommen, dass die Präferenzen von Konsument K durch eine stetige Nutzenfunktion U : Rn −→ R ausgedrückt werden und dass der Konsument rational handelt. Das heißt, es wird unterstellt, dass K die Nutzenfunktion U unter Beachtung der Nebenbedingung x ∈ Bw maximiert. Da die Budgetmenge Bw beschränkt und abgeschlossen ist, folgt mit Satz 21.53, dass es ein x0 ∈ Bw mit der Eigenschaft U(x0) = max x∈Bw U(x) gibt. 649

Chapter Preview

References

Zusammenfassung

"uneingeschränkt zu empfehlen, [...] insbesondere als Einstiegslektüre im Bachelor-Studium". In: Studium, 2013.

So zentral die Rolle der Mathematik in der Ökonomie ist, so schwer tun sich die Studierenden mit mathematischen Methoden und Konzepten. Umso wichtiger ist es, die Studierenden bei ihrem aktuellen Wissensstand abzuholen und vorsichtig an den Stoff heranzuführen. Diesem Ziel verschreibt sich dieses Lehrbuch. Es führt mit vielen interessanten Beispielen aus der Ökonomie, kurzen Anekdoten und einem modernen mehrfarbigen Design in die zentralen mathematischen Methoden für ein erfolgreiches Wirtschaftsstudium ein, ohne dabei auf mathematische Klarheit sowie die notwendige Formalität und Stringenz zu verzichten. Auch nach dem Studium ist dieses Buch ein wertvoller Begleiter bei der mathematischen Lösung wirtschaftswissenschaftlicher Problemstellungen.

Aus dem Inhalt:

* Mathematische Grundlagen

* Lineare Algebra

* Matrizentheorie

* Folgen und Reihen

* Reellwertige Funktionen in einer und mehreren Variablen

* Differential- und Integralrechnung

* Optimierung mit und ohne Nebenbedingungen

* Numerische Verfahren

Dozenten finden auf der Website zum Buch unter www.vahlen.de zusätzliche Materialien zum Download.

"Indem Sie den Lehrstoff schrittweise aufbereiten und den Leser bei seinem aktuellen Wissenstand abholen, gelingt es ihnen [den Autoren], auch komplexe Zusammenhänge leicht nachvollziehbar zu vermitteln. Geschickt bauen sie immer wieder kurze Anekdoten, historische Ereignisse und überraschende Erkenntnisse in den Text ein". In: Studium, 2013.

Prof. Dr. Michael Merz ist Inhaber des Lehrstuhls für Mathematik und Statistik in den Wirtschaftswissenschaften an der Universität Hamburg. Prof. Dr. Mario V. Wüthrich forscht und lehrt am Department für Mathematik der ETH Zürich.