Content

16. Differenzierbare Funktionen in:

Michael Merz, Mario V. Wüthrich

Mathematik für Wirtschaftswissenschaftler, page 439 - 487

Die Einführung mit vielen ökonomischen Beispielen

1. Edition 2012, ISBN print: 978-3-8006-4482-7, ISBN online: 978-3-8006-4483-4, https://doi.org/10.15358/9783800644834_439

Bibliographic information
Teil V Differentialrechnung und Optimierung in R Kapitel16 Differenzierbare Funktionen Kapitel 16 Differenzierbare Funktionen 16.1 Tangentenproblem Die Differentialrechnung ist eines der bedeutendsten Konzepte der Analysis. Ausgangspunkt der Differentialrechnung ist die Untersuchung der Auswirkung einer infinitesimalen (d. h. sehr kleinen) Änderung x des Arguments einer reellen Funktion f : D ⊆ R −→ R, x %→ f (x) an einer Stelle x0 ∈ D auf den Funktionswert an dieser Stelle. G. W. Leibniz Wichtige Vorarbeiten zur Differentialrechnung wurden bereits im 16. und 17. Jahrhundert erbracht. Als eigentliche Urheber der Differentialrechnung gelten jedoch der deutsche Universalgelehrte Gottfried Wilhelm Leibniz (1646–1716) und der bedeutende englische Physiker und Mathematiker Isaac Newton (1643–1727), welche die Differential- und auch die Integralrechnung (siehe Kapitel 19) etwa gleichzeitig und unabhängig voneinander zu einem widerspruchsfreien Kalkül entwickelt haben. Während aber Newton seine Fluxionsrechnung bei der Herleitung der Gravitationsgesetze aus den Keplerschen Gesetzen der Planetenbewegung erschuf, ging Leibniz vom sogenannten Tangentenproblem aus, das darin besteht, an eine Kurve in einem vorgegebenen Kurvenpunkt eine Tangente anzulegen. I. Newton An der sich daran anschließenden, außerordentlich rasanten Entwicklung der Differentialrechnung hatten vor allem die beiden schweizer Brüder Jakob Bernoulli (1655–1705) und Johann Bernoulli (1667–1748) entscheidenden Anteil. Auf ihren Vorlesungen basiert unter anderem auch das erste Lehrbuch zur Differential- und Integralrechnung, welches 1696 von dem französischen Mathematiker Guillaume Antoine de L’Hôspital (1661–1704) veröffentlicht wurde und einen großen Anteil an der weiteren Verbreitung der Differentialrechnung hatte. Die heute übliche logische Strenge in der Differentialrechnung wurde jedoch letztendlich erst im 19. Jahrhundert durch die wegweisenden Arbeiten der beiden Mathematiker Augustin Louis Cauchy (1789–1857) und Karl Weierstraß (1815– J. Bernoulli 1897) zum Grenzwertbegriff erreicht (vgl. Abschnitt 13.10). Zusammen mit der konzeptionell eng verwandten Integralrechnung (siehe Kapitel 19) bildet die Differentialrechnung die sogenannte Infinitesimalrechnung, die mittlerweile für die Natur-, Ingenieurund Wirtschaftswissenschaften eine überragende Bedeutung besitzt und ohne Übertreibung als eine der bedeutendsten und leistungsfähigsten Schöpfungen des menschlichen Geistes betrachtet werden kann. Die Differentialrechnung ist insbesondere zu einem unverzichtbaren Hilfsmittel bei der Beschreibung, Analyse und Optimierung der verschiedensten ökonomischen Fragestellungen geworden. Denn viele Problemstellungen in den Wirtschaftswissenschaften erfordern den intensiven Einsatz der Differentialrechnung. Zum Beispiel wird sich im weiteren Verlauf dieses Buches zeigen, dass sie bei der Lösung von Gleichungen, bei der Ermittlung von Wachstums- und Krümmungseigenschaften reeller Funktionen, bei der Bestimmung des Minimums und Maximums einer reellen Funktion, bei der Approximation von reellen Funktionen durch einfachere Funktionen usw. sehr hilfreich ist. Konkrete Beispiele für wirtschaftswissenschaftliche Anwendungsgebiete, in denen die Differentialrechnung regelmäßig zum Einsatz kommt, sind: • Portfoliooptimierung • Bewertung von Investitionen • Analyse der Veränderung des Güternachfrageverhaltens von Haushalten • Ermittlung von Produktionskostenfunktionen • Bestimmung optimaler Laufzeiten von Produktionsprozessen • Sensitivitätsanalyse bei Wertpapieren und Derivaten • Bestimmung optimaler Angebotspreise • Aufstellung optimierter Maschinenbelegungspläne • Untersuchung der Auswirkung einer Steuererhöhungoder senkung • usw. In diesen beispielhaften Anwendungen dient die Differentialrechnung vor allem zur Untersuchung von momentanen 440 Kapitel 1616.2 Differenzierbarkeit Änderungsraten, welche speziell in den Wirtschaftswissenschaften oft auch als Grenzraten (z. B. Grenzkosten, Grenzproduktivität, Grenznutzen usw.) bezeichnet werden. Ausgangspunkt für die Entwicklung der Differentialrechnung ist die Aufgabe, die momentane Änderungsrate einer reellen Funktion f : D ⊆ R −→ R an einer Stelle (Häufungspunkt) x0 ∈ D zu ermitteln. Anschaulich ist dies zur Berechnung der Steigung des Graphen der Funktion f an der Stelle x0 äquivalent. Ursprünglich ist jedoch der geometrische Begriff der Steigung eines Funktionsgraphen an einer Stelle x0 nur für affin-lineare Funktionen y = f (x) = ax + b (16.1) definiert, und zwar als Quotient der Argumentendifferenz x := x1 − x0 und der Funktionswertdifferenz y := y1 − y0 = f (x1)− f (x0) zweier beliebiger Punkte (x0, f (x0)) und (x1, f (x1)) mit x0 = x1 auf dem Graphen von f . Das heißt, die momentane Änderungsrate (Steigung) der affin-linearen Funktion (16.1) beträgt somit unabhängig von den Stellen x0 und x1 stets y x = ax1 + b − (ax0 + b) x = a x x = a (vgl. Abbildung 16.1, links). Im Vergleich zu einer affin-linearen Funktion weist jedoch eine nicht affin-lineare Funktion f : D ⊆ R −→ R einen unregelmäßigen Verlauf auf, und die momentane Änderungsrate verändert sich damit insbesondere von einer Stelle zu einer anderen Stelle des Definitionsbereichs D. Es ist daher ein naheliegender Lösungsansatz, die Steigung des Graphen einer nicht affin-linearen Funktion f an einer Stelle x0 ∈ D als die Steigung mt der Tangente t an den Graphen von f im Punkt (x0, f (x0)) zu definieren. Bei der Tangente von f an der Stelle x0 handelt es sich um eine Gerade, die den Graphen von f im Punkt (x0, f (x0)) berührt und damit in diesem speziellen Punkt in die gleiche Richtung verläuft wie der Graph von f . Die Steigung mt kann somit als Grenzwert der Steigung ms = f (x0 + x)− f (x0) x (16.2) der Sekante s durch die beiden Punkte ( x0, f (x0) ) und ( x0+ x, f (x0 + x) ) für x → 0 berechnet werden, sofern dieser Grenzwert existiert. Mit anderen Worten: Im Falle der Existenz des Grenzwertes mt = lim x→0 f (x0 + x)− f (x0) x ist dadurch die Steigung (momentane Änderungsrate) der Funktion f an der Stelle x0 gegeben. Dieser Sachverhalt ist in Abbildung 16.1, rechts dargestellt. Der Grenzübergang x → 0 lässt sich so veranschaulichen, dass x1 = x0 + x immer näher an x0 heranrückt, so dass der Abstand x zwischen x1 und x0 nach und nach beliebig klein wird und die zugehörige Sekante s letztendlich in die Tangente t übergeht. 16.2 Differenzierbarkeit Differenzenquotient Die Überlegungen im letzten Abschnitt motivieren die Einführung des Begriffs des Differenzenquotienten einer reellen Funktion: Definition 16.1 (Differenzenquotient) Es sei f : D ⊆ R −→ R eine reelle Funktion mit x0, x0 + x ∈ D und x = 0. Dann heißt f (x0 + x)− f (x0) x (16.3) Differenzenquotient der Funktion f in x0. Der Differenzenquotient (16.3) ist ein Maß für die „mittlere Steigung“ der Funktion f zwischen den Stellen x0 und x1. Geometrisch entspricht der Differenzenquotient der Steigung ms der Sekante s durch die beiden Punkte (x0, f (x0)) und (x0 + x, f (x0 + x)) auf dem Graphen von f (vgl. Abbildung 16.1, rechts). Mit y = f (x0 + x)−f (x0) erhält man für den Differenzenquotienten (16.3) die häufig verwendete Schreibweise f (x0 + x)− f (x0) x = y x . Bezeichnet α den Winkel zwischen der Sekante s und der x-Achse (vgl. Abbildung 16.1, rechts), dann folgt aus der Definition des Tangens (vgl. (5.3)) f (x0 + x)− f (x0) x = tan(α). (16.4) 441 Kapitel 16 Differenzierbare Funktionen l l f (x) = ax + b Δx Δy = aΔx y1 y0 x1x0 t(x) s(x) f (x) Δx f (x0 + Δx) − f(x0) x0 + Δxx0 f (x0 + Δx) f (x0) αl l Abb. 16.1: Affin-lineare Funktion f (x) = ax + b mit Argumentendifferenz x und Funktionswertdifferenz y (links) und reelle Funktion f : D ⊆ R −→ R mit Sekante s durch die Punkte (x0, f (x0)) und (x0 + x, f (x0 + x)) sowie Tangente t im Punkt (x0, f (x0)) (rechts) Mit der Punkt-Steigungs-Formel y = y1+a(x−x1) für eine Gerade mit der Steigung a durch den Punkt (x1, y1) erhält man für die Sekante s die Funktionsgleichung s(x) = f (x0)+ f (x0 + x)− f (x0) x (x − x0) (16.5) (vgl. Abbildung 16.1, rechts). Differentialquotient und erste Ableitung Der Grenzübergang x → 0 beim Differenzenquotienten (16.3) führt zu der folgenden grundlegenden Definition der Differenzierbarkeit und des Differentialquotienten bzw. der ersten Ableitung einer reellen Funktion f : Definition 16.2 (Differenzierbarkeit und Differentialquotient) Es sei f : D ⊆ R −→ R eine reelle Funktion und x0 ∈ D ein Häufungspunkt der Menge D mit x0 + x ∈ D für x → 0. Dann heißt f an der Stelle x0 differenzierbar, falls der Grenzwert lim x→0 f (x0 + x)− f (x0) x (16.6) existiert, und der Grenzwert wird dann mit f ′(x0) bezeichnet und erste Ableitung oder Differentialquotient von f an der Stelle x0 genannt. Die Funktion f heißt differenzierbar auf E ⊆ D, falls f an allen Stellen x0 ∈ E differenzierbar ist, und die Funktion f ′ : E −→ R, x %→ f ′(x) wird dann als erste Ableitung oder erste Ableitungsfunktion von f auf E bezeichnet. Gilt E = D, dann wird f differenzierbare Funktion oder einfach nur differenzierbar genannt. Der Grenzwert f ′(x0) = lim x→0 f (x0+ x)−f (x0) x gibt im Falle seiner Existenz die Steigung, d. h. die momentane Änderungsrate, der Tangente t an den Graphen der Funktion f im Punkt (x0, f (x0)) an (vgl. Abbildung 16.1, rechts). Die Tangente t besitzt somit die Funktionsgleichung t (x) = f (x0)+ f ′(x0) · (x − x0) (16.7) (vgl. (16.5) und Abbildung 16.1, rechts) und bezeichnet α den Winkel zwischen der Tangente t und der x-Achse, dann gilt f ′(x0) = lim x→0 f (x0 + x)− f (x0) x = tan(α) (vgl. (16.4)). Der Übergang von einer differenzierbaren reellen Funktion f zu ihrer ersten Ableitung f ′ wird als dif- 442 Kapitel 1616.2 Differenzierbarkeit ferenzieren oder ableiten bezeichnet. Die erste Ableitung f ′ einer reellen Funktion f : D −→ R, x %→ f (x) ist wieder eine Funktion, die selbst stetig oder differenzierbar sein kann, aber nicht sein muss. Ist die erste Ableitung f ′ stetig, dann wird f stetig differenzierbar genannt. Ist f : D −→ R, x %→ f (x) eine an der Stelle x0 ∈ D differenzierbare Funktion, dann gilt für kleine x f ′(x0) ≈ f (x0 + x)− f (x0) x bzw. f (x0 + x) ≈ f (x0)+ f ′(x0) x. (16.8) Das heißt, die Tangente (16.7) liefert „in der Nähe“ von x0 oftmals eine gute lineare Approximation für die Funktionswerte von f . Analog zur Stetigkeit (vgl. Abschnitt 15.1) ist auch die Differenzierbarkeit einer Funktion f an einer Stelle x0 ∈ D eine lokale Eigenschaft. J.-L. Lagrange auf einer französischen Briefmarke Die Notation f ′ für die erste Ableitung einer reellen Funktion f geht auf den italienischen Mathematiker Joseph-Louis Lagrange (1736–1813) zurück. Neben f ′(x0) sind jedoch auch df (x) dx ∣∣ ∣∣ x=x0 , df dx (x0), (16.9) d dx f (x0) und dy dx (x0) übliche Notationen für die erste Ableitung von f an der Stelle x0, wobei die Terme df und dx als Differentiale bezeichnet werden. Für eine Motivation dieser alternativen Schreibweisen siehe Abschnitt 16.3. Beispiel 16.3 (Differenzierbarkeit von reellen Funktionen) a) Für die erste Ableitung der affin-linearen Funktion f : R −→ R, x %→ f (x) = ax + b mit a, b ∈ R an der Stelle x0 ∈ R erhält man f ′(x0) = lim x→0 f (x0 + x)− f (x0) x = lim x→0 a(x0 + x)+ b − ax0 − b x = lim x→0 a = a. Das heißt, die erste Ableitungsfunktion von f ist die konstante Funktion f ′ : R −→ R, x %→ f ′(x) = a. Damit ist insbesondere gezeigt, dass eine affinlineare Funktion stetig differenzierbar ist und eine konstante Funktion f (x) = b, d. h. der Spezialfall einer affin-linearen Funktion f (x) = ax + b mit a = 0, die erste Ableitungsfunktion f ′(x) = 0 besitzt. b) Für die erste Ableitung der quadratischen Funktion f : R −→ R, x %→ f (x) = x2 an der Stelle x0 ∈ R erhält man: f ′(x0) = lim x→0 f (x0 + x)− f (x0) x = lim x→0 (x0 + x)2 − x20 x = lim x→0 x20 + 2x0 x + x2 − x20 x = lim x→0 (2x0 + x) = 2x0 Folglich ist die erste Ableitungsfunktion von f die lineare Funktion f ′ : R −→ R, x %→ f ′(x) = 2x und eine quadratische Funktion ist damit insbesondere stetig differenzierbar. Wegen f (2) = 4 und f ′(2) = 4 erhält man mit (16.7) für die Tangente t an den Graphen im Punkt (2, 4) die Funktionsgleichung t (x) = 4 + 4(x − 2) = 4x − 4 (vgl. Abbildung 16.2, links). c) Für die erste Ableitung der Wurzelfunktion f : R+ −→ R, x %→ f (x) = √x an der Stelle x0 > 0 erhält man: f ′(x0)= lim x→0 f (x0 + x)− f (x0) x = lim x→0 √ x0 + x −√x0 x = lim x→0 ( √ x0 + x −√x0)(√x0+ x+√x0) x( √ x0 + x +√x0) = lim x→0 1√ x0 + x +√x0 = 1 2 √ x0 (16.10) 443 Kapitel 16 Differenzierbare Funktionen Die Funktion f ist jedoch an der Stelle x0 = 0 nicht differenzierbar, da für x0 = 0 der Grenzwert (16.10) nicht existiert. Das heißt, die Funktion f ist nur auf dem offenen Intervall (0,∞) (stetig) differenzierbar und die erste Ableitungsfunktion von f auf (0,∞) ist gegeben durch f ′ : (0,∞) −→ R, x %→ f ′(x) = 1 2 √ x . Wegen f (3) = √3 und f ′(3) = 1 2 √ 3 erhält man mit (16.7) für die Tangente t an den Graphen im Punkt (3, √ 3) die Funktionsgleichung t (x) = √3 + 1 2 √ 3 (x − 3) = 1 2 √ 3 x + 1 2 √ 3 (vgl. Abbildung 16.2, rechts). Für √ 2 liefert die Tangente t die lineare Approximation t (2) = 1,443376. Der bis auf sieben Nachkommastellen genaue Wert ist √ 2 ≈ 1,4142135. d) Die Betragsfunktion f : R −→ R, x %→ f (x) = |x| ist gemäß Beispiel 15.3a) stetig. Für alle x0 > 0 gilt ferner lim x→0 f (x0+ x)−f (x0) x = lim x→0 |x0 + x| − |x0| x = lim x→0 x0 + x − x0 x = 1. Für alle x0 < 0 erhält man analog lim x→0 f (x0+ x)−f (x0) x = lim x→0 |x0 + x| − |x0| x = lim x→0 −(x0 + x)+ x0 x = −1. Die Betragsfunktion ist somit an jeder Stelle x0 = 0 differenzierbar und die erste Ableitung von f auf R \ {0} ist gegeben durch f ′ : R \ {0} −→ R, x %→ f ′(x)= { 1 für x > 0 −1 für x < 0 . An der Stelle x0 = 0 ist die Betragsfunktion jedoch nicht differenzierbar, denn lim x↑0 |0 + x| − |0| x = lim x↑0 − x x = −1 = lim x↓0 |0 + x| − |0| x = lim x↓0 x x = 1. Das heißt, der linksseitige und der rechtsseitige Grenzwert stimmen nicht überein, so dass der Grenzwert lim x→0 |0+ x|−|0| x nicht existiert (vgl. Satz 13.45). Am Graphen der Betragsfunktion f spiegelt sich dieser Sachverhalt durch einen Knick an der Stelle x0 = 0 wider (vgl. Abbildung 16.3, links). Für die Existenz der ersten Ableitung einer reellen Funktion f an der Stelle x0 existiert die folgende notwendige und hinreichende Bedingung: Satz 16.4 (Notwendige und hinreichende Bedingung für Differenzierbarkeit) Es sei f : D ⊆ R −→ R eine reelle Funktion und x0 ∈ D ein Häufungspunkt der Menge D mit x0 + x ∈ D für x → 0. Dann ist f an der Stelle x0 genau dann differenzierbar mit der ersten Ableitung f ′(x0), falls zu jedem ε > 0 ein δ > 0 existiert, so dass ∣∣ ∣∣ f (x0 + x)− f (x0) x − f ′(x0) ∣ ∣∣ ∣ < ε für alle | x| < δ gilt. Beweis: Diese Aussage folgt unmittelbar aus der Definition des Grenzwertes einer reellen Funktion (vgl. Definition 13.40). Analog zum Begriff der einseitigen Stetigkeit in Abschnitt 15.2 kann mit Hilfe des Begiffs des einseitigen Grenzwertes (vgl. Abschnitt 13.10) auch die einseitige Differenzierbarkeit einer reellen Funktion definiert werden. Ist somit eine reelle Funktion f : D ⊆ R −→ R an einer Stelle x0 ∈ D nicht differenzierbar, existiert also der Grenzwert des Differenzenquotienten f (x0+ x)−f (x0) x für x → 0 nicht, dann kann immer noch untersucht werden, ob wenigstens einer der einseitigen Grenzwerte für x ↓ 0 oder x ↑ 0 existiert. 444 Kapitel 1616.3 Weierstraßsche Zerlegungsformel −3 −2 −1 1 2 3 −2 2 4 6 8 f (x) = x2 t (x) = 4x − 4 f ′(x) = 2x l −1 1 2 3 4 5 −1 1 2 3 f (x) = x f ′(x) = 1 2 x t (x) = 1 2 3 x + 1 2 3 l Abb. 16.2: Quadratische Funktion f : R −→ R, x %→ f (x) = x2 mit erster Ableitungsfunktion (links) und Wurzelfunktion f : R+ −→ R, x %→ f (x) = √x mit erster Ableitungsfunktion auf (0,∞) (rechts) 16.3 Weierstraßsche Zerlegungsformel Ist f : D ⊆ R −→ R eine an der Stelle x0 ∈ D differenzierbare reelle Funktion, dann gilt aufgrund der Definition der ersten Ableitung von f an der Stelle x0 lim x→0 ( f (x0 + x)− f (x0) x − f ′(x0) ) = 0 (16.11) (vgl. Definition 16.2). Setzt man Rx0 ( x) := f (x0 + x)− f (x0) x − f ′(x0) für x = 0, dann erhält man für (16.11) die äquivalente Darstellung f (x0 + x)− f (x0) = f ′(x0) x + Rx0 ( x) x (16.12) mit lim x→0 Rx0 ( x) = 0 bzw. mit dem in Abschnitt 13.11 eingeführten Landau- Symbol o für (16.12) die alternative Schreibweise f (x0 + x)− f (x0) = f ′(x0) x + o( x) für x → 0. (16.13) Dies zeigt, dass eine reelle Funktion f genau dann an der Stelle x0 ∈ D differenzierbar ist, wenn die Funktionswertdifferenz f (x0 + x)− f (x0) die Darstellung (16.12) bzw. (16.13) besitzt. Grab von K. Weierstraß in Berlin Die Darstellung (16.12) wird nach dem deutschen Mathematiker Karl Weierstraß (1815–1897) als Weierstraßsche Zerlegungsformel bezeichnet. Durch die Weierstraßsche Zerlegungsformel (16.12) wird die Funktionswertdifferenz f (x0 + x)− f (x0) in die beiden Summanden f ′(x0) x und Rx0 ( x) x zerlegt, wobei wegen lim x→0 Rx0 ( x) = 0 der zweite Summand Rx0 ( x) x für x → 0 schneller gegen 0 konvergiert als der erste Summand f ′(x0) x (sofern f ′(x0) = 0 vorausgesetzt wird). Für kleine Werte von x ist daher der erste Summand f ′(x0) x der Hauptteil in der Zerlegung von f (x0 + x)−f (x0). Der zweite Summand Rx0 ( x) x gibt die Differenz zwischen dem Funktionswert f (x0 + x) und dem Wert f (x0)+f ′(x0) x der Tangente von f an der Stelle x0 an. Der Term f ′(x) x heißt Differential der Funktion f und man schreibt auch df := f ′(x) x oder dy := f ′(x) x. 445 Kapitel 16 Differenzierbare Funktionen Da die Funktion f (x) = x wegen f ′(x) = 1 das Differential dx = df = 1 · x = x besitzt, schreibt man für ein Differential df anstelle von f ′(x) x oft auch df := f ′(x)dx oder dy := f ′(x)dx. (16.14) Durch Division mit dx erhält man daraus für die erste Ableitung von f die Schreibweise df dx = f ′(x) bzw. dy dx = f ′(x). Das heißt, die erste Ableitung f ′(x) ist der Quotient der Differentiale dy und dx. Dieses Ergebnis ist zum einen der Grund dafür, weshalb man anstelle von Ableitung oft auch von Differentialquotient spricht, und zum anderen motiviert es die alternativen Schreibweisen (16.9) für die Ableitung einer reellen Funktion f . 16.4 Eigenschaften differenzierbarer Funktionen Zusammenhang Differenzierbarkeit und Stetigkeit Für die weiteren Betrachtungen ist es hilfreich, die Beziehung zwischen Stetigkeit und Differenzierbarkeit einer reellen Funktion f : D ⊆ R −→ R zu untersuchen. Dabei zeigt sich, dass zwischen diesen beiden Begriffen der folgende einfache Zusammenhang besteht: Satz 16.5 (Differenzierbarkeit impliziert Stetigkeit) Eine an der Stelle x0 ∈ D differenzierbare reelle Funktion f : D ⊆ R −→ R ist in x0 auch stetig. Eine differenzierbare Funktion f : D ⊆ R −→ R ist damit insbesondere stets auch stetig. Beweis: Die Funktion f sei an der Stelle x0 ∈ D differenzierbar. Dann existiert der Grenzwert lim x→0 f (x0 + x)− f (x0) x = f ′(x0) ∈ R. Dies impliziert lim x→0 f (x0 + x)− f (x0) = lim x→0 f (x0 + x)− f (x0) x · x = lim x→0 f (x0 + x)− f (x0) x · lim x→0 x = f ′(x0) · 0 = 0 und somit insbesondere lim x→0 f (x0 + x) = f (x0). Folglich ist f gemäß Definition 15.2 an der Stelle x0 stetig. Eine nicht stetige Funktion kann somit auch nicht differenzierbar sein. Umgekehrt braucht jedoch eine an der Stelle x0 stetige Funktion dort nicht differenzierbar zu sein, wie die Beispiele f (x) = |x| und f (x) = √x bereits gezeigt haben. Diese Funktionen sind zwar stetig, aber an der Stelle x0 = 0 nicht differenzierbar (vgl. Beispiel 16.3c)–d)). Das heißt, die Stetigkeit ist eine notwendige, aber keine hinreichende Bedingung für die Differenzierbarkeit einer reellen Funktion. Lange Zeit glaubte man, dass eine stetige reelle Funktion bis auf eine Menge isolierter Punkte auch differenzierbar sein muss. Selbst führende Mathematiker wie Carl Friedrich Gauß (1777–1855) besaßen diese Auffassung, welche ihren Ursprung darin hat, dass es nahezu unmöglich ist, eine stetige Funktion zu zeichnen, deren Menge nicht differenzierbarer Stellen keine endliche Menge ist. Den beiden Mathematikern Bernard Bolzano (1781–1848) und Karl Weierstraß (1815– 1897) gelang es jedoch als ersten, eine Funktion zu konstruieren, die überall stetig, aber keiner Stelle differenzierbar ist. R. Brown Ein Beispiel für eine stetige reelle Funktion mit einer großen Bedeutung für die wirtschaftswissenschaftliche Praxis, die an keiner Stelle differenzierbar ist, sind die Pfade (d. h. Realisierungen) einer sogenannten geometrischen Brownschen-Bewegung. Die geometrische Brownsche-Bewegung ist nach dem schottischen Botaniker Robert Brown (1773–1858) benannt, der als Entdecker der Brownschen-Bewegung, der Wärmebewegung von Atomen und Molekülen in Flüssigkeiten und Gasen, bekannt ist. Die geometrische Brownsche-Bewegung spielt in der modernen Finanzwirtschaft eine herausragende Rolle, da sie z. B. dem Black- Scholes-Modell, einem der bedeutendsten und verbreitetsten finanzmathematischen Modelle zur Bewertung von Optionen und Projekten, zu Grunde liegt (siehe z. B. Hull [28] und Luderer [42]). Im Black-Scholes-Modell wird die geometrische Brownsche-Bewegung zur Modellierung von Preisprozessen von Wertpapieren wie z. B. Aktien eingesetzt (vgl. Abbildung 16.3, rechts). 446 Kapitel 1616.4 Eigenschaften differenzierbarer Funktionen −4 −3 −2 −1 0 1 2 3 4 1 2 3 4 f (x) = |x| 0 50 100 0 20 40 60 f (x) Abb. 16.3: Betragsfunktion f : R −→ R, x %→ f (x) = |x| (links) und Pfad einer geometrischen Brownschen-Bewegung (rechts) Fraktal Der Graph eines Pfades der geometrischen Brownschen-Bewegung ist ein sogenanntes Fraktal (vgl. z. B. Falconer [15]). Der Begriff Fraktal wurde 1975 von dem französisch-amerikanischen Mathematiker Benoît B. Mandelbrot (1924–2010) geprägt und bezeichnet natürliche und künstliche Gebilde, Muster oder Objekte, die auf jedem Niveau selbstähnlich sind und deren Erscheinungsbild sich somit nicht verändert, wenn eine fortlaufende Vergrößerung von ihnen betracht wird. B. B. Mandelbrot Fraktale spielen zum Beispiel eine wichtige Rolle in der Chaostheorie, die unter anderem zur Erklärung und Prognose des Verhaltens von komplexen, ungeregelten und instabilen Phänomenen, wie z. B. Börsenkursen oder dem Wetter, eingesetzt wird (vgl. z. B. Mandelbrot [44]). In den folgenden drei Unterabschnitten werden für differenzierbare Funktionen drei zentrale Sätze bewiesen. Diese Resultate sind für das Arbeiten mit differenzierbaren Funktionen unentbehrlich. Denn sie ermöglichen es, die Ableitung komplizierter zusammengesetzter differenzierbarer Funktionen aus den Ableitungen ihrer einzelnen „Bausteine“ zu ermitteln. Rechenregeln für differenzierbare Funktionen Der folgende Satz lässt sich relativ einfach mit Hilfe der Rechenregeln für die Grenzwerte konvergenter reeller Funktionen (vgl. Satz 13.41) beweisen. Er ist das Analogon zum Satz 15.13 für stetige Funktionen und besagt, dass Summen, Differenzen, Produkte und Quotienten differenzierbarer Funktionen wieder differenzierbar sind. Dieses Ergebnis ist der Ausgangspunkt für den Nachweis der Differenzierbarkeit für eine ganze Reihe von reellen Funktionen, die für wirtschaftswissenschaftliche Anwendungen von Bedeutung sind. Darüber hinaus macht der folgende Satz auch eine Aussage darüber, wie jeweils die zugehörige erste Ableitung berechnet werden kann. Diese einfachen Ableitungsregeln gehen bereits auf den schweizer Mathematiker Leonard Euler (1707–1783) zurück. 447 Kapitel 16 Differenzierbare Funktionen Satz 16.6 (Rechenregeln für Ableitungen) Es seien f : D ⊆ R −→ R und g : D ⊆ R −→ R zwei reelle Funktionen, die an der Stelle x0 ∈ D differenzierbar sind und α ∈ R. Dann sind die Funktionen f + g, f − g, fg und αf ebenfalls an der Stelle x0 differenzierbar. Gilt zusätzlich g(x0) = 0, dann ist auch die Funktion fg an der Stelle x0 differenzierbar. Für die ersten Ableitungen gilt: a) (f + g)′(x0) = f ′(x0)+ g′(x0) b) (f − g)′(x0) = f ′(x0)− g′(x0) c) (fg)′(x0) = f ′(x0)g(x0)+ f (x0)g′(x0) (Produktregel) d) (αf )′(x0) = αf ′(x0) e) ( f g )′ (x0) = f ′(x0)g(x0)−f (x0)g′(x0)g2(x0) (Quotientenregel) Beweis: Es sei x0 ∈ D und gemäß Voraussetzung existieren die Grenzwerte f ′(x0) = lim x→0 f (x0 + x)− f (x0) x und g′(x0) = lim x→0 g(x0 + x)− g(x0) x . Zu a) und b): Für den Differenzenquotienten von f + g an der Stelle x0 gilt: (f + g)(x0 + x)− (f + g)(x0) x = f (x0 + x)+ g(x0 + x)− f (x0)− g(x0) x = f (x0 + x)− f (x0) x + g(x0 + x)− g(x0) x Zusammen mit Satz 13.41a) erhält man daraus durch Betrachtung des Grenzwertes für x → 0 lim x→0 (f + g)(x0 + x)− (f + g)(x0) x = lim x→0 f (x0 + x)− f (x0) x + lim x→0 g(x0 + x)− g(x0) x = f ′(x0)+ g′(x0). Das heißt, die Funktion f + g ist an der Stelle x0 differenzierbar und ihre erste Ableitung ist gegeben durch (f + g)′(x0) = f ′(x0)+ g′(x0). Der Beweis von b) verläuft völlig analog. Zu c): Für den Differenzenquotienten von fg an der Stelle x0 gilt: (fg)(x0 + x)− (fg)(x0) x = f (x0 + x)g(x0 + x)− f (x0)g(x0) x = f (x0 + x)− f (x0) x g(x0 + x) + f (x0) g(x0 + x)− g(x0) x Zusammen mit Satz 13.41a) und c) erhält man daraus durch Betrachtung des Grenzwertes für x → 0 lim x→0 (fg)(x0 + x)− (fg)(x0) x = lim x→0 f (x0 + x)− f (x0) x lim x→0 g(x0 + x) + f (x0) lim x→0 g(x0 + x)− g(x0) x = f ′(x0)g(x0)+ f (x0)g′(x0). Die Funktion fg ist folglich an der Stelle x0 differenzierbar und ihre erste Ableitung ist gegeben durch (fg)′(x0) = f ′(x0)g(x0)+ f (x0)g′(x0). Zu d): Es sei g(x) = α. Dann gilt g′(x) = 0 (vgl. Beispiel 16.3a)) und mit Aussage c) folgt, dass αf an der Stelle x0 differenzierbar ist. Für die erste Ableitung erhält man (αf )′(x0) = f ′(x0)α + f (x0) · 0 = αf ′(x0). Zu e): Für den Differenzenquotienten von f g an der Stelle x0 gilt: ( f g ) (x0 + x)− ( f g ) (x0) x = f (x0+ x) g(x0+ x) − f (x0) g(x0) x = f (x0+ x)−f (x0) x g(x0)− f (x0) g(x0+ x)−g(x0) x g(x0)g(x0 + x) . Zusammen mit Satz 13.41b), c) und e) erhält man daraus durch Betrachtung des Grenzwertes für x → 0 lim x→0 ( f g ) (x0 + x)− ( f g ) (x0) x = f ′(x0)g(x0)− f (x0)g′(x0) g2(x0) . Das heißt, die Funktion f g ist an der Stelle x0 differenzierbar und ihre erste Ableitung ist gegeben durch ( f g )′ (x0) = f ′(x0)g(x0)−f (x0)g′(x0) g2(x0) . 448 Kapitel 1616.4 Eigenschaften differenzierbarer Funktionen Aus Satz 16.6e) erhält man unmittelbar für den Kehrwert einer an der Stelle x0 ∈ D differenzierbaren reellen Funktion g : D ⊆ R −→ R mit g(x0) = 0 die Ableitungsregel ( 1 g(x0) )′ = − g ′(x0) g2(x0) . Diese Ableitungsregel wird als Reziprokenregel bezeichnet. Durch Mehrfachanwendung von Satz 16.6a), c) und d) (bzw. formaler durch vollständige Induktion) erhält man für n an der Stelle x0 ∈ D differenzierbare reelle Funktionen fi : D ⊆ R −→ R für i = 1, . . . , n und Konstanten α1, . . . , αn ∈ R die Ableitungsregeln ( n∑ i=1 αifi )′ (x0) = n∑ i=1 αif ′ i (x0) und ( n∏ i=1 fi )′ (x0) = n∑ j=1 f ′j (x0) n∏ i=1 i =j fi(x0). Beispiel 16.7 (Rechenregeln für Ableitungen) a) Die quadratische Funktion p : R −→ R, x %→ x2 ist gemäß Beispiel 16.3b) differenzierbar und besitzt die erste Ableitung p′(x) = 2x. Mit der Produktregel (d. h. Satz 16.6c)) und f (x) = g(x) = x erhält man dasselbe Ergebnis: p′(x) = (fg)′(x) = f ′(x)g(x)+ f (x)g′(x) = 1 · x + x · 1 = 2x b) Das Polynom p : R −→ R, x %→ 3x2+4x−2 ergibt sich durch Multiplikation der quadratischen Funktion f (x) = x2 mit 3 und anschließender Addition mit der affin-linearen Funktion g(x) = 4x−2. Da jedoch f und g differenzierbar sind (vgl. Beispiel 16.3a) und b)), folgt mit Satz 16.6a) und d), dass auch p differenzierbar ist. Für die erste Ableitung gilt: p′(x) = 3f ′1(x)+ f ′2(x) = 6x + 4 c) Die beiden Polynome p1 : R −→ R, x %→ 2x2+x+ 1 und p2 : R −→ R, x %→ 5x2 −5 sind differenzierbar und besitzen die erste Ableitung p′1(x) = 4x+1 bzw. p′2(x) = 10x (vgl. Beispiel 16.7b)). Mit Satz 16.6a)–c) und e) folgt somit, dass auch die reellen Funktionen p1 + p2, p1 − p2, p1p2 für alle x ∈ R und p1 p2 für alle x ∈ R \ {−1, 1} differenzierbar sind. Für die ersten Ableitungen gilt: (p1+p2)′(x) = p′1(x)+ p′2(x) = 4x + 1 + 10x = 14x + 1 (p1−p2)′(x) = p′1(x)− p′2(x) = 4x + 1 − 10x = −6x + 1 (p1p2) ′(x) = p′1(x)p2(x)+ p1(x)p′2(x) = (4x+1)(5x2−5)+(2x2+x+1)10x = 40x3 + 15x2 − 10x − 5 ( p1 p2 )′ (x) = p ′ 1(x)p2(x)− p1(x)p′2(x) p22(x) = (4x+1)(5x 2−5)−(2x2+x+1)10x (5x2 − 5)2 = − 5x 2 + 30x + 5 25x4 − 50x2 + 25 Differenzierbarkeit von Kompositionen Die folgende Ableitungsregel ist als Kettenregel bekannt und macht eine Aussage über die Differenzierbarkeit von Kompositionen (Verknüpfungen) reeller Funktionen: Satz 16.8 (Differenzierbarkeit von Kompositionen (Kettenregel)) Es seien f : Df ⊆ R −→ R und g : Dg ⊆ R −→ R zwei reelle Funktionen mit g(Dg) ⊆ Df , von denen g an der Stelle x0 ∈ Dg und f an der Stelle y0 = g(x0) differenzierbar ist. Dann ist auch die Komposition f ◦ g : Dg ⊆ R −→ R an der Stelle x0 differenzierbar und für die erste Ableitung von f ◦ g an der Stelle x0 gilt (f ◦ g)′(x0) = f ′ (g(x0)) g′(x0). (16.15) Beweis: Zunächst sei angenommen, dass die Funktion g in einer Umgebung von x0 ∈ Dg konstant ist. Dann ist auch f ◦g in dieser Umgebung von x0 konstant und somit insbesondere an der Stelle x0 differenzierbar. Für die erste Ableitung gilt in diesem Fall (f ◦ g)′(x0) = 0 (vgl. Beispiel 16.3a)). 449 Kapitel 16 Differenzierbare Funktionen Die Funktion g sei nun in keiner Umgebung von x0 ∈ Dg konstant. Für den Differenzenquotienten von f ◦g an der Stelle x0 gilt: (f ◦g)(x0+ x)−(f ◦g)(x0) x = f (g(x0 + x))− f (g(x0)) g(x0 + x)− g(x0) · g(x0 + x)− g(x0) x Aus der Differenzierbarkeit von g an der Stelle x0 folgt ferner die Existenz der Grenzwerte lim x→0 g(x0 + x) = g(x0) und lim x→0 g(x0 + x)− g(x0) x = g′(x0). Zusammen mit der Differenzierbarkeit von f an der Stelle y0 = g(x0) und Satz 13.41c) erhält man somit durch Betrachtung des Grenzwertes für x → 0 lim x→0 (f ◦ g)(x0 + x)− (f ◦ g)(x0) x = f ′ (g(x0)) g′(x0). Das heißt, die Funktion f ◦ g ist an der Stelle x0 differenzierbar und ihre erste Ableitung ist gegeben durch (f ◦ g)′(x0) = f ′ (g(x0)) g′(x0). Die Kettenregel (16.15) besagt, dass die erste Ableitung einer Komposition f ◦ g zweier differenzierbarer Funktionen f und g das Produkt aus der Ableitung f ′ (g(x0)) der „äußeren“ Funktion f und der Ableitung g′(x0) der „inneren“ Funktion g ist. Man kann sich daher die Kettenregel durch den Merksatz „äußere Ableitung mal innere Ableitung“ einprägen. Die Differentiation einer Komposition h = f ◦g kann somit in drei Schritte zerlegt werden: a) Identifikation der äußeren und inneren Funktion f bzw. g mit h(x) = f (g(x)). b) Berechnung von f ′(x) und Ersetzen von x durch g(x), so dass f ′ (g(x)) resultiert. c) Multiplikation von f ′ (g(x)) mit g′(x) (sogenanntes Nachdifferenzieren) liefert mit h′(x) = f ′ (g(x)) g′(x) die erste Ableitung der Komposition h = f ◦ g. Werden mehr als zwei reelle Funktionen miteinander verknüpft, dann gilt eine analoge Kettenregel. Zum Beispiel gilt unter entsprechender Verallgemeinerung der Voraussetzungen in Satz 16.8 für die erste Ableitung einer zweifachen Komposition k = (f ◦ g) ◦ h k′(x) = (f (g (h(x))))′ = f ′ (g (h(x))) g′ (h(x)) h′(x). Beispiel 16.9 (Ableiten von Kompositionen) a) Die reelle Funktion h : R −→ R, x %→ h(x) = (x2 + 6x + 5)2 ist die Komposition h = f ◦ g der differenzierbaren äußeren Funktion f : R −→ R, x %→ f (x) = x2 und der differenzierbaren inneren Funktion g : R −→ R, x %→ g(x) = x2 +6x+5. Mit Satz 16.8 folgt somit die Differenzierbarkeit der Komposition h = f ◦ g. Ihre erste Ableitung ist gegeben durch h′(x) = f ′ (g(x)) g′(x) = 2(x2 + 6x + 5)(2x + 6) = (4x + 12)(x2 + 6x + 5). b) Gegeben sei die reelle Funktion k : R \ {−1, 1} −→ R, x %→ k(x) = (( 2x2 + x + 1 5x2 − 5 )2 − 5 )2 . Dann gilt k = (f ◦ g) ◦ h mit den differenzierbaren Funktionen f : R −→ R, x %→ f (x) = x2, g : R −→ R, x %→ g(x) = x2 − 5 und h : R \ {−1, 1} −→ R, x %→ h(x) = 2x2+x+1 5x2−5 . Mit Satz 16.8 folgt somit die Differenzierbarkeit der zweifachen Komposition k = (f ◦ g) ◦ h und für die erste Ableitung erhält man mit Beispiel 16.7c) k′(x) = f ′ (g (h(x))) g′ (h(x)) h′(x) = 2 (( 2x2 + x + 1 5x2 − 5 )2 − 5 ) 2 ( 2x2 + x + 1 5x2 − 5 ) · ( − 5x 2 + 30x + 5 25x4 − 50x2 + 25 ) = −4 (( 2x2 + x + 1 5x2 − 5 )2 − 5 ) · (2x 2 + x + 1)(5x2 + 30x + 5) (5x2 − 5)(25x4 − 50x2 + 25) . Differenzierbarkeit von Umkehrfunktionen Der nächste Satz besagt zum einen, dass die Umkehrfunktion einer streng monotonen differenzierbaren Funktion ebenfalls differenzierbar ist, und zum anderen macht er eine Aussage darüber, wie die erste Ableitung der Umkehrfunktion be- 450 Kapitel 1616.4 Eigenschaften differenzierbarer Funktionen −2 −1.5 −1 −0.5 0.5 1 1.5 2 −150 −100 −50 50 100 150 200 250 k(x) k′(x) y = xf −1(x) f (x) y = ax + b y = 1 a x − b a y0 x0 x0 y0 l l Abb. 16.4: Reelle Funktion k : R\ {−1, 1} −→ R, x %→ (( 2x2+x+1 5x2−5 )2 − 5 )2 mit erster Ableitung k′(x) (links) und Zusammenhang zwischen der ersten Ableitung einer reellen Funktion f an der Stelle x0 und der ersten Ableitung ihrer Umkehrfunktion f−1 an der Stelle y0 = f (x0) (rechts) rechnet werden kann. Mit Hilfe dieses Satzes werden in Abschnitt 16.5 für trigonometrische Funktionen und Exponentialfunktionen die Differenzierbarkeit ihrer Umkehrfunktionen nachgewiesen und jeweils deren erste Ableitung berechnet. Satz 16.10 (Differenzierbarkeit der Umkehrfunktion) Es sei f : D ⊆ R −→ R eine streng monotone reelle Funktion, die an der Stelle x0 ∈ D differenzierbar ist mit f ′(x0) = 0. Dann ist die Umkehrfunktion f −1 an der Stelle y0 = f (x0) differenzierbar und besitzt an der Stelle y = f (x0) die erste Ableitung (f −1)′ (f (x0)) = 1 f ′(x0) bzw. (f −1)′(y) = 1 f ′ ( f −1(y) ) . Beweis: Es sei x0 ∈ D beliebig gewählt und y0 = f (x0). Aufgrund der strengen Monotonie von f existiert gemäß Satz 13.10 die Umkehrfunktion f−1 : f (D) ⊆ R −→ R. Für diese Umkehrfunktion gilt (f−1 ◦ f )(x) = f−1(f (x)) = x. Durch Ableiten der linken und rechten Seite dieser Gleichung erhält man mit Satz 16.8 (f−1 ◦ f )′(x0) = (f−1)′ ( f (x0) ) · f ′(x0) = 1. Folglich gilt (f−1)′ ( f (x0) )= 1 f ′(x0) bzw. (f−1)′(y0)= 1 f ′ ( f−1(y0) ) . Die Abbildung 16.4, rechts zeigt den Graphen einer invertierbaren und differenzierbaren reellen Funktion f :D⊆R−→R und den durch Spiegelung an der ersten Winkelhalbierenden y = x gewonnenen Graphen ihrer Umkehrfunktion f −1. Da die Ableitung der Funktion f an einer Stelle x0 ∈ D der Steigung der Tangente t : R−→R, x %→ ax+b an den Graphen von f im Punkt (x0, y0) entspricht, erhält man die Ableitung der Umkehrfunktion f −1 an der Stelle y0 = f (x0), indem man die Tangente t an der ersten Winkelhalbierenden y = x spiegelt. Die Steigung der Spiegelung von t (x) = ax+b mit a = 0 ist jedoch gerade der Kehrwert der Steigung a. Denn aus der Geraden y = ax+b erhält man durch Auflösen nach x und anschließenden Vertauschen der Rollen von x und y die Gleichung y = 1 a x− b a . Das heißt, die Steigung von f −1 in y0 ist gegeben durch (f −1)′(y0) = 1 a = 1 f ′(x0) . 451 Kapitel 16 Differenzierbare Funktionen Beispiel 16.11 (Ableiten von Umkehrfunktionen) a) Die reelle Funktion f : R+−→R, x %→f (x)=x2 ist streng monoton wachsend und differenzierbar mit der ersten Ableitung f ′(x) = 2x = 0 für alle x ∈ R+\{0}. Die Umkehrfunktion von f ist gegeben durch f −1 : R+ −→ R, y %→ √y. Mit Satz 16.10 folgt somit, dass f −1 an allen Stellen y = f (x) ∈ R+\{0} differenzierbar ist. Für die erste Ableitung erhält man (f −1)′(y) = 1 f ′ ( f −1(y) ) = 1 2 √ y . b) Die reelle Funktion f :R −→ R, x %→ f (x) = x3 ist streng monoton wachsend und differenzierbar mit der ersten Ableitung f ′(x) = 3x2 für alle x ∈ R. Die Umkehrfunktion von f ist gegeben durch f −1 : R −→ R, y %→ 3√y. Wegen f ′(x) = 0 für alle x ∈ R \ {0} folgt mit Satz 16.10, dass f −1 an allen Stellen y = f (x) ∈ R \ {0} differenzierbar ist. Für die erste Ableitung von f −1 folgt (f −1)′(y) = 1 f ′ ( f −1(y) ) = 1 3( 3 √ y)2 = 1 3y 2 3 . c) Die reelle Funktion f : [3,∞) −→ R, x %→ ((x − 3)2 + 4)2 ist streng monoton wachsend und differenzierbar mit der ersten Ableitung f ′(x)=4((x − 3)2 + 4)(x − 3) = 0 für alle x > 3. Die Umkehrfunktion von f erhält man durch Auflösen der Gleichung y =( (x − 3)2 + 4)2 nach x. Es resultiert dann die Umkehrfunktion f −1 : [16,∞) −→ R, y %→ √√y − 4 + 3 und mit Satz 16.10 folgt, dass f −1 an allen Stellen y = f (x) > 16 differenzierbar ist mit der ersten Ableitung (f −1)′(y) = 1 f ′ ( f −1(y) ) = 1 4 ((√√ y−4+3−3)2+4 ) (√√ y−4+3−3) = 1 4 √ y (√√ y − 4) . Mit Hilfe der drei Sätze 16.6, 16.8 und 16.10 wird im folgenden Abschnitt 16.5 gezeigt, dass alle elementaren Funktionen – bis auf eventuell endlich viele Stellen – differenzierbar sind. 16.5 Differenzierbarkeit elementarer Funktionen Polynome und rationale Funktionen Der folgende Satz besagt, dass Polynome – und damit insbesondere auch Monome – sowie rationale Funktionen differenzierbar sind. Dieses wichtige Resultat folgt aus den Rechenregeln für differenzierbare Funktionen: Satz 16.12 (Ableitung Polynome und rationale Funktionen) Polynome p : R −→ R, x %→ n∑ k=0 akx k und rationale Funktionen q : D ⊆ R −→ R, x %→ p1(x) p2(x) = n∑ k=0 akx k m∑ k=0 bkx k mit D = {x ∈ R : p2(x) = 0} sind differenzierbar und besitzen die erste Ableitung p′(x) = n∑ k=1 akkx k−1 bzw. q ′(x) = n∑ k=1 akkx k−1 m∑ k=0 bkx k − n∑ k=0 akx k m∑ k=1 bkkx k−1 ( m∑ k=0 bkxk )2 . (16.16) Beweis: Betrachtet wird ein Monom αxn mit n ∈ N0 und α ∈ R sowie eine beliebige Stelle x0 ∈ R. Für den Differenzenquotienten an der Stelle x0 erhält man mit dem Binomischen Lehrsatz 5.12 α(x0 + x)n − αxn0 x = α x [ xn0 +nxn−10 x+ ( n 2 ) xn−20 ( x) 2+. . .+( x)n−xn0 ] = α x [ nxn−10 x + ( n 2 ) xn−20 ( x) 2 + . . .+ ( x)n ] =αnxn−10 + α x [( n 2 ) xn−20 + . . .+ ( x)n−2 ] . Zusammen mit Satz 13.41a) erhält man daraus durch Betrachtung des Grenzwertes für x → 0 lim x→0 α(x0+ x)n−αxn0 x = { αnxn−10 für n ∈ N 0 für n = 0 . (16.17) Dies bedeutet, dass das Monom f (x) = αxn differenzierbar ist und als erste Ableitung (16.17) besitzt. 452 Kapitel 1616.5 Differenzierbarkeit elementarer Funktionen Daraus folgt zusammen mit Satz 16.6a), dass ein Polynom p(x) = ∑nk=0 akxk als Summe von Monomen an der Stelle x0 ebenfalls differenzierbar und die erste Ableitung p′(x) durch den linken Term in (16.16) gegeben ist. Zusammen mit Satz 16.6e) impliziert dies, dass auch rationale Funktionen als Quotienten zweier Polynome stets differenzierbar sind und als erste Ableitung den rechten Term in (16.16) besitzen. Beispiel 16.13 (Ableiten von Polynomen und rationalen Funktionen) a) Das Polynom p : R→R, x %→ 15x7−2x6+23x5−x4+17x3+3x2−15x−2 ist differenzierbar und besitzt die erste Ableitung p′(x) = 7 5 x6 −12x5 + 10 3 x4 −4x3 + 3 7 x2 +6x− 1 5 . b) Die rationale Funktion q : R\ {−2,−1, 1}→R, x %→ 1 4x 4+2x3−8 3x3+6x2−3x−6 ist differenzierbar und besitzt die erste Ableitung q ′(x) = ( x3 + 6x2)(3x3 + 6x2 − 3x − 6) −( 14x4 + 2x3 − 8 ) (9x2 + 12x − 3) (3x3 + 6x2 − 3x − 6)2 = 3 4x 6+3x5+ 394 x4−18x3+36x2+96x−24 (3x3 + 6x2 − 3x − 6)2 . Exponential-, Logarithmus- und Potenzfunktionen Der folgende Satz besagt, dass auch die Logarithmus-, Exponential- und Potenzfunktionen differenzierbar sind: Satz 16.14 (Ableitung Exponential-, Logarithmusund Potenzfunktion) Die Logarithmus-, Exponential- und Potenzfunktionen sind differenzierbar und für die erste Ableitung gilt: a) f (x) = ln(x) ⇒ f ′(x) = 1 x b) f (x) = loga(x) mit a > 0 ⇒ f ′(x) = 1ln(a)x c) f (x) = exp(x) ⇒ f ′(x) = exp(x) d) f (x) = ax mit a > 0 ⇒ f ′(x) = ax ln(a) e) f (x) = xc ⇒ f ′(x) = cxc−1 Beweis: Zu a): Es sei x0 > 0 beliebig gewählt. Mit den Rechenregeln für den Logarithmus (vgl. Satz 14.35b)-c)) erhält man für den Differenzenquotienten ln(x0 + x)− ln(x0) x = 1 x ln ( x0 + x x0 ) = ln [( x0 + x x0 ) 1 x ] = ln ⎛ ⎜ ⎝ [( 1 + x x0 ) x0 x ] 1 x0 ⎞ ⎟ ⎠ = 1 x0 ln [( 1 + 1x0 x ) x0 x ] . Die Betrachtung des Grenzwertes für x → 0 liefert zusammen mit der Stetigkeit von ln (vgl. Satz 15.18) und lim h→∞ ( 1+ 1 h )h = e (vgl. (11.10)) lim x→0 ln(x0 + x)− ln(x0) x = lim x→0 1 x0 ln [( 1 + 1x0 x ) x0 x ] = 1 x0 ln [ lim x→0 ( 1 + 1x0 x ) x0 x ] = 1 x0 ln [ lim x0 x →∞ ( 1 + 1x0 x ) x0 x ] = 1 x0 ln(e) = 1 x0 . Die natürliche Logarithmusfunktion ln ist folglich an der Stelle x0 differenzierbar und ihre erste Ableitung ist gegeben durch f ′(x0) = 1x0 . Zu b): Es seien x0 > 0 und a > 0 beliebig gewählt. Es gilt x = aloga(x) und damit insbesondere ln(x) = ln ( aloga(x) ) = loga(x) ln(a) (vgl. Satz 14.35c)). Das heißt, es gilt loga(x) = 1ln(a) ln(x) und mit Aussage a) folgt daher, dass auch die allgemeine Logarithmusfunktion loga an der Stelle x0 differenzierbar ist und die erste Ableitung f ′(x0) = 1ln(a)x0 besitzt. Zu c): Die Exponentialfunktion exp ist die Umkehrfunktion f−1 der natürlichen Logarithmusfunktion f (x) = ln(x) (siehe Definition 14.34). Für ein beliebiges x0 ∈ R erhält man mit Satz 16.10 und Aussage a), dass exp an der Stelle x0 differenzierbar ist. Für die erste Ableitung folgt f ′(x0) = 1 (f−1)′ (f (x0)) = 1 1 exp(x0) = exp(x0). Zu d): Es seien x0 ∈ R und a > 0 beliebig gewählt. Es gilt f (x) = ax = (eln(a))x = ex ln(a). Mit Satz 16.8 und Aussage 453 Kapitel 16 Differenzierbare Funktionen c) folgt daher, dass die allgemeine Exponentialfunktion an der Stelle x0 differenzierbar ist. Für die erste Ableitung gilt f ′(x0) = ex0 ln(a) ln(a) = ax0 ln(a). Zu e): Es seien x0 > 0 und c ∈ R beliebig gewählt. Es gilt f (x) = xc = eln(xc) = ec ln(x). Mit Satz 16.8 sowie den Aussagen a) und c) folgt daher, dass die Potenzfunktion an der Stelle x0 differenzierbar ist. Für die erste Ableitung gilt f ′(x0) = ec ln(x0) c x0 = xc0 c x0 = cxc−10 . Die Aussage c) von Satz 16.14 ist der Grund, weshalb die Exponentialfunktion exp und damit auch ihre Umkehrfunktion, die natürliche Logarithmusfunktion ln, so bedeutend sind. Denn wie sich leicht zeigen lässt, ist die Exponentialfunktion exp bis auf einen konstanten Faktor die einzige auf einem Intervall I ⊆ R definierte reelle Funktion f : I ⊆ R −→ R, die sich selbst als erste Ableitung besitzt. Für ein x < 0 folgt mit der Kettenregel (16.15) und Satz 16.14a) ln′ |x| = ln′(−x) = 1−x · (−1) = 1 x . Die Aussage a) von Satz 16.14 kann somit dahingehend verallgemeinert werden, dass die natürliche Logarithmusfunktion ln : R \ {0} −→ R, x %→ ln |x| sogar auf dem DefinitionsbereichR\{0} differenzierbar ist und die erste Ableitung ln′ |x| = 1 x (16.18) besitzt. Ist nun durch g : D ⊆ R −→ R \ {0} , x %→ g(x) eine weitere differenzierbare reelle Funktion gegeben, dann folgt mit Satz 16.8, dass auch die Komposition f (x) = ln |g(x)| für x ∈ D differenzierbar ist und mit der Kettenregel (16.15) und (16.18) erhält man für ihre erste Ableitung f ′(x) = (ln |g(x)|)′ = 1 g(x) g′(x) = g ′(x) g(x) . (16.19) Die reelle Funktion f : D ⊆ R −→ R, x %→ ln |g(x)| wird als logarithmierte Funktion von g bezeichnet und ihre Ableitung, d. h. der Quotient g ′(x) g(x) , heißt logarithmierte Ableitung von g. Die Formel (16.19) ist oft ein nützliches Hilfsmittel bei der Berechnung von Ableitungen (vgl. Beispiel 16.15a) und d)). Auf Grundlage der obigen Resultate können nun auch komplizierte Funktionen leicht abgeleitet werden: Beispiel 16.15 (Ableiten von Exponential-, Logarithmus- & Potenzfunktion) a) Die reelle Funktion f : R+ \ {0} −→ R, x %→ xx lässt sich weder mit der Ableitungsregel für Potenzfunktionen noch mit der Ableitungsregel für Exponentialfunktionen ableiten, da bei der Funktion f sowohl die Basis als auch der Exponent eine Funktion von x ist. Da jedoch xx = (eln(x))x für alle x ∈ R+ \ {0} gilt, folgt mit Satz 16.8 und der Differenzierbarkeit der Logarithmus- und Exponentialfunktion, dass auch die Funktion f differenzierbar ist. Ferner gilt ln ( f (x) ) = ln(xx) = x ln(x) für alle x ∈ R+ \ {0}. Mit (16.19), der Produktregel und Satz 16.14a) erhält man somit f ′(x) f (x) = (ln(f (x)))′ = (x ln(x))′ = 1 · ln(x)+ x · 1 x = ln(x)+ 1. Für die erste Ableitung von f folgt daraus (vgl. Abbildung 16.5, links) f ′(x) = f (x)(ln(x)+ 1) = xx(ln(x)+ 1). b) Die beiden reellen Funktionen g : D⊆R−→R\{0}, x %→ g(x) und h : D ⊆ R −→ R, x %→ h(x) seien differenzierbar. Dann gilt |g(x)|h(x) = exp (h(x) ln |g(x)|) und mit Satz 16.8 und der Differenzierbarkeit der Logarithmus- und Exponentialfunktion folgt, dass auch f (x) = |g(x)|h(x) differenzierbar ist. Mit der Kettenregel (16.15) und Satz 16.14c) erhält man für die erste Ableitung von f f ′(x) = (exp(h(x) ln |g(x)|))′ = f (x)(h(x) ln |g(x)|)′. Mit der Produktregel und (16.19) folgt schließlich f ′(x) = f (x) ( h′(x) ln |g(x)| + h(x)g ′(x) g(x) ) . c) Die reelle Funktion f : (0,∞) −→ R, x %→ 1 x √ x + 2 x5 − 3xx 72 ergibt sich durch Addition, Subtraktion und Multiplikation von Potenz- und Exponentialfunktionen 454 Kapitel 1616.5 Differenzierbarkeit elementarer Funktionen 0 1 2 3 4 0 50 100 150 200 250 300 f(x) f′(x) 1 2 3 −1000 −500 0 500 1000 f(x) f′(x) Abb. 16.5: Reelle Funktion f : R+ \ {0} −→ R, x %→ xx mit erster Ableitung f ′(x) (links) und reelle Funktion f : (0,∞) −→ R, x %→ 1 x √ x + 2 x5 − 3xx 72 mit erster Ableitung f ′(x) (rechts) und ist deshalb gemäß Satz 16.6a)–c) ebenfalls differenzierbar. Für die erste Ableitung von f (x) = x− 3 2 +2x−5 −3xx 72 erhält man mit der Produktregel sowie 16.14d) und e) (vgl. Abbildung 16.5, rechts) f ′(x)=−3 2 x− 5 2 − 10x−6 − ( 3x ln(3)x 7 2 + 3x 7 2 x 5 2 ) =− 3 2 √ x5 − 10 x6 − 3x ( ln(3)x 7 2 + 7 2 x 5 2 ) . d) Die rationale Funktion q : R \ {−3, 1} −→ R, x %→ (x − 2)e 2x (x − 1)3(x + 3)2 ist differenzierbar, aber die Berechnung der ersten Ableitung von q ist relativ aufwendig. Deutlich schneller geht es mit der Formel (16.19). Denn mit den Rechengesetzen für den Logarithmus erhält man ln |q(x)|= ln ∣∣(x − 2)e2x∣∣− ln ∣∣(x − 1)3(x + 3)2∣∣ = ln |x − 2|+2x − 3 ln |x − 1|−2 ln |x + 3| für alle x ∈ R\ {−3, 1, 2} und für die Ableitung gilt (ln |q(x)|)′ = 1 x − 2 + 2 − 3 x − 1 − 2 x + 3 . Daraus folgt mit (16.19) q ′(x) = q(x) (ln |q(x)|)′ = e 2x (x − 1)3(x + 3)2 · ( 1 + 2(x − 2)− 3(x − 2) x − 1 − 2(x − 2) x + 3 ) . Trigonometrische Funktionen und Arcusfunktionen Gegenstand des folgenden Satzes ist die Differenzierbarkeit der vier trigonometrischen Funktionen sin, cos, tan und cot: Satz 16.16 (Ableitungen trigonometrischer Funktionen) Die Sinus-, Kosinus-, Tangens- und Kotangensfunktionen sind differenzierbar und für die erste Ableitung gilt jeweils: a) f (x) = sin(x) ⇒ f ′(x) = cos(x) b) f (x) = cos(x) ⇒ f ′(x) = − sin(x) c) f (x) = tan(x) ⇒ f ′(x) = 1 cos2(x) d) f (x) = cot(x) ⇒ f ′(x) = − 1 sin2(x) 455 Kapitel 16 Differenzierbare Funktionen Beweis: Zu a): Es sei x0 ∈ R beliebig gewählt. Mit dem Additionstheorem sin(x+y) = sin(x) cos(y)+cos(x) sin(y) (vgl. Satz 5.2a)) erhält man für den Differenzenquotienten von sin an der Stelle x0 sin(x0 + x)− sin(x0) x = sin(x0) ( cos( x)− 1)+ cos(x0) sin( x) x . Mit der Identität sin2(x)+cos2(x) = 1 (vgl. Satz 5.1b)) und dem Additionstheorem cos(x + y) = cos(x) cos(y) − sin(x) sin(y) (vgl. Satz 5.2b)) folgt daraus weiter sin(x0 + x)− sin(x0) x = cos(x0) sin( x) x + sin(x0) cos ( 2 x2 )− (cos2( x2 )+ sin2( x2 )) x = cos(x0) sin( x) x + sin(x0) cos 2 ( x 2 )− sin2( x2 )− cos2 ( x2 )− sin2( x2 ) 2 x2 = cos(x0) sin( x) x − sin(x0) sin ( x 2 ) sin ( x 2 ) x 2 . Wegen lim y→0 sin(y) = 0 und limy→0 sin(y) y = 1 (vgl. (13.11)) erhält man daraus für x → 0 lim x→0 sin(x0 + x)− sin(x0) x = cos(x0). Das heißt, die Funktion sin ist an der Stelle x0 differenzierbar und ihre erste Ableitung ist gegeben durch f ′(x0) = cos(x0). Zu b): Es sei x0 ∈ R beliebig gewählt. Wegen cos(x0) = sin ( π 2 − x0 ) (vgl. Satz 5.1e)) erhält man mit Aussage a) und der Kettenregel (16.15), dass auch cos an der Stelle x0 differenzierbar ist mit der ersten Ableitung f ′(x0) = ( sin (π 2 − x0 ))′ = cos (π 2 − x0 ) (−1) = − sin(x0). Zu c): Es sei x0 ∈ R \ { x ∈ R : x = (2k + 1) π2 für k ∈ Z } beliebig gewählt. Dann folgt mit der Quotientenregel (vgl. Satz 16.6e)), den Aussagen a) und b) sowie der Identität sin2(x)+ cos2(x) = 1, dass auch tan an der Stelle x0 differenzierbar ist mit der ersten Ableitung f ′(x0) = ( sin(x0) cos(x0) )′ = cos(x0) cos(x0)+ sin(x0) sin(x0) cos2(x0) = 1 cos2(x0) . Zu d): Es sei x0 ∈ R \ {x ∈ R : x = kπ für k ∈ Z} beliebig gewählt. Dann folgt mit der Kettenregel (16.15) und Aussage c), dass auch cot an der Stelle x0 differenzierbar ist mit der ersten Ableitung f ′(x0)= ( 1 tan(x0) )′ =− tan ′(x0) tan2(x0) =− 1 cos2(x0) tan2(x0) =− 1 sin2(x0) . Beispiel 16.17 (Ableiten von trigonometrischen Funktionen) a) Die reelle Funktion f : R \ {x ∈ R : x = kπ für k ∈ Z} −→ R, x %→ ln ∣∣tan ( x2 )∣∣ ist als Komposition der Logarithmus- und der Tangensfunktion differenzierbar. Für die erste Ableitung von f erhält man mit der Kettenregel (16.15) und Satz 5.2c) (vgl. Abbildungen 16.6, links) f ′(x) = 1 tan ( x 2 ) ( tan (x 2 ))′ = 1 tan ( x 2 ) 1 cos2 ( x 2 ) 1 2 = 1 2 sin ( x 2 ) cos ( x 2 ) = 1 sin(x) . b) Die reelle Funktion f : R \ {−1} −→ R, x %→ cos ( exp ( 1−x 1+x )) ist als Komposition einer rationalen Funktion, der Exponential- und der Kosinusfunktion differenzierbar. Mit der Kettenregel (16.15) und der Quotientenregel (vgl. Satz 16.6e)) erhält man für die erste Ableitung (vgl. Abbildung 16.6, rechts) f ′(x) = − sin ( exp ( 1−x 1+x )) exp ( 1−x 1+x )( 1−x 1+x )′ = − sin ( exp ( 1 − x 1 + x )) · exp ( 1 − x 1 + x ) −(1 + x)− (1 − x) (1 + x)2 = 2 (1 + x)2 sin ( exp ( 1 − x 1 + x )) exp ( 1 − x 1 + x ) . Aus Satz 16.10 folgt auch, dass die Umkehrfunktionen der trigonometrischen Funktionen, d. h. die Arcusfunktionen, differenzierbar sind: 456 Kapitel 1616.5 Differenzierbarkeit elementarer Funktionen − π − π 2 π 2 π −10 −5 5 10 f (x) f ′(x) −10 −5 5 10 −3 −2 −1 1 2 3 f (x) f ′(x) Abb. 16.6: Reelle Funktion f : R \ {x ∈ R : x = kπ für k ∈ Z} −→ R, x %→ ln ∣∣tan ( x2 )∣∣ mit erster Ableitung f ′(x) (links) und reelle Funktion f : R \ {−1} −→ R, x %→ cos ( exp ( 1−x 1+x )) mit erster Ableitung f ′(x) (rechts) Satz 16.18 (Ableitungen Arcusfunktionen) Die Arcussinus- und Arcuskosinus-Funktionen sind differenzierbar auf dem offenen Intervall (−1, 1) und die Arcustangens- sowie Arcuskotangens-Funktionen sind differenzierbar auf ganz R. Für die erste Ableitung gilt jeweils: a) f (x) = arcsin(x) ⇒ f ′(x) = 1√ 1−x2 b) f (x) = arccos(x) ⇒ f ′(x) = − 1√ 1−x2 c) f (x) = arctan(x) ⇒ f ′(x) = 1 1+x2 d) f (x) = arccot(x) ⇒ f ′(x) = − 1 1+x2 Beweis: Zu a): Es sei x0 ∈ (−1, 1) beliebig gewählt. Da arcsin die Umkehrfunktion der Sinusfunktion f (x) = sin(x) ist, folgt mit Satz 16.10 und Satz 16.16a), dass arcsin an der Stelle x0 differenzierbar ist, und wegen cos(x) = √ 1 − sin2(x) erhält man für die erste Ableitung f ′(x0) = 1 (f−1)′ (f (x0)) = 1 cos(arcsin(x0)) = 1√ 1 − sin2(arcsin(x0) ) = 1 √ 1 − x20 . Zu b): Es sei x0 ∈ (−1, 1) beliebig gewählt. Aus arccos(x) = π 2 − arcsin(x) für x ∈ [−1, 1] (vgl. (14.38)) und Aussage a) folgt, dass auch arccos an der Stelle x0 differenzierbar ist mit der ersten Ableitung f ′(x) = − arcsin′(x) = − 1√ 1 − x20 . Zu c): Es sei x0 ∈ R beliebig gewählt. Da arctan die Umkehrfunktion der Tangensfunktion f (x) = tan(x) ist, folgt mit Satz 16.10 und Satz 16.16c), dass arctan an der Stelle x0 differenzierbar ist, und mit Satz 5.6c) erhält man für die erste Ableitung arctan′(x0) = 1 (f−1)′ (f (x0)) = 1 1 cos2(arctan(x0)) = 1 1 + tan2(arctan(x0)) = 1 1 + x20 . Zu d): Es sei x0 ∈ R beliebig gewählt. Aus arccot(x) = π2 − arctan(x) für x ∈ R (vgl. (14.39)) und Aussage c) folgt, dass auch arccot an der Stelle x0 differenzierbar ist mit der ersten Ableitung arccot′(x) = − arctan′(x) = − 1 1 + x20 . Beispiel 16.19 (Ableiten von Arcusfunktionen) a) Die reelle Funktion f : R → R, x %→ arcsin ( 1−x2 1+x2 ) ist als Komposition der Arcussinus-Funktion und einer rationalen Funktion differenzierbar für alle 457 Kapitel 16 Differenzierbare Funktionen x ∈ R \ {0}. Mit der Kettenregel (16.15) und der Quotientenregel (vgl. Satz 16.6e)) erhält man für die erste Ableitung (vgl. Abbildung 16.7, links) f ′(x)= 1√ 1− ( 1−x2 1+x2 )2 (−2x)(1 + x2)− (1 − x2)2x (1 + x2)2 = 1√ 1 − ( 1−x2 1+x2 )2 −4x (1 + x2)2 = 1 + x 2 √ 4x2 · −4x (1 + x2)2 = {− 2 1+x2 für x > 0 2 1+x2 für x < 0 . b) Die reelle Funktion f : [0,∞)→R, x %→arccot ( 1 1+√x ) ist als Komposition der Arcuskotangens-Funktion, einer rationalen Funktion und einer Potenzfunktion differenzierbar für alle x ∈ (0,∞). Mit der Kettenregel (16.15) erhält man für die erste Ableitung (vgl. Abbildung 16.7, rechts) f ′(x) = − 1 1 + 1 (1+√x)2 · −1 (1 +√x)2 · 1 2 √ x = 1 (1 +√x)2 + 1 · 1 2 √ x . −20 −10 −5 5 10 15 20 −2 −1.5 −1 −0.5 0.5 1 1.5 2 f (x) f ′(x) 0 5 10 0.5 1 1.5 2 f (x) f ′(x) Abb. 16.7: Reelle Funktion f : R −→ R, x %→ arcsin ( 1−x2 1+x2 ) mit erster Ableitung f ′(x) (links) und reelle Funktion f : [0,∞) −→ R, x %→ arccot ( 1 1+√x ) mit erster Ableitung f ′(x) (rechts) 16.6 Ableitungen höherer Ordnung Höhere Ableitungen Die erste Ableitung einer reellen differenzierbaren Funktion f : D −→ R ist selbst wieder eine reelle Funktion f ′ : D −→ R, die an einer Stelle x0 ∈ D differenzierbar sein kann, jedoch nicht sein muss. Dies motiviert die folgende Definition für Ableitungen höherer Ordnung: Definition 16.20 (Ableitungen höherer Ordnung) Es sei f : D ⊆ R −→ R eine reelle differenzierbare Funktion. Dann gilt: a) Ist die erste Ableitung von f an der Stelle x0 ∈ D differenzierbar, dann heißt f an der Stelle x0 zweimal differenzierbar. Die Ableitung der ersten Ableitung f ′ an der Stelle x0 wird mit f ′′(x0) bezeichnet und zweite Ableitung oder Differentialquotient zweiter Ordnung von f an der Stelle x0 genannt. Die Funktion f heißt zweimal differenzierbar auf E ⊆ D, falls f an allen Stellen x0 ∈ E zweimal differenzierbar ist, und die Funktion f ′′ : E −→ R, x %→ f ′′(x) wird dann als zweite Ableitung oder Ableitung zweiter Ordnung von f auf E bezeichnet. Gilt sogar 458 Kapitel 1616.6 Ableitungen höherer Ordnung E=D, dann wird f zweimal differenzierbare Funktion oder einfach nur zweimal differenzierbar genannt. b) Existiert die (n− 1)-te Ableitung von f und ist diese an der Stelle x0 ∈ D differenzierbar, dann heißt f an der Stelle x0 n-fach differenzierbar. Die Ableitung der (n − 1)-ten Ableitung f (n−1) an der Stelle x0 wird mit f (n)(x0) bezeichnet und n-te Ableitung oder Differentialquotient n-ter Ordnung von f an der Stelle x0 genannt. Die Funktion f heißt n-fach differenzierbar auf E ⊆ D, falls f an allen Stellen x0 ∈ E n-fach differenzierbar ist, und die Funktion f (n) : E −→ R, x %→ f (n)(x) wird dann als n-te Ableitung oder Ableitung n-ter Ordnung von f auf E bezeichnet. Gilt sogar E = D, dann wird f n-fach differenzierbare Funktion oder einfach nur nfach differenzierbar genannt. c) Existiert für alle n ∈ N die n-te Ableitung von f an der Stelle x0 ∈ D, dann heißt f an der Stelle x0 unendlich oft differenzierbar. Die Funktion f heißt unendlich oft differenzierbar auf E ⊆ D, falls f an allen Stellen x0 ∈ E unendlich oft differenzierbar ist. Gilt sogar E = D, dann wird f unendlich oft differenzierbare Funktion oder einfach nur unendlich differenzierbar genannt. Für Ableitungen der Ordnung Eins, Zwei und Drei wird in der Regel die Schreibweise f ′, f ′′ bzw. f ′′′ verwendet, während für Ableitungen der Ordnung n ≥ 4 die Schreibweise f (n) bevorzugt wird. Ferner ist es für eine kompakte Schreibweise bei vielen Formeln zweckmäßig, eine reelle Funktion f : D ⊆ R −→ R selbst als 0-te Ableitung oder als 0-te Ableitungsfunktion zu bezeichnen und für alle x ∈ D zu definieren: f (0)(x) := f (x) (16.20) Neben f (n)(x0) sind auch df (n−1)(x) dx ∣ ∣∣ ∣ x=x0 , df (n−1) dx (x0), dnf dxn (x0) und dny dxn (x0) übliche Notationen für die n-te Ableitung von f an der Stelle x0. Die zweite Ableitung f ′′ einer reellen Funktion f gibt die Veränderung der ersten Ableitung f ′ an. Sie kann daher geometrisch als die Krümmung des Graphen von f interpretiert und zur Charakterisierung der Krümmungseigenschaften einer reellen Funktion f verwendet werden (siehe hierzu auch Folgerung 16.34). Eine reelle Funktion f : D ⊆ R −→ R ist genau dann n-fach differenzierbar an der Stelle x0, wenn die (n−1)-te Ableitung f (n−1) existiert und an der Stelle x0 differenzierbar ist, also der Grenzwert f (n)(x0) := lim x→0 f (n−1)(x0 + x)− f (n−1)(x0) x existiert. Das heißt, eine (n−1)-fach differenzierbare Funktion muss nicht notwendigerweise auch n-fach differenzierbar sein. Zum Beispiel ist die reelle Funktion f : R −→ R, x %→ x|x| differenzierbar, aber ihre erste Ableitung f ′ : R −→ R, x %→ 2|x| ist an der Stelle x0 = 0 nicht differenzierbar (vgl. Beispiel 16.3d)). Umgekehrt existieren jedoch für eine n-fach differenzierbare Funktion f : D ⊆ R −→ R stets alle Ableitungen kleinerer Ordnung, d. h. f ′, f ′′, . . . , f (n−1), und diese sind gemäß Satz 16.5 auch stetig. Wie bereits erwähnt, heißt eine reelle Funktion f : D ⊆ R −→ R stetig differenzierbar, wenn sie differenzierbar und die erste Ableitung f ′ stetig ist. Ist die Funktion f sogar nfach differenzierbar mit stetiger n-ter Ableitung f (n), dann wird sie als n-fach stetig differenzierbar bezeichnet. Beispiel 16.21 (Höhere Ableitungen bei reellen Funktionen) Gegeben seien die vier unendlich oft differenzierbaren reellen Funktionen: f1 : R −→ R, x %→ f1(x) = 2x3 − 3x2 + x − 2 f2 : R −→ R, x %→ f2(x) = sin(x) f3 : R −→ R, x %→ f3(x) = 3e2x f4 : R+ \ {0} −→ R, x %→ f4(x) = ln(x) Für die höheren Ableitungen von f1 gilt f ′1(x) = 6x2 − 6x + 1, f ′′1 (x) = 12x − 6, f ′′′1 (x) = 12 und f (n)1 (x) = 0 für alle n ≥ 4 (vgl. Abbildung 16.8, links). Für die ersten vier Ableitungen von f2 erhält man f ′2(x) = cos(x), f ′′2 (x) = − sin(x), f ′′′2 (x) = − cos(x), f (4)2 = sin(x). 459 Kapitel 16 Differenzierbare Funktionen −2 −1 1 2 −10 −8 −6 −4 −2 2 4 6 8 10 12 14 f1(x) f1′(x) f1″(x) f1″′(x) f1 (4)(x) 1 2 3 4 −10 −8 −6 −4 −2 0 2 4 6 8 10 f4(x) f4′(x) f4″(x) f4″′(x) f4 (4)(x) Abb. 16.8: Reelle Funktion f1 : R −→ R, x %→ f1(x) = 2x3 − 3x2 + x − 2 mit ihren ersten vier Ableitungen (links) und reelle Funktion f4 : R+ \ {0} −→ R, x %→ f4(x) = ln(x) mit ihren ersten vier Ableitungen (rechts) Allgemein gilt für die höheren Ableitungen von f2 f (n) 2 (x) = { (−1) n2 sin(x) für n ∈ N gerade (−1) n−12 cos(x) für n ∈ N ungerade . Für die ersten drei Ableitungen von f3 erhält man f ′3(x) = 6e2x, f ′′3 (x) = 12e2x, f ′′′3 (x) = 24e2x, f (4)3 (x) = 48e2x . Für die höheren Ableitungen von f3 gilt allgemein f (n) 3 (x) = 3 · 2n · e2x für alle n ∈ N0. Für die ersten vier Ableitungen von f4 erhält man f ′4(x) = 1 x , f ′′4 (x) = − 1 x2 , f ′′′4 (x) = 2 x3 , f (4) 4 = −6 x4 . Für die höheren Ableitungen von f4 gilt allgemein f (n) 4 (x) = (−1)(n−1) (n−1)!xn für alle n ∈ N (vgl. Abbildung 16.8, rechts). Rechenregeln für höhere Ableitungen In Abschnitt 16.5 haben sich die Rechenregeln aus Satz 16.6 zur Berechnung der ersten Ableitung von Summen, Differenzen, skalaren Vielfachen und Produkten differenzierbarer Funktionen mehrfach als sehr nützlich erwiesen. Es stellt sich daher die Frage, ob und inwieweit diese Rechenregeln auf Ableitungen beliebiger Ordnung n übertragen werden können. Die Rechenregeln aus Satz 16.6a)–b) und d) zur Berechnung der ersten Ableitung von Summen, Differenzen und skalaren Vielfachen lassen sich unmittelbar auf Ableitungen beliebiger Ordnung n ∈ N0 verallgemeinern. Denn sind f : D ⊆ R −→ R und g : D ⊆ R −→ R zwei an der Stelle x0 ∈ D n-fach differenzierbare reelle Funktionen und α ∈ R, dann sind auch die reellen Funktionen f + g, f − g, αf und fg jeweils n-fach differenzierbar, und für die n-te Ableitung von f + g, f − g und αf an der Stelle x0 gilt: (f + g)(n)(x0) = f (n)(x0)+ g(n)(x0) (f − g)(n)(x0) = f (n)(x0)− g(n)(x0) (αf )(n)(x0) = αf (n)(x0) Aber auch für das Produkt fg zweier hinreichend oft differenzierbarer reeller Funktionen f und g kann leicht eine Rechenregel zur Berechnung von Ableitungen höherer Ordnung ermittelt werden. Denn durch wiederholte Anwendung der Produktregel (vgl. Satz 16.6c)) resultiert z. B. für die ersten 460 Kapitel 1616.6 Ableitungen höherer Ordnung drei Ableitungen von fg: (fg)′(x0) = f ′(x0)g(x0)+ f (x0)g′(x0) (fg)′′(x0) = ( f ′′(x0)g(x0)+ f ′(x0)g′(x0) ) + (f ′(x0)g′(x0)+ f (x0)g′′(x0) ) = f ′′(x0)g(x0)+ 2f ′(x0)g′(x0)+ f (x0)g′′(x0) (fg)′′′(x0) = ( f ′′′(x0)g(x0)+ f ′′(x0)g′(x0) ) + (2f ′′(x0)g′(x0)+ 2f ′(x0)g′′(x0) ) + (f ′(x0)g′′(x0)+ f (x0)g′′′(x0) ) = f ′′′(x0)g(x0)+ 3f ′′(x0)g′(x0)+3f ′(x0)g′′(x0) + f (x0)g′′′(x0) G. W. Leibniz auf einer deutschen Briefmarke Durch Wiederholung erhält man auf diese Weise für ein allgemeines n ∈ N0 die nach dem deutschen Mathematiker Gottfried Wilhelm Leibniz (1646–1716) benannte Leibnizsche Regel zur Berechnung der höheren Ableitungen von Produkten zweier n-fach differenzierbarer Funktionen (vgl. Satz 16.22d)). Insgesamt gilt somit der folgende Satz: Satz 16.22 (Rechenregeln für Ableitungen höherer Ordnung) Es seien f : D ⊆ R −→ R und g : D ⊆ R −→ R zwei reelle Funktionen, die an der Stelle x0 ∈ D n-fach differenzierbar sind und α ∈ R. Dann sind die Funktionen f + g, f − g, fg und αf ebenfalls an der Stelle x0 n-fach differenzierbar und für die n-ten Ableitungen gilt: a) (f + g)(n)(x0) = f (n)(x0)+ g(n)(x0) b) (f − g)(n)(x0) = f (n)(x0)− g(n)(x0) c) (αf )(n)(x0) = αf (n)(x0) d) (fg)(n)(x0) = n∑ k=0 ( n k ) f (n−k)g(k) (Leibnizsche Regel) Beweis: Den formalen Beweis der Aussagen a)-d) führt man leicht mittels vollständiger Induktion. Für n = 1, d.h für Ableitungen erster Ordnung, vereinfacht sich die Leibnizsche Regel zur Produktregel aus Satz 16.22c). Die Leibnizsche Regel erinnert dabei stark an den Binomischen Lehrsatz (a+b)n = ∑nk=0 ( n k ) an−kbk (vgl. (5.11)). Diese Ähnlichkeit ist kein Zufall, da der übliche Induktionsbeweis in beiden Fällen völlig analog verläuft. Es ist jedoch zu beachten, dass in Satz 16.22d) die – in Klammern angegebenen – oberen Indizes die Ordnung der jeweiligen Ableitung angeben und nicht die Potenzen wie beim Binomischen Lehrsatz. F. F. di Bruno Analog zur Verallgemeinerung der Produktregel durch die Leibnizsche Regel kann auch die Kettenregel auf Ableitungen höherer Ordnung verallgemeinert werden. Die resultierende Formel wird oftmals nach dem italienischen Mathematiker und Geistlichen Francesco Faà di Bruno (1825–1888) als Formel von Faà di Bruno bezeichnet. Die Anwendung und der Beweis dieser Formel gestaltet sich jedoch deutlich aufwendiger als die Anwendung und der Beweis der Leibnizschen Regel (siehe z. B. Lange [39], Seiten 91–93). Beispiel 16.23 (Rechenregeln für höhere Ableitungen) a) Die reelle Funktion f : R −→ R, x %→ 3x4 − 5x2 + cos ( x2 ) ist unendlich oft differenzierbar. Mit Satz 16.22a)-c) erhält man z. B. für die vierte Ableitung f (4)(x) = (3x4)(4) − (5x2)(4) + cos(4) (x 2 ) = 72 + 1 16 cos (x 2 ) . b) Die reelle Funktion f : R −→ R, x %→ x2 sin(x) ist unendlich oft differenzierbar. Mit der Leibnizschen Regel erhält man z. B. für die dritte Ableitung f ′′′(x) = ( 3 0 ) (x2)′′′ sin(x)+ ( 3 1 ) (x2)′′ sin′(x) + ( 3 2 ) (x2)′ sin′′(x)+ ( 3 3 ) x2 sin′′′(x) = 1 · 0 · sin(x)+ 3 · 2 · cos(x) + 3 · 2x · (− sin(x))+ 1 · x2 · (− cos(x)) = 6 cos(x)− 6x sin(x)− x2 cos(x). 461 Kapitel 16 Differenzierbare Funktionen 16.7 Mittelwertsatz der Differentialrechnung Kriterium von Fermat und Satz von Rolle Die beiden folgenden Sätze sind nach dem französischen Mathematiker und Juristen Pierre de Fermat (1608–1665) bzw. dem französischen Mathematiker Michel Rolle (1652–1719) benannt. Sie sind der Ausgangspunkt für die Ermittlung einer Reihe grundlegender Eigenschaften differenzierbarer Funktionen. P. de Fermat Das folgende Kriterium von Fermat besagt, dass f ′(x0) = 0 bei einer differenzierbaren Funktion f : (a, b) −→ R eine notwendige Bedingung für ein (globales oder lokales) Minimum oder Maximum an der Stelle x0 ∈ (a, b) ist. Das heißt, die Tangente an den Graphen einer differenzierbaren Funktion f : (a, b) −→ R an einer (globalen oder lokalen) Extremalstelle x0 ∈ (a, b) ist stets waagerecht (vgl. Abbildungen 16.9 und 16.10). Das Kriterium von Fermat ist für die konkrete Ermittlung von Extremalstellen differenzierbarer Funktionen äußerst hilfreich, da es eine oftmals relativ leicht nachprüfbare notwendige Bedingung für Extremalstellen bereitstellt. Satz 16.24 (Kriterium von Fermat) Es sei f : (a, b) −→ R eine reelle differenzierbare Funktion, welche an der Stelle x0 ∈ (a, b) ein (lokales oder globales) Minimum oder Maximum besitzt. Dann gilt f ′(x0) = 0. Beweis: Ist x0 ∈ (a, b) eine Stelle mit einem (lokalen oder globalen) Maximum, dann folgt aus der Differenzierbarkeit von f 0 ≥ lim x↓0 f (x0 + x)− f (x0) x = f ′(x0) und 0 ≤ lim x↑0 f (x0 + x)− f (x0) x = f ′(x0). Das heißt jedoch, dass f ′(x0) = 0 gelten muss. Im Falle eines (lokalen oder globalen) Minimums an der Stelle x0 verläuft der Beweis völlig analog. Dieses Ergebnis motiviert die folgende Definition: Definition 16.25 (Stationäre Stelle) Ist f : (a, b) −→ R eine differenzierbare reelle Funktion und x0 ∈ (a, b) eine Stelle mit der Eigenschaft f ′(x0) = 0, dann heißt x0 stationäre Stelle und ( x0, f (x0) ) stationärer Punkt der Funktion f . Das Vorgehen bei der Bestimmung von stationären Stellen wird im folgenden Beispiel deutlich: Beispiel 16.26 (Stationäre Stellen differenzierbarer Funktionen) a) Die reelle Funktion f : R −→ R, x %→ x2e−x ist differenzierbar, und mit der Produktregel (vgl. Satz 16.6c)) erhält man für die erste Ableitung f ′(x) = 2xe−x − x2e−x = x(2 − x)e−x . Wegen e−x = 0 für alle x ∈ R besitzt f die beiden stationären Stellen x0 = 0 und x1 = 2 (vgl. Abbildung 16.9, links). b) Die reelle Funktion f : (−1, 1)→R, x %→x2√1−x2 ist differenzierbar, und mit der Produkt- sowie Kettenregel (vgl. Satz 16.6c) bzw. Satz 16.8) erhält man für die erste Ableitung f ′(x) = 2x √ 1 − x2 + x2 1 2 (1 − x2)− 12 (−2x) = 2x(1 − x 2)− x3√ 1 − x2 = x(2 − 3x2)√ 1 − x2 . Durch Lösen der Gleichung x(2 − 3x2) = 0 erhält man die drei stationären Stellen x0 = 0, x1 = √ 2 3 und x2 = − √ 2 3 (vgl. Abbildung 16.9, rechts). Titelseite des Traktats Traité d’algèbre von M. Rolle Der folgende Satz von Rolle besagt, dass eine reelle stetige Funktion f : [a, b] → R, die auf dem offenen Intervall (a, b) differenzierbar ist und außerdem die Bedingung f (a) = f (b) erfüllt, an mindestens einer Stelle x0 ∈(a, b) die Ableitung Null aufweist und somit im Punkt ( x0, f (x0) ) eine waagerechte Tangente besitzt (vgl. Abbildung 16.10, rechts). Neben diesem Resultat kommt 462 Kapitel 1616.7 Mittelwertsatz der Differentialrechnung −1 0 1 2 3 4 0.5 1 1.5 2 2.5 f(x) l l x0 x1 −1 −0.5 0 0.5 1 0.2 0.4 f(x) l ll x0 x2x1 Abb. 16.9: Reelle Funktion f : R −→ R, x %→ x2e−x mit den beiden stationären Stellen x0 und x1 (links) und die reelle Funktion f : (−1, 1) −→ R, x %→ x2 √ 1 − x2 mit den drei stationären Stellen x0, x1 und x2 (rechts) Michel Rolle (1652–1719) auch das Verdienst zu, dass er in seiner im Jahre 1690 erschienenen wissenschaftlichen Abhandlung „Traité d’algèbre“ neben dem heute üblichen Symbol n√ für die n-te Wurzel auch eine Reihe anderer mathematischer Notationen einführte. Satz 16.27 (Satz von Rolle) Es sei f : [a, b] −→ R eine reelle stetige Funktion, welche auf dem offenen Intervall (a, b) differenzierbar ist und für die f (a) = f (b) gilt. Dann gibt es ein x0 ∈ (a, b), so dass f ′(x0) = 0 gilt. Beweis: Es sei angenommen, dass f auf dem Intervall [a, b] konstant ist. Dann gilt f ′(x) = 0 für alle x ∈ [a, b] und damit insbesondere auch die Aussage. Es kann daher ohne Beschränkung der Allgemeinheit angenommen werden, dass f auf dem Intervall [a, b] nicht konstant ist und es somit ein x ∈ (a, b) mit f (x) = f (a) = f (b), etwa f (x) > f (a) = f (b), gibt. Gemäß dem Satz vom Minimum und Maximum (vgl. Satz 15.25) nimmt f als stetige Funktion auf dem Intervall [a, b] sein globales Minimum und Maximum an. Wenn nun f an der Stelle x0 ∈ [a, b] z. B. ein globales Maximum besitzt, dann gilt f (x0) ≥ f (x) > f (a) = f (b) und damit insbesondere x0 ∈ (a, b). Mit Satz 16.24 folgt daraus jedoch f ′(x0) = 0. Falls f an der Stelle x0 ein globales Minimum besitzt, verläuft der Beweis völlig analog. Bei der Anwendung des Satzes von Rolle ist zu beachten, dass die Stetigkeit von f : [a, b] −→ R auf dem kompletten abgeschlossenen Intervall [a, b] für die Gültigkeit des Satzes wesentlich ist. Denn zum Beispiel ist die Funktion f : [0, 1] −→ R, x %→ f (x) = { x für 0 ≤ x < 1 0 für x = 1 auf dem offenen Intervall (0, 1) differenzierbar und es gilt f (0) = f (1) = 0. Die Funktion f ist jedoch an der Stelle x = 1 nicht stetig. Entsprechend gilt nun f ′(x) = 1 für alle x ∈ (0, 1) und es gibt somit kein x0 ∈ (0, 1) mit f ′(x0) = 0 (vgl. Abbildung 16.11, links). Mittelwertsatz der Differentialrechnung Der Mittelwertsatz der Differentialrechnung ist eine Verallgemeinerung des Satzes von Rolle (vgl. Satz 16.27). Aufgrund seiner vielen Anwendungen ist er eines der wichtigsten Resultate der Differentialrechnung. Zum einen lassen sich aus ihm wichtige Eigenschaften zur Charakterisierung von Extremalstellen ableiten und zum anderen ist er bei einer Reihe von Beweisen ein nützliches Hilfsmittel. Der Mittelwertsatz besagt, dass es zu einer Sekante durch zwei beliebige Punkte ( a, f (a) ) und ( b, f (b) ) auf dem Graphen einer stetigen Funktion f : [a, b] −→ R, die auf dem 463 Kapitel 16 Differenzierbare Funktionen −2 −1 1 2 3 −2 −1 1 2 3 f(x) x1 l x0 l −2 −1 1 2 3 −2 −1 1 2 3 f(x) x1 l b ll ax0 l Abb. 16.10: Veranschaulichung des Satzes von Fermat (links) und des Satzes von Rolle (rechts) 0 1 0 1 f (x) l l −2 −1 1 2 3 −2 −1 1 2 3 a f (a) l b f (b) l x0 f (x0) l f (x) Abb. 16.11: Reelle Funktion f : [0, 1] −→ R, die nicht stetig ist und damit nicht die Voraussetzungen des Satzes von Rolle erfüllt (links), und Veranschaulichung des Mittelwertsatzes der Differentialrechnung (rechts) offenen Intervall (a, b) zusätzlich differenzierbar ist, mindestens eine Tangente an den Graphen von f in einer Zwischenstelle x0 ∈ (a, b) gibt, die parallel zur Sekante ist. Das heißt, die Steigung f (b)−f (a) b−a der Sekante stimmt mit der Steigung f ′(x0) der Tangente überein (vgl. Abbildung 16.11, rechts). Satz 16.28 (Mittelwertsatz der Differentialrechnung) Es sei f : [a, b] −→ R eine reelle stetige Funktion, die auf dem offenen Intervall (a, b) differenzierbar ist. Dann gibt es ein x0 ∈ (a, b) mit der Eigenschaft f (b)− f (a) b − a = f ′(x0). 464 Kapitel 1616.7 Mittelwertsatz der Differentialrechnung Beweis: Die reelle Funktion g : [a, b] −→ R, x %→ g(x) := f (x)− f (b)− f (a) b − a (x − a) ist stetig und auf dem Intervall (a, b) differenzierbar. Ferner gilt g(a) = g(b) = f (a). Gemäß dem Satz von Rolle (vgl. Satz 16.27) existiert somit ein x0 ∈ (a, b) mit 0 = g′(x0) = f ′(x0)− f (b)− f (a) b − a . Das heißt, es gilt die Behauptung f ′(x0) = f (b)− f (a) b − a . Gilt zusätzlich zu den Annahmen in Satz 16.28 noch f (a) = f (b), dann folgt aus dem Mittelwertsatz der Differentialrechnung die Existenz einer Stelle x0 ∈ (a, b) mit f ′(x0) = 0. Folglich erhält man in diesem Fall als Spezialfall des Mittelwertsatzes der Differentialrechnung den Satz von Rolle (vgl. Satz 16.27). Der Mittelwertsatz der Differentialrechnung besitzt die folgende anschauliche Interpretation: Beschreibt die Funktion f die zurückgelegte Strecke in Abhängigkeit von der Zeit x, dann ist f ′(x) die Geschwindigkeit zum Zeitpunkt x und der Mittelwertsatz besagt, dass man auf dem Weg von der Universität Hamburg zur ETH Zürich mindestens zu einem Zeitpunkt genaus so schnell gewesen ist wie die Durchschnittsgeschwindigkeit f (b)−f (a) b−a . In Beispiel 16.3a) wurde bereits gezeigt, dass die Ableitung einer konstanten reellen Funktion gleich Null ist. Mit Hilfe des Mittelwertsatzes kann nun leicht nachgewiesen werden, dass auch die Umkehrung dieser Aussage gilt: Folgerung 16.29 (Erste Ableitung bei konstanten Funktionen) Es seien f : I −→ R und g : I −→ R zwei reelle stetige Funktionen auf einem Intervall I ⊆ R, die in allen inneren Stellen x ∈ I differenzierbar sind. Dann gilt: a) f ist konstant ⇐⇒ f ′(x) = 0 für alle inneren Stellen x ∈ I b) f = g + c für eine geeignete Konstante c ∈ R ⇐⇒ f ′(x) = g′(x) für alle inneren Stellen x ∈ I Beweis: Zu a): Ist f : I −→ R eine konstante reelle Funktion, dann gilt gemäß Beispiel 16.3a) f ′(x) = 0 für alle x ∈ I . Es gelte nun umgekehrt f ′(x) = 0 für alle inneren Stellen x ∈ I und es sei a ∈ I beliebig gewählt. Dann folgt mit dem Mittelwertsatz (vgl. Satz 16.28), dass es zu jedem b ∈ I mit b = a ein x0 ∈ (a, b) ⊆ I (falls a < b) oder ein x0 ∈ (b, a) ⊆ I (falls a > b) gibt, so dass f (a)− f (b) = (a − b)f ′(x0) gilt. Wegen f ′(x) = 0 für alle inneren Stellen x ∈ I , folgt daraus f (a) = f (b). Da a ∈ I beliebig gewählt ist, impliziert dies jedoch f (x) = f (b) für alle x ∈ I . Die Funktion f ist somit konstant gleich dem Wert f (b). Zu b): Die reelle Funktion h : I −→ R, x %→ h(x) := f (x)− g(x) ist stetig und in allen inneren Stellen x ∈ I differenzierbar. Ferner gilt nach Voraussetzung h′(x) = f ′(x)− g′(x) = 0 für alle inneren Stellen x ∈ I . Mit Aussage a) folgt somit, dass h konstant ist. Das heißt, es gibt eine Konstante c ∈ R, so dass f (x)− g(x) = c für alle x ∈ I gilt. In Kapitel 19 wird sich beim Beweis von Satz 19.19 zeigen, dass Satz 16.29b) im Zusammenhang mit sogenannten Stammfunktionen von großer Bedeutung ist. Die Aussage des Mittelwertsatzes der Differentialrechnung lässt sich wie folgt auf den Quotienten zweier reeller differenzierbarer Funktionen verallgemeinern: Satz 16.30 (Verallgemeinerter Mittelwertsatz der Differentialrechnung) Es seien f : [a, b] −→ R und g : [a, b] −→ R zwei reelle stetige Funktionen, die auf dem offenen Intervall (a, b) differenzierbar sind mit g′(x) = 0 für alle x ∈ (a, b). Dann gilt g(a) = g(b) und es gibt ein x0 ∈ (a, b) mit der Eigenschaft f (b)− f (a) g(b)− g(a) = f ′(x0) g′(x0) . (16.21) Beweis: Gemäß Satz 16.28 existiert ein x0 ∈ (a, b) mit g(b)−g(a) b−a = g′(x0). Wegen g′(x) = 0 für alle x ∈ (a, b) folgt daraus g(a) = g(b). Die reelle Funktion h : [a, b] −→ R, x %→ h(x) := f (x)− f (a)− f (b)− f (a) g(b)− g(a) (g(x)− g(a)) ist stetig und auf dem Intervall (a, b) differenzierbar. Ferner gilt h(a) = h(b) = 0. Gemäß dem Satz von Rolle (vgl. Satz 16.27) existiert somit ein x0 ∈ (a, b) mit 0 = h′(x0) = f ′(x0)− f (b)− f (a) g(b)− g(a) g ′(x0). Das heißt, es gilt die Behauptung (16.21). Mit g(x) = x für alle x ∈ [a, b] folgt aus Satz 16.30 der Mittelwertsatz der Differentialrechnung (vgl. Satz 16.28). Gilt zusätzlich f (a) = f (b), dann erhält man den Satz von Rolle (vgl. Satz 16.27). 465 Kapitel 16 Differenzierbare Funktionen Zusammenhang zwischen Monotonie und erster Ableitung In Abschnitt 13.3 wurden die Begriffe Monotonie und strenge Monotonie eingeführt. Im Folgenden wird nun mit Hilfe des Mittelwertsatzes gezeigt, dass bei einer differenzierbaren reellen Funktion f zwischen ihren Monotonieeigenschaften und ihrer ersten Ableitung ein einfacher Zusammenhang besteht. Dieser Zusammenhang erlaubt es, die Existenz von Extremalstellen zu den lokalen Monotonieeigenschaften einer differenzierbaren Funktion in Beziehung zu setzen. Satz 16.31 (Zusammenhang Monotonie und erste Ableitung) Es sei f : I −→ R eine reelle stetige Funktion auf einem Intervall I ⊆ R, die an allen inneren Stellen x ∈ I differenzierbar ist. Dann gilt: a) f ′(x) ≥ 0 für alle inneren Stellen x ∈ I ⇐⇒ f ist monoton wachsend b) f ′(x) ≤ 0 für alle inneren Stellen x ∈ I ⇐⇒ f ist monoton fallend c) f ′(x) > 0 für alle inneren Stellen x ∈ I ⇒ f ist streng monoton wachsend d) f ′(x) < 0 für alle inneren Stellen x ∈ I ⇒ f ist streng monoton fallend Beweis: Zu a): Es gelte f ′(x)≥0 für alle inneren Stellen x∈I und a, b ∈ I mit a < b. Dann folgt mit dem Mittelwertsatz (vgl. Satz 16.28), dass es ein x0 ∈ (a, b) mit f (b)− f (a) b − a = f ′(x0) gibt. Wegen f ′(x0) ≥ 0 impliziert dies jedoch f (b) ≥ f (a). Das heißt, f ist monoton wachsend. Umgekehrt sei nun angenommen, dass f monoton wachsend und x0 eine innere Stelle von I ist. Ferner sei x > 0, so dass x0 + x ∈ I gilt. Dann folgt f (x0 + x) − f (x0) ≥ 0 falls x > 0 und f (x0+ x)−f (x0) ≤ 0 falls x < 0 gilt. Daraus folgt f (x0 + x)− f (x0) x ≥ 0 für alle x = 0 und damit insbesondere f ′(x0) = lim x→0 f (x0 + x)− f (x0) x ≥ 0. Zu b): Die Funktion f ist genau dann monoton fallend, wenn die Funktion −f monoton wachsend ist. Gemäß Aussage a) ist dies jedoch genau dann der Fall, wenn −f ′(x) ≥ 0 und damit f ′(x) ≤ 0 für alle inneren Stellen x von I gilt. Zu c): Es gelte f ′(x) > 0 für alle inneren Stellen x ∈ I und a, b ∈ I mit a < b. Dann zeigt man analog zum ersten Teil der Aussage a), dass f (b)− f (a) b − a > 0 gilt. Dies impliziert jedoch f (b) > f (a). Die Funktion f ist somit streng monoton wachsend. Zu d): Es gilt f ′(x) < 0 für alle inneren Stellen x ∈ I genau dann, wenn −f ′(x) > 0 für alle inneren Stellen x ∈ I gilt. Gemäß Aussage c) impliziert dies jedoch, dass −f streng monoton wachsend bzw. f streng monoton fallend ist. Bei der strengen Monotonie in Satz 16.31 c) und d) gilt nur eine Richtung: Aus f ′(x) > 0 oder f ′(x) < 0 für alle inneren Stellen folgt, dass f streng monoton wachsend bzw. streng monoton fallend ist. Die Umkehrung dieser Aussage gilt jedoch nicht. Das heißt, es gibt streng monotone Funktionen f mit f ′(x) = 0 für einzelne innere Stellen x von I . Zum Beispiel ist die Funktion f : R −→ R, x %→ f (x) = x3 streng monoton wachsend, aber es gilt f ′(x) = 3x2 und damit insbesondere f ′(0) = 0 (vgl. Abbildung 16.12, links). Bei einer differenzierbaren reellen Funktion f : I⊆R−→R liefert die erste Ableitung für die strenge Monotonie eine hinreichende Bedingung, während sie für die (nicht strenge) Monotonie sogar eine hinreichende und notwendige Bedingung bereitstellt. Beispiel 16.32 (Monotonieverhalten und erste Ableitung) a) Für die differenzierbare Funktion f : I ⊆ R −→ R in Abbildung 16.12, rechts gilt f ′(x) < 0 für alle x ∈ [x0, x1) ∪ (x2, x3] und f ′(x) > 0 für alle x ∈ (x1, x2). Das heißt, die Funktion f ist streng monoton fallend auf den Teilintervallen [x0, x1] und [x2, x3] sowie streng monoton wachsend auf dem Teilintervall [x1, x2]. Weiter gilt f ′(x1) = f ′(x2) = 0. Die Funktion f besitzt somit bei x1 und x2 stationäre Stellen. b) Die reelle Funktion f : R −→ R, x %→ x√ 1 + x2 ist differenzierbar und mit der Quotientenregel (vgl. Satz 16.6e)) erhält man für die erste Ableitung f ′(x) = √ 1 + x2 − x 12 (1 + x2)− 1 2 2x 1 + x2 = 1 + x 2 − x2 ( √ 1 + x2)3 = 1 ( √ 1 + x2)3 > 0. 466 Kapitel 1616.7 Mittelwertsatz der Differentialrechnung −2 −1 1 2 −8 −6 −4 −2 2 4 6 8 f (x) = x3 l f ′(0) = 0 f (x) x0 x1 x2 x3 l l l l f ′(x2) = 0 f ′(x1) = 0 f ′(x) < 0 f ′ (x ) > 0 f ′(x) < 0 Abb. 16.12: Reelle Funktion f : R −→ R, x %→ x3 mit f ′(0) = 0 (links) und reelle Funktion f mit unterschiedlichem Monotonieverhalten auf den Teilintervallen [x0, x1], [x1, x2] und [x2, x3] (rechts) −4 −3 −2 −1 1 2 3 4 −1 −0.5 0.5 1 f (x) −1 1 2 3 4 −6 −5 −4 −3 −2 −1 f (x) Abb. 16.13: Reelle Funktion f : R −→ R, x %→ x√ 1+x2 (links) und reelle Funktion f : (−1,∞) −→ R, x %→ ln(1+ x)− x (rechts) Das heißt, die Funktion f ist streng monoton wachsend (vgl. Abbildung 16.13, links). c) Die reelle Funktion f : (−1,∞) −→ R, x %→ ln(1 + x)− x ist differenzierbar und besitzt die erste Ableitung f ′(x) = 1 1 + x − 1 = − x 1 + x . Es gilt somit f ′(x)>0 für alle x∈(−1, 0), f ′(x)<0 für alle x ∈ (0,∞) und f ′(0) = 0. Die reelle Funktion f ist folglich auf (−1, 0] streng monoton wachsend, auf [0,∞) streng monoton fallend und besitzt bei x = 0 eine stationäre Stelle (vgl. Abbildung 16.13, rechts). 467 Kapitel 16 Differenzierbare Funktionen Zusammenhang zwischen Krümmung und ersten beiden Ableitungen In Abschnitt 13.4 wurden zur Beschreibung der Krümmungseigenschaften einer reellen Funktion f die Begriffe (strenge) Konvexität und (strenge) Konkavität eingeführt (vgl. Definition 13.14). Jedoch kann die Untersuchung der Krümmungseigenschaften einer reellen Funktion ausschließlich anhand der Definition 13.14 schnell sehr mühsam werden kann. Es ist daher sowohl von theoretischer als auch von praktischer Bedeutung, dass sich neben den Monotonie- auch die Krümmungseigenschaften einer reellen Funktion f durch die ersten beiden Ableitungen charakterisieren lassen, die Existenz dieser Ableitungen natürlich vorausgesetzt. Zum Beispiel lassen die beiden Graphen links oben und links unten in Abbildung 13.6 vermuten, dass bei einer konvexen Funktion f der Anstieg mit wachsendem x zunimmt. In die Sprache der Differentialrechnung übersetzt bedeutet dies, dass die erste Ableitung f ′ eine monoton steigende Funktion ist und damit insbesondere f ′′(x) ≥ 0 gilt. Analog legen die beiden Graphen rechts oben und rechts unten in Abbildung 13.6 nahe, dass bei einer konkaven Funktion f der Anstieg mit wachsendem x abnimmt und die erste Ableitung f ′ somit eine monoton fallende Funktion ist bzw. f ′′(x) ≤ 0 gilt. Diese Beobachtungen werden durch den folgenden Satz, dessen Beweis ebenfalls auf dem Mittelwertsatz basiert, und die sich anschließende Folgerung 16.34 präzisiert. Satz 16.33 (Zusammenhang Krümmung und erste Ableitung) Es sei f : I −→ R eine differenzierbare Funktion auf einem Intervall I ⊆ R. Dann gilt: a) f ′ (streng) monoton wachsend ⇐⇒ f ist (streng) konvex b) f ′ (streng) monoton fallend ⇐⇒ f ist (streng) konkav Beweis: Zu a): Es sei f ′ monoton wachsend und x = (1 − λ)x1 + λx2 mit λ ∈ (0, 1). Gemäß dem Mittelwertsatz (vgl. Satz 16.28) gibt es zu jedem x ∈ (x1, x2) ein ξ1 ∈ (x1, x) und ein ξ2 ∈ (x, x2), so dass f (x)− f (x1) x − x1 = f ′(ξ1) bzw. f (x2)− f (x) x2 − x = f ′(ξ2) gilt. Da f ′ monoton wachsend ist und ξ1 ≤ ξ2 gilt, erhält man daraus zusammen mit x1 − x = λ(x1 − x2) und x2 − x = (1 − λ)(x2 − x1) (1 − λ)f (x1)+ λf (x2)− f (x) = (1 − λ)(f (x1)− f (x) )+ λ(f (x2)− f (x) ) = (1 − λ)f ′(ξ1)(x1 − x)+ λf ′(ξ2)(x2 − x) = (1 − λ)f ′(ξ1)λ(x1 − x2)+ λf ′(ξ2)(1 − λ)(x2 − x1) = λ(1 − λ)(x2 − x1) ( f ′(ξ2)− f ′(ξ1) ) ≥ 0. (16.22) Das heißt, f ist konvex (vgl. Definition 13.14a). Falls f ′ sogar streng monoton wachsend ist, gilt f ′(ξ2) > f ′(ξ1) und man erhält somit in (16.22) die strikte Ungleichung (1 − λ)f (x1)+ λf (x2)− f (x) > 0. Die Funktion f ist somit streng konvex (vgl. Definition 13.14c)). Umgekehrt sei nun f konvex und x1, x2 ∈ I mit x1 < x2. Für die Gerade g durch die Punkte ( x1, f (x1) ) und ( x2, f (x2) ) gilt dann f (x) ≤ g(x) (16.23) für alle x = (1 − λ)x1 + λx2 mit λ ∈ (0, 1). Nach Subtraktion von f (x1) = g(x1) und Division durch x − x1 > 0 erhält man daraus f (x)− f (x1) x − x1 ≤ g(x)− g(x1) x − x1 =: m, wobei m die Steigung der Geraden g ist. Für x ↓ x1 erhält man daraus f ′(x1) ≤ m. Analog folgt aus (16.23) nach Subtraktion von f (x2) = g(x2) und Division durch x − x2 < 0 f (x)− f (x2) x − x2 ≥ g(x)− g(x2) x − x2 = m. Für x ↑ x2 erhält man daraus f ′(x2) ≥ m. Insgesamt gilt somit f ′(x1) ≤ f ′(x2) für x1 < x2. Das heißt, f ′ ist monoton wachsend. Falls f sogar streng konvex ist, gilt in (16.23) f (x) < g(x). Damit erhält man völlig analog f ′(x1) < f ′(x2) für x1 < x2 und somit für f strenge Monotonie. Zu b): Die Funktion f ist genau dann (streng) konkav, wenn −f (streng) konvex ist. Gemäß Aussage a) ist dies jedoch genau dann der Fall, wenn −f ′ (streng) monoton wachsend und damit f ′ = −(−f ′) (streng) monoton fallend ist. Wird Satz 16.31 auf die erste Ableitung f ′ einer zweimal differenzierbaren Funktion f angewandt, dann erhält man aus Satz 16.33 die folgenden leicht nachprüfbaren Konvexitätsund Konkavitätskriterien: 468 Kapitel 1616.7 Mittelwertsatz der Differentialrechnung Folgerung 16.34 (Zusammenhang Krümmung und zweite Ableitung) Es sei f : I −→ R eine stetige Funktion auf einem Intervall I ⊆ R, die an allen inneren Stellen x ∈ I zweimal differenzierbar ist. Dann gilt: a) f ′′(x) ≥ 0 für alle inneren Stellen x ∈ I ⇐⇒ f ist konvex b) f ′′(x) ≤ 0 für alle inneren Stellen x ∈ I ⇐⇒ f ist konkav c) f ′′(x) > 0 für alle inneren Stellen x ∈ I ⇒ f ist streng konvex d) f ′′(x) < 0 für alle inneren Stellen x ∈ I ⇒ f ist streng konkav e) f ′′(x) = 0 für alle inneren Stellen x ∈ I ⇐⇒ f ist affin-linear Beweis: Zu a) und b): Gemäß Satz 16.31a) und b) gilt f ′′(x) ≥ 0 (bzw. f ′′(x) ≤ 0) für alle inneren Stellen x ∈ I genau dann, wenn f ′ monoton wachsend (bzw. monoton fallend) ist. Dies ist jedoch nach Satz 16.33a) und b) dazu äquivalent, dass f konvex (bzw. konkav) ist. Zu c) und d): Gemäß Satz 16.31c) und d) gilt f ′′(x) > 0 (bzw. f ′′(x) < 0) für alle inneren Stellen x ∈ I genau dann, wenn −1.5 −1 −0.5 0 0.5 1 1.5 2 4 6 8 10 f (x) = x4 l f ′′(0) = 0 f(x) l x1 f ′′(x) > 0 f ′′(x1) = 0 f ′′(x) < 0 x0 x2 l l Abb. 16.14: Reelle Funktion f : R −→ R, x %→ x4 mit f ′′(0) = f ′(0) = 0 (links) und reelle Funktion f mit unterschiedlichem Krümmungsverhalten auf den beiden Teilintervallen [x0, x1] und [x1, x2] (rechts) f ′ streng monoton wachsend (bzw. streng monoton fallend) ist. Dies ist jedoch nach Satz 16.33a) und b) dazu äquivalent, dass f streng konvex (bzw. konkav) ist. Zu e): Gemäß Folgerung 16.29a) gilt f ′′(x) = 0 für alle inneren Stellen x ∈ I genau dann, wenn f ′ eine konstante Funktion ist. Dies ist jedoch genau dann der Fall, wenn f eine affin-lineare Funktion ist. Bei der strengen Konvexität und strengen Konkavität in Folgerung 16.34 c) und d) gilt nur eine Richtung: Aus f ′′(x) > 0 oder f ′′(x) < 0 für alle inneren Stellen folgt, dass f streng konvex bzw. streng konkav ist. Die Umkehrung dieser Aussage gilt jedoch nicht. Das heißt, es gibt streng konvexe Funktionen und streng konkave Funktionen f mit f ′′(x) = 0 für einzelne innere Stellen x von I . Zum Beispiel ist die reelle Funktion f : R −→ R, x %→ f (x) = x4 streng konvex, es gilt jedoch f ′′(x) = 12x2 und damit insbesondere f ′′(0) = 0. (vgl. Abbildung 16.14, links). Bei einer zweimal differenzierbaren reellen Funktion f : I ⊆ R −→ R liefert die zweite Ableitung für die strenge Konvexität und Konkavität eine hinreichende Bedingung, während sie für die (nicht strenge) Konvexität und Konkavität sogar eine hinreichende und notwendige Bedingung bereitstellt. 469 Kapitel 16 Differenzierbare Funktionen Beispiel 16.35 (Krümmungsverhalten und die ersten zwei Ableitungen) a) Für die reelle Funktion f : I ⊆ R −→ R in Abbildung 16.14, rechts gilt f ′′(x) > 0 für alle x ∈ [x0, x1) und f ′′(x) < 0 für alle x ∈ (x1, x2]. Die Funktion f ist somit auf dem Teilintervall [x0, x1] streng konvex und auf dem Teilintervall [x1, x2] streng konkav. Ferner gilt f ′′(x1) = 0. b) Für die ersten beiden Ableitungen der Potenzfunktion f : R+ \ {0} −→ R, x %→ f (x) = xc mit c ∈ R gilt f ′(x) = cxc−1 ⎧ ⎪⎨ ⎪⎩ > 0 für c > 0 = 0 für c = 0 < 0 für c < 0 und f ′′(x) = c(c − 1)xc−2 ⎧ ⎪⎨ ⎪⎩ > 0 für c > 1 oder c < 0 = 0 für c = 0 oder c = 1 < 0 für c ∈ (0, 1) . 0 1 2 3 4 5 1 2 3 4 5 c=e c=2 c=1 c=0.5 c=0.25 c = − 2 0 π 2 π 3π 2 2π 1 2 3 4 f(x) l l l l Abb. 16.15: Potenzfunktion f : R+\{0} −→ R, x %→ f (x) = xc mit unterschiedlichem Krümmungsverhalten für verschiedene Exponenten c ∈ R (links) und reelle Funktion f : [0, 2π ] −→ R, x %→ f (x) = x2 +cos(x) mit unterschiedlichem Krümmungsverhalten auf den Teilintervallen [ 0, π2 ] , [ π 2 , 3 2π ] und [ 3 2π, 2π ] (rechts) Die Potenzfunktion f ist somit für c > 1 streng monoton wachsend und streng konvex, für c = 1 streng monoton wachsend und linear (d. h. sowohl konvex als auch konkav), für c ∈ (0, 1) streng monoton wachsend und streng konkav, für c = 0 konstant gleich Eins (d. h. sowohl monoton wachsend als auch monoton fallend sowie sowohl konvex als auch konkav) und schließlich für c < 0 streng monoton fallend und streng konvex (vgl. Abbildung 16.15, links). c) Für die ersten beiden Ableitungen der reellen Funktion f : [0, 2π ] −→ R, x %→ f (x) = x 2 + cos(x) gilt f ′(x) = 1 2 − sin(x) { ≥ 0 für x∈[0, π6 ]∪[ 5π6 ,2π ] ≤ 0 für x∈[ π6 , 5π6 ] und f ′′(x) = − cos(x) { ≥ 0 für x∈[ π2 , 3π2 ] ≤ 0 für x∈[0, π2 ]∪[ 3π2 ,2π ] . 470 Kapitel 1616.7 Mittelwertsatz der Differentialrechnung Das heißt, die Funktion f ist streng monoton wachsend auf den Teilintervallen [ 0, π6 ] und [ 5π 6 , 2π ] , streng monoton fallend auf dem Teilintervall [ π 6 , 5π 6 ] , streng konvex auf dem Teilintervall [ π 2 , 3π 2 ] und streng konkav auf den Teilintervallen [ 0, π2 ] und[ 3π 2 , 2π ] (vgl. Abbildung 16.15, rechts). Beispiel 16.36 (Zinssensitivität des Bar- und Endwerts) Eine Investition I mit erwarteten Auszahlungen K0, . . . , Kn > 0 zu den Zeitpunkten t = 0, . . . , n besitzt in Abhängigkeit vom Zinssatz p > 0 bei diskreter Verzinsung zum Zeitpunkt t = n den Endwert und zum Zeitpunkt t = 0 den Barwert In(p) = n∑ t=0 Kt (1 + p)n−t bzw. I0(p) = n∑ t=0 Kt (1 + p)−t (vgl. Beispiel 11.46). Das heißt, der End- und der Barwert einer Investition verändern sich mit dem Zinssatz p und unterliegen somit einem Zinsänderungsrisiko. Im Risikomanagement bestimmt man zur Quantifizierung der Auswirkung einer Zinsänderung von p zu p+ p approximativ die hieraus resultierenden End- und Barwertänderungen In := In(p + p)− In(p) bzw. I0 := I0(p + p)− I0(p). Hierzu werden die ersten beiden Ableitungen von In(p) und I0(p) bzgl. des Zinssatzes p analysiert. Für die ersten beiden Ableitungen des Endwertes gilt I ′n(p)= 1 1 + p n∑ t=0 (n− t)Kt (1 + p)n−t > 0 und I ′′n (p)= 1 (1+p)2 n∑ t=0 (n−t)(n−t−1)Kt (1 + p)n−t > 0. (16.24) Der Endwert In(p) ist somit eine streng monoton wachsende und streng konvexe Funktion des Zinssatzes p (vgl. Satz 16.31c) und 16.34c)). Bei steigendem Zinssatz p erhöht sich daher der Endwert In(p). Für die ersten beiden Ableitungen des Barwertes gilt dagegen I ′0(p)=− 1 1+p n∑ t=0 tKt (1 + p)−t < 0 und (16.25) I ′′0 (p)= 1 (1+p)2 n∑ t=0 t (t+1)Kt (1+p)−t >0. (16.26) Der Barwert I0(p) ist also eine streng konvexe und streng monoton fallende Funktion des Zinssatzes p (vgl. Satz 16.31d). Das heißt, bei steigendem Zinssatz p verringert sich der Barwert I0(p) im Gegensatz zum Endwert In(p). Zinsänderungseffekte wirken damit beim End- und Barwert in entgegengesetzte Richtungen (vgl. Abbildung 16.16, links). Zur Analyse der Zinssensitivität des Barwertes wird im Risikomanagement häufig die sogenannte absolute Duration DA(p) := −I ′0(p) = 1 1 + p n∑ t=0 tKt (1 + p)−t (16.27) verwendet. Die absolute Duration entspricht folglich der mit −1 multiplizierten ersten Ableitung der Barwertfunktion I0(p), weshalb insbesondere DA(p) > 0 gilt. Mit Hilfe der absoluten Duration −DA(p) = I ′0(p) wird die Barwertänderung I0 = I0(p+ p)−I0(p) linear durch die entsprechende Änderung der Tangente an den Graphen der Barwertfunktion I0(p) approximiert: I0 ≈ −DA(p) · p (16.28) Die absolute Duration DA(p) ist somit ein approximatives Maß für die Barwertänderung I0 bei einer Zinsänderung p. Das Zinsänderungsrisiko im Sinne einer Barwertänderung ist dabei umso größer, je höher die absolute Duration ist, während der Approximationsfehler umso größer ist, je größer p und je gekrümmter der Graph der Barwertfunktion I0(p), d. h. je größer I ′′0 (p), ist. Der Effekt einer Zinserhöhung p → p + p auf den Barwert I0(p) wird somit überschätzt, wohingegen der Effekt einer Zinsverringerung p → p − p unterschätzt wird (vgl. Abbildung 16.16, rechts). 471 Kapitel 16 Differenzierbare Funktionen t = 0 t = n 0 l l In(p2) I0(p2) l l In(p1) I0(p1) p1 < p2 0 p p + Δp 0 I0(p) Steigung − DA(p) ΔI0 l l l l Approximations− fehler Abb. 16.16: Beziehung zwischen Barwert I0(p) und Endwert In(p) für zwei verschiedene Zinssätze p1 und p2 mit p1 < p2 (links) und lineare Approximation der Barwertänderung I0 durch −DA(p) · p mit Hilfe der absoluten Duration DA(p) (rechts) Aus der absoluten Duration DA(p) lassen sich weitere Durationsmaße ableiten. Die bekanntesten sind die modifizierte Duration DM(p) := DA(p) I0(p) = 1 1+p n∑ t=0 tKt (1 + p)−t I0(p) und die nach dem kanadischen Ökonomen Frederick Robertson Macaulay (1882–1970) bezeichnete Macaulay- Duration D(p) :=(1 + p)DM(p)= n∑ t=0 tKt (1 + p)−t I0(p) . (16.29) Die Macaulay-Duration wird jedoch oftmals auch nur Duration genannt. Sie kann als gewichtetes Mittel der Auszahlungszeitpunkte t mit Gewichten proportional zu den diskontierten Auszahlungen Kt (1 + p)−t > 0 interpretiert werden. 16.8 Regeln von L’Hôspital Unbestimmte Ausdrücke In Abschnitt 13.10 wurde der Begriff des Grenzwerts einer reellen Funktion eingeführt. Dabei wurden insbesondere auch eine Reihe von Regeln für das Rechnen mit Grenzwerten bereitgestellt. Zum Beispiel wurde in Satz 13.41e) bewiesen, dass für den Grenzwert des Quotienten zweier reeller Funktionen f : D ⊆ R −→ R und g : D ⊆ R −→ R mit lim x→x0 f (x) = c bzw. lim x→x0 g(x) = d ∈ R \ {0} die Rechenregel lim x→x0 f (x) g(x) = c d gilt. Diese Rechenregel versagt jedoch, falls lim x→x0 f (x) = lim x→x0 g(x) = 0 oder lim x→x0 f (x) = ±∞ und lim x→x0 g(x) = ±∞ (16.30) gilt. In diesen beiden Fällen wird dann für lim x→x0 f (x) g(x) häufig die Schreibweise 0 0 bzw. ±∞ ±∞ (16.31) verwendet. In einem solchen Fall hängt das Verhalten des Quotienten f (x) g(x) für x → x0 von der Geschwindigkeit ab, mit der die Funktionswerte f (x) und g(x) für x → x0 fallen bzw. steigen. Das heißt, es ist keine allgemeingültige Aussage bzgl. der Existenz und der Höhe des Grenzwertes von f (x) g(x) für x → x0 möglich und jede einzelne Problemstellung dieser Bauart erfordert eine gesonderte Betrachtung. Aus diesem Grund spricht man bei den beiden Symbolen in (16.31) sowie den Zeichen 0 · ∞, 0 · (−∞), ∞−∞, 00, ∞0, 1±∞, 472 Kapitel 1616.8 Regeln von L’Hôspital die ähnlich gelagerte – und auf den nächsten Seiten ebenfalls betrachtete – Fälle charakterisieren, von unbestimmten Ausdrücken (vgl. hierzu auch Abschnitt 11.8). Durch diese Bezeichnung wird der Tatsache Rechnung getragen, dass ohne weitere Untersuchungen keine allgemeingültigen Aussagen bzgl. der Existenz und der Höhe des Grenzwertes möglich sind. Denn wie die folgenden drei Beispiele zeigen, kann für lim x→x0 f (x) g(x) je nach Geschwindigkeit, mit der die Funktionswerte f (x) und g(x) für x → x0 fallen bzw. steigen, ein ganz anderes Grenzverhalten resultieren: lim x→0 x2 x = 0, lim x→0 5x x = 5 und lim x→0 x x2 = ∞ (16.32) Die Untersuchung von Grenzwerten der Form lim x→x0 f (x) g(x) für die Fälle (16.30) wird in vielen verschiedenen mathematischen Fragestellungen benötigt und nicht immer ist ihre Ermittlung so einfach wie in (16.32). Zum Beispiel wurde zur Berechnung der ersten Ableitung der Sinusfunktion f (x) = sin(x) in Satz 16.16a) der Grenzwert lim x→0 sin(x) x (16.33) benötigt und in Beispiel 15.10a) verlangte die Untersuchung der reellen Funktion f (x) = √ x+1−1 x auf stetige Fortsetzbarf (x) g(x) l x0 Abb. 16.17: Veranschaulichung des Zusammenhangs lim x→x0 f (x) g(x) = f ′(x0) g′(x0) für zwei reelle differenzierbare Funktionen f : D ⊆ R −→ R und g : D ⊆ R −→ R keit an der Stelle x0 = 0 die Bestimmung des Grenzwertes lim x→0 √ x + 1 − 1 x . (16.34) Bei diesen beiden Grenzwertbetrachtungen ist das Ergebnis nicht mehr so offensichtlich wie in (16.32). Im ersten Fall resultiert als Grenzwert 1 und im zweiten Fall 12 . Erste und zweite Regel von L’Hôspital Unter Verwendung der Differentialrechnung ist es jedoch häufig möglich, auch kompliziertere Grenzwertprobleme wie z. B. (16.33) und (16.34) relativ einfach zu lösen. Sind nämlich f : D ⊆ R −→ R und g : D ⊆ R −→ R zwei reelle Funktionen, für die z. B. lim x→x0 f (x) = lim x→x0 g(x) = 0 gilt und deren erste Ableitungen f ′(x0) und g′(x0) mit g′(x0) = 0 existieren, dann sind die Funktionen f und g an der Stelle x0 auch stetig (vgl. Satz 16.5). Es gilt somit f (x0) = lim x→x0 f (x) = 0 und g(x0) = lim x→x0 g(x) = 0 und damit insbesondere lim x→x0 f (x) g(x) = lim x→x0 f (x)− f (x0) g(x)− g(x0) = limx→x0 f (x)−f (x0) x−x0 g(x)−g(x0) x−x0 = f ′(x0) g′(x0) (vgl. Abbildung 16.17). 473 Kapitel 16 Differenzierbare Funktionen L’Hôspital Dieser Sachverhalt wird durch die beiden folgenden Sätze präzisiert, die häufig nach dem französischen Mathematiker Guillaume Antoine de L’Hôspital (1661– 1704) als erste bzw. zweite Regel von L’Hôspital oder auch etwas scherzhaft als Krankenhausregel bezeichnet werden. Es ist allerdings festzuhalten, dass De L’Hôspital diese Regeln nicht selbst entdeckt, sondern sie von ihrem eigentlichen Entdecker, seinem akademischen Lehrer, dem schweizer Mathematiker Johann Bernoulli (1667–1748), abgekauft hat. J. Bernoulli L’Hôspital kommt jedoch das Verdienst zu, 1696 mit der Monographie „Analyse des infiniment petits“ das erste Lehrbuch zur Differentialrechnung geschrieben und veröffentlicht zu haben. Auf diese Weise hat er zur schnellen Verbreitung der Differentialrechnung wesentlich beigetragen. Mit der ersten Regel von L’Hôspital lassen sich Grenzwerte von reellen Funktionen, die sich als Quotient zweier gegen Null konvergierender Funktionen schreiben lassen, mit Hilfe der ersten Ableitungen dieser Funktionen berechnen. Das heißt, sie bezieht sich auf Grenzwertbetrachtungen der Struktur 00 : Satz 16.37 (Erste Regel von L’Hôspital) Die reellen Funktionen f, g : (a, b) −→ R seien differenzierbar mit g′(x) = 0 für alle x ∈ (a, b) und besitzen die beiden Eigenschaften: a) lim x↑b f (x) = lim x↑b g(x) = 0 b) Der Grenzwert lim x↑b f ′(x) g′(x) existiert im eigentlichen oder uneigentlichen Sinne Dann gilt: lim x↑b f (x) g(x) = lim x↑b f ′(x) g′(x) Eine analoge Aussage gilt unter entsprechend angepassten Voraussetzungen auch für die Grenzwertbetrachtungen x ↑ ∞, x ↓ a und x ↓ −∞. Beweis: Wegen Eigenschaft a) können die Funktionen f und g durch die Festlegungen f (b) := 0 bzw. g(b) := 0 stetig auf (a, b] fortgesetzt werden (vgl. Abschnitt 15.4). Im Folgenden sei x ∈ R mit a < x < b. Die Restriktionen der Funktionen f und g auf das Intervall [x, b] erfüllen somit die Voraussetzungen des verallgemeinerten Mittelwertsatzes (vgl. Satz 16.30). Das heißt, es gibt ein ξ ∈ (x, b) mit f (x) g(x) = f (x)− f (b) g(x)− g(b) = f ′(ξ) g′(ξ) . Da x ↑ b auch ξ ↑ b impliziert, erhält man daraus die Behauptung lim x↑b f (x) g(x) = lim ξ↑b f ′(ξ) g′(ξ) . Der Beweis für die rechtsseitige Grenzwertbetrachtung x ↓ a verläuft analog. Die Beweise für die Grenzwertbetrachtungen x ↑ ∞ und x ↓ −∞ werden über die Substitution y = 1 b−x mit x ↑ b bzw. y = 1 a−x mit x ↓ a auf die beiden ersten Fälle zurückgeführt. Titelblatt des Buches Analyse des infiniment petits von L’Hôspital Mit der zweiten Regel von L’Hôspital lassen sich Grenzwerte von reellen Funktionen, die sich als Quotient zweier bestimmt divergierender Funktionen schreiben lassen, mit Hilfe der ersten Ableitungen dieser Funktionen berechnen. Sie bezieht sich somit auf Grenzwertbetrachtungen der Struktur ±∞±∞ : Satz 16.38 (Zweite Regel von L’Hôspital) Die reellen Funktionen f, g : (a, b) −→ R seien differenzierbar mit g′(x) = 0 für alle x ∈ (a, b) und besitzen die beiden Eigenschaften: a) lim x↑b f (x) = ±∞ bzw. lim x↑b g(x) = ±∞ b) Der Grenzwert lim x↑b f ′(x) g′(x) existiert im eigentlichen oder uneigentlichen Sinne Dann gilt: lim x↑b f (x) g(x) = lim x↑b f ′(x) g′(x) Eine analoge Aussage gilt unter entsprechend angepassten Voraussetzungen auch für die Grenzwertbetrachtungen x ↑ ∞, x ↓ a und x ↓ −∞. 474 Kapitel 1616.8 Regeln von L’Hôspital Beweis: Es gelte ohne Beschränkung der Allgemeinheit lim x↑b f (x) = ∞ und limx↑b g(x) = ∞. Zunächst sei angenommen, dass der Grenzwert lim x↑b f ′(x) g′(x) = c im eigentlichen Sinne existiert. Dann kann zu einem beliebig vorgegebenen ε > 0 ein x1 ∈ R mit a < x1 < b hinreichend nahe bei b gewählt werden, so dass ∣ ∣ ∣ ∣ f ′(x) g′(x) − c ∣ ∣ ∣ ∣ < ε und g(x) > 0 (16.35) für alle x ∈ (x1, b) gilt. Ferner ist es dann möglich ein x2 ∈ R mit x1 < x2 < b so zu wählen, dass auch ∣ ∣ ∣ ∣ f (x1) g(x) ∣ ∣ ∣ ∣ < ε und ∣ ∣ ∣ ∣ g(x1) g(x) ∣ ∣ ∣ ∣ < ε (16.36) für alle x ∈ (x2, b) gilt. Da die Restriktionen der Funktionen f und g auf ein Intervall [x1, x] mit x ∈ (x2, b) die Voraussetzungen des verallgemeinerten Mittelwertsatzes (vgl. Satz 16.30) erfüllen, erhält man, dass es ein ξ ∈ (x1, x) mit f (x)− f (x1) g(x)− g(x1) = f ′(ξ) g′(ξ) gibt. Multiplikation mit g(x) − g(x1) und Division durch g(x) > 0 ergibt weiter f (x) g(x) = f (x1) g(x) + f ′(ξ) g′(ξ) ( 1 − g(x1) g(x) ) , woraus f (x) g(x) − c = f (x1) g(x) + f ′(ξ) g′(ξ) − c − f ′(ξ) g′(ξ) g(x1) g(x) (16.37) folgt. Wegen ξ ∈ (x1, b) und (16.35) gilt jedoch ∣ ∣∣ ∣ f ′(ξ) g′(ξ) ∣∣ ∣∣ < |c| + ε und zusammen mit (16.36) erhält man für (16.37) die Abschätzung ∣∣ ∣∣ f (x) g(x) − c ∣ ∣∣ ∣ < ε + ε + (|c| + ε)ε = (2 + |c| + ε)ε für alle x ∈ (x2, b). Da eine solche Abschätzung für jedes ε > 0 möglich ist, impliziert sie die Behauptung lim x↑b f (x) g(x) = c = lim x↑b f ′(x) g′(x) . Es sei nun lim x↑b f ′(x) g′(x) = ∞ ein Grenzwert im uneigentlichen Sinne. Dann gilt lim x↑b g′(x) f ′(x) = 0 und gemäß dem ersten Teil des Beweises damit auch lim x↑b g(x) f (x) = 0. Ferner gibt es wegen lim x↑b f (x) = ∞ und limx↑b g(x) = ∞ ein x1 ∈ (a, b), so dass f (x) > 0 und g(x) > 0 für alle x ∈ (x1, b) gilt. Somit gilt insbesondere auch f (x) g(x) > 0 für alle x ∈ (x1, b). Zusammen mit lim x↑b g(x) f (x) = 0 impliziert dies die Behauptung lim x↑b f (x) g(x) = ∞ = lim x↑b f ′(x) g′(x) . Der Beweis für die rechtsseitige Grenzwertbetrachtung x ↓ a verläuft analog. Die Beweise für die Grenzwertbetrachtungen x ↑ ∞ und x ↓ −∞ werden über die Substitution y = 1 b−x mit x ↑ b bzw. y = 1 a−x mit x ↓ a auf die beiden anderen Fälle zurückgeführt. Der Nutzen der beiden Regeln von L’Hôspital liegt darin begründet, dass sich der Grenzwert lim x↑b f ′(x) g′(x) häufig einfacher berechnen lässt als lim x↑b f (x) g(x) . Bei der Anwendung der Regeln von L’Hôspital muss jedoch stets überprüft werden, ob der Grenzwert lim x↑b f (x) g(x) auch tatsächlich in einen unbestimmten Ausdruck resultiert und somit die Voraussetzung a) in Satz 16.37 bzw. Satz 16.38 erfüllt ist. Andernfalls erhält man durch Anwendung der Regeln von L’Hôspital im Allgemeinen ein falsches Ergebnis (siehe z. B. Beispiel 16.39b)). Die unüberlegte oder vorschnelle Anwendung der Regeln von L’Hôspital ist nicht ratsam, da dies schnell zu unnötig aufwendigen Rechnungen führen kann. Die Regeln von L’Hôspital sollten daher erst angewendet werden, wenn eine Umformung des Quotienten f g oder die Darstellung der Funktionen f und g als sogenannte Potenzreihen (siehe Abschnitt 17.4) nicht möglich ist oder zu keinem Ergebnis führt (siehe hierzu Beispiel 16.42). Bei der Anwendung der Regeln von L’Hôspital kommt es auch häufig vor, dass der dazu benötigte Grenzwert lim x↑b f ′(x) g′(x) selbst erst mit den Regeln von L’Hôspital ermittelt werden muss. Dazu ist es dann notwendig, dass die ersten Ableitungen f ′ und g′ die Voraussetzungen einer der beiden Sätze 16.37 oder 16.38 erfüllen. Dieses Vorgehen lässt sich gegebenenfalls auch auf höhere Ableitungen fortsetzen (siehe Beispiel 16.39c)). Wie die folgenden Ausführungen zeigen, können die Regeln von L’Hôspital jedoch nicht nur auf unbestimmte Ausdrücke der Struktur 00 und ∞ ∞ angewendet werden, sondern nach entsprechender Umformung auch auf unbestimmte Ausdrücke der Struktur 0 · ∞, 0 · (−∞), ∞−∞, 00, ∞0 und 1±∞. 475 Kapitel 16 Differenzierbare Funktionen Grenzwerte vom Typ 00 und ±∞ ±∞ Bei Grenzwerten vom Typ 00 und ±∞ ±∞ kann der Satz 16.37 bzw. 16.38 unmittelbar, d. h. ohne Umformungen des Quotienten f (x) g(x) , angewendet werden. Beispiel 16.39 (Anwendung der Regeln von L’Hôspital) a) In Beispiel 13.43 wurde mit einem gewissen Aufwand der Grenzwert limx→0 sin xx = 1 berechnet. Da jedoch die Voraussetzungen der ersten Regel von L’Hôspital erfüllt sind, erhält man nun für den Grenzwert unmittelbar lim x→0 sin x x = lim x→0 cos x 1 = 1. b) Bei der Berechnung des Grenzwertes lim x→3 x3 − x2 − 5x − 3 3x2 − 7x − 6 sind die Voraussetzungen der ersten Regel von L’Hôspital erfüllt und man erhält lim x→3 x3 − x2 − 5x − 3 3x2 − 7x − 6 = limx→3 3x2 − 2x − 5 6x − 7 = 16 11 . Es ist jedoch zu beachten, dass eine nochmalige Anwendung der ersten Regel von L’Hôspital nicht erlaubt ist, da limx→3 3x 2−2x−5 6x−7 kein unbestimmter Ausdruck mehr ist und somit die Voraussetzung a) von Satz 16.37 nicht erfüllt ist. Eine wiederholte Anwendung der ersten Regel von L’Hôspital würde daher das falsche Ergebnis limx→3 6x−26 = 83 liefern. c) Bei der Berechnung des Grenzwertes lim x→∞ x2 ex sind die Voraussetzungen der zweiten Regel von L’Hôspital erfüllt und man erhält lim x→∞ x2 ex = lim x→∞ 2x ex . Aber auch der Grenzwert limx→∞ 2xex ist noch vom Typ ∞∞ . Durch nochmalige Anwendung der zweiten Regel von L’Hôspital erhält man den Grenzwert lim x→∞ x2 ex = lim x→∞ 2x ex = lim x→∞ 2 ex = 0. d) Bei der Berechnung des Grenzwertes lim x→∞ eax x mit a > 0 sind die Voraussetzungen der zweiten Regel von L’Hôspital erfüllt und man erhält lim x→∞ eax x = lim x→∞ aeax 1 = ∞. Folglich gilt für ein beliebiges b > 0 lim x→∞ eax xb = lim x→∞ ( e a b x x )b = ( lim x→∞ e a b x x )b = ∞. Das heißt, jede noch so kleine Potenz a > 0 von ex geht für x → ∞ schneller gegen ∞ als jede noch so große Potenz b > 0 von x. Dies wiederum impliziert, dass auch lim x→∞ p(x) eax = 0 für jedes beliebige Polynom p(x) und alle a > 0 gilt. Grenzwerte vom Typ 0 · ±∞ und ∞−∞ Bei einer Grenzwertbetrachtung der Form lim x→x0 f (x)g(x) (16.38) vom Typ 0 · ∞ und 0 · (−∞) können die Regeln von L’Hôspital nicht unmittelbar angewendet werden. Diese Fälle können jedoch leicht durch Umformungen auf Grenzwerte vom Typ 00 und ±∞ ±∞ zurückgeführt werden, so dass anschlie- ßend der Grenzwert (16.38) eventuell durch Anwendung von Satz 16.37 bzw. Satz 16.38 berechnet werden kann. Als Umformung bietet sich der Übergang vom Produkt f (x)g(x) zum Quotienten f (x) 1 g(x) oder g(x) 1 f (x) an, um anschließend für die weitere Betrachtung eventuell die erste bzw. die zweite Regel von L’Hôspital anwenden zu können. Dagegen liegt bei einer Grenzwertbetrachtung lim x→x0 ( f (x)+ g(x)) (16.39) 476 Kapitel 1616.8 Regeln von L’Hôspital vom Typ ∞−∞ für die Summe/Differenz f (x)± g(x) die Umformung f (x)± g(x) = 11 f (x) ± 11 g(x) = 1 g(x) ± 1 f (x) 1 f (x)g(x) nahe, so dass anschließend für die weitere Untersuchung eventuell die erste Regel von L’Hôspital herangezogen werden kann. Beispiel 16.40 (Anwendung der Regeln von L’Hôspital) a) Der Grenzwert lim x↓0 xa ln(x) mit a > 0 ist vom Typ 0 ·(−∞) und kann durch eine einfache Umformung in lim x↓0 xa ln(x) = lim x↓0 ln(x) x−a und damit in einen Grenzwert vom Typ −∞∞ überführt werden. Die Voraussetzungen der zweiten Regel von L’Hôspital sind somit erfüllt und man erhält lim x↓0 xa ln(x) = lim x↓0 ln(x) x−a = lim x↓0 1 x −ax−a−1 = lim x↓0 ( − 1 a xa ) = 0. b) Der Grenzwert lim x→∞ ( 5 √ x5 − x4 − x ) ist vom Typ ∞−∞ und kann durch eine einfache Umformung in lim x→∞ ( 5 √ x5 − x4 − x ) = lim x→∞ [( x5 ( 1 − 1 x ))1/5 −x ] = lim x→∞ [ x ( 1 − 1 x )1/5 − x ] = lim x→∞ [( 1 − 1 x )1/5 − 1 1/x ] und damit in einen Grenzwert vom Typ 00 überführt werden. Das heißt, die Voraussetzungen der ersten Regel von L’Hôspital sind erfüllt und man erhält lim x→∞ ( 5 √ x5−x4−x ) = lim x→∞ 1 5 ( 1 − 1 x )−4/5 · 1 x2 −1/x2 = lim x→∞− 1 5 ( 1− 1 x )−4/5 =−1 5 . Grenzwerte vom Typ 00, ∞0 und 1±∞ Bei einer Grenzwertbetrachtung der Form lim x→x0 f (x)g(x) (16.40) mit f (x) > 0 vom Typ 00, ∞0 oder 1±∞ können die Regeln von L’Hôspital ebenfalls nicht unmittelbar angewendet werden. Unter Berücksichtigung der Beziehung ln ( f (x)g(x) ) = g(x) ln (f (x)) und der Stetigkeit der Exponentialfunktion versucht man daher den Grenzwert lim x→x0 eg(x) ln(f (x)) = e limx→x0 g(x) ln(f (x)) (16.41) zu ermitteln. Der Grenzwert auf der rechten Seite von (16.41) existiert jedoch genau dann, wenn der Grenzwert lim x→x0 g(x) ln (f (x)) (16.42) existiert und es gilt dann lim x→x0 f (x)g(x) = e limx→x0 g(x) ln(f (x)). Dabei interessieren die folgenden drei Fälle: 1) lim x→x0 g(x) = 0 und lim x→x0 f (x) = 0 bzw. lim x→x0 ln (f (x)) = −∞ 2) lim x→x0 g(x) = 0 und lim x→x0 f (x) = ∞ bzw. lim x→x0 ln (f (x)) = ∞ 3) lim x→x0 g(x) = ±∞ und lim x→x0 f (x) = 1 bzw. lim x→x0 ln (f (x)) = 0 Im ersten Fall ist der Grenzwert (16.40) vom Typ 00, im zweiten Fall vom Typ ∞0 und im dritten Fall vom Typ 1±∞. Der Grenzwert (16.42) ist dagegen vom Typ 0 · (±∞). Er lässt sich somit oftmals, wie zuvor beschrieben, mit Hilfe der ersten und zweiten Regel von L’Hôspital berechnen. 477 Kapitel 16 Differenzierbare Funktionen Beispiel 16.41 (Anwendung der Regeln von L’Hôspital) a) Der Grenzwert lim x↓0 xx ist vom Typ 00. Es gilt jedoch lim x↓0 xx = elimx↓0 x ln(x), wobei der Grenzwert lim x↓0 x ln(x) vom Typ 0 · (−∞) ist und damit in lim x↓0 x ln(x) = lim x↓0 ln(x) 1 x , d. h. in einen Grenzwert vom Typ −∞∞ , umgeformt werden kann. Folglich sind die Voraussetzungen der zweiten Regel von L’Hôspital erfüllt und man erhält lim x↓0 x ln(x) = lim x↓0 ln(x) 1 x = lim x↓0 1 x − 1 x2 = − lim x↓0 x = 0. Es gilt folglich lim x↓0 xx = elimx↓0 x ln(x) = e0 = 1. b) Der Grenzwert lim x→∞ (ln(x)) 1 x ist vom Typ ∞0. Es gilt jedoch lim x→∞ (ln(x)) 1 x = e limx→∞ 1x ln(ln(x)), wobei der Grenzwert lim x→∞ 1 x ln (ln(x)) vom Typ 0·∞ ist und damit in lim x→∞ 1 x ln (ln(x)) = lim x→∞ ln (ln(x)) x , d. h. einen Grenzwert vom Typ ∞∞ , umgeformt werden kann. Daher sind die Voraussetzungen der zweiten Regel von L’Hôspital erfüllt und man erhält lim x→∞ 1 x ln (ln(x)) = lim x→∞ ln (ln(x)) x = lim x→∞ 1 x ln(x) 1 = 0. Es gilt folglich lim x→∞ (ln(x)) 1 x = e limx→∞ 1x ln(ln(x)) = e0 = 1. c) Der Grenzwert lim x↑0 (1 + sin(x)) 1x ist vom Typ 1−∞. Es gilt jedoch lim x↑0 (1 + sin(x)) 1x = elimx↑0 1 x ln(1+sin(x)) , wobei der Grenzwert lim x↑0 1 x ln (1 + sin(x)) vom Typ 0 · ∞ ist und damit in lim x↑0 1 x ln (1 + sin(x)) = lim x↑0 ln (1 + sin(x)) x , d. h. einen Grenzwert vom Typ 00 , umgeformt werden kann. Die Voraussetzungen der ersten Regel von L’Hôspital sind daher erfüllt und man erhält lim x↑0 1 x ln (1 + sin(x)) = lim x↑0 ln (1 + sin(x)) x = lim x↑0 cos(x) 1+sin(x) 1 = 1. Es gilt folglich lim x↑0 (1 + sin(x)) 1x = elimx↑0 1 x ln(1+sin(x)) = e1 = e. Das folgende abschließende Beispiel 16.42 soll vor einer zu unbedachten Anwendung der Regeln von L’Hôspital warnen. Es zeigt, dass es Situationen gibt, in denen die Regeln von L’Hôspital zu keinem Ergebnis führen bzw. sich nicht anwenden lassen, obwohl sich der Grenzwert durch elementare Umformungen leicht berechnen lässt: Beispiel 16.42 (Vorsicht bei der Anwendung der Regeln von L’Hôspital) a) Der Grenzwert lim x→∞ ex − e−x ex + e−x ist vom Typ ∞∞ und es sind die Voraussetzungen der zweiten Regel von L’Hôspital erfüllt. Jedoch führt jeder Versuch, diesen Grenzwert mit der zweiten Regel von L’Hôspital zu ermitteln, wieder zu einem Grenzwert vom Typ ∞∞ und damit zu keinem Ergebnis. Dennoch kann der Grenzwert durch eine einfache Um- 478 Kapitel 1616.9 Änderungsraten und Elastizitäten formung und ohne Anwendung der Regeln von L’Hôspital berechnet werden. Denn es gilt ex − e−x ex + e−x = ex ( 1 − e−2x) ex ( 1 + e−2x) = 1 − e−2x 1 + e−2x und damit insbesondere lim x→∞ ex − e−x ex + e−x = limx→∞ 1 − e−2x 1 + e−2x = 1. b) Der Grenzwert lim x→0 x2 cos ( 1 x ) sin(x) ist vom Typ 00 und es sind die Voraussetzungen der ersten Regel von L’Hôspital erfüllt. Für den Quotienten der Ableitungen von Zähler und Nenner gilt f ′(x) g′(x) = 2x cos ( 1 x )+ sin ( 1 x ) cos(x) . Da dieser Ausdruck jedoch für x → 0 unbestimmt divergent ist (d. h. weder eigentlich noch uneigentlich konvergiert), ist die Voraussetzung b) der Regeln von L’Hôspital nicht erfüllt und die Regeln von L’Hôspital sind somit nicht anwendbar. Dennoch kann der Grenzwert leicht auf andere Weise berechnet werden. Denn es gilt x2 cos ( 1 x ) sin(x) = x sin(x) ( x cos ( 1 x )) . Daraus folgt zusammen mit dem Ergebnis von Beispiel 16.39a) lim x→0 x2 cos ( 1 x ) sin(x) = lim x→0 x sin(x) · lim x→0 ( x cos ( 1 x )) = 1 · 0 = 0. Die Entwicklung der Kosinus- und Sinusfunktion in jeweils eine sogenannte Taylor-Reihe stellt eine andere Möglichkeit der Berechnung des Grenzwertes dar (vgl. Beispiel 17.11). 16.9 Änderungsraten und Elastizitäten Absolute und relative Änderungen Eine der zentralen Fragestellungen in den Wirtschaftswissenschaften ist die Untersuchung der absoluten Änderung y := y2 − y1 einer abhängigen Variablen y = f (x) bei einer absoluten Veränderung x := x2 − x1 der unabhängigen Variablen x. Ein typisches Beispiel hierfür ist die Änderung N = N(p + p)−N(p) der Nachfrage N(p) bei einer Veränderung des Preises p um p. Um jedoch auch einen Bezug zum Ausmaß der Änderung p herzustellen, betrachtet man in der Regel anstelle von N den Differenzenquotienten N p = N(p + p)−N(p) p (16.43) oder – falls er existiert – seinen Grenzwert, den Differentialquotienten N ′(p) = lim p→0 N p = lim p→0 N(p + p)−N(p) p , (16.44) welcher dann als Grenznachfrage bezeichnet wird. Der Differenzenquotient N p und der Differentialquotient N ′(p) = lim p→0 N p besitzen jedoch für viele wirtschaftswissenschaftliche Anwendungen den Nachteil, dass sie ausschließlich auf den absoluten Änderungen N und p basieren und damit oft nur unzureichend über das relative Ausmaß der Veränderung Auskunft geben. Betrachtet man beispielsweise ein Produkt, bei dem eine Preiserhöhung von p = 1€ eine Veränderung der Nachfrage um N = −100.000 Stück zur Folge hat, dann lässt sich daraus über die tatsächliche Qualität der Nachfrageänderung nicht viel ablesen. Denn für eine genaue Beurteilung der Situation ist es zum einen notwendig zu wissen, ob der Preis zuvor 10€ oder 1000€ betragen hat, und zum anderen ist es von entscheidender Bedeutung, ob die Nachfrage von 200.000 auf 100.000 oder von 10.000.000 auf 9.900.000 gesunken ist. Der Differenzen- und der Differentialquotient N p bzw. N ′(p) besitzen daher beide die Schwäche, dass die 479 Kapitel 16 Differenzierbare Funktionen absoluten Veränderungen N und p nicht in Bezug zum jeweils bereits vorhandenen Ausgangsniveau der Nachfrage bzw. des Preises gesetzt werden. Die Quantifizierung der Wirkung des Preises p auf die Nachfrage N ist daher für viele ökonomische Fragestellungen aussagekräftiger, wenn dazu ein Maß verwendet wird, welches das Ausgangsniveau beim Preis p und bei der Nachfrage N berücksichtigt. Das heißt, es sollte ein Maß herangezogen werden, welches nicht ausschließlich auf den absoluten Änderungen N und p, sondern stattdessen auf den relativen Änderungen N N(p) und p p basiert. Anstelle des Differenzenquotienten (16.43) und des Differentialquotienten (16.44) erhält man dann die sogenannte mittlere Nachfrageelastizität N N(p) p p = N p · p N(p) und bei Betrachtung des Grenzübergangs p → 0 die sogenannte Nachfrageelastizität lim p→0 N N(p) p p = lim p→0 N p · p N(p) = N ′(p) · p N(p) . Beispiel 16.43 (Nachfrageänderung und Nachfrageelastizität) Gegeben sei die lineare Nachfragefunktion N : [0, 100) −→ R, p %→ N(p) = 100 − p, welche die NachfrageN in Abhängigkeit des Preisesp (in €) angibt. Unabhängig vom Ausgangsniveau des Preises p bewirkt eine Preisänderung von p = p2−p1 = 5 eine Nachfrageänderung von N = N(p2)−N(p1) = 100 − p2 − (100 − p1) = p1 − p2 = − p = −5. Somit gilt unabhängig vom Ausgangsniveau von p und N(p) N p = −1 und N ′(p) = lim p→0 N p = −1. Für die Quotienten der relativen Änderungen gilt dagegen N N(p) p p = N p · p N(p) . Der Quotient der relativen Änderungen ist daher abhängig vom Ausgangsniveau von p und N(p). Zum Beispiel erhält man für die (mittlere) Nachfrageelastizität bei den Ausgangsniveaus p = 20 mit N(20) = 80 und p = 70 mit N(70) = 30 die Werte N N(20) p 20 = N p · 20 80 = −20 80 = −1 4 und lim p→0 N N(20) p 20 = N ′(20) · 20 80 = −1 4 bzw. N N(70) p 70 = N p · 70 30 = −70 30 = −7 3 und lim p→0 N N(70) p 70 = N ′(70) · 70 30 = −7 3 . Das heißt, der Quotient der relativen Änderungen stimmt bei den Preisen p = 20 und p = 70 nicht überein. Bei einem Preis von p = 20 führt – etwas salopp ausgedrückt – ein Preisanstieg um 1% zu einer Reduktion der Nachfrage um 0,25%, während bei einem Preis von p = 70 ein Preisanstieg um 1% eine Reduktion der Nachfrage um 2,33% bewirkt (vgl. Abbildung 16.18, links). Änderungsraten und Elastizitäten Neben der in Beispiel 16.43 betrachteten Nachfrageelastizität werden in den Wirtschaftswissenschaften viele weitere Arten von Elastizitäten studiert. Hierzu zählen z. B. die Einkommens-, Absatzwert-, Steuerbetrags-, Zins-, Substitutions-, Kreuzpreis- sowie die dynamische Preiselastizität. Daher werden durch die folgende Definition die obigen speziell für die Nachfragefunktion angestellten Überlegungen auf beliebige reelle (differenzierbare) Funktionen verallgemeinert und damit insbesondere die für viele ökonomische Anwendungsgebiete bedeutenden Begriffe mittlere Elastizität und Elastizität definiert: 480 Kapitel 1616.9 Änderungsraten und Elastizitäten 0 20 40 60 80 100 0 20 40 60 80 100 N(p) = 100 − p Δp Δp ΔN ΔN − a b f (x) εf (x)ρf (x) Abb. 16.18: Lineare Nachfragefunktion N : [0, 100) −→ R, p %→ N(p) = 100 − p (links) und affin-lineare Funktion f : R −→ R, x %→ a + bx mit Änderungsrate ρf (x) und Elastizität εf (x) (rechts) Definition 16.44 (Änderungsrate und Elastizität) Es sei f : D ⊆ R −→ R eine reelle Funktion und f (x0) := f (x0 + x) − f (x0) mit x0, x0 + x ∈ D, x = 0 und f (x0) = 0. Dann heißt a) f (x0) x · 1 f (x0) mittlere Änderungsrate von f an der Stelle x0 und b) f (x0) x · x0 f (x0) mittlere Elastizität von f an der Stelle x0. Ist die reelle Funktion f an der Stelle x0 zusätzlich differenzierbar, dann heißt c) ρf (x0) := df (x0)dx · 1f (x0) = f ′(x0) f (x0) Änderungsrate von f an der Stelle x0 und d) εf (x0) := df (x0)dx · x0f (x0) = x0 · f ′(x0) f (x0) Elastizität von f an der Stelle x0. Die Änderungsrate ρf (x) entspricht der momentanen Veränderung f ′(x) der Funktion f an der Stelle x bezogen auf den Funktionswert f (x). Anstelle von Änderungsrate spricht man daher oft auch von prozentualer Änderung der Funktion f an der Stelle x. Dagegen gibt die Elastizität εf (x) die momentane Veränderung f ′(x) der Funktion f an der Stelle x bezogen auf den Wert der Durchschnittsfunktion f (x) x an. Das heißt, die Elastizität berücksichtigt das Ausgangsniveau der abhängigen und der unabhängigen Variablen y = f (x) bzw. x und besitzt damit insbesondere keine Dimension (wie z. B. € oder Stück). Diese Eigenschaft erleichtert die Vergleichbarkeit von Elastizitäten. Anschaulich – aber nicht ganz korrekt – kann die Elastizität εf (x) als die prozentuale Änderung der abhängigen Variablen y = f (x) bei einer Veränderung der unabhängigen Variablen x um 1% interpretiert werden. Offensichtlich gilt zwischen der Änderungsrate und der Elastizität der Zusammenhang εf (x) = xρf (x). Die Änderungsrate und die Elastizität stimmen folglich an der Stelle x = 1 für jede differenzierbare Funktion f : D ⊆ R −→ R überein. Mit (16.19) erhält man für die Elastizität die alternative Darstellung εf (x) = 11 x f ′(x) f (x) = 1 d ln(x) dx d ln (f (x)) dx = d ln (f (x)) d ln(x) . Aufgrund dieses Zusammenhangs ist es oftmals zweckmäßig, eine reelle Funktion in einem doppeltlogarithmischen Koordinatensystem darzustellen, wenn man sich für ihre Elastizität interessiert. In den Wirtschaftswissenschaften unterscheidet man die in Tabelle 16.1 angegebenen Elastizitätsbereiche. Zum Beispiel bewirken bei derivativen Finanzinstrumenten (z. B. Put, Call) kleine Kursänderungen des zugehörigen Basisin- 481 Kapitel 16 Differenzierbare Funktionen Wert der Elastizität Bezeichnung εf (x) = 0 f heißt vollkommen unelastisch an der Stelle x 0 < |εf (x)| < 1 f heißt unelastisch oder auch unterproportional elastisch an der Stelle x |εf (x)| = 1 f heißt proportional elastisch an der Stelle x 1 < |εf (x)| < ∞ f heißt elastisch oder auch überproportional elastisch an der Stelle x |εf (x)| = ∞ f heißt vollkommmen elastisch an der Stelle x Tabelle 16.1: Verschiedene Elastizitätsbereiche struments (z. B. Aktien) eine prozentual stärkere Kursveränderung beim Derivat (sog. Hebelwirkung). Ein Derivat reagiert somit elastisch bezüglich des zugehörigen Basisinstruments (vgl. Beispiel 22.35). Eine reelle differenzierbare Funktion f : D ⊆ R −→ R, deren Elastizität εf (x) konstant ist, wird oftmals als isoelastische Funktion bezeichnet. Beispiel 16.45 (Änderungsrate und Elastizität) a) Bei der NachfragefunktionN aus Beispiel 16.43 sind die Änderungsrate ρN(p) und die Elastizität εN(p) an der Stelle p gegeben durch ρN(p) = N ′(p) N(p) = − 1 100 − p bzw. εN(p) = p · N ′(p) N(p) = − p 100 − p . Das heißt, speziell für p = 20 und p = 70 gilt ρN(20) = − 1 80 und εN(20) = −1 4 bzw. ρN(70) = − 1 30 und εN(70) = −7 3 . Die Nachfragefunktion ist somit an der Stelle p = 20 unelastisch und an der Stelle p = 70 elastisch (vgl. Abbildung 16.18, links). b) Bei der affin-linearen Funktion f : R −→ R, x %→ a+bx sind die Änderungsrate und die Elastizität gegeben durch ρf (x) = f ′(x) f (x) = b a + bx bzw. εf (x) = xρf (x) = bx a + bx für alle x ∈ R \ {− a b } . Eine lineare Funktion y = a + bx mit a = 0 besitzt somit an jeder Stelle x ∈ R \ {− a b } eine andere Elastizität. Dagegen gilt εf (x) = 1 für a = 0. Das heißt, eine Ursprungsgerade f (x) = bx ist stets eine isoelastische Funktion (vgl. Abbildung 16.18, rechts). c) Bei der Potenzfunktion f : R+ \ {0} −→ R, x %→ axc mit a = 0 und c ∈ R sind die Änderungsrate und die Elastizität gegeben durch ρf (x) = f ′(x) f (x) = cax c−1 axc = c x bzw. εf (x) = xρf (x) = c für alle x ∈ R+ \ {0}. Potenzfunktionen f (x) = axc besitzen folglich eine streng monoton steigende Änderungsrate für c < 0, eine konstante Änderungsrate 0 für c = 0 und eine streng monoton fallende Änderungsrate für c > 0. Potenzfunktionen sind stets isoelastische Funktionen (vgl. Abbildung 16.19, links). d) Bei der Exponentialfunktion f : R−→R, x %→aebx mit a = 0 und b ∈ R sind die Änderungsrate und die Elastizität gegeben durch ρf (x) = f ′(x) f (x) = bae bx aebx = b bzw. εf (x) = xρf (x) = bx. Das heißt, die Exponentialfunktion f (x) = aebx besitzt stets eine konstante Änderungsrate und eine linear ansteigende Elastizität für b > 0, eine konstante Elastizität von Null für b = 0 oder eine linear fallende Elastizität für b < 0 (vgl. Abbildung 16.19, rechts). Ähnliche Beobachtungen macht man in der Nutzentheorie für die absolute und relative Risikoaversion von Finanzmarktteilnehmern. Aus diesem Grund wird die Exponentialfunktion häufig zur Beschreibung der Risikoaversion von Finanzmarktteilnehmern verwendet (siehe z. B. Ingersoll [30] und Breuer et al. [6]). 482 Kapitel 1616.9 Änderungsraten und Elastizitäten 0 0 f (x) εf (x) ρf (x) 0 0 f (x) εf (x) ρf (x) Abb. 16.19: Potenzfunktion f : R+ \ {0} −→ R, x %→ axc mit Änderungsrate ρf (x) und Elastizität εf (x) (links) und Exponentialfunktion f : R −→ R, x %→ aebx mit Änderungsrate ρf (x) und Elastizität εf (x) (rechts) Rechenregeln für Änderungsraten und Elastizitäten Mit Hilfe der Ableitungsregeln aus Satz 16.6 und den beiden Sätzen 16.8 und 16.10 zur Differenzierbarkeit von Kompositionen bzw. Umkehrfunktionen können leicht die folgenden Regeln für das Rechnen mit Änderungsraten und Elastizitäten hergeleitet werden: Satz 16.46 (Rechenregeln für Änderungsraten) Es seien f : D ⊆ R −→ R und g : D ⊆ R −→ R zwei reelle differenzierbare Funktionen. Dann gilt: a) ρf+g(x0)= f (x0)ρf (x0)+g(x0)ρg(x0)f (x0)+g(x0) für f (x0)+g(x0) =0 b) ρf−g(x0)= f (x0)ρf (x0)−g(x0)ρg(x0)f (x0)−g(x0) für f (x0)−g(x0) =0 c) ρfg(x0) = ρf (x0) + ρg(x0) für f (x0) = 0 und g(x0) = 0 d) ραf (x0) = ρf (x0) für α ∈ R \ {0} und f (x0) = 0 e) ρ f g (x0) = ρf (x0) − ρg(x0) für f (x0) = 0 und g(x0) = 0 f) ρf ◦g(x0) = g(x0)ρf (g(x0))ρg(x0) für g(D) ⊆ D und f (g(x0)) = 0 g) ρf−1(f (x0)) = 1x0f (x0)ρf (x0) für f streng monoton sowie x0 = 0 und f ′(x0) = 0 Beweis: Zu a) und b): Gemäß Satz 16.6a) und b) sind die Funktionen f+g und f−g differenzierbar und für die Änderungsrate gilt ρf±g(x0) = (f ± g) ′(x0) (f ± g)(x0) = f ′(x0)± g′(x0) f (x0)± g(x0) = f (x0) f ′(x0) f (x0) ± g(x0) g′(x0)g(x0) f (x0)± g(x0) = f (x0)ρf (x0)± g(x0)ρg(x0) f (x0)± g(x0) . Zu c): Gemäß Satz 16.6c) ist die Funktion fg differenzierbar und für die Änderungsrate erhält man ρfg(x0) = (fg) ′(x0) (fg)(x0) = f ′(x0)g(x0)+ f (x0)g′(x0) f (x0)g(x0) = f ′(x0) f (x0) + g ′(x0) g(x0) = ρf (x0)+ ρg(x0). Zu d): Gemäß Satz 16.6d) ist die Funktion αf differenzierbar und für die Änderungsrate folgt ραf (x0) = (αf ) ′(x0) (αf )(x0) = αf ′(x0) αf (x0) = f ′(x0) f (x0) = ρf (x0). Zu e): Gemäß Satz 16.6e) ist die Funktion f g differenzierbar und für die Änderungsrate erhält man ρ f g (x0) = ( f g )′ (x0) ( f g ) (x0) = 1 g2(x0) ( f ′(x0)g(x0)− f (x0)g′(x0) ) f (x0) g(x0) = f ′(x0)g(x0)− f (x0)g′(x0) f (x0)g(x0) = ρf (x0)− ρg(x0). 483 Kapitel 16 Differenzierbare Funktionen Zu f): Gemäß Satz 16.8 ist die Funktion f ◦ g differenzierbar und für die Änderungsrate gilt ρf ◦g(x0) = (f (g(x0))) ′ f (g(x0)) = f ′ (g(x0)) g′(x0) f (g(x0)) = f ′ (g(x0)) f (g(x0)) · g ′(x0) g(x0) · g(x0) = ρf (g(x0))ρg(x0)g(x0). Zu g): Gemäß Satz 16.10 ist f−1 differenzierbar und für die Änderungsrate erhält man ρf−1 (f (x0)) = (f−1)′ (f (x0)) f−1 (f (x0)) = 1 f ′(x0) x0 = f (x0) f ′(x0) x0f (x0) = 1 x0f (x0)ρf (x0) . Der letzte Satz ist ein wichtiges Hilfsmittel beim Rechnen mit Änderungsraten. Er besagt: a) Die Änderungsrate einer Summe f + g ist ein gewichtetes Mittel der Änderungsraten von f und g (Satz 16.46a) und b)). b) Die Änderungsraten zweier Funktionen f und g, die sich nur durch einen Faktor α = 0 unterscheiden, stimmen stets überein (Satz 16.46d)). c) Die Änderungsrate eines Produkts fg oder eines Quotienten f g lässt sich leicht als Summe bzw. Differenz der Änderungsraten von f und g berechnen (Satz 16.46c) und e)). Aufgrund des Zusammenhangs εf (x) = xρf (x) gelten entsprechende Aussagen auch für Elastizitäten: Folgerung 16.47 (Rechenregeln für Elastizitäten) Es seien f : D ⊆ R −→ R und g : D ⊆ R −→ R zwei reelle differenzierbare Funktionen. Dann gilt: a) εf+g(x0)= f (x0)εf (x0)+g(x0)εg(x0)f (x0)+g(x0) für f (x0)+g(x0) =0 b) εf−g(x0)= f (x0)εf (x0)−g(x0)εg(x0)f (x0)−g(x0) für f (x0)−g(x0) =0 c) εfg(x0) = εf (x0) + εg(x0) für f (x0) = 0 und g(x0) = 0 d) εαf (x0) = εf (x0) für α ∈ R \ {0} und f (x0) = 0 e) ε f g (x0)=εf (x0)−εg(x0) für f (x0) =0 und g(x0) =0 f) εf ◦g(x0) = εf (g(x0))εg(x0) für g(D) ⊆ D und f (g(x0)) = 0 g) εf−1(f (x0)) = 1εf (x0) für f streng monoton sowie x0 = 0 und f ′(x0) = 0 Beweis: Aufgrund des Zusammenhangs εf (x) = xρf (x) folgen die Aussagen a)-g) unmittelbar aus den entsprechenden Aussagen von Satz 16.46. Die Aussagen f) und g) von Folgerung 16.47 besagen, dass die Elastizität der Komposition f ◦g zweier reeller Funktionen f und g einfach als Produkt der Elastizitäten von f und g bzw. die Elastizität der Umkehrfunktion f −1 als Kehrwert der Elastizität von f leicht berechnet werden können. Mit Aussage d) von Folgerung 16.47 lässt sich eine für die ökonomische Theorie und Praxis bedeutende Transformationseigenschaft von Elastizitäten nachweisen. Gilt nämlich y = βx und h(y) = αf (x) für alle x ∈ D und geeignete Konstanten α, β ∈ R \ {0}, dann folgt εh(y) = y h ′(y) h(y) = y h(y) dh(y) dy = βx αf (x) d(αf )(x) d(βx) = x αf (x) d(αf )(x) dx = x (αf ) ′(x) αf (x) = εαf (x) = εf (x). Das heißt, unterzieht man in einer funktionalen Beziehung z = f (x) die unabhängige und abhängige Variable x bzw. z einer multiplikativen Transformation der Form y = βx bzw. h(y) = αf (x), dann bleibt die Elastizität εf (x) unverändert. Die Elastizität εf (x) einer reellen Funktion ist somit von den Maßeinheiten, in denen die unabhängige und die abhängige Variable gemessen werden, unabhängig! Diese Unabhängigkeit vom Maßsystem ist ein weiterer Grund, weshalb die Elastizität für Vergleiche in wirtschaftswissenschaftlichen Anwendungen besser geeignet ist als die erste Ableitung. Betrachtet man z. B. die Nachfragefunktionen N1(p) und N2(p) für Büroklammern bzw. Fertighäuser in Abhängigkeit vom Preis p und interessiert man sich dafür, welche Nachfrage empfindlicher auf Preisänderungen reagiert, dann ist es nicht sinnvoll einfach die ersten Ableitungen N1(p) bzw. N2(p) zu vergleichen, da diese verschiedene Dimensionen besitzen. Die Nachfrageelastizitäten εN1(p) und εN2 (p) sind jedoch für einen solchen Vergleich geeigneter, da sie dimensionslose Größen darstellen. 484 Kapitel 1616.9 Änderungsraten und Elastizitäten Wie das folgende Beispiel zeigt, können mit Hilfe des Satzes 16.46 und der Folgerung 16.47 wichtige wirtschaftswissenschaftliche Gesetzmäßigkeiten hergeleitet werden: Beispiel 16.48 (Amoroso-Robinson-Gleichung) L. Amoroso Durch N : R+ −→ R, p %→ N(p) und U : R+ −→ R, p %→ U(p) mit U(p) = pN(p) seien die preisabhängige Nachfrage- bzw. Umsatzfunktion für ein bestimmtes Wirtschaftsgut gegeben. Setzt man P(p) :=p für alle p∈R+, dann gilt der Zusammenhang U(p) = P(p)N(p) und die Änderungsrate sowie die Elastizität der reellen Funktion P sind gegeben durch ρP (p) = P ′(p) P (p) = 1 p bzw. εP (p) = pρP (p) = 1. Für die Änderungsrate und die Elastizität der Umsatzfunktion erhält man somit ρU(p) = ρPN(p) = ρP (p)+ ρN(p) = 1 p + ρN(p) bzw. εU (p) = εPN(p) = εP (p)+ εN(p) = 1 + εN(p). Es sei nun angenommen, dass die Nachfragefunktion N streng monoton ist und sie damit insbesondere eine Umkehrfunktion N−1 : N(R) −→ R+, x %→ N−1(x) besitzt. Die mengenabhängige Umsatzfunktion ist dann gegeben durch Ũ : R+ −→ R, x %→ Ũ (x) mit Ũ (x) = xN−1(x). Setzt man X(x) := x für alle x ∈ R+, dann erhält man für die mengenabhängige Umsatzfunktion die Änderungsrate ρŨ (x) = ρXN−1(x) = ρX(x)+ ρN−1(x) = 1 x +ρN−1(x). Mit Folgerung 16.47g) erhält man für die Elastizität εŨ (x) = εXN−1(x) = εX(x)+ εN−1(x) = 1 + εN−1(x) = 1 + 1 εN ( N−1(x) ) . Zusammen mit εŨ (x)= x Ũ ′(x)Ũ(x) erhält man daraus die in der Mikroökonomie populäre Amoroso-Robinson-Gleichung Ũ ′(x) = Ũ (x) x ( 1+ 1 εN ( N−1(x) ) ) =N−1(x) ( 1+ 1 εN ( N−1(x) ) ) . J. V. Robinson Diese Gleichung ist nach dem italienischen Mathematiker und Wirtschaftswissenschaftler Luigi Amoroso (1886– 1965) und der britischen Ökonomin Joan Violet Robinson (1903–1983) benannt. Die Amoroso-Robinson- Gleichung beschreibt die Beziehung zwischen dem mengenabhängigen Grenzumsatz Ũ ′(x), der Absatzmenge x (bzw. dem Preis p = N−1(x)) und der Nachfrageelastizität εN . Beispiel 16.49 (Preiselastizität und Faktornachfrageelastizität) a) Es sei P : R+−→R, x %→ P(x) und K : R+−→R, x %→ K(x) die mengenabhängige Preis- bzw. Kostenfunktion für das Produkt eines Monopolisten. Der Gewinn des Monopolisten in Abhängigkeit von der Produktionsmenge x beträgt dann G(x) = P(x)x −K(x) und die notwendige Bedingung für eine gewinnmaximale Produktionsmenge x0 > 0 lautet G′(x0) = P ′(x0)x0 + P(x0)−K ′(x0) = 0 bzw. für die Elastizität εP (x0) = x0 P ′(x0) P (x0) = K ′(x0) P (x0) − 1 (vgl. Satz 16.24). Gilt nun K ′(x) = 0, wie dies z. B. näherungsweise für Telekommunikationsunternehmen erfüllt ist, da in der Telekommunikationsbranche die anfallenden Kosten vor allem Fixkosten sind, dann erhält man im Gewinnmaximum εP (x0) = −1. 485 Kapitel 16 Differenzierbare Funktionen Dies bedeutet, dass eine 1%-ige Erhöhung des Output (ungefähr) eine 1%-ige Verringerung des Preises zur Folge hat. b) Es sei N : R+ −→ R, p %→ N(p) die preisabhängige Nachfragefunktion eines Wirtschaftsgutes, zu dessen Produktion pro Stück b Einheiten eines bestimmten Produktionsfaktors A zum Preis π benötigt werden. Sind durch a alle übrigen Kosten gegeben, dann beträgt der Preis des Wirtschaftsgutes in Abhängigkeit vom Faktorpreis π p(π) = a + bπ. Wenn nun N(p) Einheiten des Wirtschaftsgutes produziert werden, dann besteht zwischen N(p) und der preisabhängigen Faktornachfrage NA(π) nach dem Produktionsfaktor A die Beziehung NA(π) = bN(p) = bN (p(π)) . Für die Elastizität εNA(π) der Faktornachfrage NA(π) bzgl. π erhält man mit Folgerung 16.47d) und f) sowie Beispiel 16.45b) εNA(π) = εN◦p(π) = εN (p(π)) εp(π) = εN (p(π)) bπ a + bπ . Das heißt, die Elastizität der Faktornachfrage NA(π) bzgl. des Faktorpreises π ist betragsmäßig umso grö- ßer, je größer der Kostenanteil bπ a+bπ dieses Produktionsfaktors am Produktpreis p = a + bπ ist. 486

Chapter Preview

References

Zusammenfassung

"uneingeschränkt zu empfehlen, [...] insbesondere als Einstiegslektüre im Bachelor-Studium". In: Studium, 2013.

So zentral die Rolle der Mathematik in der Ökonomie ist, so schwer tun sich die Studierenden mit mathematischen Methoden und Konzepten. Umso wichtiger ist es, die Studierenden bei ihrem aktuellen Wissensstand abzuholen und vorsichtig an den Stoff heranzuführen. Diesem Ziel verschreibt sich dieses Lehrbuch. Es führt mit vielen interessanten Beispielen aus der Ökonomie, kurzen Anekdoten und einem modernen mehrfarbigen Design in die zentralen mathematischen Methoden für ein erfolgreiches Wirtschaftsstudium ein, ohne dabei auf mathematische Klarheit sowie die notwendige Formalität und Stringenz zu verzichten. Auch nach dem Studium ist dieses Buch ein wertvoller Begleiter bei der mathematischen Lösung wirtschaftswissenschaftlicher Problemstellungen.

Aus dem Inhalt:

* Mathematische Grundlagen

* Lineare Algebra

* Matrizentheorie

* Folgen und Reihen

* Reellwertige Funktionen in einer und mehreren Variablen

* Differential- und Integralrechnung

* Optimierung mit und ohne Nebenbedingungen

* Numerische Verfahren

Dozenten finden auf der Website zum Buch unter www.vahlen.de zusätzliche Materialien zum Download.

"Indem Sie den Lehrstoff schrittweise aufbereiten und den Leser bei seinem aktuellen Wissenstand abholen, gelingt es ihnen [den Autoren], auch komplexe Zusammenhänge leicht nachvollziehbar zu vermitteln. Geschickt bauen sie immer wieder kurze Anekdoten, historische Ereignisse und überraschende Erkenntnisse in den Text ein". In: Studium, 2013.

Prof. Dr. Michael Merz ist Inhaber des Lehrstuhls für Mathematik und Statistik in den Wirtschaftswissenschaften an der Universität Hamburg. Prof. Dr. Mario V. Wüthrich forscht und lehrt am Department für Mathematik der ETH Zürich.