Mathematik für die Biophysik I/II Vorlesungsskript PDF
Document Details
Uploaded by ClearedDahlia
Goethe-Universität Frankfurt
2024
Eberhard Engel
Tags
Summary
This document is lecture notes for mathematics for biophysics. It covers fundamental concepts in mathematics, including sets, functions, complex numbers, vector spaces, linear algebra, and calculus in multiple dimensions. Last revision date is August 5, 2024.
Full Transcript
MATHEMATIK FÜR DIE BIOPHYSIK I/II Eberhard Engel Center for Scientific Computing, J.W.Goethe-Universität Frankfurt, Max-von-Laue-Straße 1, D-60438 Frankfurt/Main, Germany Letzte Überarbeitung: 5. August 2024 Inhaltsverzeichnis 1 Grundbegriffe, Notation...
MATHEMATIK FÜR DIE BIOPHYSIK I/II Eberhard Engel Center for Scientific Computing, J.W.Goethe-Universität Frankfurt, Max-von-Laue-Straße 1, D-60438 Frankfurt/Main, Germany Letzte Überarbeitung: 5. August 2024 Inhaltsverzeichnis 1 Grundbegriffe, Notation 1 1.1 Mengen...................................... 1 1.2 Abbildungen.................................... 14 1.3 Summenformeln, vollständige Induktion..................... 19 1.4 Elementare Kombinatorik, binomische Formel................. 22 1.5 Rechtwinkliges Dreieck, Additionstheoreme................... 26 2 Funktionen einer Veränderlichen 33 2.1 Reihen....................................... 35 2.1.1 Geometrische Reihe............................ 36 2.1.2 Exponentialfunktion........................... 39 2.1.3 Klassifikation von Reihen........................ 39 2.1.4 Konvergenz von Reihen.......................... 40 2.1.5 Produkte von Reihen........................... 45 2.1.6 Eigenschaften der Exponentialfunktion................. 47 2.2 Stetigkeit, Grenzwerte, Umkehrfunktion.................... 51 2.2.1 Stetigkeit................................. 52 2.2.2 Grenzwerte................................ 58 2.2.3 Umkehrfunktion, Logarithmus...................... 63 2.3 Differentialrechnung............................... 67 2.3.1 Ableitung................................. 68 2.3.2 Rechenregeln für die Differentiation................... 71 2.3.3 Differentiale................................ 75 i 2.3.4 Höhere Ableitung............................. 77 2.3.5 Grenzwerte von Produkten und Quotienten von Funktionen..... 78 2.4 Taylorentwicklung................................. 81 2.4.1 Satz von Taylor.............................. 81 2.4.2 Taylorreihen................................ 85 2.5 Integralrechnung................................. 87 2.5.1 Riemann-Integral............................. 88 2.5.2 Unbestimmtes Integral.......................... 98 2.5.3 Integrationsmethoden........................... 99 2.5.4 Uneigentliche Integrale.......................... 105 3 Komplexe Zahlen 112 3.1 Elementare Definitionen............................. 113 3.1.1 Grundbegriffe............................... 113 3.1.2 Operationen mit komplexen Zahlen................... 117 3.1.3 Komplexe Zahlen als Erweiterung der reellen Zahlen: Eulersches i.. 123 3.1.4 Komplexe Konjugation.......................... 125 3.2 Elementare komplexe Reihen und Funktionen................. 128 3.2.1 Reihen komplexer Zahlen......................... 128 3.2.2 Exponentialfunktion........................... 129 3.2.3 Sinus, Kosinus............................... 131 3.2.4 Komplexwertige Funktionen einer reellen Variablen.......... 132 3.3 Faktorisierung von Polynomen.......................... 134 3.3.1 Fundamentalsatz der Algebra, Polynomendivision........... 134 4 Vektorräume 137 4.1 Gruppen...................................... 138 4.2 Körper....................................... 144 4.3 Vektorräume.................................... 147 4.4 Unterräume, Basen................................ 156 4.5 Prähilberträume.................................. 165 4.5.1 Skalarprodukt............................... 167 ii 4.5.2 Norm................................... 176 4.5.3 Orthogonalität, Orthonormalsysteme.................. 179 4.5.4 Orthogonalisierung von Vektoren.................... 181 4.6 Lineare Abbildungen............................... 186 4.6.1 Motivation: Koordinatentransformationen............... 186 4.6.2 Definition und elementare Eigenschaften................ 189 4.6.3 Fouriertransformation.......................... 198 5 Lineare Algebra 205 5.1 Matrizen...................................... 206 5.1.1 Grundkonzept............................... 208 5.1.2 Matrizen als Realisierungen linearer Abbildungen........... 212 5.1.3 Grundbegriffe und elementare Operationen: (A) Beliebige m × n- Matrizen.................................. 214 5.1.4 Abbildungsmatrizen für bijektive lineare Abbildungen......... 220 5.1.5 Grundbegriffe und elementare Operationen: (B) Quadratische Matrizen223 5.2 Determinanten.................................. 230 5.2.1 Motivation................................. 231 5.2.2 Definition und Grundbegriffe...................... 232 5.2.3 Definierende Eigenschaften........................ 238 5.2.4 Multiplikationstheorem.......................... 242 5.2.5 Determinantenentwicklungssatz..................... 242 5.3 Lineare Gleichungen............................... 245 5.4 Eigenwertproblem................................. 249 5.4.1 Grundlagen, charakteristisches Polynom................ 250 5.4.2 Praktische Lösung des Eigenwertproblems............... 252 5.4.3 Aussagen zu Eigenwerten und -vektoren................ 255 5.5 Definitheit von Matrizen............................. 260 6 Grundlagen der Differential- und Integralrechnung im Rn 263 6.1 Mengen im Rn , Teil 1............................... 264 6.2 Funktionen im Rn : Stetigkeit, Grenzwerte................... 278 iii 6.2.1 Funktionen im Rn............................. 279 6.2.2 Stetigkeit, Grenzwerte.......................... 286 6.3 Kurven....................................... 293 6.3.1 Vektorwertige Funktionen einer Veränderlichen............. 294 6.3.2 Kurven................................... 296 6.3.3 Differentiation............................... 299 6.3.4 Tangentenvektor an Kurven....................... 300 6.4 Mengen im Rn , Teil 2............................... 302 7 Differentialrechnung im Rn 305 7.1 Partielle Ableitung................................ 306 7.2 (Totales) Differential, Kettenregel........................ 311 7.3 Gradient, Divergenz, Rotation.......................... 317 7.3.1 Gradient.................................. 317 7.3.2 Divergenz................................. 321 7.3.3 Rotation.................................. 322 7.3.4 Identitäten für Gradient, Divergenz und Rotation........... 323 7.4 Taylorentwicklung................................. 324 7.5 Lokale Extrema.................................. 327 7.5.1 Extrema ohne Nebenbedingungen.................... 328 7.5.2 Extrema mit Nebenbedingungen..................... 338 8 Integralrechnung im Rn 342 8.1 Kurvenintegrale.................................. 343 8.1.1 Länge von Kurven............................ 344 8.1.2 Kurvenintegral.............................. 349 8.1.3 Wegunabhängigkeit des Kurvenintegrals................ 354 8.2 Mehrfachintegration............................... 358 8.2.1 Motivation................................. 360 8.2.2 Mehrfachintegrale auf Intervallen des Rm................ 362 8.2.3 Lebesgue-Integrabilitätskriterium.................... 370 8.2.4 Praktische Berechnung von Mehrfachintegralen............ 373 iv 8.2.5 Integration über Jordan-messbare Mengen............... 375 8.2.6 Normalbereiche.............................. 379 8.2.7 Substitutionsregel: Koordinatentransformation............. 384 8.3 Oberflächenintegrale im R3............................ 396 8.3.1 Flächen im R3............................... 397 8.3.2 Geometrische Basis und Definition des Oberflächenintegrals..... 402 8.4 Integralsätze.................................... 409 8.4.1 Satz von Stokes.............................. 410 8.4.2 Satz von Gauß.............................. 420 A Kartesische Koordinaten 429 B Vektorprodukt, Levi-Civita Symbol, Spatprodukt 432 Index 436 v Kapitel 1 Grundbegriffe, Notation Beginn Vorlesung 1 Zur Vorbereitung des Rests der Vorlesung soll in diesem Kapitel zunächst einmal an eini- ge grundlegende Begriffe der Mathematik erinnert werden. Sie werden sie vermutlich fast alle aus der Schule kennen, nur vielleicht nicht in genau dieser Schreib- bzw. Sprechweise. Dementsprechend dient dieser Abschnitt auch ganz wesentlich dazu, die im Weiteren ver- wendete Notation und Sprache einzuführen. Eine Zusammenfassung des Inhalts dieses ersten Kapitels unterbleibt, weil praktisch jeder Aspekt des Inhalts in ihr auftreten müsste. 1.1 Mengen Wir beginnen mit dem Begriff der Menge. Definition 1.1: Die Zusammenfassung eines Satzes wohlbestimmter und wohlunterschiede- ner Objekte unserer Anschauung oder unseres Denkens zu einem Ganzen bezeichnet man als Menge (naiver Grundbegriff nach Cantor), die darin zusammengefassten Objekte werden Elemente der Menge genannt. Bemerkungen: Kein Element kann in einer Menge mehrfach vorkommen: Per Definition sind die Ele- mente wohlunterschieden. In einer Menge gibt es per se erst einmal keinerlei Anordnung der Elemente. 1 KAPITEL 1. GRUNDBEGRIFFE, NOTATION 2 Nicht nur Mengen von Zahlen sind im Weiteren von Bedeutung, sondern auch solche von ganzen Zahlengruppen, Funktionen bzw. allgemeiner Operationen und sogar von Mengen. Notation und elementare Begriffe: (i) Abgesehen von den gleich noch aufgeführten Standard-Zahlenmengen der Mathematik werden in diesem Text Mengen unabhängig vom Charakter ihrer Elemente immer mit Großbuchstaben in geschwungener Form notiert, etwa M oder U. Das ist aber keine allgemein gültige Schreibweise! (ii) Die Schreibweise der Elemente von Mengen hängt von ihrem Charakter ab. Falls Aus- sagen unabhängig vom Charakter der Elemente gemacht werden sollen, wird in diesem Text schlicht ein nicht weiter modifizierter Buchstabe wie x oder a verwendet. (iii) Die Zugehörigkeit eines Elements x zu einer Menge M wird durch das “Element-von” Symbol ∈ beschrieben: x∈M ≡ x ist Element von M Entsprechend schließt ∈ / die Zugehörigkeit aus: x∈ /M ≡ x ist nicht Element von M (iv) Falls zwei Mengen M1 und M2 exakt die gleichen Elemente enthalten, drückt man das durch ein Gleichheitszeichen aus: M1 = M2 ≡ M1 besteht aus exakt denselben Elementen wie M2 (v) Mengen können auf drei Weisen definiert werden. (a) In der aufzählenden Charakterisierung M := {x, y, z,...} werden die Elemente explizit einzeln zwischen den die Mengendefinition begrenzenden Mengenklammern { und } aufgelistet. Eine vollständige Aufzählung aller Elemente ist dabei nur bei Mengen mit endlich vielen Elementen möglich. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 3 Notation: Das Zeichen := bedeutet dabei, dass die Größe auf der Seite des Doppel- punkts durch den mathematischen Ausdruck auf der anderen Seite definiert ist. Beide Seiten in dieser Relation sind identisch, aber nur deswegen, weil die eine durch die andere erklärt wird. (b) In der beschreibenden Charakterisierung M := {x | x hat die Eigenschaft(en)...} werden die Elemente über ihre Eigenschaften sowie ihre Zugehörigkeit zu anderen Mengen definiert. Dabei können im Prinzip beliebig viele Eigenschaften gefordert sein. Die beschreibende Charakterisierung kann auch die Form M := {O(x, y,...) | x, y... haben die Eigenschaft(en)...} annehmen, in der die Elemente der Menge über eine Operation O(x, y,...) aus den Elementen x, y,... anderer Mengen gewonnen werden. Beispiele für beide Formen der beschreibenden Charakterisierung folgen gleich noch. (c) Manchmal ist es einfacher, Mengen durch die Herausnahme gewisser Elemente aus anderen Mengen zu definieren. Man schreibt dafür M3 := M1 \M2 , mit dem Verständnis, dass die Menge M3 alle Elemente von M1 enhält, die nicht in M2 sind. Dabei wird nicht vorausgesetzt, dass alle Elemente von M2 auch zu M1 gehören: Diejenigen Elemente von M2 , die nicht auch M1 angehören, bleiben in M1 \M2 einfach unberücksichtigt. Diese Beschreibung wird häufig verwendet, wenn nur einzelne Elemente aus M1 nicht M3 angehören sollen. Falls alle Elemente von M2 auch zu M1 gehören, bezeichnet man M1 \M2 als Komplement von M2 bezüglich der Gesamtmenge M1. (vi) Die Menge ohne jede Elemente, leere Menge genannt, wird mit dem Symbol ∅ cha- rakterisiert. (vii) Zwei Mengen M1 und M2 werden als disjunkt bezeichnet, falls M1 und M2 kein Element gemeinsam haben. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 4 Beispiele 1.1.1: In Mathematik und Physik sind insbesondere folgende Mengen relevant: (1) Die Menge der natürlichen, d.h. der positiven ganzen, Zahlen: N := {1, 2, 3,...} (1.1.1) Hier wurde die aufzählende Charakterisierung gewählt, obwohl die Menge unendlich viele Elemente besitzt. Man gibt in so einem Fall die ersten Elemente an, bis un- missverständlich klar ist, wie die weiteren Elemente aussehen. Dass noch beliebig viele weitere Elemente folgen, wird in der Schreibweise (1.1.1) durch die Punkte... ange- deutet. Etwas formaler könnte man N als diejenige Zahlenmenge definieren, die die Zahl 1 enthält und alle Zahlen, die sich durch beliebig häufige Addition von 1 zur Zahl 1 ergeben, wobei dann aber faktisch gleichzeitig das Verständnis von “Addition von 1” festgelegt werden muss.1 Die Menge N besteht also aus unendlich vielen Elementen. Diese sind aber per Definition der Menge abzählbar, weswegen man von abzählbar unendlich vielen oder, kürzer, von abzählbar vielen Elementen spricht. Nicht selten wird in der Menge N auch die Null eingeschlossen, andere Autoren ver- wenden dafür die Notation N0 : N0 := {0, 1, 2, 3,...} (1.1.2) Wegen der uneinheitlichen Handhabung der Null sollte man sich stets aus dem Zusam- menhang heraus klar machen, ob sie gerade dazugehört, oder nicht. In diesem Text werden aber durchgängig die Definitionen (1.1.1) und (1.1.2) verwendet. (2) Die Menge der ganzen Zahlen: Z := {0, ±1, ±2,...} (1.1.3) Auch die Menge Z besteht aus abzählbar unendlich vielen Elementen: Man könnte, ausgehend vom 1. Element 0, jeweils zuerst die positive und dann die negative Zahl zählen: Das 2. Element wäre die 1, das 3. Element die −1, das 4. Element dann die 2, und so weiter. 1 In der Mathematik wird N deshalb häufig erst nach der Einführung der reellen Zahlen definiert. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 5 (3) Die Menge der rationalen Zahlen: m Q := m ∈ Z, n ∈ N (1.1.4) n Diese Definition ist ein Musterbeispiel für eine beschreibende Charakterisierung. Die oben angedeutete Operation O ist hier der Bruch m/n. Die Notation m ∈ Z, n ∈ N in der Beschreibung der Menge ist dann so zu verstehen, dass m eine beliebige Zahl aus Z und n eine beliebige Zahl aus N sein darf, d.h. Q enthält alle Brüche, die mit Zahlen aus Z im Zähler und Zahlen aus N im Nenner gebildet werden können. Dabei tritt jede aus m/n resultierende Zahl natürlich nur ein Mal in Q auf (man hat ja zum 2m m Beispiel 2n = n ). Auch die Menge Q hat abzählbar unendlich viele Elemente. Beweis: Zum Nachweis der Abzählbarkeit tragen wir alle Zahlenpaare (m, n) mit m ∈ Z und n ∈ N als Punkte in einem Schema auf: n 5 4 r9 3 r8 r5 2 r4 r3 r7 r6 1 r1 r2 -4 -3 -2 -1 0 1 2 3 4 m Jede rationale Zahl m/n wird im Schema durch mindestens einen Punkt repräsentiert. Für manche Punkte ergibt m/n zwar dieselbe Zahl, d.h. jede rationale Zahl tritt im Schema mehrfach auf, das beeinträchtigt die weitere Argumentation aber nicht. Der rot skizzierte Pfad zeigt dann, wie man alle Punkte des Schemas in abzählbarer Form, d.h. in einer geordneten Abfolge r1 , r2 , r3 ,... durchgehen kann: Jeder Punkt wird genau ein Mal angelaufen, kein Punkt wird ausgelassen. Da das Schema sogar mehr Punkte enthält als Q Elemente besitzt, ist die Menge Q abzählbar. (4) Die Menge der reellen Zahlen R. Ihre Definition über die Körper- und Anord- nungsaxiome sowie das Schnittaxiom ist durchaus involviert. Wir wollen die reellen KAPITEL 1. GRUNDBEGRIFFE, NOTATION 6 Zahlen hier als bekannt voraussetzen. Zusätzlich zu den rationalen Zahlen enthält R √ auch irrationale Zahlen wie die Kreiszahl π oder 2. Die Elemente der Menge R las- sen sich deswegen nicht mehr abzählen, man sagt, R besteht aus überabzählbar vielen Elementen. Für die irrationalen Zahlen gibt es kein eigenes Mengensymbol. Man schreibt sie viel- mehr stets als Komplement R\Q der Menge der rationalen Zahlen Q. (5) Die Menge der positiven reellen Zahlen einschließlich der Null: R+ 0 := {x | x ∈ R und x ≥ 0} ≡ {x ∈ R | x ≥ 0} (1.1.5) Auch die Notation dieser Menge wird nicht ganz einheitlich gehandhabt. (6) Die Menge der komplexen Zahlen C wird in Abschnitt 3 im Detail eingeführt. Sie besteht aus Paaren reeller Zahlen und besitzt deswegen überabzählbar viele Elemente. (7) Die Menge Rn von n-Tupeln reeller Zahlen, d.h. von geordneten Sätzen von n reellen Zahlen, wird in Abschnitt 4 im Detail eingeführt. Für den Moment kann man sich ein n-Tupel als einen Satz von n in irgendeiner Weise zusammengehörenden reellen Zahlen a, b,... , z vorstellen, den man in der Form (a, b,... , z) notiert (die Schreibweise, dass nach ersten Elementen a und b zunächst die Punkte... folgen, dann aber noch ein abschließendes Element z ist die Standardnotation für Sätze von endlich vielen Objekten). In dieser Notation ist die Menge Rn dann Rn := {(a, b,... , z ) | a, b,... , z ∈ R}. (1.1.6) | {z } n Zahlen Die Menge Rn kann man als Spezialfall des folgenden allgemeineren Konzepts verstehen: Definition 1.2: Unter dem kartesischen Produkt der Mengen M1 und M2 , geschrie- ben M1 × M2 , versteht man die Menge aller geordneten Paare von Elementen aus M1 und M2 : n o M1 × M2 := (a, b) a ∈ M1 , b ∈ M2 (1.1.7) Das kartesische Produkt lässt sich natürlich auch mehrfach hintereinander bilden, M1 × M2 × M3 = (M1 × M2 ) × M3 = M1 × (M2 × M3 ). KAPITEL 1. GRUNDBEGRIFFE, NOTATION 7 Also gilt R2 = R × R und Rn = R | ×R× {z · · · × R}. n-mal Das kartesische Produkt M1 × M2 zweier abzählbarer Mengen M1 und M2 ist seinerseits abzählbar. Wenn aber M1 ×M2 eine abzählbare Menge ist und M3 ebenso, dann ist auch das kartesische Produkt (M1 ×M2 )×M3 eine abzählbare Menge. Diese Argumentation lässt sich offensichtlich bei Hinzunahme jeder weiteren abzählbaren Menge immer wieder verwenden, weswegen beliebige kartesische Produkte von abzählbaren Mengen ebenso abzählbar sind. Dementsprechend sind Mengen wie Q3 = Q × Q × Q abzählbar. Sobald aber eine der am kartesischen Produkt beteiligten Mengen überabzählbar ist, gilt dies auch für das kartesische Produkt als Ganzes. Konventionen für die Notation von Elementen der elementaren Mengen: Das Lesen mathematischer Texte vereinfacht sich deutlich, wenn bestimmte Information bereits über die Schreibweise von Größen aller Art transportiert wird. (i) Ganze und natürliche Zahlen werden üblicherweise mit den Buchstaben i, j, k, l, m, n dargestellt. Dabei überwiegt die Kleinschreibung, aber auch I, J, K, L, M, N symbo- lisieren in aller Regel ganze oder natürliche Zahlen. Diese Buchstaben sind deswegen im Großen und Ganzen für diese Zahlen reserviert und werden nicht für Zahlen aus Q, R oder C verwendet. Davon gibt es aber einige prominente Ausnahmen, etwa das Euler’sche i, das in Abschnitt 3.1.3 eingeführt wird. In mathematischen Texten wer- den gelegentlich auch die griechischen Buchstaben α, β, γ,... für ganze und natürliche Zahlen eingesetzt, insbesondere, wenn eine optische Abgrenzung zwischen zwei Klassen von ganzen Zahlen bewirkt werden soll. (ii) Für die Schreibweise von reellen Zahlen gibt es keine ähnlich weit verbreitete Kon- vention. Gerne werden aber die Buchstaben x, y, z oder a, b, c,... verwendet. Auch α, β, γ,... können reelle Zahlen sein (in diesem Text sind sie es praktisch immer), δ und ϵ werden es sogar fast immer sein. (iii) Komplexe Zahlen werden häufig mit z oder auch u, v, w bezeichnet. Sie sind aber im Allgemeinen nicht über die Symbolik von den reellen Zahlen zu unterscheiden. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 8 (iv) Die n-Tupel aus dem Rn werden im Weiteren in fettgedruckter Form geschrieben, r, v,.... Dabei wird nicht zwischen verschiedenen n unterschieden. Auch für sie gibt es aber durchaus andere gebräuchliche Schreibweisen, etwa den Unterstrich r oder das Vektorsymbol ⃗r. Diese Konventionen für die Notation werden im aktuellen Text weitestgehend eingehalten. Sie sind aber keine allgemein gültigen Regeln! Notation: Wenn man einen Satz von Elementen in irgendeinem Sinn als zusammengehörig charakterisieren will, etwa die n Zahlen in einem n-Tupel aus dem Rn oder die Glieder von Summen (siehe unten), arbeitet man mit einem Index. Indices an Elementen werden in der Regel rechts unten angeheftet, etwa xi (i ist hier entsprechend der obigen Konvention als ganze Zahl zu verstehen). In manchen Situationen ist auch eine Indizierung in der Form x(i) üblich. Eine Indizierung in der Form xi sollte aber vermieden werden, weil die Gefahr einer Verwechslung mit einer Potenz besteht. Ein n-Tupel reeller Zahlen würde man entsprechend in der Form (x1 ,... , xn ) aufschreiben. In der Literatur hat die Definition der Menge Rn daher in der Regel die Form Rn := {(x1 ,... , xn ) | xi ∈ R; i = 1,... , n}. (1.1.8) Auch Indices mit nicht-ganzzahligen Werten treten manchmal auf. Veranschaulichung von Mengen: Mengen werden oft durch Diagramme veranschau- licht. Solange es sich um nicht näher bekannte Mengen handelt, charakterisiert man sie durch eine mehr oder weniger verbeulte geschlossene Linie: M Das Verständnis dabei ist, dass alles im Inneren der geschlossenen Linie zu M gehört, alles außerhalb nicht, wobei die Elemente innnerhalb und außerhalb der Menge meist graphisch nicht in Erscheinung treten. Diese Visualisierung schließt sowohl den Fall von diskreten Elementen (Äpfel im Korb und außerhalb) ein, als auch den von kontinuierlich ineinander KAPITEL 1. GRUNDBEGRIFFE, NOTATION 9 übergehenden Elementen (reelle Zahlen). Sie ist in einem wichtigen Fall sogar ziemlich voll- ständig, nämlich wenn M eine räumlich begrenzte Menge von Punkten der Ebene (d.h. des R2 ) ist, etwa ein Kreis: x2 M a r@ R @ @ x1 Dann bleibt lediglich klarzustellen, ob die Punkte auf dem Rand der eingeschlossenen Flä- che zu M gehören, oder nicht. Die reellen Zahlen zwischen a und b mit a < b werden entsprechend als Abschnitt auf einer reellen Zahlengeraden (Achse) angedeutet: - a b Der Charakter der Randpunkte a, b bleibt aber erneut noch zu spezifizieren, er ist dem Diagramm nicht ohne Weiteres zu entnehmen. Elementare Verknüpfungen von Mengen: (i) Die Menge M, die sowohl die Elemente der Menge M1 als auch die von M2 enthält, aber keine weiteren Elemente, wird als Vereinigung von M1 und M2 bezeichnet: M = M1 ∪ M2 ≡ M ist Vereinigung von M1 und M2 Elemente, die sowohl M1 als auch M2 angehören, treten dabei entsprechend dem Grundkonzept von Mengen in der Vereinigung nur ein Mal auf!2 Zur Vereinigung gehören also in der nachfolgenden Visualisierung, bei der die Mengen durch die beiden geschlossenen Linien charakterisiert werden, alle Punkte innerhalb des grauen Bereichs genau ein Mal: 2 Die Reihenfolge von Mengen spielt bei ihrer Vereinigung per Konstruktion keine Rolle. Entsprechend gilt für die Vereinigung mehrerer Mengen M1 ∪ (M2 ∪ M3 ) = (M1 ∪ M2 ) ∪ M3 = M1 ∪ M2 ∪ M3. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 10 M1 M2 M1 ∪ M 2 (ii) Die Menge M, die genau nur diejenigen Elemente enthält, die sowohl der Menge M1 als auch der Menge M2 angehören, wird als Schnittmenge von M1 und M2 bezeichnet:3 M = M1 ∩ M 2 ≡ M ist Schnittmenge von M1 und M2 Im nachfolgenden Bild ist die Schnittmenge gerade der grau hinterlegte Überlappbe- reich der beiden Mengen: M1 M1 ∩ M 2 M2 Beispiele 1.1.2: (1) Die Vereinigung der Mengen M1 = {1, 2, 3} und M2 = {2, 3, 4} ist die Menge M1 ∪ M2 = {1, 2, 3, 4}. (2) Die Schnittmenge der Mengen M1 = {1, 2, 3} und M2 = {2, 3, 4} ist die Menge M1 ∩ M2 = {2, 3}. Aufteilung von Mengen: Häufig müssen Aussagen über die Zugehörigkeit der Elemente einer Menge zu einer zweiten getroffen werden oder es sollen bewusst nur bestimmte Teile einer Menge angesprochen werden. Der zentrale Begriff dazu ist die Teilmenge: Definition 1.3: Eine Menge M1 heißt Teilmenge (oder Untermenge) der Menge M2 , geschrieben M1 ⊂ M2 , falls jedes Element x aus M1 auch Element von M2 ist. 3 Die Reihenfolge von Mengen spielt bei der Schnittmengenbildung keine Rolle, M1 ∩ (M2 ∩ M3 ) = (M1 ∩ M2 ) ∩ M3 = M1 ∩ M2 ∩ M3. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 11 Bemerkung: Diese Definition schließt nicht aus, dass beide Mengen exakt die gleichen Elemente enthalten. Wenn man diesen Aspekt betonen will, schreibt man auch M1 ⊆ M2. Beispiele 1.1.3: (1) Die bekannten Inklusionen zwischen den elementaren Zahlenmengen sind: N ⊂ Z ⊂ Q ⊂ R (2) Die Menge aller reellen Zahlen zwischen zwei Grenzen a und b, Intervalle genannt, sind Teilmengen von R. Notation: Während Mengen — wie angedeutet — im Allgemeinen über geschweifte Klam- mern charakterisiert werden, wird für die sehr häufig auftretenden Intervalle aus R eine kompaktere Notation verwendet: n o [a, b] := x x ∈ R, a ≤ x ≤ b (1.1.9a) n o (a, b] := x x ∈ R, a < x ≤ b (1.1.9b) n o [a, b) := x x ∈ R, a ≤ x < b (1.1.9c) n o (a, b) := x x ∈ R, a < x < b (1.1.9d) (mit reellen Zahlen a, b). Dabei wird in diesem Text, anders als gelegentlich in der mathe- matischen Literatur, stets eine mindestens endliche Ausdehnung der Intervalle angenommen (a < b), d.h. Intervalle [a, b] aus nur dem einen Punkt a = b werden ausgeschlossen. Das Intervall [a, b] bezeichnen wir im Weiteren als abgeschlossen, (a, b) als offen, (a, b] und [a, b) als halboffen. An dieser Stelle genügt es, die Begriffe abgeschlossen und offen mit der Zu- gehörigkeit der Intervallgrenzen zum Intervall zu assoziieren. In Abschnitt 6.1 werden wir dann die tiefere mathematische Bedeutung dieser Begriffe kennenlernen. Die (halb)offenen Intervalle werden manchmal auch in der Form (a, b) ≡ ]a, b[ notiert. Abgeschlossene Intervalle [a, b] setzen stets endliche Grenzen a und b voraus. Auf der an- deren Seite können sich (halb)offene Intervalle in vielen Situationen durchaus bis unendlich erstrecken, d.h. [a, b) steht häufig auch für das sogenannte uneigentliche Intervall [a, ∞). Das Symbol ∞ bedeutet dabei “beliebig groß” (und positiv), d.h. größer als jede beliebige Zahl aus R, und damit “unendlich”. Präziser: Es gilt −∞ < x < ∞ für jedes beliebige gegebene x ∈ R. (1.1.10) KAPITEL 1. GRUNDBEGRIFFE, NOTATION 12 Das uneigentliche Intervall [a, ∞) steht dementsprechend für die Menge aller reellen Zahlen größer oder gleich a. Notation: Wie im Fall der Multiplikation und den Anordnungsrelationen reeller Zahlen erfolgt bei Mengen die Verküpfung durch Vereinigung oder Schnittmengenbildung stets vor dem Vergleich von Mengen. Die Aussage M1 ⊂ (M1 ∪ M2 ) zum Beispiel schreibt man daher häufig einfach in der Form M1 ⊂ M1 ∪ M2. Wenn alle Elemente von M1 auch M2 angehören und alle Elemente von M2 auch Elemente von M3 sind, dann folgt M1 ⊂ M3. Solche Aussagen kann man mit dem =⇒-Symbol kompakter ausdrücken: A =⇒ B bedeutet, dass aus der Aussage A die Aussage B folgt: M1 ⊂ M2 und M2 ⊂ M3 =⇒ M1 ⊂ M3 Die Teilmengen-Definition könnte man mit dem ∀-Symbol, das mit “für alle” zu über- setzen ist, und dem ⇐⇒-Symbol, das mit “genau dann, wenn” (oder, äquivalent dazu, mit “dann und nur dann”) zu übersetzen ist, sehr kompakt schreiben: M1 ⊂ M2 ⇐⇒ x ∈ M2 ∀ x ∈ M1 Den kausalen Zusammenhang zwischen zwei Aussagen fasst man verbal auch folgender- maßen: Man bezeichnet eine Aussage bzw. Bedingung A als hinreichend für die Aus- sage B, wenn aus dem Vorliegen von A auch das von B folgt. Entsprechend heißt eine Aussage bzw. Bedingung A notwendig für die Aussage B, wenn aus dem Vorliegen von B auch das von A folgt. Im vorangegangenen Beispiel ist also die Aussage “M1 ⊂ M2 und M2 ⊂ M3 ” eine hinreichende Bedingung für die Aussage “M1 ⊂ M3 ”, sie ist aber keine notwendige Bedingung. Mengen reeller Zahlen: Die Anordnungseigenschaft reeller Zahlen erlaubt die Einfüh- rung einer Reihe weiterer Begriffe für Mengen reeller Zahlen. An dieser Stelle beschränken wir uns dabei auf den zentralen Begriff der Beschränktheit: KAPITEL 1. GRUNDBEGRIFFE, NOTATION 13 Definition 1.4: Eine Menge M ⊂ R heißt nach oben bzw. nach unten beschränkt, falls eine Schranke S ∈ R existiert, so dass x≤S bzw. x≥S für alle x ∈ M gilt. Die Menge M heißt beschränkt, falls sie sowohl nach oben als auch nach unten be- schränkt ist. Damit eng verknüpft sind die Begriffe der engsten Schranken von beschränkten Mengen: Definition 1.5: Falls eine Menge M ⊂ R nach oben beschränkt ist, bezeichnet man die kleinste Schranke S, für die x ≤ S für alle x ∈ M gilt, als Supremum von M, geschrieben S = sup {x} ≡ sup{x | x ∈ M} ≡ sup{M}. x∈M Falls eine Menge M nach unten beschränkt ist, nennt man die größte Schranke S, für die x ≥ S für alle x ∈ M gilt, das Infimum von M: S = inf {x} ≡ inf{x | x ∈ M} ≡ inf{M} x∈M Falls das Supremum selbst zu den Werten von M gehört, nennt man es auch Maximum der Menge, analog nennt man ein Infimum mit inf{M} ∈ M Minimum von M. Das Supremum ist also die kleinste obere Schranke einer Menge, das Infimum die größte untere Schranke (unter Berücksichtigung des Vorzeichens). Beispiele 1.1.4: (1) Das Interval [0, 1) ist erkennbar beschränkt: Es gilt −1 ≤ x und x ≤ 1 für alle x ∈ [0, 1). Das Infimum von [0, 1) ist gerade die 0, da alle Zahlen kleiner als 0 nicht zum Intervall gehören, die 0 aber schon. Sie ist deswegen auch das Minimum der Menge. Auf der anderen Seite ist die Zahl 1 das Supremum der Menge, weil per Definition des Intervalls x < 1 für alle x ∈ [0, 1) gilt und gleichzeitig alle Zahlen größer oder gleich 1 nicht mehr zu [0, 1) gehören. Wegen 1 ∈ / [0, 1) ist die 1 aber nicht das Maximum der Menge: Die Menge besitzt kein Maximum. (2) Das uneigentliche Intervall [0, ∞) ist zwar nach unten, nicht aber nach oben be- schränkt. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 14 Ende Vorlesung 1 Beginn Vorlesung 2 1.2 Abbildungen Definition 1.6: Eine Vorschrift A, die jedem Element x ∈ M1 eindeutig ein Element y ∈ M2 zuordnet, heißt Abbildung von M1 in (oder nach) M2 , geschrieben A : M1 → M2. Dabei nennt man M1 die Definitionsmenge oder den Definitionsbereich von A, M2 die Zielmenge und n o A(M1 ) := A(x) x ∈ M1 ⊂ M2 die Bildmenge oder den Wertebereich von A. Bemerkung: Die Mengen M1 und M2 werden in dieser Definition naturgemäß als nicht- leer impliziert. Veranschaulichung von Abbildungen: Zur Veranschaulichung nicht weiter spezifizier- ter Abbildungen werden in der Regel der Definitions- und der Wertebereich als abgegrenzte Flächen der Ebene nebeneinander gezeichnet und dann einzelne Punkte in den Flächen, d.h. einzelne Elemente, mit Pfeilen miteinander verbunden: M1 A M2 A(x) x A(M1 ) Das offensichtlichste Beispiel für Abbildungen sind die gewöhnlichen reellen Funktionen einer reellen Veränderlichen. Aufgrund ihrer Bedeutung für alles Weitere konkretisieren wir die Definition 1.6 noch einmal für sie: Definition 1.7: Unter einer reellwertigen Funktion f (x) versteht man eine Abbildung aus einer (nicht-leeren) Teilmenge D der reellen Zahlen auf die reellen Zahlen, f : D → R, KAPITEL 1. GRUNDBEGRIFFE, NOTATION 15 d.h. eine Vorschrift, die allen x ∈ D eindeutig einen Wert f (x) ∈ R zuweist. D nennt man den Definitionsbereich der Funktion, die Menge f (D) = {f (x) | x ∈ D} den Bild- oder Wertebereich der Funktion. Notation: In der Literatur wird für Funktionen gelegentlich auch die Notation y(x) verwendet, wir werden hier aber fast immer mit f (x) arbeiten. In der Mathematik werden Funktionen oft in der Form D→R f : D → R, x 7→ f (x) oder f: , (1.2.1) x 7→ f (x) notiert, wobei f (x) für die konkrete Abbildungsvorschrift steht. Zum Beispiel würde die Wurzelfunktion folgendermaßen angegeben: √ [0, ∞) → R f : [0, ∞) → R, x 7→ x oder f: √ x 7→ x In dieser Schreibweise ist die komplette Information zu einer Funktion auf einen Blick sichtbar. Wir werden in diesem Text meist die kompaktere Form √ f (x) =... x∈D wie z.B. f (x) = x x ∈ [0, ∞) verwenden, auch wenn die Zielmenge dabei unklar bleibt. Wenn der Definitionsbereich einer Funktion f nicht explizit angegeben ist, wird er im Weiteren häufig über D(f ) angesprochen, d.h. D(f ) ist schlicht eine Kurzschreibweise für “Definitionsbereich von f ”. Wenn man von einer konkreten Funktion f (x) ohne explizite Angabe eines Defini- tionsbereichs spricht, dann ist in der Regel der “größtmögliche” Definitionsbereich impliziert, also die Menge aller x ∈ R, für die die Abbildungsvorschrift f (x) verwendet √ werden kann, d.h. insbesondere einen Wert aus R ergibt. Im Fall von x ist das zum Beispiel [0, ∞). KAPITEL 1. GRUNDBEGRIFFE, NOTATION 16 Bemerkung: Auch wenn eine Funktion f (x) gemäß Definition 1.7 beliebige Werte aus R annehmen und dementsprechend mit wachsendem x immer größer werden kann, ist sie für kein einzelnes x ∈ D unendlich groß, −∞ < f (x) < ∞ für jedes beliebige x ∈ D. Definition 1.8: Eine Abbildung A : M1 → M2 heißt surjektiv auf der Menge M2 , falls A(M1 ) = M2 gilt. Bemerkung: Die Surjektivität hängt zentral daran, was als Menge M2 in der Definition der Abbildung A : M1 → M2 gewählt wird. Durch geeignete Einschränkung der Menge M2 kann stets Surjektivität erzeugt werden. Beispiele 1.2.1: Für die Ihnen bekannten elementaren Funktionen ist die Surjektivität leicht zu analysieren: (1) f : R → R mit f (x) = x − 5 ist wegen f (R) = R surjektiv. (2) f : R → R mit f (x) = x2 ist wegen f (R) = R+ 0 nicht surjektiv, weil f als Abbildung nach R erklärt wurde. (3) f : R → R+ 2 0 mit f (x) = x ist dementsprechend surjektiv. Definition 1.9: Eine Abbildung A : M1 → M2 heißt injektiv (eineindeutig), falls für alle x1 , x2 ∈ M1 aus A(x1 ) = A(x2 ) auch x1 = x2 folgt: Injektivität, 1. Formulierung: A(x1 ) = A(x2 ) =⇒ x1 = x2 (1.2.2) Dementsprechend werden zwei verschiedene x auf zwei verschiedene A(x) abgebildet: Injektivität, 2. Formulierung: x1 ̸= x2 =⇒ A(x1 ) ̸= A(x2 ) (1.2.3) Diese Schlussfolgerung beruht auf einem elementaren Grundsatz der Aussagenlogik: Falls aus Aussage A gerade Aussage B folgt, folgt aus Nicht-B gerade Nicht-A. Injektive Abbildungen bezeichnet man auch als 1-zu-1-Abbildungen. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 17 Veranschaulichung der Injektivität: x2 x2 A(x2 ) A(x1 ) x1 = A(x2 ) x1 A(x1 ) A nicht injektiv A injektiv Bemerkung: Die Injektivität hängt daran, was als Menge M1 in der Definition der Ab- bildung A : M1 → M2 gewählt wird. Durch geeignete Einschränkung der Menge M1 kann stets Injektivität erzeugt werden. Beispiele 1.2.2: Wir greifen noch einmal die elementaren Funktionen auf. (1) f : R → R mit f (x) = x − 5 ist injektiv. (2) f : R → R mit f (x) = x2 ist wegen f (x) = f (−x) nicht injektiv. (3) f : R+ + 2 0 → R0 mit f (x) = x ist dagegen injektiv. Die Injektivität ist an den zugehörigen Funktionsgraphen leicht zu erkennen: f (x) x2 x21 = x22 x1 = −x2 x2 x x2 − 5 x−5 x1 − 5 Definition 1.10: Eine Abbildung, die sowohl injektiv als auch surjektiv ist, nennt man bijektiv. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 18 Definition 1.11: Falls A : M1 → M2 bijektiv ist, definiert für beliebiges y ∈ M2 A−1 (y) := x mit y = A(x) (∀ y ∈ M2 ) (1.2.4) die Umkehrabbildung (oder auch inverse Abbildung) A−1 : M2 → M1. Dabei ist der Definitionsbereich von A−1 identisch mit A(M1 ) = M2 und entsprechend ist A−1 (M2 ) = M1. Notation: A−1 ist im Fall der Umkehrabbildung nicht im Sinne eines Bruches 1/A gemeint, sondern im Sinn von “A rückgängig machen”. Beispiele 1.2.3: Wir betrachten einmal mehr die elementaren Funktionen. (1) f : R → R mit f (x) = x − 5 und dementsprechend f (R) = R: f −1 (y) = y + 5 √ (2) f : R+ + 2 + + 0 → R0 mit f (x) = x und dementsprechend f (R0 ) = R0 : f −1 (y) = y Definition 1.12: Für zwei gegebene Abbildungen A : M1 → M2 und B : M3 → M4 mit A(M1 ) ⊆ M3 definiert (B ◦ A)(x) := B(A(x)) ∀ x ∈ M1 (1.2.5) die Hintereinanderschaltung (auch Produkt genannt) von A und B, B ◦ A : M1 → M4 Notation: Das Produkt B ◦ A ist hier nicht(!) im Sinne einer Multiplikation von Zahlen gemeint, sondern im Sinne von “nacheinander ausführen”. Man beachte, dass bei der Hintereinanderschaltung B ◦ A die hintere Abbildung A zuerst(!) ausgeführt wird. Beispiele 1.2.4: (1) Wir betrachten die Abbildungen f : R → R mit f (x) = x2 und dementsprechend f (R) = R+ y 0 sowie g : R → R mit g(y) = e. Die Hintereinanderschaltung ist we- 2 gen f (R) ⊂ R legitim. Sie ergibt die Funktion (g ◦ f )(x) = g(f (x)) = ex mit dem Definitionsbereich R. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 19 1.3 Summenformeln, vollständige Induktion Für die praktische Arbeit sind zwei Resultate für elementare Summenformeln von einiger Bedeutung. Eines der beiden wollen wir hier diskutieren, das zweite werden wir später noch sehen. Die einfachste denkbare Summe ist die über die natürlichen Zahlen von 1 bis n, 1 + 2 + 3 +... + n. (1.3.1) Offensichtlich wird es auf Dauer lästig und bei komplizierteren Summen auch schwierig, sie in dieser expliziten Form aufzuschreiben und in Rechnungen zu handhaben. Daher soll vor einer Herleitung des Werts dieser Summe eine Konvention für die Schreibweise von Summen eingeführt werden. Notation für Summen: Um Summen wie (1.3.1) aufzuschreiben, verwendet man die folgende kompakte Summenschreibweise: k X ci = gehe alle ganzen Zahlen i zwischen Anfangswert j und Endwert k i=j (jeweils einschließlich) durch und summiere die zugehörigen ci auf = cj + cj+1 + cj+2 +... + ck−1 + ck (1.3.2) i wird dann Summationsindex genannt, die ci sind die Summenglieder. Dabei wird in der Regel j ≤ k vorausgesetzt, wobei j und k durchaus auch negativ sein dürfen. Gelegentlich lässt man zur Vermeidung von Fallunterscheidungen in komplizierteren Ausdrücken auch Pk j > k zu, mit dem Verständnis, dass i=j ci dann den Wert Null besitzt. Nicht selten werden die Schranken für den Summationsindex weggelassen, wenn sie aus dem Zusammenhang heraus klar sind. Entsprechend unserem Ausgangspunkt (1.3.1) wollen wir die ci an dieser Stelle erst einmal als gewöhnliche Zahlen verstehen. Die Summenschreibweise lässt sich aber genauso auf andere Größen anwenden, für die eine Addition definiert ist, zum Beispiel auf n-Tupel oder Funktionen. Für die Summe (1.3.1) erhält man in dieser Schreibweise n X n X 1 + 2 + 3 +... + n = i = k. i=1 k=1 Dieses Beispiel stellt gleich noch klar, dass keineswegs immer i als Summationsindex ein- gesetzt wird. Die Verwendung unterschiedlicher Summationsindices ist schon deswegen eine KAPITEL 1. GRUNDBEGRIFFE, NOTATION 20 Notwendigkeit, weil nicht selten mehrere Summen gleichzeitig in einem mathematischen Ausdruck auftreten: Um die einzelnen Summanden auseinanderhalten zu können, muss für jede der beteiligten Summen ein anderer Summationsindex eingesetzt werden. Nicht nur das Symbol für den Summationsindex ist frei wählbar, sondern auch der genaue Zahlenabschnitt, über den summiert wird: Offensichtlich kann man die Zahlen von 1 bis n auch dadurch aufsummieren, dass man den Summationsindex von 0 bis n − 1 laufen lässt, dafür aber die einzelnen Summanden jeweils um 1 erhöht, n X n−1 X i = (k + 1) = (0 + 1) + (1 + 1) +... + ((n − 1) + 1) = 1 + 2 +... + n. i=1 k=0 Ausgeschrieben ergeben beide Ausdrücke exakt die gleichen Zahlen. Man nennt eine solche Verschiebung des Summationsindex einen Indexshift. Bei einem Indexshift bleibt die Zahl der Terme in der Summe völlig unverändert, nur die konkreten Werte des Summationsindexes werden verschoben. Manchmal sollen in einer Summe nur die geraden bzw. ungeraden Zahlen durchgegangen werden, etwa bei x + x3 + x 5 +.... Auch das lässt sich in der Summenschreibweise leicht realisieren. Dazu muss man nur be- denken, dass 2k alle geraden Zahlen durchläuft, wenn k die ganzen Zahlen durchgeht, und 2k + 1 die ungeraden, 2k = 0, 2, 4,... ⇐⇒ k = 0, 1, 2,.... 2k + 1 = 1, 3, 5,... So hat man zum Beispiel 3 x + x3 + x5 + x7 = x2k+1. X k=0 Falls in einer Summe eines der Summenglieder ausgelassen werden soll, schreibt man k X ci = cj +... + cl−1 + cl+1 +... + ck. (1.3.3) i=j,i̸=l Hier geht der Summationsindex i also alle Werte zwischen j und k durch, mit Ausnahme von l, unter der Voraussetzung, dass j ≤ l ≤ k gilt. So, jetzt kommen wir zum Wert der Summe (1.3.1) zurück. Für ihn erhält man: n X n(n + 1) k = n = 1, 2, 3,... (1.3.4) k=1 2 KAPITEL 1. GRUNDBEGRIFFE, NOTATION 21 Beweis: Dieses Resultat soll explizit bewiesen werden, vor allem, um eine wichtige Beweis- technik einzuführen (oder vermutlich eher: an sie zu erinnern). Der Beweis von (1.3.4) erfolgt über vollständige Induktion: Bei dieser Beweistechnik, die auch in der Physik gelegentlich zum Einsatz kommt, überzeugt man sich zunächst, dass eine behauptete Formel, die von einem Index n ∈ N abhängt, für den niedrigsten relevanten Wert des Index korrekt ist. In unserem Beispiel hat man 1 X 1(1 + 1) n=1: k=1= k=1 2 2 X 2(2 + 1) n=2: k =1+2=3=. k=1 2 Dies bezeichnet man als die Induktionsbasis. Das niedrigste n (hier n = 1) reicht dabei schon, manchmal ist es aber nötig, aus den Resultaten für mehrere niedrige n erst die Summenformel herauszulesen. Wenn es nun gelingt, unter Verwendung der behaupteten Formel für den Indexwert n (der Induktionsannahme) die Richtigkeit derselben Formel für den Indexwert n+1 zu beweisen, folgt, ausgehend von der Induktionsbasis, die Richtigkeit der Formel Schritt für Schritt für jeden beliebigen Indexwert n ∈ N. Im Fall von Gl. (1.3.4) ist dieser Induktionsschluss sehr einfach durchzuführen. Man betrachtet dazu die Summe (1.3.4) für den Indexwert n + 1 und zerlegt sie in zwei Teile: n+1 X n X k = k + (n + 1) k=1 k=1 Nun kann (1.3.4) für den ersten Term auf der rechten Seite verwendet werden, denn wir hatten ja vorausgesetzt, dass (1.3.4) bis zum Indexwert n bereits bewiesen wurde: n+1 X n(n + 1) (n + 1)(n + 2) k = + (n + 1) = k=1 2 2 Damit ist gezeigt, dass (1.3.4) auch für den Indexwert n + 1 gilt, und damit für alle n. Notation für Doppelsummen: Abschließend soll gleich noch eine minimale Erweiterung der Summenschreibweise vorgestellt werden. Auch Summen über Glieder cij , die von zwei Summationsindices gleichzeitig abhängen, treten häufig auf. Wenn diese Glieder über einen ihrer Indices summiert werden, resultiert ein Satz von Zahlen, der nur noch durch den anderen Index charakterisiert wird. Falls j etwa den Bereich m,... , n durchläuft, erhält KAPITEL 1. GRUNDBEGRIFFE, NOTATION 22 man durch Summation über diesen Bereich die Werte n X di := cij. j=m Diese di kann man jetzt noch über i aufsummieren, l X l X n X di = cij , i=k i=k j=m wobei hier für i der Summationsbereich k,... , l gewählt wurde. Das Resultat ist eine Dop- pelsumme. Deren Wert hängt wegen der Assoziativität der Addition reeller Zahlen, (a + b) + c = a + (b + c), nicht von der Reihenfolge des Aufsummierens ab, l n n l ! X X X X cij = cij , i=k j=m j=m i=k weswegen auf die Klammerung in der Regel verzichtet wird: l X X n n X X l cij = cij i=k j=m j=m i=k Falls sich beide Summen über den gleichen Bereich von ganzen Zahlen erstrecken, fasst man sie meist noch kompakter zusammen: n X X n n X cij ≡ cij i=m j=m i,j=m 1.4 Elementare Kombinatorik, binomische Formel Anordnung unterscheidbarer Objekte: Um die zweite oben angesprochene Summen- formel zu diskutieren, stellen wir zunächst ein paar elementare kombinatorische Überlegun- gen an. Dazu denken wir uns n unterscheidbare Objekte gegeben. Diese wollen wir entlang einer Kette mit den Plätzen 1,... , n aufreihen: Objekte 1 2 ··· n−1 n Eine offensichtliche Frage ist dann: Wie viele unterschiedliche Anordnungen der Objekte auf den Plätzen 1,... , n gibt es? Die Antwort ist nicht gar zu schwierig. Wir starten mit der KAPITEL 1. GRUNDBEGRIFFE, NOTATION 23 Besetzung von Platz 1. Da wir zu diesem Zeitpunkt noch alle Objekte zur Verteilung auf die Plätze zur Verfügung haben, gibt es n Möglichkeiten, Platz 1 zu belegen. Weil die Objekte alle voneinander unterscheidbar sind, zerlegt die Wahl des Objekts für Platz 1 die Gesamt- menge aller Anordnungen in n unterscheidbare Teilmengen — alle Anordnungen einer dieser Teilmengen beginnen mit demselben Objekt auf Platz 1 und alle anderen Teilmengen be- ginnen mit einem anderen Objekt. Als nächstes muss Platz 2 vergeben werden. Für dessen Besetzung stehen jetzt aber nur noch n − 1 Objekte zur Auswahl, denn ein Objekt (egal welches) ist bereits für Platz 1 verwendet worden. Also gibt es in jeder der n Teilmengen n − 1 Möglichkeiten, Platz 2 zu besetzen. Diese Überlegung kann man fortsetzen, bis nur noch Platz n zu vergeben ist und dafür auch nur noch ein Objekt übrig ist. Insgesamt erhält man also n · (n − 1) · (n − 2) · · · · · 2 · 1 mögliche Anordnungen von n unterscheidbaren Objekten auf n Plätzen. Dieses Produkt tritt so häufig auf, dass man ihm einen eigenen Namen gibt. Man nennt es die Fakultät und schreibt dafür n!: n! := n · (n − 1) · (n − 2) · · · · · 2 · 1 n = 1, 2,... (1.4.1) Um Fallunterscheidungen in Ausdrücken mit n! zu vermeiden, setzt man obendrein noch 0! := 1 (Konvention). (1.4.2) Rekursive Definition: Man kann die Fakultät alternativ auch rekursiv definieren: Das zentrale Element einer rekursiven Definition ist die sogenannte Rekursionsgleichung, die eine index-abhängige Größe für den Indexwert n aus dem Wert der Größe beim Indexwert n − 1 erklärt (oder auch aus den Werten der Größe bei mehreren vorangegangenen Indexwerten). Die Größe ist dann für alle n wohldefiniert, sobald ihr für n = 0 (oder n = 1) ein Wert zugeordnet wird (wenn mehrere vorangegangene Indexwerte involviert sind, braucht man entsprechend mehrere Startwerte). Eine solche rekursive Definition liegt gerade bei der Zahl der möglichen Anordnungen von n unterscheidbaren Objekten auf n Plätzen nahe, denn nach der Besetzung des ersten Platzes wiederholt sich die Ausgangsfragestellung ja gerade für n−1 unterscheidbare Objekte. Wenn KAPITEL 1. GRUNDBEGRIFFE, NOTATION 24 also n! die Zahl der möglichen Anordnungen n unterscheidbarer Objekte darstellen soll, muss zwingend die Rekursionsgleichung n! = n (n − 1)! n = 1, 2,... (1.4.3) gelten. Damit diese Formel auch für n = 1 verwendbar bleibt, muss der Startwert 0! = 1 gewählt werden. Die wiederholte Anwendung von (1.4.3) ergibt gerade (1.4.1): n! = n(n − 1)(n − 2)! = n(n − 1)(n − 2)(n − 3)! =... Notation: Die Fakultät kann über eine der Summenschreibweise analoge Produktschreib- weise wesentlich kompakter ausgedrückt werden. Sie bietet daher die Gelegenheit, diese Produktschreibweise einzuführen: k Y cj · cj+1 · cj+2 · · · ck−1 · ck für j ≤ k ci := (1.4.4) 1 sonst i=j Für die Fakultät hat man in dieser Schreibweise also n Y n! = i n = 1, 2,.... i=1 Auswahl von Objekten: Wir wollen gleich noch eine zweite elementare kombinatorische Überlegung anschließen. Die Frage, die wir uns jetzt stellen, lautet: Wie viele Möglichkeiten gibt es, aus n unterscheidbaren Objekten einen Satz von k Objekten auszuwählen, wobei natürlich 1 ≤ k ≤ n sein muss? Bei der Bestimmung dieser Zahl beginnen wir genauso wie bei der Zahl der Anordnungen oben: Wir zählen die Möglichkeiten ab, n Objekte auf k Plätze zu verteilen. Es gibt n Möglichkeiten, den ersten der k zu vergebenden Plätze zu besetzen, danach nur noch n − 1 Möglichkeiten für den zweiten etc, insgesamt also n · (n − 1) · · · · · (n − k + 1) Möglichkeiten, k der n Objekte auf k Plätze zu verteilen. Diese Multiplizität beinhaltet so- wohl die Auswahl von k aus n Objekten als auch deren Anordnung auf k Plätze. Allerdings ist letztere bei der aktuellen Fragestellung irrelevant, nur der Satz der ausgewählten Ob- jekte zählt — ob ein Objekt sich auf Platz 1 oder auf Platz k befindet, spielt keine Rolle. Daher entsprechen alle k! Anordnungen desselben Satzes von k Objekten auf die k Plätze KAPITEL 1. GRUNDBEGRIFFE, NOTATION 25 gerade einer möglichen Auswahl von k Objekten (unabhängig davon, welche Objekte aus- gewählt wurden). Die Zahl der Möglichkeiten, k aus n unterscheidbaren Objekten auszuwählen, lautet daher n · (n − 1) · · · · · (n − k + 1) n! =. (1.4.5) k! k! (n − k)! Dieses Resultat ist gleichzeitig auch für k = 0 und k = n korrekt: Es gibt nur eine Möglich- keit, keines der Objekte auszuwählen, und nur eine, alle n auszuwählen. Die Größe (1.4.5) wird als Binomialkoeffizient bezeichnet: ! n n! := n = 0, 1, 2,... ; k = 0,... , n (1.4.6) k k! (n − k)! Binomische Formel: Damit kommen wir zur zweiten zentralen Summenformel. Die Grö- ße, die wir als Summe ausdrücken wollen, ist die Potenz (x + y)n. Jeder Term, der durch Ausmultiplizieren dieses Produkts entsteht, hat die Form xk y n−k , da ja aus jedem der Fakto- ren (x + y) entweder x oder y in den Term eingeht. Die Frage ist dann, wie häufig insgesamt eine bestimmte Potenz xk y n−k unter den 2n Termen auftritt. Um diese Frage zu beantworten, unterscheiden wir künstlich die Größen x und y in den n Faktoren: (x + y)n = (x1 + y1 )(x2 + y2 ) · · · (xn + yn ) mit x1 =... = xn = x, y1 =... = yn = y Die Zahl der Möglichkeiten, beim Ausmultiplizieren dieser n unterscheidbaren Faktoren in einem Term gerade k der xi und n − k der yj zu kombinieren, ist identisch mit der Zahl der Möglichkeiten, k Faktoren von den n auszuwählen (nämlich die k, die gerade die xi beisteuern). Die Zahl der Möglichkeiten, k aus n Faktoren auszuwählen, ist durch den Bi- nomialkoeffizienten (1.4.6) gegeben. Setzt man dann wieder alle xi = x sowie alle yj = y, erhält man die binomische Formel (auch Binomialentwicklung genannt): n ! n X n k n−k (x + y) = x y n = 0, 1, 2,... (1.4.7) k=0 k Der Beweis dieser Formel kann alternativ mittels vollständiger Induktion erfolgen (Versuchen Sie sich einmal!). KAPITEL 1. GRUNDBEGRIFFE, NOTATION 26 1.5 Rechtwinkliges Dreieck, Additionstheoreme Schließlich soll in diesem einleitenden Kapitel auch noch an ein paar Aspekte der elementaren Geometrie erinnert werden. Rechtwinkliges Dreieck: Das für viele Anwendungen aber auch für viele formale Über- legungen zentrale geometrische Objekt ist das rechtwinklige Dreieck: c a α · b Für die drei Seiten des rechtwinkligen Dreiecks gilt der Satz des Pythagoras, a2 + b 2 = c 2 , (1.5.1) wobei a und b wie im Bild die Längen der beiden aufeinander senkrecht stehenden Seiten sind und c die Länge der dritten Seite ist. Im Weiteren werden wir die drei Seiten der Kürze halber direkt über ihre Längen ansprechen, d.h. die Seite mit der Länge a ist die Seite a etc. Die Seiten a und b sind dabei stets diejenigen, die senkrecht aufeinander stehen. Sinus und Kosinus: Das Verhältnis der Seiten a und b zur Seite c kann zur geometrischen Definition der Funktionen Sinus und Kosinus verwendet werden. Dazu betrachtet man den Winkel α zwischen der Seite c, Hypotenuse genannt, und einer der beiden anderen Seiten (im Bild die Seite b), die dann als Ankathete bezeichnet wird (die verbleibende Seite heißt Gegenkathete). Dieser Winkel liegt zwischen 0◦ und 90◦. Für diesen Winkelbereich setzt man a Länge der Gegenkathete sin(α) := = (1.5.2) c Länge der Hypotenuse b Länge der Ankathete cos(α) := =. (1.5.3) c Länge der Hypotenuse Dabei wird als numerischer Wert des Arguments α von sin(α) und cos(α) aber nicht unmit- telbar der Winkel zwischen Ankathete und Hypotenuse in Grad gewählt. Vielmehr verwendet KAPITEL 1. GRUNDBEGRIFFE, NOTATION 27 man als Argument den diesem Winkel entsprechenden Bruchteil des Gesamtumfangs 2π des Kreises mit Radius 1 (Einheitskreis) um den Punkt, an dem sich Ankathete und Hypotenuse treffen (im Weiteren mit 0 bezeichnet). Man misst den Winkel in diesen Funktionen also im sogenannten Bogenmaß: Kreis mit Radius 1 · P sin(α) c=1 a Bogenlänge für gegebenes α α 0 b = cos(α) Die Übersetzung von Winkeln in Grad zu Winkeln in Bogenmaß folgt aus dem kompletten Kreis, d.h. 2π ≡ 360◦. Ein Winkel von x Grad entsprecht daher der Bogenlänge α = 2π 360 x. Die obige Definition von sin(α) und cos(α) deckt dementsprechend den Bereich 0 < α < π/2 ab. Die Verallgemeinerung auf beliebige reelle α beruht auf der Beobachtung, dass man sin(α) und cos(α) auch durch Projektion der Hypotenuse auf geeignet gewählte Achsen erhält: Wählt man eine (horizontale) Achse entlang der Ankathete und eine dazu senkrecht (vertikale) Achse so, dass die beiden sich am Punkt 0 schneiden, ist sin(α) gemäß (1.5.2) identisch mit der Länge der Projektion der Hypotenuse auf die vertikale Achse, cos(α) entspricht gemäß (1.5.3) gerade der Länge der Projektion der Hypotenuse auf die horizontale Achse (die Projektionen erfolgen dabei so, dass die Projektionslinien — im Bild zum Beispiel die gestrichelte blaue Linie — senkrecht zu der Achse verlaufen, auf die projeziert wird). Für α = 0 sind die Längen dieser Projektionen durch sin(α = 0) := 0 cos(α = 0) := 1 (1.5.4) gegeben. Analog erhält man für α = π/2 π π sin α = := 1 cos α = := 0. (1.5.5) 2 2 KAPITEL 1. GRUNDBEGRIFFE, NOTATION 28 Geht man mit α über π/2 hinaus, verlagert sich das durch die Hypotenuse und ihre Pro- jektion auf die horizontale Achse definierte rechtwinklige Dreieck in den 2. Quadranten des Kreises: Bogenlänge für gegebenes α P sin(α) c=1 a α b = cos(α) 0 Entsprechend gibt man der Projektion cos(α) der Hypotenuse auf die horizontale Achse ein negatives Vorzeichen. Das impliziert, dass man der horizontalen Achse eine Richtung gibt — die Werte auf ihr wachsen nach rechts — und dem Achsenschnittpunkt 0 den Wert 0 zuordnet. Die Projektion sin(α) auf die vertikale Achse ist gleichzeitig noch positiv — auf der vertikalen Achse lassen wir die Werte von unten nach oben wachsen und ordnen dem Achsenschnittpunkt 0 ebenfalls den Wert 0 zu. sin(α) und cos(α) durchlaufen in diesem Quadranten mit π/2 ≤ α ≤ π die gleichen Werte wie im 1. Quadranten: Jedes Dreieck im 2. Quadranten mit Winkel α ist kongruent mit dem durch seine Spiegelung an der vertikalen Achse erzeugten Dreieck im 1. Quadranten mit Winkel π − α (und umgekehrt), sin(π − α) = sin(α). (1.5.6) Das Gleiche gilt für cos(α), nur dass dessen Vorzeichen im 2. Quadranten negativ ist, cos(π − α) = − cos(α). (1.5.7) Das Konzept der Projektion von P auf die Achsen kann genauso für den 3. und 4. Quadranten fortgeführt werden. KAPITEL 1. GRUNDBEGRIFFE, NOTATION 29 Bogenlänge für gegebenes α cos(α) α 0 φ c=1 sin(α) P Im 3. Quadranten sind dann sowohl sin(α) als auch cos(α) negativ, im 4. Quadranten nur noch sin(α). Die Werte der Funktionen wiederholen sich dabei erneut, da das Dreieck mit dem Winkel α = π + φ mit 0 ≤ φ ≤ π kongruent zum Dreieck mit dem Winkel α = π − φ ist. Mit den Relationen (1.5.6) und (1.5.7) folgt daher sin(α) = sin(π + φ) = − sin(π − φ) = − sin(2π − α) = − sin(α − π) (1.5.8) cos(α) = cos(π + φ) = cos(π − φ) = cos(2π − α) = − cos(α − π). (1.5.9) Nach Überschreiten von α = 2π wiederholen sich die Werte der Projektionen sin(α) und cos(α): sin(α + 2π) = sin(α) cos(α + 2π) = cos(α) ∀α∈R (1.5.10) Diese Relationen definieren die beiden Funktionen gleichzeitig für negative α. sin(α) und cos(α) sind daher periodische Funktionen mit der Periode 2π. Nimmt man (1.5.8) und (1.5.9) zusammen mit (1.5.10), folgen die Symmetrierelationen sin(−α) = − sin(α) cos(−α) = cos(α) ∀α∈R. (1.5.11) Kombiniert man (1.5.10) und (1.5.11) wiederum mit den Relationen (1.5.8) und (1.5.9), zeigt sich, dass (1.5.6) und (1.5.7) für alle α ∈ R ihre Gültigkeit behalten. Insgesamt erhält man für die beiden Funktionen folgende Funktionsgraphen, denen man die Symmetrieeigenschaften direkt ansieht: KAPITEL 1. GRUNDBEGRIFFE, NOTATION 30 sin(α) 0 α −π π 2π 3π cos(α) Da sin(α) und cos(α) in allen Quadranten den Seiten a, b eines rechtwinkligen Dreiecks mit c = 1 entsprechen, gilt der Satz des Pythagoras für alle α ∈ R: sin2 (α) + cos2 (α) = 1 ∀α∈R (1.5.12) Additionstheoreme: Die Geometrie des rechtwinkligen Dreiecks erlaubt den Beweis von Additionstheoremen für die Auswertung von Sinus und Kosinus im Fall von Winkelsummen: sin(α + β) = sin(α) cos(β) + cos(α) sin(β) (1.5.13) cos(α + β) = cos(α) cos(β) − sin(α) sin(β) (1.5.14) Beweis: Wir führen exemplarisch einen geometrischen Beweis für das Additionstheorem (1.5.13). Dazu zeichnen wir zwei rechtwinklige Dreiecke mit den Winkeln α und β in den Einheitskreis. Das Dreieck mit Winkel α (blau) tragen wir direkt gegenüber der horizontalen Achse auf, das zweite Dreieck (rot) gegenüber der Hypotenuse des ersten Dreiecks: KAPITEL 1. GRUNDBEGRIFFE, NOTATION 31 B γ δ c sin(β) sin(α + β) C A cos(β) sin(α) d β d α 0 cos(α) cos(α + β) Durch Projektion identifizieren wir die in der behaupteten Formel auftretenden Winkel- funktionen. Um sie zueinander in Beziehung zu setzen, projezieren wir den Punkt A auf die vertikale Achse. Die Strecke vom Ursprung zum Punkt A hat die Länge cos(β), ihre Projektion d auf die vertikale Achse dementsprechend die Länge cos(β) sin(α). Die Differenz von cos(β) sin(α) zu sin(α + β) nennen wir c, sin(α + β) = sin(α) cos(β) + c. c entspricht gerade der Länge der Seite BC des Dreiecks mit den Ecken A, B, C (cyan). Zur Bestimmung von c machen wir uns klar, dass dieses Dreieck kongruent mit dem blauen Dreieck ist. Zum Nachweis betrachten wir die Winkelsumme im grünen Dreieck, π α+β+γ = , 2 sowie die im roten Dreieck, π β+γ+δ =. 2 Also gilt α = δ und das Dreieck A, B, C ist kongruent mit dem blauen Dreieck. Damit können wir c aber leicht bestimmen. Denn bezüglich der Ecke B hat die Ankathete BC des KAPITEL 1. GRUNDBEGRIFFE, NOTATION 32 Dreiecks A, B, C gerade die Länge c. Da die Hypotenuse diese Dreiecks die Länge sin(β) besitzt, erhält man c = cos(α) sin(β) und damit das behauptete Additionstheorem (1.5.13). Die Relationen (1.5.13) und (1.5.14) kann man noch nach Produkten von trigonometri- schen Funktionen auflösen. Kombiniert man etwa cos(α + β) mit cos(α − β), cos(α + β) = cos(α) cos(β) − sin(α) sin(β) cos(α − β) = cos(α) cos(−β) − sin(α) sin(−β) , | {z } | {z } =cos(β) =− sin(β) und nutzt (1.5.11), erhält man durch Addition und Subtraktion dieser beiden Gleichungen 1 sin(α) sin(β) = [cos(α − β) − cos(α + β)] (1.5.15) 2 1 cos(α) cos(β) = [cos(α − β) + cos(α + β)]. (1.5.16) 2 Analog ergibt die Kombination von sin(α + β) mit sin(α − β) 1 sin(α) cos(β) = [sin(α − β) + sin(α + β)]. (1.5.17) 2 Ende Vorlesung 2 Kapitel 2 Funktionen einer Veränderlichen Vorbemerkungen Das Konzept von Funktionen f (x) einer Veränderlichen x ist Ihnen in einigem Umfang aus der Schule bekannt. Deswegen werden wir in diesem Text nicht den kanonischen Weg in die Analysis nehmen und zunächst ausführlich über die reellen Zahlen selbst, Teilmengen von R, Folgen, Häufungspunkte etc sprechen, sondern wesentlich direkter auf die für die Physik relevanten Konzepte und Aussagen zusteuern. Es sei aber gleich darauf hingewiesen, dass einige der hier ausgelassenen Begrifflichkeiten, insbesondere die Charakterisierung von Mengen reeller Zahlen, später bei der Diskussion von Funktionen mehrerer Veränderlicher in den Abschnitten 6.1 und 6.2 noch ausgiebig behandelt werden. Andere werden in diesem Kapitel en passant eingeführt, wenn sie gebraucht werden. Die elementarsten Begriffe im Kontext von reellen Funktionen, etwa die n-te Potenz einer reellen Zahl x, 1 xn := | · x ·{z... · x} x (x beliebig aus R, n ∈ N) x0 := 1 x−n := , xn n-faches Produkt die n-te Wurzel, √ y= n x ≡ x1/n ⇐⇒ yn = x (x beliebig aus R+ 0 , n ∈ N) , oder die Potenzgesetze 1/l k xk/l = xk = x1/l xk+l = xk xl (x · y)k = xk y k werden im Weiteren aber ohne Kommentar einfach verwendet. 33 KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 34 Notation: Um Definitionen und Aussagen möglichst kompakt und lesbar formulieren zu können, wird im Weiteren stets vorausgesetzt, dass f (x) eine reellwertige Funktion der reellen Variable x ist. Falls nicht ausdrücklich anders ausgewiesen, dürfen alle in Definitionen und Aussagen auftretenden Intervalle I offen, halboffen oder abgeschlossen sein: I ≡ (a, b) oder (a, b] oder [a, b) oder [a, b] mit a < b (2.0.1) Auch uneigentliche Intervalle (die sich bis ±∞ erstrecken) sind dabei zulässig. Wenn Aus- sagen zu Punkten x, x0 oder ähnlich ohne weitere Charakterisierung getroffen werden, wird stets vorausgesetzt, dass diese Punkte im Definitionsbereich D(f ) von f (x) liegen. Falls das nicht der Fall oder nicht nötig sein sollte, wird extra darauf hingewiesen. Wenn Zahlen wie a und b in (2.0.1) auftreten, sind sie stets reell zu verstehen. Die Variablen i, j, k, l, m, n sind, wie (fast) überall in diesem Text, für ganze Zahlen reserviert. KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 35 2.1 Reihen Zusammenfassung: Unter einer Folge reeller Zahlen versteht man einen Satz ab- zählbar unendlich vieler Zahlen a1 , a2 , a3 ,... ∈ R. Eine Folge an , n = 1, 2, 3,..., heißt konvergent gegen a, wenn zu beliebig vorgegebenem ϵ > 0 stets ein n0 (ϵ) exi- stiert, so dass |an − a| < ϵ für alle n ≥ n0 (ϵ) gilt. Man schreibt dann a = limn→∞ an , nennt a den Grenzwert der an und sagt, der Grenzwert limn→∞ an existiert. Reihen sind (anschaulich gesprochen) Summen über abzählbar unendlich vie- P∞ le Terme A0 , A1 , A2 ,... ∈ R. Man schreibt sie in der Form k=0 Ak , wobei die- PN ser Ausdruck als der Grenzwert limN →∞ k=0 Ak der Folge der Partialsummen PN SN = k=0 Ak , N = 0, 1, 2,..., zu verstehen ist. Reihen heißen konvergent, wenn PN limN →∞ k=0 Ak existiert, d.h. endlich ist, ansonsten divergent. Für konvergente Reihen gilt: ∞ X ∞ X ∞ X (Ak + Bk ) = Ak + Bk k=0 k=0 k=0 ∞ X ∞ X (αAk ) = α Ak für alle α ∈ R k=0 k=0 PN Reihen heißen absolut konvergent, wenn sogar limN →∞ k=0 |Ak | existiert. Absolut konvergente Reihen kann man nach Belieben umordnen und das gilt insbesondere auch für ihre Produkte: ∞ ∞ ∞ ∞ k ! ! ! X X X X X Ak · Bl = Ak Bl = Al Bk−l k=0 l=0 k,l=0 k=0 l=0 P∞ Die für die Physik wichtigste Form von Reihen sind Potenzreihen, k=0 ak (x − x0 )k. Die größte Zahl R > 0, für die eine Potenzreihe im gesamten Intervall (x0 − R, x0 + R) konvergiert, wird als ihr Konvergenzradius bezeichnet. Innerhalb dieses Intervalls sind Potenzreihen sogar absolut konvergent. Für x ∈ (x0 −R, x0 +R) kann mit Potenzreihen genauso gearbeitet werden wie mit gewöhnlichen elementaren KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 36 Funktionen. Zwei der für die Physik zentralen Potenzreihen sind: ∞ X xk exp(x) = Exponentialfunktion k=0 k! ∞ 1 xk X = geometrische Reihe (|x| < 1) 1−x k=0 Die Exponentialfunktion konvergiert für alle x ∈ R, erfüllt die Funktionalgleichung exp(x + y) = exp(x) exp(y) und wächst streng monoton für alle x ∈ R, x2 > x 1 ⇐⇒ exp(x2 ) > exp(x1 ). Die geometrische Reihe ist dagegen nur für |x| < 1 absolut konvergent (R = 1). Beginn Vorlesung 3 2.1.1 Geometrische Reihe Unter Reihen versteht man — salopp ausgedrückt — Summen über abzählbar unendlich viele Summanden A0 , A1 , A2 ,..., ∞ X Ak. k=0 Der mathematische Hintergrund von Reihen ist weniger trivial, als es diese einfache Summen- formel vielleicht erscheinen lässt. Wir werden uns dem Phänomen Reihen hier erst einmal über ein konkretes Beispiel, die sogenannte geometrische Reihe, auf eher intuitive Wei- se nähern, ohne die zugrunde liegende Mathematik sofort systematisch aufzuarbeiten. Ziel ist es, die für die Physik wichtigsten Aspekte exemplarisch anzusprechen, ohne durch eine Vielzahl mathematischer Details von ihnen abzulenken. Später folgt dann eine Präzisierung der grundlegenden Konzepte. Betrachten wir also zunächst die Summe N xk = 1 + x + x2 +... + xN. X k=0 Diese Summe kann man in einen geschlossenen Ausdruck überführen, solange x ̸= 1 gilt. KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 37 Man führt dazu künstlich den Nenner 1 − x ein und multipliziert den resultierenden Zähler aus: N (1 − x)(1 + x + x2 +... + xN ) xk = X (x ̸= 1) k=0 1−x N N " # 1 xk − xk+1 X X = 1 − x k=0 k=0 Ein Indexshift in der hinteren Summe und anschließendes Abspalten eines Randterms bei beiden Summen ergibt dann N N N +1 " # k 1 xk − xk X X X x = k=0 1 − x k=0 k=1 N N " # 1 k xk − xN +1. X X = 1+ x − 1−x k=1 k=1 Wie sich zeigt, ist der Nenner genau so gewählt worden, dass sich fast alle Summanden des Zählers paarweise wegheben und ein recht einfacher Ausdruck übrig bleibt: N 1 − xN +1 xk = X (x ̸= 1) (2.1.1) k=0 1−x Bis zu diesem Punkt haben wir nur über endlich viele Summanden gesprochen: Alle Ope- rationen, die zur sogenannten geometrischen Summenformel (2.1.1) führen, sind daher wohldefiniert, falls die Bedingung x ̸= 1 erfüllt ist. Die geometrische Summenformel gilt also auch für x > 1. Lassen Sie uns nun den Grenzübergang N → ∞ betrachten. Unter der Schreibweise N → ∞ versteht man dabei, dass N beliebig groß wird, d.h. größer als jede gegebene natürliche (und damit auch jede reelle) Zahl (wobei N in diesem Prozess entsprechend un- serer Konvention stets eine natürliche Zahl bleibt). Das Ergebnis dieser Operation wird als Grenzwert oder Limes N → ∞ bezeichnet und durch limN →∞ ausgedrückt (die Operati- on wird dementsprechend auch “Nehmen des Grenzwerts” genannt). Dabei wird der Begriff Grenzwert durchaus etwas ambivalent verwendet: Mit Grenzwert wird zum einen der Pro- zess der Grenzwertbildung angesprochen (der Übergang N → ∞), zum anderen aber auch der daraus resultierende Reihenwert selbst bezeichnet. Wir werden letzteren später noch mathematisch präzise einführen. PN Für die Summe k=0 xk kann dieser Grenzübergang auf Basis der Summenformel (2.1.1) KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 38 gebildet werden, solange x ̸= 1 ist: N xk = 1 + x + x 2 + x3 +... X lim (bis unendlich aufsummiert) N →∞ k=0 1 − xN +1 = lim (x ̸= 1) (2.1.2) N →∞ 1−x Wir wollen die verschiedenen Bereiche von x-Werten einzeln durchgehen: x > 1: Offensichtlich kann man nicht erwarten, dass der Wert dieser Reihe endlich ist, falls x > 1 ist, da dann unendlich viele immer größer werdende positive Terme aufaddiert werden. Man sagt dann: Der Grenzwert (2.1.2) existiert nicht. x = 1: Zur Untersuchung des Punktes x = 1 kann die Summenformel (2.1.2) nicht verwendet werden. Allerdings ist der Grenzwert von h i lim 10 + 11 + 12 +... + 1N = lim (N + 1) N →∞ N →∞ offensichtlich. x = −1: Im Fall x = −1 erhält man kein eindeutiges Ergebnis, denn der Wert der Summe (2.1.1) springt mit wachsendem N zwischen 0 und 1 hin und her. x < −1: Auch für x < −1 schaukeln sich die Terme in der Reihe immer weiter auf, was durch das alternierende Vorzeichen nicht aufgefangen werden kann. Man kann auch das am Grenzwert (2.1.2) unmittelbar ablesen, denn für |x| > 1 dominiert im Zähler xN +1 über die 1. Unabhängig vom Vorzeichen von x wird diese Potenz betragsmäßig mit wachsendem N immer größer. |x| < 1: Ein endlicher Grenzwert erfordert |x| < 1. In diesem Fall wird die Potenz xN +1 mit wachsendem N betragsmäßig immer kleiner, weil beim Übergang von N zu N + 1 ein zusätzlicher Faktor |x| < 1 heranmultipliziert wird. Im Grenzwert N → ∞ verschwindet xN +1 , solange |x| auch nur minimal kleiner als 1 ist. KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 39 Insgesamt erhält man daher: 1 für |x| < 1 1−x N ∞ für x = 1 xk = X lim (2.1.3) N →∞ k=0 nicht eindeutig für x = −1 Betrag = ∞ für |x| > 1 P∞ Man sagt: Die Potenzreihe k=0 xk , geometrische Reihe genannt, konvergiert für |x| < 1 gegen die Funktion 1/(1 − x) und schreibt direkt ∞ 1 xk = X für |x| < 1. (2.1.4) k=0 1−x 2.1.2 Exponentialfunktion Ein weiteres wichtiges Beispiel für Reihen ist die Exponentialreihe. Sie definiert die Expo- nentialfunktion exp(x): ∞ X xk exp(x) := (2.1.5) k=0 k! Man kann zeigen, dass die Reihe (2.1.5) für beliebige x ∈ R konvergiert. Die Fakultät im Nenner von xk /k! wächst schneller als die Potenz xk im Zähler, sobald k > |x|, d.h. |x|/k < 1, ist. Ab einem gewissen Punkt geht xk x x x x = ··· k! 1 2 k−1 k daher schnell gegen Null, und zwar so schnell, dass die Reihe konvergiert. Die Exponentialfunktion (2.1.5) hat eine Reihe von Eigenschaften, die zum einen grund- legende Bestandteile der Differentialrechnung sind, zum anderen aber auch in physikalischen Anwendungen immer wieder benötigt werden. Wir stellen ihre Diskussion aber noch einen Moment zurück und führen erst noch ein paar allgemeingültige Begriffe und Aussagen zum Thema Reihen ein. 2.1.3 Klassifikation von Reihen Die geometrische Reihe (2.1.4) und die Exponentialreihe (2.1.5) sind Prototypen von Po- tenzreihen. Deren allgemeine Form kombiniert k-abhängige Koeffizienten ak mit einem von KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN 40 Null verschiedenen Entwicklungspunkt x0 : ∞ N ak (x − x0 )k := lim ak (x − x0 )k X X (2.1.6) N →∞ k=0 k=0 Für die geometrische Reihe hat man also ak = 1 für alle k und x0 = 0, bei der Exponen- tialreihe ist ak = 1/k! und x0 = 0. Die einzelnen Summanden ak (x − x0 )k nennt man die Reihenglieder, k die Ordnung des Reihenglieds ak (x−x0 )k. Der Name und die Bedeutung des Entwicklungspunkts werden später noch klarer werden. Potenzreihen sind ein Spezialfall von Funktionenreihen, bei denen die Abhängigkeit der einzelnen Reihenglieder fk von x nicht weiter festgelegt ist: ∞ X N X fk (x) := lim fk (x) (2.1.7) N →∞ k=0 k=0 Die Funktionen fk (x) müssen dabei selbstverständlich auf einem gemeinsamen Definitions- bereich erklärt sein. Funktionenreihen wiederum sind ein Spezialfall allgemeiner Reihen, bei denen die Form der Reihenglieder in keiner Weise beschränkt ist, d.h. insbesondere keine Abhängigkeit von einem externen Parameter wie x auftreten muss: ∞ X N X Ak := lim Ak (2.1.8) N →∞ k=0 k=0 2.1.4 Konvergenz von Reihen Die zentrale Frage bei jeder solchen Reihe ist natürlich, ob der Grenzwert N → ∞ exi- stiert, d.h. einen endlichen Reihenwert liefert, und gegebenenfalls für welche x. Bereits im Zusammenhang mit der geometrischen Reihe hatten wir dafür den Begriff der Konvergenz verwendet, der jetzt noch sorgfältiger eingeführt werden soll. Wir tun das in mehreren Schrit- ten: 2.1.4.1 Folgen, Konvergenz von Folgen Ausgangspunkt dafür ist das Konzept von Folgen: KAPITEL 2. FUNKTIONEN EINER VERÄNDERLICHEN