Appunti di Fisica Matematica PDF

Document Details

Uploaded by Deleted User

Università degli Studi di Genova

2024

A. Morro

Tags

mathematical physics multivariable functions integrals calculus

Summary

These are lecture notes for a mathematical physics course, likely for engineering students (Biomedical and Informatic). The notes cover topics such as multivariable functions, integrals, and series.

Full Transcript

A. MORRO Appunti di Fisica matematica per Ingegneria Biomedica e Ingegneria Informatica a.a. 2023/24 i Per contattare il docente: e-mail [email protected] tel 010 3352786...

A. MORRO Appunti di Fisica matematica per Ingegneria Biomedica e Ingegneria Informatica a.a. 2023/24 i Per contattare il docente: e-mail [email protected] tel 010 3352786 Contents 1 Funzioni di più variabili 3 1.1 Intorni e segmenti................................... 3 1.2 Funzioni continue.................................... 5 1.3 Derivate parziali e funzioni differenziabili...................... 6 1.3.1 Funzioni differenziabili............................. 7 1.3.2 Funzioni composte............................... 10 1.4 Formula di Taylor................................... 12 1.5 Massimi e minimi.................................... 13 1.5.1 Matrici definite................................. 14 1.6 Funzioni definite implicitamente........................... 15 1.7 Derivazione sotto il segno di integrale........................ 16 1.8 Esercizi......................................... 17 2 Funzioni di più variabili a valori vettoriali 19 2.1 Continuità e differenziabilità.............................. 19 2.2 Funzione inversa.................................... 21 2.3 Trasformazioni e matrici jacobiane.......................... 23 2.3.1 Coordinate polari................................ 24 2.4 Moltiplicatori di Lagrange............................... 25 2.5 Esercizi......................................... 28 3 Funzioni di piu’ variabili e operatori differenziali 31 3.1 Operatori differenziali in coordinate cartesiane................... 31 3.2 Componenti covarianti e controvarianti........................ 33 3.3 Derivata covariante................................... 34 3.4 Operatori in coordinate curvilinee.......................... 35 3.4.1 Operatori in coordinate curvilinee ortogonali................ 36 3.4.2 Coordinate cilindriche............................. 37 3.4.3 Coordinate sferiche............................... 38 4 Integrali di funzioni di più variabili 39 4.1 Curve e integrali curvilinei............................... 39 4.1.1 Lunghezza di una curva............................ 40 4.1.2 Integrale curvilineo............................... 43 4.2 Integrali multipli.................................... 45 4.2.1 Integrali doppi................................. 45 4.2.2 Formule di Gauss-Green............................ 48 4.2.3 Cambio di variabili negli integrali doppi................... 50 4.2.4 Integrali tripli.................................. 52 4.3 Superfici e integrali di superficie........................... 54 1 2 CONTENTS 4.4 Piano tangente e versore normale........................... 56 4.5 Area di una superficie................................. 57 4.6 Integrali di superficie.................................. 58 4.7 Teorema di Stokes................................... 59 4.8 Teorema della divergenza............................... 60 4.8.1 Applicazioni alla meccanica e all’elettromagnetismo............ 61 4.9 Baricentri e teoremi di Pappo-Guldino........................ 62 4.10 Esercizi......................................... 65 5 Serie 67 5.1 Serie numeriche..................................... 67 5.1.1 La serie geometrica............................... 68 5.1.2 La serie armonica................................ 68 1+ P 5.1.3 La serie k 1/k............................... 69 5.1.4 Criteri di convergenza............................. 69 5.1.5 Convergenza assoluta............................. 70 5.1.6 Operazioni sulle serie.............................. 71 5.2 Serie di Fourier..................................... 72 5.2.1 Serie di Fourier per intervallo generico.................... 79 5.3 Conduzione del calore in un segmento........................ 80 5.4 Propagazione ondosa in un segmento......................... 84 5.4.1 Derivazione delle serie di Fourier....................... 87 5.4.2 Integrazione delle serie di Fourier....................... 88 5.5 Equazione di Bessel.................................. 89 5.6 Esercizi......................................... 92 6 Funzioni di variabile complessa 95 6.1 Definizioni, continuità, derivabilità.......................... 95 6.2 Integrazione....................................... 97 6.3 Serie di potenze..................................... 104 6.3.1 Derivazione e integrazione di serie di potenze................ 107 6.4 Serie di Taylor e serie di Laurent........................... 108 6.5 Analisi di una funzione nell’intorno di un punto singolare............. 109 6.5.1 Somma dei residui............................... 111 6.6 Formula di Eulero................................... 112 6.7 Lemma di Jordan.................................... 114 6.7.1 Poli sull’asse reale............................... 114 6.7.2 La funzione sinc................................ 115 6.7.3 Forma modificata del lemma di Jordan.................... 116 Chapter 1 Funzioni di più variabili In questo capitolo studiamo funzioni di n variabili reali, n > 1, a valori reali. Per questo è utile riferirsi a Rn , lo spazio delle n-ple ordinate di numeri reali. Stabiliamo le nozioni di continuità e differenziabilità e il teorema di Taylor. 1.1 Intorni e segmenti Studiamo funzioni definite su sottoinsiemi di Rn. Usiamo la notazione x = (x1 , x2 ,..., xn) per l’insieme delle variabili. Ad x è associato un punto nello spazio cartesiano n-dimensionale. Si usa anche il simbolo x con il significato di x. Il carattere grassetto, x, evidenzia che la quantità non è uno scalare (reale o complesso). Per gli elementi di Rn si definiscono le due operazioni che a x = (x1 , x2 ,..., xn) e y = (y1 , y2 ,..., yn) associano x + y = (x1 + y1 , x2 + y2 ,..., xn + yn ), αx = (αx1 , αx2 ,..., αxn), dove α ∈ R. Queste due operazioni rendono Rn uno spazio vettoriale, detto anche spazio Euclideo n-dimensionale. Ad ogni n-pla, ossia ad ogni vettore, è associata una lunghezza |x| = (x21 + x22 +... + x2n )1/2 , che può essere vista come la distanza del punto dall’origine. La distanza tra due punti x, y è data da |x − y| = ((x1 − y1 )2 + (x2 − y2 )2 +... + (xn − yn )2 )1/2. Il prodotto scalare (x, y) : Rn × Rn → R tra due vettori x, y è definito da (x, y) = x1 y1 + x2 y2 +... + xn yn ; in tre dimensioni è più usuale la notazione x · y. Come per ogni prodotto scalare valgono le proprietà (x, y) = (y, x), (αx + βy, w) = α(x, w) + β(y, w), (x, x) ≥ 0, = 0 ⇔ x = 0. Si ha |x| = (x, x)1/2. Vale la disuguaglianza di Cauchy-Schwarz |x, y| ≤ |x| |y|. 3 4 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI L’uguaglianza vale se e solo se x = αy. Inoltre vale la disuguaglianza triangolare |x + y| ≤ |x| + |y|. Se y 6= 0 entrambe le relazioni sono banalmente vere. Per dimostrare la disuguaglianza di Cauchy-Schwarz consideriamo due vettori x, y, con y 6= 0, e poniamo w = x − (x, y)y/(y, y). Segue che (w, y) = 0 e quindi diciamo che w è ortogonale a y; un vettore x è sempre scrivibile come la somma di un vettore parallelo a y, ossia (x, y)y/(y, y) e un vettore ortogonale, w. Ora, (x, y) (x, y) (x, y) 2 2 (x, y) (x, y) 2 2 |x|2 = ( y + w, y + w) = |y| + |w|2 + 2( y, w) = |y| + |w|2 (y, y) (y, y) (y, y) (y, y) (y, y) Poiché |w|2 ≥ 0 segue che (x, y) 2 2 |x|2 ≥ |y| , |x|2 |y|2 ≥ |(x, y)|2. (y, y) Estraendo la radice si ha la disuguaglianza cercata. Inoltre segue che vale l’uguaglianza se w = 0 ossia se x e y sono paralleli. Per la disuguaglianza triangolare osserviamo che (x + y, x + y) = |x|2 + |y|2 + 2(x, y) ≤ |x|2 + |y|2 + 2|x| |y| = (|x| + |y|)2. Estraendo la radice si ha il risultato cercato. Dati x, u ∈ Rn , l’insieme dei punti x + tu, t∈R può essere visto come la retta che passa per x e ha la direzione di u. La rappresentazione di una retta non è unica. Ad esempio, se u = αv, si ha x + tu = x + tαv = x + τ v, con τ = αt, rappresenta gli stessi punti e quindi la stessa retta allorché τ ∈ R. Se si vuole la retta che passa per x e ha la direzione di u scriviamo y = x + tu. Cosı̀ la retta passa per i due punti x, x + u per t = 0, 1, rispettivamente. L’insieme di punti y = x + tu, t ∈ [t1 , t2 ], rappresenta il segmento che unisce x + t1 u con x + t2 u. Allorché t ∈ [0, 1] il punto corrente y descrive il segmento che unisce x e x + u. Cosı̀, posto x̂ = x + u, si ha y = x + tu = x + t(x̂ − x) = (1 − t)x + tx̂. Dati i due punti x, x̂, y = (1 − t)x + tx̂, t ∈ R, è l’equazione della retta che passa per i due punti dati. Se  > 0, l’intorno  di x ∈ Rn è l’insieme N (x) = {y : |y − x| < }. 1.2. FUNZIONI CONTINUE 5 Invece diciamo che Sr (x) = {y : |y − x| ≤ r} è la sfera di centro x e raggio r (la frontiera è contenuta). Come applicazione dei precedenti concetti, mostriamo che se due punti x̃, x̂ appartengono a un intorno di x, il segmento che li unisce è contenuto nell’intorno. Se x̃, x̂ ∈ N (x) allora |x̃ − x| < , |x̂ − x| < . Il segmento che unisce x̃, x̂ è l’insieme dei punti (1 − t)x̃ + tx̂, t ∈ [0, 1]. Ma (1 − t)x̃ + tx̂ − x = (1 − t)(x̃ − x) + t(x̂ − x) e applicando la disuguaglianza triangolare si ottiene |(1 − t)x̃ + tx̂ − x| = |(1 − t)(x̃ − x) + t(x̂ − x)| ≤ |(1 − t)(x̃ − x)| + |t(x̂ − x)| = (1 − t)|x̃ − x| + t|x̂ − x| < (1 − t) + t = . Un aperto S ⊂ Rn è connesso se, per ogni coppia di punti in S, esiste una poligonale che li congiunge. 1.2 Funzioni continue Sia f : D ⊂ Rn → R. Si dice che f (x) → l per x → x̂, lim f (x) = l, x→x̂ se x̂ ∈ D e, per ogni  > 0 esiste δ > 0 tale che 0 < |x − x̂| < δ =⇒ |f (x) − l| < . Si dimostra che, se esiste, il limite è unico. Se f (x) → l1 , g(x) → l2 per x → x̂ allora f l1 (f ± g)(x) → l1 ± l2 , (f g)(x) → l1 l2 , (x) → , g l2 la condizione sul rapporto valendo solo per l2 6= 0. Si dice che f è continua in (un intorno di) x̂ se lim f (x) = f (x̂) x→x̂ ossia se, ∀ > 0, ∃δ > 0: 0 < |x − x̂| < δ =⇒ |f (x) − f (x̂)| < . 6 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI 1.3 Derivate parziali e funzioni differenziabili Iniziamo con l’esame del comportamento di f lungo la retta passante per x e diretta lungo e. Per facilitare l’interpretazione geometrica richiediamo che |e| = 1 e quindi che e sia un versore. La funzione f (x + te) fornisce i valori di f lungo la retta passante per x e con la direzione di e. Fissati x, e, possiamo riguardare f (x + te) come una funzione della variabile t ∈ R, h(t) := f (x + te), t ∈ R. Supponiamo che f (e quindi h) sia derivabile per ogni e. In particolare possiamo scegliere e come uno dei vettori e1 = (1, 0, 0,..., 0), e2 = (0, 1, 0,..., 0),...., en = (0, 0,..., 0, 1). Se e = ei allora al variare di t varia la i-esima variabile mentre le altre sono mantenute fissate. Per definizione poniamo f (x + tei ) − f (x) f (x1 ,..., xi−1, xi + t, xi+1 ,..., xn) − f (x1 ,..., xi−1, xi, xi+1 ,..., xn) ∂xi f (x) := lim = lim t→0 t t→0 t Ad esempio, se f (x, y, z) = 3xyz + 2x2 + z 2 si ha ∂x f = 3yz + 4x, ∂y f = 3xz, ∂z f = 3xy + 2z. Se f, g sono derivabili rispetto a xi allora ∂xi (f + g) = ∂xi f + ∂xi g, ∂xi (f g) = ∂xi f g + ∂xi g, e, se g 6= 0 nel punto in questione, g∂xi f − f ∂xi g ∂xi f /g =. g2 Se una derivata parziale è derivabile possiamo definire la derivata seconda. Iterando possiamo definire la derivata parziale di f di ordine r, ∂xir ∂xir−1...∂xi1 f. Le derivate seconde ∂y ∂x f e ∂x ∂y f possono differire. Il teorema seguente fornisce una con- dizione per cui le due derivate sono uguali. Teorema. Supponiamo che f, ∂x f, ∂y f , e ∂y ∂x f esistano e siano continue in un intorno N di (x0 , y0 ). Allora ∂x ∂y f esiste in (x0 , y0 ) e (∂y ∂x f )(x0 , y0 ) = (∂x ∂y f )(x0 , y0 ). Per dimostrarlo, sia  > 0 e scegliamo δ tale che Sδ = {(x, y) : |x − x0 | < δ, |y − y0 | < δ} sia in N e, per la continuità di ∂y ∂x f , (x̂, ŷ) ∈ Sδ =⇒ |∂y ∂x f (x̂, ŷ) − ∂y ∂x f (x0 , y0 )| < . Poniamo g(h, k) = f (x0 + h, y0 + k) − f (x0 + h, y0 ) − f (x0 , y0 + k) + f (x0 , y0 ) 1.3. DERIVATE PARZIALI E FUNZIONI DIFFERENZIABILI 7 con |h|, |k| < δ. Si ha g(h, k) = φ(x0 + h) − φ(x0 ), φ(x) := f (x, y0 + k) − f (x, y0 ). Poiché φ0 (x) = ∂x f (x, y0 + k) − ∂x f (x, y0 ), dal teorema del valor medio segue che g(h, k) = φ0 (x̂)h = [∂x f (x̂, y0 + k) − ∂x f (x̂, y0 )]h e ∂x f (x̂, y0 + k) − ∂x f (x̂, y0 ) = ∂y ∂x f (x̂, ŷ)k e quindi g(h, k) = (∂y ∂x f )(x̂, ŷ)hk. Ora, |h|, |k| < δ implica g(h, k) − (∂y ∂x f )(x0 , y0 ) = |(∂y ∂x f )(x̂, ŷ) − (∂y ∂x f )(x0 , y0 )| <  hk Questa condizione, valida per |k| < δ, vale anche per k → 0 mentre g(h, k) f (x0 + h, y0 + k) − f (x0 + h, y0 ) f (x0 , y0 + k) − f (x0 , y0 ) lim = lim − lim k→0 hk k→0 hk k→0 hk ∂y f (x0 + h, y0 ) − ∂y f (x0 , y0 ) =. h Pertanto, per 0 < |h| < δ, g(h, k) ∂y f (x0 + h, y0 ) − ∂y f (x0 , y0 )  ≥ lim − (∂y ∂x f )(x0 , y0 ) = − (∂y ∂x f )(x0 , y0 ). k→0 hk h Passando al limite per h → 0 si ha |(∂x∂y f )(x0 , y0 ) − (∂y ∂x f )(x0 , y0 )| ≤ . Dall’arbitrarietà di  segue la conclusione. Più in generale si dimostra che se la funzione e le derivate fino ad un certo ordine r sono continue allora scambiando l’ordine di derivazione il risultato non cambia. 1.3.1 Funzioni differenziabili Con funzioni di più variabili può accadere che una funzione derivabile (parzialmente) non sia continua. Ad esempio, se ( xy , (x, y) 6= (0, 0), f (x, y) = x + y2 2 0, (x, y) = (0, 0) si ha f (h, 0) − f (0, 0) f (0, k) − f (0, 0) ∂x f (0, 0) = lim = 0, ∂y f (0, 0) = lim =0 h→0 h k→0 k ma f non è continua; lungo y = x si ha f = 1/2 comunque prossimo all’origine sia il punto. 8 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI Una condizione più forte, che implica la continuità, è la differenziabilità che può essere vista come l’estensione della derivabilità da una a più variabili. Si dice che f è differenziabile in x̂ se esistono delle costanti m1 , m2 ,..., mn tali che P f (x) − f (x̂) − i mi (xi − x̂i ) lim = 0. x→x̂ |x − x̂| Mostriamo che se f è differenziabile allora ha derivate parziali. Sia k in {1, 2,..., n} e x = P x̂ + tek. Come conseguenza |x − x̂| = |t| e i mi (xi − x̂i ) = mk t. Per la differenziabilità deve essere f (x̂ + tek ) − f (x̂) − mk t f (x̂ + tek ) − f (x̂) 0 = lim = lim − mk. t→0 t t→0 t Ne segue che deve esistere il limite, che è ∂xk f (x̂), e che mk = ∂xk f (x̂), k = 1, 2,..., n. Dalla definizione segue che f è differenziabile se X w(x) := f (x) − f (x̂) − ∂xi f (x̂)(xi − x̂i ) i soddisfa w(x) lim = 0. x→x̂ |x − x̂| Ne segue che X f (x) − f (x̂) = ∂xi f (x̂)(xi − x̂i ) + o(|x − x̂|), i per una funzione differenziabile la variazione della funzione, tra due punti, è data da una parte lineare con coefficienti uguali alle derivate parziali, e una parte che tende a zero più rapidamente della variazione del punto, x − x̂. Se f è differenziabile allora è continua. Infatti, sia X 1/2 M= |∂xi f (x̂)|. i Per la disuguaglianza di Cauchy-Schwarz si ha X ∂xi f (x̂)(xi − x̂i ) ≤ M |x − x̂|. i Allora |w(x)|  |f (x) − f (x̂)| ≤ M + |x − x̂|. |x − x̂| Ne segue che x → x̂ implica f (x) → f (x̂). Vediamo una condizione sufficiente per la differenziabilità. Teorema. Se le derivate parziali ∂xi f esistono e sono continue in un intorno di x̂ allora f è differenziabile in x̂. Se le derivate parziali sono continue, in x̂, allora per ogni  > 0 esiste δ tale che |x − x̂| < δ =⇒ |∂xi f (x) − ∂xi f (x̂)| < . Ora, f (x) − f (x̂) = f (x1 ,..., xn−1, xn ) − f (x1 ,..., xn−1, x̂n ) + f (x1 ,..., xn−1, x̂n ) − f (x1 ,..., x̂n−1, x̂n) +... + f (x1 , x̂2 ,..., x̂n) − f (x̂1 , x̂2 ,..., x̂n) 1.3. DERIVATE PARZIALI E FUNZIONI DIFFERENZIABILI 9 Per il teorema di Lagrange, f (x1 ,..., xn−1, xn )−f (x1 ,..., xn−1, x̂n ) = [∂xn f (x1 ,..., xn−1, ξn)](xn −x̂n ), ξn = x̂n +θn (xn −x̂n ), θn ∈ (0, 1),.........................., f (x1 , x̂2 ,..., x̂n)−f (x̂1 , x̂2 ,..., x̂n) = [∂x1 f (ξ1 , x̂2 ,..., x̂n)](x1−x̂1 ), ξ1 = x̂1 +θ1 (x1 −x̂1 ), θ1 ∈ (0, 1). Sia Sδ = {x : |x − x̂| < δ}. I punti (x1 ,..., xn−1, ξn),..., (ξ1, x̂2,..., x̂n) stanno in Sδ. Infatti, poiché ξn − x̂n = θ(xn − x̂n ),...., ξ1 − x̂1 = ν(x1 − x̂1 ), si ha |(x1 ,..., xn−1, ξn ) − (x̂1 ,..., x̂n−1, x̂n )| = |(x1 − x̂1 ,..., xn−1 − x̂n−1 , θ(xn − x̂n )| < δ.........................., |(ξ1 , x̂2 ,..., x̂n) − (x̂1 , x̂2 ,..., x̂n)| = |(ν(x1 − x̂1 ), 0,..., 0)| < δ. Allora ∂xn f (x1 ,..., xn−1, ξn) = ∂xn f (x̂) + νn (xn − x̂n ),...., ∂x1f (ξ1 , x̂2 ,..., x̂n) = ∂x1 f (x̂) + ν1 (x1 − x̂1 ), con ν1 ,..., νn → 0 per x → x̂. Sostituendo si ha X f (x) − f (x̂) = [∂xi f (x̂) + νi ](xi − x̂i ). i Ne segue che f è differenziabile. Si dice che f è differenziabile con continuità in S ⊆ Rn se S è contenuto in un aperto in cui le derivate parziali ∂x1 f,..., ∂xn f sono continue. In tal caso f è differenziabile in ogni punto di S. Mostriamo un aspetto geometrico legato alla differenziabilità. Sia z = f (x, y) una superficie, in R3 , con (x, y) ∈ D ⊂ R2. La superficie z = f (x̂) + ∂x f (x̂)(x − x̂) + ∂y f (x̂)(y − ŷ) è un piano perché, posto ẑ = f (x̂), x̂ = (x̂, ŷ), si ha (∂x f (x̂))x + (∂y f (x̂))y − z − [(∂xf (x̂))x̂ + (∂x f (x̂))ŷ − ẑ] = 0 oppure (∂x f (x̂))(x − x̂) + (∂x f (x̂))(y − ŷ) − (z − ẑ) = 0, forma canonica di scrittura dell’equazione di un piano, il piano passante per (x̂, ŷ, f (x̂, ŷ)) e ortogonale a (∂x f (x̂)), ∂y f (x̂)), −1). La formula f (x) = f (x̂) + ∂x f (x̂))(x − x̂) + ∂y f (x̂))(y − ŷ) + o(|x − x̂|) dice che f (x) differisce dalla corrispondente z della proiezione sul piano, f (x̂) + ∂x f (x̂))(x − x̂) + ∂y f (x̂))(y − ŷ), per un infinitesimo di ordine superiore rispetto a x − x̂ e quindi il piano dato è quello che ha il miglior contatto (la maggior vicinanza) con la superficie ossia è il piano tangente. 10 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI 1.3.2 Funzioni composte Sia h(u) := f (g(u)) con g = (g1 , g2 ,..., gn). Vediamo in quali condizioni h è differenziabile. Teorema (Regola della catena). Sia f differenziabile in x̂ ∈ Rn e siano g1 , g2,..., gn differenziabili in û ∈ Rm , x̂ = g(û). La funzione composta h definita da h(u) = f (g(u)) è differenziabile in û e si ha X X f (x) − f (x̂) = (∂xi f ) (∂uk gi)(uk − ûk ) + o(|u − û|). i k Siccome g è differenziabile in û si ha X gi(u) − gi (û) = [(∂uk gi ) + Λik ](uk − ûk ), k le derivate ∂uk gi essendo calcolate in û e Λik → 0 per u → û. D’altra parte, siccome f è differenziabile in x̂ si ha X f (x) − f (x̂) = [(∂xi f ) + λi](xi − x̂i ), i le derivate ∂xi f essendo calcolate in x̂ e λi → 0 per x → x̂. Poniamo x = g(u), x̂ = g(û). Per la continuità delle gi segue che u → û =⇒ x → x̂. Sostituendo si ha X X X X X X f (x)−f (x̂) = (∂xi f ) (∂uk gi )(uk − ûk )+{ (∂xi f ) Λik + λi [∂uk gi +Λik ]}(uk − ûk ) i k i k i k da cui segue la conclusione. Come corollario possiamo valutare la derivata parziale di h rispetto a uj. Poniamo u = û + tej , uk − ûk = tδjk. Per definizione, h(û + tej ) − h(û) f (g(û + tej )) − f (g(û)) ∂uj h = lim = lim. t→0 t t→0 t Sostituendo l’espressione di f (g(u)) − f (g(û)) si ha X ∂uj h = (∂xi f )(∂uj gi ). i Inoltre se u = t ∈ R allora h(t) = f (x(t)) e X h0 = (∂xi f )x0i , i 1.3. DERIVATE PARZIALI E FUNZIONI DIFFERENZIABILI 11 dove 0 denota la derivata rispetto a t. Se x = x̂ + ta, con a costante, allora x0i = ai e X h0 = (∂xi f )(x̂)ai. i In tal caso si dice che h0 è la derivata direzionale di f nella direzione a. Nel caso generale riguardiamo h0 come la derivata di f nella direzione x0. Torniamo a h(t) = f (x(t)). Possiamo riguardare h0 come funzione di t e valutare la derivata di X h0 (t) = (∂xi f )(x(t))x0i(t). i Per (∂xi f )(x(t)) si può ripetere quanto detto per f e quindi X [(∂xi f )(x(t))]0 = ∂xj ∂xi f (x(t))x0j (t) j e quindi X X h00 (t) = ∂xj ∂xi f (x(t))x0j (t)x0i (t) + (∂xi f )(x(t))x00i (t), i,j i X h000 (t) = ∂xk ∂xj ∂xi f (x(t))x0k (t)x0j (t)x0i (t) i,j,k X X + ∂xj ∂xi f (x(t))(x00j (t)x0i (t) + 2x0j (t)x00i (t)) + (∂xi f )(x(t))x000 i (t). i,j i Se, come spesso è il caso, x(t) è lineare (in t), allora X h000(t) = ∂xk ∂xj ∂xi f (x(t))x0k (t)x0j (t)x0i (t). i,j,k Per generalizzare questa formula osserviamo che derivando p volte si deriva i1 volte rispetto a x1 ,..., in volte rispetto a xn con la condizione i1 +... + in = p. Per ogni p, data l’invarianza rispetto all’ordine di derivazione, si hanno p! volte le derivate con i1 ,..., in fissati. Di queste, i1 ! sono coincidenti perché corrispondono a scambi di x1 tra loro, e cosı̀ via per x2 ,..., xn. Pertanto si può scrivere X p! h(p)(t) = ∂ i1 ∂ i2 · · · ∂xinn f (x(t))[x01(t)]i1 [x02 (t)]i2 · · · [x0n (t)]in. p i1 !i2 ! · · · in ! x1 x2 Come ulteriore conseguenza, mostriamo il Teorema (valor medio). Sia f continua in x̃, x̂ e differenziabile sul segmento che unisce x̂ e x̃. Allora esiste un punto y del segmento, distinto da x̂ e x̃ tale che X f (x̃) − f (x̂) = (∂xi f )(y)(x̃i − x̂i ). i Infatti, i punti del segmento sono dati da x(t) = tx̃ + (1 − t)x̂, t ∈ [0, 1]. e quindi x0 (t) = x̃ − x̂. 12 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI Per il teorema di Lagrange, con h derivabile, si ha h(1) − h(0) = h0 (ξ), ξ ∈ (0, 1). Posto h(t) = f (x(t)), segue X f (x̃) − f (x̂) = (∂xi f )(y)(x̃i − x̂i ). i con y = x(ξ), ξ ∈ (0, 1). 1.4 Formula di Taylor Utilizzando la formula di Taylor per funzioni di una variabile è ora possibile dimostrare l’analogo risultato per funzioni di più variabili. Teorema (di Taylor). Sia f : Rn → R e le sue derivate parziali, di ordine ≤ k, differenziabili sul segmento tra x̂ e x. Allora esiste un punto x0 sul segmento tale che k X X r! f (x) = ∂ i1 ∂ i2 · · · ∂xinn f (x̂)(x1 − x̂1 )i1 (x2 − x̂2 )i2 · · · (xn − x̂n )in i1 !i2 ! · · · in ! x1 x2 r=0 i1 +...+in =r X 1 + ∂ i1 ∂ i2 · · · ∂xinn f (x0 )(x1 − x̂1 )i1 (x2 − x̂2 )i2 · · · (xn − x̂n )in , i1 !i2 ! · · · in ! x1 x2 i1 +...+in =k+1 Sia x − x̂ x̃(t) = x̂ + ta, a=. |x − x̂| Al variare di t ∈ [0, |x − x̂|], x̃(t) descrive il segmento che unisce x̂ a x. Poniamo h(t) = f (x̃(t)) e quindi h(0) = f (x̂), h(|x − x̂|) = f (x). Dalla formula di Taylor in una variabile si ha k X h(p) (0) h(k+1) (τ ) k+1 h(t) = tp + t , τ ∈ (0, t). p=0 p! (k + 1)! Ora, X h0 (t) = ∂xi f (x̃(t))ai, i X h00 (t) = ∂xj ∂xi f (x̃(t))ai aj. i,j Iterando si ha X p! h(p) (0) = ∂ i1 ∂ i2 · · · ∂xinn f (x̂)(a1 )i1 (a2 )i2 · · · (an )in , i1 !i2 ! · · · in ! x1 x2 i1 +...+in =p e X (k + 1)! i1 i2 h(k+1) (τ ) = ∂ ∂ · · · ∂xinn f (x̂ + τ (x − x̂))(a1 )i1 (a2 )i2 · · · (an )in , i1 !i2 ! · · ·in ! x1 x2 i1 +...+in =k+1 1.5. MASSIMI E MINIMI 13 Sostituendo nella formula di Taylor in una variabile X p! h(t) = ∂ i1 ∂ i2 · · · ∂xinn f (x̂)(a1 )i1 (a2 )i2 · · · (an )in tp + Rp (t), i1 !i2 ! · · · in ! x1 x2 i1 +...+in =p con X (k + 1)! i1 i2 Rp(t) = ∂ ∂ · · · ∂xinn f (x̂+τ (x−x̂))(a1 )i1 (a2 )i2 · · · (an )in tp+1 , τ ∈ (0, t), i1 !i2 ! · · · in ! x1 x2 i1 +...+in =k+1 in t = |x − x̂| si ottiene la formula di Taylor cercata con x0 = x̃(τ ), τ ∈ (0, t). Se le derivate parziali ∂xi11 ∂xi22 · · · ∂xinn f sono limitate segue che Rp (|x − x̂|) = o(|x − x̂|p). Per fissare le idee possiamo vedere la formula nel caso particolare di due variabili, x1 = x, x2 = y. Si ha k X r X 1 f (x, y) = ∂ i ∂ r−i f (x̂, ŷ)(x − x̂)i (y − ŷ)r−i i!(r − i)! x y r=0 i=0 k+1 X 1 + ∂ i ∂ k+1−i f (x̃, ỹ)(x − x̂)i (y − ŷ)k+1−i. i!(k + 1 − i)! x y i=0 Se ora consideriamo f dipendente da una sola variabile, diciamo x, allora poniamo i = r e i = k + 1 nelle due somme ottenendo k X 1 r 1 f (x) = ∂x f (x̂)(x − x̂)r + ∂ k+1 f (x̃)(x − x̂)k+1 , r! (k + 1)! x r=0 come doveva essere. 1.5 Massimi e minimi Diciamo che x̂ è un punto di estremo locale se esiste un intorno |x − x̂| < δ, nel dominio della funzione, in cui f (x) − f (x̂) non cambia segno. In particolare, x̂ è un punto di massimo locale se f (x) ≤ f (x̂) o un punto di minimo locale se f (x) ≥ f (x̂) nell’intorno. Vediamo una condizione necessaria per l’estremo locale. Teorema. Sia f definita in un intorno di x̂ in Rn e supponiamo che le derivate parziali ∂x1 f,..., ∂xn f esistano. Allora x̂ è un punto di estremo locale di f solo se ∂xi f (x̂) = 0, i = 1, 2,..., n. Per questo, consideriamo i versori e1 ,..., en e poniamo gi (t) = f (x̂ + tei ), i = 1, 2,..., n. 14 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI La funzione gi è derivabile e gi0 (0) = ∂xi f (x̂). Inoltre gi ha un estremo in t = 0 e quindi la sua derivata è nulla, in t = 0. Ne segue che ∂x1 f (x̂) = 0. Supponiamo che valga la disuguaglianza stretta f (x) < f (x̂) o f (x) > f (x̂) per 0 < |x − x̂| < δ. Allora f (x) − f (x̂) < 0 o f (x) − f (x̂) > 0 a seconda che si abbia un massimo o un minimo, con 0 < |x − x̂| < δ. Per il teorema precedente le derivate prime devono essere nulle e quindi se x̂ è un punto di estremo si ha f (x) = f (x̂) + f2 (x) + o(|x − x̂|2 ) con X 1 f2 (x) := ∂ i1 ∂ i2 · · · ∂xinn f (x̂)(x1 − x̂1 )i1 (x2 − x̂2 )i2 · · · (xn − x̂n )in. i1 !i2 ! · · ·in ! x1 x2 i1 +..+in =2 Poiché f (x) − f (x̂) f2 (x) o(|x − x̂|2 ) = + |x − x̂|2 |x − x̂|2 |x − x̂|2 segue che, in un intorno opportuno 0 < |x − x̂| < γ < δ, f (x) − f (x̂) f2 (x) sgn 2 = sgn. |x − x̂| |x − x̂|2 Di conseguenza, se f2 (x) > 0 per 0 < |x − x̂| < γ allora x̂ è un punto di minimo, se f2 (x) < 0 allora x̂ è un punto di massimo. In generale f2 è una forma quadratica delle quantità xk − x̂k. Se la forma quadratica è definita positiva (> 0 per ogni x nell’intorno) allora si ha un minimo, se definita negativa si ha un massimo. Per semplicità vediamo il caso n = 2. Allora 1 f2 (x) = Ajk (xj − x̂j )(xk − x̂k ), Ajk := ∂xj ∂xk f. 2 Pertanto la definitezza di f2 è equivalente alla definitezza della matrice simmetrica A; se A è definita positiva si ha un minimo, se è definita negativa si ha un massimo. Se non è definita allora f non ha un estremo in x̂. 1.5.1 Matrici definite Una matrice simmetrica A è definita positiva se Ajk ξj ξk > 0 per ogni ξ ∈ Rn , ξ non banale. Si dimostra che A è positiva se e solo se gli autovalori λ1 ,..., λn sono (reali e) positivi. Con la limitazione n = 2, troviamo ora condizioni, su A, necessarie e sufficienti per la definitezza. Gli autovalori λ sono soluzioni dell’equazione caratteristica 0 = det[A − λ1l] = λ2 − (A11 + A22 )λ + A11 A22 − A212. Si ha q q λ± = A11 + A22 ± (A11 + A22 )2 − 4(A11 A22 − A212 ) = A11 + A22 ± (A11 − A22 )2 + 4A212 1.6. FUNZIONI DEFINITE IMPLICITAMENTE 15 Ne segue che la semplice simmetria assicura la realtà degli autovalori, come è vero in generale. Ora λ± > 0 solo se A11 + A22 > 0, altrimenti λ− < 0. Se A11 > 0, A22 < 0, o viceversa, si ha q A11 + A22 < (A11 − A22 )2 + 4A212 e quindi λ− < 0. Allora deve essere A11 , A22 > 0. In tal caso q λ+ = A11 + A22 ± (A11 − A22 )2 + 4A212 > 0. D’altra parte, da q λ− = A11 + A22 − (A11 + A22 )2 − 4(A11 A22 − A212 ) > 0 se A11 A22 − A212 > 0. Pertanto A11 , A22 , A11 A22 − A212 > 0 sono necessarie e sufficienti per avere λ± > 0. In realtà bastano le condizioni A11 , A11 A22 − A212 > 0, dalle quali segue che deve essere anche A22 > 0. Una matrice B è definita negativa se −B è definita positiva e quindi se 2 −B11 > 0, B11 B22 − B12 >0 ossia 2 B11 < 0, B11 B22 − B12 > 0. 1.6 Funzioni definite implicitamente Per semplicità ci limitiamo a due variabili, x, y, e consideriamo equazioni della forma f (x, y) = 0. Ci chiediamo sotto quali condizioni questa equazione fornisca una funzione y = g(x) tale che f (x, g(x)) = 0 in un opportuno intervallo per x. Assumiamo f differenziabile e ∂x f, ∂y f non entrambe nulle. Intanto deve esistere almeno un punto, diciamo (x0 , y0 ), in cui l’equazione è verificata, f (x0 , y0 ) = 0. La g cercata deve quindi soddisfare g(x0 ) = y0. Ora, se g esiste ed è derivabile, essendo f differenziabile possiamo derivare rispetto a x l’identità f (x, g(x)) = 0 ottenendo ∂x f (x, g(x)) + ∂y f (x, g(x))g 0(x) = 0. Assumiamo ∂y f 6= 0 in (x0 , y0 ) e quindi in un suo intorno. Allora possiamo scrivere ∂x f (x, g(x)) g 0 (x) = −. ∂y f (x, g(x)) 16 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI 1.7 Derivazione sotto il segno di integrale Data una funzione di due variabili f : D ⊂ R2 → R, consideriamo la funzione Z b F (t) = f (x, t)dx, a ossia l’integrale di f rispetto alla prima variabile mentre la seconda, t, ha il ruolo di un parametro. Vogliamo determinare la derivata F 0 di F ossia la derivata dell’integrale rispetto al parametro, t. Consideriamo il rapporto incrementale Z b F (t + h) − F (t) f (x, t + h) − f (x, t) = dx. h a h Supponiamo che f sia derivabile e che ∂t f sia continua, rispetto a t. Allora, per il teorema di Lagrange, f (x, t + h) − f (x, t) = ∂t f (x, t + θh), θ ∈ (0, 1). h Per la continuità di ∂t f si ha ∂t f (x, t + θh) = ∂t f (x, t) + w(x, t; h) e ∀ ∃δ : |h| < δ =⇒ |w| < . Sostituendo si ha Z b Z b F (t + h) − F (t) = ∂t f (x, t)dx + w dx h a a con Z b Z b w dx ≤ |w|dx ≤  (b − a). a a Passando al limite per h → 0 e utilizzando l’arbitrarietà di  segue che Z b 0 F (t) = ∂t f (x, t)dx. a Se, invece, il dominio di integrazione è illimitato, ad esempio b = ∞, allora assumiamo che f sia derivabile due volte rispetto a t e scriviamo f (x, t + h) − f (x, t) = ∂t f (x, t) + 12 ∂t2 f (x, t + θh)h. h Assumiamo inoltre che esista g tale che |∂t2 f (x, t)| ≤ g(x) con Z ∞ g(x)dx < ∞. a Allora ∞ ∞ F (t + h) − F (t) Z Z = ∂t f (x, t)dx + 1 2 ∂t2 f (x, t + θh)hdx. h a a Ora, Z ∞ Z ∞ ∂t2 f (x, t + θh)hdx ≤ |h| g(x)dx → 0 a a per h → 0. Ne segue che, passando al limite per h → 0, si ha Z ∞ 0 F (t) = ∂t f (x, t)dx. a 1.8. ESERCIZI 17 1.8 Esercizi Data l’equazione exp y − exp x + xy = 0, e denotata con g la funzione implicita tale che y = g(x), determinare g 0 (x, g(x)). Posto f (x, y) = exp y − exp x + xy, si ha ∂x f = − exp x + y, ∂y f = exp y + x. Per x + exp y 6= 0 si ha exp x − g(x) g 0 (x) =. x + exp x − xg(x) Data la funzione α 4 f (x, y) = x2 + xy + y , α > 0, 4 determinare eventuali punti di stazionarietà, caratterizzare i punti di estremo (massimo, minimo). Annullando le derivate parziali si ha 2x + y = 0, x + αy 3 = 0. Sostituendo y = −2x nella seconda si ha x(1 − 8αx2 ) = 0. I punti in cui si annullano le derivate prime sono: 1 1 1 1 (0, 0), ( √ , − √ ), (− √ , √ ). 2 2α 2α 2 2α 2α La matrice Hessiana è data da h ∂ 2f ∂x ∂y f i h 2 1 i x H= = ∂x ∂y f ∂y2 f 1 3αy 2 Pertanto h 2 1 i H(0, 0) = 1 0 e 1 1 1 1 h 2 1 i H( √ , − √ ) = H(− √ , √ ) =. 2 2α 2α 2 2α 2α 1 3/2 H(0, 0) non è definita. Si ha un minimo negli altri due punti di stazionarietà. Per determinare il comportamento in (0, 0) osservo che 1 1 f (x, y) = (x + y)2 + (αy 4 − y 2 ). 2 4 Sia f (0, y) sia f (x, 0) hanno un minimo nell’origine. Se ci muoviamo lungo x = −y/2 si ha 1 f (−y/2, y) = (αy 4 − y 2 ) < 0 se y 2 < 1/α. 4 e quindi f (−y/2, y) ha un massimo nell’origine. Pertanto f (x, y) ha un punto di stazionarietà nell’origine che non è né massimo, né minimo. 18 CHAPTER 1. FUNZIONI DI PIÙ VARIABILI Chapter 2 Funzioni di più variabili a valori vettoriali Definiamo le funzioni a valori vettoriali come un insieme ordinato di funzioni a valori reali. Cosı̀ scriviamo f : Rn → Rm intendendo che a x ∈ D ⊂ Rn viene associata la m-pla di valori (f1 (x), f2(x),..., fm(x)). Si dice anche che f è una trasformazione da Rn a Rm. 2.1 Continuità e differenziabilità Una trasformazione f è detta continua in x̂ se per ogni  > 0 esiste δ > 0 tale che |x − x̂| < δ =⇒ |f (x) − f (x̂)| < ; la prima lunghezza è quella di Rn , la seconda quella di Rm. Si scrive anche lim f (x) = f (x̂). x→x̂ Una trasformazione f : D ⊂ Rn → Rm , definita in un intorno di x̂ ∈ Rn , è differenziabile in x̂ se ogni sua componente fi è differenziabile in x̂. Teorema. Una trasformazione f : D ⊂ Rn → Rm , definita in un intorno di x̂ ∈ Rn , è differenzi- abile in x̂ se e solo se esiste una matrice m × n (costante) A tale che f (x) − f (x̂) − A(x − x̂) lim = 0, x→x̂ |x − x̂| con Aij = ∂xj fi (x̂). Per dimostrarlo, osserviamo che se f è differenziabile allora le sue componenti lo sono e quindi P fi (x) − fi (x̂) − j ∂xj fi (x̂)(xj − x̂j ) lim =0 x→x̂ |x − x̂| il che implica la formula vettoriale con Aij = ∂xj fi (x̂). Viceversa, se vale la formula vettoriale allora, per la generica componente i, si ha fi (x) − fi (x̂) − Aij (xj − x̂j ) lim = 0, x→x̂ |x − x̂| 19 20 CHAPTER 2. FUNZIONI DI PIÙ VARIABILI A VALORI VETTORIALI e quindi ogni fi è differenziabile e quindi lo è f. Ma se fi è differenziabile allora Aij = ∂xj fi (x̂) e quindi il teorema è dimostrato. Si dice affine una trasformazione h : Rn → Rm della forma h(x) = u + A(x − x̂), con u ∈ Rm costante, x̂ ∈ Rn costante e A ∈ Rm×n costante. Il significato del teorema è che una trasformazione differenziabile è approssimabile localmente con una trasformazione affine. La matrice A è detta matrice jacobiana della trasformazione. Se m = n la matrice è quadrata e se ne può considerare il determinante, Jf := det A, Aij = ∂xj fi , essendo sottinteso il punto in cui si considera la matrice. Ricaviamo una stima per funzioni differenziabili. Sia f : Rn → Rm differenziabile con continuità in un intorno di x̂. Allora, per ogni  > 0 esiste δ tale che per x, y in Nδ (x̂), |f (x) − f (y)| < (kA(x̂)k + )|x − y|. Consideriamo la funzione g(x) = f (x) − A(x̂)x. Chiamiamo con B la matrice associata a g, B(x) = A(x) − A(x̂). Siccome A è continua allora B → 0 per x → x̂. Pertanto, per ogni  > 0 esiste δ tale che  |x − x̂| < δ =⇒ |∂xj gi (x)| < √ mn per ogni i = 1,..., m e j = 1,..., n. Sia Nδ = {x : |x − x̂| < δ}. Per il teorema della media (di Lagrange) si ha Xn gi(x) − gi (y) = ∂xj gi (x̃i )(xj − yj ), j=1 con x̃i appartenente al segmento che unisce x a y. Assumiamo x, y ∈ Nδ (x̂) e quindi x̃i ∈ Nδ (x̂). Per la disuguaglianza di Cauchy-Schwarz si ha n n n n 2 X X X X 2 2 ∂xj gi (x̃i)(xj − yj ) ≤ [∂xj gi(x̃i )] (xj − yj ) = [∂xj gi (x̃i)]2 |x − y|2 j=1 j=1 j=1 j=1 e quindi n X 2 2 [gi (x) − gi (y)] ≤ [∂xj gi (x̃i)]2 |x − y|2 < |x − y|2. m j=1 Sommando su i ed estraendo la radice si ottiene |g(x) − g(y)|2 < |x − y|. Ora, f (x) − f (y) = g(x) − g(y) + A(x̂)(x − y). Utilizzando la disuguaglianza triangolare segue che |f (x) − f (y)| ≤ |g(x) − g(y)| + |A(x̂)(x − y)| < (kAk + )|x − y| e quindi si ha la conclusione. Questo mostra che localmente la continuità è indotta, quantitati- vamente, dalla norma della matrice A. 2.2. FUNZIONE INVERSA 21 2.2 Funzione inversa Limitiamo l’attenzione a trasformazioni f : Df ⊂ Rn → Rn. Allora se u1 = f1 (x), u2 = f2 (x),..., un = fn (x) possiamo dire che u = (u1 ,..., un) è l’immagine di x mediante f. Una trasformazione f è uno-uno o invertibile se x 6= y =⇒ f (x) 6= f (y). Denotiamo con Rf il range o immagine di f , Rf = {u : u = f (x), x ∈ Df }. Allora possiamo definire f −1 con Df −1 = Rf , Rf −1 = Df. Inoltre, f −1 (f (x)) = x, x ∈ Df ; f (f −1 (u)) = u, u ∈ Df −1. La trasformazione lineare u = l(x) =: Ax, tale che Rn → Rn , è invertibile se e solo se A è nonsingolare nel qual caso Rl = Rn e l−1 (u) = A−1 u. Vogliamo ora caratterizzare l’invertibilità di una trasformazione. Cominciamo con l’esame della trasformazione lineare    A11 A12 · · · A1n x1  A21 A22 · · · A2n   x2  f (x) = Ax = .....  .. .    .......  .  An1 An2 · · · Ann xn Se A è nonsingolare allora la trasformazione è invertibile e f −1 (u) = A−1 u. Si potrebbe pensare che se f è differenziabile con continuità (ovunque) e Jf 6= 0 in un insieme S allora f è invertibile in S. Non è vero, come si può vedere con un esempio. Se h exp(x) cos y i f (x, y) = exp(x) sin y allora h exp(x) cos y − exp(x) sin y i Jf (x, y) = det = exp(2x) 6= 0. exp(x) sin y exp(x) cos y Ma f non è invertibile, essendo periodica in y. Mostriamo ora che se A è nonsingolare in x̂ allora f è invertibile in un intorno di x̂. Sia 1 r=. k[A(x̂)]−1 k 22 CHAPTER 2. FUNZIONI DI PIÙ VARIABILI A VALORI VETTORIALI Se f : Rn → Rn è differenziabile con continuità in un intorno N (x̂), allora, per ogni  > 0, esiste δ tale che se x, y stanno in Nδ (x̂) si ha |f (x) − f (y)| > (r − )|x − y|. Poniamo g(x) = f (x) − A(x̂)x. Allora f (x) − f (y) = g(x) − g(y) + A(x̂)(x − y) e quindi possiamo scrivere la disuguaglianza |f (x) − f (y)| ≥ ||A(x̂)(x − y)| − |g(x) − g(y)||. Sappiamo che per ogni  > 0 esiste δ tale che, per x, y ∈ Nδ (x̂), |g(x) − g(y)| < |x − y|. Ora, siccome A(x̂) è invertibile si può scrivere x − y = [A(x̂)]−1 A(x̂)(x − y). Ne segue che |x − y| ≤ k[A(x̂)]−1 k|A(x̂)(x − y)| e quindi |A(x̂)(x − y)| ≥ r|x − y|. Sostituendo nella disuguaglianza per f (x) − f (y) si ha |f (x) − f (y)| > (r − )|x − y|, da cui segue l’invertibilità di f in Nδ (x̂). Osservazione. Per dimostrare la disuguaglianza |u + v| ≥ ||u| − |v|| possiamo seguire il procedimento seguente. Partiamo da |u + v|2 = |u|2 + 2u · v + |v|2. Applicando la disuguaglianza di Cauchy-Schwarz si ha |u · v| ≤ |u| |v|, u · v ≥ −|u| |v|. Allora |u + v|2 ≥ |u|2 − 2|u| |v| + |v|2 = (|u| − |v|)2. Estraendo la radice da |u + v|2 ≥ (|u| − |v|)2 si ha la conclusione. 2.3. TRASFORMAZIONI E MATRICI JACOBIANE 23 2.3 Trasformazioni e matrici jacobiane Sia f : Rn → Rn differenziabile con continuità. Una trasformazione f : Rn → Rn è regolare in un aperto S se f è 1-1 e derivabile con continuità in S e Jf (x) 6= 0 per ogni x ∈ S. Sia g differenziabile con continuità in Dg ⊂ Rf. Allora è definita la funzione composta (g ◦ f )(x) = g(f (x)). Mostriamo che h := g ◦ f è differenziabile ossia esiste una matrice C tale che g(f (x)) − g(f (x̂)) − C(x − x̂) lim = 0. x→x̂ |x − x̂| Se f è differenziabile in x̂ allora, per ogni , in Nδ (x̂) si ha |f (x) − f (x̂) − A(x − x̂)| <  |x − x̂|. Analogamente, se g è differenziabile in ŷ allora, per ogni ν, in Nγ (ŷ) si ha |g(y) − g(ŷ) − B(y − ŷ)| < ν |y − ŷ|. Con le identificazioni y = f (x), ŷ = f (x̂), sostituendo si ha |g(f (x)) − g(f (x̂)) − BA(x − x̂)| = o(|x − x̂|) e quindi g ◦ f è differenziabile e C = BA ossia Cpq = Bpk Akq = ∂yk gp ∂xq fk. In forma matriciale, ∂(h1 , h2 ,..., hn) ∂(g1, g2 ,..., gn) ∂(f1 , f2 ,..., fn) (x̂) = (f (x̂)) (x̂). ∂(x1 , x2 ,..., xn) ∂(y1 , y2 ,..., yn) ∂(x1 , x2 ,..., xn) In maniera analoga, proviamo il seguente Teorema (della funzione inversa). Sia f : Rn → Rn differenziabile con continuità in un aperto D ∈ Rn in cui Jf 6= 0. Se x̂ ∈ D, esiste un intorno di x̂ in cui g = f −1 è differenziabile con continuità e la matrice corrispondente a f −1 è l’inversa della matrice corrispondente a f. Sappiamo che f è localmente invertibile e quindi esiste g = f −1 in un dominio opportuno, D̂ ∈ D. Poiché f è differenziabile in x̂ ∈ D, possiamo scegliere D̂ in modo che x̂ ∈ D̂. Allora, per ogni  esiste δ tale che, in Nδ (x̂), |f (x) − f (x̂) − A(x − x̂)| < |x − x̂|. Poiché, nell’intorno Nδ (x̂) ⊂ D̂, f è invertibile si può scrivere |f (x) − f (x̂) − A(g(f (x)) − g(f (x̂)))| < |x − x̂|. Applicando A−1 si ha |A−1 [f (x) − f (x̂) − A(g(f (x)) − g(f (x̂)))| = |A−1 (f (x) − f (x̂)) − [g(f (x)) − g(f (x̂))]| ≤ kA−1 k|f (x) − f (x̂) − A(g(f (x)) − g(f (x̂)))| < kA−1 k |x − x̂|. 24 CHAPTER 2. FUNZIONI DI PIÙ VARIABILI A VALORI VETTORIALI Per l’invertibilità di A possiamo anche scrivere |f (x) − f (x̂)| > γ|x − x̂| con γ finito, non nullo. Allora  |g(f (x)) − g(f (x̂)) − A−1 (f (x) − f (x̂))| < |f (x) − f (x̂)| γ ossia g = f −1 è differenziabile in D̂ ∈ Rn , con continuità, e la matrice corrispondente a f −1 è l’inversa della matrice corrispondente a f. Vediamo alcuni esempi di trasformazioni. La trasformazione u = exp x cos y, v = exp x sin y ha matrice jacobiana ∂(u, v) h exp(x) cos y − exp(x) sin y i A= = ∂(x, y) exp(x) sin y exp(x) cos y e quindi Jf = exp(2x). Il determinante è non nullo in tutto R2 ma la trasformazione è invertibile in R × [0, 2π). Invece, u = x − y, v =x+y è definita su R2 , ∂(u, v) h 1 −1 i A= = ∂(x, y) 1 1 è nonsingolare in R2 e la trasformazione è invertibile in R2 , 1 1 x= (u + v), v= (−u + v). 2 2 Vediamo ora trasformazioni tra coordinate cartesiane e coordinate polari. 2.3.1 Coordinate polari Nel piano possiamo individuare i punti con coordinate cartesiane, x, y o coordinate polari r, θ, nella forma x = r cos θ, y = r sin θ. Allora ∂(x, y) h cos θ −r sin θ i =. ∂(r, θ) sin θ r cos θ Si ha ∂(x, y) det =r ∂(r, θ) e quindi la matrice è invertibile per r > 0. La trasformazione è regolare con la limitazione r > 0, θ ∈ [−π, π). Incidentalmente, ∂(r, θ) h ∂(x, y) i−1 =. ∂(x, y) ∂(r, θ) 2.4. MOLTIPLICATORI DI LAGRANGE 25 Nello spazio si usano le coordinate polari date dalla distanza, r, dall’angolo con l’asse z, θ ∈ [0, π], e dall’angolo, φ, rispetto al piano x, z. I termini longitudine e latitudine indicano l’angolo φ e l’angolo π/2 − θ. La trasformazione è data da x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ, con r ∈ [0, ∞), θ ∈ [0, π], φ ∈ [0, 2π). Si ha   sin θ cos φ r cos θ cos φ −r sin θ sin φ ∂(x, y, z)  = sin θ sin φ r cos θ sin φ r sin θ cos φ  ∂(r, θ, φ) cos θ −r sin θ 0 e   sin θ cos φ r cos θ cos φ −r sin θ sin φ det  sin θ sin φ r cos θ sin φ r sin θ cos φ  = r 2 sin θ. cos θ −r sin θ 0 Di conseguenza la trasformazione non è invertibile per r = 0 o θ = 0, π ossia sui punti dell’asse z. 2.4 Moltiplicatori di Lagrange Il problema riguarda la ricerca di estremi (massimi o minimi) soggetti a vincoli espressi da opportune funzioni. Per semplicità formale ci limitiamo a due variabili. Vogliamo determinare i punti di massimo o di minimo di f (x, y) con il vincolo nella forma φ(x, y) = c. L’idea sta nell’osservare che muovendoci lungo φ = c, si incontrano curve di livello di f. Se le due curve hanno tangente diversa muovendoci lungo φ = c troviamo via via valori crescenti o decrescenti di f. Il minimo o il massimo sono raggiunti allorché le curve f = costante e φ = costante sono tangenti. La condizione di tangenza può essere vista come il valore comune y 0 (x) o x0 (y) dato dalle due curve. Si può quindi scrivere ∂x f ∂x φ =. ∂y f ∂y φ Supponiamo che ∂y φ 6= 0 nel punto di estremo. Allora φ(x, y) = 0 individua una funzione y = g(x). Allora cerchiamo l’estremo di f (x, g(x)) rispetto alla variabile libera x. Deve essere f 0 (x) = ∂x f + (∂y f )g 0 (x) = 0. Ma g 0(x) deve avere lo stesso valore (stessa pendenza della tangente) fornito da ∂x φ + (∂y φ)g 0 (x) = 0. Sia ∂y f λ=−. ∂y φ Ovviamente λ[∂xφ + (∂y φ)g 0 (x)] + ∂x f + (∂y f )g 0 (x) = 0. 26 CHAPTER 2. FUNZIONI DI PIÙ VARIABILI A VALORI VETTORIALI Scegliamo λ in modo che sia ∂y f + λ∂y φ = 0 e quindi ∂x f + λ∂xφ = 0. Insieme a φ(x, y) = 0 abbiamo tre equazioni nelle tre incognite x, y, λ. Si noti che le tre equazioni possono essere viste come l’annullarsi delle derivate parziali, rispetto a x, y, λ, di f (x, y) + λφ(x, y). Generalizziamo il metodo nella maniera seguente. Cerchiamo l’estremo di f (x, y) con le condizioni φ(x, y) = 0 con x ∈ Rn , y ∈ Rp , φ ∈ Rp. Inoltre, assumiamo ∂(φ1 ,..., φp) det 6= 0. ∂(y1 ,..., yp) Possiamo riguardare y in termini delle rimanenti variabili x, y = g(x). Allora cerchiamo l’estremo libero di f (x, g(x)). Devono annullarsi le derivate parziali, p X ∂xi f + (∂yk f )∂xi gk = 0, i = 1,..., n, k=1 per la condizione di estremo e p X ∂xi φh + (∂yk φh )∂xi gk = 0, i = 1,..., n; h = 1,..., p, k=1 per i vincoli dati. Consideriamo p numeri λ1 ,..., λp e poniamo p X ∂yk f + λh∂yk φh = 0, k = 1,..., p. h=1 Questo è possibile perché abbiamo p equazioni lineari a determinante dei coefficienti non nullo, nelle formali incognite λ1 ,..., λp. Moltiplichiamo le equazioni di φh per λh , sommiamo su h e sommiamo l’equazione per f ottenendo le n equazioni p p p X X X ∂xi (f + λh φh ) + ∂yk (f + λh φh )∂xi gk = 0, i = 1,..., n. h=1 k=1 h=1 2.4. MOLTIPLICATORI DI LAGRANGE 27 Queste n equazioni corrispondono alle condizioni necessarie di estremo per la funzione p X f+ λh φh. h=1 In realtà, per la scelta dei λ si hanno le p equazioni p X ∂yk (f + λh φh ) = 0, k = 1,..., p. h=1 Rimangono le n equazioni p X ∂xi (f + λh φh ) = 0, i = 1,..., n. h=1 Infine valgono i p vincoli φk (x, y) = 0, k = 1,..., p. Si hanno cosı̀ 2p + n equazioni nelle 2p + n incognite x1 ,..., xn, y1 ,..., yp, λ1,..., λp. Le equazioni seguono riguardando formalmente Xp f+ λh φh h=1 come la funzione da estremizzare rispetto alle 2p + n incognite. 28 CHAPTER 2. FUNZIONI DI PIÙ VARIABILI A VALORI VETTORIALI 2.5 Esercizi Data la trasformazione di coordinate (cilindriche) x = r cos θ, y = r sin θ, z = z, determinare ∂(x, y, z) det. ∂(r, θ, z) Valutando le derivate parziali si ottiene   cos θ −r sin θ 0 ∂(x, y, z)  = sin θ r cos θ 0  ∂(r, θ, z) 0 0 1 da cui ∂(x, y, z) det = r. ∂(r, θ, z) Determinare i punti di minimo o di massimo di f (x, y) = xy sull0 ellisse x2 + 2y 2 = 1. Poniamo φ(x, y) = x2 + 2y 2 − 1. I punti dell’ellisse annullano φ. I punti cercati soddisfano il sistema y + 2λx = 0, x + 4λy = 0, x2 + 2y 2 − 1 = 0, con λ moltiplicatore di Lagrange. Dalle prime due si ottiene (1 − 8λ2 )x = 0 Deve essere x 6= 0 altrimenti y = −2λx darebbe y = 0 e (0, 0) non appartiene all’ellisse. Allora λ ha i valori 1 λ± = ± √. 2 2 I punti si trovano sulle rette 1 y = ∓ √ x. 2 Sostituendo nella terza equazione si trova 1 x± = ± √. 2 Si hanno quindi i punti (di stazionarietà) 1 1 1 1 P1 = ( √ , ), P2 = (− √ , − ) 2 2 2 2 √ in cui f = 1/2 2 e i punti 1 1 1 1 P3 = ( √ , − ), P4 = (− √ , ) 2 2 2 2 2.5. ESERCIZI 29 √ in cui f = −1/2 2; P1 e P2 sono punti di massimo, P3 e P4 sono punti di minimo. Possiamo risolvere il problema senza l’uso dei moltiplicatori di Lagrange studiando il com- portamento di f lungo l’ellisse. Anzitutto osserviamo che lungo la curva φ(x, g(x)) = 0 si ha 0 = φ0 = ∂x φ + ∂y φ g 0, e quindi x −g(x) + xg 0 (x) 1 x2 g 0 (x) = − , g 00 (x) = 2 =− [2 + 2 ]. 2g(x) 2g (x) 4g(x) g (x) Lo stesso risultato per g 00 si ottiene da 0 = φ00 = ∂x2 φ + ∂y2 φ (g 0)2 + ∂y φ g 00 sostituendo l’espressione di g 0. Ora, per f (x, g(x)) = xg(x) si ha f 0 (x) = g(x) + xg 0 (x), f 00 (x) = 2g 0(x) + xg 00 (x). Pertanto, come dev’essere, 2g 2 (x) − x2 f 0 (x) = 2g(x) si annulla nei punti di stazionarietà P1 - P4. Inoltre, sostituendo l’espressione di g 0 e g 00 si ha x 6g 2 (x) + x2 f 00 (x) = −. g(x) 4g 2 (x) √ √ Poiché x/g(x) = 1/ 2 in P1 e P2 , mentre x/g(x) = −1/ 2 in P3 e P4 , si ottiene √ f 00 (x, g(x)) = − 2, in P1 , P2 , √ f 00 (x, g(x)) = 2, in P3 , P4. Si ha quindi un massimo in P1 e P2 , un minimo in P3 e P4. Determinare i punti di minimo o di massimo di f (x, y) = x2 − 2xy sull0 ellisse x2 + 3y 2 − 1 = 0. Consideriamo la funzione g(x, y, λ) = x2 − 2xy + λ(x2 + 3y 2 − 1) e imponiamo l’annullarsi delle derivate prime, 2x − 2y + 2λx = 0, −2x + 6λy = 0. Se y = 0 allora anche x = 0, ma il punto x = 0, y = 0 non appartiene alla curva e quindi non è soluzione del problema. Allora poniamo y 6= 0. Sostituendo x = 3λy troviamo che deve essere 3λ2 + 3λ − 1 = 0 30 CHAPTER 2. FUNZIONI DI PIÙ VARIABILI A VALORI VETTORIALI con le due soluzioni √ √ 21 − 3 21 + 3 λ+ = > 0, λ− = − ∈ (−1, − 12 ). 6 6 Sostituendo x = 3λ±y nell’equazione della curva (ellisse) si ha 2 y2 = √. 21 ∓ 3 21 Si hanno quindi i seguenti quattro punti di stazionarietà p √ √ p √ √ 15 − 3 21 2 15 − 3 21 2 P1 = ( p √ ,p √ ), P2 = (− p √ , −p √ ), 21 − 3 21 21 − 3 21 21 − 3 21 21 − 3 21 p √ √ p √ √ 15 + 3 21 2 15 + 3 21 2 P3 = (− p √ ,p √ ), P4 = ( p √ , −p √ ). 21 + 3 21 21 + 3 21 21 + 3 21 21 + 3 21 Si ottiene √ √ p √ 15 − 3 21 − 2 2 15 − 3 21 f (P1 ) = f (P2 ) = √ < 0, 21 − 3 21 √ √ p √ 15 + 3 21 + 2 2 15 + 3 21 f (P3 ) = f (P4 ) = √ > 0. 21 + 3 21 Ne segue che P1 e P2 sono punti di minimo mentre P3 e P4 sono punti di massimo. Chapter 3 Funzioni di piu’ variabili e operatori differenziali Molte operazioni del calcolo differenziale e integrale, per funzioni di più variabili, sono rese più espressive mediante gli operatori gradiente, divergenza, rotore. Il capitolo è dedicato a tali operatori. 3.1 Operatori differenziali in coordinate cartesiane Descriviamo con x1 , x2 ,..., xn le coordinate cartesiane di un punto, rispetto a un’origine prefis- sata. Denotiamo con e1 , e2,..., en i corrispondenti versori. Sia a un versore fissato. Al variare di t ∈ R, x + ta descrive la retta r passante per x nella direzione del versore a. La funzione h(t) = f (x + ta) = f (x1 + ta1 , x2 + ta2 ,..., xn + tan ) denota la restrizione di f al dominio r ⊂ Rn. La derivata h0 (t) è anche denotata con df /dt. Allora df X ∂f = ak dt ∂xk k rappresenta il tasso di variazione di f lungo la retta e per questo è riguardata come la derivata direzionale, di f nella direzione a. Denotiamo con ∇f il vettore X ∇f = ∂xk f ek k di componenti ∂x1 f, ∂x2 f,..., ∂xn f. Allora df = ∇f · a. dt Il vettore ∇f è detto gradiente di f. Al variare di a, |∇f · a| è massimo se a è parallelo a ∇f. In tal modo concludiamo che ∇f è la direzione di massima variazione di f ossia la direzione per cui |df /dt| è massima. L’operatore X ∇= ek ∂xk k 31 32 CHAPTER 3. FUNZIONI DI PIU’ VARIABILI E OPERATORI DIFFERENZIALI è un operatore differenziale vettoriale, detto usualmente nabla. Come caso particolare, se a coincide con uno dei versori ei , i = 1, 2,..., n, si ha ak = δik e quindi df = ∂xi f, dt la derivata di f lungo uno dei versori ei è la derivata parziale ∂xi f. Teorema del valor medio. Siano x, y ∈ D ⊆ Rn e sia f ∈ C 1 (D). Allora esiste un punto ξ appartenente al segmento x + t(y − x), t ∈ [0, 1], tale che f (y) − f (x) = ∇f (ξ) · (y − x). In termini delle componenti, X f (y1 ,..., yn) − f (x1 ,..., xn) = ∂xk f (ξ1 ,..., ξn)(yk − xk ). k Per mostrare il risultato poniamo g(t) = f (x + t(y − x)), t ∈ [0, 1]. Per il teorema di Lagrange esiste t0 ∈ (0, 1) tale che g(1) − g(0) = g 0 (t0 ) e quindi f (y) − f (x) = ∇f (ξ) · (y − x), dove ξ = x + t0 (y − x) ossia ξk = xk + t0 (yk − xk ). 2 La divergenza di un campo vettoriale, w(x), è definita da X ∇·w = ∂xk wk k e può essere vista come il formale prodotto scalare di ∇ e w. Applicando la divergenza al gradiente, w = ∇f , si ha X ∇ · ∇f = ∂x2k f. k L’operatore X ∆= ∂x2k k è detto Laplaciano. Il rotore di un campo vettoriale w, denotato con ∇ × w, è definito in R3 e fornisce il vettore dato da   ∇ × w = ijk ∂xj wk ei dove ijk è l’elemento ijk del simbolo di permutazione. Può essere visto come il formale prodotto vettore tra ∇ e w. 3.2. COMPONENTI COVARIANTI E CONTROVARIANTI 33 3.2 Componenti covarianti e controvarianti Limitiamo l’attenzione a funzioni nello spazio tridimensionale. I punti x dello spazio possono essere descritti da terne diverse di coordinate. Siano z = (z 1 , z 2 , z 3 ) le coordinate rettangolari (Cartesiane) e x = (x1 , x2 , x3 ) tre generiche coordinate curvilinee e z k = z k (x), xk = xk (z), k = 1, 2, 3, è quindi una trasformazione regolare (in una regione opportuna). Il vettore posizione x è espresso in coordinate rettangolari nella forma x = z k ik , essendo i1 , i2, i3 i versori dei tre assi coordinati. Possiamo quindi riguardare x come funzione funzione della terna di variabili x, x(x) = z k (x)ik. I vettori gk := ∂xk x = ∂xk z h ih , k = 1, 2, 3. sono assunti linearmente indipendenti (non complanari) e quindi sono una possibile base. I prodotti scalari ghk = gh · gk = δjl ∂xj z h ∂xl z k determinano la lunghezza d’arco. Se t ∈ [a, b] è il parametro che descrive la linea, x = x(x(t)), allora ẋ · ẋ = gkl ẋk ẋl. Le coordinate curvilinee sono dette ortogonali se e solo se gkl = 0, ovunque, per k 6= l. I vettori di base reciproci {gk } sono definiti da gk · gl = δkl , il che significa che g1 è ortogonale a g2 , g3 e l’angolo θ1 tra g1 e g1 soddisfa θ1 ∈ [0, π/2), e analogamente per g2 , g3. Ogni vettore v, in ogni punto x, può essere rappresentato nelle due basi, v = v k gk , v = vk gk. Le componenti {v k } sono dette controvarianti, le componenti {vk } covariant. La reciprocità delle due basi fornisce v k = v · gk , vk = v · gk. Poniamo g hk = gh · gk. Rappresentiamo gh nella base {gk } ottenendo gk = (gk · gl )gl , δkh = gk · gh = g khghl. Valutando il determinante si ottiene 1 = det[g kh ] det[ghl ]. Pertanto, sia [g kh] sia [ghl ] sono nonsingolari e sono l’inversa l’una dell’altra. Possiamo determinare i vettori {gh } in forma analitica. Da ∂zk xh ik · gp = ∂zk xh ik · ∂xp z l il = ∂zk xh ∂xp z k = δhp concludiamo che gh = ∂zk xh ik. 34 CHAPTER 3. FUNZIONI DI PIU’ VARIABILI E OPERATORI DIFFERENZIALI In corrispondenza di coordinate curvilinee è opportuno considerare componenti fisiche, ossia √ componenti rispetto a una base ortonormale. Poiché gkk > 0, poniamo hk = |gk | = gkk e definiamo 1 ek = gk , k = 1, 2, 3. hk D’ora in poi {ek } è una base ortonormale, non necessariamente costante, associata alla base naturale {gk }. 3.3 Derivata covariante Per una funzione scalare, f : R3 → R, la derivata parziale ∂xk f è definita univocamente. Per un campo vettoriale, v : R3 → R3 occorre tenere presente che la base è a priori dipendente dalla posizione. Sarebbe quindi inaffidabile porre ad esempio ∂xk v = (∂xk vh )gh come si farebbe per una base cartesiana perché non terremmo conto della dipendenza di {gh } da x. La derivata covariante k-esima vh;k di vh è definita da ∂xk v = vh;k gh. Ne segue che vh;k = (∂xk v) · gh = (∂xk vl gl ) · gh = ∂xk vh + vl ∂xk gl · gh. Ora, poiché gl · gh = δhl , abbiamo ∂xk (gl · gh ) = 0, gh · ∂xk gl = −gl · ∂xk gh. Posto   h := gh · ∂xk gj , jk abbiamo   l vh;k = ∂xk vh − vl. hk Inoltre, poiché ∂xk gj = (∂xk gj · gh )gh , segue che   h ∂xk gj = gh. jk Analogamente,   h h h v;k = ∂xk v + vj. jk I termini con le parentesi sono noti come simboli di Christoffel di seconda specie. Assumiamo che x(x) sia una funzione C 2 cosicché, ad esempio, ∂xk gl = ∂xk ∂xl x = ∂xl ∂xk x = ∂xl gk. 3.4. OPERATORI IN COORDINATE CURVILINEE 35 Ciò implica che     j j =. hk kh I simboli di Christoffel di prima specie sono definiti da [kl, m] = gm · ∂xk kk. Possiamo mostrare che   j = g jl [hk, l], hk 1 [hk, l] = (ghl,k + gkl,h − ghk,l ). 2 3.4 Operatori in coordinate curvilinee In coordinate cartesiane, il gradiente di una funzione scalare ψ è dato da ∇ψ = ∂zk ψik. In coordinate curvilinee coordinates x poniamo ψ(z) = ψ(x(z)) e quindi ∇ψ = (∂xh ψ)∂zk xh ik = (∂xh ψ)gh. Di conseguenza, ∇ψ = (∂xh ψ)gh. In tal modo possiamo riguardare ∇ come l’operatore ∇ = gh ∂xh. In questo senso definiamo il gradiente di un vettore, la divergenza, il rotore nella forma X X X ∇v := gh ⊗ ∂xh v, ∇ · v := gh · ∂xh v, ∇ × v := gh × ∂xh v. h h h Inoltre definiamo il Laplaciano come la divergence del gradiente, X ∆ψ = gh · ∂xh (gk ∂xk ψ). h,k Si ha X X X ∇·v = gh · vk;h gk = g hk vk;h = gh · gk v;h k = h v;h h,k h,k h e X ∇×v = gh × vk;h gk = hkm vk;h gm , h,k dove hkm := gh × gk · gm. In coordinate rettangolari tali relazioni si riducono a quelle classiche. 36 CHAPTER 3. FUNZIONI DI PIU’ VARIABILI E OPERATORI DIFFERENZIALI 3.4.1 Operatori in coordinate curvilinee ortogonali Siano g1 , g2 , g3 mutuamente ortogonali. Si ha [gkl ] = diag[h21 , h22 , h23 ]. Denotiamo con 1 ek = gk = hk gk , k = 1, 2, 3, hk i corrispondenti versori e con vk , v k e v̂k le componenti covarianti, controvarianti e fisiche. Allora il gradiente assume la forma X 1 ∇ψ = (∂ k ψ)ek. hk x k Per procedere occorrono alcune proprietà dei simboli di Christoffel. In questo paragrafo indici uguali non sono tacitamente sommati e indici diversi denotano valori diversi. Partiamo dalla definizione e applichiamo opportune identità per ottenere   l 1 1 1 = gl · ∂xk gk = −gk · ∂xk gl = −gk · ∂xk ( 2 gl ) = − 2 ∂xl h2k − h2l δkl ∂xk 2 , kk hl 2hl hl   k 1 1 = gk · ∂xl gk = ek · ∂xl (hk ek ) = ∂ l hk = ∂xl ln hk. kl hk hk x Come caso particolare, (l = k), da entrambe le relazioni si ottiene   k = ∂xk ln hk. kk Siano gli indici diversi in modo che   l 1 = gl · ∂xk gj = 2 (gl · ∂xk gj ). kj hl Ora, gl · ∂xk gj = −gj · ∂xk gl e gl · ∂xk gj = gl · ∂xj gk = −gk · ∂xj gl = −gk · ∂xl gj = gj · ∂xl gk = gj · ∂xk gl. Pertanto −gj · ∂xk gl = gj · ∂xk gl implica che gl · ∂xk gj = 0. In conclusione, abbiamo mostrato che     l 1 1 k = − 2 ∂xl h2k − h2l δkl ∂xk 2 , = ∂xl ln hk , kk 2hl hl kl     k l = ∂xk ln hk , = 0. kk kj Applichiamo alcune sostituzioni all’espressione della divergenza ottene

Use Quizgecko on...
Browser
Browser