Algebra Liniowa - Maciej Czarnecki PDF

Document Details

CharmingCosine

Uploaded by CharmingCosine

Uniwersytet Łódzki

Maciej Czarnecki

Tags

linear algebra mathematics linear transformations vector spaces

Summary

This document provides an introduction to linear algebra, covering vector spaces, linear transformations, and related concepts. It presents definitions, theorems, and examples to illustrate the key ideas.

Full Transcript

Algebra liniowa Maciej Czarnecki Katedra Geometrii Uniwersytetu Łódzkiego [email protected] 1 Spis treści 1 Przestrzeń n–wymiarowa 3 2 Macierze 6 3 Układy równań liniowych 10 4 Pr...

Algebra liniowa Maciej Czarnecki Katedra Geometrii Uniwersytetu Łódzkiego [email protected] 1 Spis treści 1 Przestrzeń n–wymiarowa 3 2 Macierze 6 3 Układy równań liniowych 10 4 Przekształcenia liniowe 13 5 Struktury algebraiczne 15 6 Wyznaczniki 20 7 Układy równań liniowych II 23 8 Struktury w przestrzeniach liniowych 26 9 Formy dwuliniowe i kwadratowe 30 10 Wektory i wartości własne endomorfizmu 33 2 1 Przestrzeń n–wymiarowa Definicja 1.1. Dla n ∈ N zbiór Rn = {x = (x1 ,... , xn ) ; x1 ∈ R ∧... ∧ xn ∈ R} = |R ×.{z.. × R} n razy nazywamy (rzeczywistą) przestrzenią n–wymiarową. Elementy przestrzeni Rn nazywamy wektorami. Definicja 1.2. W przestrzeni Rn określamy dodawanie wektorów wzorem x + y = (x1 + y1 ,... , xn + yn ) dla x = (x1 ,... , xn ), y = (y1 ,... , yn ) ∈ Rn. Tym samym dodawanie wektorów jest funkcją + : Rn × Rn → Rn. Definicja 1.3. W przestrzeni Rn określamy mnożenie wektora przez skalar (liczbę) wzorem a · x = (ax1 ,... , axn ) dla x = (x1 ,... , xn ) ∈ Rn i a ∈ R. Tym samym mnożenie wektora przez skalar jest funkcją · : R × Rn → Rn. Twierdzenie 1.4. Dodawanie wektorów i mnożenie wektora przez skalar mają następujące własności: (V1) ∀x,y,z∈Rn x + (y + z) = (x + y) + z (V2) ∃θ∈Rn ∀x∈Rn x+θ =θ+x=x (V3) ∀x∈Rn ∃−x∈Rn x + (−x) = (−x) + x = θ (V4) ∀x,y∈Rn x+y =y+x (V5) ∀ n ∀ a · (x + y) = a · x + a · y x,y∈R a∈R (V6) ∀ ∀ (a + b) · x = a · x + b · x x∈Rn a,b∈R (V7) ∀ ∀ a · (b · x) = (ab) · x x∈Rn a,b∈R (V8) ∀ 1·x=x x∈Rn Dowód. Wszystkie własności wynikają z odpowiednich własności działań na liczbach rzeczywistych. Wektorem zerowym jest θ = (0,... , 0), a wektorem przeciwnym do x = (x1 ,... , xn ) — wektor −x = (−x1 ,... , −xn ). Definicja 1.5. Kombinacją liniową wektorów v1 ,... , vk ∈ Rn o współczynnikach a1 ,... , ak ∈ R nazywamy wektor a1 · v1 +... + ak vk. Definicja 1.6. Mówimy, że ukłąd wektorów v1 ,... , vk ∈ Rn jest liniowo niezależny, gdy ∀a1 ,...,ak ∈R (a1 · v1 +... + ak vk = θ =⇒ a1 =... = ak = 0). Układ wektorów jest liniowo zależny, gdy nie jest liniowo niezależny. Stwierdzenie 1.7. Układ wektorów jest liniowo niezależny wtedy i tylko wtedy, gdy żaden z wektorów tego układu nie jest kombinacją liniową pozostałych. 3 Definicja 1.8. Niepusty podzbiór U ⊂ Rn nazywamy podprzestrzenią liniową przestrzeni Rn , gdy ∀u1 ,u2 ∈U ∀a1 ,a2 ∈R a1 · u1 + a2 · u2 ∈ U. Przykład 1.9. 1◦ Zbiór jednoelementowy {θ} oraz cała przestrzeń Rn są podprzestrzeniami li- niowymi przestrzeni Rn. 2◦ Zbiór U = {(x1 , x2 , x3 ) ; x1 − 2x2 + 3x3 = 0} ⊂ R3 jest podprzestrzenią liniową, ale zbiór W = {(x1 , x2 , x3 ) ; x1 − 2x2 + 3x3 + 1 = 0} ⊂ R3 nie jest podprzestrzenią liniową. 3◦ Zbiór V = {(a + b, a − b, 2a) ; a, b ∈ R} ⊂ R3 jest podprzestrzenią liniową, ale zbiór T = {(a + b − 1, a − b, 2a + 3) ; a, b ∈ R} ⊂ R3 nie jest podprzestrzenią liniową. 4◦ W przestrzeni R2 (czyli na płaszczyźnie) jedynymi podprzestrzeniami liniowymi są {θ}, R2 oraz proste przechodzące przez początek układu θ. Definicja 1.10. Mówimy, że układ wektorów u1 ,... , uk ∈ Rn generuje podprzestrzeń liniową U ⊂ Rn , gdy U = lin (u1 ,... , uk ) = {a1 · u1 +... + ak uk ; a1 ,... , ak ∈ R} czyli, gdy każdy wektor z podprzestrzeni U jest kombinacją liniową tego układu. Definicja 1.11. Bazą podprzestrzeni liniowej U nazywamy każdy układ wektorów, który jest liniowo niezależny i generuje U. Twierdzenie 1.12. Układ wektorów jest bazą podprzestrzeni U wtedy i tylko wtedy, gdy jest mak- symalnym układem liniowo niezależnym, tzn. niie można go uzupełnić żadnym wektorem zachowując liniową niezależność. Definicja 1.13. Wymiarem podprzestrzeni liniowej U nazywamy liczbę dim U równą liczbie elemen- tów dowolnej bazy podprzestrzeni U. Przykład 1.14. Bazą kanoniczną przestrzeni Rn jest układ wektorów e1 ,... , en takich, że ei ma na ma i–tej współrzędnej 1, a na pozostałych 0, dla i = 1,... , n. Tym samym dim Rn = n. Stwierdzenie 1.15. W bazie podprzestrzeni liniowej U każdy wektor u ∈ U można jednoznacznie przedstawić w postaci kombinacji liniowej elementów tej bazy. Dowód. Przykład 1.16. Szczególnie prosto przedstawia się wektor x = (x1 ,... , xn ) ∈ Rn w bazie kanonicznej tej przestrzeni: x = x1 · e1 +... + xn · en. Definicja 1.17. Podprzestrzenią afiniczną przestrzeni Rn nazywamy jej niepusty podzbiór H postaci H = p + U = {p + u ; u ∈ U }, gdzie p ∈ H oraz U jest podprzestrzenią liniową przestrzeni Rn. Wymiar podprzestrzeni afinicznej jest równy wymiarowi odpowiadającej jej podprzestrzeni linio- wej. Przykład 1.18. 1◦ Dla dowolnego p ∈ Rn zbiór jednoelementowy {p} oraz cała przestrzeń Rn są podprzestrzeniami afinicznymii przestrzeni Rn. 4 2◦ Zbiory W oraz T z przykładu 1.9 są podprzestrzeniami afinicznymi. Odpowiednio W = (0, 0, 1)+ U i T = (−1, 0, 3) + V. 3◦ W przestrzeni R2 jedynymi podprzestrzeniami afinicznymi są zbiory jednopunktowe, R2 oraz dowolne proste. 5 2 Macierze Definicja 2.1. Dla m, n ∈ N macierzą o m wierszach i n kolumnach (krótko macierzą m × n) nazywamy funkcję A : {1,... , m} × {1,... , n} → R. Zbiór wszystkich macierzy m × n oznaczamy przez Mmn. Macierz A ∈ Mmn opisujemy przez jej wyrazy A = [aij ]1¬i¬m, 1¬j¬n , a w bardziej rozwiniętej formie   a11 a12... a1n  a21 a22... a2n    .....  . ......   am1 am2... amn Definicja 2.2. Dla macierzy A ∈ Mmn wektor Ri = [ai1 ai2... ain ] ∈ Rn nazywamy i–tym wierszem, a wektor   a1j  a2j  ∈ Rm   Cj = .. .     amj j–tą kolumną macierzy A, i = 1,... , m, j = 1,... , n. Tym samym wyraz aij znajduje się w i–tym wiersz oraz j–tej kolumnie. Definicja 2.3. Analogicznie do dodawania wektorów określamy dodawanie macierzy. Dla macierzy A = [aij ] ∈ Mmn i B = [bij ] ∈ Mmn ich sumą jest macierz A + B = [aij + bij ] ∈ Mmn. Definicja 2.4. Iloczynem macierzy A = [aij ] ∈ Mmn przez liczbę k ∈ R nazywamy macierz k · A = [kaij ] ∈ Mmn. Definicja 2.5. Niech A = [aij ] ∈ Mmn. Macierzą transponowaną do macierzy A nazywamy macierz AT = [aji ] ∈ Mnm. Innymi słowy wiersze macierzy A (w tej samej kolejności) są kolumnami macierzy AT i na odwrót. Definicja 2.6. Niech A = [aij ] ∈ Mmn i B = [bjk ] ∈ Mnp , czyli niech macierz B ma tyle wierszy co macierz A kolumn. Iloczynem macierzowym macierzy A i B nazywamy macierz A · B = C = [cik ] ∈ Mmp , której wyrazy są dane wzorami n X cik = aij bjk = ai1 b1k + ai2 b2k +... + ain bnk dla i = 1,... , m, k = 1,... , p. j=1 Uwaga 2.7. Istnienie iloczynu macierzy A · B nie gwarantuje istnienia iloczynu B · A. Nawet gdy istnieją oba, mogą być różnych rozmiarów. Gdy rozmiar macierzy A · B i A · B jest zgodny, macierze te nie muszą być równe. 6 Definicja 2.8. Macierzą kwadratową nazywamy macierz o tej samej liczbie wierszy co kolumn. Macierz kwadratowa A = [aij ] ∈ Mnn jest diagonalna, gdy aij = 0 dla wszystkich i 6= j, górna trójkątna, gdy aij = 0 dla wszystkich i > j, dolna trójkątna, gdy aij = 0 dla wszystkich i < j. Definicja 2.9. Macierzą jednostkową stopnia n nazywamy macierz In = [δij ] ∈ Mnn , gdzie ( 0 gdy i 6= j δij = 1 gdy i = j Innymi słowy, macierz jednostkowa ma jedynki na głównej przekątnej, a poza nią zera. Twierdzenie 2.10 (Własności działań na macierzach). (M1) ∀A,B,C∈Mmn A + (B + C) = (A + B) + C (M2) ∃Θ∈Mmn ∀A∈Mmn A+Θ=Θ+A=A (M3) ∀A∈Mmn ∃−A∈Mmn A + (−A) = (−A) + A = Θ (M4) ∀A,B∈Mmn A+B =B+A (M5) ∀A∈Mmn ∀B∈Mnp ∀C∈Mpq A · (B · C) = (A · B) · C (M6) ∀A∈Mmn ∀B,C∈Mnp A · (B + C) = A · B + A · C (M60 ) ∀A,B∈Mmn ∀C∈Mnp (A + B) · C = A · C + B · C (M7) ∀A∈Mmn A · In = Im · A = A (M8) ∀A∈Mmn ∀B∈Mnp ∀k∈R A · (kB) = (kA) · B = k(A · B) Uwaga 2.11. Jeżeli m = n = p, to można przyjąć, że warunki (M1)—(M8) zachodzą w zbiorze Mnn. Definicja 2.12. Macierzą odwrotną do macierzy kwadratowej A ∈ Mnn nazywamy taką macierz A−1 ∈ Mnn , że A · A−1 = A−1 · A = In. Zbiór wszystkich macierzy n × n posiadających macierz odwrotną (inaczej odwracalnych) ozna- czamy przez GL(n). " # ◦ 1 1 Przykład 2.13. 1 Macierz nie posiada macierzy odwrotnej. 1 1 " #−1 " d −b # ◦ a b ad−bc ad−bc 2 Jeżeli ad − bc 6= 0, to = −c a. c d ad−bc ad−bc Stwierdzenie 2.14. Jeżeli A, B ∈ GL(n), to (i) (A · B)−1 = B −1 · A−1 , −1 (ii) (A−1 ) = A. Definicja 2.15. Wyróżniamy trzy rodzaje operacji elementarnych na wierszach macierzy m × n: (S) zamiana miejscami dwóch wierszy k–tego i l–tego; oznaczamy ją skl lub Rk ↔ Rl , k, l ∈ {1,... , m}, k 6= l, (R) pomnożenie wiersza k–tego przez liczbę a 6= 0; oznaczamy ją rka lub Rk := aRk , k ∈ {1,... , m}, a 6= 0, 7 (P) dodanie do wiersza l–tego innego wiersza k–tego pomnożonego przez liczbę b; oznaczamy ją pbkl lub Rl := Rl + bRk , k, l ∈ {1,... , m}, k 6= l, b ∈ R. Definicja 2.16. Dla k, l ∈ {1,... , m}, k = 6 l, a, b ∈ R, a 6= 0 macierzami elementarnymi stopnia m nazywamy macierze Skl = skl (Im ), Rka = rka (Im ), Pklb = pbkl (Im ). Stwierdzenie 2.17. Macierze elementarne są odwracalne: 1  −1 (Skl )−1 = Skl , (Ska )−1 = Rka , Pklb = Pkl−b. Definicja 2.18. Macierzami bazowymi m × n nazywamy macierze Ekl = [δki δjl ]1¬i¬m, 1¬j¬n gdzie k = 1,... , m, l = 1,... , n. Są to więc macierze posiadające jedynkę na miejscu kl, a poza tym zera. Stwierdzenie 2.19. Dla k, l ∈ {1,... , m}, k 6= l, a, b ∈ R, a 6= 0 Skl = Im − Ekk + Ekl − Ell + Elk , Rka = Im + (a − 1)Ekk , Pklb = Im + bEkl. Definicja 2.20. Mówimy, że macierz A = [aij ] ∈ Mmn jest w postaci trójkątnej uogólnionej, gdy spełnione są warunki: (GT1) ∃p¬m (∀i>p Ri = θ ∧ ∀i¬p Ri 6= θ), czyli wszystkie wiersze zerowe znajdują się na końcu; (GT2) ∀i¬p ∃1¬li ¬n (aili = 1 ∧ ∀j 1). Definicja 5.4. Permutacją zbioru n–elementowego {1,... , n} nazywamy dowolną fukncję σ : {1,... , n} → {1,... , n}, ktora jest bijekcją (tzn. jest różnowartościowa i ”na”). Permutację σ zapisujemy przez podanie jej wszystkich wartości w formie ! 1 2... n σ= σ(1) σ(2)... σ(n) Zbiór wszystkich permutacji zbioru n–elementowego oznaczamy przez Sn (wiadomo, że Sn ma n! elementów) Twierdzenie 5.5. Zbiór Sn z działaniem składania permutacji (jako funkcji) jest grupą (nieabelową gdy n > 2). ! ! 1 2 1 2 Przykład 5.6. 1◦ Permutacje zbioru 2–elementowego: , 1 2 2 1 2◦ Permutacje zbioru 3–elementowego: ! ! ! ! ! ! 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 , , , , ,. 1 2 3 1 3 2 3 2 1 2 1 3 3 1 2 2 3 1 3◦ Spośród powyższych permutacji zbioru 3–elementowego pierwsze cztery są same do siebie od- wrotne, a piąta jest odwrotna do szóstej. Składanie nie jest przemienne, np. ! ! ! ! ! ! 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 · = 6= = · 3 2 1 3 1 2 1 3 2 2 1 3 3 1 2 3 2 1 Definicja 5.7. Dla danej permutacji σ ∈ Sn obliczamy liczbę występujących w niej inwersji, tzn. liczbę elementów zbioru inv σ = {(i, j) ; i, j ∈ {1,... , n} ∧ i < j ∧ σ(i) > σ(j)} Znakiem permutacji σ nazywamy liczbę sgn σ = (−1)#inv σ. 15 Przykład 5.8. W permutacjach z S3 opisanych w poprzednim przykładzie występuje odpowiednio: 0, 1, 3, 1, 2, 2 inwersji, więc permutacja pierwsza, piąta i szósta mają znak 1 (są parzyste), a pozostałe znak −1 (te są nieparzyste). Definicja 5.9. Pierścieniem nazywamy trójkę uporządkowaną (R, +, ·), gdzie R jest zbiorem nie- pustym, a + i · są działaniami wewnętrznym w R, przy czym (R1) ∀a,b,c∈R a + (b + c) = (a + b) + c (R2) ∃0∈R ∀a∈R a + 0 = 0 + a = a (R3) ∀a∈R ∃−a∈R a + (−a) = (−a) + a = 0 (R4) ∀a,b∈R a + b = b + a (R5) ∀a,b,c∈R a · (b · c) = (a · b) · c (R6) ∀a,b,c∈R a · (b + c) = a · b + a · c ∧ (a + b) · c = a · c + b · c Jeżeli ponadto spełniony jest warunek (R7) ∀a,b∈R a · b = b · a, to pierścień jest przemienny, a gdy dodatkowo (R8) ∃1∈R ∀a∈R a · 1 = 1 · a = a, to mówimy o pierścieniu przemiennym z jedynką. Uwaga 5.10. Definicję pierścienia można wyrazić krótko żadając, by (R, +) było grupą abelową i · było łączne i (obustronnie) rozdzielne względem +. Przykład 5.11. 1◦ Pierścieniami przemiennymi z jedynką są (Z, +, ·), (R, +, ·) ze znanymi dzia- łaniami, a (Mnn , +, ·) jest pierścieniem nieprzemiennym z jedynką (jest nią macierz jednostkowa I). 2◦ Niech X będzie niepustym zbiorem i niech F(X) oznacza zbiór wszystkich funkcji działających z X w zbiór liczb rzeczywistych R. W tym zbiorze określimy dodawanie funkcji i mnożenie funkcji. Dla f, g ∈ F(X) (f + g)(x) = f (x) + g(x), x∈X (f · g)(x) = f (x)g(x), x∈X Zbiór F(X) z tak określonymi działaniami jest pierścieniem przemiennym z jedynką (jest nią funkcja stała równa 1). 3◦ Przez R[x] oznaczymy zbiór wszystkich wielomainów zmiennej x o współczynnikach rzeczywi- stych, czyli wyrażeń (lepiej unikać słowa funkcji) postaci v = a0 + a1 x + a2 x2 +... + an−1 xn−1 + an xn. Można uznać, że współczynników wielomianu jest nieskńczenie wiele (te o numerach od n + 1 wzwyż są równe 0) i dodawać tak, że suma wielomianu v i wielomianu w = b0 +b1 x+b2 x2 +...+bm−1 xn−1 +bm xn. ma współczynniki ai + bi , 16 P a mnożyć tak, że iloczyn ma na miejscu o numerze k współczynnik i+j=k ai b j Z tak określonymi dziłaniami R[x] jest pierścieniem przemiennym z jedynką. 4◦ Jeżli przez R∞ oznaczymy zbiór wszystkich ciągów nieskończonych, to możemy zastosować do niego podpunkt 2◦ , czyli jest to także pierścień przemienny z jedynką. Definicja 5.12. Dla n ∈ N, n ­ 2, z zbiorze Zn = {0, 1,... , n − 1} (czyli zbiorze reszt z dzielenia przez n) określamy działania + i · (odpowiednio dodawanie modulo n i mnożenie modulo n) wzorami n n a + b =reszta z dzielenia a + b przez n, n a · b =reszta z dzielenia ab przez n. n   Twierdzenie 5.13. Trójka uporządkowana Zn , +, · jest pierścieniem przemiennym z jedynką. n n Dowód. Warunki (R): 2, 4, 7, 8 są spełnione. Elementem przeciwnym do 0 jest 0, zaś dla a ∈ Zn \ {0} elementem przeciwnym do a jest n − a. Aby wykazać (R1) weźmy a, b, c ∈ Zn i oznaczmy:     r1 = a + b, r2 = a + b + c = r1 + c, r3 = b + c, r4 = a + b + c = a + r3. n n n n n n n n Wówczas istnieją liczby całkowite nieujemne k1 , k2 , k3 , k4 takie, że k1 n + r1 = a + b, k2 n + r2 = r1 + c, k3 n + r3 = b + c, k4 n + r4 = a + r3. Zatem r2 − r4 = (k1 − k2 − k3 + k4 )n, czyli r2 − r4 jest dzielnikiem liczby n, a jednocześnie liczbą pomiędzy −(n − 1) a n − 1. Tym samym r2 − r4 = 0, a więc warunek (R1) jest spełniony. Warunków (R5) i (R6) dowodzimy analogicznie. Definicja 5.14. Ciałem nazywamy trójkę uporządkowaną (F, +, ·), gdzie F jest zbiorem co najmniej 2–elementowym, + i · są działaniami wewnętrznymi w F oraz (F, +) jest grupą abelową (element neutralny dodawania oznaczamy przez 0), (F \ {0}, ·) jest grupą abelową, działanie + jest rozdzielne względem działania ·. Przykład 5.15. 1◦ Zbiór liczb rzeczywistych R ze zwykłymi działaniami + i · jest ciałem.   ◦ 2 Pierścień Zn , +, n· jest ciałem wtedy i tylko wtedy, gdy n jest liczbą pierwszą. n Definicja 5.16. W zbiorze C = {(x, y) ; x ∈ R, y ∈ R} określamy działania: (x, y) + (x0 , y 0 ) =(x + x0 , y + y 0 ) (x, y) · (x0 , y 0 ) =(xx0 − yy 0 , xy 0 + yx0 ). Zbiór C z tymi działaniami nazywamy zbiorem liczb zespolonych, a ich elementy — liczbami zespolo- nymi. 17 Uwaga 5.17. Zauważmy, że działania w podzbiorze R × {0} = {(x, 0) ; x ∈ R} ⊂ C wykonuje się tak samo jak na samej pierwszej współrzędnej. Zatem liczbę zespoloną (x, 0) można utożsamiać z liczbą rzeczywistą x. Definicja 5.18. Liczbę zespoloną (0, 1) nazywamy jednostką urojoną i oznaczamy przez i. Wówczas i2 = −1 = (−1, 0). Liczbę zespoloną z = (x, y) możemy, używając utożsamienia, zapisać w formie z = x + yi, którą nazywamy postacią kanoniczną liczby zespolonej z. Ponadto liczby rzeczywiste x, y nazywamy odpowiednio częścią rzeczywistą i częścią urojoną liczby z; używamy oznaczeń x = 0. Przestrzeń skończonego wymiaru z iloczynem skalarnym nazywamy przestrzenią euklidesową. Przykład 8.3. 1◦ W przestrzeni Rn określamy standardowy iloczyn skalarny wzorem hx, yi = x1 y1 +... + xn yn. W Rn można też określać wiele innych iloczynów skalarnych np. w R2 takim iloczynem jest hx, yi = 9x1 y1 − 3x1 y2 − 3x2 y1 + 2x2 y2. 2◦ W przestrzeni l2 iloczynem skalarnym jest ∞ X h(xn ), (yn )i = xn y n. n=1 Definicja 8.4. Wektory v, w ∈ V są ortogonalne (inaczej prostopadłe) — co zapisujemy v ⊥ w — gdy hv, wi = 0. Podprzestrzenie liniowe U, W ⊂ V są ortogonalne, gdy każdy wektor z U jest ortogonalny do każdego wektora z W. Podobnie wektor v jest ortogonalny do podprzestrzeni liniowej U , gdy v ⊥ u dla u ∈ U. Definicja 8.5. W przestrzeni V z iloczynem skalarnym h.,.i określamy normę (inaczej długość) wektora v ∈ V wzorem q kvk = hv, vi. Przykład 8.6. 1◦ Normą pochodzącą od standardowego iloczynu skalarnego w Rn jest q kxk = x21 +... + x2n. 2◦ Normę w l2 określamy wzorem v u∞ uX k(xn )k2 = t x2. n n=1 Stwierdzenie 8.7 (własności normy). W przestrzeni V z iloczynem skalarnym 26 (N1) ∀v∈V kvk ­ 0, (N2) ∀v∈V kvk = 0 ⇐⇒ v = θ, (N3) ∀v∈V ∀a∈R ka · vk = akvk, (N4) ∀v,w∈V kv + wk ¬ kvk + kwk. Stwierdzenie 8.8 (tożsamość polaryzacyjna). W przestrzeni V z iloczynem skalarnym h.,.i dla v, w ∈ V 1  hv, wi = kv + wk2 − kv − wk2. 4 Twierdzenie 8.9. Jeżeli w przestrzeni V określony jest iloczyn skalarny h.,.i, to dla v, w ∈ V (i) |hv, wi| ¬ kvk kwk, (ii) |hv, wi| = kvk kwk wtedy i tylko wtedy, gdy wektory v i w są równoległe (tzn. gdy jeden jest iloczynem drugiego przez liczbę). Dowód. Jeżeli któryś z wektorów v, w jest zerowy, to po obu stronach występują zera, a ponadto wektor zerowy jest równoległy do każdego wektora. Załóżmy więc, że v 6= θ i w 6= θ. Rozważymy funkcję f : R → R daną wzorem f (t) = kv + twk2 = hv + tw, v + twi = kwk2 t2 + 2hv, wi + kvk2. Funkcja f ze swojego określenia przyjmuje tylko wartości nieujemne i jest funkcją kwadratową o dodatnim współczynniku przy t2 (bo w 6= θ). Zatem jej wyróżnik jest niedodatni:   0 ­ ∆ = 4hv, wi2 − 4kwk2 kvk2 = 4 hv, wi2 − kvk2 kwk2 , skąd hv, wi2 ¬ kvk2 kwk2. Teza (i) wynika więc z nieujemności kvk i kwk oraz faktu, że hv, wi2 = |hv, wi|2. Równość z (ii) zachodzi wtedy i tylko wtedy, gdy ∆ = 0, czyli gdy funkcja f ma dokładnie jeden pierwiastek. Nazywając go t0 otrzymujemy 0 = f (t0 ) = kv + t0 wk2 , co oznacza, że v + t0 w = θ, a więc v = (−t0 )w. Definicja 8.10. Kątem pomiędzy niezerowymi wektorami v, w ∈ V nazywamy liczbę ^(v, w) ∈ [0, π] taką, że hv, wi cos ^(v, w) =. kvk kwk Definicja 8.11. Bazę (v1 ,... , vn ) przestrzeni V z iloczynem skalarnym h.,.i nazywamy bazą ortogo- nalną, gdy hvi , vj i = 0 gdy i 6= j, a bazą ortonormalną, gdy ( 0 gdy i 6= j hvi , vj i = 1 gdy i = j. Przykład 8.12. Baza kanoniczna przestrzeni Rn jest bazą ortonormalną przy standardowym ilo- czynie skalarnym. 27 Twierdzenie 8.13 (ortogonalizacja Schmidta). Niech (w1 ,... , wn ) będzie pewną bazą przestrzeni V z iloczynem skalarnym h.,.i. Wówczas układ wektorów v1 = w1 ! hwj , v1 i hwj , vj−1 i vj = wj − +... + dla j = 2,... , n kv1 k 2 kvj−1 k2 jest bazą ortogonalną przestrzenie V. vj Ponadto układ vj0 = , j = 1,... , n stanowi bazę ortonormalną przestrzeni V. kvj k Stwierdzenie 8.14. Jeżeli (v1 ,... , vn ) jest bazą ortonormalną przestrzeni V , to dla v ∈ V v = hv, v1 i v1 +... + hv, vn i vn. Definicja 8.15. Niech U będzie podprzestrzenią liniową przestrzeni V z iloczynem skalarnym. Rzu- tem ortogonalnym wektora v ∈ V na podprzestrzeń U nazywamy taki wektor πU (v), że wektor v − πU (v) jest ortogonalny do podprzestrzeni U , tzn. v − πU (v) ⊥ u dla u ∈ U. Stwierdzenie 8.16. Niech (u1 ,... , uk ) będzie bazą ortonormalną podprzestrzeni liniowej U prze- strzeni liniowej V. Wówczas dla v ∈ V πU (v) = hv, u1 i u1 +... + hv, uk i uk. Definicja 8.17. Dowolną przestrzeń liniową V z funkcją k.k : V → R spełniającą warunki (N1)–(N4) nazywamy przestrzenią unormowaną. Oczywiście każda przestrzeń z iloczynem skalarnym jest przestrzenią unormowaną. Stwierdzenie 8.18 (równość równoległoboku). Norma k.k w przestrzeni unormowanej pochodzi od pewnego iloczynu skalarnego wtedy i tylko wtedy, gdy   kv + wk2 + kv − wk2 = 2 kvk2 + kwk2. Przykład 8.19. Przestrzeniami unormowanymi, w których norma nie pochodzi od żadnego iloczynu skalarnego są: 1◦ przestrzeń lp dla p ­ 1 i p 6= 2 z normą ∞ !1 p p X k(xn )kp = |xn | , n=1 2◦ przestrzeń C(I) z normą supremum kf k = sup f (x). x∈I Definicja 8.20. W przestrzeni unormowanej V z normą k.k odległością dwóch wektorów v, w ∈ V nazywamy liczbę d(v, w) = kv − wk. Przykład 8.21. W przestrzeni Rn ze standardowym iloczynem skalarnym otrzymujemy dobrze znaną odległość euklidesową daną wzorem q d(x, y) = (x1 − y1 )2 +... + (xn − yn )2. 28 Stwierdzenie 8.22 (własności odległości). W przestrzeni unormowanej V (D1) ∀v,w∈V d(v, w) = 0 ⇐⇒ v = w, (D2) ∀v,w∈V d(v, w) = d(w, v), (D3) ∀u,v,w∈V d(u, w) ¬ d(u, v) + d(v, w). Definicja 8.23. Dowolny niepusty zbiór V z funkcją d : V × V → R spełniającą warunki (D1)–(D3) nazywamy przestrzenią metryczną. Definicja 8.24. Mówimy, że przestrzeń metryczna (V, d) jest zupełna, gdy każdy ciąg Cauchy’ego jej elementów, tzn. ciąg (vn ) z V spełniający warunek ∀ε>0 ∃N ∈N ∀m,n­N d(vm , vn ) < ε, ma granicę w V , tzn. istnieje wektor v ∈ V taki, że ∀ε>0 ∃N ∈N ∀n­N d(vn , v) < ε. Definicja 8.25. Przestrzeń z iloczynem skalarnym, która jest zupełna jako przestrzeń metryczna, nazywamy przestrzenią Hilberta. Przestrzeń unormowaną, która jest zupełna jako przestrzeń metryczna, nazywamy przestrzenią Banacha. Przykład 8.26. 1◦ Przestrzeń Hilberta jest także przestrzenia Banacha. Rn jest więc przestrzenią Hilberta i przestrzenią Banacha. 2◦ l2 jest przestrzenią Hilberta. 3◦ Dla p > 1 lp jest przestrzenią Banacha. 4◦ Przestrzeń funkcji ciągłych C(I) z normą supremum jest przestrzenią Banacha. 29 9 Formy dwuliniowe i kwadratowe Definicja 9.1. Formą dwuliniową na przestrzeni liniowej V (nad ciałem R) nazywamy funkcję f : V × V → R taką, że ∀u,v,w∈V ∀a,b∈R (f (au + bv, w) = af (u, w) + bf (v, w) ∧ f (u, av + bw) = af (u, v) + bf (u, w)). Mówimy, że forma dwuliniowa f jest symetryczna, gdy ∀v,w∈V f (v, w) = f (w, v). Przykład 9.2. 1◦ Standardowy iloczyn skalarny w Rn jest formą dwuliniową symetryczną. 2◦ Funkcja f ((x1 , x2 ), (y1 , y2 )) = x1 x2 + x1 y2 + x2 y1 + 2x2 y2 jest formą dwuliniową symetryczną na R2. 3◦ Funkcja f ((x1 , x2 ), (y1 , y2 )) = x1 x2 + 2x1 y2 + 2x2 y2 jest formą dwuliniową na R2 , która nie jest symetryczna. Definicja 9.3. Dla danej formy dwuliniowej f na przestrzeni liniowej V odpowiadającą jej formą kwadratową nazywamy funkcję F : V → R daną wzorem F (v) = f (v, v) dla v ∈ V. Stwierdzenie 9.4. Dla danej formy kwadratowej F na przestrzeni V istnieje dokładnie jedna forma dwuliniowa symetryczna o formie kwadratowej F. Jest ona dana wzorem 1 f (v, w) = (F (v + w) − F (v) − F (w)). 2 Przykład 9.5. 1◦ Formą kwadratową odpowiadającą standardowemu iloczynowi skalarnemu w Rn jest kwadrat normy F (x) = kxk2 = x21 +... + x2n. 2◦ Formy dwuliniowe z podpunktów 2◦ i 3◦ poprzedniego przykładu mają tę samą formę kwadra- tową F ((x1 , x2 )) = x21 + 2x1 x2 + 2x22. 3◦ Duże znaczenie w fizyce, a konkretnie w szczególnej teorii względności, ma forma Lorentza na R4 czy to w postaci formy kwadratowej czy dwuliniowej F ((x1 , x2 , x3 , x4 )) = x21 + x22 + x23 − x24 f ((x1 , x2 , x3 , x4 ), (y1 , y2 , y3 , y4 )) = x1 y1 + x2 y2 + x3 y3 − x4 y4. 4◦ Dla formy kwadratowej F ((x1 , x2 , x3 )) = x21 − 3x22 + 5x23 + 4x1 x2 − 6x1 x3 + 12x2 x3 na R3 odpowiadającą jej formą dwuliniową symetryczną jest f ((x1 , x2 , x3 ), (y1 , y2 , y3 )) = x1 y1 − 3x2 y2 + 5x3 y3 + 2x1 y2 + 2x2 y1 − 3x1 y3 − 3x3 y1 + 6x2 y3 + 6x2 y2. 30 Definicja 9.6. Niech f bedzie formą dwuliniową na przestrzeni liniowej V , a B = (v1 ,... , vn ) — bazą przestrzeni V. Macierzą formy dwuliniowej f w bazie B nazywamy macierz MB (f ) = [f (vi , vj )]1¬i,j¬n. Macierzą formy kwadratowej nazywamy macierz odpowiadającej jej formy dwuliniowej symetrycznej. Uwaga 9.7. Macierz A formy dwuliniowej symetrycznej jest symetryczna, tzn. AT = A. Stwierdzenie 9.8. Jeżeli A jest macierzą formy dwuliniowej f w bazie B przestrzeni V , a C macierzą przejścia od bazy B do bazy C w przestrzeni V , to macierzą formy f w bazie C jest C T AC. Definicja 9.9. Mówimy, że forma kwadratowa F (odpowiednio forma dwuliniowa f ) ma w bazie B = (v1 ,... , vn ) postać kanoniczną, gdy jej macierz w tej bazie jest diagonalna, czyli gdy istnieją liczby λ1 ,... , λn ∈ R takie, że F (x1 v1 +... + xn vn ) = λ1 x21 +... + λn x2n dla x1 ,... , xn ∈ R. Postać formy jest normalna, gdy λ1 ,... , λn ∈ {−1, 0, 1}. Przykład 9.10. W bazie kanonicznej kwadrat normy w Rn ma macierz jednostkową, a forma Lo- rentza ma w bazie kanonicznje R4 macierz diagonalną o wyrazach na przekątnej 1, 1, 1, −1. Zatem obie te formy są w postaci kanonicznej, a nawet normalnej. Uwaga 9.11. Każdą formę kwadratową można sprowadzić do postaci kanonicznej metodą Lagran- ge’a: np. 1. dla formy F ((x1 , x2 )) = x21 +2x1 x2 +x22 jest to F ((x1 , x2 )) = (x1 +x2 )2 +x22. Przyjmując y1 = x1 + x2 , y2 = x2 , skąd także x1 = y1 − y2 , x2 = y2 , otrzymujemy bazę B = (v1 = (1, 0), v2 = (−1, 1)), w której F (y1 v1 + y2 v2 ) = F ((x1 + x2 )(1, 0) + x2 (−1, 1)) = F ((x1 , x2 )) = (x1 + x2 )2 + x22 = y12 + y22. 2. dla formy F ((x1 , x2 , x3 )) = x21 − 3x22 + 5x23 + 4x1 x2 − 6x1 x3 + 12x2 x3 rozumowanie przebiega podobnie   F ((x1 , x2 , x3 )) = x21 + 2 · 2x1 x2 + (2x2 )2 − 2 · 3x1 x3 + (−3x3 )2 + 2 · (2x2 )(−3x3 ) − 7x22 − 4x23 + 24x2 x3 −12 144 2 116 2   = (x1 + 2x2 − 3x3 )2 − 7 x22 + 2 x2 x3 + x3 + x 7 49 7 3 2 12 116 2  2 = (x1 + 2x2 − 3x3 ) − 7 x2 − x3 + x 7 7 3 116 2 =y12 − 7y22 + y. 7 3 Definicja 9.12. W macierzy kwadratowej A = [aij ] ∈ Mnn minorem głównym stopnia k nazywamy wyznacznik ∆k = det[aij ]1¬i,j¬k. Przyjmujemy dodatkowo ∆0 = 1. 31 Twierdzenie 9.13 (twierdzenie Jacobiego). Niech forma kwadratowa F na przestrzeni V ma w pewnej bazie macierz A = [aij ] ∈ Mnn o wszystkich minorach głównych różnych od zera. Istnieje wówczas baza B = (v1 ,... , vn ) przestrzeni V , w której forma F ma postać kanoniczną ∆0 2 ∆1 2 ∆n−1 2 F (x1 v1 +... + xn vn ) = x1 + x2... + x dla x1 ,... , xn ∈ R. ∆1 ∆2 ∆n n Twierdzenie 9.14 (twierdzenie Sylwestera o bezwładności). Dla danej formy kwadratowej F na przestrzeni V wymiaru n istnieją liczby r, s takie, że r + s ¬ n i każda postać normalna formy F zawiera dokładnie r liczb 1 oraz dokładnie s liczb −1. Układ takich iczb (r, s) nazywamy sygnaturą formy F. Przykład 9.15. Kwadrat standardowej normy ma sygnaturę (n, 0), a forma Lorentza — sygnaturę (3, 1). Definicja 9.16. Mówimy, że forma kwadratowa F na przestrzeni liniowej V jest (i) dodatnio określona, gdy F (v) > 0 dla v ∈ V \ {θ}, (ii) ujemnie określona, gdy F (v) < 0 dla v ∈ V \ {θ}, (iii) nieokreślona, gdy istnieją takie v1 , v2 ∈ V , że F (v1 ) > 0 i F (v2 ) < 0. Twierdzenie 9.17 (kryterium wyznacznikowe określoności formy). Niech forma kwadratowa F na przestrzeni V ma w pewnej bazie macierz A = [aij ] ∈ Mnn o minorach głównych ∆1 ,... , ∆n. Wówczas (i) jeżeli ∆k > 0 dla k = 1,... , n, to forma F jest dodatnio określona, (ii) jeżeli (−1)k ∆k > 0 dla k = 1,... , n, to forma F jest ujemnie określona. Przykład 9.18. Kwadrat standardowej normy jest dodatnio określony, forma Lorentza jest nieokre- ślona, a forma F ((x1 , x2 , x3 )) = −x21 − 3x22 − 5x3 jest ujemnie określona. 32 Literatura D. Cherney, T. Denton, R. Thomas, A. Waldron, Linear Algebra, https://www.math.ucdavis.edu/ linear/linear-guest.pdf M. Czarnecki, Algebra liniowa z geometrią, http://math.uni.lodz.pl/ maczar/lectures/alg.pdf B. Gleichgewicht, Algebra, PWN J. Hefferon, Linear Algebra, http://joshua.smcvt.edu/linearalgebra/book.pdf 33

Use Quizgecko on...
Browser
Browser