Archiwa tagu: glowna

11. Afiniczne przestrzenie euklidesowe

Część 1.: Zadania.

Rzuty i symetrie prostopadłe względem podprzestrzeni afinicznych

Jak policzyć rzut wektora na podprzestrzeń afiniczną lub jego obraz w symetrii względem takiej przestrzeni. Ano, sprowadzić do znanego przypadku, czyli podprzestrzeni liniowych, policzyć, wrócić do wyjściowej sytuacji. Czyli przesunąć całość tak, żeby podprzestrzeń afiniczna przechodziła przez zero, policzyć rzut, przesuną z powrotem.

Np. policzmy rzut (2,2,1) na prostą (2,1,0)+lin(-1,-1,0). Zatem najpierw liczymy rzut (2,2,1)-(2,1,0)=(0,1,1) na lin(-1,-1,0):

    \[\frac{\left<(0,1,1),(-1,-1,0)\right>}{\left<(-1,-1,0),(-1,-1,0)\right>}(-1,-1,0)=\frac{-1}{2}(-1,-1,0)=\left(\frac{1}{2},\frac{1}{2},0\right).\]

I przesuwamy z powrotem, żeby dostać ostateczny wynik: \left(\frac{1}{2},\frac{1}{2},0\right)+(2,1,0)=\left(\frac{5}{2},\frac{3}{2},0\right).

Odległość

Możemy zdefiniować odległość między punktami p,q, d(p,q) jako \|p-q\|.

Zauważ, że d(p,q)=0 wtedy i tylko wtedy, gdy p=q, d(p,q)=d(q,p) oraz dla każdych punktów p,q,r, d(p,r)\leq d(p,q)+d(q,r).

Ortgonalny układ bazowy

Układ bazowy p;v_1,\ldots, v_n przestrzeni afinicznej H, nazywa się ortogonalnym (odpowiednio, ortonormalnym), jeśli v_1,\ldots, v_n jest bazą ortogonalną (odpowiednio, ortonormalną) przestrzeni T(H).

Odległość punktu od podprzestrzeni afinicznej

Odległością punktu p od podprzestrzeni afinicznej H, nazywamy d(p,H) odległość pomiędzy p, a rzutem prostopadłym p na H.

Równoległościany i sympleksy

Niech p\in H oraz v_1,\ldots, v_k\in T(H) są liniowo niezależne, to zbiór

    \[R(p_0;v_1,\ldots, v_n)=\left\{p_0+\sum_{i=1}^k a_iv_i\colon a_i\in [0,1]\right\}\]

nazywa się k-wymiarowym równoległościanem wyznaczonym przez ten układ.

Mając dany afinicznie niezależny układ punktów p_0,\ldots, p_k\in H, zbiór

    \[S(p_0,\ldots, p_k)=\left\{\sum_{i=0}^k a_ip_i\colon \sum_{i=0}^k a_i=1\land  \forall_{0\leq i\leq k} a_i\geq 0\right\}\]

nazywa się k-wymiarowym sympleksem o wierzchołkach w punktach p_0,\ldots, p_k. Oczywiście jednowymiarowy sympleks to odcinek, dwuwymiarowy — to trójkąt, a trzy-wymiarowy to czworościan.

k-wymiarowa miara równoległościanów i sympleksów

k-wymiarowa miara \mu_k to generalizacja długości (k=1), pola powierzchni (k=2) oraz objętości (k=3).

Aby uzasadnić, jak policzyć k-wymiarową miarę k-wymiarowego sympleksu lub równoległościanu, potrzebujemy zauważyć, że jeśli v_1,\ldots, v_k będzie liniowo niezależnym układem wektorów w przestrzeni V, v\in V oraz w jest rzutem prostopadłym v na (lin(v_1,\ldots, v_k))^\bot, to
Mamy w=v-w', gdzie w'\in lin(v_1,\ldots, v_k). Niech w'=\sum_{i=1}^k a_i v_i. Zatem

    \[W(v_1,\ldots, v_k,v)=W(v_1,\ldots, v_k,w+w')=\]

    \[=\left|\begin{array}{cccc}\langle v_1,v_1\rangle &\ldots &\langle v_1,v_k\rangle & \langle v_1,w'\rangle\\ \langle v_2,v_1\rangle &\ldots &\langle v_2,v_k\rangle & \langle v_2,w'\rangle\\ &\ldots&&\ldots \\ \langle v_k,v_1\rangle &\ldots &\langle v_k,v_k\rangle & \langle v_k,w'\rangle\\\langle w',v_1\rangle &\ldots &\langle w',v_k\rangle & \langle w,w\rangle+\langle w',w'\rangle\end{array}\right|,\]

bowiem

    \[\langle v_i,w+w'\rangle=\langle v_i,w\rangle+\langle v_i,w'\rangle=\langle v_i,w'\rangle,\]

oraz

    \[\langle w,w'\rangle=0.\]

Zatem

    \[W(v_1,\ldots, v_k,v)=\left|\begin{array}{cccc}\langle v_1,v_1\rangle &\ldots &\langle v_1,v_k\rangle & \sum_{i=1}^k a_i\langle v_1,v_i\rangle\\ \langle v_2,v_1\rangle &\ldots &\langle v_2,v_k\rangle & \sum_{i=1}^k a_i\langle v_2,v_i\rangle\\ &\ldots&&\ldots \\ \langle v_k,v_1\rangle &\ldots &\langle v_k,v_k\rangle & \sum_{i=1}^k a_i\langle v_k,v_i\rangle\\\langle w',v_1\rangle &\ldots &\langle w',v_k\rangle & \sum_{i=1}^k a_i\langle w',v_i\rangle\end{array}\right|+\]

    \[+\left|\begin{array}{cccc}\langle v_1,v_1\rangle &\ldots &\langle v_1,v_k\rangle & 0\\ \langle v_2,v_1\rangle &\ldots &\langle v_2,v_k\rangle & 0\\ &\ldots&&\ldots \\ \langle v_k,v_1\rangle &\ldots &\langle v_k,v_k\rangle & 0\\\langle w',v_1\rangle &\ldots &\langle w',v_k\rangle &  \langle w,w\rangle\end{array}\right|.\]

No ale pierwszy składnik tej sumy jest równy zero, bowiem ostatnia kolumna jest kombinacją poprzednich. Natomiast drugi z tych składników jest równy \langle w,w\rangle W(v_1,\ldots, v_k) (z rozwinięcia względem ostatniej kolumny). Zatem

    \[W(v_1,\ldots, v_k,v)=\|w\|^2W(v_1,\ldots, v_k).\]

Ponieważ, powinno tak być, że k-wymiarowa miara równoległościanu, to iloczyn k-1-wymiarowej miary podstawy oraz jego wysokości (długości odpowiedniego rzutu), stosując rozumowanie indukcyjne, bez trudu dochodzimy do wniosku, że

    \[\mu_{k}(R(p_0;v_1,\ldots,v_k))=\sqrt{W(v_1,\ldots, v_k)}.\]

W takim razie

    \[\mu_{k}(S(p_0,\ldots,p_k))=\frac{1}{k!}\sqrt{W(p_1-p_0,\ldots, p_k-p_0)}.\]

Orientacja przestrzeni

Powiemy, że bazy przestrzeni liniowej V, \mathcal{A}, \mathcal{B} są zgodnie zorientowane, jeśli \det M(id)_{\mathcal{A}}^{\mathcal{B}}>0, oraz że są przeciwnie zorientowane, jeśli \det M(id)_{\mathcal{A}}^{\mathcal{B}}<0. Bycie zgodnie zorientowanym jest więc relacją równoważności na zbiorze baz z dwoma klasami abstrakcji.

Orientacją przestrzeni nazywamy wybór jednej z tej klas abstrakcji (np. poprzez zadanie wybranej bazy). Wtedy bazy z tej klasy abstrakcji nazywamy dodatnie zorientowanymi, a pozostałe — ujemnie zorientowanymi.

Iloczyn wektorowy

Mając zorientowaną n-wymiarową przestrzeń euklidesową V, iloczyn wektorowy definiuje sposób uzupełniania liniowo niezależnego układu n-1 wektorów do bazy V.

Powiemy, że v_n jest iloczynem wektorowym wektorów v_1,\ldots, v_{n-1} (ozn. v_n=v_1\times \ldots \times v_{n-1}), jeśli

  • v_n=0 wtedy i tylko wtedy, gdy v_1,\ldots, v_{n-1} jest układem liniowo zależnym,
  • w przeciwnym przypadku, v_1,\ldots, v_{n-1}, v_n jest dodatnio zorientowaną bazą V,

        \[v_n\in (lin(v_1,\ldots, v_{n-1}))^{\bot}\]

    oraz

        \[\|v_n\|=\sqrt{W(v_1,\ldots, v_{n-1})}.\]

6. Algebra liniowa, ciąg dalszy

Część 1.: Zadania.

Idea wektorów i wartości własnych

Jeśli ktoś próbował sobie kiedykolwiek wyobrazić przekształcenie liniowe np. płaszczyzny, to pewnie wyobrażał sobie, że ono ściska bądź rozciąga tę płaszczyznę wzdłuż różnych kierunków. Rzeczywiście miło by było wiedzieć, czy jak mamy jakieś dane przekształcenie liniowe \varphi\colon V\to V (takie przekształcenie, którego dziedzina i przeciwdziedzina to ta sama przestrzeń, nazywamy endomorfizmem), to polega ono właśnie na tym. Inaczej mówiąc, chcielibyśmy wiedzieć, czy istnieją taki niezerowy wektor v oraz liczba \lambda, że przekształcenie \varphi po prostu mnoży wektor v przez \lambda (czyli rozciąga lub ściska przestrzeń V w kierunku wyznaczonym przez ten wektor), czyli:

    \[\varphi(v)=\lambda v.\]

Jeśli v oraz \lambda mają takie własności, to wektor v nazywamy wektorem własnym tego przekształcenia, zaś \lambda to jego wartość własna.

Znajdywanie wartości własnych

Zauważ, że jeśli \lambda jest wartością własną przekształcenia \varphi oraz v jest wektorem własnym, to \varphi(v)-\lambda v=0. A zatem, jeśli M jest macierzą \varphi (powiedzmy w bazie standardowej), to

    \[0=Mv-\lambda v=Mv-\lambda I v=(M-\lambda I)v\]

, gdzie I to macierz jednostkowa.

Ponieważ mnożenie macierzy przez wektor, to kombinowanie jej kolumn ze sobą, oraz v jest niezerowy, to oznacza, że kolumny macierzy M-\lambda I da się skombinować nietrywialnie w wektor zerowy! Jest to możliwe wtedy i tylko wtedy, gdy \det (M-\lambda I)=0.

A zatem jak znaleźć wartości własne przekształcenia? Po prostu trzeba rozwiązać równanie \det (M-\lambda I)=0. Np. niech \varphi (x,y,z)=(2x,x+y,-x+z). Wtedy:

    \[M(\varphi)_{st}^{st}=\left[\begin{array}{ccc}2&0&0\\1&1&0\\-1&0&1\end{array}\right]\]

Zatem:

    \[M(\varphi)_{st}^{st}-\lambda I=\left[\begin{array}{ccc}2-\lambda&0&0\\1&1-\lambda&0\\-1&0&1-\lambda\end{array}\right].\]

Czyli musimy rozwiązać równanie:

    \[\det (M(\varphi)_{st}^{st}-\lambda I)=(2-\lambda)(1-\lambda)^2=0\]

A zatem wartości własne to: 2 oraz 1.

Przestrzenie własne

To pora znaleźć wektory własne odpowiadające poszczególnym wartościom. Zauważ, że ponieważ \varphi jest przekształceniem liniowym, to jeśli v, v' są wektorami własnym dla wartości własnej \lambda, to dla dowolnej liczby a także av oraz v+v' są wektorami własnymi dla \lambda. A zatem zbiór wektorów własnych dla wartości \lambda jest podprzestrzenią liniową. Zauważ, że wektor v spełnia równanie

    \[(M-\lambda I)v=0\]

a zatem przestrzeń wektorów własnych dla wartości własnej \lambda (zwana też przestrzenią własną dla \lambda, ozn. V_{(\lambda)}) jest opisana układem równań jednorodnych:

    \[(M-\lambda I)v=0\]

i możemy z łatwością znaleźć jej bazę.

W naszym przykładzie, znajdźmy bazę przestrzeni V_{(1)}, czyli niech \lambda=1. Zatem:

    \[M(\varphi)_{st}^{st}-\lambda I=\left[\begin{array}{ccc}1&0&0\\1&0&0\\-1&0&0\end{array}\right]\]

A zatem układ równań, to:

    \[\begin{cases}x=0\\x=0\\-x=0\end{cases}\]

Przestrzeń rozwiązań, to zatem V_{(1)}=\{(0,y,z)\colon y,z\in\mathbb{R}\}, a jej baza to (0,1,0),(0,0,1). Rzeczywiście \varphi((0,1,0))=1\cdot (0,1,0) oraz \varphi((0,0,1))=1\cdot (0,0,1).

Znajdźmy bazę przestrzeni V_{(2)}, czyli niech \lambda=2. Zatem:

    \[M(\varphi)_{st}^{st}-\lambda I=\left[\begin{array}{ccc}0&0&0\\1&-1&0\\-1&0&-1\end{array}\right]\]

A zatem układ równań, to:

    \[\begin{cases}0=0\\x-y=0\\-x-z=0\end{cases}\]

W postaci schodkowej zredukowanej:

    \[\left[\begin{array}{ccc|c}1&0&1&0\\0&1&1&0\\0&0&0&0\end{array}\right]\]

Przestrzeń rozwiązań, to zatem V_{(2)}=\{(-z,-z,z)\colon y,z\in\mathbb{R}\}, a jej baza to (-1,-1,1). Rzeczywiście \varphi((-1,-1,1))=(-2,-2,2)=2\cdot (-1,-1,1).

Baza własna

Jeśli zdarzy się tak, że suma wymiarów przestrzeni własnych jest równa wymiarowi całej przestrzeni (tak jest w naszym przykładzie 1+2=3), to bazę złożoną z baz przestrzeni własnych (w naszym wypadku: \mathcal{A}=\{(0,1,0),(0,0,1),(-1,-1,1)\}) nazywamy bazą własną przekształcenia.

To że przekształcenie ma bazę własną, oznacza, że jest zadane poprzez ściskanie i rozciąganie przestrzeni w tych własnych kierunkach. Zauważ, że macierz tego przekształcenia w bazie własnej jest macierzą diagonalną (ma niezerowe elementy tylko na przekątnej) z wartościami własnymi opowiadającymi poszczególnym wektorom z bazy na przekątnej. W naszym wypadku:

    \[M(\varphi)_{\mathcal{A}}^{\mathcal{A}}=\left[\begin{array}{ccc}1&0&0\\0&1&0\\0&0&2\end{array}\right]\]

Nie musi się tak zdarzyć. Może się okazać, że przekształcenie w ogóle nie ma wektorów własnych (np. obrót), lub że przestrzenie własne są za małe (np. obrót przestrzeni trójwymiarowej o 10 stopni względem jednej z osi ma tylko jednowymiarową przestrzeń własną).

Diagonalizacja macierzy

Macierz M jest diagonalizowalna, jeśli istnieje taka macierz C, że:

    \[M=C\cdot D\cdot C^{-1},\]

gdzie D jest pewną macierzą diagonalną.

Jak sprawdzić? I jak zdiagonalizować macierz, czyli znaleźć macierz D, jeśli taka istnieje. A no bierzemy przekształcenie \varphi takie że M to jego macierz w bazie standardowej. Macierz M jest diagonalizowalna, wtedy i tylko wtedy, gdy \varphi ma bazę własną \oA. Wtedy:

    \[M=M(id)_{\mathcal{A}}^{st}\cdot D\cdot (M(id)_{\mathcal{A}}^{st})^{-1}\]

i D=M(\varphi)_{\mathcal{A}}^{\mathcal{A}}, bowiem (M(id)_{\mathcal{A}}^{st})^{-1}=M(id)_{st}^{\mathcal{A}}.

Np. wiemy, że macierz

    \[\left[\begin{array}{ccc}2&0&0\\1&1&0\\-1&0&1\end{array}\right]\]

jest diagonalizowalna, bo \varphi odpowiadające tej macierzy ma bazę własną. Wiemy ponadto, że w tym wypadku:

    \[D=M(\varphi)_{\mathcal{A}}^{\mathcal{A}}=\left[\begin{array}{ccc}1&0&0\\0&1&0\\0&0&2\end{array}\right]\]

oraz

    \[C=M(id)_{\mathcal{A}}^{st}=\left[\begin{array}{ccc}0&0&-1\\1&0&-1\\0&1&1\end{array}\right].\]

Potęgowanie macierzy diagonalizowalnych

Diagonalizacja macierzy ma na przykład takie ciekawe zastosowanie, że można bardzo łatwo policzyć potęgi macierzy, o ile jest ona diagonalizowalna. Zauważmy bowiem, że jeśli \mathcal{A} jest bazą, to:

    \[\left(M(\varphi)_{\mathcal{A}}^{\mathcal{A}}\right)^{n}=M\left(\underbrace{\varphi\circ\ldots\circ\varphi}_{n}\right)_{\mathcal{A}}^{\mathcal{A}},\]

A zatem:

    \[(M(\varphi)_{st}^{st})^{n}=M\left(\underbrace{\varphi\circ\ldots\circ\varphi}_{n}\right)_{st}^{st}=\]

    \[=M(id)_{\mathcal{A}}^{st}\cdot M\left(\underbrace{\varphi\circ\ldots\circ\varphi}_{n}\right)_{\mathcal{A}}^{\mathcal{A}}\cdot M(id)_{st}^{\mathcal{A}} = M(id)_{\mathcal{A}}^{st}\cdot \left(M\left(\varphi\right)_{\mathcal{A}}^{\mathcal{A}}\right)^{n}\cdot M(id)_{st}^{\mathcal{A}}\]

z tym, że jeśli \mathcal{A} jest bazą własną, to macierz M\left(\varphi\right)_{\mathcal{A}}^{\mathcal{A}} jest macierzą diagonalną i podniesienie jej do potęgi jest po prostu podniesieniem do potęgi wyrazów na przekątnej.

Zróbmy to na przykładzie. Obliczmy:

    \[\left[\begin{array}{ccc}2&0&0\\1&1&0\\-1&0&1\end{array}\right]^{5}\]

Mamy:

    \[C=M(id)_{\mathcal{A}}^{st}=\left[\begin{array}{ccc}0&0&-1\\1&0&-1\\0&1&1\end{array}\right].\]

Zatem

    \[C^{-1}=M(id)_{st}^{\mathcal{A}}=\left[\begin{array}{ccc}-1&1&0\\1&0&1\\-1&0&0\end{array}\right].\]

A zatem:

    \[\left[\begin{array}{ccc}2&0&0\\1&1&0\\-1&0&1\end{array}\right]^{5}=C \cdot \left[\begin{array}{ccc}1&0&0\\0&1&0\\0&0&2\end{array}\right]^{5}\cdot C^{-1}=C \cdot \left[\begin{array}{ccc}1&0&0\\0&1&0\\0&0&32\end{array}\right]^{5}\cdot C^{-1}=\left[\begin{array}{ccc}32&0&0\\31&1&0\\-31&0&1\end{array}\right].\]

4. Podstawy algebry liniowej

Część 1.: Zadania, rozwiązania.
Część 2.: Zadania, rozwiązania.
Część 3.: Zadania, rozwiązania.
Część 4.: Zadania, rozwiązania.
Część 5.: Zadania, rozwiązania.
Część 6.: Zadania, rozwiązania.
Część 7.: Zadania, rozwiązania
Część 8.: Zadania, rozwiązania.
Część 9.: Zadania, rozwiązania.

Układ k równań linowych z niewiadomymi x_{1}, x_{2},\ldots, x_{n} to po prostu zestaw k równań, w których niewiadome nie występują w żadnych potęgach i bez mnożenia pomiędzy nimi:

    \[\begin{cases} a_{1,1}x_1+a_{2,1}x_2+\ldots+a_{n,1}x_n=b_1\\ a_{1,2}x_1+a_{2,2}x_2+\ldots+a_{n,2}x_n=b_2\\ \ldots\\ a_{1,k}x_1+a_{2,k}x_2+\ldots+a_{n,k}x_n=b_k \end{cases},\]

gdzie a_{i,j},b_j są po prostu pewnymi liczbami rzeczywistymi. Na przykład to jest układ 3 równań z czterema niewiadomymi:

    \[\begin{cases}x_{1}+3x_{2}+x_{3}+5x_{4}=2\\ 2x_{1}+7x_{2}+9x_{3}+2x_{4}=4\\ 4x_{1}+13x_{2}+11x_{3}+12x_{4}=8\end{cases}\]

Rozwiązaniem takiego układu równań jest zestaw czterech liczb (tyle ile jest niewiadomych), który po podstawieniu za nie, spełnia każde z tych 3 równań. Na przykład: (2,0,0,0). Ale układ równań może mieć więcej niż jedno rozwiązanie. Na przykład (22,-7,1,0) też jest rozwiązaniem tego układu także. Mówiąc bardziej precyzyjnie układ równań liniowych może mieć 0, 1 lub nieskończenie wiele rozwiązań.

Natomiast rozwiązaniem ogólnym nazywamy opis wszystkich rozwiązań (co czasem oznacza powiedzenie, że rozwiązań nie ma lub wskazanie jedynego rozwiązania). Jak rozwiązanie ogólne znaleźć? Będziemy się posługiwać tzw. metodą eliminacji Gaussa, inaczej zwaną sprowadzaniem do postaci schodkowej.

Pierwszym krokiem jest zapisanie macierzy tego układu. Macierz, to po prostu tablica z liczbami. Macierze będą odgrywać coraz bardziej ważną rolę na tym przedmiocie, ale póki co możemy taką macierz ze współczynnikami z układu po prostu rozumieć jako skrótową notację układu równań. Po prostu wypisujemy współczynniki z układu równań oddzielając kolumnę wolnych współczynników kreską.

    \[\left[\begin{array}{cccc|c}1 & 3 & 1 & 5 & 2\\ 2 & 7 & 9 & 2 & 4\\ 4 & 13 & 11 & 12 & 8\end{array}\right]\]

Następnie będziemy dokonywać operacji na tej macierzy. Nasze operacje będą tę macierz upraszczać, ale jednocześnie musimy zadbać o to, żeby po każdej takiej operacji zbiór rozwiązań układu równań się nie zmienił. Dlatego wolno nam używać 3 dozwolonych operacji:

  • odjąć od pewnego wiersza inny wiersz pomnożony przez pewną liczbę (odpowiada odejmowaniu równań stronami)
  • zamienić dwa wiersze miejscami (odpowiada zamienieniu dwóch równań w układzie miejscami)
  • pomnożyć wiersz przez liczbę różną od zera (odpowiada pomnożeniu obu stron równania przez daną liczbę)

Natomiast naszym celem będzie sprowadzenie przy pomocy tych operacji do postaci schodkowej (w sensie, że na macierzy mogę narysować schodki, pod którymi są same zera). Oznacza to, że każdym kolejnym równaniu mamy coraz mniej niewiadomych.

Co zrobić z naszą macierzą zatem? A no najlepiej zacząć generować schodki od lewej używając pierwszego wiersza. Pod jedynką w lewym prawym rogu, chcielibyśmy mieć zera. Żeby to osiągnąć musimy od drugiego wiersza odjąć pierwszy przemnożony przez 2, a od trzeciego, pierwszy pomnożony przez cztery. Czyli:

    \[\underrightarrow{w_{2}-2w_{1}, w_{3}-4w_{1}} \left[\begin{array}{cccc|c}1 & 3 & 1 & 5 & 2\\ 0 & 1 & 7 & -8 & 0\\ 0 & 1 & 7 & -8 & 0\end{array}\right]\]

To teraz chcemy mieć zero poniżej jedynki na schodku w drugim wierszu. Zatem od trzeciego odejmujemy drugi:

    \[\underrightarrow{w_{3}-w_{2}} \left[\begin{array}{cccc|c}1 & 3 & 1 & 5 & 2\\ 0 & 1 & 7 & -8 & 0\\ 0 & 0 & 0 & 0 & 0\end{array}\right]\]

I mamy postać schodkową! Schodek w pierwszym wierszu dotyczy pierwszej niewiadomej, a schodek w drugim wierszu, drugiej niewiadomej.

Kolejnym krokiem jest redukcja (doprowadzenie do postaci schodkowej zredukowanej). Idea jest taka, że w kolumnach, w których są schodki, powyżej chcemy mieć zera. W naszym przypadku dotyczy to tylko trójki na 2. miejscu w pierwszym wierszu. Aby tam mieć zero musimy odjąć od pierwszego wiersza, drugi przemnożony przez 3:

    \[\underrightarrow{w_{1}-3w_{2}} \left[\begin{array}{cccc|c}1 & 0 & -20 & 29 & 2\\ 0 & 1 & 7 & -8 & 0\\ 0 & 0 & 0 & 0 & 0\end{array}\right],\]

Musimy jeszcze zadbać, żeby na schodkach były tylko jedynki (czasem trzeba jakiś wiersz przemnożyć przez ułamek), ale w naszym wypadku stało się tak ,,samo”. Doszliśmy więc do postaci schodkowej zredukowanej. Teraz wystarczy wypisać niezerowe równania z nieschodkowymi niewiadomymi przeniesionymi na prawą stronę i to jest właśnie rozwiązanie ogólne układu równań:

    \[\begin{cases}x_{1}=2+20x_{3}-29 x_{4}\\ x_{2}=-7x_{3}+8x_{4} \end{cases}\]

Można też je przedstawić w postaci parametrycznej podstawiając do wektora (x_1,x_2,x_3,x_4) to co z rozwiązania ogólnego wiemy, czyli: (2+20x_{3}-29 x_{4}, -7x_{3}+8x_{4}, x_{3},x_{4}). To rozwiązanie parametryczne ma tą cechę, że wstawiając za te pozostałe niewiadome zupełnie dowolne liczby, dostaniemy wektor (wektorem nazywamy zestaw kilku liczb), który jest rozwiązaniem układu równań (ten układ równań ma nieskończenie wiele rozwiązań). Np. podstawiając x_3=1,x_4=0 dostajemy rozwiązanie (22,-7,1,0), o którym wspomniałem wcześniej.

Na koniec trochę terminologii. Układ równań liniowych jest:

  • jednorodny, jeśli we wszystkich równaniach wyraz wolny (składnik bez niewiadomej) jest równy zero,
  • oznaczony, jeśli ma dokładnie jedno rozwiązanie,
  • sprzeczny, jeśli nie ma żadnego rozwiązania.

Na przykład układ:

    \[\begin{cases} x+y=2\\x-2y=-1\end{cases}\]

nie jest jednorodny, jest oznaczony i nie jest sprzeczny. Zaś układ:

    \[\begin{cases} x+y+z=0\\x-y-z=0\\2x+y=0\end{cases}\]

jest jednorodny i oznaczony i nie jest sprzeczy. Natomiast przykładem sprzecznego układu jest układ:

    \[\begin{cases} x+y+z=0\\-2x-2y-2z=-1\end{cases}\]

Definicja wynacznika

Do różnych zastosowań będzie nam się bardzo przydawać umiejętność policzenia wyznacznika macierzy. Wyznacznik macierzy ma sens dla macierzy kwadratowych — i jest zdefiniowany rekurencyjnie:

  • \det[a]=a
  •     \[\det \left[\begin{array}{cccc}a_{1,1}&a_{1,2}&\ldots&a_{1,n}\\a_{2,1}&a_{2,2}&\ldots&a_{2,n}\\\ldots&\ldots&&\ldots\\ a_{n,1}&a_{n,2}&\ldots&a_{n,n}\end{array}\right]=\]

        \[=a_{1,1}\det A_{1,1}-a_{1,2}\det A_{1,2}+a_{1,3}\det A_{1,3}-\ldots\pm a_{1,n}\det A_{1,m},\]

gdzie A_{i,j} to macierz A z wykreślonym i-tym wierszem i j-tą kolumną. Czyli (wyznacznik oznaczamy \det lub poprzez napisanie zamiast nawiasów macierzy modułów):

    \[\left|\begin{array}{cc}a&b\\c&d\end{array}\right|=ad-bc,\]

a zatem:

    \[\left|\begin{array}{ccc}a&b&c\\k&l&m\\x&y&z\end{array}\right|=a\left|\begin{array}{cc}l&m\\y&z\end{array}\right|-b\left|\begin{array}{cc}k&m\\x&z\end{array}\right|+c\left|\begin{array}{cc}k&l\\x&y\end{array}\right|=\]

    \[=a(lz-my)-b(kz-mx)+c(ky-lx)=alz+bmx+cky-amy-bkz-clx.\]

I tak dalej. Na przykład:

    \[\left|\begin{array}{cccc}1&0&2&0\\2&3&0&-1\\3&-1&-1&0\\0&1&-1&-2\end{array}\right|=\]

    \[=1\left|\begin{array}{ccc}3&0&-1\\-1&-1&0\\1&-1&-2\end{array}\right|-0\left|\begin{array}{cccc}2&0&-1\\3&-1&0\\0&-1&-2\end{array}\right|+2\left|\begin{array}{cccc}2&3&-1\\3&-1&0\\0&1&-2\end{array}\right|-0\left|\begin{array}{cccc}2&3&0\\3&-1&-1\\0&1&-1\end{array}\right|=\]

    \[=1\cdot 4-0+2\cdot 19-0=42\]

Rozwinięcie Laplace’a

Definicja podana wyżej jest tylko szczególnym przypadkiem ogólnego faktu zwanego rozwinięciem Laplace’a. Zamiast korzystać z pierwszego wiersza, możemy do generowania wiersza użyć dowolnego wiersza lub kolumny (najlepiej tego z dużą liczbą zer). Czyli:

    \[\det \left[\begin{array}{cccc}a_{1,1}&a_{1,2}&\ldots&a_{1,n}\\a_{2,1}&a_{2,2}&\ldots&a_{2,n}\\\ldots&\ldots&&\ldots\\ a_{n,1}&a_{n,2}&\ldots&a_{n,n}\end{array}\right]=\]

    \[=(-1)^{i+1}\left(a_{i,1}\det A_{i,1}-a_{i,2}\det A_{i,2}+a_{i,3}\det A_{i,3}-\ldots\pm a_{i,n}\det A_{i,m}\right),\]

dla dowolnego wiersza w_i. Analogiczny fakt jest oczywiście prawdziwy dla kolumn.

Czyli na przykład w poniższej macierzy, zdecydowanie opłaca się policzyć rozwinięcie względem trzeciej kolumny:

    \[\left|\begin{array}{cccc}1&1&0&-1\\2&0&-1&-1\\3&-1&0&1\\0&1&0&-2\end{array}\right|=(-1)^3\cdot(-1)\cdot \left|\begin{array}{cccc}1&1&-1\\3&-1&1\\0&1&-2\end{array}\right|=4\]

Wyznacznik a operacje na macierzach

Zauważmy najpierw, że z faktu o rozwinięciu Laplace’a wynika w szczególności, że jeśli macierz ma zerowy rząd (lub kolumnę), to jej wyznacznik wynosi zero.

Rozpatrzmy teraz różne operacje na wierszach macierzy, które lubimy wykonywać. Posługując się rozwinięciem Laplace’a można udowodnić, że zamiana dwóch wierszy ze sobą mnoży wyznacznik przez -1 — rzeczywiście licząc rozwinięcie względem pierwszej kolumny zmienią się (być może) znaki przy sumowaniu ale i zmienią się miejscami wiersze też wiersze w macierzach minorowych, z których coś wykreśliliśmy.

Od razu widać za to z rozwinięcia Laplace’a, że przemnożenie wiersza przez liczbę, mnoży wyznacznik macierzy przez tę liczbę — można to zobaczyć wypisując rozwinięcie Laplace’a względem tego wiersza.

A zatem przemnożenie macierzy przez pewną liczbę mnoży wyznacznik przez tę liczbę tyle razy ile jest wierszy w macierzy, czyli:

    \[\det (aA)=a^n \det A, \]

gdzie macierz A jest macierzą n\times n

Zauważmy też, że wyznacznik macierzy, która ma takie same dwa wiersze, to 0, ponieważ — zamieniając te dwa wiersze ze sobą nie zmieniamy macierzy, a mnożymy wyznacznik przez -1, czyli \det A=-\det A, a zatem \det A=0. Zatem ze względu na regułę związaną z mnożeniem wiersza przez liczbę, jeśli dwa wiersze macierzy są liniowo zależne od siebie, to wyznacznik tej macierzy to 0.

Również z rozwinięcia Laplace’a od razu widać, że jeśli macierze A, B, C różnią się tylko i-tym wierszem w ten sposób, że ten wiersz w macierzy C jest sumą i-tych wierszy z macierzy B i C, to wyznacznik C to suma wyznaczników A i B, np:

    \[\left|\begin{array}{ccc}1&3&-1\\0&1&2\\0&3&3\end{array}\right|=\left|\begin{array}{ccc}0&1&4\\0&1&2\\0&3&3\end{array}\right|+\left|\begin{array}{ccc}1&2&-5\\0&1&2\\0&3&3\end{array}\right|.\]

Uwaga! Łatwo widać, że z reguły \det(A+B)\neq \det A+\det B!

W końcu możemy więc zbadać, jak wyznacznik macierzy zmienia podstawowa operacja na wierszach, czyli operacja dodania do jednego wiersza innego przemnożonego przez liczbę. Wtedy mamy tak naprawdę do czynienie z właśnie opisaną sytuacją — wynikowa macierz to macierz C, w która różni się od macierzy A i B tylko wierszem, do którego dosumowujemy inny. Macierz A to oryginalna macierz, a macierz C to macierz A w której zamiast wiersza do którego sumujemy jest wiersz, który dodajemy przemnożony przez liczbę. A zatem \det A=\det B+\det C, ale C ma dwa liniowo zależne wiersze, a zatem \det C=0 i \det B=\det A. A zatem operacja dodania do danego wiersza innego przemnożonego przez liczbę nie zmienia wyznacznika.

Liczenie wyznacznika przez sprowadzanie macierzy do postaci schodkowej

Z rozwinięcia Laplace’a, jak się przyjrzeć, to łatwo widać, że wyznacznik macierzy w postaci schodkowej (zwanej często dla macierzy kwadratowych, postacią trójkątną), jest równy iloczynowi jej wyrazów na przekątnej, czyli np.:

    \[\left|\begin{array}{ccc}-1&3&-1\\0&1&2\\0&0&3\end{array}\right|=(-1)\cdot 1\cdot 3=-3.\]

Ponieważ wiemy, jak zmieniają wyznacznik operacje na wierszach, możemy sprowadzić macierz do postaci schodkowej, policzyć jej wyznacznik, i odtworzyć wyznacznik oryginalnej macierzy, co szczególnie dobrze się sprawdza przy dużych macierzach, np. 5\times 5:

    \[\left[\begin{array}{ccccc}1&2&0&3&1\\2&6&2&0&2\\3&9&1&1&-1\\1&2&0&3&4\\1&2&0&1&1\end{array}\right]\underrightarrow{w_2-2w_1,w_3-3w_1,w_4-w_1,w_5-w_1}\]

    \[\left[\begin{array}{ccccc}1&2&0&3&1\\0&2&2&-6&0\\0&3&1&-8&-4\\0&0&0&0&3\\0&0&0&-2&0\end{array}\right]\underrightarrow{w_2\cdot\frac{1}{2}}\]

    \[\left[\begin{array}{ccccc}1&2&0&3&1\\0&1&1&-3&0\\0&3&1&-8&-4\\0&0&0&0&3\\0&0&0&-2&0\end{array}\right]\underrightarrow{w_3-3w_2, w_4\leftrightarrow w_5} \left[\begin{array}{ccccc}1&2&0&3&1\\0&1&1&-3&0\\0&0&-2&1&-4\\0&0&0&-2&0\\0&0&0&0&3\end{array}\right]\]

A zatem wyznacznik końcowej macierzy to 1\cdot 1\cdot (-2)\cdot (-2)\cdot 3=12. Po drodze raz zamienialiśmy wiersze, raz mnożyliśmy przez \frac{1}{2}, a zatem wyznacznik początkowej macierzy, to \frac{12\cdot(-1)}{\frac{1}{2}}=-24.

Z tego, że wystarczy policzyć wyznacznik przez sprowadzanie do postaci schodkowej, łatwo wynika zasada o wyznaczniku macierzy w postaci blokowej, czyli macierzy składającej się z 4 bloków, z których lewy dolny to zera, czyli \left[\begin{array}{cc}A&C\\0&B\end{array}\right]. Wyznacznik takiej macierzy, to \det A\cdot \det B, np:

    \[\left|\begin{array}{ccccc}1&2&0&3&1\\2&6&2&0&2\\3&9&1&1&-1\\0&0&0&3&4\\0&0&0&1&1\end{array}\right|= \left|\begin{array}{ccc}1&2&0\\2&6&2\\3&9&1\end{array}\right|\cdot\left|\begin{array}{cc}3&4\\1&1\end{array}\right|.\]

Wzory Cramera

Jeśli mamy układ n równań z n niewiadomymi możemy zbadać go korzystając ze wzorów Cramera. Niech A będzie macierzą układu równań bez kolumny współczynników wolnych, zaś A_{i} macierzą A, w której zamiast i-tej kolumny wstawiono kolumnę wyrazów wolnych, wtedy:

  • jeśli \det A\neq 0, to układ jest oznaczony i rozwiązanie jest dane według wzoru x_{i}=\frac{\det A_i}{\det A},
  • jeśli \det A=0, ale nie wszystkie wyznaczniki \det A_{i} są równe 0, to układ jest sprzeczny,
  • jeśli \det A=0 oraz dla każdego i, \det A_{i}=0, to układ może być nieoznaczony, ale też może być sprzeczny — nie wiadomo

Rozwiążmy w ten sposób układ:

    \[\begin{cases} x+2y+z=1\\2x+5y+2z=-1\\-x-2y=0\end{cases}\]

A zatem:

    \[A=\left[\begin{array}{ccc}1&2&1\\2&5&2\\-1&-2&0\end{array}\right]\]

Ponieważ \det A=1, to układ jest oznaczony. Aby wyliczyć pierwiastki liczymy wyznaczniki:

    \[\det A_1= \left|\begin{array}{ccc}1&2&1\\-1&5&2\\0&-2&0\end{array}\right|=6\]

    \[\det A_2= \left|\begin{array}{ccc}1&1&1\\2&-1&2\\-1&0&0\end{array}\right|=-3\]

    \[\det A_3= \left|\begin{array}{ccc}1&2&1\\2&5&-1\\-1&-2&0\end{array}\right|=1\]

A zatem x=\frac{6}{1}=6, y=\frac{-3}{1}=-3, z=\frac{1}{1}=1.

Przestrzenie liniowe

Ogólnie rzecz ujmując przestrzenią liniową będziemy nazywali ,,przestrzeń” (zbiór) złożoną z wektorów, które można:

  • dodawać do siebie i to dodawanie jest łączne ((u+v)+w=u+(v+w)) oraz przemienne (u+v=v+u)
  • mnożyć przez liczbą i to mnożenie jest rozdzielne względem dodawania (a(v+w)=av+bw), rozdzielne względem dodawania liczb ((a+b)v=av+bv) oraz zgodne z mnożeniem liczb (a(bv)=(ab)v)

i w której istnieje wektor zerowy 0 o właściwości takiej, że v+0=v, dla dowolnego wektora v oraz dla każdego wektora v jest wektor w (przeciwny do v) taki, że v+w=0.

Najbardziej standardowym przykładem przestrzeni liniowej jest płaszczyzna. Wektory to pary liczb (x,y), można je do siebie dodawać (x_1,y_1)+(x_2,y_2)=(x_1+x_2,y_1+y_2) oraz mnożyć przez liczbę a\cdot(x,y)=(ax,ay). Jest też wektor zerowy (0,0) oraz dla każdego wektora (x,y) mamy wektor przeciwny, mianowicie (-x,-y).

Ale oczywiście przestrzenią liniową jest też zbiór wszystkich wektorów składających się z większej liczby liczb, na przykład z 4, (x,y,z,t). I choć taką przestrzeń czterowymiarową trudno nam sobie geometrycznie wyobrazić, to widać, że dodawanie i mnożenie przez liczbę działa dokładnie tak samo, jak w przypadku dwuwymiarowym.

Podprzestrzenie liniowe

Podprzestrzenią liniową nazywamy taki podzbiór X jakiejś przestrzeni liniowej, który jest zamknięty na operacje na wektorach, czyli jeśli wektory u,v należą do X, to u+v też jest w X oraz dla każdej liczby a, także au jest w X.

Aby udowodnić, że coś jest podprzestrzenią liniową, muszę udowodnić, że dla dowolnych dwóch wektorów z danego mi zbioru zachodzi warunek z dodawaniem oraz dla każdego wektora z tego zbioru i dowolnej liczby zachodzi warunek z mnożeniem. Aby udowodnić, że coś nie jest podprzestrzenią liniową, wystarczy, że wskażę takie dwa wektory w danym mi zbiorze, że ich suma w nim nie jest lub wskażę jeden wektor w tym zbiorze oraz liczbę, taką że ich iloczyn nie jest w moim zbiorze.

A zatem na przykład prosta y=0 jest podprzestrznią liniową płaszczyzny, bowiem jeśli u,v należą do tej prostej, to mają postać odpowiednio (x_1,0) i (x_2,0) a ich suma to (x_1+x_2,0) należy do danej prostej. Podobnie dla dowolnej liczby a, iloczyn a(x_1,0)=(ax_1,0) należy do danej nam prostej.

Z drugiej strony zbiór \{(x,y)\colon x\geq0\} nie jest poprzestrzenią liniową, bo wektor (1,0), który należy do tego zbioru przemnożony przez liczbę -1 daje wektor (-1,0) nienależący do tego zbioru.

Kombinacje liniowe

Mając dany zestaw iluś wektorów v_1,v_2,\ldots v_n, ich kombinacją liniową nazywamy każdy wektor postaci a_1v_1+a_2v_2+\ldots a_nv_n, gdzie a_1,a_2,\ldots a_n to dowolne liczby. Na przykład wektor (-2,1) jest kombinacją wektorów (1,1) oraz (2,1) bowiem (-2,1)=4(1,1)-3(2,1). Jak to wyliczyć nie zgadując? Zauważmy, że szukamy liczb a,b, takich że a(1,1)+b(2,1)=(-2,1). To tak naprawdę układ 2 równań:

    \[\begin{cases}a+2b=-2\\a+b=1\end{cases}\]

i wystarczy go rozwiązać:

    \[\left[\begin{array}{cc|c}1&2&-2\\1&1&1\end{array}\right]\underrightarrow{w_2-w_1} \left[\begin{array}{cc|c}1&2&-2\\0&-1&3\end{array}\right] \underrightarrow{(-1)\cdot w_2}\]

    \[\left[\begin{array}{cc|c}1&2&-2\\0&1&-3\end{array}\right]\underrightarrow{w_1-2w_2}\left[\begin{array}{cc|c}1&0&4\\0&1&-3\end{array}\right]\]

czyli a=4,b=-3. Gdyby ten układ był sprzeczny, oznaczałoby to, że nasz wektor wcale nie jest kombinacją liniową tych dwóch wektorów.

Zbiór wszystkich kombinacji liniowych danego zestawu wektorów v_1,\ldots, v_n oznaczamy \text{lin}(v_1,\ldots,v_n).

Liniowa niezależność

Zestaw wektorów nazywamy liniowo niezależnym, jeśli żaden z nich nie jest kombinacją liniową pozostałych. To jednak dość niewygodna definicja w praktyce, bo żeby ją wprost zweryfikować na podstawie tego, co robiliśmy w poprzednim akapicie, to trzeba by było sprawdzić, że sprzecznych jest tyle układów równań ile jest wektorów w zestawie. Trzeba więc się postarać o inną, równoważną, ale bardziej praktyczną definicję.

Zauważcie, że jeśli któryś z wektorów jest kombinacją liniową pozostałych, np: v_5=a_1 v_1+a_2 v_3+a_3 v_3+a_4 v_4, to po przeniesieniu v_5 na drugą stronę okazuje się, że wektor zerowy można przedstawić, jako a_1 v_1+a_2 v_3+a_3 v_3+a_4 v_4 + (-1)v_5, czyli jako pewną kombinację liniową tych wektorów, w której co najmniej jeden ze współczynników nie jest zerem. Dlatego okazuje się, że doszliśmy do równoważnej definicji liniowej niezależności wektorów: zestaw wektorów jest liniowo niezależny, o ile jeśli z ich pewnej kombinacji wychodzi wektor zerowy, to wszystkie współczynniki w tej kombinacji są po prostu zerami. Innymi słowy jedyną opcją na uzyskanie wektora zerowego z nich jest metoda trywialna, czyli przemnożenie wszystkich przez zero i dodanie do siebie.

Zatem jak sprawdzić, czy dany nam zestaw wektorów jest liniowo niezależny? A no trzeba wyliczyć współczynniki dla jakich wektor zerowy jest kombinacją liniową danych wektorów (jeśli jedyne rozwiązanie to same zera, to są liniowo niezależne). Inaczej mówiąc sprawdzić, czy odpowiedni jednorodny układ równań jest oznaczony.

Na przykład sprawdźmy, że (1,1), (2,1) to zestaw wektorów liniowo niezależnych. Rozwiązujemy układ równań:

    \[\left[\begin{array}{cc|c}1&2&0\\1&1&0\end{array}\right]\underrightarrow{w_2-w_1} \left[\begin{array}{cc|c}1&2&-2\\0&-1&3\end{array}\right]\]

I już na tym etapie wiemy, że układ jest oznaczony, bo ma schodek w każdym wierszu. A zatem ten zestaw (układ) wektorów jest liniowo niezależny.

Inna metoda jest następująca — zauważmy, że operacje na wierszach macierzy to nic innego jak liniowe kombinowanie wektorów zapisanych w wierszach tej macierzy ze sobą. Jeśli pojawi się wiersz zerowy, to znaczy, że wektor zerowy był nietrywialną kombinacją liniową wektorów początkowo zapisanych w wierszach macierzy i zatem nie były one liniowo niezależne. Sprawdźmy to na przykładzie wektorów (1,2,1),(-2,0,-2),(1,3,1).

    \[\left[\begin{array}{ccc}1&2&1\\-2&0&-2\\1&3&1\end{array}\right]\underrightarrow{w_2+2w_1, w_3-w_1}\left[\begin{array}{ccc}1&2&1\\0&4&0\\0&1&0\end{array}\right]\underrightarrow{w_2\leftrightarrow w_3}\]

    \[\left[\begin{array}{ccc}1&2&1\\0&1&0\\0&4&0\end{array}\right]\underrightarrow{w_3-4 w_2}\left[\begin{array}{ccc}1&2&1\\0&1&0\\0&0&0\end{array}\right]\]

mamy wiersz zerowy, czyli (1,2,1),(-2,0,-2),(1,3,1) nie jest niezależnym liniowo układem wektorów.

Opisywanie podprzestrzeni liniowch

Jak opisać konkretną podprzestrzeń liniową matematycznie? A no można zrobić to na kilka sposobów:

  1. podać wektory, które je rozpinają
  2. podać jej bazę
  3. podać jednorodny układ równań, który ją opisuje

To wszystko wymaga kilku słów wyjaśnienia oraz zrozumienia jak się pomiędzy tymi opisami poruszać. Do dzieła zatem.

Wektory, które rozpinają

Nie jest tak trudno zauważyć, że zbiór wszystkich kombinacji liniowych danych wektorów jest przestrzenią liniową. Sprawdźmy w przypadku trzech wektorów, niech \alpha,\beta\in\text{lin}(v_1,v_2,v_3), wtedy \alpha=av_1+bv_2+cv_3, \beta=dv_1+fv_2+gv_3, dla pewnych liczb a, b, c, d, f, g. Zatem (\alpha+\beta)= (a+d)v_1+(b+f)v_2+(c+g)v_3 oraz dla dowolnej liczby k, k\alpha=kav_1+kav_2+kav_3 także są kombinacjami liniowymi v_1, v_2, v_3, czyli należą do \text{lin}(v_1,v_2,v_3), a zatem mamy do czynienia z podprzestrzenią liniową.

A zatem \text{lin}((2,2,3),(1,1,1),(-1,-1,0)), czy \text{lin}((1,0),(0,1)) to przykłady przestrzeni liniowych – w tym wypadku zadanych przez podanie wektorów, które je rozpinają.

Baza

Bazą przestrzeni nazywamy taki układ wektorów, który po pierwsze rozpina przestrzeń a po drugie jest liniowo niezależny. Baza danej przestrzeni V nie jest nigdy jednoznacznie wyznaczona, np. bazą płaszczyzny jest układ (1,0),(0,1) (to tzw. baza standardowa), jak i np. (-1,0),(2,1), jak i wiele innych. W każdej bazie danej przestrzeni zobaczymy jednak tyle samo wektorów. Tę liczbę wektorów nazywamy wymiarem przestrzeni i oznaczamy \text{dim}V.

Oczywiście baza jest szczególnym przykładem układu wektorów, które rozpinają przestrzeń.

Każdy wektor w przestrzeni jest kombinacją liniową wektorów z bazy. Ale co więcej współczynniki w tej kombinacji są jednoznacznie wyznaczone i nazywają się współrzędnymi. Tak więc np. współrzędne wektora (1,1) w bazie (-1,0),(2,1), to 1,1, a wektora (0,-1) w tej bazie to -2,-1. Oczywiście współrzędne wektora w bazie obliczamy rozwiązując układ równań — ale robiliśmy to już w poprzednim temacie wyliczając współczynniki wektora jako kombinacji liniowej innych wektorów. Tym razem zawsze nasz układ będzie oznaczony.

Układ równań opisujący podprzestrzeń

Zauważcie, że jeśli mamy jednorodny układ równań (koniecznie jednorodny) i mamy dwa jego rozwiązania, to zarówno ich suma, jak i jedno z nich przemnożone przez liczbę są też rozwiązaniami tego układu. Sprawdźmy jaki jest tego mechanizm na przykładzie. (1,-1,0) oraz (0,2,2) są rozwiązaniami równania x+y-z=0. Bowiem 1+(-1)-0=0 oraz 0+2-2=0 a zatem również (1+0)+(-1+2)-(0+2)=(1+(-1)-0)+(0+2-2)=0 oraz 5\cdot 1+ 5\cdot(-1)-5\cdot 0= 5\cdot(1+(-1)-0)=0.

A zatem zbiór rozwiązań dowolnego jednorodnego układu równań liniowych jest przestrzenią liniową! Czyli sam jednorodny układ równań jest jednym ze sposobów opisania danej nam przestrzeni.

To teraz nauczmy się, jak z jednej formy opisu znajdować inne.

Znajdywanie bazy na podstawie układu wektorów, które rozpinają przestrzeń

Czyli chcemy mając dany układ wektorów znaleźć niezależny linową układ wektorów, który rozpina tę samą przestrzeń. Ostatnio wspominaliśmy o tym, że jak mamy macierz i jej wiersze, to dokonując operacji na wierszach nie zmieniamy zbioru kombinacji liniowych, które da się z tych wektorów utworzyć. Drugie spostrzeżenie, które nam jest potrzebne, to to, że niezerowe wiersze macierzy w postaci schodkowej zawsze stanowią układ wektorów niezależnych. Rzeczywiście, żeby z nich skombinować wektor zerowy, nie ma innej drogi jak pierwszy z nich pomnożyć przez 0. Ale w takim razie i drugi trzeba pomnożyć przez zero, żeby mieć 0 na drugim miejscu, itd. A zatem to co musimy zrobić, to wpisać dane wektory jako wiersze macierzy i sprowadzić ją do postaci schodkowej. Wtedy niezerowe wiersze tej macierzy są bazą danej nam przestrzeni.

Zróbmy to na przykładzie. Znajdźmy bazę przestrzeni \text{lin}((1,0,1,),(1,1,1),(-2,-3,-2)).

    \[\left[\begin{array}{ccc}1&0&1\\1&1&1\\-2&-3&-2\end{array}\right]\underrightarrow{w_2-w_1, w_3+2w_1}  \left[\begin{array}{ccc}1&0&1\\0&1&0\\0&-1&0\end{array}\right]\underrightarrow{w_3+w_2}  \left[\begin{array}{ccc}1&0&1\\0&1&0\\0&0&0\end{array}\right]\]

A zatem baza naszej przestrzeni to (na przykład) (1,0,1),(0,1,0), a jej wymiar wynosi 2.

Znajdowanie bazy na podstawie układu równań

Zaczynamy od znalezienia rozwiązania ogólnego w postaci parametrycznej. Np:

    \[\begin{cases}x-z+w-t=0\\x+y+w=0\end{cases}\]

    \[\left[\begin{array}{ccccc|c}1&0&-1&1&-1&0\\1&1&0&1&0&0\end{array}\right]\underrightarrow{w_2-w_1} \left[\begin{array}{ccccc|c}1&0&-1&1&-1&0\\0&1&1&0&1&0\end{array}\right]\]

a zatem rozwiązanie ogólne w postaci parametrycznej, to: (z-w+t,-z-t,z,w,t), czyli każdy wektor w badanej przestrzeni ma formę (z-w+t,-z-t,z,w,t), dla pewnych z,w,t. Ale zauważ, że (z-w+t,-z-t,z,w,t)=z(1,-1,1,0,0)+w(-1,0,0,1,0)+t(1,-1,0,0,1). Czyli każdy wektor w naszej przestrzeni jest kombinacją liniową wektorów (1,-1,1,0,0),(-1,0,0,1,0),(1,-1,0,0,1), czyli wektorów, które powstały z rozwiązania ogólnego podstawiając za parametry odpowiednio 1 za jeden z nich i 0 za resztę. Łatwo też zobaczyć, że te wektory są liniowo niezależne. Czyli (1,-1,1,0,0),(-1,0,0,1,0),(1,-1,0,0,1) to baza badanej przestrzeni i przestrzeń ta ma wymiar 3. Zauważ też, że 3=5-2, gdzie 5 to liczba niewiadomych, a 2 to liczba niezależnych liniowo równań.

Znajdywanie układu równań na podstawie wektorów, które rozpinają przestrzeń (lub bazy)

Załóżmy, że badamy przestrzeń \text{lin}((1,2,-1,0),(1,1,0,1),(0,1,-1,-1)). Czyli układ równań będzie miał 4 niewiadome. Załóżmy, że pojawi się w nim równanie ax+by+cz+dw=0. To równanie muszą spełniać te trzy wektory, czyli a+2b-c=0, a+b+d=0, b-c-d=0, co jest tak naprawdę układem równań, w których niewiadomymi są współczynniki w szukanym przez nas układzie równań. Układ równań na współczynniki układu równań — trochę trudne do ogarnięcia, ale jedźmy dalej — wygląda on tak:

    \[\begin{cases}a+2b-c=0\\ a+b+d=0\\ b-c-d=0\end{cases}\]

Rozwiązujemy go:

    \[\left[\begin{array}{cccc|c}1&2&-1&0&0\\1&1&0&1&0\\0&1&-1&-1&0\end{array}\right]\underrightarrow{w_2-w_1} \left[\begin{array}{cccc|c}1&2&-1&0&0\\0&-1&1&1&0\\0&1&-1&-1&0\end{array}\right]\underrightarrow{w_3+w_2}\]

    \[\left[\begin{array}{cccc|c}1&2&-1&0&0\\0&-1&1&1&0\\0&0&0&0&0\end{array}\right]\underrightarrow{w_2\cdot(-1)}\]

    \[\left[\begin{array}{cccc|c}1&2&-1&0&0\\0&1&-1&-1&0\\0&0&0&0&0\end{array}\right]\underrightarrow{w_1-2w_2} \left[\begin{array}{cccc|c}1&0&1&2&0\\0&1&-1&-1&0\\0&0&0&0&0\end{array}\right]\]

Czyli rozwiązanie ogólne mówiące o tym, jakie powinny być współczynniki w szukanym układzie równań, to (-c-2d,c+d,c,d). Zauważ, że zawsze mamy dużą swobodę w wypisaniu szukanego układu równań, bo wiele tych układów jest ze sobą równoważne. Tak naprawdę współczynniki, które mogą w nim wystąpić tworzą same przestrzeń liniową. Wypisujemy jej bazę z rozwiązania ogólnego, jak wcześniej: (-1,1,1,0),(-2,1,0,1). Jak weźmiemy te dwa wektory współczynników i wypiszemy równania, to z nich da się liniowo skombinować każde równanie, które jest spełnione przez wektory naszej badanej przestrzeni. To znaczy, że wystarczy wypisać równania ze współczynnikami wziętymi z wypisanej bazy:

    \[\begin{cases}-x+y+z=0\\-2x+y+w=0\end{cases}\]

I gotowe!

Mnożenie macierzy

Aby pomnożyć macierze, pierwsza z nich musi mieć tyle samo kolumn, co druga wierszy. Wynik będzie miał tyle wierszy, co pierwsza z macierzy i tyle kolumn co druga macierz. Mnożymy wiersze z pierwszej macierzy przez kolumny z drugiej, w takim sensie, że na miejscu w i-tym wierszu i j-tej kolumnie macierzy wynikowej będzie efekt mnożenia i-tego wiersza pierwszej macierzy przez j-tą kolumnę drugiej macierzy, gdzie przez iloczyn wiersza i kolumny rozumiemy iloczyny par kolejnych wartości dodane do siebie. Na przykład:

    \[\left[\begin{array}{ccc}2&3&1\\-1&2&3\\0&1&0\\1&0&-2\end{array}\right]\cdot\left[\begin{array}{cc}-1&4\\-5&2\\0&1\end{array}\right]=\]

    \[=\left[\begin{array}{cc}2\cdot(-1)+3\cdot(-5)+1\cdot 0&2\cdot 4+3\cdot 2+1\cdot 1\\ (-1)\cdot(-1)+2\cdot(-5)+3\cdot 0&(-1)\cdot 4+2\cdot 2+3\cdot 1\\ 0\cdot(-1)+1\cdot(-5)+0\cdot 0&0\cdot 4+1\cdot 2+0\cdot 1\\ 1\cdot(-1)+0\cdot(-5)+(-2)\cdot 0&1\cdot 4+0\cdot 2+(-2)\cdot 1\end{array}\right]=\]

    \[=\left[\begin{array}{cc}-17&13\\ -9&3\\ -5&2\\ -1&2\end{array}\right]\]

Mnożenie macierzy jest łączne, czyli dla macierzy A,B,C, A\cdot(B\cdot C)=(A\cdot B)\cdot C. Ale nie jest przemienne! Zauważ z resztą, że o ile macierze nie są kwadratowe, to nie da się ich pomnożyć odwrotnie. A nawet jak są kwadratowe, to może wyjść inny wynik.

Macierz odwrotna

Macierz odwrotna do macierzy kwadratowej A, to macierz B, taka że A\cdot B=I, gdzie I to macierz jednostkowa (tzn. z jedynkami na przekątnej i zerami poza przekątną). Macierz odwrotną oznaczamy A^{-1}. Ponieważ \det A\cdot B=\det A\cdot \det B oraz \det I=1, dostajemy, że \det A^{-1}=\frac{1}{\det A}. Stąd też wiemy, że macierz odwrotna może istnieć tylko gdy \det A\neq 0 i takie macierze nazywamy odwracalnymi.

Jak policzyć macierz odwrotną? Powiedzieliśmy ostatnio, że operacje na wierszach prowadzące do postaci schodkowej zredukowanej, to tak naprawdę przemnożenie macierzy przez jakąś macierz. Więc wyobraźmy sobie, że sprowadzamy do postaci schodkowej zredukowanej macierz złożoną z macierzy A oraz I obok siebie: [A|I]. Ponieważ A było macierzą kwadratową i \det A\neq 0, to otrzymamy po lewej stronie macierz jednostkową, czyli dostaniemy macierz [I|B]. Ale zauważmy, że jeśli C to macierz operacji na wierszach, które wykonaliśmy, to C\cdot [A|I]=[I|B]. A zatem C\cdot A=I oraz C\cdot I=B. Z pierwszego równania wynika, że C=A^{-1}. Z drugiego, że B=C=A^{-1}. A zatem po prawej stronie otrzymaliśmy macierz odwrotną do A.

Np. chcemy policzyć macierz odwrotną do macierzy:

    \[A=\left[\begin{array}{ccc}1&2&1\\2&5&2\\-1&-2&0\end{array}\right]\]

Do dzieła:

    \[\left[\begin{array}{ccc|ccc}1&2&1&1&0&0\\2&5&2&0&1&0\\-1&-2&0&0&0&1\end{array}\right]\overrightarrow{w_2-2w_1,w_3+w_1} \left[\begin{array}{ccc|ccc}1&2&1&1&0&0\\0&1&0&-2&1&0\\0&0&1&1&0&1\end{array}\right]\overrightarrow{w_1-w_3}\]

    \[\left[\begin{array}{ccc|ccc}1&2&0&0&0&-1\\0&1&0&-2&1&0\\0&0&1&1&0&1\end{array}\right]\overrightarrow{w_1-2w_2} \left[\begin{array}{ccc|ccc}1&0&0&4&-2&-1\\0&1&0&-2&1&0\\0&0&1&1&0&1\end{array}\right]\]

A zatem:

    \[A^{-1}=\left[\begin{array}{ccc}4&-2&-1\\-2&1&0\\1&0&1\end{array}\right]\]

Przekształcenia liniowe

Przekształcenie liniowe \phi to funkcja przyporządkowująca wektorom jednej przestrzeni liniowej V, wektory (być może innej) przestrzeni liniowej W (\phi\colon V\to W), spełniająca warunek liniowości, mianowicie: dla każdych wektorów v,v'\in V i liczb a,b mamy \phi(av+bv')=a\phi(v)+b\phi(v'). Przykładem przekształcenia liniowego \mathbb{R}^2\to\mathbb{R}^2 jest obrót wokół punktu (0,0) — wszystko jedno czy najpierw przemnożymy wektory i dodamy do siebie i obrócimy wynik, czy obrócimy wektory i przemnożymy i dodamy dopiero po obrocie.

Więc aby udowodnić, że dane przekształcenie jest przekształceniem liniowym, trzeba udowodnić, że spełnia warunek liniowości, np. \varphi\colon \mathbb{R}^2\to\mathbb{R} zadane wzorem \varphi(x,y)=-x+2y jest przekształceniem liniowym, bowiem jeśli (x,y),(x',y')\in\mathbb{R}^2 oraz a,b\in\mathbb{R}, to \varphi(a(x,y)+b(x',y'))=\varphi((ax+bx',ay+by'))=-ax-bx'+2ay+2by'=a(-x+2y)+b(-x'+2y')=a\varphi((x,y))+b\varphi((x',y')).

Tymczasem, aby udowodnić, że przekształcenie nie jest przekształceniem liniowym, wystarczy znaleźć zestaw wektorów i liczb stanowiących kontrprzykład na warunek liniowości. Na przykład \psi\colon \mathbb{R}\to\mathbb{R}^2 zadane wzorem \psi(x)=(2x+1,0) nie jest przekształceniem liniowym, bo \psi(1+1)=\psi(2)=(5,0)\neq (6,0)=(3,0)+(3,0)=\psi(1)+\psi(1).

Z reguły przekształcenia liniowe będziemy mieli zadane przy pomocy wzoru. Na przykład: \psi\colon\mathbb{R}^2\to\mathbb{R}^2, \psi((x,y))=(y,-x). Wtedy, żeby zobaczyć, co to przekształcenie robi np. z wektorem (1,2), podstawiamy go do wzoru: \psi((1,2))=(2,-1). Swoją drogą łatwo zobaczyć, że to przekształcenie to po prostu obrót wokół punktu (0,0) o 90 stopni zgodnie z ruchem wskazówek zegara. Mniej geometryczny przykład, niech \phi\colon\mathbb{R}^4\to\mathbb{R}^2, \phi((x,y,z,t))=(x+3y-t,3y-2z+t), a zatem \phi przekształca wektor (1,2,0,-1) na wektor (1+6-(-1),6-0+(-1))=(8,5).

Często zadajemy przekształcenia liniowe poprzez zadanie wzoru, ale oczywiście przekształcenie jest jednoznacznie zdeterminowane przez wartości, jakie przyjmuje na wektorach z danej bazy. Np. niech \varphi\colon\mathbb{R}^2\to\mathbb{R}^3 będzie zadane następująco \varphi((1,-1))=(1,2,1), \varphi((-1,0))=(-1,0,1) (wektory (1,-1), (-1,0) stanowią bazę płaszczyzny). Z takiej postaci można łatwo odzyskać wzór przekształcenia, znajdując najpierw współrzędne wektorów z bazy standardowej w tej bazie (układ równań, albo zgadywanie). W tym wypadku widać, że (1,0)=0\cdot(1,-1)-1(-1,0) (współrzędne: 0,-1) oraz (0,1)=-(1,-1)-(-1,0) (współrzędne: -1,-1). A zatem \varphi((x,y))=x\varphi((1,0))+y\varphi((0,1))=x(-\varphi((-1,0)))+y(-\varphi((1,-1))-\varphi((-1,0)))=x(-(-1,0,1))+y(-(1,2,1)-(-1,0,1))=x(1,0,-1)+y(0,-2,-2)=(x,-2y,-x-2y).

W powyższym przykładzie, możemy także wyliczyć \varphi((1,0)) oraz \varphi((0,1)) zapisując macierz skaładającą się z wektorów danej bazy po lewej stronie i wartości po prawej stronie. Każda operacja na wierszach nie zmienia zasady, że po lewej stronie jest wektor, a po prawej wartość dla niego, bo \varphi jest przekształceniem liniowym. Zatem po sprowadzeniu do postaci schodkowej zredukowanej po prawej stronie zobaczymy wartości \varphi((1,0)) oraz \varphi((0,1)).

    \[\left[\begin{array}{cc|ccc}1&-1&1&2&1\\-1&0&-1&0&1\end{array}\right]\underrightarrow{w_1\leftrightarrow w_2}\left[\begin{array}{cc|ccc}-1&0&-1&0&1\\1&-1&1&2&1\end{array}\right]\underrightarrow{w_2+w_1}\]

    \[\left[\begin{array}{cc|ccc}-1&0&-1&0&1\\0&-1&0&2&2\end{array}\right]\underrightarrow{w_1\cdot (-1),w_2\cdot (-1)}\left[\begin{array}{cc|ccc}1&0&1&0&-1\\0&1&0&-2&-2\end{array}\right],\]

więc jak poprzednio

    \[\varphi((x,y))=x\varphi((1,0))+y\varphi((0,1))=x(1,0,-1)+y(0,-2,-2)=(x,-2y,-x-2y).\]

Jeśli mamy dwa przekształcenia \varphi,\psi\colon V\to W oraz liczbę a, to ich suma \varphi+\psi jak i a\varphi są przekształceniami liniowymi V\to W. Oczywiście dodajemy i mnożymy po współrzędnych. Czyli np. jeśli \varphi((x,y))=(-x,-2y),\psi((x,y))=(0,2x), to (\varphi+\psi)((x,y))=(-x,2x-2y).

W związku z powyższym zbiór przekształceń liniowych pomiędzy ustalonymi przestrzeniami liniowymi V i W jest zatem przestrzenią liniową. Oznaczamy ją L(V,W).

Jądro i obraz przekształcenia

Jeśli \varphi\colon V\to W jest przekształceniem liniowym, to łatwo zauważyć, że zbiory

    \[\ker\varphi=\{v\in V\colon \varphi(v)=0\}\]

zwany jądrem \varphi oraz

    \[\text{im}\varphi=\{\varphi(v)\colon v\in V\}\]

zwany obrazem \varphi są podprzestrzeniami liniowymi odpowiednio V i W. Wymiar obrazu \varphi jest zwany rzędem \varphi i oznaczany r(\varphi). Zawuażmy, że jeśli v_1,\ldots, v_n rozpina V, to \varphi(v_1),\ldots,\varphi(v_n) rozpina \text{im}\varphi. Co więcej, jeśli V=\ker\varphi\oplus U, oraz v_1,\ldots, v_n jest bazą U, to \varphi(v_1),\ldots,\varphi(v_n) jest bazą \text{im}\varphi. Wobec tego

    \[\dim V=\dim\ker\varphi+\dim\text{im}\varphi.\]

Macierz przekształcenia liniowego

Macierze teraz posłużą nam do ważnego celu — bo okazuje się, że mnożenie przez macierzy przez wektor to to samo co przekształcenie tego wektora przez przekształcenie liniowe. Spójrzmy:

    \[\left[\begin{array}{ccc}1&0&-1\\2&3&-1\end{array}\right]\cdot \left[\begin{array}{c}x\\y\\z\end{array}\right]=\left[\begin{array}{c}x-z\\2x+3y-z\end{array}\right]\]

odpowiada dokładnie przekształceniu \phi((x,y,z))=(x-z,2x+3y-z).

Mówiąc precyzyjnie, mając dane przekształcenie \varphi\colon V\to W oraz bazę \mathcal{A} przestrzeni V i bazę \mathcal{B} przestrzeni W, macierzą przekształcenia \varphi w bazach \mathcal{A} i \mathcal{B} będziemy nazywali macierz M(\varphi)_{\mathcal{A}}^{\mathcal{B}}, która przemnożona od prawej strony przez (pionowy) wektor zawierający współrzędne pewnego wektora v w bazie \mathcal{A} da w wyniku współrzędne wektora \varphi(v) w bazie \mathcal{B}.

W szczególności w powyższym przykładzie:

    \[M(\phi)_{st}^{st}=\left[\begin{array}{ccc}1&0&-1\\2&3&-1\end{array}\right]\]

to macierz przekształcenia \phi w bazach standardowych — można ją bardzo prosto wypisać ze wzoru podając wierszami kolejne jego współczynniki.

Zmiana bazy macierzy — metoda pierwsza: liczymy współrzędne

No dobrze, załóżmy zatem, że mamy wzór przekształcenia \phi, jak wyżej (lub jego macierz w bazach standardowych) oraz bazy \mathcal{A} i \mathcal{B}. Niech na przykład: \mathcal{A}=((1,1,1),(1,0,-1),(1,0,0)) oraz \mathcal{B}=((2,3),(-1,-1)). Chcielibyśmy wyliczyć macierz M(\phi)_{\mathcal{A}}^{\mathcal{B}}.

W tym celu zauważ, że jeśli wezmę wektor (1,0,0) i przemnożę go z prawej strony (pionowo) przez macierz M(\phi)_{\mathcal{A}}^{\mathcal{B}}, to z jednej strony otrzymam po prostu pierwszą kolumnę tej macierzy. Z drugiej strony to właśnie pierwszy wektor z bazy \mathcal{A}, czyli wektor (1,1,1) ma w tej bazie współrzędne 1,0,0. A zatem wynik mnożenia to współrzędne wektora \phi((1,1,1)) w bazie \mathcal{B} i jest to pierwsza kolumna szukanej macierzy.

Zatem do dzieła: \phi((1,1,1))=(1-1, 2+3-1)=(0,4) i szukamy współrzędnych tego wektora w bazie \mathcal{B}: (0,4)=4(2,3)+8(-1,-1), a zatem szukane współrzędne to 4,8 i jest to pierwsza kolumna szukanej macierzy.

Znajdźmy drugą kolumnę — to samo tylko z drugim wektorem z bazy \mathcal{A}. \phi((1,0,-1))=(1-(-1),2-(-1))=(2,3) i jego współrzędne w bazie \mathcal{B} to oczywiście 1,0.

I trzecia kolumna: \phi((1,0,0))=(1,2) ma współrzędne w bazie \mathcal{B}: (1,2)=(2,3)+(-1,-1), czyli 1,1

A zatem:

    \[M(\phi)_{\mathcal{A}}^{\mathcal{B}}=\left[\begin{array}{ccc}4&1&1\\8&0&1\end{array}\right]\]

Złożenie przekształceń

Jeśli mamy dwa przekształcenia liniowe \phi\colon V\to W oraz \psi\colon W\to U to możemy je złożyć, czyli pomyśleć o przekształceniu, które mając wektor z V najpierw stosuje przekształcenie \phi a do wyniku stosuje przekształcenie \psi dostając wektor z przestrzeni U.

Takie przekształcenie oznaczamy \psi\circ \phi. Mając wzory \phi i \psi bardzo łatwo wypisać wzór na \psi\circ \phi. Na przykład weźmy \phi takie jak wyżej oraz \psi\colon\mathbb{R}^2\to\mathbb{R}^4 zadane wzorem \psi((a,b))=(-b,a+b,-2a-b,3a). A zatem (\psi\circ\phi)((x,y,z))=\psi(\phi((x,y,z))=\psi(((x-z,2x+3y-z))=(-2x-3y+z,3x+3y-2z,-4x-3y+3z,3x-3z).

A co się dzieje z macierzami tych przekształceń? Jeśli \mathcal{A} jest bazą V, \mathcal{B} bazą W i \mathcal{C} bazą U, to mając współrzędne wektora v w bazie \mathcal{A}, aby otrzymać współrzędne wektora \psi\circ\phi(v)=\psi(\phi(v)) w bazie \mathcal{C} musimy najpierw przemnożyć go z prawej (pionowo) przez macierz M(\phi)_{\mathcal{A}}^{\mathcal{B}} (i otrzymamy współrzędne \phi(v) w bazie \mathcal{B}) i wynik przemnożyć pionowo (z prawej) przez M(\psi)_{\mathcal{B}}^{\mathcal{C}}. Zatem w sumie pomnożyliśmy początkowe współrzędne z prawej przez macierz M(\psi)_{\mathcal{B}}^{\mathcal{C}} \cdot M(\phi)_{\mathcal{A}}^{\mathcal{B}}, co oznacza, że:

    \[M(\psi\circ\phi)_{\mathcal{A}}^{\mathcal{C}} =M(\psi)_{\mathcal{B}}^{\mathcal{C}} \cdot M(\phi)_{\mathcal{A}}^{\mathcal{B}}.\]

Zwróć szczególną uwagę na to jakie bazy w tym równaniu się zgadzają!

W szczególności, w naszym przykładzie:

    \[M(\psi\circ\phi)_{st}^{st} =M(\psi)_{st}^{st} \cdot M(\phi)_{st}^{st}=\left[\begin{array}{cc}0&-1\\1&1\\-2&-1\\3&0\end{array}\right]\cdot \left[\begin{array}{ccc}1&0&-1\\2&3&-1\end{array}\right] =\left[\begin{array}{ccc}-2&-3&1\\3&3&-2\\-4&-3&3\\3&0&-3\end{array}\right] \]

co z resztą zgadza się z wyliczonym przez nas wzorem.

Macierz zmiany bazy

Jest pewna specjalne przekształcenie liniowe, które nazywamy identycznością, które nic nie robi. Na przykład w przestrzeni \mathbb{R}^3 to id((x,y,z))=(x,y,z). A zatem, jeśli mamy dwie bazy \mathcal{A} oraz \mathcal{B}, oraz macierz M(id)_{\mathcal{A}}^{\mathcal{B}} i przemnożymy z prawej przez tę macierz współrzędne wektora v w bazie \mathcal{A} to w wyniku otrzymamy współrzędne nadal wektora v (bo id(v)=v), ale w bazie \mathcal{B}. Czyli macierz M(id)_{\mathcal{A}}^{\mathcal{B}} to macierz zmiany bazy z \mathcal{A} na \mathcal{B}.

Szczególnie będą nam się przydawać macierze zmiany bazy z bazy standardowej na daną bazę i z danej bazy na bazę standardową. Obczajmy więc, jak je policzyć.

Najprościej macierz z danej bazy na bazę standardową. Znajdźmy M(id)_{\mathcal{A}}^{st} (baza z przykładu powyżej). Po przemnożeniu z prawej strony przez wektor 1,0,0 dostaniemy po prostu pierwszą kolumnę tej macierzy. Z drugiej strony to pierwszy wektor z bazy \mathcal{A} ma w niej współrzędne 1,0,0, czyli to co dostaniemy jest po prostu współrzędnymi tego wektora w bazie standardowej, czyli tym wektorem. A zatem po prostu w i-tej kolumnie tej macierzy jest i-ty wektor z naszej bazy. A zatem po prostu:

    \[M(id)_{\mathcal{A}}^{st}=\left[\begin{array}{ccc}1&1&1\\1&0&0\\1&-1&0\end{array}\right]\]

Teraz w drugą stronę — z bazy standardowej na daną bazę. Policzmy M(id)_{st}^{\mathcal{B}}. Oczywiście tym razem, łatwo zobaczyć, że w kolumnach mają znaleźć się współrzędne wektorów z bazy standardowej w danej bazie. Trzeba je policzyć (1,0)=-(2,3)-3(-1,-1) oraz (0,1)=(2,3)+2(-1,-1). A zatem:

    \[M(id)_{st}^{\mathcal{B}}=\left[\begin{array}{cc}-1&1\\-3&2\end{array}\right].\]

Zmiana bazy macierzy — metoda druga: mnożymy przez macierz zmiany bazy

Dostaliśmy do ręki nowe narzędzie do zmieniania baz w macierzy przekształcenia. Ponieważ id\circ \phi\circ id =\phi, mamy że:

    \[M(\phi)_{\mathcal{A}}^{\mathcal{D}}=M(id\circ\phi\circ id)_{\mathcal{A}}^{\mathcal{D}}=M(id)_{\mathcal C}^{\mathcal{D}}\cdot M(\phi)_{\mathcal{B}}^{\mathcal{C}}\cdot M(id)_{\mathcal{A}}^{\mathcal{B}}.\]

A zatem w szczególności:

    \[M(\phi)_{\mathcal{A}}^{\mathcal{B}}=M(id)_{st}^{\mathcal{B}}\cdot M(\phi)_{st}^{st}\cdot M(id)_{\mathcal{A}}^{st}\]

i w ten sposób mając macierz przekształcenia w bazach standardowych możemy wyliczyć jego macierz w bazach od \mathcal{A} do \mathcal{B}. W naszym przykładzie:

    \[M(\phi)_{\mathcal{A}}^{\mathcal{B}}=\left[\begin{array}{cc}-1&1\\-3&2\end{array}\right]\cdot\left[\begin{array}{ccc}1&0&-1\\2&3&-1\end{array}\right]\cdot\left[\begin{array}{ccc}1&1&1\\1&0&0\\1&-1&0\end{array}\right]=\]

    \[=\left[\begin{array}{ccc}1&3&0\\1&6&1\end{array}\right] \cdot\left[\begin{array}{ccc}1&1&1\\1&0&0\\1&-1&0\end{array}\right]=\left[\begin{array}{ccc}4&1&1\\8&0&1\end{array}\right].\]

Co się oczywiście zgadza z tym, co policzyliśmy wcześniej inną metodą.

10. Przekształcenia afiniczne

Przekształcenia afiniczne

Funkcję f\colon H\to M, gdzie M i H to przestrzenia afiniczne, nazywamy przekształceniem afinicznym, jeśli dla każdych p_0,\ldots, p_n\in H oraz a_0,\ldots, a_n\in K, takich że a_0+\ldots +a_n=1,

    \[f(a_0p_0+\ldots +a_np_n)=a_0f(p_0)+\ldots + a_nf(p_n).\]

Równoważnie, f jest przekształceniem afinicznym, gdy dla pewnego punktu p_0 oraz przekształcenia liniowego \varphi mamy

    \[f(p)=f(p_0)+\varphi(\overrightarrow{p_0p}).\]

Przekształcenie \varphi nie zależy od wyboru punktu p_0 i nazywa się pochodną f i oznacza f'.

Warto zauważyć, że

  • dla każdego punktu p\in H oraz v\in T(H), f(p+v)=f(p)+f'(v),
  • dla p,p'\in H, f'(p-p')=f(p)-f(p'),
  • jeśli p_0,\ldots,p_n jest bazą punktową H oraz q_0,\ldots, q_n jest układem punktów w M, to istnieje dokładnie jedno przekształcenie afiniczne f, że f(p_i)=q_i, dla każdego 0\leq i\leq n,
  • jeśli p_0;v_1\ldots,v_n jest układem bazowym H oraz q_0\in M oraz w_1,\ldots, w_n\in T(M), to istnieje dokładnie jedno przekształcenie afiniczne f, że f(p_0)=q_0 oraz f'(v_i)=w_i, dla 1\leq i\leq n.

Standardowe przykłady przekształceń afinicznych H\to H

Przekształcenie f(p)=p+v, dla pewnego v\in T(H) nazywamy przesunięciem o wektor v.

Przekształcenie takie, że f(p_0)=p_0 dla pewnego p_0\in H oraz f'(v)=kv dla k\in K nazywamy jednokładnością o środku w p_0 i skali k.

Jeśli T(H)=V\oplus W, to przekształcenie f nazywamy rzutem na p+V wzdłuż q+W, jeśli f(p)=p oraz f'(v)=v dla v\in V i f'(w)=0 dla w\in W.

Jeśli T(H)=V\oplus W, to przekształcenie f nazywamy symetrią względem p+V wzdłuż q+W, jeśli f(p)=p oraz f'(v)=v dla v\in V i f'(w)=-w dla w\in W.

2. Liczby zespolone

Część 1.: Zadania, rozwiązania.
Część 2.: Zadania, rozwiązania.
Część 3.: Zadania, rozwiązania,
Część 4.: Zadania, rozwiązania.

Liczby zespolone

Aby w pełni móc uprawiać algebrę, potrzebujemy umieć pierwiastkować liczby ujemne. W tym celu musimy wprowadzić nową liczbę i, o takiej własności, że i^2=-1.

Liczby zespolone \mathbb{C} to liczby postaci z=a+bi, gdzie a,b\in\mathbb{R}. Liczby a i b nazywamy odpowiednio częścią rzeczywistą i urojoną liczby z i oznaczamy \text{Re} z i \text{Im} z.

A zatem każdą liczbę zespoloną a+bi możemy przedstawić (i będziemy to często robić) na płaszczyźnie jako punkt o współrzędnych (a,b). Będziemy tą płaszczyznę nazywać płaszczyzną zespoloną.

Dodawanie i mnożenie

Dodajemy i mnożymy liczby zespolone ,,po prostu”, pamiętając jedynie, że i^2=-1, a zatem: (a+bi)+(c+di)=(a+c)+i(b+d) oraz (a+bi)(c+di)=(ac-bd)+i(bc+ad).

Np.: (1+i)(-2-3i)+(-1+2i)=(1-5i)+(-1+2i)=-3i.

Dzielenie

Nietrudno również podzielić dwie liczby zespolone przez siebie — wystarczy ,,wyciągnąć urojoność z mianownika” (podobnie czasem się postępuje przy dzieleniu przez liczbę niewymierną z pierwiastkiem). Czyli:

    \[\frac{a+bi}{c+di}=\frac{(a+bi)(c-di)}{(c+di)(c-di)}=\frac{(ac+bd)+i(bc-ad)}{c^2+d^2}.\]

Postać biegunowa

Każdą liczbę zespoloną z=a+ib, różną od 0, możemy zapisać jeszcze na jeden sposób — mianowicie definiuje ją jej odległość od zera, zwana modułem, |z|=\sqrt{a^2+b^2} oraz kąt pomiędzy tą liczbą a osią rzeczywistą, zwany argumentem \text{Arg} z (\sin \text{Arg} z=\frac{b}{|z|}, \cos \text{Arg} z=\frac{a}{|z|}). A zatem z=|z|\left(\cos \text{Arg} z+i\sin \text{Arg} x\right).

Np.: niech z=1-i, wtedy |z|=\sqrt{2} oraz \text{Arg}{z}=\frac{-\pi}{4}. W drugą stronę, jeśli \text{Arg} x=\frac{-\pi}{6}, |x|=2, to x=2\left(\frac{\sqrt{3}}{2}-\frac{i}{2}\right)=\sqrt{3}-i.

Dodawanie i mnożenie geometrycznie

Widać od razu, że dodawania liczb zespolonych od strony geometrycznej, to po prostu dodawanie wektorów na płaszczyźnie zespolonej.

Ale dużo bardziej ciekawe jest mnożenie i z pomocą przychodzi tu postać biegunowa. Mianowicie okazuje się, że mnożenie dwóch liczb zespolonych przez siebie powoduje przemnożenie ich modułów i dodanie ich argumentów. Ten fakt jest wyjątkowo przydatny przy liczeniu potęg licz zespolonych — i stąd bierze się tzw. wzór de Moivre’a:

    \[z^n=|z|^n\left(\cos n\text{Arg} z+i\sin n\text{Arg} z\right).\]

Zastosujmy tę wiedzę do jakiegoś przykładu, np. policzmy (1+i)^6(\sqrt{3}-i). Mamy:

  • 1+i ma moduł \sqrt{2} i argument \frac{\pi}{4}, a zatem (1+i)^6 ma moduł 8 i argument \frac{6\pi}{4}, czyli inaczej \frac{-\pi}{2}.
  • \sqrt{3}-i ma moduł 2 i argument \frac{-\pi}{6}, a zatem (1+i)^6(\sqrt{3}-i) ma moduł 16 i argument -\frac{2\pi}{3}.

A zatem (1+i)^6(\sqrt{3}-i)=16\left(\cos \frac{-2\pi}{3}+i\sin \frac{-2\pi}{3}\right)=-8-8i\sqrt{3}.

Przy okazji ze wzoru de Moivre’a wynikają od razu różne tożsamości trygonometryczne, np. ponieważ

    \[(\cos \alpha+i\sin\alpha)^2= \cos 2\alpha +i\sin 2\alpha,\]

a z drugiej strony:

    \[(\cos \alpha+i\sin\alpha)^2= \cos^2\alpha-\sin^2\alpha+2i\sin\alpha\cos\alpha,\]

to mamy że:

    \[\cos 2\alpha =\cos^2\alpha - \sin^2\alpha\]

oraz

    \[\sin 2\alpha = 2\sin\alpha\cos\alpha.\]

Pierwiastkowanie

Zauważ, że dla każdej liczby z\neq 0 mamy zawsze n liczb x takich, że x^n=z. Rzeczywiście pierwsza z nich powstaje poprzez policzenie pierwiastka z modułu \sqrt[n]{|z|} oraz podzielenia argumentu przez n. Ale jeśli do takiego argumentu dorzucę jeszcze dowolną wielokrotność liczby \frac{2\pi}{n}, to po podniesieniu do potęgi n dostanę to samo, bo dodatkowy kąt zsumuje się do wielokrotności 2\pi. Wszystkie te liczby będziemy nazywać pierwiastkami.

Np. \sqrt[4]{-16} to 4 liczby. Ponieważ |-16|=16, to każdy z tych pierwiastków będzie miał moduł 2. Argument 16i to \pi, więc pierwszy z pierwiastków ma argument \frac{\pi}{4} i do tego argumentu możemy dodawać \frac{2\pi}{4}=\frac{\pi}{2}, czyli mamy pierwiastki:

  • o argumencie \frac{\pi}{4}, czyli \sqrt{2}+i\sqrt{2}
  • o argumencie \frac{3\pi}{4}, czyli -\sqrt{2}+i\sqrt{2},
  • o argumencie \frac{-3\pi}{4}, czyli -\sqrt{2}-i\sqrt{2},
  • o argumencie \frac{-\pi}{4}, czyli \sqrt{2}-i\sqrt{2}.

Ten z pierwiastków liczby z, który ma argument z przedziału [0,\frac{2\pi}{n}), nazywamy pierwiastkiem głównym i oznaczamy \sqrt[n]{_+ z}. Czyli \sqrt[4]{_+ -16}=\sqrt{2}+i\sqrt{2}.

Tym razem umiejąc pierwiastkować wszystkie liczby, możemy liczyć rozwiązania równań kwadratowych nie przejmując się znakiem \Delta, a nawet tym, czy jest rzeczywista. Np. x^2+2x+(1-i), \Delta=4i, \sqrt{\Delta} ma moduł 2 oraz argument \frac{\pi}{4}, czyli to \sqrt{2}+i\sqrt{2}. Oraz -\sqrt{2}-i\sqrt{2}. A zatem x_1=-1+\frac{\sqrt{2}}{2}+i\frac{\sqrt{2}}{2} oraz x_2=-1-\frac{\sqrt{2}}{2}-i\frac{\sqrt{2}}{2}.

Postać wykładnicza i potęgowanie

Można dojść do wniosku, że dla x\in\mathbb{R}, mamy: e^x=\sum_{i=0}^\infty \frac{x^n}{n!}. To daje nam całkiem niezłą wskazówkę, co to powinno znaczyć podnoszenie liczby do zespolonej potęgi. Jeśli e^{i}=\sum_{n=0}^{\infty}\frac{(-1)^nx^{2n}}{(2n)!}+i\sum_{n=0}^{\infty}\frac{(-1)^n x^{2n+1}}{(2n+1)!}, a tak się składa, że \sin x= \sum_{n=0}^{\infty}\frac{(-1)^n x^{2n+1}}{(2n+1)!} oraz \cos x= \sum_{n=0}^{\infty}\frac{(-1)^nx^{2n}}{(2n)!}. A zatem możemy zdefiniować potęgowanie do liczby zespolonej następująco:

    \[e^{a+bi}=e^a(\cos b+i\sin b),\]

Co łatwo daje słynne równanie wiążące 5 stałych matematyki e^{i\pi}+1=0. 🙂

No i pozwala każdą liczbę zespoloną zapisać w postaci wykładniczej, co jest bardzo podobne do postaci biegunowej. Mianowicie z=e^{\ln|z|+i\text{Arg} z}.