Macierz – Wikipedia, wolna encyklopedia
W matematyce macierz to układ liczb, symboli lub wyrażeń zapisanych w postaci prostokątnej tablicy[1].
W algebrze liniowej macierze wprowadza się często jako sposób skondensowanego zapisu układów równań liniowych, co ma na celu wyeliminowanie powtarzających się elementów standardowej notacji układów równań tego rodzaju z wieloma niewiadomymi[a]. Macierze pozwalają również na reprezentowanie przekształceń liniowych, czy form dwuliniowych w sposób umożliwiający przeprowadzanie obliczeń. Ponieważ wiele przekształceń geometrycznych (jak na przykład obroty przestrzeni wokół początku układu współrzędnych) są przekształceniami liniowymi, macierze znajdują zastosowanie w geometrii analitycznej i grafice komputerowej[b].
Przykładami macierzy reprezentujących przekształcenia liniowe są pojawiające się w analizie wielowymiarowej macierze Jacobiego. Przykładami macierzy reprezentujących formy dwuliniowe są macierze Hessego w analizie wielowymiarowej oraz macierze kowariancji w rachunku prawdopodobieństwa i statystyce. Przykładem macierzy której wprowadzenie nie jest motywowane reprezentowaniem żadnego naturalnego przekształcenia liniowego, czy formy kwadratowej jest macierz incydencji w teorii grafów[c].
Oprócz wymienionych powyżej dziedzin macierze są wykorzystywane także w teorii reprezentacji, kryptografii, czy elektronice – część z tych użyć omówiono w Zastosowaniach. Macierze bada się również niezależnie od jakichkolwiek zastosowań w ramach algebry liniowej i teorii macierzy.
Elementy z których złożona jest macierz nazywamy współczynnikami macierzy. Aby zdefiniować operacje na macierzach takie jak suma dwóch macierzy lub iloczyn dwóch macierzy należy założyć, że współczynniki rozważanych macierzy należą do pewnego pierścienia. Popularnym mocniejszym założeniem jest wymaganie, by współczynniki macierzy należały do pewnego ciała. Jeszcze mocniejszym założeniem (niewymagającym znajomości abstrakcyjnego pojęcia ciała) jest przyjęcie, że zbiór dozwolonych współczynników jest (w zależności od potrzeb):
- liczbami wymiernymi
- liczbami rzeczywistymi lub
- liczbami zespolonymi
- W artykule zakłada się, że wszystkie macierze mają współczynniki z ustalonego ciała o ile nie zaznaczono inaczej.
Wprowadzenie i oznaczenia
[edytuj | edytuj kod]Poziomy układ elementów znajdujących się w jednej linii nazywa się wierszem, a pionowy – kolumną macierzy. Dane wpisane w macierz nazywa się jej elementami, współczynnikami lub wyrazami; każdy element można jednoznacznie zidentyfikować, podając jego wskaźniki lub indeksy – zwykle w tej kolejności: numer wiersza i kolumny macierzy, w której stoi. Para złożona z liczby wierszy i kolumn nazywana jest typem macierzy – często liczby te oddziela się znakiem Wyrazy macierzy otacza się przeważnie nawiasami okrągłymi[2] lub kwadratowymi (w starszych pozycjach można znaleźć podwójne kreski[3], co dziś może być źródłem pomyłek, np. z wartością bezwzględną wyznacznika bądź normą macierzy; zob. Ujęcie algebraiczne i uogólnienia); stąd napisy
oznaczają te same macierze – w dalszej części artykułu stosowane będą nawiasy kwadratowe. W ten sposób powyższa macierz złożona jest z 4 wierszy i 3 kolumn, tzn. jest typu Liczba występuje w tej macierzy dwukrotnie: na przecięciu pierwszego wiersza i pierwszej kolumny oraz na przecięciu trzeciego wiersza i drugiej kolumny – innymi słowy element macierzy o wskaźnikach lub to Ostatnia (trzecia) kolumna składa się z elementów w tej właśnie kolejności.
Nie ma ogólnie przyjętej metody oznaczania macierzy, przy czym trendy podlegały zmianom w czasie. Sposób oznaczania typu nie jest ustalony – zwykle bywa zapisywany oddzielnie (jak w tym artykule). W artykule przyjęto konwencję stosowania tych samych liter alfabetu łacińskiego na oznaczenie macierzy i jej elementów – dużych (pogrubionych, prostych) do oznaczenia macierzy i małych (pochylonych), o ile są skalarami, ze wskaźnikami w indeksie dolnym (zwykle, choć spotyka się oznaczenia ze wskaźnikami w indeksie górnym albo po jednym w każdym z indeksów; wśród innych sposobów zapisu można wymienić również notację funkcyjną, zob. Definicja) na oznaczenie jej elementów. Tak więc elementy macierzy oznaczonej literą będą zapisywane symbolicznie jako gdzie jest wskaźnikiem elementu leżącego na przecięciu -tego wiersza i -tej kolumny, lub jeśli nie wprowadza to niejasności, lub po prostu – taki element (współczynnik, wyraz) nazywa ogólnym. Macierz złożoną z elementów oznacza się, otaczając wyraz ogólny nawiasami okrągłymi, lub (jak w tym artykule) kwadratowymi, W ten sposób macierz będzie oznaczana tzn.
Macierz o liczbie kolumn równej liczbie wierszy nazywa się kwadratową – wspomnianą wspólną liczbę kolumn i wierszy nazywa się wtedy stopniem tej macierzy; macierze niebędące kwadratowymi nazywa się dla wyróżnienia prostokątnymi. Jeśli macierz jest kwadratowa, to:
- ciąg elementów o równych wskaźnikach wiersza i kolumny począwszy od jeden do jej stopnia nazywa się główną przekątną (główną diagonalą lub często po prostu przekątną bądź diagonalą) macierzy kwadratowej;
- przekątne leżące nad lub pod główną przekątną nazywa się odpowiednio nadprzekątną lub podprzekątną macierzy;
- przekątną, której wiersz rośnie od pierwszego do ostatniego, a kolumna maleje od ostatniej do pierwszej nazywa czasem przeciwprzekątną lub antyprzekątną.
Pojęcia te uogólnia się niekiedy na dowolne macierze prostokątne.
Dla macierzy
stopnia jej główną przekątną jest ciąg elementów równych odpowiednio a antyprzekątną – ciąg złożony z elementów równych kolejno Jej nadprzekątną i podprzekątną tworzą odpowiednio pary elementów i równych kolejno oraz
Podmacierz danej macierzy to dowolny układ jej elementów powstały przez „skreślenie” pewnej liczby wierszy i kolumn sam tworzący macierz; w szczególności podmacierze (kwadratowe) zawierające kolejne wiersze i kolumny o tych samych wskaźnikach, poczynając od pierwszego, nazywa się podmacierzami głównymi; innymi słowy są to podmacierze kwadratowe zawierające pewną liczbę początkowych wyrazów głównej przekątnej. Macierz klatkowa to macierz, w której wprowadzono podział elementów na grupy kolejnych wierszy i kolumn – obrazowo czyni się to, prowadząc poziome i pionowe linie między wierszami i kolumnami macierzy, dzieląc ją na podmacierze nazywane klatkami. Podział ten umożliwia traktowanie macierzy klatkowej jako macierzy, której elementami są inne macierze (klatki); podobnie macierze klatkowe można zestawiać z „pasujących” macierzy.
Jeżeli dane są macierze: odpowiednio typów to można z nich zestawić macierz klatkową
Podstawowe działania
[edytuj | edytuj kod]Macierze i uważa się za równe, jeśli mają ten sam typ i równe odpowiadające sobie elementy, tzn. dla każdej możliwej pary zachodzi
Sumę macierzy i definiuje się „po współczynnikach”, tzn. za pomocą wzoru
- dla wszystkich
Mnożenie przez skalar macierzy oraz liczby również definiuje się „po współczynnikach”, czyli
- dla dowolnych
Działanie mnożenia macierzy można określić na wiele sposobów[d], najczęściej jednak „mnożenie macierzy” oznacza tzw. iloczyn Cauchy’ego macierzy (zob. przekształcenia liniowe): dla macierzy typu oraz typu dany jest on jako taka macierz typu oznaczana dla której
- dla dowolnych
Mnożenie to jest łączne, ale nie jest przemienne; ponadto jest ono obustronnie rozdzielne względem dodawania, a do tego zgodne z mnożeniem przez skalar.
Przestawienie bądź transpozycja danej macierzy tzn. zamiana jej kolumn i wierszy miejscami (z zachowaniem kolejności) pozwala na zwięzłe przedstawienie wielu jej własności; macierz transponowaną lub przestawioną względem macierzy definiuje się jako macierz
- dla wszystkich
przy czym oraz
Operacjami elementarnymi na macierzy nazywa się operacje: zamiany miejscami dwóch wierszy macierzy, pomnożenia jednego z wierszy przez liczbę różną od zera oraz dodania wiersza macierzy do innego jej wiersza. Macierz elementarna to macierz powstała z macierzy jednostkowej w wyniku jednej operacji elementarnej na jej wierszach[e]. Podobnie definiuje się operacje elementarne na kolumnach danej macierzy.
Macierze prostokątne
[edytuj | edytuj kod]Układy równań liniowych
[edytuj | edytuj kod]Układ równań liniowych o zmiennych postaci
można zapisać w postaci równania macierzowego
dla danych macierzy nazywanej macierzą główną układu, oraz Macierz klatkową postaci nazywa się macierzą uzupełnioną lub rozszerzoną układu.
W celu uzyskania rozwiązania układy równań liniowych przekształca się za pomocą operacji elementarnych, które zachowują zbiór rozwiązań układu; odpowiadają im operacje elementarne na wierszach macierzy, których przykładanie można postrzegać jako mnożenie lewostronne macierzy uzupełnionych układu przez macierze elementarne (mnożenie prawostronne odpowiada operacjom elementarnym na kolumnach macierzy).
Przekształcenia liniowe
[edytuj | edytuj kod]Każda macierz typu opisuje przekształcenie liniowe przestrzeni współrzędnych w odwzorowujące wektor w wektor Przekształceniu temu odpowiada mnożenie macierzy typu przez macierz typu o tych samych współczynnikach, co wektor dając w wyniku macierz typu o współczynnikach identycznych z tymi w wektorze Odwrotnie: każde przekształcenie liniowe zadaje macierz typu przy czym to -ta współrzędna wektora gdzie jest wektorem o współrzędnych równych zeru poza -tą współrzędną równą jedynce. Przekształcenie jest więc reprezentowane przez macierz zaś jest macierzą przekształcenia liniowego
W ten sposób układ równań liniowych można traktować jako problem opisu przekształcenia liniowego gdzie
- istnienie rozwiązań jest tożsame z istnieniem wektora spełniającego (czyli należeniem do obrazu ),
- jednoznaczność rozwiązań jest równoważna różnowartościowości przekształcenia (czyli trywialności jego jądra).
Podejście to tłumaczy często stosowane nazwy wektor zmiennych i wektor wyrazów wolnych odpowiednio macierzy i macierzy którym odpowiadają wektory oraz W ogólności macierze odpowiednio typu oraz (jednokolumnowe i jednowierszowe) nazywa się zwykle wektorami kolumnowymi i wektorami wierszowymi.
Przykładowo macierz rzeczywistą można postrzegać jako przekształcenie kwadratu jednostkowego w równoległobok o wierzchołkach Równoległobok na ilustracji obok otrzymano poprzez przemnożenie macierzy kolejno przez macierze co odpowiada przykładaniu przekształcenia do wektorów wskazujących wierzchołki kwadratu jednostkowego.
Powinowactwo względem osi poziomej o | Symetria względem osi pionowej | Przekształcenie ekwiafiniczne o | Jednokładność o skali | Obrót o kąt miary |
Tabela przedstawia macierze stopnia 2 z odpowiadającymi im przekształceniami płaszczyzny: niebieska kratka zawierająca pewien kształt jest przekształcana na zieloną; czarny punkt oznacza początek przestrzeni. |
Definicja standardowego mnożenia macierzy jest dobrana tak, by we wzajemnie jednoznacznej odpowiedniości przekształceń liniowych i macierzy składaniu pierwszych odpowiadało mnożenie drugich: jeśli przekształceniu odpowiada macierz typu to złożeniu odpowiada wtedy macierz typu gdyż działaniu odpowiada mnożenie macierzy
Z tego powodu macierz traktuje się zwykle jak odpowiadające mu przekształcenie liniowe a wektory utożsamia się z ich macierzami w związku z tym spotyka się często zapis oznaczający działanie przekształcenia liniowego na wektorze zapis jest nieco bardziej formalny zważywszy na własność liniowość przekształcenia.
Rzędem macierzy nazywa się rząd odpowiadającego jej przekształcenia liniowego czyli wymiar jego obrazu, tzn. największą liczbę liniowo niezależnych wierszy bądź kolumn macierzy (liczba niezależnych równań w układzie równań liniowych). Twierdzenie o rzędzie mówi, że suma wymiaru jądra i rzędu macierzy jest równa liczbie jej kolumn.
Macierze kwadratowe
[edytuj | edytuj kod]Przekształcenie liniowe przestrzeni liniowej (albo dowolnej innej) w siebie nazywa się jej endomorfizmem liniowym; macierz endomorfizmu jest zawsze kwadratowa. Przestrzenie liniowe, które zawierają się w innych przestrzeniach liniowych, nazywa się ich podprzestrzeniami (liniowymi); przykładami podprzestrzeni dowolnej przestrzeni są podprzestrzeń niewłaściwa, czyli ona sama, oraz podprzestrzeń zerowa/trywialna, czyli zawierają wyłącznie wektor zerowy (por. przykłady przestrzeni liniowych). Można więc powiedzieć, że endomorfizm przekształca przestrzeń w pewną jej podprzestrzeń – jest to kluczowa, a zarazem znamienna własność tych przekształceń liniowych.
Macierzą diagonalną nazywa się macierz kwadratową, której wszystkie niezerowe elementy znajdują się wyłącznie na głównej przekątnej. Często zapisuje się ją jako gdzie jest jej stopniem. Macierze kwadratowe o elementach nad (odp. pod) przekątną główną równych zeru nazywa się dolnotrójkątnymi (odp. górnotrójkątnymi); macierze jednocześnie dolno- i górnotrójkątne są diagonalne. Macierz trójkątną mającą na głównej przekątnej jedynki nazywa się unitrójkątną. Śladem macierzy nazywa się sumę jej elementów na głównej przekątnej, przy czym oraz
Macierze postaci nazywa się macierzami skalarnymi. Macierz skalarną nazywa się macierzą jednostkową. Jeżeli
gdzie wszystkie powyższe macierze są kwadratowe ustalonego stopnia, to macierz jest wyznaczona jednoznacznie – nazywa się ją macierzą odwrotną do i oznacza symbolem o macierzy mówi się zaś wtedy, że jest odwracalna.
Wyznacznik
[edytuj | edytuj kod]Wyznacznikiem lub macierzy kwadratowej nazywa się liczbę kodującą pewne właściwości przekształcenia reprezentowanego przez tę macierz: jego wartość bezwzględna jest równa (w ) polu powierzchni obrazu kwadratu jednostkowego, tzn. pewnego równoległoboku, lub (w ) objętości obrazu sześcianu jednostkowego, tzn. pewnego równoległościanu[f], a znak mówi o orientacji przekształcenia – jest on dodatni wtedy i tylko wtedy, gdy przekształcenie zachowuje orientację[g]; macierz o wyznaczniku jednostkowym reprezentuje przekształcenie równopolowe.
Macierz o zerowym wyznaczniku nazywa się osobliwą lub zdegenerowaną (przekształcenie „spłaszcza” bądź „skleja”), w przeciwnym przypadku nazywa się ją nieosobliwą lub niezdegenerowaną. Macierz jest odwracalna wtedy i tylko wtedy, gdy jest nieosobliwa, co ma z kolei miejsce wtedy i tylko wtedy, gdy jej rząd jest maksymalny, czyli równy jej stopniowi. Stąd układ równań liniowych o kwadratowej macierzy głównej ma jednoznaczne rozwiązanie wtedy i tylko wtedy, gdy wspomniana macierz ma niezerowy wyznacznik[h] (zob. układ równań liniowych: charakteryzacja rozwiązań). Wyznaczniki stosuje się także do rozwiązywania układów równań liniowych metodą wzorów Cramera, gdzie iloraz wyznaczników dwóch powiązanych macierzy kwadratowych jest równy wartości każdej ze zmiennych układu.
Wyznacznik macierzy stopnia drugiego dany jest wzorem
Wyznacznik macierzy stopnia trzeciego można obliczyć za pomocą reguły Sarrusa, podczas gdy wzór Leibniza (znany również jako permutacyjna definicja wyznacznika) uogólnia te wzory na macierze dowolnych stopni. Twierdzenie Cauchy’ego o wyznacznikach mówi, że wyznacznik iloczynu macierzy jest równy iloczynowi ich wyznaczników, Dodanie wielokrotności dowolnego wiersza do innego (kolumny do innej) nie zmienia wartości wyznacznika; zamiana miejscami dwóch wierszy (kolumn) zmienia znak wyznacznika na przeciwny (zob. własności operacji elementarnych). Korzystając z tych operacji, dowolną macierz można przekształcić w macierz dolno- lub górnotrójkątną, a wyznacznik tego rodzaju macierzy jest równy iloczynowi elementów na przekątnej głównej (w szczególności jest to prawda dla macierzy diagonalnych).
Rozwinięcie Laplace’a umożliwia wyrażenie wyznacznika za pomocą minorów, tzn. wyznaczników podmacierzy głównych (twierdzenie to umożliwia rekurencyjne zdefiniowanie wyznacznika począwszy od wyznacznika macierzy stopnia pierwszego jako jej jedynego elementu, czy nawet wyznacznika macierzy zerowego stopnia równego z definicji jedności[i]). Minory podmacierzy głównej (tzn. zawierające elementy głównej przekątnej) nazywa się minorami głównymi; gdy minor główny zawiera kolejne, począwszy od pierwszego, elementy głównej przekątnej, nazywa się go wiodącym minorem głównym. Wśród wszystkich niezerowych minorów tej macierzy istnieje choć jeden o największym stopniu; rząd macierzy wyznaczony jest przez stopień tego minora (nie przekracza więc liczby jej wierszy, czy kolumn). Każdy niezerowy minor macierzy stopnia równego jej rzędowi nazywa się minorem bazowym tej macierzy. Wiele wyników algebry liniowej daje się zwięźle wyrazić w języku minorów za pomocą tzw. macierzy dołączonej (bądź przestawionej względem niej macierzy dopełnień algebraicznych) zbudowanej z tzw. dopełnień algebraicznych definiowanych jako minory ustalonego znaku.
Niezmienniczość i zagadnienie własne
[edytuj | edytuj kod]Każdy endomorfizm odwzorowuje całą przestrzeń, na której jest określony, w siebie (na mocy definicji endomorfizmu); podobnie zawsze odwzorowuje on w siebie podprzestrzeń zerową (wprost z definicji przekształcenia liniowego). W ogólności może on jednak odwzorowywać daną podprzestrzeń w niemającą z nią związku, zupełnie inną podprzestrzeń. Informacja o tym, które z podprzestrzeni są -niezmiennicze, czyli odwzorowywane przez w siebie, może ułatwić zrozumienie tego jak przekształcenie działa na całej przestrzeni poprzez badanie jak działa na niezależnych od siebie podprzestrzeniach składowych[j]. W kontekście macierzy podprzestrzenie niezmiennicze mogą ułatwić ich rozkład (zob. Rozkłady macierzy)[k].
Jako najprostsze i niosące przy tym istotną informację, szczególnie interesujące są jednowymiarowe podprzestrzenie niezmiennicze opisywane przez kierunek jednego (niezerowego) wektora nazywanego wektorem własnym danego endomorfizmu. Oznacza to, że jest on przekształcany przez endomorfizm na pewną swoją wielokrotność: Liczbę nazywa się wartością własną (stowarzyszoną z wektorem ) danego endomorfizmu w zapisie macierzowym równanie to przyjmuje postać
gdzie jest macierzą reprezentującą zaś jest macierzą współczynników wektora (w tej samej ustalonej bazie). Powyższe równanie można przekształcić do równoważnej postaci czyli zapisać w formie układu równań liniowych, gdzie jest macierzą jednostkową. Ze względu na niezerowość równanie to jest rozwiązalne, gdy macierz jest nieodwracalna lub (równoważnie) osobliwa, tzn.
Funkcja skalarna jest wielomianem stopnia nazywanym wielomianem charakterystycznym macierzy wielomian ten ma co najwyżej różnych pierwiastków, którymi są wartości własne macierzy[l]. Zgodnie z twierdzeniem Cayleya-Hamiltona dla macierzy spełnione jest równanie macierzowe przykładowo jeśli to skąd czyli np. (zob. Rozkłady macierzy i Aspekty numeryczne)
Każda z wartości własnych opisuje przekształcenie wzdłuż wektorów własnych – tak wyznacznik, będący iloczynem wartości własnych[m], jak i ślad, równy sumie wartości własnych, stanowią istotną informację o rodzaju przekształcenia liniowego: ślad może być interpretowany jako nieskończenie mała zmiana objętości (jako pochodna wyznacznika będącego wielomianem, zob. wzór Jacobiego), podczas gdy dodatni znak wyznacznika mówi o tym, czy przekształcenie jest złożeniem parzystej liczby symetrii[n] (zachowuje orientację), a jego moduł opisuje przyrost wzdłuż każdego z wektorów własnych przekształcenia (tzn. jego bezwzględną zmianę pola bądź objętości).
Przykładowo dla endomorfizmów opisanych w sekcji Przekształcenia liniowe wektory są wektorami własnymi symetrii, przekształcenia ekwiafinicznego i jednokładności z wartościami własnymi odpowiednio Poglądowo oznacza to, że w przekształceniach tych łatwo można wyróżnić część działającą „w poziomie” i „w pionie”: w symetrii to kierunek „poziomy” zostaje odbity, a „pionowy” zachowany; jednostkowy iloczyn wartości własnych (tj. wyznacznik) w przekształceniu ekwiafinicznym wskazuje zachowanie pola powierzchni, z kolei równe wartości własne dla jednokładności oznaczają, że skalowanie odbywa się w każdym z kierunków w tym samym stopniu. Jedynym wektorem własnym powinowactwa jest o podwójnej wartości własnej poglądowo oznacza to, że w przekształceniu zachowywany jest tylko kierunek „poziomy” (pojedynczy wektor własny), przy czym odległości między punktami w tym kierunku również są zachowane (jednostkowa stowarzyszona wartość własna). Wektory i wartości własne przytoczonych obrotów nie wyrażają się za pomocą wielkości rzeczywistych[o].
Symetria i określoność
[edytuj | edytuj kod]Macierz określoność; stowarzyszona forma kwadratowa wektory spełniające wykres | |
nieokreślona | dodatnio określona |
Hiperbola | Elipsa |
Paraboloidy: hiperboloiczna i eliptyczna |
Macierz kwadratową równą swojemu przestawieniu, nazywa się symetryczną; jeśli jest ona równa przeciwności swojego przestawienia, to nazywa się ją antysymetryczną. W przypadku macierzy zespolonych symetrię macierzy zastępuje się często jej hermitowskością (samosprzężonością), tzn. rozpatruje się gdzie gwiazdka oznacza sprzężenie hermitowskie macierzy, tzn. złożenie przestawienia macierzy ze sprzężeniem zespolonym jej elementów.
Każdej formie dwuliniowej można przyporządkować macierz kwadratową stopnia gdzie a jest standardową bazą przestrzeni współrzędnych Jeśli macierz jest symetryczna (albo samosprzężona w przypadku zespolonym), to może być ona postrzegana jako macierz formy kwadratowej Przyłożeniu formy dwuliniowej do pary wektorów odpowiada wówczas mnożenie skąd obliczeniu wartości formy kwadratowej dla wektora odpowiada wówczas mnożenie gdzie są macierzami jednokolumnowymi zawierającymi współczynniki wektorów
Formę kwadratową nazywa się dodatnio lub ujemnie określoną albo nieokreśloną, jeżeli dla wszystkich niezerowych wektorów forma przyjmuje odpowiednio wyłącznie wartości dodatnie, ujemne, bądź obu znaków. Jeśli forma przyjmuje wyłącznie wartości nieujemne albo niedodatnie, to nazywa się ją odpowiednio określoną nieujemnie albo niedodatnio (półokreśloną dodatnio bądź ujemnie); w ten sposób forma jest nieokreślona wtedy i tylko wtedy, gdy nie jest określona ani nieujemnie, ani niedodatnio; forma mająca (choć jedną) wartość własną równą zeru nazywa się osobliwą (zdegenerowaną) w przeciwnym przypadku nazywa się ją nieosobliwą (niezdegenerowaną). Określoność macierzy definiuje się jako określoność reprezentowanej przez nią formy kwadratowej (czyli odpowiadającej jej formy dwuliniowej ); identycznie ma się rzecz ze zdegenerowaniem. Terminy dotyczące określoności form przenoszą się wprost na odpowiadające im macierze; osobliwość formy odpowiada wtedy osobliwości jej macierzy (co można również sprawdzić za pomocą wyznacznika lub rzędu).
Twierdzenie spektralne mówi, że rzeczywiste macierze symetryczne i zespolone macierze hermitowskie są diagonalizowalne, tzn. istnieje taka baza, nazywana bazą własną, w której dowolny wektor można przedstawić w postaci kombinacji liniowej wektorów własnych. Innymi słowy istnieje baza, w której dana forma kwadratowa ma macierz diagonalną, przy czym jej główna przekątna zawiera wartości własne stowarzyszone z wektorami bazy własnej – określoność formy kwadratowej (dwuliniowej), czy też jej macierzy, można zatem definiować za pomocą (znaków) jej wartości własnych (tzw. kryterium Sylvestera określoności[p]). W szczególności diagonalizowalna jest macierz standardowego iloczynu skalarnego dowolnej przestrzeni współrzędnych, przy czym w bazie standardowej ma ona postać macierzy jednostkowej, co oznacza, że iloczyn skalarny jest dodatnio określoną formą dwuliniową na tej przestrzeni; stąd jego działanie definiuje się zwykle w zapisie macierzowym wzorem z kolei stowarzyszona z nim forma kwadratowa definiuje kwadrat standardowej normy tej przestrzeni.
Aspekty numeryczne
[edytuj | edytuj kod]Oprócz własności teoretycznych macierzy i ich związków z różnymi dziedzinami wiedzy z praktycznego punktu widzenia ważne jest efektywne i dokładne przeprowadzanie obliczeń na macierzach – dział matematyki obejmujący tę problematykę nazywa się numeryczną algebrą liniową. Zasadniczymi elementami są złożoność obliczeniowa i stabilność numeryczna algorytmu realizującego obliczenia. Zwykle stosuje się algorytmy wprost implementujące dane zagadnienie bądź różnorakie podejścia iteracyjne, np. wektor własny można znaleźć, wskazując ciąg wektorów zbiegający do tego wektora własnego.
Wyznaczenie złożoności algorytmu polega na wskazaniu górnego ograniczenia lub oszacowań liczby potrzebnych dodawań i mnożeń skalarów do wykonania danego algorytmu, np. mnożenia macierzy. Standardowe mnożenie dwóch macierzy typu z definicji wymaga mnożeń, gdyż dla każdego z elementów macierzy potrzeba mnożeń. Klasyczny algorytm Strassena jest efektywniejszy niż opisany wyżej „naiwny” algorytm: potrzebuje jedynie ok. mnożeń; aby przyspieszyć obliczenia uwzględnia się również cechy i własności urządzenia liczącego. W praktyce często dostępna jest dodatkowa wiedza o postaci macierzy – ważnym przypadkiem są macierze rzadkie, tzn. macierze, których większość elementów jest zerami. Istnieją dla nich specjalnie przystosowane algorytmy, np. metoda gradientu sprzężonego rozwiązywania układów równań liniowych dla macierzy rzadkiej
Intuicyjnie algorytm jest numerycznie stabilny, jeśli małe odchylenia argumentów (np. błędy zaokrągleń) nie prowadzą do dużych odchyleń wyników; przykładowo obliczanie macierzy odwrotnej z rozwinięcia Laplace’a, tzn. wzoru (gdzie oznacza macierz dołączoną do ), może prowadzić do znaczących błędów zaokrągleń, gdy wyznacznik macierzy jest bardzo mały (co do wartości bezwzględnej). Do oceny uwarunkowania problemów algebry liniowej, jak powyższe obliczanie odwrotności macierzy, stosuje się normy macierzy; przykładowo opracowano algorytmy rozkładu macierzy, które umożliwiają uniknięcie złego uwarunkowania, np. rozkład Schura.
Ujęcie algebraiczne i uogólnienia
[edytuj | edytuj kod]
Definicja
[edytuj | edytuj kod]Niech będą dodatnimi liczbami całkowitymi, zaś oznacza zbiór liczb kolejnych liczb całkowitych[q], a będzie niepustym zbiorem. Macierzą nazywa się funkcję
gdzie oznacza iloczyn kartezjański zbiorów i Parę uporządkowaną oznaczaną zwykle symbolem nazywa się typem macierzy jej argumenty (elementy dziedziny) – indeksami lub wskaźnikami, zaś wartości (elementy obrazu) – współczynnikami, elementami lub wyrazami; o macierzy mówi się też wtedy, że jest określona nad zbiorem Na podobieństwo ciągów, czy wektorów funkcję oznacza się zwykle symbolicznie
gdzie element i nazywa się wyrazem, współczynnikiem bądź elementem ogólnym macierzy; zwyczajowo pierwszą i drugą współrzędną wyrazu nazywa się odpowiednio jego wierszem i kolumną. Ustalenie pierwszej bądź drugiej współrzędnej funkcji definiuje macierze odpowiednio typu bądź nazywane wierszem bądź kolumną macierzy dokładniej: -tym wierszem, odpowiednio -tą kolumną, macierzy nazywa się macierze dane wzorami bądź odpowiednio przy czym nie ma ogólnie przyjętej notacji dotyczącej wierszy, czy kolumn danej macierzy[r] – macierze te nazywa się często wektorami wierszowymi bądź kolumnowymi, co wyjaśniono w osobnej sekcji.
Aby zaznaczyć typ macierzy często dodaje się go wyżej w pewnej formie za nawiasem, np. w indeksie dolnym: lub Zbiór wszystkich macierzy typu nad zbiorem oznacza się symbolicznie czy opuszczając niekiedy typ macierzy lub zbiór jej współczynników, jeśli są znane z kontekstu lub w szczególności oraz utożsamia się z przestrzeniami współrzędnych oraz wektorów wierszowych i kolumnowych[4][5] (w tej notacji łatwiej śledzić wymiar przestrzeni przy przekształceniach, jednak jest ona niezgodna z notacją potęgową iloczynu kartezjańskiego dla przestrzeni).
Klasy macierzy a wybór bazy
[edytuj | edytuj kod]W zbiorze macierzy można wprowadzić wiele różnych relacji równoważności dzielących ten zbiór na rozłączne klasy:
- równość, definiowana wzorem dla wszystkich
- podobieństwo, mające miejsce wtedy i tylko wtedy, gdy istnieje macierz odwracalna spełniająca [6][7]
- przystawanie, kongruencja, sprzężenie, dane warunkiem istnienia takiej macierzy odwracalnej dla której
- równoważność, zachodząca wtedy i tylko wtedy, gdy istnieją macierze odwracalne że
- równoważność względem operacji elementarnych na wierszach (odp. kolumnach) lub krótko: równoważność elementarna (zwykle dla operacji na wierszach), określona wymaganiem istnienia skończonej liczby operacji elementarnych na wierszach (odp. kolumnach), które przekształcałyby daną macierz w drugą
Na relację podobieństwo, czy przystawania można nakładać dodatkowe warunki, np. wymagać, by macierze i były ortogonalne (podobieństwo/przystawanie ortogonalne, równoważność ortogonalna), czy unitarne (podobieństwo/przystawanie unitarne, równoważność unitarna). Podobieństwo macierzy pociąga ich równoważność. Dwie macierze są równoważne wtedy i tylko wtedy, gdy ich rzędy są równe. Macierze równoważne elementarnie zachowują zbiór rozwiązań układów równań liniowych (równoważność względem operacji na kolumnach zachowuje dualny do danego układ równań liniowych); dla macierzy nad dobrymi strukturami (np. ciałem, a nawet pierścieniem ideałów głównych) elementarna równoważność pokrywa się z równoważnością.
W ogólności macierz może reprezentować przekształcenie liniowe między dowolnymi przestrzeniami liniowymi skończonego wymiaru z ustalonymi bazami, czyli poprzez wybranie w nich „układów współrzędnych”, tzn. wskazanie izomorfizmów dziedziny i przeciwdziedziny z odpowiednimi przestrzeniami współrzędnych. Otóż przekształcenie liniowe przestrzeni liniowej wymiaru w przestrzeń liniową wymiaru z bazami odpowiednio oraz może być opisane dla każdego wzorem
a więc poprzez zapisanie w macierzy kolumnowo obrazów wektorów bazy w bazie
Przynależność macierzy do ustalonej klasy oznacza, iż przedstawienia we współrzędnych (wyrażone za pomocą macierzy) danego rodzaju przekształceń są niezależne od wyboru bazy: macierze danego przekształcenia liniowego w różnych bazach mogą być różne, jednak zawsze są równoważne; podobnie ma się rzecz z endomorfizmami liniowymi przestrzeni liniowej z ustaloną bazą – macierze kwadratowe danego endomorfizmu są do siebie podobne; wreszcie wybór bazy dla przestrzeni liniowej w przypadku form dwuliniowych (często symetrycznych bądź hermitowskich form kwadratowych) umożliwia zapisanie ich w postaci macierzy kwadratowych (symetrycznych bądź hermitowskich), przy czym macierze tej samej formy są przystające (podobnie ma się rzecz z formami i macierzami antysymetrycznymi). Wyznacznik i wartości własne macierzy równoważnych są równe, zatem są one niezmiennikami przekształceń liniowych; twierdzenie Sylvestera o bezwładności form kwadratowych mówi, iż liczba oraz znaki wartości własnych macierzy przystających o rzeczywistych współczynnikach są równe, co oznacza, że są one niezmiennikami rzeczywistych form kwadratowych (symetrycznych form dwuliniowych). We wszystkich przypadkach macierze pełnią rolę macierzy zmiany bazy (tzw. „macierze przejścia” z jednej bazy do innej).
Rozkłady macierzy
[edytuj | edytuj kod]Wspomniana w sekcji Symetria i określoność diagonalizacja będąca przedstawieniem macierzy w postaci macierzy diagonalnej (podobnej do danej, zob. poprzednią sekcję) jest w istocie jedną z wielu innych metod rozkładów macierzy, czyli przekształcania macierzy do przystępniejszych postaci (nazywanych zbiorczo postaciami normalnymi bądź kanonicznymi); zasadniczą cechą tych rozkładów jest zachowywanie pewnych własności danych macierzy, np. wyznacznika, rzędu, czy odwrotności, które łatwo odczytać z uzyskanej postaci bądź możliwość algorytmicznego uproszczenia konkretnych operacji na macierzach określonego rodzaju.
Rozkład LU macierzy polega na przedstawieniu jej w postaci iloczynu macierzy trójkątnych: dolnej ( od ang. lower) i górnej ( od ang. upper). Wyznaczenie tego rozkładu znacząco upraszcza rozwiązywanie układów równań liniowych za pomocą tzw. podstawień w przód i wstecz; podobnie łatwo uzyskać z tej postaci odwrotność macierzy trójkątnych. Pokrewnym poprzedniemu algorytmem jest eliminacja Gaussa: przekształca daną macierz do postaci schodkowej. Obie metody można opisać za pomocą składania danej macierzy przez odpowiednie macierze elementarne odpowiadające permutacjom wierszy i dodawaniu wielokrotności danego wiersza do innego. Rozkład według wartości osobliwych wyraża dowolną macierz jako iloczyn trzech macierzy: unitarnych oraz diagonalnej gdzie oznacza macierz sprzężoną hermitowsko (w przypadku zespolonym; przestawioną w przypadku rzeczywistym) do
Rozkład według wartości własnych bądź diagonalizacja to rozkład danej macierzy na iloczyn macierzy diagonalnej i odwracalnej (macierz, którą można przedstawić w tej postaci nazywa się diagonalizowalną). Ogólną metodą rozkładu, która jest możliwa do przeprowadzenia dla dowolnej macierzy, jest rozkład Jordana przekształcający daną macierz do postaci (normalnej) Jordana, tzn. macierzy, której jedynymi niezerowymi elementami są znajdujące się na głównej przekątnej wartości własne macierzy oraz być może elementy jednostkowe znajdujące się na nadprzekątnej głównej (zob. rysunek obok). W rozkładzie według wartości własnych -tą potęgę macierzy (tzn. -krotne mnożenie macierzy przez siebie) można obliczyć według wzoru:
a potęgę macierzy diagonalnej oblicza się, podnosząc do potęgi elementy z jej przekątnej głównej – jest to znacznie prostsza operacja niż potęgowanie macierzy w postaci wyjściowej. Potęgowanie macierzy jest umożliwia zdefiniowanie eksponenty macierzy która podobnie do eksponenty rzeczywistej czy zespolonej znajduje wiele zastosowań: rozwiązywanie liniowych równań różniczkowych, obliczanie logarytmów macierzy, czy ich pierwiastków.
Współczynniki, algebra i grupy macierzy
[edytuj | edytuj kod]Choć w definicji zbiór współczynników nie ma żadnej wyróżnionej struktury, to moc zastosowań metod macierzowych wynika z dodatkowej struktury algebraicznej określonej w tym zbiorze, która umożliwia zdefiniowanie podstawowych działań na macierzach, co skutkuje wprowadzeniem konkretnej struktury algebraicznej w zbiorze macierzy ustalonego typu, czy rodzaju. W artykule skupiono się na ciałach (którymi są np. zbiór liczb rzeczywistych, czy zespolonych), choć uprawianie algebry liniowej za pomocą teorii macierzy możliwe jest już w przypadku zastosowania pierścieni (np. zbioru liczb całkowitych).
Zbiór macierzy tworzy grupę ze względu na dodawanie macierzy z macierzą zerową złożoną z samych zer pełniącą rolę elementu neutralnego; jeśli dodawanie w zbiorze współczynników jest przemienne (z definicji w ciele lub pierścieniu przemiennym), to jest ona abelowa. Dołączenie mnożenia przez skalary czyni z grupy przestrzeń liniową (wymiaru ) w przypadku, gdy zbiór skalarów ma strukturę ciała lub moduł (wolny rangi ), jeśli skalary tworzą pierścień[u]. Mnożenie macierzy nad pierścieniem nieprzemiennym określa się analogicznie jak w przypadku ciał, jednak działanie to nie ma wówczas tak dobrych własności.
Zbiór macierzy kwadratowych stopnia tworzy nieprzemienny pierścień z jedynką ze względu na mnożenie nazywany pierścieniem macierzy; uwzględniając strukturę przestrzeni liniowej (modułu) macierze kwadratowe danego stopnia są nieprzemienną algebrą nad ciałem z jedynką (nieprzemienną algebrą nad pierścieniem). Macierze odwrotna i odwracalna są elementami odwrotnym i odwracalnym w algebrze macierzy kwadratowych; zbiór macierzy odwracalnych ustalonego stopnia tworzy ze względu na mnożenie macierzy ogólną lub pełną grupę liniową generowaną przez macierze elementarne. Grupami macierzowymi nazywa się właśnie podgrupy ogólnej grupy liniowej (z działaniem mnożenia); jest nią np. szczególna lub specjalna grupa liniowa składająca się z macierzy odwracalnych o wyznaczniku jednostkowym (podgrupa normalna generowana przez operację elementarną dodawania wiersza pomnożonego przez odwracalną liczbę do innego w przypadku ciał). Każda grupa skończona jest izomorficzna z grupą macierzową, można się o tym przekonać, rozpatrując reprezentację regularną grupy symetrycznej. Ogólne grupy można badać za pomocą dobrze znanych grup macierzy, które zostały dość dobrze poznane dzięki teorii reprezentacji.
Jeżeli pierścień współczynników macierzy kwadratowej jest przemienny, to możliwe jest zdefiniowanie jej wyznacznika[v]. Niezerowość wyznacznika dla macierzy określonych nad ciałami należy zamienić w przypadku pierścieni na warunek jego odwracalności. Ze wzorów Cramera (własności macierzy dołączonej) wynika, że macierz kwadratowa nad pierścieniem przemiennym jest odwracalna wtedy i tylko wtedy, gdy jest nieosobliwa.
Nad (przemienną) dziedziną ideałów głównych podmoduł modułu wolnego jest wolny, a jego ranga nie przekracza rangi całego modułu. W związku z tym owocne jest dla macierzy typu nad dziedziną ideałów głównych rozważanie podmodułów modułów oraz generowanych odpowiednio przez kolumny i wiersze macierzy Podmoduły te mają równe rangi, a ich wspólną wartość nazywa się rzędem macierzy Rząd jest równy największemu stopniowi jej niezerowego minora i jest równy rzędowi tej samej macierzy nad ciałem ułamków pierścienia rząd macierzy nie przekracza liczby jej wierszy i kolumn.
Ponieważ macierze można traktować jak („długie”) wektory (najczęściej nad pewnym ciałem, takim jak np. liczby rzeczywiste, czy liczby zespolone), to w wielu przypadkach możliwe jest wprowadzenie przeróżnych struktur algebraicznych, czy topologicznych na różnego rodzaju przestrzeniach macierzy, co wynika stąd, iż zbiór macierzy ustalonego typu tworzy skończeniewymiarową przestrzeń liniową z działaniami na macierzach (traktowanych jak wektory, tzn. wprowadzonymi „po wskaźnikach”) – każda z tych przestrzeni ma identyczną strukturę z przestrzenią współrzędnych nad tym ciałem. Dla macierzy nad ciałami liczb rzeczywistych, czy zespolonych można przykładowo wprowadzić strukturę przestrzeni euklidesowej z jej naturalnymi strukturami, a nawet pójść krok dalej: wprowadzić strukturę algebry Liego, co w dalszym stopniu zwiększa liczbę zastosowań teorii macierzy.
Jeśli współczynniki należą do ciała liczb rzeczywistych lub zespolonych, to ogólna grupa liniowa ma strukturę grupy Liego (wymiaru równemu stopniowi macierzy w przypadku rzeczywistym i dwukrotnie większemu w przypadku zespolonym), tzn. mnożenie i odwracanie macierzy są ciągłe (w topologii euklidesowej macierzy traktowanych jako „długie” wektory[w]). Ponadto jest otwartą rozmaitością afiniczną w przestrzeni wszystkich macierzy ustalonego stopnia (jej niepustym podzbiorem otwartym w topologii Zariskiego), a nawet rozmaitością różniczkową (tego samego wymiaru). Algebra Liego odpowiadająca tej grupie, tzn. struktura oddająca intuicję nieskończenie małych przekształceń tych grup (por. pochodna Liego), składa się ze wszystkich macierzy kwadratowych tego samego stopnia z komutatorem pełniącym rolę nawiasu Liego; algebra Liego specjalnej grupy liniowej (będącą podrozmaitością ogólnej grupy liniowej) zawiera wszystkie macierze kwadratowe ustalonego stopnia o zerowym śladzie.
Macierze nieskończone i puste
[edytuj | edytuj kod]Rozpatruje się również macierze o nieskończonej liczbie wierszy i/lub kolumn – formalnie wystarczy, iż dla dowolnych elementów indeksujących wiersze i kolumny istnieje dobrze określony element macierzy (zbiory indeksów nie muszą być nawet podzbiorami liczb naturalnych). Analogicznie jak w przypadku skończonym można zdefiniować dodawanie, odejmowanie, mnożenie przez skalar, czy przestawienie macierzy, choć mnożenie macierzy wymagać może określenia nieskończonego sumowania do zdefiniowania elementów iloczynu. Jeśli macierz nieskończona ma opisywać przekształcenie liniowe, to jej wszystkie kolumny muszą mieć skończoną liczbę niezerowych elementów. Wynika to stąd, iż dla macierzy reprezentującej przekształcenie liniowe z ustalonymi bazami dla przestrzeni liniowych, każdy wektor przestrzeni może być zapisany jednoznacznie jako (skończona) kombinacja liniowa wektorów bazowych, a więc jako macierz jednokolumnową („wektor kolumnowy”) w której tylko skończenie wiele elementów jest różnych od zera. Wówczas kolumny zawierają kolejne obrazy w przekształceniu macierzy jednokolumnowych odpowiadających obrazom wektorów bazowych przestrzeni w bazie przestrzeni co ma sens wyłącznie wtedy, gdy kolumny te mają skończenie wiele niezerowych elementów. Nie ma jednakże ograniczenia na liczbę wierszy macierzy otóż w iloczynie pojawia się tylko skończenie wiele niezerowych współczynników macierzy jednokolumnowej przez co każdy z elementów tego iloczynu, nawet jeśli jest dany jako nieskończona suma iloczynów, zawiera tylko skończenie wiele różnych od zera elementów, skąd wynika, iż jest on dobrze określony. Co więcej, oznacza to utworzenie kombinacji liniowej kolumn macierzy która efektywnie zawiera wyłącznie skończenie wiele z nich, stąd ponieważ każda kolumna zawiera tylko skończenie wiele niezerowych elementów, to i wynik ma ich tyle. Iloczyn dwóch macierzy danego typu jest również dobrze określony (z zastrzeżeniem równości zbiorów indeksujących odpowiednio wiersze i kolumny tych macierzy), jest tego samego typu i odpowiada złożeniu przekształceń liniowych.
Macierze nieskończone wykorzystuje się do opisu operatorów na przestrzeni Hilberta, gdzie narzuca się dodatkowe ograniczenia ze względu na zbieżność odpowiednich sum oraz ciągłość przekształceń. Z ogólnego punktu widzenia macierze jednak zaciemniają ogląd – z tego powodu częściej korzysta się z abstrakcyjnych, potężniejszych metod analizy funkcjonalnej.
Macierz pusta to macierz, której liczba wierszy lub kolumn jest równa zeru. Ułatwiają one rozważania teoretyczne dotyczące zerowej przestrzeni liniowej, np. jeśli macierz jest typu a macierz jest typu to ich iloczyn jest macierzą zerową typu odpowiadającą przekształceniu zerowemu pewnej trójwymiarowej przestrzeni liniowej w siebie, podczas gdy iloczyn jest macierzą typu Nie ma ustalonej notacji dotyczącej macierzy pustych, choć większość systemów algebry komputerowej umożliwia ich tworzenie i prowadzenie obliczeń z ich udziałem. Wyznacznik macierzy typu