BSz1 Jegyzet

17. Tétel:

Négyzetes mátrixok sajátértékei és sajátvektorai, ezek meghatározása. Karakterisztikus polinom. A sajátértékek és sajátvektorok kapcsolata lineáris transzformáció valamely bázis szerinti mátrixának diagonalitásával.

17.1. A sajátérték és sajátvektor definíciója

Egy $f$ lineáris transzformáció során bizonyos vektorok megőrizhetik az irányukat, és csupán a hosszuk változik meg egy $\lambda$ skalárral való szorzás hatására. Ezek a vektorok és értékek kulcsszerepet játszanak az $[f]_B$ mátrix diagonalizálásában és a lineáris algebra számos alkalmazásában.

2.9.1. Definíció

Legyen $A$ egy $(n \times n)$-es négyzetes mátrix.

i. Sajátérték

A sajátértéknek nevezzük a $\lambda \in \mathbb{R}$ skalárt, ha létezik olyan $\underline{x} \in \mathbb{R}^n, \underline{x} \neq \underline{0}$ vektor, amelyre teljesül:

$A \cdot \underline{x} = \lambda \cdot \underline{x}$

ii. Sajátvektor

A sajátvektornak nevezzük az $\underline{x} \in \mathbb{R}^n$ vektort, ha $\underline{x} \neq \underline{0}$ és létezik olyan $\lambda \in \mathbb{R}$ skalár, amelyre:

$A \cdot \underline{x} = \lambda \cdot \underline{x}$

A fogalmak kapcsolata

A két fogalom elválaszthatatlan: ha az $A \cdot \underline{x} = \lambda \cdot \underline{x}$ egyenlet fennáll egy nem-nulla $\underline{x}$ vektorra, akkor $\lambda$ a sajátérték, az $\underline{x}$ pedig a $\lambda$-hoz tartozó sajátvektor.

Kritikus feltétel: A definíció kiköti, hogy a sajátvektor nem lehet a nullvektor ($\underline{x} \neq \underline{0}$), mivel a nullvektorra az egyenlet bármely $\lambda$ érték mellett triviálisan teljesülne.

17.2. A sajátértékek kiszámítása

A sajátértékek meghatározásához az $A\underline{x} = \lambda\underline{x}$ egyenletet olyan alakra kell hoznunk, amelyből a $\lambda$ értékei közvetlenül kiszámíthatók. Erre szolgál a lineáris algebra egyik legfontosabb tétele.

2.9.2. Tétel (A sajátérték létezésének feltétele)

A négyzetes $A$ mátrixnak a $\lambda \in \mathbb{R}$ skalár akkor és csak akkor sajátértéke, ha teljesül az alábbi egyenlőség:

$\det(A - \lambda \cdot E) = 0$

Ahol E az $(n \times n)$-es egységmátrixot jelöli.

A tétel részletes bizonyítása:

1

$\lambda$ definíció szerint akkor sajátérték, ha az $A \cdot \underline{x} = \lambda \cdot \underline{x}$ egyenletnek létezik nem-nulla ($\underline{x} \neq \underline{0}$) megoldása.

2

Az egyenlet jobb oldalán álló $\lambda\underline{x}$ kifejezés felírható $(\lambda \cdot E) \cdot \underline{x}$ alakban. Ez a mátrixszorzás definíciójából és a 2.5.8. Tétel (i) állításából következik:

$(\lambda \cdot E) \cdot \underline{x} = \lambda \cdot (E \cdot \underline{x}) = \lambda \cdot \underline{x}$

3

Rendezzük az egyenletet egy oldalra, és emeljük ki az $\underline{x}$ vektort a 2.5.8. Tétel (ii) állítása szerint:

$A \cdot \underline{x} - (\lambda \cdot E) \cdot \underline{x} = \underline{0}$

$(A - \lambda \cdot E) \cdot \underline{x} = \underline{0}$

4

Ez egy homogén lineáris egyenletrendszer, amelynek együtthatómátrixa $(A - \lambda \cdot E)$. Ennek akkor és csak akkor van nem-triviális ($\underline{x} \neq \underline{0}$) megoldása, ha a mátrix oszlopai lineárisan összefüggőek (2.5.15. Következmény).

5

Végül a 2.5.16. Tétel alapján az oszlopok lineáris összefüggősége ekvivalens azzal, hogy a mátrix determinánsa nulla: $\det(A - \lambda \cdot E) = 0$.

17.3. A karakterisztikus polinom

A 2.9.2. Tételben szereplő determináns nem csupán egy egyenlet bal oldala, hanem a $\lambda$ változó egy speciális függvénye, amely alapvető információkat hordoz a mátrix algebrai viselkedéséről.

2.9.3. Definíció

Az $(n \times n)$-es $A$ mátrix karakterisztikus polinomjának nevezzük a $\det(A - \lambda \cdot E)$ determináns értékét, ahol $\lambda$ egy változó.

$k_A(\lambda) = \det(A - \lambda \cdot E)$

Algebrai fokszám

A determináns kifejtése után egy n-edfokú polinomot kapunk. Ez azt jelenti, hogy egy $(n \times n)$-es mátrixnak legfeljebb $n$ darab különböző valós sajátértéke lehet.

Kapcsolat a gyökökkel

A karakterisztikus polinom valós gyökei pontosan az $A$ mátrix sajátértékei. A polinom megoldása tehát a kulcs a transzformáció sajátirányainak megtalálásához.

Kidolgozott példa: Polinom felírása

Feladat:

Írja fel az $A = \begin{pmatrix} 4 & 2 \\ 1 & 3 \end{pmatrix}$ mátrix karakterisztikus polinomját!

Megoldás menete:

1. Vonjunk ki $\lambda$-t a főátlóból:

$A - \lambda E = \begin{pmatrix} 4-\lambda & 2 \\ 1 & 3-\lambda \end{pmatrix}$

2. Számítsuk ki a determinánst:

$k_A(\lambda) = (4-\lambda)(3-\lambda) - (2 \cdot 1)$
$k_A(\lambda) = \lambda^2 - 7\lambda + 12 - 2$

Eredmény

$k_A(\lambda) = \lambda^2 - 7\lambda + 10$

A polinom gyökei (a sajátértékek) $\lambda_1 = 5$ és $\lambda_2 = 2$.

17.4. Diagonális mátrix és sajátvektorok

A lineáris transzformációk vizsgálatának egyik legfontosabb célja olyan bázis keresése, amelyben a transzformáció mátrixa a lehető legegyszerűbb, azaz diagonális alakú. Az alábbi állítás megmutatja, hogy ez pontosan akkor lehetséges, ha a bázis kizárólag sajátvektorokból áll.

2.9.5. Állítás (A diagonalizálhatóság feltétele)

Legyen $f : \mathbb{R}^n \to \mathbb{R}^n$ lineáris transzformáció és $B = \{\underline{b}_1, \underline{b}_2, \dots, \underline{b}_n\}$ egy bázis $\mathbb{R}^n$-ben.

Az $[f]_B$ mátrix akkor és csak akkor diagonális, ha a $B$ bázis minden eleme sajátvektora az $f$ transzformációnak.

A tétel részletes, lépésenkénti bizonyítása:

1

A definíció szerint egy mátrix akkor diagonális, ha a főátlón kívüli összes eleme nulla. Ez azt jelenti, hogy minden $1 \le i \le n$ esetén a mátrix $i$-edik oszlopa $\lambda_i \cdot \underline{e}_i$ alakú valamilyen $\lambda_i \in \mathbb{R}$ skalárra (ahol $\underline{e}_i$ a standard bázis $i$-edik vektora).

2

A 2.8.15. Tétel (iii) állítása szerint a $B$ bázis szerinti $[f]_B$ mátrix $i$-edik oszlopa pontosan megegyezik a bázisvektor képének koordinátavektorával, azaz $[f(\underline{b}_i)]_B$-vel.

3

Az előző két pontot összevetve: a mátrix akkor diagonális, ha $[f(\underline{b}_i)]_B = \lambda_i \cdot \underline{e}_i$. Ez a koordinátavektor alakjában felírva: $[f(\underline{b}_i)]_B = (0, \dots, \lambda_i, \dots, 0)^T$

4

A koordinátavektor 2.2.24. Definíciója alapján ez azt jelenti, hogy az $f(\underline{b}_i)$ vektor felírható a bázisvektorok lineáris kombinációjaként, ahol csak a $b_i$ együtthatója nem nulla: $f(\underline{b}_i) = 0 \cdot \underline{b}_1 + \dots + \lambda_i \cdot \underline{b}_i + \dots + 0 \cdot \underline{b}_n$

5

Ez az egyenlőség leegyszerűsítve: $f(\underline{b}_i) = \lambda_i \cdot \underline{b}_i$. Ez viszont pontosan a sajátvektor 2.9.1. Definíciója, vagyis $\underline{b}_i$ az $f$ transzformáció $\lambda_i$ sajátértékhez tartozó sajátvektora.

Gyakorlati jelentőség

Ez a tétel a diagonalizálás alapja: ha találsz $n$ darab lineárisan független sajátvektort, akkor ezeket bázisnak választva a transzformáció mátrixa egy olyan diagonális mátrix lesz, amelynek főátlójában éppen a sajátértékek sorakoznak.

Sajátértékek elemzése

A karakterisztikus egyenlet megoldása és a sajátértékek meghatározása

2x2-es Mátrix (A) elemei