Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.nature.web.ru/db/msg.html?mid=1151602&uri=ch3node1.html
Дата изменения: Unknown
Дата индексирования: Mon Apr 11 15:08:01 2016
Кодировка: Windows-1251
Научная Сеть >> Курс лекций И.М.Гельфанда по линейной алгебре
Rambler's Top100 Service
Поиск   
 
Обратите внимание!   Обратите внимание!
 
  Наука >> Математика >> Алгебра, математическая логика и теория чисел | Курсы лекций
 Посмотреть комментарии[2]  Добавить новое сообщение
next up previous contents index
Next: 19 приведение к нормальной Previous: 3 Канонический вид произвольных

18 Нормальная форма линейного
преобразования

В главе II мы познакомились с различными классами линейных преобразований $ n$-мерного пространства, имеющих $ n$ линейно независимых собственных векторов. Мы знаем, что в базисе, состоящем из собственных векторов такого преобразования, его матрица имеет особенно простой вид, так называемую диагональную форму.

Однако число линейно независимых собственных векторов у линейного преобразования может быть меньше, чем $ n$ 4.1. Пример линейного преобразования с недостаточным числом собственных векторов мы приведем несколько позже (см. также §10, п.1, пример 3). Такое преобразование заведомо не может быть приведено к диагональной форме, так как базис, в котором матрица преобразования диагональна, состоит из собственных векторов. Возникает вопрос: каков простейший вид матрицы такого линейного преобразования?

В этой главе мы для произвольного преобразования укажем базис, в котором его матрица имеет сравнительно простой вид (так называемая жорданова нормальная форма). В случае, когда число линейно независимых собственных векторов преобразования равно размерности пространства, эта нормальная форма совпадает с диагональной. Мы сформулируем сейчас окончательный результат, который докажем в §19.

Пусть задано произвольное линейное преобразование $ A$ в комплексном пространстве $ n$ измерений. Предположим, что у $ A$ имеется $ k$ $ (k\leqslant n)$ линейно независимых собственных векторов

$\displaystyle e_1,f_1,\dots,h_1,$

соответствующих собственным значениям $ \lambda_1,\lambda_2, \dots, \lambda_k$. Тогда существует базис, состоящий из $ k$ групп векторов 4.2:

$\displaystyle e_1,\dots,e_p; f_1,\dots,f_q; \dots; h_1,\dots,h_s,$ (1)

в котором преобразование $ A$ имеет следующий вид
:

\begin{displaymath}\begin{aligned}Ae_1&=\lambda_1e_1,&Ae_2&=e_1+\lambda_1e_2,&& ...
..._kh_2, && \dots,  &Ah_s&=h_{s-1}+\lambda_kh_s. \end{aligned}\end{displaymath}

Мы видим, что базисные векторы каждой группы переходят при нашем преобразовании в линейную комбинацию векторов той же группы. Отсюда следует, что каждая группа базисных векторов порождает подпространство, инвариантное относительно преобразования $ A$. Рассмотрим несколько подробнее преобразование, задаваемое формулами (2).

В подпространстве, порожденном каждой группой, есть собственный вектор; например, в подпространстве, порожденном векторами $ e_1,e_2,
\dots, e_p$, таким собственным вектором является $ e_1$.

Вектор $ e_2$ называют иногда присоединенным собственным вектором первого порядка. Это значит, что $ Ae_2$ пропорционально $ e_2$ с точностью до собственного вектора, как это видно из равенства

$\displaystyle Ae_2=\lambda_1e_2+e_1.$

Аналогично $ e_3, e_4, \dots$ называют присоединенными векторами второго, третьего и т.д. порядков.

Каждый из них является ``как бы собственным'', т.е. собственным с точностью до присоединенного вектора низшего порядка

$\displaystyle Ae_k=\lambda_1e_k+e_{k-1}.$

Таким образом, базис каждого инвариантного подпространства состоит из одного собственного вектора и такого же количества присоединенных, которое нужно добавить, чтобы получить базис данного подпространства.

Покажем, что в каждом из этих подпространств имеется, с точностью до множителя, лишь один собственный вектор.


Действительно, рассмотрим, например, подпространство, порожденное векторами $ e_1,e_2,
\dots, e_p$. Допустим, что некоторый вектор из этого подпространства, т.е. некоторая линейная комбинация вида

$\displaystyle c_1e_1+c_2e_2+\ldots+c_pe_p,$

где не все $ c_k$ равны нулю, является собственным вектором, т.е.

$\displaystyle A(c_1e_1+c_2e_2+\ldots+c_pe_p)=
\lambda(c_1e_1+c_2e_2+\ldots+c_pe_p).
$

Подставляя вместо левой части ее выражение по формулам (2), получаем равенство

$\displaystyle c_1\lambda_1e_1+c_2(e_1+\lambda_1e_2)+
\ldots+c_p(e_{p-1}+\lambda_1e_p)
=\lambda c_1e_1+\lambda c_2e_2+\ldots+\lambda c_pe_p.
$

Отсюда, приравнивая коэффициенты при каждом из базисных векторов, имеем систему уравнений для нахождения величин $ \lambda, c_1, c_2, \dots, c_p$:

\begin{displaymath}
\begin{aligned}
c_1\lambda_1+c_2&=\lambda c_1,\\
c_2\lambd...
...}\\
c_p\lambda_1\hphantom{{}+c_1}&=\lambda c_p.
\end{aligned}\end{displaymath}

Покажем прежде всего, что $ \lambda=\lambda_1$. Действительно, если бы $ \lambda\ne\lambda_1$, то из последнего равенства мы имели бы $ c_p=0$ и затем из остальных равенств $ c_{p-1}=c_{p-2}=c_2=c_1=0$. Итак, $ \lambda=\lambda_1$; тогда из первого уравнения имеем $ c_2=0$, из второго $ c_3=0$ и т.д. до $ c_p=0$. Значит, собственный вектор равен $ c_1e_1$ и, следовательно, с точностью до множителя совпадает с первым вектором соответствующей группы.


Выпишем матрицу преобразования (2). Так как векторы каждой группы преобразуются в линейные комбинации векторов той же группы, то в первых $ p$ столбцах матрицы преобразования могут быть отличны от нуля лишь элементы первых $ p$ строк, в следующих $ q$ столбцах могут быть отличны от нуля лишь элементы, стоящие в строках с теми же номерами, что и у этих столбцов, и т.д. Таким образом, в данном базисе матрица преобразования будет состоять из $ k$ клеток, расположенных по главной диагонали, а все элементы, не принадлежащие ни одной из этих клеток, будут равны нулю.

Для того чтобы понять, что стоит в каждой клетке матрицы преобразования $ A$, достаточно еще раз написать, как преобразуются векторы одной группы. Мы имеем:

\begin{displaymath}
\begin{aligned}
Ae_1 &=\lambda_1&&e_1,{}\\
Ae_2 &= &&e_1+\...
...&e_{p-1},\\
Ae_p &=&&&&& &e_{p-1}+\lambda_1e_p.
\end{aligned}\end{displaymath}

Вспоминая, как строится матрица, отвечающая данному преобразованию базиса, получаем, что клетка матрицы, соответствующая данной группе векторов, имеет вид

$\displaystyle \boldsymbol{A}_1= \begin{pmatrix}\lambda_1&1&0&\dots&0&0  0&\la...
...or[1.5]{6}  0&0&0&\dots&\lambda_1&1  0&0&0&\dots&0&\lambda_1 \end{pmatrix}.$ (3)

Вся же матрица оказывается составленной из таких клеток порядков $ p, q, \dots, s$ соответственно, т.е. имеет вид

\begin{equation*}\arraycolsep2.5pt \begin{pmatrix}\begin{matrix}\lambda_1&1&0&\d...
...sfor[1.5]{5}  0&0&0&\dots&\lambda_k \end{matrix} \end{pmatrix},\end{equation*} (4)

где все элементы вне клеток -- нули.

Заметим также, что не все $ \lambda_i$ обязаны быть различными.


Упражнение   Найти все инвариантные подпространства преобразования с матрицей (3).

Хотя приведенная здесь нормальная форма выглядит сложнее, чем, например, диагональная матрица, однако и с ней можно достаточно просто производить алгебраические операции. Мы покажем, например, как вычислить многочлен от матрицы (4). Матрица (4) имеет вид

$\displaystyle \arraycolsep2pt
\boldsymbol{A}=
\begin{pmatrix}
\boldsymbol{A}_1\...
...skip-4pt}
&&\ddots\\
\noalign{\vskip-2pt}
&&&\boldsymbol{A}_k
\end{pmatrix},
$

где $ \boldsymbol{A}_i$ -- отдельные клетки, а все невыписанные элементы -- нули. Тогда

$\displaystyle \arraycolsep2pt
\boldsymbol{A}^2=
\begin{pmatrix}
\boldsymbol{A}_...
...ip-4pt}
&&\ddots\\
\noalign{\vskip-2pt}
&&&\boldsymbol{A}_k^m
\end{pmatrix},
$

т.е. для того, чтобы возвести в некоторую степень матрицу $ \boldsymbol{A}$, достаточно уметь возвести в эту степень каждую из клеток. Пусть теперь $ P(t)=a_0+a_1t+\ldots+a_mt^m$ -- произвольный многочлен. Тогда легко видеть, что

$\displaystyle \arraycolsep1pt
P(\boldsymbol{A})=
\begin{pmatrix}
P(\boldsymbol{...
...p-4pt}
&&\ddots\\
\noalign{\vskip-2pt}
&&&P(\boldsymbol{A}_k)
\end{pmatrix}.
$

Покажем теперь, как вычислить $ P(\boldsymbol{A}_1)$, т.е. многочлен от одной клетки нормальной формы матрицы (3). Для этого запишем матрицу (3) в виде

$\displaystyle \boldsymbol{A}_1=\lambda_1\boldsymbol{E}+\boldsymbol{I},$

где $ \boldsymbol{E}$ -- единичная матрица порядка $ p$, а матрица $ \boldsymbol{I}$ имеет вид

$\displaystyle \boldsymbol{I}=
\begin{pmatrix}
0&1&0&\dots&0&0\\
0&0&1&\dots&0&0\\
\hdotsfor[1.5]{6}\\
0&0&0&\dots&0&1\\
0&0&0&\dots&0&0
\end{pmatrix}.
$

Заметим, что матрицы $ \boldsymbol{I}^2, \boldsymbol{I}^3, \dots, \boldsymbol{I}^{p-1}$ имеют следующий вид 4.3:

$\displaystyle \boldsymbol{I}^2=
\begin{pmatrix}
0&0&1&.&\dots&0\\
0&0&0&1&\do...
...&0\\
\hdotsfor[1.5]{6}\\
0&0&0&\dots&0&0\\
0&0&0&\dots&0&0
\end{pmatrix},$

а

$\displaystyle \boldsymbol{I}^p=\boldsymbol{I}^{p+1}=\ldots=0.$

Теперь нетрудно вычислить произвольный многочлен от матрицы (3). Действительно, многочлен $ P(t)$ можно по формуле Тейлора представить в виде

$\displaystyle P(t)=P(\lambda_1)+(t-\lambda_1)P'(\lambda_1)+
\frac{(t-\lambda_1)^2}{2!}P''(\lambda_1)+
\ldots+\frac{(t-\lambda_1)^n}{n!}P^{(n)}(\lambda_1),
$

где $ n$ -- степень многочлена. Подставляя вместо $ t$ матрицу $ \boldsymbol{A}_1$, имеем:

$\displaystyle P(\boldsymbol{A}_1)=P(\lambda_1)\boldsymbol{E}+
(\boldsymbol{A}_1...
...ts+
\frac{(\boldsymbol{A}_1-\lambda_1\boldsymbol{E})^n}{n!}P^{(n)}(\lambda_1).
$

Но $ \boldsymbol{A}_1-\lambda_1\boldsymbol{E}=\boldsymbol{I}$, следовательно,

$\displaystyle P(\boldsymbol{A}_1)=P(\lambda_1)\boldsymbol{E}+
P'(\lambda_1)\bol...
...1)}{2!}\boldsymbol{I}^2+\ldots+
\frac{P^{(n)}(\lambda_1)}{n!}\boldsymbol{I}^n.
$

Подставляя вместо $ \boldsymbol{I}, \boldsymbol{I}^2, \dots,
\boldsymbol{I}^{p-1}$ их выражения и учитывая, что $ \boldsymbol{I}^p=\boldsymbol{I}^{p+1}=\ldots=0$, получаем окончательный вид матрицы $ P(\boldsymbol{A}_1)$:

$\displaystyle P(\boldsymbol{A}_1)=
\begin{pmatrix}
P(\lambda_1)&\frac{P'(\lambd...
...a_1)}{(p-2)!}\\
\hdotsfor[1.5]{5}\\
0&0&0&\dots&P(\lambda_1)
\end{pmatrix}.$

Мы видим, таким образом, что, для того чтобы вычислить многочлен от одной клетки нормальной формы порядка $ p$, достаточно знать значение этого многочлена и его производных до порядка $ p-1$ в точке $ \lambda_1$, где $ \lambda_1$ -- собственное значение, отвечающее клетке. Отсюда следует, что если матрица $ \boldsymbol{A}$ имеет нормальную форму (4) с клетками порядков $ p, q, \dots, s$, то для вычисления матрицы $ P(\boldsymbol{A}_1)$ достаточно знать значения $ P(t)$ в точках $ t=\lambda_1,\lambda_2,\dots,\lambda_k$ с производными до порядков $ p-1, q-1, \dots, s-1$ соответственно.


Мы докажем следующую теорему.

Теорема   Пусть в комплексном $ n$-мерном пространстве задано линейное преобразование $ A$. Тогда можно найти базис, в котором матрица линейного преобразования имеет нормальную форму. Другими словами, можно найти базис, в котором линейное преобразование имеет вид (2).

Два независимых доказательства сформулированной теоремы будут даны в §19 и 20. Кроме того, важная теория инвариантных множителей и $ \lambda $-матриц дает нам третье независимое доказательство этого результата.


next up previous contents index
Next: 19 приведение к нормальной Previous: 3 Канонический вид произвольных Vadim Yu. Radionov
2000-08-30


Посмотреть комментарии[2]
 Copyright © 2000-2015, РОО "Мир Науки и Культуры". ISSN 1684-9876 Rambler's Top100 Яндекс цитирования