Документ взят из кэша поисковой машины. Адрес оригинального документа : http://higeom.math.msu.su/people/taras/teaching/panov-linalg.pdf
Дата изменения: Thu May 29 14:24:34 2014
Дата индексирования: Sun Apr 10 01:05:18 2016
Кодировка: Windows-1251
Линейная алгебра и геометрия

ПАНОВ Тарас Евгеньевич
курс лекций

Механико-математический факультет МГУ



Оглавление
Предисловие Глава 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. 1.8. 1. Линейные пространства Линейные пространства и подпространства. Примеры Линейная зависимость. Базис. Размерность Пересечение и сумма подпространств, их размерности Прямая сумма подпространств. Внешняя прямая сумма Факторпространство. Размерность факторпространства Координаты вектора. Закон изменения координат при замене базиса Линейные отображения и изоморфизмы. Ядро и образ Матрица линейного отображения. Преобразование матрицы линейного отображения при заменах базисов 1.9. Двойственное пространство V , двойственный базис. Отсутствие изоморфизма V V в бесконечномерном случае (пример) = 1.10. Второе двойственное пространство, канонический изоморфизм V V = 1.11. Сопряж?нное линейное отображение 3 5 5 7 10 11 12 14 16 18 19 21 22 23 23 25 26 27 29 31 33 35 38 40 41 45 45 46

Глава 2. Линейные операторы 2.1. Матрица линейного оператора. Определитель и след оператора. Невырожденные операторы. Группы GLn и SLn 2.2. Проекторы, их алгебраическая характеризация 2.3. Многочлены от оператора. Минимальный аннулирующий многочлен 2.4. Овеществление и комплексификация 2.5. Инвариантные подпространства. Ограничение оператора и фактороператор. Собственные значения и собственные векторы 2.6. Характеристический многочлен. Теорема ГамильтонаКэли 2.7. Диагонализируемые операторы. Критерий диагонализируемости 2.8. Нильпотентные операторы. Нормальный вид 2.9. Корневые векторы. Теорема о разложении в прямую сумму корневых подпространств 2.10. Жорданова нормальная форма оператора 2.11. Вычисление многочленов и функций от матриц. Экспонента линейного оператора (без обоснования сходимости) Глава 3. Геометрия евклидовых и эрмитовых пространств 3.1. Аффинные пространства, системы координат, подпространства 3.2. Евклидовы и эрмитовы пространства, примеры. Неравенство Коши Буняковского, неравенство треугольника
1


2

Оглавление

3.3. Ортогональные системы векторов, ортонормированные базисы. Ортогонализация ГрамаШмидта 3.4. Ортогональные и унитарные матрицы. QR-разложение 3.5. Ортогональное дополнение. Проекция и ортогональная составляющая. Угол между вектором и подпространством 3.6. Аффинные евклидовы пространства. Расстояние от точки до подпространства. Расстояние между подпространствами 3.7. Определитель матрицы Грама и многомерный объ?м 3.8. Метод наименьших квадратов 3.9. Изоморфизмы евклидовых и эрмитовых пространств. Канонический изоморфизм евклидова пространства и его сопряж?нного Глава 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 4. Операторы в евклидовых и эрмитовых пространствах Сопряж?нные операторы в евклидовых и эрмитовых пространствах Самосопряж?нные операторы. Канонический вид Самосопряж?нные проекторы. Спектральное разложение самосопряж?нного оператора Кососимметрические и косоэрмитовы операторы. Канонический вид. Эрмитово разложение Ортогональные и унитарные операторы. Канонический вид. Группы On и SOn , Un и SUn Положительные самосопряж?нные операторы. Полярное разложение Нормальные операторы

49 50 52 53 55 57 58 61 61 62 64 65 66 70 71

Глава 5. Билинейные и полуторалинейные функции 73 5.1. Билинейные и полуторалинейные функции, их матрицы. Закон изменения матрицы при замене базиса. Канонический изоморфизм пространства билинейных функций и пространства Hom(V , V ) 73 5.2. Симметрические, кососимметрические и эрмитовы функции. Квадратичные формы. Нормальный вид 75 5.3. Нормальный вид кососимметрических и эрмитовых функций 79 5.4. Закон инерции. Единственность нормального вида 81 5.5. Теорема Якоби. Критерий Сильвестра 82 5.6. Симметрические билинейные функции в евклидовых пространствах. Канонический вид 84 5.7. Приведение пары форм к диагональному виду. Собственные значения и собственные векторы пары форм 85 Глава 6.1. 6.2. 6.3. 6.4. 6.5. 6. Тензоры Полилинейные функции Тензоры: координатное определение Тензорное произведение, св?ртка, опускание и поднятие индексов Базис в пространстве тензоров Симметрические и кососимметрические тензоры, симметризация и альтернирование 6.6. Внешнее произведение кососимметрических тензоров, внешние формы 87 87 88 89 91 92 93


Предисловие
Курс лекций подготовлен Пановым Тарасом Евгеньевичем, профессором кафедры высшей геометрии и топологии механико-математического факультета МГУ, в 2012 году. В дальнейшем в него вносились различные изменения и дополнения. В лекциях встречаются четыре типа утверждений: ?теоремы?, ?леммы?, ?предложения? и ?следствия?. Теоремы это наиболее важные утверждения, основные ?кирпичики? курса. Леммы это более технические утверждения, которые как правило являются промежуточными шагами в доказательствах теорем. Предложения это как правило простые утверждения, которые тем не менее представляют самостоятельный интерес. Следствия утверждения, которые непосредственно вытекают из предыдущих; они формулируются отдельно для последующих ссылок на них. Бесконечномерные линейные пространства рассматриваются лишь в главе 1. Начиная с главы 2 все пространства предполагаются конечномерными. Изучение бесконечномерных пространств будет продолжено в курсе функционального анализа. При подготовке данного курса лекций использовались классические учебники Гельфанда [Ге], КострикинаМанина [КМ] и Постникова [По], а также предыдущие курсы лекций кафедры высшей геометрии и топологии (в частности, курсы профессоров И. А. Дынникова и В. М. Мануйлова, которые также доступны на сайте кафедры). Данные лекции (а также программа экзамена и список теоретических задач) доступны на странице Т. Е. Панова на сайте кафедры высшей геометрии и топологии:

http://higeom.math.msu.su/people/taras/

Литература
[Ге] И. М. Гельфанд. Лекции по линейной алгебре. Москва, ?Наука?, 1974. [КМ] А. И. Кострикин, Ю. И. Манин. Линейная алгебра и геометрия. Москва, ?Наука?, 1986. [Ма] В. М. Мануйлов. Курс лекций по линейной алгебре и геометрии.

http://mech.math.msu.su/~manuilov/linalg.html [По] М. М. Постников. Лекциии по геометрии. Семестр II. Линейная алгебра. Москва, ?Наука?, 1986.

3



Глава 1

Линейные пространства
1.1. Линейные пространства и подпространства. Примеры
k называется множество V c заданными на н?м операциями сложения ?+? двух элементов множества V , + : V Ч V V, ћ : k Ч V V, (K , L ) K + L (, L ) ћ L ,
и умножения ?ћ? элементов V на элементы поля k, которые удовлетворяют следующим условиям: 1) K + L = L + K для любых K , L V ; 2) (K + L ) + M = K + (L + M ) для любых K , L , M V ; 3) существует такой элемент 0 V , что L + 0 = L для любого L V ; 4) для любого L V существует такой элемент -L V , что L + (-L ) = 0; 5) ћ (K + L ) = ћ K + ћ L для любых K , L V и k; 6) ( + ч) ћ L = ћ L + ч ћ L для любых L V и , ч k; 7) ћ (ч ћ L ) = (ч) ћ L для любых L V и , ч k; 8) 1 ћ L = L для любого L V . Элементы линейного пространства называются векторами. Свойства 1)4) означают, что V является абелевой (коммутативной) группой относительно операции сложения. Элемент 0 называется нулевым вектором, а элемент (-L ) называется противоположным вектором к L . Элементы поля k иногда называют скалярами. Свойства 5)8) означают, что поле k линейно действует на V . Обычно мы будем опускать знак умножения ћ. За исключением некоторых примеров, в качестве поля k у нас будет выступать поле вещественных чисел R или поле комплексных чисел C. Далее говоря о пространстве мы будем иметь ввиду линейное пространство. Вот некоторые простые свойства линейных пространств.
Предложение 1.1.2. Определение 1.1.1. Линейным (или векторным ) пространством над полем

а) 0L = 0 = 0 для любых L V , k; б) (-1)L = -L для любого L V ; в) если L = 0, то либо = 0, либо L = 0.

0L = 0 по свойству сокращения в абелевой группе. Аналогично, 0 + 0 = (0 + 0) = 0, т.е. 0 = 0. Докажем б). Действительно, L + (-1)L = 1L + (-1)L = (1 + (-1))L = 0L = 0, т.е. вектор (-1)L противоположен к L .
5

Доказательство. Докажем а). Действительно, 0L + 0

L = (0 + 0)L = 0L , откуда


6

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

Наконец, докажем в). Если = 0, то 0 = -1 (L ) = (-1 )L = 1L = L . 1. Множество {0}, состоящее из одного элемента 0, является линейным пространством над любым полем. 2. Множества векторов на прямой, на плоскости, в пространстве, являются линейными пространствами над полем R. 3. Поле k является векторным пространством над самим собой. 4. Поле C является линейным пространством над полем R, а поле R является линейным пространством над полем рациональных чисел Q. Более общо, если k1 подполе в k2 (т.е. k2 является расширением поля k1 ), то k2 является линейным пространством над k1 . 5. Пусть { } kn := (x1 , . . . , xn ) : xi k множество последовательностей (строк ) фиксированной длины n из элементов поля k. Операции покомпонентного сложения и умножения на скаляры, т.е.
Пример 1.1.3.

(x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) := (x1 + y1 , x2 + y2 , . . . , xn + yn ), ћ (x1 , x2 , . . . , xn ) := (x1 , x2 , . . . , xn ),
задают на kn структуру линейного пространства над k. Оно называется n-мерным координатным (или арифметическим ) пространством над k. Мы в основном будем иметь дело с пространствами Rn и Cn . При n = 1 мы получаем пространство из примера 3. 6. Множество функций на произвольном множестве X со значениями в поле k, обозначаемое kX , является линейным пространством относительно операций поточечного сложения (т.е. значение функции f + g в точке x X полагается равным f (x) + g (x)) и поточечного умножения на скаляры (т.е. ( ћ f )(x) = f (x)). В случае, когда X конечное множество из n элементов, мы получаем пространство kn из предыдущего примера. 7. Множество C (R) непрерывных функций на вещественной прямой и множество C [a, b] непрерывных функций на отрезке являются линейными пространствами над R. Также линейными пространствами являются множества дифференцируемых функций (на прямой или на отрезке). 8. Множество решений однородной системы линейных уравнений является линейным пространством. 9. Рассмотрим множество R , состоящее из бесконечных последовательностей вещественных чисел, в которых лишь конечное число членов отлично от нуля (такие последовательности называются финитными ). Тогда R линейное пространство относительно операций поэлементного сложения и умножения на числа. Простран ство R можно отождествить с бесконечным объединением n 0 Rn . Пространство R всех бесконечных последовательностей также является линейным пространством. 10. Множество k[x] многочленов от одной переменной с коэффициентами в k является линейным пространством. Также линейным пространством является множество kn [x] многочленов степени не выше n.


1.2. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ. БАЗИС. РАЗМЕРНОСТЬ

7

11. Множество всех матриц размера m Ч n с элементами из k образует линейное пространство Matk (m, n) относительно операций сложения матриц и поэлементного умножения матриц на числа. При m = 1 мы получаем пространство строк kn . В предыдущих примерах мы столкнулись с ситуацией, когда подмножество линейного пространства само является линейным пространством. Это приводит к следующему определению.
Определение 1.1.4. Подмножество W V линейного пространства V называется подпространством, если для любых векторов K , L W и скаляра k мы имеем K +L W и K W . Другими словами, W подпространство, если W само является линейным пространством относительно операций, заданных в пространстве V . Пример 1.1.5. Вот некоторые примеры подпространств.

1. {0} является подпространством в любом пространстве V . 2. Множество векторов, коллинеарных заданному вектору, является подпространством в пространстве всех векторов на плоскости или в пространстве. 3. Пространство C (R) непрерывных функций является подпространством в пространстве RR всех функций на R. 4. Пространство R финитных последовательностей является подпространством в пространстве R всех последовательностей. 5. kn [x] является подпространством в km [x] при m n, а также в k[x].

1.2. Линейная зависимость. Базис. Размерность
Пусть V линейное пространство над полем k. странства V называется сумма вида 1 L 1 + . . . + k L k , где i k. Линейной комбинацией бесконечной системы векторов {L i : i I } называется сумма вида iI i L i , в которой лишь конечное число скаляров i отлично от нуля. Линейная комбинация iI i L i называется тривиальной, если в ней все коэффициенты i равны нулю. Линейной оболочкой системы векторов {L i : i I } называется множество всех линейных комбинаций этой системы. Для линейной оболочки используется обозначение L i : i I или L 1 , . . . , L k в случае конечной системы. Система векторов {L i : i I } (конечная или бесконечная) называется линейно зависимой, если существуют числа i , не все равные нулю, такие, что iI i L i = 0 (т.е. существует нетривиальная линейная комбинация векторов системы, равная нулю). В противном случае система называется линейно независимой.
Определение 1.2.1. Линейной комбинацией системы векторов

L 1 , . . . , L k про-

пространством в V . Более того, Li : i I является наименьшим по включению линейным подпространством, содержащим все векторы системы {Li : i I }.
стемы на скаляр являются линейными комбинациями и потому принадлежат линейной оболочке. Следовательно, L i : i I подпространство. Если W произвольное подпространство, содержащее все векторы из {L i : i I }, то W также содержит все их линейные комбинации, а значит W содержит L i : i I .
Доказательство. Сумма векторов системы и результат умножения вектора си-

Предложение 1.2.2. Линейная оболочка

Li : i I является линейным под-


8

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

Лемма 1.2.3. Если система векторов {Li : i I } линейно зависима, то один из векторов системы является линейной комбинацией остальных. Доказательство. Пусть
1

L 1 + . . . + k L k = 0, причем существует i = 0. Тогда
i-1

i L i = -1 L 1 - . . . -

L

i-1

-

i+1

L

i+1

- . . . - k L k .

Умножив обе части этого равенства на -1 , получим, что L i является линейной комi бинацией векторов L 1 , . . . , L i-1 , L i+1 , . . . , L k .
Определение 1.2.4. Линейно независимая система векторов {L i : i I } называется базисом пространства V , если каждый вектор L V представляется в виде линейной комбинации iI i L i . Другими словами, базисом называется максимальная (по включению) линейно независимая система векторов в пространстве V . Пространство V называется конечномерным, если в н?м существует базис, состоящий из конечного числа векторов. В противном случае пространство называется бесконечномерным.

i L i = iI чi L i , то получаем 0 = iI (i - чi )L i . Так как система {L i : i I } линейно независима, из последнего равенства вытекает, что i = чi , т.е. два представления L в виде линейных комбинаций совпадают.
Доказательство. Действительно, если

Li : i I } базис пространства V , то представ ление любого вектора L V в виде линейной комбинации iI i Li единственно.
Предложение 1.2.5. Если {

L=



iI

Теорема 1.2.6. В конечномерном пространстве все базисы состоят из одного числа элементов.

Доказательство этой теоремы будет опираться на следующую лемму.
Лемма 1.2.7. Пусть A1 , . . . , Am и B1 , . . . , Bn две (конечных) линейно независимых системы векторов, прич?м вторая система содержится в линейной оболочке первой системы. Тогда n m.

как B 1 , . . . , B (1.1)

Доказательство. Пусть
n

линейно независимая система, мы имеем

B j = a1j A 1 + . . . + amj A m , aij k, j = 1, . . . , n. Так
x1 = . . . = xn = 0.

x1 B 1 + . . . + xn B n = 0 0 = x1 (a11 A 1 + . . . + a

Подставляя в линейную комбинацию (1.1) выражения B i через A 1 , . . . , A m , получаем:

A ) + . . . + xn (a1n A 1 + . . . + amn A m ) = = (a11 x1 + . . . + a1n xn )A 1 + . . . + (am1 x1 + . . . + amn xn )A m .
m1 m

Так как A 1 , . . . , A m линейно независимая система, предыдущее равенство равносильно системе уравнений: a11 x1 + . . . + a1n xn = 0 ... am1 x1 + . . . + amn xn = 0 Если n > m, то эта система имеет ненулевое решение, что противоречит (1.1).


1.2. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ. БАЗИС. РАЗМЕРНОСТЬ

9

Доказательство теоремы 1.2.6. Пусть V конечномерное пространство. По определению, в V существует конечный базис A 1 , . . . , A m . Пусть {B i : i I } другой базис. Если это базис бесконечен, то в н?м содержится конечная линейно независимая система B 1 , . . . , B n , где n > m. При этом, так как A 1 , . . . , A m базис, мы имеем {B 1 , . . . , B n } A 1 , . . . , A m , что противоречит лемме 1.2.7. Следовательно базис {B i : i I } конечен, т.е. имеет вид B 1 , . . . , B n . Тогда {B 1 , . . . , B n } A 1 , . . . , A m и {A 1 , . . . , A m } B 1 , . . . , B n , и из леммы 1.2.7 вытекает, что m = n. Определение 1.2.8. Размерностью конечномерного линейного пространства V (обозначение: dim V ) называется число элементов в любом базисе V . Если же V бесконечномерно, то мы пишем dim V = . Размерность линейной оболочки системы векторов {A i : i I } называется рангом системы векторов.

. Мы имеем dim{0} = 0, так как пустое множество состоит из 0 элементов.

Замечание. В пространстве {0} базисом естественно считать пустое множество

Предложение 1.2.9. Подпространство W конечномерного пространства V конечномерно, прич?м dim W dim V , и равенство достигается только при W = V . Доказательство. Пусть dim V = m и A 1 , . . . , A m базис пространства V . Если dim W > m, то в W найд?тся линейно независимая система B 1 , . . . , B n с n > m. Тогда {B 1 , . . . , B n } A 1 , . . . , A m = V , что противоречит лемме 1.2.7. Следовательно, dim W dim V . Пусть dim W = dim V = m и пусть B 1 , . . . , B m базис в W . Тогда каждый вектор A i линейно выражается через B 1 , . . . , B m , так как иначе мы бы получили линейно независимую систему B 1 , . . . , B m , A i из m + 1 векторов в V , что противоречит теореме 1.2.6. Следовательно, любой вектор из V лежит в B 1 , . . . , B m = W , т.е. V = W .

ства V можно дополнить до базиса всего пространства V .

Теорема 1.2.10. Любой базис подпространства W конечномерного простран-

Доказательство. Согласно предложению 1.2.9, пространство W конечномерно; пусть A 1 , . . . , A r его базис. Если W = V , то A 1 , . . . , A r базис в V и доказывать нечего. В противном случае в V найд?тся вектор A r+1 A 1 , . . . , A r = W . Рассмотрим / подпространство W1 = A 1 , . . . , A r , A r+1 V . Если W1 = V , то вс? доказано. В противном случае аналогично строим подпространство W2 = A 1 , . . . , A r , A r+1 , A r+2 V , и так далее. Пусть k = dim V - dim W . Тогда на k -м шаге мы получим подпространство Wk V с dim Wk = dim V . Согласно предложению 1.2.9, Wk = V , а значит мы дополнили базис A 1 , . . . , A r в W до базиса в V векторами A r+1 , . . . , A r+k . Замечание. На самом деле предыдущая теорема имеет место и в бесконечномерном случае. В частности, в любом пространстве (даже бесконечномерном) существует базис. Доказательство этого факта, хотя и не сложно, использует абстрактные теоретико-множественные построения (лемму Цорна ), которые выходят за рамки данного курса. Подробности можно найти в [KM, 1.2].

1. В арифметическом пространстве kn имеется стандартный базис A 1 , . . . , A n , где A i = (0, . . . , 1, . . . , 0) строка, в которой на i-м месте стоит 1, а на остальных местах нули. Таким образом, dim kn = n.

Пример 1.2.11.


10

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

2. В пространстве kn [x] многочленов степени n имеется базис из одночленов 1, x, x2 , . . . , xn . Таким образом, dim kn [x] = n + 1. В пространстве k[x] всех многочленов имеется бесконечный базис из одночленов 1, x, x2 , x3 , . . . всех степеней. Таким образом, dim k[x] = . 3. В пространстве финитных последовательностей R имеется бесконечный базис A 1 , A 2 , . . ., где A i = (0, . . . , 0, 1, 0, . . .) последовательность, в которой на i-м месте стоит 1, а на остальных местах нули. Заметим, что эта же система A 1 , A 2 , . . . не является базисом в пространстве R всех последовательностей. Действительно, например, последовательность, состоящая из одних единиц не представляется в виде (конечной) линейной комбинации последовательностей A 1 , A 2 , . . ..

Далее все пространства мы будем предполагать конечномерными, если явно не указано противное. Бесконечномерным пространствам будет посвящ?н

отдельный курс функционального анализа. В этом курсе линейной алгебры мы лишь иногда будем встречаться с ними в примерах.

1.3. Пересечение и сумма подпространств, их размерности
Предложение 1.3.1. Пересечение V1 V2 подпространств пространства V также является подпространством.

K , L V1 V2 и k сумма K + L и произведение L также лежат и в V1 , и в V2 , а значит и в пересечении V1 V2 .
Доказательство. Для любых

В отличие от пересечения, объединение подпространств V1 V2 в общем случае не будет линейным подпространством.
Определение 1.3.2. Суммой V1 + V2 подпространств V1 и V2 пространства V называется множество всех векторов L V , которые можно представить в виде суммы L = L 1 + L 2 , где L 1 V1 и L 2 V2 . Предложение 1.3.3. Сумма подпространств является линейной оболочкой их объединения: V1 + V2 = V1 V2 . Таким образом, V1 + V2 является линейным подпространством.

Докажем обратное включение V1 V2 V1 + V2 . Рассмотрим линейную комбинацию L = 1 K 1 + . . . + n K n векторов K 1 , . . . , K n V1 V2 . Можно считать, что K 1 , . . . , K k лежат в V1 , а K k+1 , . . . , K n лежат в V2 . Тогда мы имеем L = L 1 + L 2 , где L 1 = 1 K 1 + . . . + k K k V1 и L 2 = k+1 K k+1 + . . . + n K n V2 . Следовательно, L V1 + V2 .

L 1 + L 2 является линейной комбинацией векторов L 1 , L 2 V1 V2 .

Доказательство. Включение V1 + V2 V1 V2 следует из того, что вектор

имеет место равенство

Теорема 1.3.4. Для любых подпространств V1 и V2 линейного пространства V

dim V1 + dim V2 = dim(V1 + V2 ) + dim(V1 V2 ).
Доказательство. Выберем базис A 1 , . . . , A k пространства V1 V2 . Воспользовавшись теоремой 1.2.10, дополним его до базиса A 1 , . . . , A k , B 1 , . . . , B l пространства V1 и до базиса A 1 , . . . , A k , C 1 , . . . , C m пространства V2 . Тогда мы имеем

(1.2)

dim(V1 V2 ) = k ,

dim V1 = k + l,

dim V2 = k + m.


1.4. ПРЯМАЯ СУММА ПОДПРОСТРАНСТВ

11

Докажем, что A 1 , . . . , A k , B 1 , . . . , B l , C 1 , . . . , C m базис пространства V1 + V2 . Прежде всего заметим, что так как V1 + V2 = V1 V2 , любой вектор из V1 + V2 линейно выражается через эту систему векторов. Оста?тся проверить, что эта система линейно независима. Пусть имеет место равенство (1.3)

1 A 1 + . . . + k A k + ч1 B 1 + . . . + чl B l + 1 C 1 + . . . + m C

m

= 0.

Перепишем его в виде

1 A 1 + . . . + k A k + ч1 B 1 + . . . + чl B l = -1 C 1 - . . . - m C m .
Вектор, стоящий в обеих частях этого равенства, лежит как в V1 , так и в V2 . Следовательно, он лежит в V1 V2 и линейно выражается через A 1 , . . . , A k . Так как векторы A 1 , . . . , A k , B 1 , . . . , B l линейно независимы по построению, мы получаем, что ч1 = . . . = чl = 0. Аналогичным образом доказывается, что 1 = . . . = m = 0. Тогда из линейной независимости A 1 , . . . , A k и (1.3) следует, что 1 = . . . = k = 0. Итак, система A 1 , . . . , A k , B 1 , . . . , B l , C 1 , . . . , C m порождает пространство V1 + V2 и линейно независима. Следовательно, это базис в V1 + V2 и dim(V1 + V2 ) = k + l + m. Отсюда и из (1.2) вытекает требуемое равенство.

1.4. Прямая сумма подпространств. Внешняя прямая сумма
Определение 1.4.1. Сумма V1 + V2 подпространств пространства V называется прямой (обозначение: V1 V2 ), если для любого вектора L V1 + V2 представление L = L 1 + L 2 , где L 1 V1 и L 2 V2 , единственно. Теорема 1.4.2. Следующие условия эквивалентны для подпространств V1 , V2 :

а) б) в) г)

сумма V1 + V2 прямая; V1 V2 = {0}. если 0 = L1 + L2 , где L1 V1 и L2 V2 , то L1 = L2 = 0; dim V1 + dim V2 = dim(V1 + V2 );

V1 и V2 не единственно, т.е. сумма V1 + V2 не прямая. б) в). Если существует представление 0 = L 1 + L 2 , где L 1 V1 , L 2 V2 и L 1 = 0, то L 1 V1 и L 1 = -L 2 V2 , т.е. L 1 V1 V2 и V1 V2 = {0}. Противоречие. в) а). Пусть у вектора L V есть два разложения: L = K 1 + K 2 = L 1 + L 2 , где K 1 , L 1 V1 и K 2 , L 2 V2 . Тогда 0 = (K 1 - L 1 ) + (K 2 - L 2 ), где K 1 - L 1 V1 и K 2 - L 2 V2 . Следовательно, K 1 - L 1 = K 2 - L 2 = 0, т.е. два разложения вектора L совпадают. б) г). Эта эквивалентность вытекает из теоремы 1.3.4, так как лишь тривиальное пространство может иметь нулевую размерность.
Понятие прямой суммы обобщается на любое конечное число подпространств:
Определение 1.4.3. Сумма V1 + . . . + Vn подпространств пространства V называется прямой, если для любого вектора L V1 + . . . + Vn представление L = L 1 + . . . + L n , где L i Vi , единственно. Теорема 1.4.4. Для подпространств V1 , . . . , V условия эквивалентны:
n

а) б). Пусть существует L V1 V2 , L = 0. Тогда 0 = 0 + 0 = L + (-L ), где L V1 и L V2 . Получаем, что представление вектора 0 в виде суммы векторов из

Доказательство. Мы докажем импликации а) б) в) а) и б) г).

пространства V следующие


12

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

а) б) в) г) д)

сумма Vi (V Vi (V если 0 dim V1

V1 + . . . + Vn прямая; 1 + . . . + Vi-1 + Vi+1 + . . . + Vn ) = {0} для любого i = 1, . . . , n; i+1 + . . . + Vn ) = {0} для любого i = 1, . . . , n - 1; = L1 + . . . + Ln , где Li Vi , то L1 = . . . = Ln = 0; + . . . + dim Vn = dim(V1 + . . . + Vn ).

Доказательство теоремы проводится по индукции по n; мы его опускаем.

3 условие б) в предыдущей теореме более сильное, чем условие Vi Vj = {0} при 1 i (можно также взять любые три различные прямые, пересекающиеся в нуле). Тогда Vi Vj = {0} при i = j , но сумма V1 + V2 + V3 не прямая, так как, например, вектор A 1 + A 2 допускает два различных представления в виде суммы L 1 + L 2 + L 3 с L i Vi , а именно A 1 + A 2 = A 1 + A 2 + 0 = 0 + 0 + (A 1 + A 2 ). Заметим также, что dim Vi = 1, а dim(V1 + V2 + V3 ) = dim R2 = 2. лем k. Их внешней прямой суммой, обозначаемой через V1 . . . Vn , называется линейное пространство, состоящее из всех упорядоченных наборов (L 1 , . . . , L n ), где L i Vi с операциями, определ?нными покомпонентно:
Определение 1.4.6. Пусть V1 , . . . , Vn линейные пространства над одним по-

Пример 1.4.5. При n

(K 1 , . . . , K n ) + (L 1 , . . . , L n ) := (K 1 + L 1 , . . . , K n + L n ), ћ (L 1 , . . . , L n ) := (L 1 , . . . , L n ).

1.5. Факторпространство. Размерность факторпространства
Пусть V линейное пространство, а W V подпространство.

L V по подпространству W называется множество L + W , состоящее из всех векторов вида L + M , где M W .
Определение 1.5.1. Классом смежности вектора Лемма 1.5.2. Равенство L1 + W = L2 + W имеет место тогда и только тогда, когда L1 - L2 W . Доказательство. Пусть L 1 + W = L 2 + W . Тогда L 1 L 1 + W = L 2 + W , а значит найд?тся такой вектор M W , что L 1 = L 2 + M . Следовательно, L 1 - L 2 = M W . Обратно, пусть L := L 1 - L 2 W . Докажем, что L 1 + W L 2 + W . Возьм?м произвольный вектор K L 1 + W . Тогда K = L 1 + M для некоторого M W . Мы имеем K = L 1 + M = L 2 + (L + M ), где L + M W . Следовательно, K L 2 + W и L 1 + W L 2 + W . Противоположное включение L 2 + W L 1 + W доказывается аналогично. Итак, L 1 + W = L 2 + W . Определение 1.5.3. Факторпространством V /W линейного пространства V по подпространству W называется множество {L + W : L V } всех классов смежности по подпространству W с операциями сложения и умножения на скаляры:

(K + W ) + (L + W ) := (K + L ) + W, ћ (L + W ) := L + W.


1.5. ФАКТОРПРОСТРАНСТВО

13

Предложение 1.5.4. Привед?нные выше операции определены на классах смежности корректно и задают на V /W структуру линейного пространства. Доказательство. Вначале проверим корректность определения операций, т.е. независимость результата операции от выбора вектора L в смежном классе L + W . Докажем корректность для сложения. Если K 1 + W = K 2 + W и L 1 + W = L 2 + W , то K := K 1 - K 2 W и L := L 1 - L 2 W в силу леммы 1.5.2. Следовательно,

( K 1 + W ) + ( L 1 + W ) = (K 1 + L 1 ) + W = ( K 2 + L 2 ) + ( K + L ) + W = = (K 2 + L 2 ) + W = (K 2 + W ) + (L 2 + W ),
т.е. сложение определено корректно. Корректность определения умножения на скаляры проверяется аналогично. Теперь докажем, что V /W линейное пространство. Свойства 1) и 2) из определения 1.1.1 (ассоциативность и коммутативность сложения для смежных классов) вытекают из соответствующих свойств сложения в V . Нулевым элементом в V /W является смежный класс 0 + W = W , а противоположным элементом для L + W является (-L ) + W . Проверим свойство 5): ( ) ( ) (K + W ) + (L + W ) = (K + L ) + W = (K + L ) + W = (K + L ) + W =

= (K + W ) + (L + W ) = (K + W ) + (L + W ).
Оставшиеся свойства 6)8) проверяются аналогично.
Теорема 1.5.5. Пусть W подпространство линейного пространства V . Тогда

dim V /W = dim V - dim W.
Дополним его до базиса A 1 , . . . , A k , A (1.4)
Доказательство. Пусть dim V = n, dim W = k и пусть
k+1

, . . . , A n в V . Докажем, что классы

A 1 , . . . , A k базис в W .

A
(A

k+1

+ W, . . . , A n + W

образуют базис в V /W . Вначале докажем, что классы (1.4) линейно независимы. Пусть



k+1

k+1

+ W ) + . . . + n (A n + W ) = 0 + W.

Тогда (k+1 A k+1 + . . . + n A n ) + W = 0 + W , т.е. L := k+1 A k+1 + . . . + n A n W в силу леммы 1.5.2. Так как A 1 , . . . , A k базис в W , мы можем записать L = 1 A 1 + . . . + k A k . Тогда получаем

1 A 1 + . . . + k A k -

k+1 k+1

A

- . . . - n A n = 0 .

Так как A 1 , . . . , A k , A k+1 , . . . , A n базис в V , отсюда вытекает, что k+1 = . . . = n = 0, т.е. классы (1.4) линейно независимы. Осталось доказать, что классы (1.4) порождают вс? пространство V /W . Возьм?м произвольный вектор L + W V /W . Разложим вектор L по базису в V :

L = 1 A 1 + . . . + k A k +
Тогда

k+1 k+1

A

+ . . . + n A n .

L + W = (
= (

k+1 k+1 k+1 k+1

A A

+ . . . + n A n ) + (1 A 1 + . . . + k A k ) + W = + . . . + n A n ) + W =
k+1

(A

k+1

+ W ) + . . . + n (A n + W ).

Итак, (1.4) базис в V /W , а значит dim V /W = n - k .


14

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

1.6. Координаты вектора. Закон изменения координат при замене базиса
Определение 1.6.1. Пусть V линейное пространство и A 1 , . . . , A n базис в V . Любой вектор N V единственным образом представляется в виде линейной комбинации базисных векторов: N = x1 A 1 + . . . + xn A n . Числа x1 , . . . , xn k называются координатами вектора N в базисе A 1 , . . . , A n .

Далее мы привед?м ряд соглашений об обозначениях, которые существенно упростят выкладки, связанные с координатами.
Соглашение (обозначения Эйнштейна для координат). Мы, как правило, будем писать индексы у координат сверху, а не снизу, т.е. x1 , . . . , xn вместо x1 , . . . , xn . Вместо длинной записи разложения вектора по базису N = A 1 + . . . + xn A n мы будем x1 n i использовать запись N = xi A i , подразумевая сумму i=1 x A i (т.е. суммирование всегда будет подразумеваться по повторяющимся верхним и нижним индексам). При работе с матрицами координаты вектора N в базисе A 1 , . . . , A n мы будем записывать в виде столбца высоты n, обозначая его простой (нежирной) буквой x, 1 1 x x . . Часто для экономии места вместо . будем писать (x1 . . . xn )t . . т.е. x = . . . n x xn

Пусть в пространстве V заданы два базиса: ?старый? A 1 , . . . , A n и ?новый? A 1 , . . . , A n . Нам будет удобно обозначать векторы нового базиса через A 1 , . . . , A n . Запишем формулы, выражающие векторы нового базиса через старый базис:

A 1 = c1 A 1 + . . . + cn A n , 1 1
ћћћ
или, используя обозначения Эйнштейна,

ћћћ

A n = c1 A 1 + . . . + cn A n , n n A i = ci A i , i = 1, . . . n. i
Эти формулы равносильны одному матричному равенству 1 c1 ћ ћ ћ c1 n . . (A 1 . . . A n ) = (A 1 . . . A n ) . . . . . . . . n n c1 ћ ћ ћ cn
Определение 1.6.2. Матрица

1 c1 ћ ћ ћ c i . C = (ci ) = . . . . . cn ћ ћ ћ c 1

1 n n n

. . .






называется матрицей перехода от базиса A 1 , . . . , A n к базису A 1 , . . . , A n . Е? столбцами являются координаты новых базисных векторов в старом базисе.

координаты вектора N в базисе A1 , . . . , An , а x , . . . , x координаты этого же вектора в базисе
n 1 n


Теорема 1.6.3 (закон изменения координат). Пусть x1 , . . . , x


1.6. ЗАКОН ИЗМЕНЕНИЯ КООРДИНАТ ПРИ ЗАМЕНЕ БАЗИСА

15

A1 , . . . , An . Тогда два набора координат связаны следующими формулами.
В разв?рнутом координатном виде:

x1 = c1 x1 + . . . + c1 xn , 1 n ћћћћћћ xn = cn x1 + . . . + cn xn . 1 n
В матричном виде:






x1 x1 . = C . . . . . . n x xn xi = ci xi , i


В обозначениях Эйнштейна:

i = 1, . . . , n.

вивалентны, мы докажем их по отдельности, чтобы лучше освоиться с различными обозначениями. Мы имеем

Доказательство. Хотя все три формулы закона преобразования координат эк-

x1 A 1 + . . . + xn A n = N = x1 A 1 + . . . + xn A
1






n

=


= x (c1 A 1 + . . . + cn A n ) + . . . + xn (c1 A 1 + . . . + cn A n ) = 1 1 n n = (c1 x1 + . . . + c1 xn )A 1 + . . . + (cn x1 + . . . + cn xn )A n . 1 n 1 n
Так как A 1 , . . . , A n базис, мы получаем xi = ci x1 + . . . + ci xn 1 n Та же выкладка в матричных обозначениях имеет вид 1 1 x x1 c1 . = N = (A 1 , . . . , A n ) . = (A 1 , . . . , A n ) . . (A 1 , . . . , A n ) . . . . . n n x cn x 1 откуда 1 x x1 . = C . . . . . . n x xn Наконец, используя обозначения Эйнштейна, получаем


для i = 1, . . . , n.

1 ћ ћ ћ c1 x n . . , .. . . . . . ћ ћ ћ cn xn n

xi A i = N = xi A i = xi ci A i , i
откуда xi = xi ci = ci xi . i i Из доказательства видно, что выкладка, использующая обозначения Эйнштейна имеет наиболее простой вид. Далее в аналогичных выкладках мы как правило будем пользоваться обозначениями Эйнштейна. Обратим внимание также, что в определении матрицы перехода мы выражаем новые векторы через старые, а в законе преобразования координат, наоборот, старые координаты выражаются через новые.
Соглашение (обозначения Эйнштейна для матриц). Пусть A = (ai ) матриj






ца размера l Ч m, а B = (bj ) матрица размера m Ч n. Тогда закон умножения k матриц в обозначениях Эйнштейна выглядит следующим образом: для компонент


16

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

l Ч n-матрицы C = (ci ), получаемой как произведение матриц A и B , имеет место k соотношение ci = ai bj (по повторяющемуся индексу j производится суммирование). jk k Компоненты единичной (квадратной) матрицы E задаются символом Кронекера : i E = (j ), где { 1, при i = j, i j = 0, при i = j.
Матрица D = (dj ) является обратной к матрице C = (ci ), т.е. D = C j k ij i нено соотношение cj dk = k .
Предложение 1.6.4.


-1

, если выпол-

а) Матрица CA A = (ci ) перехода от базиса A1 , . . . , An к базису A1 , . . . , An являi ется обратной к матрице CAA = (ci ) перехода от A1 , . . . , An к A1 , . . . , An , i т.е. CAA CA A = E . В частности, матрица перехода всегда невырождена (обратима). б) Если A1 , . . . , An , A1 , . . . , An , A1 , . . . , An три базиса, то для соответствующих матриц перехода имеет место соотношение

CAA = CAA CA A .

A

= A i . Докажем второе утверждение. Пусть CA A CA A = (ci ). Тогда i
i

Доказательство. Первое утверждение следует из второго, если положить


= (ci ), CA A i



= (ci ), i



ci A i = A i


i



= ci A i = ci ci A i = ci ci A i , i ii ii








откуда ci = ci ci , т.е. CA A = CA A CA i ii



A .

1.7. Линейные отображения и изоморфизмы. Ядро и образ
Определение 1.7.1. Пусть V и W линейные пространства над полем k. Отображение A : V W называется линейным, если для любых векторов K , L V и скаляра k выполнены равенства

A(K + L ) = AK + AL ,

A(L ) = AL .

Биективное (т.е. взаимно однозначное) линейное отображение A : V W называется изоморфизмом. Пространства V и W называются изоморфными, если между ними существует изоморфизм. Вот два важнейших примера линейных отображений. 1. Линейное отображение f : V k пространства V над полем k в поле k (рассматриваемое как 1-мерное линейное пространство) называется линейной функцией или линейным функционалом. Линейные функции мы вскоре отдельно рассмотрим более подробно. 2. Линейное отображение A : V V пространства V в себя называется линейным оператором. Линейные операторы будут подробно изучены во второй главе.
Пример 1.7.2.

ко тогда, когда они имеют одинаковые размерности.

Теорема 1.7.3. Два пространства V и W над полем k изоморфны тогда и толь-


1.7. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ И ИЗОМОРФИЗМЫ

17

Доказательство. Из определения изоморфизма вытекает, что свойства системы векторов быть линейной независимой и порождать вс? пространство сохраняются при изоморфизмах, т.е. при изоморфизме базис переходит в базис. Следовательно, если A : V W изоморфизм, то dim V = dim W . Пусть теперь dim V = dim W = n. Выберем базисы A 1 , . . . , A n и B 1 , . . . , B n в V и W соответственно. Тогда формула

A(xi A i ) = xi B

i

(где по i подразумевается суммирование) определяет линейное отображение A : V W . Оно является биекцией, так как формула A-1 (xi B i ) = xi A i определяет обратное отображение. Итак, A изоморфизм. В качестве стандартного примера n-мерного пространства над R мы будем рассматривать координатное пространство Rn ; в силу предыдущей теоремы оно изоморфно любому другому n-мерному вещественному пространству. торов L V , для которых AL = 0, называется ядром отображения A и обозначается Ker A. Образ линейного отображения A : V W , обозначаемый Im A, определяется так же, как и для любого отображения: Im A = {AL : L V }.
Определение 1.7.4. Пусть A : V W линейное отображение. Множество век-

является подпространством в V , а Im A является подпространством в W .
Доказательство. Пусть

Предложение 1.7.5. Пусть A : V W линейное отображение. Тогда Ker A

K , L Ker A, т.е. AK = AL = 0. Тогда A(K + L ) = AK + AL = 0 + 0 = 0 и A(L ) = AL = 0. Следовательно, K + L Ker A и L Ker A, а значит Ker A подпространство в V . Пусть теперь N , O Im A, т.е. существуют K , L V , такие, что AK = N и AL = O . Тогда A(K + L ) = N + O и A(K ) = N . Следовательно, N + O Im A и N Im A, а
значит Im A подпространство в W .
Теорема 1.7.6. Пусть A : V W линейное отображение. Тогда соответствие L + Ker A AL зада?т изоморфизм между факторпространством V / Ker A и подпространством Im A.

теоремы из курса алгебры о том, что ?гомоморфный образ группы изоморфен факторгруппе по ядру гомоморфизма?. Сначала проверим, что L + Ker A AL действительно корректно определяет отображение A : V / Ker A Im A. Для этого нужно проверить, что если K + Ker A = L + Ker A, то AK = AL . В силу леммы 1.5.2, из равенства классов смежности K + Ker A = L + Ker A вытекает, что K - L Ker A, т.е. AK = AL + A(K - L ) = AL . Итак, отображение A : V / Ker A Im A определено корректно. Линейность и сюръективность отображения A очевидны. Проверим, что оно также инъективно. Пусть A(K + Ker A) = A(L + Ker A). Это означает, что AK = AL , т.е. K - L Ker A. Тогда из леммы 1.5.2 следует, что K + Ker A = L + Ker A, т.е. A инъективно. Так как линейное отображение A : V / Ker A Im A сюръективно и инъективно, оно является изоморфизмом.
Следствие 1.7.7. Для любого линейного отображения A : V W мы имеем

Доказательство. Это доказательство полностью повторяет доказательство

dim V = dim Ker A + dim Im A.


18

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

Доказательство. Из предыдущей теоремы следует, что dim(V / Ker A) = dim Im A, а dim(V / Ker A) = dim V - dim Ker A по теореме 1.5.5 о размерности факторпространства.

1.8. Матрица линейного отображения. Преобразование матрицы линейного отображения при заменах базисов
Пусть A : V W линейное отображение, A 1 , . . . , A базис в W .
m

базис в V , а B 1 , . . . , B n

зисам A1 , . . . , A

Определение 1.8.1. Матрицей отображения A : V W по отношению к баm

и B1 , . . . , Bn называется матрица 1 1 a1 a2 . . . a1 m a2 a2 . . . a2 1 2 m A=. . .. . . . . .. . . an an . . . a n 1 2 m

размера n Ч m, в которой i-й столбец составлен из координат вектора A(A i ) относительно базиса B 1 , . . . , B n : AA i = a j B j . i Зная матрицу линейного отображения A, мы можем найти образ любого вектора N V при отображении A следующим образом.

его образ в W , т.е. O = AN. Тогда

Предложение 1.8.2. Пусть

N = xj Aj произвольный вектор из V , а O = y i Bi
1 1 1 y a1 . . . a1 x m . = . .. . . . . . . .. . . . . n n n y a1 . . . am xm

y i = ai xj j

или

Доказательство. Действительно,

y i B i = O = AN = A(xj A j ) = xj AA j = xj ai B i . j
Так как {B i } базис, отсюда следует, что y i = ai xj . j
Определение 1.8.3. Множество всех линейных отображений A : V W из V в W с операциями сложения и умножения

(A1 + A2 )(L ) := A1 L + A2 L ,

(A)(L ) := (AL )

является линейным пространством. Оно называется пространством линейных отображений из V в W и обозначается Homk (V , W ) или просто Hom(V , W ).

нейных отображений Homk (V , W ) изоморфно пространству матриц Matk (n, m).
Доказательство. Выберем базисы

Предложение 1.8.4. Пусть dim V = m и dim W = n. Тогда пространство ли-

и B 1 , . . . , B n в V и W соответственно. Определим отображение Homk (V , W ) Matk (n, m), которое сопоставляет линейному отображению его матрицу в выбранных базисах. Непосредственно проверяется, что это отображение линейно. Кроме того, оно биективно: обратное отображение сопоставляет n Ч m-матрице A = (ai ) линейное отображение, определяемое j в координатах формулой из предложения 1.8.2. Следовательно, наше отображение Homk (V , W ) Matk (n, m) является изоморфизмом.
m

A 1, . . . , A


1.9. ДВОЙСТВЕННОЕ ПРОСТРАНСТВО V



19

Пусть в пространстве V выбран новый базис A 1 , . . . , A m , а в пространстве W новый базис B 1 , . . . , B n .

A = D-1 AC, где A матрица линейного отображения A : V W по отношению к базисам A1 , . . . , Am и B1 , . . . , Bn ; A матрица отображения A по отношению к базисам A1 , . . . , Am и B1 , . . . , Bn ; C = CAA матрица перехода от базиса A1 , . . . , Am к базису A1 , . . . , Am и D = DBB матрица перехода от B1 , . . . , Bn к B1 , . . . , Bn .
Доказательство. Пусть C = (ci ) и A = (ai ), тогда i
j

сто соотношение

Теорема 1.8.5 (закон изменения матрицы линейного отображения). Имеет ме-

AA i = A(ci A i ) = ci AA i = ci aj B j . i i ii
С другой стороны, если A = (aj ) и D = (dj ), то i j


AA i = aj B i



j



= aj dj B j . ij



Сравнивая последние два соотношения, с уч?том того, что {B j } базис, получаем aj ci = dj aj . Это эквивалентно соотношению AC = DA , т.е. A = D-1 AC . ii ji

1.9. Двойственное пространство V , двойственный базис. Отсутствие изоморфизма V V в бесконечномерном случае (пример) =
Напомним, что линейной функцией называется линейное отображение f : V k. Как и всякое множество линейных отображений между двумя пространствами, множество линейных функций является линейным пространством. зывается двойственным (или сопряж?нным ) пространством к V и обозначается V .
Определение 1.9.1. Пространство Hom(V , k) линейных функций f : V k на-

Пусть A 1 , . . . , A n базис в V . Значение линейной функции V на любом векторе N = xi A i V определяется е? значениями на базисных векторах, так как (N ) = xi (A i ). Определим линейные функции 1 , . . . , n V по правилу
i i (A j ) = j .

Тогда для любого вектора N = xj A j мы имеем
i i (N ) = i (xj A j ) = xj i (A j ) = xj j = xi .

В связи с этим функции i часто называют координатными функциями.
Предложение 1.9.2. Линейные функции 1 , . . . , n образуют базис в V . Доказательство. Линейная независимость. Пусть x1 1 + . . . + xn n = o. Это

равенство означает, что линейная функция := xi i равна нулю на любом вектоi ре из V . Вычислим е? на векторе A j : 0 = (A j ) = xi i (A j ) = xi j = xj . Итак, все коэффициенты xj равны нулю, а значит 1 , . . . , n V линейно независимы. Теперь проверим, что 1 , . . . , n порождают вс? пространство V . Мы утверждаем, что любая линейная функции представляется в виде линейной комбинации = i i , где i = (A i ). Действительно, для любого вектора N = xj A j V мы имеем

i i (N ) = i xi = (A i )xi = (xi A i ) = (N ).


20

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

Следовательно, = i i , т.е. 1 , . . . , n базис в V .

ми (или сопряж?нным ) базисом к A 1 , . . . , A n .
Следствие 1.9.4. dim V = dim V .

Определение 1.9.3. Базис 1 , . . . , n пространства V



называется двойственны-

Пусть теперь A 1 , . . . , A n другой базис пространства V и C = (ci ) матрица i перехода, A i = ci A i . Рассмотрим двойственные базисы 1 , . . . , n и 1 , . . . , n . i
Предложение 1.9.5. Матрица перехода от 1 , . . . , n к 1 , . . . ,


n



есть (C

-1 t

).

ci x = ci (N ). Следовательно, i i
i i

Доказательство. Для любого вектора

N = xi A i = xi A i мы имеем i (N ) = xi =


i = ci i . i Это эквивалентно матричному соотношению 1 1 . =C . . . . . n n или (1 . . . n ) = (1 . . . n )(C -1 )t . Это означает, что (C -1 )t это матрица перехода от 1 , . . . , n к 1 , . . . , n .
Из следствия 1.9.4 также вытекает, что пространства V и V изоморфны. Однако для построения изоморфизма между ними нам необходимо выбрать базис в V (и двойственный базис в V ); изоморфизм между V и V ?неканоничен? в том смысле, что он зависит от выбора базиса. Разные базисы дают разные изоморфизмы. Для бесконечномерных пространств ситуация иная: пространства V и V никогда не изоморфны, пространство V всегда ?больше?. Мы не будем приводить доказательства этого факта (и даже не будем приводить его точной формулировки), а лишь проиллюстрируем его на примере. Это последний раз, когда у нас появляются бесконечномерные пространства; здесь нам также понадобится поле, отличное от R и C. Напомним, что k это пространство финитных последовательностей, т.е. бесконечных последовательностей элементов поля k, в которых лишь конечное число элементов отличны от нуля. Через k мы обозначали пространство всех бесконечных последовательностей.
Предложение 1.9.6. Двойственное пространство к k


изоморфно k .


имеется стандартный базис A 1 , A 2 , . . ., где A i = (0, . . . , 0, 1, 0, . . .) последовательность, в которой на i-м месте стоит 1, а на остальных местах нули. Рассмотрим отображение ( ) A : (k ) k , f f (A 1 ), f (A 2 ), . . . , которое линейной функции f (k ) ставит в соответствие последовательность е? значений на базисных векторах A i . Это отображение очевидно линейно. Кроме того, отображение A биективно: обратное отображение A-1 зада?тся формулой ( ) A-1 (x1 , x2 , . . .) = f (k ) , где f (A i ) = xi .

Доказательство. Мы воспользуемся тем фактом, что в пространстве k


1.10. ВТОРОЕ ДВОЙСТВЕННОЕ ПРОСТРАНСТВО

21

Так как любой элемент O k есть (конечная) линейная комбинация элементов A i , значение линейной функции f на O однозначно восстанавливается по е? значениям f (A i ). Итак, A изоморфизм. Пусть k = Z2 поле из двух элементов.
Предложение 1.9.7. Пространства Z и Z неизоморфны. Таким образом, 2 2 Доказательство. Дело в том, что Z как множество сч?тно, а Z не явля2 2

пространство Z не изоморфно своему двойственному пространству. 2

ется сч?тным, так что между Z и Z нельзя установить биекцию. (Множество X 2 2 называется сч?тным, если имеется биекция между X и множеством натуральных чисел N). Действительно, элементы множества Z соответствуют конечным последователь2 ностям из нулей и единиц. Количество таких последовательностей длины n конечно (равно 2n ), а поэтому Z сч?тно как сч?тное объединение конечных множеств. (Это 2 также можно увидеть, отождествив Z с множеством рациональных чисел на отрез2 ке [0, 1] в двоичной записи). С другой стороны, множество Z всех последовательностей из нулей и единиц 2 не является сч?тным. Действительно, предположим, что нам удалось перенумеровать все такие последовательности: a1 , a2 , . . . ,. Рассмотрим последовательность b, в которой k -й элемент отличается от k -го элемента последовательности ak . Тогда последовательность b не может присутствовать в списке a1 , a2 , . . ., так как она отличается от k -ой последовательности из списка по крайней мере в k -м члене. Полученное противоречие показывает, что Z не является сч?тным. (Множество Z можно также 2 2 отождествить с множеством всех чисел на отрезке [0, 1] в двоичной записи.) В качестве задачи полезно доказать, что пространство R также не изоморфно своему двойственному пространству R (указание: в R имеется сч?тный базис, а в R не существует сч?тного базиса).

1.10. Второе двойственное пространство, канонический изоморфизм V V =
Мы видели, что пространства V и V изоморфны (в конечномерном случае), однако для построения изоморфизма нам требовалось выбрать базис в V . Сейчас мы построим изоморфизм между пространством V и его вторым двойственным пространством V , который не требует выбора базиса. По определению, элементами пространства V являются линейные функции на пространстве линейных функций V .
Теорема 1.10.1. Пусть V конечномерное линейное пространство. Отображение : V V , сопоставляющее вектору N V линейную функцию N на V , задаваемую формулой N ( ) := (N), для V , является изоморфизмом. Доказательство. Очевидно, что N линейная функция на V . Кроме того,

(N + O ) = N +O = N + O = (N ) + (O )


22

1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА

и (N ) = (N ), т.е. отображение линейно. Докажем, что : V V инъективно, т.е. Ker = {0}. Пусть (N ) = N = o. Последнее равенство означает, что N ( ) = (N ) = 0 для любой линейной функции V . В частности, это верно для всех линейных функций 1 , . . . , n двойственного базиса к произвольному базису A 1 , . . . , A n в V . Следовательно, i (N ) = xi = 0, т.е. все координаты вектора N V в базисе A 1 , . . . , A n равны нулю. Это означает, что N = 0, т.е. Ker = {0}. Так как dim V = dim V = dim Ker + dim Im (последнее равенство вытекает из следствия 1.7.7) и dim Ker = 0, мы получаем dim Im = dim V . Следовательно, Im = V и сюръективно. Итак, линейно и биективно, а значит это изоморфизм. При построении изоморфизма : V V мы ни разу не использовали базис (базис использовался только при доказательстве). Изоморфизм, который не зависит от выбора базиса, называется каноническим.

1.11. Сопряж?нное линейное отображение
Определение 1.11.1. Пусть A : V W линейное отображение. Отображение A : W V , заданное формулой

(A )(L ) := (AL )
называется сопряж?нным к A.

для W , L V ,

Непосредственно проверяется, что A линейное отображение.

и W соответственно. Тогда матрица отображения A : V W в этих базисах и матрица сопряж?нного отображения A : W V в двойственных базисах 1 , . . . , n и 1 , . . . , m получаются друг из друга траспонированием.

Предложение 1.11.2. Пусть

A1 , . . . , Am и B1 , . . . , Bn базисы пространств V

A 1 , . . . , A m и B 1 , . . . , B n . Тогда для любого вектора N = xi A i мы имеем i (A i )(N ) = i (AN ) = i (aj xk B j ) = aj xk i (B j ) = aj xk j = ai xk = ai k (N ). k k k k k

Доказательство. Пусть A = (ai ) матрица отображения A в базисах j

Следовательно, A i = ai k . Это равенство означает, что в i-й строке матрицы k A = (ai ) стоят координаты образа i при отображении A по отношению к базиk су 1 , . . . , m . По определению это означает, что матрица линейного отображения A получается из матрицы A транспонированием.


Глава 2

Линейные операторы
2.1. Матрица линейного оператора. Определитель и след оператора. Невырожденные операторы. Группы GLn и SLn
Начиная с этой главы, все пространства предполагаются конечномерными. Напомним, что линейным оператором называется линейное отображение A : V V пространства V в себя. Далее мы будем называть линейные операторы просто ?операторами?. В определении матрицы A линейного отображения A : V V естественно в качестве базисов в обоих экземплярах пространства V брать один и тот же базис A 1 , . . . , A n . Получаемая квадратная матрица A = (aj ) называется матрицей линейi ного оператора A : V V в базисе A 1 , . . . , A n . Таким образом, i-й столбец матрицы A составлен из координат вектора AA i относительно базиса A 1 , . . . , A n :

AA i = aj A j . i
1. Тождественный оператор id переводит каждый вектор L V в себя: id L = L . Матрицей оператора id в любом базисе является единичная матрица E . Обратно, если матрица оператора A в каком-то базисе есть E , то A = id.
d 2. Рассмотрим оператор дифференцирования dx в пространстве k2 [x] многочленов d d d степени не выше 2. Тогда dx 1 = 0, dx x = 1 и dx x2 = 2x. Таким образом, матрицей d оператора dx в базисе 1, x, x2 является матрица 010 0 0 2 . 000

Пример 2.1.1.

3. В пространстве R3 рассмотрим оператор prL ортогонального проектирования на направление вектора L = (1, 1, 1). Найд?м матрицу этого оператора в стандартном базисе A 1 = (1, 0, 0), A 2 = (0, 1, 0) и A 3 = (0, 0, 1). По формуле из аналитической L) геометрии, для любого вектора K R3 мы имеем prL K = (K ,,L ) L . Следовательно, (L

1 1 1 1 prL A 1 = prL A 2 = prL A 3 = (1, 1, 1) = A 1 + A 2 + A 3 . 3 3 3 3
Таким образом, матрица оператора prL имеет вид 1 1 1



3 1 3 1 3

3 1 3 1 3

3 1 3 1 3

.

23


24

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

A = C -1 AC, где A матрица оператора A : V V в базисе A1 , . . . , An , A матрица в базисе A1 , . . . , An и C матрица перехода от базиса A1 , . . . , An к базису A1 , . . . , An .
плярах пространства V , мы должны подставить C = D в формулу A = D-1 AC преобразования матрицы линейного отображения из теоремы 1.8.5.
Доказательство. Так как мы выбираем один и тот же базис в обоих экзем-

соотношение

Теорема 2.1.2 (закон изменения матрицы линейного оператора). Имеет место

Матрицы A и A , удовлетворяющие соотношению A = C -1 AC , где C невырожденная матрица, называются подобными. Таким образом, матрицы одного оператора в разных базисах подобны. Cлед tr A матрицы A = (ai ) это сумма е? диагональных элементов, tr A = ai . i j
Лемма 2.1.3. Определитель и след подобных матриц равны. Доказательство. Пусть A = C
-1

AC . Тогда для определителя имеем


det A = det(C



-1

AC ) = (det C


-1

)(det A)(det C ) = (det C )-1 (det C )(det A) = det A.


Для вычисления следа используем обозначения Эйнштейна: ai = ci ai cj , откуда i jj j
j tr A = ai = ci ai cj = cj ci ai = i ai = ai = tr A. i i ji j i iij


Определение 2.1.4. Определитель (соответственно, след ) линейного оператора A : V V это определитель (соответственно, след) матрицы оператора A в любом базисе; обозначается det A (соответственно, tr A). Оператор A называется невырожденным, если det A = 0. Композицией операторов A : V V и B : V V называется линейный оператор A B : V V , определяемый формулой (A B )(L ) = A(B L ).

есть произведение матриц операторов A и B в этом базисе.
базисе A 1 , . . . , A n и пусть C = AB = (ci ). Тогда j т.е. C = AB есть матрица оператора A B .

Предложение 2.1.5. Матрица композиции операторов A B в любом базисе

Доказательство. Пусть A = (ai ) и B = (bi ) матрицы операторов A и B в j j

(A B )(A i ) = A(B A i ) = A(bj A j ) = bj AA j = bj ak A k = ak bj A k = ck A k , ji i i i ij
Теорема 2.1.6. Следующие условия эквивалентны для оператора A : V V :

а) б) в) г)

оператор A невырожден, т.е. det A = 0; оператор A обратим, т.е. существует A-1 : V V , A A Im A = V ; Ker A = {0}.

-1

= id;

а) б). Пусть det A = 0 и A матрица оператора A в любом базисе. Тогда det A = 0. Следовательно, существует обратная матрица A-1 . Рассмотрим оператор A-1 , который в выбранном базисе зада?тся матрицей A-1 . Тогда по предыдущему предложению, матрица оператора A A-1 есть AA-1 = E , а значит A A-1 = id.

Доказательство. Мы докажем импликации а) б) в) г а).


2.2. ПРОЕКТОРЫ

25

б) в). Пусть A обратим. Предположим, что Im A = V . Выберем такой L V , что L Im A. Пусть A-1 (L ) = K . Тогда AK Im A. С другой стороны, AK = / A A-1 (L ) = L . Противоречие. в) г). Пусть Im A = V , т.е. dim V = dim Im A. Согласно следствию 1.7.7, dim V = dim Ker A + dim Im A. Следовательно, dim Ker A = 0, т.е. Ker A = {0}. г) а). Пусть Ker A = {0}. Предположим, что det A = 0. Тогда det A = 0, где A матрица оператора A в любом базисе A 1 , . . . , A n . Это означает, что система линейных уравнений Ax = 0 имеет ненулевое решение x1 , . . . , xn . Согласно предложению 1.8.2, это означает, что AN = 0, где N = xi A i = 0. Таким образом, Ker A содержит ненулевой вектор N . Противоречие. Множество Hom(V , V ) всех линейных операторов A : V V в фиксированном пространстве V образует кольцо относительно операций сложения и композиции (если включить в рассмотрение и умножение операторов на элементы поля k, то получаемый объект называется алгеброй над полем k). Наряду с Hom(V , V ) для этого кольца (или алгебры) используется обозначение End(V ). Невырожденные операторы в V образуют (неабелеву) группу относительно композиции. Эта группа называется общей линейной группой пространства V и обозначается GL (V ). Если dim V = n, то группа GL (V ) изоморфна группе невырожденных квадратных матриц размера n с элементами из поля k по умножению; эта группа обозначается GLn (k). Матрицы (или операторы) с определителем 1 образуют подгруппу в GLn (k); эта подгруппа называется специальной линейной группой и обозначается SLn (k).

2.2. Проекторы, их алгебраическая характеризация
Определение 2.2.1. Пусть пространство V представлено в виде прямой суммы двух подпространств: V = V1 V2 . Тогда для любого вектора L V имеется единственное разложение L = L 1 + L 2 , L 1 V1 , L 2 V2 . Оператор P : V V , переводящий вектор L = L 1 + L 2 в вектор L 1 , называется проектором на V1 вдоль V2 .

Для такого проектора P мы очевидно имеем Im P = V1 и Ker P = V2 .
Теорема 2.2.2. Следующие условия эквивалентны для оператора A : V V :

а) A является проектором; б) A2 = A.
Доказательство. Если A проектор на V1 вдоль V2 , то для

) A2 L = A A(L 1 + L 2 ) = AL 1 = L 1 = AL ,

(

L = L 1 + L 2 имеем

т.е. A2 = A. Пусть теперь A2 = A. Положим V1 := Im A и V2 := Ker A. Мы покажем, что A проектор на V1 вдоль V2 . Сначала докажем, что V = V1 V2 , т.е., что V = V1 + V2 и V1 V2 = {0}. Пусть L V1 V2 . Тогда L V1 = Im A, т.е. существует такой вектор K V , что AK = L , и L V2 = Ker A, т.е. AL = 0. Тогда

L = AK = A2 K = A(AK ) = AL = 0,
т.е. L = 0. Итак, V1 и V2 действительно образуют прямую сумму. Кроме того,

dim(V1 V2 ) = dim V1 + dim V2 = dim Im A + dim Ker A = dim V ,


26

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

т.е. V = V1 V2 . Рассмотрим теперь произвольный вектор L V и представим его в виде L = L 1 + L 2 , L 1 V1 = Im A, L 2 V2 = Ker A. Тогда существует K V такой, что L 1 = AK , а AL 2 = 0. Мы имеем

AL = AL 1 + AL 2 = A(AK ) = AK = L 1 .
Итак, A действительно проектор на V1 вдоль V2 . Матрица проектора ( E V1 и V2 имеет вид 0 обозначает матрицу из на V1 вдоль V2 в базисе, составленном из базисов пространств ) 0 , где E единичная матрица размера k = dim V1 , а 0 0 нулей соответствующего размера.

2.3. Многочлены от оператора. Минимальный аннулирующий многочлен
Пусть A : V V оператор. Мы уже рассматривали его квадрат A2 . На самом деле каждому многочлену P (t) = a0 + a1 t + a2 t2 + . . . + an tn k[t] можно сопоставить оператор P (A) := a0 id +a1 A + a2 A2 + . . . + an An , который называется многочленом от оператора A.
Определение 2.3.1. Многочлен P (t) называется аннулирующим оператор A, если P (A) = O (нулевой оператор).

2. Многочлен t2 - t аннулирует любой проектор P согласно Теореме 2.2.2.

Пример 2.3.2. 1. Многочлен t - 1 аннулирует тождественный оператор id.

щий многочлен.
1 2

Предложение 2.3.3. У любого оператора существует ненулевой аннулируюДоказательство. Пусть dim V = n. Рассмотрим n2 + 1 операторов A
n
2

= id, A = A, A . . . , A . Так как размерность пространства операторов равна n , эти операторы линейно зависимы, т.е. существуют числа a0 , a1 , . . . , an2 , не все равные 2 нулю, такие, что a0 id +a1 A + . . . + an2 An = O. Тогда ненулевой многочлен P (t) = 2 a0 + a1 t + . . . + an2 tn аннулирует оператор A.
0 2

Определение 2.3.4. Ненулевой многочлен P (t) называется минимальным аннулирующим многочленом (или просто минимальным многочленом ) для оператора A, если P (A) = O, многочлен P (t) имеет наименьшую степень среди всех ненулевых аннулирующих многочленов, и его старший коэффициент равен 1.

мальный аннулирующий многочлен.

Предложение 2.3.5. Для любого оператора существует единственный мини-

многочлена. Среди всех аннулирующих многочленов выберем многочлен наименьшей степени и разделим его на старший коэффициент. В результате мы по определению получим минимальный многочлен. Докажем единственность. Пусть P1 (t) и P2 (t) два минимальных многочлена для оператора A. Степени и старшие коэффициенты многочленов P1 (t) и P2 (t) равны. Тогда P1 (t) - P2 (t) будет аннулирующим многочленом меньшей степени, а значит P1 (t) - P2 (t) = 0.

Доказательство. Мы уже доказали существование ненулевого аннулирующего


2.4. ОВЕЩЕСТВЛЕНИЕ И КОМПЛЕКСИФИКАЦИЯ

27

2.4. Овеществление и комплексификация
При работе с линейными пространствами и операторами часто бывает удобно изменить поле скаляров. Здесь мы рассмотрим две такие операции: переход от пространств над полем вещественных чисел R к пространствам над полем комплексных чисел C (комплексификация вещественного пространства) и переход от пространств над C к пространствам над R (овеществление комплексного пространства).

Овеществление.
полем C). Рассмотрим пространство VR , состоящее из тех же векторов, что и V , но вместо операции умножения на все комплексные числа мы оставим лишь умножение не вещественные числа. Тогда VR вещественное пространство (пространство над полем R), которое называется овеществлением пространства V .
Определение 2.4.1. Пусть V комплексное пространство (пространство над

iA1 , . . . , iAn базис пространства VR . Таким образом, dim VR = 2 dim V .
висимы в VR . Пусть
Доказательство. Проверим, что векторы

Предложение 2.4.2. Пусть

A1 , . . . , An базис пространства V . Тогда A1 , . . . , An , A 1 , . . . , A n , iA 1 , . . . , iA n линейно неза-

1 A 1 + . . . + n A n + ч1 iA 1 + . . . + чn iA n = 0,
в пространстве VR , где k , чk R. Тогда в пространстве V мы имеем

(1 + iч1 )A 1 + . . . + (n + iчn )A n = 0.
Так как векторы A 1 , . . . , A n линейно независимы в V , мы имеем k + iчk = 0, т.е. k = чk = 0. Следовательно, A 1 , . . . , A n , iA 1 , . . . , iA n линейно независимы в VR . Теперь проверим, что любой вектор L VR представляется в виде линейной комбинации (с вещественными коэффициентами) векторов A 1 , . . . , A n , iA 1 , . . . , iA n . Рассмотрим L как вектор из V . Так как A 1 , . . . , A n базис в V , мы имеем

L = 1 A 1 + . . . + n A

n

для некоторых k C. Запишем k = k + iчk , где k , чk R. Тогда

L = 1 A 1 + . . . + n A n + ч1 iA 1 + . . . + чn iA n . Итак, A 1 , . . . , A n , iA 1 , . . . , iA n базис в VR .
ратор. Тогда тот же оператор, рассматриваемый в пространстве AR , называется овеществлением оператора A и обозначается AR .
Определение 2.4.3. Пусть V комплексное пространство и A : V V опе-

странства V в виде A + iB , где A и B вещественные матрицы. Тогда ( ) A -B ; а) матрица оператора AR в базисе A1 , . . . , An , iA1 , . . . , iAn есть BA б) det AR = | det A|2 .
Доказательство. Пусть A = (al ) и B = (bl ). Тогда k k

Предложение 2.4.4. Запишем матрицу оператора A в базисе

A1 , . . . , An про-

AR (A k ) = A(A k ) = (al + ibl )A l = al A l + bl iA l , k k k k AR (iA k ) = A(iA k ) = iA(A k ) = i(al + ibl )A l = -bl A l + al iA l , k k k k


28

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

и утверждение а) вытекает из определения матрицы оператора. Для доказательства утверждения б) произвед?м следующие элементарные преобразования над строками и столбцами матрицы оператора AR : ) ( ) ( A - iB -B - iA A -B B A BA ( )( ) A - iB -B - iA + i(A - iB ) A - iB 0 = . B A + iB B A + iB Отсюда получаем det AR = det(A - iB ) det(A + iB ) = det A ћ det A = | det A|2 .

Комплексная структура.
вещественное пространство. Комплексной структурой на V называется такой оператор J : V V , что J 2 = - id.
Определение 2.4.5. Пусть V Предложение 2.4.6. Пусть V вещественное пространство с комплексной структурой J . Введ?м на V операцию умножения на комплексные числа по правилу

( + iч) ћ L = L + чJ (L).
Тогда V превращается в комплексное пространство V , для которого V овеществление оператора умножения на i есть J .
ного пространства над C. Эта проверка осуществляется непосредственно. а) размерность вещественного пространства V ч?тна; б) в подходящем базисе матрица оператора J имеет вид
R

= V, а

Доказательство. Необходимо проверить свойства 5)8) из определения линейПредложение 2.4.7. Пусть J комплексная структура на V . Тогда

(

0 -E E0

) .

предложения. Так как любой базис в V порождает V , это пространство конечномерно. Так как V = VR , из предложения 2.4.2 следует, что dim V = 2 dim V ч?тно. Далее, если A 1 , . . . , A n базис комплексного пространства V , то A 1 , . . . , A n , iA 1 , . . . , iA n базис пространства VR = V . В этом базисе оператор J (овеществление оператора умножения на i) имеет указанный вид согласно предложению 2.4.4 а).

Доказательство. Рассмотрим комплексное пространство V из предыдущего

Комплексификация.
Определение 2.4.8. Пусть V пространство над R. Рассмотрим пространство V V , состоящее из пар (K , L ), где K , L V , и введ?м на н?м комплексную структуру следующим образом: J (K , L ) := (-L , K ). Получаемое пространство V V над полем C называется комплексификацией пространства V и обозначается VC .

(A1 , 0), . . . , (An , 0) образуют базис пространства VC . Таким образом, dim VC = dim V .
Доказательство. Как всегда, нужно проверить, что (A 1 , 0), . . . , (A n , 0) линейно независимы и порождают вс? пространство VC . Пусть

Предложение 2.4.9. Пусть

A1 , . . . , An базис пространства V . Тогда векторы

(2.1)

1 (A 1 , 0) + . . . + n (A n , 0) = (0, 0)


2.5. ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА. СОБСТВЕННЫЕ ВЕКТОРЫ

29

для некоторых k = k + iчk C. Так как (k + iчk ) ћ (A k , 0) = k (A k , 0) + чk J (A k , 0) = (k A k , чk A k ), из равенства (2.1) мы получаем

(1 A 1 + . . . + n A n , ч1 A 1 + . . . + чn A n ) = (0, 0),
откуда все k , чk , а значит и k , равны нулю. Итак, (A 1 , 0), . . . , (A n , 0) линейно независимы. То, что они порождают пространство VC , проверяется аналогично.
Определение 2.4.10. Пусть V вещественное пространство и A : V V оператор. Оператор AC : VC VC , заданный формулой AC (K , L ) := (AK , AL ), называется комплексификацией оператора A. Предложение 2.4.11. Пусть A матрица оператора A в базисе A1 , . . . , An . Тогда оператор AC в базисе (A1 , 0), . . . , (An , 0) имеет ту же матрицу A. Доказательство. AC (

A k , 0) = (AA k , 0) = (alk A l , 0) = alk (A l , 0).

При работе с комплексифицированным пространством VC удобно записывать векторы (K , L ) VC в виде K + iL . Тогда действие комплексифицированного оператора AC записывается в виде AC (K + iL ) = AK + iAL .
Предложение 2.4.12. Пространство (VC )
R

канонически изоморфно V V .
R

= V V согласно предложению 2.4.6 (мы просто сначала добавили, а потом убрали умножение на комплексные скаляры).
Можно доказать (задача), что (VR )C канонически изоморфно V V , где V комплексно сопряж?нное пространство, в котором сложение то же, что и в V , а умножение на комплексные числа определено по формуле ћ L := L . Как мы вскоре убедимся, комплексификация предоставляет весьма полезный инструмент для работы с операторами в вещественных пространствах.

Доказательство. Действительно, VC = V V , а (V V )

2.5. Инвариантные подпространства. Ограничение оператора и фактор-оператор. Собственные значения и собственные векторы
сительно оператора A : V V , если A(W ) W . подпространствами.
Определение 2.5.1. Подпространство W V называется инвариантным отноПример 2.5.2. Ядро Ker A и образ Im A оператора A являются инвариантными

Пусть W V инвариантное подпространство для оператора A : V V . Выберем базис A 1 , . . . , A k в W и дополним его до базиса A 1 , . . . , A k , A k+1 , . . . , A n в V . Пусть A = (ai ) матрица оператора A в этом базисе. Тогда AA j = a1 A 1 + . . . + ak A k при j j j j = 1, . . . , k . Это означает, что матрица A имеет вид ( ) A= , 0 где в левом нижнем углу стоит матрица размера (n - k ) Ч k из нулей.


30

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

Аналогично, если имеет место разложение V = W1 W2 в прямую сумму инвариантных подпространств, A(W1 ) W1 и A(W2 ) W2 , то в подходящем базисе матрица оператора A будет иметь блочно-диагональный вид ( ) 0 A= , 0 тора A : V V . Тогда оператор A : W W , определ?нный равенством AM := AM для M W , называется ограничением оператора A на подпространство W и часто обозначается A|W . Линейный оператор A : V /W V /W , определ?нный на классах смежности по правилу A(L + W ) = AL + W , называется фактор-оператором. Определение фактор-оператора корректно. Действительно, если L + W = K + W , то L - K W , A(L - K ) W , и мы имеем
Определение 2.5.3. Пусть W V инвариантное подпространство для опера-

A(L + W ) = A(K + L - K ) + W = AK + A(L - K ) + W = AK + W = A(K + W ).
Предложение 2.5.4. Пусть W V инвариантное подпространство для оператора A : V V . Пусть A1 , . . . , Ak базис в W и A1 , . . . , Ak , Ak+1 , . . . , An базис в V . Тогда матрица оператора A в этом базисе имеет вид ( ) A A= , 0A

где A матрица ограничения A|W в базисе A1 , . . . , Ak , а A матрица фактороператора в базисе Ak+1 + W, . . . , An + W факторпространства V /W .
Доказательство. Это вытекает из предыдущих рассуждений. Определение 2.5.5. Ненулевой вектор L V называется собственным для оператора A, если AL = L для некоторого k. Число k называется собственным значением, если существует собственный вектор L , для которого AL = L . Предложение 2.5.6. Все собственные векторы, отвечающие собственному значению , и вектор 0 образуют подпространство, которое совпадает с ядром оператора A - ћ id.

Ker(A - ћ id).

Доказательство. Равенство AL =

L имеет место тогда и только, когда L

Определение 2.5.7. Пусть собственное значение для оператора A. Подпространство V = Ker(A - ћ id) называется собственным подпространством, соответствующим . Предложение 2.5.8. Собственное подпространство V инвариантно. Доказательство. Действительно, если Пример 2.5.9.

L V , то AL = L V .

1. Для тождественного оператора id : V V все ненулевые векторы являются собственными с собственным значением 1.


2.6. ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН. ТЕОРЕМА ГАМИЛЬТОНАКЭЛИ

31

2. Ядро любого оператора A : V V состоит из собственных векторов с собственным значением 0 и нулевого вектора. 3. Все собственные значения проектора P : V V суть 0 или 1. Прич?м если P проектор на U вдоль W , то U это собственное подпространство, соответствующее = 1, а W собственное подпространство, соответствующее = 0.

2.6. Характеристический многочлен. Теорема ГамильтонаКэли
Определение 2.6.1. Многочлен PA (t) := det(A - t ћ id) называется характеристическим многочленом оператора A.

Как и всякий определитель оператора, характеристический многочлен PA (t но вычислять как det(A - tE ), где A матрица оператора A в любом базисе, единичная матрица. Некоторые из коэффициентов характеристического многочлена PA (t) = an-1 tn-1 + . . . + a0 нам уже знакомы: an = (-1)n , an-1 = (-1)n-1 tr A, a0 = det

) можаE an tn + A.

корни его характеристического многочлена.

Предложение 2.6.2. Собственные значения оператора A это в точности

рожден, т.е. det(A - ћ id) = 0, а значит корень многочлена PA (t). Обратно, если корень многочлена PA (t), то det(A - ћ id) = 0, а значит собственное значение.
Теорема 2.6.3.

Доказательство. Если собственное значение, то оператор A - ћ id вы-

а) Оператор A : V V в нетривиальном пространстве над полем C имеет инвариантное подпространство размерности 1. б) Оператор A : V V в нетривиальном пространстве над полем R имеет инвариантное подпространство размерности 1 или 2. раически замкнуто, характеристический многочлен PA (t) имеет корень . Значит оператор A имеет собственный вектор L , т.е. AL = L и L одномерное инвариантное подпространство. Докажем б). Если характеристический многочлен имеет вещественный корень, то мы получаем одномерное инвариантное подпространство. Предположим, что все корни многочлена PA (t) комплексны. Пусть + iч корень. Тогда + iч собственное значение комплексифицированного оператора AC (напомним, что в подходящих базисах матрицы операторов A и AC совпадают). Возьм?м соответствующий собственный вектор K + iL VC . Тогда
Доказательство. Для доказательства а) заметим, что так как поле C алгеб-

AK + iAL = AC (K + iL ) = ( + iч)(K + iL ) = (K - чL ) + i(чK + L ).
Следовательно, AK = K - чL и AL = чK + L , и линейная оболочка K , L V является инвариантным подпространством для A. Пусть V = Ker(A - ћ id) собственное подпространство.
Предложение 2.6.4. Размерность собственного подпространства V

восходит кратности как корня характеристического многочлена.



не пре-


32

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

Доказательство. Пусть dim V = k . Выберем базис A 1 , . . . , A k в пространстве V и дополним его до базиса в V . Так как AA i = A i при i = 1, . . . , k , матрица оператора A в выбранном базисе имеет вид 0 .. . A= . 0 0 A

Тогда PA (t) = det(A - tE ) = ( - t)k det(A - tE ) = ( - t)k PA (t), где A фактороператор. Отсюда вытекает, что кратность корня не меньше k = dim V .

ратора A : V V аннулирует этот оператор, т.е. PA (A) = O.

Теорема 2.6.5 (ГамильтонаКэли). Характеристический многочлен PA (t) опе-

Мы привед?м два доказательства этого фундаментального факта. Первое доказательство более элементарное, но использует специальный трюк. Второе доказательство идейно проще, но использует понятие факторпространства. матрицу того же размера, на ij -м месте которой стоит алгебраическое дополнение j i-го элемента матрицы M . Как известно из курса алгебры, имеет место тождество
Первое доказательство. Для квадратной матрицы M обозначим через M

M M = det M ћ E .
Теперь возьм?м в качестве M матрицу A - tE , где A матрица оператора A в произвольном базисе. Тогда (2.2)

(A - tE )(A - tE ) = det(A - tE ) ћ E = PA (t)E .

По определению элементы матрицы A - tE являются многочленами от t степени не выше n - 1, где n = dim V . Следовательно, эту матрицу можно записать в виде

A - tE = B0 + tB1 + t2 B2 + . . . + t

n-1

B

n-1

,

где Bi числовые матрицы. Подставив это разложение вместе с разложением характеристического многочлена PA (t) = a0 + a1 t + . . . + an tn в формулу (2.2), получим

(A - tE )(B0 + tB1 + t2 B2 + . . . + t

n-1

Bn-1 ) = (a0 + a1 t + a2 t2 + . . . + an tn )E .

Приравнивая коэффициенты при различных степенях t, получим

AB0 = a0 E , -B0 + AB1 = a1 E , -B1 + AB2 = a2 E , ... -Bn-2 + ABn-1 = an-1 E -Bn-1 = an E
Умножив слева обе части второго равенства на A, третьего на A2 , и т.д., и сложив все полученные равенства, получим

0 = a0 E + a1 A + a2 A2 + . . . + an An .


2.7. ДИАГОНАЛИЗИРУЕМЫЕ ОПЕРАТОРЫ

33

В правой части стоит результат подстановки A в характеристический многочлен.
Второе доказательство. Вначале докажем теорему над алгебраически замкнутым полем, например, над полем C. Провед?м индукцию по размерности V . Если V одномерно, то A = ћ id умножение на скаляр . Тогда PA (t) = - t, а значит PA (A) = ћ id -A = O. Пусть теперь dim V = n, и предположим, что теорема доказана для пространств размерности n - 1. Выберем инвариантное одномерное подпространство U для A; это подпространство порождено собственным вектором K с собственным значением . Дополним вектор K до базиса. В этом базисе матрица оператора A имеет вид ( ) A= , 0A

где A матрица фактор-оператора A, действующего в фактор-пространстве V /U . Отсюда вытекает, что

PA (t) = det(A - tE ) = ( - t) det(A - tE ) = ( - t)PA (t),
где n- это для

PA (t) характеристический многочлен фактор-оператора. Так как dim V /U = 1, по предположению индукции PA (A) = O. По определению фактор-оператора означает, что для любого вектора L V имеем PA (A)L U , т.е. PA (A)L = чK некоторого ч. Следовательно, PA (A)L = ( ћ id -A)PA (A)L = ( ћ id -A)(чK ) = 0,

так как AK = K . Итак, PA (A) = O для операторов в комплексных пространствах. Для доказательства теоремы над полем R воспользуемся комплексификацией AC оператора A. Так как в соответствующих базисах пространств V и VC матрицы операторов A и AC совпадают, мы имеем PA (t) = PAC (t) и PA (A) = PAC (A) = 0.

2.7. Диагонализируемые операторы. Критерий диагонализируемости
Определение 2.7.1. Оператор A называется диагонализируемым, если существует базис, в котором матрица этого оператора диагональна.

По определению матрицы оператора, базис, в котором матрица оператора диагональна, состоит из собственных векторов. Поэтому оператор диагонализируем тогда и только тогда, когда для него существует базис из собственных векторов.
Теорема 2.7.2 (критерий диагонализируемости). Оператор A в n-мерном пространстве V диагонализируем тогда и только тогда, когда его характеристический многочлен имеет в точности n корней (с уч?том кратностей), и размерность каждого собственного подпространства V равна кратности корня .

Для доказательства теоремы нам понадобится лемма.

попарно различным собственным значениям 1 , . . . , k оператора A, образуют прямую сумму V1 . . . Vk .

Лемма 2.7.3. Собственные подпространства V1 , . . . , Vk , соответствующие


34

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

Доказательство. Провед?м индукцию по k . При k = 1 утверждение очевидно.

По определению прямой суммы мы должны проверить, что соотношение (2.3)

L 1 + . . . + L k = 0,
1 L 1 + . . . + k L k = 0

где L i Vi , влеч?т L 1 = . . . = L k = 0. Применив к (2.3) оператор A, получим Умножим (2.3) на k и вычтем из предыдущего соотношения:

(1 - k )L 1 + . . . + (

k -1

- k )L

k -1

= 0.

По предположению индукции получаем (1 - k )L 1 = . . . = (k-1 - k )L k-1 = 0. Так как по условию 1 - k = 0, . . . , k-1 - k = 0, получаем L 1 = . . . = L k-1 = 0. Тогда из (2.3) следует, что и L k = 0. Сформулируем одно полезное следствие этой леммы.
Следствие 2.7.4. Собственные векторы оператора, отвечающие различным собственным значениям, линейно независимы. Доказательство теоремы 2.7.2. Предположим, что оператор A диагонализируем. Пусть на диагонали матрицы D оператора A стоят числа 1 , . , k , прич?м .. число i присутствует ri раз. Тогда мы имеем PA (t) = det(D - tE ) = k=1 (i - t)ri . i k Следовательно, многочлен PA (t) имеет ri = n корней, и каждому корню i i=1 соответствует ri линейно независимых собственных векторов, т.е. dim Vi = ri . Предположим теперь, что многочлен PA (t) имеет различные корни 1 , . . . , k , при ч?м кратность корня i равна ri , k=1 ri = n и dim Vi = ri . Согласно лемме 2.7.3, i пространства V1 , . . . , Vk образуют прямую сумму, а по условию сумма их размерностей равна n = dim V . Следовательно, V = V1 . . . Vk . Выбрав базис в каждом из подпространств Vi и взяв объединение этих базисов, мы получим базис пространства V , состоящий из собственных векторов. Итак, оператор A диагонализируем. Следствие 2.7.5. Пусть характеристический многочлен PA (t) имеет n = dim V различных корней. Тогда оператор A диагонализируем.

Набор собственных значений оператора A часто называют его спектром (эта терминология будет прояснена в курсе функционального анализа, когда будут рассматриваться операторы с непрерывным спектром в бесконечномерных пространствах). Если все собственные значения имеют кратность 1 как корни характеристического многочлена, то говорят о простом спектре. Таким образом, операторы с простым спектром диагонализируемы. Появление кратных корней является ?особенностью?, которая устраняется произвольно малым возмущением коэффициентов матрицы оператора. Таким образом, над полем C ?почти все? операторы диагонализируемы.

( ) 0 -1 1. Оператор, заданный матрицей в стандартном базисе R2 , не диагона10 лизируем, так как его характеристический многочлен t2 + 1 не имеет вещественных корней. Однако тот же оператор в C2 диагонализируем: в базисе B 1 = (1 i), B 2 = (1 -i) ( ) -i 0 его матрица диагональна. 0i

Пример 2.7.6.


( ) 11 2. Оператор, заданный матрицей , не диагонализируем ни над каким по01 лем по другой причине: его характеристический многочлен (t - 1)2 имеет корень 1 кратности 2, но при этом размерность соответствующего собственного подпространства равна 1 (вектор A 2 = (0 1) не является собственным).

2.8. НИЛЬПОТЕНТНЫЕ ОПЕРАТОРЫ

35

2.8. Нильпотентные операторы. Нормальный вид
некоторого k . Минимальное число k , для которого Ak = O, называется степенью нильпотентности оператора A.
Пример 2.8.2. Рассмотрим оператор A, заданный в базисе Определение 2.8.1. Оператор A называется нильпотентным, если Ak = O для

(2.4)

01 0 0 ... .. . 1 0 0

A 1 , . . . , A n матрицей

(над диагональю стоят единицы, а на остальных местах нули). Действие этого оператора на базисные векторы описывается схемой A n A n-1 . . . A 1 0. Отсюда видно, что An = O, т.е. оператор A нильпотентен и имеет степень n. Сформулируем несколько простых свойств нильпотентных операторов.
Предложение 2.8.3. Пусть A : V V нильпотентный оператор, прич?м

dim V = а) б) в)

n. Тогда единственным собственным значением оператора A является 0; оператор A диагонализируем тогда и только тогда, когда A = O; An = O, т.е. степень нильпотентности A не превосходит n = dim V .
-1 k -1 k

= O. Значит существует такой вектор L , что K := A L = 0. Тогда AK = A L = 0, т.е. K собственный вектор с собственным значением 0. Если теперь = 0 другое собственное значение, то по определению найд?тся M = 0, такой, что AM = M . Тогда 0 = Ak M = k M . Отсюда 0 = k , т.е. = 0 противоречие. Докажем б). Если A диагонализируем, то на диагонали его диагональной матрицы стоят собственные значения, которые все равны нулю в силу а). Следовательно, матрица нулевая и A = O. Докажем в). Из утверждения а) вытекает, что характеристический многочлен оператора A есть (-t)n . Тогда An = O по теореме ГамильтонаКэли.
Следующая теорема показывает, что любой нильпотентный оператор является прямой суммой операторов из примера 2.8.2.
Теорема 2.8.4. Пусть A : V странстве V существует базис, диагональный вид с блоками из матрицы оператора единствен с

Доказательство. Докажем а). Пусть Ak = O и Ak

V нильпотентный оператор. Тогда в пров котором матрица оператора A имеет блочноматриц (2.4) произвольных размеров. Такой вид точностью до перестановки блоков.

Базис, существование которого утверждается в этой теореме, называется нормальным, а матрица оператора в таком базисе называется нормальным видом (или нормальной формой ) нильпотентного оператора.


36

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

Доказательство теоремы 2.8.4. Базис, в котором матрица оператора состоит из блоков вида (2.4), удобно изображать в виде диаграммы
r ? r ? r ? r r ? r ? r ? r r ? r ? r r ? r ? r r ? r r r

В этой диаграмме точки изображают элементы нормального базиса, а стрелки описывают действие оператора A. Элементы нижней строки оператор переводит в нуль, т.е. в ней стоят собственные векторы оператора (с собственным значением 0), входящие в базис. Каждый столбец соответствует одному блоку вида (2.4), прич?м размер блока равен высоте соответствующего столбца (количеству точек в столбце). Итак, нам нужно доказать существование базиса, действие оператора A на элементы которого описывается диаграммой указанного вида. Провед?м индукцию по размерности пространства V . Если dim V = 1, то нильпотентный оператор A является нулевым, и любой ненулевой вектор в V образует нормальный базис. Пусть теперь dim V = n > 1, и пусть для размерностей, меньших n, существование нормального базиса уже доказано. Пусть V0 = Ker A подпространство собственных векторов для A. Так как dim V0 > 0, имеем dim V /V0 < n. Рассмотрим фактор-оператор A : V /V0 V /V0 , A(L + V0 ) = AL + V0 . По индуктивному предположению A имеет нормальный базис. Можно считать его непустым: иначе V = V0 и любой базис в V0 будет нормальным для A. Построим диаграмму D для элементов нормального базиса оператора A, в каждом е? столбце возьм?м самый верхний вектор A i , i = 1, . . . , m (здесь m количество столбцов в D), и положим A i = A i + V0 , A i V . Теперь построим диаграмму D из векторов пространства V следующим образом. Для i = 1, . . . , m столбец с номером i диаграммы D будет состоять (сверху вниз) из векторов A i , AA i , . . . , Ahi -1 A i , Ahi A i , где hi высота i-го столбца в диаграмме D. Так как Ahi A i = 0, мы имеем Ahi A i V0 и Ahi +1 A i = 0. Выберем базис в линейной оболочке Ah1 A 1 , . . . , Ahm A m V0 , дополним его до базиса V0 и поставим дополняющие векторы в качестве новых столбцов (высоты один) в нижней строке диаграммы D; оператор A переводит их нуль. Таким образом, построенная диаграмма D из векторов пространства V имеет в точности такой вид, как требуется для нормального базиса. Нужно лишь проверить, что векторы, составляющие диаграмму, действительно образуют базис в V . Сначала покажем, что векторы из D порождают вс? V . Пусть L V . Положим hi -1 j L = L + V0 . По предположению L = m j =0 ij A A i . Тогда i=1

L-

m hi -1 i=1 j =0

ij Aj A i V0 .

Но все векторы Aj A i , j hi - 1, лежат в строках диаграммы D, начиная со второй снизу, а подпространство V0 порождено векторами из нижней строки D по построению. Поэтому L можно представить в виде линейной комбинации векторов из D.


2.8. НИЛЬПОТЕНТНЫЕ ОПЕРАТОРЫ

37

Оста?тся проверить линейную независимость векторов из D. Сначала докажем, что векторы нижней строки линейно независимы. Действительно, если некоторая их нетривиальная линейная комбинация равна нулю, то она должна иметь вид m hi i=1 i A A i = 0, ибо остальные элементы нижней строки дополняют базис линейной оболочки Ah1 A 1 , . . . , Ahm A m до базиса V0 . Но все hi 1, поэтому
m ( A i A i=1 hi -1

A

)
i

= 0,

так что

m i=1

i Ahi -1 A i V

0

и

m i=1

i A

hi -1

A i = 0.

Из последнего соотношения следует, что все i = 0, так как векторы Ahi -1 A i составляют нижнюю строку диаграммы D и являются частью базиса пространства V /V0 . Наконец, покажем, что если имеется любая нетривиальная линейная комбинация векторов D, равная нулю, то из не? можно получить нетривиальную линейную зависимость между векторами нижней строки D. Отметим самую верхнюю строку D, в которой имеются ненулевые коэффициенты этой воображаемой линейной комбинации. Пусть номер этой строки (считая снизу) равен h. Применим к этой комбинации оператор Ah-1 . При этом е? часть, лежащая в h-й строке, перейд?т в нетривиальную линейную комбинацию элементов нижней строки, а остальные слагаемые обратятся в нуль. Это завершает доказательство существования нормального базиса. Теперь докажем единственность. Размеры блоков это высоты столбцов диаграммы. Если расположить столбцы, как на рисунке, в порядке убывания, то их высоты однозначно определяются, если известны длины строк в диаграмме, начиная с нижней, в порядке убывания. Из предыдущего рассуждения следует, что длина нижней строки равна dim V0 = dim Ker A и не зависит от выбора базиса. Длина второй снизу строки равна размерности ядра фактор-оператора A в пространстве V / Ker A, т.е. dim Ker A2 - dim Ker A, что также не зависит от выбора базиса. Продолжая далее, мы видим, что длина k -й снизу строки равна размерности ядра фактор-оператора в пространстве V / Ker Ak-1 , т.е. dim Ker Ak - dim Ker Ak-1 . Это завершает доказательство единственности.
Замечание. На практике для нахождения нормального базиса нильпотентного оператора используется следующая модификация процедуры, изложенной в доказательстве теоремы. Сначала находим степень нильпотентности k оператора A, возводя матрицу в степень, пока не получим 0. Векторы из первой сверху строки диаграммы D соответствуют элементам базиса факторпространства V / Ker Ak-1 . Для их нахождения мы выбираем максимальную линейно независимую систему векторов V , не лежащих в Ker Ak-1 . Затем мы ?спускаем? найденные векторы на одну строку вниз, применяя к ним оператор A. Полученная система векторов лежит в Ker Ak-1 , но не лежит в Ker Ak-2 , и мы заполняем вторую строку, дополняя эти векторы до базиса в Ker Ak-1 / Ker Ak-2 . Затем мы спускаем все векторы из второй строки ещ? на одну строку и заполняем третью строку, дополняя векторы, пришедшие из второй строки, до базиса в Ker Ak-2 / Ker Ak-3 . И так далее. На последнем шаге мы заполняем нижнюю строку, дополняя векторы, пришедшие сверху, до базиса в Ker A.


38

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

2.9. Корневые векторы. Теорема о разложении в прямую сумму корневых подпространств
Если оператор A в комплексном пространстве имеет всего одно собственное значение , то его характеристический многочлен имеет вид (-1)n (t - )n , а значит (A - ћ id)n = 0 по теореме ГамильтонаКэли. Следовательно, оператор A - ћ id нильпотентен и к нему можно применить теорему из предыдущего раздела. В случае, когда имеется более одного различного собственного значения , соответствующие операторы A - ћ id не будут нильпотентными.

L V называется корневым вектором оператора A, отвечающим числу k, если существует такое m, что (A - ћ id)m L = 0.
Определение 2.9.1. Вектор

Обозначим через R множество всех корневых векторов, отвечающих .
Предложение 2.9.2. R является подпространством в V .

K , L R , т.е. (A - ћ id)l K = (A - ћ id)m L = 0 для некоторых l, m. Тогда (A-ћid)m (чK ) = 0 для любого ч k. Положим p = max{l, m}. Тогда (A - ћ id)p (K + L ) = 0, т.е. R действительно подпространство.
Доказательство. Пусть

Подпространство R V называется корневым подпространством для оператора A, отвечающим .

гда, когда собственное значение оператора A. При этом V R , т.е. корневое подпространство содержит собственное подпространство.

Предложение 2.9.3. Подпространство R нетривиально тогда и только то-

Доказательство. Действительно, если собственное значение, то существует ненулевой вектор L , для которого (A - ћ id)L = 0, т.е. L R и R нетривиально. Отсюда также следует, что V R . Обратно, пусть R содержит ненулевой вектор K , для которого (A - ћ id)m K = 0, прич?м m минимально, т.е. L := (A - ћ id)m-1 K = 0. Тогда имеем (A - ћ id)L = (A - ћ id)m K = 0, т.е. L собственный вектор, отвечающий .

Далее будем рассматривать только нетривиальные корневые подпространства R .

мкнутым полем, и пусть 1 , . . . , k все собственные значения оператора A. Тогда V является прямой суммой всех корневых подпространств, т.е.

Теорема 2.9.4. Пусть A оператор в пространстве V над алгебраически за-

V = R1 . . . Rk .
Доказательство теоремы будет опираться на три леммы.
Лемма 2.9.5. Подпространство R инвариантно относительно любого операто-

ра A - ч ћ id, ч k (в частности, R инвариантно относительно A). Ограничение

(A - ч ћ id)|R : R R
при = ч является обратимым, а при = ч нильпотентным оператором.
Доказательство. Пусть

L R , т.е. (A - ћ id)m L = 0. Тогда (A - ћ id)m (A - ч ћ id)L = (A - ч ћ id)(A - ћ id)m L = 0,


2.9. КОРНЕВЫЕ ПОДПРОСТРАНСТВА

39

так как (A - ч ћ id) и (A - ћ id)m являются многочленами от оператора A, а любые два многочлена от оператора коммутируют. Итак, R является (A - ч ћ id)-инвариантным подпространством, и мы можем рассмотреть ограничение (A - ч ћ id)|R . Пусть L Ker(A - ч ћ id)|R , т.е. L R и AL = чL . Тогда (A - ћ id)L = (ч - )L , а значит (ч - )m L = (A - ћ id)m L = 0. Следовательно, если = ч, то L = 0. Таким образом, при = ч мы получаем, что ядро оператора (A - ч ћ id)|R тривиально, а значит этот оператор обратим. Наконец, если A 1 , . . . , A r базис в R и (A - ћ id)mi A i = 0, то (A - ћ id)m L = 0 для любого вектора L R , где m наибольшее из чисел m1 , . . . , mr . Это означает, что оператор (A - ћ id)|R нильпотентен.

личным собственным значениям 1 , . . . , k , образуют прямую сумму R1 . . . Rk .
Предположим, что утверждение доказано для k - 1 подпространств. Докажем, что соотношение (2.5)

Лемма 2.9.6. Корневые подпространства R1 , . . . , Rk , соответствующие разДоказательство. Провед?м индукцию по k . При k = 1 утверждение очевидно.

L 1 + . . . + L k = 0,

где L i Ri , влеч?т L 1 = . . . = L k = 0. Имеем (A - k ћ id)p L k = 0 для некоторого p. Применив к (2.5) оператор (A - k ћ id)p , получим (2.6)

(A - k ћ id)p L 1 + . . . + (A - k ћ id)p L

k -1

= 0.

Так как подпространства R1 , . . . , Rk-1 инвариантны относительно A - k ћ id, мы имеем (A - k ћ id)p L i Ri , i = 1, . . . , k - 1. Тогда по предположению индукции из (2.6) вытекает, что (A - k ћ id)p L i = 0, i = 1, . . . , k - 1. Так как по предыдущей лемме оператор A - k ћ id в пространствах R1 , . . . , Rk-1 обратим, отсюда следует, что L 1 = . . . = L k-1 = 0. Тогда из (2.5) получаем, что и L k = 0.
Лемма 2.9.7. Размерность корневого подпространства R равна кратности как корня характеристического многочлена оператора A.

ограничение оператора A на R и A : V /R V /R фактор-оператор. Тогда для характеристических многочленов мы имеем
R

Доказательство. Обозначим через r кратность корня . Пусть A = A|

(2.7)

PA (t) = PA (t)PA (t) = ( - t)dim

R

PA (t)

(см. предложение 2.5.4), откуда dim R r . Предположим, что dim R < r . Тогда из (2.7) следует, что является корнем многочлена PA (t), т.е. собственным значением оператора A. Пусть L + R соответствующий (ненулевой) собственный вектор, т.е.

A(L + R ) = (L + R )

или

AL + R = L + R .

Отсюда вытекает, что AL - L = (A - ћ id)L R . По определению R это означает, что 0 = (A - ћ id)m (A - ћ id)L = (A - ћ id)m+1 L , т.е. L R . Но тогда L + R нулевой вектор пространства V /R . Противоречие.


40

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

Доказательство теоремы ня i , i = 1 . . . , k . Тогда k=1 ri = i стью поля) и из двух предыдущих dim V . Следовательно, V = R1

n (здесь мы пользуемся алгебраической замкнуто лемм вытекает, что dim(R1 . . . Rk ) = k=1 ri = i . . . Rk .

2.9.4. Пусть dim V = n и пусть ri кратность кор-

Разложение V = R1 . . . Rk называется корневым разложением для V .

2.10. Жорданова нормальная форма оператора
Давайте посмотрим, как выглядит матрица оператора A|R (ограничения оператора A на корневое подпространство R ). Так как (A - ћ id)|R является нильпотентным оператором (лемма 2.9.5), в пространстве R можно выбрать нормальный базис для этого оператора. Тогда матрица оператора (A - ћ id)|R в этом базисе будет состоять из блоков вида (2.4), а значит матрица оператора A|R в том же базисе будет состоять из блоков вида 1 0 ... (2.8) J = .. . 1 0 (на диагонали стоит , над диагональю единицы, а на остальных местах нули).
Определение 2.10.1. Матрица (2.8) называется жордановой клеткой. Если матрица оператора A в некотором базисе является блочно-диагональной c блоками вида (2.8) (возможно, соответствующими различным ), то такая матрица называется жордановой нормальной формой оператора A. Базис, в котором оператор имеет жорданову нормальную форму, называется жордановым. Теорема 2.10.2. Для любого оператора A в пространстве V над алгебраически замкнутым полем существует жорданов базис (в котором оператор имеет жорданову нормальную форму). Жорданова нормальная форма оператора единственна с точностью до перестановки блоков (клеток).

ствием теорем о разложении в сумму корневых подпространств и существования нормального вида для нильпотентных операторов. Действительно, пусть 1 , . . . , k все собственные значения A. Выберем в каждом корневом пространстве Ri нормальный базис для нильпотентного оператора (A - i ћ id)|Ri . Тогда объединение этих базисов даст жорданов базис для оператора A в силу наличия корневого разложения V = R1 . . . Rk (здесь мы пользуемся алгебраической замкнутостью поля). Докажем единственность жордановой формы. Надо показать, что количество жордановых клеток фиксированного размера с одним и тем же не зависит от способа приведения к жордановой форме (т.е. от выбора жорданова базиса). Выберем произвольный жорданов базис. Пусть Wi линейная оболочка части этого базиса, отвечающей всем клеткам с i на диагонали. Тогда ограничение оператора (A - i ћ id) на Wi нильпотентный оператор, а значит Wi Ri . Кроме того, V = W1 . . . Wk по определению жорданова базиса и V = R1 . . . Rk (корневое разложение). Следовательно, dim Wi = dim Ri и Wi = Ri . Итак, подпространства, отвечающие клеткам с собственным значением i , не зависят от способа приведения к жордановой форме и равны Ri .

Доказательство. Существование жордановой формы является прямым след-


2.11. МНОГОЧЛЕНЫ И ФУНКЦИИ ОТ МАТРИЦ. ЭКСПОНЕНТА

41

Таким образом, мы свели доказательство единственности жордановой формы к случаю, когда оператор A имеет одно собственное значение . Любой жорданов базис для такого оператора будет также нормальным базисом для нильпотентного оператора A - ћ id. Для нильпотентных операторов мы уже доказали единственность нормального вида (т.е. жордановой формы) в теореме 2.8.4. На языке матриц данная теорема означает, что любая квадратная комплексная матрица A Matn (C) подобна матрице J , состоящей из жордановых клеток, т.е. J = C -1 AC для некоторой невырожденной матрицы C .
Замечания. В отличие от жордановой формы, жорданов базис оператора далеко не единствен. Например, для тождественного оператора id любой базис будет жордановым. Теорема 2.10.2 не имеет места над полем R. Например, оператор, заданный мат( ) 0 -1 рицей в R2 , не приводится к жордановой форме (докажите). 10 На практике для нахождения жордановой формы и жорданова базиса оператора, заданного матрицей A, можно использовать следующий алгоритм. Сначала находим характеристический многочлен и его корни 1 , . . . , k (собственные значения) с кратностями. Затем находим корневые подпространства Ri . Для этого возводим матрицу A - i E в степень до тех пор, пока не наступит стабилизация ранга: rk(A - i E )mi = rk(A - i E )mi+1 . Тогда Ri = Ker(A - i E )mi , а число mi будет размером максимальной жордановой клетки, отвечающей i . Далее в каждом пространстве Ri находим нормальный базис для нильпотентного оператора (A - i ћ id)|Ri (как описано в конце раздела 2.8); объединение этих базисов и будет жордановым базисом для A.

Зная жорданову форму, легко вычислить минимальный многочлен оператора.

над полем C есть P (t) = k=1 (t - i )mi , где 1 , . . . , k все собственные значеi ния A, а mi размер максимальной жордановой клетки, отвечающей i . i )mi является минимальным аннулирующим для оператора A|Ri . В силу теоремы о корневом разложении, любой вектор L V представляется в виде L = i L i , где L i Ri . Так как P (A) содержит множитель (A - i id)mi , мы имеем P (A)L i = 0, т.е. P (A)L = 0 и многочлен P (t) аннулирует оператор A. С другой стороны, любой многочлен Q(t), аннулирующий оператор A, делится на минимальный аннулирующий многочлен для оператора A|Ri , т.е. на (t - i )mi , для каждого i . Следовательно, Q(t) делится на P (t), и P (t) минимальный многочлен.
Доказательство. Мы имеем Ri = Ker(A - i id)mi , поэтому многочлен (t -

Предложение 2.10.3. Минимальный аннулирующий многочлен оператора A

2.11. Вычисление многочленов и функций от матриц. Экспонента линейного оператора (без обоснования сходимости)
Одним из важных применений жордановой формы является эффективное вычисление многочленов и функций от операторов (матриц). Прежде всего получим формулу для многочлена от жордановой клетки.


42

2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ

Предложение 2.11.1. Пусть f (t) многочлен. Тогда его значение на жордановой клетке (2.8) размера n вычисляется по формуле (n-1) ( ( f () f 1!) . . . f (n-1)!) . ... ... . . . (2.9) f (J ) = f ( ) f () 1! 0 f ()
m f (t) = tm , т.е. для m-й степени жордановой клетки. Пусть J = (am ), т.е. (ij )-й ij m m элемент матрицы J есть aij . По предположению индукции для f (t) = tm-1 имеем

Доказательство. Вначале по индукции проверим эту формулу для многочлена

am-1 = ij

f (j -i) () =C (j - i)!

j -i m-1-j +i m-1

,

! i i где Ck = i!(kk-i)! биномиальный коэффициент; мы считаем Ck = 0 при i < 0 или m m i > k . Тогда из соотношения J = J -1 J по правилу умножения матриц вычисляем

am = ik

n j =1

am-1 a ij

1 jk

=

n j =1

j -i Cm-1

m-1-j +i

C

k-j 1-k+j 1

=
k + Cm-i1 - m+i-k

k = Cm-11-i -

m+i-k

=C

k-i m-k+i m

,

что и требовалось доказать. Осталось заметить, что формула (2.9) линейна по f , а значит она верна для любого многочлена f (t). На основе формулы (2.9) мы можем также вычислять многочлены от матриц в жордановой форме J , так как многочлен применяется к такой матрице поблочно. Теперь если A произвольная матрица, то мы можем привести е? к жордановой форме, т.е. найти жорданову матрицу J , для которой A = C J C -1 . При возведении матрицы A в степень мы получаем

Am = ( C J C
(2.10)

-1 m

) = CJ C

-1

CJ C

-1

. . . CJC
-1

-1

= C J mC

-1

.

Тогда аналогичная формула верна и для произвольного многочлена f (t):

f (A) = C f (J )C

.

При помощи этой формулы мы можем вычислить любой многочлен от матрицы A, зная е? жорданову форму и жорданов базис.
Определение 2.11.2. Пусть A оператор в комплексном пространстве с собственными значениями 1 , . . . , k кратностей r1 , . . . , rk соответственно. Говорят, что два многочлена f (t) и g (t) совпадают на спектре оператора A, если

(2.11)

f

(j )

(i ) = g (j ) (i ) при i = 1, . . . , k , j = 0, . . . , ri - 1.

Предложение 2.11.3. Если два многочлена f (t) и g (t) совпадают на спектре оператора A, то f (A) = g (A). Доказательство. При вычислении многочлена f (A) по формулам (2.9) и (2.10) используются производные многочлена f (t) в точках i порядка не выше ri - 1.


2.11. МНОГОЧЛЕНЫ И ФУНКЦИИ ОТ МАТРИЦ. ЭКСПОНЕНТА

43

Это утверждение позволяет находить многочлен f (t) большой степени от матрицы A (например, возводить матрицу в большую степень), вовсе не вычисляя е? жордановой формы, следующим образом. Если матрица A размера n, то можно найти многочлен g (t) степени не выше n - 1, удовлетворяющий соотношениям (2.11), при помощи формул интерполяции или методом неопредел?нных коэффициентов. Тогда мы имеем f (A) = g (A). Если же нам известна жорданова форма матрицы A, то можно ещ? снизить степень многочлена g , заменив в соотношениях (2.11) числа ri на числа mi размеры максимальных жордановых клеток с i на диагонали (жорданов базис для этого знать не обязательно). На самом деле формулы (2.9) и (2.10) можно использовать также для вычисления более общих функций f от операторов или матриц (а не только многочленов). Если функция f гладкая и хорошо приближается многочленами (такие функции называются аналитическими ) в окрестности собственных значений матрицы A, то можно определить f (A) как предел последовательности многочленов, получаемых обрезанием ряда Тейлора для f . При этом, однако, необходимо обосновывать сходимость получаемых последовательностей (или рядов) из матриц. Мы этого делать не буA дем, а скажем лишь, что таким образом можно определить e , sin A, cos A, а также A и ln A для матриц с положительными собственными значениями. Можно также использовать формулы (2.9) и (2.10) в качестве определения f (A) для функций f , которые определены на спектре A. Мы рассмотрим экспоненту более подробно.
Определение 2.11.4. Экспонентой оператора A называется оператор
1 A2 A3 Ak = id +A + + + .... k! 2 6 k=0 A

eA =

Предложение 2.11.5. Имеет место соотношение det e

=e

tr A

.

Доказательство. Привед?м матрицу оператора к жордановой форме: A =

CJ C

-1

. Используя формулы (2.9) и (2.10) для f (t) = et , вычисляем

det e = det(C e C

A

J

-1

) = det e =

J

k i=1

eri



i

=e



k i=1 ri i

= etr J = etr A .

Основное свойство числовой экспоненты ea eb = ea+b , вообще говоря, нарушается для экспоненты операторов. Однако есть важный случай, когда оно выполнено.

BA, то eA eB = eA

Предложение 2.11.6. Если операторы A, B : V V коммутируют, т.е. AB =
+B

.

Доказательство. Мы имеем:
k ( 1 )( 1 ) 1 1 i j ij A B= AB = Ai B ee = i! j! i!j ! i!(k - i)! i,j 0 j =0 i=0 k 0 i=0 AB k 1 k! = Ai B k ! i=0 i!(k - i!) k0 k -i k -i

=

=

1 (A + B )k = eA+B . k! k0

Коммутативность A и B используется в том месте, где (A + B )k раскладывается по формуле бинома Ньютона.



Глава 3

Геометрия евклидовых и эрмитовых пространств
3.1. Аффинные пространства, системы координат, подпространства
В геометрии на плоскости или в пространстве рассматриваются точки и векторы. Для формализацией этих понятий и взаимосвязей между ними служит понятие аффинного пространства. ящая из множества A, элементы которого называются точками, и векторного пространства V над полем k, с дополнительной операцией сложения
Определение 3.1.1. Аффинным пространством называется пара (A, V ), состо-

+ : A Ч V A,

(P, L ) P + L

для P A и L V . (Говоря неформально к точке P можно ?приложить? вектор L и тогда его ?конец? это точка P + L .) При этом требуется, чтобы операция сложения точек и векторов удовлетворяла следующим условиям: 1) P + 0 = P для любой точки P A; 2) (P + K ) + L = P + (K + L ) для любых P A, K , L V ; 3) для любых P, Q A существует единственный вектор L V , такой, что P + L = Q. Часто аффинным пространством называют просто множество точек A из определения выше (особенно когда из контекста понятно, какое векторное пространство V имеется ввиду). Вектор L , однозначно сопоставляемый паре точек P, Q A в силу свойства 3), обозначается P Q. Тогда из свойства 2) вытекает, что P Q + QR = P R. что на множестве A задано действие абелевой группы векторов пространства V . Свойство 3) по определению означает, что это действие свободно и транзитивно. Множество, на котором задано свободное и транзитивное действие группы G называется главным однородным пространством группы G. Таким образом, аффинное пространство A это главное однородное пространство абелевой группы V .
Пример 3.1.2. Замечание. Свойства 1)2) из определения аффинного пространства означают,

1. Точки плоскости и (тр?хмерного) пространства образуют аффинные пространства. Заметим, что точки ?не помнят? начала координат: все точки на плоскости или в пространстве равноправны, пока мы не ввели там систему координат. 2. Рассмотрим совместную неоднородную систему линейных уравнений Ax = b, где A матрица, а x и b столбцы. Пусть A множество решений x этой системы, а V векторное пространство решений y однородной системы Ay = 0. Тогда (A, V ) аффинное пространство. Действительно, если x A и y V , то A(x + y ) = Ax + Ay = b и поэтому x + y A. 3. Из всякого векторного пространства V можно получить аффинное пространство, взяв в качестве A множество векторов V ; при этом сложение точек и векторов
45


46

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

это просто сложение векторов в исходном пространстве V . Аффинное пространство, получаемое при помощи этой процедуры из Rn , мы будем обозначать через An .
Определение 3.1.3. Аффинной системой координат (или репером ) в аффинном пространстве (A, V ) называется набор (O, A 1 , . . . , A n ), состоящий из точки O A, называемой началом координат, и базиса A 1 , . . . , A n в векторном пространстве V . Координатами точки P A в системе координат (O, A 1 , . . . , A n ) называются координаты x1 , . . . , xn вектора OP в базисе A 1 , . . . , A n , т.е.

O P = x1 A 1 + . . . + xn A n . (A, V ) называется пара (B, W ), состоящая из подмножества B A и векторного подпространства W V , такая, что (B, W ) является аффинным пространством относительно операций в (A, V ). Эквивалентно, (B, W ) называется аффинным подпространством в (A, V ), если
1) для любых P B и M W точка P + M лежит в B; 2) для любых P, Q B вектор P Q лежит в W . способами:
Пример 3.1.5. Аффинные подпространства (B, W ) в An можно задавать двумя Определение 3.1.4. Аффинным подпространством в аффинном пространстве

а) репером, т.е. точкой P B и базисом B 1 , . . . , B k векторного пространства W Rn . При этом любая другая точка P B представляется в виде P = P + x1 B 1 + . . . + xk B k . Для такого способа задания используется обозначение

B = P + B 1 , . . . , B k .
б) как множество решений совместной неоднородной системы уравнений:

B = {x An : Ax = b}.
При этом W это пространство решений однородной системы Ax = 0. Первый способ обобщает параметрическое задание прямых и плоскостей. Второй способ обобщает задание прямых и плоскостей уравнениями. Переход от второго способа задания подпространства к первому заключается в решении неоднородной системы Ax = b: точка P это частное решение, а набор B 1 , . . . , B k это фундаментальная система решений однородной системы Ax = 0. Для перехода от первого способа задания подпространства ко второму необходимо задать линейную оболочку B 1 , . . . , B k однородной системой Ax = 0; тогда столбец b правых частей неоднородной системы Ax = b получается при подстановке координат точки P в уравнения системы Ax = 0.

3.2. Евклидовы и эрмитовы пространства, примеры. Неравенство КошиБуняковского, неравенство треугольника
Определение 3.2.1. Линейное пространство над полем R называется евклидовым, если на парах его векторов определена функция f : V Ч V R (обозначаемая (a, b) := f (a, b) и называемая скалярным произведением ), удовлетворяющая следующим свойствам:


3.2. ЕВКЛИДОВЫ И ЭРМИТОВЫ ПРОСТРАНСТВА

47

1) билинейность, т.е.

(1 K 1 + 2 K 2 , L ) = 1 (K 1 , L ) + 2 (K 2 , L ) и (K , ч1 L 1 + ч2 L 2 ) = ч1 (K , L 1 ) + ч2 (K , L 2 )
для любых 1 , 2 , ч1 , ч2 R и K , K 1 , K 2 , L , L 1 , L 2 V ; 2) симметричность : (L , K ) = (K , L ) для любых K , L V ; 3) положительная определ?нность : (L , L ) 0 для любого L V , прич?м (L , L ) = 0 только при L = 0. Свойство билинейности выражает линейность скалярного произведения по каждому из аргументов. Ввиду наличия свойства симметричности, билинейность очевидно вытекает из линейности по любому из двух аргументов.
Определение 3.2.2. Линейное пространство над полем C называется эрмитовым, (или унитарным ) если на парах его векторов определена функция f : V ЧV C (обозначаемая (a, b) := f (a, b) и называемая скалярным произведением ), удовлетворяющая следующим свойствам: 1) полуторалинейность, т.е.

(1 K 1 + 2 K 2 , L ) = 1 (K 1 , L ) + 2 (K 2 , L ) и (K , ч1 L 1 + ч2 L 2 ) = ч1 (K , L 1 ) + ч2 (K , L 2 )
для любых 1 , 2 , ч1 , ч2 C и K , K 1 , K 2 , L , L 1 , L 2 V ; 2) эрмитовость : (L , K ) = (K , L ) для любых K , L V ; в частности, (L , L ) вещественно для любого L V . 3) положительная определ?нность : (L , L ) 0 для любого L V , прич?м (L , L ) = 0 только при L = 0. Свойство полуторалинейности выражает линейность скалярного произведения по второму аргументу и антилинейность по первому. Ввиду наличия свойства эрмитовости, полуторалинейность очевидно вытекает из линейности по второму аргументу. 1. Скалярное произведение векторов K = (u1 , . . . , un ) и L = (v , . . . , v ) в пространстве Rn определяется по формуле
1

Пример 3.2.3.
n

(3.1) (3.2)

(K , L ) := u1 v 1 + u2 v 2 + . . . + un v n . (K , L ) := u1 v 1 + u2 v 2 + . . . + un v n .

Скалярное произведение векторов в Cn определяется по формуле 2. Скалярное произведение в пространстве MatC (n, n) квадратных комплексных матриц размера n зада?тся с помощью формулы n t (A, B ) := Tr(A B ) = aij bij .
i,j =1

При отождествлении пространства MatC (n, n) с Cn это скалярное произведение переходит в стандартное скалярное произведение из предыдущего примера. 3. Рассмотрим пространство C [a, b] вещественнозначных функций, непрерывных на отрезке [a, b]. Зададим скалярное произведение функций f и g по формуле b (f , g ) := f (x)g (x)dx.
2

a


48

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

Тогда свойства 1) и 2) скалярного произведения очевидны, а 3) вытекает из того, что b интеграл a f 2 (x)dx от неотрицательной функции f 2 (x) неотрицателен и обращается в нуль только при f (x) 0. Аналогично, скалярное произведение в пространстве комплекснозначных функb ций можно определить по формуле (f , g ) := a f (x)g (x)dx.

V величина (L , L ) называется длиной вектора L и обозначается |L |. Векторы K , L V , скалярное произведение которых равно нулю, называются перпендикулярными или ортогональными. В этом случае пишут K L .
Предложение 3.2.5. Пусть K ненулевой вектор евклидова или эрмитова пространства V . Тогда для любого вектора L V существует единственное разложение L = L1 + L2 , где вектор L1 коллинеарен вектору K, а вектор L2 ортогонален K.

Определение 3.2.4. Пусть V евклидово или эрмитово пространство. Для

L

L = L 1 + L 2 такое разложение. Тогда для R имеем L 1 = K , L 2 = L - K . Условие K L 2 влеч?т
Доказательство. Сначала докажем единственность. Пусть

0 = (K , L 2 ) = (K , L - K ) = (K , L ) - (K , K ).
Отсюда = (K , L )/(K , K ) и (3.3)

L1 =

(K , L ) K. (K , K )

Тем самым векторы L 1 и L 2 = L - L 1 определены однозначно. С другой стороны, определив L 1 по этой формуле, мы получим L 2 = (L - L 1 ) K .

L на направление вектора K и обозначается prK L , а вектор L - prK L называется ортогональной составляющей вектора L относительно K и обозначается ortK L .
Длина ортогональной проекции вычисляется по формуле ( (K , L ) (K , L ) ) (K , L )(K , L ) |(K , L )| | prK L | = (prK L , prK L ) = K, K= = . (K , K ) (K , K ) (K , K ) |K |

Определение 3.2.6. Вектор (3.3) называется ортогональной проекцией вектора

K, L евклидова или эрмитова пространства имеет место неравенство
|(K, L)|
Доказательство. Если

Теорема 3.2.7 (неравенство КошиБуняковского). Для любых двух векторов

|K| ћ |L|,

причем равенство имеет место только в случае, когда векторы K, L коллинеарны.

K = 0, утверждение очевидно. Пусть K = 0. Запишем L = L 1 + L 2 , где L 1 = prK L и L 2 = ortK L . Тогда (L 1 , L 2 ) = 0, и мы имеем
|L |2 = (L , L ) = (L 1 + L 2 , L 1 + L 2 ) = (L 1 , L 1 ) + (L 1 , L 2 ) + (L 2 , L 1 ) + (L 2 , L 2 ) = |L 1 |2 + |L 2 |2 .
Отсюда |L 1 | |L |, прич?м равенство достигается только при L 2 = 0, т.е. когда вектор , L коллинеарен вектору K . Осталось заметить, что |L 1 | = | prK L | = |(KKL )| , так что || неравенство |L 1 | |L | эквивалентно требуемому.


3.3. ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ВЕКТОРОВ

49

Определение 3.2.8. Углом между двумя ненулевыми векторами K , L евклидова пространства называется величина (K , L ) (K , L ) := arccos [0, ]. | K | |L | Неравенство КошиБуняковского гарантирует, что угол между ненулевыми векторами всегда определен.

евклидова или эрмитова пространства выполнено неравенство

Следствие 3.2.9 (неравенство треугольника). Для любых двух векторов

K, L

|K + L|

|K| + |L|.

ны, поэтому при возведении в квадрат получается равносильное неравенство

Доказательство. В обеих частях неравенства стоят неотрицательные величи-

(K + L , K + L )

(K , K ) + (L , L ) + 2|K | |L |.

После раскрытия скобок в левой части и сокращения подобных членов мы получаем следующее неравенство: (K , L ) + (L , K ) 2|K | |L |, которое следует из неравенства КошиБуняковского.

3.3. Ортогональные системы векторов, ортонормированные базисы. Ортогонализация ГрамаШмидта
Предложение 3.3.1. Пусть L1 , . . . , Lk набор попарно ортогональных ненулевых векторов евклидова или эрмитова пространства. Тогда эти векторы линейно независимы.

равна нулю:

Доказательство. Пусть некоторая линейная комбинация данных векторов
k i=1

i L i = 0 .

Умножим обе части этого равенства скалярно на L j и воспользуемся линейностью скалярного произведения по второму аргументу: k k ( ) 0 = L j, i L i = i (L j , L i ) = j (L j , L j ),
i=1 i=1

так как по условию остальные слагаемые в этой сумме равны нулю. Поскольку по условию L j = 0, из положительной определенности скалярного произведения следует, что (L j , L j ) = 0, а значит, j = 0. Это выполнено для любого j = 1, . . . , k , следовательно, линейная комбинация k=1 i L i тривиальна. i
Определение 3.3.2. Базис A 1 , . . . , A n евклидова или эрмитова пространства называется ортогональным, если его векторы попарно ортогональны. Если при этом длина каждого вектора равна 1, то базис называется ортонормированным. Теорема 3.3.3. Пусть =1 , . . . , =k набор линейно независимых векторов пространства V . Тогда существует такой набор попарно ортогональных векторов >1 , . . . , >k , что для каждого i = 1, . . . , k линейная оболочка >1 , . . . , >i совпадает с =1 , . . . , =i .


50

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

Доказательство. При k = 1 утверждение очевидно: можно взять > 1 = = 1 . Предположим, что утверждение верно для наборов из i векторов, и докажем его для наборов из i + 1 вектора. Пусть > 1 , . . . , > i ортогональный набор, построенный по набору = 1 , . . . , = i . Мы хотим, чтобы для нового вектора > i+1 линейная оболочка > 1 , . . . , > i , > i+1 совпадала с = 1 , . . . , = i , = i+1 = > 1 , . . . , > i , = i+1 , и поэтому будем искать > i+1 в виде > i+1 = = i+1 + 1 > 1 + . . . + i > i . Коэффициенты 1 , . . . , i будем подбирать так, чтобы вектор > i+1 был ортогонален всем предыдущим векторам > 1 , . . . , > i . Умножив скалярно предыдущее равенство слева на > j и использовав то, что (> j , > ) = 0 при j = , получаем

0 = (> j , >
(> ,

i+1

) = (> j , =

i+1

) + j (> j , > j ),

j i откуда j = - (> j ,>+1 для j = 1, . . . , i. Окончательно для вектора > i+1 получаем j) (> , = ) (> , = ) (> , = ) > i+1 = = i+1 - 1 i+1 > 1 - 2 i+1 > 2 - . . . - i i+1 > i = (> 1 , > 1 ) (> 2 , > 2 ) (> i , > i ) (3.4) = = i+1 - pr> 1 = i+1 - pr> 2 = i+1 - . . . - pr> i = i+1 .

=

)

При этом > i+1 = 0 (так как > 1 . . . , > i , = i+1 линейно независимы), > i+1 ортогонален векторам > 1 , . . . , > i , а > 1 , . . . , > i , > i+1 = > 1 , . . . , > i , = i+1 = = 1 , . . . , = i , = i+1 . Индуктивная процедура перехода от набора = 1 . . . , = k к ортогональному набору > 1 , . . . , > k называется процессом ортогонализации ГрамаШмидта. Условие > 1 , . . . , > i = = 1 , . . . , = i при i = 1, . . . , k означает, что матрица перехода от = 1 . . . , = k к > 1 , . . . , > k является верхнетреугольной.

ортонормированные базисы.

Следствие 3.3.4. В евклидовом или эрмитовом пространстве V существуют

Доказательство. Действительно, возьм?м произвольный базис пространства V и применим к нему ортогонализацию ГрамаШмидта. В результате получим ортогональный базис > 1 , . . . , > n . Тогда базис, состоящий из векторов |> 1 | , . . . , |> n | будет >1 >n ортонормированным.

v 1 , . . . , v n в некотором ортонормированном базисе евклидова или эрмитова пространства V . Тогда их скалярное произведение вычисляется по формуле (K, L) = u1 v 1 + u2 v 2 + . . . + un v n . ? ? ? (u A i , v A j ) = u v (A i , A j ) = u v ij = u1 v 1 + u2 v 2 + . . . + un v n . ? ? ? ? ?
i j ij ij

Предложение 3.3.5. Пусть векторы

K и L имеют координаты u1 , . . . , un и

Доказательство. Пусть

A 1 , . . . , A n ортонормированный базис. Тогда (K , L ) =

3.4. Ортогональные и унитарные матрицы. QR-разложение
Определение 3.4.1. Матрица перехода от одного ортонормированного базиса евклидова (соответственно, эрмитова) пространства к другому ортонормированному базису называется ортогональной (соответственно, унитарной ). Предложение 3.4.2. Следующие условия эквивалентны:

а) матрица C ортогональна (соответственно, унитарна); t б) C t C = E (соответственно, C C = E );


3.4. ОРТОГОНАЛЬНЫЕ И УНИТАРНЫЕ МАТРИЦЫ. QR-РАЗЛОЖЕНИЕ

51
n

в) столбцы матрицы C образуют ортонормированный базис пространства R (соответственно, пространства Cn ); г) C C t = E (соответственно, C C t = E ); д) строки матрицы C образуют ортонормированный базис пространства R (соответственно, пространства Cn ).
t

n

Доказательство. Условия б) и г) эквивалентны, так как каждое из них экви-

валентно равенству C t = C -1 (соответственно, C = C -1 ). Эквивалентности б) в) и г) д) вытекают из правила умножения матриц и формул (3.1) и (3.2) для скалярного произведения в Rn и Cn . Докажем импликацию а) б). Пусть A 1 , . . . , A n и A 1 , . . . , A n два ортонормированных базиса в эрмитовом пространстве и C = (ci ) матрица перехода, т.е. i A i = ci A i . Тогда (A i , A j ) = ij и (A i , A j ) = i j , откуда i (3.5)



i j



= (A i , A j ) = (ci A i , cj A j ) = ci cj (A i , A j ) = ci cj ij = ci ij cj . i ij ij i j j

Согласно правилу умножения матриц, это эквивалентно матричному соотношению t t E = C E C или C C = E . Случай евклидова пространства рассматривается аналогично. t Осталось доказать импликацию б) а). Пусть имеет место тождество C C = E или, в обозначениях Эйнштейна, ci ij cj = i j . Возьм?м произвольный ортонорi j мированный базис A 1 , . . . , A n . Из соотношения C C = E вытекает, что матрица C невырождена, и поэтому можно рассмотреть новый базис A 1 , . . . , A n , где A i = ci A i . i Тогда аналогично выкладке (3.5) мы получаем (A i , A j ) = ci ij cj = i j , т.е. базис i j A 1 , . . . , A n также ортонормирован, и C матрица перехода от одного ортонормированного базиса к другому.
t

Теорема 3.4.3 (QR-разложение). Для любой невырожденной вещественной (соответственно, комплексной) матрицы A имеет место разложение

A = QR,
где Q ортогональная (соответственно, унитарная) матрица, а R верхнетреугольная матрица с положительными числами на диагонали.
ящий из столбцов матрицы A. Применив к нему ортогонализацию ГрамаШмидта, получим ортогональный базис > 1 , . . . , > n . Пусть C матрица перехода, т.е.
Доказательство. Пусть

= 1 , . . . , = n базис пространства Rn (или Cn ), состо-

(> 1 . . . > n ) = (= 1 . . . = n ) C
или B = AC , где B матрица, столбцы которой суть > 1 , . . . , > n . При этом матрица C верхнетреугольная с единицами на диагонали (это следует из соотношений (3.4)). Если мы видоизменим процедуру ортогонализации ГрамаШмидта и на каждом ша>i ге вместо вектора > i будем брать > i = |> i | , то полученная матрица B = (> 1 , . . . , > n ) будет ортогональной. При этом мы будем иметь B = AC , где C верхнетреуголь1 ная матрица, на диагонали которой стоят положительные числа |> i | . Тогда положив

Q = B и R = C

-1

, мы получим требуемое разложение A = QR.

Замечание. QR-разложение имеет место также и для вырожденных матриц A (при этом на диагонали R могут стоять нули), а также для прямоугольных матриц A произвольного размера (задача).


52

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

3.5. Ортогональное дополнение. Проекция и ортогональная составляющая. Угол между вектором и подпространством
пространства. Ортогональным дополнением к W называется множество W , состоящее из векторов, ортогональных всем векторам из W , т.е.
Определение 3.5.1. Пусть W V подпространство евклидова или эрмитова

W



= {L V : (L , M ) = 0 для всех M W }.


Легко видеть, что ортогональное дополнение W

является подпространством.

ложение V = W W .

Предложение 3.5.2. Для любого подпространства W V имеет место раз-

Доказательство. Пусть = 1 , . . . , = k базис в W , дополним его до базиса всего пространства V векторами = k+1 , . . . , = n . Применив ортогонализацию Грама Шмидта, получим ортогональный базис > 1 , . . . , > k , > k+1 , . . . , > n в V , прич?м его первые k векторов будут базисом в W , так как > 1 , . . . , > k = = 1 , . . . , = k = W . В то же время > k+1 , . . . , > n лежат в W по определению ортогонального дополнения. Итак, для любого вектора L V мы имеем разложение по базису

L = 1 > 1 + . . . + k > k +
W

k+1 k+1

>

+ . . . + n > n ,
W


т.е. V = W + W . Осталось доказать, что эта сумма прямая. Пусть L W W . Так как L W , мы имеем (L , M ) = 0 для всех M W . Так как L W , в качестве M мы можем взять сам вектор L . Тогда (L , L ) = 0, т.е. L = 0 и сумма прямая. пространства. Для произвольного вектора L V запишем разложение L = L 1 + L 2 , где L 1 W , а L 2 W . Тогда вектор L 1 называется ортогональной проекцией вектора L на подпространство W и обозначается prW L , а вектор L 2 = L - prW L называется ортогональной составляющей вектора L относительно подпространства W и обозначается ortW L . Ясно, что ortW L = pr
W


Определение 3.5.3. Пусть W V подпространство евклидова или эрмитова

L.

Предложение 3.5.4. Пусть подпространство W V задано как линейная оболочка системы векторов: W = =1 , . . . , =k . Тогда проекция вектора L V на W есть линейная комбинация

prW L = 1 =1 + . . . + k =k ,
коэффициенты которой находятся из системы (=1 , =1 )1 + (=1 , =2 )2 + . . . + (= , = ) + (= , = ) + . . . + 2 11 2 22 (=k , =1 )1 + (=k , =2 )2 + . . . +
Доказательство. Запишем

линейных уравнений (=1 , =k )k = (=1 , L),

(=2 , =k )k = (=2 , L), ћћћћћћ (=k , =k )k = (=k , L).

L = prW L + ortW L . Тогда вектор ortW L = L - 1 = 1 - . . . - k = k ортогонален каждому из векторов = 1 , . . . , = k . Взяв скалярное произведение = i с ortW L , мы получаем (= i , L - 1 = 1 - . . . - k = k ) = 0,


3.6. АФФИННЫЕ ЕВКЛИДОВЫ ПРОСТРАНСТВА. РАССТОЯНИЯ

53

что эквивалентно i-му уравнению системы.

L V и подпространством W V называется наименьший из углов между L и произвольным вектором M W :
(L , W ) := min (L , M ).
M
W

Определение 3.5.5. Пусть V евклидово пространство. Углом между вектором

Формально угол (L , W ) нужно было определить как точную нижнюю грань углов между L и M W , но легко видеть, что множество таких углов замкнуто и поэтому точная нижняя грань достигается на некотором векторе M W . На самом деле этот вектор есть prW L , как показано в следующем утверждении.

между вектором и его проекцией на это подпространство:

Предложение 3.5.6. Угол между вектором и подпространством равен углу

(L, W ) = (L, prW L).
Доказательство. Пусть M W произвольный вектор. Обозначим = (L , prW L ), = (L , M ) и L 1 = prW L . Необходимо показать, что . Так как 0 , , неравенство эквивалентно неравенству cos cos , т.е.

(3.6)

(L , L 1 ) |L | |L 1 |

(L , M ) . |L | |M |

Запишем L = L 1 + L 2 , где L 2 = ortW L W . Тогда (L , L 1 ) = (L 1 + L 2 , L 1 ) = |L 1 |2 (L 1 , M ) и (L , M ) = (L 1 + L 2 , M ) = (L 1 , M ). Подставив это в (3.6), получим |L 1 | , что |M | вытекает из неравенства КошиБуняковского.

3.6. Аффинные евклидовы пространства. Расстояние от точки до подпространства. Расстояние между подпространствами
Определение 3.6.1. Аффинное пространство (A, V ) называется евклидовым, если линейное пространство V является евклидовым. Расстоянием между точками P и Q аффинного евклидова пространства (A, V ) называется длина вектора P Q:

d(P, Q) := |P Q|.
Расстоянием между точкой P и аффинным подпространством (B, W ) называется наименьшее из расстояний между P и произвольной точкой Q B:

d(P, B) := min d(P, Q).
QB

Расстоянием между аффинными подпространствами (C, U ) и (B, W ) называется наименьшее из расстояний между точками P C и Q B:

d(C, B) :=

P C, QB

min

d(P, Q).

Следующее утверждение обобщает утверждения о расстоянии между точкой и прямой или плоскостью из аналитической геометрии.


54

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

Теорема 3.6.2. Расстояние между точкой P и аффинным подпространством (B, W ) равно длине ортогональной составляющей вектора P Q, соединяющего P с произвольной точкой Q B, относительно пространства W :

d(P, B) = | ortW P Q|

для любой точки Q B.

Доказательство. Вначале мы докажем, что ортогональная составляющая ortW P Q не зависит от выбора точки Q B. Пусть Q B другая точка. Мы имеем P Q = prW P Q + ortW P Q и P Q = prW P Q + ortW P Q . С другой стороны, P Q = P Q + QQ , где QQ W . Тогда

P Q = prW P Q + ortW P Q = QQ + P Q = QQ + prW P Q + ortW P Q .
W W


W

W



Отсюда в силу единственности разложения вектора в прямой сумме V = W W получаем ortW P Q = ortW P Q, что и требовалось. Теперь докажем, что для любой точки Q B мы имеем |P Q| | ortW P Q|. Действительно,

|P Q|2 = (P Q, P Q) = (prW P Q + ortW P Q, prW P Q + ortW P Q) = = (prW P Q, prW P Q) + (ortW P Q, ortW P Q) = | prW P Q|2 + | ortW P Q|2 | ortW P Q|2 ,
где в предпоследнем равенстве мы воспользовались тем, что (prW P Q, ortW P Q) = 0. Следовательно, d(P, B) = minQB |P Q| | ortW P Q|. Осталось доказать, что значение | ortW P Q| достигается, т.е. |P Q | = | ortW P Q| для некоторой точки Q B. Для этого возьм?м в качестве Q точку P + ortW P Q. Тогда, по определению расстояния, |P Q | = | ortW P Q|. C другой стороны,

Q = P + ortW P Q = P + P Q - prW P Q = Q - prW P Q,
где Q B и prW P Q W , т.е. Q B. В аналитической геометрии расстояние между скрещивающимися прямыми в пространстве вычислялось как длина их общего перпендикуляра. Аналогичным образом вычисляется расстояние между аффинными подпространствами в общем случае:

(C, U ) и (B, W ) равно длине ортогональной составляющей вектора P Q, соединяющего произвольную точку P C с произвольной точкой Q B, относительно пространства U + W : d(C, B) = | ort
U +W

Теорема 3.6.3. Расстояние между двумя аффинными подпространствами

P Q|

для любых точек P C, Q B.

Доказательство. Доказательство аналогично предыдущему. Вначале докажем, что ортогональная составляющая ortU +W P Q не зависит от выбора точек P C, Q B. Пусть P C, Q B другие точки. Мы имеем P Q = prU +W P Q + ortU +W P Q и P Q = prU +W P Q + ortU +W P Q . С другой стороны, P Q = P P + P Q + QQ , где P P U и QQ W . Тогда

P Q = pr

U +W

P Q + ort

U +W

P Q = P P + QQ + pr
U +W

U +W

P Q + ort

U +W

PQ.

U +W

(U +W )

(U +W )

Отсюда в силу единственности разложения вектора в прямой сумме получаем ortU +W P Q = ortU +W P Q, что и требовалось.


3.7. ОПРЕДЕЛИТЕЛЬ МАТРИЦЫ ГРАМА И МНОГОМЕРНЫЙ ОБЪЕМ

55

Так же, как в предыдущем предложении, мы доказываем, что для P C и Q B мы имеем |P Q| | ortU +W P Q|. Следовательно,

d(C, B) =

P C, QB

min

|P Q|

| ort

U +W

P Q|.

Осталось доказать, что значение | ortU +W P Q| достигается в некоторой паре точек, т.е. |P Q | = | ortU +W P Q| для некоторых точек P C, Q B. Запишем вектор prU +W P Q U + W в виде суммы: (3.7)

pr

U +W

PQ = K + M,

где K U и M W . Теперь возьм?м P = P + K , тогда очевидно P (C, U ). Далее, возьм?м Q = P + ortU +W P Q. Тогда, по определению расстояния, |P Q | = | ortU +W P Q|. C другой стороны,

Q = P + ort

U +W

P Q = P + K + P Q - prU

+W

PQ = Q - M,

где Q B и M W , т.е. Q (B, W ). Если d(C, B) = 0, то точки P и Q , найденные в предыдущем доказательстве, различны. Прямая, содержащая P и Q , перпендикулярна каждому из подпространств (C, U ) и (B, W ) и называется их общим перпендикуляром. Такая прямая единственна тогда и только тогда, когда векторы K и M в разложении (3.7) определены однозначно, т.е. когда U W = {0}. Например, это так в случае скрещивающихся прямых в 3-мерном пространстве.

3.7. Определитель матрицы Грама и многомерный объ?м
матрица
Определение 3.7.1. Матрицей Грама системы векторов

= 1 , . . . , = k называется
1 2

(= 1 , = 1 ) (= (= 2 , = 1 ) (= G = G(= 1 , . . . , = k ) = . . . (= k , = 1 ) (=



1 2

k

, = 2 ) . . . (= , = 2 ) . . . (= . .. . . . , = 2 ) . . . (=

k

, = k) , = k ) . . . . , = k)
t

Матрица G симметрична (Gt = G) в евклидовом пространстве и эрмитова (G = G) в эрмитовом. Матрица Грама уже появлялась как матрица системы для нахождения коэффициентов проекции вектора на подпространство = 1 , . . . , = k (см. предложение 3.5.4).
Предложение 3.7.2. Пусть G матрица Грама системы векторов =1 , . . . , =k , а A = (ai ) матрица, в столбцы которой записаны координаты векторов =1 , . . . , =k j в некотором ортонормированном базисе. Тогда имеет место соотношение

G=AA

t

(G = At A в евклидовом пространстве).

Доказательство. Это следует из закона умножения матриц и формулы для скалярного произведения в ортонормированном базисе (предложение 3.3.5).


56

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

= 1 , . . . , = k набор векторов в линейном пространстве V . Параллелепипедом с вершиной в точке P , натянутым на векторы = 1 , . . . , = k , называется следующее множество
точек аффинного пространства A:

Определение 3.7.3. Пусть P (A, V ) точка в аффинном пространстве, а

(P ; = 1 , . . . , = k ) := {Q A : Q = P + x1 = 1 + . . . + xn = k ,

0

xi

1}.

Определение 3.7.4. Определим k -мерный объ?м volk параллелепипеда (P ; = 1 , . . . , = k ) в аффинном евклидовом пространстве индуктивно: 1) одномерный объ?м vol1 (P ; = 1 ) := |= 1 | это длина вектора; 2) volk (P ; = 1 , . . . , = k ) := volk-1 (P ; = 1 , . . . , = k-1 ) ћ | ort= 1 ,...,= k-1 = k |.

Это определение обобщает определение площади параллелограмма (или объ?ма 3-мерного параллелепипеда) как произведение длины (или площади) основания на высоту. Из определения объ?ма volk (P ; = 1 , . . . , = k ) видно, что он не зависит от вершины P ; поэтому далее мы будем использовать обозначение volk (= 1 , . . . , = k ).
Теорема 3.7.5. Квадрат объ?ма равен определителю матрицы Грама:

(

)2 volk (=1 , . . . , =k ) = det G(=1 , . . . , =k ).

В частности, объ?м volk (=1 , . . . , =k ) не зависит от порядка векторов.
Пусть утверждение доказано для volk-1 , докажем его для volk . Рассмотрим разложение = k = pr= 1 ,...,= k-1 = k + ort= 1 ,...,= k-1 = k , где pr= 1 ,...,= k-1 = k = 1 = 1 + . . . + k-1 = k-1 , и обозначим > = ort= 1 ,...,= k-1 = k . Тогда (= i , > ) = 0 при i = 1, . . . , k - 1 и (= k , > ) = (> , > ). Мы имеем
(= 1 , = 1 ) det G = (= k , = 1 ) (= 1 , = 1 ) =
1
. . .

Доказательство. Индукция по k . При k = 1, очевидно, |

= 1 |2 = (= 1 , = 1 ).

...
. . .

(= 1 , = k ) (= k , = k )
k -1
. . .

(= 1 , = 1 ) = (= k , = 1 ) (= 1 , = 1 )
. . . . . .

...
. . .

(= 1 , = (= k , =
. . .

k -1

) (= 1 , 1 = 1 + . . . + k
. . .

-1

= =

k-1

+ >) = + >) ) + )

...

...

k-1

) (= k , 1 = 1 + . . . + k ...
. . .

-1

k -1

...
. . .

(= 1 , = (= k , = ...
. . . . . .

)

(= 1 , = 1 ) + . . . + k
-1
. . .

(= 1 , = (= k , = (= 1 , =
. . . . . .

k -1

)

(= 1 , =
. . .

k-1

(= k , = 1 ) (= 1 , = 1 ) +
. . .

. . .

...

k-1

) (= k , = 1 )
k-1

(= k , = 1 ) . . . (= 1 , = 1 ) = (= k-1 , = 1 ) (= k , = 1 )
. . .

k -1

) (= k , = 0
. . .

k -1

(= 1 , =
. . .

)

(= 1 , > )
. . .

...
. . .

k-1

) )

(= k-1 , = 1 ) (= k , = 1 ) ...
. . . . . .

... ...

(= k-1 , = (= k , = k
k -1

k -1 -1

) ( = k -1 , > ) ) (= k , > )

... ...

( = k -1 , = (= k , = k

=

k -1 -1

)

0 (> , > )

(= 1 , = 1 ) = (=
k-1

(= 1 , = (=
. . .

) )

, = 1) . . .

k -1

,=

( ћ (> , > ) = vol

k -1

(= 1 , . . . , =

k -1

)2 ( )2 ) |> |2 = volk (= 1 , . . . , = k ) .

k-1

Следствие 3.7.6. Векторы =1 , . . . , =k линейно зависимы тогда и только тогда, когда det G(=1 , . . . , =k ) = 0. Доказательство. Действительно, предположим, что векторы = 1 , . . . , = k линейно зависимы. Можно считать, что = k линейно выражается через = 1 , . . . , = k-1 . Тогда


3.8. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

57

ort=

)2 ( det G = volk (= 1 , . . . , = k ) = volk

1

,...,

=

k-1



(

= k = 0 и, следовательно,

-1

(= 1 , . . . , =

k -1

)2 ) | ort=

1

,...,

=

k-1



= k |2 = 0.

Обратно, пусть det G = (volk (= 1 , . . . , = k ))2 определения объема, мы имеем voli (= 1 , . . . , = i ) некоторого i. Так как voli (= 1 , . . . , = i ) = voli-1 означает, что ort= 1 ,...,= i-1 = i = 0, т.е. = i линейно

= 0. Тогда, в силу индуктивного = 0, а voli-1 (= 1 , . . . , = i-1 ) = 0 для (= 1 , . . . , = i-1 )| ort= 1 ,...,= i-1 = i |, это выражается через = 1 , . . . , = i-1 .

динат векторов =1 , . . . , =n в некотором ортонормированном базисе. Тогда

Следствие 3.7.7. Пусть dim V = n и A = (ai ) квадратная матрица из коорj

voln (=1 , . . . , =n ) = | det A|.
Доказательство. Из предложения 3.7.2 и предыдущей теоремы получаем

(

)2 voln (= 1 , . . . , = n ) = det G = det(At A) = (det A)2 .

3.8. Метод наименьших квадратов
Часто на практике при исследовании какого-нибудь природного или социального явления делается допущение, что это явление описывается линейной формулой. Точнее, мы предполагаем, что некоторая величина b линейно зависит от других величин a1 , . . . , an , и хотим найти эту зависимость

b = a1 x1 + . . . + an xn ,
т.е. найти неизвестные коэффициенты x1 , . . . , xn (это называется моделью линейной регрессии ). Для нахождения зависимости b от a1 , . . . , an делается большое число m измерений (как правило m n), и по таблице измеренных значений записывается система линейных уравнений 11 1n 1 a1 x + . . . + an x = b ћћћ ћћћ ћћћ (3.8) m1 a1 x + . . . + am xn = bm n в которой число неизвестных меньше числа уравнений. Такая система, как правило, несовместна. Поэтому находится ?наилучшее приближ?нное? решение x1 , . . . , xn , для которого отклонение значений bi от ai xj = ai x1 + . . . + ai xn будет наименьшим. j 1 n Метод наименьших квадратов решает задачу нахождения наилучшего приближ?нного решения в предположении, что в качестве меры отклонения бер?тся сумма квадратов разностей величин ai x1 + . . . + ai xn и bi . n 1 который минимизирует сумму квадратов разностей левых и правых частей уравнений системы, т.е. минимизирует величину (3.9)
m (a1 xj - b1 )2 + (a2 xj - b2 )2 + . . . + (aj xj - bm )2 j j

Определение 3.8.1. Псевдорешением системы (3.8) называется набор x1 , . . . , xn , ~ ~

по всем (x1 , . . . , xn ) Rn . Эта величина называется квадратичным отклонением. Пусть A = (ai ) матрица системы (3.8), = 1 , . . . , = j этой матрицы, а > Rm вектор правых частей.
n

R

m

векторы-столбцы


58

3. ГЕОМЕТРИЯ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

Теорема 3.8.2. Псевдорешение системы (3.8) находится как решение системы

1 n (=1 , =1 )x + . . . + (=1 , =n )x = (=1 , >), ћћћ ћћћ ћћћ ћћћ 1 n (=n , =1 )x + . . . + (=n , =n )x = (=n , >).

Другими словами, псевдорешение это набор коэффициентов в разложении проекции pr=1 ,...,=n > по векторам =1 , . . . , =n , а квадратичное отклонение псевдорешения это квадрат длины вектора ort=1 ,...,=n >.
это по определению квадрат длины вектора = j x - > , т.е. квадрат расстояния между точками > и = j xj = 1 , . . . , = n аффинного пространства Am . Мы знаем из теоремы 3.6.2, что расстояние между > и точкой = j xj подпространства = 1 , . . . , = n минимально, когда = j xj это проекция вектора > на = 1 , . . . , = n . Коэффициенты в разложении проекции по векторам подпространства находятся из указанной системы (предложение 3.5.4), a минимальное расстояние равно | ort= 1 ,...,= n > |.
n j

Доказательство. Квадратичное отклонение (3.9) набора x1 , . . . , x

Аналогично, методом наименьших квадратов можно находить более сложные зависимости величины b от a1 , . . . , an . Например, в случае неоднородной линейной зависимости b = x0 + a1 x1 + . . . + an xn можно находить коэффициенты x0 , x1 , . . . , xn . В случае, когда предполагаемая зависимость b от одной величины a выражается многочленом n-й степени b = x0 + ax1 + a2 x2 + . . . + an xn с неизвестными коэффициентами x0 , x1 , . . . , xn , метод наименьших квадратов позволяет находить наилучшее приближение для этих коэффициентов.

3.9. Изоморфизмы евклидовых и эрмитовых пространств. Канонический изоморфизм евклидова пространства и его сопряж?нного
Определение 3.9.1. Два евклидовых или эрмитовых пространства V и W называются изоморфными, если существует изоморфизм линейных пространств A : V W , сохраняющий скалярное произведение, т.е. ( ) AK , AL = (K , L ) для любых K , L V . Предложение 3.9.2. Два евклидовых или эрмитовых пространства V и W изоморфны тогда и только тогда, когда их размерности совпадают. Доказательство. Если V и W изоморфны как евклидовы (эрмитовы) пространства, то они изоморфны как линейные пространства, а потому dim V = dim W . Доказательство обратного утверждения аналогично доказательству соответствующего утверждения для линейных пространств (теорема 1.7.3): изоморфизм между евклидовыми (эрмитовыми) пространствами n устанавливается при помощи взаимно однозначного соответствия между базисами A 1 , . . . , A n в V и B 1 , . . . , B n в W . Для того, чтобы получаемый изоморфизм линейных пространств A : V W сохранял скалярное произведение, базисы необходимо выбрать ортонормированными. В этом случае мы имеем B i = AA i и (A i , A j ) = (B i , B j ) = ij . Поэтому для любых векторов K = ui A i и L = v j A j из V мы имеем

(AK , AL ) = ui v j (AA i , AA j ) = ui v j (B i , B j ) = ui v j ij =

n i=1

ui v i = (K , L ),


3.9. ИЗОМОРФИЗМЫ ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВ

59

т.е. изоморфизм A сохраняет скалярное произведение. Так как пространства V и V имеют одну размерность (в конечномерном случае), они изоморфны. Однако построение изоморфизма между ними требует выбора базисов и в этом смысле неканонично. Оказывается, что в присутствии скалярного произведения можно установить изоморфизм V V каноническим образом, т.е. не прибегая к выбору базисов. Пусть V евклидово пространство. Каждому вектору K V сопоставим линейную функцию K = (K , ћ ), заданную по формуле K (L ) = (K , L ).
Теорема 3.9.3. Пусть V евклидово пространство. Отображение K K = (K, ћ ) устанавливает канонический изоморфизм A : V V .

скалярного проверить, Пусть L M V . Но

Доказательство. Линейность отображения

K K вытекает из линейности произведения по первому аргументу. Так как dim V = dim V , чтобы что A : V V изоморфизм, достаточно проверить, что Ker A = {0}. Ker A, т.е. AL = L = o. Следовательно, L (M ) = (L , M ) = 0 для любого тогда и (L , L ) = 0, значит L = 0 и ядро отображения A нулевое.

Аналогичным образом для эрмитова пространства V устанавливается канонический изоморфизм V V , K (K , ћ ), где V комплексно сопряж?нное пространство (с умножением на скаляры, определ?нным по формуле ћ L := L ). Это позволяет отождествить два понятия ?сопряж?нного? пространства для эрмитова пространства V .



Глава 4

Операторы в евклидовых и эрмитовых пространствах
4.1. Сопряж?нные операторы в евклидовых и эрмитовых пространствах
Пусть A : V V линейный оператор в евклидовом пространстве V . В разделе 1.11 мы определили сопряж?нное линейное отображение A : V V по формуле

(A )(L ) := (AL )

для V , L V .

При каноническом отождествлении V V , K K = (K , ћ ) оператор A : V V переходит в оператор A : V V , (который мы для простоты будем обозначать тем же символом A ), удовлетворяющий соотношению AK = A K для любого вектора K V . Чтобы установить связь между A : V V и A : V V непосредственно, вычислим значение линейных функций AK и A K на векторе L V :

(A K )(L ) = K (AL ) = (K , AL ). Так как AK = A K , мы получаем (A K , L ) = (K , AL ) для любых K , L V .
Определение 4.1.1. Пусть A : V V оператор в евклидовом или эрмитовом пространстве V . Линейный оператор A : V V , удовлетворяющий соотношению

AK (L ) = (A K , L ),

(A K , L ) = (K , AL )
для любых K , L V , называется сопряж?нным к A. Соотношение (A K , L ) = (K тельно, если (A K , L ) = (K , AL ) ((A - A )K , L ) = 0 для любых т.е. (A - A )K = 0 для любого

, AL ) определяет оператор A однозначно. Действидля другого оператора A : V V , то мы получаем K , L V . В частности, ((A - A )K , (A - A )K ) = 0, K V . Следовательно, A = A .

рованном базисе евклидова (эрмитова) пространства V . Тогда матрица сопряж?нt ного оператора A : V V в том же базисе есть At (соответственно, A ).
отображения), но мы также дадим прямое доказательство. Пусть A 1 , . . . , A n ортонормированный базис, A = (ai ) матрица оператора A : V V в этом базисе, а j A = (ai ) матрица оператора A : V V . Тогда мы имеем j
Доказательство. Это следует из предложения 1.11.2 (о матрице сопряж?нного

Предложение 4.1.2. Пусть A матрица оператора A : V V в ортонорми-

(AA j , A k ) = (ai A i , A k ) = ai (A i , A k ) = ai ik = ak , j j j j (A j , A A k ) = (A j , ai A i ) = ai (A j , A i ) = ai j i = aj . k k k k
Так как (AA j , A k ) = (A j , A A k ), мы получаем ak = aj или A = A. j k
t

Предложение 4.1.3. Имеют место следующие равенства:

а) (A + B ) = A + B ,

(A) = A ;
61


62

4. ОПЕРАТОРЫ В ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВАХ

б) (AB ) = B A . благодаря предложению 4.1.2.
Доказательство. Это следует из свойств операции транспонирования матриц,

Докажем ключевую лемму, которая нам не раз понадобится в дальнейшем.

то W

Лемма 4.1.4. Если W V инвариантное подпространство относительно A,


инвариантное подпространство относительно A .

K W . Тогда для любого M W имеем (A K , M ) = (K , AM ) = 0 так как AM W , а K W . Следовательно, A K W .
Доказательство. Пусть

4.2. Самосопряж?нные операторы. Канонический вид
странстве называется самосопряж?нным, если A = A, т.е. выполнено соотношение
Определение 4.2.1. Оператор A : V V в евклидовом или эрмитовом про-

(AK , L ) = (K , AL )
для любых K , L V .
Предложение 4.2.2. Матрица A самосопряж?нного оператора A в ортонор-

мированном базисе евклидова (эрмитова) пространства симметрична (эрмитова), t т.е. At = A (соответственно, A = A). Если матрица оператора A в некотором ортонормированном базисе симметрична (эрмитова), то оператор A самосопряж?н.
матрица оператора A есть A и A = A, мы получаем A = A. Докажем второе утверждение. Пусть A 1 , . . . , A n ортонормированный базис, в t котором матрица A оператора A эрмитова, т.е. A = A. Тогда из предложения 4.1.2 t следует, что матрица A оператора A в том же базисе совпадает с A. Следовательно, A = A и оператор A самосопряж?н.
Доказательство. Первое утверждение вытекает из предложения 4.1.2: так как
t t

В связи с этим самосопряж?нные операторы в евклидовом пространстве также называют симметрическими, а в эрмитовом пространстве эрмитовыми. Вот основное свойство самосопряж?нных операторов.

ванном базисе. Другими словами, для самосопряж?нного оператора существует ортонормированный базис из собственных векторов.
Доказательство будет опираться на лемму, которая важна сама по себе.
Лемма 4.2.4. Все корни характеристического многочлена самосопряж?нного оператора A вещественны. Доказательство. Вначале докажем лемму для эрмитова пространства. В этом случае корни характеристического многочлена суть собственные значения оператора A. Пусть C такой корень и L = 0 соответствующий собственный вектор, т.е. AL = L . Тогда

Теорема 4.2.3. Самосопряж?нный оператор диагонализируем в ортонормиро-

(L , L ) = (L , L ) = (AL , L ) = (L , AL ) = (L , L ) = (L , L ).


4.2. САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ. КАНОНИЧЕСКИЙ ВИД

63

Так как (L , L ) = 0, получаем = , т.е. R. Случай евклидова пространства сводится к эрмитовому случаю при помощи комплексификации. Пусть A матрица самосопряж?нного оператора A в ортонормированном базисе евклидова пространства V . Тогда матрица A вещественна и симметрична. Та же матрица A будет матрицей комплексифицированного оператора AC в соответствующем базисе эрмитова пространства VC . Этот базис также ортонормирован, а матрица A, будучи вещественной и симметричной, является эрмитовой. Следовательно, оператор AC самосопряж?н, а корни его характеристического многочлена вещественны и совпадают с корнями многочлена оператора A. странства V . При dim V = 1 доказывать нечего. Предположим, что утверждение доказано для операторов в пространствах размерности n - 1 и докажем его для пространства V размерности n. В силу предыдущей леммы у самосопряж?нного оператора A имеется собственный вектор L , т.е. одномерное инвариантное подпространство W = L . В силу леммы 4.1.4 ортогональное дополнение W инвариантно относительно оператора A = A. Так как dim W = n - 1, в пространстве W имеется ортонормированный L базис A 1 , . . . , A n-1 из собственных векторов оператора A|W . Тогда A 1 , . . . , A n-1 , |L | ортонормированный базис из собственных векторов оператора A. Ортонормированный базис, в котором матрица самосопряж?нного оператора A диагональна, называется каноническим, а сама диагональная матрица называется каноническим видом самосопряж?нного оператора. На практике для нахождения канонического базиса используется лемма.
Лемма 4.2.5. Собственные векторы, отвечающие различным собственным значениям самосопряж?нного оператора A, взаимно ортогональны. Доказательство. Пусть AK = K и AL = чL , где = ч вещественные собственные значения. Тогда Доказательство теоремы 4.2.3. Используем индукцию по размерности про-

(K , L ) = (K , L ) = (AK , L ) = (K , AL ) = (K , чL ) = ч(K , L ),
откуда (K , L ) = 0, так как = ч. Для нахождения канонического базиса самосопряж?нного оператора A находятся все его собственные подпространства, а затем в каждом из них выбирается ортонормированный базис. Объединение этих базисов и будет каноническим базисом для A. В евклидовом пространстве верно утверждение, обратное к теореме 4.2.3:
Предложение 4.2.6. Если оператор A в евклидовом пространстве диагонализируем в ортонормированном базисе, то A самосопряж?н. Доказательство. Действительно, диагональная матрица симметрична, а оператор, имеющий симметричную матрицу в ортонормированном базисе евклидова пространства самосопряж?н согласно предложению 4.2.2.

В эрмитовом пространстве класс операторов, диагонализируемых в ортонормированном базисе, шире, чем самосопряж?нные операторы (так как на диагонали могут стоять не вещественные числа). Такие операторы мы изучим позже.


64

4. ОПЕРАТОРЫ В ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВАХ

4.3. Самосопряж?нные проекторы. Спектральное разложение самосопряж?нного оператора
Пусть пространство V представлено в виде прямой суммы V = U W . Напомним (см. раздел 2.2), что оператор P : V V , переводящий L = K + M в K (где K U , M W ), называется проектором на U вдоль W . При этом Im P = U и Ker P = W .
Определение 4.3.1. Проектор P : V V на U вдоль W называется ортогональным, если W = U . Такой проектор будем обозначать через prU . Это обозначение вполне согласуется с предыдущими: если V = U U , то для любого L V мы имеем L = prU L + ortU L . Предложение 4.3.2. Проектор P : V V является самосопряж?нным оператором тогда и только тогда, когда он ортогонален. Доказательство. Пусть P = prU ортогональный проектор. Выберем ортонормированный базис в U и дополним его до ортонормированного базиса в V . Тогда в этом ортонормированном базисе матрица оператора prU диагональна (с единицами и нулями на диагонали), а значит оператор prU самосопряж?н. Обратно пусть P самосопряж?нный проектор на U вдоль W . Возьм?м произвольные векторы K U = Im P и M W = Ker P . Тогда K = P L для некоторого L V и P M = 0. Мы имеем

( K , M ) = (P L , M ) = (L , P M ) = 0,
откуда получаем W = U


и P = prU .

U = K одномерное подпространство. Тогда матрица стандартном базисе Rn есть ) 1 ( 1 2 11 u uu u u ћ ћ ћ un 2 21 1 1 u 1 u u . . uut = = |K |2 |K |2 . |K |2 . . . un un u1

Пример 4.3.3. Пусть

K = (u1 , . . . , un )t Rn ненулевой вектор-столбец и
оператора prK = pr
U

в

u1 u2 ћ ћ ћ u1 un u2 u2 ћ ћ ћ u2 un . . .. . . . . . un u2 ћ ћ ћ un un

Напомним, что спектром оператора A называется множество его собственных значений. Для каждого собственного значения рассмотрим ортогональный проектор prV на соответствующее собственное подпространство V .
Теорема 4.3.4 (спектральное разложение). Пусть A самосопряж?нный оператор. Тогда имеет место разложение A= prV ,


где сумма бер?тся по всем собственным значениями. При этом проекторы prV удовлетворяют соотношениям prV A = A prV = prV и prV prVч = O при = ч.
Доказательство. Соотношения prV A = A prV = prV и prV prVч = O при = ч выполнены, так как они выполнены для матриц входящих в них операторов в каноническом базисе для оператора A (в этом базисе матрицы всех входящих в соотношения операторов диагональны). Разложению V = V в прямую сумму


4.4. КОСОСИММЕТРИЧЕСКИЕ И КОСОЭРМИТОВЫ ОПЕРАТОРЫ

65

собственных подпространств соответствует разложение тождественного оператора в сумму ортогональных проекторов id = prV .


Умножив это соотношение слева на A и использовав соотношение A pr получим требуемое.

V

= prV ,

4.4. Кососимметрические и косоэрмитовы операторы. Канонический вид. Эрмитово разложение
Определение 4.4.1. Оператор A : V V в евклидовом (эрмитовом) пространстве называется кососимметрическим (соответственно, косоэрмитовым ), если A = -A, т.е. выполнено соотношение

(AK , L ) = -(K , AL )
для любых K , L V .
Предложение 4.4.2. Матрица A кососимметрического (косоэрмитова) опера-

тора A в ортонормированном базисе евклидова (эрмитова) пространства кососимt метрична (косоэрмитова), т.е. At = -A (соответственно, A = -A). Если матрица оператора A в некотором ортонормированном базисе кососимметрична (косоэрмитова), то оператор A кососимметричен (косоэрмитов).
ние 4.2.2).
Доказательство. То же, что и для самосопряж?нных операторов (предложе-

Теорема 4.4.3. Для косоэрмитова оператора A существует ортонормированный базис, в котором его матрица диагональна с чисто мнимыми числами на диагонали. Другими словами, для косоэрмитова оператора существует ортонормированный базис из собственных векторов, а все собственные значения чисто мнимые.

ра, основано на лемме 4.1.4. Будем вести индукцию по размерности пространства V . При dim V = 1 доказывать нечего. Предположим, что утверждение доказано для операторов в пространствах размерности n - 1 и докажем его для размерности n. Выберем собственный вектор L для A, т.е. одномерное инвариантное подпространство W = L . В силу леммы 4.1.4 ортогональное дополнение W инвариантно относительно оператора A , а значит оно инвариантно и относительно A = -A . Так как dim W = n - 1, в пространстве W имеется ортонормированный базис A 1 , . . . , A n-1 из собственных векторов оператора A|W . Тогда A 1 , . . . , A n-1 , |L | ортоL нормированный базис из собственных векторов оператора A. Пусть D диагональная матрица косоэрмитова оператора A в ортонормированt ном базисе из собственных векторов. Так как A = -A, получаем D = -D. Следовательно, диагональные элементы матрицы D (собственные числа) удовлетворяют соотношению = -, т.е. являются чисто мнимыми. Кососимметрические операторы в евклидовом пространстве, как правило, не диа( ) 0 -a гонализируемы. Например, как мы видели ранее, оператор с матрицей с a0 ненулевым a не диагонализируем в вещественном пространстве.

Доказательство. Доказательство, как и в случае самосопряж?нного операто-


66

4. ОПЕРАТОРЫ В ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВАХ

Теорема 4.4.4. Для кососимметрического оператора A существует ортонормированный базис, в котором его матрица блочно-диагональная с блоками размера ( ) 0 -a 1 или 2, прич?м блоки размера 1 нулевые, а блоки размера 2 имеют вид с a0 ненулевыми a R. Доказательство. В пространстве размерности 1 или 2 доказывать нечего, так как кососимметрическая матрица и так имеет там требуемый вид. Предположим, что утверждение доказано для операторов в пространствах размерности не больше n - 1 и докажем его для пространства V размерности n (где n 3). В силу теоремы 2.6.3 б) для оператора A существует 1-мерное или 2-мерное инвариантное подпространство W V . Как и в случае косоэрмитовых операторов, из леммы 4.1.4 следует, что ортогональное дополнение W также инвариантно. По предположению индукции, в пространстве W имеется требуемый базис для оператора A|W . Выбрав произвольный ортонормированный базис в W и взяв объединение базисов в W и W , мы получим ортнормированный базис пространства V , в котором матрица оператора A состоит из блоков требуемого вида и ещ? одного блока размера 1 или 2 матрицы оператора A|W . Этот последний блок кососимметрическая матрица размера 1 или 2, т.е. она тоже имеет требуемый вид.

Ортонормированный базис, в котором матрица кососимметрического или косоэрмитова оператора A имеет вид, описанный в предыдущих теоремах, называется каноническим, а сама матрица называется каноническим видом оператора. Заметим, что если A эрмитов оператор, то оператор iA косоэрмитов и наоборот. Поэтому теорему 4.4.3 можно было свести к теореме 4.2.3.
Теорема 4.4.5 (эрмитово разложение). Для любого оператора A в эрмитовом пространстве существует единственное представление в виде

A = R + iI ,
где R и I эрмитовы операторы.
тово разложение, то A = R - iI = R - iI . Из этих двух соотношений получаем 1 i R = (A + A), I = (A - A), 2 2 т.е. операторы R и I определены однозначно и эрмитово разложение единственно. С другой стороны, операторы R и I , задаваемые предыдущими формулами, очевидно эрмитовы (самосопряжены), так что эрмитово разложение существует. В одномерном эрмитовом пространстве C эрмитовы операторы это вещественные числа, а операторы R и I в эрмитовом разложении это вещественная и мнимая части комплексного числа.
Доказательство. Сначала докажем единственность. Если A = R + iI эрми-

4.5. Ортогональные и унитарные операторы. Канонический вид. Группы On и SOn , Un и SUn
Предложение 4.5.1. Следующие условия для оператора A : V V в евклидовом или эрмитовом пространстве эквивалентны: а) оператор A сохраняет длины векторов, т.е. |AL| = |L| для любого L V ;


4.5. ОРТОГОНАЛЬНЫЕ И УНИТАРНЫЕ ОПЕРАТОРЫ. КАНОНИЧЕСКИЙ ВИД

67

б) оператор A сохраняет скалярное произведение, т.е. (AK, AL) = (K, L) для любых K, L V ; в) оператор A переводит ортонормированные базисы в ортонормированные, т.е. если A1 , . . . , An ортонормированный базис, то AA1 , . . . , AAn также ортонормированный базис; г) матрица A оператора A в ортонормированном базисе ортогональна (униt тарна), т.е. At A = E (соответственно, A A = E ); д) A A = id, т.е. сопряж?нный оператор к A является его обратным. а) б). В евклидовом пространстве имеем (K + L , K + L ) = (K , K ) + 2(K , L ) + (L , L ), откуда ) 1( (K , L ) = (K + L , K + L ) - (K , K ) - (L , L ) . 2 Поэтому, если оператор A сохраняет длины, т.е. скалярные произведения вида (L , L ), то он сохраняет и все скалярные произведения. В эрмитовом пространстве имеем (K + L , K + L ) = (K , K ) + (K , L ) + (K , L ) + (L , L ) = (K , K ) + 2 Re(K , L ) + (L , L ), откуда ) 1( Re(K , L ) = (K + L , K + L ) - (K , K ) - (L , L ) 2 и аналогично ) 1( Im(K , L ) = - (K + iL , K + iL ) - (K , K ) - (L , L ) . 2 Поэтому, если оператор A сохраняет длины, то он сохраняет и скалярное произведение (K , L ), так как сохраняет его вещественную и мнимую части. б) а). Очевидно. б) в). Пусть (AK , AL ) = (K , L ). Тогда если A 1 , . . . , A n ортонормированный базис, то (AA i , AA j ) = (A i , A j ) = ij , т.е. базис AA 1 , . . . , AA n также ортонормирован. в) г). Пусть A переводит ортонормированный базис A 1 , . . . , A n в ортонормированный базис AA 1 , . . . , AA n и A = (ai ) матрица оператора в базисе A 1 , . . . ,A n . Тогда j
Доказательство. Мы докажем импликации а) б) и б) в) г) д) б).

ij = (AA i , AA j ) = (ak A k , a A ) = ak a (A k , A ) = ak a k = ak k a . i j ij ij i j
Это эквивалентно матричному соотношению E = A E A или A A = E . г) д). Это следует из предложения 4.1.2. д) б). Пусть A A = id. Тогда (AK , AL ) = (A AK , L ) = (K , L ), т.е. A сохраняет скалярное произведение. стве, удовлетворяющий одному из эквивалентных условий из предложения 4.5.1, называется ортогональным (соответственно, унитарным ). Иногда ортогональные и унитарные операторы называют изометрическими. Как и в случае самосопряж?нных операторов, для приведения ортогонального или унитарного оператора к каноническому виду нам понадобится утверждение об инвариантности ортогонального дополнения.
Определение 4.5.2. Оператор A : V V в евклидовом (эрмитовом) пространt t

а W V инвариантное подпространство. Тогда ортогональное дополнение W также инвариантно относительно A.

Лемма 4.5.3. Пусть A : V V ортогональный или унитарный оператор,



68

4. ОПЕРАТОРЫ В ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВАХ

(AK , M ) = 0 для любого M W . Мы знаем, что A(W ) W . Поскольку оператор A oбратим, A(W ) = W . Тогда найд?тся такой вектор L W , что M = AL , а значит (AK , M ) = (AK , AL ) = (K , L ) = 0.
Лемма 4.5.4. Собственные значения ортогонального (унитарного) оператора A по модулю равны единице. Доказательство. Действительно, пусть A

Доказательство. Пусть

K W . Нам надо доказать, что AK W , т.е., что

L = L для L = 0. Тогда (L , L ) = (AL , AL ) = (L , L ) = (L , L ) = ||2 (L , L ),

откуда ||2 = 1.

базис, в котором его матрица диагональна, а все диагональные элементы по модулю равны единице.
для самосопряж?нных или косоэрмитовых операторов. Шаг индукции проводим, выбирая собственный вектор L и устанавливая инвариантность подпространства L при помощи леммы 4.5.3.
Доказательство. Полностью аналогично доказательству теорем 4.2.3 и 4.4.3

Теорема 4.5.5. Для унитарного оператора A существует ортонормированный

ный базис, в котором его матрица блочно-диагональная с блоками размера 1 или 2, прич?м блоки ) размера 1 имеют вид (1) или (-1), а блоки размера 2 имеют вид ( cos - sin , где = k с целым k . sin cos
имеет вид (1) или (-1). В пространстве размерности 2 любая ортогональная мат( ) ( ) cos - sin cos sin рица имеет вид (если определитель равен 1) или sin cos sin - cos (если определитель равен -1). В первом случае мы уже имеем требуемый вид (а оператор представляет собой поворот на угол в положительном направлении). Во втором случае оператор представляет собой симметрию относительно прямой под углом к оси абсцисс. Такой оператор имеет два ортогональных собственных вектора: 2 (cos , sin ) (вектор вдоль оси симметрии) и (- sin , cos ) (вектор, перпендикуляр2 2 2 2 ный оси симметрии). В ) ортонормированном базисе из этих ) собственных векторов ( ( cos sin 10 оператор принимает требуемый вид . sin - cos 0 -1 Далее действуем по индукции, как и при доказательстве теоремы 4.4.4 для кососимметрических операторов. Предположим, что утверждение доказано для операторов в пространствах размерности не больше n - 1 и докажем его для пространства V размерности n (где n 3). В силу теоремы 2.6.3 б) для оператора A существует 1-мерное или 2-мерное инвариантное подпространство W V . Из леммы 4.5.3 следует, что ортогональное дополнение W также инвариантно. По предположению индукции, в пространстве W имеется требуемый базис для ортогонального оператора A|W . Выбрав ортонормированный базис в пространстве W , как описано в начале доказательства, и взяв объединение базисов в W и W , мы получим требуемый ортнормированный базис пространства V .
Доказательство. В пространстве размерности 1 ортогональная матрица и так

Теорема 4.5.6. Для ортогонального оператора A существует ортонормирован-


4.5. ОРТОГОНАЛЬНЫЕ И УНИТАРНЫЕ ОПЕРАТОРЫ. КАНОНИЧЕСКИЙ ВИД

69

Базисы, описанные в теоремах 4.5.5 и 4.5.6, называются каноническими, а соответствующие им матрицы каноническим видом унитарного или ортогонального оператора. 1. Как указано в доказательстве предыдущей теоремы, ортого( ) ( ) cos sin 10 нальный оператор с матрицей имеет канонический вид . sin - cos 0 -1 Тот же канонический вид будет, если оператор рассматривать как унитарный. ( ) cos - sin 2. Канонический вид ортогонального оператора с матрицей sin cos это та же самая матрица. В то же время канонический вид этого оператора, рас( i ) e 0 сматриваемого как унитарный оператор, есть . 0 e-i 3. В тр?хмерном пространстве канонический cos - sin sin cos 0 0 вид ортогонального оператора есть 0 0 +1
Пример 4.5.7.

где в левом нижнем углу стоит 1 или -1 в зависимости от знака определителя оператора. (Операторы, канонический вид которых имеет три блока (1) или (-1), получаются при = k .) Если определитель положителен, то такой оператор представляет собой поворот (вокруг оси третьего вектора канонического базиса). Если же определитель отрицателен, то оператор это ?поворот с переворотом?, т.е. композиция поворота и симметрии относительно плоскости, перпендикулярной оси поворота. Отсюда, в частности, следует, что композиция двух поворотов это снова поворот вокруг некоторой оси (так как в каноническом виде всегда происходит всего один поворот). 4. В четыр?хмерном пространстве уже бывают ?независимые повороты?. А именно, канонический вид ортогонального оператора общего вида с положительным определителем представляет собой матрицу из двух блоков размера 2: cos - sin 0 0 sin cos 0 0 0 0 cos - sin 0 0 sin cos Это композиция двух независимых поворотов: на угол в плоскости первого и второго базисных векторов и на угол в плоскости третьего и четв?ртого базисных векторов. Такой оператор не сводится к одному повороту. Произведение ортогональных операторов очевидно является ортогональным оператором, и поэтому ортогональные операторы в евклидовом пространстве V образуют подгруппу в общей линейной группе GL (V ). Эта подгруппа называется ортогональной группой и обозначается O(V ). Если dim V = n, то группа O(V ) изоморфна группе ортогональных матриц размера n; эта группа обозначается On . Аналогично, унитарные операторы в эрмитовом пространстве V образуют унитарную группу, которая обозначается U (V ). Если dim V = n, то группа U (V ) изоморфна группе унитарных матриц размера n; эта группа обозначается Un .


70

4. ОПЕРАТОРЫ В ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВАХ

Наконец, ортогональные (унитарные) матрицы с определителем 1 образуют подгруппу в On (соответственно, в Un ). Эта подгруппа называется специальной ортогональной группой (соответственно, специальной унитарной группой ) и обозначается SOn (соответственно, SUn ).

4.6. Положительные самосопряж?нные операторы. Полярное разложение
Определение 4.6.1. Самосопряж?нный оператор A называется положительным, если (AL , L ) > 0 для любого ненулевого вектора L V . Лемма 4.6.2. Самосопряж?нный оператора A положителен тогда и только тогда, когда все его собственные значения положительны.

Обратно, пусть все собственные значения i положительны. Выберем канонический ортонормированный базис из собственных векторов A 1 , . . . , A n с собственными значениями 1 , . . . , n . Тогда для ненулевого вектора L = v i A i мы имеем n ( ) i j ij (AL , L ) = A(v A i ), v A j = v v (AA i , A j ) = i |v i |2 > 0.
i=1

L = 0. Рассмотрим собственный вектор L с собственным значением . Тогда (L , L ) = (AL , L ) > 0, откуда > 0.

Доказательство. Пусть (AL , L ) > 0 при

Теорема 4.6.3. Для положительного оператора A существует положительный оператор P , удовлетворяющий соотношению P 2 = A. Доказательство. Выберем канонический базис A 1 , . . . , A n для A, в котором его матрица диагональна с положительными числами 1 , . . . , n на диагонали. Рассмотрим оператор P задаваемый в том же базисе2 диагональной матрицей с числами 1 , . . . , n на диагонали. Тогда, очевидно, P = A. Кроме того, оператор P самосопряж?н (так как он имеет симметричную матрицу в ортонормированном базисе) и положителен в силу леммы 4.6.2.

Оператор P , построенный в предыдущей теореме, называется, положительным корнем из положительного оператора A и обозначается A. Самосопряж?нный оператор A называется неотрицательным, если (AL , L ) 0 для любого вектора L V . Все утверждения выше переносятся без изменений на неотрицательные операторы.
Теорема 4.6.4 (полярное разложение). Для любого невырожденного оператора A в евклидовом или эрмитовом пространстве существует представление в виде

A = PU,
где P положительный, а U ортогональный (унитарный) оператор.
если бы оператор AA был положительным, можно было бы взять P = AA . Оператор AA действительно является самосопряж?нным и положительным:
Доказательство. Если A = P U , то A = U P и AA = P U U P = P 2 . Поэтому,

при L = 0, так как A L = 0 в силу невырожденности A. Теперь положим P = AA и U = P -1 A. Тогда U U = P -1 AA P -1 = P -1 P 2 P -1 = id. Следовательно, U ортогональный (унитарный) оператор и A = P U .

(AA L , L ) = (A L , A L ) > 0,


4.7. НОРМАЛЬНЫЕ ОПЕРАТОРЫ

71

Аналогично, рассмотрев положительный оператор A A, можно доказать суще ствование второго полярного разложения A = U P (где P = A A). тора единствен (задача), поэтому полярное разложение также единственно. Для произвольного оператора A существует полярное разложение A = P U , где P неотрицательный оператор, а U ортогональный или унитарный оператор (задача). Однако такое разложение не единственно. В одномерном эрмитовом пространстве C положительные операторы это положительные вещественные числа, а унитарные операторы это комплексные числа, по модулю равные 1, т.е. вида ei . Поэтому полярное разложение это представление комплексного числа z в полярных координатах: z = ei , что объясняет название.
Замечание. На самом деле положительный корень из положительного опера-

4.7. Нормальные операторы
зывается нормальным, если он коммутирует с сопряж?нным, т.е. A A = AA .
Определение 4.7.1. Оператор A в евклидовом или эрмитовом пространстве на-

Все специальные классы операторов, рассмотренные выше в этой главе (от самосопряж?нных до унитарных) являются нормальными.
Лемма 4.7.2. Пусть L собственный вектор нормального оператора A с собственным значением . Тогда L также является собственным вектором для сопряж?нного оператора A , с собственным значением . Доказательство. Если оператор A нормален, то

(AL , AL ) = (A AL , L ) = (AA L , L ) = (A L , A L ),
т.е. |AL | = |A L | для любого вектора L . Поскольку вместе с оператором A нормален и каждый оператор вида A - id, отсюда следует, что

|(A - id)L | = |(A - id)L |
для любого . Поэтому, если (A - id)L = 0, то (A - id)L = 0. В эрмитовом пространстве класс нормальных операторов это в точности операторы, диагонализируемые в ортонормированном базисе:

нормированном базисе тогда и только тогда, когда он нормален.

Теорема 4.7.3. Оператор в эрмитовом пространстве диагонализируем в ортоДоказательство. Пусть матрица оператора A в некотором ортонормирован-

ном базисе диагональна с числами 1 , . . . , n на диагонали. Тогда сопряж?нный оператор A в том же базисе имеет диагональную матрицу с числами 1 , . . . , n . Так как диагональные матрицы коммутируют, мы получаем A A = AA , т.е. A нормален. Обратно, пусть A A = AA . Доказательство диагонализируемости в ортнормированном базисе будем вести по индукции по размерности пространства V . При dim V = 1 доказывать нечего. Предположим, что утверждение доказано для пространств размерности не больше n - 1 и докажем его для размерности n. Выберем собственный вектор L с собственным значением для A, т.е. одномерное инвариантное подпространство W = L . Докажем, что ортогональное дополнение W также инвариантно относительно A. Пусть K W , т.е. (K , L ) = 0. Тогда

(AK , L ) = (K , A L ) = (K , L ) = (K , L ) = 0


72

4. ОПЕРАТОРЫ В ЕВКЛИДОВЫХ И ЭРМИТОВЫХ ПРОСТРАНСТВАХ

(где мы воспользовались леммой 4.7.2). Следовательно, AK W и пространство W инвариантно относительно оператора A. С другой стороны, пространство W инвариантно относительно оператора A в силу леммы 4.1.4. Так как W инвариантно и относительно A и относительно A , ограничение A|W является нормальным оператором. Так как dim W = n - 1, по предположению индукции в пространстве W имеется ортонормированный баL зис A 1 , . . . , A n-1 из собственных векторов оператора A|W . Тогда A 1 , . . . , A n-1 , |L | ортонормированный базис из собственных векторов оператора A.

( В евклидовом пространстве аналог этой теоремы не имеет места: оператор ) a -b нормален, но не диагонализируем при b = 0. На самом деле мы знаем из ba раздела 4.2, что в евклидовом пространстве класс операторов, диагонализируемых в ортонормированном базисе, это в точности самосопряж?нные операторы.
пространстве существует ортонормированный базис, в котором его матрица состо( ) a -b ит из блоков размера 1 или 2, прич?м блоки размера 2 имеют вид (задача). ba Собер?м в одну таблицу всю информацию о специальных классах операторов из этой главы (отдельно для евклидова и эрмитова пространства): Свойство матриНазвание Определение цы (в ортонор- Канонический вид миров. базисе) Самосопряж?нный A = A At = A диагональный (симметрический) (симметричная) ( ) 0 -a t КосоA = -A A = -A блоки (0) и a0 симметрический (кососимметр.) ( ) cos -sin t Ортогональный A A = id AA=E блоки (+1) и sin cos (ортогональная) ( ) a -b t t Нормальный A A = AA A A = AA блоки (a) и ba Самосопряж?нный A = A (эрмитов) Косоэрмитов A = -A Унитарный Нормальный
Замечание. Можно доказать, что для нормального оператора в евклидовом

A A = id A A = AA

A =A (эрмитова) t A = -A (косоэрмитова) t AA=E (унитарная) t t A A = AA

t

диагональный с вещественными числами на диагонали диагональный с чисто мнимыми числами на диагонали на диагонали числа, равные по модулю 1 диагональный


Глава 5

Билинейные и полуторалинейные функции
5.1. Билинейные и полуторалинейные функции, их матрицы. Закон изменения матрицы при замене базиса. Канонический изоморфизм пространства билинейных функций и пространства Hom(V , V )
B : V Ч V k называется билинейной функцией, если она линейна по каждому аргументу: B (1 N 1 + 2 N 2 , O ) = 1 B(N 1 , O ) + 2 B (N 2 , O ) и B (N , ч1 O 1 + ч2 O 2 ) = ч1 B (N , O 1 ) + ч2 B(N , O 2 )
для любых 1 , 2 , ч1 , ч2 k и N , N 1 , N 2 , O , O 1 , O 2 V . Матрицей билинейной функции B в базисе A 1 , . . . , A n пространства V называется квадратная матрица B = (bij ) размера n, где bij = B (A i , A j ).
Пример 5.1.2. Скалярное произведение в евклидовом пространстве является билинейной функцией. Таким образом, понятие билинейной функции обобщает понятие скалярного произведения (вместо тр?х условий на функцию V Ч V R требуется выполнение лишь первого, т.е. билинейности). Матрица билинейной функции является обобщением матрицы Грама скалярного произведения. Определение 5.1.1. Пусть V линейное пространство над полем k. Функция

Зная матрицу B = (bij ) билинейной функции, можно восстановить значение B (N , O ) на любой паре векторов N = xi A i и O = y j A j :

B(N , O ) = B (xi A i , y j A j ) = xi y j B(A i , A j ) = bij xi y j = xt B y .
Выражение B (x, y ) = bij xi y j = xt B y называется билинейной формой (здесь, как обычно, мы предполагаем, что x = (x1 , . . . , xn )t это столбец высоты n, так что xt это строка длины n). Билинейная форма представляет собой однородный многочлен степени 2 от двух наборов переменных x1 , . . . , xn и y 1 , . . . , y n , который линеен по x при фиксированных y и линеен по y при фиксированных x.

B = C t B C, где B матрица билинейной функции B : V Ч V k в базисе A1 , . . . , An , B матрица в базисе A1 , . . . , An и C матрица перехода от базиса A1 , . . . , An к базису A1 , . . . , An .
Доказательство. Пусть B = (bij ), B = (b ), C = (ci ). Мы имеем ij i

соотношение

Теорема 5.1.3 (закон изменения матрицы билинейной функции). Имеет место

bij = B (A i , A j ) = B(ci A i , cj A j ) = ci cj B (A i , A j ) = ci bij cj , i ij i j j
что эквивалентно матричному соотношению B = C t B C .
73


74

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

То же рассуждение можно провести, используя матричную запись билинейных форм. Значение B (N , O ) можно записать в виде билинейных форм от новых или старых координат: B(N , O ) = B (x, y ) = B (x , y ). Мы имеем x = C x и y = C y . Тогда

(x )t B y = B (x , y ) = B (x, y ) = xt B y = (x )t C t B C y .
Так как это верно для любых наборов x , y , получаем B = C t B C .
Следствие 5.1.4. Ранг матрицы билинейной функции не зависит от базиса. Доказательство. Так как матрица C обратима, rk B = rk(C t B C ) = rk B . Определение 5.1.5. Рангом билинейной функции B (обозначается rk B ) называ-

ется ранг е? матрицы в произвольном базисе. Билинейная функция B в пространстве V называется невырожденной, если rk B = dim V . Множество B(V ) всех билинейных функций в пространстве V образует линейное пространство относительно операций сложения функций и умножения функций на скаляры. Сопоставление билинейной функции B е? матрицы B в фиксированном базисе A 1 , . . . , A n устанавливает изоморфизм между пространством B(V ) и пространством квадратных матриц Matk (n). Как и в случае пространства линейных операторов Hom(V , V ), этот изоморфизм неканоничен, так он зависит от выбора базиса. Наряду с B(V ) рассмотрим пространство Hom(V , V ) линейных отображений из V в двойственное пространство V .

нейной функции B линейное отображение B : V V , задаваемое формулой

Теорема 5.1.6. Отображение : B(V ) Hom(V , V ), сопоставляющее били-

B (N) = B(N, ћ ) для N V ,
является каноническим изоморфизмом. (Здесь B (N, ћ ) V значение которой на векторе O V есть B(N, O).)


линейная функция,

Доказательство. Отображение линейно, так как билинейная функция линейна по первому аргументу N . Кроме того, отображение биективно: обратное отображение -1 ставит в соответствие линейному отображению B : V V билинейную функцию B , заданную по формуле B (N , O ) = B (N )(O ). Следовательно, изоморфизм. Этот изоморфизм каноничен, так как в его конструкции не использовался базис.

В комплексном пространстве V наряду с билинейными функциями рассматриваются полуторалинейные:

S : V Ч V C называется полуторалинейной функцией, если она линейна по второму аргументу и антилинейна (или полулинейна ) по первому каждому аргументу: S (1 N 1 + 2 N 2 , O ) = 1 S (N 1 , O ) + 2 S (N 2 , O ) и S (N , ч1 O 1 + ч2 O 2 ) = ч1 S (N , O 1 ) + ч2 S (N , O 2 )
для любых 1 , 2 , ч1 , ч2 C и N , N 1 , N 2 , O , O 1 , O 2 V . Матрица полуторалинейной функции S в базисе A 1 , . . . , A n определяется как S = (sij ), где sij = S (A i , A j ).

Определение 5.1.7. Пусть V линейное пространство над полем C. Функция


5.2. СИММЕТРИЧЕСКИЕ, КОСОСИММЕТРИЧЕСКИЕ И ЭРМИТОВЫ ФУНКЦИИ

75

Значение S (N , O ) выражается через матрицу S = (sij ) и координаты векторов N = xi A i и O = y j A j следующим образом:

S (N , O ) = S (xi A i , y j A j ) = xi y j S (A i , A j ) = sij xi y j = xt S y .
Выражение S (x, y ) = sij xi y j = xt S y называется полуторалинейной формой. Пример полуторалинейной функции эрмитово скалярное произведение. Матрицы S и S полуторалинейной функции S в разных базисах связаны соотноt шением S = C S C , которое доказывается аналогично соотношению для билинейных функций. Отсюда следует, что ранг матрицы полуторалинейной функции не зависит от выбора базиса.

5.2. Симметрические, кососимметрические и эрмитовы функции. Квадратичные формы. Нормальный вид
рической, если B (O , N ) = B(N , O ), и кососимметрической, если B(O , N ) = -B (N , O ), для любых N , O V . Полуторалинейная функция S : V Ч V C в комплексном пространстве называется эрмитовой, если S (O , N ) = S (N , O ), и косоэрмитовой, если S (O , N ) = -S (N , O ).
Матрица симметрической (кососимметрической) билинейной функции в любом базисе симметрична (соответственно, кососимметрична). Матрица эрмитовой (косоэрмитовой) полуторалинейной функции в любом базисе эрмитова (соответственно, косоэрмитова). Кроме того, полуторалинейная функция S является эрмитовой тогда и только тогда, когда функция iS является косоэрмитовой. Далее мы будем предполагать, что характеристика поля k отлична от 2.
Определение 5.2.2. Квадратичной формой над k называется однородный многочлен второй степени от n переменных x = (x1 , . . . , xn ), т.е. многочлен вида Определение 5.2.1. Билинейная функция B : V Ч V k называется симмет-

Q(x) = Q(x , . . . , x ) = qij x x =

1

n

ij

n i=1

qii (xi )2 +


i
2qij xi xj ,

где qj i = qij k. Симметричная матрица Q = (qij ) размера n Ч n называется матрицей квадратичной формы. Если B (x, y ) = bij xi y j симметрическая билинейная форма, то B (x, x) = bij xi xj является квадратичной формой с матрицей B . Таким образом, квадратичная форма B (x, x) полностью определяет симметрическую билинейную форму B (x, y ), а значит и симметрическую билинейную функцию B (N , O ). Это можно увидеть и не прибегая к выбору базиса: для симметрической билинейной функции имеет место соотношение ) 1( B (N , O ) = B(N + O , N + O ) - B (N , N ) - B (O , O ) , 2 т.е. значение B на произвольной паре векторов можно восстановить, зная лишь значения B на парах совпадающих векторов. Функцию V k, N B (N , N ) называют квадратичной функцией.
Теорема 5.2.3. Для симметрической билинейной функции B над полем характеристики, отличной от 2, существует базис, в котором е? матрица диагональна.


76

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

Другими словами, любую квадратичную форму Q(x) линейной заменой координат x = C y можно привести к виду

Q(y ) = r11 (y 1 )2 + . . . + rnn (y n )2 .
Мы привед?м два доказательства этого факта. В первом случае будем работать с квадратичными формами и координатами, а во втором с симметрическими билинейными функциями и базисами. Каждое из доказательств будет проведено таким образом, что его можно будет использовать как алгоритм, а не просто как доказательство существования нужного преобразования. ратичная форма. Доказательство заключается в последовательном упрощении Q(x), использующем основное и два вспомогательных преобразования. Основное преобразование производится, если в квадратичной форме Q(x) = qij xi xj первый коэффициент q11 не равен нулю. Тогда имеем Q(x1 , . . . , xn ) = q11 (x1 )2 + 2q12 x1 x2 + . . . + 2q1n x1 xn + qij xi xj =
Первое доказательство (метод Лагранжа). Пусть Q(x) = qij xi xj квад-

( =q
11

q12 2 q1 n n ) 2 1 x+ x + ... + x - q11 q11 q11 ( = q11 x1

(q q1 n n ) 2 12 2 x + ... + x + qij xi xj = q11 q11 i,j >1 )2 q1n n q12 2 x + ... + x + Q (x2 , . . . , xn ), + q11 q11

i,j >1

где Q (x2 , . . . , xn ) некоторая квадратичная форма от n - 1 переменных. Теперь сделаем замену координат q12 2 q1n n u1 = x1 + x + ... + x, q11 q11 u2 = x2 , . . . , un = xn . В результате форма Q(x) преобразуется к виду

Q(u1 , . . . , un ) = q11 (u1 )2 + Q (u2 , . . . , un ).
Если в форме Q (u2 , . . . , un ) первый коэффициент (т.е. q22 ) не равен нулю, то мы снова можем применить основное преобразование, и т.д. Первое вспомогательное преобразование производится, если q11 = 0, но существует qii = 0. В этом случае мы делаем замену u1 = xi , ui = x1 , а остальные координаты без изменений. В результате получаем q11 = 0. Второе вспомогательное преобразование производится, если все коэффициенты qii при квадратах равны нулю, но при этом есть хотя бы один ненулевой коэффициент (в противном случае Q(x) 0 уже имеет нужный вид). Пусть qij = 0, где i < j . Произвед?м замену координат

xi = ui ,

xj = ui + uj ,

xk = uk ,

при k = i, j.

В результате форма Q(x) преобразуется к виду

Q(x) = 2qij xi xj + . . . = 2qij ui (ui + uj ) + . . . = 2qij (ui )2 + . . . ,
где . . . означает члены, не содержащие квадратов. Далее мы можем применить предыдущие преобразования.


5.2. СИММЕТРИЧЕСКИЕ, КОСОСИММЕТРИЧЕСКИЕ И ЭРМИТОВЫ ФУНКЦИИ

77

Последовательно применяя основное преобразование и (если нужно) вспомогательные преобразования, мы приводим форму Q(x) к диагональному виду.
Второе доказательство (метод поиска базиса). Этот метод можно рассматривать как обобщение метода ортогонализации ГрамаШмидта. Базис, в котором матрица билинейной функции B диагональна это ?ортогональный? базис в смысле ?скалярного произведения?, задаваемого симметрической билинейной функцией B . Здесь также имеется основное и вспомогательные преобразования. Пусть B = (bij ) матрица билинейной функции B в исходном базисе A 1 , . . . , A n . Основное преобразование производится, если b11 = B (A 1 , A 1 ) = 0 (это всегда так, если симметрическая билинейная функция B зада?т скалярное произведение, т.е. является положительно определ?нной). Выберем новый базис следующим образом:

A 1 = A 1 , A 2 = A 2 -
(5.1)

ћћћ

B (A 1 , A 2 ) b A 1 = A 2 - 12 A 1 , B (A 1 , A 1 ) b11 b B (A 1 , A n ) A 1 = A n - 1n A 1 . B(A 1 , A 1 ) b11


A n = A n -

В результате мы получаем B (A 1 , A i ) = 0 при i > 1. Таким образом, матрица B билинейной функции B в новом базисе принимает вид b11 0 ћ ћ ћ 0 0 B = . . B . 0

где B матрица размера (n - 1) Ч (n - 1) билинейной функции B на подпространстве A 2 , . . . , A n . Далее мы работаем уже с этой матрицей B . Первое вспомогательное преобразование производится, если b11 = 0, но имеется bii = 0. Тогда делаем замену, меняющую местами 1-й и i-й базисный векторы. Второе вспомогательное преобразование производится, если все bii равны нулю, но при этом билинейная функция B не является тождественно нулевой, т.е. bij = B (A i , A j ) = 0 для некоторых i < j . Произвед?м замену базиса

A i = A i + A j , A j = A j , A k = A
Тогда в новом базисе мы имеем

k

при k = i, j.

bii = B (A i , A i ) = B(A i + A j , A i + A j ) = 2B(A i , A j ) = 2bij = 0.
Далее мы можем применить предыдущие преобразования. Последовательно применяя основное преобразование и дополняя его в необходимых случаях вспомогательными преобразованиями, мы получаем базис B 1 , . . . , B n , в котором матрица билинейной функции B имеет диагональный вид. Обратим внимание, что основное и вспомогательное преобразование в обоих доказательствах это одно и то же преобразование, просто в первом случае оно записано через координаты, а во втором через базисы. Так что диагональные матрицы, получаемые первым и вторым методом, совпадают, как и все промежуточные матрицы.


78

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

Замечание. Если при приведении матрицы билинейной функции (квадратичной формы) к диагональному виду использовалось лишь основное преобразование, то матрица перехода от исходного базиса к базису, в котором матрица имеет диагональный вид, является верхнетреугольной (как и в случае процесса ортогонализации ГрамаШмидта). Если же хоть раз применялось вспомогательное преобразование, то матрица перехода может не быть верхнетреугольной.

( Пример 5.2.4. Над полем Z2 симметрическая билинейная функция с матрицей ) 01 не приводится к диагональному виду заменой базиса (задача). 10
Над полем R квадратичную форму можно далее упростить:
Предложение 5.2.5. Для любой симметрической билинейной функции B в пространстве над полем R существует базис, в котором е? матрица имеет диагональный вид с 1, -1 и 0 на диагонали. Другими словами, вещественную квадратичную форму Q(x) линейной заменой координат x = C y можно привести к виду

(y 1 )2 + . . . + (y p )2 - (y
ную форму к виду

p+1 2

) - . . . - (y

p+q 2

).

Доказательство. Сначала мы с помощью теоремы 5.2.3 привед?м квадратич-

Q(u) = r11 (u1 )2 + . . . + rnn (un )2 . Если rii > 0, то замена y i = rii ui приводит слагаемое rii (ui )2 к виду (y i )2 . Если же rii < 0, то замена y i = |rii |ui приводит слагаемое rii (ui )2 к виду -(y i )2 . В результате получаем требуемый вид квадратичной формы с коэффициентами 1, -1 и 0.
Вид, описанный в предложении 5.2.5, называется нормальным видом вещественной симметрической билинейной формы (вещественной квадратичной формы). Как мы увидим ниже, это наиболее простой вид, к которому можно привести квадратичную форму над полем R. Над полем C квадратичную форму можно ещ? больше упростить:
Предложение 5.2.6. Для любой симметрической билинейной функции B над полем C существует базис, в котором е? матрица имеет диагональный вид с 1 и 0 на диагонали. Другими словами, комплексную квадратичную форму Q(x) линейной заменой координат x = C z можно привести к виду

(z 1 )2 + . . . + (z r )2 .
ратичную форму к виду (y 1 )2 + . . . + (y p )2 - (y p+1 )2 - . . . - (y p+q )2 . Затем сделаем замену координат y k = z k при k p и y k = iz k при k > p. В результате получим требуемый вид, где r = p + q = rk Q. Вид, описанный в предложении 5.2.6, называется нормальным видом комплексной симметрической билинейной формы (комплексной квадратичной формы).
Доказательство. Сначала мы с помощью предложения 5.2.5 привед?м квад-


5.3. НОРМАЛЬНЫЙ ВИД КОСОСИММЕТРИЧЕСКИХ И ЭРМИТОВЫХ ФУНКЦИЙ

79

5.3. Нормальный вид кососимметрических и эрмитовых функций
Пусть B кососимметрическая билинейная функция (над полем характеристики, отличной от 2). Соответствующую ей кососимметрическую билинейную форму B (x, y ) = bij xi y j , где bj i = -bij , можно представить в виде bij (xi y j - xj y i ). B (x, y ) =
i
Теорема 5.3.1. Для любой кососимметрической билинейной функции B существует базис, в котором е? матрица блочно-диагональная с блоками размера 1 ( ) 01 или 2, прич?м блоки размера 1 нулевые, а блоки размера 2 имеют вид . -1 0 Другими словами, любую кососимметрическую билинейную форму B (x, y ) линейной заменой координат можно привести к виду

(x1 y 2 - x2 y 1 ) + (x3 y 4 - x4 y 3 ) + . . . + (x

2k-1 2k

y

- x2k y

2k-1

).

При dim V = 1 доказывать нечего, так как кососимметрическая функция нулевая. Пусть dim V = 2. Тогда матрица кососимметрической функции в произвольном ( ) 0b базисе A 1 , A 2 имеет вид , где b = b12 = B (A 1 , A 2 ). Пусть b = 0 (иначе мы уже -b 0 имеем два блока из нулей). Тогда в новом базисе A 1 = A 1 и A 2 = 1 A 2 мы имеем b

Доказательство. Провед?м индукцию по размерности пространства V .

1 1 = B (A 1 , A 2 ) = B (A 1 , A 2 ) = B(A 1 , A 2 ) = 1, b b ( ) 01 т.е. матрица кососимметрической формы имеет требуемый вид . -1 0 Теперь предположим, что утверждение уже доказано для пространств размерности меньше n, и докажем его для размерности n. Можно считать, что функция B не является тождественно нулевой (иначе доказывать нечего). Пусть b12 = B (A 1 , A 2 ) = 0 для некоторого базиса A 1 , . . . , A n . Попытаемся заменить базисные векторы так, чтобы новые векторы A 1 , . . . , A n удовлетворяли соотношениям b
12

(5.2)

B (A 1 , A 2 ) = 1,

B (A 1 , A i ) = B (A 2 , A i ) = 0 при i
при i

3.

Новый базис будем искать в виде

A 1 = A 1 , A 2 = cA 2 , A i = A i + c1 A 1 + c2 A i i
Подставив эти соотношения в (5.2), получим c =
1 b12

2

3.

и

0 = B (A 1 , A i ) = B (A 1 , A i + c1 A 1 + c2 A 2 ) = b1i + c2 b12 , i i i
откуда c2 = - i
b1i b12

. Аналогично,

0 = B(A 2 , A i ) = B (cA 2 , A i + c1 A 1 + c2 A 2 ) = c(b2i - c1 b12 ), i i i
откуда c1 = i
b2i b12

. Окончательно, наша замена базиса имеет вид

A 1 = A 1 , A 2 =

1 A 2, b12

A i = A i +

b2i b A 1 - 1i A b12 b12

2

при i

3.


80

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

Ввиду соотношений (5.2), в новом базисе матрица билинейной функции B имеет вид 01 0 ћћћ 0 -1 0 0 ћћћ 0 B = 0 0 .. .. B .. 00 где B матрица билинейной функции B на подпространстве A 3 , . . . , A n . Так как это пространство имеет размерность n - 2, по предположению индукции в н?м существует требуемый базис A 3 , . . . , A n . Тогда в базисе A 1 , A 2 , A 3 , . . . , A n исходного пространства V матрица кососимметрической функции B имеет требуемый вид. Вид, описанный в теореме 5.3.1, называется нормальным видом кососимметрической билинейной формы.
Следствие 5.3.2.

а) Ранг кососимметрической билинейной функции ч?тное число; б) Кососимметрическая билинейная функция в пространстве неч?тной размерности всегда вырождена. Теперь рассмотрим полуторалинейные функции в комплексном пространстве.
Теорема 5.3.3. Для любой эрмитовой полуторалинейной функции S существует базис, в котором е? матрица имеет диагональный вид с 1, -1 и 0 на диагонали. Доказательство. Доказательство аналогично доказательству теоремы 5.2.3 для симметрических билинейных функций: отличие имеется лишь во вспомогательном преобразовании. Мы провед?м доказательство методом поиска базиса. Пусть S = (sij ) матрица полуторалинейной функции S в исходном базисе. Основное преобразование производится, если хотя бы один диагональный элемент sii = S (A i , A i ) отличен от нуля. Пусть s11 = 0. Замена базиса производится по тем же формулам (5.1), что и для симметрической билинейной функции (надо лишь заменить bij на sij и B на S в формулах). Первое вспомогательное преобразование производится, если s11 = 0, но существует sii = 0, и заключается в перестановке 1-го и i-го базисных векторов. Второе вспомогательное преобразование производится, если все sii = S (A i , A i ) равны нулю. Пусть s12 = S (A 1 , A 2 ) = 0. Здесь возможны два случая: Re s12 = 0 и Re s12 = 0. В первом случае производим ту же замену, что и для симметрических билинейных функций: A 1 = A 1 + A 2 , A 2 = A 2 , . . . , A n = A n .

Тогда в новом базисе мы имеем

s11 = S (A 1 , A 1 ) = S (A 1 + A 2 , A 1 + A 2 ) = S (A 1 , A 2 ) + S (A 2 , A 1 ) = 2 Re s12 = 0.
Далее мы можем применить основное преобразование. Если же Re s12 = 0, то Im s12 = 0 (так как s12 = 0 по предположению). В этом случае делаем замену

A 1 = A 1 + iA 2 , A 2 = A 2 , . . . , A n = A n .


5.4. ЗАКОН ИНЕРЦИИ. ЕДИНСТВЕННОСТЬ НОРМАЛЬНОГО ВИДА

81

Тогда в новом базисе мы имеем

s

11

= S (A 1 , A 1 ) = S (A 1 + iA 2 , A 1 + iA 2 ) = iS (A 1 , A 2 ) - iS (A 2 , A 1 ) = -2 Im s12 = 0,

и мы снова можем применить основное преобразование. Последовательно применяя основное преобразование и дополняя его в необходимых случаях вспомогательными преобразованием, мы получаем базис B 1 , . . . , B n , в котором матрица эрмитовой функции S имеет диагональный вид. Пусть S (B i , B i ) = rii . Эти числа вещественны в силу эрмитовости. Далее доказательство завершается так же, как и для симметрических функций. Эрмитова полуторалинейная форма, соответствующая диагональной матрице из предыдущей теоремы, имеет вид

x1 y 1 + . . . + xp y p - xp+1 y

p+1

- . . . - xp+q y

p+q

.

Этот вид называется нормальным видом эрмитовой полуторалинейной формы.

5.4. Закон инерции. Единственность нормального вида
В случае симметрической билинейной формы над C нормальный вид зависит только от е? ранга, и поэтому мы получаем:

(комплексные квадратичные формы) получаются друг из друга линейной заменой координат тогда и только тогда, когда их ранги совпадают.

Предложение 5.4.1. Две комплексные симметрические билинейные формы

Аналогично, нормальный вид кососимметрической билинейной формы (над любым полем) зависит только от е? ранга, и поэтому мы получаем:
Предложение 5.4.2. Две кососимметрические билинейные формы получаются друг из друга линейной заменой координат тогда и только тогда, когда их ранги совпадают.

В случае вещественных симметрических билинейных форм и в случае эрмитовых полуторалинейных форм ситуация сложнее: их нормальный вид не определяется одним лишь рангом, а зависит ещ? от количества 1 и -1 на диагонали матрицы. Оказывается, что нормальный вид такой формы не зависит от способа приведения к нормальному виду:

цы вещественной симметрической билинейной функции B не зависит от способа приведения к нормальному виду. Другими словами, если квадратичная форма Q(x) вещественной линейной заменой x = C y приводится к виду

Теорема 5.4.3 (закон инерции). Количество 1, -1 и 0 на диагонали матри-

(y 1 )2 + . . . + (y p )2 - (y (z 1 )2 + . . . + (z p )2 - (z
то мы имеем p = p и q = q .


p+1 2

) - . . . - (y

p+q 2

),


а вещественной линейной заменой x = C z к виду
p +1 2

) - . . . - (z

p +q

)2 ,


82

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

A 1, . . . , A n пространства V , (y 1 , . . . , y n ) координаты в базисе B 1 , . . . , B n , а (z 1 , . . . , z n ) координаты в базисе C 1 , . . . , C n . Рассмотрим подпространства
Доказательство. Пусть (x1 , . . . , xn ) координаты в исходном базисе

U+ = B 1 , . . . , B p , W+ = C 1 , . . . , C p ,

U - = B W - = C

p+1

,...,B

p+q

,


U0 = B , W 0 = C

p+q +1

, . . . , B n , , . . . , C n .

p +1

,...,C

p +q

p +q +1

Для ненулевого вектора N U+ мы имеем N = y 1 B 1 +. . .+y p B p и поэтому B (N , N ) = (y 1 )2 + . . . + (y p )2 > 0. Аналогично, если N U- U0 , то B (N , N ) 0. Для ненулевого вектора N W+ мы имеем B (N , N ) > 0, а для N W- W0 имеем B (N , N ) 0. Предположим, что p > p . Тогда

dim U+ + dim(W- W0 ) = p + (n - p ) > n = dim V ,
значит, U+ (W- W0 ) = {0}. Возьм?м ненулевой вектор N в этом пересечении. Так как N U+ , имеем B (N , N ) > 0. С другой стороны, из N W- W0 следует, что B (N , N ) 0. Противоречие. Следовательно, p = p . Кроме того, p + q = p + q = rk B , а значит и q = q . Имеет место также закон инерции для эрмитовых полуторалинейных функций, который доказывается полностью аналогично:
Теорема 5.4.4. Количество 1, -1 и 0 на диагонали матрицы эрмитовой полуторалинейной функции не зависит от способа приведения к нормальному виду.

ных диагональных элементов в нормальном виде называется сигнатурой вещественной симметрической билинейной функции (эрмитовой полуторалинейной функции). Из теоремы 5.4.3 следует, что сигнатура, как и ранг, является инвариантном вещественной симметрической билинейной функции (эрмитовой полуторалинейной функции), т.е. не зависит от базиса.
Следствие 5.4.6. Две вещественные симметрические билинейные формы или две эрмитовы полуторалинейные функции получаются друг из друга линейной заменой координат тогда и только тогда, когда их ранги и сигнатуры совпадают.

Определение 5.4.5. Разность p - q между числом положительных и отрицатель-

Все результаты этого раздела можно свести в одно утверждение: нормальный вид симметрической или кососимметрической билинейной функции или эрмитовой полуторалинейной функции единствен.

5.5. Теорема Якоби. Критерий Сильвестра
Теорема Якоби позволяет (при выполнении некоторого дополнительного условия) найти нормальный вид квадратичной формы без нахождения преобразования. Напомним, что угловым минором порядка k матрицы называется минор (определитель подматрицы), составленный из первых k строк и первых k столбцов.

квадратичной формы отличны от нуля до порядка r = rk Q. Тогда существует замена координат, приводящая данную квадратичную форму к виду |Qr | r 2 |Q2 | 2 2 (x ) + . . . + (x ) , |Q1 |(x1 )2 + |Q1 | |Qr-1 |

Теорема 5.5.1 (Якоби). Предположим, что все угловые миноры матрицы Q


5.5. ТЕОРЕМА ЯКОБИ. КРИТЕРИЙ СИЛЬВЕСТРА

83

где |Qi | угловой минор порядка i.
Сначала докажем лемму. Скажем, что для квадратичной формы имеет место регулярный случай, если она приводится к диагональному виду последовательным применением исключительно основного преобразования метода Лагранжа.
Лемма 5.5.2. Для квадратичной формы Q(x) имеет место регулярный случай тогда и только тогда, когда все угловые миноры е? матрицы Q отличны от нуля до порядка r = rk Q. Доказательство. Пусть угловые миноры до порядка r отличны от нуля. Тогда q11 = |Q1 | угловой минор порядка 1, который не равен нулю по предположению. Значит, на первом шаге применимо основное преобразование метода Лагранжа. Предположим теперь, что после k -кратного применения основного преобразования метода Лагранжа матрица квадратичной формы принимает вид 0 q11 .. . 0 qk k (5.3) Q = 0 qk+1,k+1 . . . . .. . . 0 .

Заметим, что матрица замены координат для 1 - q12 ћ ћ q11 0 1 ћћ C = . . .. . . . . 0 0 ћћ

основного преобразования есть ћ - q1n q11 ћ 0 . . . . ћ 1

t (см. формулы (5.1)). Для угловых подматриц Qk мы имеем Qk = Ck Qk Ck , где Ck угловая подматрица матрицы C . Так как det Ck = 1, мы получаем |Qk | = |Qk |, т.е. угловые миноры матрицы квадратичной формы не меняются при основном преобразовании метода Лагранжа. Возвращаясь к матрице (5.3), мы получаем |Qk+1 | = |Qk+1 | = q11 ћ ћ ћ qkk qk+1,k+1 = 0 при k < r по предположению. Следовательно, qk+1,k+1 = 0, и мы снова можем применить основное преобразование. После r-кратного применения основного преобразования мы получаем матрицу (5.3), где k = r и матрица в правом нижнем углу равна нулю. Следовательно, квадратичная форма приведена к диагональному виду последовательным применением основного преобразования метода Лагранжа, и мы имеем регулярный случай.

Пусть теперь имеет место регулярный случай, т.е. форма приведена к диагональ ному виду с ненулевыми числами q11 , . . . , qrr на диагонали последовательным применением основного преобразования. Тогда, так как угловые миноры не меняются при основном преобразовании, мы имеем |Qk | = |Qk | = q11 ћ ћ ћ qkk = 0 при k r. привести квадратичную форму к диагональному виду
q11 (u1 )2 + . . . + qrr (ur )2

Доказательство теоремы Якоби. В силу предыдущей леммы, мы можем


84

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

используя лишь основное преобразование метода Лагранжа. Тогда |Qk | = |Qk | = |k q11 ћ ћ ћ qkk при k r, т.е. qkk = |QQ-|1 | , что и требовалось. k

жительно определ?нной, если B (N , N ) > 0 при N = 0. Соответствующая квадратичная форма Q(x) удовлетворяет условию Q(x) > 0 при x = 0 и также называется положительно определ?нной.
Положительно определ?нная симметрическая билинейная функция зада?т в пространстве V скалярное произведение, т.е. превращает V в евклидово пространство.

Определение 5.5.3. Симметрическая билинейная функция B называется поло-

(квадратичная форма) положительно определена тогда и только тогда, когда все угловые миноры е? матрицы в некотором базисе положительны.
Доказательство. Пусть все угловые миноры |Qk | матрицы квадратичной формы Q(x) положительны. Тогда в силу теоремы Якоби квадратичная форма приво|k дится к виду Q(u) = q11 (u1 )2 + . . . + qnn (un )2 , где n = rk Q = dim V , а qkk = |QQ-|1 | > 0. k Такая квадратичная форма положительно определена, так как Q(u) > 0 при u = 0. Обратно, пусть Q(x) положительно определена. Так как в любом базисе мы имеем qii = B (A i , A i ) > 0, всегда применимо основное преобразование метода Лагранжа. Тогда последовательно применяя основное преобразование, мы привед?м квад ратичную форму к виду Q(u) = q11 (u1 )2 + . . . + qnn (un )2 , где qii > 0. Следовательно, |Qk | = |Qk | = q11 ћ ћ ћ qkk > 0 для любого k .

Теорема 5.5.4 (критерий Сильвестра). Симметрическая билинейная функция

5.6. Симметрические билинейные функции в евклидовых пространствах. Канонический вид
Пусть V евклидово пространство. Мы знаем из теоремы 3.9.3, что отображение N N = (N , ћ ) устанавливает канонический изоморфизм V V между V и его двойственным пространством V . Это позволяет нам отождествить пространства линейных отображений Hom(V , V ) и Hom(V , V ). С другой стороны, Hom(V , V ) это пространство End(V ) линейных операторов, а в силу теоремы 5.1.6, Hom(V , V ) это пространство билинейных функций B(V ). Если вникнуть в построение этих изоморфизмов, то мы увидим, что в явном виде канонический изоморфизм между пространством операторов и пространством билинейных функций в евклидовом пространстве описывается следующим утверждением, которое легко доказать и непосредственно:

BA = (A ћ , ћ ) устанавливает изоморфизм : End(V ) B(V ) между пространством операторов и пространством билинейных функций. Здесь BA = (A ћ , ћ ) билинейная функция, задаваемая формулой BA (N, O) = (AN, O).
Доказательство. Так как пространства End(V ) и B(V ) имеют одинаковую размерность n2 , достаточно проверить мономорфность отображения . Пусть (A) = 0, т.е. BA тождественно нулевая функция. Тогда (AN , O ) = 0 для любых N , O . В частности, (AN , AN ) = 0 для любого N , т.е. AN = 0 и A = O нулевой оператор.

Предложение 5.6.1. Пусть V евклидово пространство. Отображение A

Это утверждение имеет важные следствия: оно позволяет переводить утверждения об операторах в утверждения о билинейных функциях и наоборот. Одно из основных приложений заключается в следующем:


5.7. ПРИВЕДЕНИЕ ПАРЫ ФОРМ К ДИАГОНАЛЬНОМУ ВИДУ

85

Теорема 5.6.2. Для билинейной симметрической функции в евклидовом пространстве существует ортонормированный базис, в котором е? матрица диагональна. Другими словами, квадратичная форма приводится к диагональному виду ортогональным преобразованием.

A соответствующий ей оператор, т.е. B = BA . Тогда из B(N , O ) = B(O , N ) получаем (AN , O ) = (AO , N ) = (N , AO ), т.е. оператор A самосопряж?н. Выберем канонический ортонормированный базис A 1 , . . . , A n для A, т.е. AA i = i A i . Тогда для матрицы B = (bij ) функции B в этом базисе имеем bij = B(A i , A j ) = (AA i , A j ) = (i A i , A j ) = i ij ,
т.е. матрица B диагональна (и совпадает с матрицей оператора A).
Второе доказательство. Посмотрим, как преобразуются матрица билинейной функции и матрица оператора при ортогональном преобразовании. Пусть B матрица билинейной функции в некотором ортонормированном базисе. При ортогональном преобразовании с матрицей C матрица B переходит в матрицу B = C t B C . Так как матрица C ортогональна, то же преобразование мы можем записать в виде B = C -1 B C . Но это закон преобразования для матрицы оператора. Так как оператор с симметричной матрицей B в ортонормированном базисе самосопряж?н, его можно привести к диагональному виду ортогональным преобразованием.

Первое доказательство. Пусть B симметрическая билинейная функция и

Диагональный вид, к которому приводится симметрическая билинейная функция (квадратичная форма) ортогональным преобразованием, называется каноническим.
Предложение 5.6.3. Канонический вид симметрической билинейной функции (квадратичной формы) единствен с точностью до перестановки диагональных элементов. Эти элементы представляют собой собственные значения матрицы квадратичной формы в любом ортонормированном базисе.

ванном базисе. Тогда диагональные элементы канонического вида это собственные значения самосопряж?нного оператора с матрицей Q, т.е. корни уравнения det(Q - tE ) = 0. В другом ортонормированном базисе матрица квадратичной формы есть Q = C t QC и е? собственные значения находятся из уравнения det(Q - tE ) = 0. Так как det(Q -tE ) = det(C t QC -tC t C ) = det(C t (Q-tE )C ) = det(C t C ) det(Q-tE ) = det(Q - tE ), собственные значения матриц Q и Q совпадают. Собственные векторы матрицы квадратичной формы также называют е? главными осями, а приведение к каноническому виду приведением к главным осям.

Доказательство. Пусть Q матрица квадратичной формы в ортонормиро-

5.7. Приведение пары форм к диагональному виду. Собственные значения и собственные векторы пары форм
Модификация теоремы 5.6.2 позволяет одновременно приводить к диагональному виду сразу две квадратичные формы, одна из которых положительно определена:
Теорема 5.7.1. Пусть даны две квадратичные формы Q(x) и B (x), прич?м форма Q(x) положительно определена. Тогда существует линейная замена координат x = C y , приводящая форму Q(x) к нормальному виду (y 1 )2 + . . . + (y n )2 , а форму B (x) к диагональному виду 1 (y 1 )2 + . . . + n (y n )2 .


86

5. БИЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФУНКЦИИ

Доказательство. Положительно определ?нная симметрическая билинейная функция, соответствующая квадратичной форме Q(x), превращает V в евклидово пространство. В исходных координатах матрица Грама скалярного произведения есть Q. В любом ортонормированном базисе матрица Грама (она же матрица квадратичной формы Q(x)) будет единичной. Согласно теореме 5.6.2, существует ортонормированный базис, в котором матрица формы B (x) имеет диагональный вид.

Обратим внимание, что матрица C замены координат из предыдущей теоремы не является ортогональной: вместо соотношения C t C = E она удовлетворяет соотношению C t QC = E . Другими словами, столбцы матрицы C образуют ортонормированный базис относительно скалярного произведения в Rn с матрицей Грама Q. Если мы попытаемся превратить доказательство теоремы 5.7.1 в практический алгоритм, то нам прид?тся действовать в два шага: сначала найти матрицу C , приводящую Q к единичному виду, т.е. (C )t QC = E , а матрицу B к некоторому виду B = (C )t B C ; затем найти ортогональную матрицу C , приводящую B к каноническому (диагональному) виду, т.е. (C )t B C = D диагональная матрица; тогда для C = C C мы имеем C t QC = E и C t B C = D. На практике, однако, это метод не очень эффективен. Более эффективный метод основан на следующем определении:
Определение 5.7.2. Пусть даны две квадратичные формы Q(x) и B (x), прич?м Q(x) положительно определена. Корни уравнения det(B - tQ) = 0 называются собственными значениями пары форм Q(x) и B (x). Пусть собственное значение пары форм Q(x) и B (x). Ненулевой вектор y , удовлетворяющий системе уравнений (B - Q)y = 0, называется собственным вектором пары форм, соответствующим собственному значению .

тельно определ?нную форму Q(x) к нормальному виду (y 1 )2 + . . . + (y n )2 , а форму B (x) к диагональному виду 1 (y 1 )2 + . . . + n (y n )2 . Тогда числа 1 , . . . , n суть собственные векторы пары форм Q(x) и B (x), а столбцы матрицы C образуют базис из собственных векторов пары форм, который является ортонормированным относительно скалярного произведения, задаваемого формой Q(x).
матрица с числами 1 , . . . , n на диагонали. Тогда для любого i матрица D - i E вырождена, следовательно,
Доказательство. Мы имеем C t QC = E , а C t B C = D , где D диагональная

Теорема 5.7.3. Предположим, что линейная замена x = C y приводит положи-

0 = det(D - i E ) = det(C t B C - i C t QC ) = det(C t (B - i Q)C ) = det(C )2 det(B - i Q).
Так как матрица C невырождена, отсюда следует, что det(B - i Q) = 0, т.е. i собственное значение пары форм. Пусть ci i-й столбец матрицы C . Из соотношения C t (B - i Q)C = D - i E мы получаем, что i-й столбец матрицы C t (B - i Q)C нулевой, т.е. C t (B - i Q)ci = 0. Так как матрица C обратима, отсюда следует, что (B - i Q)ci = 0, т.е. ci собственный вектор пары форм, отвечающий собственному значению i . Наконец, соотношение C t QC = E выражает тот факт, что столбцы матрицы C образуют ортонормированный базис относительно скалярного произведения с матрицей Грама Q.


Глава 6

Тензоры
Понятие тензора обобщает объекты, рассматривавшиеся нами ранее: векторы, ковекторы (линейные функции), линейные операторы, билинейные функции. Имеется два подхода к определению тензора: беcкоординатный (через полилинейные функции) и координатный (собственно тензоры). Начн?м с первого.

6.1. Полилинейные функции
Пусть V линейное пространство над полем k нулевой характеристики (обычно k = R или C) и V двойственное пространство. Элементы L V это, как обычно, векторы, а элементы V здесь мы будем называть ковекторами.
Определение 6.1.1. Полилинейной функцией типа (p, q ) называется функция

T : V Ч ... Ч V ЧV Ч ... Ч V k
p q

от p ковекторных и q векторных аргументов, которая линейна по каждому аргументу, т.е. удовлетворяет соотношениям

T ( 1 , . . . , j + j , . . . , p , L 1 , . . . , L q ) = = T ( 1 , . . . , j , . . . , p , L 1 , . . . , L q ) + T (, 1 , . . . , j , . . . , p , L 1 , . . . , L q ). T ( 1 , . . . , p , L 1 , . . . , ч L i + ч L , . . . , L q ) = i = ч T ( 1 , . . . , p , L 1 , . . . , L i , . . . , L q ) + ч T ( 1 , . . . , p , L 1 , . . . , L , . . . , L q ), i
Полилинейные функции типа (p, q ) образуют линейное пространство, в котором сумма и умножение на скаляры определены по формуле






(T + чS )( 1 , . . . , p , L 1 , . . . , L q ) = T ( 1 , . . . , p , L 1 , . . . , L q ) + чS ( 1 , . . . , p , L 1 , . . . , L q ).
Мы будем обозначать это пространство через Pp (V ). q па (0 (V ) тора
Пример 6.1.2. Линейные функции (ковекторы) являются полилинейными ти-

, 1), а билинейные типа (0, 2). Ввиду наличия канонического изоморфизма V векторы являются полилинейными функциями типа (1, 0): значение век= L на ковекторе определяется по формуле L ( ) := (L ).

Следующее утверждение показывает, что операторы также можно рассматривать как полилинейные функции:
Предложение 6.1.3. Сопоставление линейному оператору A полилинейной функции TA типа (1, 1), задаваемой формулой TA ( , L) := (A(L)), устанавливает = канонический изоморфизм End(V ) - P1 (V ). 1
87


88

6. ТЕНЗОРЫ

Доказательство. Прежде всего заметим, что данное отображение End(V ) P1 (V ) линейно. Пусть dim V = n. Тогда размерность пространства P1 (V ) равна n2 1 1 это доказывается при помощи выбора базиса, так же как и для билинейных функций (см. также раздел 6.4). Поэтому размерности пространств End(V ) и P1 (V ) равны, а 1 значит достаточно доказать, что End(V ) P1 (V ) мономорфизм. Пусть TA 1 тождественно нулевая полилинейная функция, т.е. (A(L )) = 0 для любых L V и V . Получаем, что любая линейная функция обращается в нуль на векторе A(L ), т.е. A(L ) = 0. Так как это верно для любого L , получаем A = O. Итак отображение A TA мономорфно, а значит зада?т изоморфизм.

6.2. Тензоры: координатное определение
Зафиксируем базис A 1 , . . . , A n в пространстве V . В пространстве V имеется двойi ственный базис 1 , . . . , n , где i (A j ) = j . Тогда значение любой полилинейной функции T Pp (V ) определяется е? значениями на базисных векторах и ковекторах: q
j j (6.1) T ( 1 , . . . , p , L 1 , . . . , L q ) = T (i11 i1 , . . . , ipp ip , v11 A j1 , . . . , vqq A jq ) j j = i11 ћ ћ ћ ipp v11 ћ ћ ћ vqq T (i1 , . . . , ip , A j1 , . . . , A jq ).

Сопоставим полилинейной функции T Pp (V ) и базису A 1 , . . . , A n набор из n q i1 ,...,ip чисел T = {Tj1 ,...,jq }, где (6.2)

p+q

T

i1 ,...,ip j1 ,...,jq

:= T (i1 , . . . , ip , A j1 , . . . , A jq ).

Посмотрим, как преобразуется это набор при заменах базиса. Пусть C = (ci ) i матрица перехода от базиса A 1 , . . . , A n к базису A 1 , . . . , A n . Тогда мы имеем A j = cj A j , i = ci i и i j

Tj

i ,...,i p 1 1 ,...,jq

= T (i1 , . . . , ip , A j1 , . . . , A jq ) = T (ci1 i1 , . . . , cip ip , cj1 A j1 , . . . , cjq A jq ) = j p 1 q





i



i



j

1

p 1 = ci1 ћ ћ ћ cip cj1 ћ ћ ћ cjq T (i1 , . . . , ip , A j1 , . . . , A jq ) = ci1 ћ ћ ћ cip cj1 ћ ћ ћ cjq Tj1 ,...,jq . p j p j 1 1 q q

i



i

j

i

i

j

i ,...,i

1

1

Определение 6.2.1. Тензором типа (p, q ) называется соответствие

базисы в V

-
i ,...,i

наборы из n

p+q

чисел T = {Tj

i1 ,...,ip 1 ,...,jq

},

p 1 при котором наборы T = {Tj1 ,...,jq } и T = {T }, соответствующие различным базисам A 1 , . . . , A n и A 1 , . . . , A n , связаны соотношением

i ,...,i p 1 j1 ,...,jq j

Tj

i ,...,i p 1 1 ,...,jq

= ci1 ћ ћ ћ cip cj1 ћ ћ ћ cjq T p j 1 q
1

i



i

i1 ,...,ip j1 ,...,jq

.
i ,...,i

p 1 Это соотношение называется тензорным законом преобразования. Числа Tj1 ,...,jq называются компонентами тензора T . Тензоры типа (p, q ) образуют линейное пространство Tp (V ) относительно операq ций покомпонентного сложения и умножения на числа.

Полилинейная функция T Pp (V ) определяет тензор T Tp (V ) по формуq q ле (6.2). Обратно, тензор определяет полилинейную функцию по формуле (6.1). Таким образом, пространство полилинейных функций Pp (V ) можно отождествить с q пространством тензоров Tp (V ). Это соответствие обобщает соответствие между биq линейными функциями (или линейными операторами) и их матрицами.


6.3. ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ, СВЕРТКА, ПОДНЯТИЕ И ОПУСКАНИЕ ИНДЕКСОВ

89

Далее мы не будем различать полилинейные функции и тензоры. Мы будем говорить, например, что операторы это тензоры типа (1, 1). Более точно, тензор, соответствующий оператору, это сопоставление каждому базису матрицы оператора в этом базисе.
Пример 6.2.2. 1. Скаляры k естественно считать тензорами типа (0, 0): они не меняются при замене базиса. 2. Векторы это тензоры типа (1, 0). Тензорный закон преобразования v i = ci v i i описывает изменение координат вектора при замене базиса (теорема 1.6.3). 3. Ковекторы (линейные функции) это тензоры типа (0, 1). Тензорный закон преобразования i = ci i это закон преобразования координат линейной функции i при замене базиса (см. раздел 1.9). 4. Билинейные функции это тензоры типа (0, 2). Тензорный закон преобразования Ti j = ci cj Tij это закон изменения матрицы билинейной функции (в ij матричном виде: T = C t T C , см. теорему 5.1.3). 5. Линейные операторы это тензоры типа (1, 1). Тензорный закон преобразо вания Tji = ci cj Tji это закон изменения матрицы оператора (в матричном виде: ij T = C -1 T C , см. теорему 2.1.2).

6.3. Тензорное произведение, св?ртка, опускание и поднятие индексов Тензорное произведение.
p+r T Pp (V ) и S Pr (V ) называется полилинейная функция T S Pq+s (V ), заq s данная по формуле

Определение 6.3.1. Тензорным произведением двух полилинейных функций

T S ( 1 , . . . , p ,

p+1

,...,

p+r

, L 1, . . . , L q , L

q +1

,...,L

q +s

)= ,...,
p+r

= T ( 1 , . . . , p , L 1 , . . . , L q ) ћ S (

p+1

,L

q +1

,...,L

q +s

).

p+r Полилинейной функции T S соответствует тензор T S Tq+s (V ), компоненты которого задаются формулой

(T S )

i1 ,...,ip ,ip+1 ,...,ip+r j1 ,...,jq ,jq+1 ,...,jq+s

p 1 = Tj1 ,...,jq ћ S

i ,...,i

ip+1 ,...,ip+r jq+1 ,...,jq+s

.

Тензор T S называется тензорным произведением тензоров T и S . Операция тензорного произведения, очевидно, ассоциативна (т.е. (T S ) R = T (S R)) и дистрибутивна (т.е. (T +чS )R = T R+чS R), но не коммутативна (вообще говоря, T S = S T ). Сумма и тензорное произведение превращают ?пространство всех тензоров? p T(V ) = p,q Tq (V ) в кольцо (точнее, алгебру над полем k), которая называется тензорной алгеброй или алгеброй Грассмана. линейные функции, т.е. тензоры типа (0, 1). Их тензорное произведение является тензором типа (0, 2), т.е. билинейной функцией. По определению, значение этой билинейной функции на паре векторов зада?тся формулой ( )(K , L ) = (K ) ћ (L ).
Пример 6.3.2. Пусть , V



90

6. ТЕНЗОРЫ
,...,ip Св?ртка. Пусть теперь T = {Tji11,...,jq } тензор с хотя бы одним верхним и ниж-

ним индексом, т.е. p > 0 и q > 0. Зафиксируем один верхний и один нижний индекс (пусть для простоты это будут первые индексы) и сформируем следующий новый набор из np+q-2 чисел: k,i2 ,...,ip cT = {Tk,j2 ,...,jq }, где как обычно по повторяющемуся индексу k подразумевается суммирование.
Предложение 6.3.3. cT = {Tk
i ,...,i p 2 ,...,jq k ,i ,...,i p 2 ,j ,...,j q 2 i i k,i2 ,...,ip ,j2 ,...,jq

} является тензором типа (p - 1, q - 1).
j i1 ,i2 ,...,i j1 ,j2 ,...,j i

Доказательство. Необходимо проверить тензорный закон. Мы имеем

(cT )j2

= Tk
i

= ck1 ci2 ћ ћ ћ cip cj1 cj2 ћ ћ ћ cjq T i p k j 2 q
2



i



p q

=
j
2

q = ci2 ћ ћ ћ cip cj2 ћ ћ ћ cjq ck1 cj1 T i k p j 2 2

j



i1 ,i2 ,...,i j1 ,j2 ,...,j i


p q

j1 1 = ci2 ћ ћ ћ cip cj2 ћ ћ ћ cjq i1 Tj1 ,j p j 2 q j k,i2 ,...,ip ,j2 ,...,jq i


i

i ,i2 ,...,i 2 ,...,j

p q

=
i2 ,...,ip j2 ,...,jq

= ci2 ћ ћ ћ cip cj2 ћ ћ ћ cjq Tk p j 2 q
2

i

= ci2 ћ ћ ћ cip cj2 ћ ћ ћ cjq (cT ) p j 2 q
2

i

j

,

что и требовалось.
Определение 6.3.4. Тензор cT = {Tk
i1 ,i2 ,...,ip Tj1 ,j2 ,...,jq k,i2 ,...,ip ,j2 ,...,jq

} называется св?рткой тензора T =

{ } по (первым) верхнему и нижнему индексам. Св?ртка, очевидно, зада?т -1 линейное отображение Tp (V ) Tp-1 (V ). q q Операцию св?ртки можно проводить несколько раз до исчерпания верхних или нижних индексов. Последняя возможная св?ртка (после которой не оста?тся либо верхних, либо нижних индексов) называется полной св?рткой.
1. Пусть A оператор, т.е. тензор типа (1, 1). Результатом его св?ртки будет тензор типа (0, 0), т.е. скаляр. Этот скаляр это сумма ai диагональных элементов i матрицы оператора A в любом базисе, т.е. след оператора: cA = tr A. Проверка тензорного закона для св?ртки в данном случае сводится к проверке независимости следа от базиса (лемма 2.1.3). 2. Пусть B = {bj1 j2 } билинейная функция (тензор типа (0, 2)), а u = {ui1 }, v = {v i2 } векторы (тензоры типа (1, 0)). Рассмотрим тензор B u v = {bj1 j2 ui1 v i2 } типа (2, 2). Его полная св?ртка есть скаляр bkl uk v l = B (u, v ) значение билинейной функции на данной паре векторов.
Пример 6.3.5.

Опускание и поднятие индексов. Пусть V евклидово пространство. Тогда соответствие L (L , ћ ) зада?т канонический изоморфизм V V , т.е. позволяет отождествить тензоры типа (1, 0) с тензорами типа (0, 1). В координатах это выглядит следующим образом. Пусть G = (gij ) матрица Грама скалярного произведения. Так как скалярное произведение это билинейная функция, G является тензором типа (0, 2). Тогда при изоморфизме V V вектор T с координатами T i переходит в ковектор с координатами Tj = gij T i . Таким образом, мы ?опустили индекс? у тензора T при помощи фиксированного тензора G типа (0, 2). Эта операция обобщается следующим образом:
-1 Tp+1 (V ) тензоров в евклидовом пространстве V , которое тензору T = {Tj q i,i2 ,...,i (p, q ) ставит в соответствие тензор {gij Tj1 ,...,jq p } типа (p - 1, q + 1).

Определение 6.3.6. Опускание индекса это линейное отображение Tp (V ) q
i1 ,...,ip 1 ,...,jq

} типа


6.4. БАЗИС В ПРОСТРАНСТВЕ ТЕНЗОРОВ

91

Пример 6.3.7. Рассмотрим изоморфизм : End(V ) B(V ) между пространством операторов и пространством билинейных функций (см предложение 5.6.1), сопоставляющий оператору A билинейную функцию BA = (A ћ , ћ ). В координатах это выглядит так: оператору с матрицей A = (ai ) сопоставляется билинейная функция k с матрицей BA = (gij ai ). Таким образом, BA это тензор типа (0, 2), получаемый в k результате опускания индекса у тензора A типа (1, 1).

Для того, чтобы определить операцию, обратную к опусканию индекса, рассмотрим набор {g kl }, состоящий из элементов обратной матрицы к матрице Грама k G = (gij ), т.е. g kl glj = j .
Предложение 6.3.8. {g kl } является тензором типа (2, 0).
k имеем g k i gi j = j . Так как {gij } тензор типа (0, 2), мы имеем gi j = ci cj gij . ij k k i i j Подставив это в предыдущую формулу, получим g ci cj gij = j . Теперь умножим


Доказательство. Необходимо проверить тензорный закон. В новом базисе мы


обе части этого равенства на компоненты обратной матрицы cj (и просуммируем k j k по j ): g k i ci cj cj gij = j cj . Так как cj cj = k , отсюда получаем g k i ci gik = ck . Далее k ijk i k jk l умножим обе части на g kl : g k i ci gik g kl = ck g kl . Так как gik g kl = i , получаем g k i cl = k i i kl i l l l k l l ck g . Наконец, умножим обе части на cl : g k ci cl = ck cl g . Так как cl cl = i , k l k il окончательно получаем g k l = ck cl g kl . Это и есть тензорный закон преобразования kl для тензора типа (2, 0).
Определение 6.3.9. Поднятие индекса это линейное отображение Tp (V ) q
+1 Tp-1 (V ) тензоров в евклидовом пространстве V , которое тензору T = {Tj q i1 ,...,ip (p, q ) ставит в соответствие тензор {g ij Tj,j2 ,...,jq } типа (p + 1, q - 1). i1 ,...,ip 1 ,...,jq

} типа

Операция опускания (или поднятия) индекса является композицией тензорного произведения с тензором {gij } (или {g ij }) и св?ртки.

6.4. Базис в пространстве тензоров
Базис в пространстве тензоров Tp (V ) можно задать при помощи операции тенq зорного произведения. Рассмотрим полилинейную функцию A i1 . . . A ip j1 . . . jq . По определению, е? значение на q векторах и p ковекторах зада?тся формулой

(A i1 . . . A ip j1 . . . jq )( 1 , . . . , p , L 1 , . . . , L q ) =
j j = A i1 ( 1 ) ћ ћ ћ A ip ( p ) j1 (L 1 ) ћ ћ ћ jq (L q ) = i11 ћ ћ ћ ipp v11 ћ ћ ћ vqq ,

а соответствующий тензор типа (p, q ) имеет компоненты

Tl

k1 ,...,k 1 ,...,lq

p

k = (A i1 . . . A ip j1 . . . jq )(k1 , . . . , kp , A l1 , . . . , A lq ) = i11 ћ ћ ћ ipp lj11 ћ ћ ћ k

jq lp

(другими словами, компонента этого тензора с верхними индексами i1 , . . . , ip и нижними индексами j1 , . . . , jq единица, а остальные компоненты нули).

значениями индексов i1 , . . . , ip и j1 , . . . , jq , образуют базис в пространстве Tp (V ). q

Теорема 6.4.1. Тензоры

Ai1 . . . Aip j1 . . . jq , отвечающие всевозможным


92

6. ТЕНЗОРЫ

Доказательство. Сначала докажем линейную независимость данных тензоi ,...,i ров. Предположим, существуют такие числа j1 ,...,jp , что линейная комбинация q 1
i ,...,i

j1 ,...,jp A i1 . . . A ip j1 . . . jq равна нулю. Применив эту полилинейную функцию q 1 к аргументам k1 , . . . , kp , A l1 , . . . , A lq , получим
(6.3) 0 = (
i1 ,...,ip j1 ,...,jq

A i1 . . . A ip j1 . . . jq )(k1 , . . . , kp , A l1 , . . . , A lq ) =
=
i1 ,...,ip k1 j1 ,...,jq i1
q ћ ћ ћ ipp lj11 ћ ћ ћ lp =

k

j

k1 ,...,k l1 ,...,lq

p

,

т.е. все коэффициенты линейной комбинации равны нулю. i1 ,...,ip Теперь докажем, что любой тензор T = {Tj1 ,...,jq } представляется в виде линейной комбинации данных тензоров. А именно, докажем, что

T = Tj

i1 ,...,ip 1 ,...,jq

A i1 . . . A ip j1 . . . jq ,
полилинейнои ковекторов, аргументов в правую часть

т.е. координаты тензора в данном базисе суть его компоненты. В силу сти это равенство достаточно проверить на наборах базисных векторов т.е. на аргументах вида k1 , . . . , kp , A l1 , . . . , A lq . При подстановке этих k ,...,k левую часть мы по определению получаем Tl11 q p , а при подстановке в ,...,l мы получаем то же самое в силу выкладки, аналогичной (6.3).
Следствие 6.4.2. Размерность пространства Tp (V ) равна n q
p+q

.

6.5. Симметрические и кососимметрические тензоры, симметризация и альтернирование
Здесь мы будем рассматривать только тензоры с нижними индексами. Мы будем обозначать через q группу перестановок индексов 1, . . . , q . Через (-1) будем обозначать знак перестановки q .

T (L и кососимметрической, если T (L

ческой, если

Определение 6.5.1. Полилинейная функция T P0 (V ) называется симметриq
(1)

,...,L

(q )

) = T (L 1 , . . . , L q ),

(1)

,...,L

(q )

) = (-1) T (L 1 , . . . , L q ),

для любых векторов L 1 , . . . , L q и перестановки q . Компоненты тензора T T0 (V ), соответствующего симметрической полилинейq ной функции, удовлетворяет соотношениям

T

j1 ,...,j

q

= Tj

(1)

,...,j

(q )

,

а компоненты тензора, соответствующего кососимметрической полилинейной функции, соотношениям Tj1 ,...,jq = (-1) Tj(1) ,...,j(q) . Такие тензоры называются, соответственно, симметрическими и кососимметрическими. В частности, у косимметрического тензора могут быть отличны от нуля лишь компоненты Tj1 ,...,jq , у которых все индексы различны. Симметрические и кососимметрические тензоры образуют подпространства в пространстве тензоров T0 (V ), которые обозначаются Sq (V ) и q (V ) соответственно. q


6.6. ВНЕШНЕЕ ПРОИЗВЕДЕНИЕ, ВНЕШНИЕ ФОРМЫ

93

При q = 2 симметрические и кососимметрические тензоры это симметрические и кососимметрические билинейные функции соответственно.
Замечание. Хотя подпространства Sq (V ) и q (V ) и образуют прямую сумму в пространстве T0 (V ), при q > 2 разложение T0 (V ) = Sq (V ) q (V ) не имеет места, в q q отличие от случая билинейных функций. Определение 6.5.2. Симметризацией называется линейный оператор Sym : T0 (V ) T0 (V ), который q q тензору T T0 (V ) ставит в соответствие тензор Sym T с компонентами q 1 (Sym T )j1 ,...,jq := Tj ,...,j . q ! (1) (q)
q

Альтернированием называется линейный оператор Alt : T0 (V ) T0 (V ), который q q тензору T T0 (V ) ставит в соответствие тензор Alt T с компонентами q 1 (Alt T )j1 ,...,jq := (-1) Tj(1) ,...,j(q) . q !
q

Легко видеть, что Sym T симметрический тензор, а Alt T кососимметрический тензор для любого T T0 (V ). q

странства Sq (V ) и q (V ) соответственно.

Предложение 6.5.3. Операторы Sym и Alt являются проекторами на подпроДоказательство. Оба утверждения доказываются аналогично. Докажем вто-

рое. В силу теоремы 2.2.2, достаточно показать, что Alt T = T для любого кососимметрического тензора T . Мы имеем 1 1 (Alt T )j1 ,...,jq := (-1) Tj(1) ,...,j(q) = Tj ,...,j = Tj1 ,...,jq , q ! q ! 1 q
q q

где второе равенство выполнено в силу кососимметричности T .

6.6. Внешнее произведение кососимметрических тензоров, внешние формы
Для кососимметрических тензоров имеется аналог тензорного произведения:
Определение 6.6.1. Внешним произведением кососимметрических тензоров

P p (V ) и Q q (V ) называется кососимметрический тензор P Q := (p + q )! Alt(P Q) p! q !

(роль коэффициента будет объяснена ниже).
Теорема 6.6.2. Внешнее произведение кососимметрических тензоров обладает следующими свойствами: для любых P p (V ), Q q (V ), R r (V ) и , ч k а) (P + чQ) R = P R + чQ R (дистрибутивность, при p = q ); б) Q P = (-1)pq P Q (антикоммутативность); в) (P Q) R = P (Q R) (ассоциативность).


94

6. ТЕНЗОРЫ

Доказательство. а) Дистрибутивность вытекает из дистрибутивности операции и линейности оператора Alt. б) Для доказательства антикоммутативности достаточно проверить, что имеет место соотношение Alt(Q P ) = (-1)pq Alt(P Q). Введ?м перестановку ( ) 1 ... p p + 1 ... p + q = . q + 1 ... q + p 1 ... q

Тогда (-1) = (-1)pq , так как результат композиции pq элементарных подстановок. Мы имеем 1 Alt(Q P )i1 ,...,ip+q = (-1) Qi(1) ,...,i(q) Pi(q+1) ,...,i(q+p) = (p + q )!

= = (-1)


1 (p + q )!



p+q

(-1) (-1) Pi
i(1) ,...,i

(1)

,...,i

(p)

Qi

(p+1)

,...,i

(p+q )

= .

1 (-1) P (p + q )!
p+q

p+q

(p)

Qi(

p+1)

,...,i

(p+q )

= (-1)pq Alt(P Q)i1

,...,i

p+q

Тем самым б) доказано. Далее мы будем использовать следующие обозначения. Для p и P T0 (V ) p обозначим через P тензор с компонентами ( P )i1 ,...,ip := Pi(1) ,...,i(p) . По определению 1 альтернирования, Alt P = p! p (-1) P , и имеет место соотношение

(Alt P ) = Alt( P ) = (-1) Alt P.
Для доказательства в) нам понадобится лемма:
Лемма 6.6.3. Для любых тензоров P T0 (V ) и Q T0 (V ) имеем p q

Alt((Alt P ) Q) = Alt(P Q) = Alt(P Alt(Q)).
логично). Поскольку операция дистрибутивна, а оператор Alt линеен, имеем (( 1 ) ) 1 Alt((Alt P ) Q) = Alt (-1) P Q = (-1) Alt( P Q). p! p!
p p

Доказательство. Докажем лишь первое равенство (второе доказывается ана-

Каждой перестановке p сопоставим перестановку p индексах действует как , а остальные оставляет на ( 1 ... p p + 1 ... = (1) . . . (p) p + 1 . . .

p+q , которая на первых месте, т.е. ) p+q . p+q

При этом, очевидно, (-1) = (-1) и P Q = (P Q). Тогда имеем

Alt((Alt P ) Q) =

1 1 = (-1) (-1) Alt(P Q) = Alt(P Q) = Alt(P Q). p! p!
p p

1 (-1) Alt( (P Q)) = p!
p


6.6. ВНЕШНЕЕ ПРОИЗВЕДЕНИЕ, ВНЕШНИЕ ФОРМЫ

95

Теперь верн?мся к доказательству теоремы 6.6.2 в). Мы имеем

( ) (p + q + r)! Alt (P Q) R = (p + q )! r! ( (p + q )! ) (p + q + r)! (p + q + r)! = Alt Alt(P Q) R = Alt(P Q R), (p + q )! r! p! q ! p! q ! r ! где в последнем равенстве мы воспользовались предыдущей леммой. Аналогично + проверяется, что P (Q R) = (pp! q+r)! Alt(P Q R). q! r! (P Q) R =
Выберем теперь базис A 1 , . . . , A n в V , и пусть 1 , . . . , n двойственный базис в V = T0 (V ) = 1 (V ). Рассмотрим кососимметрические тензоры 1 (6.4) i1 . . . ip = p! Alt(i1 . . . ip ) = (-1) i(1) . . . i(p) .
p

В силу теоремы 6.6.2 б) имеем . . . p = (-1)
i1 i i1

i

(1)

...
ip

i

(p)

для p .
(p+q )! p! q !

в определении внешнего произведения, выражение . . . оказалось линейной комбинацией выражений i(1) . . . i(p) с целыми коэффициентами. Таким образом, кососимметрические тензоры i1 . . . ip определены над конечными полями (характеристики, отличной от двух) и даже над целыми числами, что удобно с алгебраической точки зрения.
p зуют базис в пространстве p (V ). В частности, dim p (V ) = Cn .

Замечание. Обратим внимание, что ввиду выбора коэффициента

Теорема 6.6.4. Кососимметрические тензоры {i1 . . . ip , i1 < . . . < ip } обраДоказательство. Сначала докажем, что любой кососимметрический тензор

T T0 (V ) представляется в виде линейной комбинации данных тензоров. Разлоp жим T по базису i1 . . . ip : T = Ti1
,...,i
p

i1 . . . ip .

Теперь применим к обеим частям оператор Alt. Так как T кососимметрический 1 тензор, Alt T = T . С другой стороны, Alt(i1 . . .ip ) = p! i1 . . .ip по определению i1 . . . ip . Итак, получаем 1 Ti1 ,...,ip i1 . . . ip = Ti1 ,...,ip i1 . . . ip , T= p! i ,...,i i <... 1 p 1 p

что и да?т требуемое представление в виде линейной комбинации. Предположим, что тензоры {i1 . . . ip , i1 < . . . < ip } линейно зависимы, т.е. i1 ,...,ip i1 . . . ip = 0.
i1 <... p

Тогда из (6.4) получаем
i1 <...
i


1

,...,ip
p

(-1)

i

(1)

...

i

(p)

= 0.

В этой сумме все тензоры i(1) . . . i(p) различны, следовательно они линейно независимы. Отсюда получаем, что i1 ,...,ip = 0.


96

6. ТЕНЗОРЫ

Ti1 ,...,ip i1 . . . ip (представляющее собой разложение кососимметрического тензора T p (V ) по базису {i1 . . . ip , i1 < . . . < ip }) называется внешней p-формой.
Определение 6.6.5. Выражение T =
i1 <...


Внешние формы складываются и умножаются аналогично многочленам от n переменных. Различие заключается в том, что ?переменные? 1 , . . . , n антикоммутируют, т.е. удовлетворяют соотношениям i j = -j i (в частности, i i = 0). Это предоставляет очень удобный формализм для работы с кососимметрическими тензорами.