Документ взят из кэша поисковой машины. Адрес оригинального документа : http://new.math.msu.su/department/opu/sites/default/files/attached_files/synt_course.pdf
Дата изменения: Thu Feb 21 16:19:06 2013
Дата индексирования: Sun Apr 10 04:27:36 2016
Кодировка: Windows-1251

Поисковые слова: принцип мопертюи
В. М. Тихомиров Синтетический курс математики

Оглавление
Введение Лекция 1. Теория линейных уравнений Лекция 2. Решение нелинейных уравнений Лекция 3. Правило множителей Лагранжа. Принцип компактности Лекция 4. Теория линейных уравнений и геометрия Лекция 5. Приведение квадратичных форм к главным осям. Доказательство теоремы Фредгольма Лекция 6. Начала дифференциального исчисления и теория дифференциальных уравнений Лекция 7. Определенный интеграл Лекция 8. Интегрирование дифференциальных форм Лекция 9. Ряды и комплексный анализ Лекция 10. Начала теории вероятностей Дополнения (приложения к алгебре, геометрии, анализу и к естествознанию)

1


Введение
С момента образования мех-мата, с 1933 года,преподавание математики было поделено на несколько фактически независимых областей. А далее все закоснело. Программа Государственных Экзаменов на мех-мате свыше пятидесяти лет не меняется, и читая ее особенно отчетливо видно это феодальное разделение нашей науки. Иногда речь идет о согласовании разных курсов, но фактически такого согласования добиться невозможно. Андрей Николаевич Колмогоров стремился как-то нарушить это положение созданием своего синтетического курса. Синтетическими курсами я называю такие курсы, при которых воедино соединяются несколько математических направлений. Первым синтетическим курсом в университетском образовании был курс, вошедший в историю под названием ?Анализа I I I?. Его программа была разработана А. Н. Колмогоровым в сороковые и пятидесятые годы прошлого века. Он объединял в себе начала теории множеств, теорию действительных чисел, начала общей топологии, теорию функций, функциональный анализ, теорию меры, теорию интеграла, теорию интегральных уравнений и вариационное исчисление. Чуть позже, уже по инициативе Юрия Ивановича Манина и Сергея Петровича Новикова появились синтетические курсы по линейной алгебре и геометрии и по дифференциальной геометрии и топологии. В чем мне видится смысл создания синтетических курсов? При той системе образования, которая сложилась (причем не только у нас, но фактически во всем мире), наша наука математика представлена, как феодальное царство, как собрание фактически независимых провинций, почти не связанных друг с другом. А на самом деле она едина. И в современное математическое образование, разумно, как мне кажется, включать объединяющие синтетические курсы. Эту необходимость можно мотивировать и теми радикальными переменами, что произошли за последние два десятилетия в нашей стране и в мире. Что же это за изменения? Я бы указал на три: изменился государственный строй, изме-

нилась интересы молодежи и произошел неслыханной силы информационный взрыв.
В наше время нет системы государственного трудоустройства, распределения выпускников, планирования профессиональной занятости. Не следует ли из этого, что в математическом образовании нужно выделить главное, наиболее существенное, чтобы дать возможность личности включаться в творческую деятельность в самых разных областях знаний? В представленном читателю курсе я стараюсь мотивированно выделить то самое главное, что ныне составляет математическое образование в техническом и экономическом вузе и (на несколько более высоком уровне) в университете. Каждая лекция предваряется аннотацией, которая рассчитана на читателя, владеющего теми понятиями, которые в ней фигурируют. Читателю, не владеющий этими понятиями, разумно начать с основного текста, в нем все нужные понятия будут введены.

2


Лекция 1. Теория линейных уравнений
Все есть число
Пифагор

В этой лекции речь пойдет о теории линейных уравнений. Будет рассказано о методе Гаусса решения системы

n

уравнений с

n

неизвестными. Далее рассказывается об альтернативе

Фредгольма для таких систем и доказывается теорема Кронекера Капелли. В заключительной части лекции приводится формулировка альтернативы Фредгольма в бесконечномерном случае. Эта теорема будет доказана в пятой лекции.

1.1. Конечномерный случай
Рассмотрим следующую систему уравнений:

a11 x1 + a12 x2 + . a21 x1 + a22 x2 + . ... an1 x1 + an2 x2 + .
Cистему

. . + a1 n x n = y 1 , . . + a2 n x n = y 2 , ... . . + ann xn = yn . n y

(1)

n

(1)

n называют системой

n

линейных алгебраических уравнений с

неизвестны-

ми. Числа

a

ij называются коэффициентами системы уравнений, числа

i составляют правую

часть системы

(1)

n . Если все

y

i равны нулю, система

(1)

n называется однородной. В этой

лекции коэффициенты системы и правые части предполагаются вещественными числами. Метод решения систем

1

Метод Гаусса

(1n )

был предложен К. Ф Гауссом.

решения системы

(1)

n основан на идее исключения неизвестных. Приме-

ним метод математической индукции. Если

n = 1,

требуется решить уравнение

a11 x1 = y1 .
Возможны три случая: 1) если число 2) если и число

(1)

1

a

11 не равно нулю, тогда уравнение
, и число

(1)

1 имеет единственное решение

a11

y

1 равны нулю, тогда уравнение

(1)

y1 ; a11 разрешимо, но неоднозначно 1

x=

(более того, каждое число является решением); 3) если же число нулю не равно, тогда решений вообще нет.
Эти три тривиальных утверждения мы привели потому, что и в система

a

11 равно нулю, а число

y

1

n

-мерном и в бесконечномерном случае

имеется точно такая же триада. Впрочем, пункт 2) потребует исследования вопроса о том, когда все-таки

(1)

разрешима.

Пусть системы

(1)

n-1 мы решать научились. Опишем метод решения систем

(1)

n.

1 Короткий экскурс в теорию вещественного числа содержится в Дополнении

3


Если все коэффициенты

a

ij уравнения

y1 = y2 = . . . = yn = 0

и им является

(1)n любые n a
nn

равны нулю, то решение возможно лишь если чисел

x 1 , x2 , . . . , x x

n ; если не все

y

i равны нулю

система несовместна (т. е. не имеет решения). Если же, в системе

(1)

n , скажем,

= 0,

то выразим

n из последнего уравнения через

x 1 , x2 , . . . , x

n-1 и подставим полученное выражение в первые

n-1

уравнение. В итоге мы

приходим к системе

(1)

n-1 , которую умеем решать по предположению индукции. Решив по-

лученную систему (если система имеет решение), найдем получившаяся система

x1 , x2 , . . . , x

n-1 , а затем и

x

n . Если

(1)

n-1 несовместна, то и изначальная система

(1)

n несовместна.

До сих пор мы использовали из математических средств лишь арифметику. В следующем разделе полезно пользоваться простейшими понятиями и обозначениями линейной алгебры. Совокупность вещественных чисел или, как еще говорят, вещественную прямую, обозна

x

чают символом

R

. Столбец из

n

чисел

x=

1 . . .



называют

n

-мерным вектором-столбцом.

x

n

Совокупность всех n-мерных векторов-столбцов называют n-мерным (векторным) пространn ством R . Далее для экономии места вектор-столбец с координатами x1 , . . . , xn мы иногда T T записываем в строку (x1 , . . . , xn ) , где символ означает транспонирование замену столбцов строками (и наоборот). Наряду с пространством

R

n

векторов-столбцов иногда будем рассматривать совокупность

x

R

n

векторов-строк. Для вектора

y = (y 1 , . . . , y n )

из

R

n

и вектора-столбца

x=

1 . . .



из

R

n

определяется внутреннее произведение 2 (x2 + . . . + x2 )1/2 (|y | = y ћ y T = (y1 + . n 1 n n x R (y R ). Таблицу из коэффициентов буквой

y ћ x = y1 x1 + . . . + yn xn . Выражение 2 . . + yn )1/2 ) называется модулем (или длиной)

xn |x| = xT ћ x =
вектора

(aij )1

i,j n (такие таблицы называют матрицами) обозначим

. . . a1n A = ... ... ... можно представить, как столбец из n векторов-строк из Rn (a1 = am1 . . . amn (a11 , . . . , a1n ), . . . , an = (an1 , . . . , ann )). Произведение матрицы A на вектор-столбец x (обозначаемое Ax) определяется, как вектор1 n T столбец (a ћ x, . . . , a ћ x) . Совокупность всех матриц с n столбцами и n строками обозначим nn M . Таким образом, любая матрица A из M nn задает отображение из Rn в Rn или, как n n еще говорят, матрица A задает оператор из R в R . Этот оператор обладает линейным 1 2 n свойством, заключающемся в том, что если x и x векторы из R , 1 и 2 два числа и A nn 1 2 матрица из M , то имеет место равенство: A(1 x + 2 x ) = 1 Ax1 + 2 Ax2 . Потому A a
11
называют линейным оператором.

A.

Матрицу

4


Теорема 1 (альтернатива2 Фредгольма в конечномерном случае)
одно из двух: или система уравнений

. Имеет место

(1)

n разрешима для любой правой части, или однород-

ное уравнение имеет ненулевое решение.

Доказательство. Лемма 1.1. Система

a11 x1 + a12 x2 + . . . a21 x1 + a22 x2 + . . . ... an1 x1 + an2 x2 + . . .
из

+ + .. +

a1n+1 xn+1 = 0, a2n+1 xn+1 = 0, . ann+1 xn+1 = 0

(10 )n

n

Доказательство леммы.
a11 x1 + a12 x2 = 0

однородных уравнений с

n + 1-м

неизвестным имеет ненулевое решение.

Снова применяем метод математической индукции. Если в

(уравнении (10 )1 ) все коэффициенты равны нулю, то любые не x1 и x2 будут искомым решением. Если же, скажем, a12 = 0, то a одним из решений будет x2 = 1, x1 = - 11 . a12 Допустим теперь, что мы доказали лемму для системы (10 )n-1 . Докажем лемму для системы (10 )n . Если все коэффициенты aij , 1 i n + 1, 1 j n равны нулю, то любые не равные одновременно нулю числа xi R, 1 i n + 1 будут искомым решением. А если одно из чисел, скажем, ann+1 = 0 не равно нулю, тогда, выразив xn+1 из n-того уравнения через остальные переменные и подставив то, что получится вместо xn+1 , в первые n - 1 уравнение, приходим к системе (10 )n-1 . Оно по предположению индукции имеет ненулевое решение x1 , x2 , . . . , xn-1 , а тогда через них выразим xn и тем самым придем к цели. уравнении равные одновременно нулю Переходим к доказательству альтернативы Фредгольма в конечномерном случае. В нашем случае утверждение можно разбить на две части: 1) если уравнение уравнение имеет только нулевое решение, то система разрешима

(1)

n разрешимо для любой

правой части, то однородное уравнение имеет только нулевое решение; 2) если однородное

(1)

n при любой правой части.

Докажем первое утверждение. Допустим, что оно не справедливо и система (1)n разре1 1 шима для любых правых частей, но при этом существует вектор b = 0 такой, что Ab = 0. 2 2 1 n+1 Найдем тогда вектор b такой, что Ab = b , и так далее, и, наконец, вектор b такой, что n+1 n Ab = b . По лемме 1.1 найдутся числа x1 , x2 , . . . , xn+1 не равные одновременно нулю и 1 2 n+1 такие, что x1 b + x2 b + . . . + xn+1 b = 0. Подействовав на это равенство матрицей A, ис12 n+1 пользуя линейное свойство матрицы A и определения столбцов b , b , . . . , b , получим, что 1 2 n x2 b + x3 b + . . . + xn+1 b = 0. Подействовав теперь на это новое равенство оператором A, и 1 1 поступая далее аналогично, получим, что xn+1 b = 0. Но мы предположили, что b = 0, значит

x

n+1

= 0.

Аналогично докажем, что

xn = x

n-1

= . . . = x1 = 0.

Пришли к противоречию:

мы ведь предполагали, что не все

x

i равны нулю. Значит, из разрешимости системы следует,

что однородное уравнение имеет только нулевое решение. Докажем второе утверждение. Пусть однородное уравнение имеет только нулевое реше-

2 Слово ?альтернатива? означает, что возможен лишь один из двух вариантов, взаимно исключающих друг
друга; И. Фредгольм (1866 1927) шведский математик.

5


ние. Применим лемму 1.1 к системе

a11 x1 + a12 x2 + . . . + a21 x1 + a22 x2 + . . . + ... an1 x1 + an2 x2 + . . . +

a1n xn + y1 xn+1 = 0, a2n xn + y2 xn+1 = 0, ... ann xn + yn xn+1 = 0

(10 )n

n уравнений с n + 1 неизвестным x1 , x2 , . . . , xn+1 . Из леммы 1.1 следует, что найдутся числа x1 , x2 , . . . , xn+1 , не равные нулю одновременно и удовлетворяющие системе. Но по условию число xn+1 не может равняться нулю, ибо иначе однородное уравнение имело бы x2 b x1 b bn ненулевое решение. Значит, положив x1 = - xn+1 , x2 = - xn+1 , . . . , xn = - xx+1 , мы разрешаb b bn ем систему (1)n . Альтернатива Фредгольма доказана.
Переходим к условиям разрешимости систем уравнений. Нам понадобится для этого определение ранга. Приведем его. 1 k n Пусть даны векторы a , . . . , a из R . Скажем, что эти векторы линейно зависимы, если 1 k найдутся числа 1 , . . . , k не равные нулю одновременно такие, что 1 a + . . . + k a = 0. Если таких чисел подобрать нельзя, векторы называются линейно независимыми. Если для 0 1 k 0 вектора a можно найти числа 1 , . . . , k такие, что 1 a + . . . + k a = a , то говорят, что a0 линейно выражается через {ai }1ik . Матрицу A = (aij )1i,j n назовем разрешимой, если n уравнение Ax = y разрешимо для любого y R . mn . Пусть C = (cij )1im, 1j n M (матрица с n столбцами и m стро-

Определение 1

ками). Максимальный размер разрешимой квадратной подматрицы матрицы

C

называют

рангом этой матрицы (ранг матрицы
дополнено.

C

обозначают

rank C

). На лекции 4 это понятие будет

Предложение 1
1) если столбцы

. Для системы


1

a a

a =

11 . . .

(1)

n имеются три возможности:

a

, . . . , an = a (1)

1n . . .



линейно независимы, тогда имеется

n1

nn

единственное решение системы

n ; 2) если столбцы

a1 , . . . , a

n

линейно зависимы и более

y y

того, столбец

y=

1 . . . n

линейно выражается через них, тогда система разрешима,

но неоднозначно; 3) если столбцы

a1 , . . . , a

n

линейно зависимы, а столбец

y

через них не

выражается, тогда решений вообще нет.

Доказательство.

что векторы-столбцы

a1 , . . . , a

Утверждение a1) сразу следует из альтернативы Фредгольма: сказать, n линейно независимы, равносильно тому, что однородная си-

стема имеет лишь нулевое решение. А тогда в силу альтернативы Фредгольма система

(1)

n

разрешима. Если бы существовали два разных решения, то их разность была бы нетривиальным решением однородного уравнения. Отсюда следует единственность. Докажем утверждение 2). Из условий следует, что существуют отличный от нуля вектор x = (x1 , . . . , xn ) ~ ~ ~T T решение однородной системы и вектор x = (x1 , . . . , xn ) решение неоднородной системы,

6


т. е.

x 1 a1 + . . . + x n an = 0 ~ ~

нородной системы при

x 1 a1 + . . . + x n an = y . любом t R, т. е. решение
и

Тогда вектор

x + tx ~

будет решением неод-

системы неоднозначно. Утверждение a3)

не что иное, как тавтология.

Теорема 2 (Кронекера Капелли).
уравнений с

m, m

матрицы

n C = (cij )1

n j =1 cij xj = bi , 1 i неизвестными была разрешима, необходимо и достаточно, чтобы ранг

Для того, чтобы система

im, 1j n этой системы совпадал с рангом расширенной матрицы

C

,

получаемой присоединением к матрице

C

столбца

y

правых частей.

Находить решения возможно методом Гаусса.

Доказательство. Лемма 1.2.
гольма.

Нам понадобятся две леммы.

Если матрица

независимы, а любой вектор из

A M k,k разрешима, то Rk единственным образом

столбцы этой матрицы линейно выражается через эти столбцы.

Эта лемма сразу следует из определения разрешимости матрицы и альтернативы Фред-

Лемма 1.3.

Ранг матрицы равен максимальному числу линейно независимых столбцов

этой матрицы.
Действительно, пусть матрица углу. Обозначим столбцы матрицы

C = (cij )1

im, 1j n имеет ранг

r

. Не ограничив себя в

общности, считаем, что разрешимая матрица размера r Ч r расположена в верхнем левом C через ci , 1 i n. То, что первые r столбцов матрицы C линейно независимы, следует из леммы 1.2. Допустим, что столбец ck , m + 1 k n не выражается линейно через первые ственный набор чисел

r столбцов. Из леммы 1.2 следует, что существует един1 (k ), . . . , r (k ) такой, что 1j r j (k )cij = cik , 1 i r (т. е. первые r координат вектора 1 (k )c1 + . . . + r (k )cr совпадают с первыми r координатами вектора ck ). k А предположение о том, что столбец c не выражается через первые r столбцов, означает, что для некоторого r < l n числа clk и 1 (j )cl1 + . . . + r (k )lr не совпадают друг с другом. Это означает, что столбцы у матрицы размеров (r + 1) Ч (r + 1), получающейся присоединеT нием столбца (c1k , . . . , cr k , clk ) и строки, составленной из элементов cl1 , . . . , clr и clk , линейно
независимы, и значит, в силу утверждения a1) теоремы 1.1 она разрешима, что противоречит определению ранга. Лемма доказана. Возвратимся к доказательству теоремы Кронекера Капелли. Если система разрешима, это означает, что вектор свободных членов выражается через столбцы матрицы, а значит, в силу леммы 1.1, он выражается через первые равен

r

столбцов, т. е. ранг расширенной матрицы

. А если система не разрешима, то это значит, что вектор y не выражается через 1 r столбцы матрицы C , т. е., в частности, столбцы c , . . . , c , y линейно независимы, т.е. ранг C больше ранга

r

C

. Решения линейных уравнений с одним неизвестным со-

Исторический комментарий.

держатся в первом тексте, где обсуждаются математические сюжеты в древнеегипетском папирусе, за которым закрепилось название папируса Райнда, в честь английского египтолога, приобретшего его в 1858 году на базаре. Написание папируса Райнда относят к 18 веку до нашей эры, к эпохе Среднего царства. Теория линейных систем

n

уравнений с

n

неизвест-

ными была создана К. Ф. Гауссом (1777 1855), Г. Грассманом (1809 1877), Г. Крамером (1704 1752), А. Кэли (1821 1895), К. Якоби (1804 1851) и другими математиками 18 и 19

7


веков. Тот фрагмент теории, который был изложен выше, состоит из двух частей метода Гаусса решения системы и теоремы Кронекера Капелли условия разрешимости системы. Всегда с большим удовольствием сообщаю, что первым опубликовал теорему Кронекера Капелли, не кто иной, как Чарлз Людвидж Доджсон (1832 1898), псевдоним которого Льюис Кэррол известен каждому из нас. Это произошло в 1867 году. Как написано в одной исторической справке, в лекциях Л. Кронекера (1823 1791), читанных в 1864 г. теория систем линейных уравнений получила, по существу, свое завершение, (включая теорему, о которой мы ведем речь). А. Капелли (1855 1910) опубликовал эту теорему в 1892 г. Эта тема будет продолжена в пятой лекции, где будет рассказано о других критериях разрешимости правиле Крамера и второй теореме Фредгольма, и тогда завершится путь от задач из папируса Райнда до начала двадцатого века.

1.2. Бесконечномерный случай (формулировка альтернативы Фредгольма)
Сформулируем здесь (а докажем потом в пятой лекции) ослабленный вариант альтернативы Фредгольма. Альтернатива Фредгольма принадлежит к одной из вершин университетского образования. В этом курсе лекций она будет доказана не в самом общем виде, не в банаховом пространстве, а лишь в специальном случае в пространстве l2 . Но именно этот результат доказывается в учебнике по функциональному анализу Колмогорова и Фомина и читается на третьем курсе мех-мата МГУ. Доказательство основного утверждения если система уравнений разрешима, то однородное уравнение будет иметь лишь нулевое решение будет лишь незначительной надстройкой над теми рассуждениями, которые были проведены в предыдущем пункте. А обратное утверждение, по сути дела геометрическое, разумно проводить в геометрическом разделе. Потому и сама теорема доказывается в этом разделе.

(a

2 iN xi < , A = ij )1i,j бесконечная матрица. Требуется решить такую систему бесконечного числа
Пусть

l2

множество векторов-столбцов

x = (x1 , x2 , . . .)T

таких, что

уравнений с бесконечным числом неизвестных:

a11 x1 + a12 x2 + . . . = b1 ... an1 x1 + an2 x2 + . . . = bn ... A = (aij )i,j
N представляет собой сумму


j 1

aij xj = bi ,

i 1.

(1)



Пусть в (1) , матрица I + B единичной матрицы и матрицы B = (bij )i,j N , 2 1/2 удовлетворяющей условию B = ( < . Тогда имеет место альтернатива: i,j N bij ) или система уравнений (1) разрешимa для любого b l2 , или однородная система имеет ненулевое решение.
Доказательство этой теоремы будет приведено в пятой лекции.

Альтернатива Фредгольма в бесконечномерном случае.

8


Лекция 2. Решение нелинейных уравнений
Мне прямо стыдно сказать, до какого числа знаков я дов?л на досуге эти вычисления.
И. Ньютон

В этой главе описывается модифицированный метод Ньютона решения нелинейных уравнений.

2.1. Конечномерный случай
Нам надлежит научиться решать уравнения вида F (x) = y , где аргументом является n m T n m вектор x R , y это вектор из R , а F = (f1 , . . . , fn ) отображение из R в R (или, как n m пишут, F : R R ). В развернутом виде это означает, что надо решить систему уравнений

f1 (x1 , x, . . . , xn ) = y1 , f2 (x1 , x2 , . . . , xn ) = y2 , ... ... fm (x1 , x2 , . . . , xn ) = ym
где

(2)

nm

,

fi , 1 i m

Среди отображений из

функции n

n
в

R

переменных. Rm важную роль играют линейные отображения, фрагмент

теории которых был построен в лекции 1. Напомним, что при линейном отображении Rn Rm вектору x = (x1 , . . . , xn )T ставится в соответствие вектор Ax = (a11 x1 + . . . + a1n xn , . . . , am1 x1 + . . . + amn xn )T . Система

A:

m



... ... ... am1 . . . При m
11

a

при

1 a1n и вектором y = . . . ... . amn ym < n, если система уравнений Ax = y разрешима при любом y , у уравнения (2)nm конкретном y существует, вообще говоря, множество решений, т. е. прообраз y не одно-



линейных уравнений с

y

n неизвестными Ax = y

определяется матрицей

A=

m такое линейное отображение, что уравнение Ax = y разрешимо для любого y R ). Тогда m n существуют линейное отображение R : R R (правое обратное к A) и константа > 0 m такие, что AR(y ) = y и |R(y )| |y | для любого y R . T T . Рассмотрим систему векторов e1 = (1, 0, . . . 0) , . . . , em = (0, . . . 0, 1) в Rm . 3 По условию существуют векторы {fk }m , fk Rn 1 k m такие, что Afk = ek . Для k=1

Лемма 2.1 (о правом обратном отображении к линейному отображению в конечномерном случае). Пусть A : Rn Rm сюръективное линейное отображение (т. е.

значен. Но в этом случае можно построить правое обратное отображение.

Доказательство

3 В лекции 1 индексы векторов ставились наверху, чтобы не путать векторы с координатами. Начиная с
этого места индексы векторов ставятся, как это принято, внизу (чтобы не путалось обозначение вектора

ak

с

k

-той степенью числа

a),

а координаты вектора

ak

имеют два индекса.

9


m
каждого вектора

m

yk fk . Тогда равенство k=1 AR(y ) = y A, а второе свойство следует из очевидных m оценок (и того, что длина вектора не меньше любой его координаты): |Ry | |yk ||fk | i=1 m m max |yk | |fk | |y |, где = |fk |. 1 k m k=1 k=1
(здесь

y=

yk fk

y

k числа) положим

R(y ) =

k=1 следует из линейности оператора

Метод решения системы

(2)

nm

m

уравнений с

n

неизвестными, о котором сейчас будет

рассказано, основан на линеаризации, замене нелинейного уравнения линейным. T Пусть задан вектор y . Возьмем вектор x0 = (x10 , . . . , xn0 ) , для которого F (x0 ) близn m ко по модулю к y и пусть A сюръективный линейный оператор из R в R . В каче-

F (x) = y возьмем решение x1 A(x - x0 ) + F (x0 ) = y , получающееся с помощью леммы 2.1 x1 = x0 + R(y - F (x0 )). А далее будем поступать аналогично, полагая:
стве приближенного решения уравнения уравнений

системы линейных о правом обратном:

xk = x

k -1

+ R(y - F (x

k -1

)), k = 1, 2, . . .

(2.1)

Определение 2.
Ньютона. заданы вектор

Итративную процедуру

(2.1)

называют модифицированным методом

Теорема 3 (о правом обратном отображении в конечномерном случае).
n n

x0 R , число > 0, сюръективный линейный оператор A из R m n отображение F : URn (x0 , ) R (где URn (x0 , ) = {x R | |x - x0 | < } открытый n в R с центром в x0 радиуса > 0). Если существуют такое число , 0 < < 1, что любых , x URn (x0 , ) выполняется неравенство: |F ( ) - F (x) - A( - x)|
где число

Пусть m вR и шар для

| - x|, , x URn (x0 , ),

(2.2)

взято из леммы 2.1 о правом обратном, то для каждого y URm (F (x0 ), 0 ), где 0 = (1 - )/ , последовательность (2.1) модифицированного метода Ньютона сходится к такому вектору x(y ) URn (x0 , ), что F (x(y )) = y и при этом |x(y ) - x0 | K |y - F (x0 )|, где K = /(1 - ). Отображение y x(y ) из URm (F (x0 ), 0 ) в URn (x0 , ), построенное в этой теореме, называется правым обратным отображением к F .
Доказательство опирается на понятия непрерывности функции фундаментальной последовательности векторов из отображает шар если для любого

n

переменных, сходимости векторов и

Определение 3.

R . Напомним соответствующие определения. Пусть F URn ( , r) с центром в радиуса r в Rm . Говорят, что отображение F непрерывно в точке , числа > 0 найдется такое число > 0, что |F ( + x) - F ( )| < , если только |x| < .

n

дится к вектору числа



Говорят, что последовательность {1 , 2 , Rn (и пишут k при k или

. . . , k , . . .} векторов из Rn схоlim xk = ), если для любого
k

> 0 найдется такое число N , что |k - | < , как только k > N . Последовательность {1 , 2 , . . . , k , . . .} векторов из Rn называется фундаментальной, если если для любого числа > 0 найдется такое число N , что |k - m | < , как только k , m > N .
10


a1 + a2 + ћ ћ ћ + ak + ћ ћ ћ называется сходящимся, если S1 = a1 , S2 = a1 + a2 , . . . , Sk = a1 + ћ ћ ћ + ak , . . . является сходящейся.
Числовой ряд Определение 3 в дальнейшем будет уточняться.
в

последовательность

В доказательстве будут использованы следующие факты: 1) если отображение F отображает шар URn ( , r ) m n и является непрерывным в точке , а последовательность {1 , 2 , . . . , k , . . .} векторов из R сходится к n m вектору R , то последовательность {F (1 ), F (2 ), . . . , F (k ), . . .} векторов из R сходится к вектору F ( ) Rm ; 2) предел суммы последовательностей равен сумме пределов последовательностей и предел произведения

R

k , а k , 1- k+1 (формула для а a число, то k + k + , а ak a ); 3) если 0 < < 1, то 1 + + . . . + = 1- суммы геометрической прогрессии); 4) всякая фундаментальная последовательность сходится.
последовательности на число равен произведению числа на предел последовательности (если

k

Если первые два утверждения легко следуют из определений, а третье вытекает из непосредственно проверяемого тождества

(1 + + . . . + k )(1 - ) = 1 -

k+1

, то четвертое является следствием теории вещественных

чисел, с изложения которой обычно начинается курс математического анализа. Об этом речь идет в Дополнении в разделе Числа.

Доказательство теоремы 3
{xk }k
ству надлежит

. Докажем, что a) векторы

x

k построенные модифициро-

ванным методом Ньютона, для всех

0 фундаментальна. Утверждение

URn (x0 , )
оператор

по определению.

k 0 лежат в URn (x0 , ) и b) что последовательность a) докажем по индукции. Начальный элемент x0 приПусть xs URn (x0 , ), 1 s k . Применение к равен-

(2.1) AR(y ) = y

A

для любого

, с использованием линейного свойства этого оператора и равенства y из Rm , приходим к уравнению:

A(xk - x
Учитывая равенства

k -1

) = y - F (x

k -1

).
k-1 |.

(2.3)

(2.3), неравенство |AR(y )| (y ) и (2.2), получим: |xk+1 - xk | = |R(y - F (xk )| |y - F (xk ) - y + F (xk-1 ) + A(xk - xk-1 )| |xk - x Повторив еще k - 1 раз это рассуждение, приходим к неравенству |x
k+1

- xk | |xk - x

k -1

| 2 |x

n-1

-x

n-2

| . . . n |x1 - x0 |. (2.4),
для

(2.4)
формулу

Используя в следующей выкладке неравенство для модулей, неравенство для суммы геометрической прогрессии и соотношение получаем:

(2.3)

k = 1,

а также выбор

y

,

|x

k+1

- x0 | |x

k+1

- xk | + . . . + |x1 - x0 | (k +
и значит, все

k -1

+ . . . + 1)|x1 - x0 | <

|y - F (x0 )| < (2.5) 1-

т. е.

x

r +1

URn (x0 , )
k +s-1

Докажем b). Для любых

| + . . . + |xk+1 откуда вытекает, что {xn }nN фундаментальная последовательность. Значит она сходится. Обозначим ее предел x(y ). Переход к пределу в (2.3) (который существует из-за непрерывности F в URn (x0 , )) (совсем простое доказательство непрерывности предоставим читателю) приводит к равенству F (x(y )) = y , а переход к пределу в (2.5) обеспечивает неравенство |x(y ) - x0 | K |y - F (x0 )| c K = 1- .
k +s

|x

-x

xk принадлежат URn (x0 , ). Утверждение a) доказано. k , s N имеем (в силу неравенств для модулей): |xk+s - xs | k - xk | (k+s-1 + . . . + k )|x1 - x0 | 1- |y - F (x0 )| < k ,

2.2. Бесконечномерный случай.
11


В бесконечномерном случае вместо

R

n

и

R

m

фигурируют банаховы пространства.

Напомним определение банахова пространства. Множество

X

называется (вещественным) векторным

пространством, если в нем определены две операции суммы векторов и произведения вектора на веществен-

ное число. Эти операции удовлетворяют естественным свойствам чисел и конечномерных векторов, таким, как законы коммутативности и ассоциативности сложения, существование нулевого элемента, противоположного элемента и т. п. Векторное пространство сопоставляющая вектору

X

называется нормированным, если определена функция

ћ

X

:XR

+,

x, удовлетворяющее аксиомам: 1) x X 0 для любого x X и x X тогда и только тогда, когда x = 0, 2) x X = || x X x X, R, 3) x + x X x X + x X . Такие пространства мы обозначаем X = (X, ћ X ). Через UX (x, r) = {x X | x - x X < r} обозначим открытый шар в X , а через BX (x, r) = {x X | x - x X r} замкнутый шар в X с центром в x радиуса r . Подмножество U пространства (X , ћ X ) называется открытым, если для любой точки x U найдется открытый шар с центром в этой точке целиком расположенном в U . Множество дополнительное к открытому множеству называется замкнутым. Наличие нормы позволяет
неотрицательное число , называемое нормой вектора определить понятия сходимости последовательности и непрерывности отображения.

x

xX =0

Определение
вектору

3

. Говорят, что последовательность векторов

x

и пишут

limn

N

такое, что неравенство
Пусть

, xn X сходится к xn = x, если для любого положительного числа найдется число xn - x X < выполняется для любого n > N .
nN

{x n }

Y = (Y , ћ Y ) другое нормированное пространство и F : UX (x, r) Y . Говорят, что это F непрерывно в точке x, если для любого числа > 0 найдется такое число > 0, что F (x + x) - F (x) Y < , если x X < . Из этого определения непрерывности функции сразу следует, что если функция F непрерывна в точке x, то для любой последовательности {xn }nN , сходящейся к x предел последовательности {F (xn )}nN равен F (x). Последовательность {xn }nN векторов из X называется фундаментальной или последовательностью Коши, если для любого числа > 0 найдется такое число N , что неравенство xn+k - xn < выполнено для любого натурального n N и любого натурального k N.
отображение Говорят, что нормированное пространство обладает свойством полноты, если в нем любая фундаментальная последовательность имеет предел. Полное нормированное пространство называется банаховым. Пространство рывных функций

X = Rn , n 1 с нормой x X = |x| = ( k=1 x2 ) 2 , а также пространство C ([a, b]) непреk на [a, b] с нормой x(ћ) C ([a,b]) = maxx[a,b] |x(t)| являются банаховыми пространствами.

n

1

Вернемся к вопросу о решении уравнений, но уже в банаховых пространствах.

Лемма 2.2 (о правом обратном отображении в бесконечномерном случае).
и Y банаховы пространства A : X 4 жение. Тогда существуют отображение

Пусть

X

такие, что

AR(y ) = y

и

R(y )

X

|y |Y

Y линейное непрерывное сюръективное отобраR : Y X (правое обратное) и константа > 0 y Y .

Доказательство. Эта лемма равносильна одному из основных принципов линейного анализа
принципу Банаха об открытости. Согласно принципу Банаха об открытости (см. учебник Колмогорова и Фомина гл. IV, п.5 ), образ единичного открытого шара в открытый шар в

X

с центром в нуле, при отображении

A

содержит

Y

с центром в нуле радиуса

, найдется Ax(y ) = y . Положим R(y ) = 2 y
по норме меньшего

. Таким образом, для любого элемента y Y , элемент x(y ) X , по норме меньший единицы, такой, что Y x( 2 y Y y ), R(0) = 0. Проверка свойств R тривиальна.
разрешимо для любого

4 Это означает, что уравнение

Ax = y

yY

.

12


Теорема 3 о (правом) обратном отображении в бесконечномерном случае.
X
и

Пусть

Y

банаховы пространства,

открытый шар в

X

нейное, непрерывное и

F : UX (x0 , ) Y (где UX (x0 , ) = {x X | x - x0 X < } x0 радиуса > 0) и при этом существуют такое лисюръективное отображение A : X Y , а также число , 0 < < 1,
с центром в

что выполняется неравенство:

F ( ) - F (x) - A( - x)
где число

Y



-x

X

,

, x UX (x0 , ),
где

(2.6) 0 = (1 - )/
,



взято из леммы 2.2. Тогда для каждого

y UY (F (x0 ), 0 ), )), n N

последовательность модифицированного метода Ньютона

xn = x
сходится к такому элементу

n-1

+ R(y - F (x

n-1

(2.7)
и при этом

K y - F (x0 )

Доказательство

Y , где

x(y ) BX (x0 , ), K = /(1 - ). |x|
при

что

F (x(y )) = y

x(y ) - x

0X



этого утверждения является дословным повторением доказательства

теоремы 3 и с заменой

xX

на

x



|y |

при

yY

на

y

Y.

Исторический комментарий.

Методы приближенного нахождения корней отдельных

уравнений применялись еще в Древней Греции. Считается, что первый алгоритм нахождения 2 корня уравнения x = 2 был известен в первом веке нашей эры. Этот алгоритм приписывают Герону. Алгоритм Герона описывается так: надо выбрать любую дробь x0 и затем исполь1 зовать такую итеративную последовательность: xk = (xk-1 + xk2 1 ), r = 1, 2, .... История 2 - методов решения общих нелинейных уравнений восходит к 1676 году, к ответу Ньютона на письмо к нему секретаря Королевского общества Ольденбурга, в котором тот обратился к Ньютону за некоторыми разъяснениями. Ньютон на примере решения уравнения F (x) = 0, F (x) = x3 - 2x - 5, изложил метод, который в современных обозначениях представляет -1 собой итеративную процедуру xk = xk-1 - (F (xk-1 )) F (xk-1 ), k = 1, 2, . . ., где F это прогде изводная

F

, а начальная точка выбирается вычислителем, исходя из каких-то соображений

целесообразности. Примерно в те же времена Ньютон научился разлагать функции в ряды. Комбинируя эти два метода Ньютон составил таблицы многих элементарных функций. О точности этих таблиц свидетельствует эпиграф в начале лекции. Доказанная нами заключительная теорема принадлежит американскому математику Л.Грейвсу (1896 1973). Она была опубликована в 1950 г. Таким образом, в этой лекции мы совершили экскурс в теорию обратных отображений от Ньютона до середины прошлого столетия.

Доказанные нами теоремы об обратных отображениях играют в математике огромную роль. Расскажем здесь о приложении этих теорем к доказательству правила множителей Лагранжа (1736 1813).

13


Лекция 3. Правило множителей Лагранжа. Принцип компактности
Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно прибавить к функции, о которой говорилось, функции, задающие уравнения связи, умноженные на неопределенные множители, и искать затем максимум или минимум построенной суммы, как если бы переменные были независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных.
Ж.-Л. Лагранж Эта лекция посвящена методу Лагранжа решения задач на максимум и минимум и основному принципу существования решений задач таких задач принципу компактности.

3.1. Привило множителей Лагранжа
ными задачами.

. Термины максимум и минимум объединя-

ются общим термином экстремум, и задачи на максимум и минимум называют экстремальЭкстремальные задачи стали исследовать на заpе pазвития математики. Они встречаются в трудах многих математиков древности, например, в сочинениях Зенона, Евклида, Архимеда, Аполлония, Герона. И в новое время (в 16 и 17 веках) было решено множество экстремальных задач. Вплоть до 17 века каждая экстремальная задача решалась индивидуально, приемом специально придуманным именно для нее. Первый общий метод нахождения экстремумов функций был предложен Ферма (1600 1665).

Ферма рассматривал функции одного переменного (даже, собственно говоря, полиномы одного переменного) и дал набросок доказательства утверждения, которое сейчас формулируется так: если в точке локального экстремума функция дифференцируема, то ее производ-

ная равна нулю. В начале двадцатого века его теорема была распространена на дифференцируемые функции, определенные на нормированном пространстве. Этот результат также называют теоремой Ферма. Пусть

X

нормированное пространство,

V

окрестность точки

x

и

f

функция, опре-

деенная на

V . Говорят, что точка x является точкой локального максимума (минимума) f , если найдется такое открытое множество U V в котором выполнено неравенство f (x) f (x) (f (x) f (x)) для всякого x U . Точка x является абсолютным максимумом (минимумом) функции f на некотором множестве, если для любой точки x из этого множества выполнено неравенство f (x) f (x) (f (x) f (x)).
функциии
Напомним понятие дифференцируемости отображения, определенного в нормированном

пространстве.

V окрестность точки x X и F : V Y . Говорят, что F дифференцируемо в точке x (и пишут f D1 (x)), если существует линейный непрерывный оператор из X в Y такой, что для всех x X , для которых x + x V справедливо представление F (x + x) = F (x) + x + r (x), где r (x) Y / x X 0 при x X 0. Оператор (определяемый этим представлением однозначно) называется производной отображения F в точке x и обозначается F (x). Из определения производной в x следует, что отображение должно быть непрерывным в этой точке. Отображение x F (x)x
Пусть и нормированные пространства, 14

Определение 4.

X

Y


называется дифференциалом

F

в

x

; его называют главной линейной частью

отображения

F

в окрестности точки

x

.

Отдельно обсудим вопрос о дифференцируемости функций. Пусть пространство,

X x

и нормированное

V

окрестность точки

xX

в

V

. Согласно общему определению, производной

X иf :V R f (x) функции f

функция, определенная на в точке является линейный

. Совокупность всех таких функционалов на зывают пространством, сопряженным с X и обозначают X . В одномерном случае производf ( x+ x) - f ( x) b b . ная f (x) это число, для которого имеется равносильное определение: f (x) = lim x x0 n В пространстве R производная это вектор-строка f (x) = (y1 , . . . , yn ), где yi это производная в нуле функции равна единице,

непрерывный функционал, определенный на

X

t0 f ( x) b функции f в точке x по xi . Ее обозначают x . Наличие частных производных в точке не гарантирует дифференцируемости в этой точке.
Это показывает пример функции двух переменных

t f (x + tei ), 1 i n (ei f ( x+ b остальные нули). Число yi = lim

вектор, у которого i- тая координата tei )-f (x) b называют частной производной t

x1 , x1 > 0}. Эта функция изводные по x1 и x2 существуют x1 =
Имеет место



(x1 , x2 ),

равной нулю всюду, кроме множества

{(x1 , x2 ) |

разрывна в нуле, т. е. не дифференцируема, в то время, как ее частные прои равны нулю.

Теорема Ферма (необходимое условие минимума дифференцируемой функции). Если в точке локального экстремума функция дифференцируема, то производная в
этой точке равна нулю.
Этот результат легко выводится из определения дифференцируемости. Равенство нулю производной в точке, где предполагается локальный экстремум, называют

условием стационарности.

Поставим проблему о задаче на экстремум при ограничениях типа равенств. Пусть на открытом подмножестве отображение

V

нормированного пространства

X

определены функция

F :V Y

и требуется найти (абсолютный) максимум

f0 : V R, (минимум) f0 (x) при (P )

условии, что выполнено равенство

F (x) = 0.

Будем записывать эту проблему так:

f0 (x) max(min), F (x) = 0.
Говорят, что

(P ), если найдется UX (x, ), что для любой точки x из этого шара, для которой F (x) = 0, выполнено неравенство f0 (x) f0 (x) (f0 (x) f0 (x)). Точка x является абсолютным максимумом (минимумом) функции f в задаче (P ), если для любой точки x V , для которой F (x) = 0, выполнено неравенство f0 (x) f0 (x) (f0 (x) f0 (x)). Метод исследования задач (P ) был описан Лагранжем. Слова Лагранжа из его книги
точка локального максимума (минимума) для задачи такой открытый шар Теория аналитических функций (1797) были приведены в эпиграфе к этой лекции. Мы позволим себе лишь незначительно изменить рецепт Лагранжа. Во-первых, мы будем рассматривать не только функции многих переменных, но даже функции, определенные на нормированном пространстве. Во-вторых, оказывается удобным и функцию, экстремум которой ищется, также умножить на неопределенный множитель и тем самым составлять выражение

x

15


L(x, ) = 0 f0 (x) + , F (x) , где = (0 , ) R+ Ч X , которое Лагранжа (а число 0 и элемент из сопряженного пространства X

стали называть функцией множителями Лагран-

жа). Наконец, мы не будем искать минимум или максимум функции Лагранжа, а просто будем применять к задаче на экстремум функции Лагранжа необходимое условие экстремума ?как если бы переменные были независимы?, т. е. теорему Ферма. Для того, чтобы сформулировать соответствующую теорему, необходимо дать определение некоторого усиления этого понятия дифференцируемости.

Определение 4 .
.

Пусть

X

и

Y

нормированные пространства,

V

окрестность точки

x X, F : V Y F 1, 2,

Говорят, что отображение F строго дифференцируемо в x и пишут F D1 (x) и для любого числа > 0 найдется число > 0 такое, что если то

S D(x, Y ), если xi - x X < , i =

F (x1 ) - F (x2 ) - F (x)(x1 - x2 )

Y

x1 - x

2 X.

Понятие строгой дифференцируемости позволяет сформулировать теорему об обратном отображении для гладких отображений.

Теорема 3 об обратном отображении для строго дифференцируемых отображений: строго дифференцируемое и регулярное в точке отображение из одного банахова
пространства в другое локально обратимо. Или: Пусть

X и Y банаховы пространства, V в Y , строго дифференцируемое и регулярное в точке x (т. е. отображение F (x) : X Y сюръективно). Тогда найдутся окрестность W точки F (x), отображение : W V и константа K > 0, такие, что F ((y )) = y и (y ) - x X K y - F (x) Y для любого y из W . V
окрестность точки

x X, F

отображение из

Этот результат вытекает из теоремы 2.2 очевидным образом, если вспомнить определение строгой дифференцируемости. Сформулируем теперь основной результат:

Теорема 4 (правило множителей Лагранжа).
отображение

Пусть в задаче

(P )

функция

f0

и

F

определены в некоторой окрестности точки

x

и строго дифференцируемы

в этой точке. Тогда, если в точке такой, что

x

существует набор множителей Лагранжа

достигается локальный экстремум в задаче (P ), то (0 , ) R+ Ч X , не равных одновременно нулю,

Lx (x, ) = 0 f0 (x) + , F (x) = 0.
n m

(2.8)

Докажем эту теорему здесь в конечномерном случае, когда X = R , Y = R , F = (f1 , . . . , fm )T , fi определены в окрестности точки x Rn и строго дифференцируемы в этой точке. Тогда соотношение

(2.8)

приобретает вид:

0 f0 (x) + 1 f1 (x) + . . . + m fm (x) = 0.

Доказательство.
ры

Теорема утверждает, что если

x

локальный экстремум, то векто-

fi (x), 0 i m

, линейно зависимы. Докажем теорему от противного: предположим,

что эти векторы линейно независимы и придем к противоречию с тем, что x локальный T экстремум. Рассмотрим отображение G(x) = (f0 (x), f1 (x), . . . , fm (x)) . По условию функции

x. Отсюда легко следует, что и отображение G строго дифференцируемо в x. Векторы fi (x), 0 i m образуют строки матрицы G (x). Следовательно (см. определение ранга) ранг этой матрицы равен m + 1, т. е. совпадает с числом строк. Значит, по теореме Кронекера Капелли G (x) сюръективный оператор, и мы
строго дифференцируемы в 16

fi , 0 i m


можем применить теорему правое означает,

y = (f0 (x) + , 0, . . . , 0)T и пусть x = (y ), где обратное отображение к G. Тогда G(x ) = (f0 (x) + , 0, . . . , 0) и |x - x| K | |. Это что x не доставляет задаче (P ) ни локального максимума, ни локального минимума. 2.2
. Положим Теорию экстремума принято отсчитывать от письма Фер-

Пришли к противоречию. Теорема доказана.

Исторический комментарий.

ма Декарту (1638), где он объяснял свой прием решения гладких задач на экстремум, обобщения которого называют теоремой Ферма. Условия стационарности в терминах производных появились в первых работах по анализу Ньютона и Лейбница, в конечномерном случае у Эйлера, в бесконечномерном случае у Фреше. Принцип Лагранжа для конечномерной гладкой задачи с равенствами был сформулирован Лагранжем в 1797 г., но строгое доказательство этой теоремы стало делом математиков последней четверти девятнадцатого века. Tеорема 3.1 была доказана Люстерником в 1934г..

При решении задач на экстремум возникает вопрос о том, существует ли решение задачи. Один из основных принципов существования является принцип компактности, к изложению которого мы переходим.

Я убежден, что будет возможно доказывать теоремы существования с помощью общего принципа, чья сущность навеяна принципом Дирихле. Этот общий принцип, возможно приблизит нас к ответу на следующий вопрос: имеет ли решение каждая регулярная вариационная проблема, если самому понятию решение"при случае придавать расширенное толкование.
Д. Гильберт.

3.2. Принцип компактности.
жество, а

Сначала напомним некоторые понятия общей тополо-

гии. Общая топология ветвь математики, изучающая понятия предела и непрерывности. Опишем эти понятия в рамках метрических пространств. Пара

(X, d),

где

X

мно-

d = d(x, y ) вещественная неотрицательная функция, удовлетворяющая аксиомам: a) d(x1 , x2 ) = 0 x1 = x2 , b) d(x1 , x2 ) = d(x2 , x1 ) x1 , x2 X , c) d(x1 , x3 ) d(x1 , x2 ) + d(x2 , x3 ) x1 , x2 , x3 X , называется метрическим пространством. Последовательность {xn }nN называется сходящейся, если существует такой элемент X , что > 0 N > 0 : d(xn , ) < n N ; последовательность {xn }nN называется фундаметнальной, если > 0 N > 0 : d(xn , xm ) < n, m N ; вещественная функция f на (X, d) называется непрерывной в точке x0 X , если > 0 > 0 : d(x, x0 ) < |f (x) - f (x0 )| < ; функцию f называют непрерывной на (X, d), если она непрерывна в любой точке X . Определение 5. Метрическое пространство (X, d) называют компактом, если из каждой последовательности элементов из X можно выбрать сходящуюся подпоследовательность. Лемма (о конечномерных компактах). Для того, чтобы подмножество Rn было
компактом, необходимо и достаточно, чтобы оно было ограниченным и замкнутым.

Доказательство.

Необходимость. Если множество не является ограниченным, то строит-

ся последовательность точек, расстояние между которыми больше некоторого числа. Из нее нельзя выбрать сходящейся подпоследовательности. Если же последовательность ограниче-

17


на, но не замкнута, то существует последовательность, сходящуюся к точке, принадлежащей замыканию множества, но не самому множеству. Из нее также нельзя выбрать сходящуюся последовательность. Достаточность. Докажем в случае

R

2

, в остальных случаях доказательство аналогично.

Множество ограничено, и значит, его можно поместить в квадрат. Пусть дана какая-то последовательность в нашем ограниченном и замкнутом множестве. Выберем точку нечное множество точек. Выберем из него точку

x

1 в этом

множестве. Разделим квадрат на четыре равных квадрата. В одном из них окажется беско-

x2 = x

1 и далее будем поступать аналогично.

В итоге приходим к фундаментальной последовательности, из которой выберем сходящуюся. В силу замкнутости она будет сходиться к точке множества.

Лемма (Гейне)
(X, d),

Для того, чтобы функция

f

, определенная на метрическом простран-

стве

была непрерывной в точке

x

0 необходимо и достаточно, чтобы она была непре-

рывной по Гейне, т. е. для любой последовательности тельность

{x n }

nN , сходящейся к

x

0 , последова-

Доказательство.

{f (xn )nN }

сходилась бы к

f (x0 ).

Из определения непрерывности следует непрерывность по Гейне. Пусть

непрерывность по Гейне имеется, но непрерывности нет. Отсутствие непрерывности означает, 1 , но |f (xn ) - f (x0 )| > . Это что имеется такое число > 0, что n N xn : d(xn , x0 ) < n противоречит непрерывности по Гейне.

f на (X, d) называется 0 > 0 : d(x1 , x2 ) < |f (x1 ) - f (x2 )| < .
Вещественная функция

равномерно непрерывной на

X

, если

>

Теорема 5. а) Принцип компактности Вейерштрасса. b) Теорема Кантора о равномерной непрерывности.

Функция, непрерывная на

компакте, достигает на нем своего минимального и максимального значения. Функция, непрерывная на компакте, равномерно непрерывна на нем.
a) Пусть (X , d) метрический компакт и f C (X ). 1) Если допустить, f неограничена, то n N xn : |f (xn )| > n. По определению компактности {nk }kN : xnk x0 , что противоречит непрерывности по Гейне. 2) Пусть f ограничена сверху и M 1 верхняя грань значений f . По определению верхней грани n N xn : f (xn ) > M - . По n определению компактности {nk }kN : xnk x0 . По лемме Гейне f (x0 ) = M . б) Если допустить обратное, то найдется такое число > 0, что n N xn , xn : d(xn , xn ) < 1 , но |f (xn ) - f (xn )| > . По определению компактности {nk }kN : xnk x0 , при этом n f (xn ) = f (x0 ), что противоречит лемме Гейне. что Введем метрику в совокупность непрерывных функций на компакте

Доказательство.

f2 (x)|.

Пространство непрерывных функций на компакте

X

с

X : dC (f1 , f2 ) = maxxX |f1 (x)- метрикой dC обозначают C (X ). dC
) последо-

Теорема о полноте C (X ). Пространство (C (X ), dC ) Доказательство. Пусть {fn }nN фундаментальная
вательность, т. е.

полно.
(в смысле метрики

> 0 N N : dC (fn , fm ) < (i) n, m N . Отсюда следует, что для каждого x X limn fn (x) = f (x). Переходя к пределу в (i), получим, что при n N |f (x) - fn (x)| (ii). Пусть x0 X . Для некоторого n0 N найдем > 0 : dC (x, x0 ) < |f (x) - f (x0 )| < /3 (iii). Из (ii) и (iii) следует, что |fn0 (x) - fn0 (x0 )| < , т.е. f непрерывна.

18


Исторический комментарий.

Основные понятия теории множеств и общей топологии

были введены Г. Кантором. Принцип компактности претерпел значительную эволюцию, в развитии которой надо назвать имена Вейерштрасса, Бореля Лебега и Бэра, которому принадлежит весьма существенное развитие теоремы Вейерштрасса. Теорема Бэра гласит: полу-

непрерывная функция на компакте достигает своего минимума.

Лекция 4. Теория линейных уравнений и геометрия.
В этой лекции проводится визуализация теории линейных уравнений, построенной в лекции 1. Здесь снова, как и в лекции 1 индексы векторов будем помещать наверху.

4.1. Геометрический смысл определителя матрицы и правило Крамера
Понятие определителя, которое мы собираемся сейчас вводить, играет выдающуюся роль и в алгебре, и в геометрии, и в анализе. Через определители выражаются решения систем уравнений (в которых число уравнений и неизвестных совпадают). Эти выражения называются правилом Крамера. Но на практике системы линейных уравнений в больших размерностях с помощью определителей не решают (такие решения требуют слишком большого числа операций). Геометрический смысл определителя, порожденного

n

векторами в

n

-мерном простран-

стве это ориентированный объем параллелепипеда, порожденного этими векторами. Отметим свойства такой характеристики, которые геометрически доказываются на примерах n = 2, 3. Введем функцию V : Rn Ч . . . Ч Rn R, V = V (a1 , . . . , an ) системы векторов {aj }n=1 и потребуем от этой функции выполнения таких условий: а) условие нормировки, соj 1 n гласно которому объем единичного куба должен равняться единице: V (e , . . . , e ) = 1, где 1 T n T n e = (1, 0, . . . , 0) , . . . , e = (0, . . . , 1) набор единичных векторов в R ,

V (a1 , . . . , a

b) условие антисимметричности : i-1 i i+1 i+2 n

,a ,a

,a

, . . . , a ) = -V (a1 , . . . , a

i-1

, ai+1 , ai , ai+2 , . . . , an )

и

с) условие линейности по каждому векторному аргументу (для этого достаточно потре1 1 2 n 12 n 1 2 n бовать, чтобы V (a + a , a , . . . , a ) = V (a , a , . . . , a ) + V (a , a , . . . , a )). Условия

a)

и

b)

представляются естественными, и они справедливы для определителей

матриц второго порядка. Условие линейности для двумерного случая демонстрирует рис. 1

& & & & & &

a &&

Е B ЕЕ&&

Е&

C B Е b Е& b

C
Е & & ЕЕ Е& B ЕЕ& & && & & & & E &

A

c

A
Рис. 1:

Из этого рисунка видно, что

V (a + b.c) = V (a.c) + V (b.c).
19

Действительно,

V (a + b.c) =


S

AC C A , а

V (a.c) + V (b.c) = S
i+1

AC C A

-S

ABC

+S

AB C . Но поскольку

S

ABC

=S

AB C , мы и

получаем искомое равенство. Если

ai = a

, то из условия b) следует, что

V (a1 , . . . , a

i-1

, ai , ai+1 , ai+1 , . . . , an ) = 0.

Нетрудно показать, что при совпадении любых двух векторов (необязательно соседних) это равенство остается в силе.
Выведем из условий a) c) выражение для определителя в двумерном случае. Здесь

(0, 1)

T

. Имеем:

V = V (a , a ) = V (a11 e + a21 e , a12 e + a22 e ) = (a11 a22 a1 , a2 и a3 - a11 a32 a23 .
в трехмерном случае:

1

2

1

2

1

2

e1 = (1, 0)T , e2 = - a12 a21 )V (e , e ) = a11 a22 - a12 a21 .
1 2

Аналогично из приведенных аксиом однозначно выводится выражение для объема параллелепипеда, порожденного векторами

V (a1 , a2 , a3 ) = a11 a22 a33 + a12 a23 a31 + a21 a32 a13 -

a13 a22 a31 - a12 a21 a33

Продолжая этот процесс, приходим к такому результату: существует единственная функ1 n ция V = V (a , . . . , a ), которая определяется аксиомами а) - с). Для этой функции имеет место равенство

(-1)|P |
P
где сумма берется по всем перестановкам к

n i=1 aiP (i)

, {1, 2, . . . , n}, где число |P | равно (P (1), P (2), . . . , P (n)) переход от (312) к (123) требует

P

первых

n

чисел

числу транспозиций соседних элементов, требующихся для перехода от

двух транспозиций:

a13 a21 a32 имеет знак +, ибо (312) (132) (323)). 12 n Определителем (детерминантом) матрицы A, составленной из столбцов a , a , . . . , a , на12 n зывается число detA = V (a , a , . . . , a ). Сформулируем сказанное еще раз. Определение 6. Определителем системы векторов {a1 , . . . , an } из Rn называется значеn ние на этой системе векторов единственным образом определяемой функции det : R Ч . . . Ч n R R, удовлетворяющей условиям а) - с) нормировки, антисимметрии и линейности по каж12 n 12 n дому аргументу. Если матрица A, составлена из столбцов a , a , . . . , a , то det(a , a , . . . , a ) называется определителем матрицы A.
. Например, член

{1, 2, . . . , n}

Теорема 6 (правило Крамера).

Если определитель системы

n

уравнений с

n

неиз-

вестными отличен от нуля, тогда система

(1)

n лекции 1 однозначно разрешима для любой

правой части, и решение определяется формулами Крамера:

xi =

detAi , detAi = V (a1 , . . . , a detA

i-1

, y , ai+1 . . . , an ), 1 i n.

(i)

Доказательство. Пусть

detA = 0.

Тогда по его столбцы линейно независимы (ибо в противемы

ном случае из линейности определителя по столбцам следовало бы, что определитель равен нулю). По теореме 1.1 система дутся

(1)n разрешима. В силу разрешимости сист xi , 1 i n, такие, что x1 a1 + . . . + xn an = b. Имеем detAi = V (a1 , . . . , ai-1 , b, ai+1 , . . . , an ) = V (a1 , . . . , ai-1 , x1 a1 + . . . + xn an , ai+1 , . . . , an ) = xi detA
Отсюда вытекают доказываемые равенства.

Ax = b

, най-

20


4.2. Евклидово пространство En . Подпространства в En .
Евклидовым пространством

En

называется пространство векторов из

R

n

, снабженное ска-

лярным произведением

x, y = x1 y1 + x2 y2 + . . . + xn yn .
n называется модулем вектора x En . n n Скалярное произведение позволяет идентифицировать пространство R и n пространство линейных функционалов на нем, обозначенное нами в лекции 1 через R . Это n дает возможность изображать производную функции, определенной в E в том же простран f ( x) b f ( x) b n , . . . , xn ) называется градиентом f в x. стве E . Вектор f (x) = ( x1 n Векторы x, y E , для которых x, y = 0, называются ортогональными. Поясним это
Число

Замечание.

|x| =

x, y =

x2 + . . . + x 1

определение в плоском случае (рис. 2).

x =

-x x

2 1

T ! ? y= u e e e e e ? ? ?

y y

1 2

? B ЕЕx = ? ЕЕ e?Е e? Е Е

x x

1 2

E

Рис. 2: Найдем выражение для скалярного произведения векторов

x = (x1 , x2 )

и

y = (y1 , y2 )

через координаты. Для этого надо найти выражение для косинуса угла между векторами x и y или, что то же sin(y , x ) синуса угла между векторами y и x . Воспользуемся теперь тем, что площадь V (y , x ) параллелограмма, натянутого на векторы y и x равна с одной стороны |x||y | sin(y , x ) = |x||y | cos(x, y ), а с другой это определитель матрицы

векторов равносильна тому, что косинус угла между ними равен нулю. n Множество L E называется подпространством, если при всех x, y любых

-x2 x y1 y2

1

= x1 y1 + x2 y2 = x, y

, откуда

x, y = |x||y | cos(x, y ).

Тем самым, ортогональность

L x + y L

для

, R

.

Множество векторов при всех всех

{e1 , . . . , en }

называется ортогональной системой, если

i = j . Ортогональная система называется ортонормированной, 1 i k . Ортогональная система называется полной, если из того, всех 1 i k следует, что x = 0. n Построим в подпространстве L E полную ортонормированную систему. Если L не f1 1 1 состоит из одного нуля, в нем имеется ненулевой вектор f . Положим e = . Если нет |f 1 | 1 векторов из L, не пропорциональных e , то построение закончено. Пусть существует вектор f 2 , не пропорциональный вектору f 1 . Тогда вектор g 2 = f 2 - f 2 , e1 e1 будет ортогонален 2 e1 . Обозначим вектор |g2 | через e2 . И далее будем поступать аналогично. Через некоторое g im число шагов, меньшее или равное n, все закончится построением системы {e }i=1 . Можно доказать, что m инвариант подпространства: с какого вектора мы бы ни начинали и как
21

ei , ej = 0 i если |e | = 1 при i что x, e = 0 для


бы ни продолжали, процесс закончится за подпространства

m

шагов. Число

m

называется размерностью

L

.

Для любого вектора а расстояние от до



, не принадлежащего

L

, вектор

-

m i=1

L

равно модулю этого вектора, т. е. числу

, ei ei | |2 -

ортогонален L, m i 2 (проi=1 , e

верьте!). Отметим этот важный факт: для любого подпространства, размерности меньшей

n

, существует прямая перпендикулярная этому подпространству. Это дает возможность

сформулировать отличное от теоремы Кронекера Капелли условие разрешимости уравнения

Предложение 4.1.

Ax = y

:

Для того, чтобы уравнение

Ax = y

возможно было бы решить,

необходимо и достаточно, чтобы вектор
Действительно, если def Id

уравнения с транспонированной матрицей

y был AT .

ортогонален любому решению однородного

решение уравнения Ax = y , а решение уравнения AT x = 0, T то y , = A , = , A = 0. T Допустим теперь, что вектор y ортогонален любому решению уравнения A x = 0, но n n решения Ax = y не существует. Образ E при отображении A подпространство и y AE . / n Пусть y основание перпендикуляра из y на AE . Тогда y - y , Ax = 0 для всех x и значит, T T T A (y - y ), A (y - y ) = 0, т. е. A (y - y ) = 0. Тогда по условию y , y - y = 0, откуда (в силу того, что y - y ортогонально y ) получаем, что y - y , y - y = 0, т. е. y L
противоречие.

Исторический комментарий.

Аксиоматическое определение детерминанта было пред-

ложено во второй половине 19 века К. Вейерштрассом (1815 1897) и Л. Кронекером; это определение следовало из коцепции Грассмана, изложенной в его труде ?Учение о линейном протяжении?(1847), который долго оставался невостребованным.

Лекция 5. Приведение квадратичных форм к главным осям. Доказательство теоремы Фредгольма.
Если ничто не собь?т нас с пути, то мы уподобимся Зигфриду, перед которым огненный вал раступается сам собою
Д. Гильберт.

Здесь доказываются теоремы Фредгольма и Гильберта центральные в бесконечномерной теории линейных уравнений и квадратичных форм.

5.1. Теория конечномерных квадрик
Квадрика это множество уровня квадратичной функции, а квадратичная функция в

En это функция, равная сумме квадратичной формы, линейной функции и константы, т. е. f (x) = Ax, x + 2 b, x + c = 1i,j n aij xi xj + 2 n=1 bi xi + c. Здесь A симметричная матрица, i T т. е. A = A или aij = aj i для любых i и j . Квадратичную форму назовем невырожденной, если матрица A является разрешимой.
У невырожденных квадратичных форм можно избавиться от линейных членов. Для этого

22


сдвинем систему координат параллельно на вектор

a, перейдя к координатам y = x + a,. Подставив в f вместо x вектор y - a и обозначив (y ) = f (y - a), получим (y ) = A(y - a), (y - a) + 2 b, (y - a) + c. После несложных преобразований будем иметь: (y ) = Ay , y + 2 b - Aa, y + c , где c = c + Aa - 2b, a . Если A разрешимая матрица, то можно решить уравнение Aa = b, что приведет квадратичную форму к более простому виду Ay , y + c . Приведем квадратичную форму Q(x) = Ax, x к главным осям или к каноническому
виду.

Теорема 7 (теорема о приведении квадратичной формы к главным осям.)
порождаемые векторами

Для

любой симметричной матрицы A найдутся m n i торов {f }1im и m отличных от нуля чисел m i 2 приобретает вид: Q(x) = i=1 i f , x , Прямые, главными осями.

единичных взаимно ортогональных векi , при которых квадратичная форма i

Q

f

, называются

Доказательство. Метод доказательства теоремы 5.1 и ее обобщения на бесконечномерный
случай связан с постановкой и решением некоторых задач на максимум и минимум c помощью правила множителей Лагранжа. Рассмотрим задачу на максимум при наличии ограничения типа равенства: f0 (x) = 1i,j n aij xi xj max, f1 (x) = n=1 x2 = 1, или, в сокращенной форме: i i

Ax, x max, x, x = 1.

(P1 )

n-1 Единичная сфера S = {x | n=1 x2 = 1} компакт в En , функция f0 непрерывна всюду в i i En , значит, по теореме Вейерштрасса о непрерывной функции на компакте решение постав1 ленной задачи существует. Обозначим его e . Из правила множителей Лагранжа следует, что 1 1 1 найдется число 1 для которого Ae = 1 e (вектор e называется собственным вектором 1 матрицы A, а число называется собственным значением этой матрицы. Мы доказали
существование первого собственного вектора матрицы A. Допустим, мы доказали существоj вание k ортогональных векторов {e }1j k , k < n. Докажем существование k + 1-го вектора. Для этого рассмотрим задачу

Ax, x max, x, x = 1, x, ej = 0, 1 j k .
Снова из соображений компактности решение существует. Обозначим его

(Pk ) ek
+1

. Из правила k+1 множителей Лагранжа следует, что найдутся константы k+1 , ч1 , . . . , чk такие, что Ae = k+1 1 k 1 k k+1 e +ч1 e +. . .+чk e . Умножая это равенство последовательно на e , . . . , e , получаем, что

ч1 = . . . = чk = 0. Мы n ортонормированных

построили векторов

k + 1-й собственный вектор. Так будут построена система из {ek }1kn . В силу ортонормированности эта система линейно

независима (почему?). А тогда в силу альтернативы для решения системы, присоединение n k k любого вектора x его можно выразить через {e }1kn : x = k=1 xk e . Умножая это равенn k kk ство на e и пользуясь ортонормированностью, приходим к равенству: x = k=1 x, e e , а n kk значит (в силу линейного свойства A) будем иметь Ax = k=1 k x, e e и, наконец, в силу k k2 ортонормированности e , получаем окончательно: f0 (x) = . 1kn k x, e В связи с доказанной теоремой разумно ввести два важных понятия.

23


Определение 7.
нальной.

Пусть

A

матрица размеров

ственным вектором матрицы

A

, если существует

матрицы образуют ортонормированную систему в

n Ч n. Вектор x Rn называется собчисло такое, что Ax = x. Если строки Rn , то такая матрица называется ортого-

Доказанную теорему можно переформулировать так: квадратичная форма ортогональ-

ной заменой переменных приводится к каноническому виду или симметрический оператор ортогональным преобразованием приводится к главным осям.

Исторический комментарий.

Применение методов теории экстремума для сведения

квадратичной формы к сумме квадратов было осуществлено Лагранжем в 1759 г.

5.2. Бесконечномерное евклидово пространство пространство l2 . Доказательство теоремы Фредгольма
Пространство l2 образовано векторами x = (x1 , x2 , . . . , xn , . . .), обладающими свойством 2 1/2 2 называют модулем x и обозначают |x|. Пространство nN xi ) nN xi < . Выражение ( l2 можно снабдить скалярным произведением x, y = x1 y1 + x2 y2 + . . . + xn yn + . . ., которое оказывается конечным для любых двух векторов из l2 . Это вытекает из следующего неравенства (Коши Буняковского) для двух векторов

| x, y | |x||y |. (В конечномерном случае оно вытекает ty = |x|2 - 2t x, y + |y |2 , а в бесконечномерном случае надо
из l2 : Id

из соотношений

xиy 0 x - ty , x -

перейти к пределу).

Из неравенства Коши Буняковского следует, что линейная комбинация векторов из l2 не выводит из этого пространства. Определение модуля дает возможность превратить l2 в метрическое пространство (определение см. в Дополнении), положив расстояние векторами

d(x, y )

между

Замечание об определителях в l2 .

x

и

y

равным

|x - y |.

Доказывается, что пространство l2 является полным. Некоторое время в 19 веке делалась попытка по-

строить теорию бесконечных систем линейных уравнений с бесконечным числом неизвестных с помощью определителей, но она оказалась не вполне удачной и была заменена геометрической теорией к изложению которой мы переходим. в пространстве Теорема Фредгольма в бесконечномерном случае была нами сформулирована в главе 1 T l2 . Переформулируем ее в пространстве l2 векторов x, в которых введено скалярное произведение. Переформулировка этой теоремы такова:

Теорема (Фредгольма).

Пусть матрица

A

представляет собой сумму

I +B

единичной

матрицы и матрицы B = (bij )1i,j < , удовлетворяющей условию B = ( i,j N b2 )1/2 < . Тогда: ij a) Имеет место альтернатива: или уравнение Ax = y разрешимо для любого однородное уравнение

y l2

, или

Ax = 0

имеет ненулевое решение. было разрешимо необходимо и достаточно, чтобы T на любое решение однородного уравнения A x =

b) Для того, чтобы уравнение скалярное произведение

Ax = y y , x вектора y

0, было KerAT ).

равно нулю (иначе говоря, вектор

y

долженн быть ортогонален подпространству

Доказательство. A) Допустим, что нашу систему

Ax = y

можно решить для любой правой

части, а однородное уравнение имеет ненулевое решение, и придем к противоречию. Доказа-

24


тельство в этой части проходит в значительной мере по схеме конечномерных теорем главы 1 и основывается на таком утверждении.

i Не существует бесконечной последовательности единичных векторов {f }iN , i j такой, что расстояния между B f и B f при i = j превосходят некоторое положительное

Лемма 5.1.

число.
чтобы

Доказательство леммы.
B - BN
4

(i),

где

|B f i - B f j | , i = j . Выберем N BN = (bij )1i,j N . Тогда будем иметь ((TI)
Пусть

настолько большим, Triangle Inequality

TI i j i j i i j j i неравенство треугольника): |BN f - BN f | = |B f - B f + BN f - B f - BN f + B f | |B f - B f j | - |BN f i - B f i | - |BN f j - B f j | (ii). Но из неравенства Коши Буняковского вытекает, что (i) |BN f i - B f i | BN - B |f i | /4, аналогично |BN f j - B f j | /4, откуда и из (ii) следует, i j что |BN f - BN f | /2. Мы свели дело к конечномерному случаю и должны доказать, N что в N -мерном шаре Ball (o, R) с центром в нуле радиуса R = BN нельзя расположить i слишком много точек x , находящихся друг от друга на расстоянии, большем /2. Пусть нам N 1 k удалось расположить в шаре Ball (o, R) k точек {x , . . . , x }. Это значит, что внутренности N i шаров Ball (x , /4) друг с другом не пересекаются. Но все эти шары лежат внутри шара BallN (o, R ), где R = R + /4. Откуда следует оценка k VolBallN (o, /4) VolBallN (o, R ), где R VolBallN (o, ) объем шара с центром в нуле радиуса . Мы пришли к оценке k ( 4 )N . Лемма доказана. Id

e1

Вернемся к доказательству теоремы. По предположению существует ненулевое решение Ax = 0, и при этом можно считать, что |e1 | = 1. Обозначим через Lk = KerAk . 2 1 k+1 Доказано, что L1 нетривиально. Решение уравнения Ae = e и далее Ae = ek показывает, уравнения

Lk нетривиальны. При этом из леммы I вытекает, что все Lk конечномерны (иначе k мы построили бы в Lk ортонормированную систему из любого числа векторов g таких, что |B g i - B g j | = |g i - g j | = 2. Рассмотри последовательность B en . Пусть m > n. Легко понять, n n m что zn = e - Ae + Ae KerAm-1 . Значит, B em - B en = zn - em 1/2. Пришли к
что все противоречию с компактностью оператора B) Пусть

B

. Следовательно,

KerA = 0. KerA = 0, придетAX замкнутое

AX = X

. Для доказательства, утверждения, что тогда

ся использовать два факта, которые будут доказаны в Дополнении): 1) подпространство в куляр. Итак, T

l2 , и 2) к замкнутому подпространству l2 можно провести перпендиAX замкнутое подпространство. Пусть y перпендикуляр к нему, т. е. y , Ax = A y , x) = 0 x X . Это означает, что AT y = 0, т. е. KerAT = 0. По доказанT ному в A) отсюда следует, что A X = X . А по только что доказанному, отсюда следует, что TT TT KerA = 0. Но A = A (двукратная смена строк и столбцов все возвращает на место). Вот мы и доказали, что хотели: AX = X KerA = 0.

a2 < , ij i торов {f }1
i,j

5.3. Теория квадрик в l2 . Теорема Гильберта о приведении квадратичной формы к главным осям. Cпектральная теорема Гильберта Пусть матрица A = (aij )1i,j < такова, что
тогда найдется последовательность единичных взаимно ортогональных векin и последовательность чисел



i , при которых квадратичная форма

f (x) =

25


Ax, x

Доказательство

приобретает вид:

i i 2 i=1 i f , x . проходит в точности по схеме доказательства конечномерной теоремы.

f (x) =

Рассмотрим задачу на максимум при наличии ограничения типа равенства: max, f 1 (x) = n=1 x2 1, или, в сокращенной форме: i i

f0 (x) =

1i,j <

aij xi xj

Ax, x max, x, x 1.
Сразу отметим отличие: раньше у нас было равенство

(P2 )

x, x = 1, теперь оно сменилось неравенством x, x 1. Именно шар Bl2 (0, 1) = {x l2 | x, x 1 обладает свойством (слабой) компактности, позволяющем утверждать, что решение задачи (P2 ) существует. И правило множителей Лагранжа в пространстве l2 применимо. Эти факта оставим без доказательства.
А далее доказатльство в точности повторяет то, что было проделано в конечномерном случае. Остались не доказанными три утверждения, относящихся, собственно, к общей топологии и одно к математичесому анализу. Это утверждения о замкнутости и перпендикуляре в теореме Фредгольма и существовании максимума в теореме Гильберта.

Лекция 6. Начала дифференциального исчисления и теории дифференциальных уравнений
Поворот в математике [вызванный зарождением математического анализа] произошел в 17 веке одновременно с созданием основ математического естествознания. Значение этого поворота настолько велико, что образовавшиеся в результате него разделы объединяют под названием высшей математики в отличие от сложившейся ранее элементарной математики .
А. Н. Колмогоров

В этой лекции мы вначале на короткое время возвращаемся к истокам, к началам дифференциального исчисления. Основная же часть этой лекций посвящена теоремам существования решений дифференциальных уравнений.

6.1. Об истоках математического анализа.
Основоположниками математического анализа были И. Ньютон и Г. Лейбниц (1646 1716). Ньютон создавал анализ, как аппарат естествознания, Лейбниц был воодушевлен широчайшей программой развития человеческой мысли, существенной компонентой которой, по его мнению, было создание исчислений. Он заложил начала дифференциалного исчисления. Приведем слова Ньютона, где он объясняет суть математического анализа: Для пояснения искусства анализа надо привести некоторые примеры задач [...]. 1) Пусть длина пути известна. Нужно узнать скорость в данный момент времени. 2) Пусть известна скорость движения. Надо узнать длину пройденного пути. Продумывание первой задачи Ньютона с неизбежностью ведет к понятию производной, как скорости движения. Скорость

v ( )

при малом

t

примерно равна средней скорости

26


и величина s( +t)-s( ) v ( ) равна пределу таких отношений при t стремящемся к нулю, т. е. . t t0 ds( ) Этот предел стали называть производной пути по времени и обозначать s( ), s ( ) или . d Первое обозначение принадлежит Ньютону, второе Лагранжу, третье Лейбницу. Вернемся к эйлеровым обозначениям, когда независимое переменное обозначается функция

s( +t)-s( ) (где t

s(t)

длина пути, пройденного объектом к моменту времени

t), v ( ) = lim

x



f

. Приведем три известных определения производной

f (x)

функции

f

, определен-

ной в некоторой окрестности точки f ( x) - f ( x) b 1) f (x) = lim x- x b. xx b 2) Производная в точке

x

:

f (x)

равна тангенсу угла наклона касательной к графику части отображения

f

, проведенной в точке

x

.

3) Производная такое число

A

, что

f (x) равна главной линейной f (x + x) = f (x) + Ax + o(x).

x f (x)

x

; это

Первое определение принадлежит Коши, второе Лейбницу, а третье, собственно говоря, Фреше (который дал определение в бесконечномерном случае, но полагал, что оно неизвестно в конечномерном: описывая производную функции многих переменных он написал ...dierentiele

a `

mon sens"(дифференциал в моем смысле).

И как тут не вспомнить известный рассказ.

dx ? В ответ dt dx он получил все возможные логические определения. Оставьте это, воскликнул он, dt это скорость!
... Однажды, войдя в аудиторию, лорд Кельвин спросил студентов:Что такое
Ньютон, кстати, очень хорошо осознавал смысл предельного перехода. Он писал: Количества [...], которые в продолжение любого конечного времени постоянно стремятся к равенству и ранее конца этого времени приближаются друг к другу ближе, нежели на любую заданную величину, будут в пределе равны. Полную ясность в этот вопрос внес О. Коши (1789 1857). Число при

a

называется пределом последовательности

f , определенной на x0 ), если для любого числа > 0 найдутся число N (или |xn - a| < , n N (|f (x) - f (x0 )| < x : |x - x0 | < ).
стремящемся к бесконечности (или функции стремящемся к

n

{xn }nN интервале (x0 - , x0 + ) при x, положительное число ), такие что

Из определений легко следуют формулы исчисления пределов: предел линейной комбинации, произведения, частного двух последовательностей или функций равен линейной комбинации, произведению, частному пределов этих последовательностей или функций (в последнем случае, если предел знаменателя не равен нулю).

Cовершенно аналогично осмысление второй задачи об определении пути по скорости. Оно неизбежно ведет к понятию римановой суммы. Пусть нам известна скорость момент

v (t)

в любой

t

на временном отрезке

[t0 , t1 ],

и мы хотели бы найти длину пути, преодоленного за

[t0 , t1 ] на малые промежутки точками t0 = 0 1 . . . N +1 = t1 и считать, что на участке k = [k , k+1 ] скорость примерно постоянна и равна v (k ), где k какая-то точка на отрезке k . Таким образом, преодоленный N путь, равный s(t1 )-s(t0 ) примерно равен k=0 v (k )|k | (where || это длина отрезка . Эта сумма и называется римановой суммой и обозначается R(v (ћ), D , S ), где D (от слова division разбиение) разбиение отрезка [t0 , t1 ] на малые отрезки k , а S (от слова selection выбор) выбор точек k на k . Так мы приходим к понятию интеграла, как предела римановых t1 сумм (точное определение будет дано впоследствиии). Этот предел обозначают t v (t)dt и 0
этот период времени. Естественно тогда разбить отрезок 27


называют определенным интегралом или интегралом Римана от функции

v (ћ)

на отрезке

[t0 , t1 ] s(t0 )

Подведем предварительный итог. Мы пришли к формулам: и интеграла, которым является

t1 v (t)dt = s(t1 ) - t0 и в первом приближении обосновали фундаментальный результат о связи производной

.

s (t) = v (t);

Формула Ньютона Лейбница или основная формула интегрального исчисления: t
1

s (t)dt = s(t1 ) - s(t0 ).
t0
Или еще

(1)

t v (s)ds, т. е. интегрирование в некотором отношении обратная t0 операция по отношению к дифференцированию. Далее будут даны все необходимые уточ-

s(t) = s(t0 ) +

нения. Ньютон обозначал независимое переменное буквой независимое переменное обозначают буквой Ньютона Лейбница записывается так:

t

(от time время). Сейчас чаще обозначениях формула

x, а функцию f . В этих x f (x1 ) - f (x0 ) = x01 f (s)ds.

6.2. Теоремы существования решения задачи Коши в теории дифференциальных уравнений. законы, выражающие эволюцию процессов, происходящих в природе, описываются дифференциальными уравнениями. В частности, законы механики описываются обыкграфе, на языке математического анализа может быть выражен следующим образом: новенными дифференциальными уравнениями. Решения таких уравнений предопределяются начальными данными. Это создало у человечества иллюзию о том, что все в мире предопределено. Наиболее остро выразил это Пьер Лаплас. Он сказал: Ум, которому были бы известны для какого-либо данного момента все силы, одушевляющие природу и относительное положение всех ее составляющих частей, [...] он обнял бы в одной формуле движение величайших тел Вселенной наравне с движениями легчайших атомов, и ничто не осталось бы для него недостоверным. Будущее, равно, как и прошедшее, предстало бы перед его взором. Это воззрение оказалось иллюзией, но математическая основа справедлива и состоит в теореме существования и единственности решения задачи Коши обыкновенного дифференциального уравнения. Переходим к доказательству этой теоремы. Поворот в математике, о котором говорит А. Н. Колмогоров в приведенном выше эпи-

Пусть

D = [t0 - a, t0 + a] Ч BRn (x0 , b) Rn , f : D R x = f (t, x), x(t0 ) = x0 ,

n

,

x0 R

n

. Рассмотрим задачу:

(2.1) x = f (t, x).

которую называют задачей Коши для дифференциального уравнения

Теорема 8 (локальная теорема существования решения задачи Коши).
Dи M = maxt[t0 -

непрерывна в где

f липшицева с константой L по x, то на [t0 -, t0 +] ( = min(a, 1/2L, b/2M ), a,t0 +a] |f (t, x0 |) существует и единственно решение (2.1).
Если
28


Доказательство. Здесь следует применить теорему о (правом) обратном отображении в бесn конечномерном случае (из второй лекции) в ситуации, когда X = Y = C ([t0 - , t0 + ], R ), t b x0 (ћ) x0 , F (x(ћ))(t) = x(t) - x0 - t0 f (s, x(s))ds, = Id, = 1/2, = 1, = b, = 2 . Проверим выполнимость условий этой теоремы. Имеем: F (x0 (ћ))(ћ) C ([t0 -,t0 +],Rn ) M b (т. е. функция тождественно равная нулю принадлежит BC ([t0 -,t0 +]) )(F (x0 (ћ)(ћ), ), и по2
скольку для любых

(ћ), x(ћ)

выполняется неравенство

t

F ( (ћ))(ћ) - F (x(ћ))(ћ) - ( (ћ) - x(ћ)) |t - t0 |L (ћ) - x(ћ)

C ([t0 -,t0 +],R

n



t[t0 -,t0 + ]

max

|
t0

(f (s, (s)) - f (s, x(s))ds| ),

C ([t0 -,t0 +],R

n

)

1 (ћ) - x(ћ) 2

C ([t0 -,t0 +],R

n

условия теоремы о правом обратном отображении выполнены. Применение этой теоремы немедленно приводит к локальной теореме существования.

Теорема 8 (глобальная теорема существования решения задачи Коши для линейной системы). Пусть = [t0 , t1 ], функции A : L(Rn , Rn ) и b : Rn непрерывны
на отрезке

,

и

R

n

. Тогда на



существует единственное решение задачи Коши

x = A(t)x + b(t), x( ) = .

(2.2)

Доказательство. Здесь следует применить теорему о правом обратном к cлучаю, когда X = Y = C (, Rn ), тождественному оператору и F (x(ћ))(ћ) = x(ћ) - Gm (x(ћ))(ћ), где G t G(x(ћ))(t) = + t0 (A(s)x(s) + b(s))ds и Gm m-тая степень оператора G. По индукции докаcm (ћ) - x(ћ) C (,Rn ) , где c = A(t) dt. зывается, что |F ( (ћ))(t) - F (x(ћ))(t) - ( (t) - x(t))| m! cm Подобрав m таким, чтобы < 1 и применив теорему о правом обратном, приходим к утверm!
ждению теоремы

8

.

Лекция 7. Определенный интеграл
Здесь будет рассказано об определенных интегралах функций одного переменного, измерении площадей плоских фигур и объемов многомерных тел и об определенном интеграле функций многих. Параллельно речь пойдет о дифференциальных формах в одномерном, двумерном и трехмерном случаях.

7.1. Определенный интеграл в одномерном случае.
введено в п. 6.1. Дадим точное определение. Пусть

Фактически это понятие было

f функция, определенная на конечном отрезке [a, b], - < a < b, . Раздробим отрезок [a, b] на примыкающие друг к дружке отрезки k = [k-1 , k ], 1 k N (иногда вырождающиеся в точку), порожденную системой точек a = 0 1 . . . n+1 = b. ОбознаN чим это разбиение буквой D . Рассмотрим сумму k=1 f (xk )|k | (где || это длина отрезка
29


S = {xi }N некоторая выборка xk k . Эта сумма называется римановой суммой и i=1 обозначается R(f (ћ), D , S ). Величину = (D ) = max1kN |k | назовем размером разбиения. Определение 8. Число I называют определенным интегралом функции f : [a, b] R на отрезке [a, b], если для любого > 0 найдется число > 0, что для любого разбиения D отрезка [a, b] размера меньшего , для любой выборки S выполнено неравенство ),
а

b

|R(f (ћ), D, S ) - I | <

. Эту величину обозначают

f (x)dx
a

, а саму функцию

f

называют ин-

тегрируемой (по Риману).

Теорема 9. Функция, непрерывная на конечном отрезке, интегрируема на нем. Доказательство. Пусть f непрерывная функция на [a, b]. Рассмотрим некоторое
D = N k i=1
. Нижней выборкой

раз-

биение

S

- по этому разбиению назовем такую выборку, при

которой в каждом отрезке

k

выбирается одна из точек этого отрезка, где

f

принимает

S+ (где берется наибольS по разбиению D выполнены очевидные неравенства R(f , D, S- ) R(f , D, S ) R(f , D, S+ ). Из теоремы Кантора о равномерной непрерывности по любому > 0 найдется число > 0, для которого из неравенства (D ) < следует, что R(f , D, S+ ) - R(f , D, S- ) < . Отсюда следует, что число I , равное верхней грани по D всех сумм R(f , D , S- ) совпадает с нижней гранью по D всех сумм R(f , D , S+ ), и что это число
наименьшее значение. Аналогично определяется верхняя выборка шее значение). Для любой выборки удовлетворяет определению 8.

7.2. Плоские области и измерение их площадей.
мы хотим определить, что такое площадь какой-то фигуры (скажем, полукруга, радиуса

Для того, чтобы найти площадь

квадрата, надо измерить длину его стороны, взяв в качестве масштаба, скажем, 1 см, и если 2 2 длина стороны квадрата равна a см, его площадь по определению равна a см . Пусть теперь

R

см) и подсчитать площадь

, S ()

расположенной на плоскости этой фигуры. Для определен-

ности пусть радиус полукруга 1 см. Разместим основание полукруга на отрезке

[-1, 1]

на оси

Ox1 x2 =

в плоскости, так что полукруг оказывается расположенным между графиком функции 1 - x2 и основанием. 1 2 Вырежем (мысленно) некоторое количество квадратиков размера 1 мм и будем выклады-

вать их друг к дружке, чтобы они целиком поместились в нашей фигуре (в нашем примере 2 в полукруге). Подсчитаем их общую площадь (которую будем всегда измерять в см ), пусть 2 она равна a12 см (a12 первая оценка площади двумерной фигуры). При этом, разумеется, останутся непокрытые места. Дальше будем поступать уже умственно: вырежем (умствен-2 но) некоторое количество квадратиков размера 0.1 мм =10 см и будем их прикладывать к объединению начальных, миллиметровых квадратиков, сколько возможно, и к тому же заполним маленькими квадратиками и миллиметровые квадратики. Пересчитаем полученную 2 2 площадь снова в см , получим число a22 см . Ясно, что a12 < a22 . Далее будем поступать -n аналогично, вкладывая квадратики со сторонами 10 , n 3 см, и получая площади an2 см2 , удовлетворяющие неравенствам

a

12

< a22 < . . . < an2 < . . .

. Согласно известному свойству

чисел, монотонно возрастающая ограниченная сверху (в нашем случае двумя квадратными сантиметрами) последовательность чисел имеет предел (этот факт называют иногда аксиомой Вейерштрасса, иногда его теоремой). Этот предел (пусть это будет число

a

2 ) назовем

нижней площадью фигуры. Аналогично поступим с покрытием фигуры. Сначала покроем ее

30


целиком наименьшим числом сантиметровых, потом миллиметровых и т. д. квадратиков. И будем получать числа

b

12

>b

22

> ... > b a

n2

> . . ., b

очевидно, ограниченные снизу. Предел этой

последовательности (снова по аксиоме или теореме Вейерштрасса) обозначим

b

2 и назовем

верхней площадью фигуры. Ясно, что
Если числа

2

2 .

2 , определенные выше, совпадают, т. е. a2 = b2 = S , плоскую 2 фигуру называют измеримой по Жордану, а число S см называется площадью фигуры : 2 и

a

b

S = S ().
Можно доказать, что это определение площади фигуры не зависит от того, как расположена фигура на плоскости относительно декартовой системы координат и какие размеры квадратиков мы последовательно выбираем. Если освоиться с понятием площади фигуры, то становится понятным равносильность определения 8 и следующего определения:

Определение 81 .

Определенный интеграл

определенной на отрезке мыми b f (x a

Исторический комментарий.

[a, b] x1 = a, x2 = 0, x1 = b и графиком функции x2 = f (x1 ). Если функция меняет b b )dx = a f+ (x)dx + a f( x)dx, где f+ (x) = max{f (x), 0}, а f- (x) = min{f (x), 0}. g eometria ~

b f (x)dx от неотрицательной функции f , a , по определению это площадь фигуры, ограниченной прязнак, то

Измерять площади, как считается, люди научились очень по-гречески землемерие)

давно. Полагают, что само название науки геометрия (

происходит от того, что когда-то в древнем Египте люди научились мерить площади земельных участков. Долгое время ограничивались измерением многоугольных участков (их разбивали на треугольники, площади которых равняются половине произведения основания на высоту). Вопрос о том, что такое площадь круга, потребовал больших умственных усилий. В Древней Греции стали определять площадь круга, как число, равное пределу площадей вписанных правильных многоугольников, и равного ему пределу описанных правильных многоугольников. Исходя их этого определения Архимед первый получил оценки для площади 1 10 2 2 2 < S (B 2 (0, 1)) < 3 7 . Приведенное единичного круга B (0, 1) = {x = (x1 , x2 ) | x1 + x2 1}: 3 ? 71 определение измеримости принидлежит французскому ученому К. Жордану (1838 1922).

Одномерные дифференциальные формы и их исчисления. Формула Ньютона Лейбница
0 = 1 = f1 (x)dx Формы 0 можно дифференцировать, и мы приходим к b специальному виду формы 1 : d 0 (x) = f0 (x)dx, вторые можно интегрировать: f f (x)dx. Из a1 b формулы Ньютона Лейбница получаем: df0 (x) = f0 (b) - f0 (a). За этим простым фактом a можно уже усмотреть замечательную формулу Пуанкаре d = .
В одномерном случае существуют дифференциальные формы двух типов функции

f0

и выражения вида

7.2. Интегральное исчисление функций двух переменных
В этом разделе мы еще остаемся в школе, точнее, в тех школах, где преподают стерео-

метрию. В стереометрии учат вычислять объемы. Начнем этот раздел с уточнения понятия
объема пространственной фигуры. Будем двигаться по аналогии с тем, что рассказывалось в п.7.2.

31


Пространственные фигуры и измерение их объемов.

Для того, чтобы найти объем

куба, надо измерить длину его стороны, взяв в качестве масштаба, скажем, 1 см, и если длина 3 3 стороны куба равна a см, его объем по определению равен a см . Пусть теперь мы хотим определить, что такое объем какой-то фигуры , расположенной в пространстве (скажем, 3 3 2 2 2 2 полушара B+ (O , R) = {(x R | x1 + x2 + x3 R , x3 0}, с центром в нуле радиуса R см) 3 и подсчитать объем V (B+ (0, R)) этой фигуры. Для определенности пусть опять R = 1 см. 3 3 Расположим этот полушар так, как он нарисован на рис. 5.2, так что полушар B+ = B+ (O , 1)

1 - x2 - x2 и основанием, оказывается расположенным между графиком функции x3 = 1 2 2 2 являющимся кругом x1 + x2 = 1, расположенным в плоскости x3 = 0. Все это можно как бы материализовать, разрезав пополам, скажем, сантиметровый резиновый мячик и положив
половину мячика на стол. Возьмем набор одинаковых кубиков с миллиметровой длиной стороны и будем (мысленно) укладывать эти кубики в полушар до упора. В итоге получим первую оценку объема полу3 3 шара: V (B+ ) > a13 см. . Затем, заполним полушар до упора маленькими кубиками с длиной 3 стороны, равной 0.1 мм , и получится вторая оценка a23 объема V (B+ ) полушара. Продолжая умственно заполнять полушар кубиками все меньших и меньших размеров, будем получать последовательность оценок

0 < a23 < . . . < an3 < . . .

. Последовательность эта, разумеется,

ограничена сверху. Значит, она имеет предел. Обозначим его

a

3 и назовем нижним объемом

фигуры.
Аналогично поступим с покрытием фигуры. Сначала покроем полушар наименьшим числом кубиков размера кусочков сахара, потом кубикиков размера кубиков сахарного песку и т. д. И будем получать числа

b

13

>b

23

> ... > b

n3

> ...

. Предел этой последовательности

(снова по аксиоме или теореме Вейерштрасса) обозначим

b

3 и назовем верхним объемом

фигуры. Ясно, что
Если числа

a

3

b

3 .

a

3

=b

3

=V

совпадают, т. е. 3 , пространственную фигуру называют измеримой по Жордану, а число V см

a

3 и

b

3 , определенные выше, для измеряемой фигуры



называют объемом фигуры

: V = V ()

.

Можно доказать, что это определение не зависит от того, как расположена фигура в пространстве относительно декартовой системы координат и от размеров тех кубиков, которые используются при построении. Если освоиться с понятием объема фигуры, то становится понятным естественность следующего определения:

f (x)dx от неотрицательной функции f , определенной на плоском множестве, измеримом по Жордану, по определению это объем
Определенный интеграл фигуры, ограниченной цилиндром над

Определение 82 .



и графиком функции

x3 = f (x1 , x2 ),

с естественным

дополнением, касающимся функций, меняющих знак. Аналогичным образом индуктивно вводится определенный интеграл функций в

R

n

.

Исторический комментарий.

Измерять объемы многогранников, как считается, люди

научились в Древней Греции. По свидетельству Архимеда Евдоксу

( 408



355

до н.

э.) принадлежит прием вычисления объема пирамиды известный, как метод исчерпывания. Выдающуюся роль в понимании того, что такое площадь плоской фигуры и объем фигуры пространственной, сыграл сам Архимед (



287 212 до н. э.). Шедевром античной матема-

32


тики является вычисление им объема шара.

Лекция 8. Интегрирование дифференциальных форм
Здесь речь пойдет о формуле Пуанкаре случай лишь слегка наметим.

5

об интегрировании дифференциальных форм.

На самом деле мы ограничимся одномерным, двумерным и трехмерным случаями, о общий

8.1. Дифференциальные формы в одномерном случае и формула Ньютона Лейбница.
1 Дифференциальные формы в одномерном случае определяются на отрезке M = [a, b], ко1 1 торый является диффеоморфным образом отрезка B = B (0, 1) = [-1, 1]. Это означает, что
существует непрерывно-дифференцируемое в обе стороны взаимно однозначное отображение : B 1 M1 , переводящее B 1 в [a, b]. Краем отрезка 0 1 так: M = M Отрезок являет собой прототип того, что далее будет называться многообразием с краем. M1 = [a, b] является пара чисел (b, a), снабженных знаками. Обозначим это = {+b, -a}. А все остальные точки x отрезка M1 таковы, что содержат 1 некоторый интервал (x - , x + ), лежащий в M . 0 01 1 11 В одномерном случае существуют два типа дифференциальных форм = и = . 0 это функции на M1 (0 = f0 (x)), а 1 это выражения вида 1 = f1 (x)dx. Дифферен-

циальные формы можно дифференцировать и интегрировать. Правила дифференцирования дифференциальных форм

0

и

1

в одномерном случае таковы:

d1 = 0. А вот каковы f0 (b) - f0 (a), M1 1 =
Ньютона Лейбница:

правила интегрирования этих b f (x)dx. a1 Вспоминая то, о чем говорилось на лекции 6, приходим к следующей форме теоремы

d0 = df0 (x) = f0 (x)dx, дифференциальных форм : = M1 0

b

f0 (x)dx = f0 (b) - f0 (a)
a

d0 =
M1 M1

0 .

Две фигуры в пространстве водящее одну фигуру в другую.

R

n

называют диффеоморфными, если существует взаимно-

однозначное и непрерывно-дифференцируемое вместе со своим обратным отображение, переДифференциальные формы, будут рассматриваться нами в двумерном случае, в основном, 2 2 2 2 2 на областях M , являющихся диффеоморфизмами круга B = {t = (t1 , t2 ) R | t1 + t2 1} 1 1 2 и на кривых M диффеоморфных образах отрезка B = [-1, 1] или окружности B = {x R2 | x2 + x2 = 1}. 1 2 2 Область M тоже является многообразием с краем. Ее краем является кривая, являю1 2 2 2 2 щаяся образом окружности S = {t = (t1 , t2 ) R | t1 + t2 = 1}. Обозначим эту кривую M . 2 А все остальные точки x области M таковы, что некоторый открытый круг с центром в x

5 точнее формуле Ньютона Лейбница Грина Остроградского Стокса Пуанкаре

33


радиуса



, лежит в

M2

. Помимо всего этого существуют еще пары точек

M0 = M1

, где

M1

это диффеоморфизм отрезка.

0 01 1 11 Имеется три типа дифференциальных форм в двумерном случае: = , = , 2 = 21 . Это функции (0 = f0 (x)), выражения вида 2 = f2 (x)dx1 dx2 на M2 , а так1 1 же выражения вида = f11 (x)dx1 + f12 (x)dx2 на M . Дифференциальные формы можно
дифференцировать и интегрировать. Дифференцирование превращает дифференциальную i i+1 форму i из в дифференциальную форму i+1 из , причем d2 = 0. Правила диффе f 0 ( x) dx1 + f0 (2x) dx2 , ренцирования дифференциальных форм 0 2 таковы: d0 = d 0 (x) = f x1 x f21 (x) f11 (x) d1 = ( x1 - x2 )dx1 dx2 , d2 = 0. А вот каковы правила интегрирования этих дифференциальных форм : = f0 (b) - M1 0 f0 (a), M1 1 = B 1 f1 ((t)) (t)dt (здесь t [-1, 1]), M2 2 = B 2 f2 ((t)) (t)dt (здесь t = ( ( (t1 , t2 )T , t2 + t2 1, : B 2 2 , (t) = (1 (t), 2 (t))T , (t)dt = (( 11t) dt1 + 12t) dt2 ) 1 2 t t ( ( ( ( ( ( ( 21t) dt1 + 22t) dt2 )) = ( 11t) 22t) - 12t) 11t) )dt1 dt2 t t t t t t В итоге при интегрировании форм i , i = 0, 1, 2 и их дифференциалов, приходим к следующму результату:

i =
Mi+1
При

di ,
M

i = 0, 1.

(2)

i=0

получаем двумерную формулу Ньютона Лейбница:

b a
При

f0 (x) f (x) dx1 + 0 dx x1 x2

2

= f (b) - f (a).
6

(21 )

i=1

приходим к так называемой формуле Грина:

d1 =

2



2

f12 (x) f11 (x) - x1 x1

dx1 dx2 =

2

1 =

2

f11 (x)dx1 + f12 (x)dx2 .

(22 )

Доказательство этой формулы проведем сразу в многомерном случае.

8.2. Определенный интеграл и диффернциальные формы в многомерном случае. Формула Пуанкаре Теорема 10. (Пуанкаре).

i1
соответственно. Тогда

dkn . n k n Доказательства этой теоремы мы не приводим.

dxi2 . Bk = = k k n

n 2 j =1 xj 1}, kn = . . dxik дифференциальная форма k -того порядка в Rn , {x Rk | n=1 x2 1 и B k = Sk-1 = {x Rk | n=1 x2 = 1 j j j j

Пусть

X=R

n

,

B

k

= {x R

k

|

Следствия из общей формулы Пуанкаре интегрирования дифференциальных форм в одномерном, двумерном и трехмерном случаях
6 Дж. Грин (1793 1841) английский математик, опубликовавший формулу
известна еще Эйлеру.

(21 )

в 1828 году; она была

34


n=1

формула Ньютона Лейбница,

n = 2, k = 1

формула Грина,

n = 3, k = 2



формула Остроградского,

Формула Остроградского и ее физическая интерпретация
d
k -1

n = 3, k = 1

формула Стокса.

опираются на следующую формулу Пуанкаре: границей Пусть что на 2

=




k -1

. Следующие два пункта k , где область в R с гладкой

.

некоторая область в

гладкое отображение.

F

, ограниченная гладкой поверхностью 3 сопоставляет точке x R вектор (F1 (x), F2 (x), F3 (x

R

3

и F : R3 )). Тогда говорят,

задано векторное поле. Применяя формулу Пуанкаре в этом частном случае (для = F1 dx2 dx3 + F2 dx3 dx1 + F3 dx1 dx2 ), получаем 2 = F1 dx2 dx3 + F2 dx3 dx1 +


)dx1 dx2 dx3 . Это соотношение называется формулой Остроградского. F1 (x) Число + F2 (2x) + F3 (3x) называется дивергенцией или расходимостью поля F в точке x1 x x x и обозначается divF (x). Гладкая поверхность в каждой точке x имеет нормаль n(x) F3 dx1 dx2 = d(F1 dx2 dx3 + F2 dx3 dx1 + F3 dx1 dx2 ) = ( +
единичный вектор перпендикулярный касательному пространству к поверхности в точке Элемент площади поверхности придать такую форму:

F1 (x) + F2 (2x) x1 x

F 3 ( x) x3

x

.

вблизи x обозначим d (x). n(x), F (x) d (x) = div(x)dx (i). F

Формуле Остроградского можно Выражение

n(x), F (x) d (x)

называется потоком векторного поля

через поверхность



. Таким образом, формула

Остроградского утверждает, что интеграл от дивиргенции векторного поля по объему ра-

вен потоку этого векторного поля по поверхности, ограничивающей этот объем. В этом
состоит физическая интерпретация формулы Остроградского. Докажем эту формулу для частного случая, когда область выпукла. Рассмотрим инте F1 (x) F1 ( x) dx1 dx2 dx3 = dx. Произведя при фиксированных x2 и x3 интеграл J1 = x x V грирование по

x

1 с применением формулы Ньютона Лейбница, будем иметь:

J1 =

23

(F1 (B )-

F (A))dx2 dx

x2 Ox3 , а [A, B ] отрезок интегрирования. Пусть поверхности в точках A и B и n(A) и n(B ) 1 единичные нормали в этих точках. Тогда, как легко понять, dx2 dx3 (B ) = d (B ) n(B ), e , 1 T 3 1 где e = (1, 0, 0) первый орт R . Аналогично dx2 dx3 () = -d (B ) n(B ), e . Проделав аналогичную операцию для двух других интегралов, приходим к формуле (i).
3 , где
на плоскость

23 проекция тела d (A) и d (B ) элементы

Формула Стокса
Пусть

и

F:R

3 некоторая поверхность в R , границей которой является гладкая кривая 3 3 3 гладкое отображение из в R . F сопоставляет точке x R вектор 123

eee

(F1 (x), F2 (x), F3 (x)).

Тогда говорят, что на



задано векторное поле. Вектор

det

x1 x2 x3

=

F1 F2 F3 3 2 1 3 2 1 ( F2 - F3 )e1 + ( F3 - F1 )e2 + ( F1 - F2 )e3 называется ротором (или вихрем) векторного поля x x x x x x F в точке x и обозначается rotF (x). Гладкая поверхность в каждой точке x имеет нормаль n(x) единичный вектор перпендикулярный касательному пространству к поверхности в точке x; элемент площади поверхности вблизи x обозначим d (x). Гладкая кривая в каждой точке x имеет единичный касательный вектор (x); элемент длины кривой

35


вблизи

x

обозначим

ds(x). n(x), F (x) ds(x) =
F1 x3

Имеет место следующий частный случай формулы Пуанкаре :

F1 dx1 +

F2 dx2 + F3 dx3 =


d(F1 dx1 + F2 dx2 + F3 dx3 ) = (


F3 x2

-

F2 x3

)dx2 dx3 + (

-

F3 x1

)dx3 dx1 +

(

F2 x1

-

F1 x2

)dx1 dx2 =


rotF (x)d (x)

(формула Стокса).

Лекция 9. Ряды и комплексный анализ
Напоминание простейших сведений. У комплексного числа зывается вещественной частью

z = x + iy , x, y R

число

x

на-

z, y

мнимой его частью. Они обозначаются, соответственно,

C. Функция f : C C сопоставляет комплексному числу z = x + iy комплексное число f (z ) = u(z ) + iv (z ) = u(x, y ) + iv (x, y ). 2 2 2 Например, если f (z ) = z , то u(x, y ) = x - y , v (x, y ) = 2xy . Rez
и

Imz

. Совокупность комплексных чисел обозначают

Основными понятиями вещественного анализа являются понятия производной и интеграла. Введем эти понятия для функций комплексного переменного.

9.1. Производная комплексной функции.
x

Если

f

вещественная функция, опреде-

ленная в некоторой окрестности точки

aR

x называется такое число f (x + x) = f (x) + ax + o(|x|. В комплексном случае определение аналогично: если f комплексная функция, определенная в некоторой окрестности точки z , то ее производной в точке z называется такое число a C (в предположении, что оно существует), что f (z + z ) = f (z ) + az + o(|z |. При этом говорят, что f дифференцируема в z , а число a обозначается f (z ). Если f дифференцируема в окрестности точки z и производная непрерывна, как функция z в окрестности x, говорят, что f там аналитична.
, то ее производной в точке (в предположении, что оно существует), что

9.2. Условия Коши-Римана. Предложение 1. Пусть f аналитична
и

u(x, y ) = Ref (z ) -
u(x,y ) bb . y

v (x, y ) = Imf (z )
Соотношения

в окрестности точки z u((x,y ) bb выполнены соотношения: x
v (x,y ) v (x,y ) bb bb , y x

= (x, y ). (b b = vx,y) y

Тогда для v (x,y ) bb , = x

Определение 10.

u((x,y ) bb x

=

=-

u(x,y ) bb называются условиями y

Коши Римана.
Имеем: f (z v ) + u x + y x Положив f

Доказательство предложения 1.

+ z ) = f (z ) + f (z )z + o(|z |) = u(x + x, y + y ) + iv (x + x, y + y ) + o(|z |) = v v f (z y + i( x x + y y ) + o(|z |). (z ) = + i , приравняв вещественную и мнимую компоненты левой и правой u v v v частей равенства, приходим к соотношению: x - y + i( y + x) = x + x y + i( x x + y y ). x u v v v v Откуда получаем: = , u = - , x = , y = , и следовательно, u = y , x = - u . x y x y Нетрудно доказать, что если функции u и v непрерывно дифференцируемы, то функция f = u + iv аналитична, но мы на этом не остановимся.

Id

9.3. Теорема Коши.

Знаменитая теорема Коши, лежащая в основании комплексного

анализа, является следствием формулы Грина. Формула Грина это частный случай общей

36


формулы Пуанкаре, касающейся интегрирования дифференциальных форм:

(adx + bdy ) =


)dxdy . Применим эту формулу к случаю, когда O область на комплексной плоскости, в которой задана аналитическая функция f и односвязная d(adx + bdy ) = +
область с гладкой границей

(-

a y

b x

Теорема 11 (Коши об интеграле по замкнутому контуру).

=

, расположенная в

O

.

Интеграл по гладкому

замкнутому контуру, охватывающему односвязную область от аналитической функции, равен нулю. Доказательство. Действительно,


f (z )dz = -
v y

def

(u + iv )(dx + idy ) =
Cauchy-Riemann

Id

(udx - v dy ) + i(v dx +

udy ) =

Green

(-

u y

-

v x

)dxdy + i (


u x

)dxdy

=

0.

9.4. Формула Коши. Предложение 2. Пусть f
место формула Коши:

аналитична в некоторой области, содержащей точку

z

и



замкнутая кривая, охватывающая односвязную область, включающую точку f ( )d = 2 if (z ). -z
Доказательство. Проведем окружность

z

. Имеет

исключить круг, ограниченный окружностью По ки)

= { C | | - z | = }. Если из области, ограниченной кривой , останется двусвязная область, ограниченная кривыми и . теореме Коши сумма интегралов, проходимых по в положительном направлении (против часовой стрелf ( )d и по в отрицательном направлении, то получится нуль. Значит, интеграл по равен J = -z .
| -z |=

Положим

= z + e

it

Переходя к пределу

0t при
,

it 2 ) it 2 и получим, что J = 0 f (e eie dt it 0, приходим к формуле Коши.

=i

2 0

f (e )dt = 2 i(f (eit ) + o()).

it

f

Дифференцируя под знаком интеграла последовательно формулу Коши, получаем, что ( (k ) (z ) = 2k!i (f- )d . Получили, что аналитическая в некоторой области функция бесконеч z )k+1

но дифференцируема в ней.

9.5. Ряд Маклорена.

f
(k )

ле радиуса

аналитична в окрестности нуля и круг с центром в ну1.4 1 f ( )d Id 1 f ( )d z k d 1.4 лежит в этой области. Тогда: f (z ) = = 2 i ( )= 2 i -z k k 0 |z |= |z |=

Пусть

f

k 0

(0) k z. k!

Это соотношение называется рядом Маклорена. Аналогично доказывается, что функция аналитическая в некоторой области, содержащей точку f (k ) (z ) b (z - z )k . k! k 0 ференцируема в ней, но разлагается в ней в ряд.

f

z

разлагается в ряд Тейлора:

f (z ) =

Получили, что аналитическая в некоторой области функция не только бесконечно диф-

37


Лекция 10. Начала теории вероятностей
После работ Ньютона в течение длительного времени казалось, что мир детерминирован. Лишь в прошлом веке возникли сомнения в этом, и стало фомироваться убеждение, что мир скорее хаотичен. Законы хаоса изучает теория вероятностей, и потому, любой курс математики должен содержать начала этой теории.
Краткий исторический экскурс. Первая глубокая теорема в теории вероятностей закон больших

чисел Якоба Бернулли (1654 1705) была опубликована в его труде по теории вероятностей ?Искусство предположений? , который увидел свет в 1713 г. В применении к бросанию монеты закон больших чисел утверждает, что при большом числе бросаний число гербов будет примерно равно числу решек. Следующий шаг сделал Пьер Лаплас (1749 1827). В своем труде ?Аналитическая теория верятностей? (1812) он определил вероятность отклонения доли числа, скажем, гербов, от половины при большом числе испытаний. Этот результат стал называться центральной предельной теоремой. Третье имя, которое надо назвать Андрей Николаевич Колмогоров (1903 1987). Он в своем классическом труде ?Основные понятия теории вероятностей? (1933) разработал аксиоматику теории вероятностей (и тем включил ее в ряд точных наук), доказал многие важнейшие теоремы теории вероятностей, начал разработку теории случайных процессов и многое другое.

Теория 10.1. Вероятностное пространство. Определение 10.
где Основным объектом, изучаемым в теории вероятностей, является вероятностное пространство.

Вероятностное пространство(согласно Колмогорову), это тройка (, F , P ), это некоторое множество точек { }, называемых элементарными событиями, F = {A} это некоторая совокупность подмножеств A , называемых событиями, а P это неотрицательная функция на F , удовлетворяющая следующим аксиомам:

ћ F является алгеброй множеств, т. е. если A1 и A2 события (иначе говоря, F , i = 1, 2), то их объединение A1 A2 , пересечение A1 A2 , разность A1 \ A нения Ai , i = 1, 2 тоже являются событиями (т. е. принадлежат F ). ћ
Каждому множеству число

если

Ai

2 и допол-

AF

поставлено в соответствие неотрицательное действительное

P (A).

Это число называется вероятностью события

A

.

ћ P () = 1. ћ
Если два события несовместны, (т.е.

AB =

) то вероятность того, что произойдет

одно из них равна сумме вероятностей каждого: Два события

P (A B ) = P (A) + P (B ). P (A B ) = P (A)P (B ),
а если это

A

и

B

называются независимыми, если

равенство не выполняется, события называются зависимыми.

Из аксиом вероятностного пространства сразу следует

Теорема сложения вероятностей

. Вероятность суммы событий равна сумме веро-

ятностей минус вероятность их совместного исхода (P
38

(A B ) = P (A) + P (B ) - P (A B ).


Доказательство.
множеств которые стороны

Действительно, объединение

AB

представимо, как объединение двух

непересекающихся множеств

A (B \ A

) (если некий элемент принадлежит объединению

A

и

B

, то он либо принадлежит

A

, либо принадлежит к тем элементам из

B

,

A не принадлежат). По последней аксиоме P (A B ) = P (A) + P (B \ A). С B разлагается в сумму двух непересекающихся множеств (B \ A) (A B ), P (B ) = A B + P (A B ). Откуда P (A B ) = P (B ) - P (A B ). Подставляя это в
равенство, получим доказательство теоремы. Вероятность события

другой откуда первое

стью и обозначается

B при условии, что A произошло, называется условной вероятноP (B /A). Имеет место формула: P (A B ) = P (A)P (B |A) = P (B )P (A|B ).

Это равенство называется теоремой умножения вероятностей. Имеются три наиболее важные для нас модели вероятностного пространства:конечное

вероятностное пространство, счетное вероятностное пространство и прямая

10.2. Конечное и счетное вероятностные пространства.


R

.

Конечное вероятностное

пространство это пространство

, состоящее из конечного числа элементарных событий

{1 , . . . , n }, F

это совокупность всех подмножеств , а вероятности элементарных событий n k n задаются числами {pi }i=1 : P (i ) = pi (pi 0, i=1 pi = 1), , и если A = j ij , то P (A) = k j pij . Конечное вероятностное пространство будем представлять таблицей

(, F , P )

1 , . . . , n p1 , . . . , pn

.

В дальнейшем будем иллюстрировать теорию двумя такими простейшими примерами.

1 назовем успехом. Пусть вероятность успеха p1 = p. Тогда вероятность неуспеха равна p0 = q = 1 - p. Всех событий четыре: F = {A0 , A1 , A2 , A3 }, где A0 = , A1 = 0 , A2 = 1 , A3 = = A1 A2 , и при этом P (A0 ) = 0, P (A1 ) = p, P (A2 ) = q , P (A3 ) = 1. Скажем, испытанием Бернулли является бросание монеты, когда событие 1 состоит в 1 том, что выпал герб, 0 в том, что выпала решка и вероятности обоих событий равны (или 2 бросание кости, при котором в качестве 1 рассматривается выпадение единицы, а в качестве 0 выпадение всего остального. Здесь P (1 ) = 1 , а P (0 ) = 5 ). 6 6 Пример 2 (бросание кости). Здесь = {0 , 1 , 2 , 3 , 4 , 5 , 6 }, pi = 1 , 1 i 6. 6
Здесь . Исход опыта

Пример 1 (испытаниe Бернулли).

= {0 , 1 }

Счетное вероятностное пространство это пространство
ла элементарных событий



, состоящее из счетного чис-

это совокупность всех подмножеств , а ве роятности элементарных событий задаются числами {pi }iN : P (i ) = pi (pi 0, pi = 1), , i=1 N N и если A = j ij , где N конечное число или бесконечность, то P (A) = j k pij . Счетное вероятностное пространство будем представлять таблицей

{1 , . . . , n . . .}, F

(, F , P )

Пример 3 счетного вероятностного пространства

1 , . . . , n , . . . p1 , . . . , pn , . . .

. представляет таблица

39


(, F , P )

1 , . . . , n , ... - - n-1 e , . . . , e (n-1)! , . . .

.

О прямой, как вероятностном пространстве будет сказано позже.

10.3. Случайные величины, их математические ожидания и дисперсии.
чайной величиной называется функция

Слу-

f:R

на пространстве элементарных событий.

Пусть вероятностное пространство представляет таблица дающая случайную величину, такова:

1 , . . . , n p1 , . . . , pn

и функция

f

, за-



. Ее представляет таблица:

=

f (i ) = i 1 , . . . , n p 1 , . . . , pn

. Обозначим эту случайную величину буквой

(1) x

. Если

случайная величина, прини-

мающая значения

{1 , . . . , n }

, она приводит к набору вероятностей

P (x)

это вероятность

события: случайная величина принимает значение

. Этот набор чисел называется распреде-

лением вероятностей случайной величины
ся число



.

Математическим ожиданием случайной величины



Пример 4.

M = 1 p1 + . . . + n p

n . Дисперсией

D

является число

, задаваемой таблицей 2

(1) называетM ( - M ) = M 2 - (M )2 . = (2)
. Ее

Пусть произведено испытание Бернулли. Рассмотрим случайную величину, ко-

торая успеху сопоставляет единицу, а неудаче нуль. Вот ее таблица: математическое ожидание ожиданий слагаемых.

M = p

, а дисперсия

0, 1 1 - p, p 2 D = p - p = p(1 - p) = pq . Легко

доказыва-

ется, что математическое ожидание суммы случайных величин равно сумме математических

Пример 5.

Это пример функции на счетном вероятностном пространстве, описанном в

примере 3. Здесь случайная величина, принимает значения {0, 1, . . . , m, . . .}, c вероятностью - m появления числа m, равной P (m) = e . Это распределение называется распределением m! Пуассона. Математическое ожидание этого распределения равно (как нетрудно подсчитать)



. При больших

распределение:

10.4. Независимые испытания

n и малых m Pn (m) P (m), =

распределение Пуассона хорошо приближает биномиальное m . где = n (на примере испытания Бернулли). Пусть опыт, при-

ведший к вероятностному пространству элементарных событий

0 , 1 1 - p, p

повторяется

еще раз (скажем, кость бросается дважды). Получим тогда четыре элементарных события {0 0 , 1 0 , 0 1 , 1 1 } с вероятностями, соответственно, (1 - p)2 , p(1 - p), (1 - p)p, p2 , откуда получаем случайную величину для числа успехов:

n-1)...(n-m+1) испытаний вероятность m успехов равна = m! n! m n-m называется биномиальным коэффициентом (ибо это коэффициент при p q в m!(n-m)! n разложении бинома Ньютона (p + q ) ). Вероятностное распределение случайной величины,
принимающей значения {0, 1, . . . , n}, c вероятностями {Pn (0), Pn (1), . . . , Pn (n)}, где Pn (m) = m m Cn pm (1 - p)n-m , называется биномиальным распределением, равенство Pn (m) = Cn pm (1 - p)n-m называется формулой Бернулли. Свойства биномиального распределения: математическое ожидание равно

0 1 2 2 (1 - p) , 2(1 - p)p p2 m m Cn pm (1 - p)n-m , где число Cn = n(

. В случае

n

np

, дисперсия равна

npq

. Эти формулы вытекают из свойств ма-

40


тематических ожиданий и дисперсий (в случае независимости испытаний дисперсия суммы случайных величин равна сумме дисперсий).

10.5. Еще одна модель вероятностного пространства прямая
Здесь вероятностное пространство ной функцией

=R

, элементарные события точки прямой, собыравен нулю, а при

тия объединение отрезков, интервалов и полуинтервалов, а вероятность задается монотон-

F

, предел которой при

x -

x

равен единице. Эта

функция может иметь скачки, но является непрерывной справа. Такие функции называются

функциями распределения. Значение функции
ного открытому лучу ностью как случайную величину

F

в точке

x

задает вероятность события, рав-

(-, x). F . В

Такое вероятностное пространство можно интерпретировать, важнейших случаях функция распределения задается плот-

которая является неотрицательной функцией интеграл от которой по всей x прямой равен единице. Тогда F (x) = p(t)dt. - Математическим ожиданием случайной величины F , задаваемой функцией распределения является число , порожденной плотностью p, называется число 2 M (F - M F )2 = M F - (M F )2 . Приведем три непрерывных распределения.

x p(x),

F

M F =

R

xp(x)dx

. Дисперсией

DF

имеет плотность, равную нулю всюду, 1 . кроме этого отрезка, а на отрезке оно равно константе, равной b-a задается функцией распределения Fexp (x), равной -x нулю, если x < 0 и 1 - e , если x 0.

1. Равномерное распределение

на отрезке

[a, b]

2. Показательное распределение 3. Нормальное распределение
(x) = p
norm

. Каноническое нормальное распределение задается
x2 2

плотностью

(x) =

1 e- 2

. Его называют распределением Гаусса (или иногда

распределением Лапласа).

Основные результаты Неравенство Чебышева
неравенство:

P {| - M | > }

. Пусть D . 2



некоторая случайная величина. Имеет место

Теорема 10 (закон больших чисел Я. Бернулли).

В схеме независимых испытаний

Бернулли вероятность того, что доля успехов по модулю отличается от вероятности успеха на любую положительную величину стремится к нулю при числе испытаний, стреm мящемся к бесконечности. В виде формулы это выглядит так: P {| n - p| > } 0 при

n .

Центральная предельная теорема П. Лапласа. a) Локальная: Если число n велико, а m достаточно
1 e- 2
x2 2

близко к

n

, то



npq Pn (m) :

1

для всех

m

для которых

x=

m-np находится в конечном интервале. npq

b) Интегрльная:
при

n

mi -np , i = 1, 2. Тогда вероятность того, что число успехов npq испытаниях Бернулли удовлетворяет неравенствам m1 m m2 примерно равна

Пусть

xi =

41


1 2

Доказательства
1) Закон больших чисел. Вводим случайную величину

x2 x1

e- 2 dx

x2

.

k

, равную числу наступлений собы-

-том испытании, получаем, что = 1 + . . . + n . При этом M k = p, D k = p(1 - p), Cheb.ineq np(1-p) m - p| > } 0, когда n . откуда P {| n n2 2) Локальная центральная предельная теорема. Доказательство см. в книге Б. В. Гнетия

A

при

k

денко ?Курс теории вероятностей?.

Д1. Математика и естествознание Законы Ньютона.

Дополнения.

В 1687 году вышла книга Ньютона Математические начала натуральной философии, быть может, величайшая в истории науки. Среди многого другого Ньютон там сформулировал законы динамики. Впоследствии они были истолкованы на языке теории экстремумов.
Уравнение

mx + k x = 0 Е

как и остальные уравнения динамики пишутся, основываясь на некоем экс-

тремальном принципе, который имеет долгую историю. Назовем некоторых ученых, которые вложили свою лепту в формирование этого принципа. Это Мопертюи, Эйлер, Лагранж и Гамильтон. Некогда он назывался принципом наименьшего действия.При рассмотрении механической системы, имеющей координаты

(q1 , . . . , qn , q1 , . . . , qn )

рассматривается ее лагранжиан

L(q1 , . . . , qn , q1 , . . . , qn ),

являющийся разностью кине-

тической и потенциальной энергий

L = T -U

. Интеграл от лагранжиана называется действием. Законы,

описывающие движения механических систем, являются условиями стационарности функционала действия (некогда это называли принципом наименьшего действия). Эти условия стационарности состоят в системе

d - dt Lqi + Lqi = 0. Например, уравнение mx + k x = 0 является условием стационарности дагранЕ 2 x2 жиана L = m - k x . Сказанное дает возможность дать эскиз решения задачи Кеплера. 2 2 Сила F , притягивающая движущееся тело массы m (находящееся в точке плоскости, имеющей декартовы координаты (x(t), y (t)) и полярные координаты (r (t), (t))) к Солнцу, расположенному в начале координат, -2 равна по закону всемирного тяготения -k r (t). Кинетическая энергия T тела равна m (x2 (t) + y 2 (t)) = 2 md d m2 mk 2 2 2 2 2 ( dt (r (t) cos (t)) + ( dt (r (t) sin (t)) ) = 2 (r (t) + r (t) (t)), потенциальная U равна r (t) . Лагранжиан T - U m2 mk 2 не зависит от времени, следовательно, имеет место закон сохранения энергии 2 2 (r (t) + r (t) (t)) + r (t) = H . 2 Он не зависит также от и потому имеет место закон сохранения импульса mr (t)(t) = mL, который
уравнений: перепишем в виде второго кеплеровского закона площадей:

d L = 2. dt r
Закон сохранения энергии (с учетом закона сохранения импульса) перепишем в виде

(i)
m 2

(r2 (t) + (

L mr 2 (t))

)+

mk r (t)

=

H

, что равносильно дифференциальному уравнению:

dr = dt
Соотношения

2 mk L2 H- - 2 2. m r mr

(ii)

(i)

и

(ii)

приводят к интегрируемому дифференциальному уравнению:

d = dr r

L
2 2 m

. -
L2 m2 r
2

(iii)

H-

mk r

(Дифференциальное уравнение (iii) можно проинтегрировать подстановкой Эйлера).

42


Производя интегрирование, получаем:

r=

p , 1 + e cos

p=

L2 , |k |

e=

2H L2 + 1, mk 2

L=

|k |p.

Получилось, что небесные тела под воздействием Солнца, движутся по кривым второго порядка. При этом, если

e < 1,

то движение проходит по эллипсу (этим доказан первый закон Кеплера). Соотношение

как было уже сказано, представляет собой второй закон Кеплера. Докажем третий закон. Интегрируя периоду, и используя то, что площадь эллипса с полуосями откуда, используя то, что

a и b равна ab, приходим к равенству: 222 3 a b2 = p, L2 = |k |p, получаем: T 2 = L2 b = |a | , что и требовалось. a k Кеплер задумал написать книгу об устройстве Вселенной, завершением которой должен был стать третий

(i), (i) по ab = LT ,

закон движения планет. Там есть такие слова:Я пишу эту книгу. Прочтется ли она моими современниками или потомством, мне нет до этого дела она подождет своего читателя. Разве Господь Бог не ждал шесть тысяч лет созерцателя своего творения?

Метод Фурье в задачах математической физики.
Колебание струны (Д. Бернулли и Эйлер) Пусть

u(t, x)

положение в момент

t

колеблющейся, закрепленной в концах отрезка

[0, 1]

струны, начальное положение которой в точке момент времени была равна

(x).

Функция

x было (x), (t, x) u(t, x)

а скорость в точке

x

в начальный

удовлетворяет уравнению струны

2u 2u = , t2 x2
краевым условиям

(i) u(0, x) = (x), ut (0, x) = =
X ( x) . X ( x)

u(t, 0) = u(t, 1) = 0 T (t)X (x).

и начальным условиям

(x).

Решим задачу методом рзделения переменных. Ищем решение уравнения струны в Тогда уравнение

виде произведения Значит, и

2u t2

=

T (t) 2u приводит к равенству x2 T (t)

T (t) X ( x) и равны константе, которую обозначим через . Краевые условия ведут T (t) X ( x) к равенствам X (0) = X (1) = 0. Таким образом, функция X (ћ) является решением задачи 2 Коши X = X , X (0) = X (1) = 0. Отсюда следует, что k = -k , и решениями задачи Коши
являются функции

ck sin k x, k N

. Остается применить теорему Гильберта, о которой я

G(x, ) = (1 - )x при O x и (1 - x) при 1 x функцию z (x) = 0 G(x, )y ( )d убеждаемся - 1/2 в том, что z (x) = y (x) и при этом z (0) = z (1) = 0. Система функций {2 sin k x}kN является полной ортонормированной системой в L2 ([0, 1]). Остается решить уравнения T (t) + n2 T (t) = 0 и тогда общее решение уравнения струны будет таково: u(t, x) = kN (ck sin nt + dk cos nt) sin k x, где ck и dk определяются однозначно из начальных данных.
рассказывал на предыдущей школе. Положим Дважды продифференцировав по

x 1.

(x+t)+(x-t) 2u формула: u(t, x) = x2 2 получена Даламбером и Эйлером и получила название формулы Даламбера.

(i) вывел , u(0, x) = (x), ut (0, x) = (x) задает
Уравнение колебаний струны

Даламбер в 1747 году. Решение задачи на всей прямой

+

1 2

x+t x-t

2u t2

=

( )d

, которая была

Подобную формулу можно записать и для смешаной задачи, решение которой было описано выше. Возник известный спор между Эйлером и Д. Бернулли по поводу того, чье решение является более общим. Нельзя сказать, что этот спор поныне окончательно решен.

43


Стационарное состояние мембраны (Лаплас). Лаплас был одним из крупнейших ученых 18 века. Он подробно исследовал уравнение

u = 0,

получившее его имя, которое лежит в основании теории потенциала, теплопровод-

ности, электростатики и гидродинамики. Проинтегригуем уравнение Лапласа в круге. Пусть на окружности единичного радиуса задана непрерывная функция

f (), 0 2

. Требуется решить задачу Дирихле, т.

е. найти решение уравнения Лапласа

u(x1 , x2 ) =

принимающее на границе круга в полярных коорди2u 1 u 1 натах имеет вид: + + 2 2 Решим задачу снова методом разделения переменных. Как и в случае колебаний струны,

2 u(x1 , x2 ) 2 u(x1 , x2 ) + = 0, x2 x2 1 2 значения, равные f . Уравнение Лапласа 2u = 0. 2

(i)

R()(). В результате уже дважды примененной процедуры, приходим к уравнениям + = 0 с периодическими условиями 2 2 и к уравнению R + R - R = 0. Получаем k = k и полную систему {cos k ћ, sin k ћ}k0 . 2 2 k Уравнение R + R - k R = 0 имеет решение , и тогда общее решение уравнения Лаa k пласа будет таково: u(t, x) = 0 + kN (ak sin k + bk cos k , где ak и bk определяются как 2 коэффициенты Фурье функции f .
ищем решение уравнения Лапласа в виде произведения
Распространение тепла (Фурье)
Фурье выдающийся математик и математический физик. Он вывел уравнение теплопроводности и проинтегрировал его при различных граничных условиях методом разделения переменных. и Пусть u(t, x) температура в момент t металлической нити, концы которой, расположенные в 1, содержатся при температуре в ноль градусов, а начальная температура в точке x равна (x). (t, x) u(t, x) удовлетворяет уравнению теплопроводности точках

0

Функция

u 2u = , t x2
краевым условиям

(i) u(0, x) = (x).
Решим задачу опять-таки мето-

u(t, 0) = u(t, 1) = 0 T (t)X (x). X (ћ)

и начальному условию

дом разделения переменных. Как и в случае колебаний струны, ищем решение уравнения теплопроводности в виде произведения и Тогда уравнение

u t

=

T (t) 2u x2 приводит к равенству T (t)

=

X (x) T (t) X (x) . Значит, и T (t)

X (x) X (x) равны константе, которую обозначим через

. Краевые условия ведут к равенствам

X (0) = X (1) = 0

.

X = X, X (0) = X (1) = 0. Отсюда следует, ck sin k x, k N. Применить теорему Гильберта -1/2 (как это было проделано в предыдущем пункте)приводит к тому, что система функций {2 sin k x}kN 2 является полной ортонормированной системой в L2 ([0, 1]. Остается решить уравнения T (t) + n T (t) = 0 и -n2 t тогда общее решение уравнения струны будет таково: u(t, x) = sin k x, где ak определяются kN ak e
Таким образом, функция что является решением задачи Коши

k = -k

2

, и решениями задачи Коши являются функции

однозначно из начальных данных. Как-то возник спор между Фурье и Якоби. Фурье написал, что цель математики в объяснении природы. Якоби же дал отповедь Фурье, сказав, что философам подобного ранга неплохо бы знать, что цель математики в прославлении человеческого разума. Каждый из вас может иметь собственное мнение на этот счет. Мне ближе воззрение Фурье.

Числа. Совокупность натуральных чисел

{1, 2, 3 . . .}
44

обозначается

N

, множество вещественных чисел


через дробь

R

. Вещественные числа можно определять конструктивно, как совокупность всевозможных десятичных это последовательность чисел вида:

дробей, не оканчивающихся на одни девятки, и аксиоматически, как полное упорядоченное поле. Десятичная

x

числа от нуля до девяти. Не допускается, чтобы все дробь называется конечной, если, начиная частью дроби, остальная часть называется и

m1 m2 ћ ћ ћ mN .n1 n2 ћ ћ ћ , где mi , 1 i N и ni , i N целые ni , начиная с некоторого номера, были бы все девятки; с некоторого номера, все ni нули; m1 m2 ћ ћ ћ mN называется целой дробной. Естественно определяется сравнение дробей (когда x = y R
) в поле (т. е. множество,

x
); с помощью действий над конечными дробями и понятия предела определяются сложение, вычитание,

умножение и деление десятичных дробей, что превращает их совокупность (т. е.

в котором определены операции сложения, умножения и деления с привычными аксиомами). Вещественные числа обладают свойствами a) полноты; согласно ему фундаментальная последовательность такая последовательность

{xn }nN (т. е. nN , что > 0N N : |xn+k - xn | < n N , k N) имеет предел; b) существования верхней (нижней) граней для ограниченного сверху (снизу) числового множества (для {xn }
верхней грани это означает, что если

a
для любого числа

a

из числового множества

A,

то

R :

a a A & > 0 a() : a() > -

и c) убывающей последовательности отрезков с длинами, стремящимися

к нулю иметь единственную общую точку. Таким образом, описанная нами совокупность десятичных дробей это модель аксиоматически заданного объекта полного упорядоченного поля.

45