Вы находитесь на странице: 1из 197

Шамин Роман Вячеславович

Функциональный анализ
от нуля до единицы

Москва
2015
Моему сыну Михаилу

2
Оглавление

Введение 6

I Пространства 10
Глава I. Элементы теории множеств 11
1. Что такое множество? . . . . . . . . . . . . . . . . . . . 11
2. Про аксиому выбора и другие проблемы . . . . . . . . 13
3. Мощность множеств . . . . . . . . . . . . . . . . . . . . 18
4. Отображения множеств . . . . . . . . . . . . . . . . . . 20

Глава II. Метрические пространства 23


5. Определение метрического пространства, примеры . . 23
6. Открытые и замкнутые множества метрического про-
странства . . . . . . . . . . . . . . . . . . . . . . . . . . 29
7. Сходимость в метрическом пространстве . . . . . . . . 33
8. Полные метрические пространства . . . . . . . . . . . 36
9. Принцип сжимающих отображений . . . . . . . . . . . 43
10. О применении метрических пространств в теории ин-
формации . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Глава III. Нормированные и банаховы пространства 51


11. Линейные пространства . . . . . . . . . . . . . . . . . . 51
12. Нормированные и банаховы пространства . . . . . . . 55
13. Функции со значениями в банаховом пространстве . . 58
14. О линейных операторах в банаховых пространствах . 60

Глава IV. Интеграл Лебега и пространства Lp 64


15. Интеграл Лебега . . . . . . . . . . . . . . . . . . . . . . 64

3
16. Мера множества и интеграл Лебега по мере . . . . . . 68
17. Пространства Лебега . . . . . . . . . . . . . . . . . . . 81

Глава V. Гильбертовы пространства 86


18. Скалярное произведение . . . . . . . . . . . . . . . . . 86
19. Примеры гильбертовых пространств . . . . . . . . . . 89
20. Геометрия гильбертова пространства . . . . . . . . . . 94
21. Ряды Фурье в гильбертовом пространстве . . . . . . . 99

Глава VI. Топологические пространства 109


22. Топология открытых множеств . . . . . . . . . . . . . 109
23. Базы и пределы . . . . . . . . . . . . . . . . . . . . . . 112
24. Компактность . . . . . . . . . . . . . . . . . . . . . . . 114
25. Линейные топологические пространства . . . . . . . . 122

II Линейные операторы 124


Глава VII. Три принципа линейных операций 125
26. Принцип равномерной ограниченности . . . . . . . . . 125
27. Принцип открытости отображения . . . . . . . . . . . 129
28. Теорема Хана-Банаха . . . . . . . . . . . . . . . . . . . 133

Глава VIII. Линейные функционалы 140


29. Сопряженные пространства . . . . . . . . . . . . . . . 140
30. Теорема Рисса . . . . . . . . . . . . . . . . . . . . . . . 145
31. Сопряженные операторы . . . . . . . . . . . . . . . . . 147
32. Обобщенные функции . . . . . . . . . . . . . . . . . . . 149

Глава IX. Неограниченные линейные операторы 154


33. Замкнутые операторы . . . . . . . . . . . . . . . . . . . 154
34. Самосопряженные операторы . . . . . . . . . . . . . . 157
35. Резольвента и спектр . . . . . . . . . . . . . . . . . . . 163
36. О спектральном разложении самосопряженных опера-
торов . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

Глава X. Компактные операторы 172


37. Свойства компактных операторов . . . . . . . . . . . . 172
38. Собственные значения компактного оператора . . . . . 175

4
39. Доказательство теоремы Гильберта-Шмидта . . . . . . 178

Глава XI. Операторные уравнения 182


40. Линейные уравнения . . . . . . . . . . . . . . . . . . . 182
41. Альтернатива Фредгольма . . . . . . . . . . . . . . . . 187
42. Проекционный метод . . . . . . . . . . . . . . . . . . . 190

Литература 196

5
Введение

Так получилось, что функциональный анализ стал языком совре-


менной математики почти во всех ее областях. Не очень просто дать
определение функционального анализа, поскольку в него могут вклю-
чаться самые различные разделы математики. Мы будем относиться
к функциональному анализу именно как к современному языку, по-
этому будем стараться затрагивать различные темы, где этот язык
оказывается эффективным.
Обычно функциональный анализ рассматривают как обобщение
математического анализа, но это не совсем так. С помощью функ-
ционального анализа, конечно, многие теоремы анализа могут быть
сформулированы с значительно общем виде, но смысл функциональ-
ного анализа в другом. Функциональный анализ позволяет формули-
ровать новые математические проблемы, возникающие при рассмот-
рении бесконечномерных пространств, линейных операторов и т.д.
Эти проблемы являются весьма специфичными и имеют самостоя-
тельный интерес.
Однако наибольшую яркость функциональному анализу придают
его возможности для решения многих задач как в самой математи-
ке, так и в других науках. Кроме квантовой механики, являющей-
ся традиционной областью применения функционального анализа,
многие задачи управления и математического моделирования могут
быть успешно сформулированы с помощью понятий функциональ-
ного анализа. Кроме того, язык функционального анализа часто ис-
пользуется в задачах математической экономики.
Как правило, изучение функционального анализа представляет
собой серьезные сложности, поскольку в нем оперирует значительно
более абстрактными понятиями, чем в математическом анализе или
линейной алгебре. Кроме того, бесконечномерные построения требу-
ют отказываться от многих наглядных представлений. Речь идет не

6
только о геометрических представлений (нам сложно представить да-
же трехмерные объекты, не говоря уж о больших размерностях), а о
принципиальных отличий, например, в бесконечномерном простран-
стве ограниченная последовательность может не содержать никакой
сходящейся подпоследовательности и т.д.
С другой стороны абстрактные понятия можно понимать и изу-
чать с нуля. Поэтому наш курс называется «от нуля до единицы».
Данный учебник предназначен для желающих научится функцио-
нальному анализу с нуля, но при этом освоить основные понятия
функционального анализа, а также его приложения. Несколько важ-
ных слов об учебнике. Мы изначально предполагали создать ком-
пактный курс функционального анализа, включая в него только ос-
новные результаты, но при этом изложение должно быть полным и
замкнутым. В нашем тексте нет ссылок на другие учебники и моно-
графии — все необходимые результаты доказываются непосредствен-
но в курсе.
В последнее время среди студентов и некоторых преподавате-
лей становится популярным изучение и преподавание математики
и функционального анализа в частности «без доказательства». Мы
считаем этот подход в корне неверным и опасным. Дело в том, что
смысл математики как раз и состоит в том, что все построение ос-
новано на доказательствах. По большому счету понять теоремы —
это означает понять ее доказательство. Именно через доказатель-
ства (иногда технически сложные) достигается истинное изучение
математики. Кроме того, применение математики есть получение но-
вых утверждений, которые должны быть математически верными, то
есть доказанными. Поэтому учиться математике — это учиться соб-
ственным доказательствам. А этому можно научиться только изучая
другие доказательства. Поэтому в настоящем курсе все используемые
утверждения подробно доказываются.
Некоторые темы, излагаемые в нашем курсе, являются нетради-
ционными для учебников по функциональному анализу. Например,
мы подробно со всеми доказательствами рассматриваем линейные
принципы функционального анализа (принцип равномерной ограни-
ченности, принцип открытости отображения, теорема Хана-Банаха),
а также рассматриваем подробно неограниченные линейные опера-
торы.
Одной из задач курса является введение в современную професси-

7
ональную математику в области анализа, теории функций и особенно
в теорию дифференциальных уравнений в частных производных. Ко-
нечно, функциональный анализ имеет много истоков и приложений,
но, вероятно, современная теория дифференциальных уравнений в
частных производных на основе функциональных пространств явля-
ется самым ярким применением и демонстрацией функционального
анализа. Поэтому мы подробно излагаем основы линейных диффе-
ренциальных уравнений в частных производных в пространствах Со-
болева.
Курс состоит из трех разделов:
1. «Пространства»
2. «Линейные операторы»
3. «Дифференциальные уравнения в частных производных»
Первые два раздела представляют собой замкнутый курс функцио-
нального анализа, а последний раздел демонстрирует «в бою» функ-
циональный анализ.
Как мы уже отмечали, настоящий курс не предполагает никаких
специальных математических знаний, кроме элементарных сведений
из математического анализа и линейной алгебры, а также диффе-
ренциальных уравнений, поэтому мы рекомендуем его для начина-
ющих изучать бездонный функциональный анализ. В тоже время
мы излагаем довольно общие и интересные утверждения линейного
функционального анализа и его приложения в различных областях
математики и смежных наук.

Об авторе: Шамин Роман Вячеславович - доктор физико-мате-


матических наук, заведующий кафедрой «Математическое модели-
рование в космических системах» Российского университета дружбы
народов. Председатель Научного центра по изучению волн-убийц.
Окончил Московский авиационный институт, защитил кандидат-
скую диссертацию в Московском государственном университете им.
М.В. Ломоносова по специальности «Дифференциальные уравнения»,
работал доцентом в МАИ, старшим научным сотрудником Института
океанологии им. П.П. Ширшова РАН, где защитил докторскую дис-
сертацию по специальности «Океанология», посвященную волнам-
убийцам. Работал заместителем директора Института морской гео-

8
логии и геофизики ДВО РАН. Автор более 100 научных трудов,
включая несколько монографий и учебников. Область научных ин-
тересов включает математическое моделирование и численные мето-
ды, дифференциальные уравнения в частных производных, функци-
ональный анализ, а также проблемы вычислительной океанологии.

9
Часть I

Пространства

10
Глава I

Элементы теории множеств

1. Что такое множество?


Не всем математическим понятиям можно давать определения и не
всегда это нужно. Попытки обосновать все понятия математики так-
же невозможно, как создать (нерекурсивный и незацикленный) сло-
варь всех слов русского языка. Одним из самых основных понятий
математики (и не только) является понятие множества. Определить
множество без тавтологий нельзя, также как и понятие принадлеж-
ности к множеству. Но человек разумный обычно имеет априорное
представление об этих понятиях. И важно сделать некоторые пояс-
нения к этому понятию в самом начале.
Мы будем говорить о множестве, как об определенной совокупно-
сти объектов, которые будем называть элементами множества. Сразу
же нужно ввести понятие пустого множества. Множество, которое не
содержит ни одного элемента называется пустым множеством, кото-
рое обозначается через ∅. Традиционно множества будем обозначать
заглавными буквами: A, B, C, . . . , а элементы маленькими буквами:
a, b, c, . . . . Если элемент множества a принадлежит множеству A, то
будем писать
a ∈ A.
В противном случае пишем
a∈
/ A.
Мы будем говорит, что два множества A и B равны и писать
A = B,

11
если оба множества состоят из одинаковых элементов. В этом опре-
делении есть один (и не один) нюанс. Равны ли множества

A = {1, 2, 3, 4, 5}

и
B = {5, 4, 3, 2, 1, }?
Да, равны. Множества предполагаются неупорядоченными. А равны
ли множества
F1 = {Apple, P ear, Orange}
и
F1 = {Apple, Apple, P ear, Orange}?
Если в качестве элементов мы рассматриваем одни и те же яблоки,
то да — эти множества равны1 .
Мы будем говорить, что множество A есть подмножество мно-
жества B, если каждый элемент множества A является элементом
множества B. Будем использовать для этого стандартное обозначе-
ние
A ⊂ B.
Отношение подмножества является нестрогим, поэтому если A = B,
то A ⊂ B (и, соответственно, B ⊂ A). Если нужно рассматривать
именно строгое отношение подмножества, которое называется соб-
ственным подмножеством, то это будем каждый раз оговаривать спе-
циальною.
Будем рассматривать следующие основные операции над множе-
ствами. Во-первых, множества можно объединять. Пусть A и B два
множества, тогда их объединением, обозначаемым A ∪ B называется
множество, состоящее из всех элементов множества A и множества
B. Заметим, что, например,

{1, 2, 3, 4} ∪ {2, 3, 4, 5} = {1, 2, 3, 4, 5}.

Иногда вместо объединения множеств говорят о сумме множеств.


Во-вторых, операция пересечения множеств. Пусть A и B два множе-
ства, тогда их пересечением, обозначаемым A ∩ B называется множе-
ство, состоящее из элементов, являющихся одновременно элементами
1
Выходит два яблока равны одному яблоку.

12
множества A и множества B. Эта операция легко может приводить
к пустым множествам. Будем говорить, что множества A и B не пе-
ресекаются, если
A ∩ B = ∅.
Очевидно, что обе эти операции являются симметричными

A ∩ B = B ∩ A, A ∪ B = B ∪ A.

В-третьих, рассматривается операция (уже не симметричная) разно-


сти двух множеств, обозначаемой A \ B. При этом разность множе-
ства A и B определяется, как множество, содержащее те и только те
элементы множества A, которые не содержатся в B. Разумеется,

A \ A = ∅.

Симметричную разность двух множеств A и B определим следующей


формулой
A△B = (A \ B) ∪ (B \ A).
Симметричная разность множеств состоит из тех элементов, которые
не являются одновременно элементами обоих множеств.
Чтобы определить операцию дополнения множеств, нужно вве-
сти понятие универсального множества. Пусть в фиксированной си-
туации мы рассматриваем только множества, являющиеся подмно-
жеством одного множества U , которое называется универсальным
множеством. Тогда для множества A (A ⊂ U ) дополнением является
множество A, которое определяется по формуле

A = U \ A.

Иногда используют обозначение CA, для дополнения, но мы так де-


лать не будем. Еще раз подчеркнем, что дополнение имеет смысл
только при фиксации универсального множества.

2. Про аксиому выбора и другие проблемы


В связи с универсальным множеством возникает вопрос о «множе-
стве всех множеств». А существует ли множество всех множеств?
Этот вопрос связан с парадоксом Б. Рассела, возникшем в начале

13
XX века (в 1902 году). Поскольку этот вопрос очень важен, точнее,
очень важно найти для него удовлетворительный ответ, то рассмот-
рим его подробнее. Все начинается с того, что множества можно опре-
делять по схеме свертывания. Мы рассмотрим логическую функцию
на некотором множестве U , то есть функцию F (x), где x ∈ U , а сама
функция принимает лишь два значения — «true» или «false» (1 или
0). Тогда можно определить множество

A = {x|F (x)},

состоящее только из тех элементов x, для которых F (x) = true. Кста-


ти, такая функция в математической логике называется предикатом.
Рассмотрим примеры. Пусть U = R есть множество всех действи-
тельных чисел. Тогда можно определить ряд подмножеств

A = {x|x > 0},

B = {x| sin(x) = 0},


x
C = {x| = 0}.
x
Первое подмножество — это все положительные числа, второе — чис-
ла вида π · n, где n пробегает все целые числа, а последнее множество
есть пустое множество.
Это были примеры из «мирной жизни», но как известно в воен-
ное время значение синуса может доходить до двух2 ... Рассмотрим
в качестве универсального множества — множество всех множеств.
Определим тогда множество по формуле

W = {x|x ∈
/ x}.

Определенное выше множество состоит из множеств, которые не яв-


ляются своими собственными элементами. Подвох тут вот в чем. Са-
мо множество W будет принадлежать самому себе тогда и только
тогда когда оно не будет принадлежать самому себе, что является ло-
гическим противоречием. Для разрешения этого противоречия было
принято решение ограничить построение множеств по схеме сверты-
вания.
2
Забавный анекдот, но на самом деле это правда. Для комплексных аргумен-
тов функция синуса имеет существенно особую точку в бесконечности и согласно
теореме Сохоцкого принимает очень большие по модулю значения.

14
Будем говорить, что схема свертывания приводит образованию не
множеств, а классов. При этом класс может и не быть множеством.
Для предотвращения подобных патологий можно принять аксиому
выбора. Пусть M есть некоторое множество индексов α ∈ M и для
каждого индекса задано не пустое множество Aα , тогда согласно ак-
сиоме выбора существует такая функция на множестве индексов M ,
которая относит каждому индексу α элемент множества Fα . Эта ак-
сиома является эквивалентным утверждением для леммы Цорна и
теоремы Цермело.
Приведем формулировки этих утверждений. Для этого нужно
ввести понятие частичного порядка в множестве. Рассмотрим непу-
стое множество A. Если для некоторых3 пар элементов этого множе-
ства можно ввести отношение
a ≺ b,
для a, b ∈ A, которое удовлетворяет следующим условиям:
1. из a ≺ b и b ≺ c следует a ≺ c;
2. a ≺ a;
3. из a ≺ b и b ≺ a следует a = b.
Тогда это отношение называется частичным порядком в множестве
A. Подмножество B ⊂ A называется ограниченным сверху, если су-
ществует элемент b ∈ A такой, что
x≺b
для всех x ∈ B. При этом множество A называется частично упорядо-
ченным. Если частичный порядок существует для всех пар элементов
A, то частичный порядок называется просто порядком, а множество
A упорядоченным.
Примером упорядоченного множеств является множество действи-
тельных числа, а частично упорядоченного — множество комплекс-
ных чисел.
Элемент b называется верхней границей. Наименьшая из всех
верхних границ называется точной верхней границей. Элемент c ∈ A
называется максимальным, если в A не существует элемента d 6= c
такого, что c ≺ d.
3
Не обязательно для всех.

15
Лемма 2.1 (Лемма Цорна). Если в частично упорядоченном мно-
жестве A для любого упорядоченного подмножества B ⊂ A суще-
ствует верхняя граница, то в A существует максимальный эле-
мент.

Элемент c ∈ A называется минимальным, если в A не существует


элемента d 6= c такого, что d ≺ c. Упорядоченное множество называ-
ется вполне упорядоченным, если любое его непустое подмножество
имеет минимальный элемент.

Теорема 2.1 (Теорема Цермело). Всякое множество путем введе-


ния некоторого соотношения порядка можно сделать вполне упо-
рядоченным.

Поскольку аксиома выбора, лемма Цорна и теорема Цермело яв-


ляются эквивалентными утверждениями, то приняв все три этих
утверждения мы не допустим противоречия и избежим необходимо-
сти доказательства их эквивалентности.
Зачем это нужно? Нам в этом курсе ни разу не встретиться
аксиома выбора, но мы постоянно будем говорить о множествах. И
чтобы нам не приходилось опасаться парадоксов, мы будем защи-
щаться с помощью понятия класса и аксиомой выбора. Впрочем при
доказательстве фундаментальной теоремы Хана-Банаха о продолже-
нии линейного ограниченного оператора мы будем явно использовать
лемму Цорна.
Кроме аксиомы выбора нас подстерегают и другие «засады». На-
пример, пусть у нас есть две последовательности натуральных чисел:
an и bn , то есть для каждого номера n у нас есть два алгоритма, да-
ющих последовательно числа. Сформируем из этих последователь-
ностей два множества
A = {a1 , a2 , . . . }
и
B = {b1 , b2 , . . . }.
Вопрос: равны ли эти множества? Вообще говоря, не существует кон-
структивной процедуры, чтобы в решить этот вопрос. Множества
мы задали корректно и даже конструктивно, но вот ответить на про-
стейший вопрос нельзя.

16
Можно пойти еще дальше — можно сказать, что не все действи-
тельные числа существуют, если под существованием понимать кон-
структивное существование. Конструктивная математика, развитая,
в частности, в работах А.А. Маркова, признает только конструктив-
ные объекты. Действительное число a называется конструктивным,
если существует такой алгоритм, который каждому номеру n соот-
носит рациональное число qn такое, что
1
|a − qn | ≤ .
n
Таким образом, конструктивное действительное число — это такое
число, для которого существует конструктивная рациональная ап-
проксимация с заданной погрешностью.
Возникают два вопроса. Первый — а существуют ли неконструк-
тивные действительные числа? Действительно, все приходящие на ум
иррациональные
√ числа (рациональные, очевидно, конструктивные):
π, e, 2, sin(1) являются конструктивными. Ответ — неконструк-
тивные действительные числа существуют и их значительно больше,
чем конструктивных! Любое случайное действительное число с веро-
ятностью единица будет неконструктивным. Почему? Очень просто
— количество конструктивных чисел не больше чем множество всех
возможных алгоритмов, но множество алгоритмов (согласно тези-
су Черча-Тьюринга) счетно, а множество действительных чисел —
несчетно.
Второй вопрос, который возникает, такой — если неконструктив-
ных чисел так много, то можно ли привести пример? Но если бы
можно было на бумаге написать такое число, то оно было бы кон-
структивным.
На основе конструктивных действительных чисел можно постро-
ит математический анализ и даже функциональный анализ, но рабо-
тать с такими числами сложно, поскольку конструктивные действи-
тельные числа являются «капризными». Например, задача о сравне-
нии двух конструктивных чисел является алгоритмически неразре-
шимой.
Зачем это нужно? Мы не будем впредь заморачиваться на счет
конструктивности тех или иных объектов и операций. Но это нужно
учитывать, при некоторых приложениях, а также просто понимать,
что математика, которой мы занимаемся, вообще говоря, неконструк-

17
тивна. Отметим лишь, что само понятие конструктивности опирает-
ся на понятие алгоритма, формализованного эвристическим тезисом
Черча-Тьюринга.

3. Мощность множеств
Давайте зафиксируем в течение всей книги обозначения для некото-
рых множеств, с которыми мы будем постоянно иметь дело.
Во-первых, это множество натуральных чисел

N = {0, 1, 2, . . . }.

Мы будем считать, что ноль является натуральным числом. В этом


вопросе много споров и каждый по своему прав. Я выбрал этот ва-
риант только для того, что если потребуется ряд из положительных
целых чисел, то эстетичнее исключить ноль, чем его добавлять в
противном случае.
Во-вторых, множество целых чисел

Z = {. . . , −2, −1, 0, 1, 2, . . . }.

В-третьих, множество рациональных чисел, обозначаемое Q, за-


метим, что для определения этого множества мы воспользовались
схемой свертки. В-четвертых, самое главное множество — это множе-
ство действительных чисел R. И, наконец, множество комплексных
чисел — C.
В следующей главе мы будем встречаться с большим количеством
пространств, которые являются множествами, и имеют устоявшиеся
обозначения, но о них мы пока говорить не будем.
Рассмотренные выше множества являются множествами чисел. А
что такое число? По идее число выражает некоторую количествен-
ную характеристику, необходимую для счета. В этом смысле только
комплексные числа выбиваются из ряда. Их появление обусловлено
операцией извлечения квадратного корня. Есть и дальнейшие обоб-
щения чисел — кватернионы и др. Однако для нас важным будет
определение чисел как алгебраическое поле. В общей алгебре полем
называется множество M , которая является коммутативной группой
относительно операции сложения + с нулевым элементом 0, а также
коммутативную группу с операцией умножения ∗ над ненулевыми

18
элементами множества M . При этом эти операции должны удовле-
творять свойствам дистрибутивности умножения относительно сло-
жения.
Множества Q, R и C являются полями с обычными операциями
сложения и умножения. Часто употребляются устойчивые выраже-
ния «поле комплексных числе», «над полем действительных чисел».
Теперь мы рассмотрим принципиальное понятие в теории мно-
жеств — понятие мощности множества. В быту, встречаясь с мно-
жествами — множество гостей, множество подчиненных, множество
комнат в квартире, множество конфет в вазе и т.д., нас прежде все-
го интересует количество элементов в данном множестве. Если для
одних множеств мы можем мыслить (помнить и различать) все эле-
менты как, например, множество комнат в своей квартире или мно-
жество своих детей, то для других множеств, наоборот, важно лишь
количество, например, количество баранов в стаде, множество па-
тронов в магазине и т.д. Для конечных множеств понятие мощности
совпадает с количеством элементов.
С конечными множествами более менее все понятно, обратимся к
бесконечным множествам, которые играют основную роль в анализе
(как математическом, так и функциональном).
Кстати, вообще говоря, не всегда можно ответить на вопрос о ко-
нечности множества. Например, рассмотрим множество B состоящее
из четных чисел, которые не могут быть представлены в виде суммы
двух простых чисел. Конечно ли это множество?4
Можно несколькими способами дать определение бесконечного
множества. Определение «множество, содержащее бесконечное мно-
жество элементов» не годится, потому что тогда нужно давать опре-
деление «бесконечности», что, как раз, определяется через бесконеч-
ные множества. Определение — бесконечное множество это множе-
ство не являющееся конечным, корректно, но не конструктивно и, не
раскрывает сути.
Мы сделаем следующим образом. По определению множество на-
туральных чисел N является бесконечным. Тогда множество A на-
зывается бесконечным, если существует такое подмножество B ⊂ A,
4
Согласно гипотезе Гольдбаха (проблеме Гольдбаха) множество B состоит
только из числа 2, но на сегодняшний день (июнь 2015 г.) эта гипотеза не до-
казана и не опровергнута, поэтому, может быть, есть и еще элементы у этого
множества, и их может быть бесконечное число.

19
что между элементами множества N и B существует взаимно одно-
значное соответствие. Можно дать еще одно эквивалентное опреде-
ление. Множество называется бесконечным, если у него существует
собственное подмножество (то есть не совпадающее с самим множе-
ством) для элементов которых можно установить взаимно однознач-
ное соответствие. Проверим, что множество N в этом определении
является бесконечным. Действительно, рассмотрим собственное под-
множество N1 = N \ {0}, тогда для любому элементу a ∈ N1 соот-
ветствует единственный элемент b = a − 1, который принадлежит
множеству N.
И так, мощность конечного множества есть количество элементов
этого множества. Множества, которые допускают взаимно однознач-
ное соответствие имеют одинаковую мощность. Мощность множества
N обозначается ℵ0 . Множества имеющие мощность ℵ0 называются
счетными. Используют различные обозначения для мощности мно-
жества: |A|, #A и др.
Мощность множества не является числом, однако для этих вели-
чин можно ввести порядок, то есть для любых двух мощностей a и b
верно одно из трех a < b, a = b, a > b. Не являясь числами, мощности
множеств являются трансфинитами или кардинальными числами.
Мощность ℵ0 является наименьшей мощностью бесконечных мно-
жеств. Хорошо известно, что |N| = |Z| = |Q|. Бесконечным множе-
ством, имеющим большую мощность, является множество R. Мощ-
ность этого множества называется мощностью континуума и обозна-
чается c. Хорошо известно, что ℵ0 < c. Возникает вопрос о существо-
вании множества, имеющего мощность a такую, что

ℵ0 < a < c.

Континуум-гипотеза сформулированная Г. Кантором в 1877 году утвер-


ждает, что таких множеств не существует. В 1940 году К. Гедель до-
казал, что отрицание континуум-гипотезы является недоказуемым
при аксиоме выбора.

4. Отображения множеств
Еще одно понятие, которое понимается интуитивно, относится к отоб-
ражением множеств. Пусть задано два множества X и Y . Мы будем

20
говорить, что A есть отображение из X в Y , если задано правило,
которое каждому элементу x ∈ X ставит в однозначное соответствие
элемент y ∈ Y . При этом пишут

A : X → Y.

Мы будем говорить всегда об однозначных отображениях, в случа-


ях, когда необходимо рассматривать многозначные отображения, мы
будем говорить об однозначных отображениях в подмножества.
Вместо термина «отображение» будем также использовать и дру-
гие синонимы, например, функция. Если множества X и Y представ-
ляют собой пространства, то часто будем говорить об операторе, если
множество Y представляет собой множество чисел (действительных
или комплексных), то будем говорить и функционале.
Иногда отображение будет определено на на всем X, а лишь на
некотором подмножестве X1 ⊂ X, это подмножество называется об-
ластью определения отображения A и обозначается D(A). С другой
стороны подмножество Y1 ⊂ Y состоящее из y ∈ Y , таких, что суще-
ствует x ∈ D(A), y = A[x], называется областью значения отображе-
ния Y .
Для любого x ∈ D(A) элемент y = A[x] называется образом x. А
для фиксированного y ∈ Y множество таких x ∈ D(A), что A[x] = y
называется прообразом y. Понятия образа и прообраза легко обоб-
щаются на понятия образа и прообраза для множеств.
Если область значения отображения есть все Y , то такое отобра-
жение называется сюръективным. Если для двух различных x1 , x2 ∈
X их образы различны, то такое отображение называется инъектив-
ным. Отображение одновременно сюръективное и инъективное на-
зывается биективным. Биективное отображение или биекция — это
взаимнооднозначное отображение.
Введем понятие прямого произведения двух множеств X и B.
Прямым произведением, обозначаемым X × Y называется множе-
ство, состоящее из всех упорядоченных пар (x, y), где x ∈ X, а y ∈ Y .
Например, прямое произведение R × R есть множество точек, обо-
значаемое R2 . Аналогично, можно ввести понятие и прямого произ-
ведения n множеств.
Рассмотрим некоторое непустое множество X. Для некоторых
упорядоченных пар из этого множества мы введем понятия отно-

21
шения. Будем говорит, что x1 находится в отношении ϕ с x2 и писать

x1 ϕx2 .

Отношения могут иметь различные свойства:

1. Отношение называется рефлексивным, если xϕx для всех x ∈


X.

2. Отношение называется симметричным, если из x1 ϕx2 следует,


что x2 ϕx1 .

3. Транзитивным отношение называется, если из x1 ϕx2 и x2 ϕx3


следует, что x1 ϕx3 .

Отношение, обладающее всеми тремя свойствами — рефлексивно-


стью, симметричностью и транзитивностью, называется отношением
эквивалентности. Если на множестве X задано отношение эквива-
лентности, то это множество можно разбить на классы эквивалент-
ности. Будем говорить, что подмножество K ⊂ X есть класс эквива-
лентности для отношения эквивалентности ϕ если для всех x1 , x2 ∈ K
имеет место x1 ϕx2 и в X \ K не существует элементов, состоящих в
отношении с элементами из K. Для любого элемента x ∈ X класс
эквивалентности определяется следующим образом

Kx = {x′ ∈ X : x1 ϕx′ }.

Для любых x и y, которые не состоят в отношении эквивалентности,


соответствующие классы эквивалентности не пересекаются. Поэтому
все множество X можно разбить на классы эквивалентности
[
X= Kα .
α

При этом можно каждый класс эквивалентности отождествить с неко-


торым новым элементов и рассматривать исходное множество, как
множество классов эквивалентности.

22
Глава II

Метрические пространства

5. Определение метрического пространства,


примеры
Пространством мы будем называть множества, элементы которых
объединены каким-либо свойством. Первым важным пространством,
которое мы будем рассматривать является метрическое простран-
ство. Непустое множество X называется метрическим пространством,
если для любых элементов x, y ∈ X определена числовая функ-
ция ̺(x, y), называемая метрикой, которая удовлетворяет следую-
щим условиям:
1. ϕ(x, y) ≥ 0, причем ̺(x, y) = 0 тогда и только тогда, когда
x = y.

2. ̺(x, y) = ̺(y, x).

3. ̺(x, z) ≤ ̺(x, y) + ̺(y, z), для любых x, y, z ∈ X.


Метрика является абстрактным понятием расстояния между двумя
элементами1 . Покажем, что все эти условия, которые еще называются
аксиомами метрики, характеризуют свойства обычного расстояния.
Во-первых, расстояние всегда неотрицательное, при этом нулевое
расстояние возможно только для совпадающих точек. Поэтому для
метрики есть первое условие.
1
Всякие аллюзии относительно релятивистских эффектов мы рассматривать
не будем.

23
Во-вторых, расстояние от первого объекта до второго равно рас-
стоянию от второго до первого. Для этого у нас есть второе условие
для метрики.
В-третьих, дойти из пункта A в пункт B не может быть дольше
чем дойти из A сначала в пункт C, а потом в пункт B. Это свойство
расстояние учитывается в третьем условии. Это условие называется
неравенство треугольника.
Заметим, что любое непустое множество всегда можно сделать
метрическим пространством. Действительно, для множества A опре-
делим метрику следующим образом

0, x = y
̺(x, y) =
1, x 6= y

Для одного и того же множества можно ввести много различных


метрик. Кстати, если ̺ какая-либо метрика, то также будет метри-
кой и ̺′ = a̺, где a > 0. Таким образом, метрику всегда можно
масштабировать.
Рассмотрим разнообразные примеры метрических пространств.
Сразу же заметим, что множества N, Z, Q, C являются метрическими
пространствами с метрикой

̺(x, y) = |x − y|.

Для пространства Rn рассмотрим три метрики:


p
̺2 (x, y) = (x1 − y1 )2 + (x2 − y3 )2 + · · · + (xn − yn )2 ,

̺1 (x, y) = |x1 − y1 | + |x2 − y3 | + · · · + |xn − yn |


и
̺0 (x, y) = max |xi − yi |,
1≤i≤n

здесь мы используем обозначения x = (x1 , x2 , . . . , xn ), y = (x1 , x2 , . . . , xn ).


Все эти метрики законны. Первое и второе условия метрики оче-
видны. Покажем, что выполняется неравенство треугольника.
Рассмотрим неравенство треугольника для второй и третьей мет-
рик. Для этого зафиксируем три произвольные точки x, y, z ∈ Rn .
Сначала рассмотрим метрику ̺1

̺1 (x, z) = |x1 −z1 |+· · ·+|xn −zn | = |x1 −y1 +y1 −z1 |+· · ·+|xn −yn +yn −zn | ≤

24
|x1 − y1 | + |y1 − z1 | + · · · + |xn − yn | + |yn − zn | = ̺1 (x, y) + ̺1 (x, y).
Похожим образом рассмотрим метрику ̺0

̺0 (x, z) = max |xi − zi | = |xi∗ − zi∗ | = |xi∗ − yi∗ + yi∗ − zi∗ | ≤


1≤i≤n

|xi∗ − yi∗ | + |yi∗ − zi∗ | ≤ max |xi − yi | + max |yi − zi | = ̺0 (x, y) + ̺0 (y, z).
1≤i≤n 1≤i≤n

Для первой метрики проверка неравенства треугольника следует


из неравенства Коши-Буняковского, играющего выдающуюся роль в
анализе (функциональном и математическом)
n
!2 n n
X X X
2
ak bk ≤ ak · b2k , (II.1)
k=1 k=1 k=1

верного для любых a, b ∈ Rn . Это неравенство следует из следующего


равенства
n
!2 n n n n
X X
2
X
2 1 XX
ak bk = ak · bk − (am bl − bm al )2 ,
k=1 k=1 k=1
2 m=1 l=1

которое проверяется непосредственно.


Возвращаясь к неравенству треугольника, сделаем замены y−x =
a, z − y = b, тогда z − x = a + b. В этих обозначениях неравенство
треугольника записывается следующим образом
v v v
u n u n u n
uX uX uX
t (ak + bk )2 ≤ t a2k + t b2k . (II.2)
k=1 k=1 k=1

Докажем это неравенство. С учетом неравенства Коши-Буняковского


имеем n n n n
X X X X
2 2 2
(ak + bk ) = ak + bk + 2 ak bk ≤
k=1 k=1 k=1 k=1
v v v 2
n
X n
X
u n n u n u n
uX X uX uX
a2k + b2k + 2t a2k · b2k = t a2k + t b2k  .
k=1 k=1 k=1 k=1 k=1 k=1

Извлекая квадратный корень из последнего неравенства, получаем


(II.2).

25
Таким образом, мы рассмотрели три различных метрики. Но пер-
вая метрика, называемая евклидовой метрикой имеет одно важное
преимущество. В случае n = 2, 3 значения этой метрики совпадают с
расстоянием, которое можно измерить линейкой2 . Если выбрать две
точки на листе бумаги, выразить их координатами в прямоугольной
системе и вычислить между ними метрику ̺2 , а потом приложить
линейку, то расстояние по прямой будет в точности равно этой мет-
рики. Никакая другая метрика не обладает этим свойством.
Рассмотренное пространство Rn является конечномерным, и, по
сути, изучается в курсах математического анализа и линейной ал-
гебры. Настоящее призвание функционального анализа — это бес-
конечномерные пространства. Самыми важными бесконечно мерны-
ми пространствами являются пространства последовательностей и
функций.
Начнем с пространства функций, непрерывных на отрезке [a, b].
Это множество мы будем обозначать через C[a, b]. Метрику в этом
пространстве мы введем следующим образом

̺(f, g) = max |f (x) − g(x)|.


a≤x≤b

Заметим, что по теореме Вейерштрасса непрерывная функция, за-


данная на замкнутом отрезке, принимает на этом отрезке свое мини-
мальное и максимальное значения, поэтому для любых функций из
C[a, b] максимум в метрике ̺ достигается. Как обычно, первые два
условия метрики очевидны. Неравенство треугольника доказывается
просто. Пусть f, g, h ∈ C[a, b] тогда имеем

max |f (x) − h(x)| = max |f (x) − g(x) + g(x) − h(x)|


a≤x≤b a≤x≤b

≤ max (|f (x) − g(x)| + |g(x) − h(x)|).


a≤x≤b

Поскольку максимум суммы не больше суммы максимумов, то про-


должая, получаем

max (|f (x)−g(x)|+|g(x)−h(x)|) ≤ max |f (x)−g(x)|+ max |g(x)−h(x)|.


a≤x≤b a≤x≤b a≤x≤b

2
Еще раз отметим, что пока мы рассматриваем наше пространство в «нор-
мальном» состоянии без учета общей теории относительности и возможных ис-
кажениях пространства.

26
Эта метрика называется равномерной метрикой. Можно ввести и
другие метрики. Например
Zb
̺1 (f, g) = |f (x) − g(x)|dx,
a

где интеграл понимается в смысле Римана, который всегда суще-


ствует для непрерывных функций на конечном отрезке. Свойства
метрики проверяются не сложно. Для первого свойства нужно вспом-
нить (почти очевидное3 ) свойство определенного интеграла, что если
интеграл от неотрицательной непрерывной функции равен нулю, то
подынтегральная функция тождественно равна нулю. Третье усло-
вие метрики проверяется просто
Zb Zb
|f (x) − h(x)|dx ≤ |f (x) − g(x) + g(x) − h(x)|dx ≤
a a

Zb Zb
|f (x) − g(x)| + |g(x) − h(x)|dx.
a a

Скоро мы увидим, что метрика ̺1 не является естественной для про-


странства C[a, b].
Рассмотрим множество функций, заданных на отрезке [a, b] и име-
ющих k ≥ 1 непрерывных производных на отрезке [a, b]. Это множе-
ство обозначим через C k [a, b]. Поскольку имеет место вложение

C k [a, b] ⊂ C[a, b],

то на этом множестве можно ввести метрики и из пространства C[a, b].


Интереснее тем не менее рассмотреть более характерную метрику
k
X
̺(f, g) = max |f (x) − g(x)| + max |f (l) (x) − g (l) (x)|.
a≤x≤b a≤x≤b
m=1

Все свойства метрики устанавливаются аналогично свойствам рав-


номерной метрики.
3
Очевидно, что можно доказать.

27
Давайте, вычислим значения метрики на примерах. Рассмотрим
пространство C[0, 1] вычислим расстояние между функциями f (x) =
x и g(x) = x2
̺(x, x2 ) = max |x − x2 |.
0≤x≤1

Чтобы найти этот максимум продифференцируем функцию h(x) =


x − x2 . Получаем, что максимум этой функции достигается при x =
1/2. Таким образом,
1 1 1
̺(x, x2 ) = max |x − x2 | = − = .
0≤x≤1 2 4 4
Теперь вычислим расстояние этих же функций в метрике ̺1
Z1  1
2 1 1 1 1 1
̺1 (x, x ) = |x − x |dx = x2 − x3
2
= − = .
2 3 0 2 3 6
0

А теперь рассмотрим метрику этих функций в пространстве C 1 [0, 1]


1
̺(x, x2 ) = max |x − x2 | + max |1 − 2x| = + 1 = 1.25.
0≤x≤1 0≤x≤1 4
Обратимся теперь к пространствам последовательностей. Рассмот-
рим множество всех ограниченных числовых последовательностей
(вещественных или комплексных), которое обозначим через m. Это
множество сделаем пространством, введя метрику следующим обра-
зом
̺(x, y) = sup |xk − yk |.
k
То, что это настоящая метрика легко проверить методами, аналогич-
ными для рассмотренными выше.
Почему в этой метрике мы используем sup, а не max? Потому что
количество членов последовательности бесконечно и ограниченная
последовательность может и не достигать своего максимума.
В функциональном анализе большую роль играют пространства
последовательностей, сходящихся к нулю, для которых имеет место
определенная скорость стремления к нулю. Рассмотрим простран-
ство функций, сходящихся к нулю таких, что сходится ряд

X
|xk | < ∞.
k=1

28
Это пространство, обозначаемое l1 , является метрическим с метрикой

X
̺(x, y) = |xk − yk |.
k=1

Все аксиомы метрики проверяются без проблем.


Еще большее значение играет пространство последовательностей
таких, что сходится ряд из квадрата модуля4 ее членов. Обозначается
это пространство l2 . Метрика вводится следующим образом


!1/2
X
̺(x, y) = |xk − yk |2 .
k=1

Остановимся на доказательстве неравенства треугольника для этой


метрики. Для фиксированного N > 1 мы имеем неравенство

N
!1/2 N
!1/2 N
!1/2
X X X
|xk − zk |2 ≤ |xk − yk |2 + |yk − zk |2 ,
k=1 k=1 k=1

которое следует из свойства евклидовой метрики в пространстве RN .


Переходя к пределу в последнем неравенстве получаем


!1/2 ∞
!1/2 ∞
!1/2
X X X
|xk − zk |2 ≤ |xk − yk |2 + |yk − zk |2 .
k=1 k=1 k=1

В дальнейшем мы будем рассматривать и другие функциональ-


ные пространства и пространства последовательностей.

6. Открытые и замкнутые множества


метрического пространства
В метрическом пространстве можно ввести понятие шара, которое
отрывает новые горизонты в метрических пространствах. Рассмот-
рим какое-либо метрическое пространство, которое будем обозначать
4
Если не оговорено противное, мы считаем последовательности и функции
комплекснозначными.

29
через X. Для любого элемента x0 ∈ X открытым шаром (или просто
шаром) с радиусом R > 0 в центре в x0 назовем множество
BR (x0 ) = {x ∈ X : ̺(x0 , x) < R}.
Сразу же дадим определения замкнутого шара с этим же радиусом
и тем же центром
BR (x0 ) = {x ∈ X : ̺(x0 , x) ≤ R}.
Понятие шара дает возможность для определения открытого мно-
жества в метрическом пространстве, которое имеет принципиаль-
ное значение в функциональном анализе. Множество A ⊂ X назы-
вается открытым, если для любой точки x ∈ A существует такое
r = r(x) > 0, что шар с радиусом r в центре x полностью принадле-
жит множеству A
Br (x) ⊂ A.
Также по определению будем считать открытым множеством и пу-
стое множество ∅.
Вместо шара можно использовать понятие окрестности точки.
Окрестность точки x называется любое открытое множество, содер-
жащее эту точку.
Покажем, что это определение обобщает понятие открытого мно-
жества в Rn . В качестве метрического пространства будем рассмат-
ривать R. Тогда интервал (открытый) (0, 1) является открытым мно-
жеством в данном выше определении. Действительно, рассмотрим
любую точку x ∈ (0, 1), тогда шар с радиусом
 
x 1−x
r < min , 1
2 2
в центре точке x представляет собой интервал
Br (x) = (x − r, x + r).
По выбранному радиусу имеет место
(x − r, x + r) ⊂ (0, 1).
При этом множество [0, 1] в этом же метрическом пространстве уже
не будет отрытым. Для доказательства выберем в качестве x = 0, то-
гда любой шар будет представлять собой множество (−r, r), которое

30
при любом r > 0 будет содержать отрицательные числа, которые не
входят в множество [0, 1].
Докажем простые, но важные теоремы.
Теорема 6.1. Любое объединение открытых множеств является
открытым множеством.
Доказательство. Пусть [
Q= Qs
s∈S

объединение открытых множеств, где S есть множество (конечное


или нет) индексов.
Рассмотрим произвольную точку x ∈ Q, следовательно существу-
ет (возможно не единственный) индекс s ∈ S такой, что x ∈ Qs .
Поскольку Qs является открытым множеством, то существует шар
такой, что Br (x) ⊂ Qs , а следовательно имеет место и Br (x) ⊂ Q.
Теорема 6.2. Конечное пересечение открытых множеств являет-
ся открытым множеством.
Доказательство. Пусть
N
\
Q= Qk
k=1

объединение открытых множеств.


Рассмотрим произвольную точку x ∈ Q, тогда для каждого Qk
существует такой радиус rk > 0, что

Brk (x) ⊂ Qk .

Следовательно, для r = min{r1 , r2 , . . . , rN } имеет место

Br (x) ⊂ Q.

Покажем, что бесконечное пересечение открытых множеств мо-


жет и не быть открытым множеством. Приведем простой пример.
Рассмотрим R как метрическое пространство. В этом пространстве
рассмотрим счетную систему конечных множеств

Ak = (−1/k, 1/k), k = 1, 2, . . . .

31
Пересечение этих множеств состоит из одной точки

[
(−1/k, 1/k) = {0},
k=1

которая не является открытым множеством.


Почему открытые множества так важны для функционального
анализа? С помощью понятия открытых множеств можно формули-
ровать понятия непрерывного отображения. Рассмотрим отображе-
ние
F :X→Y
где X и Y суть метрические пространства. Мы будем говорить, что
это отображение непрерывно в точке x ∈ X, если для любого откры-
того множества V ⊂ Y такого, что F (x) ∈ V . Существует открытое
множество U ⊂ X, что образ этого множества принадлежит V

F (U ) ⊂ V.

Для любого множества A ⊂ X мы определим множество гранич-


ных точек. Это множество состоит из всех таких точек x ∈ X, что
для любого шара Br (x)

Br (x) ∩ A 6= ∅

и
Br (x) ∩ A 6= ∅.
То есть любой шар содержит точки, принадлежащие множеству A,
так и не принадлежащие этому множеству. Множество все гранич-
ных точек называется границей множества и обозначается следую-
щим образом ∂A.
Например, для множества (0, 1) в метрическом пространстве R
граничными точками являются точки {0}, {1}.
Вместе с отрытыми множествами в метрическом пространстве
рассматриваются замкнутые множества. Множество называется за-
мкнутым, если оно содержит все свои граничные точки.
Очевидно, что открытое множество не может содержать ни од-
ной граничной точки. Поэтому дополнение к открытому множеству
является замкнутым множеством, а дополнение к замкнутому — от-
крытом.

32
Множество A может не быть ни открытым, ни замкнутым. На-
пример, полуинтервал [0, 1). При этом в любом метрическом про-
странстве есть два множества, которые одновременно и открыты и
замкнуты. Это пустое множество ∅ и все пространство X.
Для любого множества можно определить операцию замыкания.
Для множества A замыканием назовем следующее множество

[A] = A ∩ ∂A.

Мы будем использовать обозначение [A] для замыкания. Очевидно,


что замыкание любого множества является замкнутым множеством.
При этом можно сказать, что замыкание — это минимальное замкну-
тое множество, содержащее исходное множество.
Рассмотрим пример замыкания. В метрическом пространстве R
рассмотрим множество Q рациональных чисел. Это множество не
является открытым, поскольку любой шар любой в центре в любом
рациональном числе содержит иррациональные числа. Но оно и не
замкнуто, поскольку не содержит границы. А границей этого множе-
ства являются все иррациональные числа. Таким образом, замыка-
ние [Q] совпадает со всем R. Аналогично, если в качестве исходного
множества взять все иррациональные числа, то их границей явля-
ются все рациональные числа и замыкание вновь совпадает со всем
R.
Вернемся теперь в самому простому открытому множеству — ша-
ру. А всегда ли шар круглый? С точки зрения школьной геометрии
вопрос странный, но в метрическом пространстве более интересный.
Разумеется, мы сейчас не даем абстрактного понятия «круглый» для
абстрактных множеств. Рассмотрим метрическое пространство R2 то
есть плоскость. Мы ввели три метрики в этом пространстве. Рассмот-
рим чертежи шара с радиусом единица с центром в начале координат.
Шар в евклидовой метрики ̺2 представляет собой единичный
круг, то есть этот шар круглый. А вот в метриках ̺1 и ̺0 этот шар
будет представлять собой квадраты.

7. Сходимость в метрическом пространстве


Главный смысл метрических пространств — это возможно опреде-
лить сходимость в этом пространстве по заданной метрике. Прежде

33
всего дадим определение предела последовательности в метрическом
пространстве. Это определение полностью совпадет с определением
предела числовой последовательности, если модуль разности заме-
нить на метрику5 .
Последовательность xn называется сходящейся к точке x при n →
∞, если для любого ε > 0 существует такой номер N = N (ε), что для
всех n > N выполнено неравенство
̺(xn , x) < ε.
Мы будем писать lim xn = x или xn → x, при n → ∞.
n→∞
Можно дать и несколько другое определение, основанное опять-
таки на понятии открытого множества (точнее, окрестности). По-
следовательность xn сходится к точке x если для любой окрестности
точки x, начиная с некоторого номера (зависящего от этой окрестно-
сти) все члены последовательности принадлежат этой окрестности.
Главное, что выбор метрики определяет сходимость элементов, а
различная метрика приводит различным видам сходимости. Рассмот-
рим примеры в функциональном пространстве C[a, b]. Сначала будем
рассматривать «официальную» равномерную метрику в этом про-
странстве. Пусть мы имеем последовательность непрерывных на [a, b]
функций, тогда определение предела по этой метрике соответствует
равномерной сходимости непрерывных функций. Из теоремы Вейер-
штрасса известно, что равномерный предел непрерывных функций
есть непрерывная функция.
Простой пример. Рассмотрим последовательность в C[0, 2π] функ-
ций
1
fn (x) = sin(nx).
n
Эта последовательность сходится к нулевой функции. Это следует из
равномерной (по x) оценки

1 1
|fn (x)| = sin(nx) ≤ , x ∈ [0, 2π], n = 1, 2, . . . .

n n
Рассмотрим теперь последовательность непрерывных функций
fn (x) = xn , n = 1, 2, . . .
5
Удивительного тут нет — в формулировке предела числовой последователь-
ности модуль разности и есть метрика в пространстве R.

34
в пространстве C[0, 1]. Эта последовательность не сходится в рав-
номерной метрике. Действительно, если бы эта последовательность
сходилась равномерно к некоторой непрерывной функции, то и пото-
чечно эта последовательность сходилась бы к этой функции. Однако
поточечно эта последовательность сходится к разрывной функции.
Действительно, при фиксированном x ∈ [0, 1) мы имеем
fn (x) = xn → 0, n → ∞,
в тоже время при x = 1
fn (1) = 1, n = 1, 2, . . . .
С другой стороны эта же последовательность сходится к нулевой
функции в метрике ̺1 . В самом деле
Z1
1
̺1 (fn , 0) = xn dx = .
n+1
0

Определим еще несколько важных понятий метрических пространств,


связанных со сходимостью. Рассмотрим некоторое множество в мет-
рическом пространстве M ⊂ X. Тогда замыкание этого множества,
обозначаемое [M ] состоит из пределов всех сходящихся последова-
тельностей {xn } ⊂ M .
Множество A называется плотным в множестве B, где оба мно-
жества принадлежат одному метрическому пространству, если замы-
кание [A] совпадает с множеством B. Другими словами, для любого
элемента b ∈ B существует сходящаяся последовательность an такая,
что
an ∈ A, lim an = b.
n→∞
Множество, плотное во всем метрическом пространстве X, назы-
вается всюду плотным. Если Y ⊂ X есть всюду плотное множество,
то любой элемент x ∈ X можно аппроксимировать в метрике X с
любой точностью элементами из Y . Для любого ε > существует такой
yε ∈ Y , что
̺(x, yε ) < ε.
Метрическое пространство называется сепарабельным, если в нем
существует счетное всюду плотное множество. Таким образом, лю-
бой элемент сепарабельного пространства можно приблизить счет-
ным множеством, что удобно в приложениях. Как мы в дальнейшем

35
увидим, свойство сепарабельность играет важную роль в функцио-
нальных пространствах.
С понятием сходящейся последовательности тесно связано поня-
тие фундаментальности последовательности. Последовательность xn
метрического пространства X называется фундаментальной, если
для любого ε > 0 существует такой номер N = N (ε), что для всех
n, m > N выполнено неравенство

̺(xn , xm ) < ε.

Теорема 7.1. Всякая сходящаяся последовательность является фун-


даментальной.

Доказательство. Пусть lim xn = x. Фиксируем произвольное ε > 0,


n→∞
тогда из сходимости последовательности можно найти N такой, что
̺(xn , x) < ε/2 и ̺(xm , x) < ε/2 при n, m > N .
Тогда используя неравенство треугольника имеем

̺(xn , xm ) ≤ ̺(xn , x) + ̺(x, xm ) < ε.

В курсе математического анализа для числовых последователь-


ностей верно и обратное — любая фундаментальная последователь-
ность сходится. В общем случае в метрическом пространстве это не
так. Для сходимости в метрическом пространстве необходимо, чтобы
предел сам принадлежал этому пространству. Однако может ока-
заться так, что «предел» фундаментальной последовательности не
принадлежит исходному метрическому пространству. Такое бывает
для неполных метрических пространствах. Впрочем отчаиваться не
стоит, в этом случае всегда возможно пополнить метрическое про-
странство, но обо всем этом в следующем параграфе.

8. Полные метрические пространства


В курсе функционального анализа принципиальное значение имеет
понятие полного метрического пространства. Метрическое простран-
ство называется полным, если любая фундаментальная последова-
тельность является сходящейся.

36
Рассмотрим примеры полных и не полных метрических пространств.
Пространство действительных чисел R является полным по постро-
ению в математическом анализе. В тоже время пространство Q не
является полным, поскольку существуют последовательности раци-
ональных чисел, сходящиеся к иррациональным числам. Соответ-
ственно, эти последовательности должны быть фундаментальными.
Пространство C[a, b] является полным. Действительно, рассмот-
рим фундаментальную последовательность в C[a, b], которую мы обо-
значим через fx (x). Тогда для любого ε > 0 существует такой номер
N , что
|fn (x) − fm (x)| < ε (II.3)
при всех n, m > N и x ∈ [a, b]. Поэтому эта последовательность схо-
дится равномерно и согласно известным теоремам из математическо-
го анализа сходится к непрерывной функцией, которую обозначим
f (x). Переходя к пределу в (II.3) при m → ∞, получаем
|fn (x) − f (x)| ≤ ε
для всех x ∈ [a, b] и n > N . Следовательно эта последовательность
сходится к f (x) в пространстве C[a, b].
Однако пространство непрерывных функций с интегральной мет-
рикой ̺1 не является полным. Рассмотрим последовательность непре-
рывных функций в пространстве C[−1, 1], аппроксимирующую «сту-
пеньку» 
 −1 −1 ≤ x ≤ −1/n,
fn (x) = nx −1/n ≤ x ≤ 1/n,
1 1/n ≤ x ≤ 1

Эта последовательность фундаментальная в интегральной метрики,


что следует из неравенства, проверяемого непосредственно
Z1
2
|fn (x) − fm (x)|dx ≤ .
min{n, m}
−1

Покажем, что эта последовательность не сходится ни к какой функ-


ции из C[−1, 1]. Возьмем произвольную функцию из C[−1, 1], кото-
рая является непрерывной на [−1, 1]. Через η(x) обозначим разрыв-
ную функцию 
−1 −1 ≤ x < 0,
η(x) =
1 0≤x≤1

37
Для этих функций имеем неравенство

Z1 Z1 Z1
|f (x) − η(x)|dx ≤ |f (x) − fn (x)|dx ≤ |fn (x) − η(x)|dx.
−1 −1 −1

В силу непрерывности функции f интеграл в левой части отличен


от нуля, однако по построению функции fn (x) имеем

Z1
|fn (x) − η(x)|dx → 0, n → ∞.
−1

R1
Это означает, что для любой непрерывной функции f интеграл |f (x)−
−1
fn (x)|dx не может стремиться к нулю, следовательно последователь-
ность fn не сходится ни к какой функции в C[−1, 1].
Существует критерий полноты метрического пространства — тео-
рема о вложенных шарах.

Теорема 8.1. Пусть X метрическое пространство, rn > 0 стре-


мящаяся к нулю последовательность. Рассмотрим последователь-
ность замкнутых шаров Bn = B rn (xn ) такую что

Bn ⊂ Bm , n > m.

Тогда пространство X является полным тогда и только тогда, ко-


гда эти шары имеют не пустое пересечение

\
Bn 6= ∅. (II.4)
n=1

Доказательство. Докажем необходимость. Пусть X есть полное мет-


рическое пространство. Последовательность центров шаров xn явля-
ется фундаментальной, поскольку

̺(xn , xm ) < rn ,

при m > n, при этом rn → ∞. В силу полноты пространства X эта


последовательность сходится к элементу, который мы обозначим x.

38
Поскольку шар Bn содержит все точки последовательности, кроме,
быть может, первых n − 1, то

\
x∈ Bn .
n=1

Поэтому любая окрестность точки x содержит хотя бы одну точку


для любого множества Bn , а в силу замкнутости множеств Bn сле-
дует, что x ∈ Bn для всех n.
Теперь докажем достаточность. Рассмотрим фундаментальную
последовательность xn . В предположении, что имеет место (II.4) до-
кажем, что эта последовательность имеет предел. В силу фундамен-
тальности последовательности, существует такой номер nk , что имеет
место
1
̺(xn , xnk ) < k , n > nk .
2
Без ограничения общности можно считать, что nk+1 > nk . Обозначим
через Bk замкнутый шар B 1k (xnk ). По построению эти шары явля-
2
ются вложенными, а по предположению (II.4) имеют общую точку
x. Более того, эта точка являются пределом подпоследовательности
xnk . При этом если фундаментальная последовательность содержит
в себе сходящуюся подпоследовательность, то она и сама сходится к
этому пределу. Этим доказывается полнота пространства X.
Почему так важна полнота пространства? Дело в том, что, фун-
даментальные последовательности возникают во многих математиче-
ских и прикладных задачах. Можно сказать, что наличие фундамен-
тальной последовательности говорит о наличии некоторого «прибли-
жения». Разумно ожидать, что это «приближение», действительно,
является приближением единственного элемента. Однако это верно
лишь в полных метрических пространствах.
Важнейшим фактом в теории метрических пространств является
возможность пополнения любого метрического пространства. Метри-
ческое пространство X̃ называется пополнением метрического про-
странства X, если X ⊂ X̃, X всюду плотно в X̃ и X̃ является полным
пространством.
Докажем лемму, которая будет использоваться в доказательстве
теоремы о пополнении метрического пространства.

39
Лемма 8.1. Пусть X ⊂ X̃, X всюду плотно в X̃ и, каждая фунда-
ментальная последовательность в X имеет предел в X̃, тогда X̃
есть пополнение пространства X.
Доказательство. В условиях леммы нам необходимо доказать толь-
ко полноту пространства X̃. Пусть x̃n — фундаментальная в X̃ после-
довательность. В силу плотности пространства X в X̃, то для любого
ε > 0 существует такая последовательность элементов xn ∈ X, что
ε
̺(xn , x̃n ) < .
2n
Покажем, что эта последовательность фундаментальна, действитель-
но,

̺(xn , xm ) ≤ ̺(xn , x̃n ) + ̺(x̃n , x̃m ) + ̺(xm , x̃m ) → 0, n, m → ∞.

По условию теоремы последовательность xn имеет предел x̃ ∈ X̃.


Остается показать, что x̃ является пределом для последовательности
x̃. В самом деле

̺(x̃n , x̃) ≤ ̺(xn , x̃n ) + ̺(xn , x̃) → 0, n → ∞.

Теорема 8.2. Всякое метрическое пространство может быть по-


полнено.
Доказательство. Пусть X некоторое метрическое пространство. Идея
пополнения этого пространства состоит в том, чтобы построить мет-
рическое пространство классов фундаментальных последовательно-
стей и рассматривать это пространство, как более широкое простран-
ство исходного пространства. При этом те фундаментальные после-
довательности, которые не имеют предела в пространстве X отож-
дествить с элементом пространства X̃.
Рассмотрим две фундаментальные последовательности xn и yn в
X. Введем расстояние для этих последовательностей по следующей
формуле
d({xn }, {yn }) = lim ̺(xn , yn ). (II.5)
n→∞

Этот предел всегда существует, действительно,

|̺(xn , yn ) − ̺(xm , ym )| ≤ ̺(xn , xm ) + ̺(yn , ym ) → n, m → ∞.

40
Это означает, что числовая последовательность {̺(xn , yn )} фунда-
ментальная, а следовательно по критерию Коши имеет предел.
Введенное расстояние между фундаментальным последователь-
ностями обладает следующими свойствами. Во-первых, если обе по-
следовательности xn и yn являются сходящимися xn → x, yn → y при
n → ∞, то имеет место

d({xn }, {yn }) = ̺(x, y).

Во-вторых, если эти последовательности сходятся к одному и тому


же элементу, то, как следует из предыдущей формулы, расстояние
между ними равно нулю d({xn }, {yn }) = 0. Поэтому мы будем гово-
рит, что две последовательности (фундаментальные) являются эк-
вивалентными, если расстояние между ними равно нулю. При этом
расстояние между классами эквивалентности не зависит от выбора
конкретных последовательностей.
Таким образом, мы введем пространство X̃, как множество всех
классов эквивалентности фундаментальных в X последовательно-
стей. Это пространство является метрическим с метрикой, задава-
емой по формуле (II.5).
Любому элементу x ∈ X всегда соответствует, как минимум, одна
фундаментальная последовательность xn = x, поэтому имеет место

X ⊂ X̃.

Далее, каждая фундаментальная в X последовательность xn имеет


предел в X̃, который является классом эквивалентности всех фунда-
ментальных последовательностей, эквивалентных xn .
Покажем плотность X в X̃, тогда в силу леммы 8.1 пространство
X̃ будет пополнением X. Для этого выберем произвольный элемент
x̃ ∈ X̃ и фундаментальную последовательность xn , входящую в класс
x̃. Согласно фундаментальности последовательности xn для любого
ε > 0 существует такой N , что при n, m > N

̺(xn , xm ) < ε.

Следовательно, при любом достаточно большом n имеем

lim ̺(xn , xm ) ≤ ε.
n→∞

41
По нашему определению метрики в X̃ имеем

d(x̃, x̃n ) ≤ ε,

где через x̃n мы обозначили стационарную последовательность, где


все члены равны xn . Следовательно, любой элемент x̃ ∈ X можно
приблизить с любой точностью элементами из X, поэтому X всюду
плотно в X̃.
В чем разница между пополнением и замыканием? Разница в
том, что замыкание осуществляется в рамках одного метрического
пространства, а пополнение обеспечивается расширением исходного
пространства. Например, замыкание всех рациональных чисел в про-
странстве Q будет все тоже пространство Q, а пополнением этого
пространства уже будет R.
Хотя теорема о пополнении не является конструктивной, но она
подсказывает, как следует понимать «идеальные» элементы — пре-
делы фундаментальных последовательностей. Собственно, сама фун-
даментальная последовательность и есть этот элемент. Возвращаясь
к пространству R, легко вспомнить, что один из способов определе-
ния действительного числа, как раз и есть пополнение рациональных
чисел. Более того, в любых приложениях мы используем рациональ-
ное приближение для иррациональных чисел.
Подмножество M метрического пространства X называется неплот-
ным в X, если его замыкание M не содержит никаких непустых от-
крытых множеств пространства X. Говорят, что множество M яв-
ляется множеством первой категории, если его можно представить в
виде счетного объединения множеств, каждое из которых неплотно
в X, иначе множество называется множеством второй категории.

Теорема 8.3 (Теорема Бэра-Хаусдорфа). Всякое непустое полное


метрическое пространство X является множеством второй ка-
тегории.

Доказательство. Рассмотрим произвольную последовательность за-


мкнутых множеств {Mn } такую, что

[
X= Mn .
n=1

42
Предположим, что ни одно из множеств Mn не содержит непустых
открытых подмножеств. В этом случае множество X \ M1 является
открытым и X \ M1 = X, следовательно, множество X \M1 содержит
замкнутый шар Br1 (x1 ), где центр x1 может быть как угодно близким
к любой точке X. Без ограничения общности можно считать, что r1 <
1/2. Аналогично, рассуждая можно построить последовательность
шаров Brn (xn ) такую, что

Brn+1 (xn+1 ) ⊂ Brn (xn ), 0 < rn < 2−n ,

и
Brn (xn ) ∩ Mn = ∅.
Последовательность центров шаров xn является фундаментальной,
поскольку для n < m имеет место xm ∈ Brn (xn ) и

̺(xn , xm ) ≤ rn < 2−n .

Пусть x0 = lim xn . Для любого m имеем


n→∞

̺(xm , x0 ) ≤ ̺(xm , xn ) + ̺(xn , x0 ) ≤ rm + ̺(xn , x0 ) → rm ,

при n → ∞. Следовательно, x0 ∈ Brm (xm ) при всех m. Таким обра-


зом, точка x0 не принадлежит ни одному Mn и поэтому не содержится
в объединении
[∞
Mn = X,
n=1

что противоречит x0 ∈ X.
Теорема Бэра-Хаусдорфа играет важную роль при исследовании
различных топологических свойств отображений.

9. Принцип сжимающих отображений


В полных метрических пространствах выполнен широко известный
принцип сжимающих отображений, который находит очень частое
применение во многих задачах математики, при доказательстве тео-
рем о существовании решений и для численного нахождения прибли-
женных решений.

43
Рассмотрим полное метрическое пространство X и отображение

A : X → X.

Решения уравнения
Ax = x
называются неподвижными точками отображения A.
Существует класс отображений, которые всегда имеют неподвиж-
ную точку, причем единственную. Отображение A называется сжи-
мающим или сжатием6 , если существует такое α < 1, что для всех
x, y ∈ X выполнено неравенство

̺(Ax, Ay) ≤ α̺(x, y). (II.6)

Если xn → x, то имеем

̺(Axn , Ax) ≤ ̺(xn , x)

и поэтому отображение A является непрерывным отображением.


Принцип сжимающих отображений формулируется следующей
теоремой.

Теорема 9.1. Пусть X — полное метрическое пространство, отоб-


ражение
A:X→X
есть сжимающее отображение, удовлетворяющее (II.6), тогда отоб-
ражение A имеет единственную неподвижную точку x∗ ∈ X, яв-
ляющейся пределом
x∗ = lim An x0 ,
n→∞

существующим при любом x0 ∈ X. Кроме того, существует кон-


станта c = c(α, x0 ) > 0 такая, что

̺(x∗ , xn ) ≤ cαn , (II.7)

где xn = An x0 .
6
Тогда говорят о принципе сжатых отображений.

44
Доказательство. Покажем, что последовательность xn = An x0 яв-
ляется фундаментальной. Без ограничения общности, будем считать
m ≤ n тогда имеем

̺(xn , xm ) = ̺(An x0 , Am , x0 ) ≤ αn ̺(x0 , Am−n x0 ) ≤

αn [̺(x0 , x1 ) + ̺(x1 , x2 ) + · · · + ̺(xm−n−1 , xm−n )] ≤ (II.8)


1
αn ̺(x0 , x1 )[1 + α + α2 + · · · + αm−n−1 ] ≤ αn ̺(x0 , x1 ) .
1−α
Поскольку α < 1, то

̺(xn , xm ) → 0, n → ∞.

В силу полноты X последовательность xn имеет предел

x∗ = lim xn .
n→∞

Покажем, что x∗ есть неподвижная точка. В силу непрерывности


отображения A имеем

Ax = A lim xn = lim Axn = lim xn+1 = x∗ .


n→∞ n→∞ n→∞

Итак, мы доказали существование неподвижной точки, покажем те-


перь единственность этой точки. Предположим, что Ax = x и Ay = y
тогда имеем
̺(x, y) ≤ α̺(x, y),
но поскольку α < 1, то от сюда следует, что ̺(x, y) = 0 или x = y.
Оценка (II.7) следует из (II.9).
Принцип сжимающих отображений имеет большое количество при-
ложений благодаря тому, что последовательность, сходящаяся к непо-
движной точке строится конструктивно и имеет место априорная
оценка точности.
Пусть f ∈ C 1 [a, b] такая, что

|f ′ (x)| ≤ M < 1, x ∈ [a, b].

тогда на отрезке [a, b] уравнение

f (x) = x

45
имеет единственное решение. Например, f (x) = cos x является сжи-
мающим на отрезке [0, 1]. Следовательно, существует решение x∗ ∈
[0, 1] уравнения
x∗ = cos x∗ .
Это решение приблизительно равно

x∗ = 0.73908513321516064165531208767387 . . .

в чем не сложно убедиться, если на калькуляторе многократно на-


жимать кнопку «cos»7 .
Теперь покажем, что с помощью принципа сжимающих отображе-
ний можно доказать теорему о существовании решения задачи Коши
для обыкновенного дифференциального уравнения.
Рассмотрим задачу Коши для уравнения
dy
= f (x, y(x))
dx
с начальным условием
y(x0 ) = y0 ,
где функция f (x, y) определена и непрерывна в замыкании ограни-
ченной области Q такой, что (x0 , y0 ) ∈ Q. Вообще говоря, одних этих
условий достаточно для существования решения этой задачи Коши
на достаточно малом интервале8 . Для применения метода сжимаю-
щих отображений нужно наложить дополнительное условие на пра-
вую часть уравнения. Будем предполагать, что в области Q функция
f удовлетворяет условию Липшица по переменной y, т.е.

|f (x, y1 ) − f (x, y2 )| ≤ L|y1 − y2 |, (x, yi ) ∈ Q, i = 1, 2.

Проинтегрируем дифференциальное уравнение по x от x0 до x т и за-


метим, что Задача Коши эквивалентна следующему интегральному
уравнению
Zx
z(x) = y0 + f (s, z(s))ds. (II.9)
x0

7
Убедитесь, что в Вашем калькуляторе установлен режим «радианы».
8
Однако в этих условиях нельзя гарантировать единственность решения.

46
В силу ограниченности области Q имеем оценку

|f (x, y)| ≤ M, (x, y) ∈ Q.

Выберем величину d > 0 такую, что (x, y) ∈ Q при |x − x0 | ≤ d и


|y − y0 | ≤ M d, а также Ld < 1.
Введем метрическое пространство C ∗ состоящее из непрерывных
функций z, определенных на [x0 − d, x0 + d] и таких, что

|z(x) − y0 | ≤ M d.

Метрику в этом пространстве введем такую же как в пространстве


C[x0 − d, x0 + d]. Поскольку это пространство является замкнутым
подпространством в пространстве C[x0 − d, x0 + d], то пространство
C ∗ является полным метрическим пространством.
Рассмотрим отображение A : C ∗ → C ∗ , заданное по формуле
Zx
A[z(x)] = y0 + f (s, z(s))ds.
x0

Покажем, что этот оператор отображает все C ∗ на C ∗ . Действитель-


но, имеем x
Z

|A[z(x)] − y0 | = f (s, z(s)))ds ≤ M d.

x0

Теперь покажем, что оператор A является оператором сжатия


x
Z

̺(Az1 , Az2 ) = max (f (s, z1 (s)) − f (s, z2 (s))ds =
x∈[x0 −d,x0 +d]

x0

x∗
Zx∗

Z

(f (s, z1 (s)) − f (s, z2 (s))ds ≤ |f (s, z1 (s)) − f (s, z2 (s)|ds ≤


x0 x0

Ld max |z1 (x) − z2 (x)| = Ld̺(z1 , z2 ).


x∈[x0 −d,x0 +d]

Поскольку Ld < 1, то отображение A, действительно, сжимающее.

47
Следовательно, согласно принципу сжимающих отображений за-
дача Коши для обыкновенного дифференциального уравнения с пра-
вой частью, удовлетворяющей условию Липшица, имеет единствен-
ное локальное решение. Разумеется, без проблем распространить этот
результат и на системы дифференциальных уравнений. Данный спо-
соб доказательства существования решений дифференциальных урав-
нений называется методом Пикара и может восприниматься, как кон-
структивный метод для построения приближенных решений.
Отметим, что отображение может иметь неподвижную точку и
без условий теоремы, более того, итеративная процедура

x n = An x 0

может сходится и в этом случае, но без теоремы о принципе сжимаю-


щих отображений нельзя гарантировать сходимость этой процедуры.
Впрочем, существует большое количество различных принципов, га-
рантирующих существование неподвижных точек. При этом Прин-
цип сжимающих отображений лишь наиболее простой результат.

10. О применении метрических пространств в


теории информации
Метрические пространства играют основную роль в большинстве раз-
делов математики и во многих ее приложениях. Рассмотрим примене-
ния метрических пространств в далекой от анализа области — теории
информации.
Будем рассматривать задачу о передаче информации по комму-
никациям. В современной компьютерной техники информация пе-
редается с помощью последовательности битов, принимающих два
значения 0 или 1. Биты мы будем рассматривать в качестве букв.
Рассмотрим все возможные упорядоченные последовательности бить
длины N . Обозначим это множество I N . Ясно, что мощность этого
множества равна 2N . В этом множестве мы выделим подмножество,
состоящее из значащих слов, которое обозначим через AN . Разуме-
ется, слова могут иметь различную длину и алфавит в этом случае
дополняется символом — разделителем, но сейчас мы это не будем
рассматривать.

48
Множество I N мы сделаем метрическим пространством, введя
метрику следующим образом
N
X
̺(x, y) = |xi − yi |,
i=1

где x = (x1 , x2 , . . . , xN ), y = (y1 , y2 , . . . , yN ), при этом xi , yi принимают


значения 0 или 1. Мы не будем останавливаться на доказательстве
того, что ̺ удовлетворяет всем аксиомам метрики, мы это проходили
много раз. Введенная нами метрика называется расстоянием Хем-
минга.
Расстояние Хемминга используется для построения кодов, с ис-
правлением ошибок. Предположим, что при передачи слова по ком-
муникационным путям возможны случайные ошибки. Эти ошибки
состоят в том, что во время передачи у слова некоторые буквы (би-
ты) могут быть искажены — заменены с 0 на 1 или наоборот.
Предположим, нам нужно передать одно из двух слов — «да»
или «нет». Логично кодировать эти слова 1 или 0. В этом случае
N = 1. Однако от возможной ошибки передачи информации такой
код ничем не защищен — мы даже не узнаем была ли ошибка. Мож-
но усложнить код и дублировать буквы, кодируя «да» — 11, а «нет»
— 00. В этом случае при однократной ошибки при передаче мы смо-
жем узнать факт ошибки. Но получив сообщение 01, мы можем лишь
констатировать ошибку. При этом мы не знаем было ли исходное со-
общение 00 или 11. Рассуждая в подобном духе можно предложить
кодировать сообщения тремя битами 111 или 000. При таком рас-
кладе мы можем не только выявить факт однократной ошибки, но
исправить ее путем «голосования» битов — если в сообщении две или
три единицы, то исходное сообщение было «да».
Метрическое пространство с метрикой Хемминга позволяет разо-
браться в этом вопросе. Пусть для элементов множества AN выпол-
нено неравенство
̺(x, y) ≥ d, x 6= y.
Тогда для того, чтобы код мог корректировать n ошибок при пере-
дачи достаточно выполнения условия

d ≥ 2n + 1,

49
а в случае, если d есть минимальное значение метрики для различных
элементов в множестве AN , то это условие и необходимо. Из этого
следует, то при кодировании слов нужно выбирать коды, как можно
дальше отстоящие друг от друга.
Завершая наш разговор про метрические пространства и код Хемм-
минга, заметим, что расстояние Хемминга может понять частую фра-
зу о том, что «русский язык богаче английского». Дело в том, что
средняя длина слова в русском языке больше средней длины англий-
ского слова. Поэтому в среднем расстояние Хемминга у различных
русских слов больше чем у английских. Однако средняя длина слова
в немецком языке больше чем русского. Вероятно, что чем дальше
стоят слова друг от друга тем больше смысловых нюансов.

50
Глава III

Нормированные и банаховы
пространства

11. Линейные пространства


Рассмотренные выше метрические пространства обладали большой
общностью, однако во многих задачах математики недостаточно уметь
вычислять расстояние между элементами. Часто требуется также
уметь складывать эти элементы и умножать их на число. Выдаю-
щуюся роль в функциональном анализе играют линейные простран-
ства.
Линейным пространством L называется не пустое множество, для
элементов которого определены операции сложения и умножения на
комплексное (вещественное) число. Эти операции замкнуты в этом
пространстве и удовлетворяют следующим свойствам для любых x, y, x ∈
L и λ, µ ∈ C(R)

1. x + y ∈ L,

2. λx ∈ L,

3. x + y = y + x,

4. x + (y + x) = (x + y) + z,

5. существует такой элемент 0, что x + 0 = x,

6. для любого x существует такой элемент −x, что x + (−x) = 0,

51
7. λ(µx) = (λµ)x,

8. 1 · x = x,

9. (λ + µ)x = λx + µx,

10. λ(x + y) = λx + λy.


Вместо поля комплексных чисел можно рассматривать поле веще-
ственных чисел, либо любое другое алгебраическое поле. Говорят,
линейное пространство над таким-то полем.
В отличии от метрических пространств линейные пространства
либо состоят из одного элемента 0, умножение которого на любое
число есть 0, либо содержат не менее континуального количества
элементов. Приведем простые примеры.
Пространство R с обычными арифметическими операциями пред-
ставляет собой линейное пространство над полем действительных чи-
сел. Заметим, множества N, Q уже не являются линейными.
Важнейшую роль играет пространство Rn , которое также явля-
ется линейным пространством над полем действительных чисел. Это
пространство подробно изучается в курсе линейной алгебры.
Линейным пространством также будет множество R∞ состоящее
из всех последовательностей действительных чисел. Операции сло-
жения и умножения на число выполняются покомпонентно.
Множество C[a, b] всех непрерывных на [a, b] функций также бу-
дет линейным пространством с очевидными операциями сложения и
умножения на число.
Линейное пространство представляют собой алгебраическую кон-
струкцию, а в алгебре принято абстрагироваться от конкретных объ-
ектов, поэтому большое значение имеет понятия изоморфизма меж-
ду линейными пространствами. Изоморфизмом двух линейных про-
странств L и M называется взаимно однозначное отображение

ν : L → M,

обладающее свойствами

ν(x + y) = ν(x) + ν(y)

и
ν(λx) = λν(x).

52
Линейные пространства называются изоморфными, если для них су-
ществует изоморфизм. Изоморфные линейные пространства в опре-
деленном смысле неотличимы с точки зрения природы линейного
пространства.
В качестве нетривиального примера рассмотрим линейное про-
странство многочленов с вещественными коэффициентами порядка
не большего n, которое обозначим через Pn . Очевидно, что сумма та-
ких многочленов и произведение на вещественное число всегда есть
многочлен порядка не большего n. Покажем, что это пространство
изоморфно пространству Rn+1 . Для этого введем отображение по сле-
дующему правилу

ν(a0 + a1 x + · · · + an xn ) = (a0 , a1 , . . . , an ).

Ясно, что это отображение является взаимно однозначным. Посколь-


ку сумма двух полиномов есть полином, у которого коэффициенты
суть суммы соответствующих коэффициентов, а умножение полино-
ма на число — это полином с коэффициентами, умноженными на это
число, то отображение ν есть изоморфизм.
Важнейшей характеристикой линейного пространства является
размерность пространства. Чтобы определить размерность нужно
рассмотреть важнейшее понятие — линейной зависимости и незави-
симости элементов. Для линейного пространства L будем говорить,
что элементы x, y, . . . , z ∈ L линейно независимы, если

αx + βy + · · · + γz = 0 (III.1)

возможно только тогда, когда все коэффициенты равны нулю

α = β = · · · = γ = 0.

Если же (III.1) возможно не при всех нулевых коэффициентах, то


элементы x, y, . . . , z ∈ L называются линейно зависимыми.
В пространстве R2 элементы x1 = (1, 0) и x2 = (0, 1) являются
линейно независимыми, поскольку выражение

αx1 + βx2 = (α, β)

может быть нулевым только тогда, когда α = β = 0.

53
С другой стороны три вектора x1 = (1, 0), x2 = (0, 1) и x3 = (2, 3)
уже будут линейно зависимыми. Действительно,
2x1 + 3x2 − x3 = 0.
Если в линейном пространстве L существует n линейно незави-
симых элементов, но не существует n + 1 линейно независимых эле-
ментов, то будем говорит, что пространство L конечномерное с раз-
мерностью dim L = n. Если в линейном пространстве для любого n
существует n линейно независимых элементов, то такое пространство
называется бесконечномерным dim L = ∞.
Пространства Rn являются конечно мерными пространствами с
размерностью n. Чуть позже мы докажем, что все конечномерные
пространства размерности n над полем вещественных чисел изоморф-
ны Rn , а над полем комплексных чисел — пространству Cn .
В качестве бесконечномерного пространств можно привести при-
мер пространства C[a, b]. Бесконечной системой линейно независи-
мых элементов является множество
1, x, x2 , . . . , xn , . . . .
Действительно, выражение
a0 + a1 x + a2 x2 + · · · + an xn = 0
возможно только при a0 = a1 = · · · = an = 0, поскольку два полинома
тождественно равны только тогда, когда у них равны коэффициенты,
а с права стоит нулевой полином.
В мире метрических пространств мы рассматривали подмноже-
ства довольно произвольно, поскольку любое подмножество метриче-
ского пространства есть метрическое пространство. В мире линейных
пространств уже не любое подмножество есть линейное простран-
ство. Поэтому нужно рассматривать линейное подпространство. Непу-
стое подмножество L′ в линейном пространстве L называется линей-
ным подпространством, если для любых x, y ∈ L′ имеет место
αx + βy ∈ L′ ,
для всех чисел α и β. Любое подпространство можно рассматривать,
как новое линейное пространство.
Для любого набора (конечного или бесконечного) элементов {xα } ∈
L минимальное подпространство L′ , содержащее все {xα } называется
линейной оболочкой этого множества.

54
12. Нормированные и банаховы пространства
В линейном пространстве можно ввести метрику и рассматривать
линейные метрические пространства, но в линейном пространстве
можно ввести понятие нормы. Если метрика обобщала расстояние,
то норма обобщает понятие длины вектора.
Пусть N есть линейное пространство. Нормой в этом простран-
стве называется числовая (вещественная1 ) функция обозначаемая
kxk для x ∈ N , которая удовлетворяет следующим условиям нор-
мы

1. kxk ≥ 0, причем kxk = 0 тогда и только тогда, когда x = 0,

2. kλxk = |λ|kxk, для всех чисел λ,

3. kx + yk ≤ kxk + kyk, для всех x, y ∈ N .

Будем также писать kxkN для указания в каком пространстве берем


норму в N .
Любое нормированное пространство мы будем рассматривать как
метрическое с метрикой, порожденной нормой по следующей форму-
ле
̺(x, y) = kx − yk.
Соответственно, в любом нормированном пространстве вводится по-
нятия сходимости, полноты и т.д.
Сама норма, как отображение нормированного пространства в R
является непрерывной. Этот факт следует из простой, но важной
теоремы.

Теорема 12.1. Для любых x, y ∈ N имеет место неравенство

|kxk − kyk| ≤ kx − yk. (III.2)

Доказательство. Используя неравенство треугольника мы имеем

kxk = kx − y + yk ≤ kx − yk − kyk.

Отсюда получаем
kx − yk ≥ kxk − kyk,
1
Даже если пространство L над полем комплексных чисел.

55
но меняя местами x и y получаем
kx − yk ≥ kyk − kxk.
Совокупность этих неравенств дают (III.2).
Полное нормированное пространство называется банаховым2 про-
странством. Банаховы пространства играют важнейшую роль в функ-
циональном анализе.
Как всегда, рассмотрим некоторые примеры банаховых пространств.
Пространство Rn является банаховым пространством с нормой
q
kxkRn = x21 + x22 + · · · + x2n .

Пространство C[a, b] является банаховым пространством с нормой


kf kC[a,b] = max |f (x)|.
x∈[a,b]

Полнота этого пространства следует из полноты соответствующего


метрического пространства.
Рассмотрим пространство l1 , состоящее из всех комплексных по-
следовательностей x = (x1 , x2 , . . . ) таких, что

X
|xk | < ∞.
k=1

Норму в этом пространстве введем по формуле



X
kxkl1 = |xk |.
k=1

Покажем полноту этого пространства. Для этого выберем произволь-


ную фундаментальную последовательность {xn } ⊂ l1 . Будем исполь-
зовать обозначение xn = {xnk }. Поскольку

X
|xkn+p − xnk | ≤ |xln+p − xnl | = kxn+p − xn kl1 ,
l=1
2
Названные в честь С. Банаха, который ввел эти пространства и систематиче-
ски их изучал. Однако уместно вспомнить, что эти же пространства были неза-
висимо использованы в работах Н. Винера, и ранее назывались пространствами
Банаха-Винера.

56
то при каждом фиксированном k числовая последовательность {xnk }∞
n=1
является фундаментальной в C, поэтому существует предел

x∞ n
k = lim xk .
n→∞

Рассмотрим последовательность комплексных чисел x∞ = {x∞ k } и


n
покажем, что она принадлежит l1 . Из фундаментальности x следует,
что для любого ε > 0 существует такой N , что при всех n > N и
любом p выполняется неравенство

X
kx n+p n
− x kl1 = |xkn+p − xnk | < ε.
k=1

Следовательно для любого N имеет место


N
X
|xkn+p − xnk | < ε.
k=1

В последнем неравенстве можно перейти к пределу при p → ∞


N
X
|x∞ n
k − xk | ≤ ε.
k=1

Далее перейдем к пределу при N → ∞



X
|x∞ n
k − xk | ≤ ε.
k=1

Полученное неравенство можно записать как

kx∞ − xn kl1 ≤ ε,

верное для всех n > N . В силу линейности x∞ = xn − (x∞ − xn ) ∈ l1 ,


при этом
lim xn = x∞ .
n→∞

Следовательно, l1 является банаховым пространством.


Из свойств нормы непосредственно следует, что норму можно
умножить на любое положительное число, после чего получим дру-
гую норму. Более обще, мы будем говорить, что две нормы kxk и kxk′

57
в одном нормированном пространстве эквивалентны, если существу-
ют константы c1 , c2 > 0 такие, что
c1 kxk′ ≤ kxk ≤ c2 kxk′ .
Пусть в банаховом пространстве N по норме kxk имеем сходящу-
юся последовательность xn . Сходящаяся последовательность всегда
фундаментальна
lim kxn − xm k = 0.
n,m→∞

Однако в эквивалентной норме kxk′ эта последовательность также


будет фундаментальной, поскольку имеет место
kxn − xm k′ ≤ ckxn − xm k,
следовательно, сходящаяся последовательность остается сходящейся
и в эквивалентной норме.

13. Функции со значениями в банаховом


пространстве
Банахово пространство часто является обобщением векторного про-
странства Rn , поэтому многие результаты математического анализа
для векторнозначных функций могут быть обобщены и на случай
функций, принимающих значения в произвольном банаховом про-
странстве. Эти функции играют большую роль во многих приложе-
ниях.
Зафиксируем абстрактное банахово пространство X. На числовом
отрезке [0, T ]3 рассмотрим функции x(t), принимающие значения в
пространстве X. Это означает, что для каждого фиксированного t ∈
[0, T ] имеем x(t) ∈ X.
Функция x(t) называется непрерывной в точке t0 ∈ [0, T ], если
для любой числовой последовательности tn ∈ [0, T ], сходящейся к t0
имеет место
kx(t0 ) − x(tn )kX → 0, n → ∞.
Функция, непрерывная в каждой точке [0, T ] называется непрерыв-
ной на [0, T ].
3
Мы взяли отрезок [0, T ] для простоты, но все результаты верны для произ-
вольного [a, b].

58
Теорема 13.1. Пусть x(t) есть непрерывная функция на [0, T ] со
значениями в банаховом пространстве X, тогда числовая функция
f (t) = kx(t)kX будет непрерывной на [0, T ].

Доказательство. Рассмотрим произвольную точку t0 ∈ [0, T ] и по-


следовательность tn из этого отрезка, сходящуюся к t0 . Имеем по
теореме 12.1

|f (t0 ) − f (tn )| = |kx(t0 )kX − kx(tn )kX | = kx(t0 ) − x(tn )kX → 0

при n → ∞.
Мы можем ввести новое банахово пространство, состоящее из функ-
ций, непрерывных на отрезке [0, T ] со значениями в банаховом про-
странстве X, которое обозначим через C([0, T ]; X). Норма в этом про-
странстве выглядит следующим образом

kxkC([0,T ];X) = max kx(t)kX .


t∈[0,T ]

В случае, когда X есть R или C, это пространство совпадает с C[0, T ].


Для любого t0 ∈ (0, T ) рассмотрим ∆t такую, что (t+∆t) ∈ (0, T ),
если существует такой элемент y ∈ X, что

x(t0 + ∆t) − x(t0 )
− y → 0,
∆t
X

при ∆t → 0, то функция x(t) называется дифференцируемой в точке


t0 и для нее существует производная

dx(t0 )
x′ (t0 ) = = y.
dt
Для случая, когда t0 = 0 или t0 = T следует рассматривать односто-
ронние производные.
Функция, дифференцируемая во всех точках, называется непре-
рывно дифференцируемой на [0, T ], если ее производная, как функ-
ция t со значениями в X, является непрерывной.
Аналогично вводится понятие и k раз непрерывно дифференци-
руемой функции со значениями в банаховом пространстве. Соот-
ветственно, будем рассматривать банахово пространство функций,

59
непрерывно дифференцируемых k раз со значениями в банаховом
пространстве X, которое обозначаем C k ([0, T ]; X) с нормой

kxkC k ([0,T ];X) = max kx(t)kX + · · · + max kx(k) (t)kX .


t∈[0,T ] t∈[0,T ]

Для непрерывной функции x(t) со значениями в банаховом про-


странстве можно распространить понятие определенного интеграла
Римана. Интеграл будем рассматривать на отрезке [a, b], для этого
рассмотрим разбиение

a = t0 < t1 < · · · < tN = b, λN = max {(ti+1 − ti )}.


i=0,...,N −1

Если для непрерывной на [a, b] функции существует такой элемент


S ∈ X, что имеет место
N
X
lim x(tk )∆tk − S = 0,

λN →0
k=1 X

где ∆tk = tk − tk−1 , то мы будем говорить, что S есть интеграл от


функции x на [a, b] и писать

Zb
x(t)dt = S.
a

Аналогично, как это делается в курсе математического анализа, мож-


но показать, что для любой непрерывной функции со значениями в
банаховом пространстве существует определенный интеграл.

14. О линейных операторах в банаховых


пространствах
Основным объектом, изучаемым в курсе функционального анализа
являются линейные операторы в различных пространствах, особенно
в банаховых пространствах. В дальнейшем мы будет систематически
изучать такие линейные операторы, но сейчас рассмотрим самые ос-
новные определения и факты об ограниченных линейных операто-
рах.

60
Для двух банаховых пространств (возможно, совпадающих) X и
Y линейным оператором, действующим из X в Y называется отоб-
ражение
A : X → Y,
удовлетворяющее следующему условию

A(λx1 + µx2 ) = λAx1 + µAx2 ,

для всех x1 , x2 ∈ X и λ, µ ∈ C.
Рассмотрим простейшие примеры линейных операторов. Для слу-
чая, когда X = Y через I будем обозначать единичный оператор,
который действует по формуле

Ix = x, x ∈ X.

Для любой пары банаховых пространств рассматривается нулевой


оператор
Ox = 0,
где 0 есть нулевой элемент пространства Y .
Все линейные операторы, действующие из Rn в Rm представляют
собой n × m матрицы, а действие оператора — умножение на эту
матрицу.
Рассмотрим оператор дифференцирования, который действует в
пространствах
D : C 1 [a, b] → C[a, b]
по формуле
dx
(t).
Dx(t) =
dt
Среди линейных операторов принципиальное значение имеют огра-
ниченные или непрерывные линейные операторы. Оператор4 A на-
зывается непрерывным в x0 , если для любой последовательности
xn → x0 имеет место

kAxn − Ax0 kY → 0, n → ∞.

Оператор непрерывный для всех x ∈ X называется непрерывным


оператором.
4
Если не оговорено отличное, все операторы у нас будут линейные.

61
Лемма 14.1. Линейный оператор A непрерывный в нуле является
непрерывным.
Доказательство. Возьмем любое x0 ∈ X и любую последователь-
ность xn → x0 , тогда zn = x0 − xn → 0, при n → ∞. В силу непре-
рывности оператора A в нуле имеем

kAx0 − Axn kY = kA(x0 −n )kY = kAzn kY → 0.

Оператор A называется ограниченным, если для любого x ∈ X


выполнено неравенство

kAxkY ≤ CkxkX , (III.3)

где константа C > 0 не зависит от x. Поэтому ограниченный оператор


отображает ограниченное множество в X в ограниченное множество
Y.
Замечательный результат состоит в том, что в банаховых про-
странствах непрерывность и ограниченность линейных операторов
эквивалентны.
Теорема 14.1. Линейный оператор A ограничен тогда и только
тогда, когда он непрерывен.
Доказательство. Пусть оператор A непрерывен. Предположим, что
он не является ограниченным. Тогда образ замкнутого шара B 1 (0) в
X есть неограниченное множество в Y . Следовательно, существует
такая последовательность xn ∈ B 1 (0), что

kAxn kY ≥ n.

Возьмем x′ = xn /n, тогда имеем


1 1
kx′n kX = kxn kX ≤ → 0, n → ∞.
n n
В силу непрерывности оператора A должно быть kAx′n kY → 0 при
n → ∞. В тоже время,
1
kAx′n kY = kAxn kY ≥ 1.
n
62
Полученное противоречие доказывает, что из непрерывности следует
ограниченность.
Пусть теперь оператор A ограничен. Тогда из неравенства (III.3)
следует, что
kAxn kY → 0, n → ∞,
если kxn kX → 0, n → ∞. Это означает, что оператор A непрерывен
в нуле, но линейный оператор, непрерывный в нуле непрерывен по
лемме 14.1.
Для ограниченных операторов можно определить норму операто-
ра по следующей формуле

kAxkY
kAk = sup = sup kAxkY .
x∈X,x6=0 kxkX kxkX ≤1

Покажем, что сумма A + B двух ограниченных операторов, действу-


ющая в одних и тех же пространствах, является ограниченным опе-
ратором причем
kA + Bk ≤ kAk + kBk.
Действительно, для всех x ∈ X имеем

k(A + B)xkY = kAx + BxkY ≤ kAxkY + kBxkY ≤ (kAk + kBk)kxkX .

Поэтому можно ввести новое нормированное пространство L(X, Y )


состоящее из всех ограниченных операторов, действующих из X в Y
с операторной нормой. В дальнейшем мы увидим, что это простран-
ство является банаховым.

63
Глава IV

Интеграл Лебега и
пространства Lp

15. Интеграл Лебега


Во многих задачах функционального анализа местом действия яв-
ляются функциональные пространства, то есть пространства функ-
ций. Само название функционального анализа исходит из того, что
при изучении функций мы сталкиваемся с бесконечномерными про-
странствами — функциональными пространствами. Мы уже встре-
чались с пространствами непрерывных непрерывно дифференцируе-
мых функций. Однако запас этих функций не достаточен для многих
нужд прикладной и чистой математики. Поэтому мы будем работать
с более широкими пространствами такими, как пространства Лебега
Lp , p ≥ 1.
Вспомним, что на множестве непрерывных функций мы вводили
не только равномерную норму, но и интегральную норму. Для обла-
сти (область — это открытое и связное множество) Q ⊂ Rn будем
обозначать через L(Q), нормированное пространство непрерывных в
Q функций с нормой
Z
kf kL(Q) = |f (x)|dx.
Q

Мы знаем, что такое пространство не является полным, но по тео-


реме 8.2 его можно пополнить. Пополнение этого пространства мы

64
обозначим через L1 (Q). Из чего состоит это пространство? По постро-
ению пополнения это пространство состоит из классов эквивалентно-
сти фундаментальных последовательностей непрерывных функций.
Для понимания эквивалентности двух фундаментальных последова-
тельностей необходимо дать понятие множества меры нуль1 . Множе-
ство N ⊂ Rn называется множеством меры нуль, если существует
такая счетная система отрытых кубов Kk с гранями ak > 0, что объ-
единение этих кубов покрывает множество N

[
N⊂ Kk ,
k=1

но общий объем этих кубов



X
|Ki | < ε,
k=1

где |Kk | = ank есть объем куба Kk .


Покажем, что точка в Rn является множеством меры нуль. Рас-
смотрим точку (x01 , x02 , . . . , x0n ) ∈ Rn . Достаточно одного куба

K1 = {x ∈ Rn : |xi − x0i | ≤ ε},

покрывающего эту точку. Этот куб имеет объем |K1 | = εn , который


может быть сделан сколь угодно малым.
Мы будем говорить, что какое-либо свойство функций выполня-
ется почти всюду в Q, если это свойство выполнено для всех x ∈ Q
за исключением, быть может, множества меры нуль. В частности,
можно рассматривать функции, определенные почти всюду.
Рассмотрим последовательность функций fk (x), определенных по-
чти всюду в Q. Эта последовательность называется сходящейся по-
чти всюду в Q к функции f (x), если для почти всех x′ ∈ Q

lim fk (x′ ) = f (x′ ).


k→∞

Введем принципиально важное определение — определение из-


меримой функции. Функция f (x) называется измеримой в Q, если
1
Сейчас это понятие нужно понимать как одно «множества меры нуль», без
отдельного понятия «мера».

65
существует такая последовательность непрерывных функций fk (x),
которая сходится почти всюду в Q к функции f (x). Очевидно, что
сумма, произведение и суперпозиция измеримых функций являются
измеримыми. Также вместе с f (x) измеримой будет и функция |f (x)|.
Перейдем к определению функций, интегрируемых по Лебегу, и
соответственно интеграла Лебега. Поскольку любую числовую функ-
цию2 можно представить в виде суммы положительной и отрица-
тельной функций, то сначала будем рассматривать неотрицательные
функции.
Неотрицательная почти всюду в Q функция f (x) называется ин-
тегрируемой по Лебегу в Q, если существует последовательность непре-
рывных в Q функций fk (x) почти всюду в Q сходящаяся к f (x) такая,
что
fk+1 (x) ≥ fk (x) (IV.1)
для почти всех x ∈ Q и выполнено условие
Z
fk (x)dx ≤ C.
Q

Для интегрируемой по Лебегу функции интеграл Лебега определя-


ется следующим образом
Z Z Z
f (x)dx = sup fk (x)dx = lim fk (x)dx.
k k→∞
Q Q Q

Как мы увидим ниже для функции, интегрируемой по Риману соб-


ственный интеграл Римана всегда равен интегралу Лебега, поэтому
мы не будем вводить нового обозначения для интеграла Лебега.
Поскольку для определения интеграла Лебега нам необходима
аппроксимирующая последовательность, то для корректности это-
го определения нужно показать независимость значения интеграла
Лебега от аппроксимирующей последовательности. Для произволь-
ной почти всюду неотрицательной функции, интегрируемой по Ле-
бегу f (x), рассмотрим две любые последовательности fk (x) и fk′ (x)
2
Имеется в виду вещественную. Для комплексных функций нужно рассмат-
ривать две функции — вещественную и мнимую части.

66
непрерывных в Q почти всюду в Q сходящихся к f (x) и удовлетво-
ряющим условию (IV.1). Для произвольного m рассмотрим после-

довательность fk (x) − fm (x), k = 1, 2 . . . . При k → ∞ эта последо-

вательность почти всюду в Q сходится к f (x) − fm (x) ≥ 0 и также
удовлетворяющая условию (IV.1), поэтому имеем
Z Z Z
′ ′
lim (fk (x) − fm (x))dx = lim fk (x)dx − fm (x)dx ≥ 0.
k→∞ k→∞
Q Q Q

Следовательно,
Z Z

lim fm (x)dx ≤ lim fk (x)dx.
m→∞ k→∞
Q Q

Меняя местами последовательности fk (x) и fk′ (x), получаем обратное


неравенство. Таким образом, имеет место
Z Z

lim fk (x)dx = lim fk (x)dx.
k→∞ k→∞
Q Q

До этого мы рассматривали только почти всюду в Q неотрица-


тельные функции, но поскольку любая функция f (x) может быть
представлена в виде

f (x) = f + (x) − f − (x),

где f + (x) и f − (x) неотрицательны в Q, то будем говорить, что функ-


ция f (x) интегрируема по Лебегу в Q, если таковыми являются функ-
ции f + (x) и f − (x), а интеграл Лебега в этом случае определяется
следующим образом
Z Z Z
f (x)dx = f + (x)dx − f − (x)dx.
Q Q Q

Таким образом, мы определили интеграл Лебега для функций, инте-


грируемых по Лебегу в Q. В 16 мы дадим общее определение интегра-
ла Лебега по любой мере. Там же мы и рассмотрим многочисленные
свойства интеграла Лебега.

67
Наконец, определим понятие меры Лебега для множеств в Q. Для
любого подмножества L ⊂ Q определим характеристическую функ-
цию χL (x) 
1, x ∈ L
χL (x) =
0, x ∈
/L
Будем говорить, что множество L измеримо по Лебегу, если функция
χL (x) является интегрируемой по Лебегу, а мерой Лебега измеримого
по Лебегу множества называется следующая величина
Z
µ(L) = χL (x)dx.
Q

16. Мера множества и интеграл Лебега по мере


Определенный интеграл, который изучается в математическом ана-
лизе (интеграл Римана), обычно ассоциируется с площадью, ограни-
ченной графиком подынтегральной функции. При этом конструкция
интеграла Римана состоит в разбиение отрезка, по которому ведет-
ся интегрирование. Оказывается, что если производить разбиение не
области, на которой задана функция, а множества значений подын-
тегральной функции, то можно придти к другому значительно более
общему понятию интеграла Лебега.
Ключевым элементом интеграла Лебега является понятие меры
множества. Мера множества есть обобщение понятия объема или
площади множества. Понятие меры множества играет важную роль
во многих фундаментальных и прикладных областях математики.
Рассмотрим некоторое множество Ω, в котором выделим систему
подмножеств A. Эта система называется алгеброй множеств, если
1. Ω ∈ A,
2. для любых A, B ∈ A имеет место A ∪ B ∈ A и A ∩ B ∈ A,
3. для любого A ∈ A верно A ∈ A.
В этом определении требуется замкнутость относительно конечного
объединения и пересечения. Алгебра множеств называется σ-алгеброй,
если дополнительно выполнены условия
[
An ∈ A
n

68
и \
An ∈ A,
n

где A1 , A2 , . . . конечная или счетная последовательность элементов


A.
Пространство X с заданной σ-алгеброй A называется измеримым
пространством, а множества A ∈ A будем называть измеримыми
множествами (относительно σ-алгебры A).
Мерой, заданной на σ-алгебре, называется неотрицательная рас-
ширенная3 числовая функция µ, заданная на элементах A и удовле-
творяющая условию

! ∞
[ X
µ An = µ(An ),
n=1 n=1

для любой последовательности попарно непересекающихся множеств


из A.
Некоторые свойства меры практически очевидны. Во-первых, ме-
ра пустого множества равна нулю. Действительно,

µ(∅) = µ(∅ ∪ ∅) = 2µ(∅),

что возможно только при µ(∅) = 0. Во-вторых, мера большего мно-


жества не меньше. Если A, B ∈ A и A ⊂ B, то

µ(A) ≤ µ(B).

Действительно, B представляется в виде объединения непересекаю-


щихся множество A и B \ A, поэтому

µ(B) = µ(A) + µ(B \ A).

Имеет место следующий важный результат о непрерывности ме-


ры.
Теорема 16.1. Пусть множество A ∈ A представимо в следующем
виде ∞
[
A= Ak , A1 ⊂ A2 ⊂ A3 ⊂ . . . , Ak ∈ A,
k=1

3
То есть функция, которая может принимать значение +∞.

69
тогда для любой меры µ на A имеет место
µ(Ak ) = µ(A), k → ∞.
Доказательство. Определим последовательность множеств
B1 = A1 , Bk = Ak \ Ak−1 .
Тогда мы имеем, что Bi ∩ Bj = ∅, при i 6= j, но
k
[
Ak = Bi
i=1

и ∞
[
A= Bi .
i=1
По σ-аддитивности меры мы имеем
k
[ ∞
[
µ(Ak ) = µ(Bi ) → µ(Bi ) = µ(A).
i=1 i=1

Рассмотрим вещественную функцию f , заданную на множестве


X. Эта функция называется измеримой относительно σ-алгебры A,
если для любого a ∈ R имеет место
{x ∈ X : f (x) > a} ∈ A.
Когда очевидно о какой σ-алгебре идет речь мы будем говорить про-
сто об измеримой функции.
Рассмотрим произвольное измеримое пространство (X, A) с за-
данной мерой µ, а также измеримую функцию f (X). Перейдем к
построению интеграла Лебега от функции f (x) на измеримом мно-
жестве A по мере µ.
Мы часто будем использовать представление f (x) = f + (x)−f − (x),
где f + и f − суть неотрицательные функции. Также будем рассмат-
ривать характеристические функции χE (x) для любого множества
E ⊂ X по следующей формуле

1, x ∈ E
χE (x) =
0, x ∈
/E

70
Функция g(x), заданная на X называется простой, если множество
значений функции g(x) является конечным c1 , c2 , . . . , cN . Определим
множества
En = {x ∈ X : g(x) = cn },
тогда имеет место следующее представление для функции g(x)
N
X
g(x) = cn χEn (x).
n=1

Покажем, что любую функцию можно приблизить простыми функ-


циями

Теорема 16.2. Пусть f (x) вещественная функция на X, тогда су-


ществует последовательность gN (x) простых функций такая, что
для любого x ∈ X имеет место

gN (x) → f (x).

При этом, если функция f (x) является измеримой, то можно вы-


брать такую аппроксимирующую последовательность, что все gN
будут измеримыми.

Доказательство. Используя представление f = f + − f − , можно без


ограничения общности считать, что f (x) ≥ 0. Тогда положим
 
j−1 j
EN j = x ∈ X : N ≤ f (x) ≤ N ,
2 2

FN = {x ∈ X : f (x) ≥ N }
для N = 1, 2, . . . и j = 1, 2, . . . , N 2N .
Теперь можно построить и аппроксимирующую последователь-
ность
N 2N
X j−1
SN (x) = N
χ EN j + N χ F N .
j=1
2

Непосредственной проверкой убеждаемся, что эта последовательность


удовлетворяет условиям теоремы.

71
Для простой измеримой функции g(x) введем интеграл Лебега по
измеримому множеству E ∈ A по следующей формуле
Z N
X
g(x)dµ = cn µ(E ∩ En ).
E n=1

Для неотрицательной измеримой функции мы определим интеграл


Лебега по формуле
Z Z
f (x)dµ = sup g(x)dµ.
0≤g≤f
E E

Заметим, что значение так введенного интеграла Лебега может быть


и бесконечным.
Для произвольной измеримой функции f (x) = f + (x) − f − (x) по-
лагаем Z Z Z
f (x)dµ = f (x)dµ − f − (x)dµ,
+

E E E

если хотя бы один из интегралов в этом выражении конечен. Если


оба интеграла конечны, то функция называется интегрируемой по
Лебегу на E.
Приведем несколько очевидных свойств интегралов Лебега, кото-
рые следуют из определения.

1. Если функция f измерима и ограничена на множестве E и


µ(E) < ∞, то f интегрируема по Лебегу на E.

2. Для измеримой f такой, что a ≤ f (x) ≤ b при x ∈ E и µ(E) < ∞


имеет место Z
aµ(E) ≤ f dµ ≤ bµ(E).
E

3. Для двух интегрируемых по Лебегу на E функций f и g таких,


что f (x) ≤ g(x) при x ∈ E имеем
Z Z
f dµ ≤ gdµ.
E E

72
4. Для интегрируемой4 на E функции и любого числа c ∈ R функ-
ция cf (x) также интегрируема и
Z Z
cf dµ = c f dµ.
E E

5. Если µ(E) = 0, то любая измеримая функция f интегрируема


на E и Z
f dµ = 0.
E

6. Если f интегрируема на E, то она интегрируема и на любом


измеримом множестве E1 , если E1 ⊂ E.
Рассмотрим важную теорему, с помощью которой можно констру-
ировать новые меры.
Теорема 16.3. Для любой измеримой и неотрицательной функции
f определим новую функцию множеств, заданную на всех A ∈ A по
формуле Z
ϕ(A) = f dµ.
A
Функция ϕ является мерой на A.
Доказательство. Прежде всего нужно показать, что так введенная
функция является σ-аддитивной. Возьмем любой счетный набор мно-
жеств Ak ∈ A, k = 1, 2, . . . такой, что Ai ∩ Aj = ∅, если i 6= j.

S
Рассмотрим множество A = Ak . Нам необходимо показать, что
k=1

X
ϕ(A) = ϕ(Ak ). (IV.2)
k=1

Если f есть характеристическая функция некоторого измеримого


множества E, то σ-аддитивность ϕ обеспечивается формулой
Z
χE dµ = µ(A ∩ E)
A
4
Там, где нет оснований для путаницы, мы будем писать просто «интегриру-
емая функция».

73
и свойствами меры µ. Следовательно и для простой функции верно
(IV.2). Для произвольной измеримой простой функции g такой, что
0 ≤ g ≤ f имеет место
Z ∞ Z
X ∞
X
gdµ = gdµ ≤ ϕ(Ak ).
A k=1 A k=1
k

Согласно определению интеграла Лебега отсюда имеем



X
ϕ(A) ≤ ϕ(Ak ). (IV.3)
k=1

Если для какого-нибудь Ak имеет место ϕ(Ak ) = ∞, то (IV.2) вы-


полняется тривиально. Следовательно, будем предполагать, что при
всех k выполнено условие ϕ(Ak ) < ∞.
Для фиксированного ε > 0 можем выбрать простую измеримую
функцию g так, что выполнены неравенства
Z Z Z Z
gdµ ≥ f dµ − ε, gdµ ≥ f dµ − ε.
A1 A1 A2 A2

Далее, имеем
Z Z Z
ϕ(A1 ∪ A2 ) ≥ gdµ = gdµ + gdµ ≥ ϕ(A1 ) + ϕ(a2 ) − 2ε,
A1 ∪A2 A1 A2

следовательно
ϕ(A1 ∪ A2 ) ≥ ϕ(A1 ) + ϕ(A2 ).
Аналогично получаем, что при каждом n имеем

ϕ(A1 ∪ · · · ∪ An ) ≥ ϕ(A1 ) + · · · + ϕ(An ). (IV.4)

В силу включения A1 ∪ · · · ∪ An ⊂ A из (IV.4) следует



X
ϕ(A) ≥ ϕ(Ak ).
k=1

Отсюда и из (IV.3) следует (IV.2).

74
Теперь докажем теорему об модуле интеграла Лебега.
Теорема 16.4. Для любой интегрируемой на E функции f также
интегрируемой на E будет функция |f | и имеет место оценка

Z Z

f dµ ≤ |f |dµ.
(IV.5)

E E

Доказательство. Введем множества A = {x ∈ E : f (x) ≥ 0} и B =


{x ∈ E : f (x) < 0}, при этом E = A ∪ B. По теореме 16.3
Z Z Z Z Z
|f |dµ = |f |dµ + |f |dµ = f + dµ + f − dµ < ∞,
E A B A B

поэтому |f | интегрируема на E. Поскольку f ≤ |f | и −f ≤ |f | то мы


видим, что
Z Z Z Z
f dµ ≤ |f |dµ, − f dµ ≤ |f |dµ,
E E E E

отсюда следует (IV.5)


Поскольку интегралы Лебега играют исключительно важную роль
в функциональном анализе, то мы докажем еще несколько теорем,
которые будем использовать при работе с интегралами Лебега.
Теорема 16.5 (Теорема Леви). На множестве E ∈ A рассмотрим
последовательность измеримых функций {fk } таких, что

0 ≤ f1 (x) ≤ f2 (x) ≤ . . . , x ∈ E.

Определим функцию5 f (x) по формуле

f (x) = lim fk (x), x ∈ E,


k→∞

тогда Z Z
fk dµ → f dµ, k → ∞. (IV.6)
E E

5
Имеется в виду расширенную функцию, которая может принимать и беско-
нечные значения.

75
Доказательство. По условиям теоремы существует такая величина
α, возможно бесконечная, что
Z
fn dµ → α, (IV.7)
E

при n → ∞, при этом Z


α≤ f dµ. (IV.8)
E

Далее, выберем произвольную простую измеримую функцию g таким


образом, что
0 ≤ g(x) ≤ f (x).
Для любого c ∈ (0, 1) определим множества

Ek = {x : fk (x) ≥ cg(x)}, n = 1, 2, . . . .

Построенные таким образом множества обладают свойством, что



[
E1 ⊂ E2 ⊂ E3 ⊂ . . . , E= Ek .
k=1

Таким образом, при любом k имеем


Z Z Z
f dµ ≥ dµ ≥ c gdµ.
E Ek Ek

Переходя к пределу при k → ∞ с учетом теоремы 16.4 и теоремы о


непрерывности меры 16.1 из последнего неравенства получаем
Z
α ≥ c gdµ.
E

В силу произвольности c можем в полученном неравенстве перейти


к пределу c → 1, тогда получим
Z
α ≥ gdµ,
E

76
но по определению интеграла Лебега получаем, что
Z
α ≥ f dµ.
E

Вместе с неравенством (IV.8) это означает, что


Z
f dµ = α.
E

Согласно (IV.7) получаем утверждение теоремы.


Казалось бы, факт, что интеграл от суммы интегрируемых функ-
ций равен сумму интегралов является очевидным, но строгое его до-
казательство требует определенных усилий и привлечение теоремы
Леви.
Теорема 16.6. Пусть f1 и f2 суть интегрируемые на E функции,
тогда f = f1 + f2 также будет интегрируемой на E и
Z Z Z
(f1 + f2 )dµ = f1 dµ + f2 dµ.
E E E

Доказательство. Для простых и положительных функций утвер-


ждение теоремы следует из определение интеграла Лебега.
Предположим, что f1 ≥ 0, f2 ≥ 0. Аппроксимируем их неотрица-
тельными простыми функциями gk1 и gk2 из теоремы 16.2. Положим
gk = gk1 + gk2 . Имеем
Z Z Z
gk dµ = gk1 dµ + gk2 dµ.
E E E

Переходя к пределу при k → ∞ в силу теоремы Леви получаем утвер-


ждение теоремы.
Теперь считаем, что f1 ≥ 0 и f2 ≤ 0. Положим
E + = {x ∈ E : f (x) ≥ 0}, E − = E \ E 1.
На E + функции f , f1 , −f2 неотрицательны, поэтому
Z Z Z Z Z
f1 dµ = f dµ + (−f2 )dµ = f dµ − f2 dµ.
E+ E+ E+ E+ E+

77
Аналогично, функции −f , f1 , −f2 неотрицательны на E − и
Z Z Z
(−f2 )dµ = f1 dµ + (−f )dµ
E− E− E−

откуда следует, что


Z Z Z
f1 dµ = f dµ − f2 dµ.
E− E− E−

Отсюда следует утверждение теоремы.


В общем случае множество E можно разбить на четыре подмно-
жества, на каждом из которых f1 и f2 сохраняют знак. Для этих
областей теорема верна, и суммируя соответствующие равенства, по-
лучаем утверждение теоремы.
Другим важнейшим свойством интеграла Лебега является его непре-
рывность в определенном смысле, установленном в теореме Лебега
??. Сначала докажем следующее вспомогательное утверждение.

Лемма 16.1 (Лемма Фату). Пусть {fk } — неотрицательных изме-


римых функций и

f (x) = lim inf fk (x), x ∈ E,


k→∞

тогда Z Z
f dµ ≤ lim inf fk (x)dµ. (IV.9)
k→∞
E E

Доказательство. Введем функцию g(x) по следующей формуле

gk (x) = inf fn (x), x ∈ E.


n≥k

По построению эта функция будет измеримой на E и для нее выпол-


няются неравенства

0 ≤ g1 (x) ≤ g2 (x) ≤ . . . , (IV.10)

и
gk (x) ≤ fk (x), (IV.11)

78
при этом имеет место

gk (x) → f (x), k → ∞. (IV.12)

Из (IV.10) и (IV.12) по теореме Леви следует, что


Z Z
gk dµ → f dµ.
E E

Из отсюда и из (IV.11) следует (IV.9).


Теперь мы можем доказать фундаментальную теорему Лебега.

Теорема 16.7 (Лебег). Пусть {fn } последовательность измеримых


функций такая, что при почти всех x ∈ E, E ∈ A

fn (x) → f (x), n → ∞.

Если существует такая интегрируемая по Лебегу на E такая, что

|fn (x)| ≤ g(x), n = 1, 2, . . . , x ∈ E, (IV.13)

то имеет место Z Z
lim fn dµ = f dµ. (IV.14)
n→∞
E E

Доказательство. Сразу заметим, что fn и f являются интегрируе-


мыми на E, поскольку в силу неравенств (IV.13) их модуль ограничен
и соответственно ограниченными будут их неотрицательные и отри-
цательные слагаемые (f + и f − ).
По лемме Фату имеем
Z Z
(f + g)dµ ≤ lim inf (fn + g)dµ.
n→∞
E E

Поскольку (fn + g) ≥ 0, то
Z Z
f dµ ≤ lim inf fn dµ. (IV.15)
n→∞
E E

79
С другой стороны, так как (g − fn ) ≥ 0, то
Z Z
(g − fn )dµ ≤ lim inf (g − fn )dµ.
n→∞
E E

Отсюда имеем
 
Z Z
− f dµ ≤ lim inf − fn dµ ,
n→∞
E E

что эквивалентно Z Z
f dµ ≥ lim inf fn dµ.
n→∞
E E

Из этого неравенства и неравенства (IV.15) следует существование


предела в (IV.14) и, само равенство (IV.14).
Мы рассмотрели определение и свойства интеграла Лебега для
произвольного измеримого пространства. Однако в разделе 15 мы
построили меру Лебега и соответственно интеграл Лебега для функ-
ций, заданных на множествах в Rn . Все свойства интеграла Лебега
по мере, рассмотренные в настоящем разделе автоматически выпол-
нены и для интеграла Лебега в Rn .
Приведем примеры интеграла Лебега для других измеримых про-
странств. Например, покажем, что числовой ряд можно интерпрети-
ровать, как интеграл Лебега. Возьмем в на множестве R σ-алгебру,
состоящую из всех подмножеств R. В этом случае любое подмно-
жество R будет измеримым. Меру введем следующим образом. Для
любого подмножества E ⊂ R меру ν определим следующим образом

ν(E) = |E ∩ N+ |,

где N+ = {1, 2, . . . }. Таким образом, мера множества есть количе-


ство положительных целых чисел, содержащихся в этом множестве.
Несложно показать, что так введенная функция множеств ν являет-
ся мерой. Рассмотрим функцию a(x), заданную на всем R. Интеграл
Лебега по отрезку L = [1, N ], где N ∈ N+ , всегда существует и равен
Z N
X
adµ = an ,
L k=1

80

P
где an = a(n). Если |an | < ∞, то эта функция будет интегрируема
k=1
на всем R Z ∞
X
adµ = an .
R k=1

При этом совершенно не важны значения интегрируемой функции на


множестве R \ N+ , поскольку мера6 ν этого множества равна нулю.

17. Пространства Лебега


В этом разделе мы будем рассматривать интегралы Лебега от функ-
ций, интегрируемых по мере Лебега в областях Q ⊂ Rn . Важнейшими
пространствами в функциональном анализе являются пространства
Лебега или пространства Lp (Q). Пусть p ∈ [1, ∞) фиксированное чис-
ло, Q — произвольная область7 , тогда пространство Lp (Q) определя-
ется, как множество измеримых в Q функций8 таких, что функция
|f (x)|p интегрируема в Q
Z
|f (x)|p dx < ∞.
Q

Из элементарного неравенства |a + b|p ≤ 2p−1 (|a|p + |b|p ) верного для


любых комплексных чисел a и b, следует, что сумма двух функций
f, g ∈ Lp (Q) тоже принадлежит Lp (Q). Ясно, что и умножение на
константу не выводит функции из класса Lp (Q), поэтому простран-
ство Lp (Q) есть линейное пространство.
Поскольку интеграл Лебега имеет одинаковое значения для функ-
ций, различающихся на множестве меры нуль, то, на самом деле, мы
будем рассматривать классы эквивалентности функций из Lp (Q), где
функции f и g называются эквивалентными, если

λ({x ∈ Q : f (x) 6= g(x)}) = 0.

Поскольку это не приводит к путанице, множество классов эквива-


лентности мы будем также обозначать через Lp (Q).
6
Но не мера Лебега!
7
Можно рассматривать и произвольное измеримое множество.
8
Вообще говоря, комплексно значных.

81
В этом случае пространства Lp (Q) являются еще и нормирован-
ными с нормой
 1/p
Z
kf kLp (Q) =  |f (x)|p dx .
Q

Только неравенство треугольника среди аксиом нормы нуждается в


доказательстве — остальные аксиомы выполнены очевидно.
Для случая p = 1 неравенство треугольника мы уже рассматри-
вали, поэтому будем рассматривать ситуацию, когда p > 1. Докажем
важное неравенство Гельдера. Для сокращения письма мы будем ис-
пользовать обозначение k·kp = k·kLp (Q) , когда это не может привести
к недоразумениям.
Теорема 17.1 (Неравенство Гельдера). Пусть p > 1 и q > 1 такие,
что p1 + 1q = 1. Если f ∈ Lp (Q), а g ∈ Lq (Q), то произведение f g ∈
L1 (Q) и
kf gk1 ≤ kf kp kgkq . (IV.16)
Доказательство. Вспомним элементарное неравенство
ap bq
+ ≥ ab,
p q
справедливое для любых a, b > 0. Положим в этом неравенстве a =
|f (x)|/kf kp , b = |g(x)|/kgkq , тогда получим

|f (x)||g(x)| 1 |f (x)|p 1 |g(x)|q


≤ + .
kf kp kgkq p kf kpp q kgkqq
Из этого неравенства имеем
1 |f (x)|p 1 |g(x)|q
 
kf (x)g(x)| ≤ kf kp kgkq + . (IV.17)
p kf kpp q kgkqq
Согласно свойствам интеграла Лебега от сюда следует, что функция
|f (x)g(x)| интегрируема по Лебегу на Q. Таким образом, f g ∈ L1 (Q).
Интегрируя (IV.17) по Q имеем

kf gk1 ≤ kf kp kgkq (p−1 + q −1 ) = kf kp kgkq .

82
Перейдем к неравенству треугольника для нормы в Lp (Q). Для
любых f, g ∈ Lp имеем
Z
kf + gkpp ≤ (|f (x)| + |g(x)|)|f (x) + g(x)|p−1 dx. (IV.18)
Q

Функция h(x) = |f (x) + g(x)|p−1 принадлежит пространству Lq (Q),


где p−1 + q −1 = 1. Согласно неравенству Гельдера мы имеем
Z
h(x)|f (x)|dx ≤ khkq kf kp
Q

и Z
h(x)|g(x)|dx ≤ khkq kgkp .
Q

Поскольку khkqq = kf + gkpp , то

khkq = kf + gkp/q
p = kf + gkpp−1 ,

следовательно
Z
|f (x)||f (x) + g(x)|dx ≤ kf kp kf + gkpp−1
Q

и Z
|g(x)||f (x) + g(x)|dx ≤ kgkp kf + gkpp−1 .
Q

Из (IV.18) получаем

kf + gkpp ≤ (kf kp + kgkp )kf + gkpp−1 ,

откуда следует, что

kf + gkp ≤ kf kp + kgkp .

Таким образом, пространства Лебега Lp (Q) являются нормирован-


ными пространствами. Покажем, что эти пространства являются и
банаховыми пространствами, то есть полными.

83
Теорема 17.2. Пространства Lp (Q) полные.
Доказательство. Рассмотрим произвольную фундаментальную в Lp (Q)
последовательность {fn }. Из этой последовательности выберем под-
последовательность {fnk } такую, что

X
kfnk+1| − fnk k < ∞.
n=1

Построим последовательность функций


N
X
gN (x) = |fn1 (x)| + |fnk+1 (x) − fnk (x)|,
k=1

также принадлежащих Lp (Q) при всех N . Применяя лемму Фату,


получаем Z
lim (gN (x))p dx ≤ lim inf kgN kpp
N →∞ N →∞
Q

!p
X
≤ kfn1 kp + kfnk+1 (x) − fnk (x)kp .
n=1

Следовательно,почти всюду в Q существует конечный предел lim gN (x),


N →∞
также почти всюду существует и конечный предел

lim fnN +1 (x) = f (x).


N →∞

При этом f ∈ Lp (Q), поскольку |fnN +1 (x)| ≤ lim gN (x) ∈ Lp (Q). В


N →∞
силу леммы Фату имеем
Z ∞
!p
X
kf − fnk kpp = ( lim |fnN (x) − fnk (x)|p dx ≤ kfnl+1 − fnl kp .
N →∞
Q l=k

Поэтому подпоследовательность fnk сходится к f в Lp (Q) при k → ∞.


Покажем, что и вся последовательность сходится к f

lim sup kf − fn kp ≤ lim sup kf − fnk kp + lim sup kfnk − fn kp = 0.


n→∞ k→∞ k,n→∞

84
В функциональном анализе важнейшее значения имеют простран-
ства L1 (Q) и L2 (Q). Первое пространство описывает класс интегриру-
емых по Лебегу функций, а второе пространство играет выдающуюся
роль, поскольку является гильбертовым пространством.

85
Глава V

Гильбертовы пространства

18. Скалярное произведение


Многие абстрактные пространства (метрические, нормированные) вво-
дились, как обобщение естественного евклидового пространства Rn ,
точнее, даже R3 или R2 . Но «обычное» пространство имеет важное
геометрическое свойство — между двумя векторами можно опреде-
лить угол, а наличие угла позволяет дать говорить о перпендикуляр-
ных векторах. На перпендикулярности основано декартово произве-
дение, что дает возможность применять мощь аналитической геомет-
рии. Гильбертовы пространства, к изучению которых мы приступа-
ем, обобщают некоторые геометрические свойства Rn .
Для определения угла и перпендикулярности в Rn используется
скалярное произведение векторов, которое определяется формулой

(x, y) = x1 y1 + x2 y2 + · · · + xn yn ,

где x, y ∈ Rn , x = (x1 , . . . , xn ), y = (y1 , . . . , yn ).


Обобщим скалярное произведение на какое-нибудь бесконечно мер-
ное пространство. В каком пространстве следует вводить скалярное
произведение? Первое, что приходит на ум — это линейное простран-
ство R∞ , состоящее из векторов с счетным количеством компонент.
По аналогии скалярное произведение в таком пространстве должно
выглядеть следующим образом

X
(x, y) = xk yk . (V.1)
k=1

86
Но для любых двух x, y ∈ R∞ ряд (V.1) может не сходиться. Выходом
является использовать такое пространство последовательностей, для
элементов которого можно гарантировать сходимость ряда (V.1). И
такое пространство, действительно существует и является основным
представителем гильбертовых пространств.
Чтобы дать определение гильбертова пространства, необходимо
дать определения для абстрактного скалярного произведения1 . Рас-
смотрим линейное пространство H. Скалярным произведением в H
является комплекснозначная2 функция, определенная на паре эле-
ментов x, y ∈ H, и обозначаемая (x, y), которая удовлетворяет сле-
дующим аксиомам скалярного произведения
1. (x, x) ≥ 0, причем (x, x) = 0 только тогда, когда x = 0.

2. (x, y) = (y, x).

3. (λx, y) = λ(x, y) для любого числа λ.

4. (x + z, y) = (x, y) + (x, y).


Из этих аксиом следует, что

(x, y + z) = (x, y) + (x, z), (x, λy) = λ(x, y).

Пространство, в котором можно ввести скалярное произведение,


называется предгильбертовым пространством. Прежде чем привести
примеры покажем, что любое предгильбертово пространство явля-
ется нормированным с нормой, индуцируемой скалярным простран-
ством p
kxk = (x, x).
Поскольку для любого x ∈ H число (x, x) неотрицательное, то эта
формула корректна. Проверим основные свойства нормы. Неотрица-
тельность нормы и равенство нулю только при нулевом x очевидны.
Для произвольных x ∈ H и λ ∈ C имеем
p q p p
kλxk = (λx, λx) = λλ(x, y) = |λ|2 (x, x) = |λ|kxk.
1
В английском языке «inner product», поэтому иногда скалярное произведение
называется внутренним произведением.
2
Если пространство H над полем вещественных чисел, то скалярное произве-
дение будет вещественным.

87
Прежде чем доказывать выполнение для нормы неравенства тре-
угольника, докажем важнейшее неравенство Коши-Буняковского3 Рас-
смотрим любые x, y ∈ H и λ ∈ C, предполагая, что y 6= 0 имеем

(x + λy, x + λy) = (x, x) + λ(x, y) + λ(y, x) + |λ|2 (y, y) ≥ 0.

Положим λ = − (x,y)
y,y
, получаем

|(x, y)|2
(x, x) − ≥ 0.
y, y
Отсюда получаем неравенство Коши-Буняковского

|(x, y)| ≤ kxkkyk.

Если y = 0, то это неравенство тривиально.


Теперь покажем, что для введенной нормы выполняется неравен-
ство треугольника. Действительно,

kx+yk2 = (x+y, x+y) = (x, x)+(x, y)+(y, x)+(y, y) ≤ kxk2 +2kxkyk+kyk2 .

Это неравенство означает, что

kx + yk ≤ kxk + kyk.

При рассмотрении различных предгильбертовых пространств мы


будем пользоваться обозначением для скалярного произведения (x, y)H
в пространстве H.
Рассматривая предгильбертово пространство, мы всегда будем
иметь в виду норму в этом пространстве, которая будет определена
скалярным произведением. Далее, поскольку любое нормированное
пространство является и метрическим, то метрическим является и
предгильбертово пространство. Соответственно, мы будем говорить
о сходимости в предгильбертовом пространстве.

Теорема 18.1. Скалярное произведение есть непрерывная функция


двух аргументов.
3
Иногда еще называемое неравенство Шварца, или Коши-Буняковского-
Шварца.

88
Доказательство. Пусть xn → x, yn → y при n → ∞ в пространстве
H. Имеем

|(xn , yn )H − (x, y)H | = |(xn , yn )H − (xn , y)H + (xn , y)H − (x, y)H | ≤

|(xn , yn )H − (xn , y)H | + |(xn , y)H − (x, y)H | =


|(xn , yn − y)H + |(xn − x, y)H | ≤ |kxn kH kyn − ykH + kykH kxn − xkH ≤
C(kyn − ykH + kxn − xkH ) → 0, n → ∞,
где C = C(x, y), но не зависит от n.
Полное предгильбертово пространство называется гильбертовым
пространством.

19. Примеры гильбертовых пространств


Конечномерные гильбертовы пространства полностью исчерпывают-
ся пространствами Rn для вещественных и Cn для комплексных про-
странств4 . Скалярное произведение в Rn мы уже вводили, а в Cn оно
выглядит следующим образом

(x, y)Cn = x1 y 1 + x2 y 2 + · · · + xn y n .

Пространство l2 является примером бесконечномерного гильбер-


това пространства. Скалярное произведение в этом пространстве вво-
дится по следующей формуле

X
(x, y)l2 = xk y k .
k=1

Покажем, что для любых x, y ∈ l2 определено скалярное произведе-


ние. Для любого N верно неравенство (II.1)
N 2 N N
X X X
2
xk y k ≤ |ak | · |bk |2 ,



k=1 k=1 k=1

переходя к пределу при N → ∞ получаем, то сходимость ряда в


определении скалярного произведения.
4
Позже мы докажем это утверждение.

89
Все аксиомы скалярного произведения проверяются непосредствен-
но. Например,

X ∞
X
(x + z, y)l2 = (xk + zk )y k = (xk y k + zk y k ) =
k=1 k=1


X ∞
X
xk y k + zk y k = (x, y)l2 + (z, y)l2 .
k=1 k=1

Покажем полноту этого пространства. Для этого выберем про-


извольную фундаментальную последовательность {xn } ⊂ l2 . Будем
использовать обозначение xn = {xnk }. Поскольку


!1/2
X
|xkn+p − xnk | ≤ |xln+p − xnl |2 = kxn+p − xn kl2 ,
l=1

то при каждом фиксированном k числовая последовательность {xnk }∞


n=1
является фундаментальной в C, поэтому существует предел

x∞ n
k = lim xk .
n→∞

Рассмотрим последовательность комплексных чисел x∞ = {x∞ k } и


n
покажем, что она принадлежит l2 . Из фундаментальности x следует,
что для любого ε > 0 существует такой N , что при всех n > N и
любом p выполняется неравенство

!1/2
X
kxn+p − xn kl2 = |xkn+p − xnk |2 < ε.
k=1

Следовательно для любого N имеет место


N
!1/2
X
|xkn+p − xnk |2 < ε.
k=1

В последнем неравенстве можно перейти к пределу при p → ∞

N
!1/2
X
|x∞ n 2
k − xk | ≤ ε.
k=1

90
Далее перейдем к пределу при N → ∞


!1/2
X
|x∞ n 2
k − xk | ≤ ε.
k=1

Полученное неравенство можно записать как

kx∞ − xn kl2 ≤ ε,

верное для всех n > N . В силу линейности x∞ = xn − (x∞ − xn ) ∈ l2 ,


при этом
lim xn = x∞ .
n→∞

Другим классическим гильбертовым пространством является про-


странство Лебега L2 (Q) со скалярным произведением
Z
(f, g)L2 (Q) = f (x)g(x)dx.
Q

Покажем, что для любых двух f, g ∈ L2 (Q) их произведение f g ∈


L2 (Q). Действительно, имеет место
Z Z
kf k2L2 (Q) + 2 |f (x)g(x)|dx + kgk2L2 (Q) = (|f (x)| + |g(x)|)2 dx.
Q Q

Поскольку сумма функций |f (x)| + |g(x)| принадлежит L2 (Q), то


Z
|f (x)g(x)|dx < ∞.
Q

Аксиомы скалярного произведения также проверяются непосредствен-


но и следуют из линейности интеграла Лебега.
Наконец, по теореме 17.2 пространство L2 (Q) полное и поэтому
гильбертово.
Гильбертовы пространства не обладают большим разнообрази-
ем, но мы покажем, как можно создать шкалы гильбертовых про-
странств на основании пространств l2 и L2 (Q). Для любого, s ≥ 0

91
рассмотрим пространство числовых последовательностей l2s состоя-
щее из всех последовательностей, для которых выполнено условие

X
e2sk |xk |2 < ∞.
k=1

Другими словами, x ∈ l2s тогда и только тогда, когда последователь-


ность {esk xk } принадлежит l2 . Ясно, что если x, y ∈ l2s , то x + y ∈ l2s ,
поскольку esk xk + esk yk = esk (xk + yk ). Поэтому это линейное про-
странство. Скалярное произведение выглядит следующим образом

X
(x, y)l2s = e2sk xk y k .
k=1

Имеет место следующее соотношение

(x, y)l2s = ({esk xk }, {esk yk })l2 ,

из которого следуют аксиомы скалярного произведения.


Введем линейный оператор

Ts : l2 → l2s ,

действующий по формуле

Ts [(x1 , x2 , . . . , xk , . . . )] = (e−s x1 , e−2s x2 , . . . , e−sk xk , . . . ).

Этот оператор ограничен и его норма kTs k = 1. Рассмотрим также


линейный оператор
T−s : l2s → l2 ,
действующий по формуле

T−s [(x1 , x2 , . . . , xk , . . . )] = (es x1 , e2s x2 , . . . , esk xk , . . . ).

Этот оператор также будет ограниченным с нормой kT−s k = 1. Более


того, очевидно, что для любой x ∈ l2

T−s [Ts x] = x

и для любой y ∈ l2s


Ts [T−s y] = y.

92
Полнота пространства l2s следует из полноты l2 . Действительно,
для любой фундаментальной последовательности xn ∈ l2s последова-
тельность y n = T−s xn будет фундаментальной в l2 , имеющей предел
y ∈ l2 . В силу непрерывности оператора Ts имеем

Ts y n → Ts y, n → ∞,

но поскольку y n = T−s xn , поэтому

Ts y n = Ts [T−s xn ] = xn → Ts y.

Это означает, что последовательность xn сходится в l2s .


Рассмотрим еще пример гильбертова пространства. Для любой
непрерывной функции a(x), заданной на (−∞, ∞) и такой, что

0 < a0 ≤ a(x).

Введем весовое пространство La2 (R) состоящая из измеримых функ-


ций на R таких, что
Z∞
a2 (x)|f (x)|2 dx < ∞.
−∞

Скалярное произведение вводим по формуле


Z∞
(f, g)La2 (R) = a2 (x)f (x)g(x)dx.
−∞

Чтобы убедиться в полноте этого пространства нужно использовать


операторы
Ta : L2 (R) → La2 (R)
и
Ta−1 : La2 (R) → L2 (R).
Действующие по формулам

Ta [f (x)] = a(x)f (x)

и
Ta−1 [f (x)] = a−1 (x)f (x).

93
Легко видеть, что эти операторы линейные и непрерывные. При этом

Ta [Ta−1 f ] = f, f ∈ La2 (R)

и
Ta−1 [Ta f ] = f, f ∈ L2 (R).
Для фундаментальной последовательности fn в La2 (R) последователь-
ность Ta−1 fn будет фундаментальной и сходящейся в L2 (R) к g. Со-
ответственно, fn → Ta g.

20. Геометрия гильбертова пространства


Основной смысл гильбертова пространства состоит в том, что для
элементов этого пространства можно определить геометрические со-
отношения.
Рассмотрим гильбертово пространство H. Будем говорит, что два
элемента x, y ∈ H ортогональны, если выполнено условие

(x, y)H = 0.

Система элементов {ek } ⊂ H называется ортогональной, если имеет


место
(ek , em ) = 0, k 6= m.
Если при этом все вектора ek имеют норму равную единице, то такая
система называется ортонормированная

1, k = m
(ek , em ) =
0, k 6= m

Ортонормированные системы играют важную роль во многих при-


ложениях, поэтому необходимо иметь процедуру для построения ор-
тонормированных систем. Исходным материалом для построения та-
ких систем будут выступать линейно независимые элементы. Этот
процесс называется процессом ортогонализации Шмидта.
Пусть задана система5 линейно независимых элементов {xk }. По-
ложим
y1 = x1
5
Конечная или бесконечная.

94
и
y1
e1 = .
ky1 kH
Очевидно, что ke1 kH = 1. Далее, следующий элемент y2 ищем в виде

y2 = x2 − λ21 e1 ,

где скаляр λ21 выбираем так, чтобы (y2 , e1 )H = 0. Именно

0 = (x2 − λ21 e1 , e1 )H = (x2 , e1 )H − λ21 ,

то есть λ21 = (x2 , e1 )H или y2 = x2 −λ21 e1 . При этом y2 6= 0, поскольку


это бы противоречило линейной независимости xk . Положим
y2
e2 = .
ky2 kH

Воспользуемся доказательством с помощью математической ин-


дукции. Предположим, что e1 , e2 , . . . , ek−1 уже построены, тогда ищем
yk в виде
k−1
X
yk = xk − λkl el .
l=1

Коэффициенты λkl найдем из условий

(yk , el ) = 0, l = 1, 2, . . . , k − 1.

Легко видеть, что λkl = (xk , el )H , при этом yk 6= 0 и положим


yk
ek = .
kyk kH

Таким образом, мы получаем ортонормированную систему {ek }. Ра-


зумеется, максимальное количество ортонормированных элементов
совпадает с размерностью гильбертова пространства. При этом лишь
в бесконечномерных пространствах существует счетная система ор-
тонормированных элементов.
В пространстве l2 самой простой ортонормированной системой яв-
ляется набор векторов

e1 = (1, 0, 0, . . . ); e2 = (0, 1, 0, . . . ); e3 = (0, 0, 1, . . . ); ....

95
Рассмотрим пример ортонормированной системы в гильбертовом
пространстве L2 (0, π). Ортонормированной системой в этом простран-
стве будет, например, система функций
r
2
ek = sin kx, k = 1, 2, . . . .
π
Если k 6= m, то

2
(ek , em )L2 (0,π) = sin kx sin mxdx = 0.
π
0

Однако
Zπ Zπ
2 2 1 − cos 2kx
(ek , ek )L2 (0,π) = sin2 kxdx = dx = 1.
π π 2
0 0

Для вещественного гильбертова пространства можно определить


угол ϕ между двумя элементами x и y

(x, y)
cos ϕ = .
kxkkyk

Неравенство Коши-Буняковского гарантирует, что | cos ϕ| ≤ 1. При


этом ортогональность ненулевых элементов означает, что угол между
этими элементами равен 90◦ .
Как известно, любое скалярное произведение порождает соответ-
ствующую норму, при этом гильбертова норма обладает важным экс-
клюзивным свойством — равенства параллелограмма. Для любых
x, y ∈ H имеет место равенство

kx + yk2H + kx − yk2H = 2(kxk2H + kyk2H ). (V.2)

Действительно,

kx + yk2H + kx − yk2H = (x + y, x + y)H + (x − y, x − y)H =

(x, x)H +(x, y)H +(y, x)H +(y, y)H +(x, x)H −(x, y)H −(y, x)H +(y, y)H =
2(kxk2 + kyk2H ).

96
С помощью этого равенства можно решить важный вопрос о рас-
стоянии точки до замкнутого выпуклого множества. В гильберто-
вом пространстве H фиксировано выпуклое замкнутое множество
M ⊂ H, тогда для любого элемента x ∈ H расстояние между x и M
определяется по формуле
̺(x, M ) = inf kx − ukH .
u∈M

Теорема 20.1. Если x ∈


/ M , тогда ̺(x, M ) > 0.
Доказательство. Докажем это утверждение от противного. Предпо-
ложим, что ̺(x, M ) = 0, тогда для любого n должен существовать
un ∈ M такой, что
1
kx − un kH ≤ .
n
Отсюда следует, что un → x при n → ∞. Вследствие замкнутости M
мы получаем, что x ∈ M . Это противоречие доказывает теорему.
Более сильный результат говорит о существовании вектора гиль-
бертова пространства на котором достигается расстояние до множе-
ства M .
Теорема 20.2. Для любого x ∈
/ M существует единственный y ∈
M такой, что
̺(x, M ) = kx − ykH .
Доказательство. В силу теоремы 20.1 величина ̺(x, M ) = d > 0,
поэтому для любого n существует un ∈ M такое, что
1
d ≤ kx − un kH < d + . (V.3)
n
Согласно равенству параллелограмма имеем
2(kx − un k2H + kx − um k2H ) = kun − um k2H + k2x − un − um k2H .
Запишем 2
u n + u m
k2x − un − um k2H = 4

x − .
2
H
Поскольку в силу выпуклости M имеем un +u
2
m
∈ M , то
2
u
x − n
+ u m
≥ d2 .
2
H

97
Согласно неравенству (V.3) мы имеем
 2  2
1 1
kx − un k2H < d + ; kx − um k2H < d + .
n m
Таким образом, получаем
2
u n − u m
um k2H un k2H um k2H

kun − = 2kx − + 2kx − − 4 x − <
2
H
 2  2
1 1 4d 4d 2 2
2 d+ +2 d+ − 4d2 = + + 2 + 2.
n m n m n m
Следовательно, при достаточно больших n и m величина kun − um kH
меньше любого ε > 0, что означает фундаментальность последова-
тельности un . Эта последовательность в силу полноты H и замкну-
тости M сходиться к y ∈ M .
Переходя в неравенстве (V.3) к пределу при n → ∞, получаем,
что kx − ykH = d. Покажем единственность этого элемента. Предпо-
ложим, что для некоторого z ∈ M выполнено равенство kx − zk = d.
Согласно равенству параллелограмма имеем
2
2 2 2 2
y + z
4d = 2kx − ykH + 2kx − zkH = ky − zkH + 4 x −

2 H

ky − zk2H + 4d2 .
Из этого следует, что ky − zkH = 0 или y = z.
Смысл этой теоремы состоит в том, что для любого элемента x ∈
H существует единственное наилучшее приближение элементами из
M.
Аналогично можно ввести понятие расстояния от заданной точки
до подпространства. Пусть L ⊂ H есть подпространство в гильберто-
вом пространстве H. Для любого x ∈ H такого, что x ∈
/ L определим
расстояние по формуле

̺(x, L) = inf kx − ukH .


u∈L

Поскольку по определению подпространства L есть замкнутое и вы-


пуклое множество в H, то для расстояние до подпространства верны
теоремы 20.1 и 20.2.

98
Введем еще пару важных понятий для гильбертова пространства.
Пусть L есть подпространство в гильбертовом пространстве H эле-
мент y ∈ L называется проекцией элемента x ∈ H, если

x = y + z,

где z ортогонален всем элементам множества L. Покажем, что для


любого x проекция на L единственная. Пусть существует два пред-
ставления
x = y + z, x = y ′ + z ′ ,
где y, y ′ ∈ L, а z, z ′ ортогональны всем элементам множества L. Тогда

y − y′ = z − z′,

соответственно

ky − y ′ kH = (z ′ − z, y − y ′ )H = 0,

поскольку y − y ′ ∈ L, а z ′ − z ортогонален L. Следовательно, y = y ′ .


Множество элементов M , ортогональных всем элементам множе-
ства L, является также подпространством H. Из непрерывности ска-
лярного произведения следует, что M является замкнутым множе-
ством, то есть линейным многообразием. Это многообразие называ-
ется ортогональным дополнением к L и используется обозначение

M = H ⊖ L.

21. Ряды Фурье в гильбертовом пространстве


Декартово произведение, позволяющее ввести прямоугольную систе-
му координат сыграло выдающуюся роль в развитии геометрии (и
не только). Обобщение этого метода — использование базисных эле-
ментов, позволяющих проводить «разложение» любого элемента по
базису — является мощным средством в алгебре, анализе и много-
численных приложениях, и не только в математике. Использование
рядов Фурье один из самых рабочих элементов в физике и механике.
Хорошо известны базисы в конечномерных пространствах, в бес-
конечномерном случае используются ряды Фурье для периодических
числовых функций. А до каких пределов возможно обобщение идей

99
Декарта и Фурье? В известном смысле это обобщение получается в
сепарабельном гильбертовом пространстве.
Будем рассматривать гильбертово пространство H, которое бу-
дем предполагать бесконечномерным, поэтому в этом пространстве
существует бесконечное множество линейно независимых элементов
x1 , x2 , . . . . Согласно процедуре ортогонализации Шмидта существует
ортонормированная система элементов, которую мы будем обозна-
чать {ek }∞ k=1 и для нее будет верно

(ek , em )H = 0, k 6= m; kek kH = 1.
По аналогии с тригонометрическим рядом мы будем формаль-
ный6 ряд вида

X
ak ek , ak ∈ C
k=1
называть рядом по ортогональной системе ek . Для любого x ∈ H
набор чисел
ck = (x, ek )H , k = 1, 2, . . .
называется коэффициентами Фурье элемента x по системе ek .
Линейной оболочкой для конечной системы элементов y1 , . . . , yN ∈
H называется N -мерное подпространство LN , состоящее из всех ком-
бинаций
XN
y= ak yk .
k=1
Рассмотрим вопрос о возможности наилучшего приближения любого
элемента x ∈ H подпространствами LN . Как мы помним этот вопрос
связан с вычислением расстояния от x до LN . Ответ содержится в
следующей теореме.
Теорема 21.1. Для любого x ∈ H имеет место
N

X
̺(x, LN ) = dN = x − ck ek , (V.4)


k=1 H

N
X
d2N = kxk2H − |ck |2 , (V.5)
k=1
6
То есть без вопроса о его сходимости.

100
где ck = (x, ek )H суть коэффициенты Фурье элемента x по системе
ek .
Доказательство. Для любого элемента L, представляемого в виде
N
P
ak ek , рассмотрим
k=1

N
2 N N
!
X X X
x − ak ek = x− ak ek , x − ak ek =


k=1 H k=1 k=1 H

N
X N
X N
X
(x, x)H − ak (ek , x)H − ak (x, ek )H + ak ak .
k=1 k=1 k=1

Пользуясь обозначением для коэффициентов Фурье ck = (x, ek )H ,


(ek , x)H = (x, ek )H = ck , имеем
N
2 N N N
X X X X
2
x − ak ek = kxkH − ak ck − ak ck + ak ak .


k=1 H k=1 k=1 k=1

Кроме того, имеем

|ak − ck |2 = (ak − ck )(ak − ck ) = ak ak − ak ck − ck ak + |ck |2 ,

следовательно
N
2 N N
X X X
2 2
x − ak ek = kxkH − |ck | + |ak − ck |2 .


k=1 H k=1 k=1

Вычислим ̺(x, LN )
N
N
!1/2
X X
dN = ̺(x, LN ) = inf x − ak ek = kxk2H − |ck |2 ,

a1 ,...,aN
k=1 H k=1

при этом ak = ck .
Из этой теоремы следует, что наилучшее приближение элемента
x ∈ H элементом из LN есть
N
X
ck ek , ck = (x, ek )H .
k=1

101
Поскольку ̺(x, LN ) ≥ 0, то для любого N имеет место оценка
N
X
|ck |2 ≤ kxk2H .
k=1

В силу неотрицательности слагаемых ряда можно перейти к пределу


при N → ∞ и получить

X
|ck |2 ≤ kxk2H .
k=1

Это неравенство называется неравенством Бесселя. Из неравенства


Бесселя следует, что для любого элемента гильбертова пространства,
модуль коэффициентов Фурье стремится к нулю, как общий член
абсолютно сходящегося числового ряда.
Если для выбранной ортонормированной системы {ek } ряд Фурье
для любого x ∈ H сходится к x то есть

X
x= (x, ek )H ek ,
k=1

то такая система называется полной или ортонормированным бази-


сом в H.
В силу теоремы 21.1 мы имеем равенство
N
2 N
X X
2
x − ck ek = kxkH − |ck |2 .


k=1 H k=1

Для базиса в этом равенстве можно перейти к пределу при N → ∞,


тогда мы получаем равенство

X
kxk2H = |ck |2 ,
k=1

которое называется равенство Парсеваля. Равенство Парсеваля обоб-


щает теорему Пифагора.
Теорема 21.2. Ортонормальная система {ek } является базисом
тогда и только тогда, когда не существует ненулевого x0 ∈ H та-
кого, что
(x0 , ek )H = 0, k = 1, 2 . . .
то есть ортогонального всем ek .

102
Доказательство. Пусть система ek есть базис, тогда

X
0< kx0 k2H = |(x0 , ek )H |2
k=1

следовательно существует (x0 , ek0 ) 6= 0, и x0 не ортогонален всем ek .


Теперь предположим, что не существует элемента, ортогонально-
го всем ek . Рассмотрим L — подпространство, определенное по фор-
муле
[∞
L= LN .
k=1

Если предположить, что L 6= H, тогда по теореме 20.2 существуют


такие x0 ∈
/ L и y0 ∈ L, что

kx0 − y0 kH > 0.

Покажем, что для z = x0 − y0 имеет место

(z, y)H = 0, y ∈ L.

Пусть y ∈ L, λ ∈ C, тогда имеем

kz + λykH ≥ kzkH .

Распишем это неравенство

(z + λy, z + λy)H ≥ (z, z)H .

или
λ(y, z)H + λ(z, y)H + |λ|2 kyk2H ≥ 0.
Полагая
(z, y)H
λ=− ,
kyk2H
получаем
|(z, y)H |2
− ≥ 0,
kyk2H
что возможно только, если (z, y) = 0. Это означает, что элемент z 6= 0
ортогонален всем ek и это противоречие говорит о том, что L = H.

103
Наконец, покажем, что любой элемент x ∈ H может быть раз-
ложен по системе ek в ряд Фурье. Поскольку L плотна в H, то для
любого ε > 0 существует такой xε ∈ L, что kx − xε kH < ε, при этом
xε есть конечная линейная комбинация ek . По теореме 21.1 мы имеем
оценку
N
X
x − ck ek ≤ kx − xε kH < ε,


k=1 H
для N > Nε , где ck суть коэффициенты Фурье. Следовательно,

X
ck ek = x.
k=1

Вопрос о существовании ортонормированного базиса в гильбер-


товом пространстве решается в следующей теореме.
Теорема 21.3. В любом сепарабельном бесконечномерном гильбер-
товом пространстве существует ортонормированный базис.
Доказательство. В бесконечномерном сепарабельном пространстве
H существует счетное всюду плотное множество g1 , g2 , . . . . Без огра-
ничения общности, можем считать, что все gk 6= 0, тогда полагаем
g1
e1 = .
kg1 kH
Пусть L1 есть подпространство в H, порожденное e1 . Далее, переби-
рая элементы gk , найдем gn2 такой, что gn2 ∈
/ L1 . Обозначим через h2
проекцию элемента gn2 на H −L1 , поскольку эта проекция ненулевая,
то положим
h2
e2 = .
kh2 kH
Через L2 обозначим подпространство, порожденное элементами e1 , e2 .
Продолжая аналогично, построим счетную систему

e1 , e2 , . . . , ek , . . . .

Поскольку каждый элемент gk принадлежит некоторому подпростран-


ству Lm , то подпространство порожденное системой ek совпадает с
H.

104
Рассмотрим пример базиса в гильбертовом пространстве L2 (0, 2π),
состоящего из тригонометрических функций
(2π)−1/2 , π −1/2 cos x, π −1/2 sin x, π −1/2 cos 2x, π −1/2 sin 2x, . . . (V.6)
Непосредственно проверяется, что эти функции являются ортонор-
мированной системой. Покажем их полноту. Возьмем произвольную
f ∈ L2 (0, 2π). Для любого ε1 > 0 существует такая f1 ∈ C[0, 2π], что
kf − f1 kL2 (0,2π) < ε1 .
Далее, для любого ε2 > 0 построим непрерывную на [0, 2π] функцию
f2 такую, что
kf1 − f2 kL2 (0,2π) < ε2
и
f2 (0) = f2 (2π),
то есть функция f2 есть непрерывная 2π-периодическая функция.
Такую функцию всегда можно построить с помощью линейной ин-
терполяции на достаточно малом сегменте [0, δ]. По теореме Вейер-
штрасса любую непрерывную 2π-периодическую функцию с любой
точностью можно приблизить тригонометрическим многочленом, то
есть конечной линейной комбинацией функций из (V.6). Таким об-
разом, замыкание в L2 (0, 2π) множества линейных комбинаций (V.6)
совпадает с L2 (0, 2π), что в свою очередь говорит о том, что толь-
ко нулевой элемент может быть ортогонален всем (V.6), поэтому по
теореме 21.2 рассматриваемая система тригонометрических функций
есть ортонормированный базис в L2 (0, 2π)
Мы видели, что при наличии ортонормированного базиса в гиль-
бертовом пространстве любой элемент этого пространства можно раз-
ложить по базису. С другой стороны, с помощью базиса возможно и
конструировать любые элементы гильбертова пространства.
Теорема 21.4 (Рисс-Фишер). Для любого гильбертова простран-
ства H и ортонормированного базиса ek и любой числовой после-
довательности c = {ck } ∈ l2 существует такой элемент f ∈ H,
что
ck = (f, ek )H
и ∞
X
kf k2H = |ck |2 = kck2l2 .
k=1

105
Доказательство. Построим
n
X
fn = ck ek .
k=1

Покажем, что эта последовательность фундаментальна в H. Дей-


ствительно,
n+p
X
2
kfn+p − fn kH = |ck |2 .
k=n+p

n+p
|ck |2 → 0, при n → ∞,
P
Поскольку последовательность c ∈ l2 , то
k=n+p
что доказывает фундаментальность последовательности fn и соот-
ветственно ее сходимость к некоторому f ∈ H. Покажем, что коэф-
фициенты Фурье у f совпадают с последовательностью c. Для этого
при любом k рассмотрим

(f, ek )H = (fn + f − fn , ek )H = (fn , ek )H + (f − fn , ek )H . (V.7)

Для любого ε > существует такой n > k, что kf − fn kH < ε. Следо-


вательно, имеем

|(f − fn , ek )H | ≤ kf − fn kH < ε.

Поскольку правая часть в (V.7) не зависит от n, то после перехода к


пределу при n → ∞ получаем

(f, ek )H = (fn , ek )H = ck .

Остается показать, что kf kH = kckl2 . Действительно,


n
X n
X n
X
kf − fn k2H = (f − ck ek , f − ck ek ) H = kf k2H − |ck |2 → 0
k=1 k=1 k=1

при n → ∞.
Рассмотрим важнейшую теорему о гильбертовых пространствах,
которая устанавливает изоморфизм сепарабельных гильбертовых про-
странств.

106
Два гильбертовых пространства H и G изоморфны, если суще-
ствует взаимно однозначное отображение

ν:H→G

такое, что ν является изоморфизмом для линейных пространств H


и G и, кроме того, для любых x, y ∈ H имеет место

(x, y)H = (ν(x), ν(y))H .

Теорема 21.5. Все конечномерные гильбертовы пространства раз-


мерности n изоморфны Cn7 . А бесконечномерные сепарабельные про-
странства изоморфны l2 .
Доказательство. Пусть H есть бесконечномерное сепарабельное про-
странство. Согласно теореме 21.3 существует ортонормированный ба-
зис {ek }. Имеем разложение

X
f= ck ek .
k=1

Из равенства Парсеваля следует, что



X
|ck |2 < ∞,
k=1

поэтому последовательность c = {ck } принадлежит l2 . С другой сто-


роны, всякой последовательности d = {dk } ∈ l2 по теореме Рисса-
Фишера соответствует элемент g ∈ H, имеющий своими коэффи-
циентами Фурье последовательность d. Это означает существование
однозначного соответствия ν между H и l2 . Очевидно, что это соот-
ветствие является изоморфизмом линейных пространств H и l2 .
P∞ P∞
Для любых f = ck ek и g = dk ek и любого N в силу ортого-
k=1 k=1
нальности ek имеем
N N
! N
X X X
ck ek , d k ek = ck d k .
k=1 k=1 H k=1

7
Имеются в виду комплексные пространства, соответственно, вещественные
изоморфны Rn .

107
Переходя к пределу при N → ∞, получаем

X
(f, g)H = ck dk = ({c}, {d})l2 ,
k=1

что показывает изоморфизм между H и l2 .


Для конечномерного случая доказательство аналогичное.
Доказанная теорема говорит о том, что все бесконечномерные се-
парабельные пространства изоморфны. И в любой момент можно
перейти к самому простому пространству, например, l2 .
Однако не все гильбертовы пространства изоморфны l2 . Посколь-
ку существую несепарабельные гильбертовы пространства. В конце
этого параграфа приведем пример. Через HS множество функций
f (x), заданных на [0, 1] таких, что f (x) отлична от нуля лишь на не
более чем счетном количестве точек xi и
X
|f (xi )|2 < ∞.
xi

Скалярное произведение введем по формуле


X
(f, g)HS = f (xi )g(xi ).
xi

Корректность введенного скалярного произведения и полноту про-


странства HS можно установить аналогично пространству l2 .
Рассмотрим континуальное множество функций {ft (x) : t ∈ [0, 1]}

1, x = t
ft (x) =
0, x 6= t.

Очевидно, что

kft′ (x) − ft′′ (x)kHS = 2, t′ 6= t′′ ,

следовательно не может существовать счетного всюду плотного мно-


жества в HS . Вот пример несепарабельного гильбертова простран-
ства.

108
Глава VI

Топологические пространства

22. Топология открытых множеств


Для того, чтобы ввести понятие сходимости последовательности в
абстрактном пространстве мы использовали метрику, как обобщение
расстояния между элементами. Само понятие сходимости последова-
тельности подразумевает, что члены последовательности неограниче-
но приближаются к предельному элементу, поэтому без расстояния
(метрики) между элементами нельзя обойтись, но оказывается по-
нятие предела основано не на расстоянии, а на базе окрестностей. К
слову, под знаком lim, как раз, указывается база, по которой рассмат-
ривается предел. Чтобы ввести понятие «базы окрестностей», рас-
смотрим топологию открытых множеств в произвольном простран-
стве.
Пусть X произвольное непустое множество. Система подмножеств
τ этого множества называется топологией, если выполнены следую-
щие условия
1. Само множество X и пустое множество ∅ принадлежат τ .
2. Объединение любого (конечного или бесконечного) числа мно-
жеств из τ принадлежит τ .
3. Пересечение любого конечного числа множеств из τ принадле-
жит τ .
Множество, на котором задана топология, называется топологиче-
ским пространством.

109
В любом непустом множестве можно определить две тривиаль-
ные топологии — топологию, содержащую все свои подмножества, и
топологию, содержащую только X и ∅.
Множества, принадлежащие τ называются открытыми множе-
ствами в заданной топологии, или просто открытыми, когда это не
приводит к недоразумению. Соответственно, множества, являющие-
ся дополнением к открытым множествам называются замкнутыми.
Для любого метрического пространства X можно рассматривать
топологию, состоящую из всех открытых1 множеств. Таким образом,
любое метрическое пространство можно считать и топологическим,
с топологией, порожденной метрикой. Однако существуют топологи-
ческие пространства, где топология не может быть задана с помощью
метрики. Такие пространства называются неметризуемыми.
Для элемента x ∈ X окрестностью называется любое множество
U ∈ τ такое, что x ∈ U . Для любого множества A ⊂ X точка2 x назы-
вается точкой прикосновения для множества A, если каждая окрест-
ность x содержит хотя бы одну точку из A. Далее, точка x называется
предельной точкой множества A, если каждая окрестность точки x
содержит хотя бы одну точку из A, отличную от x. Совокупность всех
точек прикосновения называется замыканием множества A, которое
обозначаем A. Множество M ⊂ X называется всюду плотным, если
M = X. Топологическое пространство называется сепарабельным,
если в нем существует счетное всюду плотное множество.
На одном и том же множестве3 всегда можно ввести различные
топологии, и получить тем самым различные топологические про-
странства. Если на одном множестве заданы две топологии τ1 и τ2 ,
то мы будем говорить, что топология τ2 сильнее4 топологии τ1 , если

τ1 ⊂ τ2 .

При этом топология τ1 называется слабее, чем τ2 .


Для того, чтобы задать топологию не всегда удобно указывать
все открытые множества. Часто задают некоторое множество, а по-
том минимальную топологию, содержащую это множества. Для этого
нам нужна несложная, но важная теорема.
1
В смысле метрического пространства.
2
Точками мы иногда будем называть элементы топологического пространства.
3
Содержащем более одного элемента.
4
Иногда говорят тоньше.

110
Теорема 22.1. Пусть на одном множестве X задано произволь-
ное конечное или бесконечное число топологий τs , тогда пересечение
этих топологий \
τ= τs
s

есть топология в X, при этом τ слабее любой τs .

Доказательство. По определению топологии τ содержит X и ∅.


Кроме того, любое объединение и конечное пересечение подмножеств
из τ принадлежат τ , поскольку этим свойством обладает каждая из
топологий τs .
Из этой теоремы следует, что для любого множества A подмно-
жеств X существует минимальная топология, содержащая A. По-
скольку, как минимум, одна топология — топология всех подмно-
жеств X содержит A, то существуют такие топологии. Далее, пере-
сечение всех топологий, содержащих A есть минимальная топология
τA , содержащая A. Будем говорит, что топология τA порождается
множеством A.
Рассматриваемые нами пространства являются весьма общими.
Поскольку нашей целью является использование топологических про-
странств для решения конкретных проблем функционального ана-
лиза, то мы будем рассматривать топологические пространства, для
которых выполнены следующие свойства, называемые аксиомами.
Первая аксиома отделимости. Для любых двух различных точек
x, y ∈ X существует окрестность точки x, не содержащая точку y, и
аналогично для y.
Вторая аксиома отделимости. Любые две различные точки x, y ∈
X имеют непересекающиеся окрестности. Топологические простран-
ства, удовлетворяющие этой аксиоме называются хаусдорфовыми.
Третья аксиома отделимости. Любая точка и не содержащее ее
замкнутое множество имеют непересекающиеся окрестности.
Топологические пространства удовлетворяющие первой и третьей
аксиомам отделимости называются регулярными топологическими
пространствами.
Четвертая аксиома (аксиома нормальности). Два любых непересе-
кающихся замкнутых множества имеют непересекающиеся окрестно-
сти. Пространства удовлетворяющие этой аксиоме называются нор-
мальными топологическими пространствами.

111
Метрические пространства, в которых топология задается откры-
тыми множествами, являются нормальными топологическими про-
странствами.

23. Базы и пределы


В метрическом пространстве для определения открытого множества
мы использовали понятие открытого шара. В произвольном тополо-
гическом пространстве тоже для задания топологии можно задать
лишь часть открытых множеств — базу топологии.
Совокупность открытых множеств B ⊂ τ в топологическом про-
странстве называется базой топологии τ , если всякое открытое мно-
жество A ∈ τ может быть представленно в виде объединения (конеч-
ного или бесконечного) множеств из B.
В метрическом пространстве базой топологии являются все от-
крытые шары.
Если топологическое пространство имеет счетную базу, то есть
существует база топологии, состоящее из не более счетного числа
множеств, то такое пространство называется пространством со счет-
ной базой.

Теорема 23.1. Топологическое пространство со счетной базой яв-


ляется сепарабельным.

Доказательство. Пусть B = {Bn } — счетная база. Счетное множе-


ство S введем, как множество содержащее точки, принадлежащие
Bn
S = {xn ∈ Bn : n = 1, 2, . . . }.
Если предположить, что S не является всюду плотным в X множе-
ством, то отрытое множество G = X \ S не содержало бы ни одной
точки из S, что противоречит тому, что G есть объединение из B, но
xn ∈ B n .
Более того, сепарабельное метрическое пространство всегда имеет
счетную базу. Для этого нужно для каждого элемента счетного всюду
плотного множества рассмотреть шары с рациональными радиусами.
Следовательно, метрическое пространство имеет счетную базу тогда
и только тогда, когда оно сепарабельно.

112
Теперь дадим определение сходимости последовательности в то-
пологическом пространстве5 . Последовательность {xn } ⊂ X назы-
вается сходящейся к x ∈ X, если любая окрестность U (x) точки x
содержит все члены последовательности {xn }, начиная с некоторого
номера.
Легко видеть, что это понятие сходимости обобщает сходимость
в метрическом пространстве. Действительно, если топология зада-
на с помощью метрики, то сходимость эквивалентна сходимости по
метрике.
Теперь рассмотрим понятие непрерывного отображения в тополо-
гических пространствах. Пусть X и Y суть топологические простран-
ства с топологиями τX и τY соответственно. Рассмотрим отображение

F : X → Y.

Отображение F непрерывно в точке x ∈ X, если для любой окрест-


ности U (y), где y = F [x], существует такая окрестность V (x), что
F [V (x)] ⊂ U (y). Если F непрерывно в каждой точке, то оно назы-
вается непрерывным. Для метрических пространств это определе-
ние также соответствует непрерывности, которое мы рассматривали
в метрических пространствах.
Фундаментальное значение имеет следующая теорема, устанавли-
вающая критерий непрерывного отображения.

Теорема 23.2. Отображение F : X → Y является непрерывным


тогда и только тогда, когда для всякого открытого в Y множества
прообраз является открытым в X.

Доказательство. Пусть F непрерывное множество, а G ∈ τY . Че-


рез D = F −1 [G] обозначим прообраз множества G. Покажем, что
D ∈ τX . Возьмем произвольную точку x ∈ D, тогда y = F [x]. По-
скольку G есть окрестность точки y. Из непрерывности F следует,
что существует такая окрестность V (x) точки x, что F [V (x)] ⊂ G, то
есть V (x) ⊂ D. Это означает, что для любой точки из D существует
окрестность этой точки, содержащаяся в D, что означает открытость
множества D.
5
Если не оговорено отличное, то считаем, что это пространство удовлетворяет
аксиомам отделимости и нормальности.

113
С другой стороны, пусть для любого открытого G ⊂ Y множе-
ство D = F −1 [D] ∈ τX . Рассмотрим произвольную точку x ∈ D и
окрестность U (y), где y = F [x], тогда имеем

x ∈ F −1 [U (y)] ∈ τX .

Следовательно F −1 [U (y)] есть окрестность x, образ которой содер-


жится в U (y).
Два топологических пространства называются гомеоморфными,
если существует взаимно однозначное и взаимно непрерывное отоб-
ражение.

24. Компактность
Одним из самых принципиальных понятий анализа (математическо-
го и функционального) является понятие компактности. При этом
проблема компактности имеет особое значение в бесконечномерных
пространствах. Компактные множества используются для многих
теорем существования решений, а также для построения численных
методов.
Пусть теперь X есть произвольное топологическое пространство.
Система конечная или бесконечная множеств {Ms } называется по-
крытием множества A ⊂ X, если
[
A⊂ Ms .
s

Для покрытия {Ms } множества A, подпокрытием называется часть


{Msp } являющаяся покрытием A. Если множества Ms открыты, то
покрытие называется открытым, а если все эти множества замкнуты,
то покрытие называется замкнутым.
Множество топологического пространства A ∈ X называется ком-
пактным, если любое его открытое покрытие содержит конечное под-
покрытие. Если A = X, то само топологическое пространство назы-
вается компактным или компактом6
Множество называется предкомпактным, если его замыкание ком-
пактно.
6
Компактом называют и любые компактные множества.

114
Покажем, что свойство компактности сохраняется при непрерыв-
ном отображении.
Теорема 24.1. Пусть X, Y — топологические пространства, F :
X → Y — непрерывное отображение, тогда для любого компактного
множества A ⊂ X его образ B = F [A] компактен.
Доказательство. Рассмотрим открытое покрытие множества B
[
B⊂ Bs .
s

Поскольку отображение F непрерывно, тоSв силу теоремы 23.2 про-


образы Bs являются открытыми, поэтому F −1 [Bs ] будет открытым
s
покрытием множества A. Поскольку A является компактным множе-
ством, то из этого покрытия можно выделить конечное покрытие
N
[
A⊂ F −1 [Bsk ].
k=1

Следовательно, существует конечное покрытие для множества B


N
[
B⊂ B sk .
k=1

Хотя понятие компактности является топологическим понятием,


но в функциональном анализе основную роль играет компактность в
метрическом пространстве. В этом случае можно дать эквивалентное
определение компактности.
Пусть M — некоторое множество в метрическом пространстве X.
Для любого ε > 0 множество S ⊂ X называется ε-сетью для множе-
ства M , если для любого x ∈ M существует s ∈ S такое, что
̺(x, s) ≤ ε.
В конечномерном пространстве Rn любое ограниченное множество
имеет конечную ε-сеть. Действительно, любое ограниченное множе-
ство M ⊂ Rn содержится в достаточно большом кубе
KA = {x ∈ Rn : |xi | ≤ A, i = 1, 2, . . . , n}.

115
Для любого ε > построим множество

Sε = {ε n/2(i1 , i2 , . . . , in ) : ik = 0, ±1, ±2, . . . ; k = 1, . . . , n} ∩ KA

является конечной ε-сетью для M .


В бесконечномерных пространствах ограниченное множество мо-
жет не иметь конечной ε-сети для достаточно малом ε. Например,
единичная сфера в сепарабельном
√ гильбертовом пространстве огра-
ниченно, но для ε < 2/2 конечной ε-сети. Действительно, в таком
пространстве существует ортонормированный базис {ek }, но имеет
место √
̺(ek , em ) = 2, k 6= m.

Теорема 24.2. Для того, чтобы множество M в метрическом про-


странстве X было компактным необходимо и достаточно, чтобы
из всякого бесконечного подмножества множества M можно вы-
делить последовательность, сходящуюся к некоторой точке этого
множества.

Доказательство. Пусть из любого бесконечного подмножества мно-


жества M можно извлечь сходящуюся подпоследовательность. Тогда
для любого открытого покрытия множества M
[
M⊂ Gs .
s

Покажем, что существует ε > 0 такое, что для любого x ∈ M шар


Bε (x) ⊂ Gs для некоторого s. Действительно, если предположить об-
ратное, то найдутся последовательности чисел εn > 0, εn → 0 и точек
xn ∈ M такие, что шары Bεn (xn ) не войдут целиком ни в одно из Gs .
По условию из последовательности xn можно выделить подпоследо-
вательность xnk , сходящуюся к точке x0 ∈ M . Но тогда найдется Gs0
содержащее x0 . Так как множество Gs0 открытое, то существует шар
Bδ (x0 ) полностью содержащийся в Gs0 . Выбирая nk столь большим,
что εnk < δ/2 и ̺(xnk , x0 ) < δ/2. Тогда имеем

Bεnk (xnk ) ⊂ Bδ (x0 ) ⊂ Gs0 .

Что противоречит предположению, что Bεnk (xnk ) не входит целиков


ни в какое Gs .

116
Далее пусть ε0 > 0 выбрано так, что для любого x ∈ M шар
Bε (x) ⊂ Gs для некоторого s. Построим ε0 -сеть {x1 , x2 , . . . , xN } для
M , состоящую из точек этого множества. Поскольку расстояние от
любой точки x ∈ M до одной из точек xi меньше ε0 , то все множество
M разместится целиком в объединении шаров

Bε0 (x1 ) ∪ Bε0 (x2 ) ∪ · · · ∪ Bε0 (xN ).

Но поскольку Bε0 (xi ) ⊂ Gsi , то


N
[
M⊂ G si ,
i=1

что означает компактность множества M .


Пусть теперь M есть компактное множество. Пусть F — подмно-
жество множества M . не имеющее ни одной предельной точки, тогда
для каждой точки x ∈ M найдется окрестность U (x), не содержа-
щая, кроме, может быть, самой точки x, ни одной точки из F . Эти
окрестности образуют открытое покрытие. В силу компактности M
N
S
можно выделить конечное покрытие U (xi ). Поскольку
i=1

N
[
F ⊂ U (xi ).
i=1

По построению окрестностей U (x) в каждой окрестности может со-


держаться не более одной точки из F , следовательно, множество F
является конечным. Таким образом, всякое бесконечное множество
имеет предельные точки.
Покажем теперь, что множество M замкнуто. Выберем y ∈ /M и
обозначим rx = ̺(x, y) > 0 для любого x ∈ M . Очевидно имеем

Brx /3 (y) ∩ Brx /3 (x) = ∅, x ∈ M.

В тоже время множество шаров Brx /3 (x) образуют открытое покры-


тие множества M , следовательно, существует конечное подпокрытие
N
[
M⊂ Brxi /3 (xi ).
i=1

117
Пусть r0 = min rxi , тогда Br0 /3 (y) не пересекается ни с одним ша-
i
ром Brxi /3 (xi ), а следовательно, и с M . Это означает, что y не может
быть предельной точной для M , поэтому множество M содержит все
предельные точки.
Существование конечной ε-сети для множества в полном метри-
ческом пространстве эквивалентно предкомпактности этого множе-
ства. Этот факт часто используется для доказательства компактно-
сти конкретных множеств.
Теорема 24.3 (Хаусдорф). Для полного метрического простран-
ства X множество M ⊂ X предкомпактно тогда и только тогда,
когда в этом множестве существует конечная ε-сеть для любого
ε > 0.
Доказательство. Предположим, что множество M предкомпактно.
Построим ε-сеть. Возьмем любую точку x1 ∈ M . Если ̺(x, x1 ) < ε
для всех x ∈ M , то конечная ε-сеть уже построена. В противном
случае существует точка x2 ∈ M такая, что ̺(x1 , x2 ) ≥ ε. Добавляем
точку x2 в создаваемую ε-сеть. Если множество {x1 , x2 } не является
искомой ε-сетью, то аналогично добавляем x3 и продолжаем этот про-
цесс. Если процесс закончится построением конечной ε-сети, то дока-
зательство закончено. Предположим теперь, что этот процесс будет
продолжаться бесконечно. Но это противоречит предкомпактности
потому, что тогда мы получили бы бесконечную последовательность
{xn } такую, что
̺(xk , xm ) ≥ ε, k 6= m.
В этом случае эта последовательность не может содержать никакой
сходящейся подпоследовательности, тогда по теореме 24.2 множество
M является компактным.
Теперь предположим, что для M существует конечная ε-сеть для
любого ε > 0. Зафиксируем любое бесконечное множество T ⊂ M 7 .
Положим εn = 1/n. Выбираем конечную 1/n-сеть
S n = {xn1 , xn2 , . . . , xnNn }
для множества M . Поскольку T ⊂ Bε1 (S 1 ), то в окрестности как ми-
нимум одного из x1i содержится бесконечное подмножество T , кото-
рое мы обозначим через T1 . Аналогично рассуждая, можно получить
7
Если M конечное множество, то это множество, очевидно, компактно.

118
последовательность
T1 ⊃ T2 ⊃ . . .
бесконечных подмножеств множества T , при этом каждое подмноже-
ство Tn содержится в замкнутом шаре радиуса 1/n, следовательно,
расстояние между любыми двумя точками из Tn не превосходит 2/n.
Поэтому можно выбрать последовательность точек yn ∈ Tn . Эта по-
следовательность является фундаментальной
2
̺(yn+q , yn ) < .
n
В силу полноты пространства X эта последовательность сходится,
поэтому замыкание множества M является компактным, а само мно-
жество M — предкомпактно.
Из доказанных теорем видно, что для множеств в Rn предком-
пактность эквивалентна ограниченности, а компактность замкнуто-
сти и ограниченности.
В бесконечно мерном пространстве ограниченность, как мы виде-
ли не говорит о предкомпактности. Однако существуют различные
критерии компактности в конкретных пространствах. Рассмотрим
критерий предкомпактности в пространстве непрерывных функций.
Множество M в пространстве C[a, b] называется равномерно ограни-
ченным, если существует K такое, что

|f (x)| ≤ K, x ∈ [a, b]

для всех f ∈ M . Это множество называется равностепенно непре-


рывным, если для каждого ε > 0 существует δ > 0 такое, что

|f (x1 ) − f (x2 )| ≤ ε

для всех x1 , x2 ∈ [a, b] таких, что |x1 − x2 | < δ для всех f ∈ M . Здесь
принципиально, что δ не зависит от f , а только от ε.

Теорема 24.4 (Теорема Арцела). Для того, чтобы множество M ⊂


C[a, b] было предкомпактным необходимо и достаточно, чтобы это
семейство было равномерно ограничено и равностепенно непрерыв-
но.

119
Доказательство. Пусть множество M предкомпактно в C[a, b], то-
гда для любого ε > 0 существует конечная ε-сеть S = {f1 , . . . , fN }.
Каждая из функций fi равномерно ограничена с константой Ki . То-
гда имеем
|f (x)| ≤ |fi (x)| + ε ≤ Ki + ε ≤ K
для любой f ∈ M . Таким образом, множество M равномерно огра-
ничено.
С другой стороны fi ∈ S являются равномерно непрерывными на
[a, b, поэтому для любого ε > 0 существует такое δi > 0, что

|fi (x1 ) − fi (x2 )| < ε,

для |x1 − x2 | < δi . Положим δ = min δi . Для произвольной f ∈ M


i
можно выбрать fi так, что kf − fi kC[a,b] < ε. Тогда имеем

|fi (x1 ) − f (x2 )| ≤ |f (x1 ) − fi (x1 )| + |fi (x1 ) − fi (x2 )|

|fi (x2 ) − f (x2 )| < 3ε


для всех |x1 − x2 | < δ. Следовательно, множество M равностепенно
непрерывно.
Теперь предположим, что множество M равномерно ограниче-
но и равностепенно непрерывно и покажем, что оно является пред-
компактным в C[a, b]. Для этого построим конечную ε-сеть. Пусть
|f (x)| ≤ K для всех f ∈ M и пусть δ > 0 выбрано так, что |f (x1 ) −
f (x2 )| < ε при |x1 − x2 | < δ для всех f ∈ M . Разобьем отрезок [a, b]
на промежутки с длиной меньшей δ

a = x0 < x1 < · · · < xN = b

и обозначим это множество через X. Также введем множество

Y = {εk : k = 0, ±1, ±2, . . . , ±L},

где L = [K/ε] + 1. Рассмотрим множество Mε,δ , состоящее из всех


ломанных на [a, b] с узлами в точках X со значениями в этих уз-
лах в множестве Y . Очевидно это множество конечно. При этом для
любого f ∈ M существует такая g ∈ Mε,δ , что

|g(xk )−g(xk+1 )| = |g(xk )−f (xk )+f (xk )−f (xk+1 )+f (xk+1 )−g(xk+1 )| ≤

120
|g(xk ) − f (xk )| + |f (xk ) − f (xk+1 )| + |f (xk+1 ) − g(xk+1 )| ≤ 3ε.
Пусть для произвольной точки x ∈ [a, b] точка xk — ближайшая к x.
Тогда имеем

|f (x) − g(x)| ≤ |f (x) − f (xk )| + |f (xk ) − g(xk )| + |g(xk ) − g(x)| ≤ 3ε.

Таким образом, множество Mε,δ является ε-сетью для множества M .

Теорема 24.5. Пусть множество M ⊂ C[a, b] такое, что все f ∈


M непрерывно дифференцируемы и существуют такие C > 0 и A >
0, что
|f (x)| ≤ C, |f ′ (x)| ≤ A, x ∈ [a, b].
Тогда множество M является предкомпактным в C[a, b].

Доказательство. Рассмотрим функцию f ∈ M . Обозначим f (a) =


f0 , тогда имеет место представление
Zx
f (x) = f0 + f ′ (s)ds.
a

Отсюда следует, что |f (x)| ≤ |f0 | + A(b − a) и


x
Z 2
|f (x1 ) − x(x2 )| = f ′ (s)ds ≤ A(x2 − x1 ).


x1

Таким образом, это множество M по теореме Арцела будет предком-


пактным.
Теорема Арцела8 играет важную роль в доказательства существо-
вания решений задачи Коши для дифференциальных уравнений с
непрерывной правой частью.
8
Эта теорема также называется Асколи-Арцела.

121
25. Линейные топологические пространства
Как мы видели метрические пространства представляют собой при-
мер топологических пространств. С другой стороны, мы видели, что
в функциональном анализе большую роль играют и линейные про-
странства. В линейных пространствах тоже можно ввести топологию.
Однако в этих пространствах имеет смысл рассматривать только та-
кие топологии, в которых линейные операции (сложения и умноже-
ния на скаляр) будут непрерывными.
Таким образом, линейное топологическое пространство L пред-
ставляет собой линейное пространство, в котором задана тополо-
гия и линейные операции в этой топологии непрерывны. Непрерыв-
ность операции сложения означает, что для любых x′ , y ′ ∈ L и любой
окрестности U (x′ + y ′ ) существуют такие окрестности V (x′ ) и W (y ′ ),
что
x + y ∈ U (x′ + y ′ )
для всех x ∈ V (x′ ) и y ∈ W (y ′ ). Далее, непрерывность операции
умножения на скаляр означает, что для любых x′ ∈ L,. λ′ ∈ C и лю-
бой окрестности U (λ′ x′ ) существует такая окрестность V (x′ ) и такое
число ε > 0, что
λx ∈ U (λ′ x′ )
для всех x ∈ V (x′ ) и |λ′ − λ| < ε.
В силу непрерывности операции сложения в линейном топологи-
ческом пространстве, то для любого непрерывного множества G ⊂ L
и любого x ∈ L множество G + x будет открытым. Поэтому для того,
чтобы задать топологию в линейном пространстве достаточно задать
систему окрестностей нуля.
Примерами линейных топологических пространств являются все
нормированные пространства (соответственно банаховы и гильбер-
товы пространства).
Для любой функции f (x), заданной на Rn носителем этой функ-
ции называется множество

supp f = {x ∈ Rn : f (x) 6= 0},

то есть носитель — это замыкание множества, на котором функция


не равна нулю. Функции, имеющие ограниченный (и соответственно,

122
компактный) носитель называются финитными. Если supp f ⊂ Q,
где Q открытое множество, то функция называется финитной в Q.
Рассмотрим пространство финитных бесконечно дифференциру-
емых функций в Q ⊂ Rn . Это множество обозначается Ċ ∞ (Q). Оче-
видно, что это линейное пространство. В нем можно ввести норму,
но оно не будет полным ни с какой нормой. Мы будем рассматри-
вать это пространство, как линейное топологическое пространство, в
котором топология задается с помощью следующей системы окрест-
ностей нуля
max |f (k) (x)| < ε, k = 0, 1, 2 . . . , M
x∈Ks

для всех ε > 0, M ∈ N и всех компактных множеств Ks ∈ Q.

123
Часть II

Линейные операторы

124
Глава VII

Три принципа линейных


операций

26. Принцип равномерной ограниченности


Важнейший принцип теории линейных операторов посвящен усло-
виям сходимости последовательности линейных операторов. В беско-
нечномерных пространствах определение линейных операторов пред-
ставляет собой сложную проблему. Стандартный подход состоит в
том, чтобы определить оператор на некотором плотном множестве, а
далее продолжить с помощью принципа равномерной ограниченно-
сти на все пространство.
Будем рассматривать линейные ограниченные операторы, отобра-
жающие нормированное пространство X в нормированное простран-
ство Y . Для таких операторов ранее мы определяли норму оператора.
Поскольку очевидно, что сумма двух таких операторов и умноже-
ние на скаляр есть снова линейный ограниченный оператор в тех же
пространствах, то можно говорить о нормированном пространстве
линейных ограниченных операторов
L(X, Y ) = {A : X → Y : kAk < ∞}.
Следовательно, в этом пространстве можно определить сходимость
по операторной норме. Мы будем говорить, что последовательность
линейных ограниченных операторов An ∈ L(X, Y ) сходится равно-
мерно к оператору A ∈ L(x, Y ), если
kA − An k → 0, n → ∞.

125
Для последовательности операторов {An } можно также определить
и другую сходимость — поточечную. Будем говорит, что последова-
тельность An поточечно сходится к оператору A, если
kAx − An xkY → 0, n → ∞,
для всех x ∈ X.
Теорема 26.1. Пусть пространство Y является банаховым про-
странством, то L(X, Y ) также является банаховым пространством.
Доказательство. Возьмем произвольную фундаментальную в L(X, Y )
последовательность операторов An . Для любого x ∈ X рассмотрим
последовательность An x в Y . Имеем
kAn+m x − An xkY = k(An+m − An )xkY ≤ kAn+m − An kkxkX ,
следовательно, эта последовательность фундаментальная в Y . В силу
полноты Y имеем lim An x = y. Таким образом, каждому элементу
n→∞
x ∈ X ставится в соответствие элемент y ∈ Y , то есть задано отобра-
жение A : X → Y . Оператор A является линейным. Действительно,
для любых x1 , x2 ∈ X и a, b ∈ C имеем
A(ax1 + bx2 ) = lim An (ax1 + bx2 ) =
n→∞

lim aAn x1 + lim bAx2 = a lim An x1 + b lim An x2 = aAx1 + bAx2 .


n→∞ n→∞ n→∞ n→∞
Здесь мы воспользовались свойством линейности предела.
Теперь покажем, что оператор A является ограниченным. По-
скольку
|kAn+m k − kAn k| ≤ kAn+m − An k,
то числовая последовательность kAn k также является фундаменталь-
ной, и, следовательно, ограниченной
kAn k ≤ C, n = 1, 2, . . . .
Имеем
kAn xkY ≤ CkxkX .
Переходя в этой неравенстве к пределу, получаем
kAxkY ≤ CkxkX .

126
Теорема 26.2 (Банаха-Штейнгауза). Пусть X — банахово простран-
ство, а Y есть нормированное пространство и {As }s∈S семейство
линейных ограниченных операторов

As : X → Y

такое, что для каждого x ∈ X имеет место оценка

kAs xkY ≤ C(x), s ∈ S,

где C зависит от x, но не зависит от индекса s. Тогда семейство


операторов As ограничено в совокупности

kAs k ≤ C1 , s ∈ S.

Доказательство. Доказательство проведем от противного. Предпо-


ложим, что данное семейство неограничено ни в каком шаре B r (x),
r > 0. Построим последовательность шаров B rn (xn ) и последователь-
ность индексов sn таких, что

1. B rn+1 (xn+1 ) ⊂ B rn (xn ),

2. rn+1 ≤ rn /2,

3. kAsn xkY ≥ n, для всех x ∈ B rn (xn ).

Положим x0 = 0, r1 = 1, поскольку семейство операторов неогра-


ничено, в частности, на шаре B r0 (x0 ), то существует такой индекс
s1 ∈ S и x1 ∈ Br0 (x0 ), что kAs1 x1 kY > 1. В силу непрерывности опе-
ратора As1 существует такое 0 < r1 < r0 /2, что B r1 (x1 ) ⊂ B r0 (x0 ) и
выполнена оценка

kAs1 xkY ≥ 1, x ∈ B r1 (x1 ).

Пусть таким образом выбраны шары B rk (xk ) и индексы sk для k < n.


Тогда поскольку семейство As неограничено на B rn−1 (xn−1 ), то суще-
ствует такой индекс sn , элемент xn ∈ Brn−1 (xn−1 ), что kAsn xn kY > n.
По непрерывности Asn существует такое rn < rn−1 /2, что B rn (xn ) ⊂
B rn−1 (xn−1 ) и имеет место оценка

kAsn xkY ≥ n, x ∈ B rn (xn ).

127
Поскольку пространство X полное, то в силу теоремы 8.1 о вло-
женных шарах существует такой элемент x∗ общий для всех шаров
B rn (xn ). При этом будем иметь
kAsn x∗ kY ≥ n,
для любого n, что противоречит условию теоремы.
Из теоремы Банаха-Штейнгауза следует, в частности, следующая
важная для функционального анализа теорема.
Теорема 26.3. Пусть An — последовательность операторов из L(X, Y )
такая, что
1. kAn k ≤ M ,
2. kAx − An xkY → 0, при n → ∞ для всех x ∈ D, где D ⊂ X всюду
плотно в X.
Тогда последовательность операторов An поточечно сходится к опе-
ратору A ∈ L(X, Y ).
Доказательство. Если D = X, то доказательства не требуется. По-
этому пусть x′ ∈ X, но x′ ∈
/ D. В силу плотности множества D для
любого ε > 0 существует элемент x ∈ D такой, что
ε
kx′ − xkX < .
M
Имеем
kAn x′ − Ax′ kY ≤ kAn x′ − An xkY + kAn x − AxkY + kAx − Ax′ kY ≤
kAn x − AxkY + (kAn k + kAk)kx − x′ kX < kAn x − AxkY + 2ε.
Поскольку имеет место сходимость An x → Ax, то найдется такой
номер N , что для n > N имеем
kAn x − Axk < ε.
Следовательно, имеем
kAn x′ − Ax′ kY ≤ 3ε.
Поэтому последовательность An сходится поточечно к A на всем X.

128
27. Принцип открытости отображения
Основным объектом в функциональном анализе являются линейные
операторы. При этом принципиальное значение имеют ограниченные
линейные операторы. При решении операторных уравнений вида

Ax = f

устанавливается однозначная разрешимость, то есть существование


оператора A−1 . Возникает вопрос будет ли этот оператор ограничен-
ным? Ограниченность этого оператора даст возможность установить
устойчивость найденного решения при небольшом изменении правой
части. Для положительного решения вопроса об ограниченности об-
ратного оператора используется теорема Банаха об открытости отоб-
ражения.
Дадим определение обратного оператора. Пусть X и Y суть два
линейных пространства. Рассмотрим линейный оператор

A : X → Y.

Предположим, что оператор является взаимно однозначным. Тогда


существует обратное отображение

A−1 : Y → Y.

Это отображение называется обратным оператором к оператору A,


если для любого x ∈ X
A−1 Ax = x,
и для любого y ∈ Y
AA−1 y = y.
Если оператор A имеет обратный оператор A−1 , то этот обратный
оператор тоже имеет обратный и имеет место
−1
A−1 = A.

Теорема 27.1. Оператор, обратный к линейному, сам является ли-


нейным.

129
Доказательство. Пусть A−1 есть обратный оператор. Для любых
y1 , y2 ∈ Y положим

A−1 (y1 + y2 ) − A−1 y1 − A−1 y2 = x,

тогда в силу линейности A имеем

Ax = AA−1 (y1 + y2 ) − AA−1 y1 − AA−1 y2 = 0.

Следовательно,
x = A−1 Ax = A−1 0 = 0,
то есть
A−1 (y1 + y2 ) = A−1 y1 + A−1 y2 ,
что означает аддитивность оператора A−1 . Покажем однородность
обратного оператора. Для любых y ∈ Y и λ ∈ C положим

x = A−1 (λy) − λA−1 y.

Далее
Ax = AA−1 (λy) − λAA−1 y = λy − λy = 0.
Поэтому x = A−1 Ax = A−1 0 = 0, следовательно,

A−1 (λy) = λA−1 .

Ограниченность обратного оператора будет простым следстви-


ем теоремы Банаха об открытости отображения. В начале докажем
необходимую лемму.

Лемма 27.1. Пусть X и Y суть линейные топологические про-


странства, а A линейный оператор A : X → Y . Если область значе-
ний R(A) является множеством второй категории в Y , тогда для
любой окрестности нуля U в X существует такая окрестность
нуля V в Y , что
V ⊂ A[U ].

130
Доказательство. Пусть фиксирована окрестность нуля U в X. Вы-
берем такую окрестность нуля W в X, что W + W ⊂ U и W = −W .
Для любого x ∈ X существует такой n, что x ∈ nW . Это следует из
того, что x/n → 0, при n → ∞. Поэтому имеем

[
X= (nW )
n=1

и ∞
[
R(A) = A(nW ).
n=1

Поскольку R(A) — множество второй категории в Y , то существу-


ет такое целое положительное n0 , что A[n0 W ] содержит некоторое
непустое открытое множество. С другой стороны поскольку

A[nW ] = nA[W ],

и множества nA[W ] и A[W ] гомеоморфны, то множество A[W ] то-


же содержит некоторое непустое открытое множество. Пусть y0 есть
точка этого множества, тогда имеем y0 = Ax0 , где x0 ∈ W . Поскольку
отображение
T : X → X, T x = −x0 + x
является гомеоморфизмом, то существует такая окрестность нуля V
в Y , что V ⊂ −y0 + A[W ]. При этом элементы множества −y0 + A[W ]
представимы в виде

−y0 + A[W ] = A[w − x0 ],

где w ∈ W . С другой стороны, w − x0 ∈ W + W ⊂ U по выбору мно-


жества W . Поэтому −y0 + A[W ] ⊂ A[U ], и, следовательно, переходя
к замыканиям, получаем

−y0 + A[W ] ⊂ A[U ].

Таким образом,
V ⊂ −y0 + A[W ] ⊂ A[U ].

Теперь мы готовы доказать основную теорему.

131
Теорема 27.2 (Теорема Банаха об открытости отображения). Пусть
X, Y суть банаховы пространства, а A : X → Y — линейный огра-
ниченный оператор такой, что R(A) = Y . Тогда оператор A отоб-
ражает каждое открытое множество пространства X на откры-
тое множество пространства Y .
Доказательство. Поскольку полное метрическое пространство Y яв-
ляется множеством второй категории, то согласно лемме 27.1 замы-
кание образа при отображении A всякой окрестности нуля простран-
ства X содержит некоторую окрестность нуля пространства Y .
Для краткости обозначим Xr = Br (0) и Yr = Br (0) и εi = 2−i ε, для
любого ε > 0. Следовательно, существует такая последовательность
положительных чисел bi сходящаяся к нулю, что
Ybi ⊂ AXεi , i = 0, 1, 2 . . . . (VII.1)
Выберем произвольную точку y ∈ Yb0 покажем, что существует такая
точка x ∈ X2ε0 , что Ax = y. Из (VII.1) при i = 0 следует существова-
ние такой точки x0 ∈ Xε0 , что
ky − Ax0 kY < b1 .
Поскольку (y − Ax0 ) ∈ Yb1 , то из (VII.1) при i = 1 получаем суще-
ствование точки x1 ∈ Xε1 , для которой
ky − Ax0 − Ax1 kY < b2 .
Продолжая это процесс, мы получаем последовательность xi ∈ Xεi
такую, что
n
!
X
y − A xi < bn+1 , n = 0, 1, 2 . . . .


i=0

Имеем
n n n n
!
X X X X
xk ≤ kxk kX ≤ εk ≤ 2−k ε0 .



k=m+1 X k=m+1 k=m+1 k=m+1
n
P
Следовательно последовательность zn = xk фундаментальная, по-
k=0
этому в силу полноты пространства X

X
xk = x ∈ X.
k=1

132
Далее,
n n ∞
X X X
kxkX = lim xk ≤ lim kxk kX ≤ ε0 2−k = 2ε0 .

n→∞ n→∞
k=1 X k=1 k=1

Поскольку y = Ax то мы получаем, что всякий шар X2ε0 отобража-


ется на некоторое множество, содержащее шар Yb0 .
Выберем непустое открытое множество Q в X и x ∈ Q. Пусть U
— окрестность нуля пространства X такая, что x + U ∈ Q. Через
V обозначим окрестность нуля пространства Y , удовлетворяющую
условию
V ⊂ A[U ],
тогда
V + Ax ⊂ Ax + A[U ] = A[x + U ] ⊂ A[Q].
Следовательно, множество A[Q] содержит окрестность каждой сво-
ей точки, поэтому оператор A отображает открытые множества про-
странства X на открытые множества пространства Y .
Из этой важной теоремы непосредственно следует следующий прин-
ципиальный результат.
Теорема 27.3. Если линейный ограниченный оператор A взаимно
однозначно отображает банахово пространство X в банахово про-
странство Y , тогда существует обратный линейный оператор A−1
и этот оператор ограничен.

28. Теорема Хана-Банаха


Мы уже встречались с линейными операторами в нормированных
пространствах. В частности операторы действующие из нормирован-
ного пространства X в пространство C или R называются функцио-
налами. Функционалы играют важнейшую роль в строении функци-
онального анализа и приложениях.
Пусть X — нормированное пространство, а f — линейный функ-
ционал над элементами этого пространства. Будем также использо-
вать следующие обозначения для значения этого функционала на
элементе x ∈ X
f (x) = hx, f i.

133
Будем говорить об ограниченных и непрерывных функционалах, по-
нимая эти термины, как для линейных ограниченных и непрерывных
операторов.
Приведем несколько примеров линейных функционалов. В про-
странстве C[a, b] рассмотрим функционал δ, определенный по фор-
муле
hf, δi = f (x0 ),
где x0 ∈ [a, b].
Для пространства C 1 [a, b] определим функционал D
Zb
hf, Di = f ′ (x)dx.
a

Для гильбертова пространства L2 (Q) определим функционал G


по формуле Z
hf, gi = f (x)g(x)dx = (f, g)L2 (Q) ,
Q

для любой функции g ∈ L2 (Q).


Для пространства l1 определим функционал S по формуле

X
hx, Si = xk .
k=1

Хотя мы легко можем привести примеры функционалов, вопрос о


существовании нетривиальных линейных ограниченных функциона-
лов в произвольном нормированном пространстве не так прост. Вся
теория линейных функционалов основана на теореме Хана-Банаха,
которую мы сейчас докажем.
Теорема 28.1 (Хан, Банах). Пусть X — вещественное нормиро-
ванное пространство, если на линейном многообразии D ⊂ X задан
линейных ограниченный функционал f , то существует линейный
ограниченный функционал f˜, определенный на всем X такой, что

f˜(x) = f (x), x∈D

и
kf˜k = kf k.

134
Доказательство. Естественно, можно считать, что D 6= X. Пусть
/ D. Через D1 обозначим линейное многообразие в X элементов
x0 ∈
вида y + tx0 , где y ∈ D, t ∈ R. Покажем, что существует линейный
ограниченный функционал f1 , определенный на D1 , совпадающий с
f на D и kf1 k = kf k.
Каждый x ∈ D1 представим в виде x = y + tx0 единственным
образом. Действительно, из y + tx0 = y ′ + t′ x0 следует, что

y − y ′ = (t′ − t)x0 .

Если предположить, что t 6= t′ то получаем, что x0 ∈ D, поэтому


t = t′ , но тогда и y = y ′ .
Для любых y1 , y2 ∈ D имеем

f (y1 ) − f (y2 ) = f (y1 − y2 ) ≤ kf kky1 − y2 kX ≤

kf kky1 + x0 − x0 − y2 kX ≤ kf k(ky1 + x0 kX + ky2 + x0 kX ).


От сюда следует, что

f (y1 ) − kf kky1 + x0 kX ≤ f (y2 ) + kf kky2 + x0 kX .

Поскольку y1 и y2 произвольные элементы из D, то имеем

sup{f (y) − kf kky + x0 kX } ≤ c ≤ inf {f (y) + kf kky + x0 kX }. (VII.2)


y∈D y∈D

Возьмем произвольный z ∈ D1 , тогда имеет место единственное пред-


ставление z = y + tx0 , определим новый функционал ϕ по формуле

ϕ(z) = f (y) − tc,

где c вещественное число, удовлетворяющее (VII.2). По построению


функционалы f и ϕ совпадают на D. В силу единственности пред-
ставления x = y + tx0 функционал ϕ является линейным. Покажем,
что он ограничен. Сначала рассмотрим ситуацию, когда t > 0
y 
|ϕ(z)| = t f − c ≤ t(kf kky/t+x0 kX ) = kf kky+tx0 kX = kf kkzkX .

t
Следовательно,
|ϕ(z)| ≤ kf kkzkX . (VII.3)

135
Для случая t < 0 имеем
y  1 1
f − c ≥ −kf kky/t + x0 kX = − kf kky + tx0 kX = kf kkzkX .
t |t| t
Отсюда получаем
 y   1
ϕ(z) = t f − c ≤ t kf kkzkX = kf kkzkX .
t t
Таким образом, равенство (VII.3) справедливо для всех z ∈ D1 и
имеем оценку для нормы
kϕk ≤ kf k.
Поскольку функционал ϕ есть продолжение функционала f с D на
D1 , то
kϕk ≥ kf k.
Следовательно функционал ϕ ограничен и его норма равна kf k.
Мы показали, что существует (вообще говоря, не единственное)
продолжение функционала f с сохранением нормы. Рассмотрим все-
возможные продолжения Φ с сохранением нормы функционала f . На
множестве Φ введем частичный порядок, полагая, что
f ′ ≺ f ′′ ,
если линейное многообразие D′ на которое продолжен f ′ является
частью многообразия D′′ , на которое продолжен функционал f ′′ и
f ′ (x) = f ′′ (x) при всех x ∈ D′ .
Выберем произвольное упорядоченное множество {fs } ⊂ Φ. Это
множество имеет верхнюю грань (относительно введенного порядка),
то есть функционал f⋆ , определенный на линейном многообразии
[
D⋆ = Ds ,
s

где Ds есть область определения fs , причем f⋆ (x) = fs0 (x), если


x ∈ Ds0 . Таким образом, f⋆ является линейным ограниченным функ-
ционалом и kf⋆ k = kf k, следовательно, f⋆ ∈ Φ. Применяя лемму
Цорна (эквивалентную аксиоме выбора), получаем, что Φ имеет мак-
симальный элемент f˜. Этот функционал определен на всем X, по-
скольку в противном случае его можно было бы продолжить, что
противоречило бы его максимальности.

136
Теорема Хана-Банаха доказана нами в случае вещественных нор-
мированных пространств. В 1938 году Г.А. Сухомлиновым эта тео-
рема была обобщена на случай комплексных нормированных про-
странств.
Теорема 28.2 (Сухомлинов). Пусть X — комплексное нормирован-
ное пространство, если на линейном многообразии D ⊂ X задан
линейных ограниченный функционал f , то существует линейный
ограниченный функционал f˜, определенный на всем X такой, что

f˜(x) = f (x), x∈D

и
kf˜k = kf k.
Доказательство. Пусть

f (x) = f1 (x) + if2 (x), (VII.4)

где f1 (x) = Re f (x), f2 (x) = Im f (x). Функционалы f1 и f2 суть веще-


ственные линейные функционалы, рассматриваемые на D, как веще-
ственном многообразии. Это следует из того, что

f1 (ax + by) = af1 (x) + bf1 (y),

f2 (ax + by) = af2 (x) + bf2 (y).


Кроме этого,

f (ix) = f1 (ix) + if2 (ix) = if1 (x) − f2 (x) = if (x),

поэтому
f1 (ix) = −f2 (x), f2 (ix) = f1 (x).
Отсюда и из (VII.4) следует, что
1
kf1 k = kf2 k = √ kf k.
2
Будем рассматривать f1 как вещественный функционал на D. По
теореме Хана-Банаха существует его продолжение f˜1 на X с сохране-
нием нормы. Определим функционал f˜2 на X по следующей формуле

f˜2 (x) = −f˜1 (ix), x ∈ X.

137
Далее, f˜ определим следующим образом

f˜(x) = f˜1 (x) + if2 (x).

Имеем

f˜(ix) = f˜1 (ix) + if˜2 (ix) = −f˜2 (x) + if˜1 (x) = if˜(x).

Следовательно, f˜ комплексно линеен.


Если x ∈ D, то f˜1 (x) = f1 (x) и

f2 (x) = −f˜1 (ix) = −f1 (ix) = f2 (x).

Таким образом, f˜(x) = f (x) для всех x ∈ D. Учитывая, что |fi (x)| ≤
√1 kf kkxkX , i = 1, 2, то получаем
2
q
kf˜k = sup |f˜(x)| = sup |f˜1 (x)|2 + |f˜2 (x)|2 ≤ kf k.
kxkX ≤1 kxkX ≤1

В дальнейшем мы будем говорить о теореме Хана-Банах, как для


вещественных, так и для комплексных нормированных пространств,
без дополнительных уточнений.
Из теоремы Хана-Банаха следует несколько важных результатов.
Теорема 28.3. Пусть X — нормированное пространство. Для лю-
бого x ∈ X такого, что x 6= 0 существует линейный ограниченный
функционал f на X такой, что kf k = 1 и f (x) = kxkX .
Доказательство. Рассмотрим линейное многообразие D, состоящее
из элементов вида
y = tx, t ∈ R.
На этом многообразии определим функционал по формуле

f (tx) = tkxkX .

Ясно, что f (x) = 1, для y ∈ D имеем

|f (y)| = |t|kxkX = ktxkX = kykX .

Следовательно, kf k = 1. Применяя теорему Хана-Банаха, получаем


необходимое продолжение.

138
Важный для приложений результат о существовании функциона-
лов, разделяющих элемент нормированного пространства от линей-
ного многообразия.

Теорема 28.4. Пусть в нормированном пространстве X выделено


линейное многообразие L и элемент x0 ∈ X такой, что x0 ∈ / L и
расстояние d = inf kx0 − xkX > 0. Тогда существует всюду опреде-
x∈L
ленный в X линейный ограниченный функционал f такой, что

1. f (x) = 0, x ∈ L;

2. f (x0 ) = 1.

Доказательство. Определим L1 как линейное многообразие элемен-


тов, представимых в виде y = x + tx0 , где x ∈ L, t ∈ R. Определим
функционал f на L1 по следующей формуле

f (y) = t.

Условие 1) выполнено, поскольку для y ∈ L имеем f (y) = 0. Если


y = x0 , то f (x0 ) = 1 и выполнено условие 2).
Оценим норму этого функционала

|t|kykX kykX kykX


|f (y)| = |t| = = ≤ ,
kykX x/t + x0 d

x
поскольку kx/t + x0 kX = x0 − − t X ≥ d, учитывая, что −x/t ∈ L.

Для завершения доказательства продолжим f с L на все X по
теореме Хана-Банаха.

139
Глава VIII

Линейные функционалы

29. Сопряженные пространства


Мы уже говорили, что множество линейных ограниченных операто-
ров, действующих из банахова пространства X в банахово простран-
ство Y само является банаховым пространством. Если в качестве
пространства Y взять банахово пространство C, то пространство ли-
нейных ограниченных функционалов на X называется сопряженным
к X пространством и обозначается через X ∗ или X ′ .
Поскольку пространство C всегда полное, то в силу теоремы 26.1
любое сопряженное пространство X ∗ является банаховым простран-
ством вне зависимости от полноты X.
Понятие сопряженного пространства можно ввести и для любого
линейного топологического пространства L. Множество всех линей-
ных непрерывных функционалов на L называется сопряженным про-
странством, которое обозначается L′ . Ясно, что такое пространство
является линейным.
Важнейшее понятие функционального анализа и его приложения
связано с определением слабой сходимости элементов. Мы будем го-
ворит, что последовательность {xn } ⊂ X слабо сходится к элементу
x ∈ X, если для любого f ∈ X ∗ имеет место

hxn , f i → hx, f i.

Также будем говорит о слабом пределе. Поскольку, как мы увидим,


слабая сходимость не для всякой последовательности совпадает со

140
сходимостью по норме (будем говорит о сильной сходимости), то вве-
дем обозначение для слабой сходимости

x = w − lim xn .
n→∞

Прежде всего нужно убедиться в единственности слабого предела.


Пусть x′ = w − lim xn и x′′ = w − lim xn . Тогда для любого f ∈ X ∗
n→∞ n→∞
′ ′′
имеем hx , f i = hx , f i откуда

hx′ − x′′ , f i = 0.

Согласно теореме 28.3 возможно только x′ − x′′ = 0.


Из сильной сходимости вытекает слабая сходимость.

Теорема 29.1. Если x = lim xn , то x = w − lim xn .


n→∞ n→∞

Доказательство. Для любого f ∈ X ∗ имеем

|hx, f i − hxn , f i| = |hx − xn , f i| ≤ kx − xn kX kf k.

Отсюда следует слабая сходимость.


В случае гильбертова пространства имеет место следующий ре-
зультат.

Теорема 29.2. Пусть X есть гильбертово пространство, и после-


довательность xn ∈ X слабо сходится к x ∈ X. Тогда эта последо-
вательность сильно сходится к x тогда и только тогда, когда

lim kxn kX = kxkX .


n→∞

Доказательство. Из непрерывности нормы следует, необходимость.


Для доказательства достаточности нужно рассмотреть равенства

kxn − xk2X = (xn − x, xn − x)X = kxk2X − (xn , x)X − (x, xn )X + kxk2X ,

в котором предел в правой части равен

kxk2X − kxk2X − kxk2X + kxk2X = 0.

141
Поскольку X ∗ является банаховым пространством, то можно рас-
сматривать пространство, сопряженное к X ∗ , которое будем обозна-
чать X ∗∗ .

Теорема 29.3. Если последовательность xn слабо сходящаяся, то


она ограничена.

Доказательство. Для любого f ∈ x∗ последовательность hxn , f i огра-


ничена, при этом xn можно рассматривать как элемент пространства
X ∗∗ , то есть линейный ограниченный функционал. Согласно принци-
пу равномерной ограниченности kxn kX будет ограниченной.
Вообще в любом нормированном пространстве X можно ввести
слабую топологию, в которой система окрестностей нуля задается
следующим образом

Uεf = {x ∈ X : |hx, f i| < ε}, f ∈ X ∗ , ε > 0.

Соответственно, можно говорить не только о слабо й сходимости, но


и о слабой ограниченности и слабой компактности.

Теорема 29.4. В любом гильбертовом пространстве H всякое огра-


ниченное множество является слабо компактным.

Доказательство. Выберем произвольную ограниченную последова-


тельность gk в H
kgh kH ≤ C, k = 1, 2, . . . .
Образуем числовую последовательность

(g1 , gk )H , k = 1, 2, . . . .

Из неравенства Коши-Буняковского следует, что эта последователь-


ность ограничена

|(g1 , gk )H | ≤ kg1 kH kgk kH ≤ C 2 .

Следовательно из этой последовательности можно извлечь сходящу-


юся подпоследовательность, то есть существует последовательность
g1k такая, что
(g1 , g1k )H → h1 , k → ∞.

142
Далее, из ограниченной последовательности g1k можно извлечь под-
последовательность g2k такую, что

(g2 , g2k )H → h2 , k → ∞.

Аналогично можно построить последовательности gnk такие, что

(gn , gnk )H → hn , k → ∞.

Рассмотрим диагональную последовательность gkk . При любом p су-


ществует предел
lim (gp , gkk )H .
k→∞

Обозначим через L линейную оболочку для множества {gk } и поло-


жим
F = H ⊖ L.
Тогда для любого g ∈ L существует предел

lim (g, gkk )H .


k→∞

Если f ∈ F , то
(f, gkk )H , k = 1, 2, . . .
и, следовательно, предел

lim (h, gkk )H


k→∞

существует при всех h ∈ H, поэтому подпоследовательность gkk слабо


сходится к некоторому элементу.
Чтобы выяснить структуру пространства X ∗∗ введем понятие изо-
метрического вложения. Пусть X и Y нормированные пространства
и существует линейный оператор J : X → Y . Если этот оператор
удовлетворяет условию

kJxkY = kxkX ,

будем говорить, что пространство X изометрично вложено в Y .

Теорема 29.5. Пусть X — банахово пространство, тогда X изо-


метрично вложено в X ∗∗ .

143
Доказательство. Пусть x ∈ X фиксировано, поэтому каждому f ∈
X ∗ ставится в соответствие число hx, f i. При этом функционалу af1 +
bf2 ставится в соответствие число
hx, λf1 + µf2 i = λhx, f1 i + µhx, f2 i = λhx, f1 i + µhx, f2 i.
Поскольку |hx, f i| ≤ kxkX kf kX ∗ , то hx, f i определяет заданный всюду
на X ∗ линейный ограниченный функционал. Обозначим через x∗∗
этот функционал. Имеем
|x∗∗ (f )| = |hx, f i| ≤ kxkX kf kX ∗ ,
следовательно, kx∗∗ kX ∗∗ ≤ kxkX , тогда в силу теоремы 28.3 для всяко-
го x ∈ X существует f0 ∈ X ∗ такой, что kf0 kX ∗ = 1 и hx, f0 i = kxkX .
Поэтому
|hf0 , x∗∗ i| = |hx, f0 i| = kxkX kf0 kX ∗ .
Что означает kx∗∗ kX ∗∗ = kxkX .
В этом случае мы будем использовать запись X ⊂ X ∗∗ . Если все
линейные ограниченные функционалы на сопряженном пространстве
исчерпываются элементами X, то есть X ∗∗ = X, то пространство X
называется рефлексивным пространством.
Кроме сходимости по метрике, которую мы называем сильной схо-
димостью, мы ввели понятие слабой сходимости. Для элементов со-
пряженного пространства можно ввести еще понятие слабой∗ сходя-
щейся1 последовательности. Пусть X нормированное пространство,
тогда последовательность {fn } ⊂ X ∗ сходится слабо∗ к элементу
f ∈ X ∗ , если для всех x ∈ X имеет место
hx, fn i → hx, f i, n → ∞.
При этом пишут w ∗ −lim fn = f .
n→∞
Разумеется, в сопряженном пространстве можно ввести и силь-
ную сходимость по норме. При этом имеем простой факт.
Теорема 29.6. Пусть последовательность fn ∈ X ∗ сходиться силь-
но к f ∈ X ∗ , тогда имеет место w ∗ −lim fn = f .
n→∞
Доказательство. Для любого x ∈ X имеем
|hx, fn i − hx, f i| ≤ kfn − f kX ∗ kxkX .

1
Говорят, «слабой со звездой».

144
30. Теорема Рисса
Для банахова пространства задавать линейный ограниченный функ-
ционал можно не произвольно, поскольку он должен быть элемен-
том сопряженного пространства. Вообще говоря, определение сопря-
женного пространства задача сложная, но в случае гильбертова про-
странства этот вопрос может быть решен полностью. Фундаменталь-
ная теорема Ф. Рисса2 имеет важные приложения.
Теорема 30.1 (Теорема Рисса). Пусть H — гильбертово простран-
ство. Для любого линейного ограниченного функционала f на H су-
ществует единственный элемент yf ∈ H такой, что

f (x) = (x, yf )H ,

для всех x ∈ H, причем kf k = kyf kH .


Обратно, любой элемент y ∈ H определяет линейный ограничен-
ный функционал fy на H по формуле

fy (x) = (x, y)H ,

для всех x ∈ H, причем kfy k = kykH .


Доказательство. Рассмотрим линейное многообразие N (f ) = {x ∈
H : f (x) = 0}. В силу непрерывности функционала это многообразие
будет замкнутым. Действительно, пусть xn ∈ N (f ) такая что xn →
x∞ , тогда
f (x∞ ) = f ( lim xn ) = lim f (xn ) = 0,
n→∞ n→∞

поэтому x∞ ∈ N (f ).
Если N (f ) = H, то очевидно, что yf = 0. Предположим, что
N (f ) 6= H. Тогда существует такой элемент y0 6= 0, y0 ∈ H ⊖ N (f )
(см. п. 20). Пусть x пробегает все H тогда рассмотрим элементы вида

z = f (x)y0 − f (y0 )x.

Очевидно, что такие элементы принадлежат N (f ) поскольку

f (z) = f (x)f (y0 ) − f (y0 )f (x) = 0.


2
Не путать с его братом М. Риссом, который был тоже известным венгерским
математиком.

145
Следовательно,
(f (x)y0 − f (y0 )x, y0 )H = 0
или
f (x)ky0 k2H = (x, f (y0 ), y0 )H .
Построим элемент yf по следующей формуле

f (y0 )
yf = y0 .
ky0 k2H

Тогда получаем, что


f (x) = (x, yf )H .
Покажем единственность. Предположим, что одному функционалу
соответствуют два элемента y ′ и y ′′ . Тогда имеем

(x, y ′ )H = (x, y ′′ )H .

В случае, когда x = y ′ − y ′′ получаем ky ′ − y ′′ kH = 0.


Вычислим норму функционала. Имеем

|f (x)| ≤ kxkH kyf kH ,

следовательно, kf k ≤ kyf kH . Возьмем x = yf получаем f (x) = kyf k2H .


Следовательно имеем в точности kf k = kyf kH .
Пусть теперь фиксирован элемент y ∈ H для любого x ∈ H опре-
делим числовую функцию (функционал)

f (x) = (x, y)H .

Из свойств скалярного произведения следует, что этот функционал


является линейным. Его ограниченность следует из неравенства Коши-
Буняковского. Ясно также, что

kf k ≤ kykH ,

беря x = y снова получаем, что f (x) = kyk2H , поэтому kf k = kykH .


Теорема Рисса показывает, что сопряженное пространство в гиль-
бертовом случае совпадает с самим пространством H∗ = H, соответ-
ственно, любое гильбертово является рефлексивным.

146
Теорема Рисса верна и для несепарабельных гильбертовых про-
странств, но для гильбертовых пространств с ортонормированным
базисом действие любого линейного ограниченного функционала вы-
числяется через коэффициенты Фурье. Пусть любой элемент x ∈ H
представляется в виде
X∞
x= ck ek ,
k=1
где ck — коэффициенты Фурье по ортонормированному базису ek .
Тогда для любого функционала f имеем

X
f (x) = c k fk ,
k=1

где {fk } ∈ l2 .
Для гильбертова пространства L2 (Q) значение любого функцио-
нала h вычисляется по формуле
Z
h(f ) = f (x)h(x)dx,
Q

где h = h(x) ∈ L2 (Q).

31. Сопряженные операторы


Сопряженные пространства играют важную роль еще и потому, что
позволяют сформулировать понятия сопряженных (и самосопряжен-
ных) операторов. Пусть X, Y суть банаховы пространства. Рассмот-
рим линейный ограниченный оператор
A : X → Y.
Для фиксированного f ∈ Y ∗ рассмотрим элемент ϕ ∈ X ∗ , определен-
ный по следующей формуле
ϕ(x) = hx, ϕi = hAx, f i.
Линейность этого функционала следует из линейности оператора A и
линейности функционала f , и может быть проверена непосредствен-
но. Несложно видеть и ограниченность функционала ϕ
|ϕ(x)| = |hAx, f i| ≤ kAxkY kf kY ∗ ≤ kAkkxkX kf kY ∗ ≤ ckxkX . (VIII.1)

147
Таким образом, мы получили линейный ограниченный оператор
A∗ : Y ∗ → X ∗ ,
который мы будем называть сопряженнным оператором к оператору
A.
Теорема 31.1. Для сопряженного оператора имеем
kA∗ k = kAk.
Доказательство. Из (VIII.1) следует
kϕk ≤ kAkkf kY ∗
отсюда следует, что kA∗ k ≤ kAk.
В силу теоремы Хана-Банаха для каждого x0 ∈ X и Ax0 6= 0
существует функционал f0 ∈ Y ∗ такой, что kf0 kY ∗ = 1 и
hAx0 , f0 i = kAx0 kY = |hx0 , A∗ f0 i| ≤ kA∗ kkf0 kY ∗ kx0 kX .
Следовательно, kAk ≤ kA∗ k, поэтому kA∗ k = kAk.
Сопряженные операторы наиболее интересно рассматривать в гиль-
бертовом пространстве. Пусть H — гильбертово пространство. Для
линейного ограниченного оператора
A:H→H
сопряженным оператором называется оператор A∗ : H → H такой,
что
(Ax, y)H = (x, A∗ y)H ,
для всех x, y ∈ H. Использование скалярного произведение оправ-
дывается теоремой Рисса об общем виде линейного ограниченного
функционала в гильбертовом пространстве.
Оператор A называется самосопряженным оператором, если A∗ =
A, то есть
(Ax, y)H = (x, Ay)H
для всех x, y ∈ H. Мы будем уделять большое внимание самосопря-
женным операторам, поскольку они обладают рядом замечательных
свойств, и главное, возникают во многих задачах, где применяется
функциональный анализ.
Докажем несколько простых, но важных результатов относитель-
но самосопряженных операторов.

148
Теорема 31.2. Для любых двух самосопряженных операторов A и
B и вещественных чисел a и b оператор aA + bB самосопряжен.

Доказательство. Для x, y ∈ H имеем

((aA + bB)x, y)H = a(Ax, y)H + b(Bx, y)H =

(x, aAy)H + (x, bBy)H = (x, (aA + bB)y)H .

Вообще говоря, скалярное произведение является комплексным


числом, но для самосопряженного оператора имеет место следующая
теорема.

Теорема 31.3. Пусть A самосопряженный оператор, тогда число


(Ax, x)H вещественное.

Доказательство. Для любого x ∈ H имеем

(Ax, x)H = (x, Ax)H = (Ax, x)H ,

следовательно число (Ax, x)H совпадает со своим комплексным со-


пряжением, что может быть только для вещественных чисел.
Если для самосопряженного оператора имеет место неравенство

(Ax, x)H ≥ 0,

для всех x ∈ H, то такой оператор называется неотрицательным, и


мы будем писать A ≥ 0.

32. Обобщенные функции


Понятие δ-функции или функции Дирака прочно вошло в физику
и технику, а также во многие «прикладные» работы по математике.
При это у авторов, использующих δ-функции есть четкое понима-
ние этого понятия — «импульсные воздействия», «сосредоточенные
заряды» и т.д. Прикладной «математик» объяснит, что δ-функция
— это производная от ступенчатой функции Хевисайда. Более того,

149
используется такое «определение»: δ(x) = 0, при x 6= 0 и δ(0) = ∞ и
такая, что Z
δ(x) = 1.
R

В этом случае можно спросить в каком смысле понимается данный


интеграл? В смысле Римана — невозможно, этот интеграл вводится
только для ограниченных функций. Интеграл Лебега не изменяется
при изменении функции на множестве меры нуль, поэтому значение
функции δ(x) в нуле не имеет значения.
Подойти к понятию δ-функции, как производной разрывной функ-
ции в классическом анализе не получится — из существования про-
изводной следует непрерывность.
Однако игнорировать δ-функции нельзя, поскольку они в самом
деле описывают многие физические явления и понятия. В середине
XX-века была построена теория обобщенных функций или теория
распределений, в которой даны точные понятия δ-функций. Рассмот-
рим определения и основные операции с обобщенными функциям.
В п. 25 мы ввели линейное топологическое пространство финит-
ных бесконечно дифференцируемых функций Ċ ∞ (Q). Будем также
называть это пространство — пространством основных функций и
будем обозначать через D(Q). Это пространство является топологи-
ческим, поэтому в нем определено понятие сходимости элементов и
непрерывности отображений.
Пространство сопряженное к пространству основных функций
называется пространством обобщенных функций или распределений,
обозначаемым D′ (Q). Таким образом, обобщенная функция — это
функционал над гладкими финитными функциями.
Что же такое δ-функция на самом деле? Функционал, который
определяется по формуле

δ(x)(f ) = hf, δ(x)i = f (0).

Более обще, распределение δ(x − x0 ) для любого x0 ∈ R

δ(x − x0 )(f ) = hf, δ(x − x0 )i = f (x0 ).

Подчеркнем, что в обозначении δ(x) буква x есть лишь традицион-


ный символ, а не аргумент функции, поскольку обобщенные функции

150
потому и называются распределениями, что не являются функциями
точки.
Как все-таки понимать интеграл от δ-функции? Этот интеграл
следует понимать как символ функционала. Дело в том, что в про-
странстве L2 действие любого функционала есть скалярное произве-
дение, которое в свою очередь представляет собой интеграл.
Впрочем, любая функция g(x), интегрируемая на любом ограни-
ченном множестве в Rn , определяет некоторую обобщенную функ-
цию, которую будем обозначать также g(x)
Z
hf, gi = f (x)g(x)dx.
Rn

Для любой f ∈ D этот интеграл существует. Обобщенные функции,


которые могут быть представлены таким образом, называются регу-
лярными обобщенными функциями, в противном случае обобщенные
функции называются сингулярными.
Через L1,loc (Q) обозначим множество функций, интегрируемых по
Лебегу на любом компакте K ⊂ Q. Имеем вложения
Lp (Q) ⊂ L1,loc (Q) ⊂ D′ (Q).
Это оправдывает название обобщенная функция.
Примером сингулярной обобщенной функции является δ-функция.
Еще одним примером сингулярной обобщенной функции является
функция x1 ∈ D′ (R). Эта функция неинтегрируема на отрезке, содер-
жащим 0, однако мы определим функционал следующим образом
  Z
1 f (x) − f (0) f (0) f (x) − f (0)
Z Z
f, = dx + v. p. dx = dx.
x x x x
R R R

Последний интеграл сходится для любой f ∈ D(R), поскольку его


пределы интегрирования не шире компактного носителя функции f ,
а под интегралом стоит непрерывная функция.
Рассмотрим теперь действия над обобщенными функциям. По-
скольку множество D′ (Q) есть линейное пространство, обобщенные
функции можно складывать и умножать на скаляры. Теперь введем
топологию в пространстве обобщенных функций. Зададим систему
окрестностей нуля следующим образом
Uf,ε (0) = {g ∈ D′ (Q) : |g(f )| < ε}, f ∈ D(Q), ε > 0.

151
Следовательно, последовательность обобщенных функций gn ∈ D′ (Q)
сходится к g ∈ D′ (Q), если для всех f ∈ D(Q) имеет место
hf, gn i → hf, gi.
Так уж получается, что обобщенные функции нельзя умножать
друг на друга, поэтому никто еще не видел «квадрата δ-функции».
Однако обобщенные функции можно умножать на бесконечно диф-
ференцируемые функции. Пусть α(x) бесконечно дифференцируемая
функция на Q. При этом не предполагаем, что функция α(x) имеет
компактный носитель. Умножение определим по следующей форму-
ле
hf, (αg)i = hαf, gi.
Это корректно, поскольку произведение бесконечно гладкой функ-
ции на функцию из D(Q) снова будет функция из D(Q).
Однако наиболее интересно, что любую обобщенную функцию
можно дифференцировать любое количество раз! Пусть g ∈ D′ (Q)
есть обобщенная функция. Тогда производной gxi , 1 ≤ i ≤ n называ-
ется обобщенная функция, определенная по формуле
hf, gxi i = −hfxi , gi.
Последнее выражение тоже корректно, поскольку производная функ-
ции из D(Q) принадлежит тому же множеству D(Q). Производную
обобщенной функции мы будем называть обобщенной производной.
Пусть обобщенная функция является регулярной функцией g(x), x ∈
Q, предположим, что функция g(x) непрерывно дифференцируема в
Q. Рассмотрим обобщенную производную этой функции
hf, gxi i = −hfxi , gi,
но для регулярной функции значение функционала есть интеграл
Z
−hfxi , gi = − fxi (x)g(x)dx.
Q

В последнем интеграле мы имеем гладкие функции, поэтому можно


проинтегрировать по частям
Z Z Z
− fxi (x)g(x)dx = − f (x)g(x)dSx + f (x)gxi (x)dx.
Q ∂Q Q

152
Поверхностный интеграл равен нулю, поскольку функция f (x) фи-
нитная в Q. А последний интеграл можно интерпретировать, как
действие обобщенной функции
Z
f (x)gxi (x)dx = hf, gxi i,
Q

являющейся обобщенной производной gxi обобщенной функции g.


Следовательно, обобщенная производная совпадает с обычной про-
изводной, если обобщенная функция является гладкой регулярной
функцией.
Разумеется, аналогично можно рассматривать производные лю-
бых порядков. При этом любая функция из L1,loc (Q) и, соответствен-
но, из Lp (Q) и C(Q) имеет любое количество обобщенных производ-
ных.
Например, рассмотрим функцию Хевисайда

1, x > 0
η(x) =
0, x ≤ 0.

Не может быть и речи, о классической производной у этой функции


в нуле. Но обобщенная производная у этой функции есть. Вычислим
ее. Пусть f ∈ D(R) имеем

hf, ηx i = −hfx , ηi,

Поскольку η(x) есть регулярная функция, то имеем


Z∞ Z∞
−hfx , ηi = − fx (x)η(x)dx = − fx (x)dx = f (0).
−∞ 0

То есть обобщенная производная функции Хевисайда есть обобщен-


ная функция, которая представляет собой функционал, действую-
щий по формуле
hf, ηx i = f (0),
но этот функционал является δ-функцией. Поэтому

ηx (x) = δ(x).

153
Глава IX

Неограниченные линейные
операторы

33. Замкнутые операторы


До этого момента мы рассматривали операторы, которые были опре-
делены на всем нормированном пространстве. Однако широкий класс
операторов, возникающих в задачах математической физики, явля-
ются неограниченными операторами, при этом они определены, во-
обще говоря, лишь на некотором подмножестве. Перейдем к опре-
делениям. Пусть X и Y суть банаховы пространства1 . Рассмотрим
линейное многообразие D в X. Линейным оператором, действующем
из X в Y с областью определения D называется линейное отображе-
ние
Au = f,
где u ∈ D, f ∈ Y . Для области определения будем использовать
обозначения D(A). При этом мы будем сохранять запись

A:X→Y

Иногда пишут A : D(A) ⊂ X → Y или даже A : X ⊃ D(A) → Y .


Множество
R(A) = {f ∈ Y : f = Au, u ∈ D(A)}
1
Многие результаты верны и для только нормированных пространств, но мы
будем в основном рассматривать в этой главе банаховы и гильбертовы простран-
ства.

154
называется образом оператора A. Через N (A) обозначим ядро опе-
ратора A, то есть множество таких u ∈ D(A), что Au = 0.
Можно, конечно, рассматривать всюду определенный оператор
A : D → Y , но обычно множество D не является замкнутым в X и
не является банаховым в интересующей нас норме X.
Если D(A) плотно в X, то оператор называется плотно опреде-
ленным. Пусть на ряду с оператором A мы рассматриваем оператор
A1 : X → Y при этом, если D(A) ⊂ D(A1 ) и Au = A1 u для всех
u ∈ D(A), то оператор A1 называется продолжением или расшире-
нием оператора A. В свою очередь оператор A называется сужением
оператора A1 . Будем использовать обозначения

A ⊂ A1 , A1 ⊃ A.

Если оператор A взаимно однозначный, то можно определить обрат-


ный оператор A−1 : Y → X. При этом имеем

D(A−1 ) = R(A), R(A−1 ) = D(A).

По определению обратного оператора имеем

A−1 Au = u, u ∈ D(A)

и
AA−1 f = f, u ∈ R(A).
Оператор, для которого существует обратный, называется обрати-
мым оператором.
Рассмотрим два оператора A и B, действующих из X в Y . Суммой
этих операторов называется оператор A + B с областью определения

D(A + B) = D(A) ∩ D(B).

При этом по определению умножение оператора на число (даже не


ноль) не меняет область определения оператора. Из этого следует,
что нужно проявлять осторожность с использованием линейной ком-
бинации неограниченных операторов, поскольку легко получит в ре-
зультате оператор с тривиальной (то есть содержащей только ноль)
областью определения.
Неограниченные операторы представляют собой слишком общие
объекты, не удобные в приложениях. Определенным компромиссом

155
является использования замкнутых операторов, как аналог непре-
рывности. Оператор A : X → Y с областью определения D(A) на-
зывается замкнутым, если из условий un ∈ D(A), kun − ukX → 0,
kAun − ykY следует, что u ∈ D(A) и Au = y.
Можно дать другое эквивалентное определение замкнутости с ис-
пользованием понятия графика оператора. Введем новое банахово
пространство Z = X × Y , в котором определим норму следующим
образом
1/2
k(x, y)kZ = kxk2X + kyk2Y .
Графиком оператора A называется следующее множество Γ(A) в
пространстве Z
Γ(A) = {(u, Au) : u ∈ D(A)}.
Оператор A замкнут тогда и только тогда, когда его график — замк-
нутое множество. Если график является замкнутым, то замкнутость
оператора A очевидна. С другой стороны, если оператор замкнут,
то последовательность {(un , Aun )} ⊂ Z, u ∈ D(A) имеет предел
(u, Au) ∈ Γ(A), что означает замкнутость графика.
Для оператора A−1 обратного к A график будем рассматривать в
том же пространстве X × Y , как подмножество (A−1 v, v), v ∈ R(A),
в этом случае график обратного оператора Γ(A−1 ) совпадает с гра-
фиком Γ(A). Из этого сразу же следует, что оператор, обратный к
замкнутому оператору, сам замкнут.
Если оператор незамкнут и его график — незамкнутое множество,
то график можно замкнуть как множество в X × Y , однако эта про-
цедура не обязательно приведет к замкнутому оператору, поскольку
не любое подмножество в X × Y является графиком. Поэтому мы бу-
дем говорить, что оператор A замыкаем (допускает замыкание), если
замыкание его графика является графиком. При процедуре замыка-
ние, то есть при переходе к замыканию мы получаем наименьшее
замкнутое продолжение оператора A. Пусть оператор A1 есть замы-
кание оператора A. Тогда элемент u ∈ D(A1 ) тогда и только тогда,
когда существует последовательность un ∈ D(A) такая, что un → u
и Aun → A1 u.

156
34. Самосопряженные операторы
Мы уже упоминали о важности самосопряженных операторов в функ-
циональном анализе. Однако в приложениях часто возникают неогра-
ниченные самосопряженные операторы. Определения для сопряжен-
ных и самосопряженных операторов в неограниченном случае имеет
существенные нюансы в отличии от случая ограниченных операто-
ров.
Для плотно определенного оператора A : X → Y сопряженным
называется оператор A∗ : Y ∗ → X ∗ , если
hAu, vi = hu, A∗ vi,
для всех u ∈ D(A) и v ∈ D(A∗ ) и этот оператор не имеет собственных
расширений.
Покажем существование сопряженного оператора. Область опре-
деления D(A∗ ) состоит из всех таких v ∈ Y ∗ , что для некоторого
f ∈ X∗
hAu, vi = hu, f i
верно для всех u ∈ D(A). В силу плотности D(A) в X элемент f
определяется однозначно. При этом оператор A∗ : Y ∗ → X ∗ опреде-
ляется равенством A∗ v = f . Линейность оператора A∗ проверяется
непосредственно.
В дальнейшем в этом параграфе мы рассмотрим частный, но
принципиально важный случай, когда X = Y = H, где H есть гиль-
бертово пространство.
Оператор A : H → H с областью определения D(A) называет-
ся самосопряженным, если A = A∗ . При этом предполагается, что
D(A) = D(A∗ ) и для всех u, v ∈ D(A) имеет место
(Au, v)H = (u, Av)H .
Существенным моментом является то обстоятельство, что оператор
не имеет в H собственных замкнутых расширений.
Рассмотрим пример. Пусть в качестве H возьмем пространство
L2 (0, 1) вещественно значных функций2 . Рассмотрим, дифференци-
d2
альный оператор L = dx 2 с областью определения

D(L) = {u ∈ C 2 [0, 1] : u(0) = u(1) = 0}.


2
Это предположение только для сокращения письма.

157
Для любых двух u, v ∈ D(A) имеем
Z1
(Lu, v)L2 (0,1) = u′′ (x)v(x)dx.
0

Интегрируем по частям (в силу гладкости функций u и v это можно


сделать безболезненно) и учитывая краевые условия получаем
Z1 Z1 Z1
u′′ (x)v(x)dx = u′ (1)v(1)−u′ (0)v(0)− u′ (x)v ′ (x)dx = − u′ (x)v ′ (x)dx.
0 0 0

Интегрируя еще раз получаем


Z1
(Lu, v)L2 (0,1) = u(x)v ′′ (x)dx = (u, Lv)L2 (0,1) .
0

Однако отсюда не следует, что A = A∗ , поскольку оператор A не


является замкнутым. В дальнейшем мы подробно рассмотрим диф-
ференциальные операторы.
Для изучения сопряженных операторов в гильбертовом простран-
стве рассмотрим метод графика. Введем пространство H = H × H.
В этом случае графиком оператора A называется множество
Γ(A) = {(u, Au) : u ∈ D(A)} ⊂ H.
Определим оператор U : H → H следующим образом
U (u, v) = (v, −u).
Легко проверить, что U H = H и U 2 = −I.
Для любых u ∈ D(A) и v, v ∗ ∈ H имеем
(Au, v)H − (u, v ∗ )H = ((Au, −u), (v, v ∗ ))H = (U (u, Au), (v, v ∗ ))H .
Следовательно,
(Au, v)H = (u, v ∗ )H
тогда и только тогда, когда элемент (v, v ∗ ) ∈ H ортогонален множе-
ству U Γ(A). А это означает, что для графика сопряженного операто-
ра Γ(A∗ ) выполняется следующее соотношение
Γ(A∗ ) = H ⊖ U Γ(A). (IX.1)

158
Поскольку в гильбертовом пространстве ортогональное дополнение к
замкнутому многообразию само является замкнутым многообразием,
то график Γ(A∗ ) сопряженного оператора всегда является замкну-
тым множество, следовательно, оператор являющийся сопряженным
— замкнут, даже если исходный оператор A не является замкнутым.
Заметим, что этот факт верен и для операторов в банаховых про-
странствах.
Связь между сопряженным и обратным операторами устанавли-
вается в следующей теореме.
Теорема 34.1. Пусть линейный оператор A имеет обратный A−1
и пусть области определения D(A) и D(A−1 ) плотны в H. Тогда
имеет равенство ∗
(A∗ )−1 = A−1 .
Доказательство. Пусть u ∈ D(A), v ∈ D((A−1 )∗ ) — произвольные
элементы. Тогда имеем

(u, v)H = (A−1 Au, v)H = (Au, (A−1 )∗ v)H ,

но это означает, что (A−1 )∗ v ∈ D(A∗ ) и

A∗ (A−1 )∗ v = v. (IX.2)

С другой стороны, если f пробегает все D(A−1 ), а h пробегает все


D(A∗ ), то мы имеем

(f, h)H = (AA−1 f, h)H = (A−1 f, A∗ h)H ,

следовательно
A∗ h ∈ D((A−1 )∗ )
и
(A−1 )∗ A∗ h = h
отсюда и из (IX.2) следует, что
∗
(A∗ )−1 = A−1 .

Для сопряженного оператора можно также рассматривать сопря-


женный оператор A∗∗ . Что из себя представляет этот оператор?

159
Теорема 34.2. Пусть плотно определенный оператор A допускает
замыкание, тогда оператор A∗∗ существует и имеет место равен-
ство
A∗∗ = A.

Доказательство. Сначала рассмотрим случай, когда оператор A за-


мкнут, тогда множество Γ(A) — замкнуто, а значит замкнуто и мно-
жество U Γ(A), тогда имеем представление

H = U Γ(A) ⊕ Γ(A).

В силу линейности оператора A имеем Γ(A) = −Γ(A), поэтому при-


меняя оператор U , получим

H = Γ(A) ⊕ U Γ(A∗ )

или
H ⊖ U Γ(A∗ ) = Γ(A).
Теперь из (IX.1) следует, что существует A∗∗ и он совпадает с A.
Пусть теперь оператор A только замыкаем, тогда по доказанному
выше
(A)∗∗ = A.
Однако
(A)∗∗ = ((A)∗ )∗ = (A∗ )∗ = A∗∗ ,
следовательно
A∗∗ = A.

Теперь докажем теорему, которая кажется очевидной, но весьма


важной при доказательстве ограниченности операторов.

Теорема 34.3. Замкнутый оператор A с областью определения D(A) =


H является ограниченным.

Доказательство. Рассмотрим сопряженный оператор A∗ . Предпо-


ложим, что он неограничен. Тогда существует последовательность
vn ∈ D(A∗ ) такая, что kvn kH = 1 и

lim kA∗ vn kH = ∞.
n→∞

160
Построим последовательность функционалов fn по формуле

f (vn ) = (u, A∗ vn )H = (Au, vn )H .

Поскольку при каждом u ∈ H числовая последовательность fn (u)


ограниченна, то по принципу равномерной ограниченности и вся по-
следовательность функционалов ограничена

kfn k ≤ M.

Это противоречие устанавливает ограниченность оператора A∗ . В


силу его замкнутости область определение D(A∗ ) также замкнутое
множество. Более того это множество плотно в H, поскольку в силу
замкнутости оператора A и теоремы 34.2 оператор A∗ допускает за-
мыкание. Поэтому D(A∗ ) = H. В тоже время поскольку A∗∗ = A, то
по доказанному оператор A является ограниченным.
Вернемся к вопросу о построении самосопряженных операторов.
Отправной точкой для построения самосопряженных операторов, как
правило, является понятие симметричного оператора. Рассмотрим
плотно определенный оператор A в гильбертовом пространстве H.
Этот оператор называется симметричным, если для любых u, v ∈
D(A) выполняется равенство

(Au, v)H = (u, Av)H .

Сразу же это означает, что для симметричного оператора A для всех


u ∈ D(A) выражение (Au, u)H вещественно. Действительно,

(Au, u)H = (u, Au)H = (Au, u)H ,

что может быть только для вещественной величины.


Из определения симметричного оператора получаем, что

A ⊂ A∗ ,

поэтому симметричный оператор всегда допускает замыкание и это


замыкание есть самосопряженный оператор.
Введенный выше дифференциальный оператор L является сим-
метричным оператором, и следовательно, его замыкание будет само-
сопряженным оператором. Впрочем, для описание области определе-
ния самосопряженных дифференциальных операторов пространства

161
непрерывных функций недостаточно. Мы еще вернемся к этому во-
просу подробно.
Итак, допустим, что мы построили симметричный оператор. Как
узнать будет ли он самосопряженным? Кроме непосредственной про-
верки его замкнутости, есть еще удобное достаточное условие.

Теорема 34.4. Пусть оператор A является симметричным опера-


тором и R(A) = H, тогда этот оператор самосопряженный.

Доказательство. Пусть A∗ сопряженный оператор. Покажем, что


D(A∗ ) ⊂ D(A). Возьмем любой v ∈ D(A∗ ). Положим v ∗ = A∗ v.
Поскольку образ оператора A есть все пространство, то существует
w ∈ D(A) такой, что Aw = v ∗ . Следовательно, при любом u ∈ D(A)
имеем
(Au, v)H = (u, A∗ v)H = (Au, Aw)H = (Au, w)H .
Когда u пробегает все D(A), то Au пробегает все H по условию тео-
ремы, поэтому отсюда следует, что v = w и v ∈ D(A).
Обратный оператор к самосопряженному оператору тоже являет-
ся самосопряженным. Более точно имеет место следующий результат.

Теорема 34.5. Если самосопряженный оператор A имеет обрат-


ный оператор A−1 , то оператор A−1 является также самосопря-
женным.

Доказательство. Проверим, что область определение оператора A−1


плотна в H. Поскольку D(A−1 ) = R(A), то покажем, что область
значений R(A) плотна в H. Действительно, в противном случае су-
ществовал бы нетривиальный элемент f ∈ H такой, что

(Au, f )H = 0

для всех u ∈ D(A). Что невозможно, поскольку тогда f ∈ D(A) и


Af = 0, а это противоречит существованию обратного оператора.
Таким образом, существует (A−1 )∗ , далее по теореме 34.1 имеем

(A−1 )∗ = (A∗ )−1 = A−1 .

162
35. Резольвента и спектр
Спектр линейного оператора A, действующего в банаховом простран-
стве X является непосредственным обобщением понятия собствен-
ных значений для квадратных матриц. Понятие спектра играет важ-
нейшую роль в теории линейных операторов их приложениях. В част-
ности, при построении численных методов, в квантовой механике и
многих других фундаментальных и прикладных вопросах.
В этом параграфе будем рассматривать линейный, вообще говоря,
неограниченный оператор, действующий в одном и том же банахо-
вом пространстве X над полем комплексных чисел. Помимо этого
оператора рассмотрим семейство операторов

(A − λI) : X → X,

где λ ∈ C, с областью определения D(A). Необходимость обязатель-


но рассматривать комплексные значения параметра имеет тот мотив,
что любая квадратная матрица (с вещественными элементами) все-
гда имеет собственные значения, но в общем случае эти собственные
значения будут комплексными — как следствие основной теоремы
алгебры о существовании корней и любого полинома.
Точка λ ∈ C называется регулярной или резольвентной, если опе-
ратор (A − λI) имеет ограниченный обратный. Множество всех регу-
лярных точек называется резольвентным множеством и обозначается
̺(A). Для λ ∈ ̺(A) оператор

R(A; λ) = (A − λI)−1

называется резольвентой3 .
Резольвента, если она существует, удовлетворяет равенству, уста-
навливаемому следующей теоремой.

Теорема 35.1 (Соотношение Гильберта). Пусть λ, µ ∈ ̺(A), тогда

R(A; λ) − R(A; µ) = (λ − µ)R(A; λ)R(A; µ).

В частности, резольвенты коммутируют между собой.


3
По одной из легенд, «Резольвента» — это испанское женское имя

163
Доказательство. Для произвольного x ∈ X имеем

R(A; λ)x = R(A, µ)(A − µI)R(A; λ)x

и
R(A; µ)x = R(A, µ)(A − λI)R(A; λ)x.
Вычитая из первого соотношения второе — получаем соотношение
Гильберта для резольвент.
Для дальнейшего нам потребуется важная и в дальнейшем очень
полезная теорема.

Теорема 35.2. Пусть ограниченный оператор A : X → X такой,


что kAk < 1. Тогда существует ограниченный обратный (I − A)−1
и
1
k(I − A)−1 k ≤ .
1 − kAk
Доказательство. Поскольку пространство линейных ограниченных
оператор L(X, X) является банаховым пространством, то в нем мож-
но рассматривать последовательности и ряды элементов. Рассмот-
рим ряд
I + A + A2 + A3 + . . . .
Поскольку kAk k ≤ kAkk , то норма частичной суммы нашего ряда
оценивается следующим образом
q q
X X
k
A ≤ kAkk . (IX.3)



k=p k=p


kAkk как сумма геометриче-
P
Поскольку kAk < 1, то числовой ряд
k=1
ской прогрессии сходится, то из (IX.3) сходиться ряд
N
X
SN = I + Ak → S,
k=1

где S ∈ L(X, X) некоторый линейный ограниченный оператор. Име-


ем
(I − A)SN = SN (I − A) = I − AN +1 .

164
Поскольку AN +1 → 0, при N → ∞, то переходя к пределу получаем
(I − A)S = S(I − A) = I.
Следовательно, (I −A) имеет обратный и (I −A)−1 = S. Далее, имеем
1
kSk ≤ 1 + kAk + kAk2 + kAk3 + · · · ≤ .
1 − kAk

Теорема 35.3. Резольвентное множество всегда открыто.


Доказательство. Поскольку пустое множество по определению от-
крыто, то можно считать, что существует λ0 ∈ ̺(A) и оператор
(A − la0 I) непрерывно обратим. Для любого λ ∈ C имеем
A − λI = A − λ0 I − (λ − λ0 )I = (A − λ0 I)[I − (λ − λ0 )R(A; λ0 )].
Следовательно, оператор A − λI обратим, если обратим оператор
I − (λ − λ0 )R(A; λ0 ), поскольку оператор (A − λ0 I) обратим по пред-
положению. Согласно теореме 35.2 оператор I −(λ−λ0 )R(A; λ0 ) будет
обратим, если выполнено условие
|λ − λ|kR(A; λ0 )k < 1.
Следовательно вместе с λ0 резольвентному множеству принадлежит
и открытый шар Bλ+0 (r), r = kR(A; λ0 )k, что означает открытость
множества ̺(A).
Спектром оператора A, обозначаемым σ(A), называется допол-
нение к резольвентному множеству. Из теоремы 35.3 следует, что
спектр оператора всегда замкнут.
Теорема 35.4. Пусть оператор A ограничен, тогда для его спектра
имеет место следующее включение
σ(A) ⊂ {λ ∈ C : |λ| < kAk}.
Доказательство. Возьмем произвольное λ ∈ C такое, что |λ| > kAk.
Поскольку
R(A; λ) = A − λI = −λ(I − λ−1 A),
то оператор (I−λ−1 A) обратим по теореме 35.3, учитывая, что kλ−1 Ak <
1. Следовательно, λ ∈
/ σ(A).

165
Спектр оператора можно разделить на три класса. Множество
λ ∈ σ(A) называется точечным спектром, если оператор (A − λI) не
имеет обратного оператора.
Множество λ ∈ σ(A) называется непрерывным спектром, если
для оператора (A − λI) существует обратный с плотной областью
определения, но оператор A − λI)−1 не является ограниченным. Да-
лее, множество λ ∈ σ(A) называется остаточным спектром, если
существует обратный оператор A − λI)−1 , но этот оператор имеет
неплотную область определения.
Нас больше всего будет интересовать точечный спектр. Для то-
го, чтобы λ ∈ σ(A) принадлежала точечному спектру необходимо и
достаточно, чтобы уравнение

Ax = λx

имело ненулевое решение x ∈ D(A). В этом случае число λ называет-


ся собственным значением оператора A, а все решения этого уравне-
ния (их, очевидно, бесконечное число, поскольку ax, a 6= 0 тоже реше-
ние, если x — решение), называются собственными векторами4 . Далее
ядро оператора (A − λI) называется собственным подпространством
оператора A, соответствующим собственному значению λ, а размер-
ность dim N (A − λI) называется кратностью собственного значения.
Приведем примеры спектров неограниченных операторов.
Рассмотрим банахово пространство C[0, T ]. В качестве оператора
рассмотрим оператор дифференцирования

Ly = y ′ (x),

с областью определения D(L) = C 1 [0, T ]. Поскольку для любого λ ∈


C уравнение
y ′ (x) = λy(x)
имеет нетривиальные решения y(x) = Ceλx , C 6= 0, то σ(L) = C, то
есть спектр данного оператора есть вся комплексная плоскость.
Для неограниченного оператора принципиальное значение имеет
область определения. Действительно, рассмотрим этот же оператор
с начальным условием. Пусть

L0 y = y ′ (x),
4
Если X функциональное пространство, то говорят о собственных функциях.

166
с областью определения D(L0 ) = {y ∈ C 1 [0, T ] : y(0) = 0}. Для
любого λ ∈ C рассмотрим уравнение

L0 y = λy, y ∈ D(L0 ).

Это соответствует задаче Коши для однородного уравнения

y ′ (x) = λy(x),

y(0) = 0.
Однако эта задача Коши имеет единственное нулевое решение y(x) =
0. Поэтому резольвентное множество есть вся комплексная плоскость,
а спектра пуст: σ(L0 ) = ∅.
Рассмотрим теперь пространство X = C[0, π] и в этом простран-
стве оператор двойного дифференцирования

Ly = −y ′′ (x),

с областью определения D(L) = {y ∈ C 2 [0, 2π] : y(0) = y(π) = 0}.


Рассмотрим уравнение

Ly = λy, y ∈ D(L).

Этому уравнению соответствует краевая задача

−y ′′ (x) = λy(x)

y(0) = y(π) = 0.
Для λk = k 2 , k = 1, 2, . . . эта задача имеет нетривиальные решения
p
yk = sin λk x, k = 1, 2, . . . ,

в чем можно убедиться непосредственно. Причем это единственные


значения λ для которых рассматриваемое уравнение имеет нетриви-
альные решения. Следовательно по альтернативе Фредгольма для
краевых задач для линейных обыкновенных уравнений, при λ 6= λk
задача
−y ′′ (x) − λy(x) = f (x),
y(0) = y(π) = 0

167
имеет единственное решение для всех f ∈ C[0, π]. Таким образом, мы
имеем дискретный спектр
σ(L) = {k 2 : k = 1, 2, . . . },
состоящий из собственных значений.
В качестве примера остаточного спектра рассмотрим оператор в
гильбертовом пространстве l2 . Определим оператор следующим об-
разом
T (x1 , x2 , . . . ) = (0, x1 , x2 , . . . ),
с областью определения все l2 . Число λ = 0 принадлежит остаточно-
му спектру, поскольку область значений R(T ) не является плотным
в l2 .
Хорошо известно, что симметричная квадратная матрица имеет
только вещественные собственные значения. Обобщением этого фак-
та является следующая теорема.
Теорема 35.5. Пусть в гильбертовом пространстве H задан са-
мосопряженный оператор A с областью определения D(A). Тогда
имеем
σ(A) ⊂ R,
то есть может иметь только вещественный спектр.
Доказательство. Возьмем x ∈ D(A) и λ ∈ C с помощью неравенства
Коши-Буняковского будем иметь
k(A − λI)xkH kxkH ≥ |((A − λI)x, x)H | ≥ |(Ax, x)H − λkxk2H | ≥
| Im((Ax, x)H − λkxk2H )| = | Im λ|kxk2H .
Здесь использовано, что (Ax, x)H вещественно в силу самосопряжен-
ности оператора A. Следовательно, имеем
k(A − λI)xkH ≤ | Im λ|kxkH . (IX.4)
Отсюда при Im λ 6= 0 из (A − λI)x = 0 следует, что x = 0, поэтому
существует обратный (A − λI)−1 .
Покажем, что при Im λ 6= 0 область значений R(A − λI) плотна в
H. В противном случае существовал бы элемент y 6= 0, ортогональ-
ный R(A − λI) и такой, что при всех x ∈ D(A) выполнялось бы
((A − λI)x, y)H = 0. (IX.5)

168
Отсюда следует, что y ∈ D(A), действительно, в силу плотности D(A)
в H существует такая последовательность yk ∈ D(A), что ky−yk kH →
0, при k → ∞. Имеем

((A − λI)x, yk )H = (x, (A − λ)yk )H → 0, k → ∞.

Из (IX.5) получаем, что

(x, (A − λ)y)H = 0.

В силу плотности области определения самосопряженного оператора


имеем
(A − λ)y = 0
или
Ay = λy.
Однако это противоречит вещественности (Ay, y)H , поэтому область
значений R(A − λI) плотна в H. Покажем, что R(A − λI) = H. Пусть
для последовательности xk ∈ D(A) существует предел

lim (A − λI)xk = y.
k→∞

Тогда из неравенства (IX.4) следует, что существует предел lim xk =


k→∞
x. В силу замкнутости оператора A имеем

(A − λI)x = y.

Далее, в силу плотности R(A−λI) в H для любого f ∈ H существует


такая последовательность yp ∈ R(A − λI), что yp → f , p → ∞. Кроме
того, существует xp ∈ D(A) такое, что

(A − λI)xp = yp .

Переходя к пределу при p → ∞ получаем, что f ∈ R(A − λI).


Наконец, из теорем 34.1 и 34.3 следует, что (A − λI)−1 ограничен,
когда Im λ 6= 0.

169
36. О спектральном разложении
самосопряженных операторов
Мы уже не раз упоминали, что самосопряженные операторы в гиль-
бертовых пространствах являются аналогами симметричных квад-
ратных матриц. Вспомним, что любую симметричную квадратную
матрицу можно диагонализовать, то есть для любой матрицы
 
a11 a12 . . . a1N
 a21 a22 . . . a2N 
A=  ... ... ... ... .

aN 1 aN 2 . . . aN N

Существует такая ортогональная матрица C −1 = C ′ , что матрица


à = CAA′ имеет диагональный вид, причем на главной диагонали
будут собственные значения матрицы A. Этот факт играет принци-
пиальное значение в линейной алгебре и ее приложениях.
Для произвольного самосопряженного оператора тоже есть про-
цедура аналогичной «диагонализации». Однако этот вопрос весьма
сложный и требует объемных технических деталей.
Однако в одном частном, но частом случае мы можем выразить
самосопряженный оператор через его собственные значения и соб-
ственные элементы.
Рассмотрим самосопряженный оператор A с областью определе-
ния D(A). В этом множестве введем скалярное произведение по сле-
дующей формуле

(u, v)D(A) = (Au, Av)H + (u, v)H ,

для всех u, v ∈ D(A). В силу замкнутости оператора A пространство


D(A) является гильбертовым пространством. Предположим, что лю-
бое ограниченное множество в D(A) является предкомпактным в H,
тогда если оператор A имеет ограниченный обратный A−1 , тогда опе-
ратор A имеет счетное множество собственных значений λk (для бес-
конечномерного гильбертова пространства H), а соответствующие
им собственные элементы ϕk образуют базис в H. Это утверждение
мы докажем в следующей главе, посвященной компактным операто-
рам.

170
В этом случае, каждый элемент x ∈ H может быть представлен
в виде
X∞
x= (x, ϕk )H ϕk .
k=1

Кроме того, элемент x ∈ D(A) тогда и только тогда, когда в H схо-


дится ряд N
X
λk (x, ϕk )H ϕk − f → 0, N → ∞.



k=1 H
При этом имеет место

X
Ax = λk (x, ϕk )H ϕk = f.
k=1

Приведенные формулы имеют глубокий смысл, поскольку позволяют


свести задачу вычисления оператора к простому умножению. Но еще
более важно, что с помощью этих формул во многих случаях можно
находить и обратный оператор. На этом подходе построены методы
Фурье для нахождения приближенных решений. Также спектраль-
ные методы часто используются для доказательства существования
решений дифференциальных уравнений в частных производных, ин-
тегральных уравнений и т.д.

171
Глава X

Компактные операторы

37. Свойства компактных операторов


Среди ограниченных операторов есть операторы, которые более непре-
рывны, чем просто непрерывные операторы — это операторы, кото-
рые переводят ограниченные множества в предкомпактные множе-
ства. Такие операторы называются компактными или вполне непре-
рывными. Более точно, линейный оператор A : X → Y называется
компактным, если для любого ограниченного множества M ⊂ X мно-
жество A[M ] является предкомпактным в Y . Разумеется, что любой
вполне непрерывный оператор является ограниченным оператором.
Компактные операторы являются в определенном смысле проме-
жуточными между конечномерными операторами и ограниченными.
Под конечномерными операторами мы будем понимать операторы,
образ которых конечномерен.
Каждый конечномерный оператор L является компактным опера-
тором, поскольку, как ограниченный оператор, L отображает любое
ограниченное множество M в ограниченное множество L[M ], но в
конечномерном пространстве каждое ограниченное множество явля-
ется предкомпактным.
Рассмотрим несколько примеров компактных операторов в бес-
конечномерных пространства. Легко видеть, что в силу линейности
операторов достаточно показать, что оператор отображает единич-
ный шар в предкомпактное множество. В гильбертовом пространстве
l2 определим линейный оператор A следующим образом
Ax = (x1 , 2−1 x2 , 2−2 x3 , . . . , 2−(n−1) xn , . . . ).

172
Этот оператор отображает замкнутый шар единичного радиуса в сле-
дующее множество
1 1
Π = {x ∈ l2 : |x1 | ≤ 1, |x2 | ≤ , . . . , |xn | ≤ n−1 , . . . }.
2 2
Это множество называется гильбертовым кирпичом. Покажем, что
гильбертов кирпич — предкомпактное множество. Возьмем любое
фиксированное число ε > 0. Можно выбрать N так, чтобы 2−(N −1) <
ε/2. Рассмотрим множество ΠN следующего вида
ΠN = {x ∈ Π : xm = 0, m > N }.
Для x ∈ Π и x′ ∈ ΠN имеем

!1/2 ∞
!1/2
X X 1 1 ε
kx − x′ kl2 = |xk |2 ≤ < < .
k=N +1 k=N +1
4k 2N −1 2

Заметим, что множество ΠN предкомпактно, как ограниченное мно-


жество в конечномерном пространстве, следовательно в ΠN суще-
ствует конечная ε/2-сеть, которая будет ε-сетью в Π. Таким образом,
множество Π есть предкомпактное множество, а оператор A — ком-
пактным.
Другой пример компактного оператора рассмотрим в простран-
стве C[0, 1]. Введем оператор T : C[0, 1] → C[0, 1] по следующей фор-
муле
Zx
(T f )(x) = f (s)ds.
0
Линейность этого оператора следует из линейности интеграла. Огра-
ниченность из оценки
t
Z

kT f kC[0,1] = max f (s)ds ≤ max |f (x)| = kf kC[0,1] .
x∈[0,1] x∈[0,1]
0

Предкомпактность этого множества следует из теоремы Арцела (см.


теорему 24.5).
Рассмотрим компактные операторы, действующие в одном бана-
ховом пространстве X. Разумеется, что линейная комбинация ком-
пактных операторов будет компактным оператором. Имеет место сле-
дующий простой, но интересный результат.

173
Теорема 37.1. Пусть A — компактный оператор в X, а B — огра-
ниченный в X оператор, тогда операторы AB и BA являются ком-
пактными.
Доказательство. Пусть M ⊂ X произвольное ограниченное мно-
жество. Тогда множество BM тоже ограниченное, вследствие огра-
ниченности оператора B, следовательно, множество ABM предком-
пактно в X и поэтому оператор AB является компактным.
Далее множество AM является предкомпактным, для любого огра-
ниченного M , но в силу ограниченности B множество BAM тоже
будет предкомпактным.
Из этой теоремы следует, важный факт — если пространство X
есть бесконечномерное гильбертово пространство1 тогда компактный
оператор A не может иметь ограниченного обратного. Действитель-
но, если предположить, что A−1 ограничен, то оператор AA−1 = I
будет компактным, но в бесконечномерном пространстве единичный
оператор не может быть предкомпактным. В самом деле, пусть
√ ek
— ортонормированный базис в X. Поскольку √ kek − em kX = 2, то в
этом множестве нет конечной ε-сети, для ε < 2/2.
Важная характеристика компактного оператора состоит в том,
что вполне непрерывный оператор переводить слабо сходящуюся по-
следовательность в сильно сходящуюся.
Теорема 37.2. Пусть A : x → Y — вполне непрерывный оператор.
Для любой последовательности xn ∈ X такой, что

w − lim xn = x0 .
n→∞

Тогда
lim Axn = Ax0 .
n→∞

Доказательство. В силу теоремы 29.3 последовательность {xn } огра-


ничена в X, поэтому последовательность {Axn } предкомпактна в Y .
Более того, последовательность Axn будет также слабо сходящейся
к Ax0 . Действительно, для любого f ∈ Y ∗ имеем

hAxn − Ax0 , f i = hxn − x0 , A∗ f i → 0, n → ∞.


1
На самом деле этот результат верен и для любого бесконечномерного бана-
хова пространства.

174
Таким образом, последовательность Axn предкомпактна и слабо схо-
дится к Ax0 , покажем, что она сильно сходится к Ax0 . Предположим,
что Axn не сходится к Ax0 , тогда существует ε > 0 и такая подпосле-
довательность xn′ , что
kAxn′ − Ax0 kY ≥ ε. (X.1)
В силу предкомпактности последовательности Axn′ из нее можно из-
влечь сходящуюся подпоследовательность Axn′′ , сходящуюся к Ax′0
сильно, и соответственно, слабо, но из единственности слабого пре-
дела имеем Ax0 = Ax′0 , следовательно, Axx′′ → Ax0 , n′′ → ∞ сильно,
что противоречит (X.1).

38. Собственные значения компактного


оператора
В этом разделе мы будем рассматривать компактные операторы, дей-
ствующие в гильбертовом пространстве H, при этом без ограничения
общности, мы будем считать, что H является бесконечномерным про-
странством.
Спектр компактного оператора A : H → H не пусть, поскольку,
как минимум, 0 ∈ σ(A) так как этот оператор не может иметь огра-
ниченного обратного. О структуре спектра компактного оператора
говорит следующая теорема.
Теорема 38.1. Для любого δ > 0 всякий компактный оператор A
имеет лишь конечное число линейно независимых собственных век-
торов, отвечающих собственным значениям λk таким, что |λk | >
δ.
Доказательство. Будем доказывать теорему от противного. Пусть
λ1 , λ2 , . . . бесконечная последовательность собственных векторов опе-
ратора A таких, что |λk | > δ. Тогда отвечающие им собственные век-
тора обозначим x1 , x2 , . . . при этом будем считать, что эти вектора
линейно независимые. Будем обозначать через En подпространство,
порожденное элементами {x1 , . . . , xn }.
Построим последовательность yn ∈ H, удовлетворяющую следу-
ющим условиям
yn ∈ En , kyn kH = 1,

175
и
̺(yn , en−1 ) = inf kyn − xkH > 1/2.
x∈En−1

В силу линейной независимости xk имеем xn ∈/ En−1 и ̺(xn , En−1 ) =



a > 0. Поэтому существует такой вектор x ∈ En−1 , что

kxn − x∗ kH < 2a.

Далее, поскольку

a = ̺(xn , En−1 ) = ̺(xn − x∗ , En−1 ),

то элемент
xn − x∗
yn =
kxn − x∗ kH
удовлетворяет заданным условиям, в качестве возьмем y1 = x1 /kx1 kH .
Поскольку |λn | > δ, то последовательность λ−1
n yn будет ограни-
ченной, и тогда в силу компактности оператора A последователь-
ность λ−1
n Ayn должна иметь сходящуюся подпоследовательность. Од-
нако в наших предположениях это не так. Действительно, пусть
n
X
yn = α k xk .
k=1

Тогда
  n−1
yn X αk λk
A = xk + α n xn = yn + z n ,
λn k=1
λn
где
n−1  
X λk
zn = αk − 1 xk ∈ En−1 .
k=1
λn
Таким образом для любых p > q имеем
   

A y p yq
− A = kyp + zp − (yq + zq )kH =
λp λq H

kyp − (yq + zq − zp )kH > 1/2,


поскольку yq + zq − zp ∈ En−1 .
Полученное противоречие доказывает теорему.

176
Из этой теоремы следует, что собственные значения компактного
оператора дискретны и могут иметь точку накопления только в нуле.
Поэтому собственные значения можно перенумеровать следующим
образом
|λ1 | ≥ |λ2 | ≥ . . . .
Теперь рассмотрим самосопряженный компактный оператор в гиль-
бертовом пространстве. Теорема Гильберта-Шмидта указывает ка-
ким образом спектр компактного самосопряженного оператора мо-
жет быть использован.

Теорема 38.2 (Гильберт-Шмидт). Пусть A : H → H самосопря-


женный компактный оператор в гильбертовом пространстве H.
Тогда из собственных векторов ϕk оператора A, соответствующих
собственным значениям λk 6= 0 можно построить ортонормиро-
ванную систему в H такую, что для любой x ∈ H может быть
представлен в виде X
x= ck ϕk + ξ,
где ξ ∈ N (A). При этом имеет место
X
Ax = ck λk ϕk

и λk → 0, k → ∞.

Доказательство этой теоремы требует определенных технических


трудностей, поэтому мы докажем ее в следующем пункте.
Отметим, что теорема Гильберта-Шмидта остается верной и для
несепарабельных гильбертовых пространств, но в этом случае опе-
ратор A должен иметь бесконечномерное (и несепарабельное) ядро.
В параграфе 36 мы рассматривали спектр неограниченного само-
сопряженного оператора, имеющего компактный обратный. Сейчас
мы докажем приведенное тогда утверждение, что собственные эле-
менты такого оператора образуют базис в H. Итак, пусть самосопря-
женный оператор L : H → H с областью определения D(L) имеет
обратный оператор L−1 , который удовлетворяет условиям теоремы
Гильберта-Шмидта, тогда собственные элементы оператора L обра-
зуют базис в пространстве H.
Прежде всего, установим тривиальность ядра оператора L−1 . Пусть
y ∈ H такой, что L−1 y = 0, применяя оператор L к этому равенству

177
получаем y = 0. Поэтому по теореме Гильберта-Шмидта получаем,
что оператор L−1 имеет счетный набор собственных значений λk и со-
ответствующие им собственные элементы ϕk такие, что для любого
x ∈ H имеет место представление

X
x= c k ϕk .
k=1

Поскольку собственные элементы, соответствующие различным соб-


ственным значениям ортогональны, то система элементов представ-
ляет собой базис (после возможной нормировки элементов ϕk ) в про-
странстве H.
Рассмотрим какой-либо собственный элемент оператора L−1 и со-
ответствующее собственное значение

L−1 ϕk = λk ϕ.

Поскольку образ оператора L−1 совпадает с областью определения


оператора L, то ϕk ∈ D(L), поэтому имеем

LL−1 ϕk = λk Lϕk .

Отсюда получаем (с учетом того, что λk 6= 0)

Lϕk = λ−1
k ϕk .

Следовательно, числа λ−1


k являются собственными числами для опе-
ратора L, а ϕk являются собственными элементами.

39. Доказательство теоремы


Гильберта-Шмидта
Будем рассматривать компактный самосопряженный оператор A :
h → H. Введем обозначение

Q(x) = (Ax, x)H ,

для любого x ∈ H.
Сначала докажем две леммы.

178
Лемма 39.1. Пусть последовательность xn слабо сходится к x,
тогда
Q(xn ) → Q(x), n → ∞.
Доказательство. Имеем

|(Axn , xn )H −(Ax, x)H | ≤ |(Axn , xn )H −(Ax, xn )H |+|(Ax, x)H +(Ax, x)H |.

Далее,
|(Axn , xx )H − (Ax, xn )H | ≤ kxn kH kA(xn − x)kH
и

|(Ax, xn )H − (Ax, x)H | = |(Axn , x)H − (Ax, x)H | ≤ kxkH kA(xn − x)kH .

Поскольку числа kxn kH ограничены, а в силу компактности опера-


тора A имеем kA(xn − x)kH → 0, n → ∞, то

|(Axn , xn )H − (Ax, x)| → 0.

Лемма 39.2. Если неотрицательный функционал f (x) = |Q(x)| на


H достигает на единичном замкнутом шаре максимума в точке
x0 , то из (x0 , y)H следует, что

(Ax0 , y)H = (x0 , Ay)H = 0.

Доказательство. Если максимум достигается на x0 , то в силу линей-


ности A должно быть kx0 kH = 1. Для произвольного a ∈ C положим
x0 + ay
x= p ,
1 + |a|2 kyk2H

для которого имеем kxkH = 1. Имеем


1
Q(x) = 2 2
[Q(x0 ) + a(Ax0 , y) + a(Ax0 , y)H + |a|2 Q(y)].
1 + |a| kykH

Число a выберем таким образом, чтобы число Im a(Ax0 , y)H = 0, при


этом в силу вещественности Q имеем

a(Ax0 , y)H = a(Ax0 , y)H

179
и
Q(x) = Q(x0 ) + 2a(Ax0 , y)H + O(|a|2 )
при малых |a|. Если (Ax0 , y)H 6= 0, то можно так выбрать a так,
чтобы |Q(x)| > |Q(x0 )|, что невозможно, поскольку на x0 функционал
f (x) = |Q(x)| достигает максимума.
Доказательство теоремы Гильберта-Шмидта. Упорядочим собствен-
ные значения оператора A по невозрастанию модуля
|λ1 | ≥ |λ2 | ≤ . . . .
Рассмотрим функционал f (x) = |Q(x)| = |(Ax, x)H | покажем, что он
достигает максимума на замкнутом единичном шаре B1 (0). Пусть
M = sup f (x).
kxkH =1

Существует такая последовательность xn такая, что kxn kH = 1 и


f (xn ) → M, n → ∞.
В силу теоремы 29.4 единичный шар в H слабо компактный, поэтому
из {xn } можно извлечь подпоследовательность, слабо сходящуюся к
некоторому элементу y ∈ H, при этом kykH ≤ 1 и, в силу леммы 39.1
имеем
|(Ay, y)H | = M.
В качестве элемента ϕ1 мы выберем y. При чем kykH = 1. Из лем-
мы 39.2 следует, что ϕ1 является собственным вектором оператора
A. Действительно, если из (ϕ1 , z)H = 0 следует, что (Aϕ1 , z)H = 0,
то это возможно только если Aϕ1 = λϕ1 , при нашем упорядочении
собственных значений получаем, что
Aϕ1 = λ1 ϕ1 .
Дальнейшее доказательство будем проводить по методу матема-
тической индукции. Пусть уже построены собственные векторы
ϕ1 , ϕ2 , . . . , ϕn ,
отвечающие собственным значениям λ1 , λ2 , . . . , λn . Пусть Ln подпро-
странство, натянутое на {ϕk }nk=1 . Обозначим
F n = H ⊖ Ln .

180
Рассмотрим функционал f на F n ∩ B1 (0). Поскольку ALn = Ln , то
AF n = F n , поэтому проведенные выше рассуждения приводят к то-
му, что в F n найдется вектор ϕk+1 , который будет собственным для
оператора A, отвечающий собственному значению λk+1 .
Если в результате повторения этой процедуры после конечного
числа шагов мы получим F n0 такое, что f (x) = 0, для всех x ∈ F n0 , то
из леммы 39.2 следует, что подпространство F n0 переводится опера-
тором A в нуль. Следовательно это подпространство состоит из соб-
ственных элементов, соответствующих нулевому собственному зна-
чению. В этом случае искомая система состоит из конечного набора
собственных элементов {ϕ}nk=10
.
Далее будем предполагать, что при всех n функционал f не обра-
щается тождественно в нуль на F n . Следовательно, мы получаем по-
следовательность собственных элементов ϕk , соответствующих соб-
ственным значениям λk 6= 0. Покажем, что эта последовательность
стремится к нулю
λk → 0, k → ∞.
Поскольку ϕk слабо сходится к нулю, как ортонормированная по-
следовательность ибо числа
αk = (x, ϕk )H
являются коэффициентами Фурье, то Aϕk будет сходиться сильно к
нулю и
|λk | = kAϕk kH → 0, k → ∞.
Обозначим
F = H ⊖ L∞ ,
где L∞ подпространство, порожденное системой элементов ϕn . Ес-
ли F = 0, то доказательство завершено. Предположим, что F 6= 0.
Выберем произвольный элемент y ∈ F , y 6= 0, тогда для всех n име-
ем (Ay, y)H ≤ λn kyk2H . В силу стремления λn к нулю получаем, что
(Ay, y)H = 0. Из леммы 39.2 получаем, что Ay = 0, следовательно,
F ⊂ N (A).
Таким образом, для любого x ∈ H имеет место представление
X
x= ck ϕk + ξ,
где ck = (x, ϕk )H и ξ ∈ N (A). При этом имеют место все остальные
утверждения теоремы Гильберта-Шмидта.

181
Глава XI

Операторные уравнения

40. Линейные уравнения


Многие математические задачи, возникающие в приложениях, опи-
сываются следующей операторной постановкой. Рассматривается ба-
нахово пространство X — множество решений и банахово простран-
ство Y — множество параметров (правых частей) задачи. В этих про-
странствах рассматривается линейный, вообще говоря, неограничен-
ный оператор A : D(A) ⊂ X → Y . Задача формулируется так: по
заданному элементу y ∈ Y найти элемент x ∈ D(A) такой, что
Ax = y. (XI.1)
Сразу же возникают следующие вопросы:
1. Существует ли хотя бы одно решение задачи?
2. Может ли задача иметь более одного решения?
3. Будет ли решение (коль скоро оно существует) непрерывно за-
висеть от параметров задачи?
Рассмотрим эти вопросы. Вопрос существования решения, как прави-
ло, является одним из самых главных при рассмотрении уравнений.
Более того, этот вопрос относится к весьма насущным при использо-
вании «математики» для решения прикладной задачи. Тут уместно
упомянуть известный анекдот. Математик и физик совместно при-
нялись решать одну задачу. Через неделю математик радостно со-
общает, что ему удалось доказать существование решения! На что

182
физик отвечает: «Хм, если бы я в этом сомневался, то я бы и не
взялся за решение этой задачи». Впрочем, эта ситуация встречается
и реальности. Но на самом деле, не все актуальные задачи имеют
решения, поскольку факт существования решения зависит не толь-
ко от физики, но и от определения функциональных пространств
X, Y и от определения оператора A. Поэтому доказательство суще-
ствования решения часто указывает «правильные» функциональные
пространства и удачную постановку задачи.
Второй вопрос об единственности решения имеет не меньшее, а в
определенном смысле большее значение. Как мы увидим в дальней-
шем, для линейных задач часто из единственности следует существо-
вание решения. Кроме того, знание, что задача не может иметь бо-
лее одного решения играет принципиальную роль при использовании
численных методов. Как правило, если задача не имеет единствен-
ности, то решение существует с точностью до элемента некоторого
подпространства. В этом случае можно перейти к другой постановке
задачи, в которой уже будет единственность.
Третий вопрос об устойчивости решения относительно изменения
параметров задачи играет важную роль в практическом использова-
нии решений. Действительно, если при сколь угодно малом измене-
нии параметров задачи, решение может существенно измениться, то
такое неустойчивое решение редко можно использовать в приложе-
ниях, не говоря уж о том, что, в этом случае часто затруднены или
становятся невозможными численные методы.
Если для задачи все три вопроса имеют положительные ответы,
то такая задача называется корректной по Адамару. Но следует от-
метить, что ряд задач приводят таки к некорректным задачам, на-
пример, отсутствию устойчивости решений. Для решения этих задач
была построена теория некорректных задач, начиная с классических
работ А.И. Тихонова, которым были предложены методы регуляри-
зации некорректных задач.
Перейдем теперь к точным формулировкам основных понятий,
касающихся разрешимости уравнения (XI.6). Это уравнение называ-
ется однозначно разрешимым на R(A), если N (A) = 0, то есть ядро
оператора A состоит только из нулевого элемента. В этом случае для
каждого y ∈ R(A) существует единственное решение x ∈ D(A).
Далее уравнение (XI.6) называется корректно разрешимым на
множестве R(A), если существует такая константа k > 0, что для

183
всех x ∈ D(A) выполнено неравенство
kxkX ≤ kkAkY .
Если уравнение корректно разрешимо на R(A), то оно и однозначно
разрешимо на R(A). Действительно, для любого u ∈ N (A) имеем
kukX ≤ kkAukY = 0,
следовательно u = 0. Обратное, вообще говоря неверно. В случае,
когда уравнение корректно разрешимо на R(A), то существует огра-
ниченный обратный оператор A−1 на R(A).
Уравнение (XI.6) нормально разрешимо, если R(A) является за-
мкнутым подпространством в Y . Будем говорить, что уравнение плот-
но разрешимо, если R(A) = Y . Наконец, уравнение (XI.6) везде раз-
решимо, если R(A) совпадает со всем Y .
Далее мы будем считать, что оператор A является замкнутым опе-
ратором. У замкнутого оператора ядро является замкнутым подпро-
странством. Если N (A) не является тривиальным подпространством,
но является замкнутым, то можно рассмотреть фактор-пространства.
Введем на множестве X отношение эквивалентности следующим об-
разом
x′ ∼ x′′ ,
если x′ = x′′ + ϕ, где ϕ ∈ N (A). Это означает, что два эквива-
лентных элемента X отличаются только слагаемым из N (A). Вве-
денное отношение порождает классы эквивалентности, множество
которых мы обозначим через X/N (A). Это множество называется
фактор-пространством. Очевидно, что оно является линейным про-
странством, более того в нем можно ввести норму по следующей фор-
муле
kx̃kX/N (A) = inf kx − ϕkX .
ϕ∈N (A)

Теорема 40.1. Пространство X/N (A) является банаховым про-


странством.
Доказательство. Пусть x̃n — фундаментальная последовательность
в X/N (A). Без ограничения общности, можно считать, что ряд

X
kx̃n+1 − x̃n kX/N (A)
n=1

184
сходится. В случае необходимости всегда можно перейти к подпосле-
довательности x̃nj . Построим теперь последовательность {xn }∞
n=0 в
X следующим образом

xn ∈ x̃n+1 − x̃n ,

и
kx̃n+1 − x̃n kX/N (A) ≥ 2−1 kxn kX ,
что всегда можно сделать по определению нормы в фактор простран-
стве. При этом мы считаем, что x̃0 = 0. В этом случае ряд

X
kxn kX
n=1

сходится, но в силу полноты пространства X сходится и ряд



X
xn = x.
n=1

Через x̃ обозначим класс эквивалентности, содержащий x. Получаем


n

X
kx̃ − x̃n kX/N (A) ≤ x − xk → 0, n → ∞.


k=0 X

Таким образом, последовательность x̃n сходится к x̃.


Заметим, что эта теорема верна для любых фактор-пространствах.
Оператор A автоматически задает оператор Ã, определенный на
множестве D(A)/N (A) по формуле

Ãx̃ = Ax,

где x ∈ x̃. При этом ядро оператора Ã уже тривиально, то есть со-
стоит только из нулевого элемента. При этом факторизованное урав-
нение
Ãx̃ = y
является однозначно разрешимо. Таким образом, если исходный за-
мкнутый оператор A имеет нетривиальное ядро, то это говорит о
том, что решения соответствующего уравнения имеют единственное
решение с точности до слагаемого из N (A).

185
Установим теперь критерий корректной разрешимости для за-
мкнутых операторов1 .

Теорема 40.2. Корректна разрешимость эквивалентна однознач-


ной нормальной разрешимости.

Доказательство. Мы уже отмечали, что корректно разрешимое урав-


нение однозначно разрешимо. Покажем теперь, что оно и нормально
разрешимо — замкнутость образа R(A). Рассмотрим произвольную
последовательность yn ∈ R(A), которая сходится к y в Y . Поскольку
последовательность yn из образа, то существует последовательность
xn ∈ D(A) такая, что Axn = yn . Тогда имеем

kxn − xm kX ≤ kkA(xn − xm )kY = kkyn − ym kY .

В силу полноты пространства X последовательность xn сходится к


некоторому элементу x ∈ X, но в силу замкнутости оператора A име-
ем x ∈ D(A) и Ax = y ∈ R(A). Следовательно, образ R(A) замкнут
и уравнение (XI.6) нормально разрешимо.
Предположим теперь, что уравнение (XI.6) однозначно и нор-
мально разрешимо. Тогда образ R(A) является банаховым простран-
ством, на котором определен обратный оператор A−1 . Этот обратный
оператор замкнут, поэтому по теореме Банаха он ограничен. Следо-
вательно, для всех y ∈ R(A) имеем

kA−1 ykX ≤ kkykY

или, что тоже самое

kxkX ≤ kkAxkY , x ∈ D(A).

Поэтому уравнение (XI.6) корректно разрешимо.


На ряду с задачей (XI.6), которую мы будем называть прямой
задачей, будем рассматривать и задачу

A∗ y = x,
1
В дальнейшем в этой главе мы всегда будем считать оператор A замкнутым,
если не оговорено обратное.

186
где A∗ : Y ∗ → X ∗ — сопряженный оператор, которую будем называть
двойственной задачей. Для двойственной задачи можно рассматри-
вать понятия однозначной, нормальной и корректной разрешимости.
Рассмотрим что из себя представляет ядро сопряженного опера-
тора A∗ . Пусть y ∈ N (A∗ ), тогда для любого x ∈ D(A) имеем

0 = hx, A∗ yi = hAx, yi.

Из этого следует, что элемент g ортогонален к образу R(A). Верно и


обратное. Если какой-либо элемент z ∈ Y ∗ ортогонален образу R(A),
то hAx, zi = 0 для всех x ∈ D(A). Следовательно, z ∈ D(A∗ ) и z ∈
N (A∗ ).
Принцип двойственности можно сформулировать следующим об-
разом: ядро сопряженного оператора N (A∗ ) является ортогональным
дополнением у образу оператора R(A)

Y = R(A) ⊕ N (A∗ ).

Отсюда сразу же получается следующий результат о связи плотной


разрешимости и однозначной разрешимости.

Теорема 40.3. Плотная разрешимость прямой задачи (R(A) = Y )


эквивалентна однозначной разрешимости двойственной задачи (N (A∗ ) =
0).

41. Альтернатива Фредгольма


Среди линейных операторных уравнений часто встречаются уравне-
ния следующего частного вида. Пусть H — гильбертово простран-
ство, а A : H → H компактный оператор. Будем рассматривать сле-
дующее уравнение
(I − A)u = f,
где f ∈ H есть правая часть. Будем еще использовать оператор
T = I − A, который является ограниченным в H, но в случае беско-
нечномерного гильбертова пространства, не компактным.

Теорема 41.1. Неоднородное уравнение

Tu = f

187
разрешимо для тех и только тех правых частей f ∈ H, которые
ортогональны каждому решению сопряженного однородного уравне-
ния
T ∗ u0 = 0,
то есть (f, u0 )H = 0.

Теорема 41.2 (Альтернатива Фредгольма). Либо уравнение T u = f


имеет при любом f ∈ H одно и только одно решение, либо однород-
ное уравнение T u0 = 0 имеет нетривиальное решение.

Доказательство этих теорем будем проводить одновременно, ко-


торое традиционно состоит из цепочки лемм.

Лемма 41.1. Оператор T имеет замкнутый образ.

Доказательство. Пусть yn ∈ R(T ) и yn → y. Следовательно, суще-


ствуют такие xn ∈ H, что

yn = T xn = xn − Axn . (XI.2)

Поскольку вектора xn определяются с точностью до слагаемых из


N (T ), то будем считать, что эти вектора ортогональны N (T ). По-
следовательность xn ограничена. Действительно, предположив про-
тивное, имеем kxn kH → ∞. Разделим уравнение (XI.2) на ненулевое
число kxn kH получаем
xn xn yn
−A = → 0.
kxn kH kxn kH kxn kH

В силу компактности оператора A последовательность kxn k−1 H Axn


будет предкомпактной, поэтому переходя в случае необходимости к
подпоследовательности, эта последовательность будет сходящейся. В
этом случае
xn
→ z.
kxn kH
При этом kzkH = 1 и T z = 0. Поскольку мы считаем вектора xn ор-
тогональными N (T ), то и вектор z должен быть ортогонален N (T ).
Это противоречие показывает, что последовательность xn ограниче-
на. Поскольку компактный оператор A переводит эту ограниченную
последовательность в предкомпактную, то последовательность Axn

188
содержит сходящуюся подпоследовательность. Без ограничения общ-
ности, можно считать сходящейся последовательность Axn , и тогда
из (XI.2) следует, что сходится и xn к x, при этом T x = y. Этим
доказывается замкнутость образа R(A).
Лемма 41.2. Имеют место следующие разложения

H = N (A) ⊕ R(A∗ ) (XI.3)

и
H = N (A∗ ) ⊕ R(A). (XI.4)
Доказательство. Ядро оператора N (A) замкнуто, а по лемме 41.1
замкнутым является и образ R(A) (и R(A∗ )). Покажем что множе-
ства N (A) и R(A∗ ) ортогональны. Для любых x ∈ N (A) и z ∈ R(A∗ )
имеем
(x, z)H = (x, A∗ y)H = (Ax, y)H = 0.
Теперь покажем, что если некоторый элемент z ∈ H одновременно
ортогонален N (A) и R(A∗ ), то z = 0. Если вектор z ортогонален
R(A∗ ), то для любого x ∈ H имеем

(Az, x)H = (z, Ax)H = 0,

отсюда следует, что z ∈ N (A), а поскольку по предположению z


ортогонален N (A), то z = 0. Этим доказано равенство (XI.3). Соот-
ношение (XI.4) доказывается аналогично.
Лемма 41.3. Пусть H k = R(Ak ), тогда существует такое l, что
при всех k ≥ l имеет место H k+1 = H k .
Доказательство. По построению имеем

H ⊃ H1 ⊃ H2 ⊃ . . . , (XI.5)

при этом AH k = H k+1 .


Предположим, что такого l не существует, следовательно, все H k
различны. Поскольку по лемме 41.1 все H k замкнуты, то можно по-
строить ортонормированную последовательность xk ∈ H k такую, что
xk ортогонален H k+1 . Пусть m > k, тогда

Axm − Axk = −xk + (xm + T xk − T xm ).

189
Поскольку xm + T xk − T xm ∈ H k+1 , то

kAxm − Axk kH ≥ 1.

Следовательно, из последовательности Axk нельзя извлечь сходя-


щейся подпоследовательности, что противоречит компактности опе-
ратора A.

Лемма 41.4. Если N (T ) = 0, то R(T ) = H.

Доказательство. В случае, когда N (T ) = 0 оператор T взаимно од-


нозначный. Если предположить, что R(T ) 6= H, то цепочка (XI.5)
будет состоять из разных подпространств, но это противоречит лем-
ме 41.3.

Лемма 41.5. Если R(T ) = H, то N (T ) = 0.

Доказательство. Из R(T ) = H согласно лемме 41.2 имеем N (T ∗ ) =


0, а по лемме 41.4, примененной к T ∗ , получаем R(T ) = H. Снова по
лемме 41.2 имеем N (T ) = 0.
Доказательство теоремы 41.1. В силу леммы 41.2 элемент f ∈ H
ортогонален N (T ∗ ) тогда и только тогда, когда f ∈ R(T ), а значит
существует x ∈ H такой, что T x = f .
Доказательство теоремы 41.2. Непосредственно следует из лемм 41.4
и 41.5.
Отметим, что теоремы 41.1 и 41.2 верны не только в гильбертовых
пространствах, но и в произвольном банаховом пространстве.

42. Проекционный метод


Ранее мы рассматривали в основном вопросы о существовании ре-
шений операторных уравнений, а в настоящем параграфе мы рас-
смотрим метод, с помощью которого можно получать приближенные
решения. В этом случае будем говорить, что данный метод являет-
ся конструктивным. Что, впрочем, не означает конструктивности в
смысле параграфа 2.

190
Рассматриваемый нами метод будет относиться к большому се-
мейству проекционных методов, состоящих в том, что исходное бес-
конечномерное гильбертово пространство аппроксимируется после-
довательностью конечномерных пространств, и тем самым исходное
операторное уравнение приближается последовательностью конеч-
ных систем линейных уравнений.
Будем рассматривать следующую постановку задачи. Пусть H —
бесконечномерное, сепарабельное вещественное пространство. В этом
пространстве рассмотрим самосопряженный, вообще говоря, неогра-
ниченный оператор
A : D(A) ⊂ H → H
с областью определения D(A), которая является плотной в H. Будем
рассматривать задачу
Au = f, (XI.6)
где элемент f ∈ H является известным, а u — искомое решение.
Пусть оператор A является также положительным, то есть для
всех u ∈ D(A) имеет место неравенство

(Au, u)H ≥ akuk2H , (XI.7)

где константа a > 0 не зависит от u.


Построим теперь новое гильбертово пространство V ⊂ H, кото-
рое будем называть энергетическим пространством для задачи XI.6.
Пространство V определим, как пополнение множества D(A) по нор-
ме p
kukV = (Au, u)H .
Скалярное произведение в этом пространстве введем по формуле

(u, v)V = (Au, v)H .

Свойства нормы и скалярного произведения проверяются непосред-


ственно и следуют из линейности оператора A.
Введем нелинейный функционал F на пространстве V по следу-
ющей формуле
F [u] = kuk2V − 2(f, u)H .
Покажем, что отыскание решения задачи (XI.6) тесно связано с за-
дачей поиска минимума функционала F .

191
Рассмотрим линейный2 функционал (f, u)H на пространстве V и
покажем, что он ограничен

|(f, u)H | ≤ kf kH kukH ≤ a−1/2 kf kH kukV = c1 kukV .

Следовательно, по теореме Рисса об общем виде линейного ограни-


ченного функционала существует такой элемент v ∈ V , что имеет
место равенство
(f, u)H = (v, u)V .
Используя это представление функционал F можно расписать сле-
дующим образом

F [u] = kuk2V − 2(f, u) = kuk2V − 2(u, v)V = ku − vk2V − kvk2V . (XI.8)

Действительно,

(u − v, u − v)V − (v, v)V = (u, u)V − (u, v)V − (v, u)V + (v, v)V − (v, v)V =

ku − vk2V − 2(u, v)V .


Поскольку элемент v задан (определяется элементом f ), то очевид-
но, что минимум функционала F достигается на u = v. При чем
из свойств нормы сразу следует, что этот минимум единственный.
Действительно, пусть v ′ ∈ V такой, что

F [v ′ ] = min F [u] = −kvk2V .


u∈V

Следовательно, kv ′ − vk2V = 0 и v ′ = v.
Элемент u ∈ V , на котором достигается минимум функционала
F будем называть обобщенным решением задачи (XI.6). Обобщенное
решение, вообще говоря, не является решением3 задачи (XI.6).

Теорема 42.1. Если обобщенное решение v задачи (XI.6) принад-


лежит D(A), то элемент v является и классическим решением
задачи (XI.6), кроме того, классическое решение всегда является
обобщенным решением.
2
Напоминаем, что пространство H вещественное.
3
Иногда говорят о классическом решении, чтобы подчеркнуть различие от
обобщенного решения.

192
Доказательство. Пусть v ∈ D(A) — обобщенное решение. Тогда для
любого u ∈ V имеет место

(v, u)V = (f, u)H .

Поскольку v ∈ D(A), то это эквивалентно следующему равенству

(Av, u)H = (f, u)H

или
(Av − f, u)H = 0.
Поскольку по построению пространство V плотно в H, то из послед-
него соотношения получаем

Av = f,

то есть v есть классическое решение.


Пусть теперь v ∈ D(A) есть классическое решение, покажем, что
оно же будет и обобщенным решением. Умножим (скалярно в H)
равенство
Av = f
на произвольную u ∈ V . Тогда получим

(Av, u)H = (f, u)H

или
(v, u)V = (f, u)H .

Из этой теоремы сразу следует, что задача (XI.6) не может иметь


более одного классического решения. Действительно, пусть эта зада-
ча имеет два решения v ′ и v ′′ , тогда эти же элементы будут и обобщен-
ными решениями, а ранее мы показывали, что обобщенное решение
единственно, поэтому v ′ = v ′′ .
Перейдем к методу построения приближенных решений. Мы бу-
дем рассматривать метод Ритца, который является одним из вари-
антов общих методов Галеркина.
Поскольку пространство H сепарабельное, то и пространство V
будет сепарабельным, поэтому существует такая система элементов

193
{ϕk } ⊂ V , что эти элементы линейно независимые, а вся система
всюду плотна в V (и, соответственно, в H). Для любого N > 0 через
H N обозначим конечномерное пространство, натянутое на множество
ϕ1 , . . . , ϕN .
Для фиксированного N приближенное решение будем искать в
виде
N
X
N
u = c k ϕk ,
k=1

где c1 , c2 , . . . , cN вещественные коэффициенты. Очевидно, что uN ∈


H N . На этих функциях функционал F можно рассматривать, как
функцию N вещественных переменных, которую также будем обо-
значать через F
" N #
X
F (c1 , c2 , . . . , cN ) = F c k ϕk .
k=1

Тогда имеем
N 2 N
!
X X
F (c1 , c2 , . . . , cN ) = ck ϕk − 2 f, c k ϕk .


k=1 V k=1 H

Поскольку эта функция непрерывно дифференцируема относительно


коэффициентов c1 , c2 , . . . , cN , то для поиска минимума этого функци-
онала необходимо решить следующие уравнения
∂F (c1 , . . . , cN )
= 0, i = 1, 2, . . . , N.
∂ci
Эту систему можно записать в матричном виде

AN c N = f N , (XI.9)

где cN = (c1 , . . . , cN )T , f N = (f1 , . . . , fN )T , fk = (f, ϕk )H , AN — мат-


рица N × N c элементами

AN = (aij ), aij = (ϕi , ϕj )V .

Поскольку мы работаем с вещественными пространствами, то (ϕi , ϕj )V =


(ϕj , ϕi )V , следовательно, матрица AN симметричная. Покажем, что

194
она является и положительно определенной. Возьмем произвольный
ненулевой вектор ξ ∈ H N . Имеем
N
N 2 N 2
X X X
N 2
(A ξ, ξ)RN = aij ξi ξj = ξ k ϕk ≤ a ξk ϕk > 0.


i,j=1 k=1 V k=1 H
Положительно определенная матрица невырожденная, поэтому су-
ществует единственное решение системы (XI.9) и мы можем одно-
значно определить приближенное решение по формуле
N
X
N
u = c k ϕk .
k=1

Теорема 42.2. Пусть v есть обобщенное решение задачи (XI.6),


тогда имеет место
lim kuN − vkV = 0.
N →∞

Доказательство. По построению uN доставляет минимум функци-


оналу F на H N , следовательно, с учетом представления (XI.8) для
любого w ∈ H N имеем
kuN − vk2V = F [uN ] − F [v] ≤ F [w] − F [v] = kw − vk2V .
Поскольку w ∈ H N произвольно, то имеем оценку
kuN − vk2V ≤ inf kw − vkV = δ(v, N ),
w∈H N

где δ(v, N ) есть погрешность аппроксимации элемента v ∈ V про-


странством H N . Но в силу полноты системы элементов {ϕk } в про-
странстве V имеет место
δ(v, N ) → 0, N →∞
для любого фиксированного v ∈ V .
Может показаться, недостаточным, что метод Ритца позволяет
находить лишь обобщенные решения, но с другой стороны, если клас-
сическое решение существует, то согласно теореме 42.1 это обобщен-
ное решение также есть и классическое, а если классического реше-
ния не существует, но его и нельзя найти.
Более существенным обстоятельством является то, что прибли-
женное решение по методу Ритца сходится к решению в пространстве
V — более слабой топологии, чем в пространстве D(A).

195
Литература
[1] Балакришнан А.В. Прикладной функциональный анализ. М.:
Наука, 1980.

[2] Банах С. Теория линейных операций. Ижевск: НИЦ «Регуляр-


ная и хаотическая динамика», 2001.

[3] Вайнберг М.М. Функциональный анализ. Специальный курс


для педагогических институтов. М.: Просвещение, 1979.

[4] Вулих Б.З. Введение в функциональный анализ (2-е изд.). М.:


Наука, 1967.

[5] Гельфанд И.М., Виленкин Н.Я. Некоторые применения гар-


монического анализа. Оснащенные гильбертовы пространства.
(Обобщенные функции, выпуск 4). М.: Физматлит, 1961.

[6] Данфорд Н., Шварц Дж. Т. Линейные операторы. Т. I: Общая


теория. – М.: ИЛ, 1962.

[7] Иосида К. Функциональный анализ. М.: Мир, 1967.

[8] Канторович Л.В., Акилов Г.П. Функциональный анализ. 3-е


изд. М.: Наука, 1984.

[9] Кириллов А. А., Гвишиани А. Д. Теоремы и задачи функцио-


нального анализа. 2-е изд., перераб. и доп. М.: Наука, 1988.

[10] Коллатц Л. Функциональный анализ и вычислительная мате-


матика. М.: Мир, 1969.

[11] Колмогоров А.Н., Фомин С.В. Элементы теории функций и


функционального анализа. 7-е изд. М.: ФИЗМАТЛИТ, 2004.

[12] Люстерник Л. А., Соболев В. И. Элементы функционального


анализа. М.: Наука, 1965.

[13] Пугачев В. С. Лекции по функциональному анализу. М.: Изд-во


МАИ, 1996.

[14] Рид М., Саймон Б. Методы современной математической фи-


зики. Том 1. Функциональный анализ. М.: Мир, 1977.

196
[15] Рисс Ф., Секефальви-Надь Б. Лекции по функциональному
анализу. М.: Мир, 1979.

[16] Рудин У. Функциональный анализ. М.: Мир, 1975.

[17] Треногин В.А. Функциональный анализ. Учебник. 3-е изд. М.:


ФИЗМАТЛИТ, 2002.

[18] Хелемский А. Я. Лекции по функциональному анализу. Мю:


МЦНМО, 2004.

[19] Хилле Э., Филлипс Р. Функциональный анализ и полугруппы.


М.: ИЛ, 1962.

197