Вы находитесь на странице: 1из 1106

arXiv:1010.0824v4 [math.

CA] 15 Feb 2019

МАТЕМАТИЧЕСКИЙ АНАЛИЗ
без пробелов

С.С.Акбаров

18 февраля 2019 г.
2
i

Если задаться целью проследить, во что превратятся курсы математики, читаемые на техни-
ческих факультетах нынешних университетов, при условии, что изложение в них будет вестись на
современном уровне строгости, с нуля и без пробелов, то можно быть уверенным, что большинству
преподавателей и студентов открывшаяся картина покажется неожиданной. Главным сюрпризом
наверняка будет то, что такое изложение вообще возможно. Вторым по неожиданности — его де-
тали. И третьим — что такая подача материала будет все же доступна для понимания. Настоящий
учебник — попытка такой систематизации. Автор строит курс математики, включающий в себя
основные факты математического анализа и лежащих в его основе дисциплин — математической
логики и линейной алгебры — с расчетом на формально нулевую подготовку читателя. Последнее,
разумеется, не означает обещания, что изложение будет понятно первокласснику, но подразумевает
возможность для человека, способного абстрагироваться от части своих знаний, проверить детали
внушаемого ему со школы убеждения, что математика — строгая наука, где все аккуратно выстра-
ивается чисто логическими средствами, без ссылок на интуицию, причем сами логические средства
также ясно формализуются и никак не связаны с человеческой биологией.
Предисловие

Настоящий текст представляет собой черновик учебника по математическому анализу и тем обла-
стям математики, на которые он опирается: математической логике и линейной алгебре (в объеме,
с точностью до некоторых отклонений по ходу изложения, необходимом для доказательства утвер-
ждений математического анализа). Идея, руководившая автором при его создании, состояла в том,
чтобы дать возможность студентам и преподавателям проследить цепочки рассуждений, ведущие
от самых элементарных понятий теории множеств к главным результатам университетской мате-
матики. При этом первостепенными требованиями к этим цепочкам выставлялись их ясность и
непрерывность, и, поскольку по опыту автора, это требует объяснения, настоящее Предисловие
предназначено главным образом для него.

Что не так? Если задуматься, что теоретически может мешать человеку понимать предмет, из-
ложенный в учебнике, то в голову придут два главных возможных препятствия:
1) Темные места. Плохо объясненные, плохо проработанные, неоправданно сложные, непо-
нятные, запутанные детали в каких-то частях изложения, — причем таковыми могут быть
даже целые темы, — понятно, составляют проблему.
2) Пробелы. Они бывают двух типов: пробелы со ссылками и пробелы без ссылок.
a) Первые отсылают читателя за подробностями к другим источникам, и, хотя в
таких случаях считается, что человек сам может восстановить недостающие де-
тали, надо понимать, что это далеко не всегда бывает легко. Негарантированная
доступность источника, рассогласованность в терминологии и обозначениях, в
стиле, необязательно внятное освещение этой темы в самом источнике, всегда
представляют дополнительные сложности, иногда небольшие, но часто очень
существенные, вплоть до непреодолимых.
b) Помимо пробелов со ссылками бывают еще пробелы без ссылок. Это происходит,
когда какие-то вещи автору текста кажутся очевидными, или общеизвестными,
или незаслуживающими детального обсуждения. Во всех случаях это может
быть причиной непонимания или вовсе отторжения материала.
В математическом анализе эти трудности представлены полным списком. Вот, в частности, из-
вестные автору темные места и пробелы без ссылок (пробелы со ссылками мы перечислим чуть
ниже, на странице v).
1. Элементарные функции. Почти во всех учебниках они вводятся “описательно”, без строгих
определений. Если бы так было везде, это был бы пробел без ссылок, однако автору известна одна
книга, а именно, учебник Г. Грауэрта, И. Либа и В. Фишера [3], где экспонента, логарифм, степень и
тригонометрические функции определены аккуратно [3, Глава VI, § 4]. Можно было бы поэтому не
видеть здесь проблемы, но неприятность в том, что в [3] определения элементарных функций даются
только после темы “Разложение Тейлора”. Естественно, это делает их формально непригодным в
предыдущих темах, то есть, фактически во всем первом семестре изучения матанализа. Поскольку
в матанализе элементарные функции принято использовать сразу, проблема остается, и ее можно
классифицировать как темное место.
2. Кривые и поверхности. Эта тема выглядит недоработанным введением в геометрическую тео-
рию меры, в котором, вопреки ожиданиям зрителя, создатели не захотели или не смогли избавиться
от параметризации. То есть, например, кривая в Rn определяется не как множество в Rn , а как
отображение
γ : [a, b] → Rn
с подходящими свойствами (гладкость, липшицевость, спрямляемость, на вкус автора). Все после-
дующие конструкции — длина (или площадь, в случае с поверхностями), интегралы двух типов и

ii
iii

подобное — производят впечатление (как и положено им быть) величин, не зависящих от парамет-


ризации, но как это формализуется, то есть как следует определить класс кривых (поверхностей),
чтобы независимость от параметризации (с естественно вытекающими следствиями) можно было
аккуратно доказать, — остается непонятно. Это влечет за собой остальные проблемы: неразрабо-
танность аппарата теории, странную узость класса рассматриваемых примеров, а при попытках его
расширить — фантастическую дремучесть определений, формулировок и доказательств. В отличие
от предыдущего примера, это можно считать пробелом без ссылок, потому что ни в каких учебниках
эти детали не проясняются.
3. Calculus (Исчисление). К этой теме также логично относиться как к пробелу без ссылок, однако
здесь объяснение должно быть более подробным. Рассмотрим следующий пример. Представим, что
нам захотелось сосчитать производную функции1

h(x) = sin(x2 ).

Если использовать стандартное определение производной через предел2 ,

h(z) − h(x)
h(x) = lim , (1)
z→x z−x
то для этого нам необходимо будет ввести две вспомогательные функции

g(y) = sin y, f (x) = x2 ,

после чего по известной формуле производной композиции функций3 мы получим:

h′ (x) = (g ◦ f )′ (x) = g ′ (f (x)) · f ′ (x) = cos(x2 ) · 2x.

Этот способ намного менее удобен (особенно когда функция устроена сложно, с большим числом
композиций и/или алгебраических операций), чем школьный, в виде цепочки преобразований, ко-
торая в данном случае принимает вид
 ′  ′
sin(x2 ) = sin y 2
= (sin y)′ 2
· (x2 )′ = cos y 2
· 2x = cos x2 · 2x
y=x y=x y=x

(здесь штрих ′ означает взятие производной по единственной свободной переменной в скобках, а


запись y = x2 в качестве индекса у вертикальной черты, означает подстановку; удобство такой
записи в том, что в ней нет необходимости вводить обозначения для промежуточных функций, f
и g). Чтобы этот “школьный способ” здесь работал, нужны следующие “школьные тождества для
производной”:
(sin y)′ = cos y, (x2 )′ = 2x. (2)
Проблема в том, что они не могут считаться частными случаями формулы (1): в (1) x является
свободной переменной, то есть вместо нее можно подставлять разные значения, и формула все равно
будет верна. Например, можно подставить вместо x символ 1, и мы получим верное равенство

h(z) − h(1)
h(1) = lim .
z→1 z−1
Если же то же самое проделать с формулами (2), подставив, например, y = 1 и x = 1 (что есте-
ственно, когда считаешь значение производной функции h(x) = sin(x2 ) в точке 1), то мы получим
формально ложные равенства:

(sin 1)′ = cos 1, (12 )′ = 2 · 1.

(потому что производная от константы должна быть нулевой). Это означает, что если мы хотим
сохранить школьные приемы вычисления производной, мы должны помимо (1) иметь другое опре-
деление производной, предназначенное специально для вычислений.
Естественный способ приписать точный смысл тождествам (2) — относиться к операции взятия
производной в них как к формальной операции τ 7→ τ ′ на термах подходящей теории 1 порядка4 .
1 Ниже это упражнение приведено как пример 5.1.23.
2В тексте формула (5.1.4).
3 Ниже формула (5.1.61).
4 Понятие теории 1 порядка, или формальной теории, описывается ниже в тексте на с.79.
iv

Если представлять Calculus как такую теорию, то его сигнатуру логично было бы считать состоящей
их нульместных функциональных символов

0, 1, e, π

(e – число Непера, π – полупериод синуса), одноместных функциональных символов

sin, cos, arctg, arcctg,

двуместных функциональных символов


+, ·,
а также, для функций, определенных не везде, двуместных и трехместных предикатных символов,
формализующих схемы высказываний
x
tg x = y, ctg x = y, arcsin x = y, arccos x = y, = z, xy = z, logx y = z.
y

В такой теории производную и интеграл можно было бы определять как операции на термах (или
как подходящие преобразования формул5 ), а возникающие конструкции на множестве R веществен-
ных чисел были бы просто моделью6 Calculus, как теории 1 порядка. Поскольку решение школьных
уравнений и неравенств также представляет собой систему операций над выражениями, постро-
енными из тех же символов, эту часть математики также можно было бы считать компонентой
Calculus.
Но Calculus как теория 1 порядка к настоящему времени не разработан7. Со времен Коши и
Вейерштрасса, когда, как считается, в Анализе был наведен порядок, эта тема так и осталась белым
пятном, и как следствие, традиционно объясняется путано, ссылок на специальные дисциплины не
имеет, а времени на обучение требует пропорционально своей непроходимости: последние несколько
лет школы и первые годы университета.

Делить или объединять? Примеры предыдущего пункта призваны проиллюстировать тезис,


что университетской математике есть куда развиваться. Следующий вопрос можно поставить так:
нужно ли ей продолжать дробиться на все более мелкие дисциплины, или наоборот искать воз-
можности для их объединения?
Автору очевидно, что приоритетом здесь должно быть второе. Понятно, что учебный процесс
ограничен во времени, и если пытаться расположить дисциплины в виде дерева с идеей исключить
ссылки на непройденные темы, это удлиннит обучение так, что в традиционные (для большинства
учебных заведений) сроки, вполне вероятно, уложиться будет невозможно. Но, во-первых, эта про-
блема не кажется непреодолимой: при подходящей перестройке курсов можно добиться хотя бы,
чтобы линейные участки этого дерева излагались параллельно, и если курс A содержит ссылку на
курс B, но ко времени экзамена по A курс B будет пройден, это выглядит приемлемым компромис-
сом.
А, во-вторых, на уровне учебников эта проблема ведь исчезает. Ничто не мешает человеку от-
крывать одну и ту же книгу в разных местах, когда это ему понадобится. При этом общая картина
будет у него всегда перед глазами.
Помимо возможности поглядеть на науку сверху, плюс такой интеграции состоит в том, что она
структурирует знание, давая возможность человеку оценить важность тех или иных тем. Следя
за ссылками читатель может понять, что из предыдущего материала важно для данной темы, а без
чего можно обойтись. При дроблении эта опция исчезает.

С чего начать и где остановиться? Автор счел разумным (и возможным) изложить основные
факты математического анализа с элиминацией темных мест и пробелов, причем не только пробе-
лов без ссылок, но и со ссылками. Последнее условие в этой программе понимается максимально
широко: изложение ведется прямо от оснований математики, что позволяет сделать его полностью
независимым от других источников (в частности, избавиться в теоретическом материале от тради-
ционных ссылок на так называемую “базу школьных знаний”, которыми всегда злоупотребляют в
учебниках по университетской математике).
Для перечисленных выше трех трудных мест в тексте предложены следующие решения.
5 См.формулы на с.330 и 402.
6 Понятие модели теории 1 порядка определяется на с.102.
7 Очевидно, из-за проблемы с определением равенства термов, о которой мы говорим ниже на с.301.
v

1. Элементарные функции: здесь проблема решается введением двух избыточных аксиом (подроб-
ности на с.277). В нашем учебнике эта тема описывается в главе 4, после темы “Пределы”. Такое
расположение материала связано с тем, что при доказательстве свойств элементарных функций,
в частности, тождеств, приходится активно использовать классические теоремы о непрерывных
функциях (а именно, теорему Коши о промежуточном значении 3.3.6 и теорему об обратной функ-
ции 3.3.12), которые, как следствие, к этому моменту желательно иметь в своем распоряжении.
Однако если формальная сторона дела не стоит в приоритете, ничто не мешает на занятиях опи-
сать аксиомы степеней и тригонометрии сразу в теме “числовые функции”, перечислив главные
следствия из них без доказательств (или пообещав доказать это позже). Тогда пользоваться эле-
ментарными функциями можно будет с первых занятий.
2. Кривые и поверхности: здесь предложенное решение состоит в том, чтобы ввести класс гладких
отображений на измеримых по Жордану компактах, которые характеризуются инъективностью по-
чти всюду и невырожденностью почти всюду дифференциала (в тексте такие отображения называ-
ются полурегулярными, см. определение на с.946). Это позволяет доказать теорему о существовании
(подходящим образом понимаемой) функции перехода от одной параметризации к другой (теоре-
ма 15.3.15), что в свою очередь дает решение упомянутой выше проблемы независимости нужных
конструкций от параметризации.
3. Calculus: здесь автор должен признаться, что не смог (пока) найти идею, позволяющую эле-
гантно обойти упомянутые выше трудности. Последовательно разрабатывать Calculus, как теорию 1
порядка, — задача, по-видимому, слишком громоздкая (см. подробности на с.300), а можно ли (с со-
блюдением строгости) описать эту теорию проще — автору неизвестно. В тексте Дифференциальное
исчисление описывается как язык 1 порядка с набором функциональных символов, включающим
обозначения всех элементарных функций (в том числе функций, определенных не везде на R)8 с
дополнительной операцией взятия частной производной над термами. Обсуждение этой темы мы
начинаем со страницы 300, а детали решения приводим на страницах 330 (для функций одной пе-
ременной) и на с.817 (для функций нескольких переменных). Интегральное исчисление, наоборот,
описывается как конструкция внутри Анализа на с.402, без выхода в теорию формальных языков,
потому что неопределенный интеграл удобнее считать операцией на классах функций со значения-
ми в классах функций (а не на классе термов со значениями в классе термов, где он будет не везде
определен).
В соответствии с общей философской установкой, в текст включены также темы, которые по
описанной выше классификации можно считать пробелами со ссылками. Вот их список в сторону
удлинения цепочки связей с матанализом:
4. Линейная алгебра. Многомерный вещественный анализ базируется на линейной алгебре9 , по-
этому если задаваться целью ликвидировать не только пробелы без ссылок, но и со ссылками, то
соответствующий материал из линейной алгебры в такой текст нужно включать. Мы это делаем в
главе 12.
5. Комбинаторика. Линейная алгебра в свою очередь использует результаты комбинаторики10 .
Этот материал мы излагаем в начале главы 12.
6. Теория вещественного числа. Вещественный анализ и линейная алгебра, строятся как дефи-
нициальные расширения теории вещественных чисел. Мы излагаем эту теорию в главе 2.
7. Теория множеств и логика. Теория вещественных чисел в свою очередь представляет собой
дефинициальное расширение аксиоматической теории множеств. Мы описываем ее в главе 0, а в
главе 1 мы приводим материал из математической логики, необходимый для понимания логической
структуры всего курса (в частности, определение самого дефинициального расширения дается на
с.90).
О логике нужно сказать несколько слов отдельно, поскольку ее можно считать одновременно и
пробелом со ссылками, и темным местом, и, при определенном уровне требовательности, пробелом
без ссылок. Речь идет вот о чем. После знаменитого кризиса начала 20 века эта наука пришла к со-
стоянию, когда ее описание удобнее всего представлять как некую игру с символами. И, хотя в этом
8 То есть, помимо алгебраических операций, включающих деление и возведение в степень, в этой сигнатуре функ-

циональными символами считаются также

sin, cos, tg, ctg, arcsin, arccos, arctg, arcctg, log .

9 В качестве иллюстрации можно привести, например, теорему о локальном экстремуме 14.1.27, или теоремы

Лагранжа 14.3.11 и 14.3.12, или теорему об искажении меры при линейном преобразовании 15.1.21, и другие, где
содержатся ссылки на действия с матрицами и полилинейными формами на конечномерном вещественном векторном
пространстве.
10 Например, в конструкции определителя.
vi

и заключался главный итог исследований первой половины 20 века в этой области, — превращение
всей математики в игру с символами, — правила этой игры и главные ее результаты объясняются
на сегодняшний день очень плохо. Неспециалиста эти объяснения поражают своей сложностью и
требуют от него усилий, несоразмерных с целями ознакомления с предметом.
Автору очевидно, что причиной здесь является утвердившийся среди логиков после работ Гёделя
язык платоновских идей, проявляющийся в традиции использовать понятия множества и функции
вне их аксиоматического описания, а понятия истинности и ложности вне их связи с выводимо-
стью из аксиом теории множеств. На самом элементарном уровне понимания предмета это видно
в том, что в современной логике понятия множества и функции используются до того, как тео-
рия множеств построена как формальная теория. Это приводит к странной неоднозначности в
понимании этих терминов: с одной стороны, они используются как термины формальной теории,
но одновременно (и очень часто, почти всегда, невозможно уловить разницу) как просто слова в
повседневной речи, значение которых не требует уточнений (но тем не менее выводы, к которым
приводит их употребление, остаются на удивление глубокими и неочевидными11 ).
Человек с улицы (даже математик, но не специалист в этой области) понять эту игру намеков,
конечно, не в состоянии, и остается удивляться, как получилось, что до сих пор никто не пытался
навести в этой области “линейный порядок” (принятый во всей остальной математике). То есть
такое положение дел, при котором ссылки на конструкции, не описанные формально на момент
использования, считаются недопустимыми.
В первой части нашего учебника, посвященной основаниям математики (главы 0 и 1) мы поста-
раемся исправить это недоразумение и даем “линейное” изложение главных результатов этой науки.
Неспециалисту это прояснит картину, а специалисту позволит взглянуть на нее по-новому (что, как
мы уже отмечали в аннотации, полезно). Автор, помимо прочего, считает, что такой “линейный”
способ объяснять этот материал представляет собой естественное развитие гильбертовской фило-
софии формализма (которой только обстоятельства помешали превратиться в описываемую здесь
систему).
С теорией множеств и логикой мы доходим до основ, дальше которых уже ничего нет, и у нас
получается курс университетской математики с нуля.
Объем охвата тем 4-7 в этом списке диктуется потребностями математического анализа, но
иногда, когда затрагиваемый круг вопросов важен для математики в целом, как, например, в случае
с рангом множества (см. определение на с.74), мы отступаем от этого правила и даем немного
больше информации.

Структура учебника. В намерения автора входит доказательство всех формулируемых утвер-


ждений, за исключением
1) совсем элементарных, доказательство которых проводится по аналогии с соседними утвер-
ждениями (и которые поэтому иногда оформляются в виде упражнений, как, например,
свойства чисел в упражнении 2.1.12),
2) нескольких фактов общематематического значения (таких, как теорема Гёделя о непол-
ноте12 или парадокс Банаха-Тарского13), приводимых в тексте только для прояснения
мотивировок, и никак не проявляющих себя в логической структуре курса.
По способу подачи материал делится на основной, излагаемый текстом в одну колонку, и иллю-
стративный, представленный двумя колонками. Разница между тем и другим состоит в том, что
основной материал задуман, как логически последовательное изложение основных утверждений
теории, в котором, в частности, не допускаются ссылки на утверждения, не доказанные на момент
цитирования.
В иллюстративном материале, наоборот, приоритетом считается обеспечение читателя достаточ-
ным количеством примеров и упражнений для скорейшего привыкания к используемым в основном
тексте понятиям и приемам, и, как следствие, уровень логической строгости здесь снижается. Одна-
ко, не намного, а только до той планки, на которой некоторые понятия позволяется упоминать суще-
ственно раньше, чем они будут формально определены (например, понятие длины кривой впервые
упоминается на с.463, хотя определяется только на с.985), а некоторым утверждениям позволяется
быть сформулированными задолго до того, как они будут аккуратно доказаны в тексте (таковы,
11 Такова, например, теорема Гёделя о полноте, формулируемая ниже в виде двух теорем 1.1.22 и 1.1.23 (отдельно

для теорий с конечной и бесконечной системой аксиом).


12 Теорема 1.1.17 ниже.
13 Теорема 15.1.5.
vii

например, формулы для простейших геометрических величин в главе 8 – площади правильной об-
ласти на плоскости, объема тела вращения и т.п. – которые мы по традиции приводим раньше, чем
эти величины формально будут определены, и как следствие, доказательство этих формул перено-
сится на несколько глав вперед). При таком подходе, в частности, все, что связано с Исчислением,
включая определения элементарных (/стандартных) функций, описание формальных операций над
ними и доказательство связи этих операций с дифференцированием и интегрированием, попадает
в двухколоночный текст, поскольку идеологически превращается в иллюстративный материал.
При работе над текстом автор использовал многие идеи доказательств, а также некоторые за-
дачи и упражнения из учебников и пособий, выходивших в разные годы в России. Эти руководства
приведены в списке литературы на странице viii.

Остающиеся пробелы. В предлагаемом варианте текста все еще остаются один пробел без ссы-
лок и одно темное место:
1. Темным местом по-прежнему можно считать Calculus, потому что, как уже говорил ав-
тор, найти идею, позволяющую изложить этот материал одновременно строго и просто,
ему пока не удалось. Предлагаемое решение можно считать строгим, но простым его не
назовешь.
2. Пробелом без ссылок является теорема Гёделя о полноте для рекурсивно аксиоматизи-
рованных теорий, описываемая в тексте в нетрадиционно формализованном виде и на-
званная здесь теоремой о семантизации (теорема 1.1.23). Это утверждение приводится
без доказательства (и без ссылок на доказательство) и даже сама его формулировка пока
не точна.
Автор публикует в сети этот черновик в надежде на помощь коллег и будет признателен за любые
ссылки и идеи для устранения этих недостатков.
Литература

[1] Г. И. Архипов, В. А. Садовничий, В. Н. Чубариков. Лекции по математическому анализу, М.:


Высшая школа, 1999.
[2] Э. Б. Винберг. Курс алгебры. М.: Факториал-пресс, 2001.
[3] Г. Грауэрт, И. Либ, В. Фишер. Дифференциальное и интегральное исчисление. М.: Мир, 1971.
[4] В. А. Зорич. Математический анализ, М.: Фазис, Т.1-2, 1997.
[5] Дж. Л. Келли. Общая топология, М.: Наука, 1981.
[6] Л. Д. Кудрявцев. Курс математического анализа, М.: Высшая школа, Т.1-2, 1981, Т.3, 1989.
[7] Л. Д. Кудрявцев, А. Д. Кутасов, В. И. Чехлов, М. И. Шабунин. Сборник задач по математи-
ческому анализу, М.: Физматлит, Т.1-3, 2003.
[8] У. Рудин. Основы математического анализа. М.: Мир, 1976.
[9] М. Спивак. Математический анализ на многообразиях. М.: Мир, 1968.
[10] Г. Такеути. Теория доказательств. М.: Мир, 1978.
[11] Е. Титчмарш. Теория функций. М.: Наука, 1980.
[12] Х. Уитни. Геометрическая теория интегрирования. М.: ИЛ, 1960.
[13] Дж. Шенфилд. Математическая логика. М.: Наука, 1975.

viii
Часть I

ОСНОВАНИЯ МАТЕМАТИКИ

1
Глава 0

ТЕОРИЯ МНОЖЕСТВ

Вся современная математика (за исключением некоторых разделов логики) строится на теории
множеств (понимаемой ныне как система аксиоматических теорий, различающихся некоторыми
деталями). Поэтому если задаваться целью излагать какую-то часть математики (в нашем случае,
Анализ) без пробелов, начинать нужно все-таки с теории множеств.
В этой главе мы опишем одну из аксиоматических теорий множеств, теорию Морса-Келли, и
при этом постараемся сделать это описание максимально формализованным, чтобы дать читателю
представление об игре с символами, о которой мы говорили в Предисловии на с.v.

§1 Наивная теория множеств


Изучение теории множеств удобно начать с ее наивной версии, которая, будучи сформулирована на
современном языке, экономно вводит в курс дела и иллюстрирует проблемы. Эту теорию мы будем
обозначать буквосочетанием NST (“naive set theory”).

(a) Формулы Естественно, кроме A и B в этих высказывани-


ях1 допускается использование других букв из
Элементарные высказывания. Взгляд тео-
заранее выбранного алфавита. Мы будем счи-
рии множеств (не только наивной, но вообще лю-
тать таким алфавитом латинский с прописными
бой) на мир заключается в том, что его объекты
символами2 :
находятся друг с другом в отношении принад-
лежности: если мы рассматриваем произвольные
два объекта A и B, то должно быть истинным
или ложным (или независимым от используемой
нами системы аксиом) утверждение, звучащее
так: A, B, C, D, E, F, G, H, I, J, K, L, M, N,
«A принадлежит B» O, P, Q, R, S, T, U, V, W, X, Y, Z.
или, в эквивалентных формулировках,
«A является элементом B»
«B содержит A в качестве элемента».
Эти символы называются переменными.
Коротко это записывают формулой
A ∈ B.
Помимо этого объекты могут быть одинаковыми
или различаться. Если A и B совпадают, то это • Высказывания вида3 A ∈ B и A = B (где
записывают формулой вместо A и B могут стоять любые другие пе-
ременные) называются атомарными форму-
A = B. лами теории множеств.
1 Точнее, в схемах высказываний, потому что если формула содержит свободные переменные, то это не одно,
семейство высказываний.
2 Логики обычно делают алфавит бесконечным, объявляя допустимым применение индексов или штриха, но на

этом этапе нам будет достаточно конечного набора букв.


3 См. подстрочное примечание 1.

2
§ 1. Наивная теория множеств 3

Логические операции и кванторы. Из ато- • Формула ϕ в формулах (0.1.1) называется об-


марных формул (“простейших высказываний” ластью действия квантора (∀ или ∃, в зави-
этого языка) строятся более сложные с помощью симости от символа перед переменной α).
логических операций и кванторов, список кото-
рых удобно привести в следующей таблице: Приведем некотороые примеры.

⋄ 0.1.1. Следующие строки являются формула-


символ его смысл название
ми теории множеств:
¬ «не» отрицание
& «и» конъюнкция ¬(A = B)
∨ «или» дизъюнкция (A ∈ B) & (X = Y )
⇒ «влечет за собой» импликация
(A ∈ B) ∨ (B ∈ A)
⇔ «эквивалентно» эквивалентность
∀ «для любого» квантор ∀X ∃Y X ∈ Y
всеобщности ⋄ 0.1.2. Следующие строки, наоборот, не явля-
∃ «существует» квантор ются формулами теории множеств:
существования
(A = B)¬
У этих значков имеется формальное описание с
(A ∈ B) (X = Y )
точными правилами употребления (и мы приво-
дим его ниже на с.10), однако на этом этапе удоб- (A ∈ B) & ∨ (B ∈ A)
но о таких вещах не задумываться, и в логиче-
ских рассуждениях руководствоваться интуици- ∀ ∃X Y X ∈ Y
ей, воспринимая эти символы просто как систему
сокращений в обыденной речи. Сокращения.
• Отрицания отношений = и ∈ имеют специ-
Высказывания (формулы). Логические альные обозначения:
операции и кванторы позволяют строить из ато-
марных формул (“простейших высказываний” X 6= Y (0.1.2)
об объектах теории) более сложные, называемые
просто формулами. Для их описания использу- – эквивалентная запись отношения
ется следующее индуктивное определение (в ко-
¬(X = Y ),
тором греческие буквы обозначают переменные
или высказывания).
а
• Формулой (или высказыванием) теории мно- X∈
/Y (0.1.3)
жеств объявляется произвольная строка – эквивалентная запись отношения
символов, состоящая из букв латинского ал-
фавита, символов = и ∈, логических симво- ¬(X ∈ Y ).
лов и скобок, построенная по следующим пра-
вилам:
Подстановка.
— если X и Y – переменные, то X = Y явля- • Вхождение переменной X в формулу ϕ назы-
ется формулой, вается связанным, если в этом вхождении X
— если X и Y – переменные, то X ∈ Y явля- стоит сразу после какого-то квантора, или X
ется формулой, попадает в область действия какого-то кван-
— если строка ϕ – формула, то строка ¬ (ϕ) тора по X. В противном случае это вхожде-
– тоже формула; ние называется свободным.
— если строки ϕ и ψ – формулы, то следую- • Переменная X в формуле ϕ называется свя-
щие строки – тоже формулы: занной переменной в ϕ, если все ее вхождения
в ϕ связанны. В противном случае X называ-
(ϕ) & (ψ), (ϕ) ∨ (ψ), ется свободной переменной.
(ϕ) ⇒ (ψ), (ϕ) ⇔ (ψ), ⋄ 0.1.3. В формуле

— если ϕ – формула, а X – переменная, то X = Y & ∃X X ∈ X


следующие строки – тоже формулы:
первое вхождение переменной X является сво-
∀X (ϕ), ∃X (ϕ). (0.1.1) бодным, а остальные – связанными.
4 Глава 0. ТЕОРИЯ МНОЖЕСТВ

⋄ 0.1.4. В следующих формулах X является сво- Чтобы строить теорию, нужны исходные поло-
бодной переменной: жения (называемые аксиомами), из которых за-
тем будут выводиться более сложные утвержде-
X = X, ния (называемые теоремами). В наивной теории
множеств аксиомами удобно считать следующие
X ∈ X, семь высказываний (точнее сказать, классифи-
∃Y X ∈ Y. кационный список высказываний).
Первые три аксиомы называют обычно акси-
А в следующих, наоборот, X – связанная пере- омами равенства:
менная:
∀X X = X, NST-1 Аксиома рефлексивности:
∃X X ∈ X, X = X. (0.1.5)
∀X ∃Y X ∈ Y. Это надо понимать так, что равенство X = X
считается верным для всех множеств X.
• Подстановкой переменной Y вместо перемен-
ной X в формулу ϕ называется формула, по- NST-2 Аксиома симметричности:
лучающаяся из ϕ заменой X на Y во всех сво-
бодных вхождениях переменной X в формуле X = Y ⇒ Y = X. (0.1.6)
ϕ. Мы обозначаем такую формулу символом На человеческом языке это означает, что равен-
ство X = Y формально не отличается от равен-
ϕ (0.1.4) ства Y = X.
X=Y
NST-3 Аксиома транзитивности:
• Подстановка ϕ называется корректной,
X=Y (X = Y & Y = Z) ⇒ X = Z. (0.1.7)
если при замене X на Y вторая переменная
не попадает в область действия квантора по То есть равенства X = Y и Y = Z влекут за
этой переменной. собой равенство X = Z.
Следующая аксиома устанавливает связь
⋄ 0.1.5. Подстановка Y вместо X в формулу
между равенством и отношением принадлежно-
X =Y сти:
NST-4 Аксиома инвариантности:
дает формулу
Y =Y (X = A & Y = B & X ∈ Y ) ⇒ A ∈ B
(0.1.8)
⋄ 0.1.6. Подстановка Y вместо X в формулу
Иными словами, в отношение X ∈ Y можно под-
A=B ставлять множества, равные X и Y , и при этом
будут получаться следсвия.
дает ту же формулу Три последние аксиомы описывают собствен-
но отношение принадлежности:
A=B
NST-5 Аксиома невырожденности:
⋄ 0.1.7. Подстановка Y вместо X в формулу
∃X ∃Y X ∈ Y. (0.1.9)
∃Y X ∈ Y
То есть существуют множества X и Y такие, что
дает формулу X ∈Y.
∃Y Y ∈ Y, NST-6 Аксиома объемности:
однако такая подстановка некорректна, потому X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y )
что после замены Y попадает в область действия (0.1.10)
квантора ∃ по Y .
То есть два множества X и Y совпадают, если и
только если они «имеют одинаковый набор эле-
(b) Аксиомы, теоремы и антино-
ментов».
мии.
NST-7 Аксиома безусловного выделе-
Аксиомы наивной теории множеств. Если ния: пусть ϕ – формула теории мно-
не предполагать ничего о свойствах отношений жеств с единственной свободной пере-
= и ∈, которым удовлетворяют или не удовле- менной X, тогда
творяют различные множества, то и сказать о
множествах ничего внятного будет невозможно. ∃Y (X ∈ Y ⇐⇒ ϕ) (0.1.11)
§ 1. Наивная теория множеств 5

Иными словами, существует множество Y , эле- Теоремы. Из аксиом NST-1—NST-7 средства-


ментами которого являются в точности те X, для ми логики выводятся следствия, то есть теоремы
которых выполняется ϕ. этой науки.
Как мы уже говорили, наивная теория мно-
Обозначение {X : ϕ}. Отметим сразу одно жеств противоречива, и поэтому ссылки на ее ре-
важное следствие из аксиом NST-1—NST-7: ак- зультаты содержательного смысла не имеют. Ее
сиома NST-7 позволяет определять объекты: теоремы представляют интерес только как иллю-
страции к идее выводимости утверждений из ак-
• Объект Y в формуле (0.1.11) будет единствен- сиом (абстрактной) теории. Мы приведем лишь
ным по аксиоме NST-7, поэтому ему можно несколько простейших теорем теории NST, при-
приписать обозначение. Это обозначение вы- чем оформлять мы их будем в виде примеров,
глядит так: чтобы у читателя не возникало искушения цити-
{X : ϕ} ровать их в дальнейшем. Нас будет интересовать
цепочка, ведущая к антиномии Рассела.
и, если ϕ не содержит переменной T , харак-
теризуется оно высказыванием ⋄ 0.1.10. В наивной теории множеств множества
∅ и Set не совпадают:
T ∈ {X : ϕ} ⇐⇒ ϕ .
X=T
∅ 6= Set (0.1.15)
⋄ 0.1.8. Пустое множество ∅. В наивной тео-
рии множеств следующее равенство определяет Доказательство. По аксиоме объемности NST-
так называемое пустое множество: 6, чтобы доказать неравенство ∅ 6= Set, доста-
точно подобрать какое-нибудь множество X та-
∅ = {X : X 6= X}. (0.1.12) кое, что
X∈/ ∅ & X ∈ Set .
В соответствии с аксиомой выделения NST-7, Для этого воспользуемся аксиомой невырожден-
расшифровывается эта запись так: элементами ности NST-5 и рассмотрим какие-нибудь два
класса ∅ считаются те и только те множества множества X и Y такие, что
X, которые не равны самому себе. Поскольку
аксиоме NST-1 такое невозможно (высказывание X ∈ Y.
X = X считается верным всегда), множество ∅
вообще не содержит никаких элементов (отчего В силу (0.1.14), X ∈ Set. С другой стороны,
и называется пустым). X ∈/ ∅ (потому что Z ∈ ∅ невозможно ни для
какого Z).
⋄ 0.1.9. Множество Set всех множеств. Точ-
но так же из аксиомы выделения NST-7 следует, ⋄ 0.1.11. В наивной теории множеств всякое
что равенство множество X является элементом некоторого
другого множества Y :
Set = {X : X = X}. (0.1.13)
∀X ∃Y X ∈ Y (0.1.16)
тоже определяет некое множество. Его элемен-
тами считаются те и только те множества X, ко- Доказательство. В качестве Y можно выбрать
торые равны самому себе. Поскольку по аксиоме множество Set.
NST-1 это верно для любого X, получается, что
• Говорят, что множество A содержится в
множество Set должно содержать все на свете
множестве B, или что A является подмно-
множества, то есть
жеством множества B, и изображают это
X ∈ Set (0.1.14) записью
A⊆B
верно для любого объекта X наивной теории если всякий элемент T множества A является
множеств. также элементом множества B:
В том числе это верно и для X = Set, то есть
мы получаем, что истинно высказывание ∀T (T ∈ A ⇒ T ∈ B).

Set ∈ Set ⋄ 0.1.12. В наивной теории множеств для всяко-


го множества X существует множество Y такое,
Здесь важно отметить, что это верно только в что подмножествами в X являются в точности
наивной теории множеств (и это порождает па- те множества A, которые являются элементами
радоксы, о которых мы поговорим ниже). В со- множества Y :
временных аксиоматических теориях множеств
эта формула не будет верна. A ⊆ X ⇐⇒ A ∈ Y (0.1.17)
6 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Программа Гильберта. Из антиномии Рассе-


Доказательство. Множество Y определяется по
аксиоме NST-7 формулой ла (и не только из нее, потому что почти одно-
n o временно с ней были обнаружены разные дру-
Y = A : ∀T T ∈A ⇒ T ∈X . гие противоречия в тогдашней теории множеств)
следует, ни много, ни мало, что в NST вообще лю-
бое утверждение ϕ можно доказать (вместе
с его отрицанием ¬ϕ) — на этот счет имеется
Антиномия Рассела. В 1902 году англий- специальная теорема логики о противоречивых
ским математиком Бертраном Расселлом было теориях, которую мы приводим ниже (теорема
сделано следующее наблюдение. 1.1.9).
Понятно, это означало, что построенная к то-
⋄ 0.1.13. Антиномия Рассела. По аксиоме без-
му времени теория множств, которую мы здесь
условного выделения NST-7 в наивной теории
описали как аксиоматическую теорию NST, не
множеств определено множество
может выполнять роль фундамента всей мате-
R = {X : X ∈
/ X}. (0.1.18) матики, для которой она была создана. По этой
причине сама эта теория и связанная с ней логи-
Оно называется множеством Рассела и состоит ка, определяющая общие принципы математиче-
из всевозможных таких множеств X, для кото- ских рассуждений — эти области тогда как раз
рых верно X ∈
/ X: стали оформляться в специальный раздел мате-
матики, называемый основания математики —
X ∈ R ⇐⇒ X ∈ /X (0.1.19) были подвергнуты пересмотру. Немецким мате-
матиком Давидом Гильбертом в начале 20 ве-
Зададимся вопросом, будет ли R элементом са- ка была предложена специальная программа, це-
мого себя: лью которой объявлялось превращение основа-
ний математики в “универсальную” аксиомати-
R ∈ R или R ∈ /R? ческую теорию, где не только будут удалены су-
ществующие противоречия, но также будет до-
Антиномия Рассела состоит в том, что эти
казано, что
утверждения эквивалентны:

вспоминаем 1) никаких новых противоречий в дальнейшем


определение R возникнуть не может (это свойство теории на-
(0.1.19)
↓ зывается непротиворечивостью), и
R∈R ⇐⇒ R – одно из тех X, для
 2) любое утверждение ϕ либо верно само, либо
которых выполняется X ∈
/X ⇐⇒ R∈/R верно его отрицание ¬ϕ (это называется пол-

упрощаем нотой).
высказывание

То есть, Через некоторое время эта работа привела


к определенным положительным результатам:
R∈R ⇐⇒ R∈
/ R. (0.1.20) подходящим уточнением определений и введени-
ем новых строгих правил для построения новых
! 0.1.14. Из этого примера следует, между про- объектов удалось добиться устранения всех на-
чим, что в теории NST оба утверждения, R ∈ R копленных к тому времени в математике проти-
и R∈ / R, выводимы. воречий. Однако новым неприятным сюрпризом,
Действительно, покажем сначала, что R ∈ R. ставшим одним из главных итогов всей этой дея-
Это делается методом от противного. Предполо- тельности, явилась принципиальная невозмож-
жим, что выполняется противное, то есть R ∈/ R. ность доказать непротиворечивость любой та-
Тогда в силу (0.1.20) мы получаем R ∈ R. Вме- кой теории (точнее, любой теории, включаю-
сте с нашим предположением, R ∈ / R, это да- щей арифметику, без которой, конечно, ника-
ет два противоположных утверждения, R ∈ R и кая математика невозможна). Параллельно об-
R ∈/ R, то есть противоречие. Значит, наше ис- наружилась несовместимость непротиворечи-
ходное предположение, R ∈/ R, неверно. Поэтому вости с полнотой. Эти результаты принадлежат
выполняется R ∈ R. австрийскому математику Курту Гёделю, и мы
Точно так же доказывается утверждение R ∈ / о них поговорим на с.79 (см. теоремы 1.1.16 и
R. 1.1.17).
§ 2. Логика предикатов для теории множеств 7

§2 Логика предикатов для теории множеств


В 20 веке математики, следуя первоначальному плану Гильберта, построили несколько аксиомати-
ческих теорий множеств, в которых накопленные к тому времени парадоксы (в частности, парадокс
Рассела) были устранены (однако, как мы уже говорили, без гарантий, что новые парадоксы не по-
явятся в будущем). Из них самыми известными являются теории Цермело-Френкеля ZF, Неймана-
Бернайса-Гёделя NBG и Морса-Келли MK. Для этих трех теорий, в силу их особенной популярности,
удобно выбрать общее название, и мы будем поэтому называть их в дальнейшем рабочими теори-
ями множеств. Самой мощной из них является теория Морса-Келли4 MK, и по этой причине мы
будем описывать ее.

(a) Язык теории множеств


Сигнатура теории множеств. В теории Морса-Келли MK, в отличие от наивной теории мно-
жеств NST, исходные объекты называются классами. Интуитивно под этим понимается более широ-
кое образование, чем множество, а сами множества определяются затем как частные случаи классов
(см. ниже определение на с.30). В остальном все детали языка повторяются: считается, что классы,
помимо того, что могут совпадать,
A = B,
еще могут находиться в отношении принадлежности

A∈B

– и в этом случае, как и в NST, говорят, что “A принадлежит B”, или что “A является элементом
B”, или что “B содержит A в качестве элемента”.

Формулы теории множеств. Формулы теории MK определяются так же как в теории NST, с
той разницей, что алфавит удобно расширить, включив строчные буквы латинского алфавита и еще
возможность добавлять к букве штрих. То есть, повторим с уточнениями, на интуитивном уровне,
формула в MK – это утверждение или, другой термин, высказывание о классах5 , которое можно
получить инструментами теории, то есть с помощью отношения принадлежности ∈, к которому
еще добавляется отношение равенства =, а также с помощью (некоторых) логических операций
и кванторов, список которых был приведен в таблице на с.3: ¬, &, ∨, ⇒, ∀, ∃ (символ ⇔ будет
определен позже формулой (0.2.24)). При этом, информация во втором столбце этой таблицы (о
смысле этих символов) приводится пока только для интуитивного понимания существа дела, и для
нашей ближайшей цели – описать понятие формулы в теории множеств – нам не нужна. Точный
смысл этих значков мы объясним на с.10.
Определение понятию формулы выглядит так:
• Переменной в теории множеств мы будем считать произвольную букву латинского ал-
фавита, прописную

A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z,

или строчную,

a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,

либо такую же букву с добавленным (возможно, несколько раз) штрихом, то есть если α
– переменная, то α′ – тоже переменная, например

A′ , A′′ , ..., a′ , a′′ , ...

• Формулой (или высказыванием) теории множеств называется произвольная строка из


переменных, символов = и ∈, логических символов и скобок, построенная по следующим
правилам:
4 Энтони Морс, Джон Келли. В компактном виде эта теория описана в Добавлении к учебнику Дж. Л. Келли [5].

Об используемом логическом аппарате можно составить представление по книге Г. Такеути [10].


5 Правильнее сказать, “схема высказываний”, потому что, например, формула X ∈ Y — это не высказывание о

каких-то конкретных X и Y , а схема, включающая все высказывания вида “ X принадлежит Y ”.


8 Глава 0. ТЕОРИЯ МНОЖЕСТВ

1) если X и Y – переменные, то запись

X =Y (0.2.21)

является формулой,
2) если X и Y – переменные, то запись

X∈Y (0.2.22)

является формулой,
3) если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
4) если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:

(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ),

Для обозначения формул мы будем использовать греческие буквы.


5) если ϕ – формула, а X – переменная, то следующие строки – тоже формулы:

∀X (ϕ), ∃X (ϕ). (0.2.23)

• Формула ϕ в формулах (0.2.23) называется областью действия квантора (∀ или ∃, в


зависимости от символа перед переменной α).
• Для любых переменных α и β формулы (0.2.21) и (0.2.22) называются атомарными (в
теории множеств).
• К списку логических символов выше добавляется символ эквивалентности ⇔, который
понимается так: запись (ϕ) ⇔ (ψ) является сокращением записи

((ϕ) ⇒ (ψ)) & ((ψ) ⇒ (ϕ)). (0.2.24)

• Вхождение переменной α в формулу ϕ называется связанным, если в этом вхождении


α стоит сразу после какого-то квантора, или α попадает в область действия какого-то
квантора по α. В противном случае это вхождение называется свободным.
• Переменная α в формуле ϕ называется связанной переменной в ϕ, если все ее вхождения
в ϕ связанны. В противном случае α называется свободной переменной.
• Если формула ϕ не содержит свободные переменные, то ϕ называется замкнутой. Если
же в ϕ имеются свободные переменные, то ϕ называется открытой формулой.
• Отрицания отношений = и ∈ имеют специальные обозначения:

X 6= Y (0.2.25)

– эквивалентная запись отношения

¬(X = Y ),

а
X∈
/Y (0.2.26)
– эквивалентная запись отношения
¬(X ∈ Y ).
• Подстановкой переменной Y вместо переменной X в формулу ϕ называется формула,
получающаяся из ϕ заменой X на Y во всех свободных вхождениях переменной X в
формуле ϕ. Мы обозначаем такую формулу символом

ϕ (0.2.27)
X=Y

• Подстановка ϕ называется корректной, если при замене X на Y вторая переменная


X=Y
не попадает в область действия какого-нибудь квантора по этой переменной.
§ 2. Логика предикатов для теории множеств 9

⋄⋄ 0.2.1. Следующие формулы замкнуты: следних двух примерах переменная Y – связан-


ная.)
1) ∀X (X = X); 4) ∀X (X ∈
/ X);
⋄⋄ 0.2.3. Примеры двуместных открытых фор-
2) ∀X (X =
6 X); 5) ∀Y (∃X (X ∈ Y )); мул:
3) ∀X (X ∈ X); 6) ∃Y (∀X (X ∈ Y )).
1) X = Y ;
(Здесь всюду X и Y – связанные переменные.) 6 Y;
2) X =
3) X ∈ Y ;
⋄⋄ 0.2.2. Примеры одноместных открытых фор-
4) X ∈
/ Y;
мул:  
5) ∃Z X ∈ Z & Y ∈ Z ;
1) X = X; 4) X ∈
/ X;  
6) ∃Z X ∈ Z & Z ∈ Y .
6 X;
2) X = 5) ∀Y X ∈ Y ;
3) X ∈ X; 6) ∃Y X ∈ Y . (Здесь всюду X и Y – свободные переменные, а
в последних двух примерах переменная Z – свя-
(Здесь всюду X – свободная переменная, а в по- занная.)

(b) Логика предикатов в аксиоматизации Генцена


Для формализации логических рассуждений, с помощью которых из одних формул (высказыва-
ний) выводятся другие, математики построили несколько аксиоматических систем логики, из кото-
рых наиболее известны так называемое исчисление предикатов CQC, построенное самим Давидом
Гильбертом, и эквивалентное ему исчисление секвенций LK, предложенное другим немецким ма-
тематиком, Герхардом Генценом. Эти две системы определяют доминирующую ныне в математике
систему логики, называемую логикой предикатов. Из них двух более наглядна и удобна в вычис-
лениях система Генцена6 , поэтому для описания логики предикатов мы выбираем ее.

Секвенции. Формулы в языке связаны между собой тем, что одни следуют из других. Если нас
интересует вопрос, следует ли формула χ из формулы ϕ, то это принято записывать строчкой

ϕ ⊢ χ,

и называется такая запись секвенцией. В секвенции может быть несколько формул слева и справа
от знака секвенции ⊢, тогда эти формулы должны быть разделены запятыми, и при этом запятая
слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как сокращение
символа ∨.7 То есть, например, секвенция

ϕ, χ ⊢ ψ, ω

означает, что мы хотим понять, следует ли формула ψ ∨ ω из формулы ϕ &χ, и поэтому она экви-
валентна секвенции
ϕ &χ ⊢ ψ ∨ ω. (0.2.28)
Точно так же секвенция
α, β, γ ⊢ δ, η, θ, ι
эквивалентна секвенции
α &β &γ ⊢ δ ∨ η ∨ θ ∨ ι.
В секвенции формулы могут повторяться, например, так:

ϕ, ϕ ⊢ χ,

или так
ϕ, ⊢ χ, χ, χ
6 См. сравнение на с.25.
7 Это правило, — “запятая слева от символа ⊢ интерпретируется как сокращения символа &, а справа – как
сокращение символа ∨”, — формально не присутствует в правилах исчисления LK, оно выводится потом. В нашем
тексте оно доказывается ниже в теоремах 0.2.1 и 0.2.2.
10 Глава 0. ТЕОРИЯ МНОЖЕСТВ

(повторение может быть сколь угодно длинным, но конечным, потому что формул в секвенции
всегда конечный набор).
Заглавные греческие буквы, например, Γ , ∆, обозначают конечные наборы формул (возможно,
повторяющиеся), связанные запятыми. В частности, запись

Γ ⊢∆

означает секвенцию, в которой под Γ и ∆ понимаются такие конечные наборы формул. Точно так
же запись
A, B ⊢ Γ, ∆
означает секвенцию, в которой A, B, Γ , ∆ тоже такие наобры формул, причем там, где кончается
A и начинается B тоже стоит запятая (и то же самое для Γ и ∆).
В секвенции
Γ ⊢∆
набор формул Γ (слева от знака ⊢) называется антецедентом (или посылкой), а набор формул ∆
(справа от знака ⊢) – сукцедентом (или следствием). Не всегда ∆ следует из Γ , но в тех случаях,
когда удается построить так называемый вывод для секвенции Γ ⊢ ∆ (что это такое мы объясним
на с.12), говорят, что эта секвеция выводима (а ∆ действительно следует из Γ ).
Наборы Γ или ∆ могут быть пустыми: секвенция

⊢ ∆,

если она выводима, означает, что дизъюнкция формул ∆ следует из пустого набора формул (это
можно понимать так, что ∆ следует из чего угодно)8 , а секвенция

Γ ⊢

– что из конъюнкции формул Γ следует все что угодно9 . Секвенция, пустая с обеих сторон

⊢,

если она выводима, означает, что в этом языке из любого набора формул Γ следует любой набор
формул ∆ (это понимается так, что рассматриваемый язык противоречив).

Аксиома и правила вывода в LK. Следующий вариант исчисления LK модифицирован специ-


ально под язык теории множеств10 .
• Аксиома исчисления секвенций LK. Прежде всего, считается что для любой формулы ϕ
выводима секвенция

LK-0: ϕ ⊢ ϕ. (0.2.29)

Это соглашение называется аксиомой исчисления LK (и других аксиом в этом исчислении


нет).
• Правила вывода в исчислении секвенций LK. Далее вводятся следующие правила, в кото-
рых запись
Γ ⊢∆
Π ⊢Λ
означает, что если выводима верхняя секвенция, Γ ⊢ ∆, то выводима и нижняя, Π ⊢ Λ.
Если же вверху стоят две секвенции, разделенные широким пробелом
Γ ⊢∆ Π⊢Λ
,
Θ⊢Ω
то это означает, что из выводимости обеих верхних секвенций, Γ ⊢ ∆ и Π ⊢ Λ, следует
выводимость нижней, Θ ⊢ Ω.
Эти правила делятся на две группы.
8 См.
ниже в качестве иллюстрации пример 0.2.26.
9 См.
ниже в качестве иллюстрации пример 0.2.27.
10 Ниже на с.79 мы опишем язык формальной теории в общем виде. В нем, в отличие от языка теории множеств,

допускается наличие функциональных символов (которых нет в языке теории множеств, из-за чего тот проще). Для
языков с функциональными символами нижеприводимые правила вывода LK-12 и LK-15 усложняются тем, что вместо
переменной y в них позволено подставлять произвольный терм (понятие терма будет определено на с.80).
§ 2. Логика предикатов для теории множеств 11

a. Структурные правила:
— ослабление:
Γ ⊢∆ Γ ⊢∆
LK-1: (0.2.30)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
LK-2: (0.2.31)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
LK-3: (0.2.32)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
LK-4: (0.2.33)
Γ, Π ⊢ ∆, Λ
b. Логические правила:
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
LK-5: (0.2.34)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
LK-6: (0.2.35)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
LK-7: (0.2.36)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
LK-8: (0.2.37)
ϕ ∨ χ, Γ ⊢ ∆
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
LK-9: (0.2.38)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
LK-10: (0.2.39)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
LK-11: (0.2.40)
Γ ⊢ ∆, ϕ ⇒ χ
— добавление квантора всеобщности в антецедент: если подстановка ϕ x=y
корректна11 , то
ϕ x=y
,Γ ⊢ ∆
LK-12: (0.2.41)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y не
входит (как свободная переменная) в нижнюю секвенцию (то есть в
наборы формул Γ , ∆, ∀x ϕ), то

Γ ⊢ ∆, ϕ x=y
LK-13: (0.2.42)
Γ ⊢ ∆, ∀x ϕ
11 Определение корректной подстановки дано на с. 8.
12 Глава 0. ТЕОРИЯ МНОЖЕСТВ

— добавление квантора существования в антецедент: если переменная y


не входит (как свободная переменная) в нижнюю секвенцию (то есть
в наборы формул ∃x ϕ, Γ , ∆), то

ϕ x=y
,Γ ⊢ ∆
LK-14: (0.2.43)
∃x ϕ, Γ ⊢ ∆

— добавление квантора существования в сукцедент: если подстановка


ϕ x=y корректна12 , то

Γ ⊢ ∆, ϕ x=y
LK-15: (0.2.44)
Γ ⊢ ∆, ∃x ϕ

Отношение следования между формулами, дерево Генцена, и выводимость секвенций


в LK. Теперь объясним, как это работает. Если нам даны какие-то две формулы ϕ и χ (то есть два
высказывания в языке теории множеств), то правила вывода LK-0 — LK-15 дают нам (в некоторых
случаях) формальную возможность понять, следует формула χ из формулы ϕ, или нет (это не всегда
просто и даже не всегда можно выяснить, но довольно часто все-таки получается, и математика
строится на этом). Для этого надо сначала оформить наше намерение в виде секвенции

χ ⊢ ψ, (0.2.45)

а затем попытаться представить ее как результат применения какого-нибудь правила вывода из


LK-1 — LK-15, оформив это в виде картинки

Γ ′ ⊢ ∆′
χ⊢ψ
или
Γ ′ ⊢ ∆′ Γ ′′ ⊢ ∆′′
χ⊢ψ
где Γ ′ , Γ ′′ и ∆′ и ∆′′ – некие новые наборы формул. После этого нужно попробовать достроить эту
картинку, проделав то же самое с новыми секвенциями Γ ′ ⊢ ∆′ и Γ ′′ ⊢ ∆′′ , и так далее. Картинка
которая у нас будет всякий раз получаться, например, что-нибудь в таком духе,
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.46)
χ⊢ψ

— называется деревом Генцена. В нем секвенция в самом низу (здесь это χ ⊢ ψ) называется корнем,
а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и Γ ′′′′ ⊢ ∆′′′′ ) — вершинами.
Если (за конечное число шагов) нам удастся построить дерево Генцена, в котором на вершинах
стоят аксиомы исчисления LK, то есть секвенции вида LK-0,

ϕ ⊢ ϕ,

(где антецедент не отличается от сукцедента), то


— такое дерево Генцена называется выводом секвенции χ ⊢ ψ в исчислении секвенций LK,
— сама секвенция χ ⊢ ψ называется выводимой в исчислении секвенций LK, а
— про формулу ψ говорят, что она следует из формулы χ в исчислении секвенций LK.
Если же такой вывод построить невозможно (такое случается, см. ниже примеры на с.26), то
секвенция ϕ ⊢ χ называется невыводимой, а про формулу χ говорят, что она не следует из формулы
ϕ в исчислении секвенций LK.
Понятие следования удобно распространить на секвенции общего вида, с произвольным чис-
лом формул в акцеденте и сукцеденте, потому что если так сделать, то деревья Генцена (0.2.46)
можно будет рассматривать не полностью а фрагментами, сводя вопрос о выводимости корня дере-
ва к вопросу о выводимости предыдущих секвенций. Соответствующее определение с очевидными
изменениями повторяет то, что мы говорили про случай (0.2.45):
12 См. определение на с. 8.
§ 2. Логика предикатов для теории множеств 13

• Пусть
Γ ⊢ ∆, (0.2.47)
— произвольная секвенция (у которой антецедент и сукцедент состоят из произвольных
наборов формул).
1) Деревом Генцена для секвенции (0.2.47) называется произвольная запись вида
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
(0.2.48)
Γ ⊢∆
в которой в самом низу записана секвенция (0.2.47), и каждый переход снизу
вверх представляет собой применение одного из правил LK-0 — LK-15,
2) Если у какого-то дерева Генцена (0.2.48) на всех вершинах стоят аксиомы ис-
числения LK, то есть секвенции вида LK-0,

ϕ ⊢ ϕ,

(где антецедент не отличается от сукцедента), то такое дерево Генцена называ-


ется выводом для секвенции (0.2.47) в исчислении секвенций LK,
3) Секвенция (0.2.47) назвается выводимой в исчислении секвенций LK, если у нее
существует вывод.
4) Если секвенция Γ ⊢ χ (с единственной формулой в сукцеденте) выводима, то
говорят, что формула χ следует из набора формул Γ в исчислении секвенций
LK.
5) В частном случае если выводима секвенция ϕ ⊢ χ (с одной формулой в антеце-
денте и одной в сукцеденте), то говорят, что формула χ следует из формулы ϕ
в исчислении секвенций LK.

⋄ 0.2.4. Для секвенции Здесь на вершинах стоят аксиомы, поэтому это


дерево является выводом. То есть секвенция
α, α ⇒ β ⊢ β (0.2.49) (0.2.76) выводима. Опять это верно для любых
можно построить дерево Генцена формул α и β, поэтому если, например, вместо α
подставить формулу x ∈ x, а вместо β формулу
α⊢α β⊢β x ∈ y, мы получим выводимую секвенцию
(0.2.39)
α ⇒ β, α ⊢ β x ∈ x, x ∈ y ⊢ x ∈ x ⇒ x ∈ y.
(0.2.32) ⋄ 0.2.6. Для секвенции
α, α ⇒ β ⊢ β
⊢ ¬¬α ⇔ α (0.2.51)
На его вершинах стоят аксиомы, поэтому это
дерево является выводом. Значит, секвенция вывод содержит две ветви:
(0.2.49) выводима, причем независимо от того, α⊢α α⊢α
какие формулы языка теории множеств подста- (0.2.34) (0.2.34)
вишь вместо α и β. Подставив, например, вместо ⊢ α, ¬α ¬α, α ⊢
α формулу x ∈ x, а вместо β формулу ∃y x ∈ y, (0.2.34) (0.2.34)
мы получим выводимую секвенцию ¬¬α ⊢ α α ⊢ ¬¬α
(0.2.40) (0.2.40)
x ∈ x, x ∈ x ⇒ (∃y x ∈ y) ⊢ ∃y x ∈ y.
⊢ ¬¬α ⇒ α ⊢ α ⇒ ¬¬α
⋄ 0.2.5. Для секвенции (0.2.35)
⊢ (¬¬α ⇒ α) & (α ⇒ ¬¬α)
α, β ⊢ α ⇒ β (0.2.50) (0.2.24)
⊢ ¬¬α ⇔ α
дерево Генцена может быть таким:
Как и в предыдущих примерах, здесь под α по-
β⊢β нимается любая формула на языке теории мно-
(0.2.40)
жеств, например, можно подставить формулу
α, α, β ⊢ β ∃x x ∈ x, и мы получим выводимую секвенцию
(0.2.40)
α, β ⊢ α ⇒ β ⊢ ¬¬(∃x x ∈ x) ⇔ (∃x x ∈ x).
14 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Или, если подставить ее отрицание ∀x x ∈


/ x, по- вывод такой:
лучится также выводимая секвенция
γ⊢γ
(0.2.30)
α⊢α γ, β ⊢ γ, β γ, β ⊢ γ
⊢ ¬¬(∀x x ∈
/ x) ⇔ (∀x x ∈
/ x).
(0.2.30) (0.2.39)
α ⊢ α, γ β ⇒ γ, β ⊢ γ
(0.2.30) (0.2.32)
То же справедливо для всех остальных примеров
β ⇒ γ, α ⊢ α, γ β, β ⇒ γ ⊢ γ
ниже, и мы не будем дальше об этом напоминать.
(0.2.32) (0.2.30)
β ⇒ γ, α ⊢ γ, α α, β, β ⇒ γ ⊢ γ
(0.2.32) (0.2.32)
⋄ 0.2.7. Для секвенции α, β ⇒ γ ⊢ γ, α β, α, β ⇒ γ ⊢ γ
(0.2.39)
α ⇒ β, α, β ⇒ γ ⊢ γ
α&β⊢β &α (0.2.52) (0.2.32)
α, α ⇒ β, β ⇒ γ ⊢ γ
(0.2.32)
вывод может быть таким: α, β ⇒ γ, α ⇒ β ⊢ γ
(0.2.40)
β ⇒ γ, α ⇒ β ⊢ α ⇒ γ
β⊢β α⊢α (0.2.40)
(0.2.36) (0.2.36)
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ)
α&β⊢β α&β⊢α
(0.2.35) ⋄ 0.2.10. До сих пор секвенции, которые мы рас-
α&β⊢β &α сматривали, были выводимыми. Рассмотрим в
качестве контрпримера следующую секвенцию:

α ⊢ ¬α. (0.2.55)
⋄ 0.2.8. Для секвенции
Самое простое дерево Генцена, которое для нее
можно построить, выглядит так:
α ⇒ β ⊢ ¬β ⇒ ¬α (0.2.53) α, α ⊢
(0.2.34)
α ⊢ ¬α.
вывод может быть таким:
В нем секвенция на вершине,

α⊢α α, α ⊢
(0.2.30) – не аксиома, поэтому это дерево не будет выво-
¬β, α ⊢ α ¬β ⊢ ¬β дом.
(0.2.32) (0.2.30) Однако формально это не означает, что се-
α, ¬β ⊢ α ¬β ⊢ ¬β, ¬α квенция (0.2.55) невыводима в LK, потому что
(0.2.34) (0.2.32) для нее можно строить разные другие деревья,
¬β ⊢ α, ¬α ¬β ⊢ ¬α, ¬β например, такое:
(0.2.32) (0.2.34)
¬β ⊢ ¬α, α β, ¬β ⊢ ¬α α, α, α ⊢
(0.2.39) (0.2.31)
α ⇒ β, ¬β ⊢ ¬α α, α ⊢
(0.2.32) (0.2.34)
¬β, α ⇒ β ⊢ ¬α α ⊢ ¬α.
(0.2.40)
Или такое:
α ⇒ β ⊢ ¬β ⇒ ¬α
α⊢β β ⊢ ¬α
(0.2.33)
α ⊢ ¬α.
⋄ 0.2.9. Для секвенции
(где вместо β можно вставлять разные другие
формулы). Эти деревья также не будут вывода-
α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ) (0.2.54) ми (потому что на их вершинах снова стоят не
13 Атомарные формулы в теории множеств были определены на с.8.
§ 2. Логика предикатов для теории множеств 15

аксиомы), но, поскольку таких деревьев можно – и оно опять не будет выводом, потому что се-
получить бесконечно много, перебрать все вари- квенция на вершине
анты без специально разработанных для этого
технических средств не получится. α⊢α x=y
,α x=z
Забегая вперед, скажем, что для атомарных – не аксиома.
формул13 α секвенция (0.2.55) невыводима. Од- Как и в примере 0.2.10, мы здесь ограничим-
нако доказать это мы сможем только в конце это- ся заявлением, что для атомарных формул α со
го параграфа (см. ниже пример 0.2.38). свободной переменной x секвенция (0.2.61) невы-
⋄ 0.2.11. Для секвенции водима, но почему это так, мы покажем только
в конце этого параграфа (в примере 0.2.39).
∀x α ⊢ α (0.2.56) ⋄ 0.2.13. Для секвенции

вывод такой: α ⊢ ∃x α (0.2.58)


α⊢α вывод такой:
(0.2.41)
∀x α ⊢ α α⊢α
(0.2.44)
⋄ 0.2.12. Для секвенции, противоположной α ⊢ ∃x α
(0.2.56),
⋄ 0.2.14. Для секвенции, противоположной
α ⊢ ∀x α (0.2.57)
(0.2.58),
вывод построить не удается. Для построения де- ∃x α ⊢ α, (0.2.59)
рева Генцена выберем какую-нибудь перемен- вывод построить не удается (так же, как в приме-
ную, отличную от x и не входящие в формулу ре 0.2.12). Мы докажем, что эта секвенция невы-
α. Пусть такой переменной будет y. Тогда дере- водима для атомарных формул α со свободной
во Генцена может быть таким: переменной x в примере 0.2.40.
α⊢α x=y ⋄ 0.2.15. Для секвенции
(0.2.42)
α ⊢ ∀x α ∀x α ⊢ ∃x α (0.2.60)

вывод такой:
Как и в примере (0.2.10), здесь секвенция, стоя-
щая на вершине α⊢α
(0.2.44)
α⊢α x=y α ⊢ ∃x α
(0.2.41)
— не аксиома. Поэтому такое дерево не будет вы- ∀x α ⊢ ∃x α
водом для (0.2.57).
Но опять, как и в примере (0.2.10), из это- ⋄ 0.2.16. Для противоположной секвенции
го формально не следует, что секвенция (0.2.57)
невыводима, потому что дерево вывода для нее ∃x α ⊢ ∀x α (0.2.61)
можно строить по-разному, и таких вариантов вывод построить не удается. Для построения де-
имеется бесконечно много из-за неоднозначно- рева Генцена выберем какие-нибудь две перемен-
сти при движении вверх в правилах сокращения ные, отличные от x и не входящие в формулу α.
(0.2.31) и сечения (0.2.33). Скажем, если приме- Пусть такими переменными будут a и b. Тогда
нить правило сокращения LK-2 в самом начале дерево Генцена может быть таким:
(и выбрать больше переменных, отличных от x
и не входящих в α, например, пусть такими пере- α x=a
⊢α x=b
менными будут y и z), то можно получить дерево (0.2.42)
α x=a
⊢ ∀x α
α⊢α x=y
,α x=z (0.2.43)
(0.2.42) ∃x α ⊢ ∀x α
α⊢α x=y
, ∀x α
(0.2.32)
Как и в примере (0.2.10), здесь секвенция, стоя-
α ⊢ ∀x α, α щая на вершине
x=y
(0.2.42) α x=a
⊢α x=b
α ⊢ ∀x α, ∀x α
(0.2.31) — не аксиома. Поэтому такое дерево не будет вы-
α ⊢ ∀x α водом для (0.2.61).
16 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Но опять, как и в примере (0.2.10), из это- Пусть опять это будут a и b. Тогда вывод может
го формально не следует, что секвенция (0.2.61) быть таким:
невыводима, потому что дерево вывода для нее α|x=a,y=b ⊢ α|x=a,y=b
можно строить по-разному, и таких вариантов (0.2.44)
имеется бесконечно много из-за неоднозначно- α|x=a,y=b ⊢ ∃x α|y=b
сти при движении вверх в правилах сокращения (0.2.44)
(0.2.31) и сечения (0.2.33). Скажем, если приме- α|x=a,y=b ⊢ ∃y ∃x α
нить правило сокращения LK-2 в самом начале (и (0.2.43)
выбрать больше переменных, отличных от x и не ∃y α|x=a ⊢ ∃y ∃x α
входящих в α, например, пусть такими перемен- (0.2.43)
ными будут a, b, c), то можно получить дерево ∃x ∃y α ⊢ ∃y ∃x α
α x=a
,α x=b
⊢α x=c
⋄ 0.2.19. Тот же прием позволяет доказать вы-
(0.2.42) водимость секвенции
α x=a
,α x=b
⊢ ∀x α ∃x ∀y α ⊢ ∀y ∃x α, (0.2.64)
(0.2.43)
∃x α, α ⊢ ∀x α Пусть опять a и b – переменные, отличные от x
x=b
(0.2.32) и y, и не входящие в формулу α. Тогда вывод
α , ∃x α ⊢ ∀x α может быть таким:
x=b
(0.2.43) α|x=a,y=b ⊢ α|x=a,y=b
∃x α, ∃x α ⊢ ∀x α (0.2.44)
(0.2.31) α|x=a,y=b ⊢ ∃x α|y=b
∃x α ⊢ ∀x α (0.2.41)
∀y α|x=a ⊢ ∃x α|y=b
– и оно опять не будет выводом, потому что се- (0.2.42)
квенция на вершине ∀y α|x=a ⊢ ∀y ∃x α
(0.2.43)
α ,α ⊢α
x=a x=b x=c ∃x ∀y α ⊢ ∀y ∃x α
– не аксиома. ⋄ 0.2.20. Для секвенции, противоположной
Как и в примере 0.2.10, мы здесь ограничим- (0.2.64),
ся заявлением, что для атомарных формул α со ∀x ∃y α ⊢ ∃y ∀x α, (0.2.65)
свободной переменной x секвенция (0.2.61) невы-
вывод построить не получается. В качестве при-
водима, но почему это так мы покажем только в
мера дерево Генцена можно построить так. Вы-
конце этого параграфа (в примере 0.2.41).
берем четыре переменных, отличных от x и y, и
⋄ 0.2.17. Чтобы доказать выводимость секвен- не входящих в формулу α. Пусть это будут a, b,
ции c, d. Тогда дерево Генцена может быть таким:
∀x ∀y α ⊢ ∀y ∀x α (0.2.62) α|x=a,y=c ⊢ α|x=d,y=b
нужно выбрать какие-нибудь две переменные, (0.2.42)

отличные от x и y, и не входящие в формулу α. α|x=a,y=c ⊢ ∀x α|y=b


Пусть это будут a и b. Тогда вывод может быть (0.2.43)

таким: ∃y α|x=a ⊢ ∀x α|y=b


(0.2.44)
α|x=a,y=b ⊢ α|x=a,y=b ∃y α|x=a ⊢ ∃y ∀x α
(0.2.41) (0.2.41)
∀y α|x=a ⊢ α|x=a,y=b ∀x ∃y α ⊢ ∃y ∀x α
(0.2.41)
∀x ∀y α ⊢ α|x=a,y=b Снова, как и в примерах 0.2.10 и 0.2.61, мы ска-
(0.2.42)
жем здесь, что секвенция (0.2.65) невыводима,
∀x ∀y α ⊢ ∀x α|y=b пообещав доказать это потом.
(0.2.42) ⋄ 0.2.21. Для секвенции
∀x ∀y α ⊢ ∀y ∀x α
∀x ∀y α ⊢ ∀y ∀x α (0.2.66)
⋄ 0.2.18. Точно так же чтобы доказать выводи- вывод такой:
мость секвенции
α⊢α
∃x ∃y α ⊢ ∃y ∃x α, (0.2.63) (0.2.44)
α ⊢ ∃x α
нужно выбрать какие-нибудь две переменные, (0.2.41)
отличные от x и y, и не входящие в формулу α. ∀x α ⊢ ∃x α
§ 2. Логика предикатов для теории множеств 17

⋄ 0.2.22. Для секвенции Однако из перечисленных потом формальных


правил LK-0—LK-15 пока не видно, почему это
(∀x α) & (∀x β) ⊢ ∀x (α & β) (0.2.67) должно быть так. Мы это объясним в приводи-
мых ниже теоремах 0.2.1 и 0.2.2.
вывод такой:
Нам будет полезен здесь следующий пример.
α&β⊢α&β ⋄ 0.2.25. Выводимы следующие секвенции:
(0.2.41)
(∀x α) & (∀x β) ⊢ α & β α, β ⊢ α & β, (0.2.69)
(0.2.42) α ∨ β ⊢ α, β. (0.2.70)
(∀x α) & (∀x β) ⊢ ∀x (α & β)
Доказательство. 1. Вывод для (0.2.69) выгля-
И точно так же выводится секвенция дит так:

∀x (α & β) ⊢ (∀x α) & (∀x β) (0.2.68) α⊢α


(0.2.30)
⊲⊲ 0.2.23. Докажите выводимость секвенций в β, α ⊢ α β⊢β
LK: (0.2.32) (0.2.30)
α, β ⊢ α α, β ⊢ α
¬∃x α ⊢ ¬∀x α (0.2.35)
∀x (α ⇒ ¬β) ⊢ ¬(∃x α & ∀x β) α, β ⊢ α & β
∀x (α ⇒ ¬β) ⊢ ¬(∃x α & ∃x β) 2. А для (0.2.70) вывод такой:
Отметим следующее условное утверждение. β⊢β
(0.2.30)
⋄ 0.2.24. Если выводимы секвенции
α⊢α β ⊢ β, α
α ⊢ α′ β ⊢ β′, (0.2.30) (0.2.32)
α ⊢ α, β β ⊢ α, β
то выводимы и секвенции (0.2.37)
α ∨ β ⊢ α, β
α & β ⊢ α′ & β ′ α ∨ β ⊢ α′ ∨ β ′ .

Доказательство. Первое утверждение стано-


вится очевидным, если поглядеть на дерево Теперь теорема, объясняющая, почему анте-
цедент можно понимать как конъюнкцию:
α ⊢ α′ β ⊢ β′
Теорема 0.2.1. Пусть Γ — конечный набор
(0.2.36) (0.2.36)
′ ′ формул в LK и γ — конъюнкция этих формул.
α&β⊢α α&β⊢β
Тогда для формулы ∆ следующие условия экви-
(0.2.35)
валентны:
α & β ⊢ α′ & β ′
(i) ∆ следует из Γ в LK,
Если секвенции на вершинах выводимы, то к ним (ii) ∆ следует из γ в LK.
можно пририсовать сверху их выводы, и мы по-
лучим, что все дерево является выводом для се- Доказательство. Здесь достаточно рассмотреть
квенции в корне. Для второй секвенции нужно случай, когда Γ состоит из двух формул α и
рассмотреть дерево β, потому что общий случай рассматривается по
аналогии.
α ⊢ α′ β ⊢ β′ 1. Предположим, что ∆ следует из набора
(0.2.38) (0.2.38) α, β, то есть выводима секвенция
α ⊢ α′ ∨ β ′ β ⊢ α′ ∨ β ′
(0.2.37) α, β ⊢ ∆.
′ ′
α∨β ⊢α ∨β
Тогда ее вывод можно подклеить сверху к дереву
α, β ⊢ ∆
(0.2.36)
Почему антецедент можно понимать как α & β, β ⊢ ∆
конъюнкцию, а сукцедент как дизъюнк- (0.2.32)
цию входящих в них формул. Когда на β, α & β ⊢ ∆
странице 9 мы вводили понятие секвенции, мы (0.2.36)
сказали там, между прочим, что ее антецедент α & β, α & β ⊢ ∆
нужно понимать как конъюнкцию входящих в (0.2.31)
него формул, а сукцедент — как дизъюнкцию. α&β⊢∆
18 Глава 0. ТЕОРИЯ МНОЖЕСТВ

и мы получим вывод секвенции Тогда ее вывод можно подклеить сверху к левой


вершине дерева
α&β⊢∆
Γ ⊢ α∨β α ∨ β ⊢ α, β
означающий, что ∆ следует из формулы α & β. (0.2.33)
2. Наоборот, пусть ∆ следует из формулы Γ ⊢ α, β
α & β, то есть выводима секвенция
а вывод формулы (0.2.70) – к его правой вер-
α&β⊢∆ шине, и мы получим вывод секвенции

Тогда ее вывод можно подклеить сверху к пра- Γ ⊢ α, β,


вой вершине дерева означающий, что набор формул α, β следует из
Γ.
α, β ⊢ α & β α&β⊢∆
(0.2.33) Рассмотрим несколько иллюстравций.
α, β ⊢ ∆
⋄ 0.2.26. Закон исключенного третьего в ис-
а вывод формулы (0.2.69) – к левой его вершине, числении LK можно понимать как утверждение
и мы получим вывод секвенции о выводимости секвенции
⊢ α ∨ ¬α. (0.2.71)
α, β ⊢ ∆,
Это в свою очередь означает, что (какой бы ни
означающий, что ∆ следует из набора формул была формула α) формула α ∨ ¬α следует из пу-
α, β. стого набора посылок, а значит, из любого на-
И вторая теорема, объясняющая, почему сук- бора посылок, потому что в силу правила LK-
цедент можно понимать как дизъюнкцию: 1, в посылки (антецедент) можно добавлять что
угодно:
Теорема 0.2.2. Пусть ∆ — конечный набор
⊢ α ∨ ¬α
формул в LK и δ — дизъюнкция этих формул.
(0.2.30)
Тогда для набора формул Γ следующие условия
β ⊢ α ∨ ¬α.
эквивалентны:
(i) ∆ следует из Γ в LK, По теореме 0.2.2 выводимость секвенции
(0.2.71) эквивалентна выводимости секвенции
(ii) δ следует из Γ в LK.
⊢ α, ¬α. (0.2.72)
Доказательство. Здесь достаточно рассмотреть
случай, когда ∆ состоит из двух формул α и Простейший вывод для нее выглядит так:
β, потому что общий случай рассматривается по α⊢α
аналогии. (0.2.34)
1. Предположим, что из Γ следует набор α, β, ⊢ α, ¬α
то есть выводима секвенция
Таким образом, секвенция (0.2.71) тоже вы-
Γ ⊢ α, β. водима. И, как мы уже говорили, это не зависит
от того, какую формулу языка теории множеств
Тогда ее вывод можно подклеить сверху к дереву подставишь вместо α. Например, подставив вме-
Γ ⊢ α, β сто α формулу x ∈ y, мы получим выводимую
(0.2.38)
секвенцию
Γ ⊢ α, α ∨ β ⊢ (x ∈ y) ∨ ¬(x ∈ y).
(0.2.32)
Γ ⊢ α ∨ β, α Или, если подставить x = y, то получится
(0.2.38) ⊢ (x = y) ∨ ¬(x = y).
Γ ⊢ α ∨ β, α ∨ β
Понятно, что формулы можно подставлять ка-
(0.2.31)
кие угодно сложные, и все равно будут получать-
Γ ⊢ α∨β
ся выводимые секвенции:
и мы получим вывод секвенции
⊢ ((x = y & ¬(x = z)) ∨ (z = y))∨
Γ ⊢ α ∨ β,
∨ ¬((x = y & ¬(x = z)) ∨ (z = y)),
означающий, что α ∨ β следует из формул Γ .
2. Наоборот, пусть α ∨ β следует из формул ⊢ ((x ∈ y & y ∈ z) ⇒ (x ∈ z))∨
Γ , то есть выводима секвенция ∨ ¬((x ∈ y & y ∈ z) ⇒ (x ∈ z)),
Γ ⊢ α ∨ β. и так далее.
§ 2. Логика предикатов для теории множеств 19

⋄ 0.2.27. Рассмотрим секвенцию, симметричную ⋄ 0.2.28. Покажем, что выводимы секвенции


(0.2.71):
α&¬α ⊢ . (0.2.73) α ⊢ ¬(¬α), ¬(¬α) ⊢ α (0.2.75)
Ее выводимость означает, что (какой бы ни бы-
ла формула α) из формулы α&¬α всегда следует Первая из них выводится деревом
пустой набор следствий, а значит, любое вообще
следствие, потому что по правилу LK-1 в сукце- ¬α, α ⊢
дент можно добавлять что угодно: (0.2.34)
α ⊢ ¬(¬α).
α&¬α ⊢
(0.2.30)
в котором вершина выводима, поскольку, как мы
α&¬α ⊢ β
уже поняли, выводима секвенция (0.2.74). А вто-
По теореме 0.2.1, выводимость секвенции рая — деревом
(0.2.73) эквивалентна выводимость секвенции
⊢ α, ¬α
α, ¬α ⊢ . (0.2.74)
(0.2.34)
Для нее простейший вывод выглядит так: ¬(¬α) ⊢ α.
α⊢α
в котором вершина выводима, поскольку выво-
(0.2.34)
дима секвенция (0.2.72).
¬α, α ⊢
(0.2.32)
α, ¬α ⊢ ⋄ 0.2.29. Отметим, что секвенция (0.2.76)

Значит, секвенция (0.2.73) тоже выводима. Это α, β ⊢ α ⇒ β


не зависит от того, какую формулу языка тео-
рии множеств подставишь вместо α, например, выведенная нами выше, означает по теореме
можно подставить формулу ∃x x ∈ x, мы полу- 0.2.1, что выводима и секвенция
чим выводимую секвенцию
∃x x ∈ x, ¬(∃x x ∈ x) ⊢ . α & β ⊢ α ⇒ β. (0.2.76)

Выводимые формулы в LK.


• Говорят, что формула α выводима в LK, или что α является теоремой теории LK, если в LK
выводима секвенция
⊢ α.
Теорема 0.2.3. В LK формула χ следует из формулы ϕ,

ϕ ⊢ χ,

тогда и только тогда, когда выводима формула

ϕ ⇒ χ.

Доказательство. В прямую сторону это следует из правила LK-11:

ϕ⊢χ
(0.2.40)
⊢ ϕ ⇒ χ.

Это дерево Генцена надо понимать так, что если у его вершины — секвенции ϕ ⊢ χ — есть вывод,
то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом для
секвенции ⊢ ϕ ⇒ χ, а это и означает выводимость формулы ϕ ⇒ χ.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.49):

ϕ, ϕ ⇒ χ ⊢ χ
(0.2.32)
⊢ϕ⇒χ ϕ ⇒ χ, ϕ ⊢ χ
(0.2.33)
ϕ⊢χ
20 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Опять это дерево надо понимать так, что если у его левой вершины — секвенции ⊢ ϕ ⇒ χ —
есть вывод (что эквивалентно выводимости формулы ϕ ⇒ χ), то его можно пристроить к этой
вершине сверху, затем к правой вершине — секвенции ϕ, ϕ ⇒ χ ⊢ χ — нужно будет присторить ее
вывод, который мы получили на с.13, и мы в результате получим дерево, являющееся выводом для
секвенции ϕ ⊢ χ.

⊲ 0.2.30. Докажите выводимость формулы 14


⊲⊲ 0.2.33. Докажите выводимость формул в LK
в предположении, что β не содержит переменной
(α ⇒ β) ⇔ (¬α ∨ β) (0.2.77) x:

⊲⊲ 0.2.31. Докажите выводимость формул в LK:

(α & β) & γ ⇔ α & (β & γ)


(α ∨ β) ∨ γ ⇔ α ∨ (β ∨ γ)
¬∀x α ⇔ ∃x ¬α
α&β ⇔ β&α
¬∃x α ⇔ ∀x ¬α
α∨β ⇔β ∨α
((∀x α) & β) ⇔ ∀x (α & β)
α & (β ∨ γ) ⇔ (α & β) ∨ (α & γ)
β & (∀x α) ⇔ ∀x (β & α)
α ∨ (β & γ) ⇔ (α ∨ β) & (α ∨ γ)
((∃x α) & β) ⇔ ∃x (α & β)
α&α ⇔ α
β & (∃x α) ⇔ ∃x (β & α)
α∨α ⇔α
((∀x α) ∨ β) ⇔ ∀x (α ∨ β)
α & (α ∨ β) ⇔ α
β ∨ (∀x α) ⇔ ∀x (β ∨ α)
α ∨ (α & β) ⇔ α
((∃x α) ∨ β) ⇔ ∃x (α ∨ β)
(α ⇒ β) ⇔ ¬(α & ¬β)
β ∨ (∃x α) ⇔ ∃x (β ∨ α)
(α & β) ⇔ ¬(α ⇒ ¬β)
((∀x α) ⇒ β) ⇔ ∀x (α ⇒ β)
(α ∨ β) ⇔ (¬α ⇒ β)
β ⇒ (∀x α) ⇔ ∀x (β ⇒ α)
α ⇒ (β ⇒ α)
((∃x α) ⇒ β) ⇔ ∃x (α ⇒ β)
(α ⇒ (β ⇒ γ)) ⇒ ((α ⇒ β) ⇒ (α ⇒ γ))
β ⇒ (∃x α) ⇔ ∃x (β ⇒ α)
⊲⊲ 0.2.32. Докажите выводимость формул в LK: ((∀x α) & (∀x γ)) ⇔ ∀x (α ⇒ γ)
(α & β) ⇒ α ((∃x α) ∨ (∃x γ)) ⇔ ∃x (α ∨ γ)
(α & β) ⇒ β ∀y β ⇔ ∀x β|y=x
α ⇒ (β ⇒ (α ⇒ β)) ∃y β ⇔ ∃x β|y=x
α ⇒ (α ∨ β) ∀x β ⇔ β
β ⇒ (α ∨ β) ∃x β ⇔ β
(α ⇒ γ) ⇒ ((β ⇒ γ) ⇒ ((α ∨ β) ⇒ γ))
(¬α) ⇒ (α ⇒ β)
(α ⇒ β) ⇒ ((α ⇒ (¬β)) ⇒ (¬α))
14 Вывод для формулы (0.2.77):
α⊢α
(0.2.30)
α⊢α α ⊢ β, α β⊢β
(0.2.34) (0.2.34) (0.2.30)
⊢ α, ¬α ¬α, α ⊢ β β, α ⊢ β
(0.2.38) (0.2.37)
⊢ α, ¬α ∨ β β⊢β ¬α ∨ β, α ⊢ β
(0.2.32) (0.2.38) (0.2.32)
⊢ ¬α ∨ β, α β ⊢ ¬α ∨ β α, ¬α ∨ β ⊢ β
(0.2.39) (0.2.40)
α ⇒ β ⊢ ¬α ∨ β ¬α ∨ β ⊢ α ⇒ β
(0.2.40) (0.2.40)
⊢ (α ⇒ β) ⇒ (¬α ∨ β) ⊢ (¬α ∨ β) ⇒ (α ⇒ β)
  (0.2.35)
⊢ (α ⇒ β) ⇒ (¬α ∨ β) & (¬α ∨ β) ⇒ (α ⇒ β)
(0.2.24)
⊢ (α ⇒ β) ⇔ (¬α ∨ β)
§ 2. Логика предикатов для теории множеств 21

⊲ 0.2.34. Докажите выводимость формулы 15

¬(α ∨ β) ⇔ (¬α &¬β) (0.2.78)

Отношение выводимости между формулами в LK. Понятие выводимой формулы, описанное


на с.19, имеет важное обобщение, о котором мы сейчас поговорим.
• Говорят, что формула ω выводима из набора формул Σ в LK, если существует дерево Генцена, в
котором в корне стоит секвенция ⊢ ω, а на вершинах либо секвенции ⊢ σ, где σ — формулы из
Σ, либо аксиомы теории LK (то есть секвенции вида α ⊢ α):
α⊢α ⊢σ
... ...
. (0.2.79)
⊢ω
• В частном случае, если Σ состоит из одной формулы, α, говорят, что формула ω выводима из
формулы α в LK.
• В другом частном случае, если Σ совсем не содержит формул, мы получаем определение фор-
мулы ω выводимой в LK, данное на с.19.

⋄ 0.2.35. Для любых двух формул α и β из фор- Здесь видно, что если выводима формула α&β,
мулы α&β выводятся и α, и β. то есть секвенция ⊢ α&β, то ее вывод можно при-
Рассмотрим дерево клеить к левой вершине этого дерева, и мы по-
α⊢α лучим вывод для секвенции ⊢ α. Для формулы
(0.2.36)
β нужно построить похожее дерево.
⊢ α&β α&β ⊢ α
(0.2.33)
⊢α

15 Вывод для формулы (0.2.78):


β⊢β
(0.2.32)
α⊢α β ⊢ β, α
(0.2.30) (0.2.32)
α ⊢ α, β β ⊢ α, β
(0.2.37)
α ∨ β ⊢ α, β
(0.2.34)
⊢ α, β, ¬(α ∨ β)
(0.2.32)
⊢ α, ¬(α ∨ β), β
(0.2.32)
⊢ ¬(α ∨ β), α, β
(0.2.34)
α⊢α β⊢β ¬β ⊢ ¬(α ∨ β), α
(0.2.38) (0.2.38) (0.2.34)
α ⊢ α∨β β ⊢α∨β ¬α, ¬β ⊢ ¬(α ∨ β)
(0.2.34) (0.2.34) (0.2.36)
¬(α ∨ β), α ⊢ ¬(α ∨ β), β ⊢ ¬α &¬β, ¬β ⊢ ¬(α ∨ β)
(0.2.32) (0.2.32) (0.2.32)
α, ¬(α ∨ β) ⊢ β, ¬(α ∨ β) ⊢ ¬β, ¬α &¬β ⊢ ¬(α ∨ β)
(0.2.34) (0.2.34) (0.2.36)
¬(α ∨ β) ⊢ ¬α ¬(α ∨ β) ⊢ ¬β ¬α &¬β, ¬α &¬β ⊢ ¬(α ∨ β)
(0.2.39) (0.2.31)
¬(α ∨ β) ⊢ ¬α &¬β ¬α &¬β ⊢ ¬(α ∨ β)
(0.2.40) (0.2.40)
⊢ ¬(α ∨ β) ⇒ (¬α &¬β) ⊢ (¬α &¬β) ⇒ ¬(α ∨ β)
  (0.2.35)
⊢ ¬(α ∨ β) ⇒ (¬α &¬β) & (¬α &¬β) ⇒ ¬(α ∨ β)
(0.2.24)
⊢ ¬(α ∨ β) ⇔ (¬α &¬β)
22 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Предложение 0.2.4. В LK формулы α и ∀x α выводятся друг из друга.

Доказательство. 1. Дерево Генцена

⊢α
(0.2.42) (0.2.80)
⊢ ∀x α

показывает, что формула ∀x α выводится из α.


2. Рассмотрим дерево
⊢ ∀x α ∀x α ⊢ α
(0.2.33) (0.2.81)
⊢α
Вспомним, что выше в примере 0.2.11 мы уже доказали, что правая вершина этого дерева выводима:

∀x α ⊢ α (0.2.82)

Если этот вывод из примера 0.2.11 приклеить к правой вершине дерева (0.2.81), то мы получим
дерево вида (0.2.79), означающее, что формула α выводится из формулы ∀x α.

Следующая лемма представляет собой аналог теоремы 0.2.1 для отношения выводимости фор-
мул:

Лемма 0.2.5. Пусть Σ — конечный набор формул в LK и σ — конъюнкция этих формул. Тогда
для формулы ω следующие условия эквивалентны:
(i) ω выводится из Σ в LK,
(ii) ω выводится из σ в LK.

Доказательство. Пусть для начала Σ состоит из двух формул: α и β. Тогда σ есть просто конъ-
юнкция α&β.
1. Рассмотрим дерево
⊢α ⊢β
(0.2.35)
⊢ α&β

⊢ω
Если ω выводима из σ то есть из α&β, то, поскольку α&β выводима из α и β, то есть из Σ, мы
получаем, что ω выводима из Σ.
2. Для доказательства обратного рассмотрим дерево

⊢ α&β ⊢ α&β

⊢α ⊢β
(0.2.35)
⊢ω

В нем верхние две ветви мы можем считать деревьями Генцена в силу примера 0.2.35. Поэтому если
последний переход — тоже дерево Генцена, то есть если ω выводится из α и β (или, иными словами,
из Σ), то ω должна выводиться и из α&β, то есть из σ.
Общий случай (с произвольным числом формул в Σ) рассматривается аналогично.

Напомним, что на странице 13 мы определили отношение следования из набора формул. Следую-


щая теорема показывает, что в случае, если формулы в посылке замкнуты, это отношение совпадает
с отношением выводимости. (Однако, если этого условия нет, то эти два понятия не совпадают, и
ниже мы покажем это в примере 0.2.42.)

Теорема 0.2.6 (о дедукции для LK). Пусть ω – формула и Σ — конечный набор формул в LK.
Рассмотрим два условия:
(a) ω следует из Σ в LK,
(b) ω выводится из Σ в LK.
§ 2. Логика предикатов для теории множеств 23

Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).
Доказательство. Пусть σ — конъюнкция формул из Σ. По лемме 0.2.5 выводимость из Σ эквива-
лентна выводимости из σ, поэтому всюду мы можем заменить Σ на σ.
1. Рассмотрим дерево
⊢σ σ⊢ω
(0.2.33) (0.2.83)
⊢ω
Если ω следует из σ, то есть выводима секвенция σ ⊢ ω, то ее вывод можно подклеить к правой
вершине этого дерева, и тогда если вдобавок выводима секвенция ⊢ σ, то, подклеив ее вывод к
левой вершине, мы получим вывод для секвенции ⊢ ω. Это доказывает, что из (a) следует (b).
2. Предположим теперь, что формулы Σ замкнуты. Тогда их конъюнкция σ тоже замкнута.
Покажем, что в этом случае из (b) следует (a). Если выполнется (b), то есть ω выводится из σ, то
это означает, что существует некое дерево Генцена,
α⊢α ⊢σ
... ...
⊢ω
у которого в корне записана секвенция ⊢ ω, а на вершинах стоят либо секвенции вида α ⊢ α,
либо секвенция ⊢ σ. Впишем в каждый антецедент этого дерева формулу σ как дополнительную
формулу:
σ,α⊢α σ⊢σ
... ...
(0.2.84)
σ⊢ω
и покажем, что полученная картинка может быть дополнена до дерева Генцена с теми же вершинами
и корнем.
Для этого нужно проверить, что если в правилах LK-1 — LK-15 всюду в антецеденты вписать
формулу σ, то все они дополняются до деревьев Генцена с теми же вершинами и корнем. Для правил
LK-1 — LK-12, LK-15 это верно без требования, чтобы формула σ была замкнутой: если, например,
в левое правило LK-1 вписать таким образом σ, то мы получим картинку
σ, Γ ⊢ ∆
, (0.2.85)
σ, ϕ, Γ ⊢ ∆
которую можно дополнить до картинки

σ, Γ ⊢ ∆
(0.2.30)
ϕ, σ, Γ ⊢ ∆,
(0.2.32)
σ, ϕ, Γ ⊢ ∆,

а она будет деревом Генцена с теми же, что у (0.2.85) вершиной и корнем. Точно так же, например,
если в правиле LK-12 вписать в антецедент формулы σ,

σ, ϕ x=y
,Γ ⊢ ∆
, (0.2.86)
σ, ∀x ϕ, Γ ⊢ ∆
то эту картинку можно дополнить до картинки

σ, ϕ x=y
,Γ ⊢ ∆
(0.2.32)
ϕ x=y
, σ, Γ ⊢ ∆,
(0.2.41)
∀x ϕ, σ, Γ ⊢ ∆,
(0.2.32)
σ, ∀x ϕ, Γ ⊢ ∆,

а она будет деревом Генцена с теми же, что у (0.2.86) вершиной и корнем.
24 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Так будет со всеми правилами LK-1 — LK-12, LK-15, но когда мы дойдем до правил LK-13 и LK-14
нам понадобится все-таки требование, что все формулы σ — замкнутые. Например, если дополнить
правило LK-13
Γ ⊢ ∆, ϕ x=y
(0.2.87)
Γ ⊢ ∆, ∀x ϕ
как раньше, в антецедентах, формулой σ, то полученную картинку

σ, Γ ⊢ ∆, ϕ x=y
(0.2.88)
σ, Γ ⊢ ∆, ∀x ϕ

можно будет считать частным случаем правила LK-13 только если выполнено ограничение на пере-
менную y в этом правиле: нужно, чтобы y не входил как свободная переменная в нижнюю секвен-
цию. Это условие будет выполнено, потому что в (0.2.87) y не входил как свободная переменная в
нижнюю секвенцию, а в σ он не входит, потому что σ — замкнутая формула.
И то же самое с правилом LK-14. Это доказывает, что картинку (0.2.84) можно дополнить до
дерева Генцена с теми же вершинами и корнем. Теперь заметим, что там, где на вершинах стоят
секвенции σ, α ⊢ α, их можно продолжить вверх по правилу LK-1,

Γ ⊢∆
σ, Γ ⊢ ∆
и мы получим дерево Генцена
α⊢α
σ,α⊢α σ⊢σ
... ...
,
σ⊢ω
у которого все вершины — аксиомы теории LK-1, а корень — секвенция σ ⊢ ω. Иными словами, это
вывод секвенции σ ⊢ ω.

(c) Другие аксиоматизации логики предикатов


Гильбертовское исчисление предикатов CQC. Как мы говорили выше, помимо исчисления
секвенций LK, предложенного Генценом для описания логики предикатов, в математике часто ис-
пользуется другая система, CQC (“Classical quantificational calculus”), называемая исчислением пре-
дикатов, построенная Гильбертом и решающая ту же задачу. Эти системы описывают одну и ту
же логику, поэтому эквивалентны. Мы не будем доказывать их эквивалентность, а просто опишем
здесь систему Гильберта, чтобы читатель мог составить себе представление о ней.
Система CQC также состоит из аксиом и правил вывода. Но, в отличие от LK, в CQC аксиом
много, а правил вывода мало. Еще одно отличие – что в CQC не используется символ секвенции ⊢
(потому что считается, что выводиться должны не формулы из формул, то есть не секвенции ϕ ⊢ χ,
а прямо сами формулы ϕ ⇒ χ).
• Аксиомами исчисление предикатов называются формулы следующих трех типов.
1) Формулы, называемые аксиомами исчисления высказываний16 :

CQC − 1 : ϕ ⇒ (χ ⇒ ϕ) (0.2.89)
CQC − 2 : (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (0.2.90)
CQC − 3 : (ϕ & χ) ⇒ ϕ (0.2.91)
CQC − 4 : (ϕ & χ) ⇒ χ (0.2.92)
CQC − 5 : ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (0.2.93)
CQC − 6 : ϕ ⇒ (ϕ ∨ χ) (0.2.94)
CQC − 7 : χ ⇒ (ϕ ∨ χ) (0.2.95)
CQC − 8 : (ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (0.2.96)
CQC − 9 : (¬ϕ) ⇒ (ϕ ⇒ χ) (0.2.97)
CQC − 10 : (ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (0.2.98)
CQC − 11 : ϕ ∨ (¬ϕ) (0.2.99)
16 Читательможет обратить внимание, что выводимость формул CQC-1—CQC-10 в LK предлагалась в качестве
упражнения в задачах 0.2.32, а CQC-11 была выведена в LK в (0.2.72).
§ 2. Логика предикатов для теории множеств 25

2) Формулы, называемые кванторными аксиомами исчисления предикатов:


— если X – переменная в формуле ϕ, то для любой переменной Y , не содержащейся в ϕ

CQC − 12 : (∀X ϕ) ⇒ ϕ X=Y


(0.2.100)
CQC − 13 : ϕ X=Y
⇒ (∃X ϕ) (0.2.101)

— если ϕ и ψ – формулы, а X – переменная, не являющаяся свободной для ψ, то

CQC − 14 : (∀X (ϕ ⇒ ψ)) ⇒ ((∃X ϕ) ⇒ ψ)) (0.2.102)


CQC − 15 : (∀X (ψ ⇒ ϕ)) ⇒ (ψ ⇒ (∀X ϕ)) (0.2.103)

• Правилами вывода в исчислении предикатов называются следующие два правила:


modus ponens: если выводимы формулы ϕ и ϕ ⇒ ψ, то выводима формула ψ; это изображается
дробью
ϕ, ϕ ⇒ ψ
(0.2.104)
ψ
generalisation: если выводима формула ϕ, то выводима формула ∀X ϕ; это изображается дробью
ϕ
(0.2.105)
∀X ϕ

Вывод в CQC обычно выглядит не так нагляд- становки (чтобы зритель понимал, как из дан-
но, как в LK, потому что его принято представ- ной аксиомы получилась нужная нам формула).
лять не деревом, а линией (или, правильнее ска- Главное же неудобство здесь в том, что вообще
зать, деревом с одной веткой). Мы нарушим эту сообразить, как строить вывод в CQC существен-
традицию и покажем, как будет выглядеть эта но труднее, чем в LK.
картина, если ее перевести на язык деревьев Ген-
цена (с очевидной поправкой, что при переводе ⊲ 0.2.36. Покажите, что следующая секвенция
символ ⊢ должен исчезнуть). Как может заме- выводима в CQC:17
тить читатель, в CQC, из-за громоздкости акси-
α⇒α (0.2.106)
ом, деревья вывода получаются более сложны-
ми, чем в LK (по этой причине мы выносим их в ⊲ 0.2.37. Докажите выводимость в CQC секвен-
подстрочные примечания). Кроме того, при дви- ции18
жении от аксиом вниз приходится уточнять под- (α ⇒ β) ⇒ (α ⇒ α) (0.2.107)

17 Для секвенции (0.2.106) выводом может быть дерево

ϕ ⇒ (χ ⇒ ϕ) (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ))


ϕ=α
ϕ=α
χ = (α ⇒ α)
χ = (α ⇒ α)
ψ=α
ϕ ⇒ (χ ⇒ ϕ) α ⇒ ((α ⇒ α) ⇒ α), (α ⇒ ((α ⇒ α) ⇒ α)) ⇒ (α ⇒ (α ⇒ α)) ⇒ (α ⇒ α)
ϕ=α
(1.2.129)
χ=α
α ⇒ (α ⇒ α), (α ⇒ (α ⇒ α)) ⇒ (α ⇒ α)
(1.2.129)
α⇒α

Здесь на вершинах ветвей находятся аксиомы PC-1 и PC-2, и при движении вниз входящие в них формулы заменяются
на формулы α или α ⇒ α, там указано как.
18 Для секвенции (0.2.107) выводом может быть дерево

ϕ ⇒ (χ ⇒ ϕ) (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ))


ϕ=α
ϕ=α
χ=β
χ=α
ψ=α
α ⇒ (β ⇒ α) (α ⇒ (β ⇒ α)) ⇒ (α ⇒ β) ⇒ (α ⇒ α)
(1.2.129)
(α ⇒ β) ⇒ (α ⇒ α)

Здесь снова на вершинах ветвей находятся аксиомы PC-1 и PC-2.


26 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Исчисление Кетонена G3c. Еще одна аксиоматизация логики предикатов, так называемое ис-
числение G3c финского математика Оива Кетонена, была придумана как модификация генценов-
ской системы LK. Мы приведем здесь ее вариант19 для языка теории множеств (или любого языка
без функциональных символов). В языке этой системы добавляются два символа: символ ⊥, означа-
ющий “абстрактную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание
¬α понимается как сокращение для формулы α ⇒ ⊥. Еще один важный момент — что наборы
формул в секвенциях здесь понимаются не как строки, а как “мультимножества”. Это означает, что
в наборе формул можно как угодно переставлять формулы (отделенные друг от друга запятыми), и
при этом считается, что набор не меняется. Отсюда, в частноти, следует, что генценовские правила
перестановки (0.2.32) в этой системе лишние.
• Аксиомами исчисления G3c считаются следующие три вида секвенций:

Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (0.2.108)

• Правила вывода для исчисления G3c делятся на три группы. В первой группе перечисля-
ются бескванторные правила:
Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(0.2.109)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(0.2.110)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(0.2.111)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆

Во второй – правила с кванторами, в которых на переменные (x и y) не накладывается


никаких ограничений20 :

Γ, ∀x ϕ, ϕ ⊢∆ Γ ⊢ϕ , ∃x ϕ, ∆
x=y x=y
(0.2.112)
Γ, ∀x ϕ ⊢ ∆ Γ ⊢ ∃x ϕ, ∆
И в третьей – правила с кванторами, в которых на одну из переменных, y, накладывается
требование, что она не должна входить в формулы из Γ и ∆, а подстановка ϕ должна
x=y
быть корректной:

Γ, ϕ ⊢∆ Γ ⊢ϕ ,∆
x=y x=y
(0.2.113)
Γ, ∃x ϕ ⊢ ∆ Γ ⊢ ∀x ϕ, ∆

О невыводимых секвенциях. Система G3c торой мы обещали доказать в примере 0.2.10:


удобнее системы LK тем, что в ней меньше пра-
α ⊢ ¬α. (0.2.114)
вил, из-за которых дерево Генцена может разрас-
таться бесконечно далеко вверх, а именно, прави- В системе G3c это делается так. Сначала рас-
ла сокращения (0.2.31) и сечения (0.2.33) отсут- шифруем запись ¬α для системы G3c:
ствуют (но правда, правила (0.2.42) и (0.2.43) за- α ⊢ α ⇒ ⊥.
меняются правилами (0.2.112), которые все рав-
но оставляют такую возможность бесконечного После этого становится видно, что единственное
разрастания). Поскольку G3c эквивалентна LK, правило вывода в системе G3c, которое может
это облегчает возможность доказывать невыво- привести к такой секвенции – правое правило в
димость некоторых секвенций. Покажем это на (0.2.111). Поэтому если бы у секвенции (0.2.114)
примерах. был вывод, то он заканчивался бы переходом
α, α ⊢ ⊥
⋄ 0.2.38. Пусть α — атомарная формула21 . Рас- (0.2.111)
смотрим секвенцию (0.2.55), невыводимость ко- α⊢α⇒⊥
19 Подробности об этой замечательной системе см. в книге: S. Negri, G. von Plato. Structural proof theory, Cambridge

University Press, 2001.


20 Если язык теории содержит функциональные символы, то правила (0.2.110) исчисления G3c для него усложня-

ются уточнением, что под y следует понимать произвольный терм (понятие терма будет определено на с.80).
21 В теории множеств это формулы вида x = y и x ∈ y, мы об этом говорили на с.8.
§ 2. Логика предикатов для теории множеств 27

Теперь если поглядеть на вершину этого дерева, должен быть таким


то видно, что дальше вверх его не продолжишь,
потому что никакое из правил (0.2.109)-(0.2.113) α ⊢α
x=y
здесь применить невозможно (в этот момент мы (0.2.118)
(0.2.113)
используем тот факт, что α — атомарная фор-
∃x α ⊢ α
мула). Но на вершине этого дерева не аксиома.
Значит, оно – не вывод для нашей секвенции. Мы Дальше уже двигаться вверх невозможно, по-
получаем, что у секвенции (0.2.114) вывода вооб- тому что никакое правило применить не полу-
ще нет. чится (из-за атомарности формулы α). Значит,
вывод должен либо иметь вид дерева (0.2.118).
⋄ 0.2.39. Пусть снова α — атомарная форму-
Но в нем на вершине не стоит аксиома (потому
ла22 со свободной переменной x. Покажем, что
секвенция, рассматривавшаяся нами в примере что y не совпадает с x, и значит, α и α x=y — раз-
0.2.12, ные формулы). Значит это дерево – не вывод, и,
α ⊢ ∀x α (0.2.115) как следствие, у секвенции (0.2.117) вывода дей-
ствительно нет.
невыводима. Выберем какую-нибудь перемен-
ную, не входящую в формулу α, пусть это бу- ⋄ 0.2.41. Пусть снова α — атомарная форму-
дет y (понятно, что y отличается от x, потому ла24 со свободной переменной x. Покажем, что
что x входит в α). Предположим, что у секвен- секвенция, рассматривавшаяся нами в примере
ции (0.2.115) имеется вывод. Тогда в нем послед- 0.2.16,
ний шаг должен использовать правое правило ∃x α ⊢ ∀x α (0.2.119)
(0.2.113) (потому что перейти к (0.2.115) в систе-
ме G3c можно только с помощью правого прави- невыводима. Будем считать, что переменные y
ла (0.2.113)). То есть последний шаг этого вывода и z не входят в формулу α. Предположим, что
должен быть таким у секвенции (0.2.119) имеется вывод. Тогда в
нем последний шаг должен использовать прави-
ла (0.2.113) (потому что перейти к (0.2.119) в си-
α⊢α
x=y стеме G3c можно только с помощью (0.2.113)).
(0.2.113)
(0.2.116) То есть конец этого вывода должен быть либо
α ⊢ ∀x α таким

Дальше уже двигаться вверх невозможно, по- α ⊢ ∀x α


x=y
тому что никакое правило применить не полу-
(0.2.113)
чится (из-за атомарности формулы α). Значит,
∃x α ⊢ ∀x α
вывод должен либо иметь вид дерева (0.2.116).
Но в нем на вершине не стоит аксиома (потому (где y не входит в формулу ∀x α), либо таким
что y не совпадает с x, и значит, α и α — раз-
x=y
ные формулы). Значит это дерево – не выводы, и ∃x α ⊢ α
x=z
следовательно, у секвенции (0.2.115) вывода дей- (0.2.113)
ствительно нет. ∃x α ⊢ ∀x α

⋄ 0.2.40. Пусть снова α — атомарная форму- (где z не входит в формулу ∃x α). В обоих слу-
ла23 со свободной переменной x. Покажем, что чаях движение вверх может быть опять только с
секвенция, рассматривавшаяся нами в примере использованием правил (0.2.111). В первом слу-
0.2.14, чае дерево может получиться только таким
∃x α ⊢ α (0.2.117)
α ⊢α
невыводима. Выберем какую-нибудь перемен- x=y x=z
ную, не входящую в формулу α, пусть это бу- (0.2.113)

дет y (понятно, что y отличается от x, пото- α ⊢ ∀x α (0.2.120)


x=y
му что x входит в α). Предположим, что у се- (0.2.113)
квенции (0.2.117) имеется вывод. Тогда в нем по- ∃x α ⊢ ∀x α
следний шаг должен использовать левое правило
(0.2.113) (потому что перейти к (0.2.117) в систе-
ме G3c можно только с помощью левого правила (где z не входит в формулу α x=y , и поэтому z
(0.2.113)). То есть последний шаг этого вывода не может совпадать с y), а во втором – только
22 См. подстрочное примечание 21 .
23 См. подстрочное примечание 21 .
24 См. подстрочное примечание 21 .
28 Глава 0. ТЕОРИЯ МНОЖЕСТВ

таким: ⋄ 0.2.42. Существуют формулы α и β такие, что


β выводится из α, но β не следует из α.
α ⊢α
x=y x=z Доказательство. Рассмотрим какую-нибудь
(0.2.113)
атомарную формулу α со свободной переменной
∃x α ⊢ α (0.2.121) x и пусть β обозначает формулу ∀x α. Тогда:
x=z
(0.2.113) 1) формула ∀x α выводится из α: существует де-
∃x α ⊢ ∀x α рево
⊢α
(где y не входит в формулу α , и поэтому z (0.2.42)
x=z
опять не может совпадать с y). ⊢ ∀x α,
Дальше уже двигаться вверх невозможно, по- как отмечалось в предложении 0.2.4, но одно-
тому что никакое правило применить не полу- временно
чится (из-за атомарности формулы α). Значит, 2) формула ∀x α не следует в LK из α: секвенция
вывод должен либо иметь вид дерева (0.2.120),
либо дерева (0.2.121). Но в обоих случаях на вер- α ⊢ ∀x α
шине не стоит аксиома (потому что y и z — раз-
ные переменные, и значит, α иα — раз- не выводится в LK, в силу примера 0.2.39.
x=y x=z
ные формулы). Значит эти деревья – не выво-
ды, и следовательно, у секвенции (0.2.119) выво- Как мы уже говорили, из-за правил (0.2.112)
да действительно нет. такой способ доказательства невыводимости се-
квенции не всегда работает в G3c (как раньше в
Контрпример к теореме дедукции. Выше LK). В общем случае известно, что проблема, вы-
перед формулировкой теоремы дедукции 0.2.6 водима данная секвенция, или нет, алгоритмиче-
мы пообещали дать контрпример, показываю- ски неразрешима. Помимо такого способа дока-
щий, что понятия следования и выводимости зательства невыводимости исследованием полу-
между формулами не эквивалентны. Это наблю- чаемых деревьев, в математике существует еще
дение использует рассмотренный выше пример один, основанный на построении контрмодели.
0.2.39: Мы опишем его ниже в примерах 1.1.15 и 1.1.16.

§3 Теория множеств Морса-Келли


Теория Морса-Келли MK, которую мы опишем в этом параграфе, представляет собой так называе-
мую формальную теорию25 над исчислением секвенций LK для языка теории множеств, описанным
выше. От теории LK в том виде, в котором мы ее к настоящему времени описали, теория MK отли-
чается только тем, что в ней понятие вывода несколько усложняется в соответствии с идеологией,
описанной на с.21: в MK вводится некая система формул, называемых аксиомами теории MK (ни-
же мы приводим их с обозначениями MK-1—MK-14), и объявляется, что формула ω выводима, если
она выводима из аксиом в смысле определения на с.21. Более подробно, определение вывода в MK
выглядит так:

• Дерево Генцена считается выводом в MK, если каждая его вершина является
— либо аксиомой исчисления секвенций LK, то есть секвенцией вида α ⊢ α,
— либо секвенцией вида ⊢ σ, где σ — какая-нибудь аксиома теории MK.

В соответствии с этим меняются и остальные связанные определения:


• Секвенция Γ ⊢ ∆ называется выводимой в теории MK, если у нее есть вывод в теории
MK.
• Говорят, что формула χ следует из формулы ϕ в теории MK, если в MK выводима се-
квенция ϕ ⊢ χ.
• Теоремой теории MK называется произвольная выводимая формула этой теории (то есть
такая формула ω, что секвенция ⊢ ω выводима в теории MK).
25 Общее определение формальной теории (или теории 1 порядка) мы даем ниже на с.79.
§ 3. Теория множеств Морса-Келли 29

Понятно, что поскольку деревьев Генцена, признаваемых выводами, в MK больше, чем в LK, класс
выводимых секвенций26 в MK шире, чем в LK. То же самое происходит и с отношением следования
между формулами (которое в MK слабее, чем в LK27 ), и с классом теорем (которых в MK больше,
чем в LK28 ):
1) если секвенция Γ ⊢ ∆ выводима в теории LK, то она выводима и в теории MK, не не
наоборот,
2) если формула χ следует из формулы ϕ в теории LK, то это верно и в теории MK, не не
наоборот,
3) если формула α является теоремой теории LK, то она является теоремой и в теории
MK, не не наоборот.

(a) Аксиомы равенства, невырожденности, объемности и выделения


Мы перейдем к описанию аксиом теории MK. Некоторые из них, как аксиомы MK-1—MK-6 (на с.30
ниже), довольно просты, но большинство так громоздко, что среди математиков имеется традиция
описывать их последовательно, по одной, обсуждая сразу же выводы и вводя определения, которые
облегчают описание последующих аксиом. Мы поступим так же, начав список с аксиомы MK-1 на
этой странице и закончив его аксиомой MK-14 на с.64.
Мы постараемся сделать этот параграф автономным, чтобы, при желании, его можно было чи-
тать, не вникая в детали остального изложения этой главы, поэтому выводы из аксиом теории
Морса-Келли (теоремы теории MK) мы будем оформлять традиционными текстовыми рассужде-
ниями, без построения деревьев Генцена (мы дадим только один пример дерева Генцена на с.32),
однако читатель должен понимать, что отныне все наши математические утверждения (не только
в этой главе, но и вообще во всем учебнике, за исключением некоторых утверждений главы 1, где
мы возвращаемся к обсуждению оснований математики) формально могут быть доказаны именно
средствами исчисления секвенций LK, построением нужных деревьев (но, конечно, чем дальше мы
будем двигаться, тем сложнее эти деревья будут, если их в самом деле задаваться строить).
Первые шесть аксиом теории MK повторяют первые аксиомы теории NST.

Аксиомы равенства.
MK-1 Аксиома рефлексивности равенства:

X =X (0.3.122)

(равенство X = X верно для всех классов X).


MK-2 Аксиома симметричности равенства:

X=Y ⇒Y =X (0.3.123)

(равенство X = Y не отличается от равенства Y = X).


MK-3 Аксиома транзитивности равенства:

(X = Y & Y = Z) ⇒ X = Z (0.3.124)

(равенства X = Y и Y = Z влекут за собой равенство X = Z).


MK-4 Аксиома инвариантности символа принадлежности:

(X = A & Y = B & X ∈ Y ) ⇒ A ∈ B (0.3.125)

(в отношение X ∈ Y можно подставлять классы, равные X и Y , и при этом будут


получаться следствия).

Аксиома невырожденности.
26 Понятие выводимой секвенции в LK для языка теории множеств было определено на с.13.
27 Отношение следования между формулами в LK для языка теории множеств было определено на с.13.
28 Понятие теоремы (выводимой формулы) в LK для языка теории множеств было определено на с.19.
30 Глава 0. ТЕОРИЯ МНОЖЕСТВ

MK-5 Аксиома невырожденности29 :

∃X ∃Y X ∈ Y. (0.3.126)

(существуют классы X и Y такие, что X ∈ Y ).

Аксиома объемности. Следующая аксиома объясняет, как отношение принадлежности ∈ свя-


зано с равенством объектов.
MK-6 Аксиома объемности:

X = Y ⇐⇒ ∀A (A ∈ X ⇐⇒ A ∈ Y ) (0.3.127)

(два класса X и Y совпадают, если и только если они «имеют одинаковый набор эле-
ментов»).
! 0.3.1. В одну сторону это утверждение следует из аксиомы инвариантности MK-4: если X = Y ,
то условие A ∈ X ⇔ A ∈ Y выполняется автоматически. Поэтому содержательный смысл MK-6
состоит в импликации в левую сторону:

X = Y ⇐= ∀A (A ∈ X ⇐⇒ A ∈ Y ) (0.3.128)

Аксиома выделения. Из аксиомы объемности MK-6 следует, что для описания объекта теории
множеств (класса) достаточно (и необходимо) описать входящие в него элементы. Это используется
в следующей аксиоме, формализующей способ построения новых классов из уже имеющихся.
MK-7 Аксиома выделения: пусть ϕ – формула теории множеств с единственной свободной
переменной X, не содержащая переменные Y и Z, тогда

∃Y (X ∈ Y ⇐⇒ (∃Z X ∈ Z) & ϕ) (0.3.129)

то есть существует некий класс Y , элементами которого являются в точности классы


X, для которых истинны следующие два высказывания:
— во-первых, должен существовать класс Z, содержащий X в качестве своего
элемента,
∃Z X ∈ Z, (0.3.130)
— и, во-вторых, для X должно быть истинным само утверждение ϕ:

ϕ.

Как и в теории NST, аксиома MK-7 позволяет определять объекты:


• Объект Y в формуле (0.3.129) будет единственным по аксиоме MK-7, поэтому ему можно при-
писать обозначение. Это обозначение выглядит так:

{X : ϕ}

и, если ϕ не содержит переменной T , характеризуется оно высказыванием

T ∈ {X : ϕ} ⇐⇒ ϕ
X=T

Считается, что первое из этих требований, (0.3.130), автоматически добавляется к каждой фор-
муле ϕ такого вида, когда описывается определяемый ею класс. Поскольку строить новые классы
в этой науке приходится постоянно, удобно ввести некий термин, обозначающий объекты X со
свойством (0.3.130). Таким термином является слово “множество”:
• Класс X называется множеством, если существует класс Y , содержащий X в качестве
элемента:
∃Y X ∈ Y.
Если же такого Y не существует, то класс X называется собственным классом.
29 Аксиома MK-5 в действительности не очень важна, потому что избыточна: она является формальным следствием

аксиомы бесконечности MK-13 на с.63. Нам она нужна для методических целей: она дает возможность доказывать
результаты, важные для понимания предмета, раньше, чем это было бы возможным без нее.
§ 3. Теория множеств Морса-Келли 31

Это определение позволяет понятным образом упростить аксиому выделения:


MK-7′ Аксиома выделения: пусть ϕ – формула теории множеств с единственной свобод-
ной переменной X, не содержащая переменную Y , тогда ϕ определяет класс объектов,
обозначаемый символом
{X : ϕ},
элементами которого являются в точности множества X, для которых истинно утвер-
ждение ϕ.

⋄ 0.3.2. Пустой класс ∅. Следующее равенство MK-1 это верно для любого X, класс Set содер-
определяет так называемый пустой класс: жит все на свете множества (и только их).
∅ := {X : X 6= X}. (0.3.131)
Как и в наивной теории множеств, в теории
(символ := здесь означает, что это соотношение Морса-Келли
следует понимать как определение, то есть как
декларацию, согласно которой символ слева от ! 0.3.4. Классы ∅ и Set не совпадают:
:= будет использоваться в тексте всюду для обо-
значения объекта, лежащего справа от этого зна- ∅ 6= Set (0.3.133)
ка).
В соответствии с аксиомой выделения, рас- Доказательство. Здесь почти слово в слово по-
шифровывается эта запись так: элементами вторяются рассуждения примера 0.1.10. По ак-
класса ∅ считаются те и только те множества сиоме объемности MK-6, чтобы доказать нера-
X, которые не равны самому себе. Поскольку по венство ∅ 6= Set, достаточно подобрать какой-
аксиоме MK-1 таких X не бывает (высказывание нибудь класс X такой, чтобы
X = X считается верным всегда), класс ∅ во-
обще не содержит никаких элементов (отчего и / ∅ & X ∈ Set .
X∈
называется пустым).
⋄ 0.3.3. Класс Set всех множеств. Следую- Для этого воспользуемся аксиомой MK-5 и рас-
щее равенство определяет так называемый класс смотрим какие-нибудь два класса X и Y такие,
всех множеств: что
Set := {X : X = X}. (0.3.132) X ∈ Y.

Это расшифровывается так: элементами класса Понятно, что X является множеством, поэтому
/ ∅ (потому что
Set считаются те и только те множества X, ко- X ∈ Set. С другой стороны, X ∈
торые равны самому себе. Поскольку по аксиоме Z ∈ ∅ невозможно ни для какого Z).

(b) Аксиомы подмножеств, объединения и регулярности


Отношение включения ⊆ и аксиома подмножеств.
• Говорят, что класс X содержится в классе Y , или что X является подклассом класса Y ,
и изображают это записью
X⊆Y
или записью
Y ⊇ X,
если всякий элемент Z класса X является также элементом класса Y :
X⊆Y ⇔ ∀Z (Z ∈ X ⇒ Z ∈ Y ). (0.3.134)
Отношение ⊆ называется отношением включения. Запись
X ⊆Y ⊆Z
эквивалентна высказыванию
X ⊆ Y & Y ⊆ Z.
Отрицание отношения ⊆ записывается символом ⊆
6 :
X⊆
6 Y ⇐⇒ ¬(X ⊆ Y ).
32 Глава 0. ТЕОРИЯ МНОЖЕСТВ

• Полезно также ввести отношение строгого включения: говорят, что класс X строго со-
держится в классе Y , или что X является строгим подклассом класса Y , и изображают
это записью
X⊂Y
или записью
Y ⊃ X,
если
X ⊆ Y & X 6= Y.
Отрицание отношения ⊂ записывается символом ⊂
6 :
X⊂
6 Y ⇐⇒ ¬(X ⊂ Y ).

Свойства отношения включения ⊆:


1◦ Всякий класс X содержит пустой класс ∅ и содержится в классе Set всех множеств:
∅ ⊆ X ⊆ Set . (0.3.135)
2◦ Рефлексивность: любой класс X является своим подклассом:
X ⊆ X. (0.3.136)
3◦ Антисимметричность: отношения X ⊆ Y и Y ⊆ X выполняются одновременно тогда
и только тогда, когда классы X и Y совпадают:
X⊆Y ⊆X ⇐⇒ X = Y. (0.3.137)

4 Транзитивность: если X ⊆ Y и Y ⊆ Z, то X ⊆ Z:
X⊆Y ⊆Z =⇒ X ⊆ Z. (0.3.138)
Доказательство. На странице 29 мы говорили, что все утверждения (теоремы) теории MK можно
доказать средствами исчисления секвенций LK (то есть построив выводом в теории MK, как мы его
определили на с.28). Это касается и свойств (0.3.135) – (0.3.138). Например, свойство (0.3.137), если
его сначала упростить
X ⊆ Y ⊆ X ⇒ X = Y. (0.3.139)
а затем переформулировать на языке теории MK,
  
∀A (A ∈ X ⇒ A ∈ Y ) & ∀A (A ∈ Y ⇒ A ∈ X) ⇒ X = Y, (0.3.140)

будет иметь такой вывод:


⊢ (∀A A ∈ X ⇔ A ∈ Y ) ⇒ X = Y (0.3.128)
теорема 0.2.3
∀A (A ∈ X ⇔ A ∈ Y ) ⊢ X = Y
(0.2.24)
(∀A α) & (∀A β) ⊢ ∀A (α & β) (0.2.67) ∀A (α & β) ⊢ X = Y
(0.2.33)
(∀A A ∈ X ⇒ A ∈ Y ) & (∀A A ∈ Y ⇒ A ∈ X) ⊢ X = Y
(0.2.40)
(∀A A ∈ X ⇒ A ∈ Y ) & (∀A A ∈ Y ⇒ A ∈ X) ⇒ X = Y
где α — формула A ∈ X ⇒ A ∈ Y , а β — формула A ∈ Y ⇒ A ∈ X. Мы оставляем читателю
проверку остальных свойств. Как мы говорили на с.29, в дальнейшем мы будем оформлять все
доказательства в виде обычных текстовых рассуждений, без деревьев Генцена.
MK-8 Аксиома подмножеств: для всякого множества X существует множество Y такое что
∀Z (Z ⊆ X ⇒ Z ∈ Y ). (0.3.141)
Теорема 0.3.1. Если X – множество, и Z ⊆ X, то Z – тоже множество.
Доказательство. По аксиоме MK-8, существует множество Y такое, что справедливо (0.3.141). По-
скольку наш класс Z содержится в X, Z ⊆ X, мы получаем Z ∈ Y , и значит, Z – множество.
§ 3. Теория множеств Морса-Келли 33

⋄ 0.3.5. Пустой класс ∅ является множеством: В частности, для X = R получаем:


∅ ∈ Set . (0.3.142)
R ∈ R ⇔ R ∈ Set & R ∈ / R.
Доказательство. Воспользуемся аксиомой MK-
5 и выберем классы X и Y так, чтобы X ∈ Y .
Понятно, что класс X будет множеством. С дру- Если бы было верно R ∈ Set, это привело бы к
гой стороны, по свойству (0.3.135), X содержит противоречию:
пустой класс ∅. Мы получаем
∅ ⊆ X ∈ Set . R∈R ⇔ R∈ / R.

По теореме 0.3.1 из этого следует, что ∅ – мно-


жество. Значит, R ∈/ Set, то есть R – не множество. С
другой стороны, как любой класс, R содержится
⋄ 0.3.6. Класс Set всех множеств не является в Set в силу (0.3.135):
множеством:
Set ∈
/ Set . (0.3.143)
R ⊆ Set .
Доказательство. Рассмотрим класс R = {X :
X ∈/ X} (который можно назвать классом Рас-
Если бы при этом Set было множеством, мы по
села, имея в виду пример из антиномии на с.6).
теореме 0.3.1 получили бы, что R – тоже мно-
По определению (то есть по аксиоме выделения),
жество, и это было бы противоречием с тем, что
для всякого класса X
мы уже доказали про R. Значит, Set – не мно-
X ∈ R ⇔ X ∈ Set & X ∈ / X. жество.

Экспонента 2X .
• Экспонентой произвольного класса X называется класс

2X = {Z : Z ⊆ X} (0.3.144)

⋄ 0.3.7. Экспонента класса всех множеств сов- быть множеством: Y ∈ Set. Мы получаем вклю-
падает с классом всех множеств: чение 2Set ⊆ Set. Наоборот, если Y ∈ Set, то,
поскольку Y является классом, в силу (0.3.135)
2Set = Set (0.3.145) мы получаем, что Y ⊆ Set. Таким образом, одно-
временно Y ∈ Set и Y ⊆ Set, и значит, Y ∈ 2Set .
Set
Доказательство. Если Y ∈ 2 = {Z : Z ⊆ Это доказывает включение Set ⊆ 2Set . Применяя
Set}, то по аксиоме выделения MK-7′ , Y должно (0.3.137), мы получаем 2Set = Set.

Теорема 0.3.2. Если X – множество, то 2X – тоже множество, и для всякого класса Z

Z ⊆X ⇔ Z ∈ 2X (0.3.146)

Доказательство. Пусть X – множество. Тогда по аксиоме MK-8 можно подобрать множество Y


такое, что справедливо (0.3.141): если Z ⊆ X, то Z ∈ Y . Отсюда следует, что 2X ⊆ Y . При этом Y
– множество, поэтому по теореме 0.3.1, 2X тоже должно быть множеством.

Объединение и пересечение двух классов. Аксиома попарного объединения.


• Пересечением классов X и Y называется класс

X ∩ Y = {Z : Z ∈ X & Z ∈ Y } (0.3.147)

• Объединением классов X и Y называется класс

X ∪ Y = {Z : Z ∈ X ∨ Z ∈ Y } (0.3.148)

Свойства операций пересечения и объединения двух классов:


34 Глава 0. ТЕОРИЯ МНОЖЕСТВ

1◦ Связь с пустым классом: для любого класса X

∅ ∩ X = ∅, ∅ ∪ X = X. (0.3.149)

2◦ Связь с классом всех множеств: для любого класса X

Set ∩X = X, Set ∪X = Set . (0.3.150)

3◦ Связь с включением: для любых классов X и Y

X ∩ Y ⊆ X ⊆ X ∪ Y. (0.3.151)

4◦ Идемпотентность: всякий класс X, в объединении и в пересечении с самим собой не


меняется:
X ∩ X = X, X ∪ X = X. (0.3.152)
5◦ Коммутативность: для любых классов X и Y

X ∩ Y = Y ∩ X, X ∪ Y = Y ∪ X. (0.3.153)

6◦ Ассоциативность: для любых классов X, Y и Z

(X ∩ Y ) ∩ Z = X ∩ (Y ∩ Z), (X ∪ Y ) ∪ Z = X ∪ (Y ∪ Z) (0.3.154)

7◦ Дистрибутивность: для любых классов X, Y и Z

(X ∩ Y ) ∪ Z = (X ∪ Z) ∩ (Y ∪ Z), (X ∪ Y ) ∩ Z = (X ∩ Z) ∪ (Y ∩ Z) (0.3.155)

8◦ Связь с отношением включения: для любых классов X и Y

X∩Y =X ⇐⇒ X⊆Y ⇐⇒ X∪Y =Y (0.3.156)

Теорема 0.3.3. Если X или Y – множество, то пересечение X ∩ Y – тоже множество.

Доказательство. В силу (0.3.152), достаточно рассмотреть случай, когда множеством является


класс X. Тогда, применив (0.3.151), мы получим: X ∩ Y ⊆ X. То есть класс X ∩ Y содержится в
множестве X, и по теореме 0.3.1, X ∩ Y должен быть множеством.

Если бы мы задались целью доказать аналогичное утверждение с заменой операции ∩ на опера-


цию ∪ (и с естественной поправкой, чтобы оба класса X и Y были множествами), мы обнаружили
бы, что это утверждение невозможно вывести из перечисленных к настоящему моменту аксиом.
Поэтому оно вводится как отдельная аксиома:
MK-9 Аксиома попарного объединения: для любых двух множеств X и Y их объединение
X ∪ Y – тоже множество.

Объединение и пересечение элементов класса. Аксиома поэлементного объединения.


• Объединением элементов класса X называется класс

∪X = {Z : ∃Y (Y ∈ X & Z ∈ Y )} (0.3.157)

• Пересечением элементов класса X называется класс

∩X = {Z : ∀Y (Y ∈ X ⇒ Z ∈ Y )} (0.3.158)

Свойства операций объединения и пересечения элементов класса:


1◦ Действие на пустой класс:
∪∅ = ∅, ∩∅ = Set . (0.3.159)
2◦ Действие на класс всех множеств:

∪ Set = Set, ∩ Set = ∅. (0.3.160)


§ 3. Теория множеств Морса-Келли 35

3◦ Монотонность относительно включения: для любых классов X и Y

X ⊆Y =⇒ ∩X ⊆ ∩Y & ∪ X ⊆ ∪Y. (0.3.161)

4◦ Монотонность относительно принадлежности: для любых классов X и Y

X ∈Y =⇒ ∩Y ⊆ X ⊆ ∪Y. (0.3.162)

5◦ Объединение элементов множества является множеством:

X ∈ Set =⇒ ∪X ∈ Set . (0.3.163)

6◦ Пересечение элементов непустого класса является множеством:

X 6= ∅ =⇒ ∩X ∈ Set . (0.3.164)

Следующее устверждение представляет собой аналог теоремы 0.3.3:


Теорема 0.3.4. Если X – множество, то пересечение его элементов ∩X – тоже множество.
Как и в случае с операциями попарного пересечения и объединения, аналогичное утверждение с
заменой операции ∩ на операцию ∪ невозможно вывести из перечисленных к настоящему моменту
аксиом. Поэтому оно вводится как отдельная аксиома:
MK-10 Аксиома поэлементного объединения: для любого множества X объединение его
элементов ∪X – тоже множество.

Дополнение и разность.
• Дополнением класса X называется класс

\X = {Y : Y ∈
/ X} (0.3.165)

Свойства дополнения:
1◦ Связь с пустым классом и классом всех множеств:

\∅ = Set, \ Set = ∅. (0.3.166)

2◦ Связь с пересечением и объединением: для любого класса X

X ∩ \X = ∅, X ∪ \X = Set . (0.3.167)

3◦ Связь с включением: для любых классов X и Y

X⊆Y =⇒ \Y ⊆ \X. (0.3.168)

4◦ Инволютивность: для любого класса X

\(\X) = X. (0.3.169)

5◦ Законы де Моргана: для любых классов X и Y

\(X ∩ Y ) = (\X) ∪ (\Y ), \(X ∪ Y ) = (\X) ∩ (\Y ). (0.3.170)

• Разностью классов X и Y называется класс

X \ Y = X ∩ (\Y ) (0.3.171)

Свойства разности:
1◦ Связь с пустым классом и классом всех множеств: для любого класса X

X \ ∅ = X, ∅ \ X = ∅. (0.3.172)
36 Глава 0. ТЕОРИЯ МНОЖЕСТВ

2◦ Связь с пересечением и объединением: для любых классов X, Y , Z

X ∩ (Y \ Z) = (X ∩ Y ) \ Z, (X ∪ Y ) \ Z = (X \ Z) ∪ (Y \ Z) (0.3.173)

3◦ Связь с включением: для любых классов X, Y , Z

X⊆Y =⇒ X \Z ⊆Y \Z & Z \ Y ⊆ Z \ X. (0.3.174)

4◦ Двойная разность: для любых классов X, Y , Z

X \ (Y \ Z) = (X \ Y ) ∪ (X ∩ Y ∩ Z). (0.3.175)

5◦ Законы де Моргана: для любых классов X, Y , Z

X \ (Y ∩ Z) = (X \ Y ) ∪ (X \ Z), X \ (Y ∪ Z) = (X \ Y ) ∩ (X \ Z). (0.3.176)

⋄ 0.3.8. Докажем равенство ⇐⇒ x∈A&x∈


/B&x∈C ⇐⇒
⇐⇒ x∈ A∩C &x ∈
/B ⇐⇒ x ∈ (A ∩ C)\B
(A \ B) ∩ C = (A ∩ C) \ B (0.3.177)

Действительно, ⊲ 0.3.9. Докажите равенство:


h i
x ∈ (A\B) ∩ C ⇐⇒ x ∈ A\B & x ∈ C ⇐⇒ A ∪ (B \ C) = (A ∪ B) \ (B ∩ C) \ A (0.3.178)

Аксиома регулярности.
MK-11 Аксиома регулярности: если X – непустой класс, X 6= ∅, то в нем существует
элемент Y ∈ X, пересечение которого с X пусто:

X ∩ Y = ∅.

Следствия из аксиомы регулярности MK-11:


1◦ Не существует класса A такого, что A ∈ A.
2◦ Не существует классов A, B таких, что A ∈ B ∈ A.
3◦ Не существует классов A, B, C таких, что A ∈ B ∈ C ∈ A.

Доказательство. Эти утверждения доказываются одинаково, поэтому мы докажем только первые


два.
1. Пусть для какого-то A справедливо A ∈ A. Рассмотрим класс

X = {Z : Z = A}.

Из условия A ∈ A следует, что A – множество. Поэтому, по аксиоме выделения MK-7′ , у класса X


имеется только один элемент, а именно множество A

Z∈X ⇐⇒ Z ∈ Set & Z = A ⇐⇒ Z = A. (0.3.179)


Set

Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.179), Y = A, и поэтому мы получаем

A ∩ X = Y ∩ X = ∅.

Но с другой стороны, A ∈ A и A ∈ X, поэтому A ∈ A ∩ X = ∅, что невозможно.


2. Пусть для каких-то A и B справедливо A ∈ B ∈ A. Рассмотрим класс

X = {Z : Z = A ∨ Z = B}.
§ 3. Теория множеств Морса-Келли 37

Из условия A ∈ B ∈ A следует, что A и B – множества. Поэтому, по аксиоме выделения MK-7′, у


класса X элементы совпадают либо с A, либо с B:

Z∈X ⇐⇒ Z ∈ Set & (Z = A ∨ Z = B ) ⇐⇒ Z = A ∨ Z = B. (0.3.180)


Set Set

Отсюда следует, в частности, что X непусто, поэтому можно воспользоваться аксиомой MK-11 и
выбрать Y ∈ X такой что Y ∩ X = ∅. В силу (0.3.180), Y = A или Y = B. Если Y = A, то мы
получаем
A∩X =Z ∩X =∅
Но, с другой стороны, поскольку B ∈ A и B ∈ X, должно быть B ∈ A ∩ X = ∅, что невозможно. И
точно так же для случая Y = B.

(c) Отношения, отображения и аксиома подстановки


Одночленные классы и пары.
• Одночленным классом, порожденным классом X, называется класс

{X} = {Y : X ∈ Set ⇒ Y = X} (0.3.181)

Теорема 0.3.5. Если X – множество, то порожденный им одночленный класс {X} – тоже


множество, и
(i) для всякого класса Y
Y ∈ {X} ⇔ Y = X,
(ii) пересечение и объединением элементов {X} является X:

∩{X} = X = ∪{X}.

Теорема 0.3.6. Если X – собственный класс, то


(i) порожденный им одночленный класс {X} совпадает с Set,

{X} = Set;

(ii) пересечение и объединением элементов {X} описывается равенствами

∩{X} = ∅, ∪{X} = Set .

⋄ 0.3.10. Напомним, что согласно примеру 0.3.5, ⋄ 0.3.11. Наоборот, одночленный класс {Set},
пустой класс ∅ является множеством. Покажем, порожденный классом Set всех множеств, сов-
что одночленный класс {∅}, порожденный пу- падает с классом Set:
стым множеством ∅, не совпадает с пустым мно-
жеством:
{∅} 6= ∅ (0.3.182) {Set} = Set . (0.3.183)
Это следует из аксиомы объемности MK-6: ∅ ∈
{∅}, но ∅ 6= ∅. Это следует из теоремы 0.3.6.

• Неупорядоченной парой, порожденной классами X и Y называется класс

{X, Y } = {X} ∪ {Y } (0.3.184)

Теорема 0.3.7. Если X и Y – множества, то порожденная ими неупорядоченная пара {X, Y }


является множеством, и
(i) для всякого класса Z
Z ∈ {X, Y } ⇔ (Z = X ∨ Z = Y ), (0.3.185)
38 Глава 0. ТЕОРИЯ МНОЖЕСТВ

(ii) при перестановке компонент пара {X, Y } не меняется

{X, Y } = {Y, X}.

(iii) пересечение и объединение элементов неупорядоченной пары {X, Y } описываются фор-


мулами
∩{X, Y } = X ∩ Y, ∪{X, Y } = X ∪ Y.
Теорема 0.3.8. Если X или Y – собственный класс, то
(i) неупорядоченная пара {X, Y } совпадает с Set

{X, Y } = Set;

(ii) при перестановке компонент пара {X, Y } не меняется

{X, Y } = {Y, X}.

(iii) пересечение и объединение элементов неупорядоченной пары {X, Y } описываются фор-


мулами
∩{X, Y } = ∅, ∪{X, Y } = Set .
Доказательство.
• Упорядоченной парой, порожденной классами X и Y называется класс

(X, Y ) = {{X}, {X, Y }} (0.3.186)

Теорема 0.3.9. Если X и Y – множества, то

(X, Y ) ∈ Set (0.3.187)

∩(X, Y ) = {X}, ∪(X, Y ) = {X, Y } (0.3.188)

∩ ∩ (X, Y ) = X, ∩ ∪ (X, Y ) = X ∩ Y, (0.3.189)

∪ ∩ (X, Y ) = X, ∪ ∪ (X, Y ) = X ∪ Y (0.3.190)

   
∪ ∩(X, Y ) ∪ ∪ ∪(X, Y ) \ ∪ ∩ (X, Y ) = Y (0.3.191)

Теорема 0.3.10. Если X или Y – собственный класс, то

(X, Y ) = Set, (0.3.192)

∩(X, Y ) = ∅, ∪(X, Y ) = Set, (0.3.193)

∩ ∩ (X, Y ) = Set, ∩ ∪ (X, Y ) = ∅, (0.3.194)

∪ ∩ (X, Y ) = ∅, ∪ ∪ (X, Y ) = Set (0.3.195)


Первая формула в (0.3.189) и формула (0.3.191) оправдывают следующие определения.
• Левой компонентой класса Z называется класс

left Z = ∩ ∩ Z (0.3.196)

• Правой компонентой класса Z называется класс


   
right Z = ∪ ∩(X, Y ) ∪ ∪ ∪(X, Y ) \ ∪ ∩ (X, Y ) (0.3.197)

Из теорем 0.3.9 и 0.3.10 следует


§ 3. Теория множеств Морса-Келли 39

Теорема 0.3.11. Если X и Y – множества, то

left(X, Y ) = X, right(X, Y ) = Y. (0.3.198)

Если же X или Y – собственный класс, то

left(X, Y ) = Set = right(X, Y ). (0.3.199)

Теорема 0.3.12. Если X и Y – множества, то для любых классов U и V

(X, Y ) = (U, V ) ⇐⇒ X = U & Y = V. (0.3.200)

• Для всякой формулы ϕ условимся символ {(X, Y ) : ϕ} употреблять для обозначения


класса, определенного равенством

{(X, Y ) : ϕ} = {Z : ∃X ∃Y Z = (X, Y ) & ϕ} (0.3.201)

Декартово произведение.
• Декартовым произведением классов X и Y называется класс

X × Y = {(A, B) : A ∈ X & B ∈ Y } (0.3.202)

Теорема 0.3.13. Если X и Y – множества, то X × Y – тоже множество.


X∪Y
Доказательство. Заметим, что класс 22 является множеством:

аксиома MK-9 теорема 0.3.2


X ∈ Set & Y ∈ Set =⇒ X ∪ Y ∈ Set =⇒
теорема 0.3.2 X∪Y
=⇒ 2X∪Y ∈ Set =⇒ 22 ∈ Set

Отсюда следует, что нам достаточно доказать включение


X∪Y
X × Y ⊆ 22 (0.3.203)

– и тогда по теореме 0.3.1 это будет означать, что X × Y – тоже множество. Это делается так:

(0.3.146)
(A, B) ∈ X × Y =⇒ A∈X &B∈Y =⇒ A∈ X ∪Y & B ∈ X ∪Y =⇒
(0.3.146) X∪Y
=⇒ {A} ∈ 2X∪Y & {A, B} ∈ 2X∪Y =⇒ (A, B) = {{A}, {A, B}} ∈ 22 .

Отношения.
• Отношением называется произвольный класс r, элементами которого являются упорядо-
ченные пары:
C ∈ r =⇒ ∃A ∃B C = (A, B).
(Это автоматически означает, что компоненты A и B каждой такой пары (A, B) должны
быть множествами, потому что иначе пара (A, B) не могла бы быть элементом r.)
! 0.3.12. Всякое отношение r является подклассом в декартовом произведении X × Y некоторых
классов X и Y :
r ⊆X ×Y (0.3.204)
В качестве X и Y можно взять, например, класс Set всех множеств.

• Формула A ∈ B, рассматриваемая на классе ляет некоторое отношение,


множеств, то есть когда A, B ∈ Set, опреде-
e = {(A, B) : A ∈ B}, (0.3.205)
которое естественно называть отношением
40 Глава 0. ТЕОРИЯ МНОЖЕСТВ

принадлежности. • Точно так же формула A ⊆ B, рассматривае-


мая на классе множеств, A, B ∈ Set, опреде-
При этом формально формула A ∈ B не бу-
ляет некоторое отношение,
дет эквивалентна формуле (A, B) ∈ e,

A ∈ B ⇐⇒
6 (A, B) ∈ e, s = {(A, B) : A ⊆ B}, (0.3.207)

потому что если B – не множество, то в силу которое естественно называть отношением


(0.3.192), (A, B) = Set, и поэтому (A, B) ∈
/ e. По включения.
этой причине для обозначения этого отношения Как и в случае с ∈, формула A ⊆ B не будет
мы ввели здесь букву e вместо ожидаемого сим- эквивалентна формуле (A, B) ∈ s,
вола ∈. Это отношение понадобится нам ниже,
но в дальнейшем мы все же будем пользовать- A ⊆ B ⇐⇒ 6 (A, B) ∈ s,
ся символом ∈ для его обозначения, чтобы не
усложнять запись без необходимости. Мы наде- потому что если B – не множество, то в силу
емся, что это не вызовет недоразумений. (0.3.192), (A, B) = Set, и (A, B) ∈
/ s.
Предложение 0.3.14. Класс e не является Предложение 0.3.15. Класс s не является
множеством: множеством:
e∈/ Set (0.3.206) s∈/ Set (0.3.208)
Доказательство. Предположим, что e ∈ Set. Доказательство. Предположим, что s ∈ Set.
Тогда {e} ∈ Set, то есть e и {e} – множества. Поскольку s ⊆ s, мы получаем (s, s) ∈ s. Вспом-
При этом e ∈ {e}, и значит, (e, {e}) ∈ e. Вспомнив нив определение упорядоченной пары, мы полу-
определение упорядоченной пары, мы получим чим
{{e}, {e, {e}}} = (e, {e}) ∈ e
{{s}} = {{s}, {s}} = {{s}, {s, s}} = (s, s) ∈ e
С другой стороны, e ∈ {e} и {e} ∈ {{e}, {e, {e}}},
и мы получаем цепочку Это дает цепочку

e ∈ {e} ∈ {{e}, {e, {e}}} ∈ e, s ∈ {s} ∈ {{s}} ∈ s,

которая невозможна по свойству 3◦ на с.36. которая невозможна по свойству 3◦ на с.36.

• Если r и s – два отношения, то их композицией называется класс

r ◦ s = {U : ∃A ∃B ∃C U = (A, C) & (A, B) ∈ r & (B, C) ∈ s} (0.3.209)

• В дальнейшем для всякой формулы P от переменных A и C условимся употреблять обо-


значение {(A, C) : P } вместо {U : ∃A ∃C U = (A, C) & P }. Это позволяет сократить
формулы, например, (0.3.209) тогда можно будет записать так:

r ◦ s = {(A, B) : ∃B (A, B) ∈ r & (B, C) ∈ s} (0.3.210)

• Если r – отношение, то обратным отношением к нему называется отношение

r−1 = {(A, B) : (B, A) ∈ r} (0.3.211)

Теорема 0.3.16. Для любых отношений r, s, t

(r ◦ s) ◦ t = r ◦ (s ◦ t), (0.3.212)

r ◦ (s ∩ t) = (r ◦ s) ∩ (r ◦ t), (0.3.213)

r ◦ (s ∪ t) = (r ◦ s) ∪ (r ◦ t). (0.3.214)

(r−1 )−1 = r (0.3.215)

(r ◦ s)−1 = s−1 ◦ r−1 (0.3.216)


§ 3. Теория множеств Морса-Келли 41

• Если r – отношение, то для любых классов X и Y запись XrY эквивалентна записи


(X, Y ) ∈ r:
XrY ⇐⇒ (X, Y ) ∈ r (0.3.217)
• Говорят, что r – отношение на классе X, если r ⊆ X × X.

Отображения.
• Класс f называется отображением, если он является отношением и удовлетворяет усло-
вию:   
∀X ∀Y ∀Z (X, Y ) ∈ f & (X, Z) ∈ f ⇒ Y = Z . (0.3.218)

• Областью определения класса (необязательно, отображения) f называется класс

D(f ) = {X : ∃Y (X, Y ) ∈ f }. (0.3.219)

• Областью значений (или образом) класса (необязательно, отображения) f называется


класс
R(f ) = {Y : ∃X (X, Y ) ∈ f }. (0.3.220)
• Значением класса (необязательно, отображения) f на классе X называется класс

f (X) = ∩{Y : (X, Y ) ∈ f }. (0.3.221)

• Запись
f :X→Y (0.3.222)
означает, что f является отображением, область определения которого совпадает с клас-
сом X, а область значений лежит в классе Y :

D(f ) = X & R(f ) ⊆ Y. (0.3.223)

• Полезно также зарезервировать какое-то обозначение для ситуации, когда условия (0.3.223)
ослаблены до условий
D(f ) ⊆ X & R(f ) ⊆ Y. (0.3.224)
Мы в таких случаях будем писать
f : X ֒→ Y. (0.3.225)

⋄ 0.3.13. Можно заметить, что пустое множе- теореме 0.3.9, (X, Y ) ∈ Set и (X, Z) ∈ Set, но
ство ∅ является отображением, потому что фор- Y 6= Z. Несмотря на это, можно найти область
мулы (X, Y ) ∈ ∅ и (X, Z) ∈ ∅, ложны, и значит, определения и область значений класса Set:
из них следует что угодно, в частности Y = Z.
При этом, D(Set) = Set = R(Set).
Действительно, для всякого X ∈ Set мы получа-
D(∅) = ∅ = R(∅) (0.3.226) ем (X, ∅) ∈ Set, и значит X ∈ D(Set), а с другой
стороны (∅, X) ∈ Set, и поэтому X ∈ R(Set).
потому что из (X, Y ) ∈ ∅ следует X ∈ ∅ и Y ∈ ∅.
Определение (0.3.221) позволяет также найти
Для произвольного класса X значение на нем
значение класса Set на произвольном классе X:
отображения ∅ равно (
∅, X ∈ Set
∅(X) = ∅ (0.3.227) Set(X) = . (0.3.228)
Set, X ∈/ Set
потому что Действительно, если X ∈ Set, то

∅(X) = ∩{Y : (X, Y ) ∈ ∅} = Set(X) = ∩{Y : (X, Y ) ∈ Set} =


= ∩ Set = (0.3.160) = ∅. = (0.3.187) = ∩ Set = (0.3.160) = ∅.

⋄ 0.3.14. Класс всех множеств Set, наоборот, не Если же X ∈/ Set, то


является отображением, потому что если X, Y ,
Z – множества, и Y 6= Z (такие множества Y и Set(X) = ∩{Y : (X, Y ) ∈ Set} = (0.3.192) =
Z существуют, например, в силу (0.3.182)), то по = ∩{Y : (X, Y ) ∈ Set} = ∩∅ = (0.3.159) = Set .
42 Глава 0. ТЕОРИЯ МНОЖЕСТВ

⋄ 0.3.15. Характеристическая функция виям


класса. Пусть X — произвольный класс. Класс
n   D(f ) = Set & (f (x) = {∅} ⇔ x ∈ X) &
f = z : ∃x ∈ X z = (x, {∅}) ∨
 o & (f (x) = ∅ ⇔ x ∈
/ X).
/ X z = (x, ∅)
∨ ∃x ∈ (0.3.229)
Это отображение называется характеристиче-
является отображением, удовлетворяющим усло- ской функцией класса X.

Теорема 0.3.17. Для всякого класса f

X ∈ D(f ) =⇒ f (X) ∈ Set (0.3.230)


X∈
/ D(f ) =⇒ f (X) = Set (0.3.231)

Доказательство. Если X ∈ D(f ), то {Y : (X, Y ) ∈ Set} 6= ∅, и в силу (0.3.164) мы получаем

f (X) = ∩{Y : (X, Y ) ∈ D(f )} ∈ Set .

/ Set, то {Y : (X, Y ) ∈ Set} = ∅, и в силу (0.3.159) мы получаем


Если же X ∈

f (X) = ∩{Y : (X, Y ) ∈ D(f )} = ∩∅ = Set .

Теорема 0.3.18. Если f и g — отображения, то их композиция g ◦ f — тоже отображение, и


для него справедливы соотношения

D(g ◦ f ) = {X ∈ D(f ) : f (X) ∈ D(g)} ⊆ D(f ) (0.3.232)

R(g ◦ f ) = {Z ∈ D(g) : ∃Y ∈ R(f ) ∩ D(g) g(Y ) = Z} ⊆ R(g) (0.3.233)


и тождество
(g ◦ f )(x) = g(f (x)), x ∈ D(g ◦ f ) (0.3.234)
• Отображение f : X → Y называется биекцией между классами X и Y , если Y = R(f ) и

∀A ∀B (A, B ∈ D(f ) & A 6= B) ⇒ f (A) 6= f (B).

• Примером биекции является тождественное отображение idX : X → X, определенное на


любом классе X формулой
idX (A) = A, A ∈ X. (0.3.235)
• Два отображения f : X → Y и g : Y → X называются взаимно обратными, если

g ◦ f = idX & f ◦ g = idY .

В этом случае отображение g называют также обратным отображением для f (а f —


обратным отображением для g).
Теорема 0.3.19. Отображение f : X → Y тогда и только тогда будет биекцией между X и Y ,
когда существует обратное ему отображение g : Y → X

Аксиома подстановки.
MK-12 Аксиома подстановки: если f – отображение, и его область определения D(f ) –
множество, то и его область значений R(f ) – тоже множество.

Свойства отображений:

1 Если f и g – отображения, то f ◦ g – тоже отображение.
2◦ Если f – отображение, то
f = {(X, Y ) : Y = f (X)} (0.3.236)
§ 3. Теория множеств Морса-Келли 43

3◦ Отображения f и g совпадают тогда и только тогда, когда они совпадают на всех


значениях:
f = g ⇐⇒ ∀X f (X) = g(X) (0.3.237)
4◦ Если f – отображение, у которого область определения D(f ) является множеством,
то f – множество.

Доказательство. 4. Если f – отображение, и его область определения D(f ) – множество, то по


аксиоме MK-12 область значений R(f ) – тоже множество. Значит по теореме 0.3.13, декартово про-
изведение D(f ) × R(f ) – тоже множество. Отсюда по теореме 0.3.1 класс f ⊆ D(f ) × R(f ) является
множеством.

• Если X – множество, то для произвольного класса Y символом Y X обозначается класс,


состоящий из отображений f : X → Y :

f ∈YX ⇐⇒ f : X → Y. (0.3.238)

Теорема 0.3.20. Если X и Y – множества, то класс Y X – тоже множество.

Доказательство. Всякое отображение f : X → Y является отношением, поэтому элементом декар-


това произведения X × Y , поэтому справедлива цепочка

f ∈YX =⇒ f ⊆X ×Y =⇒ f ∈ 2X×Y ,

Иными словами,
Y X ⊆ 2X×Y . (0.3.239)
Если X и Y – множества, то по теореме 0.3.13, декартово произведение X ×Y – тоже множество. От-
сюда по теореме 0.3.2, 2X×Y – тоже множество. Таким образом, в (0.3.239) справа стоит множество,
и значит, по теореме 0.3.1, слева – тоже множество.

Теорема 0.3.21. Если X, Y , Z – множества, то правила

P (f )(B)(A) = f (B, A), A ∈ X, B ∈ Y, f ∈ Z Y ×X . (0.3.240)

и
Q(g)(B, A) = g(B)(A), A ∈ X, B ∈ Y, g ∈ (Z Y )X . (0.3.241)
Y ×X Y X
определяют пару взаимно обратных биекций между Z и (Z ) :

P : Z Y ×X → (Z Y )X , Q : (Z Y )X → Z Y ×X

Доказательство. По теореме 0.3.19 здесь достаточно проверить, что P и Q взаимно обратны:

Q ◦ P = idZ Y ×X , P ◦ Q = id(Z Y )X .

Это делается прямым вычислением:

Q(P (f ))(B, A) = (0.3.241) = P (f )(B)(A) = (0.3.240) = f (B, A), f ∈ Z Y ×X .

и
P (Q(g))(B)(A) = (0.3.240) = Q(g)(B, A) = (0.3.241) = g(B)(A), g ∈ (Z Y )X .

• Для всякого отображения f и любого класса X введем следующие обозначения:

[
f (Y ) = {Z : ∃Y Y ∈ X & Z ∈ f (Y )} (0.3.242)
Y ∈X
\
f (Y ) = {Z : ∀Y Y ∈ X ⇒ Z ∈ f (Y )} (0.3.243)
Y ∈X

Теорема
S 0.3.22. ЕслиT отображение f является множеством, то для любого множества X
классы Y ∈X f (Y ) и Y ∈X f (Y ) являются множествами.
44 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Ограничение и продолжение отображения.


• Для всякого отношения r и любого класса X ограничением r на X называется отношение

r X
= r ∩ (X × Set) (0.3.244)

Отношение r при этом называется продолжением отношения r X


.

Теорема 0.3.23. Для всякого отображения f его ограничение f X на произвольный класс X яв-
ляется отображением, причем его область определения описывается равенством

D(f X
) = D(f ) ∩ X (0.3.245)

а действие – правилом
f X
(Y ) = f (Y ), Y ∈ D(f ) ∩ X. (0.3.246)

Отношение эквивалентности.
• Отношение r ⊆ X × X называется отношением эквивалентности на классе X, если оно
обладает следующими свойствами:
— рефлексивность:
ArA, (0.3.247)
— симметричность:
ArB ⇒ BrA, (0.3.248)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.249)
• Если r — отношение эквивалентности на классе X, то классом эквивалентности по от-
ношению r называется произвольный непустой класс Y ⊆ X такой, что

∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.250)

Лемма 0.3.24. Любые два класса эквивалентности Y и Z либо не пересекаются, либо совпадают.
Доказательство. Если существует A ∈ Y ∩ Z, то для всякого B ∈ X мы получим:

B∈Y ⇐⇒ ArB ⇐⇒ B∈Z

Теорема 0.3.25. Пусть r — отношение эквивалентности на непустом классе X такое что все
классы эквивалентности по нему являются множествами. Тогда
(i) существует класс X/r, элементами которого являются в точности классы эквива-
лентности по отношению r:
 
Y ∈ X/r ⇔ Y ⊆ X & ∀A ∈ X ∀B ∈ Y A ∈ Y ⇔ ArB (0.3.251)

(ii) существует отображение p : X → X/r со свойством

∀A ∈ X A ∈ p(A) (0.3.252)

Отображение p : X → X/r сюръективно.


• Класс X/r называется фактор-классом класса X по отношению эквивалентности r, а отоб-
ражение p : X → X/r – фактор-отображением (класса X по отношению эквивалентности
r).
Доказательство. Определим класс X/r формулой

X/r = {Y : ∅ 6= Y ⊆ X & ∀A ∈ X ∀B ∈ Y A∈Y ⇔ ArB }

Поскольку каждый класс эквивалентности Y является множеством, X/r будет состоять в точности
из всех классов эквивалентности по r. С другой стороры, отображение p определяется формулой

p(A) = {B : B ∈ X & ArB}.


§ 3. Теория множеств Морса-Келли 45

Ясно, что A ∈ p(A), а с другой стороны, p(A) является классом эквивалентности. Отображение
p будет сюръективно, потому что если Y – класс эквивалентности, то по определению он непуст,
поэтому найдется A ∈ Y . Для него мы получим A ∈ X и A ∈ p(A). Значит, Y и p(A) – классы
эквивалентности, содержащие A, и по лемме 0.3.24 мы получаем, что Y = p(A).
Теорема 0.3.26. Если X – множество, то на нем любое отношение эквивалентности r удовле-
творяет условиям теоремы 0.3.25, а фактор-класс X/r является множеством.
Доказательство. По теореме 0.3.25, фактор-отображение p : X → X/r сюръективно, поэтому

R(p) = X/r,

и по аксиоме MK-12, этот класс должен быть множеством.

⋄ 0.3.16. Отношение равенства Y = {A}, A ∈ X. Поэтому фактор-отображение


p : X → X/r будет биекцией.
ArB ⇐⇒ A=B
⋄ 0.3.17. Теорему 0.3.25 можно в некотором
является отношением эквивалентности на любом смысле обратить: произвольное отображение f :
классе X (например, на классе Set всех мно- X → Z порождает отношение эквивалентности
жеств). на классе X по формуле
Классами эквивалентности по такому отно-
шению будут только одноэлементные классы: ArB ⇐⇒ f (A) = f (B).

(d) Определения по индукции


Наполненные классы.
• Класс X называется наполненным, если всякий его элемент является его подклассом:

∀A ∈ X A⊆X (0.3.253)

⋄ 0.3.18. Очевидно, пустой класс ∅ наполнен. ⋄ 0.3.24. Класс X = {{∅}} обладает тем свой-
ством, что на нем отношение принадлежности ∈
⋄ 0.3.19. Одночленный класс {∅} также напол-
транзитивно,
нен.
⋄ 0.3.20. Упорядоченная пара {∅, {∅}} являет- ∀A, B, C ∈ X A ∈ B ∈ C ⇒ A ∈ C (0.3.254)
ся наполненным классом. но при этом класс X не наполнен.
⋄ 0.3.21. Эту цепочку примеров можно продол- Доказательство. Цепочка A ∈ B ∈ C ∈ {{∅}}
жать, потому что если X – наполненное множе- невозможна: можно построить цепочку из двух
ство, то класс X ∪ {X} – тоже наполненное мно- знаков ∈
жество. В частности, наполнены классы ∅ ∈ {∅} ∈ {{∅}},
{∅, {∅}, {∅, {∅}}} := {∅, {∅}} ∪ {{∅, {∅}}}, но левее уже никаких классов не подпишешь.
Отсюда следует, что класс X = {{∅}} триви-
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} := ально удовлетворяет условию (0.3.254). Но он не
удовлетворяет условию (0.3.253), потому что для
= {∅, {∅}, {∅, {∅}}} ∪ {{∅, {∅}, {∅, {∅}}}}
него нужно было бы, чтобы из
и так далее.
{∅} ∈ {{∅}}
⋄ 0.3.22. Класс Set всех множеств, очевидно, на-
полнен. следовало
{∅} ⊆ {{∅}}
! 0.3.23. Следующие примеры показывают, что
условие наполненности класса (несмотря на то есть
внешнее сходство) не эквивалентно условию ∅ ∈ {{∅}},
транзитивности отношения ∈ на данном классе. а это неверно.
46 Глава 0. ТЕОРИЯ МНОЖЕСТВ

⋄ 0.3.25. Класс наполнен, но на нем отношение принадлежности


∈ не транзитивно.
X = {∅, {∅}, {{∅}}, {∅, {∅}}}

Свойства наполненных классов:


1◦ Всякий непустой наполненный класс X содержит в качестве элемента пустое множе-
ство:
∅∈X
2◦ Пересечение X ∩Y и объединение X ∪Y любых двух наполненных классов X и Y являются
наполненными классами.
3◦ Если X – класс, элементы которого являются наполненными классами, то пересечение
∩X и объединение ∪X элементов класса X также являются наполненными классами.

Доказательство. 1. По аксиоме регулярности MK-11, существует элемент Y ∈ X такой, что Y ∩X =


∅. Но с другой стороы, поскольку класс X насыщен, Y ⊆ X, и поэтому

Y = Y ∩ X = ∅.

2. Если X и Y – наполненные классы, и A ∈ X ∩ Y , то A ∈ X и A ∈ Y , и, посольку X и Y


наполненны, A ⊆ X и A ⊆ Y , и отсюда A ⊆ X ∩ Y . Если же A ∈ X ∪ Y , то A ∈ X или A ∈ Y , и,
посольку X и Y наполненны, A ⊆ X или A ⊆ Y , и отсюда A ⊆ X ∩ Y .
3. Утверждение 3◦ доказывается аналогично.

Теоремы об определении по индукции.


• Говорят, что отображение h индуктивно (или рекурсивно) определяет отображение f ,
или что отображение f индуктивно (или рекурсивно) определено отображением h, если
(i) область определения D(f ) отображения f является наполненным классом:

∀X ∈ D(f ) X ⊆ D(f ) (0.3.255)

(ii) значение отображения f на всяком элементе X ∈ D(f ) определяется значениями


f на элементах Y ∈ X с помощью функции h по формуле

∀X ∈ D(f ) f (X) = h(f |X ); (0.3.256)

(iii) f продолжает любое другое отображение со свойствами (i) и (ii): если g – какое-
то другое отображение, удовлетворяющее (i) и (ii), то g ⊆ f .
Следующая теорема – один из из самых важных результатов этой науки:

Теорема 0.3.27 (об определении по индукции). Всякое отображение h индуктивно определяет


единственное отображение f .

Доказательство. Пусть F – класс отображений, являющихся множествами и удовлетворяющих


условиям (0.3.255) и (0.3.324):

F = {f : ∀X ∈ D(f ) X ⊆ D(f ) & f (X) = h(f |X )}.

Заметим, что класс F непуст, потому что содержит по крайней мере пустое множество:

∅ ∈ F.

Покажем далее, что любые два отображения из класса F совпадают на общей области определения:

∀f, g ∈ F f D(f )∩D(g)


=g D(f )∩D(g)
(0.3.257)

Действительно, пусть f, g ∈ F . Рассмотрим класс

A = {X : X ∈ D(f ) ∩ D(g) & f (X) 6= g(X)}, (0.3.258)


§ 3. Теория множеств Морса-Келли 47

и предположим, что он непуст, A 6= ∅. Тогда по аксиоме регулярности MK-11 в нем существует


элемент B, пересечение которого с A пусто:

B∈A & B ∩ A = ∅.

Первое означает, что значения отображений f и g различаются на B, а второе – что их ограничения


на B совпадают:
f (B) 6= g(B) & f B = g B . (0.3.259)
Поскольку B ∈ A, в силу (0.3.258), мы получаем B ∈ D(f ) ∩ D(g). А с другой стороны, оба отобра-
жения f и g принадлежат F , и значит, удовлетворяют условию (0.3.324). Отсюда, используя второе
утверждение в (0.3.259), мы получаем:

f (B) = (0.3.324) = h(f B


) = (0.3.259) = h(g B
) = (0.3.324) = g(B),

и это противоречит первому утверждению в (0.3.259). Значит, наше предположение, что A непусто,
неверно. То есть A = ∅, и это доказывает (0.3.257).
После этого нужно положить
f = ∪F,
и это будет отображение, индуктивно порожденное отображением h.
Теорема 0.3.28. Если отображение h определено на классе Set, то определенное им индуктивно
отображение f также определено на классе Set:

D(h) = Set =⇒ D(f ) = Set .

Доказательство. Предположим, что порожденное им отображение f определено не всюду на Set:

D(f ) 6= Set . (0.3.260)

Тогда
Set \ D(f ) 6= ∅,
и к этому классу можно применить аксиому регулярности MK-11: существует класс Y ∈ Set \ D(f )
такой, что
Y ∩ (Set \ D(f )) = ∅.
Иными словами,
Y ∈ Set \ D(f ) & Y ⊆ D(f ). (0.3.261)
Рассмотрим класс
N = {Y } ∪ D(f ).
Он наполнен, потому что если Z ∈ N , то
— либо Z ∈ D(f ), и тогда, поскольку D(f ) наполнен, мы получаем

Z ⊆ D(f ) ⊆ N,

— либо Z ∈ {Y }, то есть Z = Y , и тогда, в силу (0.3.261), мы получаем

Z = Y ⊆ D(f ) ⊆ N.

Определим отображение g на N правилом


(
f (X), X ∈ D(f )
g(X) = , X ∈ N.
h(f ), X = Y

Оно будет принадлежать F и продолжать отображение f на более широкий, чем D(f ), класс N .
Это означает, что f не может удовлетворять условию (iii) в определении на с.58. Как следствие,
наше предположение (0.3.260) не может быть верно.
Теорема 0.3.29. Пусть отображение h и классы M и P удовлетворяют следующим условиям:
(i) класс M наполнен:
∀X ∈ M X ⊆ M, (0.3.262)
48 Глава 0. ТЕОРИЯ МНОЖЕСТВ

(ii) для всякого элемента X ∈ M класс P X всех отображений f : X → P содержится в


области определения h:
∀X ∈ M P X ⊆ D(h), (0.3.263)
(iii) область значений h содержится в классе P :

R(h) ⊆ P. (0.3.264)

Тогда существует единственное отображение f : M → P , связанное с отображением h тожде-


ством (0.3.324):
∀X ∈ D(f ) = M f (X) = h(f |X ). (0.3.265)
Доказательство. Рассмотрим отображение H : Set → Set, определенное правилом:
( S
h(g), g ∈ X∈M P X
H(g) = S (0.3.266)
∅, g∈/ X∈M P X

Оно корректно определено в силу (0.3.263). По теореме 0.3.28, H индуктивно определяет некое
отображение F : Set → Set. В частности, F будет удовлетворять условию (0.3.324):

∀X ∈ Set F (X) = H(F |X ). (0.3.267)

Покажем, что
∀X ∈ M F X
∈ P X. (0.3.268)
Предположим, что это не так:
∃X ∈ M F X
/ P X.
∈ (0.3.269)
Зафиксируем этот элемент X ∈ M . Условие (0.3.269) означает, что найдется Y ∈ X такой, что

F (Y ) ∈
/ P.

Из условия (0.3.262) следует, что Y ∈ M . Поэтому множество

N = {Y ∈ M : F (Y ) ∈
/ P}

непусто. Применим к нему аксиому регулярности MK-11: существует A такой, что

A∈N & A ∩ N = ∅.

Первое условие здесь означает, что

A∈M & F (A) ∈


/ P, (0.3.270)

а второе – что
∀Z ∈ A Z ∈
/ N = {Y ∈ M : F (Y ) ∈
/ P },
Опять применяя (0.3.262), можно это переформулировать так:

∀Z ∈ A Z∈M & Z∈
/ N = {Y ∈ M : F (Y ) ∈
/ P} .

Это в свою очередь, будет означать

∀Z ∈ A F (Z) ∈ P,

и, добавив к этому первую часть (0.3.270), мы можем записать это так:

A∈M & F A
∈ P A. (0.3.271)

Теперь мы получаем:

F (A) = (0.3.267) = H(F A


) = (0.3.271), (0.3.266) = h(F A
) ∈ R(h) ⊆ (0.3.264) ⊆ P

То есть F (A) ∈ P , и это противоречит (0.3.270). Значит, наше предположение (0.3.269) неверно, и
поэтому справедливо (0.3.268).
§ 3. Теория множеств Морса-Келли 49

Положим теперь
f =F M
.
Для него будет выполняться тождество (0.3.265),

∀X ∈ M f (X) = F (X) = (0.3.267) = H(F X


) = (0.3.268), (0.3.266) = h(F X
),

из которого будет следовать, что f является отображением из M в P :

f (X) = h(F X
) ∈ R(h) ⊆ (0.3.264) ⊆ P

Остается доказать единственность такого отображения f . Пусть g : M → P – какое-нибудь


другое отображение с тем же свойством:

∀X ∈ M g(X) = h(g|X ). (0.3.272)

Предположим, что f 6= g. Тогда класс

N = {X ∈ M : f (X) 6= g(X)}

непуст. Значит, к нему можно применить аксиому регулярности MK-11: существует класс A такой,
что
A ∈ N & A ∩ N = ∅.
Первое условие означает, что
A∈M & f (A) 6= g(A). (0.3.273)
А второе – что
∀X ∈ A f (X) = g(X),
то есть что
f A
=g A
.
Но отсюда, применяя первое условие из (0.3.273), A ∈ M , мы получаем

f (A) = (0.3.265) = h(f A


) = h(g A
) = (0.3.272) = g(A),

и это противоречит второму условию из (0.3.273): f (A) 6= g(A).

(e) Ординалы
Отношение полного порядка.
• Отношение r ⊆ X × X называется отношением строгого частичного порядка на классе
X, если оно обладает следующими свойствами:
— антисимметричность:
ArB ⇒ ¬(BrA), (0.3.274)
— транзитивность:
(ArB & BrC) ⇒ ArC. (0.3.275)
• Отношение r ⊆ X × X называется отношением строгого линейного порядка на классе
X, если оно является отношением строгого частичного порядка и обладает следующим
дополнительным свойством:
— линейность:
A 6= B ⇒ (ArB ∨ BrA), (0.3.276)
• Говорят, что в классе X элемент A ∈ X является
— минимальным для отношения r, если для любого другого элемента B ∈ X из
A 6= B следует, что BrA ложно,
— максимальным для отношения r, если для любого другого элемента B ∈ X из
A 6= B следует, что ArB ложно.
50 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Предложение 0.3.30. Если r – отношение строгого линейного порядка на классе X, и Y ⊆ X


– подкласс в X, то минимальный элемент A в Y , если он существует, единственен и обладает
свойством
∀B ∈ Y (A 6= B =⇒ A rB) (0.3.277)
Доказательство. Предположим, что A и A′ – два минимальных элемента в Y . Тогда если A 6=
A′ , то, поскольку отношение r линейно, либо ArA′ , либо A′ rA. Если ArA′ , то A′ не может быть
минимальным элементом в Y , а если A′ rA, то A не может быть минимальным элементом в Y .
Пусть далее A – минимальный элемент в Y , и пусть B ∈ Y , причем A 6= B. Поскольку отно-
шение r линейно, должно выполняться либо ArB, либо BrA. Второе невозможно, поскольку A –
минимальный элемент в Y .
• Отношение r ⊆ X × X называется отношением полного порядка на классе X, если оно
является отношением строгого линейного порядка и в любом непустом подклассе Y ⊆ X,
Y 6= ∅, имеется минимальный для r элемент.
• Если r — отношение полного порядка на классе X, то говорят также, что r вполне упоря-
дочивает X. Кроме того, если на классе X существует какое-нибудь отношение полного
порядка, то говорят, что класс X можно вполне упорядочить.
• Если r – отношение полного порядка на классе X, и ∅ 6= Y ⊆ X, то минимальный
элемент в Y , существование которого постулируется в определении полного порядка, а
единственность доказывается в предложении 0.3.30, обозначается символом

min Y. (0.3.278)

Определение и свойства ординалов.


• Класс X называется ординалом, если он наполнен, и любой его элемент Y ∈ X также
является наполненным классом.

⋄ 0.3.26 (конструкция фон Неймана). Матема- — класс {∅, {∅}, {∅, {∅}}} является ординалом
тику Джону фон Нейману принадлежит следую- и обозначается
щая остроумная идея строить ординалы “по ин-
дукции”. 3 := {∅, {∅}, {∅, {∅}}} = {0, 1, 2} = 2 ∪ {2}.
Прежде всего, пустое множество ∅ являет- (0.3.282)
ся ординалом. В дальнейшем нам будет удобно — следующий в этой цепочке класс 3 ∪ {3} тоже
использовать для него новый символ: является ординалом и обозначается

0 := ∅. (0.3.279) 4 := {0, 1, 2, 3} = 3 ∪ {3}. (0.3.283)

Далее, одночленный класс {∅} (единствен- — так же определяются классы 5, 6, 7, 8 и 9:


ным элементом которого является пустое мно-
жество) также является ординалом. Для него 5 := {0, 1, 2, 3, 4} = 4 ∪ {4}, (0.3.284)
мы также введем специальное обозначение 6 := {0, 1, 2, 3, 4, 5} = 5 ∪ {5}, (0.3.285)
1 := {∅} = {0} = 0 ∪ {0}. (0.3.280) 7 := {0, 1, 2, 3, 4, 5, 6} = 6 ∪ {6}, (0.3.286)
8 := {0, 1, 2, 3, 4, 5, 6, 7} = 7 ∪ {7}, (0.3.287)
Так же по аналогии определяются ординалы 9 := {0, 1, 2, 3, 4, 5, 6, 7, 8} = 8 ∪ {8}.(0.3.288)
2, 3, 4, 5, 6, 7, 8, 9 (и некоторые из этих обозначе-
ний будут нам полезны ниже, в частности, 0 и 1 ⋄ 0.3.27. Экспонента нуля равна единице:
встретятся при на с.108 в определении предиката
истинности, и это будет еще до обсуждения поня- 20 = 1 (0.3.289)
30
тия числа, которое начнется только со с.122 ):
Доказательство.
— класс {∅, {∅}} (с двумя элементами, ∅ и {∅}
) также является ординалом и обозначается X ∈ 20 = 2∅ ⇐⇒ X ⊆ ∅ ⇐⇒ X = ∅ = 0.

2 := {∅, {∅}} = {0, 1} = 1 ∪ {1}. (0.3.281)


30 Всеже в обозначениях 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 читатель, конечно, должен увидеть связь с натуральными числами,
потому что эти ординалы действительно входят как элементы в определяемый ниже класс FinOrd, формализующий
идею (расширенного) множества натуральных чисел (и значит, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 действительно являются
натуральными числами, см. (0.3.332)).
§ 3. Теория множеств Морса-Келли 51

⋄ 0.3.28. Экспонента единицы равна двойке: X ∈ 21 = 2{∅} ⇐⇒ X ⊆ {∅} ⇐⇒


⇐⇒ X=∅ ∨ X = {∅} ⇐⇒
21 = 2 (0.3.290)
⇐⇒ X ∈ {∅; {∅}} = 2.
Доказательство.

Теорема 0.3.31. Если X – ординал и Y ⊆ X – наполненный подкласс в X, то Y – тоже ординал.

Доказательство. Поскольку X наполнен, любой элемент Z ∈ Y является также элементом орди-


нала X, и поэтому Z – наполненый класс. С другой стороны, Y сам наполнен, и вместе это значит,
что Y – ординал.

Теорема 0.3.32. Всякий элемент Y ∈ X произвольного ординала X сам является ординалом.

Доказательство. Для Y ∈ X мы получаем импликацию


X – ординал
Y ∈X =⇒ Y – наполненный класс,

а для любого его элемента Z ∈ Y – цепочку


X – наполненный
класс X – ординал
Z∈Y ∈X =⇒ Z∈X =⇒ Z – наполненный класс.

Таким образом, класс Y наполнен и любой его элемент Z ∈ Y – тоже наполненный класс. Значит,
Y – ординал.

Теорема 0.3.33 (об отношении ∈ на ординале). Пусть X – ординал. Тогда отношение принад-
лежности ∈ на X будет отношением полного порядка31 , то есть будет обладать следующими
свойствами:
(i) транзитивность:
∀A, B, C ∈ X A∈B∈C =⇒ A∈C (0.3.291)
(ii) линейность:
∀A, B ∈ X A ∈ B ∨ B ∈ A ∨ A = B. (0.3.292)
(iii) полная упорядоченность: если ∅ 6= Y ⊆ X — непустой подкласс в X, то найдется
элемент B ∈ Y , принадлежащий любому другому элементу C ∈ Y , отличному от B:

C ∈ Y & C 6= B ⇒ B ∈ C, (0.3.293)

причем таким элементом B будет пересечение класса Y :

B = ∩Y (0.3.294)

• Элемент B класса Y , описываемый в свойстве 3◦ , называется минимальным элементом


класса Y (по отношению принадлежности ∈) и обозначается

B = min Y (0.3.295)

Свойство 3◦ , таким образом, утверждает, что

min Y = ∩Y (0.3.296)

Доказательство. 1. Транзитивность следует напрямую из определения ординала: если A, B, C ∈ X


и A ∈ B ∈ C, то, поскольку C, как элемент ордианала X, является наполненным классом, A ∈ C.
2. Линейность доказывается от противного (и довольно сложно). Предположим, что условие
(0.3.292) не выполняется. Тогда должен быть непустым класс

Y = {B ∈ X : ∃A ∈ X A∈
/ B & A 6= B & B ∈
/ A}. (0.3.297)
31 Отношение полного порядка было определено на с.50.
52 Глава 0. ТЕОРИЯ МНОЖЕСТВ

По аксиоме регулярности MK-11 на с.36, это означает, что существует элемент y ∈ Y такой что
y ∩ Y = ∅. Зафиксируем этот класс y. Он один из тех B, для которых выполняется формула,
определяющая Y :
B ∈ X & (∃A ∈ X A ∈ / B & A 6= B & B ∈/ A)
То есть формула
y ∈ X & (∃A ∈ X A∈
/ y & A 6= y & y ∈
/ A).
Это означает, что класс
Z = {z ∈ X : z ∈
/ y & z 6= y & y ∈
/ z} (0.3.298)
– тоже непуст. Опять аксиоме регулярности MK-11 на с.36, существует элемент z ∈ Z такой что
z ∩ Z = ∅. Зафиксируем z тоже.
Заметим теперь, что y ∈
/ Z (потому что y 6= y неверно, и значит, формула y ∈ X & y ∈
/ y & y 6=
y &y ∈ / y, получаемая подстановкой y вместо z в фигурные скобки (0.3.298), тоже неверна). По-
скольку z ∈ Z, отсюда можно сделать вывод, что

y 6= z. (0.3.299)

Покажем, что тем не менее из наших построений следует, что

y = z. (0.3.300)

Это будет противоречием к исходному предположению, что (0.3.292) не выполняется.


Сначала покажем, что y ⊆ z. Пусть t ∈ y. Поскольку X – ординал, и значит наполненный класс,
из t ∈ y ∈ X следует t ∈ X. Мы получим такую цепочку:
 
y∩Y = ∅ =⇒ t ∈/Y =⇒ ¬ t ∈ X & ∃A ∈ X A ∈
/t&A=t&t∈A =⇒
 
=⇒ t∈
/ X ∨ ∀A ∈ X A ∈t∨A =t∨t ∈A =⇒ ∀A ∈ X A ∈ t ∨ A = t ∨ t ∈ A =⇒
=⇒ z ∈ t∨z = t∨t∈ z

Покажем, что в последней формуле первые два варианта невозможны:


— если z ∈ t, то поскольку t ∈ y, и z, t, y ∈ X, мы, по уже доказанному условию транзитив-
ности (0.3.291), получаем z ∈ y, и, по определению класса Z это означает, что z ∈ / Z (а
это противоречит выбору z ∈ Z),
— если же z = t, то, поскольку t ∈ y, мы получаем z ∈ y, и, опять по определению класса Z
это означает, что z ∈
/ Z (и это противоречит выбору z ∈ Z).
Итак, остается только вариант t ∈ z, и, поскольку это верно для любого t ∈ y, мы получаем y ⊆ z.
Теперь наоборот, покажем что z ⊆ y. Пусть t ∈ z. Поскольку X – ординал, и значит наполненный
класс, из t ∈ y ∈ X следует t ∈ X. С другой стороны, z ∩ Z = ∅, поэтому t ∈
/ Z. Вместе то и другое
дает цепочку
 
t∈
/Z =⇒ ¬ t∈X &t∈
/ y & t 6= y & y ∈
/t =⇒
 
=⇒ t ∈ / X ∨ t∈y∨t=y∨y ∈t =⇒ t∈y∨t=y∨y ∈t

Покажем, что в последней формуле последние два варианта невозможны:


— если y ∈ t, то поскольку t ∈ z, и y, t, z ∈ X, мы, по уже доказанному условию транзитив-
ности (0.3.291), получаем y ∈ z, и, по определению класса Z это означает, что z ∈ / Z (а
это противоречит выбору z ∈ Z),
— если же y = t, то, поскольку t ∈ z, мы получаем t ∈ y, и, опять по определению класса Z
это означает, что z ∈
/ Z (и это противоречит выбору z ∈ Z).
Остается только вариант t ∈ y, и, поскольку это верно для любого t ∈ z, мы получаем z ⊆ y.
Мы доказали равенство (0.3.300), противоречащее (0.3.299), и это нам и нужно было.
3. Пусть ∅ 6= Y ⊆ X. Пусть X – ординал, и ∅ 6= Y ⊆ X. По аксиоме регулярности MK-11 на с.36,
существует элемент B ∈ Y такой, что B ∩ Y = ∅. Это значит, что ни для какого элемента C ∈ Y не
выполняется C ∈ B:
∀C ∈ Y C ∈ / B. (0.3.301)
§ 3. Теория множеств Морса-Келли 53

Поскольку B и C – элементы ординала X, в силу свойства линейности (0.3.292), либо B ∈ C, либо


B = C, либо C ∈ B. Поэтому (0.3.301) эквивалентно условию (0.3.293). Мы доказали существование
элемента B.
Теперь покажем, что B = ∩Y . По теореме 0.3.32, всякий элемент C ∈ Y ⊆ X является ординалом,
поэтому он наполнен, и значит из (0.3.293) следует

C ∈ Y & C 6= B ⇒ B ⊆ C.

Поскольку B ⊆ B, условие C 6= B можно отбросить:

C∈Y ⇒ B ⊆ C.

Из этого можно сделать вывод, что B ⊆ ∩Y . С другой стороны, B ∈ Y , поэтому ∩Y ⊆ B. Вместе


это означает равенство (0.3.294).
Лемма 0.3.34. Пусть X и Y – ординалы. Тогда

Y ⊆X ⇐⇒ (Y ∈ X ∨ Y = X), (0.3.302)

причем если Y ⊆ X и Y 6= X, то
Y = min(X \ Y ) (0.3.303)
Доказательство. Пусть X – ординал, Y – наполненный класс и Y ⊆ X. В утверждении (0.3.302)
импликация в левую сторону очевидна:

Y ⊆X ⇐= (Y ∈ X ∨ Y = X).

Если Y = X, то Y ⊆ X тривиально. Если же Y ∈ X, то Y ⊆ X по формуле (0.3.253), поскольку


класс X насыщен.
Докажем обратную импликацию

Y ⊆X =⇒ (Y ∈ X ∨ Y = X).

Пусть Y ⊆ X и Y 6= X. Тогда X \ Y 6= ∅, и по уже доказанному свойству 2◦ , класс X \ Y обладает


минимальным элементом:
B = min(X \ Y ).
Нам нужно показать, что Y = B (это докажет формулу (0.3.303), из которой будет следовать, что
Y = B ∈ X).
a. Покажем сначала, что Y ⊆ B. Пусть A ∈ Y . Из свойства линейности (0.3.292) следует, что
либо A ∈ B, либо A = B, либо B ∈ A. Покажем, что последние два варианта невозможны.
Действительно, если A = B, то вместе с A ∈ Y это дает B ∈ Y , что невозможно, потому
что B = min(X \ Y ), откуда B ∈ X \ Y . Если же B ∈ A, то получается B ∈ A ∈ Y , и,
поскольку Y наполнен, B ∈ Y , что опять противоречит условию B ∈ X \ Y . Мы получаем,
что A ∈ B, и это доказывает импликацию A ∈ Y ⇒ A ∈ B.
b. Покажем, что наоборот, B ⊆ Y . Пусть A ∈ B. Поскольку A ∈ B ∈ X, а класс X наполнен,
мы получаем, что A ∈ X. Нам нужно показать, что A ∈ Y . Если предположить, что это
не так, то есть A ∈ X \ Y , то из-за условия B = min(X \ Y ) это будет означать, что
A∈/ B, а это противоречит выбору A как элемента B. Значит действительно A ∈ Y , и это
доказывает импликацию A ∈ B ⇒ A ∈ Y .

Свойства ординалов:

1 Всякий непустой ординал X содержит пустой класс ∅ в качестве элемента,

∅ ∈ X, (0.3.304)

и имеет пустое пересечение:


∩X = ∅ (0.3.305)
Поэтому, в частности, минимальным элементом в ординале X является пустой класс:

min X = ∅. (0.3.306)
54 Глава 0. ТЕОРИЯ МНОЖЕСТВ

2◦ Пересечение X ∩ Y и объединение X ∪ Y любых двух ординалов X и Y являются ордина-


лами.
3◦ Если M – класс, элементами которого являются ординалы, то ∪M – ординал, и при
этом всякий ординал X ∈ M либо принадлежит ∪M , либо совпадает с ∪M :

X ∈M ⇒ X ∈ ∪M ∨ X = ∪M . (0.3.307)

4◦ Если M – непустой класс, элементами которого являются ординалы, то ∩M – ординал,


причем ∩M ∈ M , и всякий ординал X ∈ M либо содержит ∪M в качестве элемента,
либо совпадает с ∪M :

X∈M ⇒ ∩ M ∈ X ∨ ∩M = X . (0.3.308)

5◦ Если X и Y – ординалы, то либо X ⊆ Y , либо Y ⊆ X.


6◦ Если X и Y – ординалы, то либо X ∈ Y , либо Y ∈ X, либо X = Y .

Доказательство. 1. Первое утверждение следует из свойства 1◦ наполненных классов на с.46. Из


(0.3.304) мы получаем цепочку:

∅∈X =⇒ ∩X ⊆ ∅ =⇒ ∩X = ∅.

Формула (0.3.306) теперь следует из (0.3.296).


2. Если X и Y – ординалы, то они – наполненные классы, поэтому по свойству 2◦ на с.46 классы
X ∩ Y и X ∪ Y также наполнены. С другой стороны, элементами X ∩ Y и X ∪ Y являются элементы
X и Y , и эти элементы являются наполненными классами.
3. Пусть M – класс, элементами которого являются ординалы. По свойству 3◦ на с.46, класс
∪M наполнен. С другой стороны, из B ∈ ∪M следует, что B ∈ C для некоторого C ∈ M , который
является ординалом. Значит, его элемент B – наполненный класс. Это доказывает, что ∪M – орди-
нал. Теперь если X ∈ M , то в силу (0.3.162), X ⊆ ∩M , и поскольку X и ∪M – ординалы, по лемме
0.3.34, либо X ∈ ∪M , либо X = ∪M .
4. Пусть M – непустой класс, элементами которого являются ординалы. По уже доказанно-
му свойству 3◦ , всякий элемент X ∈ M либо принадлежит ординалу ∪M , либо совпадает с ним.
Рассмотрим два случая:
a. Если все элементы X ∈ M совпадают с ∪M , то есть M просто состоит из одного элемента,
X = ∪M , то ∩M = X = ∪M , и то, что утверждается, верно автоматически: ∩M = X ∈ M
и X = ∩M .
b. Если в M имеются элементы, отличные от ∪M , то положив N = M \ {∪M }, мы получим
∩N = ∩M . При этом по уже доказанному свойству 3◦ , N будет непустым классом в
ординале ∪M . По свойству 3◦ на с.51, ∩N = min N ∈ N ⊆ M , и отсюда ∩M = ∩N ∈ M .
Если теперь X ∈ M , то либо X ∈ N , и тогда в силу (0.3.293), ∩M = ∩N = min N ∈ X,
либо X ∈
/ N , и тогда X = ∪M .
5. Пусть X и Y – ординалы. По уже доказанному свойству 2◦ , X ∩ Y – тоже ординал. С другой
стороны, X ∩ Y ⊆ X, поэтому по лемме 0.3.34, либо X ∩ Y ∈ X, либо X ∩ Y = X. Во втором случае
X ⊆ Y . Если же X ∩ Y ∈ X, то отсюда следует что X ∩ Y ∈ / Y , потому что иначе мы получили бы
X ∩ Y ∈ X ∩ Y , что невозможно по следствию 1◦ из аксиомы регулярности MK-11 на с.36. Таким
образом, X ∩ Y – ординал, X ∩ Y ⊆ Y и X ∩ Y ∈
/ Y . Опять по лемме 0.3.34, мы получаем X ∩ Y = Y ,
и значит, Y ⊆ X.
6. Пусть X и Y – ординалы, причем пусть X 6= Y . По уже доказанному свойству 5◦ , X ⊆ Y или
Y ⊆ X. Если Y ⊆ X, то по лемме 0.3.34, Y ∈ X (поскольку Y 6= X). Если же X ⊆ Y , то опять по
лемме 0.3.34, X ∈ Y (поскольку X 6= Y ).

Класс Ord малых ординалов.


• Ординал X мы будем называть малым32 , если он является множеством.
• Символом Ord мы обозначаем класс всех малых ординалов:

Ord = {X : X – малый ординал} = {X : X – ординал}. (0.3.309)


32 Малые ординалы часто называют порядковыми числами.
§ 3. Теория множеств Морса-Келли 55

• На классе Ord удобно ввести отношение

A<B ⇐⇒ A ∈ B, A, B ∈ Ord, (0.3.310)

и отношение 
A6B ⇐⇒ A∈B ∨ A=B , A, B ∈ Ord . (0.3.311)

Из теоремы 0.3.33 следует

Теорема 0.3.35. Отношение < вполне упорядочивает класс Ord.

Свойства класса Ord:


1◦ Класс Ord – ординал, не являющийся множеством.

2 Не существует никаких других ординалов, кроме Ord и его элементов.
3◦ Класс X является ординалом тогда и только тогда, когда он наполнен и содержится в
Ord.
4◦ Если X ⊆ Ord, то ∪X – ординал.
5◦ Если ∅ =
6 X ⊆ Ord, то ∩X – ординал, причем ∩X ∈ X.
6◦ Если B, C ∈ Ord и ∀A < B A < C, то B ⊆ C.

Доказательство. 1. Пусть Y ∈ X ∈ Ord. Тогда, во-первых, Y – множество, а, во-вторых, по теореме


0.3.32, Y – ординал. Значит, Y ∈ Ord, и это доказывает наполненность Ord:

X ∈ Ord =⇒ X ⊆ Ord .

С другой стороны, всякий элемент X ∈ Ord является ординалом и значит, наполненным классом.
Вместо это означет, что Ord – ординал. Он не может быть множеством, потому что тогда мы полу-
чили бы Ord ∈ Ord, а это противоречит следствию 1◦ из аксиомы регулярности MK-11 на с.36.
2. Пусть X – ординал. По уже доказанному свойству 1◦ , Ord – тоже ординал. Поэтому по свойству
6◦ на с.54, либо X = Ord, либо X ∈ Ord, либо Ord ∈ X. Последнее – Ord ∈ X – невозможно, потому
что оно означало бы, что Ord – множество, а мы уже доказали в 1◦ , что это не так. Значит, остается
либо X = Ord, либо X ∈ Ord.
3. Если X – ординал, то по уже доказанному свойству 2◦ , либо X = Ord, либо X ∈ Ord. В первом
случае X тривиально содержится в Ord, а во втором это будет следствием того, что класс Ord,
будучи ординалом, наполнен:
X ∈ Ord ⇒ X ⊆ Ord .
Наоборот, если X – наполненный класс, содержащийся в ординале Ord, то по теореме 0.3.31, X
является ординалом.
4. Свойство 4◦ есть непосредственное следствие свойства 3◦ на с.54.
5. А свойство 5◦ сразу следует из свойства 4◦ на с.54.
6. Если B, C ∈ Ord, то условие ∀A < B A < C расшифровывается так: ∀A ∈ B A ∈ C. Это
как раз означает, что B ⊆ C.

Операция X 7→ S(X).
• Для всякого малого ординала X класс X ∪ {X} называется следующим ординалом после
X и имеет специальное обозначение:

S(X) = X ∪ {X} (0.3.312)

Оправданием этому термину служат следующие


Свойства операции X 7→ S(X):
1◦ Если X ∈ Ord, то S(X) ∈ Ord.
2◦ Если X ∈ Ord, то ∅ 6= S(X) и X 6= S(X).
3◦ Если X ∈ Ord, то S(X) является ∈-минимальным элементом класса {Y : Y ∈ Ord & X ∈
Y },
S(X) = min{Y : Y ∈ Ord & X ∈ Y }, (0.3.313)
56 Глава 0. ТЕОРИЯ МНОЖЕСТВ

4◦ Если X ∈ Ord, то
∪ S(X) = X ∈ S(X) (0.3.314)
5◦ Если X ∈ Ord, то
∪X ⊆ X ⊆ S(∪X), (0.3.315)
причем справедлива следующая альтернатива:
— либо в (0.3.315) выполняется равенство слева, эквивалентное неравенству спра-
ва:
∪X = X ⇔ X 6= S(∪X). (0.3.316)
— либо в (0.3.315) выполняется равенство справа, эквивалентное замене включе-
ния слева на символ принадлежности:

∪X ∈ X ⇔ X = S(∪X). (0.3.317)

6◦ Если X ∈ Ord, Y ∈ Ord и S(X) = S(Y ), то X = Y .


7◦ Если X ∈ Ord, Y ∈ Ord и S(X) ∈ S(Y ), то X ∈ Y .
8◦ Если X, Y ∈ Ord и X ∈ Y , то S(X) 6 Y .
Доказательство. 1. Пусть X ∈ Ord. Убедимся, что класс S(X) наполнен. Действительно, если
A ∈ B ∈ S(X) = X ∪ {X}, то либо A ∈ B = X, и значит, A ∈ X, либо A ∈ B ∈ X, и тогда A ∈ X,
в силу наполненности X. В любом случае, A ∈ X ⊆ S(X). С другой стороны, всякий элемент
B ∈ S(X) = X ∪ {X} либо совпадает с X, либо является элементом X. В обоих случаях B является
ординалом и значит, наполнен. Вместе это означает, что S(X) – ординал.
2. Если ∅ = S(X) = X ∪ {X}, то {X} ⊆ ∅, то есть X ∈ ∅, что невозможно. Если же X = S(X) =
X ∪ {X}, то {X} ⊆ X, то есть X ∈ X, что тоже невозможно.
3. Пусть X ∈ Ord. Обозначим Z = {Y : Y ∈ Ord & X ∈ Y }. В 1◦ мы уже доказали, что S(X) ∈
Ord. С другой стороны, X ∈ X ∪ {X} = S(X). Вместе эти два утверждения означают, что S(X) ∈ Z.
Покажем теперь, что это минимальный элемент в Z в смысле отношения ∈. Предположим, что
существует B ∈ Z такой, что B ∈ S(X) = X ∪ {X}. Тогда либо B = X, либо B ∈ X. В первом
случае, B = X, мы получаем
X ∈ B = X,

B∈Z

и это невозможно по следствию 1◦ из аксиомы регулярности MK-11 на с.36. А во втором случае,


B ∈ X, мы получим
X ∈ B ∈ X,

B∈Z

и это невозможно по следствию 2◦ на с.36. Это доказывает (0.3.313).


4. В формуле (0.3.314) второе равенство очевидно, X ∈ X ∪ {X} = S(X), а первое доказывается
цепочкой:

A ∈ ∪ S(X) ⇐⇒ ∃Y ∈ S(X) A ∈ Y ⇐⇒ ∈ X} ∨ ∃Y
|A {z | ∈X
{z A ∈ Y} ⇐⇒ A ∈ X.
| {z }
k Y ∈{X} ⇓
X ∪ {X} A∈Y ∈X

A∈X

5. В формуле (0.3.315) первое включение ∪X ⊆ X вытекает из наполненности класса X:


X – наполненный
класс
A ∈ ∪X ⇒ ∃B ∈ X A ∈ B ⇒ A∈B∈X ⇒ A ∈ X.

А второе, X ⊆ S(∪X), следует из (0.3.307):


(0.3.307)
A∈X ⇒ A ∈ ∪X ∨ A = ∪X ⇒ A ∈ (∪X) ∪ {∪X} = S(∪X).

Заметим далее, что поскольку X и S(∪X) – ординалы, по лемме 0.3.34, второе включение в (0.3.315),
X ⊆ S(∪X), эквивалентно условию

X ∈ S(∪X) ∨ X = S(∪X).
§ 3. Теория множеств Морса-Келли 57

Отсюда получается цепочка, доказывающая (0.3.316):

X 6= S(∪X) ⇔ X ∈ S(∪X) = (∪X) ∪ {∪X} ⇔ | ∈{z∪X} ∨ X = ∪X


X ⇔ X = ∪X

∃B ∈ X X ∈ B

X ∈B∈X

невозможно,
в силу 2◦ на с.36

А эквивалентность (0.3.317) доказывается цепочкой


(0.3.315)
∪X ∈ X ⇔ {∪X} ⊆ X ⇔ (∪X) ∪ {∪X} ⊆ X ⇔ S(∪X) = X
| {z }
k
S(∪X)


(0.3.315)
X

6. Пусть X ∈ Ord, Y ∈ Ord и S(X) = S(Y ). Тогда

X = (0.3.314) = ∪ S(X) = ∪ S(Y ) = (0.3.314) = Y.

7. Пусть X, Y ∈ Ord, тогда

S(X) ∈ S(Y ) =⇒ X ∪ {X} ∈ Y ∪ {Y } =⇒ X ∪ {X} ∈ Y ∨ X ∪ {X} ∈ {Y }


| {z } | {z } | {z } | {z }
k k ⇓ ⇓
X ∪ {X} Y ∪ {Y } {X} ⊆ Y X ∪ {X} = Y
⇓ ⇓
X ∈Y {X} ⊆ Y

X ∈Y

8. Для X, Y ∈ Ord мы получаем цепочку

X<Y ⇐⇒ X∈Y =⇒ X∈Y &X⊆Y =⇒ X ∪ {X} ⊆ Y =⇒ X 6 Y.


| {z } | {z }
⇑ k
Y – наполненный класс S(X)

Теорема 0.3.36. Класс M ⊆ Ord тогда и только тогда будет множеством, когда он содержится
в некотором малом ординале A ∈ Ord:

M ⊆ Ord & M ∈ Set ⇔ ∃A ∈ Ord M ⊆ A. (0.3.318)

Доказательство. Если M содержится в некотором малом ординале A, то поскольку A – множество,


M тоже должен быть множеством.
Пусть наоборот, M ⊆ Ord и M ∈ Set. Предположим, что M не содержится ни в каком ординале:

∀A ∈ Ord ∃B ∈ M B∈
/ A.

Поскольку класс Ord линейно упорядочен по отношению ∈, это условие можно переписать так:

∀A ∈ Ord ∃B ∈ M A ∈ B ∨ A = B.

Если вместо B подставить S(B), то можно это упростить:

∀A ∈ Ord ∃B ∈ M A ∈ B.

Это в свою очередь упрощается так:


Ord ⊆ ∪M.
Здесь ∪M – множество (в силу (0.3.163)), поэтому мы получаем, что класс Ord тоже должен быть
множеством, а это не так.
58 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Изолированные и предельные ординалы.


• Ординал X ∈ Ord называется
— изолированным, если X = ∅ или существует малый ординал Y ∈ Ord такой что
X = S(Y );
— предельным, если он не является изолированным, или, иными словами, если
X 6= ∅ и не существует Y ∈ Ord такое что X = S(Y ).

Теорема 0.3.37. Непустой ординал X ∈ Ord изолирован тогда и только тогда, когда

∪X ∈ X (0.3.319)

или, что эквивалентно,


X = S(∪X) (0.3.320)

Доказательство. Эквивалентность условий (0.3.319) и (0.3.320) доказана выше формулой (0.3.317).


Пусть X 6= ∅ и X – изолированное малый ординал, то есть X = S(Y ) для некоторого Y ∈ Ord.
Тогда выполняется (0.3.319):

(0.3.314) (0.3.314)
∪X = ∪ S(Y ) = Y ∈ S(Y ) = X.

Наоборот, если выполняется (0.3.319), ∪X ∈ X, то положив Y = ∪X, мы получим

X = (0.3.317) = S(∪X) = S(Y ).

Теорема 0.3.38. Непустой ординал X ∈ Ord пределен тогда и только тогда, когда33

∪X = X, (0.3.321)

или, что эквивалентно, когда


X 6= S(∪X) (0.3.322)

Доказательство. Эквивалентность условий (0.3.321) и (0.3.322) доказана в формуле (0.3.316). Даль-


ше применяется цепочка:

X 6= ∅ – предельный малый ординал ⇔


теорема 0.3.37
⇔ X 6= ∅ – не изолированный малый ординал ⇔ X 6= S(∪X).

Определения по индукции на ординалах. Следующее определение представляет собой мо-


дификацию определения на с.46.
• Говорят, что отображение h индуктивно определяет отображение f на ординалах, или
что отображение f на ординалах индуктивно определено отображением h, если
(i) область определения D(f ) отображения f является ординалом:

D(f ) ∈ Ord ∨ D(f ) = Ord, (0.3.323)

(ii) значение отображения f на всяком классе X ∈ D(f ) описывается равенством


(0.3.324):
∀X ∈ D(f ) f (X) = h(f |X ). (0.3.324)
(iii) f продолжает любое другое отображение со свойствами (i) и (ii): если g – какое-
то другое отображение, удовлетворяющее (i) и (ii), то g ⊆ f .

Теорема 0.3.39. Всякое отображение h индуктивно определяет единственное отображение f


на ординалах.
33 Условие (0.3.321) можно переписать так: ∀A ∈ X ∃B ∈ X : A ∈ B.
§ 3. Теория множеств Морса-Келли 59

Доказательство. По теореме 0.3.27 h индуктивно определяет некое отображение, обозначим его F .


Пусть Y = D(F ) ∩ Ord и f – ограничение F на Y :

f =F Y
.

Поскольку D(F ) и Ord – наполненные классы, их пересечение Y = D(F ) ∩ Ord – тоже наполненный
класс (по свойству 2◦ на с.46). При этом Y ⊆ Ord, поэтому по свойству 4◦ на с.55, Y – ординал.
Условие (0.3.324) выполняется для отображения f автоматически, и то же самое с условием (iii).
Из теоремы 0.3.29 сразу следует
Теорема 0.3.40. Пусть M – ординал, P – произвольный класс, и отображение h удовлетворяет
следующим условиям:
(i) для всякого ординала X ∈ M класс P X всех отображений f : X → P содержится в
области определения h:
∀X ∈ M P X ⊆ D(h), (0.3.325)
(ii) область значений h содержится в классе P :

R(h) ⊆ P. (0.3.326)

Тогда отображение h индуктивно определяет единственное отображение f : M → P .


Примером применения теоремы 0.3.39 является следующая теорема, которая понадобится нам
ниже при доказательстве леммы 0.3.55.
Теорема 0.3.41. Для всякого ординала X и любого его подкласса M ⊆ X найдется отображение
f : X ֒→ M со следующими свойствами:
(i) область определения D(f ) отображения f есть ординал (такой что D(f ) ⊆ X),
(ii) f является биекцией между D(f ) и M ,
(iii) f строго монотонно (сохраняет отношение принадлежности):

∀A, B ∈ D(f ) A∈B ⇐⇒ f (A) ∈ f (B). (0.3.327)

Доказательство. 1. Рассмотрим отображение


 
h(T ) = min M \ R(T )

(где R(T ) – область значений класса T , определенная формулой (0.3.220)). По теореме 0.3.39 оно
определяет некое отображение f , у которого область определения D(f ) является ординалом, и
 
∀Z ∈ D(f ) f (Z) = h(f |Z ) = min M \ R(f |Z ) .

2. Это отображение будет инъективно, потому что если A, B ∈ D(f ) и A 6= B, то либо A ∈ B,


либо B ∈ A. Будем считать, что A ∈ B. Тогда
 
f (A) ∈ R(f |B ) ⇒ f (A) ∈
/ M \ R(f |B ) ⇒ f (A) 6= min M \ R(f |B ) = f (B).

3. С другой стороны, f сюръективно, потому что если M \ R(f ) 6= ∅, то можно положить


(
g(A) =
f (A),
  A ∈ D(f ) ,
min M \ R(f ) , A = D(f )

и мы получим отображение g с областью определения D(g) = D(f ) ∪ {D(f )} = S(D(f )), более
широкой чем у f , но с теми же свойствами, что у f , и это будет означать, что g продолжает f ,
сохраняя его свойства, что невозможно по определению (на с.58) отображения, порожденного h.
4. Заметим далее, что отображение f нестрого монотонно:

A6B =⇒ f (A) 6 f (B) (0.3.328)

Это доказывается цепочкой


60 Глава 0. ТЕОРИЯ МНОЖЕСТВ

A6B ⇐⇒ A⊆B =⇒ f |A ⊆ f B =⇒ R(f |A ) ⊆ R(fB ) =⇒


   
=⇒ M \ R(f |A ) ⊇ M \ R(fB ) =⇒ min M \ R(f |A ) 6 min M \ R(fB )
| {z } | {z }
k k
f (A) f (B)

5. Поскольку отображение f инъективно, из его нестрогой монотонности (0.3.328) следует стро-


гая монотонность в одну сторону,
A<B =⇒ f (A) < f (B), (0.3.329)
а из нее – строгая монотонность в обе стороны:
A<B ⇐⇒ f (A) < f (B).
Действительно, если f (A) < f (B), то это сразу означает, что A 6= B, а из (0.3.329) следует, что
вариант A > B тоже отпадает, и поэтому остается только вариант A < B. Это доказывает условие
(0.3.327).
6. Нам остается доказать включение D(f ) ⊆ X. Для этого сначала нужно заметить, что из
(0.3.327) следует неравенство
∀A ∈ D(f ) A 6 f (A) (0.3.330)
Если D(f ) = ∅, то это неравенство выполняется тривиально, если же D(f ) 6= ∅, то оно доказывается
индукцией с использованием теоремы 0.3.43. Во-первых, из D(f ) 6= ∅ и D(f ) ∈ Ord сразу следует
∅ ∈ D(f )
Во-вторых, если (0.3.330) верно для какого-то A ∈ D(f ), то для S(A) ∈ D(f ) мы получаем
свойство 7◦ на с.56
A 6 f (A) < f (S(A)) =⇒ S(A) 6 f (S(A)).
И, в-третьих, если (0.3.330) верно для всех A ∈ B, где B ∈ D(f ), то
свойство 7◦ на с.55
∀A ∈ B A 6 f (A) < f (B) =⇒ B 6 f (B).
7. Теперь из (0.3.330) следует цепочка:
 
∀A ∈ D(f ) A 6 f (A) = min M \ R(f |A ) ∈ X
| {z }


∀A ∈ D(f ) A ∈ X

D(f ) ⊆ X

Доказательства по индукции. Следующие два утверждения имеют общее название: принцип


трансфинитной индукции.
Теорема 0.3.42 (принцип полной трансфинитной индукции). Пусть X – ординал и класс Y ⊆ X
обладает следующим свойством:
CT: если для какого-то ординала A ∈ X выполняется A ⊆ Y , то A ∈ Y .
Тогда Y = X.
Доказательство. Предположим, что Y 6= X. Тогда Z = X \ Y 6= ∅. Значит, по свойству 2◦ на с.55
Z обладает минимальным элементом
A = min Z.
Всякий элемент B ∈ A (то есть всякий элемент B < A) не лежит в Z, поэтому лежит в Y :
∀B ∈ A B ∈ Y.
Иными словами, A ⊆ Y . Значит, по условию CT, A ∈ Y , и поэтому A ∈
/ Z, а это противоречит
выбору A.
§ 3. Теория множеств Морса-Келли 61

! 0.3.29. Условие CT означает, между прочим, потому что ∅ ⊆ Y .


что
∅ ∈ Y,

Теорема 0.3.43 (принцип обыкновенной трансфинитной индукции). Пусть X – ординал и класс


Y ⊆ X обладает следующими свойствами:
OT-0: ∅ ∈ Y ;
OT-1: если B ∈ Y , то S(B) ∈ Y .
OT-2: если предельный ординал A ∈ X удовлетворяет условию

∀B < A B ∈ Y, (0.3.331)

то A ∈ Y .
Тогда Y = X.
Доказательство. Пусть A ∈ X и A ⊆ Y . Предположим сначала, что A – изолированный ординал,
то есть либо A = ∅, либо A = S(B) для некоторого B ∈ X. Тогда если A = ∅, то по условию OT-0,
A = ∅ ∈ Y . Если же A = S(B) для некоторого B ∈ X, то условие

Y ⊇ A = S(B) = B ∪ {B}

влечет за собой условие B ∈ Y , из которого в свою очередь в силу OT-1, мы получаем A = S(B) ∈ Y .
Если же A – предельный ординал, то для него условие

Y ⊇ A = {B : B ∈ A} = {B ∈ X : B < A}

эквивалентно условию (0.3.331), и по OT-2 мы снова получем, что A ∈ Y .


Вместе это означает выполнение условия CT теоремы (0.3.42), и значит, Y = X.

Конечные ординалы и аксиома бесконечности. Определение конечного ординала выглядит


усилением определения ординала на с.50.
• Класс X называется конечным ординалом, если он является изолированным ординалом34 ,
и любой его элемент Y ∈ X также является изолированным ординалом.
Следующая теорема аналогична теореме 0.3.32:
Теорема 0.3.44. Всякий элемент Y ∈ X произвольного конечного ординала X сам является ко-
нечным ординалом.
Доказательство. Ординал Y изолированный, поскольку он является элементом конечного орди-
нала. Если же Z ∈ Y , то мы получаем цепочку
X – наполненный X – конечный
класс ординал
Z∈Y ∈X =⇒ Z∈X =⇒ Z – изолированный ординал.

Таким образом, Y – изолированный ординал, и любой его элемент Z ∈ Y – тоже изолированный


ординал. Значит, Y – конечный ординал.
• Класс всех конечных ординалов обозначается символом FinOrd.

Свойства класса FinOrd:


1◦ Ординалы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, определенные выше формулами (0.3.279) — (0.3.288),
являются конечными ординалами:

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} ⊆ FinOrd (0.3.332)

2◦ Если X ∈ FinOrd, то S(X) ∈ FinOrd.


34 Изолированные ординалы были определены на с.58.
62 Глава 0. ТЕОРИЯ МНОЖЕСТВ

3◦ Класс FinOrd является ординалом.

Доказательство. 1. Свойство 1◦ очевидно.


2. Пусть X ∈ FinOrd, то есть X – конечный ординал. Если Y ∈ S(X) = X ∪ {X}, то либо
Y ∈ X, и тогда Y – изолированное малый ординал, потому у X, как у конечного ординала, все
элементы должны быть изолированными ординалами. Либо Y = X, и тогда Y – изолированный
ординал, потому что X, как конечный ординал, должно быть изолированным ординалом. Итак,
любой элемент Y ∈ S(X) – изолированный ординал. С другой стороны, S(X) – тоже изолированный
ординал (потому что имеет вид S(Y ) для Y = X). Вместе это означает, что S(X) – конечный
ординал.
3. Если A ∈ B ∈ FinOrd, то B – конечный ординал, и поэтому по теореме 0.3.44 A – тоже
конечный ординал. Значит, A ∈ FinOrd, и это доказывает наполненность класса FinOrd. С другой
стороны, всякий элемент B ∈ FinOrd является конечным ординалом, и значит, ординалом, и поэтому
наполнен. Вместе это значит, что FinOrd – ординал.
Из теоремы 0.3.40 следует

Теорема 0.3.45 (об определении индукцией на конечных ординалах). Пусть P – класс, и h –


отображение со следующими свойствами:
(i) для любого конечного ординала n ∈ FinOrd класс P n (состоящий из всевозможных отоб-
ражений f : n → P ) содержится в области определения D(h),

P n ⊆ D(h)

(в частности, P ∅ = {∅} ⊆ D(h)).


(ii) область значений h содержится в классе P :

R(h) ⊆ P.

Тогда формула
f (n) = h(f n ), n ∈ FinOrd (0.3.333)
однозначно определяет отображение f : FinOrd → P .
Следующая модификация теоремы 0.3.45 очень полезна в приложениях.
Теорема 0.3.46 (об определении индукцией на конечных ординалах). Пусть Q – класс, и H –
отображение, действующее из Q в Q:
H : Q → Q.
Тогда для всякого множества X ∈ Q правила

f (∅) = X, f (S(n)) = H(f (n)), n ∈ FinOrd, (0.3.334)

однозначно определяют отображение f : FinOrd → Q.


У теорем 0.3.42 и 0.3.43 имеются два важных аналога для случая, когда рассматриваемый класс
ординалов X содержится в множестве FinOrd. Эти аналоги называются принципами индукции (без
эпитета “трансфинитный”).

Теорема 0.3.47 (принцип полной индукции). Пусть класс Y ⊆ FinOrd обладает следующими
свойствами:
CI: если для какого-то числа n ∈ FinOrd выполняется n ⊆ Y , то n ∈ Y .
Тогда Y = FinOrd.
Доказательство. Это частный случай теоремы 0.3.42 с X = FinOrd.

! 0.3.30. Условие CI означает, между прочим, потому что ∅ ⊆ Y .


что
∅ ∈ Y,
§ 3. Теория множеств Морса-Келли 63

Теорема 0.3.48 (принцип обыкновенной индукции). Пусть класс Y ⊆ FinOrd обладает следую-
щими свойствами:
OI-0: ∅ ∈ Y ;
OI-1: если m ∈ Y , то S(m) ∈ Y .
Тогда Y = FinOrd.
Доказательство. Это частный случай теоремы 0.3.43 с X = FinOrd, только качественная разница
в том, что здесь условие OT-2 отпадает, потому что в FinOrd нет предельных ординалов (в силу
определения конечного ординала).
MK-13 Аксиома бесконечности: существует множество35 Y со следующими свойствами:
(i) ∅∈ Y;
(ii) если X ∈ Y , то X ∪ {X} ∈ Y .
Из этой аксиомы следует
Теорема 0.3.49. FinOrd ∈ Ord.
Доказательство. По свойству 3◦ на с.62, FinOrd – ординал. Поэтому нам нужно только доказать,
что FinOrd является множеством. Рассмотриме множество Y из аксиомы MK-13 и покажем, что
FinOrd ⊆ Y . По теореме 0.3.1 это будет означать, что FinOrd – тоже множество. Обозначим X =
Y ∩ FinOrd. Понятно, что X ⊆ FinOrd. Заметим, что
1. ∅ ∈ X, потому что ∅ ∈ Y по условию (i) аксиомы MK-13, а с другой стороны, ∅ ∈ FinOrd
в силу свойства 1◦ на с.61.
2. Если A ∈ X, то A ∈ Y , поэтому по условию (i) аксиомы MK-13, S(A) ∈ Y , а с другой
стороны, A ∈ FinOrd, поэтому в силу свойства 2◦ на с.61, S(A) ∈ FinOrd. В результате,
S(A) ∈ X.
Мы видим, что класс X удовлетворяет посылкам теоремы 0.3.48, значит X = Y ∩ FinOrd = FinOrd.
Отсюда FinOrd ⊆ Y .
Теорема 0.3.50. FinOrd является минимальным предельным ординалом.
Доказательство. Сначала покажем, что FinOrd – предельный ординал. По теореме 0.3.38 для этого
нужно убедиться, что
∪ FinOrd = FinOrd .
Вложение ∪ FinOrd ⊆ FinOrd следует из (0.3.315), нам нужно проверить обратное вложение, FinOrd ⊆
∪ FinOrd. Это следует из свойства 2◦ на с.61: если X ∈ FinOrd, то X ∈ S(X) ∈ FinOrd, поэтому
X ∈ ∪ FinOrd.
Мы поняли, что FinOrd – предельный ординал. Показать, что это минимальный ординал с таким
свойством, можно просто заметив, что никакой меньший ординал не будет предельным. Действи-
тельно, если X < FinOrd, то есть X ∈ FinOrd, то X – конечный ординал, и поэтому изолированный
ординал, то есть не предельный.

Операция наполнения X 7→ fill X. Полез- правилом


ность теорем 0.3.46 и 0.3.48 можно проиллюсти- (
ровать конструкцией, сопоставляющей любому ∪T, T 6= ∅
H(T ) =
множеству X наименьшее содержащее его напол- X, T = ∅
36
ненное множество, обозначаемое fill X и на-
Если считать, что Q = Set, то Q и H будут удо-
зываемое наполнением X.
влетворять посылке теоремы 0.3.46, и поэтому
формула (0.3.334) определяет некое отображение
f : FinOrd → Set. Обозначим
Зафиксируем произвольное множество X ∈
Set и определим отображение H : Set → Set filln X = f (n)
35 В аксиоме MK-13 важно утверждение, что Y является множеством, а не просто классом.
36 В смысле определения на с.45.
64 Глава 0. ТЕОРИЯ МНОЖЕСТВ

и заметим, что Доказательство. 1. Прежде всего,


[
fill0 X = X, fillS(n) X = ∪ filln X, X = fill0 X ⊆ filln X = fill X.
n ∈ FinOrd . n∈FinOrd

S
Действительно, во-первых, 2. Если Y ∈ fill X = n∈FinOrd filln X, то
Y ∈ filln X для некоторого n ∈ FinOrd. Приме-
fill0 X = f (0) = f (∅) = h(f ∅
) = h(∅) = X. няя (0.3.162), получаем
И, во-вторых,
Y ⊆ ∪ filln X = fillS(n) X ⊆ fill X.
fillS(n) X = f (S(n)) = H(f (n)) =
3. Пусть Y – наполненый класс, и X ⊆ Y .
= ∪f (n) = ∪ filln X.
Чтобы доказать включение fill X ⊆ Y , мы при-
Теперь наполнение fill X множества X опреде- меним теорему 0.3.48. Сначала заметим, что
ляется равенством
[ fill0 X = X ⊆ Y.
fill X = filln X. (0.3.335)
n∈FinOrd После этого предположим, что для некоторого
n ∈ FinOrd выполняется
Свойства наполнения:
◦ filln X ⊆ Y.
1 Всякое множество X содержится в своем
наполнении fill X:
Тогда
X ⊆ fill X (0.3.336)
fillS(n) X = ∪ filln X ⊆ (0.3.161) ⊆ ∪Y ⊆ Y.
2◦ Наполнение fill X любого множества X яв-
ляется наполненным множеством: 4. Если множество X наполнено, то подстав-
ляя Y = X в (0.3.338), мы получим
Y ∈ fill X =⇒ Y ⊆ fill X (0.3.337)

3◦ Если множество X содержится в наполнен- (X ⊆ X & ∪ X ⊆ X) =⇒ fill X ⊆ X,


ном классе Y , то его наполнение fill X так-
же содержится в Y : и вместе с (0.3.336) это дает (0.3.339). Наоборот,
если выполняется (0.3.339), то в силу (0.3.337),
(X ⊆ Y & ∪ Y ⊆ Y ) =⇒ множество X наполнено.
=⇒ fill X ⊆ Y. (0.3.338)
! 0.3.31. Свойства 1◦ , 2◦ и 3◦ вместе означают

4 Множество X наполнено тогда и только то, что мы говорили вначале: наполнение fill X
тогда, когда оно совпадает со своим напол- множества X является наименьшим наполнен-
нением: ным множеством (эквивалентно: классом), со-
X = fill X. (0.3.339) держащим X.

(f) Кардиналы и аксиома выбора


Аксиома выбора. Следующая аксиома — последняя в теории MK.
• Функцией выбора называется произвольное отображение c со следующими свойствами:
(i) областью определения c является класс Set \{∅} всех непустых множеств,
(ii) для всякого X ∈ Set \{∅} справедливо c(X) ∈ X,
MK-14 Аксиома выбора: существует функция выбора.

Теорема 0.3.51. Для любого множества X существует его биекция f : X → T на некоторый


малый ординал T ∈ Ord.

Доказательство. Напомним, что область значений R(M ) класса M была определена нами форму-
лой (0.3.220). Зафиксируем X и рассмотрим отображение

h(M ) = c (X \ R(M )), M ∈ Set,


§ 3. Теория множеств Морса-Келли 65

где c – функция выбора, существование которой декларируется аксиомой MK-14. По теореме 0.3.39
отображение h определяет единственное отображение f , определенное на некотором ординале D(f )
по формуле
f (Y ) = h(f Y ) = c (X \ R(f Y )), Y ∈ D(f ) ⊆ Ord .
Приглядимся к этому отображению f .
1. Заметим сначала, что f должно быть биекцией (между своими областью определения D(f )
и множеством значений R(f )). Действительно, предположим, что для некоторых A 6= B ∈ D(f )
выполняется f (A) = f (B). По свойству ординалов 6◦ на с.54 либо A ∈ B, либо B ∈ A. Будем
считать, что A ∈ B. Тогда f (A) ∈ R(f B ), и мы получаем такую импликацию:

f (B) = c (X \ R(f B
)) ∈ X \ R(f B ) ⇒ f (A) 6= f (B).
| {z }


f (A)

2. Заметим далее, что всегда

f (Y ) = c (X \ R(f Y
)) ∈ X \ R(f Y
) ⊆ X,

поэтому R(f ) ⊆ X. Отсюда по теореме 0.3.1 следует, что R(f ) – множество, а из этого по аксиоме
MK-12 на с.42 следует, что  
D(f ) = f −1 R(f −1 ) = f −1 D(f )
– тоже множество, и значит,
D(f ) ∈ Ord .
3. Поскольку D(f ) ∈
/ D(f ), по теореме 0.3.17 мы получаем

f (D(f )) = Set
| {z }
 k 
c X \ R(f D(f ) )
k 
c X \ R(f )

То есть 
c X \ R(f ) = Set .
/ D(c) = Set \{∅}. То есть должно быть X \ R(f ) = ∅, и,
Такое возможно только если X \ R(f ) ∈
поскольку R(f ) ⊆ X, мы получем
R(f ) = X.
Таким образом, f – биекция между D(f ) ∈ Ord и R(f ) = X.

Кардинальные числа.
• Говорят, что два множества X и Y равномощны, и обозначают это записью

X ≃ Y, (0.3.340)

если существует биекция f , областью определения которой является множество X, а об-


ластью значений – множество Y :

D(f ) = X & R(f ) = Y.

Если X ≃ Y ложно, то это обозначается записью

X 6≃ Y

Свойства отношения ≃:
1◦ Рефлексивность: всегда X ≃ X.
2◦ Симметричность: если X ≃ Y , то Y ≃ X.
3◦ Транзитивность: если X ≃ Y и Y ≃ Z, то X ≃ Z.
66 Глава 0. ТЕОРИЯ МНОЖЕСТВ

• Кардинальным числом называется всякий малый ординал P ∈ Ord, не равномощное ни-


какому своему элементу:
T ∈P ⇒ T ≃ 6 P. (0.3.341)
(то есть никакому меньшему ординалу). Класс всех кардинальных чисел обозначается
Card:
Card = {P : P – кардинальное число} (0.3.342)

Свойства класса Card:


1◦ Для всякого ординала T ∈ Ord найдется равномощный ему кардинал P ∈ Card.

2 На Card отношение равномощности ≃ эквивалентно равенству:

∀P, Q ∈ Card P ≃Q ⇔ P =Q (0.3.343)

Теорема 0.3.52. Существует отображение card : Set → Card со свойством

∀X ∈ Set card X ≃ X (0.3.344)

• Отображение card : Set → Card называется отображением мощности. Кардинал card X


называется мощностью множества X.

Доказательство. Определим отношение

card = {(X, P ) : X ≃ P & P ∈ Card} (0.3.345)

(то есть пара (X, P ) принадлежит классу card, если X равномощно P и P является кардиналом).
Если (X, P ) ∈ card и (X, Q) ∈ card, то X ≃ P и X ≃ Q, поэтому по свойствам 2◦ и 3◦ отношения
≃, P ≃ Q. С другой стороны, P, Q ∈ Card, поэтому в силу (0.3.343), P = Q, Поскольку это верно
для любых (X, P ) ∈ card и (X, Q) ∈ card, это означает, что отношение card – отображение. Условие
(0.3.344) следует из (0.3.345), и остается доказать, что card определено на всем классе Set. Это
следует из теоремы 0.3.51: всякое множество X ∈ Set равномощно некоторому ординалу T ∈ Ord,
который в свою очередь (по свойству 1◦ класса Card) равномощен некоторому кардиналу P ∈ Card,
поэтому (X, P ) ∈ card.

Теорема 0.3.53. Если X ∈ Ord, то

card X = min{Z ∈ Ord : Z ≃ X} (0.3.346)

Доказательство. Из card X ≃ X следует card X ∈ {Z ∈ Ord : Z ≃ X}, поэтому card X > min{Z ∈
Ord : Z ≃ X}. Если предположить, что неравенство строгое, card X > min{Z ∈ Ord : Z ≃ X}, то мы
получим
min{Z ∈ Ord : Z ≃ X} ≃ X ≃ card X,
то есть min{Z ∈ Ord : Z ≃ X} – ординал, равномощный card X, но меньший card X. Это означает,
что card X – не кардинал (потому что противоречит определению кардиналов).

Свойства мощности:
1◦ Если X, Y ∈ Set, то X ≃ Y тогда и только тогда, когда card X = card Y .
2◦ P ∈ Card тогда и только тогда, когда P ∈ Set и card P = P .
3◦ Если X ∈ Set, то card(card X) = card X.

Доказательство. 1. Если X ≃ Y , то
(0.3.344) (0.3.344) транзитивность ≃ (0.3.343)
card X ≃ X ≃Y ≃ card Y =⇒ card X ≃ card Y =⇒ card X = card Y.

Наоборот, если card X = card Y , то


(0.3.344) (0.3.344) транзитивность ≃
card X = card Y =⇒ X ≃ card X = card Y ≃ Y =⇒ X ≃ Y.
§ 3. Теория множеств Морса-Келли 67

2. Если P ∈ Set и card P = P , то P = card P ∈ Card. Наоборот, если P ∈ Card, то


(0.3.343)
| {z P} ≃ |{z}
card P =⇒ card P = P.


Card Card

3. Если X ∈ Set, то обозначив P = card X ∈ Card, мы по уже доказанному свойству 2◦ , получим

card(card X) = card P = P = card X.

Теорема 0.3.54. Для множеств X 6= ∅ и Y следующие условия эквивалентны:


(i) card X 6 card Y ,
(ii) существует инъективное отображение f : X → Y ,
(iii) существует сюръективное отображение g : Y → X.
Для доказательства нам понадобится несколько лемм.
Лемма 0.3.55. Если37 X ⊆ Y ∈ Ord, то card X 6 Y .
Доказательство. 1. Сразу заметим, что если X ∈ Ord, то это верно:

X, Y ∈ Ord & X ⊆ Y =⇒ card X 6 Y (0.3.347)

Действительно, в этом случае

card X = (0.3.346) = min{Z ∈ Ord : Z ≃ X} 6 X 6 Y.

2. Пусть X ⊆ Y ∈ Ord. Тогда по теореме 0.3.41 найдется отображение f : Y ֒→ Y , у которого


область определения D(f ) ⊆ Y является ординалом, и которое является биекцией между D(f ) и X.
Значит,
(0.3.347)
X ≃ D(f ) ⊆ Y =⇒ card X = card D(f ) 6 Y.

Лемма 0.3.56. Если X ⊆ Y ∈ Set, то card X 6 card Y .


Доказательство. Пусть X ⊆ Y ∈ Set. Поскольку Y ≃ card Y , найдется биекция f : Y → card Y . Ее
ограничение f |X на множество X также будет биекцией, поэтому по уже доказанному свойству 1◦ ,

card X = card R(f |X ).

С другой стороны, R(f |X ) ⊆ card Y , поэтому по лемме 0.3.55

card R(f |X ) 6 card Y.

Лемма 0.3.57. Для всякого отображения f

card R(f ) 6 card D(f ) (0.3.348)

Доказательство. Рассмотрим отображение

g(B) = c({A : f (A) = B}), B ∈ R(f ).

где c – функция выбора из аксиомы MK-14 на с.64. Отображение g будет инъективно, и значит,
биективно между D(g) = R(f ) и R(g) ⊆ D(f ). Применяя свойство мощности 1◦ и лемму 0.3.56, мы
получаем

R(f ) = D(g) ≃ R(g) ⊆ D(f ) =⇒ card R(f ) = card D(g) = card R(g) 6 card D(f ).

37 В лемме 0.3.55 X – произвольное подмножество в Y , необязательно ординал.


68 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Доказательство теоремы 0.3.54. 1. Докажем сначала импликацию (i) ⇒ (ii). Пусть card X 6
card Y . Пусть p : X → card X и q : Y → card Y – биекции, и r : card X → card Y – естествен-
ное вложение
r(A) = A, A ∈ card X.
Тогда отображение f = q −1 ◦ r ◦ p : X → Y является инъекцией, как композиция инъекций.
2. Далее докажем (ii) ⇒ (iii). Пусть дана инъекция f : X → Y . Поскольку X 6= ∅, найдется
элемент A ∈ X. Зафиксируем его и определим отображение
(
f −1 (B), B ∈ R(f )
g(B) = , B ∈ Y.
A, B∈/ R(f )

Это отображение g будет сюръективно.


3. Наконец, убедимся, что (iii) ⇒ (i). Пусть g : Y → X – сюръективное отображение. Тогда

card X = card R(g) 6 (0.3.348) 6 card D(g) = card Y.

Теорема 0.3.58 (Кантор, Бернштейн). Если A, B, X, Y ∈ Set и

X ≃ B


(0.3.349)
A ≃ Y

то X ≃ Y .
Доказательство. Здесь применяются только что доказанные свойства 1◦ и 4◦ : с одной стороны,

X≃B⊆Y =⇒ card X = card B 6 card Y,

а, с другой стороны,
Y ≃A⊆X =⇒ card Y = card A 6 card X.

⋄ 0.3.32. Всякий конечный ординал является Ясно, что отображение f можно переопределить
кардиналом: так, чтобы A переходило в B, а X в Y :

FinOrd ⊆ Card . (0.3.350) A X


❴ ❴
Для доказательства нам понадобится следу-
ющая  
B Y
Лемма 0.3.59. Если X, Y ∈ Ord и S(X) ≃ S(Y ),
то X ≃ Y . Это новое отображение g : S(X) → S(Y ) опреде-
Доказательство. Покажем, что если существу- ляется формулой
ет какая-то биекция f : S(X) → S(Y ), то суще-    
ствует и биекция g : S(X) → S(Y ), переводя- g = f \ (A, Y ), (X, B) ∪ (A, B), (X, Y )
щая элемент X ∈ S(X) = X ∪ {X} в элемент
Y ∈ S(Y ) = Y ∪ {Y }. Для этого обозначим и понятно, что оно также будет биекцией.
A = f −1 (Y ), B = f (X).

Если переход от A к Y и от X к B под действием Доказательство примера 0.3.32. Проведем ин-


отображения f обозначить стрелками 7→, то мы дукцию (то есть воспользуемся теоремой 0.3.48).
можем изобразить это картинкой Во-первых, ∅ ∈ Card, потому что не существу-
ет ординального числа, меньшего ∅. Во-вторых,
A❅ X пусть n ∈ FinOrd ∩ Card. Предположим, что
❅❅ ⑦⑦❃ S(n) ∈/ FinOrd ∩ Card, то есть существует k ∈
❅❅⑦
⑦ ❅❅ S(n) такой что k ≃ S(n). Поскольку k ∈ S(n) ⊆
~⑦⑦ ❅
B Y FinOrd, по теореме 0.3.50 мы получаем, что k –
§ 3. Теория множеств Морса-Келли 69

изолированный ординал. С другой стороны, от- Доказательство. Если X ≃ FinOrd для некото-
ношение k ≃ S(n) невозможно при k = ∅, по- рого X ∈ FinOrd, то
этому k 6= ∅. Значит, k – непустой изолирован-
ный ординал. То есть k = m + 1 для некоторого X ⊆ S(X) ⊆ FinOrd & FinOrd
| {z ≃ X}
m ∈ FinOrd. Для него мы получаем | {z }

⇓ лемма 0.3.56
card X 6 card S(X) 6 card FinOrd card FinOrd = card X
m + 1 = k ≃ S(n).
Отсюда по лемме 0.3.59,

m ≃ n. (0.3.351)
С другой стороны, из card X 6 card S(X) 6 card FinOrd = card X

m + 1 = k ∈ S(n) ⇓

по свойству 7 на с.56 следует
card S(X) = card X
m ∈ n. (0.3.352)
Условия (0.3.351) и (0.3.352) вместе означают, ⇓
что n – не кардинал, а это противоречит нашему
предположению n ∈ FinOrd ∩ Card. S(X) ≃ X.
⋄ 0.3.33. Множество FinOrd конечных ордина-
Это противоречит примеру (0.3.59), согласно ко-
лов является кардиналом:
торому элемент S(X) ∈ FinOrd должен быть кар-
FinOrd ∈ Card (0.3.353) диналом.

Теорема 0.3.60. Для всякого множества X справедливо неравенство

card X < card 2X . (0.3.354)

Доказательство. Рассмотрим отображение

f : X → 2X f (Y ) = {Y }, Y ∈ X.

Оно инъективно, поэтому


card X 6 card 2X .
Предположим, что здесь выполняется точное равенство:

card X = card 2X . (0.3.355)

Тогда существует некая биекция g между X и 2X . Рассмотрим множество

Z = {Y : Y ∈ X & Y ∈
/ g(Y )}. (0.3.356)

Поскольку g : X → 2X – биекция, должен существовать элемент T ∈ X, который под действием g


переходит в множество Z:
g(T ) = Z. (0.3.357)
Для этого элемента T мы получим:
(0.3.356) (0.3.357)
T ∈ g(T ) ⇐⇒ T ∈
/Z = g(T ).

Это противоречие опровергает наше предположение (0.3.355).

Биекции Ord ≃ Card и Ord ≃ Card \ FinOrd.


Теорема 0.3.61. Класс Card не является множеством.

Доказательство. Если предположить, что Card – множество, то мы получим цепочку, противоре-


чащую (0.3.354):
70 Глава 0. ТЕОРИЯ МНОЖЕСТВ

(0.3.163) теорема 0.3.2 теорема 0.3.52


Card ∈ Set =⇒ ∪ Card ∈ Set =⇒ 2∪ Card ∈ Set =⇒
(0.3.162)
=⇒ card 2∪ Card ∈ Card =⇒ card 2∪ Card ⊆ ∪ Card =⇒

свойство 3 , с.66 лемма 0.3.56  
=⇒ card 2∪ Card = card card 2∪ Card 6 card ∪ Card .

Теорема 0.3.62. Существует отображение f : Ord → Card со следующими свойствами:


(i) f является биекцией между Ord и Card,
(ii) f строго монотонно (сохраняет отношение принадлежности):

∀A, B ∈ Ord A∈B ⇐⇒ f (A) ∈ f (B). (0.3.358)

Доказательство. По теореме 0.3.41, существует сюръекция f : Ord ֒→ Card со свойствами (i) и (ii),
у которой область определения D(f ) является ординалом. Если предположить, что D(f ) 6= Ord, то по
свойству 3◦ на с.55, D(f ) ∈ Ord, и значит D(f ) является множеством. Тогда по аксиоме подстановки
MK-12 на с.42, R(f ) = Card тоже должно быть множеством, а это противоречит теореме 0.3.61.

Теорема 0.3.63. Существует отображение ℵ : Ord → Card \ FinOrd со следующими свойствами:


(i) ℵ является биекцией между Ord и Card \ FinOrd,
(ii) ℵ строго монотонно (сохраняет отношение принадлежности):

∀A, B ∈ Ord A∈B ⇐⇒ ℵ(A) ∈ ℵ(B). (0.3.359)

Доказательство. Здесь с минимальными изменениями используется прием из теоремы 0.3.62: по


теореме 0.3.41, существует сюръекция ℵ : Ord ֒→ Card со свойствами (i) и (ii), у которой область
определения D(ℵ) является ординалом. Если предположить, что D(ℵ) 6= Ord, то по свойству 3◦ на
с.55, D(ℵ) ∈ Ord, и значит D(ℵ) является множеством. Тогда по аксиоме подстановки MK-12 на с.42,
R(ℵ) = Card \ FinOrd тоже должно быть множеством, а это противоречит теореме 0.3.61.

Конечные и бесконечные множества.


• Множество X называется конечным, если у него мощность является конечным ординалом:

card X ∈ FinOrd .

В противном случае X называется бесконечным множеством.


• Класс всех конечных множеств мы будем обозначать Fin.

Свойства конечных множеств:


1◦ . Если f : X → Y – инъективное отображение и Y – конечное множество, то X – тоже
конечное множество.
2◦ . Если f : Y → X – сюръективное отображение и Y – конечное множество, то X – тоже
конечное множество.
3◦ . Всякое подмножество X любого конечного множества Y также является конечным
множеством.
4◦ . Разность X \ Y любого конечного множества X и любого другого множества Y тоже
является конечным множеством.
5◦ . Пересечение X ∩ Y любого конечного множества X с любым другим множеством Y
тоже является конечным множеством.
6◦ . Объединение X ∪ Y любых двух конечных множеств X и Y тоже является конечным
множеством.
7◦ . Если X – конечное множество, и любой его элемент Y ∈ X – тоже конечное множе-
ство, то поэлементное объединение ∪X – тоже конечное множество.
8◦ . Декартово произведение X × Y любых двух конечных множеств X и Y тоже является
конечным множеством.
§ 3. Теория множеств Морса-Келли 71

Доказательство. 1. Если f : X → Y – инъективное отображение и Y – конечное множество, то по


теореме 0.3.54 мы получаем:
card X 6 card Y ∈ FinOrd .
Если в первом знаке стоит равенство, то мы получаем card X = card Y ∈ FinOrd, а если стро-
гое неравенство, то мы получаем card X ∈ card Y ∈ FinOrd, и, в силу наполненности FinOrd, как
ординала, card X ∈ FinOrd.
2. Если f : Y → X – сюръективное отображение и Y – конечное множество, то снова применяется
теорема 0.3.54.
3. Свойство 3◦ следует из леммы 0.3.56.
4. Если X – конечное множество, то для любого множества Y мы получаем X \ Y ⊆ X, и по уже
доказанному свойству 3◦ , X \ Y должно быть конечно.
5. Если X – конечное множество, то для любого множества Y мы получаем X ∩ Y ⊆ X, и по
уже доказанному свойству 3◦ , X ∩ Y должно быть конечно.
6. Пусть X и Y – конечные множества. Чтобы доказать, что их объединение X ∪ Y конечно, мы
рассмотрим несколько случаев.
a) Прежде всего, рассмотрим случай, когда множество Y состоит из одного элемента, Y = {y},
не лежащего в X: y ∈/ X. Рассмотрим кардинал n = card X и выберем биекцию f : X → n. Тогда
отображение (
f (T ), T ∈ X
g(T ) = ,
S(n), T = y
будет биекцией g : X ∪ Y → S(n). Поэтому card(X ∪ Y ) = S(n), и мы получаем, что множество X ∪ Y
конечно.
b) Следующий случай – когда X и Y не пересекаются. Здесь проводится индукция по мощности
множества Y . Если card Y = ∅, то

card Y = ∅ =⇒ Y =∅ =⇒ X ∪Y =X =⇒ card(X ∪ Y ) = card X ∈ FinOrd,

и X ∪ Y – конечное множество. Далее, предположим, что мы доказали это для всех множеств Y
мощности card Y = n. Пусть card Y = S(n). Выделим какой-нибудь элемент z ∈ Y и рассмотрим
множество Y \ {z}. Его мощность будет равна n,

card(Y \ {z}) = n,

поэтому по нашему предположению, множество X ∪ (Y \ {z}) конечно. Теперь если добавить к нему
не пересекающееся с ним одноэлементное множество {z}, то это будет в точности рассмотренный
случай a), и мы получаем, что множество

X ∪ (Y \ {z}) ∪ {z} = X ∪ Y

– тоже конечно. Это завершает индукцию.


с) Последний случай – когда X и Y могут пересекаться. Тогда мы можем рассмотреть множество
Y \ X, которое по уже доказанному свойству 4◦ будет конечным, и не будет пересекаться с X, и по
доказанному в пункте b), множество

X ∪ (Y \ X) = X ∪ Y

должно быть конечным.


7. Свойство 7◦ доказывается индукцией по мощности X. Если card X = ∅, то X = ∅, и ∪X = ∅ –
конечное множество. Предположим, мы доказали, что ∪X – конечное множество для всех множеств
X мощности n ∈ FinOrd. Пусть теперь X – множество мощности S(n). Зафиксируем какой-нибудь
элемент z ∈ X. Тогда множество X \ {z} будет иметь мощность n, и по нашему предположению, его
поэлементное объединение ∪(X \ {z}) также будет конечным. Отсюда по уже доказанному свойству
6◦ , множество  
∪ (X \ {z}) ∪ z = ∪X
также должно быть конечным.
8. Пусть X и Y – конечные множества. Представим их декартово произведение X × Y как
объединение классов X × {y}, где y ∈ Y :
[
X ×Y = X × {y}
y∈Y
72 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Каждый класс X × {y} равномощен множеству X, поэтому он будет конечен. А множество таких
классов
{X × {y}; y ∈ Y }
равномощно Y и поэтому тоже конечно. Значит, по уже доказанному свойству 7◦ , объединение этих
классов [
X ×Y = X × {y} = ∪{X × {y}; y ∈ Y }
y∈Y

– тоже конечное множество.


Теорема 0.3.64. Если X – конечное множество, Y ⊆ X и card Y = card X, то Y = X.
Доказательство. Это утверждение удобно переформулировать так: если X – конечное множество,
Y ⊆ X и Y 6= X, то card Y 6= card X. Чтобы это доказать, заметим, что условия Y ⊆ X и Y 6= X
влекут за собой условие X \ Y 6= ∅. Зафиксируем какой-нибудь элемент x ∈ X \ Y и рассмотрим
произвольную биекцию f : card Y → Y . Правило
(
f (z), z ∈ card Y
g(z) =
x, z = card Y

определяет некую биекцию g : card S(Y ) = card Y ∪ {card Y } → Y ∪ {x}, поэтому

card(Y ∪ {x}) = card S(Y ).

С другой стороны, g можно рассматривать как инъекцию g : card S(Y ) → X, поэтому по теореме
0.3.54,
card S(Y ) = card(card S(Y )) 6 card X.
Вместе это дает цепочку
card Y < card S(Y ) 6 card X,
откуда и получается card Y 6= card X.
Теорема 0.3.65. Множество X бесконечно тогда и только тогда, когда существует инъектив-
ное отображение f : FinOrd → X.
Доказательство. Множество X бесконечно, тогда и только тогда, когда его мощность card X боль-
ше любого конечного ординала n ∈ FinOrd, то есть не меньше кардинала FinOrd, или, что то же
самое, мощности FinOrd:
card X > FinOrd = card FinOrd .
По теореме 0.3.54, это эквивалентно существованию инъективного отображения f : FinOrd → X.
Теорема 0.3.66. Множество X бесконечно тогда и только тогда, когда оно имеет равномощное
себе подмножество, не совпадающее с X.
Для доказательства нам понадобится следующая
Лемма 0.3.67. Если FinOrd 6 A ∈ Card, то A ≃ A \ {∅}.
Доказательство. Формула (
S(n), n ∈ FinOrd
f (n) =
n, n∈/ FinOrd
определяет биекцию между A и A \ {∅}.
Доказательство теоремы 0.3.66. Если существует Y ⊆ X такое что Y 6= X и card Y = card X, то
по теореме 0.3.64 это несовместимо с условием конечности X. Значит, X будет бесконечным.
Наоборот, пусть X бесконечно. Тогда card X > FinOrd. Рассмотрим какую-нибудь биекцию g :
card X → X и положим
Y = R(g card X\{∅} ).
Тогда Y 6= X, и при этом
лемма 0.3.67
Y ≃ card X \ {∅} ≃ card X ≃ X.
§ 3. Теория множеств Морса-Келли 73

Следующая теорема аналогична теореме 0.3.36:

Теорема 0.3.68. Множество M ⊆ FinOrd тогда и только тогда конечно, когда оно содержится
в некотором конечном ординале A ∈ FinOrd:

M ⊆ FinOrd & M ∈ Fin ⇔ ∃A ∈ FinOrd M ⊆ A. (0.3.360)

Доказательство. Если M содержится в некотором конечном ординале A, то, поскольку A – конеч-


ное множество, M тоже будет конечным множеством.
Пусть наоборот M ⊆ FinOrd и M ∈ Fin. Предположим, что M не содержится ни в каком
конечном ординале:
∀A ∈ FinOrd ∃B ∈ M B ∈ / A.
Поскольку класс FinOrd линейно упорядочен по отношению ∈, это условие можно переписать так:

∀A ∈ FinOrd ∃B ∈ M A ∈ B ∨ A = B.

Если вместо B подставить S(B), то можно это упростить:

∀A ∈ FinOrd ∃B ∈ M A ∈ B.

Это в свою очередь упрощается так:


FinOrd ⊆ ∪M.

Здесь ∪M – множество (в силу свойства 7 на с.70), поэтому мы получаем, что класс FinOrd тоже
должен быть конечным множеством, а это не так.

Последовательности и их декартовы произведения. После того, как определен класс FinOrd


конечных ординалов полезно определить понятие последовательности, встречающееся повсюду в
математике.
• Бесконечной последовательностью, или просто последовательностью называется произ-
вольное отображение x : FinOrd → Set (имеющее областью определения класс FinOrd
всех конечных ординалов). Значения такого отображения часто записывают с помощью
нижнего индекса
xn = x(n), n ∈ FinOrd .
а само отображение – в виде семейства {xn ; n ∈ FinOrd} или {xn }.
• Конечной последовательностью называется произвольное отображение x, имеющее обла-
стью определения конечный ординал:

D(x) ∈ FinOrd .

Точно так же значения такого отображения часто записывают с помощью индексов

xk = x(k), k ∈ n = D(x).

а само это отображение – в виде семейства {xk ; k ∈ n}. Ординал n при этом называется
длиной последовательности {xk ; k ∈ n}.
• Конечная последовательность длины n называется также строкой длины n. При этом
строку длины 2 удобно называть парой, строку длины 3 — тройкой, строку длины 4 —
четверкой, строку длины 5 — пятеркой, строку длины 6 — шестеркой, и так до строки
длины 9, которую называют девяткой38 .

⋄ 0.3.34. Введенное здесь понятие пары как по- потому что всякой последовательности a : 2 →
следовательности длины 2 согласуется с поняти- Set длины 2 естественным образом можно сопо-
ем упорядоченной пары множеств (X, Y ), опре- ставить упорядоченную пару множеств (X, Y )
деленной выше формулой (0.3.186)

(X, Y ) = {{X}, {X, Y }}, X = a0 , Y = a2 ,


38 Напомним, что ординалы от 0 до 9 были определены выше формулами (0.3.279)-(0.3.288).
74 Глава 0. ТЕОРИЯ МНОЖЕСТВ

и наоборот, любой упорядоченной паре множеств соответствие последовательность a : 2 → Set.


(X, Y ) по тем же формулам можно поставить в

Напомним, что декартово произведение классов X × Y было определено нами выше формулой
(0.3.202):
X × Y = {(A, B) : A ∈ X & B ∈ Y }.
Обобщением этого понятия на случай большего числа множителей можно считать следующую кон-
струкцию.
• Заметим, что в соответствии с обозначением (0.3.238), множество всех последовательно-
стей длины n со значениями в множестве Y естественно обозначать символом Y n :

x∈Yn ⇐⇒ x:n→Y (0.3.361)

Множество Y n называется декартовой степенью множества Y .


• Пусть X0 , ...Xk конечная последовательность множдеств. Их декартовым произведением
называется множество
k
Y
X0 × ... × Xk = Xi = {t ∈ {X0 , ..., Xk }k+1 : ∀i ∈ K ti ∈ Xi } (0.3.362)
i=0

Теорема 0.3.69. Пусть X0 , ..., Xn+1 – последовательность множеств. Тогда


Y  Y
Xi × Xn+1 ∼ = Xi (0.3.363)
i∈n i∈n+1

Доказательство. Отображение
Y  Y    
f: Xi × Xn+1 → Xi f (x0 , ..., xn ), xn+1 = x0 , ..., xn , xn+1
i∈n i∈n+1

является биекцией.

(g) Ранг множества и полное упорядочение Set


Не только новичку, но и опытному математику класс Set всех множеств обычно кажется каким-то
необъятным образованием, у которого не может быть никакого внятного описания. В теории MK
этот стереотип чудесным образом удается преодолеть. Здесь мы опишем замечательную конструк-
цию, которая позволяет рассыпать класс Set на семейство подмножеств SetA , индексированных
малыми ординалами A ∈ Ord. Это позволяет доказать теорему39 о полном упорядочении класса
Set, которую можно считать одной из вершин теории Морса-Келли.

Ранг множества. Напомним, что выше (0.3.221) мы определили значение g(X) любого класса g
на любом множестве X. Заметим, что если g – множество, то класс ординалов

{A ∈ Ord : ∀T (g(T ) ∈ Ord ⇒ g(T ) ∈ A)} = {A ∈ Ord : R(g) ∩ Ord ⊆ A}

непуст: поскольку g – множество, R(g) – тоже множество, значит R(g) ∩ Ord – тоже множество, и по
теореме 0.3.36, R(g) ∩ Ord ⊆ A для некоторого A ∈ Ord.
Рассмотрим отображение

h(g) = min{A ∈ Ord : ∀T (g(T ) ∈ Ord ⇒ g(T ) ∈ A)} = min{A ∈ Ord : R(g) ∩ Ord ⊆ A}, g ∈ Set

Оно определено всюду на Set и принимаeт значения в Ord, поэтому по теореме 0.3.28 h индуктивно
определяет некое отображение rank : Set → Ord формулой (0.3.324):

rank X = h(rank X
) = min{A ∈ Ord : R(rank X
) ∩ Ord ⊆ A} (0.3.364)

• Рангом множества X называется ординал rank X, определенный формулой (0.3.364).


39 См. ниже теорему 0.3.72.
§ 3. Теория множеств Морса-Келли 75

Свойства ранга множеств:


1◦ rank X 6 B ∈ Ord тогда и только тогда, когда ∀T ∈ X rank T ∈ B.
2◦ Если X ∈ Y , то rank X ∈ rank Y .
3◦ Если X ⊆ Y , то rank X 6 rank Y .
4◦ rank(X ∪ Y ) = rank X ∪ rank Y .
5◦ rank(∪X) = ∪{rank Y : Y ∈ X} 6 rank X.
6◦ rank{X} = rank S(X).
7◦ rank 2X = rank S(X).
8◦ Если A ∈ Ord, то rank A = A.

Доказательство. 1. Пусть B ∈ Ord. Тогда условие ∀T ∈ X rank T ∈ B эквивалентно условию

R(rank X
) ∩ Ord = {rank T ; T ∈ X} ∩ Ord = {rank T ; T ∈ X} ⊆ B.

которое в свою очередь эквивалентно условию

B ∈ {A ∈ Ord : R(rank X
) ∩ Ord ⊆ A}

и условию
B > min{A ∈ Ord : R(rank X
) ∩ Ord ⊆ A} = rank A.

2. Пусть X ∈ Y . Тогда, очевидно, rank X ∈ R(rank Y ), а с другой стороны, rank X ∈ Ord, поэтому
rank X ∈ R(rank Y ) ∩ Ord. Поэтому если для какого-то ординала A справедливо R(rank Y ) ∩ Ord ⊆
A, то автоматически справедливо и rank X ∈ A. Это можно переформулировать так, что rank X
принадлежит пересечению всех таких A, и поэтому мы получаем цепочку

rank X ∈ ∩{A ∈ Ord R(rank Y


) ∩ Ord ⊆ A} = (0.3.296) =
= min{A ∈ Ord R(rank Y
) ∩ Ord ⊆ A} = (0.3.364) = rank Y.

3. Пусть X ⊆ Y . Тогда по уже доказанному свойству 2◦ , если T ∈ X, то T ∈ Y , и значит


rank T ∈ rank Y . Это можно понимать так, что rank Y – одно из тех множеств A ∈ Ord, для которых
справедливо включение R(rank X ) ∩ Ord ⊆ A:

rank Y ∈ {A ∈ Ord : R(rank X


) ∩ Ord ⊆ A}.

Как следствие,
rank Y > min{A ∈ Ord : R(rank X
) ∩ Ord ⊆ A} = rank X.
4. Прежде всего, из X ⊆ X ∪ Y следует, в силу уже доказанного свойства 3◦ , что rank X 6
rank(X ∪ Y ), и точно так же из Y ⊆ X ∪ Y следует, что rank Y 6 rank(X ∪ Y ). Это в свою очередь
означает в силу (0.3.302), что

rank X ⊆ rank(X ∪ Y ) & rank Y ⊆ rank(X ∪ Y ).

Поэтому
rank X ∪ rank Y ⊆ rank(X ∪ Y ). (0.3.365)
Докажем теперь обратное включение. Для этого заметим такую цепочку:

T ∈X ∪Y =⇒ T ∈X ∨ T ∈Y =⇒
=⇒ rank T ∈ rank X ∨ rank T ∈ rank Y =⇒ rank T ∈ rank X ∪ rank Y.

Это можно понимать так, что ординал rank X ∪ rank Y содержится в классе всех ординалов A, для
которых выполняется условие
R(rank X∪Y ) ∩ Ord ⊆ A.
Или, иными словами,

rank X ∪ rank Y ∈ {A ∈ Ord : R(rank X∪Y


) ∩ Ord ⊆ A}.
76 Глава 0. ТЕОРИЯ МНОЖЕСТВ

Понятно, что rank X ∪ rank Y должен быть не меньше минимума этого множества:
rank X ∪ rank Y > min{A ∈ Ord : R(rank X∪Y
) ∩ Ord ⊆ A} = (0.3.364) = rank(X ∪ Y ).
Опять в силу (0.3.302) мы получаем
rank X ∪ rank Y ⊇ rank(X ∪ Y ),
Вместе с (0.3.365) это дает 4◦ .
5. Во-первых, из цепочки
T ∈ ∪X =⇒ ∃Y ∈ X T ∈ Y =⇒ ∃Y ∈ X rank T ∈ rank Y =⇒ rank T ∈ ∪{rank Y ; Y ∈ X}
следует включение
∪{rank Y ; Y ∈ X} ∈ {A ∈ Ord : R(rank ∪X
) ∩ Ord ⊆ A}
а из него – неравенство
∪{rank Y ; Y ∈ X} > min{A ∈ Ord : R(rank ∪X
) ∩ Ord ⊆ A} = rank ∪X. (0.3.366)
Во-вторых, из цепочки
Y ∈X =⇒ Y ⊆ ∪X =⇒ rank Y 6 rank ∪X
следует неравенство
∪{rank Y ; Y ∈ X} 6 rank ∪X.
которое вместе с (0.3.366) это дает равенство в 5◦ :
∪{rank Y ; Y ∈ X} = rank ∪X.
В-третьих, из цепочки
Y ∈X =⇒ rank Y ∈ rank X =⇒ rank Y 6 rank X
мы получаем неравенство в 5◦ :
∪{rank Y ; Y ∈ X} 6 rank X.

6. Равенство 6 доказывается прямым вычислением:

rank{X} = min{A ∈ Ord : R(rank {X}


) ∩ Ord ⊆ A} =
= min{A ∈ Ord : {rank X} ⊆ A} = min{A ∈ Ord : rank X ∈ A} = rank S(X).
7. С одной стороны,
X ∈ 2X =⇒ rank X ∈ rank 2X =⇒ rank S(X) 6 rank 2X .
А, с другой,
Y ∈ 2X =⇒ Y ⊆X =⇒ rank Y 6 rank X < rank S(X).
Последнее верно для всякого Y ∈ 2X , поэтому, по уже доказанному свойству 1◦ ,
rank 2X 6 rank S(X).
Вместе то и другое дает 7◦ .
8. Последнее свойство доказывается индукцией по ординалу A. Пусть X – класс ординалов,
для которых верно равенство rank A = A. Рассмотрим произвольный ординал A ∈ Ord, такой, что
A ⊆ X, то есть удовлетворяющий условию40
∀B ∈ A rank B = B.
Тогда
R(rank A
) = R({rank B; B ∈ A}) = R({B; B ∈ A}) = A,
и
rank A = min{C ∈ Ord : R(rank A
) ∩ Ord ⊆ C} = min{C ∈ Ord : A ⊆ C} = A.
То есть A ∈ X. По теореме 0.3.42 это означет, что X = Ord.
40 Можно заметить, хотя это не входит в формальное требование теоремы 0.3.42, которую мы собираемся применить,

что ∅ удовлетворяет этому условию, потому что rank ∅ = min{C ∈ Ord : ∅ ∩ Ord ⊆ C} = min Ord = ∅.
§ 3. Теория множеств Морса-Келли 77

Теорема 0.3.70. Для всякого малого ординала A ∈ Ord класс

SetA = {X : rank X ∈ A} (0.3.367)

является множеством, и удовлетворяет равенству


[
SetA = 2SetB (0.3.368)
B: B∈A

Доказательство. Докажем сначала (0.3.368). Пусть X ∈ SetA , то есть rank X ∈ A. Положим B =


rank X ∈ A. Тогда для всякого T ∈ X мы в силу свойства 2◦ на с.75 получим rank T ∈ rank X = B,
следовательно, X ⊆ {T : rank T ∈ B} = SetB , то есть X ∈ 2SetB . Мы доказали вложение
[
SetA ⊆ 2SetB .
B: B∈A
S
Наоборот, пусть X ∈ B: B∈A 2SetB , то есть X ∈ 2SetB для некоторого B ∈ A. Это значит, что
X ⊆ SetB = {T : rank T ∈ B}, то есть для всякого T ∈ X выполняется rank T ∈ B. Из определения
rank формулой (0.3.364) мы получаем, что rank X 6 B ∈ A, и значит, X ∈ SetA . Таким образом,
доказано вложение [
SetA ⊇ 2SetB
B: B∈A

и вместе с ним, вся формула (0.3.368).


Теперь покажем, что для всякого малого ординала A ∈ Ord класс SetA является множеством.
Это доказывается индукцией по теореме 0.3.42. При A = ∅ мы получаем

SetA = Set∅ = {X : rank X ∈ ∅} = ∅ ∈ Set .

Предположим, что при некотором A ∈ Ord это верно для всех B ∈ A:

∀B B∈A =⇒ SetB ∈ Set .

Тогда по теореме 0.3.2


∀B B∈A =⇒ 2SetB ∈ Set,
и поэтому [
SetA = (0.3.368) = 2SetB ∈ Set .
B: B∈A

Свойства SetA :
1◦ X ⊆ SetA тогда и только тогда, когда rank X 6 A.
2◦ rank SetA = A.
3◦ Наполненность: X ∈ SetA =⇒ X ⊆ SetA .
4◦ Если A ∈ B, то SetA ∈ SetB (и поэтому SetA ⊆ SetB ).
5◦ 2SetA = SetS(A) .
S
6◦ Если A – предельный ординал41 , то SetA = B: B∈A SetB .

S
7 Set = A: A∈Ord SetA .
Доказательство. 1. Первое свойство здесь эквивалентно свойству 1◦ на с.75:

X ⊆ SetA ⇐⇒ ∀Y ∈ X rank Y < A ⇐⇒ rank X 6 A.

2. Во-первых, ∀X ∈ SetA rank X ∈ A, поэтому по свойству 1◦ на с.75 rank SetA 6 A. Во-вторых,


∀B ∈ A rank B = B ∈ A (по свойству 8◦ на с.75), поэтому B ∈ SetA . Это означает включение
A ⊆ SetA , из которого по свойству 3◦ на с.75 следует A = rank A 6 rank SetA .
3. Если Y ∈ X ∈ SetA , то rank Y < rank X < A, поэтому rank Y < A и значит Y ∈ SetA .
4. Если A ∈ B, то в силу уже доказанного свойства 2◦ , rank SetA = A < B, поэтому SetA ∈ SetB .
41 Предельные орлиналы были определены выше на с.58.
78 Глава 0. ТЕОРИЯ МНОЖЕСТВ

5. Здесь применяется уже доказанное свойство 1◦ :

X ∈ 2SetA ⇐⇒ X ⊆ SetA ⇐⇒ rank X 6 A ⇐⇒ rank X < S(A) ⇐⇒ X ∈ SetS(A) .

6. Пусть A – предельный ординал. Тогда

X ∈ SetA ⇐⇒ rank X < A ⇐⇒ ∃B < A rank X < B ⇐⇒


[
⇐⇒ ∃B < A X ∈ SetB ⇐⇒ X∈ SetB .
B: B∈A

∈ Set, то существует A ∈ Ord такой что rank X < A, поэтому X ∈ SetA . Иными
7. Если X S
словами, X ∈ A: A∈Ord SetA .

Полное упорядочение Set. Напомним, что понятие полного порядка было введено на с.50.
Теорема 0.3.71. На каждом множестве X можно ввести отношение полного порядка.
Доказательство. По теореме 0.3.51 существует биекция f : X → T на некоторый малый ординал
T ∈ Ord. Правило
A ≺ B ⇐⇒ f (A) ∈ f (B), A, B ∈ X,
определяет полный порядок на X.
Теорема 0.3.72. На классе Set всех множеств можно ввести отношение полного порядка.
Доказательство. Для каждого малого ординала A ∈ Ord класс SetA является по теореме 0.3.70
множеством, поэтому по теореме 0.3.71 на SetA существует (хотя бы один) полный порядок. Если
обозначить через WA класс всевозможных полных порядков на SetA , то, во-первых, он будет непуст
(потому что, как мы уже говорили, существует хотя бы один полный порядок на SetA ), а, во-вторых,
он будет множеством (потому что каждый полый порядок на SetA содержится в SetA × SetA , и
значит WA содержится в множестве 2SetA × SetA ).
Мы получаем, что {WA ; A ∈ Ord} ⊆ Set \{∅}. Значит, к классам WA можно применить функцию
выбора c : Set \{∅} → Set (из аксиомы MK-14 на с.64), и для каждого A ∈ Ord мы получим некий
полный порядок ≺A = c(WA ) ∈ WA на SetA . Теперь определим отношение ≺ на Set правилом:
X ≺ Y , если
— либо rank X ∈ rank Y ,
— либо rank X = rank Y = A, и X ≺A Y .
Отношение ≺ будет полным порядком на Set.
Глава 1

МАТЕМАТИЧЕСКАЯ ЛОГИКА

Глядя на шаги, по которым в главе 0 строилась теория множеств, нетрудно представить, как, меняя
какие-то элементы этой конструкции, можно построить другую подобную теорию. Например, можно
менять аксиомы самой теории (если варьировать аксиомы MK-1 – MK-14, оставив все остальные
элементы неизменными, то будут получаться различные варианты теории множеств, каковых много
в математике). Точно так же можно менять язык теории (алфавит и сигнатуру), и даже аксиомы
логики и правила вывода LK-0 – LK-151 . При этом будут получаться конструкции, называемые
формальными теориями (понятно, что они могут сильно отличаться друг от друга).
Изучением таких теорий, построенных по примеру уже описанной нами теории множеств, зани-
мается наука, называемая математической логикой. Сами теории такого вида имеют специальное
название: формальные теории, или формальные системы, или теории первого порядка. В этой главе
мы опишем основные выводы этой науки, увиденные глазами сторонника гильбертовской филосо-
фии формализма (в том смысле как мы описали это на с.v).
Понятия и результаты этой главы будут полезны ниже в главе 4 о стандартных функциях при
объяснении трудностей построения Исчисления (Calculus, см. с.301).

§1 Логика предикатов для общей формальной теории


(a) Синтаксис.
Определение формальной теории.
• Формальная теория T над логикой предикатов состоит из языка теории и ее дедуктивного
аппарата. Эти компоненты определяются следующими правилами.
I. Язык формальной теории (над логикой предикатов) представляет из себя алфавит, сигнатуру
и правила построения формул.
1. Алфавит A формальной теории T описывается указанием символов, которые называ-
ются переменными данного языка. Эта часть конструкции считается произвольной, и,
поскольку в этой науке нам понадобится много разных букв вне алфавита, мы для удоб-
ства условимся использовать более узкий алфавит, чем тот, что описывался на с.7 для
построенного там варианта теории множеств:
• Переменной в формальной теории мы будем считать произвольную строку символов,
составленную по следующим правилам:
— всякая строчная буква латинского алфавита

a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z,

является переменной,
— если x – переменная, то добавляя к ней штрих ′ мы получаем новую переменную:

x′ , x′′ , ...
1 В качестве примера читатель может поглядеть на правила интуиционистской логики, которые мы приводим на

с.116.

79
80 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

2. Сигнатура формальной теории представляет собой список используемых в ней специаль-


ных символов, не входящих в алфавит, которые делятся на функциональные и предикат-
ные.
a. Предикатные символы интутитивно представляют собой обозначения для элементар-
ных высказываний об объектах (как символы ∈ и = в теории множеств). Каждому
предикатному символу P приписывается конечный ординал n, называемый валентно-
стью предиката P , и его интуитивный смысл – число переменных, необходимых для
высказывания P .
b. Функциональные символы интуитивно представляют собой обозначения для элемен-
тарных операций в данном языке (как + и · в арифметике). Как и в случае с преди-
катными символами, каждому функциональному символу F приписывается конечный
ординал n, называемый валентностью символа F , интуитивный смысл которого –
число переменных, необходимых для операции F .
3. Далее вводится понятие терма, под которым понимается фрагмент формулы, состав-
ленный посредством функциональных символов, без предикатных. Точное определение
выглядит так: термом называется произвольная строка символов, построенная по следу-
ющим правилам
— всякая переменная является термом,
— всякий функциональный символ валентности 0 является термом,
— если τ1 , ..., τn – термы, и F – функциональный символ валентности n, то строка

F (τ1 , ..., τn ) (1.1.1)

– также терм. В частном случае, когда валентность F равна 2, принято для краткости
вместо (1.1.1) писать
τ1 F τ2
(как это делается в теории групп с символом умножения ·, см. ниже пример 1.1.4).
4. После этого формулой данного языка объявляется произвольная строка символов, постро-
енная по следующим правилам:
— если τ1 , ..., τn – термы, и P – предикатный символ валентности n, то строка

P (τ1 , ..., τn ) (1.1.2)

– формула. В частном случае, когда валентность P равна 2, принято для краткости


вместо (1.1.2) писать
τ1 P τ2
(как это делается в теории множеств с символом принадлежности ∈, см. (0.2.22));
— если строка ϕ – формула, то строка ¬ (ϕ) – тоже формула;
— если строки ϕ и ψ – формулы, то следующие строки – тоже формулы:

(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ), (ϕ) ⇔ (ψ),

— если x – переменная, а ϕ – формула, то следующие строки – тоже формулы:

∀x (ϕ), ∃x (ϕ). (1.1.3)

Как и раньше, для обозначения формул мы используем греческие буквы.


• Мы будем говорить, что формулы α и β равны, и изображать это записью

α = β,

если α и β совпадают как строчки символов.


Для дальнейших объяснений нам понадобятся определения, аналогичные тем, что дава-
лись на с.8 и 8.
• Вхождение переменной x в формулу ϕ называется связанным, если в этом вхождении
x стоит сразу после какого-то квантора, или α попадает в область действия какого-то
квантора по x. В противном случае это вхождение называется свободным.
§ 1. Логика предикатов для общей формальной теории 81

• Переменная x в формуле ϕ называется связанной переменной в ϕ, если все ее вхож-


дения в ϕ связаны. В противном случае x называется свободной переменной формулы
ϕ.
• Если формула ϕ не содержит свободные переменные, то ϕ называется замкнутой.
Если же в ϕ имеются свободные переменные, то ϕ называется открытой формулой.
• Подстановкой терма τ вместо переменной x в формулу ϕ называется формула, полу-
чающаяся из ϕ заменой всех свободных вхождений переменной x в формуле ϕ на терм
τ . Мы обозначаем такую формулу символом

ϕ (1.1.4)
x=τ

• Подстановка ϕ называется корректной, если при замене x на τ никакая перемен-


x=τ
ная, входящая в τ , не попадает в область действия квантора по этой переменной. Это
эквивалентно тому, что каждое свободное вхождение переменной x в формулу ϕ не
должно содержаться в области действия кванторов по переменным, входящим в терм
τ.
II. Дедуктивный аппарат формальной теории состоит из аксиом теории и логического ис-
числения.
1. Аксиомы формальной теории представляют собой произвольную выбранную совокуп-
ность A формул языка теории.
2. Логическое исчисление состоит из аксиом логики и правил вывода, описывающих ло-
гику предикатов для данного языка. Им может быть исчисление секвенций LK, описан-
ное нами на с.10 для языка теории множеств (качественно отличающегося от общего
случая отсутствием функциональных символов), которое для языка общего вида (с
функциональными символами) должно быть усложнено соглашением что в правилах
вывода LK-12 и LK-15 вместо переменной y позволено подставлять произвольный терм.
Весь список правил удобно привести снова, несмотря на повторения (всюду, кроме LK-
12 и LK-15). Прежде всего, аксиома для общего исчисления секвенций LK та же, что и
в исчислении для теориий множеств: для любой формулы ϕ выводима секвенция

LK-0: ϕ ⊢ ϕ. (1.1.5)

Остальные правила следующие.


a. Структурные правила:
— ослабление:
Γ ⊢∆ Γ ⊢∆
LK-1: (1.1.6)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:

ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
LK-2: (1.1.7)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:

ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
LK-3: (1.1.8)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— сечение:
Γ ⊢ ∆, ϕ ϕ, Π ⊢ Λ
LK-4: (1.1.9)
Γ, Π ⊢ ∆, Λ

b. Правила введения логических связок:


— переброс отрицания:

Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
LK-5: (1.1.10)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
82 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— конъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
LK-6: (1.1.11)
Γ ⊢ ∆, ϕ&χ
— конъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
LK-7: (1.1.12)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— дизъюнкция в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
LK-8: (1.1.13)
ϕ ∨ χ, Γ ⊢ ∆
— дизъюнкция в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
LK-9: (1.1.14)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— перенос с импликацией в антецедент:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
LK-10: (1.1.15)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
LK-11: (1.1.16)
Γ ⊢ ∆, ϕ ⇒ χ
— добавление квантора всеобщности в антецедент: если подстановка
ϕ x=τ корректна2 (здесь x — переменная, а τ – терм), то

ϕ x=τ , Γ ⊢ ∆
LK-12:∗ (1.1.17)
∀x ϕ, Γ ⊢ ∆
— добавление квантора всеобщности в сукцедент: если переменная y
не входит (как свободная переменная) в нижнюю секвенцию (то
есть в наборы формул Γ , ∆, ∀x ϕ), то
Γ ⊢ ∆, ϕ x=y
LK-13: (1.1.18)
Γ ⊢ ∆, ∀x ϕ
— добавление квантора существования в антецедент: если переменная
y не входит (как свободная переменная) в нижнюю секвенцию (то
есть в наборы формул ∃x ϕ, Γ , ∆), то
ϕ x=y
,Γ ⊢ ∆
LK-14: (1.1.19)
∃x ϕ, Γ ⊢ ∆
— добавление квантора существования в сукцедент: если подстановка
ϕ x=τ корректна3 (здесь x — переменная, а τ – терм), то

Γ ⊢ ∆, ϕ x=τ
LK-15:∗ (1.1.20)
Γ ⊢ ∆, ∃x ϕ
Подобно тому как это делалось на с.12 для теории MK, деревом Генцена в формальной теории
называется произвольная картинка
Γ ′′′ ⊢∆′′′ Γ ′′′′ ⊢∆′′′′
Γ ′ ⊢∆′ Γ ′′ ⊢∆′′
, (1.1.21)
χ⊢ψ
в которой внизу выписана какая-то одна секвенция, а каждый переход сверху вниз представляет
собой применение одного из правил вывода LK-1 — LK-15. При этом секвенция в самом низу
(здесь это χ ⊢ ψ) называется корнем, а секвенции на самом верху (в данном случае Γ ′′′ ⊢ ∆′′′ и
Γ ′′′′ ⊢ ∆′′′′ ) — вершинами этого дерева.
2 Определение корректной подстановки дано на с. 8.
3 См. определение на с. 8.
§ 1. Логика предикатов для общей формальной теории 83

• Дерево Генцена считается выводом в формальной теории T , если каждая его вершина
является
— либо аксиомой исчисления секвенций LK, то есть секвенцией вида ϕ ⊢ ϕ, где
ϕ — какая-нибудь аксиома теории T ,
— либо секвенцией вида ⊢ α, где α — какая-нибудь аксиома теории T (то есть
формула из списка A аксиом этой теории).
• Секвенция Γ ⊢ ∆ называется выводимой в теории T , если у нее есть вывод в теории
T.
• Формула ω формальной теории T называется
— выводимой (или теоремой теории T ), если в T выводима секвенция ⊢ ω;
— опровержимой, если ее отрицание, ¬ω, выводимо в теории T .
• Формальная теория T называется теорией с равенством, если в ее сигнатуру включен специ-
альный символ =, а в систему аксиом – следующие аксиомы, называемые аксиомами равенства:
— аксиомы эквивалентности для равенства:

x=x (1.1.22)
x=y ⇒ y=x (1.1.23)
(x = y & y = z) ⇒ x=z (1.1.24)

— аксиомы инвариантности функциональных и предикатных символов:


a. Для любого функционального символа F валентности n и для любых двух строк пере-
менных x1 , ..., xn и y1 , ..., yn длины n задается аксиома4

(x1 = y1 & ... & xn = yn ) ⇒ F (x1 , ..., xn ) = F (y1 , ..., yn ). (1.1.25)

b. Для любого предикатного символа P валентности n и для любых двух строк переменных
x1 , ..., xn и y1 , ..., yn длины n задается аксиома5
 
(x1 = y1 & ... & xn = yn ) & P (x1 , ..., xn ) ⇒ P (y1 , ..., yn ). (1.1.26)

• Если T — формальная теория с равенством, то для ее аксиом, не являющихся аксиомами ра-


венства, полезно выделить специальное название. Мы условимся называть такие аксиомы содер-
жательными аксиомами теории T .

⋄ 1.1.1. Теория множеств Морса-Келли MK, по- но представить как формальную теорию с равен-
строенная нами выше в § 2 и § 3, является приме- ством над логикой предикатов, у которой сигна-
ром формальной теории с равенством. Это тео- тура состоит из единственного двуместного пре-
рия над логикой предикатов, ее сигнатура состо- дикатного символа сравнения 6 (не считая дву-
ит из единственного двуместного предикатного местного предикатного символа равенства =), а
символа принадлежности ∈ (не считая двумест- содержательными аксиомами считаются форму-
ного предикатного символа равенства =), а акси- лы
омы – утверждения MK-1 – MK-14, приведенные
в § 3. x6x (1.1.27)
⇒ x=y
x6y &y6x (1.1.28)
⋄ 1.1.2. Наивная теория множеств NST, по-
строенная в § 1 этой главы, также является при- x6y &y6z ⇒ x6z (1.1.29)
мером формальной теории с равенством. Это
⋄ 1.1.4. Теорию групп, также часто используе-
также теория над логикой предикатов, у нее та-
мую в алгебре и анализе, можно представить как
кая же сигнатура, как у MK, а система аксиом
формальную теорию с равенством. Ее сигнатура,
NST-1—NST-7 описана на с.4.
состоит (помимо двуместного предикатного сим-
⋄ 1.1.3. Теорию частичного порядка, используе- вола равенства =) из функционального символа
мую в разных разделах алгебры и анализа, мож- 1 (валентности 0) и функционального символа ·
4В (1.1.25) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.61.
5В (1.1.26) запись k 6 n понимается как неравенство в классе конечных ординалов, определенных выше на с.61.
84 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

(валентности 2) с содержательными аксиомами x + S(y) = S(x + y) (1.1.36)


(x · y) · z = x · (y · z) (1.1.30) x·0=0 (1.1.37)
x·1=x & 1·x=x (1.1.31) x · S(y) = x · y + x (1.1.38)
   
∀x ∃y x·y =1 & y·x = 1 (1.1.32) ϕ x=0 & ∀y ϕ x=y ⇒ ϕ ⇒ ϕ
x=S(y)

⋄ 1.1.5. Арифметика Пеано PA определяется (1.1.39)


как формальная теория с равенством над логи-
кой предикатов с сигнатурой, состоящей из сим-
вола 0 валентности 0, символа S валентности 1, где ϕ – произвольная формула, для которой под-
двух символов + и · валентности 2, и следующи- становка ϕ x=y будет корректна (в этом случае
ми содержательными аксиомами: подстановка ϕ x=S(y) тоже будет корректна, а
подстановка ϕ x=0 всегда корректна). Можно за-
¬(0 = S(x)) (1.1.33)
метить, что в этом примере число аксиом беско-
S(x) = S(y) ⇒ x = y (1.1.34) нечно: строка (1.1.39) описывает не одну аксио-
x+0=x (1.1.35) му, а то, что называется схемой аксиом.

Отношения следствия и эквивалентности между формулами.

Теорема 1.1.1 (об импликации). Секвенция α, Γ ⊢ ∆, β выводима тогда и только тогда, когда
выводима секвенция Γ ⊢ ∆, α ⇒ β.

• Говорят, что формула β следует из формулы α в теории T , если в T выводима секвенция


α ⊢ β.6 Из теоремы 1.1.1 следует, что это эквивалентно выводимости секвенции ⊢ α ⇒ β.

Доказательство. В прямую сторону это следует из правила LK-11:

α, Γ ⊢ ∆, β
(1.1.16)
Γ ⊢ ∆, α ⇒ β.

Это дерево Генцена надо понимать так, что если у его вершины — секвенции α, Γ ⊢ ∆, β — есть
вывод, то его можно пристроить к этой вершине сверху, и мы получим дерево, являющееся выводом
для секвенции Γ ⊢ ∆, α ⇒ β.
В обратную же сторону это утверждение следует из выведенной ранее секвенции (0.2.49):

α, α ⇒ β ⊢ β
(1.1.8)
Γ ⊢ ∆, α ⇒ β α ⇒ β, α ⊢ β
(1.1.9)
Γ, α ⊢ ∆, β
(1.1.8)
α, Γ ⊢ ∆, β

Опять это дерево надо понимать так, что если у его левой вершины — секвенции Γ ⊢ ∆, α ⇒ β —
есть вывод, то его можно пристроить к этой вершине сверху, затем к правой вершине — секвенции
α, α ⇒ β ⊢ β — нужно будет пристроить ее вывод, который мы получили на с.13, и мы в результате
получим дерево, являющееся выводом для секвенции α, Γ ⊢ ∆, β.

Теорема 1.1.2 (о транзитивности). Если выводимы секвенции Γ ⊢ α и α ⊢ ∆, то выводима и


секвенция Γ ⊢ ∆.

! 1.1.6. Если формулу α заменить здесь каким-нибудь набором (из более чем одной формулы)
Θ, то это утверждение утрачивает силу: из выводимости секвенций Γ ⊢ Θ и Θ ⊢ ∆ не следует
выводимость секвенции Γ ⊢ ∆.
6 Мы уже определяли это отношение между формулами выше на с.13.
§ 1. Логика предикатов для общей формальной теории 85

Доказательство. Это частный случай правила сечения LK-4:

Γ ⊢α α⊢∆
(1.1.9)
Γ ⊢∆

Теорема 1.1.3. Если выводима секвенция α ⊢ β, то для любой формулы γ выводима секвенция
β ⇒ γ ⊢ α ⇒ γ.
Доказательство. Пусть выводима секвенция α ⊢ β. Тогда по теореме 1.1.1 выводима секвенция

⊢ α ⇒ β.

Вспомним секвенцию (0.2.54), которую мы вывели выше:

α ⇒ β ⊢ (β ⇒ γ) ⇒ (α ⇒ γ).

Вместе эти две секвенции по теореме 1.1.2 дают выводимость секвенции

⊢ (β ⇒ γ) ⇒ (α ⇒ γ).

Снова применяя теорему 1.1.1, мы получаем выводимость секвенции

β ⇒ γ ⊢ α ⇒ γ.

• Если в теории T выводимы секвенции α ⊢ β и β ⊢ α, то говорят, что формулы α и β


эквивалентны в теории T . Из теоремы 1.1.1 следует, что это эквивалентно выводимости
секвенции ⊢ α ⇔ β. Условимся эквивалентность формул α и β обозначать записью

α ∼ β.

Теорема 1.1.4. Если α ∼ β, то


(i) выводимость секвенции Γ ⊢ ∆, α эквивалентна выводимости секвенции Γ ⊢ ∆, β.
(ii) выводимость секвенции α, Γ ⊢ ∆ эквивалентна выводимости секвенции β, Γ ⊢ ∆.
Доказательство. 1. Из выводимости секвенции α ⊢ β следует, что в дереве (получающемся приме-
нениям правила сечения LK-4)
Γ ⊢ ∆, α α ⊢ β
(1.1.9)
Γ ⊢ ∆, β
если левая вершина выводима, то и корень тоже выводим. И такой же вывод получается если
поменять местами α и β.
2. Точно так же, применениям правила сечения LK-4, доказывается (ii).

Свойства эквивалентных формул:7


1◦ Если α ∼ β, то
¬α ∼ ¬β, (1.1.40)
и для всякой переменной x

∀x α ∼ ∀x β, ∃x α ∼ ∃x β. (1.1.41)

2◦ Если α1 ∼ β1 и α2 ∼ β2 , то

α1 & α2 ∼ β1 & β2 , α1 ∨ α2 ∼ β1 ∨ β2 , , α1 ⇒ α2 ∼ β1 ⇒ β2 . (1.1.42)

Доказательство. Эти свойства можно считать очевидными.


7 Эти свойства не распространяются на отношение следствия между формулами. Например, если β следует из α,

то из этого нельзя заключить, что ¬β следует из ¬α. Все же применение логических операций & и ∨ и кванторов ∀
и ∃ сохраняет отношение следствия.
86 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Отношение выводимости между формулами в формальной теории. Вариант исчисления


секвенций LK, описанный нами на с.10, был частным случаем этого исчисления для языка теории
множеств. Общий случай качественно не отличается, но для порядка все же мы должны дать для
него основные определения отдельно. В частности, вот определения выводимости в формальной
теории.
• Говорят, что формула ω выводима из набора формул Σ в формальной теории T , если существует
дерево Генцена, в котором в корне стоит секвенция ⊢ ω, а на вершинах либо аксиомы теории
LK (то есть секвенции вида α ⊢ α, где α — произвольная формула теории T ), либо секвенции
вида ⊢ β, где β — произвольная аксиома теории T , либо секвенции ⊢ σ, где σ — произвольная
формула из Σ:
α⊢α ⊢β ⊢σ
... ... ...
. (1.1.43)
⊢ω
• В частном случае, если Σ состоит из одной формулы, σ, говорят, что формула ω выводится из
формулы σ в теории T .
• В другом частном случае, если Σ совсем не содержит формул, говорят, что формула ω выводится
в теории T , а дерево (1.1.43), принимающее вид
α⊢α ⊢β
... ...
, (1.1.44)
⊢ω
где α — произвольная формула теории T , а β — произвольная аксиома теории T , называется
выводом формулы ω в теории T .
Пусть T – формальная теория и σ – формула в ней. Условимся символом T + σ обозначать
формальную теорию, полученную из T присоединением формулы σ к списку аксиом. Заметим, что
следующие условия эквивалентны:
(a) ω выводится из σ в T ,
(b) ω выводится в T + σ.
По аналогии с теоремой о дедукции для LK 0.2.6 доказывается
Теорема 1.1.5 (о дедукции для произвольной теории T ). Пусть ω – формула и Σ — конечный
набор формул в формальной теории T . Рассмотрим два условия:
(a) ω следует из Σ в T ,
(b) ω выводится из Σ в T .
Тогда:
(i) условие (a) влечет условие (b),
(ii) если формулы Σ замкнуты, то условие (b) влечет условие (a) (то есть в этом случае
(a) и (b) равносильны).

Замыкание всеобщности.
• Пусть α — формула формальной теории T , и пусть x1 , ..., xn — ее свободные переменные.
Тогда замыканием всеобщности α формулы α называется формула

∀x1 ... ∀xn α.

• Пусть T — формальная теория с системой аксиом Σ. Если каждую формулу α в Σ за-


менить на ее замыкание всеобщности α, то мы получим систему аксиом некоторой новой
формальной теории T , которую мы будем называть замыканием формальной теории T .
По аналогии с предложением 0.2.4 доказывается
Предложение 1.1.6. В формальной теории T всякая формула α и ее замыкание всеобщности α
выводятся друг из друга.
Отсюда сразу следует
Теорема 1.1.7. Выводимость формулы ω в формальной теории T эквивалентна ее выводимости
в замыкании T теории T .
§ 1. Логика предикатов для общей формальной теории 87

Противоречивость и непротиворечивость.

Теорема 1.1.8. Для формулы ϕ в теории T следующие условия эквивалентны:


(i) формула ϕ одновременно выводима и опровержима в теории T (то есть в теории T
выводимы формулы ϕ и ¬ϕ),
(ii) в T выводима формула ϕ & ¬ϕ,
(iii) в T выводима формула ϕ ⇔ ¬ϕ.

Доказательство. 1. (i)⇒(ii). Рассмотрим дерево

⊢ ϕ ⊢ ¬ϕ
(1.1.11)
⊢ ϕ & ¬ϕ

Если в T выводимы формулы ϕ и ¬ϕ, то подклеив их выводы к вершинам этого дерева, мы получим
вывод формулы ϕ & ¬ϕ.
2. (ii)⇒(iii). Вспомним выведенную выше секвенцию (0.2.76),

α & β ⊢ α ⇒ β. (1.1.45)

Подставив ϕ вместо α, а ¬ϕ вместо β, мы получим секвенцию

ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ,

которая также выводима. Подклеим ее вывод к правой вершине дерева

⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ ϕ ⇒ ¬ϕ
(1.1.11)
⊢ ϕ ⇒ ¬ϕ

Если теперь выводима формула ϕ & ¬ϕ, то подклеив ее вывод к левой вершине, мы получим вывод
формулы ϕ ⇒ ¬ϕ.
Точно также заменив в (1.1.45) α на ¬ϕ, а β на ϕ, мы получим выводимую секвенцию

¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ.

Подклеим ее вывод к правой вершине дерева

⊢ ¬ϕ & ϕ ¬ϕ & ϕ ⊢ ¬ϕ ⇒ ϕ
(1.1.11) (1.1.46)
⊢ ¬ϕ ⇒ ϕ

Теперь если выводима формула ϕ & ¬ϕ, то, в силу выводимости секвенции (0.2.52), выводима и
формула ¬ϕ & ϕ. Подклеив ее вывод к левой вершине дерева (1.1.46), мы получим вывод формулы
¬ϕ ⇒ ϕ.
Мы получили, что если выводима формула ϕ & ¬ϕ, то выводимы формулы ϕ ⇒ ¬ϕ и ¬ϕ ⇒ ϕ.
Значит, выводима формула ϕ ⇔ ¬ϕ.
3. (iii)⇒(i). Пусть выводима некоторая формула ϕ ⇔ ¬ϕ, то есть секвенция

⊢ ϕ ⇔ ¬ϕ.

Это означает выводимость секвенций


⊢ ϕ ⇒ ¬ϕ
и
⊢ ¬ϕ ⇒ ϕ.
По теореме 0.2.3 это эквивалентно выводимости секвенций

ϕ ⊢ ¬ϕ

и
¬ϕ ⊢ ϕ.
88 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Выводимость первой из них влечет выводимость формулы ¬ϕ в силу дерева


ϕ ⊢ ¬ϕ
(1.1.10)
⊢ ¬ϕ, ¬ϕ
(1.1.7)
⊢ ¬ϕ
А выводимость второй влечет выводимость формулы ϕ в силу дерева
¬ϕ ⊢ ϕ
(1.1.10)
⊢ ϕ, ¬(¬ϕ) ¬(¬ϕ) ⊢ ϕ (0.2.75)
(1.1.7)
⊢ ϕ, ϕ
(1.1.7)
⊢ϕ

(в котором секвенция в правой вершине была выведена раньше в (0.2.75)).


• Если в теории T существует формула ϕ, удовлетворяющая условиям теоремы 1.1.8, то тео-
рия T называется противоречивой. В противном случае (если формулы ϕ с описанными
в этой теореме свойствами не существует), теория T называется непротиворечивой.

⋄ 1.1.7. Наивная теория множеств NST, кото- чим, означает, что в NST выводима также фор-
рую мы строили в § 1 главы 0, противоречива мула
как формальная теория, потому что парадокс R∈R&R∈
/ R,
Рассела (0.1.20), обсуждавшийся нами в примере
0.1.13, означает выводимость в этой теории фор- и что в этой теории выводима и опровержима
мулы формула R ∈ R (мы это отмечали в замечании
R∈R ⇔ R∈ /R 0.1.14, но тогда мы пользовались обычным мате-
(где R — множество Рассела, определенное фор- матическим языком, не организованным в фор-
мулой (0.1.18)). По теореме 1.1.8 это, между про- мальное исчисление).

Теорема 1.1.9 (о противоречивых теориях). Если теория T противоречива, то в ней любая фор-
мула одновременно выводима и опровержима.
Доказательство. Здесь используется секвенция (0.2.74), которую мы вывели когда-то. Пусть ϕ –
какая-нибудь формула в T , являющаяся выводимой и опровержимой одновременно. Зафиксируем
какую-нибудь формулу ψ в теории T и покажем, что она тоже выводима и опровержима в T .
Выводимость ϕ значит, что существует ее вывод в теории T , то есть дерево Генцена (1.1.44)
α⊢α ⊢β
... ...
⊢ϕ
с корнем ⊢ ϕ, и вершинами вида α ⊢ α, где α — произвольная формула теории, либо ⊢ β, где β —
произвольная аксиома теории T .
Точно так же выводимость ¬ϕ значит, что существует такое же дерево Генцена
α⊢α ⊢β
... ...
.
⊢ ¬ϕ
Подклеив эти деревья сверху к левым двум вершинам дерева (а вывод секвенции (0.2.74) — к
его правой вершине)

⊢ ϕ ⊢ ¬ϕ ϕ & ¬ϕ ⊢ (0.2.74)
(1.1.11) (1.1.6)
⊢ ϕ & ¬ϕ ϕ & ¬ϕ ⊢ ψ
(1.1.9)
⊢ψ
§ 1. Логика предикатов для общей формальной теории 89

мы получим вывод формулы ψ в теории T .


То есть ψ выводима в теории T . Это верно для любой формулы ψ, поэтому если взять вместо
нее формулу ¬ψ, то для нее это тоже будет верно. Значит, обе формулы, ψ и ¬ψ выводимы в T .

Из теоремы 1.1.9 сразу следует

Теорема 1.1.10. Если в формальной теории T существует невыводимая формула ϕ, то теория


T непротиворечива.

Справедлива также следующая

Теорема 1.1.11. Если замкнутая формула ϕ в теории T невыводима, то (не только теория T ,
но и) теория T + ¬ϕ непротиворечива.

Доказательство. Заметим, что аксиомы теории T тоже можно считать замкнутыми (как и форму-
лу ϕ), потому что по теореме 1.1.7 теория T и ее замыкание T дают один и тот же класс выводимых
формул.
Теперь предположим, что теория T + ¬ϕ противоречива. Тогда по теореме 1.1.9 в ней выводится
любая формула, в том числе и формула ϕ. Иными словами, ϕ выводится из ¬ϕ и некоторого ко-
нечного набора Σ аксиом теории T . При этом, как мы уже говорили, формулы Σ можно считать
замкнутыми (поскольку это аксиомы теории T ), а формула ¬ϕ замкнута потому что ϕ замкнута.
Отсюда по теореме о дедукции 1.1.5 мы получаем, что ϕ (не просто выводится, но и) следует из
¬ϕ и Σ. То есть в LK выводима секвенция

¬ϕ, Σ ⊢ ϕ.

Подклеив ее вывод к левой вершине дерева Генцена (а вывод секвенции (0.2.75) — к его правой
вершине)
¬ϕ, Σ ⊢ ϕ
(1.1.10)
Σ ⊢ ϕ, ¬(¬ϕ) ¬(¬ϕ) ⊢ ϕ (0.2.75)
(1.1.9)
Σ ⊢ ϕ, ϕ
(1.1.7)
Σ⊢ϕ
мы получим, что ϕ следует из Σ. Опять применяя теорему дедукции 1.1.5, мы получим, что формула
ϕ выводима из Σ, то есть выводима в T .

(b) Дефинициальные расширения


• Пусть нам дана формальная теория T с алфавитом A, сигнатурой Σ и аксиомами Γ .
1. Пусть P – какой-то новый символ, не входящий ни в алфавит A, ни в сигна-
туру Σ. Если мы хотим относиться к P , как к новому предикатному символу
некоторой валентности n, то необходимо задать некую новую аксиому, которая
называется определяющей аксиомой этого предикатного символа, и это должна
быть какая-нибудь формула

P (x1 , ..., xn ) ⇐⇒ α, (1.1.47)

в которой α – какая-нибудь формула, в которой нет никаких свободных пере-


менных, кроме x1 , ..., xn (возможно, не всех из этого списка). Если задана такая
определяющая аксиома, то P называется внешним предикатным символом (ва-
лентности n) теории T , а формула α – определением символа P .
2. Пусть кроме того F – какой-то новый символ, не входящий ни в алфавит A, ни
в сигнатуру Σ. Если мы хотим относиться к F , как к новому функциональному
символу некоторой валентности n, то необходимо задать некую новую аксиому,
которая называется определяющей аксиомой этого функционального символа,
и это должна быть какая-нибудь формула

y = F (x1 , ..., xn ) ⇐⇒ β, (1.1.48)


90 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

где β – какая-нибудь формула, в которой нет никаких свободных переменных,


кроме x1 , ..., xn (возможно, не всех из этого списка), а также переменной y,
причем в теории T выводима формула
 
(∀x1 , ..., xn ∃y β) & ∀x1 , ..., xn ∀y ∀z (β & β y=z ) =⇒ y = z (1.1.49)

в которой z – какая-нибудь переменная, не содержащаяся в β. Если задано такое


определение, то F называется внешним функциональным символом (валентно-
сти n) теории T , а формула β – определением символа F .
• Формальная теория R, полученная из теории T последовательным добавлением к ее сиг-
натуре Σ некоторого количества внешних предикатных или функциональных символов, с
одновременным добавлением к системе аксиом теории T соответствующих аксиом, опреде-
ляющих эти символы (то есть формул (1.1.47) и/или (1.1.48)), называется дефинциальным
расширением теории T .

⋄ 1.1.8. Символ Ord, обозначающий класс малых циального расширения теории MK.
ординалов, определенный формулой (0.3.309),
может считаться примером внешнего функцио- ⋄ 1.1.10. Символ ≃, обозначающий отноше-
нального символа валентности 0, присоединен- ние равномощности, и определенный формулой
ного к теории MK. А теория MK с присоединен- (0.3.340), – пример внешнего предикатного сим-
ным к ней символом, определенным формулой вола валентности 2 для теории MK.
(0.3.309), – пример дефинициального расшире-
ния теории MK. ! 1.1.11. Глядя на эти примеры, можно заме-
⋄ 1.1.9. Символ S, обозначающий функцию сле- тить, что в теории множеств Морса-Келли MK
дования, определенную формулой (0.3.312), – всякий присоединенный предикатный символ η
пример внешнего функционального символа ва- валентности n выделяет некий класс строк дли-
лентности 1 для теории MK. Точно так же теория ны n, а всякий присоединенный функциональ-
MK с присоединенным к ней символом S, опре- ный символ θ валентности n выделяет некое
деленным формулой (0.3.312), – пример дефини- отображение на строках длины n.

Групповая подстановка. Ниже нам понадобится следующая конструкция. Пусть ϕ — формула,


содержащая n свободных переменных x1 , ..., xn и еще термы τ1 , ..., τn , и предположим, мы хотим
заменить в ней каждую переменную xk на терм τk .
• Групповой подстановкой термов τ1 , ..., τn вместо переменных x1 , ..., xn в формулу ϕ назы-
вается формула, получающаяся из ϕ одновременной заменой всех свободных вхождений
каждой переменной xk в формуле ϕ на терм τk . Мы обозначаем такую формулу символом

ϕ (1.1.50)
x1 =τ1 ,...,xn =τn

• Групповая подстановка ϕ называется корректной, если ее можно предста-


x1 =τ1 ,...,xn =τn
вить как последовательное применение корректных подстановок одной переменной:

ϕ =ϕ ...
x1 =τ1 ,...,xn =τn x1 =τ1 xn =τn

т.е. при замене xk на τk никакая переменная, входящая в τk , не должна попадать в об-


ласть действия квантора по этой переменной. Это эквивалентно тому, что каждое свобод-
ное вхождение переменной xk в формулу ϕ не должно содержаться в области действия
кванторов по переменным, входящим в терм τk .

Перевод формул в дефинициальном расширении. Всякой формуле ϕ дефинициального рас-


ширения R теории T можно неким стандартным образом поставить в соответствие некую формулу
b теории T (без присоединенных символов) так, чтобы ϕ и ϕ
ϕ b были равносильны в R. Это удобно
описать, считая, что R получено из T присоединением какого-то одного внешнего символа (а в
общем случае нужно будет представить R как цепочку дефинициальных расширений, полученую
из T присоединением каждый раз по одному символу). Поэтому мы рассмотрим два случая.
§ 1. Логика предикатов для общей формальной теории 91

1. Пусть R получено из T присоединением предикатного символа P , определенного форму-


лой α по правилу (1.1.47), причем пусть связанные переменные в формуле α не пересе-
каются с переменными (любыми, и свободными, и связанными) в формуле ϕ (если это
не так, то можно в α связанные переменные заменить на какие-то другие). Тогда чтобы
получить ϕ b мы в формуле ϕ заменяем каждое вхождение символа P (τ1 , ..., τn ) в ϕ фор-
мулой α с подставленными термами τ1 , ..., τn вместо x1 , ..., xn (такая подстановка будет
корректна, потому что переменные из τ1 , ..., τn не будут содержаться в α как связанные
переменные).
2. Пусть R получено из T присоединением функционального символа F , определенного фор-
мулой β по правилу (1.1.48). Построим сначала перевод ϕ b всех атомарных формул ϕ:
— b совпадает с ϕ,
если ϕ не содержит символа F , то мы считаем, что ϕ
— предположим, что мы построили формулы ϕ b для всех атомарных формул ϕ, в
которых символ F встречается k раз,
— пусть далее ϕ – атомарная формула, в которой символ F встречается k + 1 раз;
выберем какую-нибудь формулу χ так, чтобы ϕ имела вид

ϕ=χ
y=F (τ1 ,...,τn )

где термы τ1 , ..., τn символа F не содержат, а переменная y не встречается ни в


χ, ни в τ1 , ..., τn ; будем считать, что переменные, входящие в τ1 , ..., τn , не входят
в (1.1.48) как связанные переменные (если это не так, поменяем y и связанные
переменные в (1.1.48) и в наших рассуждениях дальше будем вместо y исполь-
зовать другую букву); в формуле χ символ F входит уже k раз (на 1 меньше,
чем в формуле ϕ), поэтому для нее соответствующая формула χ b уже построена;
теперь ϕb можно определить так:
 
∀y β ⇒χ b
x1 =τ1 ,...,xn =τn

(подстановка будет корректна, потому что переменные из термов τ1 , ..., τn не со-


держатся как связанные переменные в β); эквивалентный способ — определить
b формулой
ϕ  
∃y β &χ b .
x1 =τ1 ,...,xn =τn

b построен для всех атомарных формул ϕ, мы, рассматривая


После того, как перевод ϕ
произвольную формулу ψ, заменяем в ней всякую атомарную подформулу ϕ на ее перевод
b
ϕ.
• b называется переводом формулы ϕ на язык теории T .
Формула ϕ

Свойства операции перевода:



1 Если формула ϕ не содержит присоединенных символов, то8

b=ϕ
ϕ (1.1.51)

2◦ Если P — присоединенный предикатный символ валентности n, определенный формулой


(1.1.47), то 
P (x1 , ..., xn ) b = α, (1.1.52)
3◦ Если F — присоединенный функциональный символ валентности n, определенный фор-
мулой (1.1.48), то 
y = F (x1 , ..., xn ) b = β, (1.1.53)
4◦ В T справедливы следующие равенства формул

¬ϕ
c = ¬ϕ,
b (ϕ ⇒ ψ)b = (ϕ b
b ⇒ ψ) (1.1.54)
ϕ\ b
b & ψ,
&ψ=ϕ \
ϕ ∨ψ =ϕ b
b ∨ ψ, (1.1.55)
[
∀x ϕ = ∀x ϕ,
b [
∃x ϕ = ∃x ϕ.
b (1.1.56)
8 Равенство формул было определено на с.80.
92 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

5◦ Для любой формулы ϕ в R выводима формула

ϕ ⇔ ϕ
b (1.1.57)

6◦ Если τ — терм теории T (без новых присоединенных символов), для которого подста-
b x=τ также будет корректна, и справедливо
новка ϕ x=τ корректна, то подстановка ϕ
равенство формул
ϕ\ =ϕ b . (1.1.58)
x=τ x=τ

7 Если в теории R подстановка ϕ x=τ корректна (и τ — произвольный терм в R, то есть,
возможно, содержащий присоединенные к T символы), то в T выводимы секвенции

∀x ϕ \
b⊢ϕ (1.1.59)
x=τ

\ ⊢ ∃x ϕ
ϕ b (1.1.60)
x=τ

Доказательство. Здесь все свойства очевидны, кроме 5 и 7. Свойство 5 вытекает из свойств 1◦ и


2◦ на с.85: всякая атомарная формула ϕ эквивалентна своему переводу ϕ
b в R,

ϕ ∼ ϕ,
b

поэтому то же самое верно для любых формул, составленных из атомарных с помощью связок ¬,
&, ∨, ⇒, и кванторов ∀, ∃. То есть это верно для любых вообще формул.
Свойство 7 доказывается индукцией по сложности формулы.

⋄ 1.1.12. Напомним, что отношение включе- Ее перевод ϕb на язык теории MK, естественно,
ния ⊆ было определено в теории MK формулой должен содержать только символы сигнатуры
(0.3.134) теории MK (то есть = или ∈, без ⊆), и мы его
упоминали уже, — это формула (0.3.140):
X ⊆Y ⇔ ∀A (A ∈ X ⇒ A ∈ Y ).
Понятно, что ⊆ можно понимать как внешний  
двуместный предикатный символ в MK. Саму ∀A (A ∈ X ⇒ A ∈ Y )
теорию MK с присоединенным к ней предикат- 
& ∀A (A ∈ Y ⇒ A ∈ X)
ным символом ⊆ можно поэтому рассматривать
как дефинициальное расширение теории MK. ⇒ X = Y.
Обозначим его MK+ ⊆. Рассмотрим в MK+ ⊆
какую-нибудь формулу ϕ с участием этого сим-
вола, например, (0.3.139): На с.32 мы приводили вывод формулы ϕb в MK,
9
 а формула ϕ, в свою очередь, выводится в
X ⊆Y &Y ⊆X ⇒ X = Y. MK+ ⊆.

Теорема 1.1.12. Пусть R — дефинициальное расширение теории T . Формула ϕ в R выводима в


R если и только если ее перевод ϕ
b выводим в T .
9 Формула ϕ имеет следующий вывод в MK+ ⊆:
⊢ (∀A A ∈ X ⇔ A ∈ Y )
⇒ X = Y (0.3.128)
теорема 0.2.3
∀A (A ∈ X ⇔ A ∈ Y )
⊢ X ⊆ Y ⇒ (∀A α) (0.3.134) ⊢ Y ⊆ X ⇒ (∀A β) (0.3.134) ⊢X =Y
теорема 0.2.3 теорема 0.2.3 (∀A α) & (∀A β) ⊢ (0.2.24)
X ⊆ Y ⊢ ∀A α Y ⊆ X ⊢ ∀A β ∀A (α & β) (0.2.67) ∀A (α & β) ⊢ X = Y
 пример 0.2.24 (0.2.33)
X ⊆ Y & Y ⊆ X ⊢ (∀A α) & (∀A β) (∀A α) & (∀A β) ⊢ X = Y
(0.2.33)
X ⊆Y &Y ⊆X ⊢X =Y
 (0.2.40)
⊢ X⊆Y &Y ⊆X ⇒ X=Y
где α — формула A ∈ X ⇒ A ∈ Y , а β — формула A ∈ Y ⇒ A ∈ X.
§ 1. Логика предикатов для общей формальной теории 93

Доказательство. Заметим сразу, что в одну сторону это утверждение следует сразу из свойства
b выводима в T , то ϕ выводима в R. Действительно, в R выводима формула (1.1.57),
(1.1.57): если ϕ
а значит, и формула
b ⇒ ϕ,
ϕ
и по теореме об импликации 1.1.1, секвенция

b ⊢ ϕ.
ϕ

Мы можем подклеить ее вывод сверху к правой вершине дерева

⊢ϕ b⊢ϕ
b ϕ
(1.1.9)
⊢ϕ

b выводима (в T , а значит и в R), то ее вывод мы также можем подклеить к левой


и тогда, если ϕ
вершине этого дерева, и мы получим вывод в R для секвенции ⊢ ϕ.
Таким образом, задача сводится к проверке второй половины этого утверждения: если ϕ выво-
дима в R, то ϕb выводима в T .
Если ϕ выводима в R, то у нее есть вывод в R, то есть некое дерево Генцена,
α⊢α ⊢γ
Γ3 ⊢∆3 Γ4 ⊢∆4
Γ1 ⊢∆1 Γ2 ⊢∆2
... ...
(1.1.61)
⊢ϕ

у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
α ⊢ α), либо секвенции вида ⊢ γ, где γ — аксиомы теории T или теории R.
Преобразуем каждую формулу ψ в этом дереве в формулу ψb теории T (по правилам, описанным
на с.91). Мы получим некую картинку с секвенциями теории T :
α⊢
b αb ⊢b
γ
b ⊢∆
Γ c b ⊢∆
Γ c
3 3 4 4
b ⊢∆
Γ c b ⊢∆
Γ c
1 1 2 2
... ...
(1.1.62)
⊢ϕ
b

В вершинах этой картинки стоят либо секвенции вида α b⊢αb, то есть аксиомы исчисления преди-
катов LK, либо секвенции вида ⊢ γ
b, где γ — аксиомы теории T , либо секвенции вида ⊢ bγ , где γ —
аксиома теории R, то есть определение в T . Но всякое определение имеет вид (1.1.47)

η(x1 , ..., xn ) ⇐⇒ α,

и его перевод будет иметь вид


α ⇐⇒ α,
По теореме 0.2.3 выводимость такой формулы эквивалентна выводимости секвенции

α ⊢ α.

А это аксиома теории T .


Сказанное означает, что в дереве (1.1.62), получающемся переводом дерева (1.1.61), все вершины
— либо аксиомы теории T , либо выводимые секвенции в теории T . Поэтому если доказать, что в
(1.1.62) каждый переход вниз осуществляется по правилам вывода исчисления LK, то это будет
выводом секвенции
⊢ϕb
(что нам и нужно).
Таким образом, остается проверить только, что конструкция (1.1.62) — это либо само по себе
дерево Генцена, либо ее можно дополнить (с сохранением корня и возможным добавлением новых
вершин, которые также будут выводимыми секвенциями) до дерева Генцена.
Это делается вот как. Каждый переход в (1.1.62)

Γbp ⊢ ∆
bp
(1.1.63)
Γbq ⊢ ∆
bq
94 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

получен как преобразование по правилам (1.1.71)—(1.1.70) соответствующего перехода в (1.1.61)

Γp ⊢ ∆p
, (1.1.64)
Γq ⊢ ∆q

который в свою очередь получен применением какого-то из правил вывода LK-1 — LK-15. Нужно
перебрать все правила от LK-1 до LK-15 и убедиться, что всякий раз, когда в (1.1.64) выводимость
нижней секвенция следует из выводимости верхней применением этого правила, в (1.1.63) выводи-
мость нижней секвенции также получается из выводимости верхней применением этого же правила,
возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (1.1.64) получено применением первого правила в LK-1, то есть имеет вид

Γ ⊢∆
α, Γ ⊢ ∆

Тогда (1.1.63), получаемое преобразованием этого перехода, имеет вид

Γb ⊢ ∆b
,
b, Γb ⊢ ∆
α b

и это тоже применение правила LK-1.


2. Следующие правила, от LK-2 до LK-11 включительно проверяются так же элементарно.
3. Сложности начинаются с правила LK-12∗ . Пусть (1.1.64) получено применением этого правила,
то есть имеет вид
α x=τ , Γ ⊢ ∆
∀x α, Γ ⊢ ∆
— где x — переменная, а τ – терм. Это преобразуется в переход

\ , Γb ⊢ ∆
α b
x=τ
.
dα, Γb ⊢ ∆
∀x b

Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(1.1.9),
dα ⊢ α
∀x \ \ , Γb ⊢ ∆
α b
x=τ x=τ
,
dα, Γb ⊢ ∆
∀x b
и по правилу (1.1.56) это будет эквивалентно переходу

∀x α \
b⊢α \ , Γb ⊢ ∆
α b
x=τ x=τ
.
b, Γb ⊢ ∆
∀x α b

Последний переход представляет собой применение правила сечения LK-4, а добавленная нами вер-
шина слева — ∀x α
b⊢α\ — выводимая секвенция в T , в силу (1.1.59).
x=τ
4. Пусть (1.1.64) получено применением правила LK-13∗ , то есть имеет вид

Γ ⊢ ∆, α x=y
Γ ⊢ ∆, ∀x α

— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход

Γb ⊢ ∆,
b α\
x=y

Γb ⊢ ∆, dα
b ∀x

который по формулам (1.1.58) и (1.1.56) эквивалентен переходу

Γb ⊢ ∆,
b αb x=y
Γb ⊢ ∆,
b ∀x α
b
§ 1. Логика предикатов для общей формальной теории 95

При этом, y, по-прежнему, не входит (как свободная переменная) в нижнюю секвенцию, и мы


получаем, что это в точности применение правила LK-13∗ к верхней секвенции.
5. Пусть (1.1.64) получено применением правила LK-14∗ , то есть имеет вид

α x=y
,Γ ⊢ ∆
∃x α, Γ ⊢ ∆
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход

\ , Γb ⊢ ∆
α b
x=y
dα, Γb ⊢ ∆
∃x b

который по формулам (1.1.58) и (1.1.56) эквивалентен переходу

b
α x=y
, Γb ⊢ ∆
b

b, Γb ⊢ ∆
∃x α b

Здесь y по-прежнему не входит (как свободная переменная) в нижнюю секвенцию, и мы получаем,


что это в точности применение правила LK-14∗ к верхней секвенции.
6. Пусть (1.1.64) получено применением правила LK-15∗ , то есть имеет вид

Γ ⊢ ∆, α x=τ
Γ ⊢ ∆, ∃x α
— где x — переменная, а τ – терм. Это преобразуется в переход

Γb ⊢ ∆,
b α\
x=τ
.
Γb ⊢ ∆, dα
b ∃x

Здесь переход от верхней секвенции к нижней можно представить как действие правила сечения
(1.1.9),
Γb ⊢ ∆,
b α\ \ ⊢ ∃x
α dα
x=τ x=τ
,
Γb ⊢ ∆, dα
b ∃x
и по правилу (1.1.56) это будет эквивалентно переходу

Γb ⊢ ∆,
b α\ \ ⊢ ∃x α
α b
x=τ x=τ
,
b b
Γ ⊢ ∆, ∃x α
b
Последний переход представляет собой применение правила сечения LK-4, а добавленная нами вер-
\ ⊢ ∃x α
шина справа — α b — выводимая секвенция в T , в силу (1.1.60).
x=τ

(c) Интерпретации и модели


Интерпретации.
• Пусть нам даны:
1) две формальные теории S и T над логикой предикатов с одним алфавитом A и
сигнатурами Σ и T соответственно,
2) некий символ U , не входящий ни в алфавит A, ни в сигнатуру Σ, ни в сигнатуру
T,
И пусть каждому (предикатному и функциональному) символу η из Σ поставлен в соот-
ветствие некий внешний (предикатный или функциональный, в зависимости от η) символ
η ′ в теории T , той же валентности, что η (см. определение на с.89). Пусть кроме того,
символ U присоединен к теории T как предикатный символ валентности 1, причем вы-
полнены следующие два условия:
(i) требуется, чтобы в теории T существовал хотя бы один объект, удовлетворяющий
условию U , то есть чтобы была выводима секвенция

⊢ ∃x U (x) (1.1.65)
96 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

(ii) нужно чтобы для каждого функционального символа F из сигнатуры Σ соответству-


ющий функциональный символ F ′ в дефинициальном расширении S ′ теории T , со-
хранял свойство U для своих аргументов, то есть должна быть выводима секвенция
 
U (x1 ), ..., U (xn ) ⊢ U F ′ (x1 , ..., xn ) (1.1.66)

(здесь n – валентность символа F ′ ).


И пусть S ′ обозначает формальную теорию, полученную как дефинициальное расширение
теории T присоединением к ней символов η ′ (где η пробегает Σ) и символа U .
• Преобразование формул. При этих условиях каждой формуле ϕ теории S можно поста-
вить в соответствие формулу ϕ′ в теории S ′ , которая отличается от ϕ только тем, что
на входящие в нее переменные накладывается дополнительное условие, что они должны
удовлетворять формуле U (неформально выражаясь, должны лежать в универсуме U , не
выходя из него). Построение формулы ϕ′ происходит следующим образом:
— каждый предикатный символ P в ϕ нужно заменить на соответствующий символ P ′ ,
— каждый функциональный символ F в ϕ нужно заменить на соответствующий символ
F ′ (при этом каждый терм τ преобразуется в новый терм τ ′ ),
— каждую подформулу
∀x (α) (1.1.67)
нужно заменить на подформулу
 
∀x U (x) ⇒ (α) (1.1.68)

— каждую подформулу
∃x α (1.1.69)
нужно заменить на подформулу
 
∃x U (x) & (α) (1.1.70)

— если в формуле ϕ есть свободные переменные x1 , ..., xn , то мы заменяем ϕ на формулу


 
U (x1 ) & ... & U (xn ) ⇒ (ϕ). (1.1.71)

• Предположим далее, что выполняется следующее условие:


— для всякой формулы ϕ, являющейся аксиомой теории S, соответствующая ей
формула ϕ′ в теории S ′ выводима в этой теории.
Тогда теория S ′ называется интерпретацией теории S в теории T . Предикатный символ
U при этом называется универсумом этой интерпретации, а формула ϕ′ — переводом
формулы ϕ в этой интерпретации.

! 1.1.13. Конструкция интерпретации позволяет “погрузить” данную теорию S в построенное дефи-


нициальное расширение S ′ теории T . С другой стороны, по теореме 1.1.12 дефинициальное расшире-
ние S ′ само можно считать теорией, погруженной в T . Поэтому мы получаем “цепочку погружений”
(здесь символ ⊆ используется неформально, не как обозначение из теории множеств):

S ⊆ S′ ⊆ T .

Теорема 1.1.13. Если формула ϕ теории S выводима (соответственно, опровержима) в S, то в


любой интерпретации S ′ теории S ее перевод ϕ′ также выводим (соответственно, опровержим).

Для доказательства этого утверждения нам понадобится следующая

Лемма 1.1.14. Если α — корректная подстановка, и y1 , ..., yn – переменные в терме τ , то


x=τ
 ′   
α ∼ U (y1 ) & ... & U (yn ) ⇒ α′ (1.1.72)
x=τ x=τ ′
§ 1. Логика предикатов для общей формальной теории 97

Доказательство теоремы 1.1.13. Здесь схема рассуждений похожа на ту, что использовалась в
доказательстве второй части теоремы 1.1.12, только каждый шаг усложняется пропроционально
усложнению конструкции ϕ′ в сравнении с ϕ.
b
Нам достаточно рассмотреть случай, когда формула ϕ выводима в S. Тогда у нее есть вывод в
S, то есть некое дерево Генцена,
λ⊢λ ⊢γ
Γ3 ⊢∆3 Γ4 ⊢∆4
Γ1 ⊢∆1 Γ2 ⊢∆2
... ...
(1.1.73)
⊢ϕ
у которого на вершинах стоят либо аксиомы исчисления предикатов LK (то есть секвенции вида
λ ⊢ λ), либо секвенции вида ⊢ γ, где γ — аксиомы теории S.
Преобразуем каждую формулу ψ в этом дереве в формулу ψ ′ теории S ′ (по правилам, описанным
на с.96). Мы получим некую картинку с секвенциями теории S ′ :
λ′ ⊢λ′ ⊢γ ′
Γ ′ ⊢∆′ Γ ′ ⊢∆′
3 3 4 4
Γ1′ ⊢∆′ Γ2′ ⊢∆′
1 2
... ...
(1.1.74)
⊢ ϕ′

В вершинах этой картинки стоят либо секвенции вида λ′ ⊢ λ′ , то есть аксиомы исчисления предика-
тов LK, либо секвенции вида ⊢ γ ′ , где γ — аксиомы теории S, а это выводимые секвенции, поскольку
операция γ 7→ γ ′ есть интерпретация теории S.
Поэтому если доказать, что в (1.1.74) каждый переход вниз осуществляется по правилам вывода
исчисления LK, то это будет выводом секвенции

⊢ ϕ′

(что нам и нужно).


Таким образом, остается проверить только, что конструкция (1.1.74) — это либо само по себе
дерево Генцена, либо ее можно дополнить до дерева Генцена.
Это делается вот как. Каждый переход в (1.1.74)

Γp′ ⊢ ∆′p
(1.1.75)
Γq′ ⊢ ∆′q

получен как преобразование по правилам (1.1.71)—(1.1.70) соответствующего перехода в (1.1.73)

Γp ⊢ ∆p
, (1.1.76)
Γq ⊢ ∆q

который в свою очередь получен применением какого-то из правил вывода LK-1 — LK-15. Нужно
перебрать все правила от LK-1 до LK-15 и убедиться, что всякий раз, когда в (1.1.76) выводимость
нижней секвенция следует из выводимости верхней применением этого правила, в (1.1.75) выводи-
мость нижней секвенции также получается из выводимости верхней применением этого же правила,
возможно, с добавлением каких-то других.
Рассмотрим теперь эти правила.
1. Пусть (1.1.76) получено применением первого правила в LK-1, то есть имеет вид

Γ ⊢∆
α, Γ ⊢ ∆

Тогда (1.1.75), получаемое преобразованием этого перехода, имеет вид

Γ ′ ⊢ ∆′
,
α′ , Γ ′ ⊢ ∆′

и это тоже применение правила LK-1.


2. Следующие правила, от LK-2 до LK-11 включительно проверяются так же элементарно.
3. Сложности начинаются с правила LK-12∗ . Пусть (1.1.76) получено применением этого правила,
то есть имеет вид
α x=τ , Γ ⊢ ∆
∀x α, Γ ⊢ ∆
98 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— где x — переменная, а τ – терм. Это преобразуется в переход

(α x=τ )′ , Γ ′ ⊢ ∆′
,
(∀x α)′ , Γ ′ ⊢ ∆′
По правилам преобразования (1.1.72) и (1.1.68) этот переход расшифровывается так:

U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y ,...,y ) , Γ ′ ⊢ ∆′
1 n
, (1.1.77)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′

– здесь в числителе мы заменили формулу (α x=τ )′ на эквивалентную ей в (силу (1.1.72)) формулу



U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y1 ,...,yn) , применяя теорему 1.1.4.
Дальше нам полезно будет ввести некое обозначение для упрощения формул. Условимся фор-
мулу U (y1 ) & ... & U (yn ) коротко записывать как U (y):

U (y) = U (y1 ) & ... & U (yn ) (1.1.78)

Тогда (1.1.77) можно переписать так:

U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
, (1.1.79)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что из
правила (1.1.66), записанного применительно к нашим условиям в виде

U (y1 ), ..., U (yn ) ⊢ U τ ′ (y1 , ..., yn ) ,

или, что эквивалентно, из выводимости



U (y1 ) & ... & U (yn ) ⊢ U τ ′ (y1 , ..., yn ) ,

по теореме 1.1.3 следует выводимость секвенции


 
U τ ′ (y1 , ..., yn ) ⇒ α′ x=τ ′ (y1 ,...,yn) ⊢ U (y1 ) & ... & U (yn ) ⇒ α′ x=τ ′ (y1 ,...,yn )

Если снова воспользоваться обозначением (1.1.78), то эту секвенцию можно будет коротко записать
так: 
U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′
Добавив ее слева к верхней секвенции в (1.1.79), мы получим дерево

U τ ′ ⇒ α′ x=τ ′ ⊢ U (y) ⇒ α′ x=τ ′ U (y) ⇒ α′ x=τ ′ , Γ ′ ⊢ ∆′
(1.1.9)

U τ ′ (y) ⇒ α′ x=τ ′ (y)
, Γ ′ ⊢ ∆′
(1.1.17)
∀x U (x) ⇒ α′ , Γ ′ ⊢ ∆′
Здесь секвенция в левой вершине, как мы уже заметили, выводима. Поэтому из выводимости се-
квенции в правой вершине следует выводимость корня дерева.
4. Пусть (1.1.76) получено применением правила LK-13∗ , то есть имеет вид

Γ ⊢ ∆, α x=y
Γ ⊢ ∆, ∀x α
— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
 ′
Γ ′ ⊢ ∆′ , α x=y
 ′
Γ ′ ⊢ ∆′ , ∀x α

который по правилам преобразования (1.1.72) и (1.1.68) расшифровывается так:

Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=y
Γ ′ ⊢ ∆′ , ∀x U (x) ⇒ α′
§ 1. Логика предикатов для общей формальной теории 99

(опять мы в числителе заменяем формулу на эквивалентную, применяя теорему 1.1.4), или, что
эквивалентно, так: 
Γ ′ ⊢ ∆′ , U (x) ⇒ α′ x=y
.
Γ ′ ⊢ ∆′ , ∀x U (x) ⇒ α′
При этом, y по-прежнему не входит (как свободная переменная) в нижнюю секвенцию. Но это в
точности применение правила LK-13∗ к верхней секвенции.
5. Пусть (1.1.76) получено применением правила LK-14∗ , то есть имеет вид

α x=y
,Γ ⊢ ∆
∃x α, Γ ⊢ ∆

— где y не входит (как свободная переменная) в нижнюю секвенцию. Это преобразуется в переход
 ′
α x=y , Γ ′ ⊢ ∆′
 ′
∃x α , Γ ′ ⊢ ∆′

который по правилам преобразования (1.1.72) и (1.1.70) расшифровывается так:

U (y) ⇒ α′ x=y
, Γ ′ ⊢ ∆′
(1.1.80)
∃x U (x) & α′ , Γ ′ ⊢ ∆′

Теперь чтобы доказать, что из верхней секвенции здесь выводится нижняя, заметим, что выведен-
ную нами выше секвенцию (0.2.76) можно записать применительно к нашим условиям в виде

U (y) & α′ x=y


⊢ U (y) ⇒ α′ x=y

или, что эквивалентно, в виде



U (x) & α′ x=y
⊢ U (y) ⇒ α′ x=y

Добавив эту секвенцию слева к верхней секвенции в (1.1.80), мы получим дерево Генцена

U (x) & α′ x=y ⊢ U (y) ⇒ α′ x=y U (y) ⇒ α′ x=y , Γ ′ ⊢ ∆′
(1.1.9)

U (x) & α′ x=y
, Γ ′ ⊢ ∆′
(1.1.19)
∃x U (x) & α′ , Γ ′ ⊢ ∆′

Оно и есть нужное нам дополнение картинки (1.1.80).


6. Пусть (1.1.76) получено применением правила LK-15∗ , то есть имеет вид

Γ ⊢ ∆, α x=τ
Γ ⊢ ∆, ∃x α
— где x — переменная, а τ – терм. Это преобразуется в переход
 ′
Γ ′ ⊢ ∆′ , α x=τ
 ′ .
Γ ′ ⊢ ∆′ , ∃x α

По правилам преобразования (1.1.72) и (1.1.70) этот переход расшифровывается так:

Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′
. (1.1.81)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′

— где как и раньше, в соответствии с соглашением (1.1.78), под U (y) понимается U (y1 ) & ... & U (yn ).
Заметим, что по теореме 1.1.1 секвенция

Γ ′ ⊢ ∆′ , U (y) ⇒ α′ x=τ ′
100 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

выводима если и только если выводима секвенция

U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′

Поэтому (1.1.81) можно переписать в виде

U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
. (1.1.82)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′

Теперь рассмотрим дерево Генцена

U (y) ⊢ U (τ ′ (y))
(1.1.6)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′
(1.1.11)
U (y), Γ ′ ⊢ ∆′ , U (τ ′ (y)) & α′ x=τ ′
(1.1.20)
U (y), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.78)
U (y1 ) & U (y2 ) & ... & U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
Теорема 0.2.1
U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.19)
⊢ ∃y1 U (y1 ) ∃y1 U (y1 ), U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.9)
U (y2 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.9)
...
(1.1.9)
⊢ ∃yn U (yn ) U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)
(1.1.9)
Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x)

Здесь самая правая вершина — секвенция U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′ — верхняя секвенция в (1.1.82).
Вершина на самом верху — секвенция U (y) ⊢ U (τ ′ ) — правило (1.1.66), записанное для терма τ ′ .
Остальные вершины — секвенции ⊢ ∃yi U (yi ) — представляют собой правило (1.1.65) непустоты уни-
версума, записанное для переменных yi . С их помощью мы последовательно избавляемся от формул
U (yi ) в антецеденте получающейся секвенции U (y1 ), ..., U (yn ), Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x). Из этого де-
рева видно, что если выводится U (y), Γ ′ ⊢ ∆′ , α′ x=τ ′ , то выводится и Γ ′ ⊢ ∆′ , ∃x U (x) & α′ (x).

⋄ 1.1.14. Интерпретация арифметики Пеано символ + определяется теоремой 2.1.1, а символ


PA в теории множеств MK. Рассмотрим сигна- · – теоремой 2.1.3. Тогда
туру теории PA, описанную в примере 1.1.5:
— условие (1.1.33) будет выполняться в силу
0, S, +, · свойства 20 на с.55,
— условие (1.1.34) будет выполняться в силу
Вспомним определения, которые мы давали этим
свойства 60 на с.56,
символам в теории MK. Оставим эти определе-
ния, подкорректировав только одно из них, для — условие (1.1.35) будет выполняться в силу
функции S, а именно: пусть символ 0 обозначает (2.1.45),
пустое множество ∅ (то есть определяется фор- — условие (1.1.36) будет выполняться в силу
мулой (0.3.279)) (2.1.46),
0 = ∅, — условие (1.1.37) будет выполняться в силу
(2.1.69),
символ S – ограничение отображения S, опре-
деленного формулой (0.3.312), на множество — условие (1.1.38) будет выполняться в силу
FinOrd конечных ординалов (2.1.70),
— условие (1.1.39) будет выполняться по теоре-
S(X) = X ∪ {X}, ме 0.3.48 (принцип обыкновенной индукции).
§ 1. Логика предикатов для общей формальной теории 101

Вместе все это означает, что такая система опре- будет интерпретацией теории PA в теории MK (с
делений для символов 0, S, +, · в теории MK универсумом FinOrd).

Теорема 1.1.15. Пусть задана интерпретация S ′ теории S в теории T . Тогда


— если теория S противоречива, то теория T тоже противоречива,
— если теория T непротиворечива, то теория S тоже непротиворечива,

Доказательство. Здесь достаточно проверить первое утверждение. Если ϕ – формула в теории


S, являющаяся одновременно выводимой и опровержимой, то по теореме 1.1.13 соответствующая
формула ϕ′ в теории T также будет одновременно выводимой и опровержимой.

Теоремы Гёделя о непротиворечивости. Формальная теория T называется полной, если в


ней любая формула ϕ либо выводима, либо опровержима. В противном случае (то есть когда в T
существует такая формула ϕ, что ни ϕ, ни ¬ϕ не выводимы) теория T называется неполной.
Следующие два результата австрийского математика Курта Гёделя считаются ключевыми в ма-
тематической логике. В энциклопедиях и в популярной литературе они традиционно приводятся с
довольно туманными формулировками из-за громоздкости деталей. Мы также приводим эти утвер-
ждения в их нестрогом виде, отсылая читателя за подробностями к книге Питера Смита "Введение
в теоремы Гёделя"10 . Отметим только, что под выражением “теория T содержит арифметику Пе-
ано” здесь понимается несколько естественных условий, среди которых, в частности, требование,
чтобы теория Пеано PA имела интерпретацию в T (в смысле определения на с.95). Все стандарт-
ные аксиоматические теории множеств ZFC, NBG, MK (из которых только последняя, MK, описана в
этой книге, а сведения об остальных можно найти в других руководствах) удовлетворяют посылкам
теорем 1.1.16 и 1.1.17.

Теорема 1.1.16 (первая теорема Гёделя о неполноте). Пусть T – формальная теория, содержа-
щая арифметику Пеано. Тогда теория T либо противоречива, либо неполна.

Теорема 1.1.17 (вторая теорема Гёделя о неполноте). Пусть T – формальная теория, содержа-
щая арифметику Пеано. Тогда либо теория T противоречива, либо утверждение о ее непротиво-
речивости невыводимо в T .

Второе из этих утверждений может быть интерпретировано, как, ни много, ни мало, свидетель-
ство того, что непротиворечивость арифметики, теории множеств, а вместе с ними и математики
в целом, доказать (в рамках логики предикатов) невозможно. Действительно, для доказательства
непротиворечивости любой более или менее содержательной теории T (то есть, теории, включаю-
щей арифметику, как, скажем, теория множеств) нужно, как выясняется, строить новую теорию
T ′ (обычно под T ′ понимается какая-то более широкая теория, хотя это необязательно, достаточно
просто чтобы T интерпретировалась в T ′ ), после чего немедленно встает вопрос о том, не будет ли
T ′ сама противоречива. Это важно, потому что по теореме 1.1.9 если T ′ противоречива, то в ней
вместе с утверждением о непротиворечивости T становится выводимым и утверждение о противо-
речивости T (и таким образом, теорема «в T ′ выводится непротиворечивость T » обесценивается
противоположной теоремой «в T ′ выводится противоречивость T »).
Это наблюдение имеет важное следствие для математической логики и всей математики. Из
невозможности доказать непротиворечивость теорий, лежащих в основаниях математики, в част-
ности, какой-нибудь аксиоматической теории множеств, эту непротиворечивость приходится пред-
полагать. Это означает, что все утверждения в той части математики, где используется тео-
рия множеств (то есть, фактически везде, или, если быть точным, везде вне некоторых совсем
узких разделов логики), формулируются с дополнительным предположением, что используемый
рабочий вариант теории множеств (в нашем случае это теория Морса-Келли MK) непротиво-
речив. Математики почти никогда не следуют этому правилу формально (то есть нигде в форму-
лировках не говорят явно “мы предполагаем, что теория множеств непротивроречива”), однако это
всюду предполагается по умолчанию.11 Мы в этом параграфе будем эту фразу произносить, чтобы
она отпечаталсь у читателя в сознании (в частности, это будет вставленно в формулировки теорем
1.1.19 и 1.1.20 ниже), однако в дальнейшем мы об этом также забудем и вспоминать не будем.
10 P.
Smith. An intoduction to Gödel’s theorems. Cambridge University Press. 2007.
11 Правильнее было бы сказать “те математики, кто продумывал эти детали, считают это предполагающимся по
умолчанию”, потому что большая часть из них об этих вещах не задумывается.
102 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Модели и контрмодели. Частным случаем понятия интерпретации является следующая кон-


струкция.
• Пусть S – произвольная формальная теория с сигнатурой Σ, и пусть
— выделено некоторое непустое множество U (как объект теории MK),
— всякому предикатному символу η валентности n из сигнатуры Σ поставлен в
соответствие некий класс η ′ ⊆ U n ,
— всякому функциональному символу η валентности n из сигнатуры Σ поставлено
в соответствие некое отображение η ′ : U n → U .
Если относиться к η ′ как к присоединенным предикатным и функциональным символам,
то мы получим некое дефинициальное расширение S ′ теории MK. По аналогии с тем, как
это делалось на с.96, каждой формуле ϕ теории S поставим в соответствие формулу ϕ′
теории S ′ по следующим правилам:
— каждый предикатный символ η, примененный к термам τ1 , ..., τn , в ϕ нужно заменить
на формулу (τ1 , ..., τn ) ∈ η ′ ,
— каждый функциональный символ η в ϕ нужно заменить на соответствующий символ
η ′ (при этом каждый терм τ заменится на некий терм τ ′ ),
— каждую подформулу
∀x α (1.1.83)
нужно заменить на подформулу
 
∀x x ∈ U ⇒ (α) (1.1.84)

— каждую подформулу
∃x α (1.1.85)
нужно заменить на подформулу
 
∃x x ∈ U & (α) (1.1.86)

— если в ϕ есть свободные переменные x1 , ..., xn , то заменяем ϕ на формулу


(x1 ∈ U & ... & xn ∈ U ) ⇒ (ϕ) (1.1.87)

Теория S называется моделью теории S, если для всякой аксиомы ϕ теории S соответ-
ствующая формула ϕ′ выводима в S ′ (разумеется, это эквивалентно тому, что теория S ′
является интерпретацией S в смысле определения на с.95). Множество U при этом назы-
вается универсумом этой модели, а формула ϕ′ — переводом формулы ϕ в этой модели.
Из теоремы 1.1.13 сразу следует
Теорема 1.1.18. Если формула ϕ теории S выводима (соответственно, опровержима) в S, то
в любой модели S ′ теории S ее перевод ϕ′ также выводим (соответственно, опровержим).
Отсюда, в свою очередь, мы получаем два важных следствия.
Теорема 1.1.19. В предположении, что теория MK непротиворечива,
(i) всякая модель S ′ в MK любой формальной теории S непротиворечива,
(ii) если формальная теория S противоречива, то у нее нет модели в MK;
(iii) если формальная теория S обладает моделью в MK, то теория S непротиворечива.
Доказательство. 1. Пусть какая-то модель S ′ теории S противоречива, то есть в ней выводится
какая-то формула ψ и ее отрицание ¬ψ. Поскольку S ′ – дефинициальное расширение теории MK,
это значит, что в MK тоже выводятся формулы ψ и ¬ψ. Значит, теория MK должна быть тоже
противоречивой.
2. Если формальная теория S противоречива, то в ней выводится какая-то формула ϕ и ее отри-
цание ¬ϕ. Если у S есть модель S ′ в MK, то в этой модели S ′ выводятся формулы ϕ′ и (¬ϕ′ ) = ¬(ϕ′ ).
То есть S ′ должна быть противоречивой теорией, а это противоречит уже доказанному утвержде-
нию (i).
3. Если формальная теория S обладает моделью в MK, то в силу уже доказанного свойства (ii),
S не может быть противоречивой теорией.
§ 1. Логика предикатов для общей формальной теории 103

Теорема 1.1.20. Пусть S – формальная теория, S ′ – ее модель в MK, ϕ – формула в S, и ϕ′ –


соответствующая ей формула в S ′ . Тогда, в предположении, что теория MK непротиворечива,
— если формула ϕ′ опровержима в S ′ , то формула ϕ не может быть выводима в S,
— если формула ϕ′ выводима в S ′ , то формула ϕ не может быть опровержима в S.
Доказательство. Докажем первую часть (вторая доказывается по аналогии). Пусть формула ϕ′
опровержима в S ′ , то есть в S ′ выводится формула ¬ϕ′ . Если предположить дополнительно, что
формула ϕ выводима в S, то по теореме 1.1.18 формула ϕ′ также выводима в S ′ . Одновременно
по нашему предположению, ϕ′ опровержима в S ′ . Значит, S ′ должна быть противоречивой, а это
противоречит теореме 1.1.19.

Покажем, как применяется понятие модели. Тогда множества


Пусть нам дана какая-то формальная теория S и
формула ϕ в ней. Чтобы понять, будет эта фор- x = {0, 1}, y = {0, 2}
мула выводима в S, конечно, никакого опреде-
ленного алгоритма нет. Однако если удается по- будут обладать свойством
добрать модель S ′ , в которой соответствующая
x*y &y*x
формула ϕ′ опровержима, то по теореме 1.1.20
это будет сразу означать, что в S формула ϕ не то есть будет выполняться отрицание формулы
может быть выводимой (если предполагать, что (1.1.88):
теория множеств MK непротиворечива). Такая 
∃x ∃y x 66 y & y 66 x
модель S ′ , в которой формула ϕ′ опровержима,
называется контрмоделью для формулы ϕ. Значит, в нашей модели выводимо отрицание
формулы (1.1.88). То есть формула (1.1.88) опро-
⋄ 1.1.15. Пусть S – теория частичного поряд- вержима в построенной модели, и поэтому не мо-
ка, описанная в примере 1.1.3. Рассмотрим в ней жет быть выводимой в теории частичного по-
утверждение, что порядок всегда линеен: рядка (если считать, что теория множеств MK
 непротиворечива).
∀x ∀y x 6 y ∨ y 6 x . (1.1.88)
⊲ 1.1.16. Пусть S – теория групп, описанная в
Рассмотрим в качестве модели множество X = примере 1.1.4. Покажите, что в ней утверждение
3 = {0, 1, 2}, с частичным порядком на множе- 
стве U = 2X всех подмножеств в X: ∀x ∀y x · y = y · x (1.1.89)

A6B ⇔ A ⊆ B. — невыводимо.

Теорема Генкина. У теоремы 1.1.19 (iii) имеется обращение, которое чаще всего называют од-
ним из вариантов теоремы Гёделя о полноте. Чтобы не путать его с приводимой ниже теоремой о
семантизации 1.1.22, которую также обычно называют теоремой Гёделя о полноте, мы будем на-
зывать его теоремой Генкина12 , по имени человека, выделившего этот результат в первоначальных
рассуждениях Гёделя и приведшего относительно простое его доказательство.
Теорема 1.1.21. Если формальная теория S непротиворечива, то у нее существует модель в
теории MK.13

(d) Семантика
Для всякой формальной теории S ее модели представляют собой объекты теории MK, и при опре-
деленной предварительной работе по уточнению нужных терминов, можно говорить о классе ModS
всех моделей теории S в MK. Этот класс ModS порождает некую новую формальную теорию S ∗ ,
дефинициальное расширение теории MK, которая называется семантизацией теории S. Оказыва-
ется, что эта теория S ∗ эквивалентна теории S в том смысле, что данная формула ϕ выводима в S
тогда и только тогда, когда соответствующая ей по определенным правилам формула ϕ∗ выводима
12 Леон Генкин (1921-2006) — американский математик.
13 Доказательство этого факта приводится в различных учебниках по математической логике, см. например,
C.C.Leary, L.Kristiansen, A friendly introduction to mathematical logic, NY, 2015 (с. 75). См. также P.T.Johnstone,
Notes on logic and set theory, 1987 (Theorem 3.7).
104 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

в S ∗ . Этот результат принято называть теоремой Гёделя о полноте (ниже мы его приводим в виде
теорем 1.1.22 и 1.1.23 для случаев конечной и бесконечной систем аксиом, которые мы называем
теоремами о семантизации), и его ценность в том, что он позволяет свести изучение формаль-
ных теорий к изучению дефинициальных расширений теории множеств MK. Это в свою очередь
позволяет математикам (по крайней мере, тем, кто не специализируется в математической логике)
вообще забыть о формальных теориях, описывая все необходимые конструкции языком рабочей
теории множеств (и выводя все нужные результаты внутри этой теории множеств).

Семантизация конечно аксиоматизируемой теории. Для случая, когда теория S имеет ко-
нечную систему аксиом, класс ModS ее моделей определяется относительно просто, и сейчас мы
опишем эту конструкцию. Она состоит из четырех частей.
1. Прежде всего, нужно расширить сигнатуру Σ теории S. Выберем какой-нибудь символ,
не лежащий в Σ, например, пусть таким символом будет ♯. Дополним сигнатуру Σ этим
символом: пусть Σ♯ обозначает сигнатуру Σ с добавленным символом ♯.
2. Затем нужно превратить расширенную сигнатуру Σ♯ в объект теории Морса-Келли.
Это можно сделать, просто пронумеровав элементы Σ♯ . Поскольку Σ♯ — конечный на-
бор символов, нам для этого понадобится конечный набор чисел. Когда мы занумеруем
элементы Σ♯ , мы установим взаимно однозначное соответствие между Σ♯ и некоторым
натуральным числом n = {0, 1, ..., n − 1}. После этого можно будет забыть о символах Σ♯ ,
заменяя их номерами из n = {0, 1, ..., n − 1}, и это позволит считать Σ♯ (а также его эле-
менты) объектом теории MK, или, точнее, конечным множеством. Когда это уложилось
в сознании, удобно сделать шаг назад: поскольку неважно, какими символами мы обо-
значаем элементы сингатуры Σ♯ , можно дальше забыть о нумерации, и с самого начала
относиться к Σ♯ как к объекту теории MK, точнее, как к конечному множеству.
3. Затем строится класс StrS так называемых реляционных структур, или просто структур
теории S: объект P теории MK (то есть класс) считается элементом класса StrS (и на-
зывается реляционной структурой или просто структурой), если он представляет собой
семейство {η ′ ; η ∈ Σ♯ } (отображение η ∈ Σ♯ 7→ η ′ ∈ Set) со следующими свойствами:
— множество P♯ непусто,
— для всякого предикатного символа η валентности n из сигнатуры Σ справедливо
вложение η ′ ⊆ (P♯ )n ,
— для всякого функционального символа η валентности n из сигнатуры Σ множе-
ство η ′ представляет собой отображение η ′ : (P♯ )n → P♯ .
4. На последнем этапе в классе StrS реляционных структур выделается подкласс ModS , со-
стоящий из моделей теории S: структура {η ′ ; η ∈ Σ} принадлежит классу ModS , если она
представляет собой модель теории S с универсумом P♯ в смысле определения на с.102.
Как это делается, удобнее понять на примерах 1.1.18-1.1.19, которые мы приводим ниже.
Важно, что здесь существенно используется, что система аксиом теории S конечна:
именно поэтому можно выстроить требования, выделяющие класс ModS в виде конеч-
ной цепочки символов, то есть определить класс ModS формулой языка MK.14
• В результате мы получаем класс ModS моделей теории S, определенный формулой языка
теории MK. К нему можно относиться как к присоединенному функциональному символу
валентности 0, тогда теория MK с этим присоединенным символом превращается в дефи-
нициальное расширение S ∗ теории MK. Теория S ∗ называется семантизацией формальной
теории S в теории MK.
! 1.1.17. Понятно, что семантизация ModS всякой формальной теории S является также формаль-
ной теорией.

14 Если система аксиом бесконечна (как, например, в самой теории MK), то такое описание класса Mod становится
S
бесконечно длинным (потому что у нас нет возможности применять кванторы по системе аксиом), и поэтому это
описание перестает быть формулой MK. Как разрешается эта проблема в случае бесконечной системы аксиом мы
поговорим на с.107.
§ 1. Логика предикатов для общей формальной теории 105

⋄ 1.1.18. Семантизация теории частичного по- ⋄ 1.1.19. Семантизация теории групп. В при-
рядка. Напомним, что в примере 1.1.3 мы опреде- мере 1.1.4 мы определили теорию групп как фор-
лили теорию частичного порядка как формаль- мальную теорию. Ее семантизацией в MK будет
ную теорию. Ее семантизацией в MK будет сле- следующая конструкция. Рассмотрим в MK фор-
дующая конструкция. Рассмотрим в MK форму- мулу, которая на человеческом языке описывает-
лу, которая на человеческом языке описывается ся словами “G является группой”, а на формаль-
словами “X является частично упорядоченным ном имеет вид
множеством с отношением порядка R”, а на фор-
мальном имеет вид
∃M ∃e ∃f
∃M ∃R X = (M, R) & R ⊆ M × M & G = (M, e, f ) & e ∈ M & f : M × M → M &
   
& ∀x x ∈ M ⇒ (x, x) ∈ R & & ∀x ∀y ∀z f ((x, y), z) = f (x, (y, z)) &
   
& ∀x ∀y (x, y) ∈ R & (y, x) ∈ R ⇒ x = y & & ∀x f (x, e) = x & f (e, x) = x &
  
& ∀x ∀y ∀z (x, y) ∈ R & (y, z) ∈ R ⇒ & ∀x ∃y f (x, y) = e & f (y, x) = e (1.1.92)

(x, z) ∈ R (1.1.90)
Эта формула, обозначим ее η, имеет только одну
Эта формула, обозначим ее η, имеет только одну
свободную переменную, G, и поэтому ею опреде-
свободную переменную, X, и поэтому ею опре-
ляется некий внешний предикатный символ ва-
деляется некий внешний предикатный символ
лентности 1, в качестве него можно взять букву
валентности 1, в качестве него можно взять η.
η. Определение η можно переписать так:
Определение η можно переписать так:

η(X) ⇐⇒
η(G) ⇐⇒
∃M ∃R X = (M, R) & R ⊆ M × M &
  ∃M ∃e ∃f G = (M, e, f ) &
& ∀x x ∈ M ⇒ (x, x) ∈ R & & e∈M & f :M ×M →M &
   
& ∀x ∀y (x, y) ∈ R & (y, x) ∈ R ⇒ x = y & & ∀x ∀y ∀z f ((x, y), z) = f (x, (y, z)) &
  
& ∀x ∀y ∀z (x, y) ∈ R & (y, z) ∈ R ⇒ & ∀x f (x, e) = x & f (e, x) = x &
  
(x, z) ∈ R (1.1.91) & ∀x ∃y f (x, y) = e & f (y, x) = e (1.1.93)

Если к сигнатуре теории множеств MK присо-


единить символ η, а к системе ее аксиом формулу Если к сигнатуре теории множеств MK присо-
(1.1.91), то полученная формальная теория будет единить символ η, а к системе ее аксиом формулу
семантизацией теории частичного порядка (или (1.1.93), то полученная формальная теория будет
просто теорией частичного порядка в классиче- семантизацией теории групп (или просто теори-
ском его понимании). ей групп в классическом ее понимании).

• По аналогии с тем, как это делалось на с.102, каждой формуле ϕ теории S поставим в
соответствие формулу ϕ∗ теории S ∗ по следующим правилам:
— каждый предикатный символ η, примененный к переменным x1 , ..., xn , в ϕ нужно за-
менить на формулу (x1 , ..., xn ) ∈ η ′ ,
— каждый функциональный символ η в ϕ нужно заменить на соответствующий символ
η′ ,
— если в ϕ есть свободная переменная x, то заменяем ϕ на формулу
x ∈ P♯ ⇒ (ϕ) (1.1.94)
(это нужно проделать последовательно со всеми свободными переменными в ϕ и оста-
новиться),
— каждую подформулу
∀x α (1.1.95)
нужно заменить на подформулу
 
∀x x ∈ P♯ ⇒ (α) (1.1.96)
106 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— каждую подформулу
∃x α (1.1.97)
нужно заменить на подформулу
 
∃x x ∈ P♯ & (α) (1.1.98)

— на заключительном этапе мы получаем формулу, которую полезно как-то обозначить,


пусть это будет ϕP ; формула ϕ∗ получается из ϕP добавлением квантора всобщности
по переменной P :  
∀P P ∈ ModS ⇒ ϕP . (1.1.99)

Формула ϕ∗ называется семантизацией формулы ϕ в теории S.


! 1.1.20. По определению класса ModS , если ϕ – аксиома теории S, то соответствующая формула
ϕP выводима в модели P как в формальной теории. Поэтому семантизация ϕ∗ всякой аксиомы ϕ
теории S выводима в семантизации S ∗ теории S.
Следующее утверждение представляет собой ослабленный вариант одного из ключевых резуль-
татов в этой науке, который принято называть теоремой Гёделя о полноте15 . Мы приводим его
под другим названием, поскольку по нашему мнению, упоминание о полноте здесь излишне. Это
утверждение показывает, что всякая формальная теория S в определенном смысле эквивалентна
своей семантизации S ∗ (в MK или, в действительности, в любой другой рабочей теории множеств).
Теорема 1.1.22 (о семантизации для конечно аксиоматизированной теории). В предположении,
что теория MK непротиворечива, для любой конечно аксиоматизированной теории S над логикой
предикатов и любой формулы ϕ в ней следующие условия эквивалентны:
(i) формула ϕ выводима в S,
(ii) ее семантизация ϕ∗ выводима в семантизации S ∗ теории S.
! 1.1.21. Несколько огрубляя картину, можно сказать, что условие (ii) здесь эквивалентно тому, что
в каждой модели P ∈ ModS теории S соответствующая формула ϕP выводима (как в формальной
теории, какую представляет собой модель P ).
Доказательство теоремы 1.1.22. В прямую сторону это утверждение уже отмечалось в замечании
1.1.20: если формула ϕ в формальной теории S выводима, то формула ϕ∗ выводима в семантизации
S ∗ (это проверяется так же, как в теореме 1.1.13 об интерпретации). Нетривиальной частью является
обратное утверждение: если ϕ невыводима в S, то ϕ∗ невыводима в S ∗ .
Заметим теперь, что формулу ϕ можно считать замкнутой, потому что по предложению 1.1.6,
ϕ и ее замыкание всеобщности ϕ выводятся друг из друга. Пусть далее формула ϕ невыводима в
теории S. Тогда, по теореме 1.1.11, теория S + ¬ϕ непротиворечива. По теореме 1.1.21 Генкина это
означает, что для теории S + ¬ϕ найдется модель M в теории Морса-Келли MK. В этой модели
формула (¬ϕ)M = ¬(ϕM ) выводима. Мы получаем, что ¬(ϕM ) выводима и ϕM выводима тоже
(потому что ϕ∗ выводима). Значит, теория M , описывающая модель, противоречива, а вместе с ней
и содержащая ее теория MK тоже должна быть противоречива.

Семантизация S ∗ теории S, будучи эквива- ней тоже гораздо больше.


лентна S на уровне утверждений теории S (то Вот примеры, иллюстрирующие это замеча-
есть в смысле теоремы 1.1.22), не эквивалентна ние.
S в обычном, широком смысле. Точнее, можно
сказать, что все, что утверждается (и выво- ⋄ 1.1.22. Построенная нами в примере 1.1.18 се-
дится) в исходной теории S, утверждается (и мантизация теории частичного порядка не экви-
выводится) и в ее семантизации S ∗ , но не на- валентна самой этой теории (представленной как
оборот: в семантизации S ∗ сигнатура шире (в формальная теория в примере 1.1.3), потому что,
ней содержатся дополнительные символы из тео- например, все, что связано с гомоморфизмами
рии множеств) и аксиом гораздо больше, чем в частично упорядоченных множеств, описывает-
S, и как следствие, выводимых утверждений в ся только в семантизации теории частичного по-
рядка (а в самой формальной теории частичного
15 См. напр. Г.Такеути. Теория доказательств. М.: Мир, 1978.
§ 1. Логика предикатов для общей формальной теории 107

порядка из примера 1.1.3 понятие гомоморфизма на формальной теории групп из примера 1.1.4,
определить невозможно). потому что, например, понятие гомоморфизма
групп можно определить только в семантизации
⋄ 1.1.23. Точно так же описанная в примере этой теории (но не в самой формальной теории
1.1.19 семантизация теории групп не эквивалент- групп).

Семантизация теории с бесконечной системой аксиом. В определении семантизации S ∗


формальной теории S, которое мы привели на с.104, существенную роль играло то, что теория S
имела конечный набор аксиом. Если аксиом бесконечно много (как, например, в теории MK), то
определить класс моделей ModS и семантизацию S ∗ способом, описанным на с.104, невозможно.
Для этого приходится использовать гораздо более сложную конструкцию, которую мы опишем в
этом пункте.
Пусть теория S имеет произвольную (необязательно конечную) систему аксиом. Класс ModS ее
моделей строится как модификация конструкции, описанной на с.104.
1. Прежде всего, как и на с.104, мы расширяем сигнатуру Σ теории S. Выберем какой-нибудь
символ, не лежащий в Σ, например, пусть таким символом будет ♯. Дополним сигнатуру
Σ этим символом: пусть Σ♯ обозначает сигнатуру Σ с добавленным символом ♯.
2. Затем нужно превратить расширенную сигнатуру Σ♯ в объект теории Морса-Келли.
Это, как и на с.104, можно сделать, просто пронумеровав элементы Σ♯ . После этого мы
сможем относиться к Σ♯ как к объекту теории MK (точнее, как к множеству, в данном
случае, конечному).
3. Далее класс StrS реляционных структур, или просто структур теории S строится так
же как на с.104: объект P теории MK (то есть класс) считается элементом класса StrS
(и называется реляционной структурой или просто структурой), если он представляет
собой семейство {η ′ ; η ∈ Σ♯ } (отображение η ∈ Σ♯ 7→ η ′ ∈ Set) со следующими свойствами:
— множество P♯ непусто,
— для всякого предикатного символа η валентности n из сигнатуры Σ справедливо
вложение η ′ ⊆ (P♯ )n ,
— для всякого функционального символа η валентности n из сигнатуры Σ множе-
ство η ′ представляет собой отображение η ′ : (P♯ )n → P♯ .
4. Важное нововведение по сравнению с конструкцией на с.104: мы превращаем алфавит A
теории S в объект теории MK точно таким же образом, нумеруя его элементы, вкладывая
таким образом A в MK, а затем забывая об этой нумерации.
5. Систему логических символов ¬, &, ∨, ∃, ∀, = тоже нужно превратить в объект теории
MK.
6. После того, как Σ♯ и A превращены в объекты теории MK, систему термов теории S
также нужно превратить в некий объект TermS теории MK. Это делается по индукции
(напомним, что в теории MK определения по индукции уже были нами описаны, поэтому
сейчас это законный прием):
— сначала все элементы алфавита A, то есть все переменные теории S объявля-
ются термами,
— после этого для любого функционального символа β ∈ Σ♯ валентности n и любой
последовательности термов (τ1 , ..., τn ) последовательность
(β, τ1 , ..., τn )
синтаксический смысл которой — терм β(τ1 , ..., τn ) — тоже объявляется термом.
7. Затем то же самое проделывается с системой формул теории S: она также превращается
в некий объект FormS теории MK. И это тоже делается по индукции:
— если τ1 , ..., τn – термы, и α – предикатный символ (возможно, равенство) валентности
n, то последовательность
(α, τ1 , ..., τn )
синтаксический смысл которой — формула α(τ1 , ..., τn ) — объявляется элементом FormS .
108 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— для всякого ϕ ∈ FormS строка (¬, ϕ), смысл которой — формула ¬ ϕ — также объяв-
ляется элементом FormS ,
— для любых двух элементов ϕ, ψ ∈ FormS строки

(&, ϕ, ψ), (∨, ϕ, ψ), (⇒, ϕ, ψ), (⇔, ϕ, ψ),

смысл которых — формулы

(ϕ) & (ψ), (ϕ) ∨ (ψ), (ϕ) ⇒ (ψ), (ϕ) ⇔ (ψ),

— также объявляются элементами FormS ,


— если α ∈ A (переменная), а ϕ ∈ FormS (формула), то следующие две строки

(∀, α, ϕ), (∃, α, ϕ). (1.1.100)

кодирующие формулы
∀α (ϕ), ∃α (ϕ).
— также считаются элементами FormS .
8. Важным элементом этой картины должно быть то, что в классе FormS формул теории S
выделяется подкласс AxS аксиом. То есть должна строиться формула в теории MK, вы-
деляющая AxS в FormS . Как пример, AxS может выделяться каким-нибудь индуктивным
правилом.
9. Далее определяется так называемый предикат истинности теории S. Это отображение
TrueS , которое каждой структуре P ∈ StrS , каждой формуле ϕ ∈ FormS и каждому отоб-
ражению f : A → P♯ , называемому оценкой, ставит в соответствие конечный ординал16 0
или 1 по следующим индуктивным правилам:
— если τ1 , ..., τn – термы, α – предикатный символ (возможно, равенство) валентно-
сти n, то для формулы ϕ = (α, τ1 , ..., τn ) со свободными переменными x1 , ..., xk , и
оценки f : A → P♯ значение TrueS (P, ϕ, f ) равно 1, если строка (f (x1 ), ..., f (xk ))
принадлежит множеству

AP,α = {z : ∃y1 ... ∃yk z = (y1 , ..., yk ) Pα (τ1 (y1 , ..., yk ), ..., τn (y1 , ..., yk ))}

и 0 в противном случае (иными словами, TrueS (P, ϕ, f ) совпадает со значени-


ями характеристической функции множества AP,α , которую мы определили в
примере 0.3.15),
— для всякой строки ϕ ∈ FormS и оценки f : A → P♯ значение TrueS (P, (¬, ϕ), f )
меняется на противоположное по сравнению с TrueS (P, ϕ, f ):
(
1, TrueS (P, ϕ, f ) = 0
TrueS (P, ϕ, f ) =
0, TrueS (P, ϕ, f ) = 1

— для любых двух элементов ϕ, ψ ∈ FormS полагаем


(
1, TrueS (P, ϕ, f ) = 1 & TrueS (P, ψ, f ) = 1
TrueS (P, (&, ϕ, ψ), f ) =
0, иначе
(
0, TrueS (P, ϕ, f ) = 0 & TrueS (P, ψ, f ) = 0
TrueS (P, (∨, ϕ, ψ), f ) =
1, иначе
(
0, TrueS (P, ϕ, f ) = 1 & TrueS (P, ψ, f ) = 0
TrueS (P, (⇒, ϕ, ψ), f ) =
1, иначе
  

 True S (P, ϕ, f ) = 1 & True S (P, ψ, f ) = 1 ∨
 1,  
TrueS (P, (⇔, ϕ, ψ), f ) = ∨ True S (P, ϕ, f ) = 0 & True S (P, ψ, f ) = 0



0, иначе

16 Напомним, что ординалы 0 = ∅ и 1 = {∅} были определены выше формулами (0.3.279) и (0.3.280), а в свойстве

1◦ на с.61 отмечалось, что они являются элементами FinOrd.


§ 1. Логика предикатов для общей формальной теории 109

— если α ∈ A (переменная), а ϕ ∈ FormS (формула), то


( 
1, ∀g ∈ P♯A g(α) = f (α) ⇒ TrueS (P, ϕ, g) = 1
TrueS (P, (∀, α, ϕ), f ) =
0, иначе
(
1, ∃g ∈ P♯A g(α) = f (α) & TrueS (P, ϕ, g) = 1
TrueS (P, (∃, α, ϕ), f ) =
0, иначе

10. На последнем этапе в классе StrS реляционных структур выделяется подкласс ModS , со-
стоящий из моделей теории S. Под моделью теории S понимается реляционная структура
P ∈ StrS , у которой на всякой аксиоме ϕ теории S при любой оценке f : A → P♯ предикат
истинности имеет значение 1:

∀ϕ ∈ AxS ∀f ∈ P♯A TrueS (P, ϕ, f ) = 1.

• В результате мы получаем класс ModS моделей теории S, определенный формулой языка


теории MK. К конструкциям FormS , AxS , TrueS и ModS можно относиться как к присоеди-
ненным функциональным символам (валентности 0, 0, 3 и 0 соответственно), тогда теория
MK с этими присоединенными символами превращается в дефинициальное расширение
S ∗ теории MK. Теория S ∗ называется семантизацией формальной теории S в теории
MK.
• В противоположность интуитивно ясному определению на с.105 семантизация ϕ∗ фор-
мулы ϕ теории S определяется теперь как формула теории S ∗

∀P ∈ ModS ∀f ∈ P♯A True(P, ϕ, f ) = 1 (1.1.101)

Для фиксированной модели P ∈ ModS формула

∀f ∈ P♯A True(P, ϕ, f ) = 1 (1.1.102)

называется семантизацией формулы ϕ в модели P и обозначается ϕP .


! 1.1.24. По определению класса ModS , семантизация ϕ∗ всякой аксиомы ϕ теории S выводима в
семантизации S ∗ теории S.
Следующее утверждение представляет собой усиление теоремы 1.1.22, вариант теоремы Гёделя
о полноте для произвольных формальных теорий. Оно показывает, что всякая рекурсивно акси-
оматизированная формальная теория S в определенном смысле эквивалентна своей семантизации
S ∗ в MK.
Теорема 1.1.23 (о семантизации для рекурсивно аксиоматизированной теории). В предположе-
нии, что теория MK непротиворечива, для любой рекурсивно аксиоматизированной теории S над
логикой предикатов и любой формулы ϕ в ней следующие условия эквивалентны:
(i) формула ϕ выводима в S,
(ii) ее семантизация ϕ∗ выводима в семантизации S ∗ теории S.
! 1.1.25. Как и в теореме 1.1.22, огрубляя картину, можно сказать, что условие (ii) здесь эквива-
лентно тому, что в каждой модели P ∈ ModS теории S соответствующая формула ϕP выводима
(как в формальной теории, какую представляет собой модель P ).

Семантические теории. Мы уже говорили выше, что теоремы о семантизации 1.1.22 и 1.1.23
позволяют математикам свести изучение общих формальных теорий к изучению дефинициальных
расширений теории множеств MK. Выработанная в теории множеств интуиция фактически позво-
ляет вообще забыть определение формальной теории (приведенное нами на с.79) и рассматривать
любую теорию как дефинициальное расширение рабочей теории множеств. По этой причине мы
для дальнейших построений вводим следующее определение.
• Семантической теорией мы будем называть произвольное дефинициальное расширение
теории множеств MK (или любой другой рабочей теории множеств). При этом аксиома-
ми семантической теории будут называться просто определения этого дефинициального
расширения (то есть новые формулы, добавленные в список аксиом теории MK).
110 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Понятно, что семантизация формальной теории будет семантической теорией, поэтому всякую
формальную теорию S можно по теореме 1.1.23 представить как семантическую (то есть подобрать
для S эквивалентную ей в смысле теоремы 1.1.23 семантическую теорию S ∗ ), а, с другой стороны,
всякая семантическая теория по замечанию 1.1.17 является и формальной. Эти две операции —
превращение формальной теории в семантическую и наоборот — не будут, конечно, взаимно об-
ратными, но все же переход по ним дает в некотором смысле эквивалентную теорию (на уровне
утверждений, формулируемых в теории S, но, конечно, не в обычном смысле, как мы уже говорили
перед примерами 1.1.22 и 1.1.23).

Эта установка — сводить все теории к семан- U, V ∈ τ ⇒ U ∩ V ∈ τ, (1.1.105)


тическим — настолько естественна для матема- U ⊆τ ⇒ ∪U ∈τ (1.1.106)
тиков, что подавляющее большинство из них о
формальных теориях не задумывается. Считает- Класс таких объектов образует семантическую
ся, что теорию достаточно описать как дефини- теорию в MK, называемую общая топология.
циальное расширение рабочей теории множеств, Это очень важная теория в тех частях матема-
а вопрос, нельзя ли ее представить как семанти- тики, которые каким-то образом связаны с ана-
зацию какой-то формальной теории, обычно во- лизом, но она, по-видимому, не представима как
обще не возникает. Это оправдывается тем, что семантизация какой-то формальной теории.
такое представление очень часто, почти всегда
бывает чрезвычайно громоздким, а иногда и во- Это был пример, апеллирующий к общемате-
все невозможным. Вот некоторые примеры та- матической эрудиции, а вот еще несколько при-
ких “трудноупрощаемых” и “неупрощаемых” се- меров теорий, описываемых в самом нашем учеб-
мантических теорий. нике.
⋄ 1.1.26. Общая топология. Топологическим про-
⋄ 1.1.27. Теория вещественных чисел, как семан-
странством называется всякая пара (M, τ ), в ко-
тическая теория, описывается на с.122.
торой M — множество, а τ — система подмно-
жеств в M , то есть множество ⋄ 1.1.28. Теория векторных пространств, как се-
M
τ ⊆2 , мантическая теория, описывается на с.671.

такое, что выполняются следующие условия, на- ⋄ 1.1.29. Теория евклидовых пространств, как се-
зываемые аксиомами общей топологии: мантическая теория, описывается на с.751.
∅ ∈ τ, (1.1.103) ⋄ 1.1.30. Теория инвариантной меры, как семан-
M ∈ τ, (1.1.104) тическая теория, описывается на с.884.

6-я проблема Гильберта. Вопрос о том, можно ли считать данную теорию формальной (или
семантической, что, как мы теперь понимаем, эквивалентно), полезно обсуждать не только в мате-
матике, но также и (по крайней мере) в тех науках, которые используют математику, но формально
не являются ее частью. Это приводит к любопытнейшим, совсем неочевидным (по крайней мере,
для неспециалиста по логике) и весьма поучительным выводам. Обсуждение удобно начать с упо-
минания о шестой проблеме Гильберта.
В 1900 году на II Математическом конгрессе Давид Гильберт предложил некий список перво-
очередных задач математики (так, как он их понимал), и среди них, между прочим, была такая:
аксиоматизировать физику.

Утверждается, что в момент своего выступления Гильберт сформулировал это как одну из 10 задач.
Позже он этот список расширил до 23-х, и в нем эта проблема получила номер 6. С тех пор она
называется 6-й проблемой Гильберта.
Во времена, когда она была поставлена, математическая логика еще не оформилась в строгую
дисциплину, и, в частности, что следует понимать под аксиоматизацией, еще не было толком понят-
но. Очевидно, по этой причине до сих пор не существует единого мнения о том, насколько далеко
продвинулись математики в решении этой задачи. Мнения сходятся только в том, что даже при
самом нетребовательном понимании аксиоматизации, которое можно встретить среди далеких от
логики математиков (и, в больше мере, физиков), эту проблему нельзя считать решенной (хотя бы
потому что “единой физической теории” пока не построено).
§ 1. Логика предикатов для общей формальной теории 111

В свете того, что мы уже знаем про аксиоматические теории, задачу, поставленную Гильбер-
том, можно понимать либо как предписание построить формальную теорию (другими словами,
теорию 1 порядка), описывающую законы физики, и на уровне определений не связанную с теори-
ей множеств. Либо как семантическую теорию, то есть дефинициальное расширение какой-нибудь
рабочей теории множеств, например, теории MK. По теореме о семантизации 1.1.23 эти два решения
будут эквивалентны. С другой стороны, как показывают примеры на с.110, второе из них ближе к
традиции, и может считаться более удобным.

Как мы уже говорили, общей для всей физи- в том виде, как их описывают в нынешних учеб-
ки теории построить не удалось. Однако неко- никах по квантовой теории20 невозможно интер-
торые конкретные области этой науки можно претировать ни как аксиомы формальной тео-
считать аксиоматизированными, и именно в том рии (потому что никакая формальная теория в
смысле, что они описаны ныне как семантиче- этой науке не описывается), ни как определения
ские теории. Следующие примеры дают некото- в теории операторов на гильбертовом простран-
рое представление о прогрессе в этой области. стве, по крайней мере, если целью ставится вы-
вод каких-то утверждений о строении или свой-
⋄ 1.1.31. Классическая механика может считать-
ствах атомов, молекул или каких-то элементар-
ся в настоящее время аксиоматизированной, по-
ных частиц (потому что ни атомам, ни молеку-
скольку ее удалось описать как семантическую
лам, ни частицам определений в этой теории то-
теорию в современных вариантах Лагранжевой
же не дается).
и Гамильтоновой механики.17
Как следствие, например, таблица Д. И. Мен-
⋄ 1.1.32. Теория относительности также может делеева, которая, казалось бы, должна быть пер-
считаться аксиоматизированной, поскольку она вым и главным, о доказательстве чего следова-
описывается как семантическая теория, дефи- ло бы думать в квантовой механике, не является
нициальное расширение современной дифферен- теоремой этой науки. Почему, скажем, на первой
циальной геометрии18 (которая в свою очередь электронной оболочке может уместиться только
представляет собой дефинициальное расширение 2 электрона, на второй – 8, на третьей – опять
теории вещественных чисел19 ). 8, и т.д. – с точки зрения логики остается за-
гадкой (как и другие закономерности в строении
⋄ 1.1.33. Квантовую механику, по контрасту с атомов).
предыдущими примерами, к настоящему време-
ни нельзя считать аксиоматизированной, потому ⋄ 1.1.34. Теория вероятностей представляет со-
что ее пока не удалось описать ни как семантиче- бой показательный пример дисциплины, аксио-
скую теорию, ни тем более как теорию 1 поряд- матизация которой была найдена уже после до-
ка. Отношение нынешних специалистов к этой клада Гильберта. В 1933 году ее описание как
проблеме иллюстрирует разницу между матема- семантической теории (дефинициального расши-
тическим и физическим образованием: физики, рения теории меры) было дано А. Н. Колмого-
услышав такое, энергично протестуют, ссылаясь ровым.21 Физики не считают эту область своей,
на то, что они называют “постулатами Дирака- объявляя ее частью математики. Мне этот тезис
фон Неймана квантовой механики”. кажется спорным, из-за того, что трудно понять,
Одна из причин, почему мы подробно обсуж- не является ли он следствием общей для подоб-
дали понятия математической логики в этом па- ных ситуаций закономерности: как только наука
раграфе, состояла как раз в том, чтобы дать получает строгую математическую интерпрета-
читателю возможность проверить детали в по- цию, она сразу становится частью математики,
добных спорах. Поглядев на рассуждения фи- независимо от того, к какой области ее относили
зиков на эту тему, читатель теперь может сам до этого. По этой причине я привожу этот при-
убедиться, что постулаты Дирака-фон Неймана мер в списке физических теорий.

17 См.: В.И.Арнольд. Математические методы классической механики. М.: Наука, 1974.


18 См.: А.Бессе. Многообразия Эйнштейна. Т.1,2. М.: Мир, 1990.
19 Теорию вещественных чисел как дефинициальное расширение теории множеств мы описываем ниже в главе 2.
20 См., напр., Ф.А.Березин, М.А.Шубин. Уравнение Шредингера. М.: МГУ, 1983.
21 См. A. N. Kolmogorov. Grundbegriffe der Wahrscheinlichkeitrechnung, in Ergebnisse der Mathematik. — Berlin, 1933.

Русский перевод: А. Н. Колмогоров. Основные понятия теории вероятностей. — М.: Наука, 1974.
112 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

§2 Другие логические системы


(a) Логика высказываний
Помимо логики предикатов в математике (и еще больше в ее приложениях) очень популярна ло-
гическая система, называемая логикой высказываний. Она получается из логики предикатов вы-
брасыванием алфавита, сигнатуры и всего, что с ними связано (включая кванторы). Мы здесь
бегло ее опишем, только чтобы оттенить детали, связанные с логикой предикатов. Доказательство
утверждений мы оставляем читателю.

Различные аксиоматизации логики высказываний. Как и логику предикатов, логику вы-


сказываний можно описывать разными аксиоматическими системами. Мы здесь отметим те, что
получаются как модификации систем LK, CQC и G3c. В этих модификациях рассматривается только
то, что остается после выбрасывания переменных (а вместе с ними, термов и формул), с сохранением
одних обозначений для формул
α, β, γ, ..., ϕ, χ, ψ, ω,
и их композиций с помощью логических связок

¬α, α & β, α ∨ β, α ⇒ β, α ⇔ β

которые называются пропозициональными формулами (понятно,что связок может быть много).


Число букв, входящих в данную пропозициональную формулу, называется валентностью этой
формулы.

⋄ 1.2.1. Следующие пропозициональные форму- (α ∨ β) ⇒ γ,


лы
α
α ⇒ (α ∨ β)
¬α
α & β, имеют валентности, соответственно, 1,1,2,3,2.

A. Исчисление высказываний LKp получается из LK.


• Аксиома исчисления LKp одна и такая же как в LK:

LKp-0: ϕ ⊢ ϕ. (1.2.107)

• Правила вывода в исчислении LKp получаются выбрасыванием из LK правила сечения и


правил с кванторами:
— ослабление:
Γ ⊢∆ Γ ⊢∆
LKp-1: (1.2.108)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, ϕ
LKp-2: (1.2.109)
ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ
— перестановка:
ϕ, χ, ψ, Γ ⊢ ∆ Γ ⊢ ∆, ϕ, χ, ψ
LKp-3: (1.2.110)
ϕ, ψ, χ, Γ ⊢ ∆ Γ ⊢ ∆, χ, ϕ, ψ
— переброс отрицания:
Γ ⊢ ∆, ϕ ϕ, Γ ⊢ ∆
LKp-4: (1.2.111)
¬ ϕ, Γ ⊢ ∆ Γ ⊢ ∆, ¬ ϕ
— пересечение сукцедентов:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, χ
LKp-5: (1.2.112)
Γ ⊢ ∆, ϕ&χ
§ 2. Другие логические системы 113

— добавление в антецеденте:
ϕ, Γ ⊢ ∆ ϕ, Γ ⊢ ∆
LKp-6: (1.2.113)
ϕ &χ, Γ ⊢ ∆ χ &ϕ, Γ ⊢ ∆
— объединение в антецеденте:
ϕ, Γ ⊢ ∆ χ, Γ ⊢ ∆
LKp-7: (1.2.114)
ϕ ∨ χ, Γ ⊢ ∆
— добавление в сукцеденте:
Γ ⊢ ∆, ϕ Γ ⊢ ∆, ϕ
LKp-8: (1.2.115)
Γ ⊢ ∆, ϕ ∨ χ Γ ⊢ ∆, χ ∨ ϕ
— объединение с импликацией:
Γ ⊢ ∆, ϕ χ, Π ⊢ Λ
LKp-9: (1.2.116)
ϕ ⇒ χ, Γ, Π ⊢ ∆, Λ
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ ∆, χ
LKp-10: (1.2.117)
Γ ⊢ ∆, ϕ ⇒ χ
B) Исчисление высказываний CQCp получается из CQC тем же приемом.
• Аксиомами исчисления CQCp называются следующие формулы:

CQCp − 1 : ϕ ⇒ (χ ⇒ ϕ) (1.2.118)
CQCp − 2 : (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)) (1.2.119)
CQCp − 3 : (ϕ & χ) ⇒ ϕ (1.2.120)
CQCp − 4 : (ϕ & χ) ⇒ χ (1.2.121)
CQCp − 5 : ϕ ⇒ (χ ⇒ (ϕ ⇒ χ)) (1.2.122)
CQCp − 6 : ϕ ⇒ (ϕ ∨ χ) (1.2.123)
CQCp − 7 : χ ⇒ (ϕ ∨ χ) (1.2.124)
CQCp − 8 : (ϕ ⇒ ψ) ⇒ ((χ ⇒ ψ) ⇒ ((ϕ ∨ χ) ⇒ ψ)) (1.2.125)
CQCp − 9 : (¬ϕ) ⇒ (ϕ ⇒ χ) (1.2.126)
CQCp − 10 : (ϕ ⇒ χ) ⇒ ((ϕ ⇒ (¬χ)) ⇒ (¬ϕ)) (1.2.127)
CQCp − 11 : ϕ ∨ (¬ϕ) (1.2.128)
• Правилом вывода в исчислении CQCp считается
modus ponens: если выводимы формулы ϕ и ϕ ⇒ ψ, то выводима формула ψ; это изображается
дробью
ϕ, ϕ ⇒ ψ
(1.2.129)
ψ
C) Исчисление высказываний G3cp получается из G3c так же.
Напомними, что в языке этой системы добавляются два символа: символ ⊥, означающий “аб-
страктную ложь”, и символ ⊤, означающий “абстрактную истину”. Кроме того, отрицание ¬α пони-
мается как сокращение для формулы α ⇒ ⊥, а эквивалентность α ⇔ β как сокращение формулы
(α ⇒ β) & (β ⇒ α).
• Аксиомами исчисления G3cp считаются следующие три вида секвенций:
Γ, ⊥ ⊢ ∆ Γ, ϕ ⊢ ϕ, ∆ Γ ⊢ ⊤, ∆. (1.2.130)
• Правила вывода в исчислении G3cp такие:
Γ, ϕ, χ ⊢ ∆ Γ ⊢ ϕ, ∆ Γ ⊢ χ, ∆
(1.2.131)
Γ, ϕ & χ ⊢ ∆ Γ ⊢ ϕ & χ, ∆
Γ, ϕ ⊢ ∆ Γ, χ ⊢ ∆ Γ ⊢ ϕ, χ, ∆
(1.2.132)
Γ, ϕ ∨ χ ⊢ ∆ Γ ⊢ ϕ ∨ χ, ∆
Γ ⊢ ϕ, ∆ Γ, χ ⊢ ∆ Γ, ϕ ⊢ χ, ∆
(1.2.133)
Γ, ϕ ⇒ χ ⊢ ∆ Γ ⊢ ϕ ⇒ χ, ∆
114 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Эквивалетность исчислений высказыва- которые позволяют дереву расти бесконечно вы-


ний. Описанные выше исчисления LKp, CQCp соко, и поэтому на каком-то конечном шаге по-
и G3cp эквивалентны. Мы приведем несколь- строение должно обязательно закончиться. Если
ко примеров, иллюстрирующих эту эквивалент- на вершинах при этом окажутся аксиомы, то по-
ность, а полную проверку мы оставляем читате- лученное дерево будет выводом, а исходная се-
лю. квенция будет выводимой. Если же на какой-то
вершине будет не аксиома, то это будет означать,
⋄ 1.2.2. Вывод формулы (1.2.118) в LKp будет
что полученное дерево – не вывод, а исходная се-
таким:
квенция невыводима. Приведем пример.
ϕ⊢ϕ
(1.2.108) ⋄ 1.2.4. Рассмотрим секвенцию
χ, ϕ ⊢ ϕ
(1.2.117) ⊢ (α ⇒ β) ⇒ (α ⇒ γ)
ϕ⊢χ⇒ϕ
(1.2.117) Для нее дерево Генцена в G3cp будет таким:
⊢ ϕ ⇒ (χ ⇒ ϕ)
α ⊢ α, γ β, α ⊢ γ
⋄ 1.2.3. Вывод формулы (1.2.119) в LKp будет (1.2.133) (1.2.133)
таким: ⊢ α, α ⇒ γ β⊢α⇒γ
(1.2.133)
χ⊢χ ψ⊢ψ
α⇒β⊢α⇒γ
(1.2.116)
(1.2.133)
ϕ⊢ϕ χ ⇒ ψ, χ ⊢ ψ ⊢ (α ⇒ β) ⇒ (α ⇒ γ)
(1.2.116)
ϕ ⇒ (χ ⇒ ψ), ϕ, χ ⊢ ψ Видно, что на вершине справа стоит не аксиома,
(1.2.110)
поэтому такая секвенция невыводима.
ϕ⊢ϕ χ, ϕ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ
(1.2.116) ⊲⊲ 1.2.5. Проверьте выводимость следующих
ϕ ⇒ χ, ϕ, ϕ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ формул в исчислении высказываний:
(1.2.109)
ϕ ⇒ χ, ϕ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ (α ⇒ β) & (α ⇒ ¬β)
(1.2.110)
(α ⇒ β) ∨ (α ⇒ ¬β)
ϕ, ϕ ⇒ χ, ϕ ⇒ (χ ⇒ ψ) ⊢ ψ
(1.2.117)
(α ⇒ β) & (¬β ⇒ ¬α)
ϕ ⇒ χ, ϕ ⇒ (χ ⇒ ψ) ⊢ ϕ ⇒ ψ (α ⇒ β) ⇒ (¬β ⇒ ¬α)
 
(1.2.117)
(α ⇒ β) & ¬β ⇒ ¬α
ϕ ⇒ (χ ⇒ ψ) ⊢ (ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ)  
(1.2.117)
(α ∨ β) ⇒ γ ∨ α ∨ β
⊢ (ϕ ⇒ (χ ⇒ ψ)) ⇒ ((ϕ ⇒ χ) ⇒ (ϕ ⇒ ψ))
(α ∨ β) & (¬α & ¬β)
 
Выводимость в логике высказываний. В α ⇒ (β ∨ γ) ∨ (γ ⇒ ¬α)
отличие от логики предикатов, в логике выска-    
зываний имеется (и очень простой) алгоритм, α ⇒ (β ⇒ γ) ⇒ (α ⇒ β) ⇒ (α ⇒ γ)
позволяющий понять, выводима данная секвен-    
ция, или нет. Он состоит в том, чтобы строить α ⇒ (β ⇒ γ) ⇒ (α ⇒ β) ⇒ (γ ⇒ α)
дерево Генцена в исчислении G3cp: как может    
заметить читатель, в правилах G3cp нет таких, (α ∨ β) & α ⇒ (β & γ) & β ⇒ (α & ¬γ)

Теорема о полноте для логики высказываний. Каждой пропозициональной формуле ва-


лентности n можно поставить в соответствие некое отображение f : {0, 1}n → {0, 1}, называемой
функцией истинности по следующему алгоритму:
1) для формулы не содержащей ни одной логической связки

соответствующая функция истинности f : {0, 1} → {0, 1} определяется равенством

f (α) = α
§ 2. Другие логические системы 115

(на переменную α здесь нужно глядеть как на элемент множества {0, 1}),
2) для формулы
¬α
соответствующая функция истинности f : {0, 1} → {0, 1} обозначается тем же символом
¬ и определяется равенством
(
1, α = 0
f (α) = ¬α =
0, α = 1

3) для формулы
α&β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
& и определяется равенством
(
1, α = 1 и β = 1
f (α, β) = α & β =
0, иначе

4) для формулы
α∨β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
∨ и определяется равенством
(
0, α = 0 и β = 0
f (α, β) = α ∨ β =
1, иначе

5) для формулы
α⇒β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇒ и определяется равенством
(
0, α = 1 и β = 0
f (α, β) = α ⇒ β =
1, иначе

6) для формулы
α⇔β
соответствующая функция истинности f : {0, 1}2 → {0, 1} обозначается тем же символом
⇔ и определяется равенством
(
1, (α = 1 и β = 1) или (α = 0 и β = 0)
f (α, β) = α ⇔ β = .
0, иначе

7) для остальных пропозициональных формул булевы функции строятся как композиции


уже описанных.

⋄ 1.2.6. Описанный алгоритм позволяет ко вся- соответствующая функция истинности


кой формуле в исчислении высказываний отно-
ситься как к булевой функции. Например, для f (α, β, γ) = (α ∨ β) ⇒ γ,
формулы
на аргументах α = 1, β = 0, γ = 0 принимает
значение

(α ∨ β) ⇒ γ (1.2.134) f (1, 0, 0) = (1 ∨ 0) ⇒ 0 = 1 ⇒ 0 = 0.

Следующий результат считается главным в логике высказываний:


116 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

Теорема 1.2.1 (полнота исчисления высказываний). 22 Выводимость пропозициональной фор-


мулы в исчислении высказываний эквивалентна тождественному равенству единице ее булевой
функции.

⋄ 1.2.7. Например, рассмотренная выше форму- формулы


ла (1.2.134)
(α ∨ β) ⇒ γ f (α, β, γ) = (α ⇒ β) ⇒ (α ⇒ γ)
– невыводима, потому что, как мы уже отмечали будет обращаться в нуль: для этого надо рас-
в примере 1.2.6, ее функция истинности смотреть вершину дерева, не являющуюся акси-
омой, в данном случае, правую вершину,
f (α, β, γ) = (α ∨ β) ⇒ γ,
β, α ⊢ γ
равну нулю на значениях α = 1, β = 0, γ = 0.
⋄ 1.2.8. Вспомним, что в примере 1.2.4 мы дока- и переменные, слева от символа секвенции, по-
зали невыводимость формулы ложить равными единице

(α ⇒ β) ⇒ (α ⇒ γ) β = 1, α = 1,

Соответствующее дерево Генцена в G3cp выгля- а переменные справа — равными нулю:


дело так:
γ = 0.
α ⊢ α, γ β, α ⊢ γ
(1.2.133) (1.2.133) На этих значениях мы получим
⊢ α, α ⇒ γ β⊢α⇒γ
(1.2.133) f (1, 1, 0) = (1 ⇒ 1) ⇒ (1 ⇒ 0) = 1 ⇒ 0 = 0.
α⇒β⊢α⇒γ
(1.2.133)
⊲⊲ 1.2.9. Постройте функции истинности для
⊢ (α ⇒ β) ⇒ (α ⇒ γ) примеров из упражнений 1.2.5 и, в случае, если
формула невыводима, подберите значения пере-
По этому дереву можно сразу понять, при ка- менных для ее функции истинности, на которых
ких аргументах функция истинности для нашей она принимает нулевое значение.

(b) Интуиционистская логика


Довольно неожиданно, что одно небольшое изменение в правилах исчисления LK ведет к системе,
которая, как оказывается, формализует знаменитую интуиционистскую логику, пропагандировав-
шуюся математиками Яном Брауэром, Германом Вейлем и Арендом Гейтингом в первой половине
20 века в качестве альтернативы гильбертовскому формализму (и расселовскому логицизму). Свои
взгляды интуиционисты описывали довольно невнятно, до тех пор, пока в 1930-х годах Генцен не
заметил, как их философия может быть формализована исчислением секвенций. Соответствующую
систему он обозначил аббревиатурой LJ (в которой буква “J” означает интуиционизм), и от системы
LK она отличается только тем, что в ее правилах сукцеденты всех секвенций могут содержать не
более одной формулы. Мы приведем правила системы LJ, а также правила соответствующей логи-
ки высказываний LJp (которая тоже меняется в соответствии с общим принципом “не более одной
формулы в сукцеденте”).

Интуиционистская логика предикатов. Вот правила интуиционистской логики предикатов


LJ (здесь ϕ, χ, ψ, ω — произвольные формулы, а Γ , Π — произвольные наборы формул)23 :
a. Структурные правила:
— ослабление:
Γ ⊢ω Γ ⊢
LJ-1: (1.2.135)
ϕ, Γ ⊢ ω Γ ⊢ϕ
22 P.T.Johnstone,Notes on logic and set theory, 1987 (Proposition 3.7, Theorem 2.6).
23 Читатель может заметить, что среди правил LJ отсутствуют сокращение справа и перестановка справа, поскольку
требование “не более одной формулы в сукцеденте” не оставляет им места.
§ 2. Другие логические системы 117

— сокращение:

ϕ, ϕ, Γ ⊢ ω
LJ-2: (1.2.136)
ϕ, Γ ⊢ ω
— перестановка:

ϕ, χ, ψ, Γ ⊢ ω
LJ-3: (1.2.137)
ϕ, ψ, χ, Γ ⊢ ω
— сечение:
Γ ⊢ ϕ ϕ, Π ⊢ ω
LJ-4: (1.2.138)
Γ, Π ⊢ ω

b. Правила введения логических связок:


— переброс отрицания:

Γ ⊢ϕ ϕ, Γ ⊢
LJ-5: (1.2.139)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
— конъюнкция в сукцеденте:

Γ ⊢ϕ Γ ⊢χ
LJ-6: (1.2.140)
Γ ⊢ ϕ&χ

— добавление в антецеденте:

ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
LJ-7: (1.2.141)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
— дизъюнкция в антецеденте:

ϕ, Γ ⊢ ω χ, Γ ⊢ ω
LJ-8: (1.2.142)
ϕ ∨ χ, Γ ⊢ ω

— добавление в сукцеденте:

Γ ⊢ϕ Γ ⊢ϕ
LJ-9: (1.2.143)
Γ ⊢ϕ∨χ Γ ⊢χ∨ϕ

— перенос с импликацией в антецедент:

Γ ⊢ ϕ χ, Π ⊢ ω
LJ-10: (1.2.144)
ϕ ⇒ χ, Γ, Π ⊢ ω

— перенос с импликацией в сукцедент:

ϕ, Γ ⊢ χ
LJ-11: (1.2.145)
Γ ⊢ϕ⇒χ

— добавление квантора всеобщности в антецедент: если подстановка ϕ x=τ


кор-
ректна24 (здесь x — переменная, а τ – терм), то

ϕ x=τ , Γ ⊢ ω
LJ-12:∗ (1.2.146)
∀x ϕ, Γ ⊢ ω

— добавление квантора всеобщности в сукцедент: если переменная y не входит


(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул Γ ,
ω, ∀x ϕ), то

Γ ⊢ϕ x=y
LJ-13: (1.2.147)
Γ ⊢ ∀x ϕ
24 Определение корректной подстановки дано на с. 8.
118 Глава 1. МАТЕМАТИЧЕСКАЯ ЛОГИКА

— добавление квантора существования в антецедент: если переменная y не входит


(как свободная переменная) в нижнюю секвенцию (то есть в наборы формул
∃x ϕ, Γ , ω), то
ϕ x=y
,Γ ⊢ ω
LJ-14: (1.2.148)
∃x ϕ, Γ ⊢ ω
— добавление квантора существования в сукцедент: если подстановка ϕ x=τ
кор-
ректна25 (здесь x — переменная, а τ – терм), то
Γ ⊢ ϕ x=τ
LJ-15:∗ (1.2.149)
Γ ⊢ ∃x ϕ

⋄ 1.2.10. Вспомним закон исключенного тре- Первое из них можно превратить в вывод, если
тьего, о котором мы говорили в примере 0.2.26, подклеить к нему сверху вывод секвенции
и который в исчислении LK представляет собой
утверждение о выводимости секвенции
⊢α
⊢ α ∨ ¬α. (1.2.150)
По контрасту с LK, в исчислении LJ эта секвен- (а для этого нужно, чтобы такой вывод суще-
ция не выводима (и это одна из причин, почему ствовал), а второе точно так же можно превра-
считается, что исчисление LJ формализует инту- тить в вывод, если подклеить к нему сверху вы-
иционистскую логику). вод секвенции
Во-первых, нужно заметить, что рассужде-
ние, использовавшееся в примере 0.2.26, здесь ⊢ ¬α
не проходит, потому что там сукцедент состо-
ял из двух формул, а в LJ такое запрещено. А,
во-вторых, среди правил вывода LJ-1—LJ-15 есть (а для этого нужно, чтобы такой вывод суще-
только одно, содержащее логическую связку ∨ ствовал). Но если ни одна из этих секвенций не
в сукцеденте, а именно, LJ-926 , и если с его по- выводима (например, если формула α атомарна,
мощью пытаться достроить дерево вверх, то мы и ни α, ни ¬α не входят в систему аксиом), то ни
получим либо дерево (1.2.151), ни (1.2.152) в вывод не превратишь.

⊢α Это значит, что секвенция (1.2.150) не выво-


(1.2.143) (1.2.151) дима в LJ (по крайней мере) для атомарных фор-
⊢ α ∨ ¬α мул α, таких, что ни α, ни ¬α не входят в акси-
омы теории. Иными словами, если в теории над
либо дерево исчислением LJ существует хотя бы одна ато-
⊢ ¬α марная формула α, такая, что ни α, ни ¬α не
(1.2.143) (1.2.152) входят в систему ее аксиом, то в этой теории
⊢ α ∨ ¬α секвенция (1.2.150) не выводима.

Интуиционистская логика высказываний. Логика высказываний в интуиционистской тео-


рии также претерпевает изменения. Возникающая в результате система LJp отличается от системы
LKp (которую мы описывали на с.112) тем, что в LJp каждый сукцедент, в соответствии с общим
принципом LJ, может иметь не более одной формулы (или, эквивалентно, LJp можно получить из
LJ выбросив правило сечения и правила с кванторами). Вот правила этой системы (ϕ, χ, ψ, ω —
произвольные формулы, а Γ , Π — произвольные наборы формул):
— ослабление:
Γ ⊢ω Γ ⊢
LJp-1: (1.2.153)
ϕ, Γ ⊢ ω Γ ⊢ϕ
— сокращение:
ϕ, ϕ, Γ ⊢ ω
LJp-2: (1.2.154)
ϕ, Γ ⊢ ω
25 См.определение на с. 8.
26 Висчислении LK это рассуждение не работает, потому что там по правилу LK-2 можно, двигаясь вверх по дереву,
формулы в сукцеденте множить, что в LJ невозможно.
§ 2. Другие логические системы 119

— перестановка:
ϕ, χ, ψ, Γ ⊢ ω
LJp-3: (1.2.155)
ϕ, ψ, χ, Γ ⊢ ω
— переброс отрицания:
Γ ⊢ϕ ϕ, Γ ⊢
LJp-4: (1.2.156)
¬ ϕ, Γ ⊢ Γ ⊢ ¬ϕ
— пересечение сукцедентов:
Γ ⊢ϕ Γ ⊢χ
LJp-5: (1.2.157)
Γ ⊢ ϕ&χ
— добавление в антецеденте:
ϕ, Γ ⊢ ω ϕ, Γ ⊢ ω
LJp-6: (1.2.158)
ϕ &χ, Γ ⊢ ω χ &ϕ, Γ ⊢ ω
— объединение в антецеденте:
ϕ, Γ ⊢ ω χ, Γ ⊢ ω
LJp-7: (1.2.159)
ϕ ∨ χ, Γ ⊢ ω
— добавление в сукцеденте:
Γ ⊢ϕ Γ ⊢ϕ
LJp-8: (1.2.160)
Γ ⊢ϕ∨χ Γ ⊢χ∨ϕ
— объединение с импликацией:
Γ ⊢ ϕ χ, Π ⊢ ω
LJp-9: (1.2.161)
ϕ ⇒ χ, Γ, Π ⊢ ω
— перенос с импликацией в сукцедент:
ϕ, Γ ⊢ χ
LJp-10: (1.2.162)
Γ ⊢ϕ⇒χ
Часть II

ФУНКЦИИ ОДНОЙ
ВЕЩЕСТВЕННОЙ ПЕРЕМЕННОЙ

120
Глава 2

ВЕЩЕСТВЕННЫЕ ЧИСЛА

Понятие вещественного числа является естественным развитием идеи измерения по эталону, ухо-
дящей корнями в глубокую древность и опирающейся на следующие два фундаментальных допу-
щения.
1. Первое из них — возможность сравнивать с эталоном — заключается в том, что среди значений
физической величины можно выбирать эталонные, то есть такие, которыми можно (в целых
числах) оценивать все остальные значения этой величины. Например, имея эталон длины – метр
– можно длину x любого физического тела оценивать в метрах (то есть найти, сколько метров
в этой длине укладывается, а сколько – нет):

k 6 x < k + 1.

При этом важно, что организовать методы измерения можно так, чтобы результаты не зависели
от попыток.
2. Второе же — возможность измельчения эталона — предполагает, что любой эталон можно де-
лить на равные части (точнее, на произвольное фиксированное число равных частей), которые
также можно принимать за эталоны. Из этого принципа следует, что мы можем поделить наш
исходный эталон длины, скажем, на 10 равных частей, принять их длины за новые эталоны, и
после этого поглядеть, не войдут ли в оставшуюся часть длины x − k (куда уже не входит наш
исходный эталон) новые, меньшие эталоны:
l l+1
6x−k < .
10 10
Так мы получим уже оценку в десятых долях эталона (то есть можно будет сказать, сколько
десятых долей эталона укладывается в величине, которую мы измеряем):
l l+1
k+ 6x<k+
10 10
Поскольку (согласно второму допущению) измельчать эталон можно сколь угодно долго, мы
получаем, что физическую величину x можно оценивать сверху и снизу рациональными числами
(количеством долей эталона)
m m+1
6x< ,
n n
причем с любой точностью (то есть так, чтобы числа m m+1
n и n отличались друг от друга как угодно
мало). В этом состоит применяемый в естествознании алгоритм измерения физической величины по
эталону, и интерпретировать его удобнее всего, как приближение к некоему идеальному значению,
изначально имеющемуся у данной измеряемой величины x.
Разумеется, не всякая физическая величина допускает измерение по эталону так, как мы это
описали. Например, у векторных величин (таких, как скорость или сила) оценивать при измерении
необходимо не одну, а сразу несколько числовых характеристик (скажем, проекции данной величи-
ны на заранее выбранные координатные оси), а у целочисленных величин (таких, как количество
однотипных предметов в данном объеме пространства) допущение о делимости эталонов не будет
справедливым. Более того, развитие физики показало, что даже для величин, измерение которых
традиционно организуется именно сравнением с эталоном (таких как длина, масса или объем), де-
ление эталона тоже не может быть бесконечным, потому что, когда Вы доходите до планковских

121
122 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

размеров, дальнейшее деление утрачивает смысл (то есть попросту становится непонятно, что зна-
чит делить дальше).
Тем не менее, вера в эти принципы (или, точнее сказать, невозможность на данном этапе разви-
тия науки заменить их чем-то более эффективным) приводит к тому, что физическая величина пред-
ставляется такой, что ее можно с любой точностью оценивать рациональными числами в эталонных
единицах измерения. Само по себе это еще не означает, что значения физической величины долж-
ны непременно описываться вещественными числами, какими их изображают в математическом
анализе (дело в том, что в математике имеются альтернативные теории, например, «нестандарт-
ный анализ», где числа описываются иначе). Но при некоторых дополнительных предположениях,
в частности, что величины могут быть отрицательными, и что в качестве эталона можно выбирать
любое ненулевое значение физической величины, математическая теория, формализующая идею
измерения по эталону, оказывается единственной, и ее аксиоматика выглядит следующим образом.

§1 Вещественные числа и числовые множества


В математике имеется три главных способа объяснить, что такое число:
1) построить формальную теорию1 чисел (наподобие теории множеств, но не связанную с
ней),
2) описать теорию чисел абстрактно, как дефинициальное расширение2 рабочей теории мно-
жеств,
3) построить явную конструкцию числа в рабочей теории множеств.
Смысл того, что представляет из себя первый способ, можно понять по примеру 1.1.5 на странице
84, в котором описывалась формальная теория Пеано натуральных чисел. Мы это не обсуждаем в
тексте, но по аналогии с теорией Пеано можно построить формальную теорию вещественных чисел
(с другими аксиомами). Недостаток такого подхода, однако, в том, что для привязки к остальной
математике получаемую теорию все равно приходится интерпретировать в теории множеств, а это
делает вообще излишним построение теории чисел как формальной теории.
Второй способ можно считать самым удобным, потому что он избавляет зрителя от необходи-
мости следить за громоздкими деталями, которые нигде, кроме самых первых утверждений этой
теории, не используются. Но у него есть важный недостаток: доказательство, что описываемая в
этой теории конструкция (множество вещественных чисел R) действительно существует (то есть
ее существование вытекает из аксиом рабочей теории множеств), нужно проводить отдельно, и это
приводит нас к третьему способу.
Третий способ состоит в том, чтобы строить числа прямиком из аксиом рабочей теории мно-
жеств, так, чтобы их существование (внутри теории множеств) не вызывало сомнений.
Оба последних способа, второй и третий, мы описываем в этой главе (второй – на с.122, а третий
на с.126).

(a) Вещественные числа R как семантическая теория


Вот как выглядит описание теории вещественных чисел как семантической теории (точнее, как
дефинициального расширение теории множеств MK).

Аксиомы теории вещественных чисел. Под моделью вещественных чисел, понимается произ-
вольная шестерка3 (R, 0, 1, +, ·, 6), в которой R — некое множество, элементы которого называются
вещественными числами, 0 и 1 — его элементы, + и · — отображения R × R → R, называемые со-
ответственно сложением и умножением, а 6 — бинарное отношение, называемая порядком, такие
что выполняются следующие две группы требований I и II.

I. Арифметические операции над вещественными числами


A1. Коммутативность сложения: для любых чисел a и b выполняется равенство

a+b=b+a (2.1.1)
1 Что такое формальная теория мы объясним на с.79.
2 Понятие дефинициального расширения было введено на с.89.
3 Понятие шестерки (строки длины 6) было введено на с.73.
§ 1. Вещественные числа и числовые множества 123

A2. Ассоциативность сложения: для любых чисел a, b и c выполняется равенство

(a + b) + c = a + (b + c) (2.1.2)

A3. Коммутативность умножения: для любых чисел a и b выполняется равенство

a·b=b·a (2.1.3)

A4. Ассоциативность умножения: для любых чисел a и b выполняется равенство

(a · b) · c = a · (b · c) (2.1.4)

A5. Дистрибутивность: для любых чисел a, b, c выполняется равенство

(a + b) · c = a · c + b · c (2.1.5)

A6. Существование нуля: существует число 0 такое, что

a+0=a (2.1.6)

A7. Существование противоположного числа: для любого числа a существует такое чис-
ло −a (называемое противоположным числом к числу a) что

a + (−a) = 0 (2.1.7)

A8. Существование единицы: существует число 1 6= 0 такое, что для любого числа a 6= 0
справедливо равенство
a·1=a (2.1.8)
A9. Существование обратного числа: для любого числа a 6= 0 существует такое число a−1
(называемое обратным числом к числу a), что

a · a−1 = 1 (2.1.9)

II. Сравнение вещественных чисел


Для любых вещественных чисел a и b имеет смысл высказывание «a меньше, либо равно b»,
записываемое a 6 b. Оно может быть верно или неверно, но при этом выполняются следующие
правила.
A10. Рефлексивность: для любого числа a справедливо a 6 a.
A11. Транзитивность: если a 6 b и b 6 c, то a 6 c.
A12. Антисимметричность: если a 6 b и b 6 a, то a = b.
A13. Линейность: для любых чисел a и b
– либо a 6 b;
– либо b 6 a.
A14. Монотонность сложения: если a 6 b, то для любого c справедливо a + c 6 b + c.
A15. Сохранение знака + при умножении: если 0 6 a и 0 6 b, то 0 6 a · b.
A16. Непрерывность вещественной прямой: пусть X и Y – два непустых множества веще-
ственных чисел, причем для любых чисел x ∈ X и y ∈ Y выполняется неравенство x 6 y;
тогда существует хотя бы одно число c такое, что для любых x ∈ X и y ∈ Y выполняется
неравенство x 6 c 6 y.
• Класс всех моделей вещественных чисел естественно назвать теорией вещественных чи-
сел.

⋄ 2.1.1. Дедекиндовы сечения. Из теорем 2.1.18 является моделью вещественных чисел. Из это-
и 2.1.19 следует, что множество всех дедекиндо- го примера видно, что класс всех моделей веще-
вых сечений множества Q рациональных чисел ственных чисел непуст.
124 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Из аксиом A1 - A16 следуют все остальные свойства вещественных чисел (и, в частности, все
теоремы математического анализа).
Помимо отношения «меньше, либо равно» a 6 b на множестве вещественных чисел R вводятся
еще три отношения, а именно,
– «меньше» a < b, означающее, что a 6 b и одновременно a 6= b;
– «больше, либо равно» a > b означающее, что b 6 a;
– «больше» a > b, означающее, что b 6 a и одновременно b 6= a.
Из аксиомы линейности A13 следует, что множество вещественных чисел R удобно изображать
в виде прямой, а сами вещественные числа – в виде точек на ней. Именно так и делают математики:

⋄ 2.1.2. Покажем, что из аксиом A6 (о суще- m


ствовании нуля) и A1 (коммутативности) следу-
(a + x) + (−a) = b + (−a)
ет, что нуль единственен. Действительно, если 0
и 0̃ – два разных объекта со свойствами нуля m
(x + a) + (−a) = b + (−a)
∀a a + 0 = a, (2.1.10)
m
x + (a + (−a)) = b + (−a)
∀a a + 0̃ = a (2.1.11)
m
то мы получили бы
x + 0 = b + (−a)
0̃ = (2.1.10) = 0̃ + 0 = (A1) = 0 + 0̃ = (2.1.11) = 0
m
(в скобках мы указываем формулы или аксио- x = b + (−a)
мы, которые в данный момент используем в сво-
их рассуждениях).
⋄ 2.1.3. Покажем, что для данного числа a про- ⋄ 2.1.6. Справедливы следующие тождества:
тивоположное число −a, существование которо- 0·a= 0 (2.1.14)
го постулируется в аксиоме A7, тоже должно
быть единственно. Действительно, если бы суще- − (−a) = a (2.1.15)
ствовали два числа x и y со свойствами a + x = 0 (−1) · a = −a (2.1.16)
и a + y = 0, то мы получили бы (−a) · (−a) = a · a (2.1.17)

x = (A6) = x + 0 = x + (a + y) = (A2) = Доказательство. 1. Докажем (2.1.14):


= (x + a) + y = (A1) = (a + x) + y = 0 + y = 0 · a = (0 + 0) · a = 0 · a + 0 · a
= (A1) = y + 0 = y
⇓ (2.1.13)
⊲ 2.1.4. Докажите равенство: 0 · a + (−0 · a) = 0 · a
−0 = 0 (2.1.12) ⇓ (A7)

⋄ 2.1.5. Покажем, что справедлива следую- 0=0·a


щая эквивалентность, означающая, что уравне- 2. Для (2.1.15) доказательство выглядит так:
ния вида a + x = b однозначно разрешимы в R:
a + (−a) = 0
a+x=b ⇐⇒ x = b + (−a) (2.1.13)

Доказательство. (−a) + a = 0
a+x=b ⇓
§ 1. Вещественные числа и числовые множества 125

a – противоположное число для −a Доказательство.


у −a не может
!
быть двух (−a−1 ) · (−a) = (2.1.17) = a−1 · a = 1
⇓ противоположных
чисел
 
в силу

a = −(−a) упражнения 2.1.9,



⇓  у −a не может 
 быть двух 
3. Для (2.1.16) доказательство такое: обратных
чисел

(A7) (−a)−1 = −a−1


1 + (−1) = 0 ⊲ 2.1.12. Докажите следующие утверждения:

⇓ x<y =⇒ ∀a x+a<y+a (2.1.21)


(1 + (−1)) · a = 0 · a x·y =0 =⇒ x=0 ∨ y=0 (2.1.22)
x>0 & y>0 =⇒ x·y >0 (2.1.23)
⇓ (A5),(2.1.14)
x<0 & y<0 =⇒ x·y >0 (2.1.24)
1 · a + (−1) · a = 0 x<0 & y>0 =⇒ x·y <0 (2.1.25)
⇓ 1>0 (2.1.26)
a + (−1) · a = 0 −1<0 (2.1.27)
x<y =⇒ −x > −y (2.1.28)
⇓ −1
x>0 =⇒ x >0 (2.1.29)
(−1) · a – противоположное число для a −1
x<0 =⇒ x <0 (2.1.30)
⇓ 0<x<y =⇒ −1
x >y −1
(2.1.31)
−1 −1
(−1) · a = −a x < y < 0 =⇒ x > y (2.1.32)
4. Докажем (2.1.17): x < y & a > 0 =⇒ a · x < a · y (2.1.33)
x<y & a < 0 =⇒ a · x > a · y (2.1.34)
(−a) · (−a) = (2.1.16) = ((−1) · a) · (−a) = a>1 ⇐⇒ 0 < a < 1 (2.1.35)
= (A3) = (a · (−1)) · (−a) = (A4) = x>0 & a > 1 =⇒ a · x > x (2.1.36)
= a · ((−1) · (−a)) = (2.1.16) = x>0 & 0 < a < 1 =⇒ a · x < x (2.1.37)
= a · (−(−a)) = (2.1.15) = a · a
Числа 2, ..., 10. Напомним, что обозначения 0,
1, 2, 3, 4, 5, 6, 7, 8, 9 были введены нами в тео-
рии MK в формулах (0.3.279)—(0.3.288). Сейчас
⊲ 2.1.7. Докажите, по аналогии с примером мы описываем теорию вещественных чисел, как
2.1.2, что единица 1, существование которой по- дефинициальное расширение теории множеств,
стулируется в аксиоме A8, тоже единственна. для понимания которого такие детали как опре-
⊲ 2.1.8. Докажите равенство: деления (0.3.279)—(0.3.288) не нужны, и более то-
го, при желании читатель может вообще обхо-
1−1 = 1 (2.1.18) диться наивным пониманием теории множеств.
Поэтому помнить об определениях на с.50 не обя-
⊲ 2.1.9. По аналогии с примером 2.1.3 докажи- зательно, а если помнить, то то надо понимать,
те, что для данного числа a 6= 0 обратное число что определения тех же чисел от 0 до 9 в описы-
a−1 (о котором идет речь в аксиоме A9), должно ваемой теперь теории будет другим (и формаль-
быть единственно (то есть, не может существо- но это будут другие объекты).
вать двух чисел x и y со свойствами a · x = 1 и В частности, число 2 определяется равен-
a · y = 1). ством
2 := 1 + 1 (2.1.38)
⊲ 2.1.10. Докажите тождество:
Точно также, числа 3, 4, 5 можно определить ра-

−1 −1
a =a (2.1.19) венствами
3 := 1 + (1 + 1),
⋄ 2.1.11. Справедливо тождество
4 := 1 + (1 + (1 + 1)), (2.1.39)
(−a)−1 = −a−1 (2.1.20) 5 := 1 + (1 + (1 + (1 + 1)))
126 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Полезно заметить, что одно и то же число можно определения для одного и того же символа были
определять по-разному. Например, 3, 4, 5 можно эквивалентны. Естественный (и самый распро-
иначе определить так: страненный) способ вводить новые обозначения
– так называемый последовательный, в котором
3 := (1 + 1) + 1, при определении нового обозначения использу-
4 := ((1 + 1) + 1) + 1, (2.1.40) ются обозначения, введенные ранее. Например,
5 := (((1 + 1) + 1) + 1) + 1 числа 3, 4, 5, 6, 7, 8, 9, 10 можно последователь-
но определить так:
Строго говоря, это будут другие определения,
потому что записи в (2.1.39) и (2.1.40) не одина- 3 := 2 + 1, 4 := 3 + 1,
ковы (с точки зрения языка, последовательность 5 := 4 + 1, 6 := 5 + 1,
символов 1 + (1 + 1) — совсем не то же самое, что
7 := 6 + 1, 8 := 7 + 1,
последовательность символов (1 + 1) + 1).
Тем не менее, определения (2.1.39) и (2.1.40) 9 := 8 + 1, 10 := 9 + 1
эквивалентны, потому что из аксиом A1 – A16
можно логическими средствами вывести, что Числа вида −a. Когда определены числа
числа, определяемые формулами (2.1.39) — те 1,...,10, их противоположные числа −1,...,−10
же самые, что числа, определяемые формулами определять уже не нужно, поскольку они авто-
(2.1.40). Действительно, эквивалентность опре- матически определяются аксиомой A7 о суще-
делений для числа 3 получается подстановкой в ствовании противоположного числа (дело в том,
тождество из аксиомы A2 вместо a, b, c, символа что, как мы отмечали в упражнении 2.1.3, из ак-
1: сиомы A7 и других аксиом следует, что противо-
положное число определяется единственным об-
разом).
(1 + 1) + 1 = (a + b) + c a = 1 = (A2) =
Вообще, всякий раз, когда мы дали собствен-
b=1
c=1
ное обозначение a какому-нибудь числу, аксиома
A7 определяет его противоположное число и да-
= a + (b + c) = 1 + (1 + 1) ет ему собственное обозначение −a.
a=1
b=1
c=1 Числа вида a−1 . Точно также, всякий раз, ко-
гда мы даем собственное обозначение a какому-
(символ | означает подстановку, а фрагмент =
нибудь числу (a 6= 0), аксиома A9 дает собствен-
(A2) = есть ссылка на аксиому A2, применяемую
ное обозначение обратному числу a−1 . В частно-
в этот момент). Эту запись можно сократить так:
сти, обратные числа к 2, ..., 10 имеют собствен-
(1 + 1) + 1 = (A2) = 1 + (1 + 1) ные обозначения 2−1 ,...,10−1 .

— здесь читателю предлагается самому дога- Дроби определяются равенством


даться, какой должна быть подстановка, чтобы
можно было применить аксиому A2. Читатель a
= a · b−1 = b−1 · a, (b 6= 0)
теперь может самостоятельно расшифровать со- b
кращенную запись доказательства эквивалент- Например,
ности определений числа 4:
1 2 3
((1 + 1) + 1) + 1 = (A2) = (1 + 1) + (1 + 1) = := 2−1 , := 2 · 3−1 , := 3 · 5−1
2 3 5
= (A2) = 1 + (1 + (1 + 1))
⊲ 2.1.13. Докажите тождества:
Что же касается числа 5, то нам теперь доста- a c a·d+b·c
точно сказать, что эквивалентность определений + = (2.1.41)
b d b·d
для него доказывается по аналогии.
a c a·d−b·c
Итак, одни и те же собственные обозначения − = (2.1.42)
b d b·d
можно задавать формально по-разному, нуж- a c a·c
но только следить, чтобы выписываемые тобой · = (2.1.43)
b d b·d

(b) Числа как явная конструкция в теории множеств


На с.122 мы описали вещественные числа как семантическую теорию, то есть как абстрактную
конструкцию внутри теории множеств. Однако пока непонятно, из чего следует, что такой объект
§ 1. Вещественные числа и числовые множества 127

действительно существует. Здесь мы опишем явную конструкцию в теории множеств, обладающую


свойствами модели вещественных чисел, описанными на с.122. Описываемые здесь модели числовых
множеств Z+ , Z, Q, R мы будем снабжать верхним индексом * — Z∗+ , Z∗ , Q∗ , R∗ — чтобы читатель
понимал, что это конкретные модели, а не абстрактные конструкции, которые у нас появятся ниже
в § 2 (а R уже появилась выше на с.122).

Множество неотрицательных целых чисел Z∗+ . Напомним, что множество FinOrd конеч-
ных ординалов было определено на с.61. С этого момента удобно присвоить ему новое название,
множество неотрицательных целых чисел, и новое обозначение,

Z∗+ := FinOrd . (2.1.44)

Его элементы (конечные ординалы) мы далее будем называть неотрицательными целыми числами.
Теорема 2.1.1. Существует единственное отображение (m, n) ∈ Z∗+ × Z∗+ 7→ m + n ∈ Z∗+ со
следующими свойствами:

m+0=m m ∈ Z∗+ (2.1.45)


m + S(n) = S(m + n) m, n ∈ Z∗+ (2.1.46)

• Отображение (m, n) ∈ Z∗+ × Z∗+ 7→ m + n ∈ Z∗+ называется операцией сложения на Z∗+ .


∗ ∗
Доказательство. Здесь используется теорема 0.3.46. Рассмотрим отображение H : Z∗+ Z+ → Z∗+ Z+ ,
действующее по формуле

H(f )(m) = S(f (m)), f ∈ Z∗+ Z+ , m ∈ Z∗+ . (2.1.47)
Z∗
По теореме 0.3.46 оно однозначно определяет некое отображение K : Z∗+ → Z∗+ + со свойствами

K(0) = idZ∗+ , K(S(n)) = H(K(n)). (2.1.48)



Теперь надо воспользоваться теоремой 0.3.21: отображение K : Z∗+ → Z∗+ Z+ является элементом
∗ ∗ ∗ ∗ ∗ ∗
множества (Z∗+ Z+ )Z+ , и поэтому при биекции (Z∗+ Z+ )Z+ → Z∗+ Z+ ×Z+ (заданной формулой (0.3.241))
∗ ∗
ему соответствует некий элемент L ∈ Z∗+ Z+ ×Z+ , то есть отображение L : Z∗+ × Z∗+ → Z∗+ :

L(m, n) = K(n)(m). (2.1.49)

Если значение L(m, n) обозначить m + n, то мы, во-первых, получим (2.1.45):

m + 0 = L(m, 0) = (2.1.49) = K(0)(m) = (2.1.48) = idZ∗+ (m) = (0.3.235) = m.

И, во-вторых, (2.1.46):

m + S(n) = L(m, S(n)) = (2.1.49) = K(S(n))(m) = (2.1.48) =


= H(K(n))(m) = (2.1.47) = S(K(n)(m)) = S(L(m, n)) = S(m + n).

Осталось проверить единственность отображения +. Предположим, что ⊕ – другое отображение


с теми же свойствами:

m⊕0=m m ∈ Z∗+ (2.1.50)


m ⊕ S(n) = S(m ⊕ n) m, n ∈ Z∗+ (2.1.51)

Покажем, что
m + n = m ⊕ n. (2.1.52)
Зафиксируем m ∈ Z∗+ и проведем индукциею по n ∈ Z∗+ . При n = 0 мы получим

m + 0 = (2.1.45) = m = (2.1.50) = m ⊕ 0.

Предположим, что (2.1.52) верно при каком-то n ∈ Z∗+ . Тогда для S(n) мы получим:

m + S(n) = (2.1.46) = S(m + n) = (2.1.52) = S(m ⊕ n) = (2.1.51) = m ⊕ S(n).


128 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Свойства операции сложения на Z∗+ :


S(n) = n + 1, n ∈ Z∗+ (2.1.53)
0 + n = n = n + 0, n ∈ Z∗+ (2.1.54)
m + n = n + m, m, n ∈ Z∗+ (2.1.55)
l + (m + n) = (l + m) + n, l, m, n ∈ Z∗+ (2.1.56)
l + m = l + n ⇒ m = n, l, m, n ∈ Z∗+ (2.1.57)

Доказательство. 1. Свойство (2.1.53):

n + 1 = n + S(0) = (2.1.46) = S(n + 0) = (2.1.45) = S(n).

2. В (2.1.54) правая часть есть тождество (2.1.45), поэтому нужно доказать только левую. Это
делается индукцией по n. Для n = 0 мы получаем

0 + 0 = (2.1.45) = 0.

Если же (2.1.54) верно для какого-то n ∈ Z∗+ ,

0+n=n (2.1.58)

то для S(n) мы получаем:

0 + S(n) = (2.1.46) = S(0 + n) = (2.1.58) = S(n).

3. Свойство (2.1.55) доказывается двойной индукцией, внешей по m, и внутренней по n. При


m = 0 утверждение вытекает для всех n из (2.1.54) и (2.1.45):

∀n ∈ Z∗+ 0 + n = (2.1.54) = n = (2.1.45) = n + 0.

Предположим, что (2.1.55) верно для некоторого m при всех n:

∀n ∈ Z∗+ m+n=n+m (2.1.59)

Тогда для S(m) оно доказывается индукцией по n. При n = 0 мы получаем

S(m) + 0 = (2.1.45) = S(m) = (2.1.54) = 0 + S(m).

Если же это верно для какого-то n,

S(m) + n = n + S(m) (2.1.60)

то для S(n) мы получаем:


  
S(m) + S(n) = (2.1.46) = S S(m) + n = (2.1.60) = S n + S(m) = (2.1.46) = S S(n + m) =
  
= (2.1.59) = S S(m + n) = (2.1.46) = S m + S(n) = (2.1.59) = S S(n) + m = (2.1.46) =
= S(n) + S(m).

4. Свойство (2.1.56) доказывается индукцией по n. При n = 0 мы получаем

l + (m + 0) = (2.1.45) = l + m = (2.1.45) = (l + m) + 0.

Если (2.1.56) верно для какого-то n ∈ Z∗+ ,

l + (m + n) = (l + m) + n, (2.1.61)

то для S(n) мы получим:



l + (m + S(n)) = (2.1.46) = l + S(m + n) = (2.1.46) = S l + (m + n) = (2.1.61) =

= S (l + m) + n = (2.1.61) = (l + m) + S(n).

5. Свойство (2.1.57) доказывается инукцией по l. При l = 0 получаем

0+m=0+n ⇒ m = n.
§ 1. Вещественные числа и числовые множества 129

Если (2.1.57) верно для какого-то l,

l+m=l+n ⇒ m = n, (2.1.62)

то для S(l) мы получим:

(2.1.53) (2.1.56) (2.1.62)


S(l) + m = S(l) + n ⇒ (l + 1) + m = (l + 1) + n ⇒ l + (1 + m) = l + (1 + n) ⇒
(2.1.55) (2.1.53) свойство 7◦ на с.56
⇒ 1+m=1+n ⇒ m+1=n+1 ⇒ S(m) = S(n) ⇒ m = n.

⊲⊲ 2.1.14. Докажите следующие свойства опера- m < n ⇒ ∀l ∈ Z∗+ l+m<l+n (2.1.64)


ции сложения в Z∗+ (l, m, n ∈ Z∗+ ): m 6 m + n, (2.1.65)
m < n ⇔ ∃l > 0 l+m=n (2.1.63)

Теорема 2.1.2. Если X и Y – конечные непресекающиеся множества, то

card(X ∪ Y ) = card X + card Y (2.1.66)

Доказательство. Проведем индукцию по card Y .


0. Заметим, что при card Y = 0, то есть Y = ∅, (2.1.66) верно:

card(X ∪ Y ) = card(X ∪ ∅) = card X = (2.1.45) = card X + 0 = card X + card Y.

1. Покажем далее, что (2.1.66) верно при card Y = 1:


 
X ∩ Y = ∅ & card(Y ) = 1 =⇒ card(X ∪ Y ) = card X + card Y. (2.1.67)

Пусть f : X → card X – биекция. Обозначим буквой y единственный элемент Y . Поскольку y ∈


/ X,
отображение (
f (A), A∈X
g(A) =
{card X}, A = y
будет биекцией между X ∪ Y и S(card X) = card X ∪ {card X}. Поэтому

card(X ∪ Y ) = S(card X) = (2.1.53) = card X + 1 = card X + card Y.

2. Теперь предположим, что формула (2.1.66) доказана для всех Y мощности card Y = n:
 
X ∩ Y = ∅ & card(Y ) = n =⇒ card(X ∪ Y ) = card X + card Y. (2.1.68)

Покажем, что тогда она верна и для случая card Y = S(n). Пусть f : Y → S(n) – биекция. Рассмот-
рим элемент4
y = f −1 (n) ∈ Y.
Отображение f |Y \{y} будет биекцией между Y \ {y} и n, поэтому card(Y \ {y}) = n. Отсюда мы
получаем:
 
card(X ∪ Y ) = card (X ∪ {y}) ∪ ( Y \ {y} ) = (2.1.68) = card(X ∪ {y}) + card(Y \ {y}) =
| {z } | {z } | {z }
↑ k (2.1.67) k
card(Y \ {y}) = n card X + card{y} n
k
card X + 1

= (card X + 1) + n) = (2.1.56) = card X + (1 + n) = (2.1.55) = card X + (n + 1) = (2.1.53) =


= card X + S(n) = card X + card Y.

4 Напомним, что S(n) = n ∪ {n}, поэтому n ∈ S(n).


130 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Теорема 2.1.3. Существует единственное отображение (m, n) ∈ Z∗+ × Z∗+ → m · n ∈ Z∗+ со


следующими свойствами:

m·0=0 m ∈ Z∗+ (2.1.69)


m · S(n) = m · n + m m, n ∈ Z∗+ (2.1.70)

• Отображение (m, n) ∈ Z∗+ × Z∗+ 7→ m · n ∈ Z∗+ называется операцией умножения на Z∗+ .

Доказательство. Здесь, как и∗ в доказательстве



теоремы 2.1.1, используется теорема 0.3.46. Рас-
смотрим отображение H : Z∗+ Z+ → Z∗+ Z+ , действующее по формуле

H(f )(m) = f (m) + m, f ∈ Z∗+ Z+ , m ∈ Z∗+ . (2.1.71)

По теореме 0.3.46 оно однозначно определяет некое отображение K : Z∗+ → Z∗+ Z+ со свойствами

K(0)(m) = 0 (m ∈ Z∗+ ), K(S(n)) = H(K(n)). (2.1.72)



Теперь надо воспользоваться теоремой 0.3.21: отображение K : Z∗+ → Z∗+ Z+ является элементом
∗ ∗ ∗ ∗ ∗ ∗
множества (Z∗+ Z+ )Z+ , и поэтому при биекции (Z∗+ Z+ )Z+ → Z∗+ Z+ ×Z+ (заданной формулой (0.3.241))
∗ ∗
ему соответствует некий элемент L ∈ Z∗+ Z+ ×Z+ , то есть отображение L : Z∗+ × Z∗+ → Z∗+ :

L(m, n) = K(n)(m). (2.1.73)

Если значение L(m, n) обозначить m · n, то мы, во-первых, получим (2.1.69):

m · 0 = L(m, 0) = (2.1.73) = K(0)(m) = (2.1.72) = 0.

И, во-вторых, (2.1.70):

m · S(n) = L(m, S(n)) = (2.1.73) = K(S(n))(m) = (2.1.72) =


= H(K(n))(m) = (2.1.71) = K(n)(m) + m = L(m, n) + m = m · n + m.

Осталось проверить единственность отображения ·. Предположим, что ⊙ – другое отображение


с теми же свойствами:

m⊙0=0 m ∈ Z∗+ (2.1.74)


m ⊙ S(n) = m ⊙ n + m m, n ∈ Z∗+ (2.1.75)

Покажем, что
m · n = m ⊙ n. (2.1.76)
Зафиксируем m ∈ Z∗+ и проведем индукциею по n ∈ Z∗+ . При n = 0 мы получим

m · 0 = (2.1.69) = 0 = (2.1.74) = m ⊙ 0.

Предположим, что (2.1.76) верно при каком-то n ∈ Z∗+ . Тогда для S(n) мы получим:

m · S(n) = (2.1.70) = m · n + m = (2.1.76) = m ⊙ n + m = (2.1.75) = m ⊙ S(n).

Свойства операции умножения на Z∗+ :

0 · n = 0 = n · 0, n ∈ Z∗+ (2.1.77)
1 · n = n = n · 1, n ∈ Z∗+ (2.1.78)
m · n = ·m, m, n ∈ Z∗+ (2.1.79)
l · (m · n) = (l · m) · n, l, m, n ∈ Z∗+ (2.1.80)
l · (m + n) = l · m + l · n, l, m, n ∈ Z∗+ (2.1.81)
§ 1. Вещественные числа и числовые множества 131

Доказательство. 1. В (2.1.77) правая часть есть тождество (2.1.69), поэтому нужно доказать только
левую. Это делается индукцией по n. Для n = 0 мы получаем
0 · 0 = (2.1.69) = 0.
Если же левая часть (2.1.77) верна для какого-то n ∈ Z∗+ ,
0·n=n (2.1.82)
то для S(n) мы получаем:
0 · S(n) = (2.1.70) = 0 · n + 0 = (2.1.82) = 0 + 0 = (2.1.45) = 0.
2. В (2.1.78) правая часть выводится из (2.1.70):
n · 1 = n · S(0) = (2.1.70) = n · 0 + n = (2.1.77) = 0 + n = (2.1.54) = n.
А левая часть доказывается индукцией по n. При n = 0 мы получаем
1 · 0 = (2.1.69) = 0.
Если левая часть (2.1.78) верна для какого-то n ∈ Z∗+ ,
1·n=n (2.1.83)
то для S(n) мы получаем:
1 · S(n) = (2.1.70) = 1 · n + 1 = (2.1.83) = n + 1 = (2.1.53) = S(n).
3. Свойство (2.1.79) доказывается двойной индукцией, внешей по m, и внутренней по n. При
m = 0 утверждение вытекает для всех n из (2.1.77):
∀n ∈ Z∗+ 0 · n = (2.1.77) = 0 = (2.1.77) = n · 0.
Предположим, что (2.1.79) верно для некоторого m при всех n:
∀n ∈ Z∗+ m · n = n · m. (2.1.84)
Тогда для S(m) оно доказывается индукцией по n. При n = 0 мы получаем
S(m) · 0 = (2.1.77) = 0 = (2.1.77) = 0 · S(m).
Если же это верно для какого-то n,
S(m) · n = n · S(m) (2.1.85)
то для S(n) мы получаем:

S(m) · S(n) = (2.1.70) = S(m) · n + S(m) = (2.1.85) = n · S(m) + S(m) = (2.1.70) = (n · m + n) + S(m) =
= (2.1.53) = (n · m + n) + (m + 1) = (2.1.56) = ((n · m + n) + m) + 1 = (2.1.56) = ((n · m + (n + m)) + 1 =
= (2.1.55) = ((n · m + (m + n)) + 1 = (2.1.56) = ((n · m + m) + n) + 1 = (2.1.84) = ((m · n + m) + n) + 1 =
= (2.1.70) = (m · S(n) + n) + 1 = (2.1.56) = m · S(n) + (n + 1) = (2.1.53) = m · S(n) + S(n) = (2.1.84) =
= S(n) · m + S(n) = (2.1.70) = S(n) · S(m).
4. После того, как доказано (2.1.79), свойство (2.1.81) можно переписать в виде
(m + n) · l = m · l + n · l, (2.1.86)
и доказать это индукцией по l. При l = 0 мы получим
(m + n) · 0 = (2.1.74) = 0 = (2.1.45) = 0 + 0 = (2.1.74) = m · 0 + n · 0.
Предположим, что (2.1.86) верно для некоторого l. Тогда для S(l) мы получим

(m + n) · S(l) = (2.1.70) = (m + n) · l + (m + n) = (2.1.86) = (m · l + n · l) + (m + n) =


= (2.1.56) = (m · l + m) + (n · l + n) = (2.1.70) = m · S(l) + n · S(l).
132 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

⊲⊲ 2.1.15. Докажите следующие свойства опера- m 6= n ⇒ l · m 6 l · n, (2.1.90)


ции умножения в Z∗+ . 2 · n = n + n, (2.1.91)
06l ⇒ ∀n ∈ Z∗+ n 6 l · n, (2.1.87) 1<m&1<n ⇒ m + n 6 m · n, (2.1.92)
1 < l ⇒ n < l · n, (2.1.88) m 6= 0 & n 6= 0 ⇒ m · n 6= 0, (2.1.93)
l 6= 0 & m < n ⇒ l · m < l · n, (2.1.89)

Теорема 2.1.4. Если X и Y – конечные множества, то

card(X × Y ) = card X · card Y. (2.1.94)

Доказательство. Нужно провести индукцию по мощности Y .


Если card Y = 0, то Y ∅, и поэтому X × Y = ∅, и мы получаем

card(X × Y ) = card ∅ = 0 = (2.1.77) = card X · 0 = card X · card Y.

Предположим, мы доказали (2.1.94) для случая card Y = n:

card Y = n =⇒ ∀X card(X × Y ) = card X · n. (2.1.95)

Рассмотрим случай card Y = S(n). Пусть f : Y → S(n) = n ∪ {n}. Обозначим y = f −1 (n). Тогда
f |Y \{y} : Y → n будет биекция, и поэтому card(Y \ {y}) = n. С другой стороны, отобюражение
A ∈ X 7→ (A, y) ∈ X × {y} также будет биекцией. Поэтому
   
card(X × Y ) = card X × (Y \ {y}) ∪ (X × {y}) = card X × (Y \ {y}) + card(X × {y}) =
| {z } | {z }
k (2.1.95) k
card X · n card X

= (2.1.66) = card X · n + card X = (2.1.70) = card X · S(n) = card X · card Y.

Целые числа Z∗ . На странице 127 мы определили множество Z∗+ целых неотрицательных чисел
(как множество всех конечных ординалов FinOrd, определенное ранее), а в теоремах 2.1.1 и 2.1.3
мы описали операции + и · на нем. Рассмотрим декартово произведение Z∗+ × Z∗+ и введем на нем
следующее отношение:
(n, m) ∼ (n′ , m′ ) ⇔ n + m′ = n′ + m. (2.1.96)

Предложение 2.1.5. Отношение ∼ является отношением эквивалентности на множестве


Z∗+ × Z∗+ .

Доказательство. Свойство рефлексивности очевидно:

(2.1.96)
(n, m) ∼ (n, m) ⇒ n+m=n+m

(последнее верно в силу тождества (0.3.122)). Симметричность:

(2.1.96) (0.3.123) (2.1.96)


(n, m) ∼ (n′ , m′ ) ⇒ n + m′ = n ′ + m ⇔ n ′ + m = n + m′ ⇒ (n′ , m′ ) ∼ (n, m).

Транзитивность:

(n, m) ∼ (n′ , m′ ) & (n′ , m′ ) ∼ (n′′ , m′′ ) ⇒ n + m′ = n′ + m & n′ + m′′ = n′′ + m′ ⇒


(2.1.56),(2.1.55)
⇒ (n + m′ ) + (n′ + m′′ ) = (n′ + m) + (n′′ + m′ ) ⇒
(2.1.57) (2.1.96)
⇒ (n′ +m′ )+(n+m′′ ) = (n′ +m′ )+(n′′ +m) ⇒ n+m′′ = n′′ +m ⇒ (n, m) ∼ (n′′ , m′′ ).
§ 1. Вещественные числа и числовые множества 133

Из предложения 2.1.5 и теоремы 0.3.26 следует, что определено фактор-множество

Z∗ = (Z∗+ × Z∗+ )/ ∼ (2.1.97)

Для всякого элемента (n, m) ∈ Z∗+ × Z∗+ обозначим символом [(n, m)] класс эквивалентности, кото-
рому принадлежит (n, m):
(n, m) ∈ [(n, m)] ∈ (Z∗+ × Z∗+ )/ ∼ .
Тогда на множестве Z∗ можно определить отношение порядка

[(n, m)] 6 [(n′ , m′ )] ⇐⇒ n + m′ 6 n ′ + m (2.1.98)

и операции сложения и умножения

[(n, m)] + [(n′ , m′ )] = [(n + n′ , m + m′ )] (2.1.99)


[(n, m)] · [(n′ , m′ )] = [(n · n′ + m · m′ , n · m′ + m · n′ )] (2.1.100)

Свойства алгебраических операций на Z∗ :

0 + p = p = p + 0, p ∈ Z∗ (2.1.101)

p + q = q + p, p, q ∈ Z (2.1.102)
p + (q + r) = (p + q) + r, p, q, r ∈ Z∗ (2.1.103)
0 · p = 0 = p · 0, p ∈ Z∗ (2.1.104)
1 · p = p = p · 1, p ∈ Z∗ (2.1.105)
p · q = q · p, p, q ∈ Z∗ (2.1.106)
p · (q · r) = (p · q) · r, p, q, r ∈ Z∗ (2.1.107)
p · (q + r) = p · q + p · r, p, q, r ∈ Z∗ (2.1.108)
p · q = 0 ⇒ p = 0 ∨ q = 0, p, q ∈ Z∗ (2.1.109)
(p 6= 0 & p · q = p · r) ⇒ q = r, p, q, r ∈ Z∗ (2.1.110)

Рациональные числа Q∗ . После того, как построено множество Z∗ целых чисел, мы рассмотрим
декартово произведение Z∗ × (Z∗ \ {0}) и определяем на нем отношение

(p, q) ∼ (p′ , q ′ ) ⇔ p · q ′ = p′ · q. (2.1.111)

Предложение 2.1.6. Отношение ∼ является отношением эквивалентности на множестве Z∗ ×


(Z∗ \ {0}).
Доказательство. Здесь (с очевидными поправками) повторяются те же рассуждения, что и в пред-
ложении 2.1.5. Рефлексивность:
(2.1.111)
(p, q) ∼ (p, q) ⇒ p+q =p+q

(последнее верно в силу тождества (0.3.122)). Симметричность:


(2.1.111) (0.3.123) (2.1.111)
(p, q) ∼ (p′ , q ′ ) ⇒ p · q ′ = p′ · q ⇔ p′ · q = p · q ′ ⇒ (p′ , q ′ ) ∼ (p, q).

Для доказательсва транзитивности нужно рассмотреть два случая. Пусть

(p, q) ∼ (p′ , q ′ ) & (p′ , q ′ ) ∼ (p′′ , q ′′ )

Сначала предположим, что p′ = 0. Тогда получается цепочка

(2.1.111)
(p, q) ∼ (0, q ′ ) & (0, q ′ ) ∼ (p′′ , q ′′ ) ⇒ p · q ′ = 0 · q & 0 · q ′′ = p′′ · q ′ ⇒
|{z} | {z }
k k
0 0
(2.1.109) (2.1.111)
⇒ p = 0 & p′′ = 0 ⇒ p · q ′′ = 0 · q ′′ = 0 = 0 · q = p′′ · q ⇒ (p, q) ∼ (p′′ , q ′′ )
134 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

После этого предположим, что p′ 6= 0. Тогда

(p, q) ∼ (p′ , q ′ ) & (p′ , q ′ ) ∼ (p′′ , q ′′ ) ⇒ p · q ′ = p′ · q & p′ · q ′′ = p′′ · q ′ ⇒


(2.1.107),(2.1.106)
⇒ (p · q ′ ) · (p′ · q ′′ ) = (p′ · q) · (p′′ · q ′ ) ⇒
′ ′ ′′ ′ ′ ′′ (2.1.110) ′′ ′′ (2.1.111)
⇒ (p · q ) ·(p · q ) = (p · q ) ·(p · q) ⇒ p·q = p ·q ⇒ (p, q) ∼ (p′′ , q ′′ )
| {z } | {z }

6=

6=
0 0

Из предложения 2.1.6 и теоремы 0.3.26 следует, что определено фактор-множество


 
Q∗ = Z∗ × (Z∗ \ {0}) / ∼ (2.1.112)

Для всякого элемента (p, q) ∈ Z∗ × (Z∗ \ {0}) обозначим символом [(p, q)] класс эквивалентности,
которому принадлежит (p, q):
 
(p, q) ∈ [(p, q)] ∈ Z∗ × (Z∗ \ {0}) / ∼ .

Тогда на множестве Q∗ можно определить отношение порядка,


[(p, q)] 6 [(p′ , q ′ )] ⇐⇒ 0 6 q & 0 6 q ′ & p · q ′ 6 p′ · q (2.1.113)
и операции сложения и умножения:
[(p, q)] + [(p′ , q ′ )] = [(p · q ′ + p′ · q, q · q ′ )] (2.1.114)
′ ′ ′ ′
[(p, q)] · [(p , q )] = [(p · p , q · q )] (2.1.115)

Свойства отношения порядка и алгебраических операций на Q∗ :

0 + a = a = a + 0, a ∈ Q∗ (2.1.116)

a + b = b + a, a, b ∈ Q (2.1.117)
a + (b + c) = (a + b) + c, a, b, c ∈ Q∗ (2.1.118)
0 · a = 0 = a · 0, a ∈ Q∗ (2.1.119)
1 · a = a = a · 1, a ∈ Q∗ (2.1.120)
a · b = b · a, a, b ∈ Q∗ (2.1.121)

a · (b · c) = (a · b) · c, a, b, c ∈ Q (2.1.122)
a · (b + c) = a · b + a · c, a, b, c ∈ Q∗ (2.1.123)
a · b = 0 ⇒ a = 0 ∨ b = 0, a, b ∈ Q∗ (2.1.124)
(a 6= 0 & a · b = a · c) ⇒ b = c, a, b, c ∈ Q∗ (2.1.125)
a 6 a, a ∈ Q∗ (2.1.126)
(a 6 b & b 6 a) ⇒ a = b, a, b ∈ Q∗ (2.1.127)
(a 6 b & b 6 c) ⇒ a 6 c, a, b, c ∈ Q∗ (2.1.128)
∀a ∀b (a 6 b ∨ b 6 a), a, b ∈ Q∗ (2.1.129)
(a < x & b < y) ⇒ a + x < b + y, a, b, x, y ∈ Q∗ (2.1.130)
(0 6 a & 0 6 b) ⇒ 0 6 a · b, a, b ∈ Q∗ (2.1.131)
(0 < a & 0 < b) ⇒ 0 < a · b, a, b ∈ Q∗ (2.1.132)
(0 < a < x & 0 < b < y) ⇒ 0 < a · b < x · y, a, b, x, y ∈ Q∗ (2.1.133)
(0 < a & x < y) ⇒ a · x < a · y, a, x, y ∈ Q∗ (2.1.134)
−1 ∗
0 < a < 1 ⇒ a > 1, a∈Q (2.1.135)
a < b ⇒ ∃x a < x < b, a, b, x ∈ Q∗ (2.1.136)
• Элементы n ∈ Z∗ принято отождествлять с элементами [(n, 1)] ∈ Q∗ :
n = [(n, 1)], n ∈ Z∗ . (2.1.137)
Теорема 2.1.7. Для любого x ∈ Q∗ найдется число n ∈ Z∗ такое что 0 < n и x < n.
§ 1. Вещественные числа и числовые множества 135

Вещественные числа R∗ . Дедекиндовым сечением множества Q∗ рациональных чисел называ-


ется пара (A, A′ ) подмножеств Q∗ со следующими свойствами:
(i) A и A′ непусты:
A 6= ∅ 6= A′ . (2.1.138)
(ii) A и A′ образуют разбиение множества Q∗ :

A ∩ A′ = ∅, A ∪ A′ = Q∗ (2.1.139)

(iii) A лежит левее A′ :


∀a ∈ A ∀x ∈ A′ a6x (2.1.140)
(iv) A не содержит максимального элемента:
  
∀x ∈ Q∗ ∀a ∈ A a 6 x =⇒ x∈
/A (2.1.141)

⋄ 2.1.16. Для всякого элемента a ∈ Q∗ рассмот- ⋄ 2.1.17. Помимо сечений из примера 2.1.16 бы-
рим множества вают и другие. Например, можно рассмотреть
пару (A, A′ ), в которой

(a) = {x ∈ Q : x < a} (2.1.142)
A = {x ∈ Q∗ : x < 0 ∨ x · x < 2}
и
(a)′ = {x ∈ Q∗ : a 6 x} (2.1.143)
и
Тогда пара (A, A ), в которой A = (a), A′ = (a)′ ,

A′ = {x ∈ Q∗ : 0 6 x & 2 6 x · x}
является является дедекиндовым сечением в Q∗ .
Такое сечение назвывается сечением, порожден- и это будет дедекиндово сечение, не порожденное
ным элементом a ∈ Q∗ . никаким элементом Q∗ .

Из (2.1.139) следует, что в дедекиндовом сечении (A, A′ ) левый элемент, A полностью определяет
правый, A′ :
A′ = Q∗ \ A.
Поэтому можно описывать дедекиндовы сечения свойствами левой компоненты:

Теорема 2.1.8. Множество A ⊆ Q∗ тогда и только тогда является первой компонентой неко-
торого дедекиндова сечения, когда оно удовлетворяет следующим свойствам:
(i) A непусто и не совпадает с Q∗ :
∅ 6= A 6= Q∗ , (2.1.144)
(ii) A замкнуто относительно переходов влево:

∀x ∀a x6a∈A =⇒ x ∈ A, (2.1.145)

(iii) A не содержит максимального элемента:

∀x ∈ A ∃a ∈ A x<a (2.1.146)

С этого момента условимся под дедекиндовым сечением понимать его левую компоненту, то есть
произвольное множество A ⊆ Q∗ , удовлетворяющее условиям (i)—(iii) теоремы 2.1.8.

Теорема 2.1.9. Если A – дедекиндово сечение, то справедливо утверждение, двойственное (2.1.145):

∀z ∀y z>y∈
/A =⇒ z∈
/ A, (2.1.147)

Доказательство. Предположим, что z > y ∈ / A, но z ∈ A. Тогда мы получим y < z ∈ A, и


по условию (2.1.145) это означает, что y ∈ A. Это противоречит исходному предположению, что
y∈/ A.
136 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Пусть символ R∗ обозначает множество всех дедекиндовых сечений множества Q∗ (то есть,
в соответствии с нашим соглашением, множество всех подмножеств A ⊆ Q∗ , удовлетворяющих
условиям теоремы 2.1.8). Определим на R∗ отношение порядка

A6B ⇐⇒ A⊆B (2.1.148)

и отношение строгого порядка


A<B ⇐⇒ A⊂B (2.1.149)
(отношения ⊆ и ⊂ были определены на с.31).
Теорема 2.1.10. Отношение < на множестве R∗ дедекиндовых сечений множества Q обладает
следующими свойствами:
(i) линейность: для любых сечений A и B либо A = B, либо A < B, либо B < A.
(ii) транзитивность: для любых сечений A, B, C

A<B<C =⇒ A < C. (2.1.150)

Доказательство. 1. Свойство (i) можно проще записать формулой

A 6= B & A <
6 B =⇒ B < A,

которая доказывается цепочкой

A 6= B & A <
6 B =⇒ A 6= B & ¬(A 6= B & A ⊆ B) =⇒ A 6= B & (A = B ∨ A ⊆
6 B) =⇒
=⇒ A ⊆ 6 B =⇒ A \ B 6= ∅ =⇒ ∃a ∈ A a |∈
/ B}
{z
⇓ (2.1.140)
∀b ∈ B b < a
| {z }
⇓ (2.1.145)
∀b ∈ B b ∈ A

B⊆A
| {z }

B⊂A

2. Свойство (ii) вытекает сразу из определения отношения <.


Лемма 2.1.11. Если A > (0), то найдется a ∈ A такой что a > 0.
Доказательство. Если A > (0), то (0) ⊆ A и (0) 6= A. Значит, найдется число x ∈ A \ (0). Условие
x∈/ (0) означает, что x > 0. Воспользуемся теперь условием (2.1.146) и подберем a ∈ A так, чтобы
x < a. Тогда мы получим 0 6 x < a ∈ A, и отсюда 0 < a ∈ A.
Лемма 2.1.12. Для всякого сечения A и любого числа q ∈ Q∗ , q > 0, найдется такое число a ∈ A
и такое число r ∈ Q∗ , r > 0, что
a∈ A & a+q−r ∈ /A (2.1.151)
Доказательство. Зафиксируем b ∈ A и рассмотрим последовательность

xn = b + q · n.

Предположим, что все элементы этой последовательности лежат в A:

∀n ∈ N∗ xn = b + q · n ∈ A. (2.1.152)

Тогда если взять какой-нибудь элемент y ∈


/ A, то мы получим

∀n ∈ N∗ xn = b + q · n 6 y.

То есть
y−b
∀n ∈ N∗ n6 .
q
Это противоречит теореме 2.1.7. Значит, наше предположение (2.1.152) неверно, и выполняется
обратное:
∃n ∈ N∗ xn = b + q · n ∈
/ A. (2.1.153)
§ 1. Вещественные числа и числовые множества 137

Рассмотрим множество M = {n ∈ N∗ : b + q · n ∈
/ A} и пусть m – его минимальный элемент5 , то
есть
b+q·m−q ∈A & b+q·m∈ / A. (2.1.154)
Рассмотрим два случая.
1. Если b + q · m — не минимальный элемент множества Q∗ \ A, то есть существует x ∈ / A такой
что x < b + q · m, то мы полагаем a = b + q · m − q, r = b + q · m − x и тогда у нас получается:

a= b+q·m−q ∈ A & a + q − r = b + q · m − (b + q · m − x) = x ∈
/ A.

2. Если же b + q · m — минимальный элемент множества Q∗ \ A, то есть для любого x ∈ / A


выполняется b + q · m 6 x, то мы полагаем a = b + q · m − 2q , r = q2 и тогда у нас получается:
q q q
a=b+q·m− ∈A & a+q−r = b+q·m+ − =b+q·m∈
/ A.
2 2 2

• Сумма сечений определяется равенством

A + B = {a + b; a ∈ A, b ∈ B} (2.1.155)

Теорема 2.1.13. Если A и B – сечения, то A + B – тоже сечение.


Доказательство. Надо проверить условия (i)-(iii) теоремы 2.1.8.
1. Прежде всего, A + B 6= ∅, потому что

A 6= ∅ & B 6= ∅ =⇒ ∃a ∈ A & ∃b ∈ B =⇒ ∃a + b ∈ A + B.

С другой стороны, A + B 6= Q∗ , потому что

A 6= Q∗ & B 6= Q∗ =⇒ ∃x ∈ / A & ∃y ∈
/ B =⇒
=⇒ ∃x ∈ Q∗ (∀a ∈ A a < x) & ∃y ∈ Q∗ (∀b ∈ B b < y) =⇒

=⇒ ∃x, y ∈ Q ∀a ∈ A ∀b ∈ B a+b<x+y =⇒ A + B 6= Q∗ .

2. Пусть z < c ∈ A + B, то есть z < a + b, где a ∈ A и b ∈ B. Положим t = z − b. Тогда

t<a∈A =⇒ t∈A =⇒ z = t + b ∈A+B


A B

3. Если z ∈ A+B, то z = x+y для некоторых x ∈ A и y ∈ B. Для них, воспользовавшись (2.1.146),


можно подобрать a и b такие что x < a ∈ A и y < b ∈ B, и мы получим z = x + y < a + b ∈ A + B.
• Противоположное сечение к сечению A определяется равенством:

−A = {x ∈ Q∗ : ∃y ∈ Q∗ y >0 & −x−y ∈


/ A} (2.1.156)

Теорема 2.1.14. Если A – сечение, то −A – тоже сечение.


Доказательство. Надо проверить условия (i)-(iii) теоремы 2.1.8.
1. Прежде всего, из A 6= Q∗ следует, что существует z ∈
/ A. Положим x = −z −1, тогда −x−1 ∈
/ A.
Поскольку 0 < 1 ∈ Q∗ , это означает, что x ∈ −A. Поэтому мы можем сделать вывод, что −A 6= ∅.
С другой стороны, A 6= ∅, потому существует a ∈ A. Положим x = −a, тогда −x = a ∈ A, и
поэтому для всякого y > 0 мы получим
(2.1.145)
−x − y = a − y < a ∈ A =⇒ −x − y ∈ A

/ −A. Мы можем таким образом заключить, что −A 6= Q∗ .


Это верно для любого y > 0, поэтому x ∈
2. Пусть x < b ∈ −A. Условие b ∈ −A означает, что −b − y ∈
/ A для некоторого y > 0. Теперь мы
получаем:
(2.1.147)
−x > −b =⇒ −x − y > −b − y ∈
/A =⇒ −x − y ∈
/A =⇒ x ∈ −A.
5 Напомним, что минимальный элемент ординала был определен на с.51.
138 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

/ A для некоторого y > 0. Тогда, положив b = x + y2 = x + y · 2−1 ,


3. Пусть x ∈ −A, то есть −x − y ∈
мы получим, с одной стороны,
y
x < x + = b,
2
а, с другой,
y
−b − = −x − y ∈ / A =⇒ b ∈ −A.
2

• Произведение сечений определяется сначала для неотрицательных сечений

(0) < A & (0) < B =⇒ A · B = {x ∈ Q∗ : ∃a ∈ A ∃b ∈ B a > & b > 0 & x 6 a · b},
(2.1.157)
а после этого для остальных сечений:


 (−A) · (−B), A < (0) & B < (0)

−((−A) · B), A < (0) < B
A·B = (2.1.158)

 −(A · (−B)), B < (0) < A


(0), A = (0) ∨ B = (0)

Теорема 2.1.15. Если A и B – сечения, то A · B – тоже сечение.


Доказательство. Здесь, как и раньше проверяются условия (i)-(iii) теоремы 2.1.8. В силу (2.1.158),
нам достаточно рассмотреть случай A > (0) и B > (0).
1. Из A > (0) по лемме 2.1.11 следует, что существует a ∈ A такой что a > 0. По той же причине
из B > (0) следует, что существует b ∈ B такой что b > 0. В силу (2.1.132), 0 < a · b. Значит, в силу
(2.1.157), 0 ∈ A · B. Из этого мы делаем вывод, что A · B 6= ∅.
Далее, из A 6= Q∗ следует, что существует x ∈
/ A. По той же причине, существует y ∈ / B. Покажем,
что
x·y ∈/ A · B. (2.1.159)
Предположим, что это не так:
x · y ∈ A · B. (2.1.160)
Тогда существуют a ∈ A и b ∈ B такие, что a > 0, b > 0 и

x·y 6a·b (2.1.161)

Но из a ∈ A и x ∈
/ A следует
a < x.
А из b ∈ B и y ∈
/ B следует
b < y.
Добавив условия a > 0, b > 0, мы получим

0 < a < x & 0 < b < y.

откуда, в силу (2.1.133),


0 < a · b < x · y.
Это противоречит условию (2.1.161), и значит, наше предположение (2.1.160) также неверно. То
есть верно (2.1.159), и поэтому A · B 6= Q∗ .
2. Пусть z 6 c ∈ A · B. Из c ∈ A · B следует, что существуют a ∈ A и b ∈ B такие, что a > 0, b > 0
и c 6 a · b. Применяя (2.1.128), получаем z 6 a · b, что в силу (2.1.157) дает z ∈ A · B.
3. Пусть z ∈ A · B. В силу (2.1.157) это означает, что существуют x ∈ A и y ∈ B такие, что x > 0,
y > 0 и z 6 x · y. Воспользуемся (2.1.146) и подберем a и b так, чтобы x < a ∈ A и y < b ∈ B. Тогда

0<x<a&0<y<b =⇒ 0<x·y <a·b =⇒ z 6 x · y < a · b.

Положив c = a · b, мы в силу (2.1.157), получим z < c ∈ A · B.


• Обратное сечение A−1 определяется правилом
(
−1 {x ∈ Q∗ : x 6 0 ∨ ∃y ∈ Q∗ y > 0 & x−1 − y ∈
/ A}, A > (0)
A = (2.1.162)
−((−A)−1 ), A < (0)
§ 1. Вещественные числа и числовые множества 139

Лемма 2.1.16. Если A > (0), то A−1 > (0).

Доказательство. По лемме 2.1.11 найдется a ∈ A такой, что a > 0. Выберем какой-ниюудь z ∈


/ A.
Поскольку 0 < a < z, мы получаем, что 0 < z. Положим c = (z + 1)−1 . Тогда

c−1 − 1 = (z + 1) − 1 = z ∈
/A =⇒ c ∈ A−1 .

При этом,
z>0 =⇒ c = (z + 1)−1 > 0.

Теорема 2.1.17. Если A – сечение, то A−1 – тоже сечение.


Доказательство. Здесь, как и раньше проверяются условия (i)-(iii) теоремы 2.1.8. При этом доста-
точно рассмотреть случай A > (0).
1. Из A 6= Q∗ следует, что ∃p ∈
/ A. Выберем произволный x ∈ Q∗ так чтобы x−1 > p. Тогда мы
получим, что
(2.1.147) (2.1.162)
∃y > 0 x−1 − y > p ∈
/A =⇒ x−1 − y ∈
/A =⇒ x ∈ A−1 =⇒ A−1 6= ∅.

С другой стороны, из леммы 2.1.11 следует, что существует a ∈ A такой что a > 0. Воспользуемся
(2.1.136) м выберем x так, чтобы 0 < x1 < a. Тогда для всякого y > 0 мы получим

1 1
−y <a∈A =⇒ −y ∈A =⇒ / A−1
x∈ =⇒ A−1 6= ∅.
x x
2. Пусть x < b ∈ A−1 . Если x 6 0, то по формуле (2.1.162) мы сразу получаем, что x ∈ A−1 .
Поэтому для нас важен случай x > 0. Тогда возникает система импликаций

0 < x < b ∈ A−1 =⇒ 0 < b ∈ A−1 =⇒ ∃y > 0 b−1 − y ∈ /A


⇓ ⇓
0<x<b =⇒ x−1 > b−1 =⇒ ∃y > 0 x−1 − y > b−1 − y ∈/A
⇓ (2.1.147)
∃y > 0 x−1 − y ∈ /A
⇓ (2.1.162)
x ∈ A−1 .

3. Пусть x ∈ A−1 . Снова рассмотрим два случая. Если x 6 0, то, по лемме 2.1.16, A−1 > 0,
поэтому по лемме 2.1.11 существует c ∈ A−1 такой что c > 0, и мы получаем x 6 0 < c ∈ A−1 . Если
же x > 0, то условие x ∈ A−1 означает, что существует y > 0 такой что x−1 − y ∈/ A. Это число y
можно при необходимости уменьшить, чтобы 0 < y < x−1 . Зафиксируем такой y и выберем a так,
чтобы
y
a−1 = x−1 − .
2
Тогда
y (2.1.147)
a−1 − = x−1 − y ∈ /A =⇒ a ∈ A−1 .
2
С другой стороны,
y
a−1 = x−1 − =⇒ a−1 < x−1
2
и
y y
0 < y < x−1 =⇒ a−1 = x−1 − > > 0 =⇒ a−1 > 0
2 2
и поэтому
0 < a−1 < x−1 =⇒ 0 < x < a.

Теорема 2.1.18. Отношение 6 и операции + и · на множестве R∗ дедекиндовых сечений мно-


жества Q∗ обладают свойствами

A+B =B+A (2.1.163)


(A + B) + C = A + (B + C) (2.1.164)
140 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

A + (0) = A (2.1.165)
A + (−A) = (0) (2.1.166)
− (−A) = A (2.1.167)
− (A + B) = (−A) + (−B) (2.1.168)
A > (0) ⇐⇒ −A < (0) (2.1.169)
A < (0) ⇐⇒ −A > (0) (2.1.170)
A > (0) & B > (0) =⇒ A · B > (0) (2.1.171)
A < (0) < B =⇒ A · B < (0) (2.1.172)
A < (0) & B < (0) =⇒ A · B > (0) (2.1.173)
A 6 B =⇒ ∀C A+C 6B +C (2.1.174)
(−A) · B = −(A · B) (2.1.175)
A·B = B·A (2.1.176)
(A · B) · C = A · (B · C) (2.1.177)
A · (1) = A (2.1.178)
A · A−1 = (1), A 6= (0) (2.1.179)
(A + B) · C = A · C + B · C (2.1.180)

Доказательство. 1. Тождество (2.1.163):

A + B = (2.1.155) = {a + b; a ∈ A, b ∈ B} = {b + a; a ∈ A, b ∈ B} = (2.1.155) = B + A.

2. Тождество (2.1.164):

(A + B) + C = {a + b; a ∈ A, b ∈ B} + C = {(a + b) + c; a ∈ A, b ∈ B, c ∈ C} =
= {a + (b + c); a ∈ A, b ∈ B, c ∈ C} = A + {b + c; b ∈ B, c ∈ C} = A + (B + C).

3. Тождество (2.1.165):

A + (0) = {a + b; a ∈ A, b ∈ (0)} = {a + b; a ∈ A, b < 0} = A

4. Тождество (2.1.166) доказывается так. Пусть сначала z ∈ A + (−A). Это значит, что z = a + x
для некоторых a ∈ A и x ∈ −A. Второе означает, что −x − y ∈ / A для некоторого y > 0. Поскольку
a ∈ A и −x − y ∈
/ A, мы получаем цепочку

a < −x − y =⇒ a + x < −y < 0 =⇒ z = a + x ∈ (0).

Это доказывает включение A + (−A) ⊆ (0). Наоборот, пусть z ∈ (0), то есть z < 0. Воспользуемся
леммой 2.1.12 и выберем a ∈ A так, чтобы для некоторого r > 0 выполнялось

a−z−r ∈
/ A.

Тогда если взять x = z − a, то мы получим, во-первых,

−x − r = a − z − r ∈
/A =⇒ x ∈ −A,
и, во-вторых,
z = a + x ∈ A + (−A).
Это доказывает включение (0) ⊆ A + (−A).
5. Тождество (2.1.168). Сначала система импликаций

z ∈ (−A) + (−B) =⇒ ∃x ∈ −A ∃y ∈ −B z = x + y =⇒
=⇒ ∃x ∃y ∃p > 0 ∃q > 0 −x − p ∈/A & −y − q ∈
/B & z =x+y
| {z } | {z }
⇓ ⇓
∀a ∈ A − x − p > a ∀b ∈ B − y − q > b
| {z }

∀a ∈ A ∀b ∈ B − z − p − q = −x − p − y − q > a + b

−z − p − q ∈/ A+B

z ∈ −(A + B)
§ 1. Вещественные числа и числовые множества 141

– доказывает включение
(−A) + (−B) ⊆ −(A + B).
А затем обратное включение
−(A + B) ⊆ (−A) + (−B) (2.1.181)
– доказывается следующими рассуждениями. Пусть z ∈ −(A + B), то есть

−z − r ∈
/ A+B (2.1.182)

для некоторого r > 0. Воспользуемся леммой 2.1.12 и подберем a′ ∈ A так, чтобы


r
a′ + −s∈
/ A, (2.1.183)
2
для некоторого s > 0. Положим
r
x = −a′ −
2
Тогда условие (2.1.183) будет означать, что

x ∈ −A.

Обозначим
y = −z − x.
Условие (2.1.182) можно переписать так:

∀a ∈ A ∀b ∈ B a + b < −z − r.

Если вместо a подставить a′ , то мы получим цепочку:

r r r
∀b ∈ B a′ + b < −z − r =⇒ ∀b ∈ B b < −z − a′ − r = −z −a′ − − = y − =⇒
2
| {z } 2 2
k
−x
r
=⇒ y− ∈
/B =⇒ y ∈ −B.
2
Это доказывает (2.1.181).
6. Тождество (2.1.167) доказывается цепочкой

x ∈ −(−A) ⇐⇒ ∃y > 0 −x−y ∈


/ −A ⇐⇒
(2.1.145),(2.1.146)
⇐⇒ ∃y > 0 ∀z > 0 x + y − z ∈ A ⇐⇒ x∈A

7. Свойство (2.1.169) доказывается цепочкой

− A < (0) ⇐⇒ ∃z < 0 z∈


/ −A ⇐⇒ ∃z < 0 ∀y > 0 −z−y ∈A ⇐⇒
⇐⇒ ∃x > 0 ∀y > 0 x−y ∈A ⇐⇒ ∃x > 0 x ∈ A ⇐⇒ A > (0).

8. Свойство (2.1.170) следует из (2.1.169) и (2.1.167).


9. Свойство (2.1.171):
   
A > (0) & B > (0) =⇒ ∃a ∈ A a > 0 & ∃b ∈ B b>0 ⇐⇒
⇐⇒ ∃a ∈ A ∃b ∈ B 0<a·b =⇒ 0∈A·B =⇒ A · B > (0)

10. Свойство (2.1.172):

(2.1.170) (2.1.171)
A < (0) < B =⇒ −A > (0) & B > (0) =⇒
(2.1.169)
=⇒ (−A) · B > (0) =⇒ A · B = (2.1.158) = −((−A) · B) < (0)

11. Свойство (2.1.173) доказывается по аналогии с (2.1.172).


142 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

12. Свойство (2.1.174):

(2.1.148) (2.1.171)
A6B =⇒ A⊆B =⇒
=⇒ A + C = {a + c; a ∈ A, c ∈ C} ⊆ {b + c; b ∈ B, c ∈ C} = B + C

13. Для доказательства (2.1.175) нужно рассмотреть несколько случаев. Если A > (0) и B > (0),
то
(−A) ·B = (2.1.158) = −((−(−A)) · B) = (2.1.167) = −(A · B).
| {z }
> (2.1.169)
0

Если A < (0) и B < (0), то

(−A) ·B = (2.1.158) = −((−A) · (−B)) = (2.1.158) = −(A · B).


| {z }
>

0
<

(2.1.170)
0

И так же для остальных случаев.


14. Для (2.1.176) нужно рассмотреть несколько случаев. Если A > (0) и B > (0), то

A · B = (2.1.157) = {x ∈ Q∗ : ∃a ∈ A ∃b ∈ B a > 0 & b > 0 & x 6 a · b} =



= {x ∈ Q : ∃a ∈ A ∃b ∈ B a > 0 & b > 0 & x 6 b · a} = (2.1.157) = B · A.

Если (0) > A и (0) > B, то

A · B = (2.1.158) = (−A) · (−B) = (уже доказано) = (−B) · (−A) = (2.1.158) = B · A.

Если A < (0) < B, то

A · B = (2.1.158) = −((−A) · B) = (уже доказано) = −(B · (−A)) = (2.1.158) = B · A.

Если B < (0) < A, то

A · B = (2.1.158) = −(A · (−B)) = (уже доказано) = −((−B) · A) = (2.1.158) = B · A.

Если A = (0) или B = (0), то

A · B = (2.1.158) = (0) = (2.1.158) = B · A.

15. Тем же приемом доказывается тождество (2.1.177). Если A > (0), B > (0) и C > (0), то

(A · B) · C = (2.1.157) = {x ∈ Q∗ : ∃y ∈ A · B ∃c ∈ C y > 0 & c > 0 & x 6 y · c} =


= (2.1.157) = {x ∈ Q∗ : ∃a ∈ A ∃b ∈ B ∃c ∈ C a > 0 & b > 0 & c > 0 & x 6 (a · b) · c} =
= {x ∈ Q∗ : ∃a ∈ A ∃b ∈ B ∃c ∈ C a > 0 & b > 0 & c > 0 & x 6 a · (b · c)} = (2.1.157) =
= {x ∈ Q∗ : ∃a ∈ A ∃z ∈ B · C a > 0 & z > 0 & x 6 a · z} = (2.1.157) = A · (B · C).

Остальные варианты рассматриваются так же как при доказательстве (2.1.176). Например, для
A < (0) < B и C > (0) получаем:

(A · B ) · C = (2.1.158) = (−((−A) · B)) · C = (2.1.175) = −(((−A) · B) · C) =


| {z }
>

<

0 0
>

(2.1.169),(2.1.171)
0

= (уже доказано) = −((−A) · (B · C)) = (2.1.158) = A · (B · C) .


| {z } | {z }
>

0
<

<

(2.1.171)
0 0

16. Тождество (2.1.178). Пусть сначала A > (0). Тогда, прежде всего,

x ∈ A · (1) =⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x < a · b =⇒


=⇒ ∃a ∈ A ∃b a > 0 & 0 < b < 1 & x < a · b < (2.1.133) < a · 1 = (2.1.120) = a =⇒
§ 1. Вещественные числа и числовые множества 143

(2.1.145)
=⇒ ∃a ∈ A x<a =⇒ x ∈ A,

и это доказывает включение


A · (1) ⊆ A
Докажем далее обратное включение. Пусть x ∈ A. Если x 6 0, то выбрав произвольные a ∈ A, a > 0
и b ∈ (1), b > 0, мы получим
x 6 0 < a · b,
и это означает, что x ∈ A · (1). Поэтому важен более сложный случай, когда x > 0. Для него мы
получим:

(2.1.134) (2.1.136)
x∈A =⇒ ∃a ∈ A a > 0 & x < a =⇒ ∃a ∈ A a > 0 & x · a−1 < a · a−1 = 1 =⇒
(2.1.136)
=⇒ ∃a ∈ A ∃b a>0& x a−1} < b < 1
| ·{z =⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x·a−1 < b =⇒
<

=⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x = x · a−1 · a < b · a = a · b =⇒


=⇒ ∃a ∈ A ∃b ∈ (1) a > 0 & b > 0 & x < a · b =⇒ x ∈ A · (1).

Это доказывает включение


A ⊆ A · (1),
и, вместе с ним, равенство (2.1.178) для случая A > (0). Теперь если A < (0), то мы получаем

A · (1) = (2.1.158) = −((−A) · (1)) = (уже доказано) = −(−A) = (2.1.167) = A.

А если A = (0), то
A · (1) = (0) · (1) = (2.1.158) = (0) = A.
17. Тождество (2.1.179). Пусть сначала A > (0). Тогда по лемме 2.1.16, A−1 > (0), и мы, прежде
всего, получаем цепочку

(2.1.162)
x ∈ A · A−1 =⇒ ∃a ∈ A ∃b ∈ A−1 a > 0 & b > 0 & x < a · b =⇒
=⇒ ∃a > 0 ∃b > 0 ∃y > 0 a ∈ A & b−1 − y ∈
/ A & x<a·b =⇒ x<1 =⇒ x ∈ (1),
| {z }

a < b−1 − y

a · b < (b−1 − y) · b = 1 − y · b < 1
| {z }

x<a·b<1

доказывающую включение
A · A−1 ⊆ (1).
Чтобы доказать обратное включение,
(1) ⊆ A · A−1 , (2.1.184)
зафиксируем x ∈ (1), то есть x < 1. Если x 6 0, то мы сразу можем выбрать a ∈ A, a > 0, и b ∈ A−1 ,
b > 0, для которых получится

x 60 <a·b =⇒ x ∈ x ∈ A · A−1 .

Поэтому важнен немного более сложный случай 0 < x < 1. Для него по формуле (2.1.135), x−1 > 1,
поэтому положив p = 1 − x−1 , мы получим

x−1 = 1 + p, p>0 (2.1.185)

Поскольку a · p > 0, по лемме 2.1.12 существуют r > 0 и a ∈ A такие, что

a∈ A & a+a·p−r ∈
/A

Положив c = x · a−1 , мы получим

c−1 − r = a · x−1 − r = a · (1 + p) − r = a + a · p − r ∈
/A =⇒ c ∈ A−1 .
144 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Теперь если мы возьмем какое-нибудь b ∈ A−1 так, чтобы c < b, мы получим:

x = a · b < (2.1.134) < a · c =⇒ x ∈ A · A−1 .

Это доказывает включение (2.1.184), и вместе с ним, формулу (2.1.179) для случая A > (0). Случай
A < (0) будет его следствием:

A · A−1 = (2.1.158) = (−A) · (−(A−1 )) = (2.1.162) =


= (−A) · (−(−(−A)−1 )) = (2.1.167) = (−A) · (−A)−1 = (уже доказано) = (1).

18. В тождестве (2.1.180) сначала мы предполагаем, что A + B > (0) и C > (0). Тогда

x ∈ (A + B) · C ⇐⇒ ∃y ∈ A + B ∃c ∈ C x6y·c ⇐⇒
⇐⇒ ∃a ∈ A ∃b ∈ B ∃c ∈ C x 6 (a + b) · c = |{z}
a · c + |{z}
b·c ∈ A·C +B·C ⇐⇒


A·C B·C

⇐⇒ x∈ A·C +B·C

После этого рассматриваются остальные случаи. Например, при A + B < (0) и C > (0) мы получаем

(A + B) · C = (2.1.158) = −((−(A + B)) · C) = (2.1.168) = −(((−A) + (−B)) · C) = (уже доказано) =


= −((−A) · C + (−B) · C) = (2.1.168) = (−(−A) · C) + (−(−B) · C) = (2.1.175) =
= (−(−A)) · C + (−(−B)) · C = (2.1.167) = A · C + B · C.

Случаи A + B > (0) & C < (0) и A + B < (0) & C < (0) рассматриваются так же. Случай C = (0)
тоже очевиден. Остается случай A + B = (0), то есть B = (−A). Для него мы получаем

(A+B)·C = (0)·C = (2.1.158) = (0) = A·C+(−(A·C)) = (2.1.175) = A·C+((−A)·C) = A·C+B·C.

Теорема 2.1.19 (Р. Дедекинд). Пусть X и Y – два непустых множества в R∗ , причем

∀A ∈ X ∀B ∈ Y A 6 B. (2.1.186)

Тогда найдется сечение C ∈ R∗ такое что

∀A ∈ X ∀B ∈ Y A 6 C 6 B. (2.1.187)

Доказательство. Положим [
C = ∪X = A.
A∈X

1. Проверим сначала, что C — сечение. Прежде всего, поскольку множество X непусто, найдется
A ∈ X, и поскольку A – сечение, это множество тоже должно быть непусто. Мы получаем, что

∅ 6= A ⊆ C =⇒ C 6= ∅.

С другой стороны, поскольку Y непусто, найдется B ∈ Y , и для него будет справедливо неравенство
A 6 B, при любом A ∈ X. Это означает, что все элементы A ∈ X содержатся в B, и мы получаем
цепочку6 [
∀A ∈ X A ⊆ B =⇒ C = A ⊆ B ⊂ Q∗ =⇒ C 6= Q∗ .
A∈X

Свойство (2.1.145) для C доказывается цепочкой


[ A∈R∗ A⊆C
x<a∈C= A =⇒ ∃A ∈ X x < a ∈ A =⇒ ∃A ∈ X x∈A =⇒ x∈C
A∈X

А свойство (2.1.146) — цепочкой


[ A∈R∗ A⊆C
x∈C= A =⇒ ∃A ∈ X x∈A =⇒ ∃A ∈ X ∃a ∈ A x < a ∈ A =⇒ x<a∈C
A∈X
6 Напомним, что отношение M ⊂ N было определено на с.32 и означает, что M ⊆ N и M 6= N .
§ 1. Вещественные числа и числовые множества 145

2. После этого остается убедиться, что справедливо условие (2.1.187). Первое неравенство в нем,

∀A ∈ X A 6 C,

эквивалентно включению
∀A ∈ X A ⊆ C,
S
справедливому, потому что C = A∈X A. А второе неравенство

∀B ∈ Y C 6 B,

эквивалентно включению
∀B ∈ Y C ⊆ B,
которое доказывается цепочкой
[
∀A ∈ X A6B =⇒ ∀A ∈ X A⊆B =⇒ C= A ⊆ B.
A∈X

(c) Числовые множества


Как мы уже говорили, числа также образуют множества. При этом, поскольку мы строим теорию
вещественных чисел, опираясь на теорию множеств, нам не нужно давать строгое определение
этому понятию. Здесь мы приведем простейшие примеры числовых множеств и обсудим некоторые
их свойства, которые понадобятся в дальнейшем.


⋄ 2.1.18. Множества, определяемые явным (a, b] = x ∈ R : a<x6b
перечислением своих элементов. Это самый 
[a, b) = x ∈ R : a6x<b
простой пример числовых множеств. Например, 
запись (a, +∞) = x ∈ R : a<x
  
1 [a, +∞) = x ∈ R : a6x
−1; ; 3 
2 (−∞, b) = x ∈ R : x<b

обозначает множество, состоящее из трех эле- (−∞, b] = x ∈ R : x6b
ментов: −1, 21 и 3.
Точнее, в этом списке множество (a, b) называ-
⋄ 2.1.19. Числовые множества, определяе- ется интервалом, [a, b] – отрезком, (a, b] – полу-
мые отношениями порядка. Отношения 6, < интервалом с замкнутым правым концом, [a, b)
, >, > определяют на прямой R множества, из- – полуинтервалом с замкнутым левым концом,
вестные как интервал, отрезок и полуинтервалы: (a, +∞) – открытым полуинтервалом с бесконеч-
 ным правым концом, [a, +∞) – замкнутым полу-
(a, b) = x ∈ R : a<x<b интервалом с бесконечным правым концом, и так

[a, b] = x ∈ R : a6x6b далее.

Алгебраические операции над числовыми множествами и неравенства между ними.


• Если X ⊆ R — числовое множество и a ∈ R – число, то
— символом −X обозначается множество, состоящее из чисел, противоположных
числам из X:
−X := {y ∈ R : ∃x ∈ X − x = y} (2.1.188)
— символами X+a и X−a обозначаются числовые множества, получаемые сдвигом
X на a вправо и влево:

X + a = {y ∈ R : ∃x ∈ X x + a = y}, (2.1.189)
X − a = {y ∈ R : ∃x ∈ X x − a = y} (2.1.190)
146 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

— символами a · X и X · a обозначается числовое множество, получаемое умноже-


нием X на a:

a · X = X · a = {y ∈ R : ∃x ∈ X a · x = y}, (2.1.191)

— неравенство
a 6 X, (2.1.192)
означает, что любой элемент множества X не меньше числа a

∀x ∈ X a 6 x;

точно так же формулы


a < X, X 6 a, X <a
являются сокращенными записями следующих утверждений соответственно:

∀x ∈ X a < x, ∀x ∈ X x 6 a, ∀x ∈ X x<a

• Если X и Y — два числовых множества, то


X
— символами X + Y , X − Y , X · Y , Y обозначаются множества, определяемые
формулами

X + Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x + y = z} (2.1.193)
X − Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x − y = z} (2.1.194)
X · Y = {z ∈ R : ∃x ∈ X ∃y ∈ Y x · y = z} (2.1.195)
 
X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z (2.1.196)
Y y
— неравенство
X 6Y
по определению означает, что любой элемент множества X не превосходит лю-
бого элемента множества Y :

∀x ∈ X ∀y ∈ Y x6y

а неравенство
X <Y
– что любой элемент множества X меньше любого элемента множества Y :

∀x ∈ X ∀y ∈ Y x<y

⊲ 2.1.20. Проверьте справедливость равенств: (a; b) + c = (a + c; b + c)


   
1 9 [a; b] + c = [a + c; b + c]
−1; ; 3 + 4 = 3; ; 7
2 2 (a; +∞) + c = (a + c; +∞)
   
1 7 (−∞; a) + c = (−∞; a + c)
−1; ; 3 − 4 = −5; − ; −1
2 2

Минимум и максимум числового множества.


• Пусть X — числовое множество. Число a называется минимумом множества X, если a
принадлежит X, и все остальные элементы X не меньше a:

a∈X & a6X (то есть a ∈ X и ∀x ∈ X a 6 x)

В таких случаях пишут


a = min X
§ 1. Вещественные числа и числовые множества 147

• Аналогично, число b называется максимумом множества X, если b принадлежит X, и все


остальные элементы X не больше b:

b∈X & X6b (то есть b ∈ X и ∀x ∈ X x 6 b)

и в таких случаях пишут


b = max X

⋄⋄ 2.1.21. Нетрудно сообразить, что минимум и вместе это дает (2.1.199).


и максимум отрезка X = [a; b] совпадают с его Теперь из (2.1.199) следует (2.1.198):
концами:
a = min[a; b], b = max[a; b] x<y
Но при этом у интервала X = (a; b) нет ни мини- ⇓
мума, ни максимума: 0<y−x
∄ min(a; b), ∄ max(a; b) (2.1.197) ⇓ (2.1.199)
y−x
«Наглядное» объяснение этому выглядит так: 0< <y−x
2
минимумом множества (a; b) может быть толь-
ко число a, но оно не принадлежит (a; b); и то же
самое с максимумом. Наконец, доказываем (2.1.197):
Разумеется, такие рассуждения нельзя счи-
тать строгим доказательством. Чтобы провести c = min(a; b)
аккуратные выкладки нам понадобится следую-

щее утверждение:
c ∈ (a; b)
x+y
x<y =⇒ x< < y. (2.1.198) ⇓
2
Для его доказательства в свою очередь понадо- a <c < b
бится вот что: ⇓ (2.1.198)
a a+c
0 < a =⇒ 0 < < a. (2.1.199) a< <c
2 2

Это доказывается так: с одной стороны, из
a+c
(2.1.23) получаем ∃z = ∈ (a; b) z < c
2
a ⇓
0 < a =⇒ 0 <
2
c 6= min(a; b)
отсюда, в силу (2.1.21) следует
a a a a
=0+ < + =a И то же самое с максимумом.
2 2 2 2

Свойства min и max:


1◦ Монотонность: если множества X и Y имеют минимум (максимум), то
 
X⊆Y =⇒ min X > min Y max X 6 max Y (2.1.200)

2◦ Инвариантность относительно сдвига: если множество X имеет минимум (макси-


мум), то любой его сдвиг X + a тоже имеет минимум (максимум), причем
 
min(X + a) = (min X) + a max(X + a) = (max X) + a (2.1.201)

3◦ Двойственность: если множество X имеет минимум (максимум), то противополож-


ное множество −X имеет максимум (минимум), и
 
max(−X) = − min X min(−X) = − max X (2.1.202)
148 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Доказательство. Мы докажем первую половину каждого утверждения (вторая доказывается по


аналогии).
1. Пусть X ⊆ Y . Тогда

a = min X =⇒ a∈X⊆Y =⇒ a > min Y

2.

p = min X =⇒ p∈X & p 6 X =⇒


=⇒ p + a ∈ X + a & p+a6X +a =⇒ p + a = min(X + a)

3.

p = min X =⇒ p∈X & p6X =⇒ −p ∈ −X & − p > −X =⇒ −p = max(−X)

Минимум и максимум двух чисел. ⋄ 2.1.22. Очевидно,


• Из аксиомы A13 следует, что формулы 0 ∧ 1 = 0, 0∨1=1
(
a, a 6 b 0 ∧ (−1) = −1, 0 ∨ (−1) = 0.
a ∧ b := (2.1.203)
b, a > b ⊲ 2.1.23. Докажите, что выполняются следую-
( щие тождества:
b, a 6 b
a ∨ b := (2.1.204)
a, a > b a∧b = b∧a
корректно определяют две операции над ве- a∨b = b∨a
щественными числами. (a ∧ b) ∧ c = a ∧ (b ∧ c)
(a ∨ b) ∨ c = a ∨ (b ∨ c)
Теорема 2.1.20. Для любых двух чисел a, b ∈ R
множество {a, b} обладает минимумом и мак- (a ∧ b) ∨ c = (a ∨ c) ∧ (b ∨ c)
симумом, и справедливы формулы: (a ∨ b) ∧ c = (a ∧ c) ∨ (b ∧ c)

a ∧ b = min{a, b} (2.1.205)
a ∨ b = max{a, b} (2.1.206) ⊲ 2.1.24. Докажите, что не существует числа
b ∈ R такого, что равенство
Доказательство. По аксиоме A13, выполняется
одно из двух: либо a 6 b, либо a > b. a∧b=a
В первом случае (когда a 6 b) мы получим:
выполнялось бы для всех a ∈ R.
a ∧ b = a = min{a, b}. ⊲ 2.1.25. Докажите, что не существует числа
Здесь первое равенство выполняется по опреде- b ∈ R такого, что равенство
лению a ∧ b, а второе – потому что a ∈ {a, b} и a∨b=a
a 6 {a, b}. И точно так же
выполнялось бы для всех a ∈ R.
a ∨ b = b = max{a, b},
⊲ 2.1.26. Докажите неравенства:
и первое равенство выполняется по определению
a ∨ b, а второе – потому что b ∈ {a, b} и {a, b} 6 b. a 6 a ∨ b, a, b ∈ R
А во втором случае (когда a > b) мы получа- (2.1.207)
ем a ∨ b 6 a + b 6 2 · a ∨ b, a, b > 0
a ∧ b = b = min{a, b}, (2.1.208)
2 2
где второе равенство выполняется потому что a∨b 6 a2 + b 2 6 2 a ∨ b , a, b > 0
b ∈ {a, b} и {a, b} > b. И, с другой стороны, (2.1.209)
a ∨ b = a = max{a, b}, ⊲ 2.1.27. Проверьте, какие из следующих тож-
деств верны:
где второе равенство верно потому что a ∈ {a, b}
и a > {a, b}. (a ∧ b) + c = (a + c) ∧ (b + c)
§ 1. Вещественные числа и числовые множества 149

(a + b) ∧ c = (a ∧ c) + (b ∧ c) мумом), то их объединение A ∪ B тоже облада-


(a ∨ b) + c = (a + c) ∨ (b + c) ет минимумом (максимумом), причем выпол-
няется равенство:
(a + b) ∨ c = (a ∨ c) + (b ∨ c)
min(A ∪ B) = (min A) ∧ (min B) (2.1.210)
Предложение 2.1.21. Если числовые множе-  
ства A и B оба обладают минимумом (макси- max(A ∪ B) = (max A) ∨ (max B) (2.1.211)

Нижняя и верхняя грани числового множества.


• Говорят, что числовое множество X ограничено снизу, если существует число s такое, что
для всякого x ∈ X выполняется неравенство s 6 x. Коротко это условие можно записать с
помощью неравенств, в которых сравниваются числа и множества (мы определяли такие
неравенства на с.146):
∃s ∈ R s 6 X.
В таких случаях принято говорить также, что число s ограничивает множество X снизу.
• Аналогично, говорят, что числовое множество X ограничено сверху, если существует чис-
ло t такое, что для всякого x ∈ X выполняется неравенство x 6 t. Это можно записать
так:
∃t ∈ R X 6 t.
В таких случаях принято говорить также, что число d ограничивает множество X свер-
ху.
• Если множество X ограничено и снизу, и сверху, то говорят, что множество X ограничено.
• Точной нижней гранью (или точной нижней границей) inf X числового множества X
называется
— символ −∞, если X не ограничено снизу; в этом случае точная нижняя грань
не является числом: запись
inf X = −∞
просто означает, что множество X не ограничено снизу;
— наибольшее из чисел s, ограничивающих X снизу, если X ограничено снизу:

inf X = max{s ∈ R : s 6 X} (2.1.212)

запись
inf X > −∞
принято использовать в случаях, когда нужно коротко дать понять, что множе-
ство X ограничено снизу.
• Точной верхней гранью (или точной верхней границей) sup X числового множества X
называется
— символ +∞, если X не ограничено сверху; опять же в этом случае точная ниж-
няя грань не является числом: запись

inf X = +∞

просто означает, что множество X не ограничено сверху;


— наименьшее из чисел t, ограничивающих X сверху, если X ограничено сверху:

sup X = min{t ∈ R : X 6 t} (2.1.213)

запись
sup X < +∞
принято использовать в случаях, когда множество X ограничено сверху.
150 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

⋄ 2.1.28. Пусть X = (a, b) — интервал на веще- роны, любое число s 6 a ограничивает X снизу.
ственной прямой R. А наибольшее из всех таких чисел, то есть число
A = a будет точной нижней гранью множества
X. Таким образом,

inf(a, b) = a sup(a, b) = b

Точно также для отрезка и полуинтервалов


Легко видеть, что любое число t > b огра-
ничивает множество X сверху. А наименьшее из inf[a, b] = inf(a, b] = inf[a, b) = a
всех таких чисел, то есть число B = b будет точ-
ной верхней гранью множества X. С другой сто- sup[a, b] = sup(a, b] = sup[a, b) = b

Теорема 2.1.22. Если множество X обладает минимумом (максимумом), то он совпадает с


точной нижней (верхней) гранью этого множества:
 
∃ min X =⇒ min X = inf X ∃ max X =⇒ max X = inf X

Теорема 2.1.23 (о точной границе). Если X – непустое ограниченное снизу множество, то оно
имеет точную нижнюю грань. Аналогично, если X – непустое ограниченное сверху множество,
то оно имеет точную верхнюю грань.
Доказательство. Рассмотрим случай, когда X – непустое ограниченное сверху множество (слу-
чай, когда X ограничено снизу рассматривается аналогично). Обозначим буквой Y множество всех
чисел, ограничивающих X сверху:

Y = {y ∈ R : X 6 y} = {y ∈ R : ∀x ∈ X x 6 y}

(поскольку X ограничено сверху, хотя бы одно такое число y существует, и значит, Y – непустое
множество). Тогда
∀x ∈ X ∀y ∈ Y x 6 y
и по аксиоме непрерывности вещественной прямой A16, найдется такое число c, что

∀x ∈ X ∀y ∈ Y x6c6y

Первое неравенство здесь означает, что c ограничивает X сверху, то есть, что c ∈ Y . А второе – что
c есть наименьшее число, лежащее в Y . То есть c = min Y = min{y ∈ R : X 6 y} = sup X.

Свойства inf и sup:


1◦ Монотонность: если X и Y ограничены снизу (сверху), то
 
X⊆Y =⇒ inf X > inf Y sup X 6 sup Y .

2◦ Инвариантность относительно сдвига: если множество X ограничено снизу (свер-


ху), то любой его сдвиг X + a тоже ограничен снизу (сверху), причем
 
inf(X + a) = (inf X) + a sup(X + a) = (sup X) + a

3◦ Двойственность: если множество X ограничено снизу (сверху), то противоположное


множество −X ограничено сверху (снизу), и
 
sup(−X) = − inf X sup(−X) = − inf X

Доказательство. Здесь мы также докажем только первую половину каждого утверждения (пред-
ложив читателю самостоятельно по аналогии доказать вторую).
1. В первом случае получаем цепочку:

X⊆Y
§ 2. Натуральные, целые и рациональные числа 151


∀c ∈ R c6Y =⇒ c 6 X

{c ∈ R : c 6 Y } ⊆ {c ∈ R : c 6 X}
⇓ (свойство 1◦ на с. 147 )
inf Y = max{c ∈ R : c 6 Y } 6 max{c ∈ R : c 6 X} = inf X

2. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : c 6 X + a}
Тогда получаем цепочку

b∈B ⇐⇒ b6X ⇐⇒ b+a6X +a ⇐⇒ b+a∈C



B+a=C

   
inf X + a = max B + a =(свойство 2◦ на с. 147) = max(B + a) = max C = inf(X + a)

3. Обозначим
B = {b ∈ R : b 6 X}, C = {c ∈ R : −X 6 c}
Тогда получаем цепочку

c∈C ⇐⇒ −X 6 c ⇐⇒ −c 6 X ⇐⇒ −c ∈ B ⇐⇒ c ∈ −B

−B = C

 
− inf X = − max B =(свойство 3◦ на с. 147) = min − B = min C = sup(−X)

§2 Натуральные, целые и рациональные числа


Если задана какая-то модель вещественных чисел (R, 0, 1, +, ·, 6), то внутри нее можно построить
другие стандартные классы чисел, считающихся также вещественными, а именно, класс N нату-
ральных чисел, класс Z целых чисел, класс Q рациональных чисел, и так далее. В этом параграфе
мы покажем, как выглядит эти конструкции. Мы при этом следуем традициям российской мате-
матической школы, в которой принято множество N начинать с единицы (этот выбор, конечно,
несущественен).

(a) Натуральные числа N и целые неотрицательные числа Z+


Определение натуральных чисел N. Вначале нам понадобится вспомогательное определение:
• Множество вещественных чисел X называется индуктивным, если
1) X содержит единицу (о которой говорится в аксиоме A8):

1∈X

2) вместе с каждым числом x ∈ X ему принадлежит также число x + 1:

∀x ∈ X x+1∈X
152 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

⋄⋄ 2.2.1. Само множество R является индуктив- ми множествами. Наоборот, скажем, множества


ным. Полуинтервалы вида (a, ∞) где a < 1, или (1, ∞), [2, ∞), [0, 5] не являются индуктивными.
[a, ∞) где a 6 1 также являются индуктивны-

Теперь главное определение:


• Наименьшее индуктивное множество обозначается символом N и называется множе-
ством натуральных чисел, или натуральным рядом. Слово “наименьшее” здесь означает,
что выполняются два условия:
(i) N является индуктивным множеством;
(ii) если X – какое-нибудь другое индуктивное множество, то N содержится в X.
Доказательство существования и единственности. 1. Покажем сначала, что такое множество N
действительно существует. Обозначим через N пересечение всех индуктивных множеств X:
\
N= X (2.2.214)
X − индуктивное
множество

Иными словами,

y∈N ⇔ y принадлежит любому индуктивному множеству X

Тогда мы получим:
1) 1 ∈ N, потому что 1 лежит в любом множестве X, и
2) если x ∈ N, то есть x ∈ N для всякого индуктивного множества X, то x+1 ∈ X (поскольку
X индуктивно); значит, x + 1 ∈ X для всякого индуктивного множества X, поэтому
x + 1 ∈ N.
Таким образом, N – индуктивное множество. С другой стороны, N содержится в любом множе-
стве X, то есть, в любом другом индуктивном множестве. Значит, N как раз и есть множество
натуральных чисел.
2. Убедимся, что N – наименьшее индуктивное множество, то есть оно удовлетворяет условию
(ii) на с.152. Действительно, если Y – какое-нибудь индуктивное множество, то оно содержится в
семействе множеств X, по которому устраивается пересечение в формуле (2.2.214). Поэтому N ⊆ Y .
3. Убедимся, что множество N определяется однозначно. Действительно, если бы нам было дано
какое-то другое множество N e с теми же свойствами, то мы получили бы, что, во-первых,

e
N⊆N
e и, во-вторых,
(потому что N содержится в любом индуктивном множестве, в частности, в N),

e ⊆N
N
e содержится в любом индуктивном множестве, в частности, в N). Вместе это означает,
(потому что N
что
e
N = N.

Принцип математической индукции. Напомним, что в предыдущей главе мы описали прин-


цип обыкновенной индукции для класса FinOrd конечных ординалов (теорема 0.3.48). Следующее
утверждение показывает, что множество N обладает тем же свойством (несмотря на внешнее сход-
ство, N и FinOrd – формально разные множества, поэтому этот факт не очевиден).
Теорема 2.2.1 (принцип математической индукции в абстрактной форме). Пусть E – какое-
нибудь подмножество в N, обладающее свойствами:
(a) 1∈E
(b) ∀n ∈ E n+1∈E
Тогда E = N.
§ 2. Натуральные, целые и рациональные числа 153

Доказательство. С одной стороны, нам дано, что E ⊆ N. С другой же стороны, свойства (a), (b)
означают, что E является индуктивным множеством. Поэтому, в силу условия (ii) определения 3.2,
N содержится в E: N ⊆ E. Итак,
E⊆N & N⊆E
то есть, E = N.
На практике удобно пользоваться следующей переформулировкой принципа математической
индукции.
Теорема 2.2.2 (принцип математической индукции). Пусть дана последовательность утвержде-
ний
Φn n∈N (2.2.215)
со следующими свойствами:
(a′ ) первое утверждение Φ1 истинно;
(b′ ) если при каком-нибудь n ∈ N истинно утверждение Φn , то истинно и утверждение
Φn+1 .
Тогда все утверждения Φn истинны (для всех n ∈ N).
Доказательство. Обозначим через E множество всех таких чисел n ∈ N, для которых утверждение
Φn истинно. Тогда условие (a′ ) будет эквивалентно условию (a) теоремы 2.2.1, а условие (b′ ) будет
эквивалентно условию (b). Значит, E = N, то есть Φn истинно для каждого n ∈ N.

Свойства натуральных чисел. Первое следствие из принципа математической индукции вы-


глядит так:
Теорема 2.2.3. Множество N натуральных чисел замкнуто относительно сложения и умно-
жения: если m, n ∈ N, то m + n ∈ N и m · n ∈ N.
Доказательство. 1. Зафиксируем m ∈ N и обозначим через E множество чисел n ∈ N таких, что
m + n ∈ N:
E = {n ∈ N : m + n ∈ N}
Нам нужно убедиться, что E = N. Это делается индукцией. Сначала замечаем, что 1 ∈ E, потому
что из m ∈ N следует m + 1 ∈ N. Затем берем какое-нибудь k ∈ E, то есть

m+k ∈N

и замечаем, что тогда k + 1 ∈ E, потому что

m + (k + 1) = (m + k) + 1 ∈ N

По принципу индукции все это означает, что E = N.


2. Опять фиксируем m ∈ N и обозначаем через E множество чисел n ∈ N таких, что m · n ∈ N:

E = {n ∈ N : m · n ∈ N}

Нам нужно убедиться, что E = N. Это тоже делается индукцией. Сначала замечаем, что 1 ∈ E,
потому что из m ∈ N следует m · 1 = m ∈ N. Затем берем какое-нибудь k ∈ E, то есть

m·k ∈N

и замечаем, что тогда k + 1 ∈ E, потому что из только что доказанной замкнутости N относительно
сложения следует
m · k ∈ N =⇒ m · (k + 1) = (m · k) + m ∈ N
Снова по принципу индукции E = N.
Ниже нам понадобятся еще несколько утверждений об N.
• Дискретным интервалом с концами m ∈ N и n ∈ N называется множество

{m, ..., n} := {k ∈ N : m 6 k 6 n}

(очевидно, если m > n, то {m, ..., n} = ∅).


154 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

• Начальным дискретным интервалом называется дискретный интервал, у которого левый


конец равен 1:
{1, ..., n} = {k ∈ N : k 6 n}

Свойства натуральных чисел


1◦ . Для всякого n ∈ N выполняется n > 1. Поэтому,

min N = 1 (2.2.216)

2◦ . Если n ∈ N и n 6= 1, то n − 1 ∈ N.
3◦ . Для любого n ∈ N множество чисел x ∈ N, больших n − 1, имеет наименьший элемент,
а именно n:
min{x ∈ N : n − 1 < x} = n (2.2.217)
4◦ . Каждое непустое подмножество M ⊆ N обладает минимальным элементом.
5◦ . Для любых m, n ∈ N справедливы импликации:

m<n+1 =⇒ m6n (2.2.218)

m<n =⇒ m+16n (2.2.219)


6◦ . Если m, n ∈ N и m < n, то n − m ∈ N.
7◦ . Пусть I – подмножество в начальном интервале {1, ..., n}, удовлетворяющее условиям
(a) 1∈I
 
(b) ∀k < n k ∈ I =⇒ k + 1 ∈ I
тогда I = {1, ..., n}.

8 . Пусть E – подмножество в N, удовлетворяющее условиям
(a) 1∈E
(b) ∀k ∈ E {1, ..., k} ⊆ E
Тогда
— либо E = N,
— либо E – начальный интервал:

∃n ∈ E {1, ..., n} = E (2.2.220)

Доказательство. Все эти утверждения доказываются математической индукцией.


1. Формула n > 1 верна для любого n ∈ N, потому что, во-первых, она верна при n = 1: 1 > 1.
И, во-вторых, если она верна при некотором n = m, m > 1, то и при n = m + 1 она тоже верна:
m + 1 > 1 + 1 > 1.
2. Рассмотрим множество

E = {1} ∪ (N + 1) = {x ∈ R : x=1 ∨ ∃n ∈ N x = n + 1}

и заметим, что E = N. Действительно, во-первых, 1 ∈ E, а во-вторых, если m ∈ E, то либо m = 1, и


тогда m+1 ∈ N+1 ⊆ E, либо m = n+1 для некоторого n ∈ N, и тогда m+1 = (n+1)+1 ∈ N+1 ⊆ E.
Теперь из E = N получаем: если n ∈ N = E = {1} ∪ (N + 1) и n 6= 1, то n ∈ N + 1, то есть n = k + 1
для некоторого k ∈ N.
3. Обозначим Xn = {x ∈ N : n − 1 < x} и заметим, что

Xn+1 = X +1 (2.2.221)
| {z } | n{z }
k k
{y ∈ N : n < y} {y ∈ R : ∃x ∈ Xn y = x + 1}

Действительно, с одной стороны, Xn + 1 ⊆ Xn+1 , потому что

y ∈ Xn + 1 =⇒ ∃x ∈ Xn y =x+1 =⇒ ∃x ∈ N n−1<x&y =x+1 =⇒


§ 2. Натуральные, целые и рациональные числа 155

=⇒ ∃x ∈ N n < x + 1 = y =⇒ y ∈ Xn+1

а, с другой – Xn+1 ⊆ Xn + 1, потому что

y ∈ Xn+1 =⇒ y∈N& n<y =⇒ ∃x ∈ N y =x+1&n<x+1 =⇒


| {z }

y > min N = 1

2◦

x := y − 1 ∈ N

=⇒ ∃x ∈ N y =x+1&n−1<x =⇒ ∃x ∈ Xn y =x+1 =⇒ y ∈ Xn + 1

Теперь доказываем (2.2.217) по индукции. Во-первых, убеждаемся, что эта формула верна при
n = 1. Действительно,
1◦
x∈N =⇒ x>1>0 =⇒ x ∈ X1
| {z }

N ⊆ X1

X1 = N

min X1 = min N = 1
Далее предполагаем, что (2.2.217) верна при n = m:

min Xm = m (2.2.222)

и докажем, что тогда она верна при n = m + 1:

min Xm+1 = (2.2.221) = min(Xm + 1) = (min Xm ) + 1 = (2.2.222) = m + 1

4. Пусть M ⊆ N и M 6= ∅. Если 1 ∈ M , то доказывать нечего, потому что тогда 1 = min M .


/ M . Тогда множество E = N \ M , наоборот, должно содержать 1:
Поэтому будем считать, что 1 ∈

1∈E

Покажем, что существует такое n ∈ N, что

{1, ..., n} ⊆ E & n+1∈


/E (2.2.223)

Действительно, если бы это было не так, то есть при любом n ∈ E мы получали бы, что из {1, ..., n} ⊆
E следует n + 1 ∈ E, то это означало бы, что E = N, то есть M = ∅.
Теперь, возвращаясь от E к M , условие (2.2.223) можно переформулировать так:

{1, ..., n} ∩ M = ∅ & n+1∈M

Это и означает, что n + 1 = min M .


5. Пусть m, n ∈ N и m < n + 1, то есть m − 1 < n. Тогда n ∈ {x ∈ N : m − 1 < x} и по свойству 3◦
получаем n > min{x ∈ N : m − 1 < x} = m. Это доказывает импликацию (2.2.218). А из нее следует
(2.2.219):
(2.1.21) (2.2.218)
m<n =⇒ m+1<n+1 =⇒ m+16n
6. Пусть m ∈ N. Рассмотрим множество

E = {1, ..., m} ∪ (N + m)

и заметим, что E = N. Действительно, во-первых, 1 ∈ E, а во-вторых, если k ∈ E, то возможны три


случая, в каждом из которых получается k + 1 ∈ E:
1) k < m = (m − 1) + 1 =⇒ (применяем 5◦ ) =⇒ k 6 m−1 =⇒ k+16m =⇒
k + 1 ∈ E;
156 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

2) k = m =⇒ k + 1 = 1 + m ∈ (N + m) ⊆ E;
3) k > m =⇒ k ∈ / {1, ..., m} =⇒ k ∈ (N + m) =⇒ k = n + m (n ∈ N) =⇒
k + 1 = (n + 1) + m (n + 1 ∈ N) =⇒ k + 1 ∈ (N + m) ⊆ E;
Таким образом, получается что N = E = {1, ..., m} ∪ (N + m), и поэтому если n ∈ N, n > m,
то, поскольку n ∈/ {1, ..., m}, имеем n ∈ N + m, то есть n = m + k, k ∈ N, или, иными словами,
n − m = k ∈ N.
7. Рассмотрим множество M = N \ I. Тогда получаем цепочку

I ⊆ {1, ..., n} =⇒ n+1∈


/I =⇒ n+1∈ M =⇒ n + 1 > |min
{zM}

существует
в силу 4◦

Нам нужно убедиться, что min M = n+1: тогда получится, что {1, ..., n}∩M = ∅, то есть {1, ..., n} ⊆
I и значит I = {1, ..., n}.
Предположим, что это не так: min M 6= n + 1. Тогда min M < n + 1, и по свойству 5◦ min M 6 n.
/ M , и значит min M > 1, то есть по свойству 5◦ ,
С другой стороны, в силу (a), 1 ∈ I, поэтому 1 ∈
min M − 1 > 1, и
2 6 min M 6 n
Если теперь положить k = min M − 1, то получается вот что:

(b)
16k<n & k∈
/M =⇒ k∈I & k<n =⇒ {z ∈ I}
k + 1 = |min M

невозможно,
потому что
M ∩I = ∅

8. Если E 6= N, то найдется x ∈ N такое что x ∈


/ E. То есть множество

M = {x ∈ N : x∈
/ E}

непусто. Значит, по уже доказанному свойству 4◦ , M имеет минимальный элемент:

m = min M

/ M . С другой стороны, по уже доказанному свойству 1◦ , 1 6 m.


По условию (a), 1 ∈ E, и поэтому 1 ∈
Значит, 1 < m. Поэтому по свойству 6◦ , число n = m − 1 тоже лежит в N:

n=m−1∈N

Тогда, во-первых, n ∈
/ M (потому что иначе число m = n + 1 не было бы минимумом для M ), и
значит n ∈ E, откуда в силу (b),
{1, ..., n} ⊆ E (2.2.224)
А, во-вторых, для x ∈ N справедлива импликация

x>n =⇒ x∈
/ E, (2.2.225)

потому что иначе мы получили бы

n<x x∈E

(2.2.219) ⇓ (b)
m=n+16x {1, ..., x} ⊆ E
| {z }

m∈E
а это невозможно, поскольку m ∈ M . Утверждения (2.2.224) и (2.2.225) вместе означают, что
{1, ..., n} = E.
§ 2. Натуральные, целые и рациональные числа 157

Целые неотрицательные числа Z+ .


• Множество целых неотрицательных чисел, обозначаемое символом Z+ (и называемое иногда
расширенным натуральным рядом), определяется как объединение множества N натуральных
чисел и нуля {0}:
Z+ = {0} ∪ N (2.2.226)
Для этого множества, как и для N справедлив принцип математической индукции:
Теорема 2.2.4 (принцип математической индукции в абстрактной форме для Z+ ). Пусть E –
какое-нибудь подмножество в Z+ , обладающее свойствами:
(a) 0 ∈ E
(b) ∀n ∈ E n+1∈E
Тогда E = Z+ .
Теорема 2.2.5 (принцип математической индукции для Z+ ). Пусть дана последовательность
утверждений
Φn n ∈ Z+ (2.2.227)
со следующими свойствами:
(a′ ) первое утверждение Φ0 верно;
(b′ ) если при каком-нибудь n ∈ N верно утверждение Φn , то верно и утверждение Φn+1 .
Тогда все утверждения Φn справедливы (для всех n ∈ Z+ ).

Определения по индукции. Читатель мог заметить, что среди примеров собственных обозна-
чений для чисел на странице 125 не было чисел, больших 10. Мы могли бы, конечно, по аналогии
последовательно определить числа 11, 12, или присвоить собственные обозначения вообще любому
конечному набору натуральных чисел, но чтобы дать собственные обозначения всем натуральным
числам (которых бесконечно много), нужно использовать так называемый прием определения по
индукции. О собственных обозначениях для чисел из N (точнее, об их десятичной записи) мы по-
говорим ниже на странице 172, а здесь мы приведем две теоремы, служащие обоснованием приема
определения по индукции и проиллюстрируем их примерами. Первая из них используется в случаях,
когда нужно определить бесконечную последовательность элементов7 :
Теорема 2.2.6 (об определениях полной индукцией). Пусть X – произвольное множество (необя-
зательно числовое) и дано отображение G, которое каждой конечной последовательности эле-
ментов x1 , ..., xn ∈ X, n ∈ N, ставит в соответствие определенный элемент G(x1 , ..., xn ) ∈ X. То-
гда для всякого начального элемента x1 ∈ X отображение G однозначно определяет бесконечную
последовательность {xn } ⊆ X, содержащую x1 в качестве первого элемента и удовлетворяющую
условию
∀n ∈ N G(x1 , ..., xn ) = xn+1 (2.2.228)
Доказательство. Зафиксируем x1 ∈ X и обозначим через E подмножество в N, состоящее из та-
ких n ∈ N, для которых существует конечная последовательность x1 , ..., xn ∈ X со следующим
свойством:
∀k = 2, ..., n G(x1 , ..., xk−1 ) = xk (2.2.229)
Тогда, во-первых, 1 ∈ E, потому что для n = 1 нужная последовательность должна состоять
только из одного числа, и таким числом будет x1 . И, во-вторых, если n ∈ E, то это значит, что
существует последовательность x1 , ..., xn ∈ X для которой выполняется (2.2.229). Тогда можно
положить xn+1 = G(x1 , ..., xn ), и мы получим что n + 1 ∈ E.
Таким образом, по принципу математической индукции (2.2.1), E = N. Отсюда следует, что для
всякого n ∈ N можно выбрать xn по такому правилу: выбираем какую-нибудь конечную после-
довательность {x1 , ..., xn }, подчиненную условию (2.2.229) (такая последовательность существует
поскольку n ∈ E), и в качестве xn берем ее последний элемент. Нам нужно только убедиться,
что число xn определяется таким алгоритмом однозначно. Действительно, если предположить, что
существует какое-то другое число x′n , которое можно определить таким же образом, то есть для
которого можно построить конечную последовательность {x′1 , ..., x′n } так, чтобы

x′1 = x1 & ∀k = 1, ..., n − 1 G(x′1 , ..., x′k ) = x′k+1


7 Напомним, что понятие бесконечной последовательности было определено на с.73.
158 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

то, рассмотрев множество индексов


I = {k = 1, ..., n : ∀i 6 k x′i = xi }
мы получим, что, во-первых, 1 ∈ I (потому что x′1 = x1 ), и, во-вторых,
k<n & k∈I

k<n & ∀i 6 k x′i = xi

x′k+1 = G(x′1 , ..., x′k ) = G(x1 , ..., xk ) = xk+1

k+16n & ∀i 6 k + 1 x′i = xi

k+1∈I
Отсюда, по принципу конечной индукции (свойство 7◦ на с.154), I = {1, ..., n}, то есть, в частности,
x′n = xn .
Вторая теорема бывает нужна, когда нет гарантии, что определяемая тобой последовательность
будет бесконечной8 :
Теорема 2.2.7 (об определениях частной индукцией). Пусть X – произвольное множество (необя-
зательно числовое) и дано отображение G, которое некоторым конечным последовательностям
элементов x1 , ..., xn ∈ X, n ∈ N, ставит в соответствие определенные элементы G(x1 , ..., xn ) ∈ X.
Тогда для всякого начального элемента x1 ∈ X это правило однозначно определяет (конечную или
бесконечную) последовательность {xn } ⊆ X, содержащую x1 в качестве первого элемента и удо-
влетворяющую условию
G(x1 , ..., xn ) = xn+1 , n<N (2.2.230)
где величина N зависит от множества X, отображения G и начального элемента x1 , и опреде-
ляется условием:
n o
N = sup n ∈ N : ∃{x2 , ..., xn } ⊆ X ∀k ∈ {2, ..., n} G(x1 , ..., xk−1 ) = xk (2.2.231)

Если N конечна, то она представляет собой длину последовательности {xn }.


Доказательство. Зафиксируем x1 и обозначим через E подмножество в N, от которого берется
верхняя грань в формуле (2.2.231)
N = sup E,
то есть состоящее из таких n ∈ N, для которых существует конечная последовательность x2 , ..., xn ∈
X со следующим свойством:
∀k = 2, ..., n G(x1 , ..., xk−1 ) = xk (2.2.232)
Это множество E будет удовлетворять условиям (a) и (b) свойства 8◦ на с.154:
(a) 1 ∈ E (потому что для n = 1 нужная последовательность должна состоять только из
одного числа, и таким числом будет x1 ), и
(b) ∀n ∈ E {1, ..., n} ⊆ E (потому что если n ∈ E, то есть существуют x1 , ..., xn ∈ X со
свойством (2.2.232), то для всякого k 6 n последовательность x2 , ..., xk будет обладать
теми же свойствами, только с заменой k на какое-нибудь i, а после этого n на k).
По свойству 8◦ на с.154 отсюда следует, что либо E = N, либо E = {1, ..., N } для некото-
рого N ∈ N. В обоих случаях мы получаем, что каждому n ∈ E можно поставить в соответ-
ствие некоторый элемент xn по такому правилу: выбираем какую-нибудь конечную последователь-
ность {x2 , ..., xn }, подчиненную условию (2.2.229) (такая последовательность существует поскольку
n ∈ E), и в качестве xn берем ее последний элемент. Здесь нужно только убедиться, что элемент
xn определяется таким алгоритмом однозначно. Это делается в точности так же, как при доказа-
тельстве теоремы 2.2.6.

8 Понятие конечной последовательности было определено на с.73.


§ 2. Натуральные, целые и рациональные числа 159

Поговорим теперь о примерах применения Факториал n! и двойной факториал n!!.


теоремы 2.2.6.
• Факториал числа n ∈ Z+ определяется по ин-
дукции следующим правилом:
Степени с натуральным показателем.
0! = 1, (n + 1)! = (n + 1) · n! (2.2.237)
• Степенью an числа a ∈ R с показателем
n ∈ N, как известно, называется число – здесь отображение G определяется форму-
лой
an = |a · a {z
· ... · a} G(x1 , ..., xn ) = (n + 1) · xn ,
n множителей
а начальным значением последовательности
Теорема 2.2.6 позволяет придать точный xn будет единица:
смысл этим словам: чтобы определить an для
любого n ∈ N, нужно зафиксировать число a ∈ R x1 = 1.
и рассмотреть отображение G, которое любой по-
следовательности (x1 , ..., xn ) чисел из R ставит в • Двойной факториал числа n ∈ Z+ определя-
соответствие число ется по индукции следующими правилами:
— если число n четно, то есть имеет вид
G(x1 , ..., xn ) = x1 · xn . n = 2m, m ∈ Z+ , то

Применив к этому отображению теорему 2.2.6, 0!! = 1, (2m + 2)!! = (2m + 2) · (2m)!! (2.2.238)
мы для начального значения
— если число n нечетно, то есть имеет вид
x1 = a n = 2m − 1, m ∈ N, то

получим последовательность со свойствами 1!! = 1, (2m + 1)!! = (2m + 1) · (2m − 1)!! (2.2.239)

Pn
x1 = a, xn+1 = a · xn , n ∈ N. Индуктивная сумма Qn k=1 ak и индуктив-
ное произведение k=1 ak элементов после-
Если обозначить довательности {an } определяются индуктивны-
ми правилами так:
an = xn , !
X1 n+1
X Xn

то эти свойства переписываются в виде ak = a1 , ak = ak + an+1


k=1 k=1 k=1
(2.2.240)
a1 = a (2.2.233)
1 n+1 n
!
Y Y Y
ak = a1 , ak = ak · an+1
an+1 = a · an (2.2.234) k=1 k=1 k=1
(2.2.241)
Это и есть формальное определение степени. – здесь (последовательность {an } считается за-
Обычно при определении по индукции указы- ранее фиксированной, и) в первом случае отоб-
ваются только эти соотношения, без уточнения, ражение G определяется формулой
каким должно быть отображение G, потому что
о его виде всегда можно догадаться. G(x1 , ..., xn ) = xn + an+1 ,
В дальнейшем нам будет удобно отдельно по-
а во втором — формулой
ложить
a0 = 1 (a ∈ R), G(x1 , ..., xn ) = xn · an+1 ;

и тогда индуктивное определение для an можно начальным же значением последовательности xn


будет переписать в виде в обоих случаях будет первый элемент последо-
вательности {an }:
a0 = 1, an+1 = a · an (a ∈ R, n ∈ Z+ )
(2.2.235) x1 = a1 .

! 2.2.2. Это определение, между прочим, пред- Часто приходится рассматривать также суммы и
полагает, что 00 равно единице: произведения по интервалам натуральных чисел
{m, ..., n}. Читатель может по аналогии дать ин-
00 = 1 (2.2.236) дуктивные определения этим понятиям, мы же
160 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

воспользуемся уже записанными формулами, и 1) G(x1 , ..., xn ) = x1 + xn , x1 = a. (Ответ: xn =


положим a · n.)
xn
n
X n
X m−1
X 2) G(x1 , ..., xn ) = n , x1 = a. (Ответ: xn =
a
ak = ak − ak (n−1)! .)
k=m k=1 k=1 1
3) G(x1 , ..., xn ) = xn , x1 = a, a 6= 0. (Ответ:
n
Y n
Y . m−1
Y xn = a (−1)n+1
.)
ak = ak ak (если ak 6= 0).
4) G(x1 , ..., xn ) = xxn1 , x1 = a, a 6= 0. (Ответ:
k=m k=1 k=1 (
⊲⊲ 2.2.3. Найдите формулы для последователь- a, n = 1
xn = .)
ностей, определяемых следующими условиями: 1, n > 1

Доказательство формул по индукции. Здесь мы покажем, как с помощью математической


индукции доказываются разные формулы. Те, что мы докажем, понадобятся нам в дальнейшем.

⋄ 2.2.4. Неравенство Бернулли. Для любых ⇓


n ∈ N и α > −1 выполняется неравенство
k>1
n
(1 + α) > 1 + n · α (2.2.242) ⇓
Доказательство. Действительно, при n = 1 по- n=k+1>2
лучается ⇓
(1 + α)1 > 1 + 1 · α,
то есть в этом случае неравенство верно. Предпо- n! = (k + 1)! = (k + 1) · |{z}
k! >
ложим, что оно верно для какого-нибудь n = k, | {z }

6
то есть, что справедливо 6
2 2k−1
k
(1 + α) > 1 + k · α (2.2.243) > 2 · 2k−1 = 2k = 2n−1
Тогда для n = k + 1 мы получаем 2. После того, как (2.2.244) доказано для n ∈
N, остается заметить, что при n = 0 оно тоже
(1 + α)n = (1 + α)k+1 = (1 + α) · (1 + α)k > верно:
> (применяем (2.2.243)) > (1 + α) · (1 + k · α) = 1
0! = 1 > = 2−1 .
2
= 1 + (k + 1) · α + k · α2 > 1 + (k + 1) · α = 1 + n · α
Следовательно, оно верно для n ∈ Z+ .
Мы получили, что из того, что (2.2.242) вы-
⋄ 2.2.6. При n, m ∈ Z+ справедливо неравенство
полняется для какого-то n = k автоматически
следует, что оно выполняется для n = k + 1. Та- (n + m)! > n! · (n + 1)m (2.2.245)
ким образом, (2.2.242) обладает свойствами (a′ )
и (b′ ) теоремы 2.2.2, и поэтому оно выполняется Доказательство. Проведем индукцию по m ∈
для любых n ∈ N. Z+ . При m = 0 это неравенство верно:
⋄ 2.2.5. При n ∈ Z+ справедливо неравенство (n + 0)! = n! > n! · (n + 1)0
n! > 2n−1 (2.2.244) Предположим, что оно верно при m = k:

Доказательство. 1. Докажем сначала это нера- (n + k)! > n! · (n + 1)k


венство для n ∈ N. При n = 1 это верно:
Тогда при m = k + 1 получаем:
20
1! 6 |{z}
|{z}
1 1 (n + m)! = (n + k + 1)! =
Предположим, что это верно при n = k: = (n + k + 1) · (n + k)! > (n + 1) · n! · (n + 1)k =
| {z } | {z }
6

k! > 2k−1 n+1 n! · (n + 1)k

Тогда при n = k + 1 получаем: = n! · (n + 1)k+1 = n! · (n + 1)m

k∈N
§ 2. Натуральные, целые и рациональные числа 161

⋄ 2.2.7. Сумма отрезка геометрической Доказательство. Это доказывается простой


прогрессии. Для всякого вещественного числа проверкой:
q 6= 1 и любых чисел m, n ∈ Z+ , m 6 n, справед-
Cnk + Cnk−1 = Cn+1k
ливы формулы:
m
Xn
i 1 − q n+1 n! n! (n + 1)!
q = , (2.2.246) + =
i=0
1 − q (n − k)!k! (n − k + 1)!(k − 1)! (n + 1 − k)!k!
Xn m
q −q n+1 m (делим на n!)
qi = (2.2.247)
i=m
1−q 1 1 n+1
+ =
(n − k)!k! (n − k + 1)!(k − 1)! (n + 1 − k)!k!
Доказательство. 1. Докажем сначала (2.2.246). m (умножаем на k!)
При n = 0 формула верна:
1 k n+1
0
+ =
X 1−q 1 (n − k)! (n − k + 1)! (n + 1 − k)!
qi = q0 = 1 = . m (умножаем на (n + 1 − k)!)
i=0
1−q
n−k+1+k =n+1
Предположим, что формула верна при n = k:

k
X 1 − q k+1 ⋄ 2.2.8. Бином Ньютона. Для любых a, b ∈ R
qi = , (2.2.248) и n ∈ N справедливо равенство
i=0
1−q
n
X
Тогда при n = k + 1 получаем: (a + b)n = Cnk · an−k · bk (2.2.251)
k=0
k+1 k
X X где Cnk – число сочетаний, определенное выше
qi = q i + q k+1 = (2.2.248) = формулой (2.2.249).
i=0 i=0
1 − q k+1 1 − q k+1 + q k+1 − q k+2 Доказательство. Сначала проверяем ее при n =
= + q k+1 = = 1:
1−q 1−q 1
X
1 − q k+2 (a + b)1 = C1k · a1−k · bk
= , | {z }
1−q k
k=0
| {z }
a+b k
что и есть формула (2.2.246) при n = k + 1. C10 · a1 · b0 + C11 · a0 · b1
2. После того, как (2.2.246) доказано, форму- Затем предполагаем, что она верна при n = m
ла (2.2.247) получается вычислением: m
X
m k
(a + b) = Cm · am−k · bk (2.2.252)
Xn Xn m−1
X
i i i k=0
q = q − q =
i=m i=0 i=0
и проверяем, что тогда она будет верна при n =
1 − q n+1 1 − qm q m − q n+1 m + 1:
= − =
1−q 1−q 1−q (a + b)m+1 = (a + b) · (a + b)m = (2.2.252) =
Xm
k
= (a + b) · Cm · am−k · bk =
k=0
m m
Число сочетаний Cnk . Для любых n, k ∈ Z+ , X
k
X
k 6 n число = Cm · am+1−k · bk + k
Cm · am−k · bk+1 =
k=0 k=0
| {z }
n! заменяем k на i − 1
Cnk = , (0 6 k 6 n) (2.2.249)
(n − k)! · k! m
X m+1
X
k
= Cm · am+1−k · bk + i−1
Cm · am+1−i · bi =
называется числом сочетаний из n по k. k=0 i=1
| {z }
заменяем i на k
Предложение 2.2.8. Справедливо следующее
m
X m+1
X
тождество k
= Cm · am+1−k · bk + k−1
Cm · am+1−k · bk =
k=0 k=1
Cnk + Cnk−1 = Cn+1
k
, (2.2.250) m
X
= am+1 + k
Cm · am+1−k · bk +
называемое тождеством Паскаля. k=1
162 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

m
X 1 1 1 11
k−1 4) n+1 + n+2 + ... + 2n > 24
+ Cm · am+1−k · bk + bm+1 = Pn 1 n
k=1 5) k=1 (4k−3)·(4k+1) = 4n+1
Xm Qn  
1 n+2
= am+1 + (C k + C k−1 ) ·am+1−k · bk + bm+1 = 6) k=1 1− (k+1)2 = 2n+2
| m {z m }
k=1
k 7) 1 · 22 + 2 · 32 + ... + (n − 1) · n2 =
k
Cn+1 , n·(n2 −1)·(3n+2)
по тождеству 12 (n > 2),
Паскаля (2.2.250) n P2n−1 1
8) 2 < k=0 k < n.
m
X
= am+1 + k
Cm+1 · am+1−k · bk + bm+1 = ⊲⊲ 2.2.12. Докажите методом математической
k=1 индукции9 (используя бином Ньютона):
m+1
X 1 3 5 2n−1 √ 1
= k
Cm+1 · am+1−k · bk 1)2 · 4 · 6 · ... 2n 6 3n+1
√ Pn √
k=0 2) n < k=1 √1k < 2 n (n > 2).

⊲ 2.2.13. Докажите индукцией следующие тож-


⊲ 2.2.9. Сумма отрезка арифметической дества:
прогрессии. Докажите методом математиче- n
Y
ской индукции формулу: an = a, a ∈ R, n ∈ N (2.2.258)
n
X k=1
n · (n + 1) n
i= (2.2.253) Y
i=1
2 n! = k, n∈N (2.2.259)
k=1
⊲ 2.2.10. Докажите следующие тождества для m
Y
двойного факториала: (2m)!! = (2k), m ∈ Z+ (2.2.260)
k=1
n!! = n · (n − 2)!!, n>2 (2.2.254) m
Y
n! = n!! · (n − 1)!!, n ∈ N (2.2.255) (2m − 1)!! = (2k − 1), m∈N (2.2.261)
(2m)!! = 2m · m!, m ∈ Z+ (2.2.256) k=1

(2m − 1)! ⊲ 2.2.14. Покажите индукцией, что для любой


(2m − 1)!! = , m ∈ N. (2.2.257)
2m−1
· (m − 1)! последовательности чисел x1 , ..., xn выполняют-
ся соотношения:
⊲⊲ 2.2.11. Докажите методом математической
индукции: Xn Xn

2
xk 6 |xk |, (2.2.262)
1) 12 + 32 + ... + (2n − 1)2 = n(4n3 −1) k=1 k=1
1 1 1 Yn Yn
2) n+1 + n+2 + ... + 3n+1 >1
Pn 2
xk = |xk | (2.2.263)
3) k=1 k(3k − 1) = n (n + 1) k=1 k=1

Принцип Архимеда.

Теорема 2.2.9. Множество натуральных чисел N не ограничено сверху.

Доказательство. Предположим, что наоборот, N ограничено сверху. Тогда по теореме 2.1.23, N


должно иметь точную верхнюю грань:

∃ sup N = B ∈ R (2.2.264)

Поскольку B – точная верхняя грань (то есть наименьшее из чисел, ограничивающих N сверху),
число B − 1 не может ограничивать N сверху. Значит, существует какое-то n ∈ N, большее чем B − 1:
n > B − 1. То есть
B <n+1
Это означает, что B не может ограничивать N сверху (потому что B меньше некоторого числа n+1 ∈
N). Таким образом, мы получили противоречие с (2.2.264). Оно означает, что наше предположение
о том, что N ограничено сверху неверно.
9 Функция

f (x) = x будет определена только в следующей главе, на с.280, и здесь мы рассчитываем школьные
знания читателя.
§ 2. Натуральные, целые и рациональные числа 163

Из теоремы 2.2.9 следует важный вывод:

Теорема 2.2.10 (принцип Архимеда). Для любого вещественного числа C ∈ R найдется нату-
ральное число n ∈ N такое, что n > C.

Доказательство. Зафиксируем число C ∈ R, и предположим противное, то есть что для него не


существует такого n ∈ N, чтобы n > C. Тогда для всякого n ∈ N мы получаем n 6 C. Иными слова-
ми, C ограничивает N сверху. Этого не может быть по теореме 2.2.9. Значит, наше предположение
неверно.

Конечные множества в R и N.

Теорема 2.2.11. Всякое конечное множество X в R обладает минимумом и максимумом.

Доказательство. Покажем, что X имеет минимум (существование максимума доказывается по


аналогии). Проведем индукцию по мощности card X (числу элементов) множества X.
1. При card X = 1 мы получаем, что X состоит всего из одного элемента a, и ясно, что a будет
минимумом X:
a = min X
2. Предположим, что мы доказали наше утверждение для всех множеств X мощности card X = k,
где k ∈ N.
3. Пусть X – множество мощности card X = k + 1. Рассмотрим какую-нибудь биекцию f :
{1, ..., k + 1} → X и обозначим K = {f (i); i ∈ {1, ..., k}}. Тогда:

X = K ∪ {f (k + 1)},

Рассмотрим число
a = (min K) ∧ f (k + 1)
(напомним, что мы определили операцию ∧ формулой (2.1.203)). Это число a будет минимумом
множества X, потому что, во-первых,

a = (min K) ∧ f (k + 1) = min{min K, f (k + 1)}


a = min K ∨ a = f (k + 1)

a∈K ∨ a ∈ {f (k + 1)}

a ∈ K ∪ {f (k + 1)} = X
И, во-вторых,
a = (min K) ∧ f (k + 1) = min{min K, f (k + 1)}

a 6 min K & a 6 f (k + 1)

a6K & a 6 f (k + 1)

a 6 K ∪ {f (k + 1)} = X

Теорема 2.2.12. Множество A в N конечно тогда и только тогда, когда оно ограничено:

card A < ∞ ⇐⇒ ∃N ∈ N A ⊆ {1, ..., N }


164 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Доказательство. Первая половина этого утверждение следует из теоремы 2.2.11: если множество
A конечно, то оно либо пусто, и тогда ограничено, либо непусто, и тогда оно является образом R(f )
некоторого инъективного отображения f : {1, ..., n} → N. Отсюда по теореме 2.2.11 получаем, что
A имеет максимум, и поэтому ограничено сверху. С другой стороны, оно всегда ограничено снизу
единицей 1, и значит оно просто ограничено.
Докажем, что, наоборот, если A ограничено, то оно конечно. Опять, если A пусто, то доказывать
ничего не нужно, поэтому мы будем считать, что A 6= ∅. Тогда, положив

a1 = min A,

можно определить отображение G, которое некоторым последовательностям {a1 , ..., ak } ⊆ A будет


ставить в соответствие число

G(a1 , ..., ak ) = min A \ {a1 , ..., ak }

(если множество A\{a1 , ..., ak } непусто, то такое число существует по свойству 4◦ на с.154). По теоре-
ме 2.2.7 об определениях частной индукцией, отображение G определяет некую последовательность
{an } ⊆ A, удовлетворяющую условию

G(a1 , ..., an ) = an+1 ,

для всех n, меньших длины N этой последовательности.


1. Докажем, что она строго возрастает:

∀n < N an < an+1 (2.2.265)

Действительно, во-первых,
{1, ..., an−1 } ⊆ {1, ..., an−1 , an }

A \ {1, ..., an−1 } ⊇ A \ {1, ..., an−1 , an }
⇓ (2.1.200)

an = min A \ {1, ..., an−1 } 6


6 min A \ {1, ..., an−1 , an } = an+1

И, во-вторых, если бы оказалось, что an = an+1 , то мы получили бы

an = an+1 = min A \ {1, ..., an }


an ∈ A \ {1, ..., an },
что невозможно.
2. Из (2.2.265) следует условие
∀n n 6 an (2.2.266)
Его можно доказать индукцией. При n = 1 оно очевидно:

1 6 a1 .

А если оно верно при n = k


k 6 ak ,
то из этого следует
k 6 ak < ak+1
⇓ (2.2.219)

k + 1 6 ak+1
То есть (2.2.266) будет верно и при n = k + 1.
§ 2. Натуральные, целые и рациональные числа 165

3. Заметим теперь, что поскольку A ограничено, существует c ∈ R такое что

A6c

По принципу Архимеда (теорема 2.2.10), должно существовать m ∈ N такое что

A6c<m

Отсюда следует, что последовательность {an } конечна. Действительно, если бы она была бесконеч-
ной, то мы получили бы, что ее элемент с номером m лежит в A

am ∈ A

А с другой стороны, это невозможно, потому что

A < m 6 am

4. Итак, мы имеем конечную последовательность {an } ⊆ A, то есть отображение

f : {1, ..., N } → A, f (n) = an

где N ∈ N – длина последовательности. Это отображение инъективно, потому что

m<n


f (m) = am < an = f (n)

f (m) 6= f (n)
Нам остается проверить, что оно сюръективно. Действительно, если бы оказалось, что

A \ {a1 , ..., aN } 6= ∅,

то положив
aN +1 = min A \ {a1 , ..., aN }
мы получили бы, что N не может быть длиной последовательности {an }, определяемой отображе-
нием G по теореме 2.2.7:

∃{a2 , ..., aN +1 } ⊆ A ∀k ∈ {2, ..., N + 1} G(a1 , ..., ak−1 ) = ak


n o
N + 1 6 sup n ∈ N : ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak


n o
6 sup n ∈ N :
N= ∃{a2 , ..., an } ⊆ A ∀k ∈ {2, ..., n} G(a1 , ..., ak−1 ) = ak

(b) Целые числа Z


Определение множества целых чисел.
• Число x ∈ R называется целым, если оно
– либо натуральное,
x∈N
– либо равно нулю
x=0
166 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

– либо противоположно натуральному

x ∈ −N

(то есть x имеет вид x = −n, где n ∈ N).


В соответствии с этим, множество целых чисел, обозначаемое символом Z, описывается
формулой
Z = (−N) ∪ {0} ∪ N (2.2.267)
Теорема 2.2.13. Множество целых чисел Z замкнуто относительно сложения, вычитания и
умножения: если m, n ∈ Z, то m + n ∈ Z, m − n ∈ Z и m · n ∈ Z.
Доказательство. 1. Пусть m, n ∈ Z. Покажем сначала, что m + n ∈ Z. Для этого придется рас-
смотреть несколько случаев.
Во-первых, заметим, что если какое-то из этих чисел равно нулю, например, m = 0, то их сумма
очевидно, принадлежит Z: m + n = n ∈ Z. Поэтому будем считать, что оба они отличны от нуля:
m 6= 0, n 6= 0.
Далее рассматриваем три случая:
— если m > 0 и n > 0, то m, n ∈ N, и по теореме 2.2.3 получаем m + n ∈ N ⊆ Z;
— если m < 0 и n < 0, то m, n ∈ −N, то есть −m ∈ N и −n ∈ N и опять по теореме 2.2.3
получаем −m − n ∈ N, откуда m + n ∈ −N ⊆ Z;
— если m < 0 и n > 0, то m ∈ −N, n ∈ N, то есть −m = k ∈ N и n ∈ N; здесь нужно
рассмотреть три частных случая:
— если k < n, то по свойству 7◦ на с. 154, n + m = n − k ∈ N ⊆ Z;
— если k = n, то n + m = n − k = 0 ∈ Z;
— если k > n, то по свойству 7◦ на с. 154, −(n + m) = k − n ∈ N, откуда n + m ∈
−N ⊆ Z;
2. Когда доказано, что Z замкнуто относительно сложения, замкнутость относительно вычита-
ния становится очевидной, потому что из самого определения Z ясно, что если n ∈ Z, то −n ∈ Z.
Поэтому при m, n ∈ Z получаем −n ∈ Z и можно применить уже доказанную замкнутость относи-
тельно сложения: m − n = m + (−n) ∈ Z.
3. Замкнутость относительно умножения доказывается так же, как и относительно сложения.
Пусть m, n ∈ Z. Чтобы убедиться, что m · n ∈ Z, нужно рассмотреть несколько случаев.
Во-первых, опять же нужно заметить, что если какое-то из этих чисел равно нулю, например,
m = 0, то их сумма очевидно, принадлежит Z: m · n = 0 ∈ Z. Поэтому будем считать, что оба они
отличны от нуля: m 6= 0, n 6= 0.
Далее рассматриваем три случая:
— если m > 0 и n > 0, то m, n ∈ N, и по теореме 2.2.3 получаем m · n ∈ N ⊆ Z;
— если m < 0 и n < 0, то m, n ∈ −N, то есть −m ∈ N и −n ∈ N и опять по теореме 2.2.3
получаем m · n = (−m) · (−n) ∈ N ⊆ Z;
— если m < 0 и n > 0, то m ∈ −N, n ∈ N, то есть −m ∈ N и n ∈ N; опять по теореме 2.2.3
получаем −m · n = (−m) · n ∈ −N, откуда m · n ∈ −N ⊆ Z.

Теорема 2.2.14. Для любых m, n ∈ Z

m<n+1 =⇒ m6n (2.2.268)

Доказательство. Здесь нужно рассмотреть несколько случаев.


1. Если m ∈ N, то 1 6 m, поэтому 0 6 m − 1 < n, и, поскольку n ∈ Z = (−N) ∪ {0} ∪ N, такое
возможно только если n ∈ N. Мы получаем, что оба числа m и n лежат в N, а этот случай уже
рассмотрен в свойстве 5◦ на с.154.
2. Если m = 0, то 0 < n + 1, то есть −1 < n, поэтому либо n = 0, и тогда m = 0 6 0 = n, либо
n ∈ N, и тогда n > 1 > 0, откуда m = 0 6 n.
3. Если m < 0, то m ∈ −N, и приходится рассматривать несколько частных случаев.
— если n ∈ N, то мы получаем m 6 0 6 n.
— если n = 0, то m 6 0 = n.
§ 2. Натуральные, целые и рациональные числа 167

— если n < 0, то n ∈ −N, и мы получаем

m<n+1 =⇒ −m > −n − 1 =⇒ −n < −m + 1;

поскольку при этом −m ∈ N и −n ∈ N, мы опять попадаем в ситуацию, описанную в


свойстве 5◦ на с.154, и получаем, что −n 6 −m. То есть m 6 n.

Следствие 2.2.15. Если m, n ∈ Z, причем n 6 m < n + 1, то m = n.


Доказательство. Из (2.2.268) получаем: m < n + 1 =⇒ m 6 n, и вместе с неравенством n 6 m это
означает, что m = n.
Теорема 2.2.16. Любое непустое ограниченное снизу (сверху) множество целых чисел E ⊆ Z
имеет минимальный (максимальный) элемент.

∃ min E (max E)

причем
n<E =⇒ n < min E (E < n =⇒ max E < n) (2.2.269)
Доказательство. Пусть E ограничено сверху. Тогда по принципу Архимеда 2.2.10, найдется нату-
ральное число n ∈ N ограничивающее E сверху. Теперь получаем:

E<n

−n < −E

0 < −E + n (причем −E + n ⊆ Z, по теореме 2.2.13)
⇓ (2.2.267)

−E + n ⊆ N
⇓ (свойство 5◦ на с. 154)
∃ min(−E + n) = min(−E) + n > 0
⇓ (свойство 2◦ (i) на с. 147)
∃ min(−E) > −n
⇓ (свойство 2◦ (ii) на с. 147)
∃ max E = − min(−E) < n

Степени с целым показателем. Напомним, • Отображение (a, n) 7→ an называется сте-


что на странице 159 мы уже определили степень пенным отображением с целым показателем.
an с показателем n ∈ Z+ индуктивной формулой Его свойства удобно собрать в следующей
(2.2.235): теореме.
a0 = 1, an+1 = an · a, n ∈ Z+ (2.2.235) Теорема 2.2.17 (о степенном отображении).
Отображение
(при этом a может быть любым). Для целых от-
рицательных показателей степень определяется (a, n) 7→ an ,
формулой обладает следующими свойствами:
 n
n 1 Z0 : оно определено в следующих двух си-
a−n := |{z}
a−1 = , n ∈ N, (2.2.270) туациях:
a
обратный
элемент — при a 6= 0 и n ∈ Z,
для a
из аксиомы — при a = 0 и n ∈ Z+ ,
A9
или, что то же самое, в следующих
(в этом случае a должно быть ненулевым). двух:
168 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

— при n ∈ Z+ и тогда a ∈ R, — если 0 < a < 1, то потенцирование


— при n ∈ −N и тогда a 6= 0; с основанием a меняет знак нера-
венства:
Z1 : следующие две группы тождеств вы-
полняются всякий раз, когда обе ча- m<n =⇒ am > an (2.2.283)
сти тождества определены:
Доказательство. 1. Начнем с показательных за-
— показательные законы:
конов. Формула (2.2.271) есть просто часть опре-
a0 = 1, (2.2.271) деления (2.2.235) степени an с неотрицатель-
1 ным показателем. Формула (2.2.272) доказыва-
a−n = , (2.2.272) ется рассмотрением трех случаев: если n ∈ N, то
an
am+n = am · an ; (2.2.273) 1
a−n = (2.2.270) =
— степенные законы: an
если n = 0, то
1n = 1, (2.2.274)
 n
1 1 a−n = a0 = (2.2.271) = 1 =
= n, (2.2.275)
a a 1 1 1
(a · b)n = an · bn (2.2.276) = = (2.2.271) = 0 = n
1 a a

Z2 : тождество, называемое накопи- а если n ∈ −N, то есть n = −k, k ∈ N, то по-


тельным законом, скольку (2.2.272) уже доказано для положитель-
ных степеней, должно выполняться a−k = a1k ,
(am )n = am·n (2.2.277) 1
или, что то же самое, a−k = ak , поэтому
выполняется для следующих значений
1 1
переменных: a−n = ak = =
a−k an
— при a 6= 0 и m, n ∈ Z,
— при a = 0 и m, n ∈ Z+ ; Для доказательства (2.2.273) нам понадобит-
ся следующее вспомогательное тождество:
Z3 : для нулевого основания степень, в
случаях, когда она определена, описы- am+1 = am · a, m∈Z (2.2.284)
вается формулой
( При m ∈ Z+ оно является просто частью опреде-
n 1, n = 0 ления (2.2.235), поэтому для его доказательства
0 = (2.2.278)
0, n > 0 нам нужно лишь проверить, что оно верно при
m ∈ −N, то есть при m = −k, где k ∈ N:
а для положительных оснований
выполняется следующее условие со- a1−k = a−k · a, k∈N
хранения знака:
Если сделать замену k − 1 = n, n ∈ Z+ , то мы
a>0 ⇒ an > 0 (n ∈ Z) (2.2.279) получим эквивалентную формулу
Z4 : для положительных оснований выпол-
няются следующие условия моно- a−n = a−n−1 · a, n ∈ Z+
тонности:
которую можно переписать так:
— если n > 0, то возведение в сте-
пень n сохраняет знак неравен- a−n
= a−n−1 , n ∈ Z+
ства: a
0<x<y =⇒ xn < y n (2.2.280) и доказывается это цепочкой:

— если n < 0, то возведение в сте- 1 1


пень n меняет знак неравенства: a−n−1 = (2.2.272) = = (2.2.235) = n =
an+1 a ·a
0<x<y =⇒ xn > y n (2.2.281) 1 1 a−n
= (2.1.43) = n · = (2.2.272) =
a a a
— если a > 1, то потенцирование с
основанием a сохраняет знак нера- Докажем теперь (2.2.273). Зафиксируем m ∈
венства: Z. Для n ∈ Z+ это доказывается индукцией:

m<n =⇒ am < an (2.2.282) am+0 = am = am · a = am · a0


§ 2. Натуральные, целые и рациональные числа 169

(2.2.284)  n  −k
am+n+1 m+n m n 1 1
= |a {z } ·a = a · a · a = = = (2.2.272) =
a a

=
am · an , 1 1 1 1
посылка =  = 1 = (2.2.272) = −k = n
индукции 1 k a a
ak
(2.2.284)
| a {z }
= am · an+1 здесь применяется
(2.2.275),
уже доказанное
Для n ∈ −N, то есть n = −k, где k ∈ N, формула для k > 0
(2.2.273) переписывается так:
Ну и формула (2.2.276) тоже доказывается
m−k m −k am сначала для n ∈ Z+ индукцией:
a =a ·a = (2.2.272) = k
a
(2.2.235) (2.2.235)
то есть так: (a · b)0 = 1 = 1·1 = a0 · b 0 ,
am−k · ak = am (2.2.235)
(a · b)n+1 = (a · b)n·(a · b) = an · bn · a · b =
| {z }
Заменив m − k = l, мы получим:

=
an · bn ,
al · ak = ak+l , l ∈ Z, k ∈ N посылка
индукции

Это просто иначе записанное равенство (2.2.273), (2.2.235)


= an · a · bn · b = an+1 · bn+1
в котором одна из степеней неотрицательна, и
для этого случая мы его уже доказали. А затем для n = −k, k ∈ N, получается как след-
2. Проверим степенные законы. Они все до- ствие из уже доказанного:
казываются сначала для неотрицательных степе-
ней индукцией, а затем для отрицательных сте- (a · b)n = (a · b)−k = (2.2.272) =
пеней выводятся из уже доказанных формул. На- 1 1 (2.1.43) 1 1
пример, формулу (2.2.274) нужно доказать сна- = = k k = · =
(a · b)k a ·b ak b k
чала для n ∈ Z+ индукцией: | {z }
здесь применяется
(2.2.276),
10 = (2.2.235) = 1, уже доказанное
1n+1 = (2.2.235) = |{z}
1n ·1 = 1 · 1 = 1 для k > 0

= (2.2.272) = a−k · b−k = an · bn


=

1,
посылка 3. Докажем накопительный закон (2.2.277).
индукции
Зафиксируем m ∈ Z и проведем сначала индук-
А отсюда уже становится ясно, что она верна и цию по n ∈ Z+ .
при n ∈ −N, то есть при n = −k, k ∈ N: (2.2.235) (2.2.235)
(am )0 = 1 = a0 = a0·m ,

−1 k
1n = 1−k = (2.2.270) = 1 = (am )n+1
(2.2.235)
= (am )n ·am = am·n · am =
k | {z }
= (2.1.18) = 1| {z
= 1}
=

для k > 0 am·n ,


уже посылка
доказано индукции
(2.2.235)
Точно так же формула (2.2.275) доказывается = am·n+m = am·(n+1)
сначала для n ∈ Z+ индукцией: Это доказывает формулу (2.2.277) для случая
 0 m ∈ Z и n ∈ Z+ . Если же n ∈ −N, то есть n = k,
1 (2.2.235) 1 (2.2.235) 1
= 1= = , k ∈ N, то мы получаем:
a 1 a0
 n+1  n здесь применяется
1 (2.2.235) 1 1 1 1 (2.1.43)
= · = n· = (2.2.277),
a a a a a уже доказанное
| {z } для k > 0
z }| {
=

1
an , m n m −k (2.2.272) 1 1 (2.2.272)
посылка (a ) = (a ) = = m·k =
индукции (am )k a
1 (2.2.235) 1 = a−m·k = am·(−k) = am·n
= n
=
a ·a an+1
4. Формулу (2.2.278) при n = 0 можно счи-
А затем для n = −k, k ∈ N мы получаем: тать следствием (2.2.271) (или можно сказать
что раньше мы отмечали это утверждение как
170 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

равенство (4.1.14)). Затем для n = 1 ее мож- ⇓ (2.2.280)


но вывести из (2.2.235) (или, опять же, мож-
xk < y k
но заявить, что мы уже этот факт отмечали в
(2.2.233)): ⇓ (2.1.31)

1 1
01 = 00 · 0 = 1 · 0 = 0 xn = x−k = k
> k = y −k = y n
x y
А для остальных n ∈ N она доказывается индук- 6. Импликацию (2.2.282) можно доказать, на-
цией: пример, с помощью следующего вспомогательно-
го утверждения:
(2.2.235)
0n+1 = 0n ·0 = 0
|{z}
a>1 ⇒ ∀n ∈ N an > 1 (2.2.285)
=
0,
посылка Оно доказывается индукцией: подставив n = 1
индукции
мы получим тавтологию,
Условие сохранения знака (2.2.279) для n ∈ Z+ a>1 ⇒ a1 = a > 1
доказывается индукцией:
а если оно верно при каком-то n = k
(2.2.235)
a0 = 1 > 0,
(2.1.23) a>1 ⇒ ak > 1
n+1 (2.2.235) n
a = a · |{z}
|{z} a > 0
то при n = k + 1 мы получим
<

<

0, 0
посылка (2.1.36)
индукции an = ak+1 = |{z}
ak · |{z}
a > ak > 1

<

<
А после этого для n ∈ −N, то есть для n = k, 0 1
k ∈ N, мы получаем:
Когда (2.2.285) доказано, (2.2.282) становится его
ak > 0 (уже доказано) следствием – при a > 1 получаем:
⇓ (2.1.29)
1 m<n
−k (2.2.272)
an = a = >0
ak ⇓
5. Импликация (2.2.280) доказывается индук- n−m>0
цией по n ∈ N. При n = 1 она становится тавто-
логией (то есть в ней следствие является частью ⇓ (2.2.285)
посылки, и поэтому утверждение будет очевид- a n−m
>1
но настолько, что в обычной речи это звучало бы
глупо): ⇓
0 < x < y =⇒ x < y an−m − 1 > 0
Предположим, что мы доказали (2.2.280) для ⇓
какого-то n = k
(2.1.23)
k k
an − am = am (an−m − 1) > 0
0<x<y =⇒ x <y

Тогда для n = k + 1 мы получим: a m
< an
xk < y k , x<y Наконец, из (2.2.282) выводится (2.2.283):
(2.1.33) ⇓ ⇓ (2.1.33)
x · xk < x · y k , x · yk < y · yk m<n 0<a<1
| {z } ⇓ ⇓ (2.1.35)
1
−m > −n >1
⇓ | {z a }
n k+1
x =x = x · x < x · y k < y · y k = y k+1 = y n
k

Когда (2.2.280) доказано, (2.2.281) становится его  −m  −n
m 1 (2.2.282) 1
следствием: если n < 0, то есть n = −k, k > 0, то a = > = an
a a
0<x<y
§ 2. Натуральные, целые и рациональные числа 171

Целая и дробная части числа.


• Целой частью вещественного числа x ∈ R называется целое число [x] ∈ Z, определяемое
правилом
[x] = max{n ∈ Z : n 6 x}, (2.2.286)
то есть, максимум множества E = {n ∈ Z : n 6 x} целых чисел, не превосходящих x (по
теореме 2.2.16, такой максимум существует).

Свойства целой части:


1◦ . Целая часть числа x ∈ [0; 1) равна нулю:

x ∈ [0; 1) =⇒ [x] = 0 (2.2.287)

2◦ . Для любого x ∈ R справедливо двойное неравенство

[x] 6 x < [x] + 1 (2.2.288)

3◦ . При сдвиге на целое число целая часть сдвигается на это число:

[x + m] = [x] + m, x ∈ R, m ∈ Z (2.2.289)

4◦ . Тождественность на целых числах: если x ∈ Z, то [x] = x.



5 . Монотонность: если x, y ∈ R, то

x6y =⇒ [x] 6 [y] (2.2.290)

6◦ . Сохранение двойных неравенств с целыми концами: если m, n ∈ Z и x ∈ R, то

m6x<n =⇒ m 6 [x] < n (2.2.291)

Доказательство. 1. Если x ∈ [0; 1), то с одной стороны,

0 ∈ {n ∈ Z : n 6 x} =⇒ 0 6 max{n ∈ Z : n 6 x} = [x]

а с другой –
(2.2.269)
{n ∈ Z : n 6 x} 6 x < 1 =⇒ [x] = max{n ∈ Z : n 6 x} < 1
То есть 0 6 [x] < 1. По следствию 2.2.15 это означает, что [x] = 0.
2. Обозначим E = {n ∈ Z : n 6 x}. Тогда, во-первых,

{n ∈ Z : n 6 x} 6 x =⇒ [x] = max{n ∈ Z : n 6 x} 6 x

и, во-вторых, если бы [x] + 1 6 x, то мы получили бы цепочку

[x] + 1 6 x =⇒ [x] + 1 ∈ E =⇒ [x] + 1 6 max E = [x]

Поскольку последнее невозможно, это означает, что x < [x] + 1.


3. Если x ∈ Z, то x ∈ {n ∈ Z : n 6 x} 6 x, и поэтому max{n ∈ Z : n 6 x} = x.
4. При x ∈ R, m ∈ Z получаем:

[x + m] = max{n ∈ Z : n 6 x + m} = max{n ∈ Z : n − m 6 x} =
= max{k + m : k ∈ Z & k 6 x} = max{k ∈ Z : k 6 x} + m

5. Если x 6 y, то {n ∈ Z : n 6 x} ⊆ {n ∈ Z : n 6 y}, и поэтому [x] = max{n ∈ Z : n 6 x} 6


max{n ∈ Z : n 6 y} = [y].
6. Если m 6 x, то по уже доказанным свойствам 2◦ и 3◦ , m = [m] 6 [x]. А если x < n, то для
всякого k ∈ Z условие k 6 x автоматически влечет условие k < n а это, в силу (2.2.268), влечет
условие k 6 n − 1. Отсюда

[x] = max{k ∈ Z : k 6 x} 6 max{k ∈ Z : k 6 n − 1} = n − 1 < n


172 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

• Дробной частью {x} вещественного числа x ∈ R называется разность между x и его целой
частью [x]:
{x} := x − [x] (2.2.292)

Свойства дробной части:


1◦ . Дробная часть числа x ∈ [0; 1) совпадает с x:

x ∈ [0; 1) =⇒ {x} = x (2.2.293)

2◦ . Для любого x ∈ R справедливо двойное неравенство

0 6 {x} < 1 (2.2.294)

3◦ . При сдвиге на целое число дробная часть не меняется:

{x + m} = {x}, x ∈ R, m ∈ Z (2.2.295)

Доказательство. 1. Если x ∈ [0; 1), то в силу (2.2.287), [x] = 0, поэтому {x} = x − 0 = x.


2. Неравенство (2.2.294) следует сразу из неравенства (2.2.288):

[x] 6 x < [x] + 1 =⇒ 0 6 x − [x] < 1

3. А тождество (2.2.295) – из (2.2.289):

{x + m} = (x + m) − [x + m] = (x + m) − ([x] + m) = x − [x] = {x}

Десятичная запись целых чисел. Как из- вым


вестно, целые неотрицательные числа n ∈ Z+ an 6= 0, (2.2.297)
(мы определили это множество выше формулой
и тогда представление x в виде (2.2.296) стано-
(2.2.226)) можно записывать цифрами 0, 1, 2, 3,
вится единственным.
4, 5, 6, 7, 8, 9. Например, записи 487 и 1204 озна-
чают числа • Формула (2.2.296) называется десятичным
представлением числа x ∈ N, а последова-
487 = 7 + 8 · 10 + 4 · 102 , тельность цифр {an , an−1 , ..., a1 , a0 } – после-
1204 = 4 + 0 · 10 + 2 · 102 + 1 · 103 . довательностью коэффициентов этого пред-
ставления. Коротко эту формулу принято за-
Тот факт, что любое число n ∈ Z+ можно за- писывать в виде
писать таким образом, и что такая запись одно-
значно определяет число (то есть не может слу- x = an ...a1 a0
читься, чтобы разные числа записывались оди-
наково), следует из принципа Архимеда 2.2.10, и такая запись называется десятичной запи-
принципа математической индукции и свойств сью числа x ∈ N. Например, запись
отображения x 7→ [x]. Здесь мы объясним, по-
x = 1825
чему это так.
расшифровывается как равенство
Теорема 2.2.18. Для всякого числа x ∈ N най-
дется число n ∈ Z+ и конечная последователь- x = 1 · 103 + 8 · 102 + 2 · 101 + 5 · 101
ность чисел a0 , a1 , ..., an ∈ {0; 1; 2; ...; 9} такая,
что • Если x ∈ −N, то по теореме 2.2.18 число
−x ∈ N представимо в виде
x = a0 + a1 · 10 + a2 · 102 + ... + an · 10n =
Xn
Xn
k −x = ak · 10k
= ak · 10 (2.2.296)
k=0
k=0
и для этого используется запись
Числа n и ai в этой формуле можно выбрать
так, чтобы старший коэффициент был ненуле- x = −an ...a1 a0
§ 2. Натуральные, целые и рациональные числа 173
h x i
называемая десятичной записью числа x ∈ 06 < 10
n
−N. Например, запись | 10
{z }
a
x = −247
И, во-вторых, по определению целой части
расшифровывается как равенство (2.2.288),
h x i x h x i
−x = 2 · 102 + 4 · 101 + 7 · 101 n
6 n
< n
+1
| 10
{z } 10 | 10 {z }
или, что эквивалентно, как равенство a a+1

x = −2 · 102 − 4 · 101 − 7 · 101 ⇓

Для доказательства теоремы 2.2.18 нам пона- a · 10n 6 x < (a + 1) · 10n


добятся три леммы.

Лемма 2.2.19. Для всякого x ∈ R найдется на-


туральное число n ∈ Z+ такое, что
Лемма 2.2.21. Если число x представлено в
x < 10n+1 (2.2.298) виде (2.2.296), то старший коэффициент an в
этой формуле вычисляется по формуле
Доказательство. Рассмотрим число x−19 . По h x i
принципу Архимеда 2.2.10, для него найдется
x−1 an = (2.2.300)
n ∈ N такое, что 9 6 n. Отсюда получаем 10n
следствия:
x−1 Доказательство. Здесь применяется формула
<n+1
9 (2.2.246) для суммы первых членов геометриче-
⇓ ской прогрессии:

x − 1 < (n + 1) · 9 n−1
X n−1
X n−1
X
k k
ak ·10 6 9 · 10 = 9 · 10k =
⇓ |{z}
k=0 k=0 k=0
>

x < 1 + (n + 1) · 9 6 (1 + 9)n+1 = 10n+1 9



здесь мы применяем 10n − 1 10n − 1
неравенство Бернулли
= (2.2.246) = 9 · =9· =
10 − 1 9
(2.2.242)
= 10n − 1 < 10n

Лемма 2.2.20. Если x ∈ R и выполняется нера- ⇓


венство
n−1
0 6 x < 10n+1 , 1 X
06 · ak · 10k < 1
10n
то найдется число a ∈ {0; 1; 2; ...; 9} такое, что k=0

a · 10n 6 x < (a + 1) · 10n (2.2.299) ⇓

Доказательство. Обозначим через a целую


!
часть числа 10xn : x 1
n−1
X
k n
h x i n
= n· ak · 10 + an · 10 =
10 10
k=0
a=
10n n−1
1 X
= · ak · 10k + an
Тогда, во-первых, из свойства целой части со- 10n |{z}
k=0
хранять неравенства с целыми концами (2.2.291) | {z }

следует, что a ∈ {0; 1; 2; ...; 9}, Z


[0, 1)
0 6 x < 10n+1


h x i
x = an
0 6 n < 10 10n
10
⇓ (2.2.291)
174 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Доказательство теоремы 2.2.18. Пусть x ∈ N. можно добиться, чтобы количество слагаемых в


Применяя лемму 2.2.19, можно выбрать n ∈ этих суммах стало одинаковым:
Z+ так, чтобы выполнялось (2.2.298), то есть,
Xn n
X
(2.2.301):
n+1 ak · 10k = bk · 10k (2.2.303)
0 6 x < 10 , (2.2.301)
k=0 k=0
1. Покажем, что при выполнении этого неравен-
ства x можно представить в виде (2.2.296). Нам нужно проверить, что тогда
Это доказывается индукцией по n.
ak = b k , k = 0, ..., n. (2.2.304)
1) При n = 0 условие (2.2.301) превращает-
ся в 0 6 x < 10, и формула (2.2.296) становится Это также делается индукцией по n.
верна, если положить a = x. 1) Если n = 0, то (2.2.303) сразу превращает-
2) Предположим, что наше утверждение вер- ся в (2.2.304): a = b .
0 0
но при n = m − 1: 2) Предполагаем, что это верно при n = m,
m−1
X m
X m
X
0 6 x < 10m ⇒ x= ak · 10k (2.2.302)
k=0
ak · 10k = bk · 10k ⇒
k=0 k=0
и покажем, что тогда оно верно и при n = m:
⇒ ∀k = 0, ..., m ak = b k (2.2.305)
m
X
0 6 x < 10m+1 ⇒ x= ak · 10k тогда для n = m + 1 получаем:
k=0
m+1
X m+1
X
Действительно, ak · 10k = bk · 10k (2.2.306)
k=0 k=0
0 6 x < 10m+1
⇓ (лемма 2.2.21)
⇓ лемма 2.2.20 "m+1 # "m+1 #
X X
k k
am+1 = ak · 10 = bk · 10 = bm+1
∃am ∈ {0; 1; 2; ...; 9} : k=0 k=0
am · 10m 6 x < (am + 1) · 10m старшие слагаемые
!
в (2.2.306) равны,
⇓ и их можно
⇓ (вычитаем am · 10m ) отбросить
0 6 x − am · 10m < 10m m
X m
X
  ak · 10k = bk · 10k
применяем посылку
⇓ индукции: (2.2.302) k=0 k=0
m−1
 
X ⇓ применяем посылку
m k
x − am · 10 = ak · 10 индукции: (2.2.305)
k=0
  ∀k = 0, ..., m ak = bk
⇓ переносим am · 10m  
в правую часть а при k = m + 1 равенство
ak = bk уже доказано.
m−1
X m
X
x= ak · 10k + am · 10m = 3. Остается убедиться, что если x 6= 0, то n
ak · 10k
k=0 k=0 можно выбрать так, чтобы an 6= 0. Для этого
можно рассмотреть множество E, состоящее из
2. Мы доказали, что x представимо в виде
тех n ∈ Z+ , для которых справедливо представ-
(2.2.296). Теперь убедимся, что такое представ-
ление (2.2.296) и найти его минимум n = min E.
ление единственно, с точностью до добавления
Тогда an 6= 0, потому что иначе мы получили бы,
или исключения нулевых слагаемых (то есть сла-
что старшее слагаемое в (2.2.296) можно выбро-
гаемых со старшими коэффициентами an = 0).
сить,
Пусть нам даны два разных представления:
n−1
X n−1
X
n
X l
X
x= ak · 10 k
и x= bk · 10 k x= ak · 10k + an · 10n = ak · 10k
| {z }
k=0 0 k=0
k=0 k=0

Добавив слагаемые с нулевыми коэффициентами и это означало бы, что n − 1 ∈ E (то есть n не
(то есть, взяв дополнительные ai = 0 или bi = 0), может быть минимумом E).
§ 2. Натуральные, целые и рациональные числа 175

(c) Деление с остатком и делимость


Деление с остатком.
Теорема 2.2.22 (о делении с остатком). Для любых двух чисел a ∈ R и b > 0 существуют и
единственны числа q ∈ Z и r ∈ [0; b) такие, что

a = b · q + r, (2.2.307)

Если вдобавок a ∈ Z и b ∈ N, то r ∈ Z+ .
Доказательство. Числа q и r можно определить формулами
hai nao
q= , r =b·
b b
Тогда по определению целой части q ∈ Z, а по определению дробной части, rb ∈ [0; 1), и значит
r ∈ [0, b). Нам остается доказать, что такие числа q и r единственны. Предположим, что существуют
два разложения одного числа a:
a = b · q + r = b · q̃ + r̃
Тогда
r r̃
= q̃ + q+
b b
Из этого следует, что q = q̃, потому что если бы это было не так, то есть например q < q̃, то, по
свойству (2.2.268), мы получили бы, что q + 1 6 q̃, и поскольку rb < 1,

r r̃
q+ < q + 1 6 q̃ 6 q̃ +
b b
А с другой стороны, равенство rb = q̃ − q + r̃b означает, что rb и q̃ − q + r̃b отличаются на целое число
q̃ − q, поэтому  
r nro r̃ r̃
= = q̃ − q + = (2.2.295) = ,
b b b b
и отсюда r = r̃.
Остается заметить, что поскольку q ∈ Z, то при a ∈ Z и b ∈ N число r = a − b · q должно быть
целым.

Делимость в множестве N натуральных ⋄ 2.2.15. Следующие утверждения можно про-


чисел. верить, например, с помощью калькулятора:
• Говорят что число a ∈ N делится на число 6 ... 2, 123 ... 3, 430095 ... 541
b ∈ N, и записывают это формулой

a ... b, Свойства отношения делимости:

если найдется число m ∈ N такое, что 1◦ . Всегда x ... 1 и x ... x.


2◦ . Если x ... y, то (a · x) ... y для любого
a = m · b. a ∈ N.
В этом случае 3◦ . Если x ... y и y ... z, то x ... z.
4◦ . Если x ... a и y ... a, то (x + y) ... a, а если
— число a называется кратным числа b,
вдобавок x > y, то (x − y) ... a.
— число b называется делителем числа a.
5◦ . Если x ... y, то x > y.
• Если A ⊆ N и B ⊆ N – множества, то записи
Доказательство этих свойств мы оставляем
A ... b, a ... B, A ... B читателю.
⊲⊲ 2.2.16. Докажите методом математической
означают соответственно, что a ... b выполня- 10
ется для любого a ∈ A, для любого b ∈ B, и индукции :
для любых a ∈ A и b ∈ B. 1) n5 − n ... 5 при любом n ∈ N;
10 В первых двух примерах нужно использовать бином Ньютона.
176 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

2) n7 − n ... 7 при любом n ∈ N; ! 2.2.17. Если в формуле (2.2.312) поменять ме-


3) n · (2n2 − 3n + 1) ... 6 при любом n ∈ N; стами ∪ и ∩, она перестает быть верной:
4) 11n+1 + 122n−1 ... 133 при любом n ∈ N; (A ∩ B)▽ 6= A▽ ∪ B ▽
5) 5 · 23n−2 + 33n−1 ... 19 при любом n ∈ N.
Например, при A = {2} и B = {3} мы получаем
Наибольший общий делитель и наимень- ({2} ∩ {3})▽ = ∅▽ = N,
шее общее кратное. Пусть A ⊆ N.
но
• Число x ∈ N называется общим кратным {2}▽ ∪ {3}▽ = 2N ∪ 3N
множества A, если оно кратно любому чис-
лу a ∈ A (то есть делится на любое a ∈ A): Это не одно и то же, потому что, например,

∀a ∈ A x ... a, 5∈N & 5∈


/ 2N ∪ 3N

коротко это записывается формулой Предложение 2.2.24. Если A конечно (необя-


зательно непусто), то A▽ непусто, и поэтому
x ... A. существует наименьшее общее кратное ▽(A).
Множество всех общих кратных для A обо- Доказательство. Если A пусто, то число 1 бу-
значается A▽ : дет его общим кратным, поскольку при a ∈ A
. условие 1 ... a выполняется тривиально (из-за от-
▽ .
A := {x ∈ N : x . A} = сутствия таких a). Если же A непусто, то, по-
= {x ∈ N : ∀a ∈ A x ... a} (2.2.308) скольку оно конечно, его можно представить в
виде конечной последовательности (с неповторя-
Очевидно, ющимися элементами)
A▽ ... A (2.2.309)
• Hаименьшее общее кратное множества A (то A = {a1 , ..., an }
есть наименьшее число среди всех x ∈ A▽ ) а затем рассмотреть произведение всех чисел,
обозначается ▽(A): входящих в A
▽(A) := min A▽ = Y n
Y
x= a= ai
= min{x ∈ N : ∀a ∈ A x ... a} (2.2.310)
a∈A i=1
В частном случае, когда A состоит из двух Это число делится на любой элемент a ∈ A, то
элементов a и b, наименьшее общее кратное есть является общим кратным для множества A:
множества A называется наименьшим общим
кратным чисел a и b и обозначается x ∈ A▽

a ▽ b := ▽{a, b} = Значит, множество A▽ непусто. Как любое непу-


стое подмножество в N, оно, в силу свойства 5◦
= min{x ∈ N : x ... a & x ... b} (2.2.311)
на с.154, должно иметь минимальный элемент

Предложение 2.2.23. Следующее соотноше- min A = ▽(A).
ние справедливо для любых двух множеств A ⊆
Снова пусть A ⊆ N.
N и B ⊆ N:
• Число x ∈ N называется общим делителем
(A ∪ B)▽ = A▽ ∩ B ▽ (2.2.312) множества A, если оно является делителем
Доказательство. для любого числа a ∈ A (то есть любое a ∈ A
делится на x):
x ∈ (A ∪ B)▽
∀a ∈ A a ... x,
m
.
. коротко это записывается формулой
x . (A ∪ B)
m A ... x.
x ... A & x ... B Множество всех общих делителей для A обо-
m значается A△ :

x ∈ A▽ & x ∈ B▽ A△ := {x ∈ N : A ... x} =
m = {x ∈ N : ∀a ∈ A a ... x} (2.2.313)
▽ ▽
x∈A ∩B Очевидно,
A ... A△ (2.2.314)
§ 2. Натуральные, целые и рациональные числа 177

• Наибольший общий делитель множества A (поскольку A непусто, такое a найдется), то мы


(то есть наибольшее число среди всех x ∈ A△ ) получим:
обозначается △ (A):
5◦ на
с.175
△ (A) = max A△ = ↓
A△ ⊆ {a}△ ⊆ {1, ..., a}
= max{x ∈ N : ∀a ∈ A a ... x} (2.2.315)
То есть A△ содержится в конечном множестве
В частном случае, когда A состоит из двух {1, ..., a}. Значит, по свойству 1◦ на с.70, A△ са-
элементов a и b, наибольший общий делитель мо конечно. После этого применяется теорема
множества A называется наибольшим общим 2.2.11: поскольку множество A△ конечно, оно
делителем чисел a и b и обозначается имеет максимальный элемент.
a △ b := max{x ∈ N : a ... x & b ... x} (2.2.316) Теорема 2.2.27. Следующие соотношения
справедливы для любого непустого конечного
Предложение 2.2.25. Следующее соотноше- A ⊆ N:
ние справедливо для любых двух множеств A ⊆
N и B ⊆ N: ▽(A) > maxA > min A >△ (A), (2.2.318)
▽ .. .
. .
. .
. △
A . ▽(A) . A . △ (A) . A , (2.2.319)
(A ∪ B)△ = A△ ∩ B △ . (2.2.317) △
△ (A) = ▽(A ), (2.2.320)
Доказательство. Это доказывается по анало- ▽(A) =△ (A▽ ). (2.2.321)
гии с предложением 2.2.23:
Доказательство. 1. В цепочке (2.2.318) нужно
x ∈ (A ∪ B)△ проверить два крайних неравенства.

m ▽(A) > max A, min A >△ (A)


(A ∪ B) ... x Они оба следуют из свойства 5◦ на с.175. Напри-
m мер, первое:
x ∈ A▽
A ... x & B ... x

m
x ... A
x ∈ A△ & x ∈ B△
⇓ 5◦ на с.175
m x>A
x ∈ A△ ∩ B △ ⇓
x > max A
! 2.2.18. Если в формуле (2.2.317) поменять ме- Это верно для любого x ∈ A▽ , значит
стами ∪ и ∩, то она перестает быть верной:
▽(A) = min A▽ = min▽ x > max A,
△ △ △ x∈A
(A ∩ B) 6= A ∪ B
И то же самое со вторым:
Например, при A = {2} и B = {3} мы получаем
x ∈ A△
△ △
({2} ∩ {3}) = ∅ = N,

но A ... x
{2}△ ∪ {3}△ = {1, 2} ∪ {1, 3} = {1}.
⇓ ◦
5 на с.175
Предложение 2.2.26. Если A непусто (необя-
A>x
зательно конечно), то A△ непусто и конечно, и
поэтому существует наибольший общий дели- ⇓
тель △ (A). min A > x
Доказательство. Число 1, очевидно, является Это верно для любого x ∈ A△ , значит
общим делителем для множества A:
min A > max△ x = max A△ =△ (A)
A.1 .
. x∈A

2. В цепочке (2.2.319) середина очевидна:


Это значит, что 1 ∈ A△ , и поэтому A△ непусто. С
другой стороны, если взять какое-нибудь a ∈ A ▽(A) ... A ... △ (A) (2.2.322)
178 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

– с одной стороны, Это противоречие означает, что наше предполо-


жение, что r > 0, было неверно.
▽ ..
| {z. A}
A ⇒ ▽(A) = min A▽ ... A 4. Докажем (2.2.320), то есть второе звено в
(2.2.309) нашей цепочке. Для этого расшифруем уже до-
казанную формулу (2.2.323) так:
а с другой,
... A△ x ... A ⇒ x ... ▽(A) (2.2.325)
|A {z } ⇒ A ... max A△ =△ (A)
(2.2.314) Тогда из (2.2.314) мы получаем цепочку:

Поэтому нужно доказать только два крайних со- A ... A△


отношения:

A ... ▽(A),

△ (A) ... A△ . ∀a ∈ A a ... A△
Мы будем их доказывать вместе с соотношения- ⇓ (2.2.325)
ми (2.2.320) и (2.2.321), причем в следующей по- ∀a ∈ A a ... ▽(A△ )
следовательности:

A▽ ... ▽(A) (2.2.323) .
A .. ▽(A△ )
⇓ ⇓

△ (A) = ▽(A )
⇓ ▽(A△ ) ∈ A△ (2.2.326)
С другой стороны, из (2.2.322) получаем:
△ (A) ... A△ (2.2.324) ▽(A△ ) ... A△


▽(A) =△ (A▽ )
▽(A ) > A△

3. Докажем первое звено в этой цепочке, то


Вместе с (2.2.326) это означает, что
есть формулу (2.2.323). Пусть x ∈ A▽ , то есть
. .
x .. A. Нам нужно показать, что x .. ▽(A). Разде- ▽(A△ ) = max A△ =△ (A),
лим x на ▽(A) с остатком: по теореме 2.2.22, су-
ществуют q ∈ Z и r ∈ Z такие, что то есть как раз справедливо (2.2.320).
5. Теперь формула (2.2.324), то есть третье
x = ▽(A) · q + r, 0 6 r < ▽(A) звено в нашей цепочке, получается в одну строч-
ку:
Если r = 0, то мы сразу получаем, что x ... ▽(A). (2.2.322)
△ (A) = ▽(A△ ) ... A△
(2.2.320)
Если же r > 0, то для всякого a ∈ A мы получаем
цепочку: 6. Остается доказать последнее звено цепоч-
ки – формулу (2.2.321). Здесь последователь-
▽(A) ... A (уже доказано)
ность рассуждений напоминает пункт 4. Сначала
⇓ расшифруем уже доказанную формулу (2.2.324)
так:
x ... a, ▽(A) · q ... a, x > ▽(A) A ... x ⇒ △ (A) ... x (2.2.327)
| {z }
⇓ 4◦ на с.175
Тогда из (2.2.309) мы получаем цепочку:

r = x − ▽(A) · q ... a A▽ ... A


Это верно для любого a ∈ A, значит r – общее ⇓
кратное для A:
r ... A ∀a ∈ A A▽ ... a

или, что то же самое, ⇓ (2.2.327)

∀a ∈ A △ (A▽ ) ... a
r ∈ A▽

С другой стороны, △ (A▽ ) ... A
r < ▽(A) = min A▽ ⇓
§ 2. Натуральные, целые и рациональные числа 179

2. Чтобы доказать (2.2.331), обозначим


▽ ▽
△ (A ) ∈ A (2.2.328)
a·b
С другой стороны, из (2.2.322) получаем: x=
a▽b
A▽ ... △ (A▽ ) и заметим, что x ∈ N, потому что

⇓ (a · b) ... a, (a · b) ... b
| {z }
A▽ >△ (A▽ )
⇓ (2.2.329)
Вместе с (2.2.328) это означает, что
(a · b) ... (a ▽ b)
△ (A▽ ) = min A▽ = ▽(A),
Нам нужно убедиться, что
то есть как раз справедливо (2.2.321).
x=a△b
Теорема 2.2.28. Для любых a, b ∈ N справедли-
вы импликации Для этого отдельно докажем два неравенства
 . 
x .. a
⇒ x ... (a ▽ b) (2.2.329) a △ b > x, x>a△b
x ... b
 . 
a .. x Первое из них доказывается такой цепочкой:
⇒ (a △ b) ... x (2.2.330)
b ... x
a▽b a▽b
и равенство a=x· , b=x·
| b {z a}
(a ▽ b) · (a △ b) = a · b (2.2.331)

Доказательство. 1. Импликации следуют из со-
отношений (2.2.319): a ... x, b ... x
| {z }

A▽ ... ▽(A) ⇓ (2.2.330)

⇓ (a △ b) ... x

{a; b}▽ ... ▽{a; b} ⇓


⇓ a△b>x
x ∈ {a; b} ▽
⇒ x ... ▽{a; b} = (a ▽ b) А второе так:

a·b b a·b a
=a· , = ·b
x ... {a; b} ⇒ x ... ▽{a; b} = (a ▽ b) a
| △ b a △ b {z a △ b a △ b }


(2.2.329)
a · b .. a · b ..
И точно так же, . a, .b
a
| △ b {z a △b }
△ (A) ... A△
⇓ (2.2.329)

⇓ a · b ..
. (a ▽ b)
△ {a; b} ... {a; b}△ a△b

⇓ ⇓

x ∈ {a; b}△ ⇒ △ {a; b} ... x a·b


> a▽b
a△b


x ... {a; b} ⇒ (a △ b) =△ {a; b} ... x
a·b
⇓ x= >a△b
a▽b
(2.2.330)
180 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Основная теорема арифметики. Доказательство. В обратную сторону это сле-


дует из 2◦ на с.175:
• Число a ∈ N, a > 1, называется
— простым, если оно делится только на 1 и (x · a) ... b ⇐= x ... b
на a:
Покажем, что она верна в прямую сторону:
a△ = {1; a}
— составным, если кроме 1 и a у него есть (x · a) ... b =⇒ x ... b
еще какие-то делители:
Для этого нужно добавить к (x · a) ... b очевидное
a△ 6= {1; a} соотношение (x · a) ... a:

(x · a) ... b
⋄ 2.2.19. Число 2 является простым, потому что

2 ... x
(x · a) .. a & (x · a) ... b
.
| {z }

⇓ (2.2.329)
16x62
(x · a) ... a ▽ b = a · b
(2.2.332)



x ∈ {1; 2}. x x·a
= ∈N
b a·b
То есть

2△ = {1; 2}
x ... b
• Числа a, b ∈ N называются взаимно просты-
ми, если они имеют только один общий дели-
тель, а именно, число 1: Предложение 2.2.30. Если произведение про-
стых чисел
{a, b}△ = {1} a1 · a2 · ... · an
Понятно, что это равносильно тому, что их делится на простое число b, то b содержится
наибольший общий делитель равен единице: в последовательности a1 , ..., an :

a △ b = 1. ∃i ∈ {1, ..., n} ai = b

Это в свою очередь означает, что Доказательство. Это доказывается индукцией


по n.
a ▽ b = a · b, (2.2.332) 1. При n = 1 утверждение становится триви-
альным:
поскольку a1 ... b

(2.2.331)

(a ▽ b) · (a △ b) = a·b
| {z } b ∈ {a1 }△ = {1; a1 }
1
⇓ (b > 1)
⋄ 2.2.20. Если a и b – два различных простых
b = a1
числа, то они взаимно просты, потому что
2. Предположим, что оно верно при n = k:
a△ = {1; a}, b△ = {1; b}  
a1 · a2 · ... · ak ... b ⇒ ∃i = 1, ..., k ai = b
⇓ (2.2.333)
3. Покажем, что тогда оно будет верно и при
n = k + 1. Пусть
{a, b}△ = (2.2.317) = {a}△ ∩ {b}△ =
= {1; a} ∩ {1; b} = {1} a1 · a2 · ... · ak · ak+1 ... b

Предложение 2.2.29. Если a и b – взаимно Если b = ak+1 , то наше утверждение доказано.


простые числа, то для любого x ∈ N Если же b 6= ak+1 , то обозначив x = a1 · a2 · ... · ak ,
мы получим:
(x · a) ... b ⇐⇒ x ... b x · ak+1 ... b,
§ 2. Натуральные, целые и рациональные числа 181

причем ak+1 и b простые, не совпадающие чис- Покажем тогда, что оно верно и при x = N .
ла, и значит, в силу примера 2.2.20, взаимно про- Здесь придется рассмотреть два случая. Во-
стые. Поэтому по предложению 2.2.29, x должно первых, если x = N – простое число, то наше
делиться на b: утверждение для него верно по тем же причи-
нам, по которым оно было верно для уже рас-
x = a1 · a2 · ... · ak ... b смотренного случая x = 2: те же рассуждения,
но с заменой 2 на N приводят к тому же резуль-
Но тогда по предположению индукции (2.2.333), тату.
b = ai для некоторого i = 1, ..., k. То есть в лю- Во-вторых, если x = N – составное число, то
бом случае мы получаем b = ai для некоторого есть
i = 1, ..., k, k + 1.
N = K ·L (K, L ∈ N, K, L > 1)
Теорема 2.2.31 (основная теорема арифмети-
ки). Каждое число x ∈ N, x > 1, можно един- то
ственным образом разложить в произведение K < N, L<N
x = pn1 1 · pn2 2 · ... · pknk , (2.2.334) поэтому по предположению индукции числа K
и L раскладываются по формуле (2.2.334). От-
в котором k и {n1 , n2 , ..., nk } – натуральные чис- сюда можно сделать вывод, что их произведе-
ла, а {p1 , p2 , ..., pk } – простые, расположенные в ние N = K · L тоже раскладывается по формуле
порядке возрастания: (2.2.334).
Остается только объяснить, почему для тако-
p1 < p2 < ... < pk
го N разложение будет единственно. Предполо-
Доказательство. Проведем индукцию по x ∈ N, жим, что этих разложений имеется два:
x > 2.
N = pn1 1 · ... · pnk k = q1m1 · ... · qlml (2.2.336)
1. Пусть x = 2. Тогда в виде (2.2.334) его мож-
но представить так: Поглядим на это с точки зрения предложения
2.2.30: число N делится на простое число q1 , а, с
2 = 21
другой стороны, N является произведением про-
(то есть в данном случае k = 1, p1 = 2, n1 = 1). стых чисел p1 , ..., pk (с разными степенями). Зна-
Единственность такого разложения следует из чит, среди чисел p1 , ..., pk какое-то должно быть
того, что, как мы убедились в примере 2.2.19, равно q1 :
число 2 простое: если
∃i ∈ {1, ..., k} pi = q1
2 = q1m1 · q2m2 · ... · qlml (2.2.335)
По той же причине среди чисел q1 , ..., ql какое-то
– какое-нибудь другое разложение, то мы во- должно быть равно p1 :
первых получим, что все числа qi должны быть
∃j ∈ {1, ..., l} qj = p1
одинаковыми и равными двойке, потому что
Поскольку числа p1 , ..., pk упорядочены по воз-
2 ... qi
растанию, получаем

p1 6 pi = q1

qi ∈ 2 = {1; 2}
С другой стороны, числа q1 , ..., ql тоже упорядо-
⇓ (qi > 1)
чены по возрастанию, и поэтому
qi = 2
q1 6 qj = p1
То есть разложение (2.2.335) должно иметь вид
Вместе это означает, что
2 = 2m
p1 = q1
И, во-вторых, здесь m должно быть равно 1, по-
тому что иначе, то есть при m > 1, мы получили откуда следует, что i = 1 = j.
бы Теперь разложение (2.2.336) можно записать
(2.2.282)
2 = 21 < 2m так:
2. Предположим далее, что наше утвержде- N = pn1 1 · pn2 2 · ... · pnk k = pm
1
1
·q2n2 · ... · qlml
ние верно при всех x, меньших некоторого N , |{z}
q1
заменено
x < N. на p1
182 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

Отсюда можно вывести, что n1 = m1 . Действи- Поделим это на pn1 1 :


тельно, если бы оказалось, что n1 > m1 , то поде-
лив на pm N
1 , мы получили бы
1
= pn2 2 · ... · pnk k = q2m2 · ... · qlml
pn1 1
N
= p1n1 −m1 · pn2 2 · ... · pnk k = q2m2 · ... · qlml
pm
1
1
Из p1 > 1 и n1 > 0 следует, что pn1 1 > 1, поэтому
и оказалось бы, что это число, будучи произве-
N
дением простых чисел q2 , ..., ql (с разными степе- <N
нями), делится на простое число p1 , которое не pn1 1
принадлежит последовательности q2 , ..., ql (пото-
и по предположению индукции, для числа pN n1
му что p1 = q1 меньше любого из этих чисел). И 1

точно так же, если бы n1 < m1 , то поделив на разложение (2.2.334) должно быть единственно.
pn1 1 , мы получили бы То есть,
N  
n2 nk m1 −n1 m2 ml
= p · ... · p = p · q · ... · q k = l & ∀i = 2, ..., k p i = qi & n i = m i
pn1 1 2 k 1 2 l

то есть произведение простых чисел p2 , ..., pk (с С другой стороны, равенства p1 = q1 и n1 = m1


разными степенями), делилось бы на простое мы уже доказали раньше. То есть в формуле
число p1 , которое не принадлежит последова- (2.2.336) числа справа и слева от последнего ра-
тельности p2 , ..., pk (потому что p1 меньше лю- венства совпадают, и это значит, что разложение
бого из этих чисел). N на множители однозначно.
Итак, n1 = m1 , и поэтому разложение
(2.2.336) можно переписать так:
N = pn1 1 · pn2 2 · ... · pnk k = pn1 1 ·q2n2 · ... · qlml
|{z}
q1 и m1
заменены
на p1 и n1

(d) Рациональные числа Q


Определение и свойства рациональных чисел.
• Число x ∈ R называется рациональным, если оно представимо в виде
a
x= , a ∈ Z, b∈N
b
В соответствии с этим, множество рациональных чисел, обозначаемое символом Q, опи-
сывается формулой
Z
Q= (2.2.337)
N

Свойства множества Q:
1◦ . Сумма x + y двух рациональных чисел x и y, также является рациональным числом:

x, y ∈ Q =⇒ x+y ∈Q (2.2.338)

2◦ . Число −x, противоположное рациональному числу x, также является рациональным


числом:
x∈Q =⇒ −x ∈ Q (2.2.339)
3◦ . Произведение x · y двух рациональных чисел x и y, также является рациональным чис-
лом:
x, y ∈ Q =⇒ x · y ∈ Q (2.2.340)
4◦ . Число x−1 , обратное рациональному числу x 6= 0, также является рациональным чис-
лом:
x∈Q =⇒ x−1 ∈ Q (2.2.341)
Теорема 2.2.32. В любом интервале (a, b) на вещественной прямой R найдутся рациональные
числа.
§ 2. Натуральные, целые и рациональные числа 183

Доказательство. Пользуясь принципом Архимеда (теорема 2.2.10), подберем число n ∈ N такое,


что
1
n>
b−a
и положим
m = [a · n] + 1
Тогда
m
<b a<
n
Первое неравенство здесь доказывается напрямую:
(2.2.288) m
a·n < [a · n] + 1 = m =⇒ a<
n
m
А правое – от противного: если бы оказалось, что b 6 n, то мы получили бы

(2.2.288) [a · n] m [a · n] + 1 [a · n] 1
[a · n] < a·n =⇒ 6a<b6 = = + =⇒
n n n n n
1 1
=⇒ b−a6 =⇒ n6 ,
n b−a
и последнее противоречит выбору n.

 
Несократимые дроби. a = p · (a △ b) ... x · (a △ b)
b = q · (a △ b) ... x · (a △ b)
Теорема 2.2.33. Всякое положительное раци-
ональное число x ∈ Q представимо в виде дро- ⇓
би, в которой числитель и знаменатель взаим- x · (a △ b) ∈ {a; b}△
но просты:

p
x= , p, q ∈ N, p△q=1 (2.2.342) x · (a △ b) 6 max{a; b}△ = (a △ b)
q

• Такие дроби называются несократи-
мыми. x61

Доказательство. Поскольку x рационально, Из этой цепочки видно, что


оно имеет вид x = ab , где a ∈ Z и b ∈ N. С
p △ q = max{p; q}△ = 1
другой стороны, x положительно, поэтому a то-
же должно быть положительно, и значит a ∈ N.
Поскольку a ... (a △ b) и b ... (a △ b), числа

a b Существование иррациональных чисел.


p= , q=
a△b a△b • Число x ∈ R называется иррациональным, ес-
ли оно не является рациональным:
должны быть натуральными. Понятно, что

a a
p /Q
x∈
a△b
x= = b
=
b a△b
q Следующий пример показывает, что такие числа
в самом деле существуют.
Остается проверить, что p △ q = 1. Это делается
так: ⋄ 2.2.21. Существует число c ∈ [1; 2], удовлетво-
x ∈ {p; q}△ ряющее условию11
⇓ c2 = 2 (2.2.343)
 . 
p .. x
q ... x Это число иррационально:

⇓ /Q
c∈
11 Читатель,

конечно, узнает в числе c из примера 2.2.21 число 2. Мы не вставляем это в формулировку, потому
что понятие корня будет определено нами только в § 1 главы 4.
184 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА
 ε 2 c · ε  ε 2
Доказательство. 1. Рассмотрим два множества: c+ = c2 + 2 · + =
3c 3·c 3c
X = {x ∈ R : x>0 & x2 6 2} 2 1 1 2 1
= c2 + ·ε+ · 2 · |{z} ε2 6 c2 + ·ε+ ·ε =
3 9 c
|{z} |{z} 3 3
Y = {y ∈ R : y>0 & y 2 > 2}

6
ε,

6
Заметим, что 1 ∈ X и 2 ∈ Y , поэтому X и Y 1
3
1 так как
непустые. Докажем неравенство для множеств 0<ε61

= c2 + ε = c2 + (2 − c2 ) = 2
X 6Y
То есть
Действительно, если бы для каких-то x ∈ X и 
ε ε 2
y ∈ Y выполнялось обратное неравенство c+ >c>0 & c+ 62
3c 3c
x > y, ε
и это значит, что число c + 3c наоборот лежит в
X. Это противоречие означает, что наше предпо-
то, поскольку y > 0, по свойству степенного отоб-
ложение (2.2.345) было неверным.
ражения (2.2.280), мы получили бы
Предположим, наоборот, что
x2 > y 2 c2 > 2 (2.2.346)
при том что из условий x ∈ X и y ∈ Y следует Тогда число ε = c2 − 2 будет положительно
x2 6 2 6 y 2 . ε = c2 − 2 > 0
Из неравенства X 6 Y , в силу аксиомы непре- Отсюда сразу следует, что
рывности A16, следует, что найдется число c ∈ R, ε
лежащее между X и Y : c− <c6Y
3c
X 6c6Y ε
и поэтому число c− 3c не лежит в Y . Но с другой
стороны, во-первых,
Заметим сразу, что, поскольку 1 ∈ X и 2 ∈ Y ,
число c должно удовлетворять условию ε c2 − 2 2c2 + 2
c− =c− = >0
3c 3c 3c
16c62 (2.2.344)
И, во-вторых,
2. Покажем, что  ε 2 2 · ε  ε 2
c− = c2 − + =
c2 = 2 3c 3 3c
ε  ε 2
= c2 − ε + + > c2 − ε = c2 − (c2 − 2) = 2
Предположим, что это не так, например, пусть 3 3c
| {z }
<

c2 < 2 (2.2.345) 0

2
Тогда число ε = 2 − c будет положительно: То есть мы получаем
ε  ε 2
ε = 2 − c2 > 0 c− >0 & c− >2
3c 3c
Отсюда сразу следует, что ε
и это значит, что число c − 3c наоборот лежит
ε в Y . Это противоречие говорит о том, что наше
c+ >c>X
3c предположение (2.2.346) тоже было неверным.
ε 3. Нам осталось доказать, что число c ирра-
и следовательно число c + 3c не лежит в X. Но
ционально. Предположим, что оно рационально:
с другой стороны,
c∈Q
(2.2.344)
⇓ (2.2.344) Тогда, поскольку c > 0, по теореме 2.2.33 это
1 6 c2 ⇓ число можно представить в виде несократимой
1
⇓ 0< c 61 дроби
−c2 6 −1 ⇓ m
1
c= , m△n=1
⇓ 0< c2 61 n
ε = 2 − c2 6 2 − 1 = 1 Мы получаем цепочку:
| {z }
m2
⇓ = c2 = 2
n2
§ 2. Натуральные, целые и рациональные числа 185

⇓ ⋄ 2.2.22. Множество четных натуральных чисел


2
m = 2·n 2 {2, 4, 6, 8, ...} = {2n; n ∈ N} удобно записывать в
виде

2N.
m ... 2
2

⇓ Точно также множество нечетных натуральных


чисел {1, 3, 5, 7, ...} = {2n − 1; n ∈ N} удобно за-
в разложении (2.2.334) числа m2 писывать в виде
имеется множитель 2s , s ∈ N
2N − 1.

в разложении (2.2.334) числа m ⋄ 2.2.23. Выше мы уже приводили формулу
имеется множитель 2t , t ∈ N (2.2.337)
⇓ Z
Q= ,
m ... 2 N
которую можно рассматривать, как определение

множества рациональных чисел Q.
m = 2 · k, k>1
⇓ ⋄ 2.2.24. Непривычному взгляду не сразу будет
очевидной справедливость равенства
4 · k 2 = m2 = 2 · n 2
⇓ Z
Q= (2.2.347)
2·k =n2 2 2N

⇓ Доказательство. Ясно, что выполняется вклю-


n ... 2
2 чение
Z
⇓ ⊆Q
2N
по тем же причинам, что и для m,
в разложении (2.2.334) числа n Покажем, что верно и обратное включение:
должен быть множитель 2r , r ∈ N
Z
⇓ Q⊆
2N
n ... 2
Действительно, если r = pq ∈ Q, p ∈ Z, q ∈ N, то
Мы получаем, что оба числа m и n делятся на положив m = 2p, мы получим:
2. Это противоречит тому, что у них наиболь-
ший общий делитель равен 1. Это означает, что p m
r= = , m ∈ Z, q ∈ N
наше предположение о рациональности c было q 2q
ошибочным.
Z
То есть r ∈ 2N .
Рациональные числа с нечетным знамена-
Z
телем 2N−1 . Напомним, что выше формулой
⊲ 2.2.25. Докажите равенства:
(2.1.191) мы определили умножение числового
множества X на число a: 2Z
=Q
a · X = {y ∈ R : ∃x ∈ X a · x = y} 2N
N
формулой (2.1.190) – сдвиг множества = {r ∈ Q : r > 0}
N
X − a = {y ∈ R : ∃x ∈ X x − a = y},
⋄ 2.2.26. После примера 2.2.24 можно было бы
а формулой (2.1.196) – частное числовых мно- ожидать, что если заменить в (2.2.347) четные
жеств: числа 2N на нечетные 2N − 1, то равенство оста-
  нется верным. Но это не так:
X x
= z ∈ R : ∃x ∈ X ∃y ∈ Y =z
Y y Z
Q 6=
Этого достаточно, чтобы сообразить, что пони- 2N − 1
Z
мается под множеством 2N−1 , о котором мы по-
1
ведем речь здесь, но перед тем, как приступить Доказательство. Число 2 лежит в Q, но не в
Z
собственно к изучению его свойств, мы рассмот- 2N−1 (потому что его невозможно представить в
целое
рим несколько подготовительных примеров. виде нечетное ).
186 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА

• Число x ∈ Q называется рациональным чис- это равносильно тому, что в разложении x


лом с нечетным знаменателем, если его на несократимую дробь числитель являет-
можно представить в виде дроби, в которой ся четным числом; очевидно, что множе-
числитель - целое число, а знаменатель – ство четных чисел с нечетным знаменате-
нечетное натуральное число: лем описывается формулой:
m
x= , m ∈ Z, n ∈ N 2Z
2n − 1
2N − 1
Нетрудно сообразить, что это равносильно
— нечетным, если его нельзя представить в
тому, что, будучи представлено в виде несо-
виде дроби с четным числителем и нечет-
кратимой дроби, x имеет нечетный знамена-
ным знаменателем; это равносильно тому,
тель. Множество всех рациональных чисел с
что при любом представлении в виде дро-
нечетным знаменателем описывается форму-
би с нечетным знаменателем, числитель
лой
Z тоже будет нечетным:
(2.2.348)
2N − 1
2m − 1
x= , m ∈ Z, n∈N
Z
2n − 1
Свойства множества 2N−1 :
в частности, в разложении x на несократи-

1 . Сумма x + y двух рациональных чисел x и y с мую дробь числитель должен быть нечет-
нечетным знаменателем, также является ным числом; множество нечетных чисел с
рациональным с нечетным знаменателем: нечетным знаменателем описывается фор-
Z Z мулой:
x, y ∈ =⇒ x+y ∈ 2Z − 1
2N − 1 2N − 1
2N − 1
2◦ . Число −x, противоположное рациональному
числу x с нечетным знаменателем, также Доказательство следующей теоремы мы
является рациональным с нечетным знаме- оставляем читателю:
нателем:
Теорема 2.2.34. Множества 2N−1 2Z 2Z−1
и 2N−1 не
Z Z пересекаются и в объединении дают множе-
x∈ =⇒ −x ∈ Z
2N − 1 2N − 1 ство 2N−1 :
3◦ . Произведение x · y двух рациональных чисел
x и y с нечетным знаменателем, также яв- 2Z 2Z − 1
∩ =∅
ляется рациональным с нечетным знамена- 2N − 1 2N − 1
телем: 2Z 2Z − 1 Z
∪ =
2N − 1 2N − 1 2N − 1
Z Z
x, y ∈ =⇒ x·y ∈
2N − 1 2N − 1 • Четностью рационального числа x с нечет-
! 2.2.27. Можно заметить, что для рациональ- ным знаменателем называется число sgn2 x,
ных чисел с четным знаменателем, которые мож- определяемое правилом:
но определить как те, которые будучи представ- (
лены в виде несократимой дроби имеют четный +1, x – четное
sgn2 x = (2.2.349)
знаменатель (и, возможно, знак минус перед дро- −1, x – нечетное
бью), утверждение 2◦ в этом списке не будет
справедливо: равенство Напомним, что выше (см.(2.1.204)) мы усло-
1 1 вились записью a∨b обозначать операцию взятия
+ =1 максимума двух чисел:
2 2
означает, что множество таких чисел не замкну- a ∨ b = max{a, b}
то относительно сложения. Однако, утвержде-
ния 1◦ и 3◦ для этого класса все же будут вы- Такая запись позволяет придать “алгебраиче-
полняться. ский” вид последнему из тождеств в следующем
Z
• Рациональное число x с нечетным знаменате- списке (x, y ∈ 2N−1 ):
лем называется
1
— четным, если его можно представить в ви- sgn2 x = (2.2.350)
sgn2 x
де дроби с четным числителем и нечетным
sgn2 (−x) = sgn2 x (2.2.351)
знаменателем:
sgn2 (x + y) = sgn2 x · sgn2 y (2.2.352)
2m
x= , m ∈ Z, n ∈ N sgn2 (x · y) = sgn2 x ∨ sgn2 y (2.2.353)
2n − 1
§ 2. Натуральные, целые и рациональные числа 187

Доказательство. Здесь нужно просто рассмот- sgn2 (x · y) = sgn2 x ∨ sgn2 y,


| {z } | {z } | {z }
реть несколько случаев. Для двух последних

=
=
тождеств рассуждения выглядят так: 1 1 −1
2Z 2Z
1) если x, y ∈ 2N−1 , то x + y ∈ 2N−1 и x·y ∈
2Z
2N−1 , поэтому 3) если x, y ∈ 2Z−1
то x + y ∈ 2Z
и x·y ∈
2N−1 , 2N−1
sgn (x + y) = sgn2 x · sgn2 y , 2Z−1
| 2 {z } | {z } | {z } 2N−1 , поэтому

=
=
1 1 1 sgn (x + y) = sgn2 x · sgn2 y,
| 2 {z } | {z } | {z }
sgn2 (x · y) = sgn2 x ∨ sgn2 y ,

=
=
| {z } | {z } | {z }
= 1 −1 −1

=
=

1 1 1
2Z 2Z−1 2Z−1
2) если x ∈ 2N−1 ,y∈ 2N−1 , то x + y ∈ 2N−1 и sgn (x · y) = sgn x ∨ sgn2 y .
2Z
x · y ∈ 2N−1 , поэтому | 2{z } | {z2 } | {z }

=
sgn (x + y) = sgn2 x · sgn2 y , −1 −1 −1
| 2 {z } | {z } | {z }
=

=
=

−1 1 −1
Глава 3

ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

§1 Числовые функции
(a) Определение функции и примеры
Понятие функции формализует в математике идею взаимной зависимости физических величин.
Идея же состоит в следующем.
Как мы уже говорили на с.122, физические величины, такие как расстояние, масса, скорость,
и так далее, поддаются количественной оценке в числах. Люди находят и устанавливают правила,
позволяющие измерять эти величины (сравнивая их с эталонами), то есть выражать их числами:
200 метров, 1,8 килограмма, и т.д. Собственно говоря, в этом состоит смысл самого понятия фи-
зической величины: параметр, существование которого предполагается теоретически, должен быть
снабжен системой правил, позволяющих его измерять и сравнивать значения в различных ситуа-
циях – только в этом случае он приобретает статус физической величины.
При этом очень важное наблюдение, с которого и начинаются технические науки, состоит в том,
что при фиксированных правилах измерений обнаруживается, что разные величины могут быть
связаны друг с другом довольно жесткими соотношениями (законами природы): если известны
результаты измерений какой-то величины, то это, как правило, означает, что можно вычислить
какие-то другие величины в рассматриваемой ситуации (без необходимости их измерять).

⋄ 3.1.1. Например, по результатам измерения ⋄ 3.1.2. Точно так же, зная (с достаточной точ-
диаметра окружности D, можно с достаточной ностью) массу тела m и плотность ρ материала,
точностью судить о том, какой будет ее длина l, из которого оно изготовлено, мы можем (опять
же, достаточно точно) определить объем V этого
l = πD, (3.1.1) тела по формуле

или площадь ограничиваемого ею круга: m


V = .
π 2 ρ
S= D . (3.1.2)
4 Нам для этого не нужно ставить экспериментов,
Важно, что нам не нужно измерять l и S, если требующих времени и денег (если, скажем, изу-
ны измерили D, потому что зависимости (3.1.1) чаемый нами предмет довольно громоздок) – все
и (3.1.2) позволяют вычислять l и S по данному легко и быстро вычисляется на бумаге (или в
D. уме).

В этих примерах одна величина выражается через другую с помощью логических правил, поз-
воляющих проводить вычисления, то есть находить нужные значения, возможно приближенные,
пользуясь заранее разработанными алгоритмами. Инженер, привыкший пользоваться подобными
вычислениями на практике, обычно только так и понимает функциональную зависимость, но мате-
матику удобнее рассматривать эту зависимость в абстрактном виде, включая те ее разновидности,
для которых алгоритмы вычислений еще не построены. Эти соображения приводят к следующему
определению:
• Числовой функцией на вещественной прямой R называется произвольное отображение1
1 Понятие отображения было определено выше на с.41.

188
§ 1. Числовые функции 189

f : D(f ) → R, у которого область определения D(f ) содержится в R. В дальнейшем мы


будем использовать в таких случаях запись

f : R ֒→ R

(которая будет означать, что f является отображением, у которого область определения


и область значений содержатся в R).
Интуитивно яснее, хотя и менее точно, звучит следующее неформальное описание:
• Пусть даны два числовых множества X и Y , и пусть задано некое правило, которое каж-
дому элементу x ∈ X ставит в соответствие единственный (зависящий от x) элемент
y = f (x) ∈ Y . Такое правило обозначается f : X → Y или просто f и называется числовой
функцией с областью определения X и множеством значений Y .
Напомним, что формальное определение на с.41 не различает отображение и его график. В
соответствии с ним, мы можем сказать, что числовая функция f : R ֒→ R представляет из себя
подмножество в декартовом произведении R × R, удовлетворяющее условию (0.3.218). Обычно все
же такое различие проводится: человеческому воображению удобно представлять себе функцию
как правило, а не как подмножество, поэтому мы будем функцию f : R ֒→ R считать правилом,
а к ее графику относиться как к множеству в декартовом произведении R × R, состоящему из
упорядоченных пар вида (x; f (y)), x ∈ D(f ) ⊆ R.

⋄ 3.1.3. Степенная функция с целым по- ⋄ 3.1.6. Дробная часть числа. Формулой
казателем. Напомним, что на странице 167 мы (2.2.292) мы определили дробную часть числа
определили степени с целым показателем. Сте- x ∈ R:
пенной функцией с показателем n ∈ Z называет- {x} := x − [x]
ся функция Это тоже будет функция, определенная на R, и
ее график тоже имеет бесконечное число разры-
f (x) = xn вов:

При n > 0 она определена на всей числовой


прямой R, а при n < 0 – только на множестве
R \ {0} = (−∞; 0) ∪ (0; +∞).

⋄ 3.1.4. Модуль числа. Выше формулой (3.1.5) ⋄ 3.1.7. Сигнум числа x ∈ R определяется пра-
мы определили модуль числа x ∈ R: вилом


1, если x > 0
(
x, если x > 0 sgn x = 0, если x = 0 (3.1.3)
|x| = 

x, если x < 0 −1, если x < 0
График этой функции имеет разрыв только в од-
ной точке x = 0:
Понятно, что правило x 7→ |x| будет функцией,
определенной всюду на числовой прямой R.

⋄ 3.1.5. Целая часть числа. Формулой


(2.2.286) выше мы определили целую часть чис-
ла x ∈ R:
⋄ 3.1.8. Функция Дирихле. Функция D на R,
определенная правилом
[x] = max{n ∈ Z : n 6 x}, (
1, x ∈ Q
D(x) = (3.1.4)
/Q
0, x ∈
Правило x 7→ [x] будет функцией, определенной
всюду на числовой прямой R. Ее график инте- называется функцией Дирихле. Ниже мы дока-
ресен тем, что имеет бесконечно много разрывов жем формулу (9.1.4), выражающую эту функ-
(что такое разрыв мы объясним ниже на с.242): цию как двойной предел стандартных функций.
190 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

⋄ 3.1.9. Пустая функция. В список примеров 0.3.13, и рассматриваемое как отображение из ∅


полезно включить пустую функцию, то есть пу- в R.
стое отображение, определенное нами в примере

(b) Модуль
Модулем (или абсолютной величиной) вещественного числа x ∈ R называется число |x|, определя-
емое формулой
(
x, если x > 0
|x| = (3.1.5)
−x, если x < 0

Ниже на с.189 мы отметим, что отображение x 7→ |x| является функцией. Свойства этой функции
так часто используются в анализе, что их изучению мы посвятим целый раздел.

Теорема 3.1.1. Справедливо тождество

|x| = max{−x; x} = (−x) ∨ x, x∈R (3.1.6)

Доказательство. Здесь нужно рассмотреть три случая:


1) если x > 0, то |x| = x и, с другой стороны, max{−x; x} = x, поэтому |x| = max{−x; x};
2) если x = 0, то |x| = 0 = x и, с другой стороны, max{−x; x} = 0 = x, поэтому |x| =
max{−x; x};
3) если x < 0, то |x| = −x и, с другой стороны, max{−x; x} = −x, поэтому |x| = max{−x; x}.
Мы получаем, что, (3.1.6) выполняется независимо от знака x.

Алгебраические тождества с модулем.

Теорема 3.1.2. Для любых x, y ∈ R, n ∈ N справедливы следующие равенства:

|x · y| = |x| · |y| (3.1.7)


n n
|x | = |x| (3.1.8)

Доказательство. Если оба знака у x и y положительны, получаем


(
x>0
=⇒ |x · y| = |x| · |y|
y>0 | {z } |{z} |{z}
k k k
x·y x y

Далее, если оба знака отрицательны,


(
x60
=⇒ |x · y| = |x| · |y|
y60 | {z } |{z} |{z}
k k k
x·y −x −y

Наконец, если знаки разные, например, x > 0, а y 6 0, то


(
x>0
=⇒ |x · y| = |x| · |y|
y60 | {z } |{z} |{z}
k k k
−x · y x −y

Это доказывает (3.1.7). Отсюда индукцией получается (3.1.8).


§ 1. Числовые функции 191

Алгебраические неравенства с модулем.


Теорема 3.1.3. Для любых x, y ∈ R справедливы следующие неравенства:
|x| > 0, причем |x| = 0 ⇐⇒ x = 0 (3.1.9)
|x| − |y| 6 |x + y| 6 |x| + |y| (3.1.10)
−|x − y| 6 |x| − |y| 6 |x − y| (3.1.11)
Доказательство. 1. Если x > 0, то |x| = x > 0. Если же x < 0, то |x| = −x > 0. Далее, если x = 0,
то |x| = max{0; 0} = 0. И наоборот, если |x| = 0, то либо |x| = x = 0, либо |x| = −x = 0, то есть
опять x = 0.
2. Докажем сначала правую половину (3.1.10):
|x + y| 6 |x| + |y| (3.1.12)
Во-первых, если оба знака у x и y положительны, получаем
(
x>0
=⇒ |x + y| 6 |x| + |y|
y>0 | {z } |{z} |{z}
k k k
x+y x y

Во-вторых, если оба знака отрицательны,


(
x60
=⇒ |x + y| 6 |x| + |y|
y60 | {z } |{z} |{z}
k k k
−(x + y) −x −y

Наконец, если знаки разные, например, x > 0, а y 6 0, то


( (
x>0 x + y = |x| − |y| 6 |x| + |y|
=⇒ =⇒ |x + y| = max{x + y; −x − y} 6 |x| + |y|
y60 −x − y = −|x| + |y| 6 |x| + |y|

Из (3.1.12) теперь получаем левую половину (3.1.10):


|x| = |(x + y) − y| 6 |x + y| + | − y| = |x + y| + |y| =⇒ |x| − |y| 6 |x + y|
3. Докажем правую половину (3.1.11):
|x| = |(x − y) + y| 6 (3.1.12) 6 |x − y| + |y| =⇒ |x| − |y| 6 |x − y|
После этого становится очевидной левая половина:
|y| − |x| 6 |y − x| =⇒ −|y| + |x| > −|y − x| = −|x − y|

Решение неравенств с модулем.


Теорема 3.1.4. Справедливы следующие правила решения неравенств с модулем:
|x| < ε ⇐⇒ x ∈ (−ε,ε) ⇐⇒ |x| ∈ (−ε, ε) (3.1.13)
|x| > ε ⇐⇒ x ∈ (−∞; −ε)∪(ε; +∞) ⇐⇒ |x| ∈ (−∞; −ε) ∪ (ε; +∞) (3.1.14)
Доказательство. 6. Если x > 0, то |x| = x, и цепочка (3.1.13) становится очевидной:
|x| < ε ⇐⇒ x ∈ (−ε, ε) ⇐⇒ |x| ∈ (−ε, ε)
| {z } |{z}
m k
06x<ε x

Если же x 6 0, то |x| = −x, и получается


|x| < ε ⇐⇒ x ∈ (−ε, ε) ⇐⇒ |x| ∈ (−ε, ε)
| {z } |{z}
m k
0 6 −x < ε −x
m
0 > x > −ε
192 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

7. То же самое с 3◦ : если x > 0, то |x| = x, и цепочка (3.1.14) приобретает вид,

|x| > ε ⇐⇒ x ∈ (−∞; ε) ∪ (ε; +∞) ⇐⇒ |x| ∈ (−∞; ε) ∪ (ε; +∞)


| {z } |{z}
m k
x>ε x

а если x 6 0, то |x| = −x, и получается

|x| > ε ⇐⇒ x ∈ (−∞; ε) ∪ (ε; +∞) ⇐⇒ |x| ∈ (−∞; ε) ∪ (ε; +∞)


| {z } |{z}
m k
−x > ε −x
m
x < −ε

(c) Функции с симметриями


Четные и нечетные функции.
• Функция f называется
– четной, если
(1) для всякой точки x из области определения D(f ) функции f точка −x также лежит
в области определения,
∀ x ∈ D(f ) − x ∈ D(f )
(2) выполняется тождество
f (−x) = f (x)
Эти условия означают, что график функции f должен быть симметричен относительно
оси ординат:

– нечетной, если
(1) для всякой точки x из области определения D(f ) функции f точка −x также лежит
в области определения,
∀ x ∈ D(f ) − x ∈ D(f )
(2) выполняется тождество
f (−x) = −f (x)
Эти условия означают, что график функции f должен быть симметричен относительно
начала координат:
§ 1. Числовые функции 193

⋄ 3.1.10. Степенная функция с четным показа- 1. При n = 0 тождество (3.1.17) превращается


телем является четной: в уже доказанное тождество (2.1.20):

(−x)2n = x2n , n∈Z (3.1.15) (−x)−1 = −x−1

Доказательство. Заметим, что это достаточно 2. Предположим, что мы доказали это для
доказать для n > 0, потому что случай отрица- какого-то n = k:
тельных степеней получается отсюда в качестве
следствия: (−x)2k−1 = −x2k−1 (3.1.18)

1 1 3. Тогда для n = k + 1 мы получаем:


(−x)−2n = = 2n = x−2n
(−x)2n x
(−x)2(k+1)−1 = (−x)2k+1 =
Для n > 0 доказательство проводится по индук-
ции. = (−x)2k−1 · (−x)2 = −x2k−1 · x2 =
| {z } | {z }
1. При n = 0 утверждение очевидно: k k
− x2k−1 , x2 ,
(−x)0 = 1 = x0 в силу (3.1.18) в силу (2.1.17)

= −x2k+1 = x2(k+1)−1
2. Предположим, что мы доказали это для
какого-то n = k:

(−x)2k = x2k (3.1.16) ⋄ 3.1.12. Модуль является четной функцией:

3. Тогда для n = k + 1 мы получаем: | − x| = |x| (3.1.19)

(−x)2(k+1) = (−x)2k+2 = Доказательство. Если x > 0, то


= (−x)2k · (−x)2 = x2k · x2 = | −x | = −(−x) = x = | |{z}
x |
| {z } | {z } |{z}
k k

<
>

x2k , x2 , 0 0
в силу (3.1.16) в силу (2.1.17)

= x2k+2 = x2(k+1) Если x = 0, то

| − x| = | − 0| = |0| = |x|

⋄ 3.1.11. Степенная функция с нечетным пока- Если x < 0, то


зателем является нечетной:
x |
| −x | = −x = | |{z}
|{z}
(−x)2n−1 = −x2n−1 , n∈Z (3.1.17)
>
<

0 0
Доказательство. Как и в предыдущем приме-
ре, здесь достаточно доказать утверждение для
n > 0, потому что для n = −k, k ∈ Z+ , это выво-
дится как следствие: ! 3.1.13. На всякий случай полезно заметить,
что функции не обязаны быть только четными
−2k−1 1 1 −2k−1 или нечетными. Например, функция
(−x) = = − 2k+1 = −x
(−x)2k+1 x
f (x) = 1 + x
Для n > 0 доказательство проводится по индук-
ции. не будет ни четной ни нечетной. Докажите это.

Периодические функции.
• Число T называется периодом числовой функции f , если
(a) оно положительно:
T > 0,
(b) область определения D(f ) функции f инвариантна относительно сдвигов на T вправо
и влево:
D(f ) − T = D(f ) = D(f ) + T
194 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(то есть для любого x ∈ D(f ) числа x + T и x − T тоже лежат в D(f )),
(c) справедливо двойное тождество:

f (x − T ) = f (x) = f (x + T ), x ∈ D(f ) (3.1.20)

(здесь из-за условия (b) достаточно выполнения какого-нибудь одного из этих двух
равенств, например f (x) = f (x + T )).
• Число h называется полупериодом числовой функции f , если число 2h является периодом
функции f .
• Числовая функция f называется
— периодической, если она обладает каким-нибудь периодом T ,
— T -периодической, если число T является ее периодом,

⋄ 3.1.14. Непериодические функции. По- Можно заметить, что вообще любое натуральное
нятно, что не всякая функция будет периодиче- число n ∈ N является периодом для x 7→ {x}:
ской. Например, функция
f (x) = x, x∈R {x + n} = {x}, x∈R

– не периодическая, потому что для нее тожде-


Других же периодов здесь нет:
ство (3.1.20) эквивалентно тождеству
n o
x + T = x, x∈R T > 0 : ∀x ∈ R {x + n} = {x} = N
которое выполняется только если T = 0. То
есть периода (числа T > 0, удовлетворяющего Как следствие, эта функция обладает важным
(3.1.20)) у этой функции не существует. свойством, которое встречается не у всякой пе-
⋄ 3.1.15. Константы. Всякую функцию, тож- риодической функции (например, у констант его
дественно равную какому-нибудь числу C ∈ R, нет): у нее есть наименьший период – число 1.
f (x) = C, x∈R
⋄ 3.1.17. Функция Дирихле x 7→ D(x), опре-
можно считать периодической, потому что для деленная в главе 2 формулой (3.1.4), также будет
нее любое число T > 0 будет периодом: периодической, потому что любое положитель-
ное рациональное число r ∈ Q является для нее
f (x + T ) = C = f (x), x∈R
периодом
⋄ 3.1.16. Дробная часть. Функция x 7→ {x},
сопоставляющая числу x его дробную часть {x} D(x + r) = D(x), x∈R
(мы определили ее формулой (2.2.292)), являет-
ся периодической, потому что, например, число
Однако среди таких чисел r не существует наи-
1 является для нее периодом:
меньшего. Поэтому D, будучи периодической, не
{x + 1} = {x}, x∈R обладает наименьшим периодом.

Теорема 3.1.5. Если функция f является периодической и обладает наименьшим периодом M ,


то любой ее период T имеет вид
T =n·M
где n ∈ N.
Доказательство. Разделим T на M с остатком по теореме 2.2.22:

T = n · M + r, 06r<M

Если бы оказалось, что r > 0, то мы получили бы, что r = T − n · M – период функции f , меньший
M . То есть M в этом случае не могло бы быть наименьшим периодом. Значит r = 0, и это то, что
нам нужно.
Теорема 3.1.6. Если функция f является периодической, но не обладает наименьшим периодом
M , то
§ 1. Числовые функции 195

(i) нижняя грань всех ее периодов равна нулю:


n o
inf T > 0 : ∀x ∈ D(f ) f (x + T ) = f (x) = 0 (3.1.21)

(ii) на любом непустом интервале I = (a, b) функция f принимает все свои значения:
   
f I ∩ D(f ) = f D(f ) (3.1.22)

(иными словами, каковы бы ни были a и b, a < b, для любой точки x ∈ D(f ) найдется
точка t ∈ (a, b) ∩ D(f ) такая, что f (t) = f (x)).
Доказательство. 1. Обозначим буквой P множество всех периодов для f , а его нижнюю грань
буквой α: n o
P = T > 0 : ∀x ∈ D(f ) f (x + T ) = f (x) , α = inf P

Если α ∈
/ P , то для всякого β > α найдется T ∈ P такое, что

α<T <β

Возьмем произвольное ε > 0. Для него существует какое-то T1 ∈ P со свойством

α < T1 < α + ε

Поскольку T1 > α, можно подобрать T2 ∈ P такое, что

α < T2 < T1 < α + ε

Числа T1 и T2 являются периодами для f . Поэтому их разность T = T1 − T2 (которая больше нуля,


потому что T1 > T2 ) тоже будет периодом для f :

f (x + T ) = f (x + T1 − T2 ) = f (x + T1 ) = f (x)

С другой стороны, T1 и T2 лежат в интервале (α, α + ε) длины ε, поэтому их разность должна быть
меньше ε:
T = T1 − T2 < ε
Мы получили, что для всякого ε > 0 найдется период T ∈ P , меньший ε. Значит, α = inf P = 0
2. Рассмотрим сначала интервал I = (−ε, ε), ε > 0. В силу уже доказанной формулы (3.1.21),
найдется период T < ε. Возьмем произвольную точку x ∈ D(f ), и обозначим через n целую часть
числа Tx : hxi
n=
T
Тогда точка t = x − nT будет обладать нужными свойствами:

t ∈ (−ε, ε), t ∈ D(f ), f (t) = f (x)

Действительно, последние два условия – t ∈ D(f ) и f (t) = f (x) – выполняются потому что T –
период. А первое следует из свойств целой части:
hxi
n=
T
⇓ (2.2.288)
x ε
n6 <n+1<n+
T T

nT 6 x < nT + ε

| −{znT} < ε
06x
t


196 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

t ∈ (−ε, ε)
3. Пусть, наконец, I = (a, b) – произвольный интервал. Положим ε = b−a 3 и, пользуясь формулой
(3.1.21), подберем период T так, чтобы
ε
>1
T
Тогда a + ε < b − ε, поэтому a+ε T < b−εT , причем расстояние между точками T
a+ε
и b−ε
T больше
единицы:
b−ε a+ε (b − ε) − (a + ε) (b − a) − 2ε 3ε − 2ε ε
− = = = = >1
T T T T T T
Значит, между ними лежит хотя бы одно целое число n ∈ Z:
a+ε b−ε
<n<
T T
Умножив на T мы получим:
a + ε < nT < b − ε

a < nT − ε & nT + ε < b

(−ε; ε) + nT = (nT − ε; nT + ε) ⊆ (a; b)
То есть (−ε; ε) – такой интервал, сдвиг которого на число nT , кратное периоду T , попадает в
интервал (a; b). Мы уже доказали, что для любой точки x ∈ D(f ) в интервале (−ε; ε) найдется
точка t, на которой функция f определена и принимает то же значение:
f (t) = f (x)
Положив s = t + nT , мы получим точку из интервала (nT − ε; nT + ε) ⊆ (a; b) с теми же свойствами:
f (s) = f (t + nT ) = f (t) = f (x)

(d) Свойства функций, связанные с отношением порядка


Ограниченные функции и точная грань функции на множестве. Пусть f – числовая
функция и E – подмножество в ее области определения:
E ⊆ D(f ).
Образом этого множества под действием функции f называется множество
n o n o
f (E) = f (x); x ∈ E = y : ∃x ∈ E y = f (x) (3.1.23)

• Точная нижняя грань множества f (E) называется точной нижней гранью функции f на
множестве E и обозначается inf x∈E f (x):
n o
inf f (x) = inf f (E) = inf f (x); x ∈ E (3.1.24)
x∈E

Если функция f ограничена снизу на множестве E, то есть существует число A такое, что
∀x ∈ E A 6 f (x)
(это эквивалентно тому, что множество f (E) ограничено снизу), то точная нижняя грань
f на E совпадает с наибольшим из таких чисел A:
inf f (x) = max{A ∈ R : ∀x ∈ E A 6 f (x)}.
x∈E

В таких случаях inf x∈E f (x) само является числом (а не символом −∞, как тоже иногда
бывает), и это коротко записывается формулой:
inf f (x) > −∞
x∈E

В противном случае говорят, что функция f не ограничена снизу на множестве E, и


записывается это формулой:
inf f (x) = −∞
x∈E
§ 1. Числовые функции 197

• Точная верхняя грань множества f (E) называется точной верхней гранью функции f на
множестве E и обозначается supx∈E f (x):
n o
sup f (x) = sup f (E) = sup f (x); x ∈ E (3.1.25)
x∈E

Если функция f ограничена сверху на множестве E, то есть существует число B такое,


что
∀x ∈ E f (x) 6 B
(это эквивалентно тому, что множество f (E) ограничено сверху), то точная верхняя грань
f на E совпадает с наименьшим из таких чисел B:

sup f (x) = min{B ∈ R : ∀x ∈ E f (x) 6 B}.


x∈E

В таких случаях supx∈E f (x) является числом (а не символом +∞), и это коротко запи-
сывается формулой:
sup f (x) < +∞
x∈E

В противном случае говорят, что функция f не ограничена сверху на множестве E, и


записывается это формулой:
sup f (x) = +∞
x∈E

• Числовая функция f называется ограниченной на множестве E ⊆ D(f ), если она ограни-


чена на E сверху и снизу, то есть существуют числа A и B, такие что:

∀x ∈ E A 6 f (x) 6 B

Свойства точной верхней и точной нижней грани функции:


1◦ Точная грань от константы:
 
∀x ∈ E f (x) = C =⇒ inf f (x) = C = sup f (x)
x∈E x∈E

2◦ Монотонность:
 
∀x ∈ E f (x) 6 g(x) =⇒ inf f (x) 6 inf g(x) & sup f (x) 6 sup g(x)
x∈E x∈E x∈E x∈E

3◦ Антиоднородность:
 
inf − f (x) = − sup f (x)
x∈E x∈E
  (3.1.26)
sup − f (x) = − inf f (x)
x∈E x∈E

4◦ Полуаддитивность:
 
inff (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E
  (3.1.27)
sup f (x) + g(x) 6 sup f (x) + sup g(x)
x∈E x∈E x∈E

5◦ Полумультипликативность: если f (x), g(x) > 0, то


 
inf f (x) · g(x) > inf f (x) · inf g(x)
x∈E x∈E x∈E
  (3.1.28)
sup f (x) · g(x) 6 sup f (x) · sup g(x)
x∈E x∈E x∈E
198 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

6◦ Связь с модулем:2
 
sup f (x) − f (y) = sup f (x) − f (y) (3.1.29)
x,y∈E x,y∈E

Доказательство. В каждом пункте (за исключением 6◦ ) мы докажем только первую половину


утверждения (вторая доказывается по аналогии).
1.
 
∀x ∈ E f (x) = C =⇒ {A : ∀x ∈ E A 6 f (x)} = {A : A 6 C} = (−∞; C] =⇒
=⇒ inf f (x) = max{A : ∀x ∈ E A 6 f (x)} = max(−∞; C] = C
x∈E

2. Пусть ∀x ∈ E f (x) 6 g(x). Тогда


{C : ∀x ∈ E C 6 f (x)} ⊆ {C : ∀x ∈ E C 6 g(x)}
⇓ (свойство 1◦ на стр. 150)

inf f (x) = max{C : ∀x ∈ E C 6 f (x)} 6 max{C : ∀x ∈ E C 6 g(x)} = inf g(x)


x∈E x∈E

3.    
inf − f (x) = inf − f (E) = (свойство 3◦ на стр. 150) = − sup f (E) = − sup f (x)
x∈E x∈E
.
4.
(
∀x ∈ E f (x) > inf x∈E f (x)
=⇒ ∀x ∈ E f (x) + g(x) > inf f (x) + inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) x∈E x∈E
 
=⇒ inf f (x) + g(x) > inf f (x) + inf g(x)
x∈E x∈E x∈E

5.
(
∀x ∈ E f (x) > inf x∈E f (x) > 0
=⇒ ∀x ∈ E f (x) · g(x) > inf f (x) · inf g(x) =⇒
∀x ∈ E g(x) > inf x∈E g(x) > 0 x∈E x∈E
 
=⇒ inf f (x) · g(x) > inf f (x) · inf g(x)
x∈E x∈E x∈E

6. Во-первых, нужно заметить неравенство:


 
sup f (x) − f (y) 6 sup f (x) − f (y)
x,y∈E x,y∈E

Оно следует из свойства монотонности:


   
∀x, y ∈ E f (x) − f (y) 6 f (x) − f (y) =⇒ sup f (x) − f (y) 6 sup f (x) − f (y)
x,y∈E x,y∈E

После этого нужно убедиться, что это неравенство не может быть строгим. Предположим, что
 
sup f (x) − f (y) < sup f (x) − f (y)
x,y∈E x,y∈E

то есть что для каких-то элементов a, b ∈ E выполняется


 
∀x, y ∈ E f (x) − f (y) < f (a) − f (b)

В частности, взяв x = a, y = b, мы получили бы

f (a) − f (b) < f (a) − f (b)

а, взяв x = b, y = a, получили бы

f (b) − f (a) < f (a) − f (b)

Вместе эти два неравенства выполняться не могут, потому что f (a) − f (b) равен либо f (a) − f (b),
либо f (b) − f (a).
2 Это тождество понадобится нам на с.434.
§ 1. Числовые функции 199

Монотонные функции

• Числовая функция f называется


– возрастающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких
что x < y выполняется неравенство f (x) < f (y);

– убывающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких что


x < y выполняется неравенство f (x) > f (y);

– невозрастающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких


что x < y выполняется неравенство f (x) > f (y);

– неубывающей на множестве E ⊆ D(f ), если для любых точек x, y ∈ E таких что


x < y выполняется неравенство f (x) 6 f (y);

– монотонной на множестве E ⊆ D(f ), если она невозрастающая или неубываю-


щая;
– строго монотонной на множестве E ⊆ D(f ), если она возрастающая или убы-
вающая.
Доказательство следующих свойств мы оставляем читателю:

Свойства монотонных функций

1◦ Если функция f возрастает на множестве E, то она неубывает на множестве E.


2◦ Если функция f убывает на множестве E, то она невозрастает на множестве E.
3◦ Если функция f неубывает на множестве E, то на всяком ограниченном снизу (сверху)
подмножестве M ⊆ E таком, что inf M ∈ E (sup M ∈ E) функция f ограничена снизу
200 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(сверху) и удовлетворяет неравенству


 
f (inf M ) 6 inf f (x) sup f (x) 6 f (sup M ) (3.1.30)
x∈M x∈M

4◦ Если функция f невозрастает на множестве E, то на всяком ограниченном сверху


(снизу) подмножестве M ⊆ E таком, что sup M ∈ E (inf M ∈ E) функция f ограничена
снизу (сверху) и удовлетворяет неравенству
 
f (sup M ) 6 inf f (x) sup f (x) 6 f (inf M ) (3.1.31)
x∈M x∈M

5◦ Композиция g ◦ f функций f и g
– возрастает (неубывает), если обе функции f и g возрастают (неубывают),
либо обе убывают (невозрастают),
– убывает (невозрастает), если одна из функций f и g возрастает (неубывает),
а другая убывает (невозрастает).

⋄ 3.1.18. Степенная функция x 7→ x2n , n ∈ N, ⋄ 3.1.19. Степенная функция x 7→ x2n−1 , n ∈ N,


возрастает всюду на своей области определения
— убывает на полуинтервале (−∞; 0],
(то есть на прямой R). Как следствие,
— возрастает на полуинтервале [0; +∞).
Как следствие, x>0 =⇒ x2n−1 > 0
(3.1.33)
2n
x<0 =⇒ x2n−1 < 0
x 6= 0 =⇒ x >0 (3.1.32)
Доказательство. Возрастание на полуинтерва-
Доказательство. Возрастание на полуинтерва-
ле [0; +∞) здесь доказывается так же, как в
ле [0; +∞) следует из теоремы 2.2.17: в силу
предыдущем примере 3.1.18. Поскольку вдоба-
(2.2.280), функция x 7→ x2n возрастает на интер-
вок, в силу (3.1.17), наша функция нечетная,
вале (0; +∞):
(−x)2n−1 = −x2n−1 ,
0<x<y ⇒ x2n < y 2n
она должна возрастать и на полуинтервале
А случай x = 0 получается из условия сохране-
(−∞; 0]:
ния знака (2.2.279):
x<y60
(2.2.278)
0<y ⇒ 02n = 0 < y 2n ⇓

С другой стороны, в силу (3.1.15), наша функция 0 6 −y < −x


четная: ⇓
(−x)2n = x2n
2n−1
(−y) < (−x)2n−1
Отсюда следует, что она убывает на полуинтер- | {z } | {z }
вале (−∞; 0]: −y 2n−1 −x2n−1

x<y60 ⇓
⇓ −y 2n−1 < −x2n−1
0 6 −y < −x ⇓
⇓ x2n−1 < y 2n−1
(−y)2n < (−x)2n Остается заметить, что значения функции на
| {z } | {z }
y 2n x2n полуинтервале (−∞; 0] меньше значений на
[0; +∞). Это следует из того, что эти интервалы
⇓ имеют общую точку 0:
2n
y < x2n
x<0<y
Для доказательства (3.1.32) нужно просто рас-
смотреть два случая: x > 0 и x < 0. ⇓
§ 2. Предел последовательности 201

2n−1
x
| {z < 0} & 0 < y 2n−1 Из него и условия нечетности (3.1.17) выводит-
| {z }
потому что потому что
ся убывание на интервале (−∞; 0) по аналогии с
x, 0 ∈ (−∞; 0] 0, y ∈ [0; +∞) тем, как это делалось в примере 3.1.19. Свойства
| {z } (3.1.36) следуют из из условия сохранения зна-
⇓ ка (2.2.279) теоремы 2.2.17 и условия нечетности
(3.1.17).
x2n−1 < 0 < y 2n−1 (3.1.34) ⊲ 3.1.22. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами:
Формулы (3.1.33) можно вывести из возрастания
функции x 7→ x2n−1 , а можно объявить их след- 1) на интервале (−∞; −1) функция f убывает и
ствием уже доказанного неравенства (3.1.34). ограничена;
2) на интервале (−1; 0) функция f возрастает и
⋄ 3.1.20. Степенная функция x 7→ x−2n , n ∈ N,
ограничена;
— возрастает на интервале (−∞; 0), 3) на интервале (0; 1) функция f убывает, огра-
— убывает на интервале (0; +∞). ничена снизу, но не ограничена сверху;
При этом, 4) на интервале (1; +∞) функция f возрастает
и ограничена;
x 6= 0 =⇒ x−2n > 0 (3.1.35)
Понятно, что эта задача имеет неединствен-
ное решение. В качестве возможного ответа мы
Доказательство. Убывание на интервале предлагаем следующую картинку:
(0; +∞) следует из условия монотонности
(2.2.281) теоремы 2.2.17. Из него и условия чет-
ности (3.1.15) выводится возрастание на интер-
вале (−∞; 0) по аналогии с тем, как это делалось
в примере 3.1.18. Свойства (3.1.35) следуют из
из условия сохранения знака (2.2.279) теоремы
2.2.17 и условия четности (3.1.15).

⋄ 3.1.21. Степенная функция x 7→ x−(2n−1) ,


n ∈ N, ⊲ 3.1.23. Нарисуйте график какой-нибудь функ-
ции f : R → R со следующими свойствами:
— убывает на интервале (−∞; 0),
— убывает на интервале (0; +∞). 1) на интервале (−∞; −2) функция f возрастает
и ограничена;
При этом,
2) на интервале (−2; 0) функция f убывает,
−(2n−1) ограничена сверху, но не ограничена снизу;
x > 0 =⇒ x >0
(3.1.36) 3) на интервале (0; 1) функция f возрастает и не
x < 0 =⇒ x−(2n−1) < 0 ограничена ни сверху, ни снизу;
4) на интервале (1; +∞) функция f возрастает
Доказательство. Как и в предыдущем приме-
и ограничена снизу.
ре убывание на интервале (0; +∞) следует из
условия монотонности (2.2.281) теоремы 2.2.17. Один из возможных ответов выглядит так:

§2 Предел последовательности
Напомним, что понятие бесконечной последовательности было определено на с.73. В частном слу-
чае, когда значения последовательности являются числами, такая последовательность называется
числовой. Выпишем это определение для ссылок:
• Числовой последовательностью называется произвольное отображение a : N → R (на-
турального ряда N в множество R вещественных чисел). Значения такого отображения
принято записывать с помощью нижнего индекса

an = a(n), n ∈ N.

а само отображение – в виде семейства {an ; n ∈ N} или {an }. (Понятно, что вместо a
может употребляться любая другая буква.)
202 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Способы описания числовой последовательности. В математическом анализе имеется толь-


ко три способа определить числовую последовательность. Мы перечислим их в следующих приме-
рах.

⋄ 3.2.1. Последовательности, заданные яв- (ниже в главе 10 мы докажем неочевидный факт,


но. Первый способ – написать формулу вида что эту последовательность можно задать и яв-
ной формулой (10.3.149)). Отметим, что в этом
xn = f (n), (3.2.37) примере ссылка на теорему 2.2.6, из которой мы
в которой f – заранее определенная функция. выводили саму возможность определений по ин-
Например, следующие формулы явно задают дукции не вполне корректна, потому что в каче-
последовательности, поскольку функции в пра- стве начальных данных в определении (3.2.38)
вых частях были уже нами определены: используются два числа, x1 и x2 (а не одно,
x1 ). Для обоснования такого индуктивного при-
1 ема нужно заменить теорему 2.2.6 на формаль-
xn = , xn = n, xn = (−1)n .
n но другое утверждение, в котором отображе-
Естественно, под f в формуле (3.2.37) можно ние G будет действовать на последовательно-
также понимать какую-нибудь функцию, состав- сти элементов a1 , ..., an ∈ A длиной не меньше
ленную из уже определенных, с помощью явно 2. Поскольку пример Фибоначчи используется в
описанных операций, например, операции ком- нашем учебнике исключительно как иллюстра-
позиции, ция, мы предоставляем читателю самостоятель-
x = 2n
2
но продумать эти детали.
n

или алгебраических операций,


⋄ 3.2.3. Последовательности, заданные с
xn = n2 − n
помощью аксиомы выбора. Последний спо-
или операции индуктивного суммирования, соб – воспользоваться следующим частным слу-
чаем аксиомы выбора, описанной на с.64:
n
X 1
xn = • Аксиома счетного выбора: для вся-
k
k=1
кой последовательности непустых множеств
или каких-то других операций (например, диф- {Xn ; n ∈ N} можно подобрать
S последова-
ференцирования и интегрирования которые мы тельность {xn ; n ∈ N} ⊆ n∈N Xn такую, что
опишем ниже). Во всех этих случаях считается, для всякого n ∈ N объект xn является эле-
что формула задает последовательность явно. ментом множества Xn :
⋄ 3.2.2. Последовательности, заданные ре-
куррентно. Второй способ – задать последова- ∀n ∈ N xn ∈ Xn .
тельность индуктивно с помощью теоремы 2.2.6
(об определениях полной индукцией). В таких
случаях говорят также, что последовательность Этот способ может показаться слишком аб-
задана рекуррентно. Например, правило страктным, но, как правило, именно он (за ред-
  кими исключениями) используется при дока-
1 1 зательстве общих утверждений там, где быва-
x1 = 2, xn+1 = xn +
2 xn ет нужно построить последовательность с за-
индуктивно задает некую числовую последова- данными свойствами. Ниже на примере до-0
тельность (ниже в примере 3.2.48 мы будем изу- казательств
0
свойств подпоследовательностей 2
чать ее свойства). и 3 на с.228 и при доказательстве теоремы
Другой пример – знаменитая последователь- Больцано-Вейерштрасса 3.2.13 мы подробно об-
ность Фибоначчи, задаваемая правилом суждаем этот эффект в связи с замечаниями о
приеме бесконечнократного выбора, которые мы
x1 = x2 = 1, xn+2 = xn+1 + xn , (3.2.38) делаем там же.

Способы изображения числовой последовательности. Множество натуральных чисел N,


по которому бегает аргумент n последовательности {xn }, обладает довольно редко встречающим-
ся в математике свойством перечислимости. Это значит, что можно указать алгоритм, который
сначала выдаст первый элемент этого множества, n = 1, а затем для каждого n ∈ N сгенерирует
следующий за ним элемент n + 1, и таким образом будут перечислены все элементы N. Из этого
§ 2. Предел последовательности 203

следует, что последовательность {xn } можно представлять себе в виде таблицы, в которой первую
строчку (множество значений аргумента) занимают натуральные числа, а вторая строчка будет
занята соответствующими вещественными числами (значениями последовательности):

1 2 3 4 5 6 7 ...
x1 x2 x3 x4 x5 x6 x7 ...

Поскольку ячеек у такой таблицы должно быть бесконечно много, всю ее нарисовать, конечно,
невозможно, однако в качестве зрительного образа, который можно держать в голове, когда речь
заходит о последовательностях, такое представление бывает полезно.
Но оно фокусирует внимание наблюдателя на первых элементах последовательности и бывает
удобно только там, где важно ее “начало”, а на остающийся “хвост” можно не обращать внимание.
Нас же, наоборот, будет главным образом интересовать этот “хвост”: первые значения как раз не
будут нам особенно нужны (причем, каким бы длинным ни был этот начальный отрезок последова-
тельности), а важной для нас будет лишь закономерность, позволяющая понять, к чему стремится
данная последовательность (и стремится ли она к чему-то).
Пытаться уловить эту закономерность (разумеется, не на произвольных примерах, а на специаль-
но подобранных, обучающих) гораздо удобнее, пользуясь другим зрительным образом, в котором
последовательность изображается системой направленных дуг, символизирующих переходы от xn
к xn+1 :

Это можно представлять себе как движение “блохи, прыгающей по прямой”: сначала эта “блоха
находилась в точке x1 ”, затем “прыгнула в точку x2 ”, и так далее. Понятно, что и здесь всю систему
дуг нарисовать никогда не бывает возможно (потому что их тоже бесконечно много), однако как
зрительный образ такое представление оказывается удивительно полезным.

⋄ 3.2.4. xn = 1
n ⋄ 3.2.7. xn = (−1)n · n

⋄ 3.2.5. xn = n
⋄ 3.2.8. xn = (−1)n

(−1)n
⋄ 3.2.6. xn = n ⋄ 3.2.9. xn = 3 (постоянная последовательность)
204 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(a) Предел числовой последовательности


“Почти все n ∈ N”. Пусть P обозначает какое-нибудь переменное высказывание о натуральных
числах (например, “n > 10”, или “n четное”, и т.д.).
• Говорят, что почти все числа n ∈ N обладают свойством P , если только конечное (воз-
можно, пустое) множество чисел n ∈ N не обладает этим свойством:

card{n ∈ N : ¬P } < ∞ (3.2.39)

Это эквивалентно тому, что свойство P выполняется для всех n ∈ N, начиная с некоторого
номера:
∃N ∈ N ∀n > N P (3.2.40)

Доказательство эквивалентности. Пусть P – какое-то переменное высказывание о натуральных


числах. Обозначим буквой A множество тех чисел n ∈ N, для которых P ложно, а через B множество
тех чисел n ∈ N, для которых P истинно:

A = {n ∈ N : ¬P }, B = {n ∈ N : P}

Тогда
(3.2.39)
m
card A < ∞
m теорема 2.2.12

∃N ∈ N A ⊆ {1, ..., N }
m
∃N ∈ N {n ∈ N : n > N} ⊆ B
m
(3.2.40)

⋄ 3.2.10. Ясно, что почти все числа n ∈ N удо- выполняется для почти всех n ∈ N?
влетворяют неравенству Понятно, что это не так, потому что оно
выполняется только для четных чисел (n =
n>5
2, 4, 6, 8, ...), а для нечетных чисел (n =
потому что чисел n ∈ N, не удовлетворяющих 1, 3, 5, 7, ...) – которых бесконечно много – оно
этому неравенству имеется только конечное мно- неверно.
жество (а именно n ∈ {1, 2, 3, 4}).
⋄ 3.2.11. Наоборот, неверно, что почти все числа ⊲ 3.2.13. Верно ли, что обратное неравенство
n ∈ N удовлетворяют неравенству
(−1)n 6 0
n<5
потому что чисел n ∈ N, не удовлетворяющих выполняется для почти всех n ∈ N?
этому неравенству бесконечно много (а именно, Это, конечно, тоже не так, потому что это-
n = 5, 6, 7, 8, ...). му неравенству удовлетворяют только нечетные
⊲ 3.2.12. Сообразим, будет ли неравенство числа (n = 1, 3, 5, 7, ...), а для четных чисел
(n = 2, 4, 6, 8, ...) – которых бесконечно много –
(−1)n > 0 оно неверно.
§ 2. Предел последовательности 205

Теорема 3.2.1 (Архимеда). Каково бы ни было число C ∈ R, почти все числа n ∈ N удовлетворя-
ют неравенству
n>C (3.2.41)
Доказательство. Это следует из принципа Архимеда (теорема 2.2.10). Выберем какое-нибудь N ∈
N так, чтобы N > C. Тогда все числа n, начиная с числа N , удовлетворяют неравенству (3.2.41),
потому что n > N > C.

⊲ 3.2.14. Следующая “абстрактная” задача мо- бесконечное множество) не лежат в M ;


жет считаться тестом на понимание термина “по- (E) все числа n ∈ N не лежат в множестве M (то
чти все”. Пусть M какое-нибудь множество нату- есть M = ∅).
ральных чисел (M ⊆ N), рассмотрим пять воз-
можных ситуаций: Ответьте на вопросы:
(A) все числа n ∈ N лежат в множестве M (то 1) в каких из этих случаев почти все числа n ∈ N
есть M = N); лежат в множестве M ?
(B) конечный набор чисел n ∈ N не лежит в мно- 2) в каких случаях почти все числа n ∈ N не
жестве M , а остальные числа n ∈ N (которых лежат в множестве M ?
– бесконечное множество) лежат в M ; 3) в каких случаях не верно ни то, ни другое?
(C) бесконечный набор чисел n ∈ N не лежит в Ответы:
множестве M , и одновременно бесконечный
набор чисел n ∈ N лежит в M (такое быва- 1) (A) и (B) (чисел, лежащих в M больше, чем
ет, например, когда M – множество четных остальных);
чисел); 2) (D) и (E) (чисел, не лежащих в M больше,
(D) конечный набор чисел n ∈ N лежит в множе- чем остальных);
стве M , а остальные числа n ∈ N (которых – 3) (C).

• Говорят, что почти все элементы последовательности {xn } принадлежат множеству


E, если для почти всех номеров n ∈ N соответствующие числа {xn } принадлежат множе-
ству E.

⋄ 3.2.15. Проверим, что почти все элементы по- няется для почти всех n ∈ N, по теореме Архи-
следовательности
 {xn = n1 } лежат в интервале меда 3.2.1.
1
0; 4 .
⋄ 3.2.16. Верно ли, что почти все элементы по-
следовательности
 {xn = n1 } лежат в интервале
1
4; ∞ ?

Действительно,

   
1 1 1 Нет, конечно, потому что
xn ∈ 0; ⇔ ∈ 0; ⇔
4 n 4  
 1 1 1
 1 <1 1 1 xn ∈ ;∞ ⇔ > ⇔ n<4

n 4
⇔ < ⇔ n>4 4 n 4
 1 >0 n 4
n а последнее неравенство выполняется не для
▼❇ почти всех чисел n ∈ N, а только для n ∈
❇ {1, 2, 3}.
это неравенство выполняется автоматически для любого n ∈ N,
поэтому его можно отбросить
⋄ 3.2.17. Верно ли, что почти все элементы по-
а последнее неравенство в этой цепочке выпол- следовательности {xn = (−1)n } лежат в интер-
206 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

вале (0; 2)? вале (α; β).

При этом ясно, что если α > 1 или β < 1,


Чтобы это понять, разберемся сначала для ка-
то утверждение, что почти все числа xn лежат
ких номеров n ∈ N числа xn лежат в интервале
в интервале (α; β) будет неверно. Поэтому ответ
(0; 2):
для второй половины задачи выглядит так
Ответ для пункта (b): α < 1 6 β.
xn ∈ (0; 2) ⇔ (−1)n ∈ (0; 2) ⇔ ⋄ 3.2.19. (a) Найдите какие-нибудь два числа α

 (−1)n > 0 и β такие, чтобы почти все элементы последо-
⇔ ⇔ (−1)n > 0 вательности xn = (−1)n лежали в интервале
 (−1)n < 2 (α; β).
▼❇❇ (b) Найдите все такие числа α и β, чтобы почти
это неравенство выполняется автоматически для любого n ∈ N,
все элементы последовательности xn = (−1)n
поэтому его можно отбросить лежали в интервале (α; β).
Снова нарисуем на прямой первые несколько
элементов нашей последовательности
Последнее неравенство в этой цепочке выполня-
ется не для почти всех чисел n ∈ N а только
для четных: n ∈ {2, 4, 6, ...}. Значит, соотноше-
ние xn ∈ (0; 2) тоже выполняется не для почти
всех чисел n ∈ N.

⋄ 3.2.18. (a) Найдите какие-нибудь два числа α


и β такие, чтобы почти все элементы после- Из рисунка видно, что, например, вне интер-
довательности xn = n−1
n лежали в интервале вала (−2; 2) нет вообще никаких чисел xn . Отсю-
(α; β). да следует
(b) Найдите все такие числа α и β, чтобы почти Ответ для пункта (a): можно взять, напри-
все элементы последовательности xn = n−1 n мер, α = −2 и β = 2.
лежали в интервале (α; β). И вообще, если взять какие-нибудь другие
числа α и β так чтобы α < −1 и β > 1, то все xn
Нарисуем на прямой первые несколько эле-
будут лежать в интервале (α; β).
ментов нашей последовательности

Если же α > 1 или β 6 1, то утверждение,


что почти все числа xn лежат в интервале (α; β)
Из рисунка видно, что, например, вне интер-
будет неверно. Поэтому ответ для второй поло-
вала ( 12 ; 2) лежит только конечный набор чисел
вины задачи выглядит так
xn . Отсюда следует
Ответ для пункта (b): α < −1 и β > 1.
Ответ для пункта (a): можно взять, напри-
⊲⊲ 3.2.20. Ничего не доказывая, но пользуясь
мер, α = 12 и β = 2.
интуицией, попробуйте сообразить, какие интер-
Более того, если взять какие-нибудь другие валы (α; β) содержат почти все элементы данной
числа α и β так чтобы α < 1 6 β, то начиная с последовательности xn . Опишите все такие ин-
какого-то номера все xn будут лежать в интер- тервалы для последовательностей
§ 2. Предел последовательности 207

n
1 −1
1) xn = (−1)n + n 8) xn = (−1)n · n(−1)
(Ответ: α 6 −1, β > 1) (Ответ: α < 0, β > 1)
n
2) xn = (−1) − n1n
9) xn = (−1)n + n(−1) −1

(Ответ: α < −1, β > 1) (Ответ: α 6 −1, β > 2)


n
3) xn = (−1) · n 10) xn = n · (1 + (−1)n )
(Ответ: α = −∞, β = ∞) (Ответ: α < 0, β = ∞)
n n n
4) xn = (−1)n + 1+(−1)2 11) xn = 2+(−1)
2 − n1
(Ответ: α < 0, β > 1) 1
(Ответ: α < 2 , β > 23 )
n 
5) xn = 2 + 1+(−1)n 12) xn = (−1)n · 1 − 1
n
(Ответ: α < 2, β > 2) (Ответ: α 6 −1, β > 1)
n 
6) xn = 2 − 1+(−1)n 13) xn = (−1)n · 1 + 1
n
(Ответ: α < 2, β > 2) (Ответ: α < −1, β > 1)
n
3

7) xn = n(−1) 14) xn = (−1)n−1 · 2 + n
(Ответ: α 6 0, β = ∞) (Ответ: α < −2, β > 2)

Окрестность точки.
• Окрестностью точки c ∈ R называется всякий интервал с центром в точке c, то есть
всякий интервал вида (c − ε; c + ε). Число ε при этом называется радиусом окрестности
(c − ε; c + ε).

Предложение 3.2.2. Всякая точка x произвольного интервала (a, b) содержится в нем вместе
с некоторой своей окрестностью:

x ∈ (a, b) =⇒ ∃ε > 0 : (x − ε; x + ε) ⊆ (a, b)

Доказательство. Положим
ε = min{b − x; x − a}.
Тогда
( ( (
ε6b−x ε6b−x x+ε 6 b
=⇒ =⇒ =⇒
ε 6 x−a −ε > a − x x−ε > a
=⇒ a6x−ε<x<x+ε6b =⇒ x ∈ (x − ε, x + ε) ⊆ (a, b)

Конечный предел последовательности.


• Точка c ∈ R называется пределом последовательности {xn }, если любая ее окрестность
(c − ε; c + ε) содержит почти все элементы последовательности {xn }. В этом случае пишут

lim xn = c
n→∞

или
xn −→ c
n→∞

и говорят, что последовательность {xn } стремится к числу c.


Если последовательность {xn } имеет предел (то есть стремится к какому-то числу c), то
говорят, что последовательность {xn } сходится . Если же такого числа c не существует,
то говорят, что последовательность {xn } расходится .

⋄ 3.2.21. Покажем, что следовательности {xn = n−1


n }.
n−1
lim =1
n→∞ n
то есть что точка c = 1 является пределом по- Действительно, возьмем какую-нибудь
208 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

окрестность (1 − ε; 1 + ε) точки c = 1, (0; 2) точки c = 1. Это означает, что c = 1 не мо-


жет быть пределом последовательности {xn =
(−1)n }.

⋄ 3.2.23. Покажем, что

2n + 3
lim =2
n→∞ n+2

и поймем, что означает, что xn лежит в (1−ε; 1+ то есть что точка c = 2 является пределом по-
ε): следовательности {xn = 2n+3
n+2 }.
Возьмем какую-нибудь окрестность (2 − ε; 2 +
ε) точки c = 2
xn ∈ (1 − ε; 1 + ε) ⇔ 1 − ε < xn < 1 + ε ⇔
( (
n−1
xn > 1 − ε n > 1−ε
⇔ ⇔ n−1

xn < 1 + ε n < 1+ε
( (
n−1
n − 1 > −ε − n1 > −ε
⇔ n−1
⇔ ⇔
n −1 <ε − n1 < ε

 1
 n <ε 1 1
⇔ ⇔ <ε ⇔ n>
 1
 −n < ε n ε Тогда

▼❇

поскольку ε > 0,
xn ∈ (2 − ε; 2 + ε) ⇔ 2 − ε < xn < 2 + ε ⇔
это неравенство выполняется автоматически для любого n ∈ N,
значит его можно отбросить ( (
2n+3
xn > 2 − ε n+2 > 2 − ε
По теореме Архимеда 3.2.1, последнее нера- ⇔ ⇔ 2n+3

xn < 2 + ε n+2 < 2 + ε
венство выполняется для почти всех n ∈ N. Это ( (
2n+3 1
означает, что почти все числа xn содержатся в n+2 − 2 > −ε − n+2 > −ε
⇔ ⇔ ⇔
интервале (1 − ε; 1 + ε). 2n+3
− 2 < ε − 1
n+2 n+2 < ε
Итак, мы получили, что любая окрестность 
 1
(1 − ε; 1 + ε) точки c содержит почти все элемен-  n+2 < ε 1
ты последовательности {xn = n−1 n }. Это как раз
⇔ ⇔ <ε ⇔
 1
 −n + 2 < ε n + 2
означает, что точка c = 1 является пределом по-
следовательности {xn = n−1 n }. ❇▼

⋄ 3.2.22. Покажем, что поскольку ε > 0,
это неравенство выполняется автоматически для любого n ∈ N,

1 6= lim (−1)n значит его можно отбросить

n→∞
1 1
то есть что число c = 1 не является пределом ⇔ n+2> ⇔ n> −2
ε ε
последовательности {xn = (−1)n }.
Возьмем ε = 1 и рассмотрим соответствую- По теореме Архимеда 3.2.1, последнее неравен-
щую окрестность (0; 2) точки c = 1. Тогда ство выполняется для почти всех n ∈ N. Это
означает, что почти все числа xn содержатся в
xn ∈ (0; 2) ⇔
 интервале (2 − ε; 2 + ε).
 0 < (−1)n Итак, мы получили, что любая окрестность
⇔ ⇔ 0 < (−1)n (2 − ε; 2 + ε) точки c = 2 содержит почти все
 (−1)n < 2
элементы последовательности {xn = 2n+3 n+2 }. Это
❇▼ означает, что точка c = 2 является пределом по-

это неравенство выполняется автоматически для любого n ∈ N, следовательности {xn = 2n+3 n+2 }.
поэтому его можно отбросить

Последнее неравенство выполняется только для ⋄ 3.2.24. Покажем, что


четных n ∈ N.
Мы получили, что бесконечное множество (−1)n
n lim =0
элементов последовательности {xn = (−1) } не n→∞ n
принадлежит окрестности (0; 2) точки c = 1. Та-
ким образом, будет неверно утверждать, что по- то есть что точка c = 0 является
n
пределом по-
чти все {xn = (−1)n } содержатся в окрестности следовательности {xn = (−1)
n }.
§ 2. Предел последовательности 209

Возьмем какую-нибудь окрестность (−ε; ε) Для этого нужно будет рассмотреть отдель-
точки c = 0 но четные и нечетные номера n. Тогда условие
xn ∈ (−1; 1) распадется в совокупность двух си-
стем:
(
−1 < xn
xn ∈ (−1; 1) ⇔ ⇔
xn < 1
n
поскольку всегда n(−1) > 0,
это неравенство выполняется автоматически для любого n ∈ N,
значит его можно отбросить


 ✂✌
 −1 < n(−1)n n
⇔ ⇔ n(−1) < 1 ⇔
n
 n(−1) < 1
n

и покажем, что почти все числа xn = (−1)n со-  


держатся в интервале (−ε; ε). Действительно, 
 n – четное: n = 2k, k ∈ N 
  тогда (−1)n = (−1)2k = 1  
 
 и при подстановке получается: 
 

 (2k)1 < 1 
xn ∈ (−ε; ε) ⇔ (3.1.13) ⇔ ⇔   
n – нечетное: n = 2k − 1, k ∈ N ⇔
(−1)n  
⇔ |xn | < ε ⇔ <ε ⇔  тогда (−1)n = (−1)2k = −1 
 
n  и при подстановке получается:

 

⇔ (3.1.7), (3.1.8), (3.1.5) ⇔ (2k − 1)−1 < 1
n    
| − 1| 1 1 n = 2k 
⇔ <ε ⇔ <ε ⇔ n>  
n n ε  k∈N 
 
⇔   2k < 1 
По теореме Архимеда 3.2.1, последнее нера- n = 2k − 1 ⇔
венство выполняется для почти всех n ∈ N. Это  
 k∈N 
означает, что почти все числа xn содержатся в  1 
2k−1 < 1
окрестности (−ε; ε) точки c = 0. Таким образом,
точка c = 0 действительно является пределом эта система не имеет решений,
последовательности {xn = 2n+3
n+2 }.
поэтому ее можно выбросить из совокупности

⋄ 3.2.25. Покажем, что   ✌✂✂ 



n = 2k
0 6= lim n(−1)
n
 
 k∈N 
n→∞   1  
 k< 2 
 
то есть что точка c = 0 не является пределом ⇔   ⇔
n  
последовательности {xn = n(−1) }. n = 2k − 1
 
Возьмем интервал (−1; 1), являющийся  k∈N 
окрестностью точки c = 0 (при ε = 1).  
2k − 1 > 1
   
n = 2k − 1 n = 2k − 1
⇔ k∈N ⇔ k∈N
   
k>1 k>1

Мы видим, что условие xn ∈ (−1; 1) выполняется


только для индексов n = 3, 5, 7.... Таким образом,
бесконечное множество чисел xn (с четными ин-
дексами n) не содержатся в окрестности (−1; 1)
и посмотрим, что будет означать условие xn ∈ точки c = 0. Значит эта точка не может быть
n
(−1; 1). пределом последовательности {xn = n(−1) }.

Теорема 3.2.3 (о единственности предела). Если

xn −→ a
n→∞

и
xn −→ b
n→∞
210 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

то
a=b
Доказательство. Предположим, что a 6= b, например a < b. Возьмем ε = b−a 2 , тогда мы получим,
что почти все xn лежат в двух непересекающихся интервалах – в (a − ε; a + ε) и в (b − ε; b + ε):

xn xn
n
n
↓ ↓ ↓ ↓


a−ε< a <a+ε=b−ε< b <b+ε
| {z } | {z }
⇓ ⇓
xn ∈ (a − ε, a + ε) xn ∈ (b − ε, b + ε)
для почти всех n ∈ N для почти всех n ∈ N

Но это невозможно: если почти все xn лежат в (a − ε; a + ε), то вне (a − ε; a + ε) должен лежать
лишь конечный набор чисел xn . В частности, в (b − ε; b + ε) тоже должен лежать лишь конечный
набор чисел xn .

⊲⊲ 3.2.26. Доказать что 4) limn→∞ 1−n


n+1 = −1,
1 1
1) limn→∞ n3 = 0, 5) limn→∞ 1+2 n = 0,
n−3 1
2) limn→∞ 2n+5 = 2,
6) 1 6= limn→∞ (−1)n ,
3)
2
limn→∞ nn2 +2
+1
= 1, 7) 0 6= limn→∞ (−1)n · n.

Бесконечный предел последовательности.


• Говорят, что числовая последовательность {xn }
– стремится к +∞
xn −→ +∞
n→∞

если любой интервал (E; +∞) содержит почти все элементы {xn }.
– стремится к −∞
xn −→ −∞
n→∞

если любой интервал (−∞; E) содержит почти все элементы {xn }.


– стремится к ∞
xn −→ ∞
n→∞

если всякое множество (−∞; −E) ∪ (E; +∞) содержит почти все элементы {xn };
нетрудно проверить, что это равносильно тому, что последовательность из мо-
дулей {|xn |} стремится к +∞:

|xn | −→ +∞
n→∞

⋄ 3.2.27. Покажем, что Возьмем какой-нибудь интервал (E; +∞)

Тогда
lim n2 = +∞ xn ∈ (E; +∞) ⇔ xn > E ⇔ n2 > E
n→∞
§ 2. Предел последовательности 211

Заметим далее такую цепочку: (−1)2k−1 = −1, и

n > E верно для почти всех n ∈ N


xn ∈ (−∞; −1) ∪ (1; +∞) ⇔ |xn | > 1 ⇔
по теореме Архимеда 3.2.1
(−1)n
⇔ n >1 ⇔
⇓  применяем равенства 
n2 > n > E верно для почти всех n ∈ N ⇔ n = 2k − 1, ⇔
(−1)n = (−1)2k−1 = −1
⇓ ⇔ (2k − 1)−1 > 1 ⇔ 2k − 1 < 1 ⇔
2
n > E верно для почти всех n ∈ N ⇔ k<1
⋄ 3.2.28. Покажем, что последовательность
n
{xn = n(−1) } не стремится к бесконечности: Последнее неравенство не выполняется ни при
(−1)n каком k = 1, 2, 3... Это означает, что все чис-
n −→
6 ∞
n→∞ ла x2k−1 не содержатся в множестве (−∞; −1) ∪
(1; +∞). Таким образом, бесконечное множество
Возьмем множество (−∞; −1) ∪ (1; +∞)
чисел xn не содержатся в “окрестности беско-
нечности” (−∞; −1) ∪ (1; +∞). Значит, бесконеч-
ность не может быть пределом последовательно-
n
сти {xn = n(−1) }.

⊲⊲ 3.2.29. Доказать что


4n+1
1) limn→∞ 3n−2 6= +∞;
n2
и рассмотрим нечетные номера n, то есть чис- 2) limn→∞ 1−2n = −∞;
ла вида n = 2k − 1, где k ∈ N. Тогда (−1)n = 3) n
limn→∞ (−1) · n = ∞.

Бесконечно малые и бесконечно большие последовательности.


• Последовательность {xn } называется бесконечно малой , если выполняются следующие
равносильные условия:
(i) {xn } стремится к нулю:
xn −→ 0
n→∞

(ii) {xn } по модулю стремится к нулю:

|xn | −→ 0
n→∞

Доказательство. Здесь необходимо проверить, что условия (i) и (ii) действительно равносильны.
Для этого перепишем свойство модуля 20 пункта 0.6, подставив вместо x последовательность {xn }:

xn ∈ (−ε; +ε) ⇐⇒ |xn | ∈ (−ε; +ε)

После этого получается следующая цепочка равносильностей:

xn −→ 0
n→∞

m
для всякого ε > 0 соотношение xn ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
для всякого ε > 0 соотношение |xn | ∈ (−ε; +ε) выполняется для почти всех n ∈ N
m
|xn | −→ 0
n→∞
212 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

• Последовательность {xn } называется бесконечно большой , если выполняются следующие


равносильные условия:
(i) {xn } стремится к бесконечности

xn −→ ∞
n→∞

(ii) {xn } по модулю стремится к бесконечности

|xn | −→ ∞
n→∞

Доказательство равносильности условий (i) и (ii).

xn −→ ∞
n→∞

для всякого ε > 0 соотношение xn ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N

m (3.1.14)

для всякого ε > 0 соотношение |xn | ∈ (−∞; −E) ∪ (E : +∞) выполняется для почти всех n ∈ N

|xn | −→ ∞
n→∞

Теорема 3.2.4 (о связи между бесконечно малыми и бесконечно большими последовательностями).


Пусть xn 6= 0. Тогда последовательность {xn } бесконечно малая тогда и только тогда, когда
последовательность { x1n } бесконечно большая.

Доказательство.
{xn } – бесконечно малая

xn −→ 0
n→∞

∀ε > 0 |xn | < ε – верно для почти всех n ∈ N

m
1 1
∀ε > 0 > – верно для почти всех n ∈ N
xn ε
m
1
∀E > 0 >E – верно для почти всех n ∈ N
xn
m
1
−→ ∞
xn n→∞
m
 
1
– бесконечно большая.
xn
§ 2. Предел последовательности 213

Теорема 3.2.5 (о связи между бесконечно малыми последовательностями и конечными пределами).


Последовательность {xn } стремится к числу a

xn −→ a
n→∞

тогда и только тогда, когда она имеет вид

xn = a + αn

где {αn } – некоторая бесконечно малая последовательность.


Доказательство. Положим
αn = xn − a
и заметим сразу, что

(
a − ε < xn
xn ∈ (a − ε; a + ε) ⇐⇒ a − ε < xn < a + ε ⇐⇒ ⇐⇒
xn < a + ε
(
−ε < xn − a
⇐⇒ ⇐⇒ −ε < xn − a < ε ⇐⇒ −ε < αn < ε ⇐⇒ αn ∈ (−ε; ε)
xn − a < ε

поэтому окрестность (a − ε; a + ε) точки a содержит почти все элементы последовательности xn в


том и только в том случае, если окрестность (−ε; ε) точки 0 содержит почти все элементы после-
довательности αn .
Отсюда следует, что если xn −→ a (то есть любая окрестность (a − ε; a + ε) точки a содержит
n→∞
почти все элементы последовательности xn ), то это равносильно тому, что αn −→ 0 (то есть тому,
n→∞
что любая окрестность (−ε; ε) точки 0 содержит почти все элементы последовательности αn ).

Свойства бесконечно малых последовательностей


1◦ Если {αn } – бесконечно малая последовательность, то для любого числа C ∈ R последова-
тельность {C · αn } – тоже бесконечно малая.
2◦ Если {αn } и {βn } – бесконечно малые последовательности, то {αn + βn } и {αn − βn } –
тоже бесконечно малые последовательности.
3◦ Если {αn } и {βn } – бесконечно малые последовательности, то {αn · βn } – тоже бесконечно
малая последовательность.
Доказательство. 1. Пусть {αn } – бесконечно малая последовательность. Тогда если C = 0, то

C · αn = 0 −→ 0
n→∞

и поэтому {C · αn } – тоже бесконечно малая. Рассмотрим случай, когда C 6= 0. Тогда:

{αn } – бесконечно малая

m
αn −→ 0
n→∞

m
∀ε > o |αn | < ε – верно для почти всех n ∈ N
m
ε
∀ε > o |αn | < – верно для почти всех n ∈ N
|C|
m
∀ε > o |C · αn | < ε – верно для почти всех n ∈ N
m
214 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

{C · αn } – бесконечно малая
2. Пусть {αn } и {βn } – бесконечно малые последовательности, покажем что тогда {αn + βn } –
тоже бесконечно малая последовательность:

{αn } и {βn } – бесконечно малые


αn −→ 0, βn −→ 0
n→∞ n→∞


∀ε > o |αn | < ε & |βn | < ε – верно для почти всех n ∈ N

ε ε
∀ε > o |αn | < & |βn | < – верно для почти всех n ∈ N
2 2

ε ε
∀ε > o |αn + βn | 6 |αn | + |βn | < + – верно для почти всех n ∈ N
2 2

{αn + βn } – бесконечно малая
Точно так же рассматривается случай {αn − βn }.
3. Пусть снова {αn } и {βn } – бесконечно малые последовательности, покажем что {αn · βn } –
тоже бесконечно малая последовательность:

{αn } и {βn } – бесконечно малые


αn −→ 0, βn −→ 0
n→∞ n→∞


∀ε > 0 |αn | < ε & |βn | < ε – верно для почти всех n ∈ N

∀ε ∈ (0; 1) |αn | < ε & |βn | < ε – верно для почти всех n ∈ N

∀ε ∈ (0; 1) |αn · βn | = |αn | · |βn | < ε2 < ε – верно для почти всех n ∈ N

∀ε > o |αn · βn | < ε – верно для почти всех n ∈ N

{αn · βn } – бесконечно малая.

Свойства бесконечно больших последовательностей


1◦ Если C 6= 0 и yn −→ ∞, то C · yn −→ ∞.
n→∞ n→∞
2◦ Если xn −→ C 6= ∞, а yn −→ ∞, то xn + yn −→ ∞.
n→∞ n→∞ n→∞
3◦ Если xn −→ C 6= 0, а yn −→ ∞, то xn · yn −→ ∞.
n→∞ n→∞ n→∞
yn
4◦ Если xn −→ C 6= ∞, а yn −→ ∞, то xn n→∞ ∞.
−→
n→∞ n→∞

5 Если xn −→ ∞ и |xn | 6 yn , то yn −→ ∞.
n→∞ n→∞
§ 2. Предел последовательности 215

Доказательство. Мы докажем только второе из этих свойств (остальные доказываются аналогич-


но):
xn −→ C 6= ∞ yn −→ ∞
n→∞ n→∞
⇓ ⇓
|xn | − |C| 6 (3.1.11) 6 |xn − C| < 1 ∀D > 0 |yn | > D + |C| + 1
| {z } | {z }
↑ ↑
верно для почти всех n ∈ N верно для почти всех n ∈ N

|xn | < |C| + 1
| {z }

верно для почти всех n ∈ N
| {z }


D + |C| + 1
>

z}|{
∀D > 0 |yn +xn | > (3.1.10) > |yn | −|xn | > (D+|C|+1)−|C|−1 = D – верно для почти всех n ∈ N
| {z }
<

−|C| − 1


xn + yn −→ ∞
n→∞

⋄ 3.2.30. Для любого α 6= 0 последовательность ⋄ 3.2.31. Последовательность {nk }n∈N является


{α · n}n∈N является бесконечно большой, точнее: – бесконечно малой, если k < 0;
( – бесконечно большой, если k > 0.
+∞, если α > 0
lim n · α = (3.2.42) Точнее,
n→∞ −∞, если α < 0
(
Доказательство. 1. Пусть сначала α > 0. Тогда 0, если k < 0
lim nk = (3.2.43)
для любого E > 0 условие n→∞ +∞, если k > 0
n·α >E
Доказательство. 1. Пусть k > 0. Применяя
эквивалентно условию неравенство Бернулли (2.2.242), мы получим

E (2.2.242)
n> nk = (1 + (n − 1))k >
α
(3.2.42)
которое по теореме Архимеда 3.2.1 выполняется > 1 + k · (n − 1) = 1 − k + k · n −→ +∞
n→∞
для почти всех n. Это означает, что
⇓ ◦
5 на с.214
n · α −→ +∞
n→∞ nk −→ ∞
n→∞
2. Если же α < 0, то для любого E > 0 усло-
2. Пусть k < 0. Тогда −k > 0, и, по уже дока-
вие
занному,
n · α < −E
n−k −→ ∞
n→∞
эквивалентно условию
⇓ теорема 3.2.4
E
n>− 1
α nk = −→ 0
n−k n→∞
и опять по теореме Архимеда 3.2.1 это выполня-
ется для почти всех n. Это означает, что
⋄ 3.2.32. Последовательность an является
n · α −→ −∞
n→∞ – бесконечно малой, если |a| < 1;
– бесконечно большой, если |a| > 1.
216 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

То есть, и мы получаем
( уже
n ∞, если |a| > 1 n доказано
lim a = (3.2.44) 1 1
n→∞ 0, если |a| < 1 = −→ ∞
|a|n a n→∞

Доказательство. 1. Если |a| > 1, то это означает ⇓ теорема 3.2.4


либо a > 1, либо a < −1. Рассмотрим каждый из
этих случаев отдельно. Если a > 1, то применяя |a|n −→ 0
n→∞
неравенство Бернулли (2.2.242), мы получим

(2.2.242)
|a|n = an = (1+(a−1))n > 1+n·(a−1) −→ ∞ ⊲ 3.2.33. Какие из последовательностей явля-
n→∞
ются бесконечно малыми, а какие – бесконечно
⇓ 5◦ на с.214 большими?
1
an −→ ∞ 1) xn = n,
n→∞ 1
2) xn = n2 ,
Если же a < −1, то |a| = −a > 1, и по уже дока- 3) xn = n,
занному,
4) xn = (−1)n · n,
|a|n = (−a)n −→ ∞ n
n→∞
5) xn = (−1)
n ,
1 1 2
2. Пусть наоборот, |a| < 1. Тогда a = |a| > 1, 7) xn = n .

Арифметические операции с пределами. Следующие свойства пределов связаны с арифме-


тическими операциями.
10 . Если xn −→ a, то для всякого числа C ∈ R справедливо C · xn −→ C · a.
n→∞ n→∞
20 . Если xn −→ a и yn −→ b, то xn + yn −→ a + b и xn − yn −→ a − b.
n→∞ n→∞ n→∞ n→∞
30 . Если xn −→ a и yn −→ b, то xn · yn −→ a · b.
n→∞ n→∞ n→∞
yn
40 . Если xn −→ a и yn −→ b, причем a 6= 0 и xn 6= 0 (при любом n), то −→ ab .
xn n→∞
n→∞ n→∞

Доказательство свойств 10 -30 . 1. Свойство 10 доказывается такой логической цепочкой:

xn −→ a
n→∞

⇓ теорема 3.2.5

xn = a + αn
|{z}
n
↓ ↓

0


C · xn = C · a + C · αn
| {z }
n
↓ ↓ (свойство 10 на с.213)

0

⇓ теорема 3.2.5

C · xn −→ C · a
n→∞
0
2. Свойство 2 :
xn −→ a, yn −→ b
n→∞ n→∞

⇓ теорема 3.2.5
§ 2. Предел последовательности 217

xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0


xn + yn = a + b + αn + βn
| {z }
n
↓ ↓ (свойство 20 на с.213)

0

⇓ теорема 3.2.5

xn + yn −→ a + b
n→∞

И точно так же для xn − yn .


3. Свойство 30 :
xn −→ a, yn −→ b
n→∞ n→∞

⇓ теорема 3.2.5

xn = a + αn , y n = b + βn
|{z} |{z}
n n
↓ ↓ ↓ ↓
∞ ∞
0 0


 
свойство 10
на с.213
0

↑ ↑
n
z }| {
xn · yn = a · b + αn · b + a · βn + αn · βn
| {z } | {z }
n n
↓ ↓ ↓ ↓
∞ ∞
 0   0 
свойство 10 свойство 30
на с.213 на с.213
| {z }
n
↓ ↓ (свойство 20 на с.213)

0

⇓ теорема 3.2.5

xn · yn −→ a · b
n→∞

Для доказательства последнего свойства нам понадобится следующая


Лемма 3.2.6. Если последовательность {xn } стремится к числу a, причем xn 6= 0 и a 6= 0, то
последовательность { x1n } стремится к числу a1 :

1 1
xn −→ a (xn 6= 0 & a 6= 0) =⇒ −→
n→∞ xn n→∞ a
Доказательство. По условию, a 6= 0, значит либо a < 0, либо a > 0.
1
1. Рассмотрим сначала случай, когда a > 0. Тогда в силу (2.1.29), a > 0. Выберем произвольное
ε такое, что
1
0<ε<
a
Тогда
ε · a > 0 > −ε · a

1+ε·a>1 > 1−ε·a
218 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ


1 1
<1<
1+ε·a 1−ε·a

a a
<a<
1+ε·a 1−ε·a
⇓ предложение 3.2.2
a a
∃δ > 0 : <a−δ <a<a+δ <
1+ε·a 1−ε·a
Запомним это число δ и заметим теперь цепочку:
xn −→ a
n→∞


xn ∈ (a − δ, a + δ) – выполняется для почти всех n ∈ N

a a
< a − δ < xn < a + δ < – выполняется для почти всех n ∈ N
1+ε·a 1−ε·a

a a
< xn < – выполняется для почти всех n ∈ N
1+ε·a 1−ε·a

1+ε·a 1 1−ε·a
> > – выполняется для почти всех n ∈ N
a xn a

1 1 1
+ε> > − ε – выполняется для почти всех n ∈ N
a xn a

 
1 1 1
∈ − ε, + ε – выполняется для почти всех n ∈ N
xn a a

Мы получили, что любая “маленькая” окрестность a1 − ε; a1 + ε точки a1 (радиуса ε < a1 ) содер-
жит почти все элементы последовательности x1n . Отсюда следует, что любая “большая” окрестность
1 1
 1 1 1
a − ε; a + ε точки a (радиуса ε > a ) тоже содержит почти все элементы последовательности xn
(потому что в ней можно выбрать какую-нибудь “маленькую” окрестность, которая будет содержать
почти все x1n ). Вместе это означает, что x1n −→ a1 .
n→∞
2. Мы доказали нашу лемму для случая, когда a > 0. Рассмотрим теперь случай a < 0. Тогда
будет по уже доказанному свойству 10 с.216 последовательность yn = −xn стремиться к числу
−a > 0. Значит, в силу уже доказанного в нашей лемме,
1 1
−→
yn n→∞ −a
откуда опять по свойству 10 с.216,
1 1 1 1
=− −→ − =
xn yn n→∞ −a a

Доказательство свойства 40 .
0 0
6=

6=

xn −→ a, yn −→ b
n→∞ n→∞
лемма 3.2.6 ⇓
1
−→ a1
xn n→∞
| {z }
⇓ 0
свойство 3 на с.216
yn 1 1 b
= · yn −→ ·b=
xn xn n→∞ a a
§ 2. Предел последовательности 219

Ограниченные последовательности. Последовательность {xn } называется ограниченной, если


множество чисел X = {xn } ограничено (сверху и снизу), то есть существуют такие числа C, D, что
для любого n ∈ N выполняется
C 6 xn 6 D

 
⋄ 3.2.34. Проверьте, будут ли следующие после- n2 + 1 n2 + 1
xn = , xn = ,
довательности ограничены? n n

n+1 Какие из них сходятся (то есть имеют конечный


xn = (−1)n , xn = , предел)?
n

Теорема 3.2.7 (об ограниченности сходящейся последовательности). Всякая сходящаяся последо-


вательность ограничена.

Свойства ограниченных последовательностей


◦◦
1 Если {xn } – ограниченная последовательность, а {yn } – бесконечно малая последователь-
ность, то {xn · yn } – бесконечно малая последовательность.
2◦◦ Если {xn } – ограниченная последовательность, а {yn } – бесконечно большая последова-
тельность, то { xynn } – бесконечно малая последовательность.
3◦◦ Если {xn } – ограниченная последовательность, а {yn } – бесконечно большая последова-
тельность, то {xn + yn } – бесконечно большая последовательность.

⋄ 3.2.35. Найти предел ⊲⊲ 3.2.36. Найдите пределы


n
(−1)
lim n o
n→∞ n n3
n+1
Поскольку последовательность в числителе lim ,
(xn = (−1)n ) ограничена, а последовательность n→∞ n
в знаменателе (yn = n) бесконечно большая, по n+5
lim  ,
n
n→∞ n + n + 1
свойству 200 дробь xynn = (−1)
n должна быть бес- n 2 2
o
конечно малой, то есть n + n n+2+n+1

(−1)n lim n o
n→∞ 3 +5
lim =0 n − nn+5
n→∞ n

Вычисление пределов простейших последовательностей. Теперь, когда доказаны главные


свойства сходящихся последовательностей, мы, наконец, можем научиться вычислять простейшие
пределы. Для этого полезно переформулировать сказанное выше в виде следующей серии формул.
Это, во-первых, “арифметические формулы”:

lim (xn + yn ) = lim xn + lim yn (3.2.45)


n→∞ n→∞ n→∞
lim (xn − yn ) = lim xn − lim yn (3.2.46)
n→∞ n→∞ n→∞
lim (C · xn ) = C · lim xn (3.2.47)
n→∞ n→∞
220 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

lim (xn · yn ) = lim xn · lim yn (3.2.48)


n→∞ n→∞ n→∞
yn limn→∞ yn
lim = (3.2.49)
n→∞ xn limn→∞ xn
И, во-вторых – “эвристические” (здесь C обозначает ненулевое число: 0 6= C 6= ∞):

C C
= 0 = ∞, (3.2.50)
∞ 0
∞ 0
= ∞ = 0 (3.2.51)
C C
C +∞= ∞ C·∞= ∞ (3.2.52)
∞+∞= ∞ ∞·∞= ∞ (3.2.53)
∞ 0
=? =? (3.2.54)
∞ 0
∞−∞= ? 0·∞ = ? (3.2.55)

Здесь вопросительные знаки в последних четырех формулах означают, что в рассматриваемых


случаях сказать определенно, чему равен предел, невозможно, и требуется дополнительное иссле-
дование. Эти ситуации объединяются общим термином неопределенность, и что он означает легче
всего понять из следующих примеров.

⋄ 3.2.37. Вычислим предел На этом обсуждение этого примера можно


закончить, но перед этим мы хотели бы пока-
n−1 зать, как можно сократить количество писанины
lim
n→∞ 2n + 3 в подобных вычислениях, одновременно, сделав
их более наглядными. Коротко и просто нашу
Если попробовать применить формулы (3.2.45)–
первую попытку можно записать так:
(3.2.49) сразу, то мы увидим, что ответа не полу-
чается: n−1 ∞−1 ∞
lim = = =?
(3.2.48) (3.2.47)
n→∞ 2n + 3 2·∞+3 ∞
n−1 ↓ limn→∞ (n − 1) ↓
lim = =
n→∞ 2n + 3 limn→∞ (2n + 3) А вторую – так:
(3.2.52) (3.2.54)
limn→∞ n − 1 ∞−1 ↓ ∞ ↓

✟ 0
= = = = ? 1
2 · limn→∞ n + 3 2·∞+3 ∞ 1−
n−1 n 1−0 1
lim = lim = =
Появившийся вопросительный знак означает, n→∞ 2n + 3 n→∞ 3 2+0 2
| {z } 2+
что таким способом найти предел невозможно, n
и это тот случай, когда принято говорить, что
делим числитель
и знаменатель на n ❥
❍ 0
возникает неопределенность. Это в свою очередь
означает, что нужно искать какой-то другой спо- Ниже мы постараемся всюду пользоваться такой
соб (при котором этой неопределенности не воз- “наглядной” записью, поэтому будет хорошо, ес-
никнет). ли читатель уже сейчас обратит на нее внимание.
Для этого обычно бывает достаточно преоб-
разовать подходящим образом выражение под ⋄ 3.2.38. Вычислим предел
пределом. В нашем случае можно поделить чис-
литель и знаменатель на n: 3n2 + 5n + 7
lim
n→∞ 8n2 − 4n + 1
1
n−1 1− n limn→∞ (1 − n1 )
lim = lim 3 = = Здесь также первая попытка ничего не дает, по-
n→∞ 2n + 3
| {z }
n→∞ 2 +
n limn→∞ (2 + n3 )
тому что неопределенность возникает на этот раз
делим числитель
и знаменатель на n
в знаменателе:
1
1 − limn→∞ n 1 − limn→∞ n1 3n2 + 5n + 7 3 · ∞2 + 5 · ∞ + 7 ∞
= 3 = = lim = =
2 + limn→∞ n 2 + 3 · limn→∞ n1 2
n→∞ 8n − 4n + 1 8 · ∞2 − 4 · ∞ + 1 ?
1−0 1
= = Поэтому мы снова преобразуем дробь, прежде
2+3·0 2
чем пользоваться правилами (3.2.45)–(3.2.49):
Итак, со второй попытки мы получили ответ: 21 .
§ 2. Предел последовательности 221

0 0
15n2 + 75n + 125 − 14n2 + 49n
✒ ✒ = lim =
5 7 n→∞ n2
3+ + 2
3n2 + 5n + 7 n n2 n + 26n + 125
lim = lim = = lim =
n→∞ 8n2 − 4n + 1 n→∞ 4 1 n→∞ n2 !
| {z } 8− +
n n2
делим числитель 26 125
и знаменатель на n2 ❘
❅ ❘
❅ = lim 1+ + =1+0+0=1
n→∞ n n2
0 0
3+0+0 3 ❘0
❅ ❘0

= =
8−0−0 8
⋄ 3.2.42. Докажем формулу:
⋄ 3.2.39. Вычислим предел

5n2 − n + 1 
0,
k<l
lim 3 Cnk 1
n→∞ n + n2 + 2 −→ k! , k=l (3.2.56)
nl n→∞ 

∞, k > l
Здесь у нас уже достаточно опыта, чтобы сооб-
разить сразу, что первая попытка “подставить в
лоб” снова приведет к неопределенности, поэто- Доказательство. Начнем со случая k = l:
му мы можем сразу перейти к преобразованию
дроби: Cnk n!
= k =
nk n · k! · (n − k)!
0 0 0 k множителей
✒ ✒ ✒ z }| {
5 1 1 n · (n − 1) · ... · (n − k + 1)
− + = =
5n2 − n + 1 n n2 n3
lim 3 2
= lim = · ... · n} ·k!
|n · n{z
n→∞ n +n +2 n→∞ 1 2 k множителей
| {z } 1+ +
n n3 0 0
делим числитель
и знаменатель на ❘0
❅ ❘0
❅  ✒
  ✒

максимальную степень n, 1 k−1
то есть на n3 1− · ... · 1 −
n n 1
0−0+0 = −→
= =0 k! n→∞ k!
1+0+0
После этого при k < l мы получим:
⋄ 3.2.40. В следующем примере читатель уже
сразу должен сообразить, что без преобразова- Cnk 1 Cnk
ний ничего не получится, поэтому о “подстановке = · −→ 0
nl nl−k nk n→∞
в лоб” мы уже и не заикаемся:
❘0
❅ ❘
❅ 1
0 0 k!
✒ ✒
1 5
А при k > l мы получим:
4 2 1+ +
n +n +5 n2 n4
lim 3
= lim = Cnk Cnk
| − {z
n 3n + 2}
n→∞ n→∞ 1 3 2 k−l
− + = n · −→ ∞
n n3 n4 nl nk n→∞
делим числитель


и знаменатель на ❘0
❅ ❘0
❅ ❘0
❅ ∞ ❅ 1

максимальную степень n, k!
то есть на n4
1+0+0 1
= = = ∞
0−0+0 0 ↑
(3.2.50) ⊲⊲ 3.2.43. Вычислите пределы
2−n
⋄ 3.2.41. 1) limn→∞ 3n+4
n2 −3
раскрываем скобки 2) limn→∞ 3n−4n2
z }| {
3+2n+n2
(n + 5)3 − n(n + 7)2 3) limn→∞ 4−9n+4n3
lim 2
=
n2 +1 3n2 +1
nn
n→∞
4) limn→∞ 2n+1 − 6n+1
= lim n3 + 15n2 + 75n + 125− n2 +2n+1
n→∞ 5) limn→∞
o n o n+5
− n(n2 + 14n + 49) : n2 = 6) limn→∞ n3 −n2 +1
5−n−n2
222 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(b) Теоремы о последовательностях


Предельный переход в неравенствах.

Теорема 3.2.8 (о предельном переходе в неравенстве с конечным пределом). 3


Если последова-
тельности {xn }, {yn } связаны неравенством

xn 6 yn (3.2.57)

и сходятся
xn −→ a yn −→ b
n→∞ n→∞

то их пределы связаны тем же неравенством

a6b
a−b
Доказательство. Предположим, что b < a. Тогда можно взять ε = 2 . Из xn −→ a будет следо-
n→∞
вать, что почти все числа xn лежат в окрестности (a − ε; a + ε). То есть, для почти всех номеров
n ∈ N выполняется неравенство
a − ε < xn < a + ε
С другой стороны, из yn −→ a будет следовать, что почти все числа yn лежат в окрестности
n→∞
(b − ε; b + ε). То есть, для почти всех номеров n ∈ N выполняется неравенство

b − ε < yn < b + ε

Таким образом, у нас получается, что для почти всех номеров n ∈ N выполняются неравенства

yn < b + ε = a − ε < xn

То есть, для почти всех n ∈ N


yn < xn
Это противоречит условию (3.2.59).

Аналогично доказывается

Теорема 3.2.9 (о предельном переходе в неравенстве с бесконечным пределом). Пусть последова-


тельности {xn }, {yn } связаны неравенством

xn 6 yn

тогда
— если xn −→ +∞, то yn −→ +∞;
n→∞ n→∞
— если yn −→ −∞, то xn −→ −∞.
n→∞ n→∞

Теорема 3.2.10 (о двух милиционерах). 4


Пусть последовательности {xn }, {yn }, {zn } связаны неравенствами

xn 6 yn 6 zn

причем две крайние из них сходятся к одному пределу

xn −→ C zn −→ C
n→∞ n→∞

Тогда средняя последовательность тоже стремится к этому пределу:

yn −→ C
n→∞
3 Этот результат используется ниже в разных ситуациях, в частности, при доказательстве теоремы 3.3.4 о сохра-
нении знака непрерывной функцией
4 Эта теорема также используется довольно часто, например, при доказательстве теоремы Больцано-Вейерштрасса

3.2.13, при доказательстве непрерывности модуля, синуса и косинуса (предложение 4.1.32) и при доказательстве
замечательных пределов (теоремы 4.2.4 и 4.2.5).
§ 2. Предел последовательности 223

Доказательство. Возьмем произвольную окрестность (C − ε; C + ε) точки C. Тогда


1) поскольку xn −→ C, почти все числа xn содержатся в окрестности (C − ε; C + ε); поэтому
n→∞
для почти всех номеров n ∈ N выполняется неравенство

C − ε < xn

то есть для почти всех номеров n ∈ N выполняется

C − ε < xn 6 yn

2) поскольку zn −→ C, почти все числа zn содержатся в окрестности (C − ε; C + ε); поэтому


n→∞
для почти всех номеров n ∈ N выполняется неравенство

zn < C + ε

то есть для почти всех номеров n ∈ N выполняется

yn 6 zn < C + ε

Итак, мы получили, что для почти всех номеров n ∈ N выполняются неравенства

C − ε < yn yn < C + ε

Это означает, что почти все числа yn содержатся в окрестности (C − ε; C + ε) точки C. Поскольку
это верно для любой окрестности, мы получаем, что yn −→ C,
n→∞

⋄ 3.2.44. Докажем формулу: ⇓ теорема 3.2.10


(
nk 0, |a| > 1 nk
n
−→ (k ∈ Z) (3.2.58) −→ 0
a n→∞ ∞, |a| < 1 an n→∞
Доказательство. Очевидно, здесь достаточно 3. Если k 6 0 и 0 < a < 1, то, по уже доказан-
рассмотреть случай, когда a > 0. ному,
1. Если k < 0 и a > 1, то все очевидно: n−k
−→ 0
nk 1 1 (a−1 )n n→∞
= −k · n −→ 0
an n
|{z} a n→∞
|{z} ⇓
↓ ↓
0 0  −1
nk n−k
= −→ ∞
2. Пусть k > 0 и a > 1. Тогда a = 1 + ε, ε > 0, an (a−1 )n n→∞
и при n > k + 1 мы получаем цепочку:
n
4. Наконец, при k > 0 и 0 < a < 1 все опять
X очевидно:
n n
a = (1 + ε) = Cni εi > Cnk+1 εk+1
i=0  n
nk 1
⇓ nk ·
= |{z} −→ ∞
an a n→∞
n k
n k
1 nk ↓ | {z }
06 6 = · −→ 0 ∞ ↓
an Cnk+1 εk+1 k+1
|ε {z } Cnk+1 n→∞ ∞
| {z }
константа
↓ (3.2.56)
0

Монотонные последовательности и теорема Вейерштрасса. Последовательность {xn } на-


зывается
– возрастающей, если
x1 < x2 < x3 < ... < xn < xn+1 < ...
224 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

– убывающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...

– неубывающей, если
x1 6 x2 6 x3 6 ... 6 xn 6 xn+1 6 ...

– невозрастающей, если
x1 > x2 > x3 > ... > xn > xn+1 > ...

– монотонной, если она неубывающая или невозрастающая;


Понятно, что если последовательность xn возрастает, то она неубывает. И наоборот, если xn
убывает, то она невозрастает.

⋄ 3.2.45. Последовательность xn = 1
n монотонна (точнее, возрастает) и неограничена;
(точнее, убывает) и ограничена;

(−1)n
⋄ 3.2.46. Последовательность xn = n монотонна ⋄ 3.2.47. Последовательность xn = n немо-
§ 2. Предел последовательности 225

нотонна, но ограничена;

Теорема 3.2.11 (Вейерштрасса о монотоных ограниченных последовательностях). 5


Всякая монотонная ограниченная последовательность {xn } сходится (то есть имеет конеч-
ный предел), причем
— если {xn } неубывающая последовательность, то

lim xn = sup xn
n→∞ n∈N

— если {xn } невозрастающая последовательность, то

lim xn = inf xn
n→∞ n∈N

Доказательство. Если последовательность {xn } монотонна, то это значит, что она или неубываю-
щая, или невозрастающая. Докажем теорему для случая, когда {xn } – неубывающая (случай, когда
она невозрастающая рассматривается аналогично):

C 6 x1 6 x2 6 x3 6 ... 6 xn 6 xn+1 6 ... 6 D (3.2.59)

Рассмотрим множество X, состоящее из элементов {xn }. Из цепочки неравенств (3.2.59) следует,


что оно будет ограничено сверху и непусто. Значит, по теореме 2.1.23 (о точной границе), оно имеет
точную верхнюю грань B:
B = sup{xn ; n ∈ N}
Покажем, что {xn } стремится к B. Возьмем окрестность (B − ε, B + ε) точки B. Поскольку B –
точная верхняя грань для {xn }, число B − ε < B не может быть верхней гранью для {xn }. Это
значит, что существует такое k, что
B − ε < xk
При этом для любого n > k мы получим

B − ε < xk 6 xn

то есть все числа {xn }, начиная с номера k, лежат в интервале (B − ε, B + ε).

Итак, получается, что любая окрестность (B−ε, B+ε) точки B содержит почти все точки последова-
тельности {xn }. Значит
lim xn = B
n→∞

⋄ 3.2.48. Покажем, что последовательность, за- 1. Вычислим сначала несколько первых эле-
данная рекуррентно ментов последовательности {xn }, и нарисуем
 
1 1
x1 = 2, xn+1 = xn +
2 xn

сходится, и найдем ее предел.


5 Этот результат используется далее при доказательстве теоремы о вложенных отрезках 3.2.12 и при доказательстве

второго замечательного предела (лемма (c)).


226 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

картинку: ⇔ x2k + 1 > 2xk ⇔ x2k − 2xk + 1 > 0 ⇔


2
⇔ (xk − 1) > 0

а последнее неравенство выполняется всегда (по-


тому что квадрат любого числа неотрицателен).
Итак, мы доказали (3.2.60), а значит и рав-
носильное ему условие (3.2.61). Эти неравенства
означают, что {xn } невозрастает и ограничена
сверху. Значит, по теореме Вейерштрасса 3.2.11
2. Заметим, что все числа {xn } положитель- она имеет предел. Обозначим его буквой c:
ны:
xn > 0
lim xn = c
(это можно отдельно доказать индукцией). n→∞
3. Из картинки видно, что на первых
нескольких элементах {xn } наша последователь- и заметим, что c > 0, поскольку xn > 0. Тогда из
ность невозрастает. Попробуем доказать, что она формулы
невозрастает всегда:  
1 1
xn+1 6 xn (3.2.60) xn+1 = xn +
2 xn
Поймем сначала, что означает это неравенство:
получаем
умножаем на 2xn ;
поскольку xn > 0,    
знак неравенства не меняется 1 1 1 1
↓ c = lim xn+1 = lim xn + = c+
z  }|  { n→∞ n→∞ 2 xn 2 c
1 1
xn+1 6 xn ⇔ xn + 6 xn ⇔
2 xn То есть c удовлетворяет уравнению
⇔ x2n +16 2x2n ⇔ x2n >1 ⇔ xn > 1  
Теперь докажем, последнее неравенство: 1 1
c= c+
2 c
xn > 1 (3.2.61)
Это делается математической индукцией. решая которое мы получаем
a) Сначала проверяем наше неравенство при
n = 1: 2c2 = c2 + 1 ⇔ c2 = 1
x1 = 2 > 1
b) Предполагаем, что оно верно при n = k: откуда (с учетом c > 0) имеем c = 1.
xk > 1 (3.2.62) Ответ: limn→∞ xn = 1
c) Доказываем, что тогда оно будет верно при
n = k + 1. ⊲⊲ 3.2.49. Докажите, что последовательность,
xk+1 > 1 (3.2.63) заданная рекуррентно сходится, и найдите ее
предел:
Действительно,
умножаем на 2xk , 1) x1 = 3, xn+1 = 3x5x n
n +1
;
и, поскольку xn > 0,
4xn
знак неравенства не меняется 2) x1 = 1, xn+1 = 2+x2n ;

z  }|  { 3) x1 = −1, xn+1 = xn (xn +4)
;
1 1 2
xk+1 > 1 ⇔ xk + >1 ⇔ 4) x1 = 2, xn+1 = xn (6−xn )
.
2 xk 3

Теорема о вложенных отрезках. Пусть дана последовательность отрезков [an ; bn ] такая, что
каждый последующий содержится в предыдущем:

[a1 ; b1 ] ⊇ [a2 ; b2 ] ⊇ [a3 ; b3 ] ⊇ ... ⊇ [an ; bn ] ⊇ ...

Понятно, что в этом случае концы отрезков связаны неравенствами

a1 6 a2 6 a3 6 ... 6 an 6 ... 6 bn 6 ... 6 b3 6 b2 6 b1 (3.2.64)


§ 2. Предел последовательности 227

Пусть, кроме того, длины этих отрезков стремятся к нулю:

bn − an −→ 0 (3.2.65)
n→∞

Такая последовательность отрезков называется последовательностью вложенных отрезков.


Теорема 3.2.12 (о вложенных отрезках). 6 Для любой последовательности вложенных отрезков
[an ; bn ] существует единственная точка C, принадлежащая всем отрезкам этой последователь-
ности,
C ∈ [an ; bn ] (3.2.66)
При этом
lim an = C = lim bn (3.2.67)
n→∞ n→∞

Доказательство. Неравенства (3.2.64) означают, что последовательности {an } и {bn } монотоны и


ограничены. Значит, они сходятся (то есть имеют пределы). Обозначим буквами A и B эти пределы:

A = lim an B = lim bn
n→∞ n→∞

Покажем, что эти числа совпадают. Действительно,


 
используем свойство
B − A = lim bn − lim an = 0
2 на с.213 = lim (bn − an ) = (используем (3.2.65)) = 0
n→∞ n→∞ n→∞

то есть
A=B
Итак, мы получили, что можно взять C = A = B, и тогда будет выполняться (3.2.67). По теореме
Вейерштрасса 3.2.11, получаем

a1 6 a2 6 a3 6 ... 6 an 6 ... 6 sup an = A = C = B = inf bn 6 ... 6 bn 6 ... 6 b3 6 b2 6 b1


n∈N n∈N

и это означает, что C принадлежит всем интервалам [an ; bn ]. Наконец, такая точка C (обладающая
свойством (3.2.66)), единственна, потому что если бы существовала какая-то другая точка C ′ с тем
же самым свойством (3.2.66), отличющаяся от C, например, большая, чем C, то мы получили бы,
цепочку неравенств

a1 6 a2 6 a3 6 ... 6 an 6 ... 6 C < C ′ 6 ... 6 bn 6 ... 6 b3 6 b2 6 b1

из которых следовало бы, что расстояние между концами любого отрезка [an ; bn ] не меньше чем
фиксированное число ∆ = C ′ − C

b n − an > C ′ − C = ∆ > 0

и поэтому bn − an не может стремиться к нулю.

Подпоследовательности и теорема Больцано-Вейерштрасса. Пусть нам дана какая-то по-


следовательность вещественных чисел
xn
и пусть кроме того дана бесконечно большая последовательность натуральных чисел:

nk −→ +∞
k→∞

Тогда можно рассмотреть последовательность yk = xnk (зависящую от индекса k). Она называется
подпоследовательностью числовой последовательности xn .

6 Этот результат используется ниже при доказательстве теоремы Больцано-Вейерштрасса 3.2.13 и при доказатель-

стве теоремы Коши о промежуточном значении 3.3.6.


228 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

⋄ 3.2.50. Пусть, скажем, нам дана последова- ⊲⊲ 3.2.52. Какую нужно взять последователь-
тельность ность индексов {nk }, чтобы последовательность
1 {yk } была подпоследовательностью последова-
xn =
n тельности {xn }?
Если взять
nk = k 2 1) xn = n1 , yk = k13
2) xn = (−1)n , yk = −1
то мы получим подпоследовательность
1 1 ⊲⊲ 3.2.53. Является ли данная последователь-
yk = xnk = = 2 ность {yk } подпоследовательностью последова-
nk k
тельности {xn }? (Если да, то указать соответ-
⋄ 3.2.51. Пусть ствующую последовательность индексов {nk }.)
n
xn = (−1) 1) xn = n, yk = k 2 ,
Если взять 2) xn = n2 , yk = k,
nk = 2k 3) xn = n, yk = 2.
то мы получим подпоследовательность
yk = xnk = (−1)nk = (−1)2k = 1

Свойства подпоследовательностей
1◦ . Если последовательность {xn } стремится к числу a, то любая ее подпоследователь-
ность {xnk } тоже стремится к числу a:

xn −→ a =⇒ xnk −→ a
n→∞ k→∞

2◦ . Если последовательность {xn } не стремится к числу a, то найдется такая подпосле-


довательность {xnk } и такое число ε > 0, что {xnk } отстоит от a больше чем на
ε:
xn −→
6 a =⇒ ∃ε > 0 ∃xnk ∀k |xnk − a| > ε
n→∞

3 . Если последовательность {xn } неограничена, то она содержит некоторую бесконечно
большую подпоследовательность:

sup |xn | = +∞ =⇒ ∃xnk −→ ∞


n∈N k→∞

4◦ . Если бесконечный набор элементов последовательности {xn } содержится в множестве


M , то {xn } содержит некоторую подпоследовательность, полностью содержащуюся в
M:
∃xnk ⊆ M

Доказательство. 1. Докажем сначала 1◦ . Возьмем произвольную окрестность (a − ε; a + ε) точки


a. Поскольку xn −→ a, почти все точки {xn } должны лежать в (a − ε; a + ε). Значит, точки с
n→∞
индексами nk тоже почти все лежат в (a − ε; a + ε). Поскольку это верно для любой окрестности
(a − ε; a + ε) мы получаем xnk −→ a.
n→∞
2. Свойство 20 , как многие другие утверждения в анализе, традиционно доказывается приемом
бесконечнократного выбора, о котором нужно сказать несколько слов. Он представляет из себя
неявное использование аксиомы (счетного) выбора (сформулированной выше на с.202). Другой,
“честный” способ доказать это утверждение – явно сослаться на аксиому выбора, однако у этого
пути есть важный недостаток: тогда рассуждения становятся интуитивно менее очевидными. Эти
два способа можно считать эквивалентными, и чтобы показать читателю разницу, мы приведем
здесь оба. Далее мы еще несколько раз поступим так же7 , то есть приведем два доказательства,
приемом бесконечнократного выбора и с явной ссылкой на аксиому выбора, но после этого будем в
подобных ситуациях использовать только бесконечнократный выбор без напоминаний, что за ним
стоит аксиома выбора.
7 Точнее, дважды: при доказательстве свойства 30 в этом списке и теоремы Больцано-Вейерштрасса 3.2.13 ниже.
§ 2. Предел последовательности 229

а) Доказательство приемом бесконечнократного выбора. Если xn −→


6 a, то это означает, что най-
n→∞
дется такая окрестность (a − ε, a + ε) точки a, вне которой лежит бесконечное число элементов
xn . То есть множество
N = {n ∈ N : xn ∈ / (a − ε, a + ε)}
бесконечно.
1) Выберем произвольное n1 ∈ N .
2) Поскольку N бесконечно, найдется n2 ∈ N такое что n2 > 2. Зафиксируем это n2 .
3) Поскольку N бесконечно, найдется n3 ∈ N такое что n3 > 3. Зафиксируем это n3 .
И так далее. Поступая подобным образом, мы получим последовательность индексов {nk } такую,
что
nk > k, k∈N
поэтому по теореме 3.2.9 о предельном переходе в неравенстве, nk −→ +∞, то есть {xnk } –
k→∞
подпоследовательность в {xn }.
б) Доказательство с явной ссылкой на аксиому выбора. Еще раз, если xn −→
6 a, то найдется такая
n→∞
окрестность (a − ε, a + ε) точки a, вне которой лежит бесконечное число элементов xn . То есть
множество
N = {n ∈ N : xn ∈ / (a − ε, a + ε)}
бесконечно. По теореме 2.2.12, оно не ограничено, то есть для всякого k ∈ N
Nk = {n ∈ N : n 6 k} 6= ∅
По аксиоме счетного выбора (с.202), найдется последовательность
nk ∈ N k
Для нее мы получаем во-первых:
xnk ∈
/ (a − ε, a + ε), k∈N
то есть
|xnk − a| > ε, k∈N
И, во-вторых,
nk > k, k ∈ N,
откуда по теореме 3.2.9 о предельном переходе в неравенстве, nk −→ +∞, то есть {xnk } –
k→∞
подпоследовательность в {xn }.
3. Как и в предыдущем случае, мы даем два доказательства свойства 30 : традиционное и с явной
ссылкой на аксиому (счетного) выбора.
а) Доказательство приемом бесконечнократного выбора. Пусть supn∈N |xn | = +∞, построим под-
последовательность xnk −→ ∞.
k→∞
1) Сначала выбирается индекс n1 . Это делается так: поскольку {xn } неограничена, найдется
такой номер n1 , что
|xn1 | > 1
Этот номер n1 фиксируется.
2) Затем выбирается индекс n2 : поскольку {xn } неограничена, найдется такой номер n2 , что
|xn2 | > 2
Этот номер n2 фиксируется.
k). Когда индексы n1 , n2 , ..., nk−1 уже выбраны, выбирается индекс nk : поскольку {xn } неогра-
ничена, найдется такой номер nk , что
|xnk | > k
Этот номер nk фиксируется.
И так далее. В результате получается последовательность {xnk } со свойством
∀k ∈ N |xnk | > k
из которого и следует xnk −→ ∞.
k→∞
230 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

б) Доказательство с явной ссылкой на аксиому выбора. Пусть supn∈N |xn | = +∞. Это значит, что

∀k ∈ N {n ∈ N : |xn | > k} 6= ∅

По аксиоме счетного выбора (с.202), найдется последовательность {nk } такая, что

nk ∈ {n ∈ N : |xn | > k}, k∈N

то есть
|xnk | > k, k ∈ N.
Отсюда следует xnk −→ ∞.
k→∞

4. Свойство 4 доказывается тем же приемом, только номера nk здесь нужно выбирать так,
чтобы выполнялись не одно, а два условия:

nk+1 > nk & xnk+1 ∈ M.

Можно заметить, что иногда получается, что, хотя данная последовательность {xn } расходится
(то есть не имеет предела), тем не менее, выбранная подпоследовательность {yk } сходится.

n
⊲⊲ 3.2.54. Для данной последовательности {xn } 3) xn = n(−1) ,
укажите какую-нибудь сходящуюся подпоследо- n
4) xn = (−1)n · n(−1) −1 ,
вательность {xnk }, если она существует.
5) xn = n · (1 + (−1)n ),
1) xn = (−1)n · n, 2+(−1)n
6) xn = 2 − n1 ,
(−1)n 1+(−1)n n−1 3

2) xn = n + 2 , 7) xn = (−1) · 2+ n .

Теорема 3.2.13 (Больцано-Вейерштрасса). 8 Всякая ограниченная последовательность {xn } име-


ет сходящуюся подпоследовательность {xnk }.
Для доказательства условимся длиной отрезка I = [a, b] называть число

diam I = b − a

Нам удобно начать со следующей леммы:


Лемма 3.2.14. Если отрезок I содержит бесконечно много элементов последовательности {xn },

card{n ∈ N : xn ∈ I} = ∞

то в I содержится отрезок J в два раза меньшей длины,


diam I
diam J = ,
2
также содержащий бесконечно много элементов {xn }:

card{n ∈ N : xn ∈ J} = ∞

Доказательство. Это очевидно: разделим отрезок I на два равных (по длине) отрезка J и K. По
крайней мере в одном из них должно содержаться бесконечное число элементов {xn } (потому что
иначе получилось бы, что J и K содержат конечный набор элементов {xn }, и значит их объединение
I = J ∪ K тоже содержит конечный набор элементов.
Доказательство теоремы 3.2.13. В соответствии с обещанием на с.228, мы даем здесь два доказа-
тельства: приемом бесконечнократного выбора и с явной ссылкой на аксиому (счетного) выбора.
8 Этот результат используется ниже при доказательстве критерия Коши сходимости числовой последовательности

(теорема 3.2.15), а также при доказательстве теорем Вейерштрасса об ограниченности и об экстремумах (теоремы
3.3.7 и 3.3.8) и теоремы Кантора о равномерной ограниченности (теорема 3.3.10)
§ 2. Предел последовательности 231

а) Доказательство приемом бесконечнократного выбора.


1) Последовательность {xn } ограничена, значит она лежит в некотором отрезке I1 = [a1 ; b1 ].
Положим n1 = 1, и заметим на будущее, что xn1 ∈ I1 = [a1 ; b1 ].
2) По лемме 3.2.14, в I1 содержится некий отрезок I2 = [a2 ; b2 ] вдвое меньшей длины,
diam I1
diam I2 = ,
2
также содержащий бесконечно много чисел {xn }. Выбираем какой-нибудь номер n2 > 2, такой
что xn2 ∈ I2 = [a2 ; b2 ] (такой номер n2 найдется, потому что xn ∈ [a2 ; b2 ] для бесконечного
количества номеров n).
3) Опять по лемме 3.2.14, в I2 содержится некий отрезок I3 = [a3 ; b3 ] вдвое меньшей длины,
diam I2
diam I3 = ,
2
также содержащий бесконечно много чисел {xn }. Выбираем какой-нибудь номер n3 > 3, такой
что xn3 ∈ I3 = [a3 ; b3 ] (такой номер n3 найдется, потому что xn ∈ [a3 ; b3 ] для бесконечного
количества номеров n).
Продолжая эту процедуру, мы получим последовательность отрезков Ik = [ak ; bk ] и чисел xnk
со следующими свойствами:

[a1 ; b1 ] ⊇ [a2 ; b2 ] ⊇ [a3 ; b3 ] ⊇ ... ⊇ [ak ; bk ] ⊇ ... bk − ak −→ 0 xnk ∈ [ak ; bk ] (3.2.68)


k→∞

Первые два свойства означают, что [ak ; bk ] – последовательность вложенных отрезков, значит,
по теореме 3.2.12 о вложенных отрезках, существует число C такое что

lim ak = C = lim bk
k→∞ k→∞

Последнее же свойство в цепочке (3.2.68) означает, что

ak 6 xnk 6 bk

и поэтому мы можем применить теорему о двух милиционерах 3.2.10, из которой следует, что

lim xnk = C
k→∞

То есть последовательность xnk имеет предел.


б) Доказательство с явной ссылкой на аксиому выбора. Опять заметим сначала, что поскольку
последовательность {xn } ограничена, она лежит в некотором отрезке I = [a; b]. Пусть I обо-
значает множество отрезков J, содержащихся в I, и содержащих бесконечный набор элементов
последовательности {xn }

J ∈I ⇐⇒ J ⊆I & card{n ∈ N : xn ∈ J} = ∞

(множество I непусто, потому что, например, I ∈ I). Пусть теперь I1 , I2 , ..., Ik – конечная по-
следовательность отрезков, удовлетворяющая таким условиям:
diam Ii
{I1 , ...Ik } ⊆ I, I1 ⊃ I2 ⊃ ... ⊃ Ik , ∀i < k diam Ii+1 = , (3.2.69)
2
Тогда по лемме 3.2.14, найдется отрезок J со свойствами:
diam Ik
J ∈ I, J ⊂ Ik , diam J = . (3.2.70)
2
Это наблюдение можно переформулировать таким хитрым образом: для любой последователь-
ности I1 , I2 , ..., Ik , удовлетворяющей условиям (3.2.69), множество J (I1 , I2 , ..., Ik ) всех отрезков
J, удовлетворяющих условиям (3.2.70), непусто:
 
diam Ik
J (I1 , I2 , ..., Ik ) = J ∈ I : J ⊂ Ik , diam J = 6= ∅
2
Теперь мы применяем аксиому выбора: должно существовать отображение (I1 , I2 , ..., Ik ) 7→ G(I1 , I2 , ..., Ik ),
которое каждой последовательности (I1 , I2 , ..., Ik ) отрезков, удовлетворяющих условиям (3.2.69),
232 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

ставит в соответствие отрезок G(I1 , I2 , ..., Ik ), принадлежащий J (I1 , I2 , ..., Ik ), то есть удовлетво-
ряющий условиям
diam Ik
G(I1 , I2 , ..., Ik ) ∈ I, G(I1 , I2 , ..., Ik ) ⊂ Ik , diam G(I1 , I2 , ..., Ik ) = . (3.2.71)
2
После этого мы применяем теорему 2.2.7 об определениях частной индукцией: если положить
I1 = I, то это определит последовательность {Ik } ∈ I, содержащую I1 в качестве первого эле-
мента и удовлетворяющую условию
G(I1 , ..., Ik ) = Ik+1 , k<N

где величина N определяется условием:


n o
N = sup k ∈ N : ∃{I2 , ..., Ik } ⊆ I ∀i ∈ {2, ..., k} G(I1 , ..., Ii−1 ) = Ii

Но здесь верхняя грань равна бесконечности, потому что наше отображение G было определено
на всех конечных последовательностях со свойствами (3.2.69). Поэтому последовательность {Ik },
определяемая теоремой 2.2.7 должна быть бесконечной.
Теперь каждый отрезок {Ik } содержит бесконечный набор элементов {xn }, поэтому

{n > k : xn ∈ Ik } 6= ∅
Отсюда по аксиоме счетного выбора (с.202) следует, что существует последовательность номеров

nk ∈ {n > k : xn ∈ Ik }

то есть такая, что


nk > k & xnk ∈ Ik
Обозначив теперь через ak и bk концы отрезков Ik ], мы получим в точности условия (3.2.68), и
дальше рассуждения повторяют пункт а).

Критерий Коши сходимости последовательности.


Теорема 3.2.15 (критерий Коши сходимости числовой последовательности). 9
Числовая последовательность {xn } тогда и только тогда сходится, когда она удовлетворяет
следующим двум эквивалентным условиям:
(i) для любых двух бесконечно больших последовательностей индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞ (3.2.72)
i→∞ i→∞

соответствующие подпоследовательности {xpi } и {xqi } стремятся друг к другу:

xpi − xqi −→ 0 (3.2.73)


i→∞

(ii) для любой последовательности {li } ⊆ N и любой бесконечно большой последовательно-


сти {ki } ⊆ N
ki −→ ∞ (3.2.74)
i→∞
выполняется соотношение
xki +li − xki −→ 0 (3.2.75)
i→∞

Для доказательства нам понадобится две леммы.


Лемма 3.2.16. Если последовательность {xn } бесконечно большая

xn −→ ∞
n→∞

то она содержит некоторую подпоследовательность {xnk } со свойством


xnk − xnk−1 −→ ∞ (3.2.76)
k→∞
9 Этот результат понадобится нам только в главе 18 при доказательстве критерия Коши сходимости числового

ряда (теорема 4.1)


§ 2. Предел последовательности 233

Доказательство. Подпоследовательность {xnk } строится бесконечнократным выбором (традици-


онно этот прием называется “построением по индукции”).
1. Индекс n1 выбирается произвольным, например, n1 = 1.
2. Затем выбирается индекс n2 . Для этого произносится фраза: поскольку {xn } неограничена,
найдется такой номер n2 , что
|xn2 − xn1 | > 2
Этот номер n2 фиксируется.
k. Когда индексы n1 , n2 , ..., nk−1 уже выбраны, выбирается индекс nk . Опять говорится так:
поскольку {xn } неограничена, найдется такой номер nk , что

xnk − xnk−1 > k

Этот номер nk фиксируется.


И так далее. В результате получается последовательность {xnk } со свойством

∀k ∈ N xnk − xnk−1 > k

из которого и следует (3.2.76).

Лемма 3.2.17. Если последовательность {xn } обладает свойством (i) теоремы 3.2.15, то она
ограничена.

Доказательство. Предположим, что это не так, то есть что {xn } – неограниченная последова-
тельность, обладающая свойством (i). Тогда по свойству 30 предыдущего параграфа, нашлась бы
подпоследовательность {xnk } такая что

xnk −→ ∞
k→∞

а по лемме 3.2.16 это означало бы, что можно выбрать подпоследовательность {xnki } последова-
тельности {xnk } такую что
xnki − xnki−1 −→ ∞
k→∞

После этого мы бы могли взять две последовательности

pi = nki , qi = nki−1

и у нас бы получилось, что


xpi − xqi = xnki − xnki−1 −→ ∞
k→∞

Но это невозможно, потому что {xn } обладает свойством (i). Значит, наше исходное предположение
(о том, что {xn } – неограниченная последовательность) неверно. То есть {xn } обязательно ограни-
чена.

Доказательство теоремы 3.2.15. Убедимся сначала что условия (i) и (ii) действительно эквива-
лентны.
1. Импликация (i) ⇒ (ii) очевидна: если выполняется (i) то есть любые две подпоследователь-
ности {xpi } и {xqi } последовательности {xn } стремятся друг к другу

xpi − xqi −→ 0,
i→∞

то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение

xki +li − xki = xpi − xqi −→ 0


i→∞

2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(3.2.75). Возьмем какие-нибудь две бесконечно большие последовательности индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞
234 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
   
 xmax{pi ;qi } − xmin{pi ;qi } , если pi > qi   xki +li − xki , если pi > qi 
xpi − xqi = x − xmax{pi ;qi } , если pi < qi = xk − xki +li , если pi < qi
 min{pi ;qi }   i 
0, если pi = qi 0, если pi = qi

В любом случае получается


|xpi − xqi | = |xki +li − xki |
поэтому
|xpi − xqi | = |xki +li − xki | −→ 0
i→∞
и значит,
xpi − xqi −→ 0
i→∞

Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {xn } сходится, то есть существует конечный
предел
lim xn = a
n→∞

то {xn } обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие по-
следовательности индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞
i→∞ i→∞

Соответствующие подпоследовательности {xpi } и {xqi } тоже стремятся к числу a по свойству 10


предыдущего параграфа:
xpi −→ a, xqi −→ a
i→∞ i→∞
поэтому их разность должна стремиться к нулю:

xpi − xqi −→ a − a = 0
i→∞

Это значит, что {xn } действительно должна обладать свойством (i).


4. Теперь докажем, что наоборот, если {xn } обладает свойством (i), то она обязательно сходит-
ся. Действительно, по лемме 3.2.17, {xn } ограничена. Значит, по теореме Больцано-Вейерштрасса
3.2.13, {xn } содержит некоторую сходящуюся подпоследовательность {xni }:

xni −→ a (3.2.77)
i→∞

Теперь возьмем следующие две последовательности индексов

pi = i, qi = ni

Поскольку {xn } обладает свойством (i), должно выполняться соотношение

xi − xni = xpi − xqi −→ 0 (3.2.78)


i→∞

Из (3.2.77) и (3.2.78) получаем

xi = (xi − xni ) + xni −→ 0 + a = a


i→∞

То есть последовательность {xn } стремится к некоторому конечному пределу a.


§ 2. Предел последовательности 235

n
⊲⊲ 3.2.55. Проверьте с помощью критерия Коши 1) xn = 3(−1) ;
сходимость последовательностей: 2
2) xn = { n n+1 }.

Теорема Штольца-Чезаро.
Теорема 3.2.18 (О.Штольц, Э.Чезаро). 10
Пусть {yn } и {zn } – две последовательности, причем
(i) {yn } строго монотонна:

y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ... (3.2.79)

(ii) {yn } бесконечно большая:


yn −→ ∞ (3.2.80)
n→∞
zn −zn−1
(iii) последовательность yn −yn−1 имеет конечный предел:

zn − zn−1
lim =A (3.2.81)
n→∞ yn − yn−1

Тогда последовательность { yznn } тоже имеет конечный предел, и он совпадает с A:

zn zn − zn−1
lim = lim =A (3.2.82)
n→∞ yn n→∞ yn − yn−1

Доказательство. Заметим сразу, что достаточно рассмотреть случай, когда yn возрастает:

y1 < y2 < ... < yn < ...,

поскольку случай убывающей последовательности

y1 > y2 > ... > yn > ...

сводится к случаю возрастающей заменой ỹn = −yn , (ỹ1 < ỹ2 < ... < ỹn < ...). Заодно можно счи-
тать, что все yn положительны:
0 < y1 < y2 < ... < yn < ... (3.2.83)
zn −zn−1
Из условия (iii) следует, что yn −yn−1 представимо в виде

zn − zn−1
= A + αn , (3.2.84)
yn − yn−1
где
αn −→ 0 (3.2.85)
n→∞

Зафиксируем ε > 0, и подберем N так чтобы


ε
∀n > N |αn | < (3.2.86)
2
(это можно сделать, потому что |αn | −→ 0).
n→∞
Из (3.2.80) следует, что существует M > N такое, что
2
∀n > M yn > · zN − A · yN
ε
то есть
ε
∀n > M · yn
zN − A · yN < (3.2.87)
2
Зафиксируем эти N и M . Из (3.2.84) получаем: для всякого n > M > N

zn − zn−1 = (αn + A) · (yn − yn−1 ) = αn · (yn − yn−1 ) + A · (yn − yn−1 )


10 Otto Stolz (1842–1905), Ernesto Cesàro (1859 – 1906). Эта теорема используется при доказательстве правила Ло-

питаля 5.2.3 для раскрытия неопределенностей типа ∞ ∞


.
236 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ




zn − zn−1 = αn · (yn − yn−1 ) + A · (yn − yn−1 )

z
n−1 − zn−2 = αn−1 · (yn−1 − yn−2 ) + A · (yn−1 − yn−2 )

...


zN +1 − zN = αN +1 · (yN +1 − yN ) + A · (yN +1 − yN )
⇓ (складываем уравнения)

после сокращений остаются


только первое и последнее слагаемое
z }| {
zn − zn−1 + ... + zN +1 − zN = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN )+
+ A · ( yn − yn−1 + ... + yN +1 − yN )
| {z }
после сокращений остаются
только первое и последнее слагаемое


zn − zN = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + A · (yn − yN )

zn − A · yn = αn · (yn − yn−1 ) + ... + αN +1 · (yN +1 − yN ) + zN − A · yN

zn − A · yn = αn (yn − yn−1 ) + ... + αN +1 (yN +1 − yN ) + zN − A · yN 6

6 |αn | · yn − yn−1 + ... + |αN +1 | · yN +1 − yN + zN − A · yN <


|{z} | {z }
>

>

(3.2.86) (3.2.86)
ε ε
2 2
ε ε
< · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2 | {z } 2 | {z }
<

<

(3.2.79) (3.2.79)
0 0
ε   ε  
= · yn − yn−1 + ... + · yN +1 − yN + zN − A · yN =
2  2 
ε
= · yn − yn−1 + ... + yN +1 − yN + zN − A · yN =
2 | {z }
после сокращений остаются
только первое и последнее слагаемое
0
>

(3.2.83)
ε  z}|{  ε ε
= · yn − yN + zN − A · yN < · yn + · yn = ε · yn
2 | {z } | {z } 2 2
>

>

yn (3.2.87)
ε
2 · yn

zn − A · yn < ε · yn


zn
−A <ε
yn
У нас получилось, что для всякого ε > 0 найдется M такое, что
zn
∀n > M −A <ε
yn
То есть
zn
∀n > M −ε< −A<ε
yn
§ 2. Предел последовательности 237

zn
Иными словами, для любого ε > 0 почти все числа yn − A лежат в интервале (−ε, ε). Значит,

zn
− A −→ 0
yn n→∞

то есть,
zn
−→ A
yn n→∞

(c) Приложения предела последо- 2. Докажем (3.2.93). Сначала заметим, что


вательности ∀k ∈ N xk · 10k = [x · 10k ] ∈ Z
Десятичная запись вещественных чисел.

 
Лемма 3.2.19. Для всякого вещественного чис- x1 , k=1
ла x ∈ (0, 1) последовательность a−k = ∈Z
(xk − xk−1 ) · 10k , k > 1
[x · 10N ] Теперь для k = 1 получаем:
xN = (3.2.88)
10N 0<x<1
обладает следующими свойствами: ⇓
(i) для всякого N ∈ N выполняется неравенство 0 < x · 10 < 10
1 ⇓ (2.2.291)
0 6 x − xN < (3.2.89)
10N 0 6 [x · 10] < 10
из которого следует, что xN сходится к x: ⇓
xN −→ x (3.2.90) a−1 = [x · 10] ∈ {0, 1, ..., 9}
N →∞
Затем для k > 1 получаем:
(ii) последовательность {a−k ; k ∈ N}, опреде-
1
ленная правилом 0 6 x − xk−1 < (3.2.89)
10k−1
a−1 = x1 · 10 = [x · 10], (3.2.91) ⇓
k
a−k = (xk − xk−1 ) · 10 (k > 1) (3.2.92) 0 6 (x − xk−1 ) · 10k < 10
⇓ (2.2.291)
состоит из целых чисел в интервале
{0, 1, ..., 9}: 0 6 [(x − xk−1 ) · 10k ] < 10
| {z }
=

∀k ∈ N a−k ∈ {0, 1, ..., 9} (3.2.93) [x · 10k − xk−1 · 10k ]


=

(iii) справедливо тождество [x · 10k ] − xk−1 · 10k


=

 
[x·10k ]
N
X − xk−1 · 10k
10k
−k
xN = a−k · 10 (3.2.94)
=

k=1 (xk − xk−1 ) · 10k


=

a−k
Доказательство. 1. Начнем с (3.2.89):

{x · 10N } ∈ [0, 1) (2.2.294)
a−k ∈ {0, 1, ..., 9}
⇓ 3. Формула (3.2.94) доказывается индукцией.
При N = 1 она принимает вид:
[x · 10N ] x1 = a−1 · 10−1 ,
x − xN = x − =
10N
x · 10N [x · 10N ] x · 10N − [x · 10N ] и это эквивалентно (3.2.91). Далее, если (3.2.94)
= N
− N
= = верна для N = m,
10 10 10N
  m
{x · 10N } 1 X
= (2.2.292) = ∈ 0, N a−k · 10−k = xm ,
10N 10
k=1
238 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

то для N = m + 1 мы получаем: ⋄ 3.2.56. Запись


m+1
X x = 45, 28
a−k · 10−k =
k=1
xm расшифровывается как равенство
z }| {
Xm
= a−k · 10−k +a−m−1 · 10−m−1 = x = 4 · 101 + 5 · 100 + 2 · 10−1 + 8 · 10−2
k=1
= xm + a−m−1 · 10−m−1 = (3.2.92) = • Помимо этого, запись вида

= xm + (xm+1 − xm ) · 10m+1 · 10−m−1 = x = an ...a1 a0 , a−1 ...a−N ...
= xm + (xm+1 − xm ) = xm+1
(в которой перечислены все числа ak до но-
мера a−N включительно, а после них стоит
Из леммы 3.2.19 и теоремы 2.2.18 следует многоточие), называется приближенной де-
Теорема 3.2.20. Всякое число x > 0 предста- сятичной записью числа x и означает, что
вимо в виде x отличается от числа an ...a1 a0 , a−1 ...a−N не
больше чем на 10−N :
n
X N
X
x= ak · 10k + lim a−k · 10−k (3.2.95)
N →∞ 0 6 x − an ...a1 a0 , a−1 ...a−N < 10−N
k=0 k=1

где n ∈ Z+ , ai ∈ {0, 1, ..., 9}. ⋄ 3.2.57. Запись


Доказательство. Разложим x в сумму целой и
дробной части: x = 102, 67...

x = [x] + {x} означает, что справедлива оценка


Если [x] = 0, то в (3.2.95) нужно положить n = 0,
a0 = 0, если же [x] 6= 0, то по теореме 2.2.18 [x] 0 6 x − 102, 67 < 10−2
можно представить в виде
n • Если x < 0, то по теореме 3.2.20 число −x > 0
X
[x] = ak · 10 k
(ak ∈ {0, 1, ..., 9}) представимо в виде
k=0
n
X N
X
То же самое с дробной частью: если {x} = 0, то −x = ak · 10k + a−k · 10−k
в (3.2.95) нужно положить a−k = 0 при k ∈ N, k=0 k=1
а если {x} =6 0, то {x} можно по лемме 3.2.19
записать в виде Опять же, если здесь начиная с номера N + 1
N
все числа a−k (k > N + 1) равны нулю, то
X
{x} = lim a−k · 10−k (a−k ∈ {0, 1, ..., 9}). справедливо равенство
N →∞
k=1
n
X N
X
−x = ak · 10k + a−k · 10−k
k=0 k=1
• Формула (3.2.95) называется десятичным
представлением числа x > 0, а последова- и его принято коротко записывать так:
тельность {an , an−1 , ..., a1 , a0 , a−1 , ...} – после-
довательностью коэффициентов этого пред- x = −an ...a1 a0 , a−1 ...a−N
ставления. Если начиная с номера N + 1 все
числа a−k (k > N + 1) равны нулю, то спра- (запятая отделяет цифры с индексами 0 и
ведливо равенство −1). Это называется десятичной записью
n
X N
X числа x < 0.
x= ak · 10k + a−k · 10−k
k=0 k=1 ⋄ 3.2.58. Запись
которое коротко принято записывать так:
x = −34, 72
x = an ...a1 a0 , a−1 ...a−N
(запятая отделяет цифры с индексами 0 и расшифровывается как равенство
−1), и это называется десятичной записью
числа x. −x = 3 · 101 + 4 · 100 + 7 · 10−1 + 2 · 10−2
§ 2. Предел последовательности 239

• Помимо этого, запись вида По теореме Вейерштрасса 3.2.11, это означает,


что последовательность yn сходится:
x = −an ...a1 a0 , a−1 ...a−N ...
∃ lim yn ∈ R.
n→∞
(в которой перечислены все числа ak до номе- n
ра a−N включительно, а после них стоит мно- Теперь сходимость последовательности 1 + n1
готочие), называется приближенной деся- следует из правила вычисления предела дроби
тичной записью числа x < 0 и означает, что (свойство 4◦ на с. 214):
−x отличается от числа an ...a1 a0 , a−1 ...a−N
 n n+1
не больше чем на 10−N : 1 1 + n1
lim 1 + = lim =
n→∞ n n→∞ 1 + n1
0 6 −x − an ...a1 a0 , a−1 ...a−N < 10−N
yn limn→∞ yn
= lim 1 =  =
Понятно, что это равносильно оценке n→∞ 1+ n 1 
limn→∞ 1 +
n
10−N < x + an ...a1 a0 , a−1 ...a−N 6 0
❆❯
0
⋄ 3.2.59. Запись = lim yn ∈ R.
n→∞
x = −2, 31...

означает оценку Теорема 3.2.21. Число Непера e удовлетворя-


ет соотношению:
10−2 < x + 2, 31 6 0 n
X 1
e = lim (3.2.97)
Число Непера e. Из теоремы Вейерштрас- n→∞ k!
k=0
са 3.2.11 выводится следующее утверждение,
причем для любого n ∈ N справедливо двойное
неожиданно оказывающееся важным в анализе:
n неравенство:
• Последовательность 1 + n1 имеет конеч- n
X 1 1
ный предел, который называется числом 0<e− 6 (3.2.98)
Непера и обозначается буквой e: k! n! · n
k=0
 n
1 или, что то же самое двойное неравенство
e = lim 1 + (3.2.96)
n→∞ n X n Xn
1 1 1
<e6 + (3.2.99)
Доказательство. Рассмотрим сначала вспомо- k! k! n! · n
k=0 k=0
гательную последовательность yn = (1 + n1 )n+1
и докажем что она сходится. Для n > 2 мы по- Доказательство. Обозначим
лучаем: Xn
1
En =
1 n n k!
yn−1 (1 + n−1 )n ( n−1 ) k=0
= = =
yn (1 + n1 )n+1 ( n+1
n )
n+1
и докажем сначала равенство (3.2.97).
2n
 2
n 1. Поскольку
n n n n
= 2 · = · =
(n − 1)n n + 1 n2 − 1 n+1 Xn Xn
 n   1 1 1
1 n неравенство En = < + =
= 1+ 2 · > Бернулли > k! k! (n + 1)!
n −1 n+1 (2.2.242) k=0 k=0
  n+1
X 1
n n
> 1+ 2 · > = = En+1 ,
n −1 n+1 k!
  k=0
 n n 1 n
> 1+ 2 · = 1+ · =1 эта последовательность возрастает.
n n+1 n n+1 С другой стороны, из (2.2.244) получаем:
То есть последовательность yn монотонно убы- ∀k ∈ Z+ k! > 2k−1
вает:
yn−1 > yn ⇓
1 1
С другой стороны, все числа yn положительны, ∀k ∈ Z+ 6 k−1
k! 2
и поэтому она ограничена:

0 < ... < yn < yn−1 < ... < y3 < y2 < y1
240 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Xn X n Xn  k
1 1 1 ⇓
En = 6 k−1
= 2 · =
k! 2 2 Em 6 e (m ∈ N)
k=0 k=0 k=0
n+1 n+1
1 − 12 1 − 21 ⇓
= (2.2.246) = 2 · =2· =
1 − 21 1
2 E = lim Em 6 e
 n+1 ! m→∞
1 1 2. Докажем теперь (3.2.98). Первое неравен-
=4· 1− = 4 − n−1 < 4,
2 2 ство здесь следует из возрастания последова-
тельности En :
и значит она ограничена сверху.
По теореме Вейерштрасса 3.2.11 получаем, e = lim Em = sup Em > En+1 > En
m→∞ m∈Z+
что она имеет предел. Обозначим его буквой E:

En −→ E
n→∞ e − En > 0
Наша задача – проверить, что E = e. С одной А второе – из неравенства (2.2.245): для любых
стороны, n, p ∈ N мы получим
 n n
X (n + m)! > n! · (n + 1)m (2.2.245)
1 1
1+ = (2.2.251) = Cnk · k =
n n ⇓
k=0
n
X n! 1 1 1
= · k = 6
k! · (n − k)! n (n + m)! n! · (n + 1)m
k=0
n  k ⇓
X 1 n! 1
= · · =
k! (n − k)! n n+p
X n
X n+p
X 1
k=0 1 1
Xn En+p − En = − = =
1 1 1 k! k! k!
= · n · ... · (n − k + 1) · · ... · = k=0 k=0 k=n+1
k! | {z } |n {z n}
Xp
k=0 m=k−n 1
k множителей
k множителей = k =m+n = 6
n
X 16m6p (n + m)!
1 n n−1 n−k+1 m=1
= · · · ... · = Xp p  m
k! 1 1 X 1
k=0 |n n {z n }
6 = · =
k множителей
m=1
n! · (n + 1)m n! m=1 n + 1
Xn      p+1
1 1 k−1 1 1
= ·1· 1− · ... · 1 − 6 1 n+1 − n+1
k! n n = (2.2.247) = · =
k=0 | {z } n! 1
k множителей, и все 6 1
1 − n+1
 p  p
Xn 1 1
6
1
= En 1 1 − n+1 1 1 − n+1
k! = · = ·
k=0 n! n + 1 − 1 n! n

⇓ ⇓
 p
 n 1
1 1 1 − n+1
e = lim 1 + 6 lim En = E En+p − En 6 ·
n→∞ n n→∞ | {z } |n! {z n }
(p → ∞) ↓
А с другой – при любом m 6 n e − En
↓ (p → ∞)
1
n!·n
Pm 1
Em = k=0 k!

↑ (n → ∞) 1
z }| { e − En 6
Xm     n! · n
1 1 k−1
·1· 1− · ... · 1 − 6
k! n n
k=0
n     ! 3.2.60. Двойное неравенство (3.2.99) позволяет
X 1 1 k−1
6 ·1· 1− · ... · 1 − = оценивать число e. Для нахождения двух первых
k! n n знаков после запятой можно взять n = 7:
k=0
 n 7 7
1 X 1 X 1 1
= 1+ <e6 +
n k! k! 7! · 7
| {z } k=0 k=0
↓ (n → ∞) Значения величин справа и слева можно при-
e ближенно вычислить (на бумаге, или с помощью
§ 3. Непрерывные функции 241

калькулятора), получив оценки сверху и снизу, Доказательство. Предположим, что оно рацио-
из которых затем выводится оценка для e: с од- нально, то есть имеет вид
ной стороны,
m
e=
1 n
8!·8 = 0, 000198412698...
⇓ для некоторых m, n ∈ N. Из оценки (3.2.100) сле-
1
0, 00019 < 8!·8 < 0, 0002 дует, что n > 2 (потому что при n = 1 мы получи-
с другой – ли бы, что e целое). Запомним это. Из двойного
неравенства (3.2.98) мы получаем:
P8 1
= 2, 71827877... n
m X 1
k=0 k!
⇓ 1
P8 0< − 6
1
2, 718 < k=0 k! < 2, 719 n k! n! · n
k=n

И вместе это дает: ⇓


n
8 8 m · n! X n! 1
X 1 X 1 1 0< − 6
2, 718 < <e< + < n k! n
k=n
k! k! 8! · 8
k=0 k=0

< 2, 719 + 0, 0002 = 2, 7192

⇓ n
X
0 < m · (n − 1)! − n · (n − 1) · ... · (n − k) 6
| {z } | {z }
k=n
целое целое
2, 71 < e < 2, 72 (3.2.100) | {z }
целое
⇓ 1 1
6 6
n 2
e = 2, 71... (3.2.101) 
Мы получаем, что в полуинтервале 0; 12 лежит
Теорема 3.2.22. Число e иррационально: какое-то целое число. Понятно, что это невоз-
можно, и значит наше предположение (о раци-
e∈/Q ональности e) было неверным.

§3 Непрерывные функции
(a) Что такое непрерывная функция?
Пусть нам дано уравнение, связывающее две физические величины,

y = f (x),

и мы говорим, что y непрерывно зависит от x. Что это означает? Интуитивный ответ очевиден:
непрерывная функция – это такая, у которой график – непрерывная линия.

⋄ 3.3.1. Например, функция ⋄ 3.3.2. И наоборот, функция сигнум



1, если x > 0
f (x) = x2 sgn x = 0, если x = 0


−1, если x < 0

непрерывна, потому что у нее график – непре- разрывна, потому что у нее график имеет раз-
рывная линия рыв:
242 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Однако, это соображение не может быть точным определением, потому что оно объясняет смысл
одного нового понятия (непрерывная функция) с помощью другого нового понятия (непрерывная
линия).
Как же быть? Оказывается, имеется очень простой способ объяснить, что такое непрерывная
функция, опираясь на известное нам уже (то есть, старое для нас) понятие предела последователь-
ности. Это делается с помощью следующей серии определений.
• Функция f , определенная на множестве E ⊆ R, называется
– непрерывной в точке a ∈ E на множестве E, если f определена на множестве E, и
для всякой последовательности точек xn ∈ E, сходящейся к точке a,
 
xn −→ a xn ∈ E
n→∞

соответствующая последовательность f (xn ) значений функции f стремится к f (a):


f (xn ) −→ f (a)
n→∞

(при этом точка a называется точкой непрерывности функции f на множестве E);


– разрывной в точке a на множестве E, если f определена на множестве E, и найдется
последовательность  
xn −→ a xn ∈ E
n→∞

такая, что f (xn ) не стремится к f (a)


6
f (xn )−→ f (a)
n→∞

(при этом точка a называется точкой разрыва функции f на множестве E)


• Функция f , определенная на множестве E, называется
– непрерывной на множестве E, если она непрерывна в любой точке a ∈ E на
множестве E, то есть для всякой последовательности точек xn ∈ E, сходящейся
к любой точке a ∈ E,  
xn −→ a xn , a ∈ E
n→∞

соответствующая последовательность f (xn ) значений функции f стремится к


f (a):
f (xn ) −→ f (a)
n→∞
– разрывной на множестве E, если она разрывна в некоторой точке a ∈ E на
множестве E, то есть существует такая точка a ∈ E и такая последовательности
точек xn ∈ E, сходящаяся к a,
 
xn −→ a xn , a ∈ E
n→∞
§ 3. Непрерывные функции 243

что соответствующая последовательность f (xn ) значений функции f не стре-


мится к f (a):
6
f (xn )−→ f (a)
n→∞

• Функция f называется непрерывной (соответственно, разрывной), если она непрерывна


(соответственно, разрывна) на своей области определения D(f ).

⋄ 3.3.3. Функция f (x) = x2 будет непрерывна мы получим


на множестве E = R, потому что (по свойству
30 сходящихся последовательностей на с.216) из {xn } = (2.2.293) = xn −→ 1,
n→∞
условия xn −→ a следует условие f (xn ) =
n→∞ то есть
(xn )2 −→ a2 = f (a). {x } −→6 0 = {1}.
n→∞ n
n→∞
⋄ 3.3.4. Наоборот, функция сигнум f (x) = sgn x, В силу периодичности функции f (x) = {x}, от-
определенная выше формулой (3.1.3), разрывна сюда следует, что она разрывна в любой точке
на множестве E = R, точнее, в точке x = 0, по- a ∈ Z. С другой стороны, нетрудно убедиться,
тому что если взять последовательность / Z.
что она непрерывна в любой точке a ∈
1
xn = −→ 0 ⊲ 3.3.7. В каких точках непрерывна функция
n n→∞ f (x) = [x] (целая часть числа)?
то окажется, что
⊲ 3.3.8. Для следующих функций найдите точки
f (xn ) = 1 −→ 1 6= 0 = f (0) разрыва (если они есть) и докажите, что в этих
n→∞
точках функции действительно разрывны:
Однако, в любой другой точке она непрерыв- 
на. Например, в любой точке a > 0: если взять 
1 − x, если x > 0
ε = a > 0 и рассмотреть окрестность (0; 2a) = f (x) = −1 − x, если x < 0 ,
(a − ε; a + ε), то для всякой последовательности 

0, если x = 0
xn −→ a 
n→∞

0, если x < 0
мы получим, что почти все числа xn лежат в ин- g(x) = x2 , если 0 6 x 6 1 ,
тервале (0; 2a), значит, для почти всех n ∈ N вы- 

полняется неравенство 0, если x > 1

⋄ 3.3.9. Непрерывность модуля Функция


xn > 0
f (x) = |x| непрерывна.
поэтому для почти всех n ∈ N
Доказательство. Для любой точки a ∈ R и лю-
f (xn ) = sgn xn = 1 бой последовательности xn −→ a получаем це-
n→∞
почку следствий:
и следовательно,
xn −→ a
f (xn ) −→ 1 = f (a) n→∞
 
n→∞
применяем
⇓ теорему 3.2.5
Аналогично доказывается, что f (x) = sgn x
xn − a −→ 0
непрерывна в любой точке a < 0. n→∞
 
вспоминаем
⊲ 3.3.5. Покажите, что функция ⇓  определение 
бесконечно малой
( на с.211
1, если x 6= 0
f (x) = sgn2 x = |xn − a| −→ 0
0, если x = 0 n→∞
⇓ (3.1.11)
также разрывна в точке 0, но непрерывна в лю-
−|xn − a| 6 |xn | − |a| 6 |xn − a|
бой точке a 6= 0. | {z } | {z }
↓ ↓
⋄ 3.3.6. Покажем, что функция f (x) = {x} 0 0
 
(дробная часть числа) разрывна в точке 1. Дей- применяем
ствительно, для последовательности ⇓  теорему о двух 
милиционерах 3.2.10
1 |xn | − |a| −→ 0
xn = 1 − −→ 1 n→∞
n n→∞
244 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Мы получили, что если xn −→ a, то |xn | −→ 2. Пусть k ∈ N, тогда функция f (x) = xk


n→∞ n→∞
|a|. Это означает, что функция f (x) = |x| непре- определена на всей числовой прямой R. Зафик-
рывна в любой точке a ∈ R. Таким образом, сируем точку a ∈ R и рассмотрим произвольную
f (x) = |x| – непрерывная функция. последовательность

⋄ 3.3.10. Непрерывность линейной функ- xn −→ a


n→∞
ции. Функция вида
Тогда, в силу арифметических свойств пределов
f (x) = kx + b, k, b ∈ R (3.3.102)
последовательностей (40 на с. 216), имеем
называется линейной. Покажем, что она непре-
рывна. f (xn ) = (xn )k −→ ak = f (a)
n→∞

Доказательство. Пусть то есть f (x) непрерывна в точке a. Поскольку


точка a ∈ D(f ) выбиралась произвольно, мы по-
xn −→ a
n→∞ лучаем, что функция f (x) = xk непрерывна.
тогда, в силу арифметических свойств пределов 2. Пусть k = −m, m ∈ N, тогда функция
последовательностей (10 , 30 из (a)), имеем f (x) = x−m определена на множестве (−∞; 0) ∪
(0; +∞). Зафиксируем точку a ∈ (−∞; 0) ∪
f (xn ) = kxn + b −→ ka + b = f (a) (0; +∞) и рассмотрим произвольную последова-
n→∞
тельность
то есть f (x) непрерывна в точке a xn −→ a
n→∞
⋄ 3.3.11. Непрерывность степенной функ- тогда, в силу арифметических свойств пределов
ции. Функция f (x) = xk непрерывна при любом последовательностей (40 на с. 216), имеем
k ∈ Z. В частности, функция x 7→ x1 непрерывна.
Доказательство. Напомним, что при k > 0 сте- (xn )m −→ am
n→∞
пень xk определялась индуктивным соотношени-
ем (2.2.235), а при k < 0 – формулой (2.2.270). а затем по лемме 3.2.6,
Рассмотрим три случая.
1 1
1. При k = 0 эта функция будет по определе- f (xn ) = m
−→ m = f (a)
нию константой (xn ) n→∞ a
0
x = 1,
то есть f (x) непрерывна в точке a. Поскольку
поэтому в этом случае она непрерывна тривиаль- точка a ∈ D(f ) выбиралась произвольно, мы по-
ным образом. лучаем, что функция f (x) = xk непрерывна.

Интуитивный смысл непрерывности в том, что график функции f непрерывной на каком-нибудь


интервале (α; β) является непрерывной кривой.

⊲ 3.3.12. По графику функции рывной, и будет ли она непрерывной


1) на интервале (−∞; 1)?
2) на интервале (−∞; 0)?
3) на интервале (1; +∞)?
определите, в каких точках она является непре- 4) на интервале (0; 1)?

(b) Непрерывность и монотонные последовательности


Теорема 3.3.1. Для всякой функции f , определенной на множестве M , следующие условия экви-
валентны:
(i) f непрерывна в точке a на M ;
(ii) для любой строго монотонной последовательности xn −→ a
n→∞

f (xn ) −→ f (a) (3.3.103)


n→∞
§ 3. Непрерывные функции 245

Доказательство. Ясно, что из (i) следует (ii), потому что если f непрерывна в a, то f (xn ) −→ f (a)
n→∞
для любой последовательности xn −→ a (необязательно монотонной). Докажем, что наоборот если
n→∞
(i) не выполняется, то не выполняется и (ii). Пусть f – разрывная функция на M , то есть существует
последовательность xn ∈ M такие что

xn −→ a & 6
f (xn )−→ f (a)
n→∞ n→∞

План наших действий состоит в том, чтобы, последовательно переходя от xn к ее подпоследова-


тельностям, построить строго монотонную последовательность с теми же свойствами.
1. Прежде всего, по свойству подпоследовательностей 2◦ на с.228, второе условие означает, что
существует ε > 0 и последовательность натуральных чисел nk −→ ∞, такие что
k→∞

∀k ∈ N f (xnk ) ∈
/ (f (a) − ε; f (a) + ε)

Обозначив yk = xnk , мы получим последовательность с такими свойствами:

yk −→ a & ∀k ∈ N f (yk ) ∈
/ (f (a) − ε; f (a) + ε)
k→∞

2. Заметим далее, что числа yk не могут совпадать с a

∀k ∈ N yk 6= a

потому что иначе мы получили бы, что для некоторых k числа f (yk ) = f (a) лежат в интервале
(f (a) − ε; f (a) + ε). Отсюда следует, что либо бесконечный набор этих чисел лежит левее a, либо
бесконечный набор этих чисел лежит правее a. Будем для определенности считать, что выполняется
первое (второй случай рассматривается по аналогии):

yk < a.

Тогда по свойству 4◦ на с.228, найдется последовательность ki −→ ∞ такая, что


i→∞

∀i ∈ N yki < a

Обозначив zi = yki , мы получим последовательность с такими свойствами:


   
zi −→ a & ∀i ∈ N zi < a & ∀i ∈ N f (zi ) ∈
/ (f (a) − ε; f (a) + ε)
i→∞

3. После этого мы индуктивно определим две последовательности im и tm . Сначала полагаем

i1 = 1, t1 = z 1

Затем, если для m = 1, ..., l числа im и tm определены, мы замечаем вот что. Поскольку zi < a,
zi −→ a и tl < a, найдется такое il+1 , что zil+1 лежит в интервале (tl ; a):
i→∞

zil+1 > tl

Выбираем такое il+1 и полагаем


tl+1 = zil+1
Полученная последовательность tm = zm+1 обладает нужными нам свойствами. Во-первых, как
подпоследовательность zi , она стремится к a:

tm = zim −→ a
m→∞

Во-вторых, последовательность значений f на ней не заходит в интервал (f (a) − ε; f (a) + ε):

∀m ∈ N f (tm ) = f (zim ) ∈
/ (f (a) − ε; f (a) + ε)

И, в-третьих, она строго монотонна:

tm < zim+1 = tm+1


246 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(c) Операции над непрерывными функциями


Из непрерывных функций можно конструировать новые непрерывные функции с помощью алгеб-
раических операций и операции композиции.

Арифметические операции с непрерывными функциями.


• Если f и g – две функции, определенные на множестве X, то их суммой, разностью и
произведением называются функции на X, обозначаемые f +g, f −g и f ·g, и определенные
формулами
(f + g)(x) := f (x) + g(x), x∈X (3.3.104)
(f − g)(x) := f (x) − g(x), x∈X (3.3.105)
(f · g)(x) := f (x) · g(x), x∈X (3.3.106)
• Если f и g – две функции, определенные на множестве X, причем f нигде не обращается
в нуль на X, то отношением этих функций fg называется функция на X, определенная
формулой
g g(x)
(x) := , x∈X (3.3.107)
f f (x)
• Если f – функция, определенная на множестве X, а λ – число, то их произведением
называется функция λ · f на X, определенная формулой
(λ · f )(x) := λ · f (x), x∈X (3.3.108)
Теорема 3.3.2 (об арифметических операциях с непрерывными функциями). Если функции f и g
непрерывны (на области определения), то непрерывны (на области определения) и функции
g
f + g, f − g, λ · f, f · g,
f
(где λ ∈ R – произвольное число).
Доказательство. Пусть точка a и последовательность {xn } таковы, что обе функции f и g в них
определены, причем
xn −→ a
n→∞
Тогда, поскольку функции f и g непрерывны в точке x = a, мы получаем
f (xn ) −→ f (a) g(xn ) −→ g(a)
n→∞ n→∞
0 0 0
Поэтому, в силу свойств 1 , 2 , 4 из (a), мы получаем
f (xn ) + g(xn ) −→ f (a) + g(a) f (xn ) − g(xn ) −→ f (a) − g(a) f (xn ) · g(xn ) −→ f (a) · g(a)
n→∞ n→∞ n→∞

Это верно для произвольной точки a и последовательности xn −→ a, поэтому функции f + g, f − g,


n→∞
f · g непрерывны. Аналогично доказывается непрерывность для функции λ · f .
Если, кроме того, дополнительно потребовать, чтобы f (a) 6= 0 и f (xn ) 6= 0, то по свойству 50 из
(a) мы получим
g(xn ) g(a)
−→
f (xn ) n→∞ f (a)
и поскольку это будет верно для любой точки a ∈ D( fg ) и любой последовательности xn ∈ D( fg ),
xn −→ a, мы получим, что функция fg тоже должна быть непрерывна.
n→∞

Непрерывность композиции. Вспомним, что на с.40 мы определили понятие композиции двух


отношений. В частном случае, когда отображения являются числовыми функциями, их композиция
также становится числовой функцией (в силу формул (0.3.232) и (0.3.233)), и мы можем считать
отмеченную выше формулу (0.3.234) просто ее определением:
• Пусть g и f – две функции. Тогда функция g ◦ f , определенная правилом
(g ◦ f )(x) = g(f (x)), (3.3.109)
называется композицией функций g и f . Эту функцию называют также сложной функ-
цией, составленной из функций f и g.
§ 3. Непрерывные функции 247

⋄ 3.3.13. Пусть g(y) = 1


и f (x) = x + 1. Тогда 1 1
y H(x) = =
{x} y y={x}
1 1
(g ◦ f )(x) = g(y) = =
y=f (x) y y=x+1 x+1
⊲⊲ 3.3.15. Составьте композиции из следующих
Если же взять композицию этих функций в об- функций в разном порядке (то есть найдите
ратном порядке, то мы получим другую функ-
g(y) и f (x) ), и проверьте, будут ли
цию: y=f (x) x=g(y)
эти функции одинаковы:
1
(f ◦ g)(y) = f (x) =x+1 = +1
x=g(y) 1
x= y y 1) g(y) = y 2 и f (x) = D(x) − 12 .
⋄ 3.3.14. Представить функции в виде компози- 2) g(y) = sgn y и f (x) = |x|.
ции двух функций из списка на с.189:
1 ⊲⊲ 3.3.16. Представьте функции в виде компо-
G(x) = |x + 1|, H(x) =
{x} зиции двух функций из списка на с.189:
Решение: 1) [ x2 ],
G(x) = |x + 1| = |y| , 2) [x]
y=x+1 2 .

Теорема 3.3.3 (о композиции непрерывных функций). Если функции f и g непрерывны (на обла-
сти определения), то их композиция h(x) = g(f (x)) тоже непрерывна (на области определения).

Доказательство. Пусть точка a и последовательность {xn } лежат в области определения функции


h(x) = g(f (x)), причем
xn −→ a
n→∞

Тогда, поскольку f (x) непрерывна в точке x = a,

f (xn ) −→ f (a)
n→∞

Отсюда, поскольку g(y) непрерывна в точке y = f (a),

h(xn ) = g(f (xn )) −→ g(f (a))


n→∞

Мы получили, что если xn −→ a, то h(xn ) = g(f (xn )) −→ g(f (a)). Это означает, что h(x) = g(f (x))
n→∞ n→∞
непрерывна в точке x = a. Поскольку точка a с самого начала выбиралась произвольной, получаем,
что h(x) = g(f (x)) непрерывна в произвольной точке, то есть всюду на области определения.

(d) Теоремы о непрерывных функциях


Непрерывные функции обладают некоторыми важными свойствами, которые понадобятся в даль-
нейшем, в частности, для доказательства теоремы Ролля 5.1.6 (необходимой для доказательства
теорем Лагранжа, Коши и Тейлора из главы 5), а также теоремы об интегрируемости непрерывной
функции 7.2.4.

Теорема о сохранении знака


Теорема 3.3.4 (о сохранении знака непрерывной функцией). 11 Пусть функция f определена в
некоторой окрестности точки c и непрерывна в точке c, причем f (c) 6= 0. Тогда существует
окрестность (c − δ; c + δ) точки c такая, что всюду в этой окрестности функция f имеет тот
же знак, что и f (c):
∀x ∈ (c − δ; c + δ) sgn f (x) = sgn f (c)

Доказательство. Пусть для определенности f (c) > 0, покажем что для некоторого δ > 0 выполня-
ется соотношение
∀x ∈ (c − δ; c + δ) f (x) > 0 (3.3.110)
11 Эта теорема используется далее в главе 5 при доказательстве теоремы 5.2.15 о точках перегиба.
248 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство проводится методом от противного. Предположим, что (3.3.110) не выполняется ни


для какого δ > 0, то есть что
∀δ > 0 ∃x ∈ (c − δ; c + δ) f (x) 6 0
Тогда, в частности, оно не выполняется для чисел δn = n1 :
 
1 1
∀n ∈ N ∃xn ∈ c − ; c + f (xn ) 6 0
n n
Мы получаем, что имеется последовательность
xn −→ c (3.3.111)
n→∞
для которой
f (xn ) 6 0 (3.3.112)
Поскольку f (x) непрерывна в точке c, из (3.3.111) следует
f (xn ) −→ f (c)
n→∞

а по теореме 3.2.8 (о предельном переходе в неравенстве), из (3.3.112) следует


f (c) 6 0
Это противоречит предположению, что f (c) > 0. Значит, (3.3.110) все-таки должно выполняться
для какого-то δ > 0.

Теорема Коши о промежуточном значении.


Лемма 3.3.5 (о промежуточном значении). Пусть функция ϕ непрерывна на отрезке [a; b], и на
концах его принимает значения разных знаков:
ϕ(a) < 0 < ϕ(b) (или ϕ(a) > 0 > ϕ(b))
Тогда существует точка c ∈ (a; b) в которой ϕ(x) равна нулю:
ϕ(c) = 0
Доказательство. Пусть для определенности
ϕ(a) < 0 < ϕ(b)

Разделим отрезок [a; b] пополам. Если значение функции в середине отрезка равно нулю, то теорема
доказана. Если же нет, то выберем из двух половинок ту, у которой на концах функция ϕ принимает
§ 3. Непрерывные функции 249

значения разных знаков, и обозначим ее [a1 ; b1 ]:

ϕ(a1 ) < 0 < ϕ(b1 ), [a1 ; b1 ] ⊆ [a; b]

Проделаем то же самое с отрезком [a1 ; b1 ]: разделим его пополам, выберем ту половинку, на концах
которой ϕ(x) меняет знак, и обозначим ее [a2 ; b2 ]:

ϕ(a2 ) < 0 < ϕ(b2 ), [a2 ; b2 ] ⊆ [a1 ; b1 ]

Затем поделим отрезок [a2 ; b2 ], и так далее. В результате у нас получится цепочка вложенных
отрезков, на концах которых функция меняет знак:
b−a
[a; b] ⊃ [a1 ; b1 ] ⊃ [a2 ; b2 ] ⊃ ... b n − an = −→ 0, ϕ(an ) < 0 < ϕ(bn )
2n n→∞
По теореме 3.2.12 о вложенных отрезках, существует единственная точка c, принадлежащая всем
отрезкам [an ; bn ], причем
lim an = c = lim bn
n→∞ n→∞

Отсюда следует, что с одной стороны, поскольку ϕ(an ) < 0,

ϕ(c) = lim ϕ(an ) 6 0


n→∞

а с другой, поскольку ϕ(bn ) > 0,


ϕ(c) = lim ϕ(bn ) > 0
n→∞

И следовательно, ϕ(c) = 0.
Теорема 3.3.6 (Коши о промежуточном значении). 12 Пусть функция f непрерывна на отрезке
[a; b], и пусть C – произвольное число, лежащее между f (a) и f (b):
 
f (a) < C < f (b) или f (a) > C > f (b)

Тогда на интервале (a; b) найдется точка c такая, что

f (c) = C

Доказательство. Рассмотрим функцию

ϕ(x) = f (x) − C

Она будет непрерывна на отрезке [a; b] (как разность непрерывных функций) и принимает на концах
этого отрезка значения разных знаков
 
ϕ(a) = f (a) − C < 0 < f (b) − C = ϕ(b) или ϕ(a) = f (a) − C > 0 > f (b) − C = ϕ(b)

Поэтому, по лемме 3.3.5, существует точка c ∈ [a; b] такая, что ϕ(c) = 0. Отсюда f (c) = ϕ(c) + C =
C.

Теоремы Вейерштрасса
Теорема Вейерштрасса об ограниченности. Напомним, что функция f называется
– ограниченной сверху на множестве E, если существует число B такое, что

∀x ∈ E f (x) 6 B

– ограниченной снизу на множестве E, если существует число A такое, что

∀x ∈ E A 6 f (x)

– ограниченной на множестве E, если она ограничена на E сверху и снизу, то есть суще-


ствуют такие числа A и B что:

∀x ∈ E A 6 f (x) 6 B
12 Эта теорема используется далее на с.435 при доказательстве теоремы о среднем для определенного интеграла.
250 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Теорема 3.3.7 (Вейерштрасса об ограниченности). 13 Если функция f определена и непрерывна


на отрезке [a; b], то она ограничена на этом отрезке.
Доказательство. Предположим обратное, то есть что f (x) не ограничена на отрезке [a; b]. Значит
f (x) не ограничена сверху или снизу. Пусть для определенности f (x) не ограничена сверху:

∀B ∈ R ∃x ∈ [a; b] f (x) > B

Тогда для всякого n ∈ N можно подобрать точку xn ∈ [a; b] такую, что

f (xn ) > n (3.3.113)

Последовательность точек {xn } принадлежит отрезку [a; b] и значит ограничена. Следовательно, по


теореме Больцано-Вейерштрасса 3.2.13, {xn } содержит сходящуюся подпоследовательность {xnk }:

xnk −→ c ∈ [a; b] (3.3.114)


k→∞

Из формулы (3.3.113) получаем


f (xnk ) > nk −→ +∞
k→∞
поэтому
f (xnk ) −→ +∞ (3.3.115)
k→∞

Но с другой стороны, функция f непрерывна в любой точке отрезка [a; b], и в частности в точке
c ∈ [a; b], значит из (3.3.114) следует

f (xnk ) −→ f (c) 6= +∞ (3.3.116)


k→∞

Мы получили противоречие между (3.3.115) и (3.3.116), которое означает, что наше исходное пред-
положение было неверно. Значит, функция f все-таки ограничена.

Теорема Вейерштрасса об экстремумах. Пусть функция f определена на множестве E ⊆ R.


Точка xmax ∈ E называется точкой максимума функции f на множестве E, если

∀x ∈ E f (x) 6 f (xmax )

Число f (xmax ) при этом называется максимумом функции f на множестве E и обозначается

f (xmax ) = max f (x)


x∈E

Наоборот, точка xmin ∈ E называется точкой минимума функции f на множестве E, если

∀x ∈ E f (xmin ) 6 f (x)

Число f (xmin ) при этом называется минимумом функции f на множестве E и обозначается

f (xmin ) = min f (x)


x∈E

Экстремумом функции f на множестве E называется минимум или максимум функции f на


множестве E.
! 3.3.17. Максимум и минимум функции – не то же самое, что точная верхняя и точная нижняя
грани.

13 Эта теорема используется в следующем параграфе при доказательстве теоремы Вейерштрасса об экстремумах

3.3.8
§ 3. Непрерывные функции 251

⋄ 3.3.18. Пусть E = [−1; 1] и f (x) = x2 . точка минимума и нет точек максимума, при-
чем точная нижняя грань (существует и) совпа-
дает с минимумом, а точная верхняя грань суще-
ствует, но не совпадает с максимумом, которого
на множестве E = (−1; 1) нет (потому что нет
точек максимума):

min x2 = x2 =0= inf x2


x∈(−1;1) x=0 x∈(−1;1)

sup x2 = 1 ∄ max x2
x∈(−1;1) x∈(−1;1)
Тогда на множестве E у функции f имеется одна
точка минимума и две точки максимума, причем
⋄ 3.3.20. Пусть E = R и f (x) = {x}.
минимум совпадает с точной нижней гранью, а
максимум – с точной верхней гранью:
min x2 = x2 =0= inf x2
x∈[−1;1] x=0 x∈[−1;1]

max x2 = x2 = x2 =1= sup x2


x∈[−1;1] x=−1 x=1 x∈[−1;1]

⋄ 3.3.19. Пусть E = (−1; 1) и f (x) = x2 .

Тогда на множестве E у функции f нет точек


минимума, хотя точная нижняя грань существу-
ет:
inf {x} = 0 ∄ min{x}
x∈R x∈R

При этом максимум на этом множестве есть:

Тогда на множестве E у функции f имеется одна sup{x} = max{x} = 1


x∈R x∈R

Итак, экстремумы могут существовать, а могут и не существовать.


Теорема 3.3.8 (Вейерштрасса об экстремумах). 14 Если функция f определена и непрерывна на
отрезке [a; b], то она имеет минимум и максимум на этом отрезке.
Доказательство. Докажем существование максимума. По теореме 3.3.7, функция f ограничена
сверху на [a; b]:
∃C ∀x ∈ [a; b] f (x) 6 C
поэтому по теореме 2.1.23 о точной границе, у функции f существует точная верхняя грань на этом
множестве:
∃ sup f (x) = M
x∈[a;b]

Это значит, что во-первых, все значения функции f на отрезке [a; b] не превосходят M

∀x ∈ [a; b] f (x) 6 M (3.3.117)

и во-вторых если взять любое число α < M , то обязательно оно окажется меньше, чем какое-то
значение f (x) на отрезке [a; b]
∀α < M ∃x ∈ [a; b] α < f (x)
Возьмем в качестве α числа вида M − n1 . Тогда у нас получится целая последовательность {xn }:

1
∀n ∈ N ∃xn ∈ [a; b] M − < f (xn ) (3.3.118)
n
14 Эта теорема используется ниже на с.327 при доказательстве теоремы Ролля 5.1.6, на с.433 при доказательстве

теоремы об интегрируемости непрерывной функции 7.2.4, и на с.438 при доказательстве интегральной теоремы о
среднем (свойство 7◦ на с.435).
252 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Поскольку последовательность {xn } лежит в отрезке [a; b], она ограничена. Значит по теореме
Больцано-Вейерштрасса 3.2.13, из нее можно выбрать сходящуюся подпоследовательность:

xnk −→ c (c ∈ [a; b])


k→∞

Поскольку f (x) непрерывна в любой точке отрезка [a; b] и, в частности, в точке c ∈ [a; b], мы
получаем
f (xnk ) −→ f (c)
k→∞

С другой стороны, из (3.3.117) и (3.3.118) следует


1
M− < f (xnk ) 6 M
nk
откуда  
1
M = lim M − 6 lim f (xnk ) = f (c) 6 M
k→∞ nk k→∞
то есть
f (c) = M
Еще раз вспомнив (3.3.117), получим

∀x ∈ [a; b] f (x) 6 M = f (c)

Это означает, что c ∈ [a; b] является точкой максимума функции f на множестве [a; b].
Следствие 3.3.9. Множество значений всякой (определенной на отрезке) непрерывной функции
f : [a, b] → R является отрезком.
Доказательство. По теореме 3.3.8 функция f имеет минимум в некоторой точке α ∈ [a, b] и мак-
симум в некоторой точке β ∈ [a, b]:

f (α) = min f (x), f (β) = max f (x).


x∈[a,b] x∈[a,b]

Покажем, что
R(f ) = [f (α), f (β)].
1. Будем считать для начала, что α < β. Тогда по теореме Коши 3.3.6, любая точка C ∈
(f (α), f (β)) является образом некоторой точки c ∈ (α, β). Значит, весь отрезок [f (α), f (β)] лежит в
R(f ) = f ([a, b]):
[f (α), f (β)] ⊆ R(f ).
Но с другой стороны, никакая точка y, лежащая выше [f (α), f (β)], не может принадлежать f ([a, b]),
потому что тогда мы получили бы, что f (β) — не максимум множества f ([a, b]). И таким же образом,
никакая точка y, лежащая ниже [f (α), f (β)], не может принадлежать f ([a, b]), потому что тогда мы
получили бы, что f (α) — не минимум множества f ([a, b]). Значит,

[f (α), f (β)] = R(f ).

2. В случае если α > β можно рассмотреть функцию

g(x) = f (−x)

и для нее мы получим, что

g(−α) = min g(x), g(−β) = max g(x)


x∈[−a,−b] x∈[−a,−b]

и
−α < −β.
Тогда, по уже доказанному,
R(g) = [g(−α), g(−β)],
и это можно дополнить до цепочки

R(f ) = R(g) = [g(−α), g(−β)] = [f (α), f (β)].


§ 3. Непрерывные функции 253

Теорема Кантора о равномерной непрерывности


Говорят, что функция f равномерно непрерывна на множестве E если для любых двух последо-
вательностей аргументов αn ∈ E и βn ∈ E стремящихся друг к другу, соответствующие последова-
тельности значений {f (αn )} и {f (βn )} тоже стремятся друг к другу:
∀αn , βn ∈ E αn − βn −→ 0 =⇒ f (αn ) − f (βn ) −→ 0 (3.3.119)
n→∞ n→∞

⋄ 3.3.21. Линейная функция f (x) = kx+b равно- то мы получим, что


мерно непрерывна на множестве E = R, потому
что если 1
αn − βn = −→ 0
αn − βn −→ 0 n n→∞
n→∞
то но при этом

f (αn ) − f (βn ) = (kαn + b) − (kβn + b) =  2


1
f (αn )−f (βn ) = (αn )2 −(βn )2 =
n+ −n2 =
= kαn − kβn = k(αn − βn ) −→ 0 n
n→∞
1 1 1
⋄ 3.3.22. Квадратичная функция f (x) = x2 не = 2n · + 2 = 2 + 2 −→ 2 6= 0
n n n n→∞
является равномерно непрерывной на множестве
E = R, потому что если взять, например,
1
αn = n + , βn = n
n

Теорема 3.3.10 (Кантора о равномерной непрерывности). 15 Если функция f определена и непре-


рывна на отрезке [a; b], то она равномерно непрерывна на этом отрезке.
Доказательство. Доказательство проводится от противного. Предположим, что f (x) не является
равномерно непрерывной на [a; b]. Тогда существуют последовательности аргументов αn ∈ [a; b] и
βn ∈ [a; b] которые стремятся друг к другу
αn − βn −→ 0
n→∞

но при этом последовательности значений не стремятся друг к другу:


f (αn ) − f (βn )−→
6 0
n→∞

Рассмотрим последовательность
γn = f (αn ) − f (βn )
То, что она не стремится к нулю
γn −→
6 0
n→∞
означает, что найдется некоторая окрестность нуля (−ε; ε) которая не содержит бесконечное коли-
чество чисел {γn }. Значит можно выбрать подпоследовательность {γnk }, которая вообще не будет
заходить в окрестность (−ε; ε):
∀k |γnk | = |f (αn ) − f (βn )| > ε (3.3.120)
Рассмотрим теперь индексы {nk }. Им соответствует некоторая подпоследовательность {αnk } после-
довательности {αn }. Поскольку она ограничена (из-за того, что αnk ∈ [a; b]), по теореме Больцано-
Вейерштрасса 3.2.13 мы можем выбрать у нее некоторую сходящуюся подпоследовательность {αnkj }:

αnkj −→ c (c ∈ [a; b])


j→∞

Тогда мы получим, что соответствующая последовательность {βnkj } стремится к тому же пределу


c, потому что
βnkj = (βnkj − αnkj ) + αnkj −→ 0 + c = c
| {z } |{z } j→∞
↓ ↓
0 c

15 Эта теорема используется на с.433 при доказательстве теоремы об интегрируемости непрерывной функции.
254 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Отсюда следует, что


   
f αnkj − f βnkj −→ f (c) − f (c) = 0
|{z} |{z} j→∞
↓ ↓
c c

а это противоречит условию (3.3.120), из которого видно, что расстояние между f (αnkj ) и f (βnkj )
не может быть меньше ε.
Итак, мы предположили, что f (x) не является равномерно непрерывной на [a; b] и получили про-
тиворечие. Это означает, что предположение неверно, и функция f все-таки равномерно непрерывна
на [a; b].

Теоремы о монотонных функциях.


Монотонные функции на отрезке.

Теорема 3.3.11 (о монотонной функции на отрезке). Пусть функция f определена и строго мо-
нотонна на отрезке I = [a, b], и пусть J – отрезок с концами f (a) и f (b):
(
[f (a); f (b)], если f возрастает
J=
[f (b); f (a)], если f убывает.

Тогда:
(i) если f биективно отображает отрезок I на отрезок J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает отрезок I на отрезок J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.

Доказательство. Будем считать для определенности, что функция f строго возрастает:

s<t =⇒ f (s) < f (t) (3.3.121)

(случай убывания рассматривается аналогично).


Докажем (i). Пусть f биективно отображает отрезок I на отрезок J. Тогда у нее имеется обратная
функция f −1 : J → I.
1. Прежде всего заметим, что f −1 : J → I также будет возрастать. Действительно, если бы это
было не так, то для некоторых y1 , y2 ∈ J мы получили бы

y1 < y2 & f −1 (y1 ) > f −1 (y2 )

Тогда можно было бы обозначить x1 = f −1 (y1 ) и x2 = f −1 (y2 ), и получилось бы:

f (x1 ) < f (x2 ) & x1 > x2


| {z } | {z } |{z} |{z}
y1 y2 f −1 (y 1) f −1 (y2 )

Это противоречит утверждению 1◦ на с.199: поскольку f возрастает, она должна неубывать, значит
условие x1 > x2 должно влечь за собой условие f (x1 ) > f (x2 ), а у нас получается наоборот, f (x1 ) <
f (x2 ).
2. Покажем, что функция f : I → J непрерывна. Пусть xn −→ x, покажем что f (xn ) −→
n→∞ n→∞
f (x). По теореме 3.3.1, последовательность xn можно считать строго монотонной. Нам придется
рассмотреть два случая.
§ 3. Непрерывные функции 255

A. Пусть сначала xn возрастает:

x1 < x2 < ... < xn < ... < x

Тогда предел x этой последовательности равен ее точной верхней грани

lim xn = sup xn = x (3.3.122)


n→∞ n∈N

и то же для предела последовательности f (xn ) поскольку, в силу (3.3.121), она тоже воз-
растает:
lim f (xn ) = sup f (xn ) (3.3.123)
n→∞ n∈N

Обозначив yn = f (xn ), мы получим



sup yn = sup f (xn ) 6 (3.1.30) 6 f sup xn = (3.3.122) = f (x)
n∈N n∈N n∈N


sup yn 6 f (x)
n∈N

⇓ (f −1 возрастает, как уже доказано)

  
f −1 sup yn 6 f −1 f (x) = x (3.3.124)
n∈N

А с другой стороны, опять, поскольку f −1 возрастает,


  
x = sup xn = sup f −1 f (xn ) = sup f −1 (yn ) 6 (3.1.30) 6 f −1 sup yn
n∈N n∈N n∈N n∈N


 
x 6 f −1 sup yn (3.3.125)
n∈N

Неравенства (3.3.124) и (3.3.125) вместе дают


 
x = f −1 sup yn
n∈N

То есть
f (x) = sup yn = sup f (xn ) = (3.3.123) = lim f (xn )
n∈N n∈N n→∞

B. Пусть теперь наоборот, xn убывает:

x < ... < xn < ... < x2 < x1

Тогда предел x этой последовательности равен ее точной нижней грани

lim xn = inf xn = x (3.3.126)


n→∞ n∈N

и то же для предела последовательности f (xn ) поскольку, в силу (3.3.121), она тоже воз-
растает:
lim f (xn ) = inf f (xn ) (3.3.127)
n→∞ n∈N

Обозначив yn = f (xn ), мы получим



inf yn = inf f (xn ) > (3.1.30) > f inf xn = (3.3.126) = f (x)
n∈N n∈N n∈N


sup yn > f (x)
n∈N

⇓ (f −1 возрастает, как уже доказано)


256 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

  
f −1 inf yn > f −1 f (x) = x (3.3.128)
n∈N

А с другой стороны, опять, поскольку f −1 возрастает,


  
x = inf xn = inf f −1 f (xn ) = inf f −1 (yn ) > (3.1.30) > f −1 inf yn
n∈N n∈N n∈N n∈N


 
x > f −1 inf yn (3.3.129)
n∈N

Неравенства (3.3.128) и (3.3.129) вместе дают


 
x = f −1 inf yn
n∈N

То есть
f (x) = inf yn = inf f (xn ) = (3.3.127) = lim f (xn )
n∈N n∈N n→∞

3. Мы показали, что если функция f : I → J возрастает и биективна, то она автоматически


непрерывна. Поскольку обратная функция f −1 : J → I тоже биективна и, как мы уже убедились,
тоже возрастает, мы получаем, что она тоже должна быть непрерывной.
Докажем (ii). Пусть f непрерывна на I.
1. Заметим, что f отображает I в J. Это следует из того, что функция f неубывает (1◦ на с.199):
если x ∈ I = [a, b], то
a6x6b =⇒ f (a) 6 f (x) 6 f (b) =⇒ f (x) ∈ J = [f (a), f (b)]
2. Проверим, что f инъективно отображает I в J. Для любых x, y ∈ I получаем:
   
x < y =⇒ f (x) < f (y) f (x) < f (y)
x 6= y =⇒ =⇒ =⇒ f (x) 6= f (y) (3.3.130)
y < x =⇒ f (y) < f (x) f (y) < f (x)

3. Покажем далее, что f сюръективно отображает I в J, то есть что f (I) = J. Для любого
C ∈ J = [f (a), f (b)] получаем:
— либо C лежит на левом конце отрезка J = [f (a), f (b)], то есть C = f (a), и тогда точка
x = a ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит на правом конце отрезка J = [f (a), f (b)], то есть C = f (b), и тогда точка
x = b ∈ I = [a, b] будет прообразом для C: C = f (x);
— либо C лежит внутри отрезка J = [f (a), f (b)], то есть f (a) < C < f (b), и тогда по
теореме Коши о промежуточном значении 3.3.6 найдется точка x ∈ (a, b) такая, что C =
f (x).
4. Инъективность и сюръективность отображения f : I → J означают, что оно является биекци-
ей, и поэтому правило
f (x) = y ⇐⇒ x = f −1 (y)
определяет обратное к нему отображение f −1 : J → I.
5. Проверим, что функция f −1 : J → I строго монотонна. Пусть y1 < y2 – две точки из J.
Обозначим x1 = f −1 (y1 ) и x2 = f −1 (y2 ). Поскольку отображение f −1 биективно, x1 не может быть
равно x2 . Значит, либо x1 < x2 , либо x1 > x2 . Но второе, в силу строгого возрастания f , влечет за
собой неравенство y1 > y2 :
x1 > x2 =⇒ y1 = f (x1 ) > f (x2 ) = y2 ,
что противоречит исходному выбору y1 < y2 . Значит, x1 > x2 тоже невозможно. Мы получаем, что
возможно только неравенство x1 < x2 , и это означает, что функция f −1 строго возрастает:
y1 > y2 =⇒ x1 = f −1 (y1 ) > f −1 (y2 ) = x2 .
6. Осталось убедиться, что функция f −1 : J → I непрерывна. Предположим, что это не так, то
есть что существует последовательность yn ∈ J = [f (a), f (b)] такая что
yn −→ y & f −1 (yn ) −→
6 f −1 (y) (3.3.131)
n→∞ n→∞
§ 3. Непрерывные функции 257

Обозначим xn = f −1 (yn ) и x = f −1 (y), тогда

xn = f −1 (yn ) −→
6 f −1 (y) = x
n→∞

и по свойству 2◦ на с.228, это означает, что существует подпоследовательность xnk , лежащая вне
некоторой окрестности (x − ε; x + ε) точки x:

xnk ∈
/ (x − ε; x + ε), ε>0 (3.3.132)

С другой стороны, последовательность xnk лежит в отрезке [a, b], поэтому по теореме Больцано-
Вейерштрасса 3.2.13, у нее должна быть сходящаяся подпоследовательность:

xnki −→ t (t ∈ I = [a, b])


n→∞

Из (3.3.132) следует, что t ∈


/ (x − ε; x + ε), поэтому t 6= x. Но, с другой стороны,

xnki −→ t
n→∞

ynki = f (xnki ) −→ f (t)


n→∞

f (t) = lim ynki = (свойство 1◦ на с. 228) = lim yn = y


i→∞ n→∞

t = f −1 (f (t)) = f −1 (y) = x
То есть t 6= x и одновременно t = x. Это противоречие означает, что наше предположение (3.3.131)
о разрывности функции f −1 было неверно.

Монотонные функции на интервале.

Теорема 3.3.12 (о монотонной функции на интервале). Пусть функция f определена и строго


монотонна на интервале I = (a, b), и пусть J – интервал с концами inf x∈I f (x) и supx∈I f (x):
 
J= inf f (x); sup f (x)
x∈I x∈I

Тогда:
(i) если f биективно отображает интервал I на интервал J, то
(a) она непрерывна на I, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
(ii) если f непрерывна на I, то
(a) она биективно отображает интервал I на интервал J, и
(b) ее обратная функция f −1 : J → I также непрерывна и строго монотонна.
При этом характер монотонности наследуется обратной функцией:
— если f : I → J возрастает, то и f −1 : J → I возрастает,
— если f : I → J убывает, то и f −1 : J → I убывает.

! 3.3.23. В условиях теоремы из равенства f −1 (J) = I следуют две формулы, которые, несмотря
на свою очевидность, оказываются полезными:16

inf f −1 (y) = inf I sup f −1 (y) = sup I (3.3.133)


y∈J y∈J
16 Мы используем формулы (3.3.133) ниже в предложении 4.1.2.
258 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Доказательство. Как и в доказательстве предыдущей теоремы будем считать, что f строго воз-
растает.
Докажем (i). Пусть f биективно отображает интервал I на интервал J. Тогда у нее имеется
обратная функция f −1 : J → I.
1. Прежде всего, как и в теореме 3.3.11, без труда доказывается, что обратная функция f −1 :
J → I также возрастает.
2. Выберем отрезок [α, β] ⊆ I, и покажем, что f биективно отображает его на отрезок [f (α), f (β)] ⊆
J. Во-первых, из-за монотонности, f действительно отображает [α, β] в [f (α), f (β)]:

x ∈ [α, β] =⇒ α6x6β =⇒ f (α) 6 f (x) 6 f (β)

Во-вторых, если C ∈ [f (α), f (β)], то, поскольку f : I → J биективно, должно существовать c ∈ I


такое, что
f (c) = C
Нам нужно показать, что это c лежит в отрезке [α, β]. Если бы это было не так, то мы получили
бы:
— либо c < α, и тогда C = f (c) < f (α), а это невозможно, потому что C ∈ [f (α), f (β)],
— либо β < c, и тогда f (β) < f (c) = C, и это тоже невозможно, потому что C ∈ [f (α), f (β)].
Таким образом, что c ∈ [α, β], и это доказывает сюръективность отображения f : [α, β] → [f (α), f (β)].
С другой стороны, будучи строго монотонным, оно инъективно, поэтому является биекцией.
3. По теореме 3.3.11, функция f : [α, β] → [f (α), f (β)] должна быть непрерывной. Это верно для
любого отрезка [α, β] ⊆ I, поэтому наша исходная функция f : I → J непрерывна на интервале I.
4. Для доказательства (i) остается только убедиться, что обратная функция f −1 : J → I тоже
непрерывна на J. Для этого возьмем произвольный отрезок [A, B] ∈ J (A < B) и положим

α = f −1 (A), β = f −1 (B)

Поскольку, как мы уже заметили, f −1 возрастает, получаем

α<β

и, опять мы это уже показали, функция f будет биективно (и строго монотонно) отображать отрезок
[α, β] на отрезок [A, B] = [f (α), f (β)]. Значит, по теореме 3.3.11, обратная функция f −1 : [A, B] →
[α, β] тоже должна быть непрерывной. Это верно для любого отрезка [A, B] ∈ J, поэтому функция
f −1 : J → I должна быть непрерывна.
Докажем (ii). Пусть f непрерывна на I.
1. Если x ∈ I = (a, b), то выбрав α и β так, чтобы x ∈ [α, β] ⊆ (a, b) = I. Тогда:

a<α<x<β<b


inf f (t) 6 f (α) < f (x) < f (β) 6 sup f (t)
x∈I x∈I


 
f (x) ∈ inf f (t), sup f (t) = J
x∈I x∈I

То есть f (I) ⊆ J.
2. Инъективность отображения f : I → J доказывается той же цепочкой (3.3.130), что и для
случая, когда I – отрезок.
3. Сюръективность отображения f : I → J. Пусть y ∈ J = (inf t∈I f (t), supt∈I f (t)). Тогда:

inf f (t) < y < sup f (t) =⇒ ∃t1 , t2 ∈ I : f (t1 ) < y < f (t2 ) =⇒
t∈I t∈I
=⇒ y ∈ [f (t1 ); f (t2 )] =⇒ ∃x ∈ [t1 ; t2 ] y = f (x)
теорема 3.3.11

4. Снова инъективность и сюръективность отображения f : I → J означают, что оно является


биекцией, и поэтому правило

f (x) = y ⇐⇒ x = f −1 (y)
§ 4. Предел функции 259

определяет обратное к нему отображение f −1 : J → I.


5. Строгая монотонность функции f −1 : J → I доказывается так же, как и в случае, когда I –
отрезок.
6. Остается проверить непрерывность функции f −1 : J → I. Пусть y1 < y2 – произвольные
точки из J. Рассмотрим точки x1 = f −1 (y1 ) и x2 = f −1 (y2 ) из I. Поскольку функция f −1 : J → I
строго возрастает, должно выполняться неравенство x1 < x2 . Рассмотрим отрезок [x1 , x2 ]. На нем
функция f непрерывна и строго возрастает, поэтому, как мы уже доказали, f должна непрерыв-
но и биективно отображать [x1 , x2 ] на [f (x1 ), f (x2 )] = [y1 , y2 ], а обратное отображение f −1 будет
непрерывно отображать [y1 , y2 ] в [x1 , x2 ].
Из этого можно сделать вывод, что функция f −1 : J → I непрерывна на каждом отрезке [y1 , y2 ]
из интервала J. Это автоматически означает, что f −1 непрерывна на J.

! 3.3.24. Утверждения, аналогичные теоремам 3.3.11 и 3.3.12 справедливы и для полуинтервалов.


Мы предлагаем читателю самостоятельно их сформулировать и доказать.

§4 Предел функции
В примере 3.3.6 выше мы заметили, что функция f (x) = {x} (дробная часть числа) разрывна в
точке x = 1 (да и вообще во всех целых точках a ∈ Z), то есть для некоторых последовательностей
аргументов xn выполняются соотношения

xn −→ 1, 6
f (xn )−→ f (1)
n→∞ n→∞

Если приглядеться к этой функции, то можно заметить, что в поведении последовательности f (xn )
имеется следующая простая закономерность: если xn стремится к 1 слева, то f (xn ) стремится к 1,

xn −→ 1, xn < 1 =⇒ f (xn ) −→ 1, (3.4.134)


n→∞ n→∞

а если xn стремится к 1 справа, то f (xn ) стремится к 0:

xn −→ 1, 1 < xn =⇒ f (xn ) −→ 0. (3.4.135)


n→∞ n→∞

Это наблюдение оказывается очень полезным, потому что позволяет просто и наглядно объяснить,
как ведет себя наша функция вблизи своих точек разрыва: если сказать, что при приближении
аргумента к точке разрыва слева функция стремится к единице, а при приближении аргумента
справа – к нулю, то изобразив это графически картинкой

мы даем человеческому сознанию наглядный образ, с помощью которого все вопросы о пределах
последовательностей вида f (xn ) решаются без труда.
Условие (3.4.134) коротко записывается формулой

lim f (x) = 1,
x→1−0

и в таких случаях говорят, что функция f имеет предел слева в точке 1. А условие (3.4.135) запи-
сывается формулой
lim f (x) = 0,
x→1+0

и в таких случаях говорят, что функция f имеет предел справа в точке 1, равный 0.
В этом параграфе мы подробно обсудим понятие предела функции. Ниже в главе 5 будет дано
его важное применение: с его помощью определяется понятие производной, играющие центральную
роль во всем математическом анализе.
260 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

(a) Определение и свойства предела функции

Когда в § 2 этой главы мы определяли предел последовательности, мы приводили два определения:


отдельно для конечного и бесконечного предела. В случае с пределом функции ситуация много-
кратно усложняется из-за того, что аргумент функции x и ее значение f (x) могут стремиться в
различных ситуациях к конечным величинам или бесконечности. В соответствии с этим различа-
ются четыре основных вида пределов функции, причем каждый из них имеет два дополнительных
“подвида”, потому что аргумент x предполагается иногда стремящимся к a с одной стороны.

Представление об этой картине дает следующая таблица:

Функция стремится Функция стремится


ТИПЫ ПРЕДЕЛОВ ФУНКЦИИ к конечной величине: к бесконечности:
f (x) → A f (x) → ∞
Аргумент стремится Конечный предел Бесконечный предел
к конечной величине: в точке: в точке:
x→a limx→a f (x) = A limx→a f (x) = ∞
возможно, с одной стороны:
Конечный предел Бесконечный предел
слева в точке a слева: в точке a слева:
x→a−0 limx→a−0 f (x) = A limx→a+0 f (x) = ∞
Конечный предел Бесконечный предел
или справа в точке a справа: в точке a справа:
x→a+0 limx→a+0 f (x) = A limx→a+0 f (x) = ∞
Аргумент стремится Конечный предел Бесконечный предел
к бесконечности: в бесконечности: в бесконечности:
x→∞ limx→∞ f (x) = A limx→∞ f (x) = ∞
возможно, в одну сторону:
Конечный предел Бесконечный предел
влево в минус бесконечности: в минус бесконечности:
x → −∞ limx→−∞ f (x) = A limx→−∞ f (x) = ∞
Конечный предел Бесконечный предел
или вправо в плюс бесконечности: в плюс бесконечности:
x → +∞ limx→+∞ f (x) = A limx→+∞ f (x) = ∞

К этим 12 типам пределов следует добавть еще 12, соответствующих случаям, когда функция f
стремится к бесконечности с определенным знаком:
§ 4. Предел функции 261

Функция стремится Функция стремится


ТИПЫ ПРЕДЕЛОВ ФУНКЦИИ к минус бесконечности: к плюс бесконечности:
f (x) → −∞ f (x) → +∞
Аргумент стремится Бесконечный предел Бесконечный предел
к конечной величине: в точке: в точке:
x→a limx→a f (x) = −∞ limx→a f (x) = +∞
возможно, с одной стороны:
Бесконечный предел Бесконечный предел
слева в точке a слева: в точке a слева:
x→a−0 limx→a−0 f (x) = −∞ limx→a+0 f (x) = +∞
Бесконечный предел Бесконечный предел
или справа в точке a справа: в точке a справа:
x→a+0 limx→a+0 f (x) = −∞ limx→a+0 f (x) = +∞
Аргумент стремится Бесконечный предел Бесконечный предел
к бесконечности: в бесконечности: в бесконечности:
x→∞ limx→∞ f (x) = −∞ limx→∞ f (x) = +∞
возможно, в одну сторону:
Бесконечный предел Бесконечный предел
влево в минус бесконечности: в минус бесконечности:
x → −∞ limx→−∞ f (x) = −∞ limx→−∞ f (x) = +∞
Бесконечный предел Бесконечный предел
или вправо в плюс бесконечности: в плюс бесконечности:
x → +∞ limx→+∞ f (x) = −∞ limx→+∞ f (x) = +∞

Таким образом, чтобы определить предел функции, нужно формально сформулировать 24 раз-
ных определения. Чтобы не утомлять читателя такими вразумлениями, обычно поступают иначе.
Говорят так: пусть a и A обозначают числа, или символы бесконечности, возможно с определенным
знаком
a, A ∈ R или a, A = ∞, −∞, +∞

и пусть для всякого такого a


— проколотой окрестностью величины a называется всякое множество вида
  

 (a − δ, a) ∪ (a, a + δ), где δ > 0 если a – число 


   

 

(−∞, −E) ∪ (E, +∞), где E > 0 если a = ∞ ; 
U=  

 (−∞, −E), где E > 0 если a = −∞ ; 


   


 

 (E, +∞), где E > 0 если a = +∞ ; 

— левой полуокрестностью a называется всякий интервал вида


 
U = (a − δ, a), где δ > 0 если a – число

— правой полуокрестностью a называется всякий интервал вида


 
U = (a, a + δ), где δ > 0 если a – число

Далее следует определение, впервые сформулированное немецким математиком Генрихом Гейне:17

• Величина A называется пределом функции f (x) при x стремящимся к a


 
A = lim f (x) f (x) −→ A
x→a x→a

если
1) f (x) определена в некоторой выколотой окрестности U величины a и
17 Генрих Гейне (1821-1881) – известный немецкий математик, поэт и публицист (1797-1856).
262 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

2) для любой последовательности xn ∈ U , стремящейся к a


 
xn −→ a xn 6= a
n→∞

соответствующая последовательность значений f (xn ) стремится к A:

f (xn ) −→ A
n→∞

Отдельно определяются односторонние пределы:


• Величина A называется пределом слева (справа) функции f (x) в точке a
 
A = lim f (x) A = lim f (x)
x→a−0 x→a+0

если
1) f (x) определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой последовательности xn ∈ U , стремящейся к a
 
xn −→ a xn 6= a
n→∞

соответствующая последовательность значений f (xn ) стремится к A:

f (xn ) −→ A
n→∞

Перепишем эти общие определения для неко-


торых конкретных ситуаций.

⋄ 3.4.1 (конечный предел функции в точке по


Гейне). Применительно к случаю конечного пре-
дела функции в точке наше определение можно
сформулировать следующим образом.

Число A называется пределом функции f в


точке a ∈ R, если В этом случае пишут

1) функция f определена на некотором множе- f (x) −→ A


x→a
стве вида (a − δ; a) ∪ (a; a + δ), и или
2) для всякой последовательности аргументов lim f (x) = A
x→a
{xn }, стремящейся к точке a, но не попада-
ющей в a ⋄ 3.4.2 (конечный предел функции в точке слева
по Гейне). Число A называется пределом слева
функции f в точке a, если
1) функция f определена на некотором интер-
xn −→ a xn ∈ (a − δ; a) ∪ (a; a + δ)
n→∞ вале вида (a − δ; a), и
2) для всякой последовательности аргументов
{xn }, стремящейся слева к точке a
соответствующая последовательность значе-
xn −→ a xn ∈ (a − δ; a)
ний функции {f (xn )} стремится к числу A: n→∞

соответствующая последовательность значе-


ний функции {f (xn )} стремится к числу A:

f (xn ) −→ A f (xn ) −→ A
n→∞ n→∞
§ 4. Предел функции 263

соответствующая последовательность значе-


ний функции {f (xn )} стремится к числу A:

f (xn ) −→ A
n→∞

В этом случае пишут

f (x) −→ A
x→a−0

или
lim f (x) = A В этом случае пишут
x→a−0

⋄ 3.4.3 (бесконечный предел функции в точке f (x) −→ A


x→+∞
по Гейне). Говорят, что функция f стремится
к ∞) в точке a, если или
1) функция f определена на некотором множе- lim f (x) = A
x→+∞
стве вида (a − δ; a) ∪ (a; a + δ), и
⊲ 3.4.5. Сформулируйте определения предела
2) для всякой последовательности аргументов
функции для остальных ситуаций, описанных в
{xn }, стремящейся к точке a, но не попада-
двух таблицах этого параграфа, и приведите гра-
ющей в a
фические иллюстрации.
xn −→ a xn ∈ (a − δ; a) ∪ (a; a + δ)
n→∞ ⊲ 3.4.6. Нарисуйте график какой-нибудь функ-
соответствующая последовательность значе- ции f : R → R, удовлетворяющей следующим
ний функции {f (xn )} стремится к ∞: условиям (всем сразу):

f (xn ) −→ ∞ 1) limx→−∞ f (x) = −2;


n→∞
2) limx→−1 f (x) = 0;
3) limx→1−0 f (x) = −∞;
4) limx→1+0 f (x) = 2;
5) limx→+∞ f (x) = +∞;

Нахождение предела функции по опреде-


лению.

В этом случае пишут ⋄ 3.4.7. Покажем что

f (x) −→ +∞ (или −∞, или ∞) 1


x→a
lim =∞
x→0 x
или
Действительно, если взять последовательность
lim f (x) = +∞ (или −∞, или ∞) аргументов {xn }, стремящуюся к нулю, но не по-
x→a
падающую в ноль
⋄ 3.4.4 (конечный предел функции в бесконеч-
ности по Гейне). Число A называется пределом xn −→ 0 xn 6= 0
n→∞
функции f при x → +∞, если
то мы получим
1) функция f определена на некотором интер-
вале вида (E; +∞), и 1
f (xn ) = −→ ∞
2) для всякой последовательности аргументов xn n→∞
{xn } ⊂ (β; +∞), стремящейся к +∞
Это верно для всякой последовательности
xn −→ +∞ xn −→ 0 xn 6= 0, поэтому limx→0 x1 = ∞.
n→∞ n→∞
264 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

⋄ 3.4.8. Покажем что Аналогично, если


x+2 1 xn −→ −∞
lim = n→∞
x→∞ 2x − 1 2
то мы получим
Действительно, если взять последовательность
аргументов {xn }, стремящуюся к бесконечности x2n + 1
lim f (xn ) = lim =
xn −→ ∞ n→∞ n→∞ |xn |(xn + 1)
n→∞  
|xn | = −xn , x2n + 1
то мы получим = потому что = lim =
почти все xn < 0 n→∞ −xn (xn + 1)
xn + 2
2
1 + xn 1 | {z }
f (xn ) = = 1 −→ ↑
2xn − 1 2 − xn n→∞ 2 делим числитель
и знаменатель на x2n
Это верно для всякой последовательности  
x+2 1 + x12 1+0
xn −→ ∞, поэтому limx→0 2x−1 = 21 . = lim n
= применяем
= = −1
n→∞ теорему 3.2.4
n→∞ −1 − 1 −1 − 0
xn
⋄ 3.4.9. Покажем что
1 1 Это верно для всякой последовательности
lim = −∞ lim = +∞ x2 +1
x→0−0 x x→0+0 x xn −→ −∞, поэтому limx→−∞ |x|(x+1) = 1.
n→∞
Действительно, если взять последовательность ⋄ 3.4.11. Покажем что
аргументов {xn }, стремящуюся к 0 слева, 1
lim =0
xn −→ 0 xn < 0 x→+∞ x3
n→∞
Действительно, если взять последовательность
то мы получим
аргументов {xn }, стремящуюся к ∞,
1
lim = (применяем теорему 3.2.4) = −∞ xn −→ ∞
n→∞ xn n→∞
Это верно для всякой последовательности то мы получим
xn −→ 0 xn < 0, поэтому limx→0−0 x1 = −∞.  3  
n→∞ 1 применяем
Аналогично, если lim f (xn ) = lim = теорему 3.2.4 = 0
n→∞ n→∞ x n
xn −→ 0 xn > 0 Это верно для всякой последовательности
n→∞
то мы получим xn −→ ∞, поэтому limx→∞ x13 = 0.
n→∞
1 ⋄ 3.4.12. Покажем что
lim = (применяем теорему 3.2.4) = +∞
n→∞ xn
lim |x|x = +∞ lim |x|x = −∞
x→+∞ x→−∞
Это верно для всякой последовательности
xn −→ 0 xn > 0, поэтому limx→0+0 x1 = +∞. Действительно, если взять последовательность
n→∞
аргументов {xn }, стремящуюся к +∞,
⋄ 3.4.10. Покажем что
x2 + 1 x2 + 1 xn −→ +∞
n→∞
lim =1 lim = −1
x→+∞ |x|(x + 1) x→−∞ |x|(x + 1) то мы получим
Действительно, если взять последовательность lim f (xn ) = lim |xn |xn =
аргументов {xn }, стремящуюся к +∞, n→∞

n→∞

|xn | = xn ,
xn −→ +∞ = потому что = lim x2n = +∞
n→∞ почти все xn > 0 n→∞
то мы получим
Это верно для всякой последовательности
+1 x2n xn −→ +∞, поэтому limx→+∞ |x|x = +∞.
n→∞
lim f (xn ) = lim =
n→∞ n→∞ |xn |(xn + 1) Возьмем теперь последовательность аргумен-
  тов {xn }, стремящуюся к −∞,
|xn | = xn , x2n + 1
= потому что = lim =
почти все xn > 0 n→∞ xn (xn + 1) xn −→ −∞
| {z } n→∞

делим числитель
Тогда
и знаменатель на x2n
lim f (xn ) = lim |xn |xn =
1+ 1   1+0 n→∞ n→∞
x2n применяем  
= lim = = =1 |xn | = −xn , потому что
n→∞ 1+ 1
xn
теорему 3.2.4
1+0 = почти все xn < 0 = − lim x2n = −∞
n→∞
Это верно для всякой последовательности Это верно для всякой последовательности
x2 +1
xn −→ +∞, поэтому limx→+∞ |x|(x+1) = 1. xn −→ −∞, поэтому limx→−∞ |x|x = −∞.
n→∞ n→∞
§ 4. Предел функции 265

Связь между нулевым и бесконечным пределом.


Теорема 3.4.1 (о связи между нулевым и бесконечным пределами). Предел функции f при x → a
равен нулю в том и только в том случае, если предел обратной функции f1 при x → a равен
бесконечности:
1
lim f (x) = 0 ⇐⇒ lim = ∞. (3.4.136)
x→a x→a f (x)

Доказательство. Это следует из теоремы 3.2.4 о связи между бесконечно большими и бесконеч-
но малыми последовательностями: если xn → a, то соотношение yn = f (xn ) → 0 эквивалентно
соотношению y1n = f (x1n ) → ∞.

⋄ 3.4.13. 1
(xn )k = −→ ∞
( (yn )k x→0
0, если k > 0 Поскольку это верно для любой последователь-
lim xk = (3.4.137)
x→0 ∞, если k < 0 ности xn → ∞, мы получаем, что

xk −→ ∞ (k > 0)
Доказательство. 1. Пусть k > 0. Тогда x→∞

xn −→ 0 2. Пусть k < 0. Тогда m = −k > 0, поэтому:


x→0
xm −→ ∞ (уже доказано)
⇓ 0
(свойство 3 на с.216) x→∞

(xn )k −→ 0 ⇓ (3.4.136)
x→0

Поскольку это верно для любой последователь- 1


xk = m −→ 0
ности xn → 0, мы получаем, что x x→∞

xk −→ 0 (k > 0)
x→0 ⋄ 3.4.15. Для любого n ∈ N
2. Пусть k < 0. Тогда m = −k > 0, поэтому:
lim x2n = +∞ (3.4.139)
x→−∞
m
x −→ 0 (уже доказано)
lim x2n = +∞ (3.4.140)
x→0
x→+∞

⇓ (3.4.136)
⋄ 3.4.16. Для любого n ∈ N
1
xk = m −→ ∞ lim x−2n = +∞ (3.4.141)
x x→0 x→0
lim x−2n = 0 (3.4.142)
x→∞
⋄ 3.4.14.
⋄ 3.4.17. Для любого n ∈ N
(
∞, если k > 0
lim xk = (3.4.138) lim x2n−1 = −∞ (3.4.143)
x→∞ 0, если k < 0 x→−∞

lim x2n−1 = +∞ (3.4.144)


x→+∞
Доказательство. 1. Пусть k > 0 и
⋄ 3.4.18. Для любого n ∈ N
xn −→ ∞
x→0
lim x−(2n−1) = −∞ (3.4.145)
x→−0
1
Обозначим yn = xn . Тогда
lim x−(2n−1) = +∞ (3.4.146)
x→+0
yn −→ 0 (теорема 3.2.4)
x→0 lim x−(2n−1) = 0 (3.4.147)
x→∞

⇓ 0
(свойство 3 на с.216)
⊲⊲ 3.4.19. Покажите что
k
(yn ) −→ 0 1) limx→+∞ |x|
=1
x→0 x
|x|
⇓ (теорема 3.2.4) 2) limx→−∞ x = −1
266 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Связь между односторонними и двусторонними пределами.


Теорема 3.4.2. Величина A будет пределом функции f в точке a
A = lim f (x)
x→a

тогда и только тогда, когда A является пределом слева и пределом справа функции f в точке a:
lim f (x) = A = lim f (x)
x→a−0 x→a+0

Доказательство. 1. Если A = limx→a f (x), то для любой последовательности xn −→ a, xn 6= a


n→∞
должно выполняться f (xn ) −→ A. В частности, если xn −→ a, xn < a то f (xn ) −→ A, и поэтому
n→∞ n→∞ n→∞
A = limx→a−0 f (x). Аналогично получается A = limx→a+0 f (x).
2. Наоборот, если limx→a−0 f (x) = A = limx→a+0 f (x), то это означает, что
∀xn −→ a, xn < a ⇒ f (xn ) −→ A
n→∞ n→∞
и
∀xn −→ a, xn > a ⇒ f (xn ) −→ A
n→∞ n→∞
Поэтому если взять последовательность xn −→ a, xn 6= a то, разложив ее на две подпоследова-
n→∞
тельности    
xnk −→ a, xnk < a , xmk −→ a, xmk > a
k→∞ k→∞
мы получим
f (xnk ) −→ A, f (xmk ) −→ A
k→∞ k→∞
Это означает, что
f (xn ) −→ A,
n→∞
Поскольку это верно для любой последовательности xn −→ a, xn 6= a, мы получаем A = limx→a f (x).
n→∞

Теорема 3.4.3. Величина A будет пределом функции f на бесконечности


A = lim f (x)
x→∞

тогда и только тогда, когда A является пределом функции f при x стремящимся к −∞ и к +∞:
lim f (x) = A = lim f (x)
x→−∞ x→+∞

Доказательство. 1. Если A = limx→∞ f (x), то для любой последовательности xn −→ ∞ долж-


n→∞
но выполняться f (xn ) −→ A. В частности, если xn −→ −∞ то f (xn ) −→ A, и поэтому A =
n→∞ n→∞ n→∞
limx→−∞ f (x). Аналогично получается A = limx→+∞ f (x).
2. Наоборот, если limx→−∞ f (x) = A = limx→+∞ f (x), то это означает, что
∀xn −→ −∞ ⇒ f (xn ) −→ A
n→∞ n→∞
и
∀xn −→ +∞ ⇒ f (xn ) −→ A
n→∞ n→∞
Поэтому если взять последовательность xn −→ ∞ то, разложив ее на две подпоследовательности
n→∞

xnk −→ −∞, xmk −→ +∞,


k→∞ k→∞
мы получим
f (xnk ) −→ A, f (xmk ) −→ A
k→∞ k→∞
Это означает, что
f (xn ) −→ A,
n→∞
Поскольку это верно для любой последовательности xn −→ ∞, мы получаем A = limx→∞ f (x).
n→∞
§ 4. Предел функции 267

⋄ 3.4.20. Покажем что (xn + 1)(xn − 1) 


= lim = lim xn +1 =2
n→∞ xn − 1 n→∞
|x| |x| ❆❯
lim = −1 lim =1 1
x→0−0 x x→0+0 x
Это верно для всякой последовательности
Действительно, если взять последовательность x2 −1
xn −→ 1, xn > 1, поэтому limx→1−0 |x−1| = 2.
аргументов {xn }, стремящуюся к 0 слева, n→∞

⋄ 3.4.22. Покажем что


xn −→ 0 xn < 0
n→∞
x2 + x3
то мы получим lim =0
x→0 |x|
  Возьмем сначала последовательность аргумен-
|xn | |xn | = −xn , −xn
lim = поскольку = lim = тов {xn }, стремящуюся к 0 слева,
n→∞ xn xn < 0 n→∞ xn

= lim (−1) = −1 xn −→ 0 xn < 0


n→∞ n→∞

Это верно для всякой последовательности тогда


xn −→ 0 xn < 0, поэтому limx→0−0 |x|
x = −1.  
n→∞ x2n + x3n |xn | = −xn ,
Аналогично, если lim = поскольку xn < 0 =
n→∞ |x | n

xn −→ 0 xn > 0 x2n + x3n


n→∞ = lim = lim (−xn − x2n ) = 0
n→∞ −xn n→∞
то мы получим
Это верно для всякой последовательности
  2
+x3
|xn | |xn | = xn , xn xn −→ 0 xn < 0, поэтому limx→0−0 x |x| = 0.
lim = поскольку = lim = lim 1 = 1 n→∞
n→∞ xn xn > 0 n→∞ xn n→∞ Аналогично, если

Это верно для всякой последовательности xn −→ 0 xn > 0


n→∞
xn −→ 0 xn > 0, поэтому limx→0−0 |x|
x = 1.
n→∞ то мы получим
⋄ 3.4.21. Покажем что  
x2n + x3n |xn | = xn ,
lim = поскольку xn > 0 =
x2 − 1 x2 − 1 n→∞ |xn |
lim = −2 lim =2
x→1−0 |x − 1| x→1+0 |x − 1| x2 + x3n
= lim n = lim (xn + x2n ) = 0
n→∞ xn n→∞
Действительно, если взять последовательность
аргументов {xn }, стремящуюся к 1 слева, Это верно для всякой последовательности
2
+x3
xn −→ 0 xn > 0, поэтому limx→0+0 x |x| = 1.
xn −→ 1 xn < 1 n→∞
2
+x3
n→∞ Мы получаем, что для функции f (x) = x |x|
то мы получим левый и правый предел в точке 0 совпадают, по-
этому
x2n − 1 (xn + 1)(xn − 1)
lim = lim = x2 + x3 x2 + x3 x2 + x3
n→∞ |xn − 1| n→∞ |xn − 1| lim = lim = lim =0
  x→0 |x| x→0−0 |x| x→0+0 |x|
|xn − 1| = −(xn − 1), (xn + 1)(xn − 1)
= поскольку xn − 1 < 0 = n→∞lim = ⋄ 3.4.23. Покажем что
−(xn − 1)
= − lim ( xn + 1) = −2 1
n→∞ lim = +∞
x→0 |x|


1
Действительно, если взять последовательность
Это верно для всякой последовательности аргументов {xn }, стремящуюся к 0 слева,
x2 −1
xn −→ 1 xn < 1, поэтому limx→1−0 |x−1| = −2.
n→∞ xn −→ 0 xn < 0
Аналогично, если n→∞
то мы получим
xn −→ 1 xn > 1
n→∞
1   1
|xn | = −xn ,
то мы получим lim
n→∞ |xn |
= потому что xn < 0 = − n→∞ lim =
xn
 
применяем
x2n − 1 (xn + 1)(xn − 1) = теорему 3.2.4 = +∞
lim = lim =
n→∞ |xn − 1| n→∞ |xn − 1|
  Это верно для всякой последовательности
|xn − 1| = xn − 1,
= поскольку xn − 1 > 0 = xn −→ 0 xn < 0, поэтому limx→0−0 x1 = +∞.
n→∞
268 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Аналогично, если Это верно для всякой последовательности


xn −→ 0 xn > 0, поэтому limx→0+0 x1 = +∞.
n→∞
xn −→ 0 xn > 0 Мы получили
n→∞

то мы получим 1 1
lim = +∞ = lim
  x→0−0 |x| x→0+0 |x|
1 |xn | = xn , 1
lim = потому что xn > 0 = lim = и это означает что
n→∞ |xn | n→∞ xn
 
применяем
= теорему 1
3.2.4 = +∞ lim = +∞
x→0 |x|

Связь предела функции с монотонными последовательностыми.


Теорема 3.4.4. 18 Пусть функция f определена на некотором интервале (a, b) и C – произвольное
число. Тогда следующие условия эквивалентны:
(i) limx→b−0 f (x) = C;
(ii) для любой монотонной последовательности xn

x1 < x2 < ... < xn < ... < b, xn −→ b (3.4.148)


n→∞

выполняется
f (xn ) −→ C (3.4.149)
n→∞

Доказательство. Ясно, что из (i) следует (ii), потому что если limx→b−0 f (x) = C, то f (xn ) −→
n→∞
C для любой последовательности xn −→ b, xn < b (необязательно монотонной). Докажем, что
n→∞
наоборот если (i) не выполняется, то не выполняется и (ii). Пусть limx→b−0 f (x) 6= C, то есть
существует точка последовательность xn ∈ M такая что

xn ∈ (a, b) & xn −→ a & 6


f (xn )−→ C
n→∞ n→∞

План наших действий состоит в том, чтобы, переходя от xn к ее подпоследовательностям, построить


строго монотонную последовательность с теми же свойствами.
1. Прежде всего, по свойству подпоследовательностей 2◦ на с.228, второе условие означает, что
существует ε > 0 и последовательность натуральных чисел nk −→ ∞, такие что
k→∞

∀k ∈ N f (xnk ) ∈
/ (C − ε; C + ε)

Обозначив yk = xnk , мы получим последовательность с такими свойствами:

yk ∈ (a, b) & yk −→ a & ∀k ∈ N f (yk ) ∈


/ (C − ε; C + ε)
k→∞

2. После этого мы индуктивно определим две последовательности km и tm . Сначала полагаем

k1 = 1, t1 = y 1

Затем, если для m = 1, ..., l числа km и tm определены, мы замечаем вот что. Поскольку a < yk ,
yk −→ a и a < tl , найдется такое kl+1 , что ykl+1 лежит в интервале (a; tl ):
k→∞

ykl+1 < tl

Выбираем такое kl+1 и полагаем


tl+1 = ykl+1
Полученная последовательность tm = zm+1 обладает нужными нам свойствами. Во-первых, (как и
для xn и yk ) все числа tm лежат в интервале (a, b):

tm ∈ (a, b)
18 Эта теорема используется ниже при доказательстве правила Лопиталя для раскрытия неопределенностей типа


.
§ 4. Предел функции 269

Во-вторых, последовательность tm , как подпоследовательность в yk , должна стремиться к a:

tm = ykm −→ a.
m→∞

В-третьих, последовательность значений f на ней не заходит в интервал (C − ε; C + ε):

∀m ∈ N f (tm ) = f (zkm ) ∈
/ (C − ε; C + ε)

И, в-четвертых, она строго монотонна:

tm < ykm+1 = tm+1

Заменой переменной доказывается симметричное утверждение:


Теорема 3.4.5. Пусть функция f определена на некотором интервале (a, b) и C – произвольное
число. Тогда следующие условия эквивалентны:
(i) limx→a+0 f (x) = C;
(ii) для любой монотонной последовательности xn

a < ... < xn < ... < x2 < x1 < b, xn −→ a


n→∞

выполняется
f (xn ) −→ C
n→∞

Предел монотонной функции.


Теорема 3.4.6. Пусть функция f определена на некотором интервале (a, b) и монотонна на нем.
Тогда
— если f неубывает, то

lim f (x) = inf f (x) lim f (x) = sup f (x) (3.4.150)


x→a+0 x∈(a;b) x→b−0 x∈(a;b)

— если f невозрастает, то

lim f (x) = sup f (x) lim f (x) = inf f (x) (3.4.151)


x→a+0 x∈(a;b) x→b−0 x∈(a;b)

(b) Теоремы о пределах


Связь между понятием предела и непрерывностью.
Теорема 3.4.7 (критерий непрерывности). Пусть функция f определена на некотором интервале
(α; β), содержащем точку x = a. Тогда следующие условия эквивалентны:
(i) функция f непрерывна в точке a;
(ii) функция f имеет конечный предел в точке a, равный f (a):

∃ lim f (x) = f (a)


x→a

Доказательство. 1. (i) =⇒ (ii). Пусть функция f непрерывна в точке a, то есть для всякой по-
следовательности аргументов {xn }, стремящейся к точке a соответствующая последовательность
значений {f (xn )} стремится к значению f (a). Тогда, в частности, для всякой последовательности

xn −→ a, xn 6= a
n→∞

выполняется
f (xn ) −→ f (a)
n→∞

По определению предела это означает, что предел функции f в точке x = a равен f (a):

lim f (x) = f (a)


x→a
270 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

2. (ii) =⇒ (i). Пусть наоборот


lim f (x) = f (a)
x→a

Это означает, что для любой последовательности

xn −→ a, xn 6= a
n→∞

выполняется
f (xn ) −→ f (a)
n→∞

Нам нужно проверить то же самое для последовательностей {xn }, у которых некоторые элементы
xn совпадают с a. Пусть {xn } – как раз такая последовательность, то есть xn −→ a, причем xn = a
n→∞
для некоторых n. Тогда {xn } можно разложить на две подпоследовательности {xnk } и {xmk } такие
что
xnk −→ a xnk 6= a, xmk = a
k→∞

Для них мы получаем


f (xnk ) −→ f (a), f (xmk ) = f (a)
k→∞
откуда
f (xn ) −→ f (a),
n→∞

Мы показали, что для всякой последовательности аргументов {xn }, стремящейся к точке a соот-
ветствующая последовательность значений {f (xn )} стремится к значению f (a). Это означает, что
функция f непрерывна в точке a.
Теорема 3.4.8 (о перестановочности предела с непрерывной функцией). Если существует конеч-
ный предел
lim f (x) = A
x→a

и функция g(y) определена в некоторой окрестности точки A и непрерывна в A, то


   
∃ lim g f (x) = g lim f (x) (3.4.152)
x→a x→a

Доказательство. Если xn −→ a, xn 6= a, то, поскольку limx→a f (x) = A, получаем f (xn ) −→ A,


n→∞   n→∞
и поскольку g(y) непрерывна в точке A, g f (xn ) −→ g(A). Поскольку это верно для произвольной
n→∞    
последовательности xn −→ a, xn 6= a, мы получаем limx→a g f (x) = g(A) = g limx→a f (x)
n→∞

Теорема о замене переменной под знаком предела.


Теорема 3.4.9 (о замене переменной под знаком предела). Пусть

lim f (x) = b & lim g(y) = c


x→a y→b

причем
∀x 6= a f (x) 6= b
Тогда
lim g(f (x)) = c
x→a

Доказательство. Возьмем какую-нибудь последовательность

xn −→ a, xn 6= a
n→∞

Тогда мы получим
f (xn ) −→ b, f (xn ) 6= b
n→∞

Поэтому
g(f (xn )) −→ c
n→∞

Поскольку это верно для всякой последовательности xn −→ a (xn 6= a), мы получаем, что
n→∞
limx→a g(f (x)) = c.
§ 4. Предел функции 271

Эта теорема бывает полезна при вычислении предела от сложной функции. Если нам нужно
найти предел
lim g(f (x))
x→a

и известно, что f (x) −→ b причем f (x) 6= b при x 6= a, то можно сделать замену переменных:
x→a

f (x) = y
lim g(f (x)) = y −→ b = lim g(y)
x→a x→a y→b
y 6= b при x 6= a

⋄ 3.4.24. Найти предел ⊲⊲ 3.4.25. Найти пределы


2 2x2 −x
2x − x 1) limx→∞
lim x2 +10 ,
x→∞ x2 + 10 1−3x
2) limx→∞ 2x+3 ,
Решение:
(x−1)3
3) limx→∞ 2x3 +3x+1 ,
2
2x − x x = y1 , y = 1
x
lim = = 10x+5
y −→ 0 4) limx→∞ 0.01x 2 −6x ,
x→∞ x2 + 10 x→∞
x2 −5x+1
2 1 5) limx→∞ 3x+7 ,
y2 − y 2−y
= lim 1 = lim = 6) limx→∞ x3 −5x
y→0 2
y + 10 y→0 1 + 10y 2 x+1010

2−0
= (подстановка) = =2
1 + 10 · 0

Арифметические операции над пределами.

Теорема 3.4.10. Если существуют конечные пределы limx→a f (x) и limx→a g(x), то справедливы
формулы:

lim (f (x) + g(x)) = lim f (x) + lim g(x) (3.4.153)


x→a x→a x→a
lim (f (x) − g(x)) = lim f (x) − lim g(x) (3.4.154)
x→a x→a x→a
lim (C · f (x)) = C · lim f (x) (если 0 6= C 6= ∞) (3.4.155)
x→a x→a
lim f (x) · g(x) = lim f (x) · lim g(x) (3.4.156)
x→a x→a x→a
g(x) limx→a g(x)
lim = (если lim f (x) 6= 0) (3.4.157)
x→a f (x) limx→a f (x) x→a

Доказательство. Эти формулы следуют из арифметических свойств последовательностей 1◦ -4◦ ,


перечисленных на с.216. Докажем например (3.4.156). Если limx→a f (x) = A и limx→a g(x) = B, то
для всякой последовательности xn −→ a, xn 6= a возникает логическая цепочка:
n→∞

xn −→ a, xn 6= a
n→∞

f (xn ) −→ A, g(xn ) −→ B
n→∞ n→∞
 
используем свойство
⇓ 30 на с.216

f (xn ) · g(xn ) −→ A · B
n→∞

Поскольку это верно для любой последовательности xn −→ a, xn 6= a, мы получаем limx→a f (x) ·


n→∞
g(x) = limx→a f (x) · limx→a g(x).
272 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Критерий Коши существования предела функции. В следующих двух теоремах, называе-


мых критериями Коши, объясняется, что конечный предел функции f при x → a существует тогда
и только тогда, когда разность значений этой функции в соседних точках f (s) − f (t) стремится к
нулю при s, t → a.
Теорема 3.4.11 (критерий Коши существования двустороннего предела функции). Пусть функ-
ция f определена в некоторой проколотой окрестности U величины a (где a – произвольное число
или символ бесконечности ∞). Тогда следующие условия эквивалентны:
(i) существует конечный предел
lim f (x)
x→a

(ii) для любых двух последовательностей sn , tn ∈ U стремящихся к a

sn −→ a, tn −→ a,
n→∞ n→∞

разность между соответствующими значениями функции f стремится к нулю:

f (tn ) − f (sn ) −→ 0
n→∞

Теорема 3.4.12 (критерий Коши существования одностороннего предела функции). 19 Пусть


функция f определена на интервале (α; a), где a – произвольное число или символ бесконечности
∞. Тогда следующие условия эквивалентны:
(i) существует конечный предел
lim f (x)
x→a−0

(ii) для любых двух последовательностей sn , tn ∈ (α; a) стремящихся к a

sn −→ a, tn −→ a,
n→∞ n→∞

разность между соответствующими значениями функции f стремится к нулю:

f (tn ) − f (sn ) −→ 0
n→∞

Доказательство. Эти две теоремы доказываются одинаково, поэтому мы докажем лишь вторую.
1. Легко проверяется, что из условия (i) следует условие (ii). Действительно, если существует
конечный предел limx→a−0 f (x) = C, то есть для всякой последовательности xn ∈ (α; a), xn −→ a
n→∞
выполняется соотношение
f (xn ) −→ C
n→∞

то взяв произвольные последовательности sn , tn ∈ (α; a), sn −→ a, tn −→ a, мы получим


n→∞ n→∞

f (tn ) − f (sn ) −→ C − C = 0
n→∞

2. Теперь докажем, что из условия (ii) следует условие (i). Пусть выполняется (ii).
a) Покажем сначала, что тогда для любой последовательности xn ∈ (α; a), xn −→ a существует
n→∞
конечный предел
lim f (xn )
n→∞

Действительно, обозначим yn = f (xn ). Тогда если взять любые две последовательности индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

то положив ti = xpi , si = xqi , мы получим, что, в силу условия (ii)

ypi − yqi = f (xpi ) − f (xqi ) = f (ti ) − f (si ) −→ 0


i→∞

Это означает, что последовательность yn = f (xn ) удовлетворяет критерию Коши (то есть обладает
свойством (i) теоремы 3.2.15). Значит, yn = f (xn ) имеет конечный предел.
19 Этот результат понадобится при доказательстве критерия Коши сходимости несобственного интеграла (теорема

8.1.7).
§ 4. Предел функции 273

b) Мы показали, что для любой последовательности xn ∈ (α; a), xn −→ a существует конечный


n→∞
предел limn→∞ f (xn ). Теперь из условия (ii) следует, что все такие пределы совпадают, потому что
для любых двух последовательностей sn , tn ∈ (α; a) стремящихся к a

sn −→ a, tn −→ a
n→∞ n→∞

выполняется равенство
lim (f (tn ) − f (sn )) = 0
n→∞
и следовательно,
lim f (tn ) = lim f (sn )
n→∞ n→∞

Это в свою очередь означает, что существует число C такое, что

lim f (xn ) = C
n→∞

для любой последовательности xn ∈ (α; a), xn −→ a, то есть


n→∞

lim f (x) = C
x→a−0

Мы убедились, что из условия (ii) следует условие (i). Теорема 1.1 доказана.

(c) Язык ε-δ Коши


Определение предела функции по Коши. Данное нами на с.261 определение предела функ-
ции по Гейне – не единственно возможное. В некоторых случаях бывает полезно знать еще одно,
эквивалентное определение, предложенное известным французским математиком Огюстеном Ко-
ши (1789-1857). Чтобы его сформулировать, нам, как и в случае с определением Гейне, понадобится
вспомнить несколько терминов.
Пусть, как и в § 4(a), a и A обозначают числа, или символы бесконечности, возможно с опреде-
ленным знаком
a, A ∈ R или a, A = ∞, −∞, +∞
и пусть для всякого такого a
— проколотой окрестностью величины a называется всякое множество вида
   

 (a − δ, a) ∪ (a, a + δ), где δ > 0 если a – число 

   

 

 (−∞, −E) ∪ (E, +∞), где E > 0 если a = ∞ ; 
U=  

 (−∞, −E), где E > 0 если a = −∞ ; 


   


 

 (E, +∞), где E > 0 если a = +∞ ; 

— левой полуокрестностью a называется всякий интервал вида


 
U = (a − δ, a), где δ > 0 если a – число

— правой полуокрестностью a называется всякий интервал вида


 
U = (a, a + δ), где δ > 0 если a – число

— окрестностью величины a называется


— всякий интервал вида U = (a − ε, a + ε) (где ε > 0), если a – точка;
— всякая проколотая окрестность величины a, если a – символ бесконечности.
Теперь даем само определение по Коши:
• Величина A называется пределом функции f (x) при x стремящимся к a
 
A = lim f (x) f (x) −→ A
x→a x→a

если
274 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

1) f (x) определена в некоторой выколотой окрестности U величины a и


2) для любой окрестности V величины A найдется выколотая окрестность W ве-
личины a такая, что
∀x ∈ W f (x) ∈ V
Отдельно определяются односторонние пределы:
• Величина A называется пределом слева (справа) функции f (x) в точке a
 
A = lim f (x) A = lim f (x)
x→a−0 x→a+0

если
1) f (x) определена в некоторой левой (правой) полуокрестности U точки a и
2) для любой окрестности V величины A найдется левая (правая) полуокрестность
W точки a такая, что
∀x ∈ W f (x) ∈ V

Покажем, как эта общая схема работает в δ; a) ∪ (a, a + δ) выполняется включение


конкретных ситуациях. f (x) ∈ (−∞, −E) ∪ (E, +∞).
• Конечный предел функции в точке по • Конечный предел функции слева в точ-
Коши. Число A называется пределом функ- ке по Коши. Число A называется пределом
ции f в точке a слева функции f в точке a

lim f (x) = A lim f (x) = A


x→a x→a−0

если если
1) функция f определена на некотором мно- 1) функция f определена на некотором ин-
жестве вида (a−η, a)∪(a, a+η) (где η > 0), тервале вида (a − η; a) (где η > 0, и
и 2) для всякого числа ε > 0 существует число
2) для всякого числа ε > 0 существует чис- δ > 0 такое что для любого x ∈ (a − δ; a)
ло δ > 0 такое что для любого x ∈ (a − выполняется включение f (x) ∈ (A − ε; A +
δ; a) ∪ (a, a + δ) выполняется включение ε).
f (x) ∈ (A − ε; A + ε). • Конечный предел функции при x → +∞
• Бесконечный предел функции в точке по Коши. Число A называется пределом
по Коши. Говорят, что функция f имеет функции f при x → +∞
бесконечный предел в точке a
lim f (x) = A
x→+∞
lim f (x) = ∞
x→a
если
если 1) функция f определена на некотором ин-
1) функция f определена на некотором мно- тервале вида (α; +∞), и
жестве вида (a−η, a)∪(a, a+η) (где η > 0), 2) для всякого числа ε > 0 существует число
и β > α такое что для любого x ∈ (β; +∞)
2) для всякого числа E > 0 существует чис- выполняется включение f (x) ∈ (A − ε; A +
ло δ > 0 такое что для любого x ∈ (a − ε).

Теорема 3.4.13 (об эквивалентности определений предела по Коши и по Гейне). 20


Для произ-
вольной функции f и любых величин A и a следующие условия эквивалентны:
(i) A является пределом функции f при x → a по Коши;
(ii) A является пределом функции f при x → a по Гейне.
(Аналогичное утверждение справедливо для односторонних пределов.)
20 Эквивалентность определений предела по Коши и по Гейне используется ниже в главе 17 при доказательстве
признаков сравнения несобственных интегралов (теоремы 5.7 и 7.5).
§ 4. Предел функции 275

Доказательство. Мы докажем эту теорему для конечных пределов слева, поскольку в каждом
случае доказательство отличается лишь несущественными деталями.
1. (i) ⇒ (ii). Пусть A является пределом по Коши функции f при x → a − 0, то есть для всякого
ε > 0 существует δ > 0 такое что для любого x ∈ [a−δ; a) выполняется включение f (x) ∈ (A−ε; A+ε).
Покажем, что тогда A является пределом по Гейне f (x) при x → a − 0, то есть что для любой
последовательности аргументов xn −→ a − 0 выполняется f (xn ) −→ A.
n→∞ n→∞
Возьмем произвольную такую последовательноть xn −→ a − 0. и зафиксируем какое-нибудь
n→∞
ε > 0. По предположению, для него можно выбрать δ > 0 так чтобы

∀x ∈ [a − δ; a) f (x) ∈ (A − ε; A + ε) (3.4.158)

Зафиксируем это число δ. Получаем следующую логическую цепочку:

xn −→ a − 0
n→∞

xn ∈ [a − δ; a) для почти всех n ∈ N

(применяем (3.4.158))

f (xn ) ∈ (A − ε; A + ε) для почти всех n ∈ N


Это верно для произвольного ε > 0. Значит, f (xn ) −→ A, а именно это нам и нужно было доказать.
/ / n→∞
2. (i) ⇒ (ii). Пусть наоборот, A не является пределом по Коши функции f при x → a − 0, то
есть существует такое ε > 0, что для любого δ > 0 найдется такой x ∈ [a − δ; a), для которого
/ (A − ε; A + ε). Тогда, в частности, для любого числа вида δ = n1 мы получим,
выполняется f (x) ∈
что
1
∃xn ∈ [a − δ; a) = [a − ; a) такие что f (xn ) ∈
/ (A − ε; A + ε) (3.4.159)
n
Зафиксируем такие числа xn . Получается:

1
a− < xn < a
n

xn −→ a − 0
n→∞

Но, с другой стороны, в силу (3.4.159),


6
f (xn )−→ A
n→∞

Значит, A не является пределом по Гейне функции f при x → a − 0.


Мы получили, что если не выполняется (i) то автоматически не выполняется (ii).

Равномерная непрерывность функции по Коши. На с.253 мы дали определение равномерно


непрерывной функции на множестве. Это определение легко переводится на язык ε − δ Коши. В
дальнейшем при доказательстве результатов такая переформулировка нам не понадобится, но мы
полагаем, что она сама по себе будет интересна читателю.
• Функция f (x) называется равномерно непрерывной на множестве E, если f (x) определена
на E, и для всякого числа ε > 0 найдется такое число δ > 0, что для любых x и y из E,
расстояние между которыми меньше δ, соответствующее расстояние между значениями
функции f и f (y) будет меньше ε:

∀ε > 0 ∃δ > 0 ∀x, y ∈ E |x − y| < δ =⇒ |f (x) − f (y)| < ε (3.4.160)


276 Глава 3. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ

Докажем равносильность этих определений. 1. Пусть выполняется (3.4.160). Возьмем произволь-


ные последовательности xn , yn ∈ E такие, что

xn − yn −→ 0
n→∞

Покажем, что тогда


f (xn ) − f (yn ) −→ 0
n→∞

Для этого возьмем ε > 0. В силу (3.4.160), должен существовать такой δ > 0, что

∀x, y ∈ E |x − y| < δ =⇒ |f (x) − f (y)| < ε

В частности,

|xn − yn | < δ =⇒ |f (xn ) − f (yn )| < ε


| {z } | {z }
выполняется для почти всех n значит, и это выполняется для почти всех n

Последнее верно при любом ε > 0, поэтому f (xn ) − f (yn ) −→ 0.


n→∞
2. Наоборот, предположим, что (3.4.160) не выполняется, то есть существует некоторое ε > 0
такое что
∀δ > 0 ∃x, y ∈ E |x − y| < δ & |f (x) − f (y)| > ε
1
В частности, это должно выполняться для чисел δ = n:

1
∀n ∈ N ∃xn , yn ∈ E |xn − yn | < & |f (xn ) − f (yn )| > ε
n
1
Мы получили последовательности xn и yn такие, что 0 6 |xn − yn | < −→
n n→∞ 0, и поэтому

xn − yn −→ 0
n→∞

но при этом |f (xn ) − f (yn )| > ε, и поэтому

f (xn ) − f (yn )−→


6 0
n→∞

Значит, (3.3.119) не может выполняться.


Теорема 3.4.14 (критерий равномерной непрерывности). Функция f : E → R тогда и только
тогда равномерно непрерывная на E, когда выполняется соотношение

sup |f (x) − f (y)| −→ 0 (3.4.161)


x,y∈E: |x−y|6δ δ→0
Глава 4

СТАНДАРТНЫЕ ФУНКЦИИ

§1 Элементарные функции
Среди функций, используемых в точных науках, имеется несколько таких, которые служат глав-
ными моделями изучаемых явлений. Эти функции называются элементарными, и их свойства, а
также свойства функций, получаемых из них с помощью алгебраических операций и композиции
(такие функции мы будем называть стандартными) служат предметом изучения в разделе ана-
лиза, называемом Исчислением (что это мы объясним ниже в § 2). Список элементарных функций
выглядит так:1

обозначение:
название x область определения
7→

 Z+

 x ∈ R, b ∈ 2N−1

 N
b x 6= 0, b ∈ − 2N−1
степенная функция x

 x > 0, b ∈ (0, +∞) \ Z

 2N−1
Z
x > 0, b ∈ (−∞, 0) \ 2N−1


x ∈ R,
 a>0
x
показательная функция a x > 0, a=0

x ∈ Z ,
2N−1 a<0

логарифм loga x x > 0, a ∈ (0; 1) ∪ (1; +∞)

синус sin x x∈R

косинус cos x x∈R

π
тангенс tg x x∈
/ 2 + πZ

котангенс ctg x x∈
/ πZ

арксинус arcsin x x ∈ [−1; 1]

арккосинус arccos x x ∈ [−1; 1]

арктангенс arctg x x∈R

арккотангенс arcctg x x∈R

Как может заметить читатель, только одна из этих функций – xb – была определена нами к на-
стоящему моменту, и то только для целых значений параметра b (см. определения на с.159 и 167).

Z
1 Смысл встречающихся в этой таблице обозначений типа , N
2N−1 2N−1
объяснялся выше на с.185.

277
278 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Остальные функции в этом списке мы определим необычным приемом – с помощью двух так на-
зываемых зависимых аксиом.
Это вот что такое. Зависимой или избыточной аксиомой называется такая аксиома теории, про
которую впоследствии становится известно, что ее можно вывести из остальных аксиом этой теории.
Как следствие, зависимые аксиомы можно (и с точки зрения логической стройности правильнее)
оформлять не как аксиомы, а как теоремы этой теории. Однако в математике встречаются время от
времени ситуации, когда знакомство с теоремой бывает желательно задолго до того, как появляется
возможность эту теорему строго доказать. В таких случаях полезно объявить эту теорему аксиомой,
сообщив слушателям, что в действительности эта аксиома зависима.
Элементарные функции – как раз такой пример. Чисто логически ничто не мешает молчать о
них в курсе анализа до тех пор, пока не появится возможность аккуратно их определить и дока-
зать их характеристические свойства. Однако тогда возможность решать задачи с элементарными
функциями, отличными от рациональных, появится у преподавателя и у студентов только в кон-
це второго семестра. Поскольку выбрасывание из упражнений всех иррациональных элементарных
функций эквивалентно просто отказу от Исчисления в классическом его понимании, разумно по-
ступить по-другому. В этой главе мы сформулируем две избыточные аксиомы – Аксиому степеней
(аксиома B1 на с.278) и Аксиому тригонометрии (аксиома B2 на с.291). Доказательство их зависи-
мости (избыточности) мы сможем привести очень нескоро – лишь в § 3 главы 10. Отчасти поэтому,
но, в первую очередь в соответствии с общим принципом, согласно которому все, что связано с
Исчислением считается иллюстративным материалом, мы переносим эти утверждения вместе с их
следствиями, в двухколоночный текст.

(a) Степени с нецелым показате- — показательные законы:


лем и логарифмы a0 = 1, (4.1.1)
Аксиома степеней. На страницах 159 и 167 1
a−x = , (4.1.2)
мы уже определили степень числа с целым пока- ax
зателем: ax+y = ax · ay ; (4.1.3)
an (n ∈ Z)
— степенные законы:
Для нецелых показателей это понятие вводится
с помощью следующей избыточной аксиомы: 1b = 1, (4.1.4)
 b
1 1
B1. Аксиома степеней.2 Существует един- = b, (4.1.5)
ственное отображение x x
(x · y)b = xb · y b (4.1.6)
b
(a, b) 7→ a ,
P2 : тождество, называемое накопитель-
со следующими свойствами: ным законом,
P0 : оно определено в следующих трех ситуа- (ax )y = ax·y (4.1.7)
циях:
выполняется для следующих значений пе-
— при a > 0 и произвольном b ∈ R, ременных:
— при a = 0 и b > 0,
Z
— при a > 0 и x, y ∈ R,
— при a < 0 и b ∈ 2N−1 , — при a = 0 и x > 0, y > 0,
или, что то же самое, в следующих че- Z
— при a < 0 и x, y ∈ 2N−1 ,
тырех:
Z+ P3 : для нулевого основания степень, в слу-
— при b ∈ 2N−1 и тогда a ∈ R может чаях, когда она определена, описывается
быть произвольным, формулой
N
— при b ∈ − 2N−1 и тогда a 6= 0, (
Z b 1, b = 0
— при b ∈ (0, +∞) \ 2N−1 , и тогда a > 0, 0 = (4.1.8)
Z
0, b > 0
— при b ∈ (−∞, 0) \ 2N−1 , и тогда a > 0,
а для положительных выполняется сле-
P1 : следующие две группы тождеств вы- дующее условие сохранения знака:
полняются всякий раз, когда обе части
тождества определены: a>0 ⇒ ab > 0 (b ∈ R) (4.1.9)
2 Избыточность Аксиомы степеней доказывается в § 3(a) главы 10.
§ 1. Элементарные функции 279

P4 : для положительных оснований выполня- ! 4.1.4. Формула (4.1.8) вытекает из остальных


ются следующие условия монотонно- утверждений аксиомы: если b > 0, то
сти:
0·0=0
— если b > 0, то возведение в степень b
не меняет знак неравенства: ⇓
0 · 0 = (4.1.6) = (0 · 0)b = 0b
b b
0 < x < y =⇒ xb < y b (4.1.10)

— если b < 0, то возведение в степень b 0b · 0b − 0b = 0
меняет знак неравенства:

 b

0<x<y =⇒ x >y b b
(4.1.11) 0 =0
0b = 1
— если a > 1, то потенцирование с осно- Здесь второе равенство – 0b = 1 – невозможно,
ванием a не меняет знак неравенства: потому, что, если бы оно было верно, мы полу-
чили бы противоречие:
x < y =⇒ ax < ay (4.1.12)
1
0 = 01 = 0b· b = (4.1.7) =
— если 0 < a < 1, то потенцирование 1 1

с основанием a меняет знак неравен- 0b ) b = 1 b = (4.1.4) = 1


= ( |{z}
ства: k
1,
по предположению
x<y =⇒ ax > ay (4.1.13)
Значит, должно быть верно первое равенство:
! 4.1.1. Эта аксиома, между прочим, предпо- 0b = 0.
лагает справедливым равенство, которое трудно ⊲ 4.1.5. Можно заметить, что условие сохране-
считать интуитивно очевидным: ния знака (4.1.9) также следует из остальных
утверждений Аксиомы степеней B1. Нам этот
00 = 1 (4.1.14)
факт в дальнейшем не понадобится, однако чита-
тель в качестве упражнения может доказать его
(оно следует из (4.1.4), а также из (4.1.8)).
самостоятельно. В качестве подсказки мы сооб-
! 4.1.2. Для натуральных значений b тождество щим только, что здесь удобно использовать тео-
рему о степенном отображении 2.2.17 и предло-
(4.1.3) влечет за собой индуктивное тождество
(2.2.235): жение 4.1.2 на с.280.
Следствие 4.1.1. Справедлива импликация:
a0 = 1, an+1 = an · a,  
a>0 & b>0 =⇒ ab > 0 (4.1.17)
поэтому an в этом случае совпадает со степе-
нью числа a, определенной на странице 159. Как Доказательство. Если a = 0, то
следствие, выполняется тождество (4.1.8)
ab = 0 b = 0
a1 = a. (4.1.15)
Если же a > 0, то
Из него, а также напрямую из (4.1.8) следует, в (4.1.9)
ab > 0
частности, равенство
В обоих случаях получается ab > 0.
01 = 0 (4.1.16)
Корни.
! 4.1.3. Накопительный закон (4.1.7) не обя-
зан выполняться в случаях, не предусмотренных • Корнем степени n ∈ N называется функция
условиями Аксиомы степеней B1. Например, ра- √n
1
x := x n (4.1.18)
венство
1 1
Из аксиомы степеней B1 следует, что эта
(−1)2 2 = (−1)2· 2
| {z } | {z } функция определена
k k
1
12 (−1)1 – на всей прямой R для n ∈ 2N − 1 (то есть
k
k
−1
когда n нечетно),
1
– на полуинтервале [0; +∞) для n ∈ 2N (то
конечно, не будет верным. есть когда n четно).
280 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

• Корень степени 2 называется квадратным √ По тем же причинам цепочка равенств


корнем, и его обозначение упрощается до : 1 1
(a2n−1 ) 2n−1 = a(2n−1)· 2n−1 = a1 = a
√ √ 1
x := 2 x = x 2 (4.1.19) выполняется при любых значениях a ∈ R, и из
нее следует тождество:
• Корень степени 3 называется кубическим кор- 1
нем: f (g(y)) = (y 2n−1 ) 2n−1 = y, y∈R

3
1
x = x3 Вместе это и означает, что функции f и g обрат-
Предложение√ 4.1.2. Корень нечетной степе- ны друг другу.
ни x 7→ 2n−1
x 3. В примере 3.1.19 мы показали, что степен-
ная функция
— определен всюду на R, g(y) = y 2n−1
— возрастает на R, возрастает на всей прямой R (а для интервала
— непрерывен на R, (0; +∞) это утверждается в первом условии мо-
— равен нулю в нуле: нотонности (4.1.10)). По теореме о монотонной
√ функции 3.3.12 отсюда следует, что ее обратная
2n−1
0=0 (4.1.20) функция
1
f (x) = x 2n−1
— имеет бесконечные пределы на бесконечно-
должна возрастать и быть непрерывной на своей
стях:
области определения, то есть на множестве
√  
lim 2n−1
x = −∞ (4.1.21)
x→−∞ inf g(y); sup g(y) =
√ y∈R y∈R
lim 2n−1 x = +∞ (4.1.22)  
x→+∞
= lim g(y); lim g(y) =
y→−∞ y→+∞
— удовлетворяет следующему правилу, кото-
рое может считаться его определением: = (3.4.147), (3.4.146) = (−∞; +∞) = R
√ 4. Равенство (4.1.20) следует из тождества
y = 2n−1 x ⇐⇒ y 2n−1 = x (4.1.23) (4.1.8).
5. Формулы (4.1.21)-(4.1.22) следуют из фор-
Доказательство. 1. Как мы уже отмечали, тот мул (3.3.133):
√ 1
факт, что функция x 7→ 2n−1 x = x 2n−1 опреде-
лена на R постулируется в Аксиоме степеней B1 1 1
lim x 2n−1 = (3.4.150) = inf x 2n−1 =
на с.278, поэтому его доказывать не нужно. x→−∞ x∈R
2n−1
2. Докажем правило (4.1.23). Оно означает, = (3.3.133) = inf D(x →
7 x ) = inf R = −∞
что функции
и
1
f (x) = x 2n−1 , g(y) = y 2n−1 1 1
lim x 2n−1 = (3.4.150) = sup x 2n−1 =
x→+∞ x∈R
(определенные на всей прямой R, по условиям = (3.3.133) = sup D(x 7→ x 2n−1
) = sup R = +∞
Аксиомы степеней B1 на с. 278) должны быть
обратны друг другу. Это доказывается с помо-
щью накопительного закона (4.1.7): заметим, что
⋄ 4.1.6. Предложение 4.1.2 дает достаточно ин-
цепочка равенств
формации для построения графика корня нечет-
1 1 (4.1.15) ной степени, за исключением одной детали,
(a 2n−1 )2n−1 = a 2n−1 ·(2n−1) = a1 = a (4.1.24) а именно свойства графика иметь выпуклость
вверх или вниз на разных участках. Смысл этих
выполняется при любых значениях a ∈ R: слов интуитивно очевиден, однако аккуратное
— для a > 0 первое равенство в (4.1.24) выпол- объяснение им удобно давать после того, как бу-
1 дет определена производная, поэтому мы отло-
няется, независимо от свойств степеней 2n−1
и 2n − 1, жим разговор о выпуклости до с.345. Если же
— для a = 0 оно выполняется, потому что не требовать здесь объяснений относительно вы-
1 пуклости, то в остальном из предложения 4.1.2
2n−1 > 0 и 2n − 1 > 0,
следует, что по виду графика (то есть по тому,
— для a < 0 оно выполняется, потому что
1 Z Z где у графика имеются интервалы возрастания
2n−1 ∈ 2N−1 и 2n − 1 ∈ 2N−1 . и убывания, интервалы, где сохраняется выпук-
Из (4.1.24) следует тождество: лость, и какие функция имеет пределы на концах
этих интервалов) все корни нечетной степени ве-
1
g(f (x)) = (x 2n−1 )2n−1 = x, x∈R дут себя одинаково:
§ 1. Элементарные функции 281


— график функции x 7→ 2n−1 x выглядит как то, во-первых,
график любого представителя из этого семей-  1 2n 1
ства функций, например, как график кубиче- y 2n = x 2n = (4.1.7) = x 2n ·2n = x1 = x
ского корня
√ 1 и, во-вторых, по Аксиоме степеней B1 на с.278,
3
x = x3 (x ∈ R) 1
из того, что x 2n существует, следует, что x > 0.
Поэтому
1 (4.1.17)
y = x 2n > 0
Мы доказали импликацию
Предложение
√ 4.1.3. Корень четной степени
x 7→ 2n x √
y = 2n x =⇒ y 2n = x & y>0
— определен всюду на полуинтервале [0; +∞),
Теперь докажем обратную импликацию:
— возрастает на [0; +∞),

— непрерывен на [0; +∞), y = 2n x ⇐= y 2n = x & y > 0
— равен нулю в нуле:
√ Пусть
2n
0=0 (4.1.25) y 2n = x & y>0

— имеет бесконечный предел на бесконечности: Тогда (4.1.17)



2n
x = y 2n > 0
lim x = +∞ (4.1.26)
x→+∞
и поэтому, по Аксиоме степеней B1 нас.278,
— удовлетворяет следующему правилу, кото- 1 1 1

рое может считаться его определением: ∃ x 2n = (y 2n ) 2n = (4.1.7) = y 2n· 2n = y 1 = y


√ То есть
y = 2n x ⇐⇒ y 2n = x & y > 0 √
(4.1.27) y = 2n x

Доказательство. 1. Тот факт, что функция x 7→ 6. Остается


√ доказать непрерывность функции
√ 1 x →
7 2n
x. Заметим, что правило (4.1.27) можно
2n
x = x 2n определена на [0; +∞) постулирует-
интерпретировать так: функции
ся в Аксиоме степеней B1 на с.278, поэтому его
доказывать не нужно. √ 1
f (x) = 2n x = x 2n , g(y) = y 2n ,
2. Докажем соотношение (4.1.26). При x > 1
мы получим: если их считать определенными на полуинтер-
1 1
> вале [0; +∞) (эта оговорка нужна, потому что
2n 2n + 1 функция g(y) = y 2n формально определена на
⇓ всей прямой R, что больше, чем [0; +∞)) обрат-
1 1 (4.1.22) ны друг другу. Поэтому можно воспользоваться
x 2n > (4.1.13) > x 2n+1 −→ +∞ замечанием 3.3.24: функции f и g определены на
x→+∞
полуинтервале [0; +∞), взаимно обратны, при-

1
чем функция f возрастает на нем (мы это уже
x 2n −→ +∞ доказали на первом шаге), поэтому они должны
x→+∞
быть непрерывны.
3. Равенство (4.1.25) следует из тождества Однако утверждение, упомянутое нами в за-
(4.1.8). √ мечании 3.3.24 мы не доказали (и даже акку-
4. Проверим, что функция x 7→ 2n x = ратно не сформулировали). Поэтому для строго-
1
x 2n возрастает на [0; +∞). Для подмножества сти можно поступить иначе. Сначала заметим,
(0; +∞) этот факт постулируется в условии мо- что функции f и g, если их считать определен-
нотонности (4.1.10). Поэтому нам нужно лишь ными на интервале (0; +∞), взаимно обратны,
проверить, что он будет верен для случая пары и строго монотонны (в силу условия монотон-
x, y ∈ [0; +∞), x < y, в которой x = 0. Здесь ности (4.1.10)). Значит, по теореме 3.3.12 они
применяется (4.1.9): должны быть непрерывны на (0; +∞). Поэтому
1 для непрерывности на [0; +∞) нам остается до-
0 < y =⇒ 0 < (4.1.9) < y 2n . казать, что f непрерывна в нуле. При 0 < x < 1
5. Докажем правило (4.1.27). В прямую сто- мы получим: 1 1
рону мы получаем: если >
2n 2n + 1
√ 1
y = 2n x = x 2n ⇓ (4.1.13)
282 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

(4.1.9)
0 <
1 1
x 2n < x 2n+1 −→ 0 2n+1
1 (4.1.25)
= 0 В-третьих, если x < 0, то
x→0 √
| {z } y = x2
1
функция x 7→ x 2n+1
непрерывна m
по предложению 4.1.2 2
y =x & y>0
⇓ m
x
1
2n −→ 0 y 2 − x2 = 0 & y>0
x→0
m
(y − x)(y + x) = 0 & y>0
⋄ 4.1.7. Предложение 4.1.3 позволяет строить m
графики корней четной степени. Опять если не  
y+x=0
интересоваться участками выпуклости (о кото- & y>0
y−x=0
рых мы упоминали в примере 4.1.6), мы получа-
ем, что по виду графика все корни четной степе- m
 
ни ведут себя одинаково: y = −x
√ & y>0
y=x
— график функции x 7→ 2n x выглядит как гра-
фик любого представителя из этого семейства ▼❇❇
функций, например, как график квадратного
невозможно,
корня √ потому что x < 0
1
x = x2 (x ∈ R)
m
y = −x = |x|

Предложение 4.1.4. Справедливо тождество: Степенная функция. Корни, о которых мы


√ говорили в предыдущем разделе, являются част-
|x| = x2 (4.1.28)
ными случаями функций, называемых степенны-
Доказательство. Здесь нужно рассмотреть
√ три ми.
2
случая: во-первых, если x = 0, то x = 0 = |x| • При каждом фиксированном значении b
– очевидно. Во-вторых, если x > 0, то получаем функция
√ x 7→ xb
y = x2
называется степенной (с показателем b). По
m Аксиоме степеней B1 на с. 278, эту функцию
можно считать определенной
y 2 = x2 & y > 0 Z+
— на множестве R, если b ∈ 2N−1 ;
m — на множестве R \ {0}, если b ∈ − N ; 2N−1
y 2 − x2 = 0 & y>0 — на множестве [0, +∞), если b ∈ (0, +∞) \
Z
m 2N−1 .
— на множестве (0, +∞), если и b ∈ (−∞, 0)\
(y − x)(y + x) = 0 & y>0 Z
2N−1 .
m Предложение 4.1.5. При b ∈ 2N−1
степенная
2N−1
 
y−x=0 функция x 7→ xb
& y>0
y+x=0 – определена всюду на R,
m – непрерывна на R,
  – возрастает на R,
y=x
& y>0 – равна нулю в нуле,
y = −x
0b = 0,
▼❇

– имеет бесконечные пределы на бесконечно-
невозможно,
потому что x > 0 стях:

m lim xb = −∞ (4.1.29)
x→−∞

y = x = |x| lim xb = +∞ (4.1.30)


x→+∞
§ 1. Элементарные функции 283

Доказательство. 1. Поскольку b > 0, по Аксио- луинтервале (−∞; 0] и выпуклым вверх на по-


ме степеней B1 на с.278, функция x 7→ xb дей- луинтервале [0; +∞), и выглядит как график
ствительно определена на R. любого представителя из этого семейства, на-
2. Если b = 2m−1
2n−1 , m, n ∈ N, то степенная пример, как график кубического корня:
функция h(x) = xb является композицией сте- 1 √
1 f (x) = x 3 = 3 x (x ∈ R)
пенных функций g(y) = y 2m−1 и f (x) = x 2n−1 :

h(x) = g(f (x)) = y 2m−1 1 =


y=x 2n−1
1 2m−1
= (x 2n−1 )2m−1 = (4.1.7) = x 2n−1 Предложение 4.1.6. При b ∈ 2N
2N−1 степенная
1
функция x 7→ xb
3. Поскольку функция f (x) = x 2n−1 непре-
рывна на R по предложению 4.1.2, а функция – определена всюду на R,
g(y) = y 2m−1 непрерывна на R в силу примера – непрерывна на R,
3.3.11, их композиция h = g ◦ f должна быть – убывает на полуинтервале (−∞; 0],
непрерывна по теореме 3.3.3. – возрастает на полуинтервале [0; +∞),
1
4. Функция f (x) = x 2n−1 возрастает всю-
– равна нулю в нуле,
ду на R в силу предложения 4.1.2, а функция
g(y) = y 2m−1 возрастает всюду на R в силу при- 0b = 0,
мера 3.1.19. Значит, по свойству 5◦ на с.199, ком-
позиция h = g ◦ f также возрастает. – имеет бесконечные пределы на бесконечно-
5. Равенство нулю в нуле опять следует из стях:
тождества (4.1.8). lim xb = +∞ (4.1.31)
x→−∞
6. А пределы (4.1.29)-(4.1.30) следуют из
(4.1.21)-(4.1.22) и (3.4.147)-(3.4.146). lim xb = +∞ (4.1.32)
x→+∞

⋄ 4.1.8. Как и в случае с предложением 4.1.6, Доказательство. Здесь с очевидными измене-


предложение 4.1.5 позволяет строить график ниями мы применяем те же рассуждения, что и
степенной функции, теперь уже с показателем при доказательстве предложения 4.1.5.
b ∈ 2N−1
2N−1 . Опять вид графика зависит от того, 1. Поскольку b > 0, по Аксиоме степеней B1
больше или меньше единицы степень b (здесь она на с.278, функция x 7→ xb действительно опреде-
2N−1
может быть равной 1, поскольку 1 ∈ 2N−1 ), и, лена на R.
забегая вперед, мы употребляем термин выпук- 2m
2. Заметим, что для b = 2n−1 , m, n ∈ N, сте-
лость, рассчитывая на интуицию (или эрудицию) b
пенная функция h(x) = x является композицией
читателя: 1
степенных функций g(y) = y 2m и f (x) = x 2n−1 :
2N−1
— в случае b > 1, b ∈ 2N−1 , график функции
b
x 7→ x является выпуклым вверх на полуин- h(x) = g(f (x)) = y 2m 1 =
y=x 2n−1
тервале (−∞; 0] и выпуклым вниз на полуин- 1 2m
тервале [0; +∞), и выглядит как график лю- = (x 2n−1 )2m = (4.1.7) = x 2n−1
бого представителя из этого семейства функ- 3. Теперь проверим непрерывность. Посколь-
ций, например, как кубическая парабола, то ку функция g(y) = y 2m непрерывна на R в силу
есть как график функции: 1
примера 3.3.11, а функция f (x) = x 2n−1 непре-
f (x) = x3 (x ∈ R) рывна на R по предложению 4.1.2, их компози-
ция h = g◦f должна быть непрерывна по теореме
3.3.3.
4. Далее разберемся с монотонностью. Функ-
1
ция f (x) = x 2n−1 возрастает на полуинтерва-
— в случае b = 1 график функции x 7→ xb = ле (−∞; 0] в силу предложения 4.1.2, а функция
2m
x1 = x, понятное дело, представляет собой g(y) = y убывает на полуинтервале (−∞; 0] ⊇
прямую: f ((−∞; 0]) в силу примера 3.1.18. Значит, по
свойству 5◦ на с.199, композиция h = g ◦ f убы-
f (x) = x (x ∈ R) вает на полуинтервале (−∞; 0].
1
Наоборот, функция f (x) = x 2n−1 возрастает
на [0; +∞) в силу предложения 4.1.2, а функция
g(y) = y 2m возрастает на [0; +∞) ⊇ f ([0; +∞)) в
силу примера 3.1.18. Значит, по свойству 5◦ на
2N−1
— если же b < 1, b ∈ 2N−1 , то график функ- с.199, композиция h = g ◦ f также возрастает на
ции x 7→ xb является выпуклым вниз на по- [0; +∞).
284 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

5. Равенство нулю в нуле следует из тожде- – убывает на интервале (0; +∞),


ства (4.1.8). – имеет следующие пределы в граничных точ-
6. Пределы (4.1.31)-(4.1.32) следуют из ках области определения и на бесконечно-
(4.1.21)-(4.1.22) и (3.4.139)-(3.4.140). Например, сти:
первый из них:
x → −∞ lim xb = +∞ (4.1.33)
x→−0
⇓ (4.1.31) lim xb = +∞ (4.1.34)
x→+0
1
f (x) = x 2n−1 → −∞ lim xb = 0 (4.1.35)
x→∞
⇓ (3.4.139), теорема 3.4.9
Доказательство. Если обозначить c = −b, то
2n 2N
g(f (x)) = x 2n−1 → +∞ мы получим c ∈ 2N−1 , и наша функция будет
композицией функции f (x) = xc , рассмотренной
в предложении 4.1.6 и функции g(y) = y −1 , рас-
⋄ 4.1.9. Предложение 4.1.6 позволяет строить смотренной в примерах 3.1.21 и 3.3.11. b
Все нуж-
графики степенных функций с показателями b ∈ ные нам свойства функции x →
7 x следуют из
2N этих утверждений.
2N−1 . Эти графики имеют уловимое взглядом
различие, в зависимости от того, больше или ⋄ 4.1.10. Предложение 4.1.7 позволяет строить
меньше единицы степень b (равной 1 она быть график степенной функции с показателем b ∈
2N
не может, из-за того, что 1 ∈
/ 2N−1 ). Различие же − 2N . В отличие от предыдущих случаев, здесь
2N−1
состоит в том, как устроены участки выпукло- вид графика (в тех деталях, которые нас инте-
сти, которые мы еще не успели определить, и о ресуют, а именно, монотонность, выпуклость и
которых речь пойдет на с.345. Поскольку интуи- пределы в крайних токах интервалов монотон-
тивный смысл выпуклости очевиден, мы думаем, ности и выпуклости) не зависит от значения b:
что читателю будет понятно, если, забегая впе- 2N b
ред, сообщить ему, что при b > 1 график степен- — если b ∈ − 2N−1 , то график функции x 7→ x ,
ной функции является выпуклым вниз на пря- выглядит как график любого представителя
мой R, а при 0 < b < 1 прямая разбивается на из этого семейства функций, например, как
два полуинтервала (−∞, 0] и [0; +∞), на которых квадратичная гипербола, то есть как график
график является выпуклым вверх: функции
2N
— в случае b > 1, b ∈ 2N−1 , график функции f (x) = x−2 (x ∈ R)
b
x 7→ x , выглядит как график любого пред-
ставителя из этого семейства функций, на-
пример, как квадратичная парабола, то есть
как график функции
Предложение 4.1.8. При b ∈ − 2N−1
2N−1 степен-
2
f (x) = x (x ∈ R) ная функция x 7→ xb
– определена на множестве R \ {0},
– непрерывна на R \ {0},
– убывает на интервале (−∞; 0),
2N
— точно так же, если b < 1, b ∈ график2N−1 , – убывает на интервале (0; +∞),
функции x 7→ xb , выглядит как график любо- – имеет следующие пределы в граничных точ-
го представителя из этого семейства, напри- ках области определения и на бесконечно-
мер, как парабола со степенью 23 , то есть как сти:
график функции
lim xb = −∞ (4.1.36)
2 x→−0
f (x) = x 3 (x ∈ R)
lim xb = +∞ (4.1.37)
x→+0

lim xb = 0 (4.1.38)
x→∞

Доказательство. Если обозначить c = −b, то


Предложение 4.1.7. При b ∈ − 2N−12N 2N
степен- мы получим c ∈ 2N−1 , и наша функция будет
ная функция x 7→ xb композицией функции f (x) = xc , рассмотренной
в предложении 4.1.5 и функции g(y) = y −1 , рас-
– определена на множестве R \ {0},
смотренной в примерах 3.1.21 и 3.3.11. Все нуж-
– непрерывна на R \ {0}, ные нам свойства функции x 7→ xb следуют из
– возрастает на интервале (−∞; 0), этих утверждений.
§ 1. Элементарные функции 285

⋄ 4.1.11. Предложение 4.1.8 позволяет строить если их считать определенными на полуинтерва-


график степенной функции с показателем b ∈ ле [0; +∞) (эта оговорка нужна, потому что мо-
− 2N−1
2N−1 . Как и в предыдущем случае, здесь вид жет случиться, что вторую из них можно опре-
графика не зависит от значения b: делить на множестве, большем, чем [0; +∞); на-
Z
пример, при b = 21 ∈ (0; +∞) \ 2N−1 мы получаем
— если b ∈ − 2N−1
2N−1 , то график функции x →
7 xb
,
1 Z 1
2
выглядит как график любого представите- b = 2 ∈ 2N−1 , и функция y 7→ y b = y оказы-
ля из этого семейства функций, например, вается определенной на всей прямой R) обратны
как кубическая гипербола, то есть как график друг другу. Действительно, с одной стороны, для
функции любого x ∈ [0; +∞) мы получаем

f (x) = x−3 (x ∈ R) 1
g(f (x)) = (xb ) b = (4.1.7) =
1
= xb· b = x1 = (4.1.15) = x

А с другой – для любого y ∈ [0; +∞)


Z
Предложение 4.1.9. При b ∈ (0; +∞) \ 1
2N−1 f (g(y)) = (y b )b = (4.1.7) =
степенная функция x 7→ xb 1
= y b ·b = y 1 = (4.1.15) = y
– определена на полуинтервале [0; +∞),
– непрерывна на [0; +∞), 6. После этого можно воспользоваться заме-
– возрастает на [0; +∞), чанием 3.3.24: функции f и g определены на по-
луинтервале [0; +∞), взаимно обратны, причем
– равна нулю в нуле,
функция f возрастает на нем (мы это уже дока-
0b = 0, (4.1.39) зали на первом шаге), поэтому они должны быть
непрерывны.
– имеет бесконечный предел в бесконечности: Однако поскольку утверждение, упомянутое
нами в замечании 3.3.24 мы не доказали, мы
lim xb = +∞ (4.1.40) для строгости поступим иначе. Сначала заме-
x→+∞
тим, что функции f и g, если их считать опреде-
Доказательство. Здесь мы с небольшими изме- ленными на интервале (0; +∞), взаимно обрат-
нениями повторяем рассуждения, применявшие- ны, и строго монотонны (в силу условия моно-
ся при доказательстве предложения 4.1.3. тонности (4.1.10)). Значит, по теореме 3.3.12 они
1. Поскольку b > 0, по Аксиоме степеней B1 должны быть непрерывны на (0; +∞). Поэтому
на с.278 функция x 7→ xb действительно опреде- для непрерывности на [0; +∞) нам остается до-
лена на [0; +∞). казать, что f непрерывна в нуле. Для этого снова
1
2. Докажем соотношение (4.1.40). Для этого возьмем n ∈ N так, чтобы 2n−1 < b. Тогда при
1
подберем n ∈ N так, чтобы b > 2n−1 . Тогда при 0 < x < 1 мы получим:
x > 1 мы получим: 1
0 < (4.1.9) < xb < (4.1.13) < x 2n−1 −→ 0
1
x→0
xb > (4.1.13) > x 2n−1 −→ +∞
x→+∞

⇓ xb −→ 0
x→0
xb −→ +∞
x→+∞

3. Равенство (4.1.39) следует из тождества ⋄ 4.1.12. Предложение 4.1.9 позволяет строить


(4.1.8). график степенной функций с показателем b ∈
4. Проверим, что наша функция возрастает Z
(0; +∞) \ 2N−1 . Здесь как и в примере 4.1.9, вид
на [0; +∞). Для подмножества (0; +∞) этот факт графика зависит от того, больше или меньше
постулируется в условии монотонности (4.1.10). единицы степень b (равной 1 она опять быть не
Поэтому нам нужно лишь проверить, что он бу- Z
может, из-за того, что 1 ∈ 2N−1 ):
дет верен для случая пары x, y ∈ [0; +∞), x < y,
Z
в которой x = 0. Здесь применяется (4.1.9): — в случае b > 1, b ∈ (0; +∞) \ 2N−1 , график
b
функции x 7→ x , выглядит как график лю-
0<y =⇒ 0 < (4.1.9) < y b . бого представителя из этого семейства функ-
ций, например, как график функции
5. Заметим далее, что функции
3

1
f (x) = x 2 (x > 0)
b
f (x) = x , g(y) = y b
286 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Z
— точно так же, если b < 1, b ∈ (0; +∞) \ 2N−1 , Лемма 4.1.11. При любом a > 0 последова-
1 1
b
график функции x 7→ x , выглядит как гра- тельности a n и a− n стремятся к единице:
фик любого представителя из этого семей- 1
a n −→ 1,
1
a− n −→ 1 (4.1.43)
ства, например, как график квадратного кор- n→∞ n→∞
ня Доказательство. 1. Пусть сначала a > 1. Обо-
1 √
f (x) = x 2 = x (x > 0) значим
1
xn = a n − 1
и заметим, что, во-первых,
a>1
Z
Предложение 4.1.10. При b ∈ (−∞; 0) \ 2N−1 ⇓ (4.1.10)
степенная функция x 7→ xb a
1
n >1
1
n = (4.1.4) = 1
– определена на интервале (0; +∞). ⇓
1
– непрерывна на (0; +∞). xn = a − 1 > 0
n

– убывает на (0; +∞) И, во-вторых, в силу неравенства Бернулли


– имеет следующие пределы на концах этого (2.2.242),
интервала:
a = (1 + xn )n > (2.2.242) > 1 + n · xn
lim xb = +∞ (4.1.41) ⇓
x→+0
a−1
lim xb = 0 (4.1.42) > xn
x→+∞ n
Записав эти два неравенства вместе, мы получим
Доказательство. Если обозначить c = −b, то оценку для xn , из которой получается первый из
2N
мы получим c ∈ 2N−1 , и наша функция будет двух пределов (4.1.43):
композицией функции f (x) = xc , рассмотренной
a−1
в предложении 4.1.9 и функции g(y) = y −1 , рас- 0 < xn 6
смотренной в примерах 3.1.21 и 3.3.11. Все нуж- n
b
ные нам свойства функции x 7→ x следуют из ⇓
1
этих утверждений. a n − 1 = xn −→ 0
n→∞

⋄ 4.1.13. Предложение 4.1.10 позволяет стро- ⇓


1
ить график степенной функций с показателем a n −→ 1
Z n→∞
b ∈ (−∞; 0) \ 2N−1 . Здесь вид графика (в тех де-
После этого второй предел получается примене-
талях, которые мы здесь уже перечисляли) не
нием тождества (4.1.2) и свойства пределов со-
зависит от значения b:
хранять дробь:
Z
— при b ∈ (−∞; 0) \ 2N−1 , график функции x 7→
1 1 40 , с.216 1
xb , выглядит как график любого представи- a− n = (4.1.2) = 1 −→ =1
теля из этого семейства функций, например, a n n→∞ 1
как график функции 2. Если a = 1, то пределы (4.1.43) становятся
тривиальными следствиями тождества (4.1.4):
1
f (x) = x− 2 (x ∈ R) 1 1
a n = 1 n = (4.1.4) = 1 −→ 1
n→∞
1 1
−n −n
a =1 = (4.1.4) = 1 −→ 1
n→∞

3. Если 0 < a < 1, то положив A = a1 , мы по-


Показательная функция. При каждом фик- лучим A > 1, и поэтому, как мы уже доказали,
сированном значении a отображение 1
A n −→ 1
n→∞
x 7→ ax Как следствие,
  n1
называется показательной функцией (с основа- 1 1 1 1
a =
n = (4.1.5) = 1 −→ =1
нием a). По Аксиоме степеней B1 на с.278, эту A An n→∞ 1
функцию можно считать определенной а отсюда уже
— на множестве R, если a > 0; 1 1 1
a− n = (4.1.2) = 1 −→ =1
— на множестве [0; +∞), если a = 0; a n n→∞ 1
Z
— на множестве 2N−1 , если a < 0.
§ 1. Элементарные функции 287

Лемма 4.1.12. При любом a > 0 справедливо Предложение 4.1.13. При любом a > 0 функ-
соотношение: ция x 7→ ax непрерывна.
x
a −→ 1 (4.1.44) Доказательство. Если x −→ x, то x − x −→
x→0 k k
k→∞ k→∞
Доказательство. Нам нужно показать, что для 0 и поэтому
произвольной бесконечно малой последователь- axk − ax = axk −x · ax − ax = (axk −x −1) · ax −→ 0
ности | {z } k→∞

xk −→ 0 (4.1.45) 1,
k→∞ в силу (4.1.44)
выполняется
axk −→ 1 (4.1.46)
k→∞
Рассмотрим несколько случаев. Предложение 4.1.14. Справедливы следующие
1. Если a = 1, то (4.1.46) выполняется триви- соотношения:
ально, потому что в этом случае axk = 1. — если a > 1, то
2. Пусть a > 1. Из соотношений (4.1.43) сле-
lim ax = 0, lim ax = +∞ (4.1.47)
дует, что для любого ε > 0 найдется номер N x→−∞ x→+∞
такой, что — если 0 < a < 1, то
1 1
1 − ε < a− N < a N < 1 + ε lim ax = +∞, lim ax = 0 (4.1.48)
x→−∞ x→+∞
Из (4.1.45) следует, что для данного N можно Доказательство. 1. Пусть a > 1. Тогда в силу
подобрать номер K такой, что (3.2.44),
1 an −→ +∞,
∀k > K |xk | < n→∞
N поэтому для любого E > 0 найдется N ∈ N такое,
Поэтому: что
aN > E
1 1
∀k > K − < xk < Для любого x > N мы теперь получаем:
N N
⇓ (4.1.12) ax > (4.1.12) > aN > E
1 1
∀k > K 1 − ε < a− N < ax k < a N < 1 + ε Мы получили, что для любого E > 0 найдется N
такое, что при x > N выполняется неравенство

ax > E. Это означает, что справедливо второе
xk
∀k > K a ∈ (1 − ε, 1 + ε) соотношение в (4.1.47):
Мы получили, что какой ни возьми ε > 0 почти lim ax = +∞
xk x→+∞
все элементы последовательности a лежат в ε-
окрестности точки 1. Это и означает, что спра- После того, как оно доказано, первое выводится
ведливо (4.1.46). как его следствие:
3. Пусть 0 < a < 1. Тогда из (4.1.43) следует,  
y = −x
что для любого ε > 0 найдется номер N такой, lim ax = = lim a−y =
x→−∞ y → +∞ y→+∞
что
1
− 1
1 − ε < aN < a N < 1 + ε 1
= lim = (3.4.136) = 0
y→+∞ ay
Опять из (4.1.45) получаем, что для данного N
можно подобрать номер K такой, что ❘ +∞

1 2. Пусть 0 < a < 1. Тогда, положив A = 1
∀k > K |xk | < a,
N мы получим A > 1, поэтому
и поэтому  
y = −x
1 1
∀k > K − < xk < lim ax =  y → +∞  =
N N x→−∞
ax = A−x = Ay
⇓ (4.1.13)
= lim Ay = (4.1.47) = +∞
1
xk 1
−N y→+∞
∀k > K 1−ε<a N <a <a < 1+ε
и
⇓  
xk
y = −x
∀k > K a ∈ (1 − ε, 1 + ε) lim ax =  y → −∞  =
x→+∞
То есть какой ни возьми ε > 0, почти все ax = A−x = Ay
элементы последовательности axk лежат в ε- = lim Ay = (4.1.47) = 0
окрестности точки 1. Опять это означает, что y→−∞

справедливо (4.1.46).
288 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Предложение 4.1.15. При любых a > 0 и x ∈ пытаться рисовать отдельные точки на нем, на-
R справедливо неравенство пример

ax > 0 (4.1.49)

Доказательство. Если a = 1, то это неравенство


Увеличивая число точек, мы будем добиваться
будет очевидно, в силу первого степенного зако-
усложнения картинки
на (4.1.4): 1x = 1. Поэтому важно рассмотреть
случаи a > 1 и 0 < a < 1.
1. Пусть a > 1. Тогда рассмотрев целую часть
[x] числа x (мы ее определили выше формулой
(2.2.286)), мы получим: но, в отличие от предыдущих случаев, здесь
не получится, чтобы все точки принадлежали
[x] 6 x (2.2.288) какой-то одной непрерывной линии.
Частным случаем будет график функции
⇓ (4.1.12)

0 < a[x] 6 ax f (x) = (−1)x


(2.2.279)
В зависимости от степени подробности он может
⇓ изображаться так
0 < ax

2. Наоборот, если 0 < a < 1, то


или так
x < [x] + 1 (2.2.288)

⇓ (4.1.13)
x [x]+1
a >a > 0
(2.2.279)
или так

x
a >0

Логарифм.
⋄ 4.1.14. Предложений 4.1.13, 4.1.14 и 4.1.15 • Для всякого числа a, удовлетворяющего
достаточно, чтобы построить график функции двойному неравенству
x 7→ ax в тех случаях, когда это возможно, то 0 < a 6= 1,
есть когда a > 0:
правило
– если a > 1, график выглядит так: y = loga x ⇐⇒ ay = x (4.1.50)
определяет функцию
x 7→ loga x (x > 0)
– если a = 1, график становится прямой: называемую логарифмом по основанию a. По-
нятно, что функции x 7→ ax и loga связаны
тождествами
aloga x = x (x > 0) (4.1.51)
x
– если 0 < a < 1, график выглядит так: loga (a ) = x (x ∈ R) (4.1.52)
Второе из них влечет за собой тождество
loga a = 1 (0 < a 6= 1) (4.1.53)

– если a = 0, график выглядит так: Доказательство. Мы докажем это утверждение


для случая a > 1 (случай 0 < a < 1 рассматри-
вается аналогично).
1. Неравенство (4.1.49) означает, что отоб-
ражение x 7→ ax действительно переводит R в
⋄ 4.1.15. Отдельно нужно сказать, что при a < (0; +∞).
0, график изобразить невозможно, оттого, что он 2. Далее из условия возрастания (4.1.12) сле-
становится разрывным в каждой точке. Можно дует, что отображение x 7→ ax инъективно.
§ 1. Элементарные функции 289

3. Покажем, что x 7→ ax сюръективно отобра- Предложение 4.1.18. Функция loga , опреде-


жает R на (0; +∞). Пусть C ∈ (0; +∞). Посколь- ленная правилом (4.1.50), удовлетворяет тож-
ку limx→−∞ ax = 0 (первое равенство в (4.1.47)), дествам
найдется x ∈ R такое, что ax < C. С другой
loga 1 = 0, (4.1.56)
стороны, limx→+∞ ax = +∞ (второе равенство
в (4.1.47)), поэтому найдется y ∈ R такое, что 1
loga = − loga x (4.1.57)
ay > C. Мы получаем, что x
loga (x · y) = loga x + loga y, (4.1.58)
ax < C < ay
Доказательство. Первое равенство следует
непосредственно из определения (4.1.50):
причем x 7→ ax – непрерывная функция в силу
предложения 4.1.13. Значит, по теореме Коши о a0 = (4.1.1) = 1 ⇐⇒ 0 = loga 1
среднем значении 3.3.6, найдется точка c ∈ R та-
Чтобы доказать второе, достаточно вычис-
кая, что
лить значения функции x 7→ ax в обеих его ча-
ac = C стях:
Мы получили, что какое ни возьми C ∈ (0; +∞), 1 1 1
aloga x = log x = (4.1.2) = a− loga x
=
для него найдется точка c ∈ R, в которой функ- x a a
ция x 7→ ax принимает значение C. Это и означа- Поскольку x 7→ ax – инъективное отображение,
1
ет сюръективность x 7→ ax как отображения из равенство aloga x = a− loga x означает, что аргу-
R в (0; +∞). менты должны быть равны: loga x1 = − loga x.
4. Инъективность и сюръективность вме- Точно так же доказывается последнее равен-
сте означают биективность x 7→ ax : R → ство:
(0; +∞).
aloga (x·y) = x · y = aloga x · aloga y =
Предложение 4.1.16. Функция loga , опреде- = (4.1.3) = aloga x+loga y
ленная правилом (4.1.50), непрерывна.
Опять, поскольку x 7→ ax – инъективное отоб-
loga (x·y)
Доказательство. Это следует из теоремы 3.3.12: ражение, равенство a = aloga x+loga y воз-
функция x 7→ ax непрерывна и строго монотонна можно только если аргументы равны: loga (x·y) =
на интервале R = (−∞, +∞), значит обратная ей loga x + loga y.
функция y 7→ loga y тоже непарерывна. Предложение 4.1.19. Справедливы следующие
соотношения:
Предложение 4.1.17. Функция loga , опреде-
ленная правилом (4.1.50), — если a > 1, то

— возрастает при a > 1: lim loga x = −∞, lim loga x = +∞


x→+0 x→+∞
(4.1.59)
0<x<y =⇒ loga x < loga y (4.1.54)
— если 0 < a < 1, то
— убывает при 0 < a < 1: lim loga x = +∞, lim loga x = −∞
x→+0 x→+∞

0<x<y =⇒ loga x > loga y (4.1.55) (4.1.60)


Доказательство. Пусть a > 0. Если E > 0, то
Доказательство. Пусть a > 1 и x < y. Если бы для любого x ∈ (0; a−E ) получаем в силу (4.1.54):
оказалось, что loga x > loga y, то, в силу возрас-
тания x 7→ ax , мы получили бы loga x < loga a−E = −E
Это означает, что справедливо первое соотноше-
ln x > ln y ние в (4.1.59):

⇓ lim loga x = −∞
x→+0

loga x loga y Наоборот, для любого x > aE получаем в силу


| {z } > |a {z }
a
(4.1.54):
x y
loga x > loga aE = E
⇓ Это означает, что справедливо второе соотноше-
ние в (4.1.59):
x>y
lim loga x = +∞
x→+∞
Случай 0 < a < 1 рассматривается аналогич-
но.
290 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

⋄ 4.1.16. Предложений 4.1.17, 4.1.18 и 4.1.19 стороны, формулы для вычисления их значений,
достаточно, чтобы построить график функции их производных и интегралов, оказываются осо-
loga : бенно простыми, а с другой – все остальные по-
казательные функции и логарифмы выражаются
— если a > 1, то картинка получается такой: через них с помощью формул (4.1.61)-(4.1.63).

• Показательная функция x 7→ ex с основанием


e имеет специальное название – экспонента.
А логарифм x 7→ loge x с основанием e на-
— если 0 < a < 1, то такой: зывается натуральным логарифмом и у него
есть специальное обозначение – ln:

ln x = loge x

Формулы, связывающие показательные Из (4.1.61)-(4.1.63) следует, что любую пока-


функции и логарифмы с разными основа- зательную функцию и любой логарифм можно
ниями. выразить через экспоненту и натуральный лога-
рифм так:
Предложение 4.1.20. Справедливы тожде-
ства: ax = ex·ln a (0 < a) (4.1.64)
ln x
ax = bx·logb a (4.1.61) loga x = (0 < a 6= 1) (4.1.65)
ln a
x
logb (a ) = x · logb a (4.1.62)
Графики эти функций выглядят как обычная по-
logb x
loga x = (4.1.63) казательная функция и обычный логарифм:
logb a

(в первых двух тождествах 0 < x, 0 < a,


0 < b 6= 1, а в третьем 0 < x, 0 < a 6= 1,
0 < b 6= 1)
Доказательство. Первое тождество доказыва-
ется цепочкой:

bx·logb a = (4.1.7) = ( |blog ba x


{z } ) = a
x

k
(4.1.51)
k
a

Из него следует второе: Перестановочность предела с возведением


в степень. У формулам арифметический дей-
(4.1.61) (4.1.52)
logb (ax ) = logb (bx·logb a ) = x · logb a ствий с пределами (3.4.153)-(3.4.157) полезно до-
бавить еще одну:
А из второго следует третье:
Теорема 4.1.21. Если существуют конеч-
(4.1.62) loga x ные пределы limx→a f (x) и limx→a g(x), причем
logb a · loga x = logb (a ) = logb x
limx→a f (x) > 0, то
⇓ lim f (x)g(x) = lim f (x)limx→a g(x) (4.1.66)
x→a x→a
logb x
loga x =
logb a Доказательство.
g(x)
lim f (x)g(x) = lim 2log2 f (x) =
x→a x→a
Экспонента e и натуральный логарифм
x
= lim 2 g(x)·log2 f (x)
= (Предложение 4.1.13) =
x→a
ln x. Напомним, что число Непера e мы опре-  
делили на с.239, а в теореме 3.2.22 мы показали, limx→a g(x)·log2 f (x)
что оно иррационально и лежит в интервале =2 = (3.4.152) =
limx→a g(x)·limx→a log2 f (x)
=2 = (Предложение 4.1.16) =
2, 708 < e 6 2, 720 =2 limx→a g(x)·log2 (limx→a f (x))
= (4.1.62) =
x log2 {(limx→a f (x))limx→a g(x) }
Среди всех показательных функций x 7→ a и =2 = lim f (x)limx→a g(x)
x→a
всех логарифмов x 7→ loga x функции с основани-
ем e занимают особое место, потому что, с одной
§ 1. Элементарные функции 291

(b) Тригонометрические функции Доказательство. Во-первых,


Аксиома тригонометрии. Напомним, что
sin 2x = sin(x + x) = (10.3.134) =
синус sin t и косинус cos t определяются в шко-
ле как ордината и абсцисса точки на единич- = sin x · cos x + sin x · cos x = 2 · sin x · cos x
ной окружности, получаемой поворотом край-
Во-вторых,
ней правой точки (1; 0) на угол t против часо-
вой стрелки (при этом угол обычно измеряется в
cos 2x = cos(x + x) = (10.3.135) =
радианах, то есть в качестве угла берется длина
дуги единичной окружности): = cos x · cos x − sin x · sin x =
= cos2 x − |sin{z2 x} = 2 cos2 x − 1
k
(4.1.67)
k
1 − cos2 x

И отсюда уже следует:


2 2
{z x} −1 = 1 − 2 sin x
cos 2x = 2 |cos
k
(4.1.67)
k
1 − sin2 x

Поскольку здесь не объясняется, что такое длина


дуги, такое «определение» синуса и косинуса, ко- Предложение 4.1.23. Функция sin обладает
нечно, нельзя считать строгим. Однозначно эти наименьшим периодом (а значит и наимень-
функции описываются следующей зависимой ак- шим полупериодом).
сиомой:
• Наименьший полупериод функции sin обозна-
B2. Аксиома тригонометрии. 3 Существуют чается буквой π:
и единственны числовые функции синус sin n
и косинус cos, удовлетворяющие следующим π = min h > 0 : ∀x ∈ R
условиям: o
T0 : функции sin и cos определены всюду на R sin(x + 2h) = sin x (4.1.73)
и являются периодическими,
Как следствие,
T1 : справедливы следующие три тождества
(x, y ∈ R): sin(x + 2π) = sin x. (4.1.74)
sin2 x + cos2 x = 1 (4.1.67) ! 4.1.17. Формула для вычисления π будет вы-
sin(x + y) = sin x · cos y + cos x · sin y ведена нами только на с.617. Сейчас мы лишь
(4.1.68) отметим, что число π иррационально и удовле-
cos(x + y) = cos x · cos y − sin x · sin y творяет оценке
(4.1.69)
3, 14 < π < 3, 15
T2 : при x ∈ (0; 1) выполняется следующее
тройное неравенство: Доказательство. Рассмотрим число
1
0 < x cos x < sin x < x. (4.1.70) C = sin
2
Синус и косинус. Это может быть неожидан- Из (4.1.70) следует, что оно лежит в интервале
ным, но все остальные свойства синуса и косину- 0; 12 :
са выводятся из этого списка. Мы покажем здесь, 1 1
0 < sin = C <
как это делается. 2 2
Предложение 4.1.22. Справедливы тожде- Положим ε = C2 и рассмотрим интервал (0; ε).
ства: Если предположить, что у функции sin нет наи-
меньшего периода, то по теореме (3.1.6), найдет-
ся точка t ∈ (0, ε) такая, что
sin 2x = 2 sin x · cos x (4.1.71)
2 2
cos 2x = 2 cos x − 1 = 1 − 2 sin x (4.1.72) sin t = C
3 Избыточность Аксиомы тригонометрии доказывается в § 3(b) главы 10.
292 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Но в то же время из t ∈ (0, ε) ⊆ (0; 1) в силу Здесь снова если попробовать подставить в


(4.1.70) следует: (4.1.76) вместо cos 0 значение −1, получится
неверное равенство:
C
sin t < t < ε = <C −1 = 2 · (−1)2 − 1,
2
Полученное противоречие означает, что наше поэтому второе равенство в совокупности
предположение (что у sin нет наименьшего пе- (4.1.77) неверно, и остается первое:
риода) неверно.
cos 0 = 1
Предложение 4.1.24. В точках 0, π, 2π синус
и косинус принимают следующие значения: 2. После того, как значения в x = 0 вычис-
лены, из тождества периодичности для синуса
(4.1.74) сразу получается значение sin в точке
x 0 π 2π
x = 2π:
sin x 0 0 0
cos x 1 −1 1 sin 2π = sin(0 + 2π) = sin 0 = 0

Отсюда следует тождество


Доказательство. 1. Сначала рассмотрим слу-
чай x = 0. Во-первых,
sin x = sin(x + 2π) = sin x · cos 2π+
sin 0 = sin(2 · 0) = (4.1.71) = 2 · sin 0 · cos 0 | {z2π} = sin x · cos 2π
+ cos x · sin
0
⇓ 1
В частности, при x = 2 получаем:
sin 0 − 2 · sin 0 · cos 0 = 0
1 1
⇓ sin = sin · cos 2π
2 2
sin 0 · (1 − 2 · cos 0) = 0 Из (4.1.70) следует, что sin 12 > 0, потому на него
⇓ можно сократить:

  1 = cos 2π
sin 0 = 0
(4.1.75) Таким образом, мы заполнили третий столбец в
cos 0 = 12
таблице.
Но с другой стороны, 3. Только после этого можно получить значе-
2 ния в точке x = π. Во-первых,
cos 0 = cos(2 · 0) = (4.1.72) = 2 cos 0 − 1 (4.1.76)
(уже вычислено)
и отсюда следует, что cos 0 не может быть ра- ↓
0 = sin 2π = (4.1.71) = 2 sin π · cos π
вен 21 , потому что при подстановке в (4.1.76) мы
получаем неверное равенство: ⇓
 
 2 sin π = 0
1 1
=2 −1 cos π = 0
2 2
Второе из этих равенств – cos π = 0 – неверно,
Таким образом, в совокупности (4.1.75) второе потому что если это значение подставить в фор-
равенство невозможно, и остается первое: мулу (4.1.72) при x = π,
2
sin 0 = 0. | {z2π} = 2 cos π − 1
cos
k
Отсюда уже получаем значение для cos 0: 1
(уже вычислено)
0
z}|{ получается неверное равенство:
sin2 0 + cos2 0 = (4.1.67) = 1
1 = 2 · 02 − 1
⇓ Значит остается первое:
cos2 0 = 1
sin π = 0

Из этого равенства теперь получаем:
  2
cos 0 = 1 2
(4.1.77) |sin{z π} + cos π = 1
cos 0 = −1 0
§ 1. Элементарные функции 293

⇓ И, аналогично,
cos2 π = 1
1 = (таблица на с.292) = cos 0 =
⇓ = cos(x − x) = cos x · cos(−x) − sin x · sin(−x) =
| {z } | {z }
  B A
cos π = 1 = B · cos x − A · sin x
(4.1.78)
cos π = −1
Предположим, что верно первое: cos π = 1. Тогда Вместе эти равенства дают систему линейных
в качестве следствия мы получим, во-первых, уравнений для A и B:
(
B · sin x + A · cos x = 0
sin(x + π) = (10.3.134) =
B · cos x − A · sin x = 1
= sin x · cos
| {zπ} + cos x · sin
| {zπ} = sin x
k k Ее можно по-разному решать, например, так:
1 0
(предположение) (уже доказано) (
B · sin x + A · cos x = 0 ← умножаем на sin x
То есть число π > 0 должно быть периодом B · cos x − A · sin x = 1 ← умножаем на cos x
функции sin. Но это невозможно, потому что
наименьшим периодом для sin является число ⇓
2π. Полученное противоречие означает, что на- (
B · sin2 x + A · cos x · sin x = 0
ше предположение о равенстве cos π = 1 было
неверным. B · cos2 x − A · sin x · cos x = cos x
Значит, в совокупности (4.1.78) должно быть ⇓ (складываем равенства)
верно второе равенство:
B · sin2 x + B · cos2 x = cos x
| {z }
cos π = −1 k
B · (sin2 x + cos2 x)
k
B

Предложение 4.1.25. Число π является полу- ⇓


периодом и для функции cos:
B = cos x
cos(x + 2π) = cos x. (4.1.79) Это нам и нужно было узнать про B. Точно так
же и с A:
Доказательство. Здесь используются уже най- (
денные значения sin и cos в точке 2π: B · sin x + A · cos x = 0 ← умножаем на cos x
B · cos x − A · sin x = 1 ← умножаем на sin x
cos(x + 2π) = (10.3.135) =
= cos x · cos ⇓
| {z2π} − sin x · sin
| {z2π} = cos x (
1 0 B · sin x · cos x + A · cos2 x = 0
B · cos x · sin x − A · sin2 x = sin x

Предложение 4.1.26. Справедливы тожде- ⇓ (вычитаем второе из первого)

ства: A · cos x + A · sin2 x = − sin x


2
| {z }
k
A · (cos2 x + sin2 x)
sin(−x) = − sin x, cos(−x) = cos x (4.1.80) k
A
Доказательство. Зафиксируем точку x ∈ R и

обозначим
A = − sin x
A = sin(−x), B = cos(−x)

Тогда
Очевидным следствием (4.1.80) будет
0 = (таблица на с.292) = sin 0 = Предложение 4.1.27. Справедливы тожде-
= sin(x − x) = sin x · cos(−x) + cos x · sin(−x) = ства:
| {z } | {z }
B A sin(x − y) = sin x · cos y − cos x · sin y (4.1.81)
= B · sin x + A · cos x cos(x − y) = cos x · cos y + sin x · sin y (4.1.82)
294 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Из этого в свою очередь следует еще несколь- cos x − cos y = cos(α + β) − cos(α − β) =
ко тождеств. Во-первых, тождества для произве- = (10.3.135), (4.1.82) = cos α · cos β − sin α · sin β−
дений:
− cos α · cos β − sin α · sin β = −2 sin α · sin β =
Предложение 4.1.28. Справедливы тожде- x+y x−y
= −2 sin · sin
ства: 2 2
1  
sin x · sin y = cos(x − y) − cos(x + y)
2
(4.1.83) Предложение 4.1.30. Справедливы следующие
1   неравенства (x ∈ R):
cos x · cos y = cos(x − y) + cos(x + y)
2 | sin x| 6 1, (4.1.90)
(4.1.84)
1  | cos x| 6 1, (4.1.91)
sin x · cos y = sin(x − y) + sin(x + y) | sin x| 6 |x|. (4.1.92)
2
(4.1.85)
Доказательство. Из (4.1.67) получаем
Доказательство. Мы докажем первое из этих
тождеств, потому что остальные два доказыва- sin2 x + cos2 x = 1
ются по аналогии. Здесь нужно просто вычис-
лить выражение в скобках в правой части: ⇓
2
sin x 6 1
cos(x − y) − cos(x + y) = (4.1.82), (10.3.135) =

= cos x · cos y + sin x · sin y − cos x · cos y + p
| {z } | {z }
| sin x| = sin2 x 6 1
↑ ↑
+ sin x · sin y = 2 sin x · sin y и точно так же доказывается (4.1.91).
Последнее неравенство доказывается отдель-
Поделив на 2, мы получим (4.1.83). но для случаев x = 0, x ∈ (0; 1), x ∈ (−1, 0) и
x∈/ (−1, 1):
И, во-вторых, тождества для сумм:
– при x = 0 получаем
Предложение 4.1.29. Справедливы тожде-
ства: | sin 0| = 0 6 |0|
x+y x−y – при 0 < x < 1:
sin x + sin y = 2 · sin · cos (4.1.86)
2 2
x+y x−y 0 6 sin x < x = |x|
cos x + cos y = 2 · cos · cos (4.1.87)
2 2
x+y x−y ⇓ (4.1.70)
sin x − sin y = 2 · cos · sin (4.1.88)
2 2 | sin x| 6 |x|
x+y x−y
cos x − cos y = −2 · sin · sin (4.1.89) – при −1 < x < 0 получаем:
2 2
Доказательство. Ниже нам понадобятся только x ∈ (−1, 0)
два последних тождества, поэтому мы докажем
их. Два первых доказываются по аналогии. Обо- ⇓
значим −x ∈ (0, 1)
x+y x−y
α= , β=
2 2 ⇓ (4.1.70)
Тогда
0 < sin(−x) < −x
α + β = x, α−β =y | {z } |{z}
k k
Поэтому − sin x |x|
k
| sin x|
sin x − sin y = sin(α + β) − sin(α − β) =

= (10.3.134), (4.1.81) = sin α · cos β + cos α · sin β−
− sin α · cos β + cos α · sin β = 2 cos α · sin β = | sin x| 6 |x|
x+y x−y – и, наконец, если x ∈ / (−1, +1), то 1 6 |x| и
= 2 cos · sin
2 2 поэтому
| sin x| 6 1 6 |x|.
И точно так же,
§ 1. Элементарные функции 295

Предложение 4.1.31. Справедливы неравен- непрерывна в точке a ∈ R. Поскольку a – про-


ства извольная точка на R, функция sin непрерывна
всюду на R.
| sin x − sin a| 6 |x − a| (4.1.93) Для функции cos этот факт доказывается
| cos x − cos a| 6 |x − a| (4.1.94) аналогично, только нужно вместо неравенства
(4.1.93) применять (4.1.94).
Доказательство.
Лемма 4.1.33. Если в некоторой точке h > 0
| sin x − sin a| = (4.1.81) = синус равен нулю,
x+a x−a sin h = 0,
= 2 · cos · sin =
2 2
то h – полупериод для функций sin и cos.
x+a x−a
= 2 · cos · sin 6
2 2 Доказательство.
x−a 0
6 (4.1.91), (4.1.92) 6 2 · 1 · = |x − a|  z}|{ 
2 sin 2h = 2 · sin h · cos h = 0
cos 2h = 1 − 2 · |sin{z2 h} = 1
0
| cos x − cos a| = (4.1.82) =

x+a x−a
= −2 · sin · sin = 1 0
2 2  z }| { z }| { 
sin(x + 2h) = sin x · cos 2h + cos x · sin 2h = sin x
x+a x−a
= 2 · sin · sin 6 | {z2h} − sin x · sin
cos(x + 2h) = cos x · cos | {z2h} = cos x
2 2
1 0
x−a
6 (4.1.90), (4.1.92) 6 2 · 1 · = |x − a|
2
Предложение 4.1.34. На интервале (0, π) си-
нус положителен, а на интервале (−π, 0) – от-
Предложение 4.1.32. Функции sin и cos непре- рицателен:
рывны на R. x ∈ (0, π) =⇒ sin x > 0 (4.1.95)
Доказательство. Для любого числа a ∈ R и лю- x ∈ (−π, 0) =⇒ sin x < 0 (4.1.96)
бой последовательности xn −→ a получаем:
n→∞ Доказательство. Из-за тождества нечетности
xn −→ a (4.1.80) здесь достаточно доказать первое утвер-
n→∞ ждение. Предположим, что оно неверно, то есть

⇓ теорема 3.2.5 что для некоторого x ∈ (0, π) выполняется
xn − a −→ 0 sin x 6 0. Рассмотрим отдельно два случая: когда
n→∞
  sin x = 0, и когда sin x < 0.
вспоминаем
 определение  1) Если sin x = 0, то по лемме 4.1.33 число x
⇓ бесконечно малой
должно быть полупериодом для функций sin и
пос-ти на с.211
cos. Это невозможно, потому что x < π, то есть
|xn − a| −→ 0
n→∞ x меньше наименьшего полупериода π.
 
⇓ применяем 2) Если же sin x < 0, то выберем какое-нибудь
неравенство (4.1.93)
число ε > 0 так, чтобы выполнялись два условия:
0 6 | sin xn − sin a| 6 |xn − a| −→ 0
n→∞
  ε < 1, ε<x
теорема о двух
⇓ милиционерах 3.2.10
Из первого неравенства, в силу (4.1.70), мы по-
| sin xn − sin a| −→ 0 лучим:
n→∞
 
определение sin ε > 0
⇓ бесконечно малой
пос-ти на с. 211 То есть на отрезке [ε, x] функция sin меняет знак:
sin xn − sin a −→ 0
n→∞

sin ε > 0 > sin x
⇓ теорема 3.2.5

sin xn −→ sin a Значит, по теореме Коши о промежуточном зна-


n→∞ чении 3.3.6, в некоторой точке h ∈ (ε, x) она об-
ращается в нуль:
Мы получили, что если xn −→ a, то sin xn −→
n→∞ n→∞
sin a. Это означает, что функция f (x) = sin x sin h = 0
296 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Но тогда снова по лемме 4.1.33 получается, что ⇓


число h должно быть полупериодом для функ- π
cos = 0
ции sin, что невозможно, потому что h < x < 2
π, то есть h меньше наименьшего полупериода И, во-вторых,
π. π π
sin2 + cos2 = 1
2 | {z 2}
Предложение 4.1.35. На отрезке [0, π] коси-
0
нус строго убывает, а на отрезке [−π, 0] моно-
тонно возрастает: ⇓
2 π
sin =1
x, y ∈ [0, π], x<y =⇒ cos x > cos y 2
(4.1.97) ⇓
 
x, y ∈ [−π, 0], x<y =⇒ cos x < cos y sin π2 = 1
(4.1.98) sin π2 = −1 ← невозможно, в силу (4.1.95)


Доказательство. Заметим сначала, что из-за π
тождества четности (4.1.80) здесь достаточно до- sin = 1
2
казать только утверждение для отрезка [0, π]. 2. Заметим, что sin π4 = cos π4 :
Для него мы получаем такую цепочку: π π
π π π
sin = sin − = sin · cos −
x, y ∈ [0, π], x<y 4 2 4 | {z2} 4
1
⇓ π π π
− cos · sin = cos
x+y x−y | {z 2} 4 4
∈ (0, π), ∈ (−π, 0)
2 2 0
(отрезок [0, π] превратился в интервалы (0, π) и (−π, 0)!)
Отсюда получаем:
π π π π π π

1 = sin = sin + = 2·sin ·cos = 2·sin2
2 4 4 4 4 4
cos x − cos y = (4.1.89) = ⇓
x+y x−y 2 π 1
= −2 · sin · sin >0 sin =
4 2
| {z } | {z2 }
2

r √
<

>

0 0 π 1 2
sin = =
4 2 2
⇓ ⇓
" √ #
cos x > cos y sin π4 = 2√2
sin π4 = − 22 ← невозможно, в силу (4.1.95)
Предложение 4.1.36. Справедлива следующая ⇓

таблица значений синуса и косинуса в некото- π π 2
sin = cos =
рых характерных точках на отрезке [0, π2 ]: 4 4 2

π π π π
t 0 Предложение 4.1.37. Справедливы тожде-
√6 √4 3 2
3 2 1
cos t 1 2 0 ства:
√2 √2
1 2 3
sin t 0 2 2 2 1 sin(x + π) = − sin x (4.1.99)
cos(x + π) = − cos x (4.1.100)
 π
Доказательство. Мы покажем, как выводятся sin x + = cos x (4.1.101)
 2
значения этих функций в двух точках, оставив π
вывод для остальных точек читателю. cos x + = − sin x (4.1.102)
 2
1. Вычислим значения в точке π2 : во-первых, π
sin x − = − cos x (4.1.103)
π π  2
0 = sin π = 2 · sin · cos π
2 2 cos x − = sin x (4.1.104)
 π 2
⇓ sin − x = cos x (4.1.105)
 
sin π
=0 ← невозможно, в силу (4.1.95)  2π 
2
cos π
=0 cos − x = sin x (4.1.106)
2 2
§ 1. Элементарные функции 297
 
Доказательство. Мы докажем только первое Доказательство. Для отрезка − π2 , π2 получа-
тождество, остальные доказываются по анало- ем: h π πi
гии: x, y ∈ − , , x<y
2 2
sin(x + π) = sin x · cos
| {zπ} + cos x · sin
| {zπ} = sin x ⇓
−1 0 π π π π
x + , y + ∈ [0, π], x+ <y+
2 2 2 2

Индукцией из формул (4.1.99) и (4.1.100) вы-  π  π
водится cos x + > cos y +
2 2
Следствие 4.1.38. Справедливы тождества: ⇓

cos(πn) = cos(−πn) = (−1)n , (4.1.107)  π


sin x = (4.1.102) = − cos x + <
sin(πn) = sin(−πn) = 0. (4.1.108) 2
 π 
 < − cos y + = (4.1.102) = sin y
Предложение 4.1.39. На интервале − π2 , π2 2
косинус положителен, а на интервале π2 , 3π –  
отрицателен:
2
А для π2 , 3π
2 :

 π π  
π 3π
x∈ − , =⇒ cos x > 0 (4.1.109) x, y ∈ , , x<y
 2 2 2 2
π 3π
x∈ , =⇒ cos x < 0 (4.1.110) ⇓
2 2
π π π π
Доказательство. Здесь все следует из предло- x+ , y + ∈ (π, 2π), x+ <y+
2 2 2 2
жения 4.1.34:  π π ⇓
x∈ − ,   
2 2 π π
cos x + < cos y +
⇓ 2 2
π ⇓
x+ ∈ (0, π)
2
 π
⇓ sin x = (4.1.102) = − cos x + >
 π 2
 π 
cos x = (4.1.101) = sin x + >0
2 > − cos y + = (4.1.102) = sin y
2
И точно так же
 
π 3π
x∈ , ⋄ 4.1.18. Полученной теперь информации до-
2 2
статочно для построения графиков синуса и ко-
⇓ синуса. Эти картинки общеизвестны, однако мы
π предлагаем читателю проверить самостоятельно,
x+ ∈ (π, 2π) что, если ставить себе целью указать на графи-
2
ке интервалы монотонности и знакоопределенно-
⇓ сти, то из того, что мы уже успели доказать про
 π
cos x = (4.1.101) = sin x + <0 синус и косинус никаких других картинок полу-
2 читься не может. Для синуса график должен вы-
глядеть так:
 
Предложение 4.1.40. На отрезке − π2 ,π2 си-
нус монотонно возрастает, а на отрезке π2 , 3π
2
монотонно убывает:
h π πi
x, y ∈ − , , x < y =⇒ sin x > sin y
2 2
(4.1.111)
 
π 3π
x, y ∈ , , x < y =⇒ sin x < sin y
2 2
(4.1.112) А для косинуса так:
298 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Тангенс и котангенс. Доказательство.


• Тангенс tg и котангенс ctg определяются фор-
x, y ∈ (0, π), x<y
мулами
sin x  π  ⇓
tg x = x∈/ + πZ (4.1.113)
cos x
cos x
2 π π  π π π π
ctg x = (x ∈/ πZ) (4.1.114) x− ,y − ∈ − , , x− <y−
sin x 2 2 2 2 2 2

Предложение 4.1.41. Справедливы следующие ⇓


тождества:  π  π
tg x − < tg y −
2 2
tg(x + π) = tg x, ctg(x + π) = ctg x
(4.1.115) ⇓
 π  π   
π π
tg x − = − ctg x, ctg x − = − tg x − ctg x = tg x − < tg y − = − ctg y
2 2 2 2
(4.1.116)

tg(−x) = − tg x, ctg(−x) = − ctg x
(4.1.117) ctg x > ctg y
Доказательство. Это сразу вытекает из свойств
синуса и косинуса, например, первая формула
доказывается так: Предложение 4.1.44. На границах интерва-
лов, где tg и ctg определены, эти функции име-
sin(x + π)
tg(x + π) = = (4.1.99), (4.1.100) = ют бесконечные пределы:
cos(x + π)
− sin x sin x lim tg x = ∞, (n ∈ Z) (4.1.120)
= = = tg x x→ π2 +πn
− cos x cos x
lim ctg x = ∞, (n ∈ Z) (4.1.121)
x→πn

Предложение 4.1.42. На интервале − π2 , π2 Доказательство. Из-за π-периодичности и фор-
функция tg возрастает: мул (4.1.116), связывающих tg и ctg, здесь доста-
 π π точно рассмотреть только одну точку. Например,
x, y ∈ − , , x < y =⇒ tg x < tg y при x → π2 мы, в силу непрерывности sin и cos,
2 2
(4.1.118) получаем:
π π
Доказательство. В силу нечетности танген- sin x −→π sin = 1, cos x −→π cos =0
x→ 2 2 x→ 2 2
са (4.1.117),
 достаточно рассмотреть интервал
0, π2 . Тогда все следует из монотонности синуса

и косинуса:
 π sin x
x, y ∈ 0, , x<y tg x = −→ ∞
2 cos x x→ π2

0 < sin x < sin y, cos x > cos y > 0
⋄ 4.1.19. Для построения графиков нам теперь
⇓ не хватает нескольких значений в характерных
1 1 точках. Из таблицы для синуса и косинуса на
0 < sin x < sin y, 0< < с.296 мы прямым вычислением получаем табли-
cos x cos y
цу для тангенса и котангенса:

sin x sin y Предложение 4.1.45. Справедлива следующая
tg x = < = tg y
cos x cos y таблица значений тангенса и котангенса:

π π π π
x 0 6 4
Предложение 4.1.43. На интервале (0, π) √3 2
tg x 0 √1 1 3 6∃
функция ctg убывает: √ 3
ctg x 6∃ 3 1 √1 0
3
x, y ∈ (0, π), x<y =⇒ ctg x > ctg y
(4.1.119)
§ 1. Элементарные функции 299

Теперь можно строить графики. Для танген- Предложение 4.1.47. Функции arcsin, arccos,
са график выглядит так: arctg и arcctg имеют следующие знаки на ха-
рактерных интервалах:

arcsin x > 0, x ∈ (0, 1] (4.1.126)


arcsin x < 0, x ∈ [−1, 0) (4.1.127)
arccos x > 0, x ∈ [−1, 1) (4.1.128)
arctg x > 0, x>0 (4.1.129)
arctg x < 0, x<0 (4.1.130)
А для котангенса так: arcctg x > 0, x∈R (4.1.131)

Остается привести графики этих функций.

⋄ 4.1.20. Арксинус:
Обратные тригонометрические функции.
• Следующие правила определяют функции,
называемые соответственно арксинусом, арк-
косинусом, арктангенсом и арккотангенсом:

h π πi
t = arcsin x ⇐⇒ x = sin t & t ∈ − ;
2 2
(4.1.122)
t = arccos x ⇐⇒ x = cos t & t ∈ [0; π] (4.1.123)
 π π
t = arctg x ⇐⇒ x = tg t & t ∈ − ; ⋄ 4.1.21. Арккосинус:
2 2
(4.1.124)
t = arcctg x ⇐⇒ x = ctg t & t ∈ (0; π) (4.1.125)

Доказательство. Здесь используется теоремы о


монотонной функции на отрезке 3.3.11 и на ин-
тервале 3.3.12. Например, в случае с синусом мы
получаем вот что: по предложению
 4.1.40,
 синус
строго возрастает на отрезке − π2 ; π2 . Вдобавок
 π π
sin − = −1, sin =1
2 2
⋄ 4.1.22. Арктангенс:
поэтому по теореме 3.3.11 правило (4.1.122) опре-
деляет
 некую  функцию на отрезке [−1; 1] =
sin − π2 ; π2

Из теорем 3.3.11 и 3.3.12 мы автоматически


получаем

Предложение 4.1.46. Функции arcsin, arccos,


arctg и arcctg непрерывны и монотонны на сво-
ей области определения.

А из предложений 4.1.34 и 4.1.39 получаем ⋄ 4.1.23. Арккотангенс:


300 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

(c) Непрерывные элементарные x


функции название область определения

7→
Можно заметить, что в списке элементарных 
 x ∈ R, b N
∈ 2N−1


функций, который мы приводили на с. 277, не степенная
x 6= 0, b N
∈ − 2N−1
xb
все функции будут непрерывны (мы это уже от- функция 


x > 0, b ∈ (0, +∞) \ N
2N−1
 −N
мечали в примере 4.1.15, но без доказательства). x > 0, b ∈ (−∞, 0) \ 2N−1

Объясним теперь, почему это так.


показательная
ax x ∈ R, a > 0
функция
⋄ 4.1.24. Функция
логарифм loga x x > 0, a ∈ (0; 1) ∪ (1; +∞)
x
f (x) = 0
синус sin x x∈R

разрывна в точке x = 0. Действительно, для по- косинус cos x x∈R


следовательности
π
тангенс tg x x∈
/ 2 + πZ
1
xn = −→ 0
n n→∞ котангенс ctg x x∈
/ πZ

мы получим арксинус arcsin x x ∈ [−1; 1]

1
f (xn ) = 0 n = 0 −→ 0 6= 1 = 00 = f (0) арккосинус arccos x x ∈ [−1; 1]
n→∞

арктангенс arctg x x∈R


⋄ 4.1.25. Функция
арккотангенс arcctg x x∈R

f (x) = (−1)x
• Функции из этого списка называются
разрывна в любой точке своей области опреде- непрерывными элементарными функ-
ления. Например, для точки a = 0 можно взять циями.
последовательность

1 §2 Стандартные функции
xn = −→ 0
3n n→∞
В инженерном деле, и вообще в приложени-
ях очень редко используются какие-то сложные
для которой мы получим
функции, представляемые суммами рядов или
1
решениями уравнений (например, дифференци-
f (xn ) = (−1) 3n = −1 −→ −1 6= 1 = (−1)0 = f (0) альных). Почти всегда это функции, получаю-
n→∞
щиеся из элементарных с помощью алгебраиче-
ских операций (сумма, разность, произведение,
С другой стороны, очевидно, что некото- частное) и операции композиции. Мы будем на-
рые другие элементарные функции непрерывны. зывать такие функции стандартными (см. опре-
Полный их список дает следующая теорема (ее деление на с.306), чтобы отличать их от списка
доказательство мы оставляем читателю в каче- функций, перечисленных в § 1 этой главы и на-
стве упражнения): званных там элементарными.

Теорема 4.1.48. Следующие элементарные (a) Числовые выражения


функции (и только они) непрерывны в своей об-
ласти определения: Стандартные функции определяются с помощью
числовых выражений, которые используются за-
тем при описании формальных операций взятия
4 Напомним, что формальные теории были определены на с.79.
5 Эта тема, по-видимому, остается совершенно неразработанной, в частности, непонятно, можно ли заменить ра-
венство какими-то другими предикатами. Как следствие, в понимаемом таким образом Исчислении получается, что
есть функциональные символы, и вместе с ними и термы, но нет предикатных, и поэтому нет формул в том смысле,
как они определяются в формальных теориях (определение формулы в формальной теории было дано на с.80).
§ 2. Стандартные функции 301

производной и интеграла, и поэтому раздел ма- большие надежды внушает наметившаяся по-
тематики, изучающий числовые выражения, опе- следнее время возможность создать инфраструк-
рации над ними и их связь со стандартными туру, которая позволила бы избавить общество
функциями, логично считать частью Исчисле- от этой нагрузки.
ния (Calculus) — дисциплины о символьных вы- Очевидно, что с развитием программирова-
числениях в Анализе. В русском языке это слово ния отношение к вычислениям в математике бу-
обычно используется в связке с одним из двух дет меняться. Арифметические вычисления, ко-
прилагательных, дифференциальное или инте- торым до последней трети 20 века уделялось
гральное, в зависимости от типа решаемых задач. главное внимание в преподавании математики, с
О дифференциальном исчислении мы поговорим их сосредоточенностью на вопросе “как выразить
на с.330, а об интегральном – на с.392. в десятичных дробях результат данной последо-
С точки зрения логики на Исчисление есте- вательности операций с десятичными дробями?”
ственно глядеть, как на недостроенную фор- — ушли далеко на периферию общественного со-
мальную теорию4 . Качественное ее отличие от знания с распространением калькуляторов. Точ-
теорий, рассматривавшихся нами в главе 1, со- но так же Исчисление, концентрирующееся на
стоит в том, что предикат равенства в ней опре- задачах “как выразить в стандартных функциях
делить (внутри самого Исчисления, без необхо- результат данной последовательности операций
димости строить модель в теории вещественных со стандартными функциями?”, должно отойти
чисел) не получается5. на второй план с распространением программ,
Вопрос о том, как определить равенство чис- позволяющих решать эти задачи автоматически.
ловых выражений, чтобы превратить Исчисле- Это не будет означать, конечно, смерть школь-
ние в полноценную формальную теорию, на се- ной и университетской математики, просто надо
годняшний день, насколько известно автору, от- понимать, что круг задач, которыми она зани-
крыт.6 Хотя он не выглядит трансцендентным, мается, неизбежно будет меняться. Вычисление
ясно, что ответ на него должен быть чрезвычай- производных и интегралов, вместе с решением
но громоздким (если не появится какой-то идеи, уравнений, утратят актуальность, как утратили
позволяющей все упростить, например, сменой ее относительно недавно методы умножения и
сигнатуры). По уровню трудоемкости эта зада- деления многозначных чисел.
ча, наверное, сравнима с созданием операцион-
Эта неразработанность в настоящем и неопре-
ной системы в программировании (с той разни- деленность для будущего делает Исчисление
цей, что несколько операционных систем нынче
неблагодарной темой для учебников. Мы по-
существует и поддерживается, а Исчисление, как стараемся в своих объяснениях минимизиро-
формальная теория, пока не разработано). вать собственно рассуждения внутри Исчисле-
Это сравнение с программированием кажет- ния, как “недостроенной формальной теории”,
ся автору ключевым в выработке отношения к перенеся, насколько это возможно, формально-
этой дисциплине. Ясно, что проблему равенств в сти в Анализ. В частности, проблему равен-
Исчислении нужно как-то решать, но нужно ли ства числовых выражений мы, по установив-
заставлять школьников и студентов изучать де- шейся традиции, решаем декларацией: “выраже-
тали полученного решения, когда оно будет най- ния равны, если определяемые ими стандартные
дено, и нужно ли продолжать заставлять их зуб- функции равны” 7 .
рить “суррогатные” алгоритмы решения задач в
обход этой проблемы, как это делается сейчас, —
зависит от развития событий не только в мате-
матике. Числовые выражения. Числовые выраже-
Если удастся превратить Исчисление в (бо- ния служат главным предметом изучения в шко-
лее или менее простую) формальную теорию, ле, поэтому читателю они должны быть хорошо
то понятно, что такую науку нужно будет пре- знакомы. Грубо говоря, это конечные последова-
подавать везде, где можно, просто как доступ- тельности символов (букв, цифр, или символов
ный пример приложений математических зна- операций), которые можно записывать как ле-
ний. Поскольку это пока не получается, и в шко- вые или правые части уравнений, или которые
лах и университетах, по-прежнему, приходится определяют функции (возможно, от нескольких
учить людей дремучим методам решения урав- переменных) с помощью элементарных функций
нений и вычисления производных и интегралов, и алгебраических операций. Например, выраже-
6 Автору трудно судить о современных исследованиях в этой области, но во второй половине 20 века этой про-

блемой интересовались. В частности, известный польский математик Альфред Тарский поставил так называемую
Проблему школьных тождеств (“High school identities”), которую можно считать упрощенным вариантом проблемы
равенств в Исчислении, для частного случая, когда в сигнатуру теории включены только операции сложения, умно-
жения и возведения в степень (а в качестве модели рассматривается множество натуральных чисел N). Она оказалась
на удивление сложной и была решена в 1980 году Алексом Уилки, построившим знаменитый контрпример.
7 Связь между числовыми выражениями и стандартными функциями описывается ниже теоремой 4.2.2.
302 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

ниями будут Задание числового выражения дополняется


p следующим правилом:
a+b
25, t + 2, sin x, , x2 + y 2 .
a−b • Буквы и индексированные буквы, входящие в
Строгое определение этому понятию выглядит данное числовое выражение H должны быть
так: поделены на переменные и параметры. Это
нужно понимать так, что всякое записанное
• Числовыми выражениями называются ко- числовое выражение H должно сопровож-
нечные последовательности символов, опре- даться указанием, какие из входящих в него
деленные следующими индуктивными прави- букв и индексированных букв рассматрива-
лами: ются как переменные, а какие как парамет-
1) десятичная запись целого неотрицатель- ры.
ного числа считается числовым выраже-
нием (обозначающим обычное число из Смысл этого деления станет понятен чуть
Z+ ), позже, при определении дифференциала число-
вого выражения (мы увидим, что на переменных
2) буквы π и e считаются числовыми выра- и параметрах действие этой операции задается
жениями (обозначающими числа π и e, по-разному).
определенные выше на страницах 291 и
239), • Сложность comp H выражения H — это
3) всякая буква латинского или греческого сколько раз в нем встречаются алгебраиче-
алфавита, строчная или прописная, от- ские операции (сложение, вычитание, умно-
личная от π и e, также считается чис- жение, деление, возведение в степень) и сим-
ловым выражением (обозначающим пере- волы элементарных функций.
менную или параметр, о чем будет сказано • Число мест в выражении H — это количе-
позже): ство переменных в нем. Числовое выражение
H называется n-местным, если в нем n пере-
a, b, c, ..., x, y, z, A, B, C, ..., X, Y, Z
менных (и неважно, сколько параметров).
α, β, γ, ..., χ, ψ, ω, A, B, Γ, ..., X, Ψ, Ω;
⋄ 4.2.1. Следующие числовые выражения (с
4) если мы выбрали какую-то букву латин-
точностью до замены букв) называются элемен-
ского или греческого алфавита, отличную
тарными:
от π и e, например, a, то приписывая ей
в качестве индекса десятичную запись це-
лого неотрицательного числа, мы получим xα , sin x, cos x, tg x, ctg x,
новое полиномальное выражение: arcsin x, arccos x, arctg x, arcctg x
(4.2.132)
a0 , a1 , a2 , ..., a10 , ...
5) если F и G — числовые выражения, то чис-
Подстановка.
ловыми выражениями будут также
Теорема 4.2.1. Если G — числовое выражение,
(F ) + (G), (F ) − (G), (F ) · (G),
y — входящая в него буква (разумеется, вме-
(F )/(G), (F )(G) , log(F ) (G) сто y можно выбирать любую другую букву), и
F — какое-то другое числовое выражение, то,
(скобки могут не писаться, если это не
подставив всюду в G вместо буквы y выраже-
приводит к недоразумению);
ние (F ), мы получим новое числовое выражение,
6) если F — числовое выражение, то число- обозначаемое
выми выражениями будут также выраже-
ния, получаемые подстановкой F как ар- G , (4.2.133)
y=F
гумента под знак элементарных функций,
в частности, и называемое результатом подстановки в G
вместо буквы y выражения F .
sin(F ), cos(F ),
• Если выражение H получено из какого-то вы-
tg(F ), ctg(F ),
ражения G подстановкой выражения F ,
arcsin(F ), arccos(F ),
arctg(F ), arcctg(F ) G =H
y=F
(как и в предыдущем правиле, скобки мо-
гут не писаться, если это не приводит к то говорят, что выражение F подчинено вы-
недоразумению). ражению H (или является частью H).
§ 2. Стандартные функции 303

(b) Стандартные функции ⋄ 4.2.4. Запись


Упорядочение переменных. Ниже мы уви- xn ∈ EX(n; x).
дим, что всякое числовое выражение H опреде-
ляет некое семейство функций (от одного или означает, что в выражении xn буква n считается
многих переменных, в зависимости от числа пе- параметром, а буква x – переменной. Наоборот,
ременных, входящих в H), однако для форму- запись
лировки этого факта нужно сначала научиться xn ∈ EX(x; n).
упорядочивать переменные и параметры. означает, что здесь x считается параметром, а n
Мы будем говорить, что в числовом выра- – переменной.
жении H (или на множестве числовых выраже-
ний) задан порядок переменных, если специально ⋄ 4.2.5. Точно так же запись
оговорено, какая из переменных, входящих в H a · xn ∈ EX(a, n; x)
считается первой, какая второй, и так далее до
последней. Порядок переменных удобно записы- следует понимать, как соглашение, что в выра-
вать просто строчкой, в которой через запятую жении a · xn буква a считается первым парамет-
по порядку перечисляются все переменные, вхо- ром, буква n – вторым, а буква x – переменной.
дящие в данное выражение. Наоборот,
a · xn ∈ EX(n, a; x),
⋄ 4.2.2. Например, если в выражении xa счита-
ется, что обе буквы, x и a, являются перемен- значит, что здесь n – первый параметр, a – вто-
ными, то можно условиться, что переменная x рой, а x – переменная.
будет первой, а переменная a – второй. Это бу- ⋄ 4.2.6. Запись
дет фиксированный порядок переменных, кото-
рый записывается строчкой a · xn + y ∈ EX(a, n; x, y)

(x, a), предполагает, что здесь a считается первым па-


раметром, n – вторым, x – первой переменной, а
и он будет отличаться от другого возможного по- y – второй. Если бы мы записали
рядка,
(a, x), a · xn + y ∈ EX(a, n; y, x),
где наоборот a считается первой переменной, а x то это означало бы, что для нас, по-прежнему, a
– второй. – первый параметр, n – второй, но первой пере-
менной считается y, а второй x.
Точно так же определяется порядок парамет-
ров в числовом выражении. ⋄ 4.2.7. В качестве упражнения полезно заме-
тить, что ни при каком соглашении о параметрах
• Пусть P – упорядоченный набор параметров
и переменных (и ни при каком их упорядочении)
(например, P = (a1 , ..., am )), а V – упорядо-
не могут получиться включения
ченный набор переменных (например, можно
считать, что V = (x1 , ..., xn ) для некоторого a · xn ∈ EX(n; x),
n ∈ N). Условимся говорить, что H есть чис-
ловое выражение над упорядоченными набо- a · xn + y ∈ EX(n, a; x).
рами P и V параметров и переменных, если
в H нет никаких других параметров и пере- Семейство стандартных функций, опреде-
менных, кроме тех, что перечислены в P и ляемое числовым выражением. Если A –
V. некое множество, и каждому его элементу a ∈ A
поставлена в соответствие некая функция fa :
! 4.2.3. При этом необязательно, чтобы все па- Rn ֒→ R, то такое отображение
раметры из P и переменные из V действитель-
но содержались в выражении H, нужно только, a 7→ fa
чтобы в H не было “лишних” параметров и пе-
ременных, то есть таких, которые √ не содержатся называется семейством функций, и для такого
в P и V . Например, выражение 2 вообще не объекта используется запись
содержит переменных и параметров, но можно {fa ; a ∈ A}.
говорить, что это выражение над набором пере-
менных V = (x, y, z) и параметров (a, b). В частном случае, когда A представляет собой
некое подмножество в Rm , каждый элемент a ∈
• Множество всех числовых выражений над A будет числовой строчкой (a , ..., a ), и семей-
1 m
упорядоченными наборами параметров ство функций f тогда записывается так:
a
(a1 , ..., am ) и переменных (x1 , ..., xn ) мы будем
обозначать символом EX(a1 , ..., am ; x1 , ..., xn ). {fa1 ,...,am ; (a1 , ..., am ) ∈ A}.
304 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

Теорема 4.2.2. Всякое числовое выражение набором переменных (x1 , ..., xn ) и парамет-
H над упорядоченными наборами параметров ров (a1 , ..., am ), имеющих сложность, мень-
(a1 , ..., am ) и переменных (x1 , ..., xn ) шую некоторого числа k ∈ N. Пусть H – вы-
ражение сложности k. По определению, сре-
H ∈ EX(a1 , ..., am ; x1 , ..., xn ) ди операций, из которых составлено выраже-
ние H должна быть какая-то внешняя опера-
определяет некое семейство функций ha1 ,...,am ция (то есть последняя по времени действия).
по формуле Рассмотрим по очереди возможные вариан-
ты:
ha1 ,...,am (x1 , ..., xn ) = H. (4.2.134)
— если внешней операцией является сложе-
Доказательство. Смысл формулы (4.2.134) ние, то есть H имеет вид
нуждается в прояснении, и мы проведем его ин- H = (F ) + (G),
дукцией по сложности выражения H.
где F и G – выражения сложности < k, то
0) Пусть сначала H — выражение сложности 0,
по предположению индукции F и G опре-
то есть не содержащее ни алгебраических опе-
деляют при заданном наборе параметров
раций, ни символов элементарных функций.
(a1 , ..., am ) некоторые функции
Тогда
— либо H вообще не содержит переменных, fa1 ,...,am (x1 , ..., xn ) = F ,
и является просто собственным обозна- ga1 ,...,am (x1 , ..., xn ) = G, (4.2.135)
чением какого-то неотрицательного цело-
го числа; тогда формула (4.2.134) задает и поэтому формула
функцию ha1 ,...,am : Rn → R, которая во
всех точках равна (одному и тому же) чис- ha1 ,...,am (x1 , ..., xn ) :=
лу, описываемому выражением H; = fa1 ,...,am (x1 , ..., xn )+ga1 ,...,am (x1 , ..., xn )
— либо H представляет собой какую-то пе- определяет функцию на общей области
ременную из набора (x1 , ..., xn ) определения функций fa1 ,...,am и ga1 ,...,am :
H = xi , i = 1, ..., n; D(ha1 ,...,am ) := D(fa1 ,...,am ) ∩ D(ga1 ,...,am );

в этом случае формула (4.2.134) интерпре- — точно так же мы поступаем, если внешней
тируется как тождество операцией является вычитание или умно-
жение:
ha1 ,...,am (x1 , ..., xn ) = xi , x ∈ R, H = (F ) − (G),
определяющее функцию ha1 ,...,am : Rn → H = (F ) · (G),
R, которая в каждой точке (x1 , ..., xn ) рав- – тогда опять формулы (5.1.88) определя-
на значению переменной xi . ют некие функции, и после этого на их об-
— либо H представляет собой какой-то пара- щей области определения D(ha1 ,...,am ) :=
метр из набора (a1 , ..., am ) D(fa1 ,...,am ) ∩ D(ga1 ,...,am ) становится воз-
можным определить функцию
H = aj , i = 1, ..., n;
ha1 ,...,am (x1 , ..., xn ) :=
в этом случае формула (4.2.134) интерпре- = fa1 ,...,am (x1 , ..., xn )−ga1 ,...,am (x1 , ..., xn ),
тируется как тождество
и функцию
ha1 ,...,am (x1 , ..., xn ) = aj , x ∈ R,
ha1 ,...,am (x1 , ..., xn ) :=
определяющее функцию ha1 ,...,am Rn → R, = fa1 ,...,am (x1 , ..., xn )·ga1 ,...,am (x1 , ..., xn );
которая в каждой точке (x1 , ..., xn ) равна
значению параметра ai . — если внешней операцией является деле-
ние, то есть H имеет вид
Понятно, что во всех трех случаях областью
определения функции ha1 ,...,am является про- F
H= ,
странство Rn : G
то формулы (5.1.88) определяют некие
D(ha1 ,...,am ) = Rn .
функции, и поэтому формула
k) Предположим далее, что смысл формулы fa1 ,...,am (x1 , ..., xn )
(4.2.134) объяснен для всех выражений над ha1 ,...,am (x1 , ..., xn ) :=
ga1 ,...,am (x1 , ..., xn )
§ 2. Стандартные функции 305

определяет функцию на той части пере- то сложность F меньше k, и по предполо-


сечении областей определения fa1 ,...,am и жению индукции формула
ga1 ,...,am , где ga1 ,...,am отлична от нуля
fa1 ,...,am (x1 , ..., xn ) = F (4.2.137)
D(ha1 ,...,am ) := определяет некую функцию на подмноже-
= {(x1 , ..., xn ) ∈ D(fa1 ,...,am )∩D(ga1 ,...,am ) : стве D(fa1 ,...,am ) в Rn , и, как следствие,
ga1 ,...,am (x1 , ..., xn ) 6= 0}, (4.2.136) формула

— если внешней операцией является возведе- ha1 ,...,am (x1 , ..., xn ) :=


ние в степень, = tg fa1 ,...,am (x1 , ..., xn ),
(G) определяет функцию на множестве
H = (F ) ,

то по предположению индукции формулы D(ha1 ,...,am ) :=


(5.1.88) определяют некие функции, и как n
= (x1 , ..., xn ) ∈ D(fa1 ,...,am ) :
следствие, формула o
π
fa1 ,...,am (x1 , ..., xn ) ∈
+ πZ ; /
ha1 ,...,am (x1 , ..., xn ) := 2
= fa1 ,...,am (x1 , ..., xn )ga1 ,...,am (x1 ,...,xn) — если внешней операцией является вычис-
ление котангенса,
определяет функцию на множестве8
H = ctg(F ),
n
D(u) := (x1 , ..., xn ) ∈ D(fa1 ,...,am )∩D(ga1 ,...,am ) : то сложность F меньше k, и по предполо-
жению индукции формула (4.2.137) опре-
fa1 ,...,am (x1 , ..., xn ) > 0 ∨ деляет некую функцию на подмножестве

∨ fa1 ,...,am (x1 , ..., xn ) = 0 & D(fa1 ,...,am ) в Rn , и, как следствие, форму-
 ла
& ga1 ,...,am (x1 , ..., xn ) > 0 ∨
 ha1 ,...,am (x1 , ..., xn ) :=
∨ fa1 ,...,am (x1 , ..., xn ) < 0 & = ctg fa1 ,...,am (x1 , ..., xn ),
Z o определяет функцию на множестве
& ga1 ,...,am (x1 , ..., xn ) ∈ ,
2N − 1
— если внешней операцией является взятия D(ha1 ,...,am ) :=
n
логарифма, = (x1 , ..., xn ) ∈ D(fa1 ,...,am ) :
o
H = log(F ) (G), fa1 ,...,am (x1 , ..., xn ) ∈
/ πZ ;
то по предположению индукции формулы — если внешней операцией является вычис-
(5.1.88) определяют некие функции, и как ление арксинуса,
следствие, формула
H = arcsin(F ),
ha1 ,...,am (x1 , ..., xn ) :=
то сложность F меньше k, и по предполо-
= logfa1 ,...,am (x1 ,...,xn) ga1 ,...,am (x1 , ..., xn ) жению индукции формула (4.2.137) опре-
деляет некую функцию на подмножестве
определяет функцию на множестве9 D(fa1 ,...,am ) в Rn , и, как следствие, форму-
ла
D(u) :=
= {(x1 , ..., xn ) ∈ D(fa1 ,...,am )∩D(ga1 ,...,am ) : ha1 ,...,am (x1 , ..., xn ) :=
fa1 ,...,am (x1 , ..., xn ) > 0 & = arcsin fa1 ,...,am (x1 , ..., xn ),
& fa1 ,...,am (x1 , ..., xn ) 6= 1 & определяет функцию на множестве
& ga1 ,...,am (x1 , ..., xn ) > 0},
D(ha1 ,...,am ) :=
— если внешней операцией является вычис- n
ление тангенса, = (x1 , ..., xn ) ∈ D(fa1 ,...,am ) :
o
H = tg(F ), fa1 ,...,am (x1 , ..., xn ) ∈ [−1, 1] ;
8 См. объяснение на с. 278 по поводу условий существования выражения ab .
9 См. аналогичное объяснение на с. 288 по поводу loga x.
306 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

— если внешней операцией является вычис- Для всякого набора параметров (a1 , ..., am ) ∈
ление арккосинуса, Rm область определения D(fa1 ,...,am ) функ-
ции fa1 ,...,am называется областью допу-
H = arccos(F ), стимых значений переменных выражения
F (при заданных значениях параметров
то сложность F меньше k, и по предполо- (a1 , ..., am )) и обозначается Da1 ,...,am (F ):
жению индукции формула (4.2.137) опре-
деляет некую функцию на подмножестве Da1 ,...,am (F ) := D(fa1 ,...,am ). (4.2.138)
D(fa1 ,...,am ) в Rn , и, как следствие, форму-
ла В частном случае, когда параметры отсут-
ствуют, используется обозначение
ha1 ,...,am (x1 , ..., xn ) :=
= arccos fa1 ,...,am (x1 , ..., xn ), D(F ) := D(f ),

определяет функцию на множестве и это множество называется областью допу-


стимых значений переменных выражения F
D(ha1 ,...,am ) := (без параметров).
n • Числовое выражение F называется непре-
= (x1 , ..., xn ) ∈ D(fa1 ,...,am ) : рывным, если оно составлено из выраже-
o ний, определяющих непрерывные элементар-
fa1 ,...,am (x1 , ..., xn ) ∈ [−1, 1] ; ные функции (см. определение на с.300).
— наконец, если внешней операцией являет- Рассмотрим примеры.
ся какая-нибудь из оставшихся тригоно-
метрических функций, то есть H имеет ⋄ 4.2.8. Выражение
вид 1
sin(F ), cos(F ), arctg(F ), arcctg(F ) x
определяет стандартную функцию одного пере-
то, как и в предыдущих случаях, фор- менного
мула (4.2.137) определяет некую функ- 1
u(x) = .
цию на подмножестве D(fa1 ,...,am ) в Rn , и x
стандартные функции, порожденные эти- В соответствии с правилом (4.2.136), ее областью
ми выражениями, определяются форму- определения является множество
лами
 
1
ha1 ,...,am (x1 , ..., xn ) := D = {x ∈ R : x 6= 0} = R \ {0}.
x
= sin fa1 ,...,am (x1 , ..., xn ),
ha1 ,...,am (x1 , ..., xn ) := ⋄ 4.2.9. Выражение
= cos fa1 ,...,am (x1 , ..., xn ), 1
,
ha1 ,...,am (x1 , ..., xn ) := x + y
= arctg fa1 ,...,am (x1 , ..., xn ), при упорядочении переменных (x, y), определяет
ha1 ,...,am (x1 , ..., xn ) := стандартную функцию двух переменных
= arcctg fa1 ,...,am (x1 , ..., xn ),
1
f (x, y) =
x+y
причем считается, что они определены в В соответствии с тем же правилом (4.2.136), ее
точности там же, где определена функция областью определения является множество
fa1 ,...,am :  
1
D(ha1 ,...,am ) := D(fa1 ,...,am ). D = {(x, y) : x + y 6= 0}.
x+y

⋄ 4.2.10. Выражения
• Семейство функций fa1 ,...,am : Rn ֒→ R, 1 √ √
(a1 , ..., am ) ∈ Rm , называется стандартным, , x − 1 + −1 − x
0
если оно определяется некоторым числовым
выражением F : определяют пустую функцию, потому что об-
ласть допустимых значений переменных у них
fa1 ,...,am (x1 , ..., xn ) = F . пуста.
§ 2. Стандартные функции 307

⋄ 4.2.11. Стандартная функция ⋄ 4.2.14. Доказанное нами выше тождество


(4.1.28), √
u(α, x) = xα .
|x| = x2 ,
(здесь выбрано упорядочение переменных α, x)
означает, между прочим, что функция модуль,
описывается в аксиоме степеней на с.278. Ее об-
определенная формулой (3.1.5), является стан-
ласть определения, или, что то же самое, область
дартной.
допустимых значений переменных в выражении
xα , описана на с.278: ⋄ 4.2.15. Функция сигнум, определяемая прави-
 лом (
D(xα ) = (α; x) ∈ R2 : x > 0 ∨ 1, x>0
sgn x =
−1, x < 0
∨ (x = 0 & α > 0) ∨
 
Z  является стандартной, потому что совпадает со
∨ x<0&α∈ . стандартной функцией
2N − 1
x
Эквивалентно ее можно описать формулой sgn x =
 |x|
Z+
D(xα ) = (α; x) ∈ R2 : α ∈ ∨ ⋄ 4.2.16. Функции из семейства
2N − 1
 N  (
∨ α∈− & x 6= 0 ∨ 1, x > α
2N − 1 fα (x) =
  0, x < α
N
∨ α ∈ (0, +∞) \ &x>0 ∨
2N − 1 являются стандартными, в силу формулы

−N
∨ α ∈ (−∞, 0) \ &x>0 .  
2N − 1 0, x < α 1 + sgn(x − α)
= (4.2.139)
1, x > α 2
⋄ 4.2.12. Стандартная функция
u(a, x) = loga x ⋄ 4.2.17. Функции из семейства
(
(здесь выбрано упорядочение переменных a, x) 0, x < α
описана на с.288. Ее область определения, или, fα (x) =
1, x > α
что то же самое, область допустимых значе-
ний переменных в выражении loga x, описывает- являются стандартными, в силу формулы
ся формулой
 
1, x < α 1 − sgn(x − α)
2
D(loga x) = {(a; x) ∈ R : = (4.2.140)
0, x > α 2
a ∈ (0; 1) ∪ (1; +∞) & x > 0}
! 4.2.18. В частности, для случая положитель-
⋄ 4.2.13. Для выражения ной и отрицательной полупрямой формулы вы-
1 глядят так:
log2 x  
0, x < 0 1 + sgn x
область допустимых значений переменной опре- = (4.2.141)
1, x > 0 2
деляется условиями
 
x>0 1, x < 0 1 − sgn x
= (4.2.142)
0, x > 0 2
(для того, чтобы существовал log2 x) и
⋄ 4.2.19. Функции из семейства
log2 x 6= 0
(
(для того, чтобы можно было делить на log2 x). 1, x ∈ (α, β)
fα,β (x) =
Поскольку эти условия должны быть выполне- 0, x ∈/ [α, β]
ны оба сразу, их нужно объединить в систему,
решая которую получим ответ: являются стандартными, в силу формулы
     
x>0 x>0 1, x ∈ (α, β)
⇐⇒ ⇐⇒ =
log2 x 6= 0 0 < x 6= 1 0, x ∈ / [α, β]
⇐⇒ x ∈ (0, 1) ∪ (1, +∞) 1 + sgn(x − α) 1 + sgn(x − β)
= − (4.2.143)
Множество (0, 1) ∪ (1, +∞) будет областью допу- 2 2
стимых значений переменной в этом выражении. .
308 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

⋄ 4.2.20. Всякая функция вида Приведенные числовые выражения и при-


веденные стандартные функции.
fα,β (x) = 1, x ∈ (α, β),
• Условимся называть числовое выражение H
(то есть определенная на заданном интервале приведенным, если в его построении не участ-
(α, β) и равная на нем единице) является стан- вовали операции перехода от F и G к (F )(G)
дартной, потому что получается из какой-то или logF G. Соответствующее семейство стан-
функции предыдущего примера возведением в дартных функций
степень −1. Для бесконечных интервалов фор-
мулы выглядят так: ha1 ,...,am (x1 , ..., xn ) = H

 2 мы также будем называть приведенным.


1, x > α = , (4.2.144)
1 + sgn(x − α)
⋄ 4.2.23. Выражение xx не является приведен-
 ным, как и функция
2
1, x < α = (4.2.145)
1 − sgn(x − α) h(x) = xx .
в частности, для случая положительной и отри-
цательной полупрямой, Для положительных значений переменной x эту
функцию можно представить как приведенную,
 2
1, x > 0 = (4.2.146) потому что функция
1 + sgn x
w(x) = ex·ln x
 2
1, x < 0 = (4.2.147) (определенная приведенным выражением ex·ln x )
1 − sgn x
будет совпадать с h при x > 0:
А, для конечных интервалов — так:
x
 h(x) = xx = eln x = ex·ln x = w(x).
1, x ∈ (α, β) =
 −1 Но функции h и w формально различны, потому
1 + sgn(x − α) 1 + sgn(x − β)
= − что у них области определения разные: функция
2 2
h, например, определена в точке −1, в отличие
(4.2.148)
от функции w:
⋄ 4.2.21. Из предыдущего примера следует, что 1
если нам дана некая стандартная функция f , h(−1) = (−1)−1 = = −1.
−1
то умножая ее на стандартную функцию вида
(4.2.148), где интервал (α, β) лежит в области • Каждому числовому выражению H можно
определения f , мы получаем стандартную функ- поставить в соответствие некое новое число-
цию, определенную строго на (α, β), и совпадаю- вое выражение Ĥ, называемое приведением
щую с f на этом интервале: числового выражения H, которое получает-
  ся заменой в H всех фрагментов вида (F )(G)
f (x), x ∈ (α, β) = f (x) · 1, x ∈ (α, β) на фрагменты вида e(G)·(F ) , а фрагментов ви-
F
да logF G на фрагменты lnln G . Получающееся
Таким образом, ограничение стандартной функ-
ции на любой интервал (возможно, бесконеч- при этом семейство стандартных функций ĥ,
ный) также будет стандартной функцией. порожденное выражением Ĥ,
В частности, функция
ĥa1 ,...,am (x1 , ..., xn ) = Ĥ
1 1 
x , x > 0 = x · 1, x > 0 называется приведением семейства h, порож-
денного выражением H.
тоже является стандартной.
⋄ 4.2.24. В примере 4.2.23 приведением выраже-
⊲ 4.2.22. Проверьте, что для любых стандарт- ния xx является выражение ex·ln x ,
ных функций f1 ,...,fk и любого набора непересе-
кающихся интервалов (α1 , β1 ),...,(αk , βk ), функ- cx = ex·ln x .
x
ция, определенная правилом
  Соответственно, приведением функции h явля-
f1 (x), x ∈ (α1 , β1 )  ется функция w:
f (x) = ... ĥ = w.
 
fk (x), x ∈ (αk , βk )
Понятно, что здесь h не совпадает со своим при-
также будет стандартной. ведением.
§ 2. Стандартные функции 309

⋄ 4.2.25. Бывает все же так, что при приведе- 2) limn→∞ log2 n = +∞ (здесь тоже рассто-
нии стандартная функция не меняется. Напри- яние между соседними точками последова-
мер, функция тельности убывает);
3) limn→∞ log3 n1 = −∞;
h(x) = logx sin x 2
4) limn→∞ (−n 3 ) = −∞;
при приведении превращается в функцию 5) limn→∞ (−1)n · n = ∞.
ln sin x ⊲ 4.2.29. Какие из последовательностей явля-
ĥ(x) = ,
ln x ются бесконечно малыми, а какие – бесконечно
которая имеет ту же область опреджеления, что большими?
и h, и совпадает с h во всех точках этого множе- 1) xn = √1
n
ства. √
2) xn = n

(c) Стандартные функции в прой- ⋄ 4.2.30. Проверьте, что следующие последова-


тельности ограничены:
денных темах
Добавление стандартных функций к общему xn = sin n, xn = cos n, xn = arctg n.
списку объектов, рассматриваемых в матема- Какие из них сходятся (то есть имеют конечный
тическом анализе, резко расширяет возможно- предел)?
сти иллюстрировать идеи этой дисциплины. В
этом параграфе мы приведем серию таких иллю- ⊲⊲ 4.2.31. Найти пределы
страций к двум основным пройденным на этот sin n n+5 n + arctg n
момент темам: последовательности и пределы. lim , lim , lim ,
n→∞ n n→∞ n + sin n n→∞ n − cos n
Одновременно здесь будут доказаны некоторые
утверждения, которые понадобятся затем в ил- Последовательности, заданные рекуррент-
люстративном материале последующих глав, в но.
частности формулы первого и второго замеча-
тельных пределов. ⋄ 4.2.32. Покажем, что последовательность, за-
данная рекуррентно

Числовые последовательности, определяе- x1 = 0, xn+1 = 6 + xn
мые стандартными функциями
сходится, и найдем ее предел.
Примеры последовательностей, рассматривав- 1. Вычислим сначала несколько первых эле-
шиеся в главе 3, полезно дополнить следующими, ментов последовательности {xn }, и нарисуем
определяемыми с помощью стандартных функ- картинку:
ций.

Предел последовательности.
⊲⊲ 4.2.26. Какими должны быть величины α, β,
чтобы почти все элементы последовательности
xn лежали в интервале (α; β)?
1) xn = cos 2πn
3
(Ответ: α < − 12 , β > 1)
2. Заметим, что все числа {xn } неотрицатель-
2) xn = sin 2πn
3 ны (это можно доказать отдельно по индукции):
√ √
3 3
(Ответ: α < − 2 , β> 2 )
xn > 0
3) xn = cos πn
3
(Ответ: α < −1, β > 1) 3. Из картинки видно, что на первых несколь-
4) xn = sin πn ких элементах {xn } наша последовательность
3 √ √
(Ответ: α < − 3
2 , β> 3
2 )
неубывает. Попробуем доказать, что она неубы-
вает всегда:
⊲⊲ 4.2.27. Доказать что xn 6 xn+1 (4.2.149)
1) 0 6= limn→∞ sin πn
3 Поймем сначала, что означает это неравенство:
⊲⊲ 4.2.28. Доказать что используем, что xn > 0
√ ↓
1) limn→∞ n = +∞ (здесь расстояние между √
соседними точками последовательности убы- xn 6 xn+1 ⇔ xn 6 6 + xn ⇔
вает); ⇔ x2n 6 6 + xn ⇔ x2n − xn − 6 6 0 ⇔
310 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

⇔ (xn + 2)(xn − 3) 6 0 ⇔ 2) x1 = 3, xn+1 = √4xn2 ;


| {z } 2+ 2xn −4
↑ √
делим на xn + 2;
3) x1 = 9, xn+1 = 2 xn ;

и, поскольку xn + 2 > 0 4) x1 = 1, xn+1 = 3 xn ;
знак неравенства не меняется
⇔ xn − 3 6 0 ⇔ xn 6 3 5) xn+1 = √10xn2 , x1 = 6
5+ 2xn −25

xn 3 2

Теперь докажем, последнее неравенство: 6) xn+1 = , x1 = 1.
9+x4n

xn 6 3 (4.2.150)
Подпоследовательности.
Это делается математической индукцией. ⊲⊲ 4.2.34. Является ли данная последователь-
a) Сначала проверяем наше неравенство при ность {yk } подпоследовательностью последова-
n = 1: тельности {xn }? (Если да, то указать соответ-
x1 = 0 6 3 ствующую последовательность индексов {nk }.)
b) Предполагаем, что оно верно при n = k: √
1) xn = n, yk = k
xk 6 3 (4.2.151) ⊲⊲ 4.2.35. Для данной последовательности {xn }
укажите какую-нибудь сходящуюся подпоследо-
c) Доказываем, что тогда оно будет верно при вательность {x }, если она существует.
nk
n = k + 1.
2πn
xk+1 6 3 (4.2.152) 1) xn = cos 3
Действительно, ⊲⊲ 4.2.36. Проверьте с помощью критерия Коши
√ сходимость последовательностей:
xk+1 6 3 ⇔ 6 + xk 6 3 ⇔
1) xn = sin πn
4 ;
⇔ 6 + xk 6 9 ⇔ xk 6 3
2) xn = cos πn
7 ;
а последнее неравенство выполняется в силу 3) xn = arctg(−1)n .
(4.2.151). Таким образом, получилось что из
(4.2.151) следует (4.2.152), а это нам и нужно бы- Функции, заданные как пределы после-
ло. довательностей. Следующая серия упражне-
Итак, мы доказали (4.2.150), а значит и рав- ний может быть полезна в теме “предел после-
носильное ему условие (4.2.149). Эти неравенства довательности”, хотя подробно эти примеры мы
означают, что {xn } неубывает и ограничена свер- разбираем ниже в теме “поточечная сходимость”
ху. Значит, по теореме Вейерштрасса 3.2.11 она (начиная со страницы 529).
имеет предел. Обозначим его буквой c:
⊲⊲ 4.2.37. Постройте графики следующих функ-
lim xn = c ций:
n→∞
1) f (x) = limn→∞ xn
и заметим, что c > 0, поскольку xn > 0 (по тео- 1
реме 3.2.8 о переходе к пределу в неравенстве). 2) f (x) = limn→∞ 1+x n

Тогда из формулы xn+1 = 6 + xn мы получаем 3) f (x) = limn→∞ xn − xn+1 ;
x−n −1
(xn+1 )2 = 6 + xn 4) f (x) = limn→∞ x−n +1 ;

n
5) f (x) = limn→∞ 1 + x2n
откуда q
6) f (x) = limn→∞ n
x2 + n12 .
c2 = lim (xn+1 )2 = lim (6 + xn ) = 6 + c
n→∞ n→∞ 7) f (x) = limn→∞ nx
nx −n−x
То есть c удовлетворяет квадратному уравнению 8) f (x) = limn→∞ nx +n−x
x3 nx −n−x
c2 = 6 + c 9) f (x) = limn→∞ nx +n−x
x
−1
10) f (x) = limn→∞ arcsin nnx +1 .
решая которое (с учетом, что c > 0), мы получа- 2n
ем c = 3. 11) f (x) = limn→∞ cos x;
Ответ: limn→∞ xn = 3 12) f (x) = limn→∞ (sin2n x − cos2n
x);
x
13) f (x) = limn→∞ 1+(2 sin x)2n ;
⊲⊲ 4.2.33. Докажите, что последовательность,
заданная рекуррентно сходится, и найдите ее 14) f (x) = limn→∞ arctg(nx);
предел: 15) f (x) = limn→∞ x · arctg(n · ctg x);
p
1) x1 = 1, xn+1 = xn (6 − xn ); 16) f (x) = limn→∞ x2 · arctg(x2n );
§ 2. Стандартные функции 311

17) f (x) = limn→∞ arctg nx ; Принцип подстановки. Во-вторых, нужно


2 −nx
−2 nx помнить, что если функция непрерывна, то по
18) f (x) = limn→∞ 2−nx +2nx ; критерию непрерывности 3.4.7 ее предел равен
x+x2 2nx
19) f (x) = limn→∞ 1+2nx ;
ее значению в точке:
nx
−3nx
20) f (x) = limn→∞ x2
2nx +3nx ; Теорема 4.2.3 (принцип подстановки).
21) f (x) =
n sin x
limn→∞ 2 2n sin−2
−n sin x
cos x
; Пусть G – непрерывная стандартная функция,
x +2−n sin x
определенная в некоторой окрестности точки
2n cos x −2−n cos x sin x
22) f (x) = limn→∞ 2n cos x +2−n cos x ; a. Тогда предел функции G в точке x = a суще-
log2 (1+2nx ) ствует и равен ее значению в этой точке:
23) f (x) = limn→∞ log (1+2n ) .
2
∃ lim G(x) = G(a).
x→a
Вычисление пределов со стандартными
функциями Рассмотрим примеры.

Рассмотрим теперь вопрос, как вычисляются ⋄ 4.2.39. Вычислить предел


пределы стандартных функций: √
x + x2
lim
x→4 1 + x
lim G(x) =?
x→a
Решение:

Существование предела. Прежде всего, ко- x + x2
нечно, нужно понимать, что предел существует lim = (подстановка) =
x→4 1 + x
не всегда. √
4 + 42 2 + 16 18
= = =
⋄ 4.2.38. Покажем что функция f (x) = sin 1 не 1+4 5 5
x
имеет предела в точке x = 0: Число 18
и будет ответом.
5

1 ⋄ 4.2.40. Найти предел


∄ lim sin
x→0 x
lim (x2 − 2x + 3)
x→1
Возьмем сначала последовательность аргумен-
тов Решение:
1
xn = π −→ 0
2 + 2πn n→∞ lim (x2 − 2x + 3) = (подстановка) =
x→1
тогда мы получим = 12 − 2 · 1 + 3 = 1 − 2 + 3 = 2
1 π 
f (xn ) = sin = sin + 2πn = 1 −→ 1 ⊲⊲ 4.2.41. Вычислите пределы:
xn 2 n→∞
1) limx→π/2 sin x
С другой стороны, если взять 2) limx→0 arctg x − 1 + x3

x+1
1 3) limx→0 arcsin x−4
xn = π −→ 0
− 2 + 2πn n→∞ x2 −3
4) limx→√3 x4 +x2 +1 ,
то мы получим
Вычисление упрощением. Обсудим теперь
1  π 
f (xn ) = sin = sin − + 2πn = −1 −→ −1 ситуацию, когда, по-прежнему, требуется найти
xn 2 n→∞ предел
lim G(x) =?
Таким образом, мы получаем, что если взять од- x→a

ну последовательность аргументов xn −→ 0, то но функция G(x) не определена в точке x = a


n→∞
соотвествующая последовательность f (xn ) будет (хотя, например, определена слева и справа от
стремиться к одному числу (A = 1), а если взять a). Тогда говорят, что имеется так называемая
другую последовательность xn −→ 0, то f (xn ) неопределенность, и алгоритм действий в таких
n→∞ случаях состоит в том, чтобы подобрать новую
будет стремиться к другому числу (A = −1).
функцию F (x), которая совпадала бы с G(x)
Это означает, что функция f (x) = sin x1 не вблизи точки a, и при этом была бы непрерывной
имеет предела в точке x = 0, потому что иначе в точке a.
f (xn ) должно было бы стремиться к этому кон- Зрительно изобразить это руководство мож-
кретному пределу A, независимо от того, какую но так:
берешь последовательность xn −→ 0.
n→∞
312 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

lim G(x) = ... Поэтому нужны какие-то преобразования. В


x→a
подбираем функцию F (x)
! примерах с корнями, как этот, в качестве такого
совпадающую с G(x) преобразования можно использовать домноже-
... = вблизи точки a = ...
и непрерывную в точке a
ние на сопряженный радикал.
Под этим понимается вот что. В √ числите-
... = lim F (x) = F (a)
x→a ле
√ имеется иррациональное выражение 1 + x−
1 − x, называемое радикалом. Подберем такое
Проиллюстрируем это на примерах. выражение, которое при умножении на него
⋄ 4.2.42 (упрощение + сокращение). Найти “уничтожает корни”. Оно называется сопряжен-
предел ным
√ радикалом,
√ и в нашем случае имеет вид
 
1 2 1 + x + 1 − x. Помножим числитель и знаме-
lim − 2 натель дроби на сопряженный радикал:
x→1 1 − x 1−x
√ √
При подстановке возникает неопределенность: 1+x− 1−x
lim =
  x→0 x
1 2 1 2 √ √ √ √
lim − 2
= − =? ( 1 + x − 1 − x) · ( 1 + x + 1 − x)
x→1 1 − x 1−x 0 0 = lim √ √ =
x→0 x · ( 1 + x + 1 − x)
Значит, нужны преобразования. Попробуем √ 2 √ 2
1+x − 1−x
упростить наше выражение: = lim √ √ =
x→0 x · ( 1 + x + 1 − x)
 
1 2 (1 + x) − (1 − x)
lim − = = lim √ √ =
x→1 1 − x 1−x 2 x→0 x · ( 1 + x + 1 − x)
  2x
1 2 = lim √ √ =
= lim − = x→0 x · ( 1 + x + 1 − x)
x→1 1 − x (1 − x)(1 + x)
1+x−2 x−1 2
= lim = lim = = lim √ √ = (подстановка) =
x→1 (1 − x)(1 + x) x→1 (1 − x)(1 + x) x→0 1+x+ 1−x
−1 −1 2 2
= lim = lim = = √ √ = =1
x→1 1 + x x→1 1 + x 1+0+ 1−0 1+1
−1 1 В следующем примере снова используется со-
= (подстановка) = =−
1+1 2 пряженный радикал.
⋄ 4.2.43 (разложение на множители). Найти ⋄ 4.2.45. Вычислить предел
предел √3
1 + x2 − 1
x2 − 1 lim
lim x→0 x2
x→−1 x2 − x − 2
При подстановке имеем неопределенность:
Здесь возникает неопределенность: √ √
3
1 + x2 − 1 3
1+0−1 0
2
x −1 1−1 0 lim 2
= =
lim = = =? x→0 x 0 0
x→−1 x2 − x − 2 1+1−2 0
Значит нужны преобразования, которые здесь
Это означает, что необходимы преобразования. В опять состоят в умножении на сопряженный ра-
данном случае они состоят в том, что числитель дикал. В нашем √ примере радикалом является
3
и знаменатель нужно разложить на множители, выражение 1 + x2 − 1. Сопряженный же ради-
после чего сократить дробь: кал – то есть выражение, которое при умноже-
нии на наш радикал “сокращает корни” – имеет
√ 2 √
x2 − 1 (x − 1)(x + 1) вид 3 1 + x2 + 3 1 + x2 + 1. Умножим на него
lim = lim =
x→−1 x2 − x − 2 x→−1 (x − 2)(x + 1) числитель и знаменатель:
x−1 −1 − 1 2 √3
= lim = (снова подстановка) = = 1 + x2 − 1
x→−1 x − 2 −1 − 2 3 lim =
x→0 x2  
⋄ 4.2.44 (использование сопряженного ра- √ √ √
( 3 1 + x2 − 1) ( 3 1 + x2 )2 + 3 1 + x2 + 1
дикала). Вычислить предел = lim   =
x→0
x 2 (√ 3
1 + x
2 √
2 ) + 3 1 + x2 + 1
√ √
1+x− 1−x
lim 1 + x2 − 1
x→0 x = lim  √ 2 √  =
x→0 2 3
x 1 + x2 + 3 1 + x2 + 1
При подстановке получается неопределенность:
√ √ x2
1+x− 1−x 0 = lim  √  2 √  =
x→0 2 3
lim = x 1 + x2 + 3 1 + x2 + 1
x→0 x 0
§ 2. Стандартные функции 313

1 Решение:
= lim √ 2 √ =
x→0 3
1+x 2 + 3 1 + x2 + 1
1 cos2 x − 1 cos x = y,
= (подстановка) = √ 2 √ = lim = y −→ 1 =
3 x→0 cos2 x + 2 cos x − 3
1+0 + 31+0+1 x→0

1 1 y2 − 1 (y − 1)(y + 1)
= = = lim = lim =
1+1+1 3 y→1 y 2 + 2y − 3 y→1 (y − 1)(y + 3)
y+1 2 1
⊲⊲ 4.2.46. Найти пределы = lim
y→1 y + 3
= =
4 2
x2 −5x+6
1) limx→2 x2 −2x ,
√ ⋄ 4.2.50. Вычислить предел
2 −1
2) limx→0 1+x x2
p 
√ lim 1 + x2 − x
1+x2 −1
3) limx→0 √16+x 2 −4
x→+∞

3

3
4) limx→0 1+x− x
1−x Решение:

x−1
5) limx→1 √
3 x−1 p  x = y1 , y = x1

1−x−3
lim 1 + x2 − x = y −→ 0 + 0 =
6) limx→−8 2+ √ x→+∞
3 x x→+∞
r 
1 1
= lim 1+ 2 − =
Замена переменной под знаком предела. y→0+0 y y
В следующих примерах используется теорема !
1 p 2 1
3.4.9 о замене переменной под знаком предела. = lim p y +1− =
y→0+0 y 2 y
⋄ 4.2.47. Найти предел  
используем
p тождество
= =
√ 2
y = |y|
x−4  p 
lim √ √ 1 1
x→16 x− 4x−2 = lim y2 + 1 − =
y→0+0 |y| y
 
Решение: y → 0 + 0,
= значит y > 0, =
√ поэтому |y| = y
√ 4
x = y, x = y 4  p  p
x−4 1 1 y2 + 1 − 1
lim √ √ = y −→ 4 = = lim 2
y +1− = lim =
x→16 x− 4 x−2 x→16 y→0+0 y y y→0+0 y
y 6= 4 при x 6= 16 p p
2
  ( y 2 + 1 − 1)( y 2 + 1 + 1)
y −4 0 (y − 2)(y + 2) = lim p =
= lim 2 = = lim = y→0+0 y( y 2 + 1 + 1)
y→4 y − y − 2 0 y→4 (y − 2)(y + 1)
y+2 4+2 6 y2 + 1 − 1 y2
= lim = = = lim p = lim p =
y→0+0 y( y 2 + 1 + 1) y→0+0 y( y 2 + 1 + 1)
y→4 y + 1 4+1 5
y
⋄ 4.2.48. Найти предел = lim p =
y→0+0 2
y +1+1
√ y
x−1 = lim p = (подстановка) =
lim √ y→0+0 y2 + 1 + 1
x→1 3
x−1
0
= √ =0
Решение: 0+1+1
√ ⋄ 4.2.51. Вычислить предел
√ 6
x = y, x = y 6
x−1 y −→ 1
lim √ = x→1
= x
x→1 3
x−1 lim √
y 6= 1 при x 6= 1 x→−∞ 2
x +5
 
y3 − 1 0 Решение:
= lim 2 = =
y→1 y − 1 0
(y − 1)(y 2 + y + 1) y2 + y + 1 x x = y1 , y = x1
= lim = lim = lim √ = y −→ 0 − 0 =
y→1 (y − 1)(y + 1) y→1 y+1 x→−∞ 2
x +5 x→−∞
1+1+1 3 1 1
= = y y
1+1 2 = lim q = lim q =
y→0−0 1 y→0−0 1
y2 +5 +5 y2
⋄ 4.2.49. Найти предел используем
1
2
cos x − 1 = lim py = тождество
p =
lim y→0−0 √1 2 1 + 5y 2 y 2 = |y|
x→0 cos2 x + 2 cos x − 3 y
314 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

1  
y → 0 − 0, ⇓ (теорема 3.2.10)
= lim 1
py = значит y < 0, =
y→0−0
|y| 1 + 5y 2 поэтому |y| = −y sin xn
−→ 1.
1 xn n→∞
y 1
= lim 1
p = lim p = Это верно для всякой последовательности
y→0−0 1 + 5y 2 y→0−0 − 1 + 5y 2
−y xn −→ 0, xn > 0, значит
1 n→∞
= √ = −1
− 1+5·0 sin x
lim =1
x→+0 x
⊲⊲ 4.2.52. Найти пределы
sin2 x−sin x−2 Отсюда уже следует, что
1) limx→− π2 sin3 x+1
23x+2 −3·2x sin x t = −x sin(−t)
2) limx→+∞ 1−23x+1 lim = = lim =
23x+2
−3·2 x x→−0 x t → +0 t→+0 −t
3) limx→−∞ 1−23x+1
√ − sin t sin t
1+sin x−1 = lim = lim =1
4) limx→0 sin x t→+0 −t t→+0 t

1+9x
5) limx→+∞ 1+3 x Вместе эти равенства дают (4.2.153).

1+9x
6) limx→−∞ 1+3x Обсудим теперь применения первого замеча-
x
−1
7) limx→0 16
8x −1
тельного предела.
√ √ 
8) limx→∞ x2 + 1 − x2 − 1 ⋄ 4.2.53. Найти предел

9) limx→∞ x( x2 + 1 − x) sin 2x
2
2x√ −3x−4 lim
10) limx→∞ x4 +1
x→0 x

11) limx→+∞ q √x √ Здесь можно сделать замену переменных, после
x+ x+ x чего наш предел сведется к первому замечатель-
ному:
Первый замечательный предел. При вы-
y
числении пределов с тригонометрическими sin 2x 2x = y, x = 2
lim = y −→ 0 =
функциями оказывается полезным следующий x→0 x x→0
y 6= 0 при x 6= 0
факт.
2 sin y sin y
= lim = 2 lim = 2·1 =2
Теорема 4.2.4. y→0 y y→0 y

sin x ⋄ 4.2.54.
lim =1 (4.2.153)
x→0 x
1 1
= y, x =
1 x y
• Это равенство называется первым за- lim x · sin = y −→ 0
x→∞
=
x→∞ x y 6= 0 при любом x
мечательным пределом.
sin y
Доказательство. Пусть сначала = lim =1
y→0 y
xn −→ 0, xn > 0 ⋄ 4.2.55.
n→∞
tg x sin x sin x 1
Почти все xn лежат в интервале (0; π2 ), поэтому lim = lim = lim · lim =
x→0 x x→0 x cos x x→0 x x→0 cos x
для них из тройного неравенства (4.1.70) мы по-
лучаем цепочку: = 1·1 =1

⋄ 4.2.56.
0 < sin xn < xn < tg xn
 
1 − cos x 2 sin2 x2 sin x2 2
⇓ (делим на sin xn ) lim = lim = 2 lim =
x→0 x2 x→0 x2 x→0 x
xn 1  
sin x2 2
x
1< < 2 = y, x = 2y
sin xn cos xn = 2 lim = y −→ 0
x→0 =
x→0 x y 6= 0 при x 6= 0
⇓ (возводим в степень −1)  2  2
sin y 1 sin y 1 1
sin xn = 2 lim = lim = ·1 =
1> > cos xn y→0 2y 2 y→0 y 2 2
xn | {z }
↓ (cos – непрерывная функция)
cos 0 ⊲⊲ 4.2.57. Найти пределы
k sin 5x
1 1) limx→0 3x
§ 2. Стандартные функции 315

sin αx
2) limx→0 sin βx Аналогично доказывается что
2
3) limx→∞ (x − 3) sin 3x  nk +1
1
1+ −→ e (4.2.158)
4) limx→0 x ctg x nk + 1 k→∞
5) limx→∞ x2 sin x1
Теперь рассмотрим двойное неравенство
tg x−sin x
6) limx→0 sin3 x (4.2.156). Из него следует
1 1 1
Второй замечательный предел. Следую- > >
nk xk nk + 1
щее утверждение оказывается также весьма по-
а отсюда, в свою очередь, получается
лезным при вычислении пределов:
1 1 1
Теорема 4.2.5. 1+ >1+ >1+
nk xk nk + 1
 x и
1 1
lim (1 + x) = e = lim 1 +
x
(4.2.154)  xk  xk   xk
x→0 x→∞ x 1 1 1
1+ > 1+ > 1+
nk xk nk + 1
• Эти (эквивалентные) равенства назы-
ваются вторым замечательным пре- Расширим это двойное неравенство влево и впра-
делом. во:

Доказательство. Равенство между этими дву-  nk +1  


1
мя пределами получается заменой переменной, 1+ > используем неравенство
nk + 1 > xk >
поэтому нам достаточно доказать только второе nk
 xk  xk
равенство в этой цепочке. Для начала будем счи- 1 1
> 1+ > 1+ >
тать, что x положительно, то есть докажем ра- nk xk
венство  xk  
1
 x > 1+ > используем неравенство
xk > nk >
1 nk + 1
lim 1+ =e (4.2.155)  nk
x→+∞ x 1
> 1+
nk + 1
Зафиксируем последовательность {xk }, стремя-
щуюся к +∞, Теперь выбросим ненужные звенья в этой цепоч-
xk −→ +∞ ке:
k→∞  nk +1  xk  nk
и покажем, что 1 1 1
1+ > 1+ > 1+
nk xk nk + 1
 xk | {z } | {z }
1 ↓ (4.2.157) ↓ (4.2.158)
lim 1+ =e
k→∞ xk e e

Действительно, всякое число xk лежит между ⇓ (теорема 3.2.10)


  xk
какими-нибудь двумя соседними натуральными 1
числами, поэтому можно найти число nk ∈ N та- 1+ −→ e
xk k→∞
кое, что
Мы доказали равенство (4.2.155). Из него теперь
nk 6 xk < nk + 1 (4.2.156) получаем
 x
Возникающая таким образом последователь- 1 y = −x
lim 1+ = =
ность натуральных чисел {nk } будет бесконечно x→−∞ x y → +∞
 −y  −y
большой 1 y−1
= lim 1− = lim =
nk −→ +∞ y→+∞ y y→+∞ y
k→∞  y  y
y 1
потому что nk > xk − 1 −→ +∞. Значит, мож- = lim = lim 1+ =
k→∞ y→+∞ y − 1 y→+∞ y−1
но рассмотреть подпоследовательность {rnk },  z+1
последовательности {rn }, рассматривавшейся в z =y−1 1
= = lim 1+ =
лемме (c), и поскольку {rn } стремится к e, по z → +∞ z→+∞ z
 z  
свойству 10 пункта (b) мы получим, что {rnk } 1 1
= lim 1+ · lim 1+ =e
тоже должна стремится к e: z→+∞ z z→+∞ z
| {z } | {z }
 nk
=

1
1+ −→ e (4.2.157) e, 1
nk k→∞ в силу (4.2.155)
316 Глава 4. СТАНДАРТНЫЕ ФУНКЦИИ

В результате мы доказали ⊲⊲ 4.2.61. Найти пределы


2
 x 1) limx→0 (1 + 3 tg2 x)ctg x
1  3x
lim 1+ =e (4.2.159) 2) limx→∞ 2x−32x
x→−∞ x
 3 √x
и вместе с (4.2.155) это дает второе равенство в 3) limx→+∞ 5x5x+2 3

(4.2.154). 1
4) limx→0 1 + 2x2 x2
Теорема 4.2.5 позволяет вычислять сложные  x+1
2x+3
5) limx→∞ 2x+1
пределы, в которых возникает неопределенность
типа 1∞ . 6) limx→0 (1 + tg x)ctg x
ctg2 x
⋄ 4.2.58. Найти предел 7) limx→0 1 + 3 tg2 x
1
ctg x 8) limx→0 (cos x) sin2 x
lim (1 + tg x)  1
x→0 9) limx→0 cos2 x sin2 x
ctg x
Решение: 10) limx→0 (cos x)
 x+1
2x+3
tg x = y, ctg x = 1 11) limx→∞ 2x−1
lim (1 + tg x)ctg x = y −→ ∞
y
=  2 x2
x→0 x→0
1
12) limx→∞ xx2+3x+1
−x+2
= lim (1 + y) y = e  x
y→0 5x2 +1
13) limx→∞ 5x2 +x+1
⋄ 4.2.59. Найти предел  x2
x+1
14) limx→∞ x+3
 x
x+1
lim Следствие 4.2.6. Справедливы соотношения:
x→∞ x − 1

Решение: ln(1 + x)
lim =1 (4.2.160)
x→0 x
 x
 x и
x+1 x+1
lim = lim 1 + −1 = ex − 1
x→∞ x − 1 x→∞ x−1 lim =1 (4.2.161)
 x x→0 x
2 2
= y, x = 1 + y2
= lim 1 + = x−1 y −→ 0 = Доказательство. Сразу получается (4.2.160):
x→∞ x−1 x→∞
h i
1 2
1+ 2
= lim (1 + y) y = lim (1 + y) (1 + y) y = ln(1 + x) 1
y→0 y→0 lim = lim ln(1 + x) x =
 2 x→0 x x→0
1 1
= lim (1 + y) lim (1 + y) y = e2 = ln lim (1 + x) x = ln e = 1
y→0 y→0 x→0

⋄ 4.2.60. Найти предел А отсюда уже следует (4.2.161):


1
lim (cos x) x2 ex − 1 x t
x→0
lim = xe= − 1=t
ln(1 + t) = lim =
x→0 x t→0 ln(1 + t)
Решение:  −1
ln(1 + t)
= lim = (4.2.160) = 1−1 = 1
t→0 t
  12
2 1
1 x
lim (cos x) = lim 1 − 2 sin
x2 =
x→0 x→0 x
h  1 2 i −2 xsin2 x
2

2 ⊲⊲ 4.2.62. Найдите пределы


= lim 1 − 2 sin x −2 sin x
= 2x
x→0 1. limx→0 e x−1 ;
h  1 ilimx→0 −2 xsin2
2x
ln(1−3x)
2 2. limx→0 ;
= lim 1 − 2 sin x −2 sin2 x = 5
x 
x→0
3. limx→∞ x e x − 1 ;
−2 sin2 x = y,
= y −→ 0 = 4. limx→∞ 1
ln x−1
x→0 x x+1 ;
 −2 limx→0 ( sinx x )2 ln(1−7ex )
1
5. limx→−∞ ex ;
= lim (1 + y) y
= e−2 6. 1−esin x
limx→−∞ 1−cos2 x .
y→0
Глава 5

ПРОИЗВОДНАЯ

§1 Производная
Понятие производной появилось в анализе как инструмент для решения задач на экстремум (то есть
на максимум и минимум), поэтому обсуждение этой темы полезно начать с какого-нибудь простого
примера, иллюстрирующего эту связь.

⋄ 5.1.1. Пусть нам дана функция тель знает по школе):

f (x) = x2 − x4 (5.1.1)

и требуется найти ее наибольшее значение на


прямой R. Как любая линейная функция (мы определи-
ли линейные функции формулой (3.3.102)), ка-
Нулями этой функции (то есть решениями сательная описывается уравнением вида
уравнения f (x) = 0) являются числа {−1, 0, 1},
y = k·x+b
поэтому легко сообразить, что график f будет
выглядеть примерно так: в котором k – угловой коэффициент, связанный
с углом наклона ϕ касательной формулой

k = tg ϕ

Если точку a сдвинуть в какое-нибудь другое ме-


сто, то угловой коэффициент k, вообще говоря,
изменится (как и вся касательная). Таким обра-
зом, мы получаем некую зависимость, или, точ-
нее сказать, функцию

a 7→ k(a)

Отсюда можно заключить, что f действительно которая каждой точке a ∈ R ставит в соответ-
будет иметь максимум в каких-то точках, лежа- ствие угловой коэффициент k = k(a) касатель-
щих на интервалах (−1, 0) и (0, 1), и нам нужно ной к графику функции f в точке a.
придумать, как найти эти точки. Заметим далее, что в точках максимума (а
также, минимума) касательная к графику функ-
ции f горизонтальна, то есть угловой коэффици-
Чтобы это понять, нарисуем касательную к ент касательной равен нулю
графику функции f в какой-нибудь точке a ∈ R
(что такое касательная, мы надеемся, что чита- k(a) = 0. (5.1.2)

317
318 Глава 5. ПРОИЗВОДНАЯ

Поэтому если б мы знали функцию a 7→ k(a), то задача будет решена в примере 5.1.3), и уравне-
решив уравнение (5.1.2), мы как раз смогли бы ние (5.1.2) решается так:
получить точки максимума.
Раздел анализа, называемый Дифференци- k(a) = 0 ⇔ 2a − 4a3 = 0 ⇔
альным исчислением (мы поговорим о нем на  
1 1
с.330), как раз предоставляет алгоритм, позво- ⇔ a∈ − √ , 0, √ ,
ляющий найти функцию a 7→ k(a) по функции 2 2
x 7→ f (x). Для нашей функции f (x) = x2 − x4 После этого становится понятно, что максимум
соответствующая функция k имеет вид нашей функции достигается в точках ± √12 , и ра-
k(a) = 2a − 4a3 (5.1.3) вен  
1 1 1 1
(почему это так станет понятно после § 1 настоя- f ± √ = − =
2 2 4 4
щей главы, а конкретно для функции (5.1.1) эта

Функция a 7→ k(a), о которой мы говорили в этом примере, на математическом языке называется


производной функции f и обозначается

k(a) = f ′ (a)

Это одно из главных понятий в математическом анализе, и, помимо нахождения экстремумов (мак-
симумов и минимумов), оно используется в разных других задачах, например,
– при построении графика функции (это описывается в (b) этой главы),
– при вычислении сложных пределов с помощью правила Лопиталя (см. (a) этой главы),
– при определении еще одного важного объекта в математическом анализе – неопределен-
ного интеграла (об этом речь пойдет в главе 8).
В этой главе мы дадим аккуратное определение этому понятию, научимся вычислять производные
стандартных функций и обсудим приложения производной.

(a) Производная и дифференцируемость


• Пусть функция f определена в некоторой окрестности точки a. Если существует конечный
предел
f (a + t) − f (a) f (x) − f (a)
f ′ (a) = lim = lim ∈ R, (5.1.4)
t→0 t x→a x−a
то он называется производной функции f в точке a, а про функцию f говорят, что она
дифференцируема в точке a.
• Функция f называется дифференцируемой на множестве E, если она (определена в
окрестности каждой точки этого множества и) дифференцируема в каждой точке это-
го множества:
f (a + t) − f (a)
∀a ∈ E ∃f ′ (a) = lim ∈R
t→0 t

⋄ 5.1.2. Для функции Ясно, что смысл нашего утверждения не изме-


нится, если заменить a на любую другую пере-
f (x) = x2 менную, например, на x:
по определению, получаем: f ′ (x) = 2x, x∈R
– эта формула будет означать, что производная
′ (a + t)2 − a2 функции f в любой точке x равна 2x.
f (a) = lim =
t→0 t
⋄ 5.1.3. Рассмотрим функцию из примера 5.1.1:
a2 + 2at + t2 − a2
= lim = lim (2a + t) = 2a
t→0 t t→0 f (x) = x2 − x4
То есть, в любой точке a производная функции опять по определению, получаем:
f (x) = x2 равна 2a: n o n o
(a + t)2 − (a + t)4 − a2 − a4
f ′ (a) = 2a, a∈R f ′ (a) = lim =
t→0 t
§ 1. Производная 319

= (2.2.251) = Если поменять переменную на x, то


1 n 
= lim · a2 + 2at + t2 − f ′ (x) = 2x − 4x3 , x ∈ R.
t→0 t
 o
− a4 + 4a3 t + 6a2 t2 + 4at3 + t4 − a2 + a4 =
⋄ 5.1.4. Наоборот, функция
1 n  o
= lim · 2at+ t2 − 4a3 t+ 6a2 t2 + 4at3 + t4 =
t→0 t f (x) = |x|
n  o
= lim 2a + t − 4a3 + 6a2 t + 4at2 + t3 =
t→0
не дифференцирема в точке a = 0, потому что
= 2a − 4a3 предел
Это совпадает с тем, что мы заявляли в примере |t|
5.1.1: f ′ (0) = lim
t→0 t

f ′ (a) = k(a) = 2a − 4a3 , a∈R не существует.

Теорема 5.1.1 (о связи между непрерывностью и дифференцируемостью). Если функция f диф-


ференцируема в точке a, то она непрерывна в этой точке.
Доказательство. Если функция f определена в некоторой окрестности точки a и дифференциру-
ема в a, то это значит, что существует конечный предел

f (a + t) − f (a)
lim = f ′ (a)
t→0 t
Отсюда следует, что существует предел
 
f (a + t) − f (a) f (a + t) − f (a)
lim (f (a + t) − f (t)) = lim · t = lim · lim t = f ′ (a) · 0 = 0
t→0 t→0 t t→0 t t→0

То есть,
lim f (x) = lim f (a + t) = f (a)
x→a t→0

а это как раз означает, что функция f непрерывна в точке a.

Геометрический смысл производной. У Теперь “расфиксируем” число t и устремим его к


производной имеется естественная геометриче- нулю. Тогда наша секущая тоже станет двигать-
ская интерпретация: число f ′ (a), определенное ся, “приближаясь к касательной”, а “в пределе” –
формулой (5.1.4) как раз и есть угловой коэф- просто превратится в касательную.
фициент касательной к графику функции f в
точке a, о котором мы говорили в примере 5.1.1.
Чтобы понять, почему это так, зафиксируем сна-
чала число t и проведем секущую к графику
функции f через точки (a; f (a)) и (a + t; f (a + t)):

Угловой коэффициент (тангенс угла наклона)


этой касательной будет как раз равен производ-
ной:
f (a + t) − f (a)
k = lim = f ′ (a)
t→0 t
Из треугольника ABC видно, что угловой коэф-
фициент (то есть тангенс угла наклона) секущей
Наглядный смысл дифферецируемости.
будет равен
На интуитивном уровне дифференцируемость
f (a + t) − f (a) функции f в точке a означает, что в точке a к
kt = графику функции f можно провести (однознач-
t
320 Глава 5. ПРОИЗВОДНАЯ

но определенную) касательную (и это не будет в частности, если производная в какой-то точ-


вертикальная прямая). ке x0 равна нулю

f ′ (x0 ) = 0

Для понимания этих терминов следует уяс- то это означает, что касательная в этой точке
нить два важных момента: x0 горизонтальна

– во-первых, производная существует не все-


гда, и глядя на график обычно бывает
нетрудно сообразить, имеет ли функция f в
данной точке производную (то есть, диффе-
ренцируема ли она в этой точке), или нет; на-
пример, функция f (x) = | arctg x|
если же производная в x0 положительна

f ′ (x0 ) > 0

то это означает, что касательная в этой точке


x0 возрастает

дифференцируема в любой точке x0 6= 0 (по-


тому что в любой точке x0 6= 0 к графику
можно провести касательную)

а если производная в x0 отрицательна

f ′ (x0 ) < 0

то касательная в x0 убывает
но в точке x0 = 0 она не дифференцируема
(потому что в x0 = 0 однозначно определен-
ную касательную провести невозможно)

В качестве упражнения полезно порешать за-


дачи следующего типа.

– во-вторых, по графику функции можно сооб- ⊲ 5.1.5. Нарисуйте график какой-нибудь функ-
разить, в каких точках производная больше, ции f со следующими свойствами:
а в каких – меньше; например, у той же самой
1) f дифференцируема в любой точке,
функции f (x) = | arctg x| производная в точ-
кроме x = −2 и x = 1;
ке x0 = 1 больше, чем в точке x1 = 2 (потому

что угол наклона касательной в точке x0 = 1 2) f (0) = 0, f ′ (2) = −1, f ′ (−1) = 1;
больше, чем в точке x1 = 2): 3) f убывает на множестве (0; +∞);
§ 1. Производная 321

4) f возрастает на множестве (−∞; −3). Действительно, при x 6= 0 мы получим


⊲ 5.1.6. Нарисуйте график какой-нибудь функ- (x + t)α − xα
ции f со следующими свойствами: f ′ (x) = lim =
t→0 t
1) f дифференцируема в любой точке, x + t = xes
кроме x = 0; = t = x(es − 1) =
2) f ′ (2) = 0, f ′ (3) = 1, f ′ (1) = −1; s = ln(1 + xt )
3) f ограничена на множестве (0; +∞); xα · eαs − xα xα eαs − 1
= lim = · lim =
s→0 x(es − 1) x s→0 es − 1
4) f не ограничена на множестве (−∞; 0).
eαs − 1 αs
= xα−1 · lim · s =
⊲ 5.1.7. По графику функции s→0 αs e −1
eαs − 1 αs
= xα−1 · lim · lim s =
s→0 αs s→0 e − 1
 
в первом пределе
= делаем замену y = αs =
ey − 1 αs
= xα−1 · lim · lim s =
y→0 y s→0 e − 1
 
= выносим α из второго предела
и преобразуем этот предел =
 −1
ey − 1 es − 1
= αxα−1 · lim · lim =
y→0 y s→0 s
 
= дважды применяем
формулу (4.2.161) =
= αxα−1 · 1 · 1−1 = αxα−1 .
определите, в каких точках она дифференциру-
ема, и будет ли она дифференцируемой А при x = 0 и α > 1 вычисления упростятся:
1) на интервале (−∞; 1)?
tα − 0 α tα
2) на интервале (−∞; 0)? f ′ (0) = lim = lim =
3) на интервале (1; +∞)? t→0 t t→0 t

4) на интервале (0; 1)? = lim tα−1 = 0 = α · xα−1 x=0


.
t→0

Производные элементарных функций. ⋄ 5.1.10. Производная показательной


функции:
Вычислим теперь производные элементарных
функций (в тех случаях, когда это возможно). f (x) = ax =⇒ f ′ (x) = ax · ln a (5.1.9)
⋄ 5.1.8. Производная линейной функции: В частности,

f (x) = kx + b =⇒ f (x) = k (5.1.5) f (x) = ex =⇒ f ′ (x) = ex (5.1.10)
В частности, производная от константы: Действительно,

f (x) = C =⇒ f ′ (x) = 0 (5.1.6) ax+t − ax at − 1


f ′ (x) = lim = ax · lim =
t→0 t t→0 t
Действительно,  
применяем x et ln a − 1
= формулу (4.1.64) = a · t→0
lim =
f (x + t) − f (x) t
f ′ (x) = lim = s
e −1
t→0 t = st == t lns a = ax ln a · lim =
(k · (x + t) + b) − (k · x + b) 
ln a

s→0 s
= lim = применяем
t→0 t = формулу (4.2.161) = ax ln a · 1 = ax ln a
k·t
= lim = lim k = k ⋄ 5.1.11. Производная логарифма:
t→0 t t→0

⋄ 5.1.9. Производная степенной функции: 1


f (x) = loga x =⇒ f ′ (x) = (5.1.11)
x · ln a
f (x) = xα =⇒ f ′ (x) = α · xα−1 , (5.1.7) В частности,

при x 6= 0, либо при x = 0 и α > 1. 1


f (x) = ln x =⇒ f ′ (x) = (5.1.12)
В частности, x
1 1 Действительно,
f (x) = =⇒ f ′ (x) = − (5.1.8)
x x2
322 Глава 5. ПРОИЗВОДНАЯ

loga (x + t) − loga x ⋄ 5.1.14. Производная тангенса:


f ′ (x) = lim =
t→0 t
  ln(x + t) − ln x 1
применяем
= формулу f (x) = tg x =⇒ f ′ (x) = (5.1.16)
(4.1.64) = t→0lim = cos2 x
t ln a
ln x+t ln(1 + xt ) t Действительно,
= lim x
= lim = t s==s x· x =
t→0 t ln a t→0 t ln a
ln(1 + s) 1 ln(1 + s) tg(x + t) − tg x
= lim = · lim = (tg x)′ (x) = lim =
s→0 s · x · ln a x · ln a s→0 s t→0 t
  1 1 sin(x+t) sin x
cos(x+t) − cos x
применяем
= формулу (4.2.160) = ·1 = = lim =
x · ln a x · ln a t→0 t
⋄ 5.1.12. Производная синуса: sin(x + t) · cos x − sin x · cos(x + t)
= lim =
t→0 t · cos(x + t) cos x
f (x) = sin x =⇒ f ′ (x) = cos x (5.1.13)
sin ((x + t) − x) sin t
= lim = lim =
Для доказательства нам понадобится следующая t→0 t · cos(x + t) cos x t→0 t · cos(x + t) cos x
вспомогательная формула: sin t 1 1 1
= lim ·lim = 1· 2 =
cos t − 1 t→0 t t→0 cos(x + t) cos x cos x cos2 x
lim = 0, (5.1.14)
t→0 t ⋄ 5.1.15. Производная котангенса:
которую можно вывести из первого замечатель-
ного предела: 1
f (x) = ctg x =⇒ f ′ (x) = − 2 (5.1.17)
sin x
cos t − 1 −2 sin2 2t s = 2t Действительно,
lim = lim = =
t→0 t t→0 t t = 2s
−2 sin2 s sin s ctg(x + t) − ctg x
= lim = − lim ·lim sin s = −1·0 = 0 f ′ (x) = lim =
s→0 2s s→0 s s→0 t→0 t
cos(x+t) cos x
Мы можем теперь доказать (5.1.13): sin(x+t) − sin x
= lim =
t→0 t
sin(x + t) − sin x cos(x + t) · sin x − cos x · sin(x + t)
f ′ (x) = lim = = lim =
t→0 t t→0 t · sin(x + t) sin x
sin x · cos t + cos x · sin t − sin x sin (x − (x + t)) − sin t
= lim = = lim = lim =
t→0 t t→0 t · sin(x + t) sin x t→0 t · sin(x + t) sin x
sin x · (cos t − 1) + cos x · sin t sin t 1
= lim = = − lim · lim =
t→0 t t→0 t t→0 sin(x + t) sin x
sin x · (cos t − 1) cos x · sin t
= lim + lim = 1 1
t→0 t t→0 t = −1 · 2 =− 2
cos t − 1 sin t sin x sin x
= sin x · lim + cos x · lim =
t→0 t t→0 t ⋄ 5.1.16. Производная арксинуса:
 
применяем формулу (5.1.14)
= и первый замечательный предел = 1
f (x) = arcsin x =⇒ f ′ (x) = √
= sin x · 0 + cos x · 1 = cos x 1 − x2
(5.1.18)
⋄ 5.1.13. Производная косинуса: Действительно,
f (x) = cos x =⇒ f ′ (x) = − sin x (5.1.15) arcsin(x + t) − arcsin x
(arcsin x)′ (x) = lim =
Действительно, t→0 t
s = arcsin(x + t) − arcsin x
= t = sin s · cos(arcsin x) + x · (cos s − 1) =
cos(x + t) − cos x
f ′ (x) = lim = s
t→0 t = lim =
s→0sin s · cos(arcsin x) + x · (cos s − 1)
cos x · cos t − sin x · sin t − cos x  
= lim = используем формулу
t→0 t = cos(arcsin x) = √1 − x2 =
cos x · (cos t − 1) − sin x · sin t s
= lim = = lim √ =
t→0 t s→0 sin s · 1 − x2 + x · (cos s − 1)
cos t − 1 sin t 1
= cos x · lim − sin x · lim = = lim sin s √ =

t→0 t t→0 t
 2 + x · cos s−1
s→0
s · 1 − x s
применяем формулу (5.1.14)
= и первый замечательный предел = 1
= √ =
= cos x · 0 − sin x · 1 = − sin x lims→0 sins s · 1 − x2 + x · lims→0 cos ss−1
§ 1. Производная 323
 
используем первый s cos s(1 − x tg s) cos s(1 − x tg s)
= замечательный предел = = lim = lim sin s =
и формулу (5.1.14) s→0 sin s(1 + x2 ) s→0
s · (1 + x )
2

1 1 lims→0 cos s · (1 − x · lims→0 tg s)


= √ = √ = =
2
1· 1−x +x·0 1 − x2 lims→0 sins s · (1 + x2 )
⋄ 5.1.17. Производная арккосинуса: 1 · (1 − x · 0) 1
= 2
=
1 1 · (1 + x ) 1 + x2
f (x) = arccos x =⇒ f ′ (x) = − √
1 − x2
(5.1.19) ⋄ 5.1.19. Производная арккотангенса:
Действительно,
1
f (x) = arcctg x =⇒ f ′ (x) = −
arccos(x + t) − arccos x 1 + x2
f ′ (x) = lim = (5.1.21)
t→0 t
s = arccos(x + t) − arccos x
Действительно,
= t = (cos s − 1) · x − sin s · sin(arccos x) =
s arcctg(x + t) − arcctg x
= lim = f ′ (x) = lim =
(cos s − 1) · x − sin s · sin(arccos x)
s→0 t→0 t
 
используем формулу s = arcctg(x + t) − arcctg x
= sin(arccos x) = √1 − x2 = = 1+x
t = − x+ctg
2 =
s
s
= lim √ = −s · (x + ctg s)
s→0 (cos s − 1) · x − sin s · 1 − x2 = lim =
s→0 1 + x2
1 s · (x · sin s + cos s)
= lim cos s−1 √ = = − lim =
s→0
s · x − sins s · 1 − x2 s→0 (1 + x2 ) · sin s
1 x · sin s + cos s
= √ = = − lim =
lims→0 s · x − lims→0 sins s · 1 − x2
cos s−1 s→0 (1 + x2 ) · sin s
s
 
используем первый x · lims→0 sin s + lims→0 cos s
= замечательный предел = =− =
и формулу (5.1.14) (1 + x2 ) · lims→0 sins s
1 1 x·0+1 1
= √ = −√ =− =−
0 · x − 1 · 1 − x2 1 − x2 (1 + x2 ) · 1 1 + x2
⋄ 5.1.18. Производная арктангенса:
Из этих примеров видно, что (как и в случае
1
f (x) = arctg x =⇒ f ′ (x) = (5.1.20) с непрерывностью, о чем мы говорили в теореме
1 + x2 4.1.48), не все элементарные функции дифферен-
Действительно, цируемы на своей области определения:

arctg(x + t) − arctg x Теорема 5.1.2. Среди элементарных функций


f ′ (x) = lim =
t→0 t все непрерывные1 (и только они) дифференциру-
s = arctg(x + t) − arctg x s(1 − x tg s) емы на всяком интервале в своей области опре-
= t = (1+x
2 )·tg s = lim = деления.
1−x tg s s→0 tg s(1 + x2 )

(b) Правила вычисления производных


Арифметические действия с производными.

Теорема 5.1.3. Если функции f и g дифференцируемы в точке x то их сумма, разность и про-


изведение тоже дифференцируемы в точке x, причем
 ′
C · f (x) = C · f ′ (x), C∈R (5.1.22)
 ′
f + g (x) = f ′ (x) + g ′ (x) (5.1.23)
 ′
f − g (x) = f ′ (x) − g ′ (x) (5.1.24)
 ′
f · g (x) = f ′ (x) · g(x) + f (x) · g ′ (x) (5.1.25)

1 Непрерывные элементарные функции были определены нами на с.300.


324 Глава 5. ПРОИЗВОДНАЯ

а если, кроме того g(x) 6= 0 то функция fg тоже дифференцируема в точке x, причем


 ′
f f ′ (x) · g(x) − f (x) · g ′ (x)
(x) = (5.1.26)
g g 2 (x)
Доказательство. Докажем (5.1.23):

   
 ′ f (x + t) + g(x + t) − f (x) + g(x)
f + g (x) = lim =

t→0
  t 
f (x + t) − f (x) + g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim + lim =
t→0 t t→0 t t→0 t
= f ′ (x) + g ′ (x)
Аналогично доказывается (5.1.24):

   
 ′ f (x + t) − g(x + t) − f (x) − g(x)
f − g (x) = lim =

t→0
  t 
f (x + t) − f (x) − g(x + t) − g(x) f (x + t) − f (x) g(x + t) − g(x)
= lim = lim − lim =
t→0 t t→0 t t→0 t
= f ′ (x) − g ′ (x)
Для (5.1.25) получаем:

 ′ f (x + t) · g(x + t) − f (x) · g(x)  вычтем и прибавим 


f · g (x) = lim = слагаемое f (x) · g(x + t) =
t→0 t
f (x + t) · g(x + t) − f (x) · g(x + t) + f (x) · g(x + t) − f (x) · g(x)
= lim =
t→0 t
 f (x + t) · g(x + t) − f (x) · g(x + t) f (x) · g(x + t) − f (x) · g(x) 
= lim + =
t→0
 t   t 
f (x + t) − f (x) · g(x + t) f (x) · g(x + t) − g(x)
= lim + lim =
t→0
 t t→0
 t 
f (x + t) − f (x) g(x + t) − g(x)
= lim · lim g(x + t) + f (x) · lim =
t→0 t t→0

t→0
 t
по теореме 5.1.1, функция
= g непрерывна, значит = f ′ (x) · g(x) + f (x) · g ′ (x)
limt→0 g(x + t) = g(x)

И, наконец, для (5.1.26):

 f ′ f (x+t) f (x)
g(x+t) − g(x) f (x + t) · g(x) − f (x) · g(x + t)  вычтем и прибавим 
(x) = lim = lim = слагаемое f (x) · g(x) =
g t→0 t t→0 t · g(x + t) · g(x)
f (x + t) · g(x) − f (x) · g(x) + f (x) · g(x) − f (x) · g(x + t)
= lim =
t→0 t · g(x + t) · g(x)
 f (x + t) · g(x) − f (x) · g(x) f (x) · g(x) − f (x) · g(x + t) 
= lim + =
t→0 t · g(x + t) · g(x) t · g(x + t) · g(x)
 
f (x + t) − f (x) g(x + t) − g(x)  1
= lim · g(x) − f (x) · · =
t→0 t t g(x + t) · g(x)
 f (x + t) − f (x) g(x + t) − g(x)  1
= lim · g(x) − f (x) · lim · lim =
t→0 t t→0 t t→0 g(x + t) · g(x)
   
по теореме 5.1.1, функция 1 f ′ (x) · g(x) − f (x) · g ′ (x)
= g(x) непрерывна, значит = f ′ (x) · g(x) − f (x) · g ′ (x) · =
limt→0 g(x + t) = g(x) g(x)2 g(x)2
§ 1. Производная 325

⋄ 5.1.20. Вычислим производную функции введем обозначения


h(x) = ln x · sin x
Для этого введем обозначения f (x) = ex , g(x) = arctg x,

f (x) = ln x, g(x) = sin x


Тогда h = fg , и по формуле (5.1.25) получаем:
Тогда h = f · g, и по формуле (5.1.25) получаем:
1
h′ (x) = f ′ (x)·g(x)+f (x)·g(x) =
·sin x+ln x·cos x
x f ′ (x) · g(x) − f (x) · g(x)
h′ (x) = =
⋄ 5.1.21. Чтобы найти производную функции g(x)2
1
ex ex · arctg x − ex · 1+x2
h(x) = =
arctg x arctg2 x

Производная композиции. Напомним, что композиция g ◦ f функций g и f (или, что то же


самое, сложная функция, составленная из f и g) была определена нами на с.246 формулой

(g ◦ f )(x) = g(f (x)).

Теорема 5.1.4. Пусть функция f дифференцирема в точке x = a, а функция g дифференцируема


в точке f (a). Тогда сложная функция

h(x) = g(f (x))

дифференцируема в точке x = a, причем

h′ (a) = g ′ (f (a)) · f ′ (a) (5.1.27)

! 5.1.22. Формулу (5.1.27) удобно записывать в виде

(g ◦ f )′ = (g ′ ◦ f ) · f ′ (5.1.28)

Доказательство. Перепишем равенство (5.1.27) по-другому:

g(f (x)) − g(f (a))


lim = g ′ (f (a)) · f ′ (a)
x→a x−a
Чтобы это доказать, нужно взять произвольную последовательность

xn −→ a, xn 6= a (5.1.29)
n→∞

и убедиться, что
g(f (xn )) − g(f (a))
lim = g ′ (f (a)) · f ′ (a) (5.1.30)
xn − a
n→∞

Для этого нужно рассмотреть два случая:


– возможна ситуация, когда для почти всех n ∈ N выполняется f (xn ) 6= f (a);
– если же это не так, то для некоторой подпоследовательности аргументов xnk соответству-
ющая последовательность значений f (xnk ) будет обладать свойством f (xnk ) = f (a).
1. Рассмотрим сначала первый случай, то есть когда для почти всех n ∈ N выполняется f (xn ) 6=
f (a). Тогда можно делить и умножать на f (xn ) − f (a) 6= 0, и мы получим

g(f (xn )) − g(f (a)) g(f (xn )) − g(f (a)) f (xn ) − f (a)
lim = lim · =
n→∞ xn − a n→∞ f (xn ) − f (a) xn − a
g(f (xn )) − g(f (a)) f (xn ) − f (a) в левом пределе делаем
= lim · lim = замену yn = f (xn ) =
n→∞ f (xn ) − f (a) n→∞ xn − a
g(yn ) − g(f (a)) f (xn ) − f (a)
= lim · lim = g ′ (f (a)) · f ′ (a)
n→∞ yn − f (a) n→∞ xn − a
326 Глава 5. ПРОИЗВОДНАЯ

2. После этого рассмотрим случай, когда для некоторой подпоследовательности аргументов xnk
соответствующая последовательность значений f (xnk ) обладает свойством f (xnk ) = f (a). Тогда
последовательность xn можно разбить на две подпоследовательности xnk и xni , такие что

f (xnk ) = f (a), f (xni ) 6= f (a)

Для подпоследовательности xni мы получаем то же самое, что и в предыдущем случае:

g(f (xni )) − g(f (a))


lim = g ′ (f (a)) · f ′ (a)
i→∞ xni − a

А для xnk получаем:

g(f (xnk )) − g(f (a)) вспоминаем, что g(f (a)) − g(f (a)) 0
lim = f (xn ) = f (a) = lim = lim =0
k→∞ xnk − a k k→∞ xnk − a k→∞ xnk − a

А с другой стороны,

f (xnk ) − f (a) вспоминаем, что 0


f ′ (a) = lim = f (xn ) = f (a) = lim =0
k→∞ xnk − a k k→∞ xnk − a

И, таким образом,
g(f (xnk )) − g(f (a))
lim = 0 = g ′ (f (a)) · f ′ (a)
k→∞ xnk − a
Мы получили, что для любой последовательности (5.1.29) выполняется равенство (5.1.30), а это
нам и нужно было доказать.

⋄ 5.1.23. Вычислим производную функции Одним из следствий теоремы о производной


h(x) = sin(x2 ). Для этого представим ее как ком- сложной функции является возможность вычис-
позицию двух элементарных функций: лять производные функций вида f g . Это делает-
ся с помощью следующей очевидной формулы:
h(x) = sin(x2 ) = g(f (x)), g(y) = sin y, f (x) = x2
g
Тогда f g = eln f = eg·ln f (5.1.31)
′ ′
g (y) = cos y, f (x) = 2x (справедливой, разумеется, только при f > 0).
Применяя формулу (5.1.61), получаем:
⋄ 5.1.26. Вычислим производную функции
h′ (x) = g ′ (f (x)) · f ′ (x) = cos(x2 ) · 2x
h(x) = xx , x>0
⋄ 5.1.24. Чтобы посчитать производную функ-
ции h(x) = sin2 x, нужно представить ее в виде Для этого представим нашу функцию, как ком-
композиции элементарных функций позицию двух функций с помощью формулы
(5.1.31):
h(x) = sin2 x = g(f (x)), g(y) = y 2 , f (x) = sin x x
h(x) = xx = eln x = ex·ln x
Тогда
g ′ (y) = 2y, f ′ (x) = cos x Тогда
и, применяя (5.1.61), получаем: h(x) = g(f (x)), g(y) = ey , f (x) = x · ln x
′ ′ ′
h (x) = g (f (x)) · f (x) = 2 sin x · cos x
Производная функции f вычисляется по форму-
⋄ 5.1.25. Вычислим производную функции ле (5.1.28) и равна
h(x) = earctg x . Для этого представим ее как ком-
позицию двух элементарных функций: f ′ (x) = ln x + 1

h(x) = earctg x = g(f (x)), g(y) = ey , f (x) = arctg x а для функции g она посчитана в примере 5.1.10:
Тогда g ′ (y) = ey
1
g ′ (y) = ey , f ′ (x) = Поэтому
1 + x2
Применяя формулу (5.1.61), получаем:
h′ (x) = g ′ (f (x)) · f ′ (x) =
1    
h′ (x) = g ′ (f (x)) · f ′ (x) = earctg x · = ex·ln x · ln x + 1 = xx · ln x + 1 .
1 + x2
§ 1. Производная 327

(c) Теоремы о дифференцируемых функциях


Теорема Ферма.
Теорема 5.1.5 (Ферма). 2 Пусть функция f определена на интервале (a, b) и в некоторой точке
ξ ∈ (a, b) достигает экстремума на этом интервале, то есть

f (ξ) = max f (x),


x∈(a,b)

или
f (ξ) = min f (x).
x∈(a,b)

Тогда, если в точке ξ функция f дифференцируема, то

f ′ (ξ) = 0

Доказательство. Пусть для определенности

f (ξ) = max f (x)


x∈(a,b)

то есть
∀x ∈ (a, b) f (x) 6 f (ξ) (5.1.32)
Тогда, с одной стороны,
0
6

(5.1.32)
z }| {
f (x) − f (ξ)  если предел существует,  f (x) − f (ξ)
f ′ (ξ) = lim = то он равен пределу слева = lim >0
x→ξ x−ξ x→ξ−0 x−ξ
| {z }
>

(x < ξ)
0

А, с другой стороны,
0
6

(5.1.32)
z }| {
f (x) − f (ξ)   f (x) − f (ξ)
если предел существует,
f ′ (ξ) = lim = то он равен пределу справа = lim 60
x→ξ x−ξ x→ξ+0 x−ξ
| {z }
<

(x > ξ)
0

Итак, мы получили, что f ′ (ξ) > 0 и, одновременно, f ′ (ξ) 6 0. Значит, f ′ (ξ) = 0.

Теорема Ролля.
Теорема 5.1.6 (Ролля). 3
Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
2 Эта теорема используется в следующем параграфе при доказательстве теоремы Ролля.
3 Эта теорема используется в следующих трех параграфах при доказательстве теорем Лагранжа, Коши и Тейлора
328 Глава 5. ПРОИЗВОДНАЯ

(ii) f дифференцируема на интервале (a, b),


(iii) f (a) = f (b).
Тогда существует точка ξ ∈ (a, b), такая что

f ′ (ξ) = 0

Доказательство. Поскольку функция f непрерывна на отрезке [a, b], по теореме Вейерштрасса об


экстремумах (теорема 3.3.8), f имеет максимум и минимум на [a, b]:

m = f (xm ) = min f (x) M = f (xM ) = max f (x)


x∈[a,b] x∈[a,b]

Ясно, что m 6 M , поэтому возможны два случая:


1) m = M , или
2) m < M .
В первом случае мы получаем, что функция f должна быть постоянной

∀x ∈ [a, b] m = f (x) = M,

поэтому ее производная f ′ (x) будет равна нулю в любой точке x ∈ [a, b].
Во втором же случае мы получаем, что с одной стороны f (a) = f (b), а с другой, m = f (xm ) <
f (xM ) = M . Это означает, что xm или xM не не может быть концом отрезка [a, b]:
– либо a < xm < b,
– либо a < xM < b.
Значит, функция f имеет экстремум на интервале (a, b) (если a < xm < b – то минимум, а если
a < xM < b – то максимум). Следовательно, по теореме Ферма 5.1.5, найдется точка ξ ∈ (a, b) такая,
что f ′ (ξ) = 0.

Теорема Лагранжа.

Теорема 5.1.7 (Лагранжа). 4


Пусть функция f определена на отрезке [a, b], причем
(i) f непрерывна на отрезке [a, b],
(ii) f дифференцируема на интервале (a, b).
Тогда существует точка ξ ∈ (a, b), такая что

f (b) − f (a)
f ′ (ξ) = (5.1.33)
b−a

4 Эта теорема используется ниже при доказательстве теоремы 5.2.14 (достаточное условие строгой выпуклости).
§ 1. Производная 329

Доказательство. Рассмотрим вспомогательную функцию


f (b) − f (a)
F (x) = f (x) − f (a) − (x − a)
b−a
Эта функция удовлетворяет всем трем условиям теоремы Ролля 5.1.6:
(1) F непрерывна на отрезке [a, b] (по теореме 3.3.2, потому что F (x) составлена из непре-
рывных функций с помощью операции вычитания);
(2) F дифференцируема на интервале (a, b) (по теореме 5.1.3, потому что F составлена из
дифференцируемых функций с помощью операции вычитания);
f (b)−f (a)
(3) F (a) = F (b) (потому что F (a) = f (a) − f (a) − b−a (a − a) = 0 − 0 = 0 и F (b) =
f (b)−f (a) f (b)−f (a)
f (b) − f (a) − b−a (b − a) = f (b) − f (a) − 1 = 0).
Значит, по теореме Ролля 5.1.6, найдется такая точка ξ ∈ (a, b), что F ′ (ξ) = 0. Иными словами,
f (b) − f (a)
f ′ (ξ) − =0
b−a
или
f (b) − f (a)
f ′ (ξ) =
b−a

Теорема Коши об отношении приращений.


Теорема 5.1.8 (Коши). 5
Пусть функции f и g определены на отрезке [a, b], причем
(i) f и g непрерывны на отрезке [a, b],
(ii) f и g дифференцируемы на интервале (a, b),
(iii) g ′ (x) 6= 0 при x ∈ (a, b).
Тогда существует точка ξ ∈ (a, b), такая что
f ′ (ξ) f (b) − f (a)
= (5.1.34)
g ′ (ξ) g(b) − g(a)
Доказательство. Сначала нужно убедиться, что g(a) 6= g(b), то есть что формула (5.1.34) имеет
смысл. Действительно, если бы оказалось, что g(a) = g(b), то это означало бы, что g(x) удовле-
творяет всем трем условиям теоремы Ролля 5.1.6, поэтому нашлась бы точка ξ ∈ (a, b) такая, что
g ′ (ξ) = 0. Это невозможно по условию (iii) нашей теоремы.
Теперь перейдем к доказательству формулы (5.1.34). Рассмотрим вспомогательную функцию
f (b) − f (a)
F (x) = f (x) − f (a) − · (g(x) − g(a))
g(b) − g(a)
Эта функция удовлетворяет всем трем условиям теоремы Ролля 5.1.6:
(1) F непрерывна на отрезке [a, b] (по теореме 3.3.2, потому что F составлена из непрерывных
функций с помощью операции вычитания);
(2) F дифференцируема на интервале (a, b) (по теореме 5.1.3, потому что F составлена из
дифференцируемых функций с помощью операции вычитания);
f (b)−f (a)
(3) F (a) = F (b) (потому что F (a) = f (a) − f (a) − g(b)−g(a) · (g(a) − g(a)) = 0−0 = 0 и
f (b)−f (a)
F (b) = f (b) − f (a) − g(b)−g(a) (g(b) − g(a)) = f (b) − f (a) − f (b)−f
1
(a)
= 0).
Значит, по теореме Ролля 5.1.6, найдется такая точка ξ ∈ (a, b), что

F ′ (ξ) = 0

Иными словами,
f (b) − f (a) ′
f ′ (ξ) − · g (ξ) = 0
g(b) − g(a)
5 Эта теорема используется ниже при доказательстве теоремы 5.2.1 (правило Лопиталя для предела в точке с

неопределенностью 00 )
330 Глава 5. ПРОИЗВОДНАЯ

или, учитывая что g ′ (ξ) 6= 0,


f ′ (ξ) f (b) − f (a)

=
g (ξ) g(b) − g(a)

(d) Дифференциальное исчисле- бы иметь формальные основания пользоваться


ние: производная, как фор- им в примерах.
мальная операция
Частная производная числового выраже-
В примерах на с.325 и с.326, как наверняка заме- ния. Напомним, что приведенные числовые
тил читатель, для вычисления производной стан- выражения были определены нами на с.308. Вся-
дартной функции h нам приходилось вводить кому приведенному числовому выражению F и
новые обозначения для «более простых» функ- любой переменной x можно естественным обра-
ций, через которые h выражается алгебраически зом поставить в соответствие некое новое чис-
или в виде композиции. Например, чтобы вычис- ∂
ловое выражение, обозначаемое ∂x (F ) или ∂(F
∂x
)

лить производную функции h(x) = sin(x2 ) в при- (если это не приводит к недоразумениям, скоб-
мере 5.1.23 нам пришлось рассмотреть функции ки вокруг F могут не писаться) и называемое
g(y) = sin y и f (x) = x2 , выписать их производ- производным выражением таким образом, что-
ные и подставить их в формулу (5.1.27). бы выполнялись следующие условия:
Этот способ вычислений выглядит довольно
0) если выражение F не содержит переменной
громоздким в сравнении с приемами, употреб-
x, то его частная производная по x считается
лявшимися для таких задач в школе, где, как,
нулевой:
наверное, помнит читатель, вычисление произ- ∂F
водной оформляется в виде цепочки равенств = 0, (5.1.36)
∂x
(иногда длинной цепочки, но все же гораздо ко-
1) частная производная от переменной x по са-
роче, чем запись, которую приходится употреб-
мой этой переменной x считается равной еди-
лять, следуя алгоритму действий, описанному на
нице:
страницах 325 и 326). Например, для функции ∂x
h(x) = sin(x2 ) можно (используя обозначение = 1, (5.1.37)
∂x
(4.2.133)) записать эту цепочку так:
2) для произвольных числовых выражений F и
 ′  ′ G
sin(x2 ) = sin y = ∂   ∂ ∂
y=x2
F +G = F+ G (5.1.38)
∂x ∂x ∂x
= (sin y)′ · (x2 )′ = cos x2 · 2x. (5.1.35)  
y=x2 ∂ ∂ ∂
F −G = F− G (5.1.39)
∂x  ∂x  ∂x  
Естественно поэтому задуматься, отчего школь- ∂   ∂ ∂
ные приемы приводят к правильным результа- F ·G = F ·G+F · G (5.1.40)
∂x ∂x ∂x
там, и как их следует аккуратно сформулиро-    
  ∂F ∂G
вать, чтобы грамотно использовать для вычис- ∂ F ∂x · G − F · ∂x
лений. = (5.1.41)
∂x G G2
Раздел математического анализа, занимаю-
щийся этими вопросами, называется Исчисление, 3) для произвольного числового выражения F
и мы упоминали уже о нем в начале главы 4.
Его идея состоит в том, чтобы поглядеть на про- ∂  α ∂F
изводную (и на интеграл, о котором мы пого- F = α · F α−1 · (5.1.42)
∂x ∂x
ворим в следующей главе), как на формальную ∂  F F ∂F
операцию над числовыми выражениями6 . Такой a = ln a · a · (a > 0) (5.1.43)
∂x ∂x
отстраненный взгляд позволяет формализовать ∂  F ∂F
приемы вычисления производной таким образом, e = eF · (5.1.44)
∂x ∂x
что цепочки вида (5.1.35) становятся результа- ∂   1 ∂F
том применения одного общего алгоритма, обос- loga F = · (F > 0) (5.1.45)
∂x F · ln a ∂x
нованность которого отдельно доказывается, и ∂   1 ∂F
поэтому не вызывает сомнений. ln F = · (F > 0) (5.1.46)
∂x F ∂x
В этом параграфе мы опишем этот алгоритм ∂   ∂F
(и докажем правомерность его применения), что- sin F = cos F · (5.1.47)
∂x ∂x
6 Числовые выражения были определены выше на с.302.
§ 1. Производная 331

∂   ∂F
cos F = − sin F · (5.1.48) производную по этой переменной удобно обозна-
∂x ∂x чать штрихом:
∂   1 ∂F ∂
tg F = · (5.1.49) F′ = F (5.1.62)
∂x cos2 F ∂x ∂x
∂   1 ∂F Для этого случая правила вычисления полезно
ctg F = − 2 · (5.1.50)
∂x sin F ∂x переписать отдельно:
∂   1 ∂F 0) если F – нульместное числовое выражение,
arcsin F = √ · (5.1.51)
∂x 1−F 2 ∂x то его производная считается нулевой:
∂   1 ∂F
arccos F = − √ · (5.1.52) F ′ = 0, (5.1.63)
∂x 1−F 2 ∂x
∂   1 ∂F 1) производная от переменной x считается рав-
arctg F = · (5.1.53) ной единице:
∂x 1 + F 2 ∂x
∂   1 ∂F x′ = 1, (5.1.64)
arcctg F = − · (5.1.54) 2) для произвольных выражений F и G от пере-
∂x 1 + F 2 ∂x
менной x,
 ′
F + G = F ′ + G′ (5.1.65)
! 5.1.27. К этим правилам следует добавить,  ′
что операции дифференцирования выражений F − G = F ′ − G′ (5.1.66)
по другим переменным определяются по анало-  ′
гии. F · G = F ′ · G + F · G′ (5.1.67)
! 5.1.28. Из формул (5.1.38)-(5.1.61) следует,  ′
F F ′ · G − F · G′
что область допустимых значений переменной = (5.1.68)
G G2
для производного выражения подчиняется ра-
венствам: 3) для произвольного выражения F от перемен-
      ной x,
∂(F + G) ∂F ∂G
D =D ∩D (5.1.55)
∂x ∂x ∂x  ′
      F α = α · F α−1 · F ′ (5.1.69)
∂(F − G) ∂F ∂G
D =D ∩D (5.1.56)  ′
∂x ∂x ∂x
      aF = ln a · aF · F ′ (a > 0) (5.1.70)
∂(F · G) ∂F ∂G  ′
D =D ∩D (5.1.57)
∂x ∂x ∂x eF = eF · F ′ (5.1.71)
 F 
∂( )  ′ 1
D ∂xG =
  (5.1.58) loga F = · F ′ (F > 0) (5.1.72)
= D ∂F ∂G F · ln a
∂x ∩ D ∂x \ {x : G = 0}  ′
 ! 1
∂ G ln F = · F ′ (F > 0) (5.1.73)
D y=F
= F
∂x  ′
n  o (5.1.59) sin F = cos F · F ′ (5.1.74)

= x : F ∈ D ∂G
∂y ∩D ∂F
∂x  ′
cos F = − sin F · F ′ (5.1.75)
Из (5.1.40) и (5.1.36) следует  ′ 1
tg F = · F′ (5.1.76)
Теорема 5.1.9. Если выражение F не содер- cos2 F
 ′ 1
жит переменной x, то ctg F = − 2 · F ′ (5.1.77)
  sin F
∂   ∂  ′ 1
F ·G = F · G (5.1.60) arcsin F = √ · F′ (5.1.78)
∂x ∂x 1 − F2
 ′ 1
Теорема 5.1.10. Если F — одноместное выра- arccos F = − √ · F′ (5.1.79)
жение от переменной x, а G — одноместное вы- 1 − F2
 ′ 1
ражение от переменной y, то для выражения,
arctg F = · F′ (5.1.80)
полученного подстановкой, выполняется равен- 1 + F2
ство  ′ 1
    arcctg F = − · F′ (5.1.81)
∂ ∂ ∂ 1 + F2
G = G · F (5.1.61)
∂x y=F ∂y y=F ∂x
Теорема 5.1.11. Если выражение F не содер-
Производная одноместного числового вы- жит переменной x, то
ражения. Если F – одноместное числовое вы-  ′
ражение, например, от переменной x, то частную F · G = F · G′.
332 Глава 5. ПРОИЗВОДНАЯ

Покажем на примерах, как вычисляется про- ⋄ 5.1.34.


изводная выражения.  ′  ′
earctg x = ey = (5.1.82) =
⋄ 5.1.29. y=arctg x

 ′  ′  ′  ′ = (ey )′ · (arctg x)′ =


3x2 − x + 5 = 3 x2 − x + 5 = y=arctg x
1 1
= 3 · 2x − 1 + 0 = 6x − 1 = ey · = earctg x ·
y=arctg x 1 + x2 1 + x2
⋄ 5.1.30. ⋄ 5.1.35.
 ′  ′  ′  ′  ′
x ln x = x · ln x + x · ln x = sin2 x = y 2 = (5.1.82) =
y=sin x
1
= 1 · ln x + x · = ln x + 1 = (y 2 )′ · (sin x)′ =
x y=sin x

⋄ 5.1.31. = 2y · cos x = 2 sin x · cos x


y=sin x
√ ′
x · sin x = ⋄ 5.1.36.
√ ′ √  ′  ′  ′
= x · sin x + x · sin x = (x2 + x + 1)5 = y 5 =
y=x2 +x+1
1 √
= √ · sin x + x · cos x = (5.1.82) = (y 5 )′ · (x2 + x + 1)′ =
2 x y=x2 +x+1

⋄ 5.1.32. = 5 · y4 · (2x + 1) =
y=x2 +x+1
 ′ = 5 · (x + x + 1)4 · (2x + 1)
2
arctg x
=
x2 + 1
⋄ 5.1.37. Следующая формула доказывается с
(arctg x)′ · (x2 + 1) − (x2 + 1)′ · arctg x помощью теоремы о сложной функции:
= =
(x2 + 1)2
1 1
2 · (x2 + 1) − 2x · arctg x (ln |x|)′ = , (5.1.83)
= x +1 = x
(x2 + 1)2
1 − 2x · arctg x Для доказательства нужно рассмотреть два слу-
= чая: при x > 0 получаем:
(x2 + 1)2
1
⊲⊲ 5.1.33. Продифференцируйте выражения по (ln |x|)′ = (ln x)′ = ,
переменной x: x

1) arctg x + x + arcctg x; а при x < 0 получается то же самое:


2) x arcsin x;  ′  ′
3) arccos x (ln |x|)′ = ln(−x) = ln y =
arcsin x ; y=−x
  ′
4) x2 − 7x + 8 · ex ; 1 1
= ln y · (−x)′ = · (−1) = .
9 27
−x x
5) ln x3 − x − 2x2 ;
sin x+cos x ⊲⊲ 5.1.38. Найдите производную выражений:
6) sin x−cos x ;
√ x √ −x
7) ( 2) + ( 5) ; 1) arctg ex ; 7) earcsin ln x ;
8) 2x · ln |x|; 2) sin x2 ; 8) arcsin ln sin x;
9) ex · log2 x; 3) tg ln x;
9) ln2 (1 + x3 );
4) ln tg x. √
10) log2 x · ln x · log3 x; 10) cos x + x3 ;
5) ln sin ex ; √
Теорема 5.1.12. Если F — одноместное выра- 6) sin earcsin x ; 11) 3 1 + cos x.
жение от переменной x, а G — одноместное вы-
ражение от переменной y, то для выражения, Для вычисления производных выражений ви-
G
полученного подстановкой, выполняется равен- да F полезно заметить формулу:
ство G

 ′ F G = eln F = eG·ln F (5.1.84)


G = G′ · F ′. (5.1.82) (справедливую при F > 0).
y=F y=F
§ 1. Производная 333

⋄ 5.1.39. – выражение сложности k. Тогда по определе-


′ нию, F будет либо суммой, либо разностью, ли-

(xx ) = (5.1.84) = ex·ln x = бо произведением, либо отношением, либо ком-
 ′ позицией выражений сложности < k. Рассмот-
= ey = (ey )′ · (x · ln x)′ = рим каждый из этих случаев.
y=x·ln x y=x·ln x
 Если F = P + Q, где P и Q – выражения
1  
сложности < k, то можно рассмотреть функции
= ex·ln x · 1 · ln x + x · = xx · ln x + 1 .
x
⋄ 5.1.40. p(x) = P, q(x) = Q (5.1.88)
 sin x ′ и по предположению индукции, они будут диф-
cos x = (5.1.84) = ференцируемы на интервале (a, b), причем
 ′
′ p′ (x) = P ′ , x ∈ (a, b),
= esin x·ln cos x = ey = ′ ′ (5.1.89)
y=sin x·ln cos x q (x) = Q , x ∈ (a, b).
= (ey )′ · (sin x · ln cos x)′ =
y=sin x·ln cos x С другой стороны, функция f будет их суммой
 на (a, b):
= ey · (sin x)′ · ln cos x+
y=sin x·ln cos x
  sin x f (x) = p(x) + q(x), x ∈ (a, b),
+ sin x · (ln cos x)′ = cos x ·
 ′  И значит, по теореме 5.1.3, ее производная на
cos x этом интервале будет равна сумме производных
· cos x · ln cos x + sin x · =
cos x p и q:
 sin x  sin2 x 
= cos x · cos x ln cos x − f ′ (x) = p′ (x) + q ′ (x), x ∈ (a, b)
cos x
⊲⊲ 5.1.41. Вычислите производную: Следовательно, функция f ′ должна задаваться
формулой
  x1
1) lnx x; 3) sin x ;
√ x
f ′ (x) = (5.1.23) = p′ (x) + q ′ (x) =
x
2) x ; 4) xe .
= P ′ + Q′ = (5.1.65) = F ′ .

Производная стандартной функции. Объ- То же самое верно для случая разности и про-
ясним теперь, как связана производная число- изведения выражений. Для отношения получа-
вого выражения с производной порождаемой им ем: если F = Q P
, где P и Q – выражения слож-
стандартной функции. Эта связь выражается ности < k, то, во-первых, рассмотрев функции
следующей теоремой, оправдывающей определе- (5.1.88), мы снова по предположению индукции
ние на с.806. получим, что функции p и q дифференцируемы
на интервале (a, b), и их производные опреде-
Теорема 5.1.13. Пусть стандартная функция
ляются тождествами (5.1.89). А, во-вторых, из
f определяется непрерывным числовым выра-
условия (5.1.86) следует, что функция q вдоба-
жением7 F (при заданных значениях парамет-
вок не равна нулю на интервале (a, b):
ров),
f (x) = F . (5.1.85) (a, b) ⊆ {x : q(x) = Q =
6 0}.
Тогда на всяком интервале (a, b) из области
определения производной выражения F , Вместе это означает, что функция

(a, b) ⊆ D(F ′ ). (5.1.86) p(x)


f (x) =
q(x)
функция f дифференцируема и ее производная
определяется на (a, b) производной выражения дифференцируема на интервале (a, b) и ее про-
F: изводная на этом множестве определяется про-
f ′ (x) = F ′ , x ∈ (a, b). (5.1.87) изводной выражения F :
Доказательство. Проведем индукцию по слож- p′ (x) · q(x) − p(x) · q ′ (x)
ности выражения F . Прежде всего, для элемен- f ′ (x) = (5.1.26) = =
q(x)2
тарных непрерывных выражений это очевидно.   ′
Предположим, что это верно для выражений P ′ · Q − P · Q′ P
= = (5.1.68) = = F ′.
сложности, меньшей некоторого k ∈ N. Пусть F Q2 Q
7 Напомним, что непрерывные числовые выражения были определены на с.306.
334 Глава 5. ПРОИЗВОДНАЯ

Остается рассмотреть (самый сложный) слу- а точка p(x0 ) при этом должна быть нулем:
чай композиции. Пусть
p(x0 ) = 0.
F =Q ,
y=P
Чтобы доказать (5.1.87) при x = x0 , зафиксиру-
где Q – непрерывное элементарное выражение от ем какую-нибудь последовательность xn ∈ (a, b),
переменной y, а P – непрерывное выражение от стремящуюся к x0 , но не попадающую в x0 :
переменной x сложности < k. Условие (5.1.86) в
этом случае принимает вид xn −→ x0 , xn 6= x0 .
n→∞

(a, b) ⊆ {x : P ∈ D(Q′ )} ∩ D(P). Рассмотрим соответствующую последова-


Рассмотрим функции тельность p(xn ). Поскольку функция p диффе-
ренцируема в точке x0 , она непрерывна в ней, и
p(x) = P, q(y) = Q. поэтому
p(xn ) −→ p(x0 ) = 0.
По предположению индукции функция p будет n→∞
дифференцируема на интервале (a, b), причем Далее нам нужно рассмотреть два случая:
p′ (x) = P ′ , x ∈ (a, b), – возможна ситуация, когда для почти
всех n ∈ N выполняется p(xn ) 6=
а q должна быть непрерывной элементарной
p(x0 ) = 0;
функцией из списка на с.300.
Чтобы доказать (5.1.87), зафиксируем точку – если же это не так, то для некото-
x0 ∈ (a, b) и рассмотрим два случая. рой подпоследовательности аргумен-
1. Предположим сначала, что число p(x0 ) ле- тов xnk соответствующая последова-
жит во внутренности множества D(Q′ ), то есть тельность значений p(xnk ) будет обла-
существует интервал (α, β) такой, что дать свойством p(xnk ) = p(x0 ) = 0.

p(x0 ) ∈ (α, β) ⊆ D(Q′ ). a. Рассмотрим сначала первый случай, то


(5.1.90)
есть когда для почти всех n ∈ N выполняется
Тогда, поскольку Q – выражение сложности < k, p(xn ) 6= 0. Тогда можно делить и умножать на
по предположению индукции определяемая им p(xn ) − p(x0 ) 6= 0, и мы получим
функция q должна быть дифференцируема на
интервале (α, β), и ее производная должна опре- f (xn ) − f (x0 ) p(xn )b − p(x0 )b
деляться выражением Q : ′ lim = lim =
n→∞ xn − x0 n→∞ xn − x0
q ′ (y) = Q′ , y ∈ (α, β). p(xn )b − p(x0 )b p(xn ) − p(x0 )
= lim · =
n→∞ p(xn ) − p(x0 ) xn − x0
В частности, в точке p(x0 ) должно выполняться
p(xn )b − p(x0 )b p(xn ) − p(x0 )
равенство = lim · lim =
n→∞ p(xn ) − p(x0 ) n→∞ xn − x0
 
q ′ (p(x0 )) = Q′ . =
p(x0 ) = 0
=
y=p(x0 ) p(x0 )b = 0

Теперь по теореме 5.1.4 мы получаем, что ком- p(xn )b p(xn ) − p(x0 )


= lim · lim =
позиция f (x) = q(p(x)) должна быть дифферен- n→∞ p(xn ) n→∞ xn − x0
цируема в точке x0 , и
= lim p(xn )b−1 ·p′ (x0 ) = 0 · p′ (x0 ) = 0
n→∞ | {z }
f ′ (x0 ) = (5.1.27) = q ′ (p(x0 )) · p′ (x0 ) = b>1

= Q′ · P′ = (5.1.61) = F ′
b. После этого рассмотрим случай, когда
y=p(x0 ) x=x0 x=x0
для некоторой подпоследовательности аргумен-
Это формула (5.1.87) с подстановкой x = x0 . тов xnk соответствующая последовательность
2. Предположим далее, что число p(x0 ) ∈ значений p(xnk ) обладает свойством p(xnk ) =
D(Q) лежит на границе множества D(Q′ ), то есть p(x0 ). Тогда последовательность xn можно раз-
не существует интервала (α, β) такого, чтобы вы- бить на две подпоследовательности xnk и xni , та-
полнялось (5.1.90). Поскольку Q – непрерывное кие что
элементарное выражение, одно из перечислен-
ных списке на с.300, такое возможно только в p(xnk ) = p(x0 ), p(xni ) 6= p(x0 )
случае, если Q есть степенное выражение, в ко-
тором показатель степени больше единицы и не Для подпоследовательности xni мы получаем то
N
лежит в 2N−1 , же самое, что и в предыдущем случае:

N f (xni ) − f (x0 ) p(xni )b − p(x0 )b


Q = yb, b ∈ (1, +∞) \ , lim = lim = 0.
2N − 1 i→∞ xni − x0 i→∞ xni − x0
§ 2. Приложения производной 335

А для xnk получаем: (0, +∞), поэтому производная функции f , ес-


ли ее вычислять таким образом, также должна
f (xnk ) − f (x0 ) p(xnk )b − p(x0 )b быть определена только на этом множестве:
lim = lim =
k→∞ xnk − x0 k→∞ xnk − x0 √
3
  ′ ∂ x3 1
вспоминаем, что
= p(xn ) = p(x0 ) = f (x) = = √ · 3 · x2 = 1, x 6= 0
k
∂x 3
3( x3 )2
p(x0 )b − p(x0 )b 0
= lim = lim =0 Таким образом, при изменении выражения, ко-
k→∞ xnk − x0 k→∞ xnk − x0
торым представляется данная функция f , мно-
Вместе все это означает, что функция f долж- жество точек, в которых действует формула, вы-
на иметь нулевую производную в точке x0 : ражающая производную функции f , может ме-
няться. Замена данного представления другим
f ′ (x0 ) = 0, может добавлять или выбрасывать какие-то точ-
ки, в которых формула для производной f будет
и это то же самое, что дает формула (5.1.87) при верна.
x = x0 :
⋄ 5.1.43. Композиция выражений, дифференци-
руемых на любом интервале своей области до-
F = Q′ · P′ = пустимых значений переменной, может быть
x=x0 y=p(x0 ) x=x0
недифференцируема на каких-то интервалах
= b · y b−1 · P′ = 0. своей области допустимых значений перемен-
y=p(x0 ) x=x0
ной. Таким свойством обладает выражение

arcsin sin x
⋄ 5.1.42. Покажем, что при выборе выражения,
представляющего функцию, область допусти- График определяемой им функции
мых значений переменной в его производном вы-
ражении может меняться. Рассмотрим функ- h(x) = arcsin sin x
цию
f (x) = x. представляет собой “пилу”:

Выражение в правой части этой формулы пред-


ставляет собой переменную, поэтому его произ-
водная будет единицей, и значит, производная
функции f также равна единице:
– и видно, что в точках x = π2 + πn, n ∈ Z, эта
′ ∂x
f (x) = x∈R
= 1, функция не дифференцируема. Поэтому ее нель-
∂x зя назвать дифференцируемой на прямой R. Но
Но функцию f можно представить другим выра- при этом составляющие ее функции
жением: √
3
f (x) = x3 f (x) = sin x, g(y) = arcsin y

Производная этого нового выражения будет дифференцируемы на каждом (открытом) ин-


определена только на множестве (−∞, 0) ∪ тервале своей области определения.

§2 Приложения производной
(a) Правило Лопиталя
Теоремы о дифференцируемых функциях позволяют доказать важное правило Лопиталя, с помо-
щью которого удается вычислять “сложные” пределы (которые иначе сосчитать бывает невозмож-
но).

Раскрытие неопределенностей типа 0.


0

Теорема 5.2.1 (правило Лопиталя для предела в точке с неопределенностью 00 ). 8

Пусть функции f и g обладают следующими свойствами:


8 Эта теорема используется в главе 6 при доказательстве асимптотической формулы Тейлора-Пеано 6.2.35
336 Глава 5. ПРОИЗВОДНАЯ

(i) f и g определены и дифференцируемы в некоторой выколотой окрестности (a − ε, a) ∪


(a, a + ε) точки a,
(ii) limx→a f (x) = 0 и limx→a g(x) = 0,
(iii) g ′ (x) 6= 0 при x 6= a,
f ′ (x)
(iv) существует предел limx→a g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→a g(x) , причем

f (x) f ′ (x)
lim = lim ′ (5.2.91)
x→a g(x) x→a g (x)

Доказательство. Чтобы доказать (5.2.91), нужно взять произвольную последовательность xn −→


n→∞
a, xn 6= a, и убедиться, что
f (xn ) f ′ (x)
lim = lim ′
n→∞ g(xn ) x→a g (x)

Доопределим функции f и g в точке a формулами


( (
f (x), если x ∈ (a, b) g(x), если x ∈ (a, b)
f˜(x) = g̃(x) = (5.2.92)
0, если x = a 0, если x = a

Тогда на каждом отрезке [a, xn ] функции f˜(x) и g̃(x) удовлетворяют условиям теоремы Коши 5.1.8:
1) f˜ и g̃ непрерывны на отрезке [a, xn ],
2) f˜ и g̃ дифференцируемы на интервале (a, xn ),
3) g ′ (x) 6= 0 при x ∈ (a, xn ).
Значит, по теореме Коши 5.1.8, существует точка ξn ∈ (a, xn ), такая что

f˜(xn ) − f˜(a) f ′ (ξn )


= ′ ξn ∈ (a, xn )
g̃(xn ) − g̃(a) g (ξn )

Но, по формуле (5.2.92), f˜(a) = g̃(a) = 0, поэтому

f˜(xn ) f ′ (ξn )
= ′ , ξn ∈ (a, xn )
g̃(xn ) g (ξn )

Теперь устремим n к бесконечности:

!
f (xn ) f˜(xn ) f ′ (ξn ) ξn ∈ (a, xn ),
поэтому
f ′ (ξ)
lim = lim = lim ′ = = lim =
n→∞ g(xn ) n→∞ g̃(xn ) n→∞ g (ξn ) ξn −→ a
n→∞
ξ→a g ′ (ξ)
 
неважно, какая f ′ (x)
= буква стоит под = lim ′
знаком предела x→a g (x)

Как раз это нам и нужно было проверить.


Теорема 5.2.2 (правило Лопиталя для предела в бесконечности с неопределенностью 00 ). Пусть
функции f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы на некотором множестве (−∞, −E) ∪ (E; +∞),
(ii) limx→∞ f (x) = 0 и limx→∞ g(x) = 0,
(iii) g ′ (x) 6= 0 при x ∈ (−∞, −E) ∪ (E; +∞),
f ′ (x)
(ii) существует предел limx→∞ g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→∞ g(x) , причем

f (x) f ′ (x)
lim = lim ′ (5.2.93)
x→∞ g(x) x→∞ g (x)
§ 2. Приложения производной 337

Доказательство. Вычислим этот предел с помощью теоремы 5.2.2:


′
f (x) x = 1t , t = 1
x f ( 1t ) f ( 1t )
lim = t −→ 0 = lim 1 = (применяем теорему 5.2.2) = lim  =
x→∞ g(x) t→0 g( ) t→0 g( 1 ) ′
x→∞ t t

f ′ ( 1t ) · − t12 f ′( 1 ) t = x1 , x = 1t , f ′ (x)
= lim ′ 1 1
 = lim ′ 1t = x −→ ∞ = lim
t→0 g ( ) · − 2 t→0 g ( ) x→∞ g ′ (x)
t t t t→0

   
⋄ 5.2.1. Вычислим предел ln cos x 0 применяем
lim = = теорему 5.2.1 =
x→0 x2 0
sin 2x
lim (ln cos x)′ 1
x→0 arctg 3x cos x · (− sin x)
= lim = lim =
x→0 (x2 )′ x→0 2x
Для этого можно воспользоваться теоремой    
− sin x 0 снова
5.2.1: = lim = = применяем =
x→0 2x cos x 0 теорему 5.2.1
   
sin 2x 0 применяем (− sin x)′ − cos x
lim = = теорему 5.2.1 = = lim = lim =
x→0 arctg 3x 0 x→0 (2x cos x) ′ x→0 2 cos x − 2x sin x
(sin 2x)′ cos 2x · 2 cos 0 · 2 −1 1
= lim = lim 3 = 3 = = =−
x→0 (arctg 3x)′ x→0 2−0 2
1+9x2 1+0
1·2 2
= = ⋄ 5.2.4. Теперь пример, где применяется теоре-
3 3
ма 5.2.2:
⋄ 5.2.2. Правило Лопиталя можно применять
π    
несколько раз подряд. Покажем это на следую- 2 − arctg x 0 применяем
lim  = = теорему 5.2.2 =
щем примере: x→+∞ ln 1 + x12 0
    1
1 − cos x 0 применяем
( π2 − arctg x)′ − 1+x 2
lim = = = lim ′ = lim =
теорему 5.2.1 = x→+∞ ln 1 + 1 1
· − x23
x→0 x2 0 x2
x→+∞
1+ x12
 
(1 − cos x)′ sin x 0 1 x2 + 1 x3 x
= lim = lim = = = lim · · = lim = +∞
x→0 (x2 )′ x→0 2x 0 x→+∞ 1 + x2 x2 2 x→+∞ 2
 
снова (sin x)′ cos x 1
= применяем = lim = lim =
теорему 5.2.1 x→0 (2x)′ x→0 ⊲⊲ 5.2.5. Вычислите пределы:
2 2
1. limx→1 sin 3πx
sin 2πx .
⋄ 5.2.3. Еще один пример, где правило Лопита- tg x−x
ля применяется несколько раз: 2. limx→0 sin x−x2 .
tg x−x
3. limx→0 sin x−x .


Раскрытие неопределенностей типа ∞.


Теорема 5.2.3 (правило Лопиталя для предела в точке с неопределенностью ∞ ). Пусть функции
f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы в некоторой окрестности точки a,
(ii) limx→a f (x) = ∞ и limx→a g(x) = ∞,
(iii) g ′ (x) 6= 0 в некоторой выколотой окрестности точки a,
f ′ (x)
(iv) существует предел limx→a g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→a g(x) , причем

f (x) f ′ (x)
lim = lim ′ (5.2.94)
x→a g(x) x→a g (x)
338 Глава 5. ПРОИЗВОДНАЯ

f ′ (x)
Доказательство. 1. Рассмотрим сначала случай, когда предел limx→a g′ (x) конечен:

f ′ (x)
lim =A∈R (5.2.95)
x→a g ′ (x)

Зафиксируем интервал (a − δ, a), на котором g ′ (x) 6= 0. В силу теоремы 5.2.7, функция g(x) должна
быть строго монотонна на (a − δ, a). Поэтому, если взять возрастающую последовательность
x1 < x2 < ... < xn < ... < a, xn −→ a
n→∞

то мы получим, что g(xn ) – строго монотонная бесконечно большая последовательность:


 
g(xn ) −→ +∞, g(x1 ) < g(x2 ) < ... < g(xn ) < ... или g(x1 ) > g(x2 ) > ... > g(xn ) > ...
n→∞

Положив
yn = g(xn ), zn = f (xn )
мы теперь получим, что последовательности yn и zn удовлетворяют всем условиям теоремы Штоль-
ца 3.2.18: во первых,
 
yn −→ ∞, y1 < y2 < ... < yn < ... или y1 > y2 > ... > yn > ...
n→∞
и во вторых,

zn − zn−1 f (xn ) − f (xn−1 )


lim = lim =
n→∞ yn − yn−1 n→∞ g(xn ) − g(xn−1 )
 
по теореме Коши 5.1.8, f ′ (ξn )
= ∃ξn ∈ (xn−1 , xn ) f (xn )−f (xn−1 ) = f ′ (ξn ) = lim = (2.2) = A
g(xn )−g(xn−1 ) g′ (ξn ) n→∞ g ′ (ξn )

Значит, по теореме Штольца 3.2.18,


f (xn ) zn zn − zn−1
lim = lim = lim =A
n→∞ g(xn ) n→∞ yn n→∞ yn − yn−1

Это верно для всякой возрастающей последовательности xn −→ a, значит, по теореме 3.4.4,


n→∞

f (x)
lim =A
x→a−0 g(x)
Аналогично получаем
f (x)
lim =A
x→a+0 g(x)

2. Рассмотрим теперь случай, когда


f ′ (x)
lim =∞
x→a g ′ (x)


Тогда fg′ (x)
(x)
6= 0 в некоторой выколотой окрестности точки a. (Это следует, например, из определения
предела по Коши.) Значит, f ′ (x) 6= 0 в некоторой выколотой окрестности точки a. Таким образом,
получается:
1) f ′ (x) 6= 0 в некоторой выколотой окрестности точки a, и
g′ (x)
2) limx→a f ′ (x) =0
То есть выполняется посылка теоремы, но только с переставленными символами f и g, и с условием,
что предел отношения производных конечен. Поскольку для случая конечного предела теорема уже
доказана, имеем
g(x) g ′ (x)
lim = 0 = lim ′
x→a f (x) x→a f (x)
откуда
f (x) f ′ (x)
lim = ∞ = lim ′
x→a g(x) x→a g (x)
§ 2. Приложения производной 339


Теорема 5.2.4 (правило Лопиталя для предела в бесконечности с неопределенностью ∞ ). Пусть
функции f и g обладают следующими свойствами:
(i) f и g определены и дифференцируемы на некотором множестве (−∞, −E) ∪ (E, +∞),
(ii) limx→∞ f (x) = ∞ и limx→∞ g(x) = ∞,
(iii) g ′ (x) 6= 0 при x ∈ (−∞, −E) ∪ (E, +∞),
f ′ (x)
(ii) существует предел limx→∞ g′ (x) (конечный или бесконечный).
f (x)
Тогда существует предел limx→∞ g(x) , причем

f (x) f ′ (x)
lim = lim ′ (5.2.96)
x→∞ g(x) x→∞ g (x)

Доказательство. Здесь используется тот же прием, что и в доказательстве теоремы 5.2.2:


′
f (x) x = 1t , t = 1
x f ( 1t ) f ( 1t )
lim = t −→ 0 = lim 1 = (применяем теорему 5.2.3) = lim  =
x→∞ g(x) t→0 g( ) t→0 g( 1 ) ′
x→∞ t t

f ′ ( 1t ) · − t12 f ′( 1 ) t = x1 , x = 1t , f ′ (x)
= lim ′ 1 1
 = lim ′ 1t = x −→ ∞ = lim
t→0 g ( ) · − 2 t→0 g ( ) x→∞ g ′ (x)
t t t t→0

⋄ 5.2.6. Вычислим предел ln x  ∞   применяем 


lim = = теорему 5.2.4 =
x→+∞ x ∞
ctg x 1
lim (ln x)′ x
x→+0 ln x = lim = lim = +∞
x→+∞ (x)′ x→+∞ 1
Для этого воспользуемся теоремами 5.2.3 и 5.2.1:
⋄ 5.2.8. Вычислим предел
ctg x  ∞   применяем 
lim = = теорему 5.2.3 = ∞  
x→+0 ln x ∞ x3 применяем
lim = = теорему 5.2.4 =
(ctg x)′ − sin12 x x→+∞ e x ∞
= lim = lim 1 = (x3 )′ 3x2 ∞
x→+0 (ln x)′ x→+0
   x = lim = lim = =
 x→+∞ (ex )′ x→+∞ ex ∞
x 0 применяем  
= − lim 2 = = теорему 5.2.1 = снова (3x2 )′
x→+0 sin x 0 = применяем = lim =
x→+∞ (ex )′
(x)′ 1 теорему 5.2.4
 
= − lim
x→+0 (sin2 x)′
= − lim
x→+0 2 sin x cos x
= 6x  ∞  еще раз
  = lim x = = применяем =
1
x→+∞ e ∞ теорему 5.2.4
= − = −∞  
+0 (6x)′ 6 6
= lim x ′
= lim x = =0
x→+∞ (e ) x→+∞ e ∞
⋄ 5.2.7. Вычислим предел
⊲⊲ 5.2.9. Вычислите пределы:
ln x 2
lim 1. limx→∞ ln ln(1+x )
.
x→+∞ x ( 2 −arctg x)
π

ln(x−a)
2. limx→a ln(ex −ea ) .
Для этого воспользуемся теоремой 5.2.4:
ex +x2 +x
3. limx→+∞ x3 −ex .

Раскрытие неопределенностей 0·∞, ∞−∞, 00 , 1∞ , ∞0 . Покажем на примерах, как с помощью


правил Лопиталя можно вычислять пределы с такими неопределенностями.
340 Глава 5. ПРОИЗВОДНАЯ

2 2
x· ln cos x ln cos x
⋄ 5.2.10 (неопределенность вида 0 · ∞). = elimx→0 cos sin2 x = elimx→0 cos x·limx→0 sin2 x =
ln cos x
 0  
применяем
ln x ∞ = e1·limx→0 sin2 x = e 0 = теорему 5.2.1 =
lim x · ln x = (0 · ∞) = lim 1 = =
x→+0 x→+0 ∞ limx→0 (ln cos x)′ − sin x
cos x

 
x
1
=e (sin2 x)′ = elimx→0 2 sin x cos x =
применяем (ln x)′ 1
= теорему 5.2.3 = lim 1 ′
= lim x1 = −1
= elimx→0 2 cos2 x = e
−1
2 = √
x→+0 ( ) x→+0 − 2
x x e
= − lim x = 0
x→+0
⋄ 5.2.14 (неопределенность вида ∞0 ).
⋄ 5.2.11 (неопределенность вида ∞ − ∞).
1  1
  lim (ln x) x = ∞0 = lim eln(ln x) x =
1 x→+∞ x→+∞
lim − tg x = (∞ − ∞) = ln(ln x) ln(ln x) ∞
x→ π2 cos x = lim e =e x x limx→+∞
= e∞ =
    x→+∞
1 − sin x 0 применяем   x))′
= limπ = = теорему 5.2.1 = применяем limx→+∞ (ln(ln(x)′
x→ 2 cos x 0 = теорему 5.2.4 = e =
(1 − sin x)′ − cos x 1
x ln x 1
= limπ ′
= limπ =0 = elimx→+∞ 1 = elimx→+∞ x ln x = e0 = 1
x→ 2 (cos x) x→ 2 − sin x

⋄ 5.2.12 (неопределенность вида 00 ). ⊲⊲ 5.2.15. Вычислите пределы:


1. limx→+∞ x2 · e−2x .
 x

x→+0
lim xx = 00 = lim eln(x ) = lim ex ln x =
x→+0 x→+0
 ln x · ln(x − 1).
2. limx→1+0
1
  3. limx→0 − ex1−1 .
x
= elimx→+0 x ln x = применяем 0
пример 3.1 = e = 1

4. limx→+∞ ( x− ln x).
x
5. limx→+0 ln x1 .
⋄ 5.2.13 (неопределенность вида 1∞ ). 1
6. limx→+∞ (ln 2x) ln x .
 2
  1
lim cos xctg
2
x
= (1∞ ) = lim e
ln cos xctg x
= 7. limx→0 1 + sin2 x tg2 x .
x→0 x→0 8. limx→1−0 (1 − x)ln x .
2 2
= lim ectg x ln cos x
= elimx→0 ctg x ln cos x 1
= 9. limx→+0 (ln(x + e)) x .
x→0

(b) Построение графика


Монотонность и экстремум.

Теорема 5.2.5 (достаточное условие монотонности). Пусть f – дифференцируемая функция на


интервале (a; b). Тогда
(a) если ее производная положительна всюду на (a; b),

f ′ (x) > 0, x ∈ (a; b), (5.2.97)

f (строго) возрастает на (a; b),


(b) если ее производная отрицательна всюду на (a; b),

f ′ (x) < 0, x ∈ (a; b), (5.2.98)

f (строго) убывает на (a; b).

Доказательство. 1. Пусть выполняется (5.2.97). Тогда для любых x, y ∈ (a; b) таких что x < y
можно по теореме Лагранжа 5.1.7 подобрать точку ξ ∈ (x; y) такую, что

f (y) − f (x)
0 < f ′ (ξ) = ⇒ 0 < f (y) − f (x) ⇒ f (x) < f (y).
y−x
| {z }
<

2. Наоборот, если выполняется (5.2.98), то для любых x, y ∈ (a; b) таких что x < y можно по
§ 2. Приложения производной 341

теореме Лагранжа 5.1.7 подобрать точку ξ ∈ (x; y) такую, что

f (y) − f (x)
0 > f ′ (ξ) = ⇒ 0 > f (y) − f (x) ⇒ f (x) > f (y).
y−x
| {z }

<
0

Теорема 5.2.6 (о нестрогой монотонности). Пусть f – дифференцируемая функция на интервале


(a; b). Тогда
(a) f неубывает на (a; b) в том и только в том случае, если ее производная неотрицательна
всюду на (a; b):
f ′ (x) > 0, x ∈ (a; b)
(b) f невозрастает на (a; b) в том и только в том случае, если ее производная неположи-
тельна всюду на (a; b):
f ′ (x) 6 0, x ∈ (a; b)
Доказательство. Мы докажем утверждение (a), оставив читателю выполнить то же самое для (b)
по аналогии. Если f неубывает,
 
∀x, y ∈ (a; b) x<y =⇒ f (x) 6 f (y)

то, переходя при вычислении производной в точке x ∈ (a; b) к одностороннему пределу, мы получим:
0
>
z }| {
′ f (y) − f (x) f (y) − f (x)
f (x) = lim = lim >0
y→x y−x y→x+0 y−x
| {z }
<

Наоборот, если в любой точке x ∈ (a; b) производная неотрицательна, то для любых x, y ∈ (a; b)
таких, что x < y, подобрав по теореме Лагранжа 5.1.7 точку ξ ∈ (a; b) со свойством (5.1.33), мы
получим:
f (y) − f (x)
= f ′ (ξ) > 0 =⇒ f (y) − f (x) > 0 =⇒ f (x) 6 f (y)
y−x
| {z }
<

Теорема 5.2.7 (о строгой монотонности). 9 Пусть f – дифференцируемая функция на интервале


(a, b), причем ее производная нигде не обращается в нуль:

∀x ∈ (a, b) f ′ (x) 6= 0 (5.2.99)

Тогда f строго монотонна на (a, b), а именно:


— либо, f ′ (x) > 0 всюду на (a, b), и в этом случае f возрастает на (a, b):
 
∀x, y ∈ (a; b) x < y =⇒ f (x) < f (y)

— либо, f ′ (x) < 0 всюду на (a, b), и в этом случае f убывает на (a, b):
 
∀x, y ∈ (a; b) x < y =⇒ f (x) > f (y) .

Доказательству этой теоремы мы предпошлем две леммы.


9 Теорема 5.2.7 используется ниже при доказательстве правила Лопиталя для раскрытия неопределенностей типа


342 Глава 5. ПРОИЗВОДНАЯ

Лемма 5.2.8. В условиях теоремы 5.2.7 для любых трех точек x, y, z ∈ (a; b), связанных неравен-
ством
x < y < z,
выполняется следующее:
(a) условие f (x) < f (z) влечет за собой условие f (x) < f (y) < f (z):

f (x) < f (z) =⇒ f (x) < f (y) < f (z)

(b) условие f (x) > f (z) влечет за собой условие f (x) > f (y) > f (z):

f (x) > f (z) =⇒ f (x) > f (y) > f (z).

Доказательство. Мы докажем утверждение (a) (а (b) читатель сможет доказать по аналогии).


Пусть f (x) < f (z). Нам нужно показать, что число f (y) лежит в интервале (f (x); f (z)):

f (y) ∈ f (x); f (z)

Если это не так, то либо f (y) лежит ниже этого интервала, то есть f (y) 6 f (x), либо, наоборот,
выше, то есть f (y) > f (z). Убедимся, что ни то, ни другое невозможно.
1. Предположим, что f (y) 6 f (x). Если f (y) = f (x), то по теореме Ролля 5.1.6 найдется точка
ξ ∈ (x; y) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) < f (x). Тогда, если обозначить C = f (x), то мы получим

f (y) < f (x) < f (z),


|{z}
k
C

и, по теореме Коши о промежуточном значении 3.3.6, на интервале (y; z) должна найтись такая
точка c ∈ (y; z), что
f (c) = C = f (x)
Теперь опять по теореме Ролля 5.1.6 должна существовать точка ξ ∈ (x; c) такая, что

f ′ (ξ) = 0,

и это снова противоречит условию (5.2.99). Мы получаем, что неравенство f (y) 6 f (x) невозможно.
2. Проверим, что будет, если f (y) > f (z). Если f (y) = f (z), то по теореме Ролля 5.1.6 найдется
точка ξ ∈ (y; z) такая, что
f ′ (ξ) = 0,
что невозможно. Значит, должно быть f (y) > f (z). Тогда, если обозначить C = f (z), то мы получим

f (x) < f (z) < f (y),


|{z}
k
C

и, по теореме Коши о промежуточном значении 3.3.6, на интервале (x; y) должна найтись такая
точка c ∈ (x; y), что
f (c) = C = f (z)
Теперь опять по теореме Ролля 5.1.6 должна существовать точка ξ ∈ (c; z) такая, что

f ′ (ξ) = 0,

и это снова противоречит условию (5.2.99). Мы получаем, что неравенство f (y) > f (x) тоже невоз-
можно.
Лемма 5.2.9. В условиях теоремы 5.2.7 пусть α, β ∈ (a, b) – произвольные точки, связанные
неравенством
α < β,
Тогда:
§ 2. Приложения производной 343

(a) если f (α) < f (β), то функция f возрастает на интервале (α; β):
  
f (α) < f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) < f (y)

(b) если f (α) > f (β), то функция f убывает на интервале (α; β):
  
f (α) > f (β) =⇒ ∀x, y ∈ (α; β) x < y =⇒ f (x) > f (y)

(c) равенство f (α) = f (β) невозможно.


Доказательство. 1. Если f (α) < f (β), то мы получаем логическую цепочку:

f (α) < f (β), α<x<β


| {z }
лемма 5.2.8(a) ⇓
f (α) < f (x) < f (β), x<y<β
| {z }
лемма 5.2.8(a) ⇓
f (x) < f (y) < f (β)
| {z }

f (x) < f (y)
2. Наоборот, если f (α) > f (β), то мы получаем цепочку:

f (α) > f (β), α<x<β


| {z }
лемма 5.2.8(b) ⇓
f (α) > f (x) > f (β), x<y<β
| {z }
лемма 5.2.8(b) ⇓
f (x) > f (y) > f (β)
| {z }

f (x) > f (y)
3. Остается убедиться, что равенство f (α) = f (β) невозможно. Действительно, если бы оно
выполнялось, то мы получили бы по теореме Ролля 5.1.6, что f ′ (ξ) = 0 для некоторого ξ ∈ (α, β), а
это противоречит условию (5.2.99).
Доказательство теоремы 5.2.7. Зафиксируем произвольные точки α, β ∈ (a, b), связанные нера-
венством
α<β
По лемме 5.2.9(c), f (α) 6= f (β), значит должно быть либо f (α) < f (β), либо f (α) > f (β). Рассмотрим
каждый случай отдельно.
1. Пусть f (α) < f (β). Тогда по лемме 5.2.9(a), функция f возрастает на интервале (α; β). Если
теперь выбрать какие-нибудь точки x, y так, чтобы

a<x<α<β<y<b (5.2.100)

то снова по лемме 5.2.9 функция f должна быть строго монотонной на интервале (x; y). При этом,
как мы уже поняли, f возрастает на меньшем интервале (α; β), значит, она возрастает и на большем
интервале (x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (5.2.100), мы
получаем, что f возрастает на всем интервале (a; b).
Далее получается цепочка:

f возрастает на интервале (a; b)

⇓ теорема 5.2.6(a)

f (x) > 0, x ∈ (a; b)
344 Глава 5. ПРОИЗВОДНАЯ

⇓ (5.2.99)

f ′ (x) > 0, x ∈ (a; b)

2. Пусть наоборот, f (α) > f (β). Тогда по лемме 5.2.9(b), функция f убывает на интервале
(α; β). Если теперь выбрать какие-нибудь точки x, y так, чтобы выполнялось (5.2.100), то снова
по лемме 5.2.9 функция f должна быть строго монотонной на интервале (x; y). При этом, как мы
уже поняли, f убывает на меньшем интервале (α; β), значит, она убывает и на большем интервале
(x; y). Поскольку это верно для любых x, y, удовлетворяющих условию (5.2.100), мы получаем, что
f убывает на всем интервале (a; b).
Далее получается цепочка:
f убывает на интервале (a; b)

⇓ теорема 5.2.6(b)

f ′ (x) 6 0, x ∈ (a; b)

⇓ (5.2.99)

f ′ (x) < 0, x ∈ (a; b)

• Точка x0 называется
– точкой строгого локального максимума функции f , если в некоторой окрестно-
сти (x0 − δ; x0 + δ) точки x0 выполняется неравенство

f (x) < f (x0 )

– точкой строгого локального минимума функции f , если в некоторой окрестно-


сти (x0 − δ; x0 + δ) точки x0 выполняется неравенство

f (x) > f (x0 )

– точкой локального экстремума функции f , если она является точкой строгого


локального минимума, или строгого локального максимума.

Теорема 5.2.10 (необходимое условие локального экстремума). Если функция f имеет в точке
x0 локальный экстремум и дифференцируема в этой точке, то

f ′ (x0 ) = 0

Доказательство. В точке x0 функция f достигает максимума или минимума на некотором интер-


вале (x0 − δ; x0 + δ), значит, по теореме Ферма 5.1.5, f ′ (x0 ) = 0.

Теорема 5.2.11 (достаточное условие локального экстремума). Пусть функция f дифференцируема


в некоторой окрестности (x0 − δ; x0 + δ) точки x0 . Тогда
– если f ′ (x) > 0 при x ∈ (x0 − δ; x0 ), и f ′ (x) < 0 при x ∈ (x0 ; x0 + δ) (то есть при переходе
через точку x0 производная меняет знак с + на −), то x0 – точка строгого локального
максимума;
– если f ′ (x) < 0 при x ∈ (x0 − δ; x0 ), и f ′ (x) > 0 при x ∈ (x0 ; x0 + δ) (то есть при переходе
через точку x0 производная меняет знак с − на +), то x0 – точка строгого локального
минимума.

Доказательство. Пусть при переходе через точку x0 производная меняет знак с − на +. Тогда
по теореме 5.2.7, на интервале (x0 − δ; x0 ) функция f строго убывает, а на интервале (x0 ; x0 + δ)
функция f строго возрастает, значит x0 – точка локального минимума.
Аналогично рассматривается случай, когда при переходе через точку x0 производная меняет
знак с − на +.
§ 2. Приложения производной 345

Выпуклость и перегиб. Пусть функция f определена на интервале (a; b) и пусть a < α < β < b.
Проведем хорду через точки (α; f (α)) и (β; f (β)) на графике функции f :

Уравнение этой хорды имеет вид


f (β) · (x − α) + f (α) · (β − x)
y=
β−α
Теорема 5.2.12. Для функции f : (a, b) → R следующие условия эквивалентны:
(i) для любых двух точек α, β : a < α < β < b график функции f на интервале (α, β) лежит
ниже хорды:
f (β) · (x − α) + f (α) · (β − x)
f (x) < , a<α<x<β<b (5.2.101)
β−α

(ii) для любых двух точек α 6= β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство

f (λ · α + (1 − λ) · β) < λ · f (α) + (1 − λ) · f (β) (5.2.102)

• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вниз на интервале (a, b).
Доказательство. 1. (i)⇒(ii). Пусть выполнено (i) и пусть a < α < β < b. Зафиксируем λ ∈ (0, 1).
Тогда, положив
x = λ · α + (1 − λ) · β
мы получим:
β−x β − λ · α − (1 − λ) · β −λ · α + λ · β λ · (β − α)
= = = = λ,
β−α β−α β−α β−α
x−α λ · α + (1 − λ) · β − α (1 − λ) · β − (1 − λ) · α (1 − λ) · (β − α)
= = = = 1 − λ,
β−α β−α β−α β−α
поэтому

f (β) · (x − α) + f (α) · (β − x)
f (λ · α + (1 − λ) · β) = f (x) < (5.2.101) < =
β−α
x−α β−x
= ·f (β) + ·f (α) = λ · f (α) + (1 − λ) · f (β).
β−α β−α
| {z } | {z }
1−λ λ

Это доказывает неравенство (5.2.102) для случая α < β. Если β < α, то по уже доказанному мы
получим
f (λ · β + (1 − λ) · α) < λ · f (β) + (1 − λ) · f (α), λ ∈ (0, 1).
346 Глава 5. ПРОИЗВОДНАЯ

Обозначив t = 1 − λ, мы превратим это неравенство в такое:

f ((1 − t) · β + t · α) < (1 − t) · f (β) + t · f (α), t ∈ (0, 1).

И теперь если сделать новую замену λ = t, мы получим

f ((1 − λ) · β + λ · α) < (1 − λ) · f (β) + λ · f (α), λ ∈ (0, 1).

и это будет то же неравенство (5.2.102), но уже с β < α.


2. (ii)⇒(i). Пусть выполнено (ii) и пусть a < α < β < b. Зафиксируем x ∈ (α, β). Тогда, положив

β−x
λ=
β−α
мы получим:
β−x x−α
1−λ=1− = ,
β−α β−α
β−x x−α β ·α−x·α+x·β −α·β
λ · α + (1 − λ) · β = ·α+ ·β = = x,
β−α β−α β−α
поэтому

f (x) = f (λ · α + (1 − λ) · β) < (5.2.102) < λ · f (α) + (1 − λ) · f (β) =


x−α β−x f (β) · (x − α) + f (α) · (β − x)
= ·f (β) + ·f (α) =
β−α β−α β−α
| {z } | {z }
1−λ λ

Точно так же доказывается

Теорема 5.2.13. Для функции f : (a, b) → R следующие условия эквивалентны:


(i) f для любых двух точек α, β : a < α < β < b график функции f на интервале (α, β)
лежит выше хорды:

f (β) · (x − α) + f (α) · (β − x)
< f (x), a<α<x<β<b (5.2.103)
β−α

(ii) для любых двух точек α, β ∈ (a, b) и любого числа λ ∈ (0, 1) выполняется неравенство

f (λ · α + (1 − λ) · β) > λ · f (α) + (1 − λ) · f (β) (5.2.104)

• Если выполняются условия (i) и (ii) этой теоремы, то говорят, что функция f выпукла
вверх на интервале (a, b).

Теорема 5.2.14 (достаточное условие выпуклости). Пусть функция f дважды дифференцируема


на интервале (a; b). Тогда
– если f ′′ (x) < 0 при x ∈ (a; b), то функция f выпукла вверх на интервале (a; b);
– если f ′′ (x) > 0 при x ∈ (a; b), то функция f выпукла вниз на интервале (a; b).
§ 2. Приложения производной 347

Доказательство. Рассмотрим разность между хордой и функцией:

f (β) · (x − α) + f (α) · (β − x) f (β) · (x − α) + f (α) · (β − x) − f (x) · (β − α)


− f (x) = =
β−α β−α
f (β) · (x − α) + f (α) · (β − x) − f (x) · (β − α) + f (x) · (x − x)
= =
β−α
[f (β) − f (x)] · (x − α) − [f (x) − f (α)] · (β − x)
= =
β−α
 
применяем теорему Лагранжа 5.1.7
для f на отрезках [x; β] и [α; x]:
 
= найдутся θ ∈ [x; β] и η ∈ [α; x]  =
такие что f (β) − f (x) = f ′ (θ) · (β − x)
и f (x) − f (α) = f ′ (η) · (x − α)

f ′ (θ) · (β − x) · (x − α) − f ′ (η) · (x − α) · (β − x) [f ′ (θ) − f ′ (η)] · (β − x) · (x − α)


= = =
β−α β−α
снова применяем теорему Лагранжа 5.1.7
!
но уже для f ′ (x) на отрезке [η; θ]: (θ − η) · (β − x) · (x − α)
= найдется ξ ∈ [η; θ] = f ′′ (ξ) ·
такое что f ′ (θ) − f ′ (η) = f ′′ (ξ) · (θ − η)
β−α

Заметим теперь, что (θ − η) > 0, (β − x) > 0, (x − α) > 0, (β − α) > 0. Значит, если f ′′ (x) < 0
при x ∈ (a; b), то, в частности, f ′′ (ξ) < 0, и поэтому

f (β) · (x − α) + f (α) · (β − x)
− f (x) < 0
β−α

(то есть функция f выпукла вверх на интервале (a; b)). Если же f ′′ (x) > 0 при x ∈ (a; b), то, в
частности, f ′′ (ξ) > 0, и поэтому

f (β) · (x − α) + f (α) · (β − x)
− f (x) < 0
β−α

(то есть функция f выпукла вниз на интервале (a; b)).

• Точка x0 называется точкой перегиба функции f , если при переходе через x0 выпуклость
вверх меняется на выпуклость вниз (или наоборот). Иными словами, имеется некоторая
окрестность (x0 − δ; x0 + δ) такая, что на интервале (x0 − δ; x0 ) функция f выпукла вверх,
а на интервале (x0 ; x0 + δ) она выпукла вниз (или наоборот, на (x0 − δ; x0 ) функция f
выпукла вниз, а на интервале (x0 ; x0 + δ) она выпукла вверх).

Теорема 5.2.15 (о точках перегиба). Пусть функция f дважды дифференцируема на интервале


(a; b), причем ее вторая производная f ′′ непрерывна на (a; b). Тогда если точка x0 ∈ (a; b) – точка
перегиба функции f , то f ′′ (x0 ) = 0.

Доказательство. Предположим, что f ′′ (x0 ) 6= 0, тогда либо f ′′ (x0 ) < 0, либо f ′′ (x0 ) > 0. Если
f ′′ (x0 ) < 0, то, по теореме о сохранении знака 3.3.4, f ′′ (x) < 0 для всех x из некоторой окрестности
(x0 − δ; x0 + δ) точки x0 . Поэтому по теореме 5.2.14 этой главы, f будет выпукла вверх всюду в
окрестности (x0 −δ; x0 +δ), и значит x0 не может быть точкой перегиба. Аналогично, если f ′′ (x0 ) > 0,
то по теореме о сохранении знака 3.3.4, f ′′ (x) > 0 для всех x из некоторой окрестности (x0 − δ; x0 +
δ) точки x0 . Поэтому по теореме 5.2.14 этой главы, f будет выпукла вверх всюду в окрестности
(x0 − δ; x0 + δ), и опять x0 не может быть точкой перегиба.

Следующее наблюдение довольно неожиданно.

Теорема 5.2.16. Если функция f выпукла (вниз или вверх) на интервале (a, b), то она непрерывна
на (a, b).

Доказательство. Будем считать, что f выпукла вниз. Зафиксируем точку x ∈ (a, b) и число h > 0
так, чтобы
a < x − h < x < x + h < b.
Покажем, что если
λn ∈ (0, 1) & λn −→ 0 (5.2.105)
n→∞
348 Глава 5. ПРОИЗВОДНАЯ

то
f (x − λn · h) −→ f (x) & f (x + λn · h) −→ f (x). (5.2.106)
n→∞ n→∞

Этого достаточно, чтобы сделать вывод, что из

xn −→ x
n→∞

следует
f (xn ) −→ f (x).
n→∞

1. Зафиксируем ε > 0 и покажем, что из условий (5.2.105) следует, что неравенство

f (x − λn · h) < f (x) + ε (5.2.107)

верно для почти всех n ∈ N. Это следует из того, что в цепочке


 
f (x − λn · h) = f (1 − λn ) · x + λn · (x − h) < (5.2.102) < (1 − λn ) · f (x) + λn · f (x − h) < f (x) + ε
↓ ↓
0 0

последнее неравенство верно для почти всех n ∈ N.


2. Покажем, что при ε > 0 из условий (5.2.105) следует, что неравенство

f (x + λn · h) < f (x) + ε (5.2.108)

тоже верно для почти всех n ∈ N. Это следует из того, что в цепочке
 
f (x + λn · h) = f (1 − λn ) · x + λn · (x + h) < (5.2.102) < (1 − λn ) · f (x) + λn · f (x + h) < f (x) + ε
↓ ↓
0 0

последнее неравенство верно для почти всех n ∈ N.


3. Теперь заметим, что
x − λ · h x + λ · h 1 1
n n
f (x) = f + < (5.2.102) < · f (x − λn · h) + · f (x + λn · h)
2 2 2 2
и поэтому
2f (x) < f (x − λn · h) + f (x + λn · h).
Отсюда следует, во-первых, что для почти всех n ∈ N выполняются неравенства

2f (x) < f (x − λn · h) + f (x + λn · h) < f (x − λn · h) + f (x) + ε


| {z }
>

(5.2.108)
f (x) + ε


2f (x) < f (x − λn · h) + f (x) + ε

f (x) < f (x − λn · h) + ε

f (x) − ε < f (x − λn · h)
⇓ (5.2.107)
f (x) − ε < f (x − λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому

f (x − λn · h) −→ f (x).
n→∞

И, во-вторых, для почти всех n ∈ N выполняются неравенства

2f (x) < f (x − λn · h) +f (x + λn · h) < f (x) + ε + f (x + λn · h)


| {z }
>

(5.2.107)
f (x) + ε
§ 2. Приложения производной 349


2f (x) < f (x) + ε + f (x + λn · h)

f (x) < ε + f (x + λn · h)

f (x) − ε < f (x + λn · h)
⇓ (5.2.108)
f (x) − ε < f (x + λn · h) < f (x) + ε.
Это верно для любого ε > 0, и поэтому
f (x + λn · h) −→ f (x).
n→∞

Мы доказали (5.2.106).

⋄ 5.2.16. Выпуклая функция не обязана быть и [0, +∞), а потом нужно заметить, что хорда,
дифференцируемой. Например, функция соединяющая точки с аргументами, лежащими
справа и слева от нуля, α < 0 < β, будет лежать
f (x) = e|x|
выше двух хорд, соединяющих аргумент α с ар-
не дифференцируема в точке 0, но выпукла вниз. гументом 0, и 0 с β. И поэтому эта хорда будет
Это доказывается сначала для участков (−∞, 0] выше графика f на участке (α, β).

Асимптоты. Асимптотой называется прямая, к которой график функции “бесконечно прибли-


жается”. Более точное определение этому понятию выглядит так:
• Пусть функция f обладает следующим свойством:
lim f (x) = ∞ или lim f (x) = ∞
x→x0 −0 x→x0 +0

Тогда прямая
x = x0
называется вертикальной асимптотой функции f .
• Пусть функция f обладает следующим свойством:
lim (f (x) − (k · x + b)) = 0 или lim (f (x) − (k · x + b)) = 0
x→+∞ x→−∞

Тогда прямая
y =k·x+b
называется наклонной асимптотой функции f (при x → +∞ или x → −∞).

⋄ 5.2.17. Функция f (x) = 1


x имеет вертикаль- ⋄ 5.2.18. Функция f (x) = 1
x + x имеет наклон-
ную асимпоту x = 0. ную асимпоту y = x.

Теорема 5.2.17 (об асимптотах). Если прямая y = k · x + b является наклонной асимптотой


функции f при x → +∞ (или x → −∞), то
!
f (x) f (x)
k = lim или k = lim (5.2.109)
x→+∞ x x→−∞ x

и !
b = lim (f (x) − k · x) или b = lim (f (x) − k · x) (5.2.110)
x→+∞ x→−∞
350 Глава 5. ПРОИЗВОДНАЯ

Доказательство. Если
lim (f (x) − (k · x + b)) = 0
x→+∞
то  
f (x) = (k · x + b) + α(x) где α(x) −→ 0
x→+∞

поэтому  
f (x) b α(x)
lim = lim k+ + =k
x→+∞ x x→+∞ x x
и, кроме того,
lim (f (x) − k · x) = lim (b + α(x)) = b
x→+∞ x→+∞

Аналогично рассматривается случай x → −∞.

Общая схема построения графика функции.


Построение графика функции удобно проводить по следующей схеме.
1. Находится область определения; обычно она состоит из интервалов (или отрезков), концы кото-
рых удобно называть специальным термином, например, особыми точками.10
2. Находятся пределы функции в особых точках и вертикальные асимптоты.
3. Находятся пределы на бесконечности и наклонные асимптоты.
4. Вычисляется первая производная, с помощью которой затем находятся интервалы монотонности
и точки экстремума.
5. Вычисляется вторая производная, с помощью которой затем находятся интервалы выпуклости
вверх и вниз и точки перегиба.
6. С учетом полученных данных строится график.

Объясним эту схему на примерах. Из этих равенств следует, что прямая x = 1 явля-
ется вертикальной асимптотой нашей функции.
График стандартной функции без симмет- 3. Вычисляем пределы в бесконечности:
рий.
x2 + 1 x + x1
⋄ 5.2.19. Построим график следующей функ- lim f (x) = lim = lim =
x→+∞ x→+∞ x − 1 x→+∞ 1 − 1
x
ции: !
1
x2 + 1 +∞ + +∞
f (x) = = 1 = +∞
x−1 1 − +∞
1. Сначала находим область определения.
Она определяется неравенством x − 1 6= 0, и по-
x2 + 1 x + x1
этому имеет вид (−∞; 1) ∪ (1; +∞). Точка x = 1 lim f (x) = lim = lim =
x→−∞ x→−∞ x − 1 x→−∞ 1 − 1
является особой точкой функции f . x
!
2. Затем находим пределы функции в особых −∞ + −∞ 1
точках: = 1 = −∞
1 − −∞
x2 + 1 12 + 1
lim f (x) = lim = = Ищем наклонные асимптоты по формулам
x→1−0 x→1−0 x − 1 1−0−1
  (5.2.109) и (5.2.110):
2
= = −∞
−0 f (x) x2 + 1
k+ = lim = lim 2 =
x→+∞ x x→+∞ x − x

1 + x12
x2 + 1 12 + 1 = lim =1
lim f (x) = lim = = x→+∞ 1 − 1
x→1+0 x→1+0 x − 1 1+0−1 x
 
2
= = +∞
+0 b+ = lim [f (x) − k+ · x] =
x→+∞
10 Более точное определение: особой точкой функции f называется любая граничная точка области определения
функции f , то есть такая точка a, в любой окрестности которой (a−ε, a+ε) содержатся точки, в которых f определена
и точки, в которых f не определена.
§ 2. Приложения производной 351
 
x2 + 1 Рисуем картинку, изображающую интервалы
= lim −1·x =
x→+∞ x − 1 знакопостоянства второй производной, а значит,
x2 + 1 − x(x − 1) интервалы выпуклости вверх и вниз функции f :
= lim =
x→+∞ x−1
x2 + 1 − x2 + x 1+x
= lim = lim =
x→+∞ x−1 x→+∞ x − 1
1
+1
= lim x 1 = 1
x→+∞ 1 −
x

Значит, прямая 6. Рисуем график:


y =x+1

является асимптотой при x → +∞. Аналогично


получаем, что k− = 1 и b− = 1, и поэтому та
же прямая y = x + 1 является асимптотой при
x → −∞.
4. Находим производную:
 ′
x2 + 1
f ′ (x) = =
x−1
(x2 + 1)′ · (x − 1) − (x − 1)′ · (x2 + 1)
= =
(x − 1)2
2x · (x − 1) − 1 · (x2 + 1) x2 − 2x − 1
= = ⋄ 5.2.20. Построим график функции
(x − 1)2 (x − 1)2 p
3
f (x) = x3 − 3x
Решаем уравнение f ′ (x) = 0:
1. Очевидно, функция определена всюду, по-
x2 − 2x − 1
f ′ (x) = 0 ⇔ =0 ⇔ этому область определения есть вся числовая
(x − 1)2 прямая R = (−∞; +∞).
(
x2 − 2x − 1 = 0 2. Функция непрерывна везде на R =
⇔ ⇔ (−∞; +∞), поэтому вертикальных асимптот нет.
(x − 1)2 6= 0
√ √ 3. Вычисляем пределы в бесконечности:
⇔ x = 1 − 2 или x = 1 + 2 p
3
lim f (x) = lim x3 − 3x =
Рисуем картинку, изображающую интервалы x→+∞ x→+∞
знакопостоянства производной, а значит, интер- r
3 3
валы монотонности функции f : = lim x · 1− = (+∞ · 1) = +∞
x→+∞ x2

p
3
lim f (x) = lim x3 − 3x =
x→−∞ x→−∞
r
3 3
= lim x · 1− = (−∞ · 1) = −∞
x→−∞ x2
5. Находим вторую производную: Ищем наклонные асимптоты по формулам
 ′ (5.2.109) и (5.2.110):
x2 − 2x − 1
f ′′ (x) = = √
3
(x − 1)2 f (x) x3 − 3x
k+ = lim = lim =
(x2 − 2x − 1)′ · (x − 1)2 − ((x − 1)2 )′ · (x2 − 2x − 1) x→+∞ x x→+∞ x
= = r
(x − 1)4
3 3
2
(2x − 2) · (x − 1) − 2(x − 1) · (x − 2x − 1) 2 = lim 1− =1
= = x→+∞ x2
(x − 1)4
4
= b+ = lim [f (x) − k+ · x] =
(x − 1)3 x→+∞
hp i
3
Решаем уравнение f ′′ (x) = 0: = lim x3 − 3x − 1 · x =
x→+∞
q  q q 
4 3 3
x − 3x − x ·
3
(x3 − 3x)2 + x ·
3 3
x − 3x + x2
f ′′ (x) = 0 ⇔ =0 ⇔ x∈∅ = lim q q =
(x − 1)3 x→+∞ 3
(x3 − 3x)2 + x ·
3 3
x − 3x + x2
352 Глава 5. ПРОИЗВОДНАЯ
p
3
(x3 − 3x)3 − x3 ⊲⊲ 5.2.21. Постройте графики следующих функ-
= lim p √ =
x→+∞ 3 (x3 − 3x)2 + x · 3 x3 − 3x + x2 ций:
−3x √
= lim p √ = 1. y = 3
x2 − x3 .
x→+∞ 3
(x − 3x) + x · 3 x3 − 3x + x2
3 2
x2
−3 2. y = x−1 .
= lim q √ = q
x→+∞ 3
(1 − x32 ) · (x3 − 3x) + 3 x3 − 3x + x 3. y = 5 x6
x−a .
−3 x3
= lim q q  =0 4. y = 4(x−2)2 .
x→+∞
x · 3 (1 − 3 2
1− 3 p
x2 ) + +1
3
x2 5. y = x 3 (x + 1)2 .
q
Значит, прямая y = x является асимптотой при 3 −2x2
6. y = x x−3 .
x → +∞. Аналогично получаем, что k− = 1 и
x2 −4 5
b− = 0, и поэтому та же прямая y = x является 7. y = x · e− 3x .
асимптотой при x → −∞. 8. y = x + 3x2 − 9x − 3.
3
4. Находим производную: √
9. y = x + x2 − 1.
p ′ (x3 − 3x)′
f ′ (x) =
3
x3 − 3x = √ 2 =
3 3 x3 − 3x
3x2 − 3 x2 − 1
= √ 2 = 2
3 3 x3 − 3x (x3 − 3x) 3
Решаем уравнение f ′ (x) = 0: Четные и нечетные функции. Построение
графика упрощается, если функция обладает
x2 − 1 какими-то симметриями (то есть в каком-нибудь
f ′ (x) = 0 ⇔ 2 =0 ⇔ смысле инвариантна относительно некоторых
(x3 − 3x) 3
( преобразований прямой). Мы расмотрим три из
x2 − 1 = 0 них: четность, нечетность и периодичность.
⇔ ⇔ x ∈ {−1; 1}
x3 − 3x 6= 0
Напомним, что четные и нечетные функции
Рисуем картинку, изображающую интервалы мы определили на с.192 как удовлетворяющие
знакопостоянства производной, а значит, интер- тождествам
валы монотонности функции f :

f (−x) = f (x) (четность),

5. Находим вторую производную:


!′ f (−x) = −f (x) (нечетность)
′′ x2 − 1 x2 + 1
f (x) = 2 = ... = −2 5
(x3 − 3x) 3 (x3 − 3x) 3
Решаем уравнение f ′′ (x) = 0: Там же отмечалось, что график четной функции
4
2x + x + 1 2 должен быть симметричен относительно оси ор-
f ′′ (x) = 0 ⇔ −2 5 =0 ⇔ x∈∅ динат, а график нечетной – центрально симмет-
(x3 − 3x) 3 ричен относительно начала координат.
Рисуем картинку, изображающую интервалы
знакопостоянства второй производной, а значит, Отсюда следует, что если нам нужно постро-
интервалы выпуклости вверх и вниз функции f : ить график четной функции, то его достаточ-
но построить на правой полуплоскости, а затем,
чтобы получить окончательный результат, отоб-
разить полученную картинку налево симметрич-
но относительно оси ординат. Точно так же гра-
фик нечетной функции достаточно строить на
правой полуплоскости, а потом отобразить цен-
трально симметрично относительно начала коор-
6. Рисуем график: динат. Здесь мы рассмотрим примеры.
§ 2. Приложения производной 353

⋄ 5.2.22. Постройте график функции: ства второй производной:

f (x) = x2 · ln |x|

1. Область определения: (−∞; 0) ∪ (0; +∞).


Точка x = 0 является особой. Функция является
четной, поэтому нам достаточно построить гра-
фик только на интервале x ∈ (0; +∞).
6. График функции для x > 0:
2. Поскольку нас интересует только область
x ∈ (0; +∞), в особой точке x = 0 мы вычисляем
односторонний предел:

lim x2 · ln |x| = lim x2 · ln x = (0 · ∞) =


x→+0 x→+0
ln x  ∞ 
= lim −2 = =
x→+0 x ∞
 
применяем x−1 x2
= правило = lim = lim =0
Лопиталя x→+0 −2x−3 x→+0 −2 Отобразив эту картинку симметрично относи-
тельно оси ординат, мы получим полный график
Значит, вертикальных асимптот нет. нашей функции:
3. Наклонная асимптота нас тоже интересует
только при x → +∞:

f (x)
k+ = lim = lim x · ln |x| =
x→+∞ x x→+∞

= lim x · ln x = ∞
x→+∞

Это означает, что и наклонных асимптот нет.


⋄ 5.2.23. Постройте график функции:
4. Производная:

f (x) = 2x − arcsin x
1
f ′ (x) = (x2 · ln |x|)′ = 2x · ln |x| + x2 · =
x
= x · (2 ln |x| + 1) 1. Область определения: [−1; 1]. Точки x = −1
и x = 1 являются особыми. Функция являет-
ся нечетной, поэтому нам достаточно построить
При x > 0 получаем f ′ (x) = 0 ⇔ 2 ln x + 1 = график только на отрезке x ∈ [0; 1].
1
0 ⇔ ln x = − 21 ⇔ x = e− 2 . Интервалы знакопо-
стоянства производной: 2. Предел в особой точке конечный

π
lim (2x − arcsin x) = 2 − arcsin 1 = 2 − ,
x→1−0 2

значит вертикальных асимптот нет.


3. Наклонных асимптот тоже нет, поскольку
x не может стремиться к бесконечности.
4. Производная:
5. Вторая производная:

 ′ 1
′′ 2 f ′ (x) = (2x − arcsin x)′ = 2 − √
f (x) = x·(2 ln |x|+1) = (2 ln |x|+1)+x· = 1 − x2
x
= 2 ln |x| + 2 = 2(ln |x| + 1) 1
При x > 0 получаем f ′ (x) = 0 ⇔ 2 − √1−x 2 =
1
√ 1 2 1
2
При x > 0 получаем f ′′ (x) = 0 ⇔ ln x + 1 = 0 ⇔ 0 ⇔ 2 = 1−x2 √⇔ 1 − x = 2 ⇔ 1 − x = 4 ⇔

−1 2 3
ln x = −1 ⇔ x = e . Интервалы знакопостоян- x = 4 ⇔ x = 23 . Интервалы знакопостоянства
354 Глава 5. ПРОИЗВОДНАЯ

производной: достаточно построить на отрезке вида [a; a +


T ], а затем, чтобы получить окончательный ре-
зультат, сдвинуть полученную картинку влево и
вправо нужное число раз (чтобы зрителю ста-
ло понятно, что сдвигать можно сколько угодно
раз с тем же результатом). Здесь мы рассмотрим
примеры.
⋄ 5.2.24. Постройте график функции:
5. Вторая производная:
f (x) = sin3 x + cos3 x
 1 ′  ′
f ′′ (x) = 2 − √
1
= 2 − (1 − x2 )− 2 = 1. Область определения: (−∞; +∞). Функция
1 − x2 является периодической с периодом T = 2π, по-
1 3 этому нам достаточно построить график только
3
= (1 − x2 )− 2 · (−2x) = −x · (1 − x2 )− 2
2 на отрезке x ∈ [0; 2π].
′′ 2. Особых точек нет, значит и вертикальных
При x > 0 получаем f (x) = 0 ⇔ −x · (1 −
3 асимптот нет.
x2 )− 2 = 0 ⇔ x = 0. Интервалы знакопостоян- 3. Наклонные асимптоты мы не ищем, по-
ства второй производной: скольку нас интересует только отрезок x ∈
[0; 2π].
4. Производная:

f ′ (x) = 3 sin2 x cos x − 3 cos2 x sin x =


= 3 sin x cos x(sin x − cos x)
При x ∈ [0; 2π] получаем
6. График функции для x > 0: f ′ (x) = 0 ⇔ 3 sin x cos x(sin x − cos x) = 0 ⇔
 x ∈ {0; π} 
   
sin x = 0  π 3π 

  x ∈ ; 
⇔  cos x = 0  ⇔  2 2  ⇔
  
sin x = cos x  π 5π 
x∈ ;
4 4
 
π π 5π 3π
⇔ x∈ 0; ; ; π; ;
4 2 4 2
Интервалы знакопостоянства производной:

Отобразив эту картинку симметрично относи-


тельно начала координат, мы получим полный
график нашей функции:

5. Вторая производная:

f ′′ (x) = (3 sin x cos x(sin x − cos x))′ =


= 3 cos2 x(sin x − cos x) − 3 sin2 x(sin x − cos x)+
+ 3 sin x cos x(cos x + sin x) =
Периодические функции. Напомним, что = 3(cos2 x − sin2 x)(sin x − cos x)+
периодические функции мы определили на с.194
как удовлетворяющие тождеству + 3 sin x cos x(cos x + sin x) =
= −3(cos x + sin x)(cos x − sin x)2 +
f (x + T ) = f (x)
+ 3 sin x cos x(cos x + sin x) =
при некотором T > 0. Там же отмечалось, что = 3(cos x + sin x)[−(cos x − sin x)2 + sin x cos x] =
график периодической функции f должен на-
= 3(cos x + sin x)[− cos2 x − sin2 x + 3 sin x cos x] =
кладываться на себя при сдвиге вправо (и влево)
на число T (период). = 3(cos x + sin x)[3 sin x cos x − 1]
Отсюда следует, что если нам нужно по- При x ∈ [0; 2π] получаем
строить график периодической функции, то его
§ 2. Приложения производной 355

2
f ′′ (x) = 0 ⇔ x +2
1. y = 2x 2 +1 .
p p
⇔ 3(cos x + sin x)[3 sin x cos x − 1] = 0 ⇔ 2. y = (x + 1)2 − 3 (x − 1)2 .
3

" # " # sin x+cos x


cos x + sin x = 0 cos x = − sin x 3. y = ep . p
⇔ ⇔ ⇔
3 sin x cos x − 1 = 0 3 sin x cos x = 1 4. y = (x + 1)2 + 3 (x − 1)2 .
3


cos x = − sin x
 
cos x = − sin x
 5. y = x−8x
2 +4 .
⇔ 3  ⇔  2 ⇔ 6. y = arctg(sin x).
sin 2x = 1 sin 2x = 2
2
   
3 7. y = √xx2 +2 .
3π 7π
x∈ ; 8. y = x ln |x|.
 4 4 
 


⇔  2x = arcsin + 2πn
2 
⇔ 9. y = ln(sin x + cos x).
 2


3 
 10. y = √x4x+1 2 −3
.
2
2x = π − arcsin + 2πn
3
11. y = 2x − arctg x.
  1
 3π 7π  12. y = sin x−cos x.
x∈ ;
 4 4 
 
 1 2 

⇔  x = arcsin + πn  ⇔
 Экстремум функции одной переменной.
 2 3 
 
π 1 2
x= − arcsin + πn ⋄ 5.2.26. Найти наибольшее и наименьшее зна-
2 2 3

оставляем только
 чение функции
⇔ те значения x, которые ⇔
лежат в отрезке [0; 2π] f (x) = x3 − 6x2 + 9x + 1
n1 2 π 1 2 3π
⇔x∈ arcsin ; − arcsin ; ; на следующих множествах:
2 3 2 2 3 4
1 2 3π 1 2 7π o 1) на отрезке [0, 2],
π + arcsin ; − arcsin ;
2 3 2 2 3 4 2) на полуинтервале [−2, −1).
Интервалы знакопостоянства второй произ- Решение. Найдем производную:
водной:
f ′ (x) = 3x2 − 12x + 9 = 3(x − 1)(x − 3).

Она обращается в нуль в точках x = 1 и x = 3,


причем
– f ′ (x) > 0 при x ∈ (−∞, 1) ∪ (3, ∞), поэтому
функция f возрастает на интервалах (−∞, 1)
и (3, ∞),
6. График функции на отрезке x ∈ [0; 2π]: – f ′ (x) < 0 при x ∈ (1, 3), поэтому функция f
убывает на интервале (1, 3).
Теперь рассматриваем два заданных множе-
ства.
1. На отрезке [0, 2] функция f имеет толь-
ко одну критическую точку, x = 1, причем на
интервале (0, 1) она возрастает, а на интервале
(1, 2) – убывает. Одновременно

f (0) = 1, f (1) = 5, f (2) = 3.

Сдвинув эту картинку несколько раз влево и Поэтому


вправо на период T = 2π, мы получим полный max f (x) = f (1) = 5
x∈[0,2]
график нашей функции:
и
min f (x) = f (0) = 1.
x∈[0,2]

2. На полуинтервале [−2, −1) функция f не


имеет критических точек и возрастает. Отсюда
следует, что

min f (x) = f (−2) = −49,


x∈[−2,−1)

а
max f (x)
⊲⊲ 5.2.25. Постройте графики следующих функ- x∈[−2,−1)
ций: не существует.
356 Глава 5. ПРОИЗВОДНАЯ

⋄ 5.2.27. Найти максимальный объем цилиндра, ⊲ 5.2.29. Найдите отношение катетов прямо-
вписанного в данный конус. угольного треугольника, у которого площадь
Решение. Обозначим буквами R и H радиус и максимальна среди всех прямоугольных тре-
высоту конуса, а буквами x и h радиус и высоту угольников, у которых сумма длин гипотенузы
вписанного цилиндра. Тогда и одного из катетов равна фиксированной вели-
чине c.
H −h H
= ,
x R ⊲ 5.2.30. Сечение тоннеля имеет форму пря-
поэтому моугольника, завершенного полукругом. Опре-
xH делить радиус полукруга, при котором площадь
H −h=
R сечения будет наибольшей, если периметр сече-
и ния равен p.
xH H
h=H− = (R − x),
R R ⊲ 5.2.31. Лист картона имеет форму прямо-
а объем цилиндра получается угольника со сторонами a и b. Вырезая по углам
этого прямоугольника квадраты и сгибая высту-
πH
V (x) = · (Rx2 − x3 ). пающие части крестообразной фигуры, получим
R открытую сверху коробку, высота которой рав-
Дифференцируея по x, мы получаем: ная стороне квадрата. Какой должна быть сто-
рона квадрата, чтобы объем коробки был наи-
πH большим?
V ′ (x) = · (2Rx − 3x2 ) = 0 ⇐⇒
R  
2R ⊲ 5.2.32. Найти наибольший объем цилиндра,
⇐⇒ x ∈ 0, . периметр осевого сечения которого равен a.
3
⊲ 5.2.33. Среди всех равнобедренных треуголь-
Здесь видно, что x = 2R 3 – точка максимума для ников, вписанных в данный круг, найти тре-
V:
угольник с наибольшим периметром.
 
2R
max V (x) = V = ⊲ 5.2.34. Определить размеры закрытой короб-
x∈[0,R] 3 ки объема v с квадратным основанием, на изго-
 2  3 !
πH 2R 2R товление которой расходуется наименьшее коли-
= · R − = чество материала.
R 3 3
 3 
πH 4R 8R3 ⊲ 5.2.35. Среди всех прямоугольников данной
= · − =
R 9 27 площади S найти прямоугольник: 1) с наимень-
  шим периметром, 2) с наименьшей диагональю.
πH 12R3 8R3 4
= · − = · πHR2
R 27 27 27 ⊲ 5.2.36. Найти наибольшую площадь прямо-
⋄ 5.2.28. Среди всех прямоугольников с дан- угольника, вписанного в круг радиуса R.
ным периметром P найти прямоугольник с мак- ⊲ 5.2.37. Найти длину боковой стороны трапе-
симальной площадью. ции, имеющей наименьший периметр среди всех
Пусть x – одна из сторон прямоугольника. То- равнобедренных трапеций с заданной площадью
гда другая сторона будет y = P2 − x, а площадь S и углом α между боковой стороной и нижним
Px основанием.
S = x·y = − x2 .
2 ⊲ 5.2.38. Вычислить наибольшую площадь тра-
Дифференцируя по x мы получим: пеции, вписанной в полукруг радиуса R, у кото-
рой нижним основанием служит диаметр полу-
P P круга.
S ′ (x) = − 2x = 0 ⇐⇒ x= .
2 4
⊲ 5.2.39. Из трех досок одинаковой ширины
При этом
 нужно сколотить желоб. При какой угле накло-
– S ′ (x) > 0 при x ∈ 0, P4 , то есть на интервале на боковых стенок площадб поперечного сечения

0, P4 функция S возрастает, желоба будет наибольшей?
′ P P

– S (x) < 0 при x ∈ 4 , 2 , то есть на интерва- ⊲ 5.2.40. Консервная банка имеет цилиндриче-

ле P4 , P2 функция S убывает. скую форму. Найти наиболее выгодное отноше-
Поэтому ние ее размеров (то есть отношение диаметра к
  высоте, при котором ее объем станосится наи-
P P2 большим при заданной полной площади поверх-
max S(x) = S = .
x∈(0, P2 ) 4 16 ности).
§ 2. Приложения производной 357

⊲ 5.2.41. Найти наибольшую полную поверх- Каким должен быть угол сектора, чтобы ворон-
ность цилиндра, вписанного в шар радиуса R. ка имела наибольший объем?
⊲ 5.2.42. Из кругового листа жести вырезают ⊲ 5.2.43. Найти наименьшую боковую поверх-
сектор и свертывают его в коническую воронку. ность конуса, имеющего объем V .
Глава 6

АСИМПТОТИЧЕСКИЕ МЕТОДЫ

Поведение функции при аргументе, стремящемся к некоторой величине, является предметом изуче-
ния специального раздела математического анализа, называемого асимптотическими методами.
По идеологии этой науки, свойство функции f иметь (или не иметь) предел при x → a – только
самое первое, поверхностное наблюдение, за которым скрывается гораздо более сложная картина,
которую если подходящим образом формализовать, то получаешь удивительно мощный инструмент
для решения самых разных задач, в том числе для вычисления самих пределов.

Чтобы было понятно, о чем идет речь, вспом- g(0) = earctg 0 − 1 − arctg(e0 − 1) = 0.
ним снова, как мы вычисляли пределы. После
Это значит, что можно применить правило Ло-
всех усилий, что мы потратили на изучение это-
питаля. Первые производные будут такие:
го вопроса в (c)(c) главы 4, а затем в § 2 главы 5,
для читателя может быть неожиданностью, что cos x cos ln(1 + x)
встречаются все же пределы, нахождение кото- f ′ (x) = − ,
1 + sin x 1+x
рых известными нам сейчас методами оказыва-
ется затруднительным или даже невозможным. earctg x ex
g ′ (x) = 2 − .
x +1 (1 − ex )2 + 1
⋄ 6.0.1. В качестве упражнения можно попро-
бовать найти следующий, простой на первый При подстановке x = 0 мы опять получаем нули:
взгляд, предел: cos 0 cos ln(1 + 0)
f ′ (0) = − = 0,
ln(1 + sin x) − sin ln(1 + x) 1 + sin 0 1+0
lim (6.0.1)
x→0 earctg x − 1 − arctg(ex − 1) earctg 0 e0
g ′ (0) = 2 − = 0.
Здесь, если пользоваться правилом Лопиталя, 0 +1 (1 − e0 )2 + 1
то его придется применять 4 раза, причем воз- И опять нужно дифференцировать. Вторые
никающие при дифференцировании выражения производные будут выглядеть так:
столь громоздки, что у обыкновенного человека
терпение истощается уже после первых двух ша- sin x sin ln(1 + x)
f ′′ (x) = − + −
гов. 1 + sin x (1 + x)2
Вот как выглядят эти вычисления, если по- cos2 x cos ln(1 + x)
следовательно находить производную от числи- − + ,
(1 + sin x)2 (1 + x)2
теля

f (x) = ln(1 + sin x) − sin ln(1 + x) earctg x 2x · earctg x


g ′′ (x) = − −
и знаменателя (x2 + 1)2 (x2 + 1)2
2e2x · (1 − ex ) ex
g(x) = earctg x − 1 − arctg(ex − 1), − −
((1 − ex )2 + 1)2 (1 − ex )2 + 1
не проводя возникающие в числителе дроби к об- Они опять при подстановке x = 0 дают нули:
щему знаменателю.
Прежде всего, при подстановке x = 0 напря- sin 0 sin ln(1 + 0)
мую в числитель и знаменатель мы получаем ну- f ′′ (0) = − + −
1 + sin 0 (1 + 0)2
ли: cos2 0 cos ln(1 + 0)
− 2
+ = 0,
f (0) = ln(1 + sin 0) − sin ln(1 + 0) = 0, (1 + sin 0) (1 + 0)2

358
359

earctg 0 0 · earctg 0 48e4x · (1 − ex )3 48e3x · (1 − ex )2


g ′′ (0) = − − − − −
(02 + 1)2 (02 + 1)2 ((1 − ex )2 + 1)4 ((1 − ex )2 + 1)3
2e0 · (1 − e0 ) e0 14e2x · (1 − ex ) 24e4x · (1 − ex )
− − =0 − + −
((1 − e0 )2 + 1)2 (1 − e0 )2 + 1 ((1 − ex )2 + 1)2 ((1 − ex )2 + 1)3
ex 12e3x
Далее мы дифференцируем в третий раз: − +
(1 − ex )2 + 1 ((1 − ex )2 + 1)2
3 sin ln(1 + x) 2 cos3 x И только в этот момент обнаруживается, что при
f ′′′ (x) = − + −
(1 + x)3 (1 + sin x)3 подстановке не получается нулей:
cos ln(1 + x) 3 sin x cos x cos x
− + − , 3 sin2 0 sin 0
(1 + x) 3 (1 + sin x)2 1 + sin x f ′′′′ (0) = − + +
(1 + sin 0)2 1 + sin 0
10 sin ln(1 + 0) 6 cos4 0
2earctg x earctg x + − +
g ′′′ (x) = − + + (1 + 0)4 (1 + sin 0)4
(x2 + 1)2 (x2 + 1)3 4 cos2 0 12 sin 0 cos2 0
8x2 · earctg x 6x · earctg x + − = −2.
+ − − (1 + sin 0)2 (1 + sin 0)3
(x2 + 1)3 (x2 + 1)3
8e3x · (1 − ex )2 6e2x · (1 − ex ) 8earctg 0 0 · earctg 0
− − − g ′′′′ (0) = − + 2 +
((1 − ex )2 + 1)3 ((1 − ex )2 + 1)2 2
(0 + 1) 3 (0 + 1)3
ex 2e3x earctg 0 0 · earctg 0
− + + 2 + 2 −
(1 − ex )2 + 1 ((1 − ex )2 + 1)2 (0 + 1) 4 (0 + 1)4
и убеждаемся, что при подстановке снова полу- 0 · earctg 0 0 · earctg 0
− 2 4
− 2 −
чаются нули: (0 + 1) (0 + 1)4
48e0 · (1 − e0 )3 48e0 · (1 − e0 )2
3 sin ln(1 + 0) 2 cos3 0 − 0 2 4
− −
f ′′′ (0) = − + − ((1 − e ) + 1) ((1 − e0 )2 + 1)3
(1 + 0)3 (1 + sin 0)3 14e0 · (1 − e0 ) 24e0 · (1 − e0 )
cos ln(1 + 0) 3 sin 0 cos 0 cos 0 − 0 2 2
+ −
− + − = 0, ((1 − e ) + 1) ((1 − e0 )2 + 1)3
(1 + 0) 3 (1 + sin 0) 2 1 + sin 0 e0 12e0
− + =
(1 − e ) + 1 ((1 − e0 )2 + 1)2
0 2

2earctg 0 earctg 0 = −8 + 1 − 1 + 12 = 4.
g ′′′ (0) = − + +
(02 + 1)2 (02 + 1)3 И мы наконец получаем ответ
0 · earctg 0 0 · earctg 0
+ 2 − − ln(1 + sin x) − sin ln(1 + x)
(0 + 1)3 (02 + 1)3 lim =
8e0 · (1 − e0 )2 6e0 · (1 − e0 ) x→0 earctg x − 1 − arctg(ex − 1)
− − − f ′′′′ (x) f ′′′′ (0) −2 1
((1 − e0 )2 + 1)3 ((1 − e0 )2 + 1)2 = lim ′′′′ = ′′′′ = =− .
x→0 g (x) g (0) 4 2
e0 2e0
− + = 0.
(1 − e0 )2 + 1 ((1 − e0 )2 + 1)2 Когда решение известно и выписано на бума-
ге, трудности блёкнут. Они не кажутся такими
Затем в четвертый раз: серьезными как в момент, когда не знаешь ни от-
вета, ни способа, которым его можно получить.
3 sin2 x sin x Поэтому приведенные нами в примере 6.0.1 вы-
f ′′′′ (x) = − 2
+ +
(1 + sin x) 1 + sin x кладки могут не впечатлить читателя. Но даже
10 sin ln(1 + x) 6 cos4 x если встать на точку зрения радикального сто-
+ 4
− + ронника компьютерных методов и считать, что
(1 + x) (1 + sin x)4
вычисление производной совсем не составляет
4 cos2 x 12 sin x cos2 x
+ 2
− . труда, проблема остается в том, что непонятно,
(1 + sin x) (1 + sin x)3 сколько раз нужно применять правило Лопита-
ля. Дело ведь в том, что нет гарантии даже,
что этот процесс вообще когда-то приведет к
8earctg x 24x · earctg x
g ′′′′ (x) = − + + удобоваримому результату.
(x2 + 1)3 (x2 + 1)3
earctg x 44x2 · earctg x ⋄ 6.0.2. В качестве иллюстрации, можно рас-
+ 2 + − смотреть следующий пример:
(x + 1)4 (x2 + 1)4
1
12x · earctg x 48x3 · earctg x sin(2− x2 )
− − − lim 1 . (6.0.2)
(x2 + 1)4 (x2 + 1)4 x→0 2− sin2 x
360 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

1  
Здесь применение правила Лопиталя превраща- sin(2− x2 ) 0 f ′ (x)
ется в бесконечный процесс (со все более слож- lim − sin12 x
= = lim ′ =
x→0 2 0 x→0 g (x)
ными вычислениями на каждом следующем ша-    
0 f (n) (x) 0
ге), потому что числитель = = ... = lim (n) = =?
0 x→0 g (x) 0
1
f (x) = sin(2− x2 ) Эти примеры означают, что алгоритмы, ис-
пользуемые для вычисления пределов (в част-
и знаменатель
ности, в современных компьютерах), не могут
g(x) = 2 − sin12 x сводиться к применению одного только прави-
ла Лопиталя и должны использовать какие-то
стремятся к нулю при x → 0 вместе со всеми другие методы. И если ставить целью объясне-
своими производными. Сколько раз ни применяй ние интересующимся (в том числе, разработчи-
правило Лопиталя, ты получишь здесь неопреде- кам этих алгоритмов) сути этих методов, то огра-
ленность: ничиться тем, что уже сказано на эту тему, ко-
нечно, нельзя.

Асимптотические методы предлагают остроумный способ упростить подобные задачи, абстра-


гировавшись от несущественных свойств функций, и оставив только то, что важно для целей. При
этом оказывается, что используемый прием формализуется в виде единого алгоритма — нахождения
асимптотики функции — и применим в разных других ситуациях, например, при исследовании на
сходимость несобственных интегралов и рядов. В этой главе мы познакомим читателя с основными
понятиями этой науки и с простейшими ее приложениями (а конкретные пределы (6.0.1) и (6.0.2)
мы вычислим методами этой науки на страницах 386 и 388).

§1 Асимптотические отношения и формулы


(a) Асимптотические отношения
Асимптотическая эквивалентность функций (символ ∼) Пусть a — точка на прямой R или
символ бесконечности, возможно, со знаком.
Пусть f1 и f2 – две функции, определенные в выколотой окрестности a1 . Говорят, что функция
f1 эквивалентна функции f2 при x → a и записывают это так

f1 (x) ∼ f2 (x) (6.1.3)


x→a

если существует функция θ, определенная в выколотой окрестности a такая, что

f1 (x) = θ(x) · f2 (x)

и
θ(x) −→ 1.
x→a

В частном случае, когда f2 (x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание о θ: тогда запись (6.1.3) просто эквивалентна условию

f1 (x)
−→ 1 (6.1.4)
f2 (x) x→a

В качестве примеров выпишем несколько x2


1 − cos x ∼ (6.1.7)
важных эквивалентностей. x→0 2
ln(1 + x) ∼ x (6.1.8)
x→0
sin x ∼ x (6.1.5) x
x→0 loga (1 + x) ∼ (6.1.9)
x→0 ln a
tg x ∼ x (6.1.6)
x→0
1 Если a = ∞, то выколотой окрестностью a считается всякое множество (−∞, −E) ∪ (E, +∞), где E > 0. Если

a = +∞, то выколотой окрестностью a считается всякое множество (E, +∞), где E > 0. Если же a = −∞, то
выколотой окрестностью a считается всякое множество (−∞, −E), где E > 0.
§ 1. Асимптотические отношения и формулы 361

ex − 1 ∼ x (6.1.10) (6.1.11): по определению символа ∼,


x→0
ax − 1 ∼ x · ln a (6.1.11) ax − 1
x→0 ax − 1 ∼ x ln a ⇔ −→ 1
x→0 x ln a x→0
(1 + x)α − 1 ∼ α · x (6.1.12)
x→0
Последнее соотношение доказывается с по-
arcsin x ∼ x (6.1.13)
x→0 мощью правила Лопиталя:
arctg x ∼ x (6.1.14)
x→0 ax − 1
lim = (Лопиталь) =
x→0 x ln a
Доказательство. Все эти соотношения дока- ax ln a
зываются одним и тем же способом – простым = lim = lim ax = 1
x→0 ln a x→0
вычислением, например, с помощью правила
Лопиталя. В качестве примера мы рассмотрим

Свойства асимптотической эквивалентности:


1◦ . Если f1 (x) ∼ f2 (x), то равенство или неравенство нулю в выколотой окрестности a
x→a
первой функции эквивалентно тому же для второй функции (с возможным изменением
окрестности):

f1 (x) = 0, x ∈ U̇ε (a) ⇐⇒ f2 (x) = 0, x ∈ U̇δ (a)

и
f1 (x) 6= 0, x ∈ U̇ε (a) ⇐⇒ f2 (x) 6= 0, x ∈ U̇δ (a).

2 . Рефлексивность: всегда
f1 (x) ∼ f1 (x)
x→a

3 . Симметричность:
f1 (x) ∼ f2 (x) =⇒ f2 (x) ∼ f1 (x)
x→a x→a

4◦ . Транзитивность:

f1 (x) ∼ f2 (x) & f2 (x) ∼ f3 (x) =⇒ f1 (x) ∼ f3 (x)


x→a x→a x→a

5◦ . Мультипликативность:

f1 (x) f2 (x)
f1 (x) ∼ f2 (x) & g1 (x) ∼ g2 (x) =⇒ f1 (x)·g1 (x) ∼ f2 (x)·g2 (x) & ∼
x→a x→a x→a g1 (x) x→a g2 (x)

(там, где g2 присутствует в знаменателе, нужно чтобы g2 (x) 6= 0 в некоторой выко-


лотой окрестности a).
6◦ . Связь с пределом:
f1 (x) ∼ f2 (x) −→ A =⇒ f1 (x) −→ A
x→a x→a x→a

Понятие асимптотической эквивалентности полезно при вычислении сложных пределов, кото-


рые слишком утомительно находить с помощью правила Лопиталя. Для этого используется следу-
ющая
Теорема 6.1.1 (об эквивалентной замене). Если f1 (x) ∼ f2 (x) и g1 (x) ∼ g2 (x), то
x→a x→a

f1 (x) f2 (x)
lim = lim lim f1 (x) · g1 (x) = lim f2 (x) · g2 (x)
x→a g1 (x) x→a g2 (x) x→a x→a

(там, где g2 присутствует в знаменателе, нужно чтобы g2 (x) 6= 0 в некоторой выколотой


окрестности a).
Доказательство. Условия f1 (x) ∼ f2 (x) и g1 (x) ∼ g2 (x) одначают, что существуют функции θ,
x→a x→a
τ , такие что
f1 (x) = θ(x) · f2 (x), θ(x) −→ 1
x→a
362 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

и
g1 (x) = τ (x) · g2 (x), τ (x) −→ 1
x→a

Запомним их, и поглядим, что можно сказать о пределах, о которых говорит теорема:
 
f1 (x) θ(x) · f2 (x) θ(x) f2 (x) θ(x) f2 (x) f2 (x)
lim = lim = lim · = lim · lim = lim
x→a g1 (x) x→a τ (x) · g2 (x) x→a τ (x) g2 (x) x→a τ (x) x→a g2 (x) x→a g2 (x)
| {z }
k
1

И точно так же,


   
lim f1 (x) · g1 (x) = lim θ(x) · f2 (x) · τ (x) · g2 (x) = lim θ(x) · τ (x) · f2 (x) · g2 (x) =
x→a x→a x→a
  
= lim θ(x) · τ (x) · lim f2 (x) · g2 (x) = lim f2 (x) · g2 (x)
x→a x→a x→a
| {z }
k
1

⋄ 6.1.1. Приведем иллюстрацию: ⋄ 6.1.2.


√ √ 1 − cos x 1 − cos x ∼ x2
1+x−1 1+x−1 ∼ x
x→0 2 lim = x→0 2
=
lim = 2x − 1 ∼ x · ln 2 = x→0 ln2 (1 + x) ln(1 + x) ∼ x
x→0 2x − 1 x→0
x→0

x x2
2 1 1
= lim = = lim 2 =
x→0 x · ln 2 2 ln 2 x→0 x2 2

В более сложных примерах следует пользоваться еще одной теоремой:


Теорема 6.1.2 (о замене переменной под знаком эквивалентности). Если f1 (x) ∼ f2 (x) и ξ(t) −→
x→a t→c
a, причем ξ(t) 6= a при t 6= c, то f1 (ξ(t)) ∼ f2 (ξ(t)).
t→c

Доказательство. Условие f1 (x) ∼ f2 (x) означает, что существуют функция θ, такая что
x→a

f1 (x) = θ(x) · f2 (x), θ(x) −→ 1


x→a

Положим
τ (t) = θ(ξ(t)).
Тогда, во-первых,
f1 (ξ(t)) = θ(ξ(t)) · f2 (ξ(t)) = τ (t) · f2 (ξ(t)),
И, во-вторых,
применяем теорему 3.4.9
о замене переменной
lim τ (t) = lim θ(ξ(t)) = под знаком предела: = lim θ(x) = 1.
t→c t→c x→a
x = ξ(t) −→ a
t→c
ξ(t) 6= a при t 6= c
То есть f1 (ξ(t)) ∼ f2 (ξ(t)).
t→c

⋄ 6.1.3. Рассмотрим предел посложнее: (6.1.14), arctg y ∼ y, можно заменой y = 7


4x
y→0

arctg 7 x (y −→ 0) получить формулу arctg 74 x ∼ 7


x.
x→0 x→0 4
lim −2x 4 Точно так же, из формулы (6.1.10), ez − 1 ∼ z,
x→0 e −1 z→0
заменой z = −2x (z −→ 0) получается e−2x −
Чтобы его вычислить, заметим, что из формулы x→0
§ 1. Асимптотические отношения и формулы 363
 x
1 ∼ −2x. Отсюда 3x 3
x→0 = lim x = lim =0
x→−∞ 2 x→−∞ 2
arctg 47 x
lim = ⋄ 6.1.6.
x→0 e−2x − 1
7
arctg y ∼ y =⇒ arctg ∼ 74 x
4 x x→0 √
y→0
= ez − 1 ∼ z =⇒ e−2x − 1 ∼ −2x
= sin( 1 + x − 1)
z→0 x→0 lim =
7 7 x→0 10x − 1
4x 4 7 √ √ x
= lim = lim =− sin( 1 + x − 1) ∼ 1+x−1 ∼
x→0 2
x→0 −2x x→0 −2 8 = x→0
10x − 1 ∼ x ln 10 =
x→0
⋄ 6.1.4. x
1
2
= lim =
1 − cos 5x 1− cos 5x ∼ (5x)
2 x→0 x ln 10 2 ln 10
2
lim = 2
x→0
2 =
x→0 tg x2 tg x ∼ x
x→0
⊲⊲ 6.1.7. Найдите пределы
(5x)2 √
25x2 25 1. limx→0 1+x sin x−1
= lim 2 = lim = ex2 −1
x→0 x2 x→0 2x2 2 sin 5x
−1
2. limx→0 eln(1+2x)
⋄ 6.1.5. 3
arctg(ex −1)
x x
∼ x 3. limx→0 10arcsin3 x −1
ln(1 + 3 ) ln(1 + 3 )
x→−∞
3
lim = ln(1 + 2x ) ∼ 2x = 4. limx→0 √ 1−cos x
x→−∞ ln(1 + 2x ) x→−∞ 3
1+x2 −1

Асимптотическое сравнение функций (символы ≪ и o) и шкала бесконечностей Пусть


снова a — точка на прямой R или символ бесконечности, возможно, со знаком.
И пусть f1 и f2 – две функции, определенные в выколотой окрестности a. Говорят, что функция
f бесконечно мала по сравнению с функцией g при x → a и записывают это так

f (x) ≪ g(x) (6.1.15)


x→a

или так  
f (x) = o g(x)
x→a

если существует функция α, определенная в выколотой окрестности a такая, что

f (x) = α(x) · g(x)

и
α(x) −→ 0.
x→a

В частном случае, когда g(x) 6= 0 при x 6= a это определение можно упростить, выбросив в нем
упоминание об α: тогда запись (6.1.15) просто эквивалентна условию

f (x)
−→ 0
g(x) x→a

⋄ 6.1.8. Покажем, что ⋄ 6.1.9. Убедимся, что

x2 ≪ x x ≪ x2
x→0 x→∞

или, в других обозначениях, или, в других обозначениях,

x2 = o (x) x= o (x2 )
x→0 x→∞

x2 x 1
Действительно, x = x −→ 0. Действительно, x2 = −→
x x→∞ 0.
x→0

Свойства асимптотического сравнения


364 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

1◦ . Если f (x) ≪ g(x), то неравенство нулю в выколотой окрестности a для первой функ-
x→a
ции влечет за собой то же для второй функции (с той же окрестностью):

f (x) 6= 0, x ∈ U̇ε (a) ⇐⇒ g(x) 6= 0, x ∈ U̇ε (a)

а равенство нулю в выколотой окрестности a для второй функции влечет за собой то


же для первой функции (с той же окрестностью):

f (x) = 0, x ∈ U̇ε (a) ⇐= g(x) = 0, x ∈ U̇ε (a).

2◦ Транзитивность:

f (x) ≪ g(x) & g(x) ≪ h(x) =⇒ f (x) ≪ h(x)


x→a x→a x→a

3◦ Связь с эквивалентностью:

f (x) ≪ g(x) ∼ h(x) =⇒ f (x) ≪ h(x),


x→a x→a x→a

f (x) ∼ g(x) ≪ h(x) =⇒ f (x) ≪ h(x).


x→a x→a x→a

Теорема 6.1.3 (о сравнении степенных и это означает, что bx ≪ ax .


x→−∞
функций). Если λ < µ, то

xλ ≪ xµ , xµ ≪ xλ Теорема 6.1.5 (о шкале бесконечностей). Спра-


x→∞ x→0 ведливы соотношения
или, в других обозначениях,
 C ≪ loga x ≪ xλ ≪ ax
xλ = o (xµ ) , xµ = o xλ . (C∈R) x→+∞ (a>1) x→+∞ (λ>0) x→+∞ (a>1)
x→∞ x→0
(6.1.16)
Доказательство.
или, в других обозначениях,
xλ 1
= µ−λ −→ 0
xµ x x→∞ C= o (loga x) , если a > 1,
x→+∞
и это означает, что x λ µ
≪ x . Наоборот, 
x→∞ loga x = o xλ , если a > 1, λ > 0
x→+∞
µ
x xλ = o (ax ) , если λ > 0, a > 1
= xµ−λ −→ 0 x→+∞
xλ x→0

и это означает, что xµ ≪ xλ . Доказательство. Первое соотношение очевид-


x→0
но, потому что
Теорема 6.1.4 (о сравнении показательных
 
функций). Если 0 < a < b, то C 1
lim = =0
x→+∞ loga x ∞
ax ≪ bx , bx ≪ ax
x→+∞ x→−∞
Докажем второе:
или, в других обозначениях,
loga x  правило 
ax = o (bx ) , bx = o (ax ) . lim
x→+∞ xλ
= Лопиталя =
x→+∞ x→−∞
1
Доказательство. (loga x)′ x·ln a
= lim = lim =
x→+∞ (xλ )′ x→+∞ λ · xλ−1
ax  a  x
= −→ 0 1 1 1
bx b
|{z}
x→+∞ = lim = · lim λ =
x→+∞ λ ln a · x · xλ−1 λ ln a x→+∞ x
∧  
= учитываем, что
1
λ>0 =0
То есть, ax ≪ bx . Наоборот,
x→+∞
 b x А теперь третье:
bx
= −→ ∞,
ax a
|{z}
x→−∞  
xλ правило (xλ )′
∨ lim = Лопиталя = lim =
1 x→+∞ ax x→+∞ (ax )′
§ 1. Асимптотические отношения и формулы 365

   
λxλ−1 если λ − 1 > 0, то еще раз
применяем правило Лопиталя
= lim x = применяем правило Лопиталя = = до тех пор, пока в числителе = ... =
x→+∞ a ln a не получится xλ−n , где λ − n < 0
λ · (λ − 1) · xλ−2 λ · (λ − 1) · (λ − 2) · ... · (λ − n + 1) · xλ−n
= lim = = lim
ax (ln a)n
=
x→+∞ ax (ln a)2 x→+∞
   
  поскольку λ − n < 0, 0
если λ − 2 > 0, то еще раз
= применяем правило Лопиталя =
= xλ−n −→ 0 = =0
x→+∞ ∞
λ · (λ − 1) · (λ − 2) · xλ−3
= lim = ... =
x→+∞ ax (ln a)3

Принцип выделения главного слагаемого. Символы ≪ и o, описанные в предыдущем па-


раграфе, бывают полезны в различных ситуациях при вычислении пределов. Самое простое их
применение описывается в следующей теореме.
Теорема 6.1.6 (о выделении главного слагаемого). Пусть даны несколько функций

A0 (x), A1 (x), ..., An (x),

причем при x → a функция A0 (x) бесконечно велика по сравнению с любой другой функцией из
этого списка:
A1 (x) ≪ A0 (x), A2 (x) ≪ A0 (x), ..., An (x) ≪ A0 (x) (6.1.17)
x→a x→a x→a

Тогда сумма этих функций эквивалентна A0 (x) при x → a:

A0 (x) + A1 (x) + A2 (x) + ... + An (x) ∼ A0 (x) (6.1.18)


x→a

Доказательство. Из (6.1.17) следует, что

A1 (x) = α1 (x) · A0 (x), A2 (x) = α2 (x) · A0 (x), ... An (x) = αn (x) · A0 (x),

где
α1 (x) −→ 0, α2 (x) −→ 0, ... αn (x) −→ 0
x→a x→a x→a

Поэтому

A0 (x) + A1 (x) + ... + An (x) = A0 (x) + α1 (x) · A0 (x) + ... + αn (x) · A0 (x) =
 
= 1 + α1 (x) + ... + αn (x) ·A0 (x) = β(x) · A0 (x),
| {z }
обозначим это θ(x)

где
θ(x) = 1 + α1 (x) + ... + αn (x) −→ 1 + 0 + ... + 0 = 1.
x→a

То есть, выполняется (6.1.18).


• Функция A0 (x), для которой выполняются соотношения (6.1.17), называется главным сла-
гаемым в сумме A0 (x) + A1 (x) + A2 (x) + ... + An (x).
Теорема 6.1.6 применяется в следующей ситуации. Пусть нам необходимо вычислить предел
A0 (x) + A1 (x) + A2 (x) + ... + An (x)
lim
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

причем известно, что A0 (x) является главным слагаемым в сумме A0 (x)+ A1 (x)+ A2 (x)+ ...+ An (x),
а B0 (x) является главным слагаемым в сумме B0 (x) + B1 (x) + B2 (x) + ... + Bn (x):

A1 (x) ≪ A0 (x), A2 (x) ≪ A0 (x), ... An (x) ≪ A0 (x)


x→a x→a x→a

B1 (x) ≪ B0 (x), B2 (x) ≪ B0 (x), ... Bn (x) ≪ B0 (x)


x→a x→a x→a

Тогда
A0 (x) + A1 (x) + A2 (x) + ... + An (x) ∼ A0 (x)
x→a
366 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

B0 (x) + B1 (x) + B2 (x) + ... + Bn (x) ∼ B0 (x)


x→a
и поэтому
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A0 (x)
lim = lim
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x) x→a B0 (x)
Таким образом, справедлив следующий важный принцип.

Теорема 6.1.7 (принцип выделения главного слагаемого). Вычисляя предел

A0 (x) + A1 (x) + A2 (x) + ... + An (x)


lim ,
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

следует выделить в числителе и знаменателе главные слагаемые, а все остальные – “второсте-


пенные” – просто зачеркнуть:
.
/ .
/ .
/
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A0 (x) + A1 (x) + A2 (x) + ... + An (x) A (x)
lim = lim .
/ .
/ / = lim 0
.
x→a B0 (x) + B1 (x) + B2 (x) + ... + Bn (x) x→a x→a B0 (x)
B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

Рассмотрим примеры.

⋄ 6.1.10. минимальные степени у x:


 по теореме 6.1.5  √
(о шкале бесконечностей), 5x + 3 x − 2x5
 ln x ≪ x,  lim √ =
x + ln x  x→+∞  x→0 x − 3x4 + 8 x
lim = кроме того, = .
/ .
/
x→+∞ x2 + sin x   √ √
как легко проверить, 5x + 3 x − 2x5 3 x 3
sin x ≪ x2
x→+∞ = lim ./ .
/ √ = lim √ =
.
/ x→0
x − 3x4 + 8 x x→0 8 x 8
x + ln x x
= lim .
/ = lim 2 = 0
x→+∞ 2
x + sin x x→0 x ⋄ 6.1.14. Здесь используется теорема 6.1.4 (о
сравнении показательных функций): поскольку
⋄ 6.1.11. В следующем примере снова использу- x → +∞, главными слагаемыми будут степени с
ется шкала бесконечностей (теорема 6.1.5): наибольшим основанием:
√ 1 x x
2 x + 2 log5 x + 5 2x−1 − 3x+1 2 ·2 −3·3
lim √ = lim = lim =
x→+∞ cos x + x − 1 x→+∞ 2x+1 + 3x−1 x→+∞ 2 · 2x + 1 · 3x
.
/ .
/ 3
√ .
/
2 x + 2 log5 x + 5 √ 1 x
− 3 · 3x
2 x 2 ·2 −3 · 3x
= lim .
/ √ .
/ = lim √ = 2 = lim .
/ = lim 1 x = −9
x→+∞
cos x + x − 1 x→+∞ x x→+∞
2 · 2x + 31 · 3x x→+∞ 3 · 3

⋄ 6.1.12. Здесь используется теорема 6.1.3 (о ⋄ 6.1.15. Здесь дробь та же, что и в предыду-
сравнении степенных функций): поскольку x → щем примере, но, поскольку x → −∞, главными
∞, главными слагаемыми будут максимальные слагаемыми, по той же теореме 6.1.4, будут на-
степени у x: оборот, степени с наименьшим основанием:

5x + 3 x − 2x5 1
lim √ = 2x−1 − 3x+1 · 2x − 3 · 3x
x→∞ x − 3x4 + 8 x lim x+1 x−1
= lim 2 x 1 x =
.
/ .
/
√ x→−∞ 2 +3 x→−∞ 2 · 2 +
3 ·3
5x + 3 x − 2x5 .
/
−2x5 1 x x
= lim . / .
/ 2 ·2 −3·3
1
√ = lim
x→∞ −3x4
= · 2x 1
x→∞
x − 3x4 + 8 x = lim .
/ = lim 2 x =
x→−∞ x 1 x x→−∞ 2 · 2 4
2·2 + 3 ·3
−2x
= lim =∞
x→∞ −3 ⋄ 6.1.16. В следующем примере мы сначала вы-
⋄ 6.1.13. Здесь дробь та же, что и в предыдущем деляем главное слагаемое, а затем применяем
примере, но, поскольку x → 0, главными слага- теорему 6.1.2 об эквивалентной замене:
емыми, по той же теореме 6.1.3, будут наоборот,
§ 1. Асимптотические отношения и формулы 367
.
/ √
3

2 10 x+ x
2
5x + 3x 10 5x + 3x 4. limx→+∞ √
5
sin x+ x2
lim 5 = lim /
. = √
x→0 2x + 7 sin x2 x→0 5. x+ x
limx→0 ex −1
2x5 + 7 sin x2

5x2   5x2 5 6. limx→+∞ x+ x
ex −1
= lim 2
= sin x2 ∼ x2 = lim 2 = x x
x→0 7 sin x x→0 x→0 7x 7 7. limx→0 2x2 +3
+x3
⊲⊲ 6.1.17. x
+3x
8. limx→+∞ x2 2 +x 3
2x +x5
1. limx→0 x2 +5x 2x +3x
9. limx→−∞ x2 +x3
2x +x5
2. limx→+∞ x2 +5x x+sin x
√ √ 10. limx→+∞ x+cos x
3
x+ x
3. limx→0 √
5
sin x+ x2

Эквивалентность модулей, степеней и логарифмов


Теорема 6.1.8. Пусть даны две эквивалентные функции при x → a:
f1 (x) ∼ f2 (x)
x→a

Тогда
(i) модули этих функций тоже эквивалентны:
|f1 (x)| ∼ |f2 (x)|
x→a

(ii) степени этих функций (с произвольным показателем) тоже эквивалентны:


f1 (x)α ∼ f2 (x)α , α∈R
x→a

(iii) если вдобавок f2 (x) стремится к бесконечности или к нулю


f2 (x) −→ +∞ (или + 0)
x→a

то логарифмы этих функций (с произвольным основанием) эквивалентны:


loga f1 (x) ∼ loga f2 (x), 0 < a 6= 1
x→a

Доказательство.
1. f1 (x) ∼ f2 (x) ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1 ⇒
x→a x→a
⇒ |f1 (x)| = |θ(x)| · |f2 (x)| , |θ(x)| −→ 1 ⇒
x→a
⇒ |f1 (x)| ∼ |f2 (x)|
x→a
2. f1 (x) ∼ f2 (x) ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1 ⇒
x→a x→a
α α α α
⇒ f1 (x) = θ(x) · f2 (x) , θ(x) −→ 1 ⇒
x→a
⇒ f1 (x)α ∼ f2 (x)α
x→a
( (
+∞ +∞
3. f1 (x) ∼ f2 (x) −→ ⇒ f1 (x) = θ(x) · f2 (x), θ(x) −→ 1, f2 (x) −→ ⇒
x→a x→a +0 x→a x→a +0
✯0

 loga θ(x) 
⇒ loga f1 (x) = loga θ(x) + loga f2 (x) = + 1 · loga f2 (x) ⇒
loga f2 (x)
❥∞

| {z }

1

⇒ loga f1 (x) ∼ loga f2 (x)


x→a
368 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

Из этой теоремы следует, что при вычислении пределов с модулями, степенями или логариф-
мами также можно выделять главные слагаемые, но нужно только следить, чтобы аргументы у
логарифмов стремились к +∞ или к +0. Например,

|A0 (x) + A1 (x) + A2 (x) + ... + An (x)|


lim =
x→a (B0 (x) + B1 (x) + B2 (x) + ... + Bn (x))β
.
/ .
/ .
/
A0 (x) + A1 (x) + A2 (x) + ... + An (x) |A0 (x)|
= lim  .
/ .
/ / β = x→a
. lim
x→a B0 (x)β
B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

Или, если B0 (x) −→ +∞ (или + 0),


x→a

α
(A0 (x) + A1 (x) + A2 (x) + ... + An (x))
lim =
x→a ln (B0 (x) + B1 (x) + B2 (x) + ... + Bn (x))
 .
/ /
. .
/ α
A0 (x) + A1 (x) + A2 (x) + ... + An (x) A (x)α
= lim  .
/ .
/ /  = lim 0
.
x→a x→a ln B0 (x)
ln B0 (x) + B1 (x) + B2 (x) + ... + Bn (x)

И в таком духе. Рассмотрим несколько примеров.

.
/
⋄ 6.1.18. 2 ln(x2
+ x)
ln(x + x)
√ lim 5 3
= lim .
/ =
| 3 x + 3x − 2x2 | x→+0 ln(x + x ) x→+0
lim√ = ln(x5 + x3 )
x→+∞ x + x2 + x4 ln x ln x 1
√./ .
/
= lim = lim =
| 3 x + 3x − 2x2 | x→+0 ln x 3 x→+0 3 ln x 3
= lim r. / .
/ =
x→+∞
x +x 2 +x4 ⋄ 6.1.22.

| − 2x2 | 2x2 3 ln x + x − 2
= lim √ = lim =2 lim =
x→+∞ x2
x→+∞ ln |5 + x3 − e2x |
x→+∞ x4 .
/ .
/
⋄ 6.1.19. 3 ln x + x − 2
= lim .
/ .
/ =
√ x→+∞
ln 5 + x3 − e2x
| 3 x + 3x − 2x2 |
lim √ =
x→0 x + x2 + x4 x x 1
√ .
/ .
/ = lim = lim =
x→+∞ ln |−e2x | x→+∞ 2x 2
| 3 x + 3x − 2x2 |
= lim r .
/ .
/ = ⊲⊲ 6.1.23. Вычислите пределы, обращая внима-
x→0
x+x +x2 4
ние на значение, к которому стремится аргумент
√ x: √
| 3 x| 1 ln|x−2 ln x−3 x|
= lim √ = lim x− 6 = ∞ 1. limx→+∞ √ √
x→0 x x→0 3
ln x+2x x−x2

ln|x−2 ln x−3 x|
⋄ 6.1.20. 2. limx→0 √3 √
ln x+2x x−x2
.
/ √ √
ln(1+ x+ 3 x)
2 ln(x2
+ x) 3. limx→+∞ ln 1+ √ √
ln(x + x) ( 3 x+ 4 x)
lim 5 3
= lim .
/ = √
ln(1+ x+ 3 x)

x→+∞ ln(x + x ) x→+∞ 4. limx→0 ln 1+ √
ln(x5 + x3 ) ( 3 x+ 4 x)

√ √
ln( x+ x) 3
ln x2 2 ln x 2 5. limx→0 ln √ √
= lim = lim = ( 3
)
x+ 4 x
x→+∞ ln x5 x→+∞ 5 ln x 5 x
6. limx→+∞ ln(1+3x
ln(1+2 )
)
⋄ 6.1.21. ln(1+3x )
7. limx→0 ln(1+2x )
§ 1. Асимптотические отношения и формулы 369

(b) Асимптотические формулы


В математическом анализе имеется специальный язык асимптотических формул, позволяющий
описывать различные связи между функциями с помощью символов o. Для  егопонимания доста-
точно просто знать, что если в какой-то формуле встречается символ o f (x) , то это означает,
x→a
что на этом местестоит некоторая (неизвестная) функция α(x), для которой справедливо соотно-
шение α(x) = o f (x) .
x→a

⋄ 6.1.24. Скажем, асимптотическая формула Выпишем несколько важных асимптотиче-


ских формул:
sin x = x + o (x)
x→0
sin x = x + o(x) (6.1.19)
означает, что x→0
tg x = x + o(x) (6.1.20)
sin x = x + α(x), где α(x) = o(x) x→0
x→0 2
x
cos x = 1 − + o(x2 ) (6.1.21)
Ее нетрудно доказать: 2 x→0
ln(1 + x) = x + o(x) (6.1.22)
sin x = x+ o (x) ⇔ sin x−x = o (x) ⇔ x→0
x→0 x→0 x
sin x − x loga (1 + x) = + o(x) (6.1.23)
⇔ −→ 0 ⇔ ln a x→0
x x→0
ex = 1 + x + o(x) (6.1.24)
sin x sin x x→0
⇔ − 1 −→ 0 ⇔ −→ 1
x x→0 x x→0 ax = 1 + x · ln a + o(x) (6.1.25)
x→0
Последнее соотношение верно, поскольку пред-
ставляет собой первый замечательный предел. (1 + x)α = 1 + αx + o(x) (6.1.26)
x→0

⋄ 6.1.25. Или вот такая асимптотическая фор- arcsin x = x + o(x) (6.1.27)


x→0
мула:
x2 arctg x = x + o (x) (6.1.28)
x→0
cos x = 1 − + o(x2 )
2 x→0
Доказательство. Все эти формулы легко выво-
Она означает, что
дятся из (6.1.5) – (6.1.14). В качестве примера
x2 рассмотрим (6.1.25):
cos x = 1 − + α(x), где α(x) = o(x2 )
2 x→0
формула (6.1.25)
и доказать ее также нетрудно: ↓
z }| {
x2 ax = 1 + x · ln a + o (x) ⇔
x→0
cos x = 1 − + o(x2 ) ⇔ x
2 x→0 ⇔ a − 1 − x · ln a = o(x) ⇔
2 x→0
x
⇔ cos x − 1 + = o(x2 ) ⇔ ax − 1 − x · ln a
2 x→0 ⇔ −→ 0 ⇔
2
x x→0
cos x − 1 + x2 ax − 1
⇔ −→ 0 ⇔ ⇔ − ln a −→ 0 ⇔
x2 x→0 x x→0
cos x − 1 1 cos x − 1 1 ax − 1
⇔ + −→ 0 ⇔ −→ − ⇔ −→ ln a ⇔
x2 2 x→0 x2 x→0 2 x x→0
ax − 1
Последнее соотношение доказывается напрямую: ⇔ −→ 1 ⇔ ax − 1 ∼ x · ln a
x · ln a x→0 |
x→0
{z }
cos x − 1  правило  − sin x ↑
lim 2
= Лопиталя = lim = формула (6.1.11)
x→0 x x→0 2x
  − cos x 1
= снова правило
Лопиталя = lim =−
x→0 2 2

Связь между асимптотической эквивалентностью и асимптотическим сравнением. Свя-


зи между формулами (6.1.19) – (6.1.28) и (6.1.5) – (6.1.14) отражают важную общую зависимость
370 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

между символами ∼ и o:
Теорема 6.1.9 (о связи между символами ∼ и o). Следующие утверждения эквивалентны:
(i) f (x) ∼ g(x);
x→a
(ii) f (x) = g(x) + o (g(x));
x→a
(ii) g(x) = f (x) + o (f (x)).
x→a

Доказательство. Докажем, что (ii) ⇔ (i):

(ii) ⇔ f (x) = g(x) + o (g(x)) ⇔ f (x) − g(x) = o (g(x)) ⇔


x→a x→a
⇔ f (x) − g(x) = α(x) ·g(x) ⇔ f (x) = (1 + α(x)) ·g(x) ⇔ f (x) ∼ g(x) ⇔ (i)
| {z} | {z } x→a
↓ ↓
0 1

А теперь – что (iii) ⇔ (i):

уже доказано свойство 3◦ , с.361


(iii) ⇔ g(x) = f (x) + o (f (x)) ⇔ g(x) ∼ f (x) ⇔
x→a x→a
⇔ f (x) ∼ g(x) ⇔ (i)
x→a

Равенство асимптотических выражений и свойства символа o. До сих пор мы рассматри-


вали асимптотические формулы, в которых символ o встречается только один раз, и в тех случаях,
когда o выражался через остальные элементы формулы, смысл этих формул был очевиден. Но в
этой науке приходится иметь дело также с формулами, где o встречается несколько раз, и для
придания смысла таким формулам необходима некая предварительная работа.
Сначала нужно определить понятие асимптотического выражения. Это то, что стоит справа в
формулах (6.1.19)-(6.1.27). Точное определение выглядит так:
• Асимптотическим выражением называется запись, полученная из числовых выраже-
ний2 с помощью следующих операций:
1) всякое числовое выражение считается асимптотическим выражением,
2) если A – асимптотическое выражение, то запись o (A) тоже считается асимп-
x→a
тотическим выражением,
3) если A – асимптотическое выражение, то подстановкой вместо произвольной
переменной, входящей в A, но не в связке вида x → a, любого другого асимпто-
тического выражения B, мы снова получаем асимптотическое выражение.

⋄ 6.1.26. Следующие записи являются асимпто- ⋄ 6.1.27. Следующие записи, наоборот, не явля-
тическими выражениями: ются асимптотическими выражениями:
 
o (x), o (x)
sin x, o (sin x), sin o (x) sin x→0 o (1)→0
x→0 x→0 x→0

К асимптотическим выражениям нужно относиться как к выражениям (в главе про логику они
назывались термами), описывающим семейства функций: когда вместо каждого входящего символа
o мы подставляем выражение, описывающее какую-то функцию (со свойством этого символа
x→a
o ), мы получаем выражение, описывающее определенную стандартную функцию. Говорят, что
x→a
два асимптотических выражения равны, если они описывают один и тот же класс функций:
 
A = B ⇐⇒ f (x) = A ⇐⇒ f (x) = B

2 Числовые выражения были определены на с.((a)).


§ 1. Асимптотические отношения и формулы 371

⋄ 6.1.28. Докажем равенство: Действительно,

x + o (x) = x + o (2x) f (x) = o (x) + o (x2 ) ⇔


x→0 x→0
x→0 x→0
Действительно, ⇔ ∃α, β f (x) = α(x) ·x + β(x) ·x2 =
|{z } |{z}
↓ ↓
f (x) = x+ o (x) ⇔ f (x)−x = o (x) ⇔ 0 0
x→0 x→0  
f (x) − x f (x) − x = α(x) + β(x) ·x ·x ⇔
⇔ −→ 0 ⇔ −→ 0 ⇔ | {z} |{z} ↓
x x→0 2x x→0
↓ ↓ 0
⇔ f (x)−x = o (2x) ⇔ f (x) = x+ o (2x). 0 0
x→0 x→0 | {z }

⋄ 6.1.29. Покажем, что следующее равенство, γ(x) = α(x) + β(x) · x −→ 0
x→0
наоборот, неверно:
⇔ ∃γ f (x) = γ(x) ·x ⇔
|{z}
x + o (x) = o (1) ↓
x→0 x→0 0
|{z}
Для этого достаточно найти какую-нибудь функ- ⇓

цию f , которая принадлежала бы второму клас- α(x) = γ(x) −→ 0
x→0
су β(x) = 0 −→ 0
x→0
f (x) = o (1)
x→0 ⇔ f (x) = o (x)
x→0
но не первому:
Предпоследнюю равносильность надо понимать
f (x) 6= x + o (x).
x→0 так, что из существования α и β с нужными свой-
ствами следует существование γ, в качестве ко-
Такой функцией будет, например,
торой можно взять γ(x) = α(x)+β(x)·x, и наобо-
√ рот, из существования γ с нужными свойствами
f (x) = 3 x.
следует существование α и β, в качестве которых
Для нее мы получим: можно взять α(x) = γ(x), β(x) = 0.

f (x) √ ⋄ 6.1.31. Покажем, что


= 3 x −→ 0 ⇔ f (x) = o (1).
1 x→0 x→0
o (x) + o (x2 ) 6= o (x2 ),
А с другой стороны, x→0 x→0 x→0

√ Здесь достаточно предъявить функцию f со


f (x) − x 3
x−x 1
= = √ − 1 6−→ 0 ⇒ свойствами
x x 3
x2 x→0
⇒ f (x)−x 6= o (x) ⇒ f (x) 6= x+ o (x). f (x) = o (x) + o (x2 ) & f (x) 6= o (x2 ),
x→0 x→0 x→0 x→0 x→0

⋄ 6.1.30. Покажем, что Такой функцией будет, например,

o (x) + o (x2 ) = o (x), 4


f (x) = x 3 .
x→0 x→0 x→0

Свойства символа o:
     
1o C · o f (x) = o C · f (x) = o f (x) , C 6= 0;
x→a x→a x→a
     
2o o f (x) ± o f (x) = o f (x) ;
x→a x→a x→a
       
3o o f (x) · o g(x) = o f (x) · g(x) = f (x) · o g(x) ;
x→a x→a x→a x→a
    
4o o o f (x) = o f (x) .
x→a x→a x→a
5o o (f (x)) = f (x) · o (1);
x→a x→a
6o o (1) −→ 0;
x→a x→a
   
7o f (x) ∼ g(x) ⇒ o f (x) = o g(x) ;
x→a x→a x→a
372 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
  µ  
8o f (x) + o f (x) = f (x)µ + o f (x)µ , µ 6= 0.
x→a x→a

Доказательство. 1. Докажем 1o : во-первых,

u(x) = C· o (f (x)) ⇔ u(x) = C·α(x) ·f (x) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = o (C·f (x)),
x→a | {z } |{z } x→a
↓ ↓
0 0

и, во-вторых,
C6=0
u(x) = o (C·f (x)) ⇔ u(x) = α(x) ·C·f (x) ⇔ u(x) = C · α(x) ·f (x) ⇔ u(x) = o (f (x)).
x→a | {z} | {z } x→a
↓ ↓
0 0

2. Докажем 2o :
    
u(x) = o (f (x) ± o f (x) ⇔ u(x) = α(x) ·f (x) ± β(x) ·f (x) = α(x) ± β(x) ·f (x) ⇔
x→a x→a | {z } |{z} | {z }
↓ ↓

0 0
0
| {z }

γ(x) = α(x) ± β(x) −→ 0
x→0
 
⇔ u(x) = γ(x) ·f (x) ⇔ u(x) = o f (x)
|{z} x→a

0
|{z}
 ⇓
α(x) = γ(x) −→ 0
x→0
β(x) = 0 −→ 0
x→0

3. Докажем 3o : во-первых,
     
u(x) = o f (x) · o g(x) ⇔ u(x) = α(x) ·f (x) · β(x) ·g(x) = α(x) · β(x) ·f (x) · g(x) ⇔
x→a x→a | {z} |{z} | {z }
↓ ↓

0 0
0
| {z }

γ(x) = α(x) · β(x) −→ 0
x→0
 
⇔ u(x) = γ(x) ·f (x) · g(x) ⇔ u(x) = o f (x) · g(x) ,
|{z} x→a

0
|{z}

 2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 13 −→ 0
x→0

и, во-вторых,
 
u(x) = o f (x) · g(x) ⇔ u(x) = α(x) ·f (x) · g(x) = f (x) · α(x) ·g(x) ⇔
x→a | {z} |{z }
↓ ↓
0 0
 
⇔ u(x) = f (x) · o g(x) .
x→a

o
4. Докажем 4 :
    
u(x) = o o f (x) ⇔ u(x) = α(x) · o f (x) ⇔
x→a x→a |{z } x→a

0
§ 1. Асимптотические отношения и формулы 373
 
⇔ u(x) = α(x) · β(x) ·f (x) = α(x) · β(x) ·f (x) ⇔
| {z} |{z} | {z }
↓ ↓

0 0
0
| {z }

γ(x) = α(x) · β(x) −→ 0
x→0
 
⇔ u(x) = γ(x) ·f (x) ⇒ u(x) = o f (x)
|{z} x→a

0
|{z}

 2
α(x) = γ(x) 3 −→ 0
x→0
β(x) = γ(x) 31 −→ 0
x→0

5. Для доказательства 5o можно воспользоваться вторым равенством в уже доказанном свойстве


3o :
o (f (x)) = o (f (x) · 1) = f (x) · o (1)
x→a x→a x→a

6. Докажем 6o :
u(x) = o (1) ⇔ u(x) = α(x) ·1 ⇔ u(x) −→ 0.
x→a | {z} x→a

0

7. Докажем 7o : Пусть f (x) ∼ g(x), то есть


x→a

f (x) = θ(x) ·g(x)


|{z}

1

Тогда
   
u(x) = o f (x) ⇔ u(x) = α(x) ·f (x) = α(x) · θ(x) ·g(x) = α · θ(x) ·g(x) ⇔ u(x) = o g(x)
x→a |{z } | {z} |{z} | {z } x→a
↓ ↓ ↓ ↓
0 0 1 0

8.
  µ
u(x) = f (x) + o f (x) ⇔
x→a
 µ    µ  µ
⇔ u(x) = f (x) + α(x) ·f (x) = 1 + α(x) ·f (x) = 1 + α(x) ·f (x)µ ⇔
|{z } | {z } | {z }

↓ ↓
0
1 1
Теорема 6.1.9
 
⇔ u(x) ∼ f (x)µ ⇔ u(x) = f (x)µ + o f (x)µ
x→a x→a

Упрощение асимптотических многочленов. Асимптотические многочлены, о которых пой-


дет здесь речь, представляют собой частный случай асимптотических выражений.
• Простым асимптотическим многочленом называется запись вида

a1 · xλ1 + a2 · xλ2 + ... + an · xλn + o (xµ ),


x→0

где ai ∈ R, λi , µ, n ∈ Z+ . При этом,


— каждое выражение ai · xλi (вне символа o ) называется неасимптотическим
x→0
мономом, а числа ai и λi – его коэффициентом и степенью,
— выражение xµ (под символом o ) называется асимптотическим мономом, а
x→0
число µ называется асимптотической степенью этого асимптотического мно-
гочлена.
374 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

— если в асимптотическом многочлене есть неасимптотический моном ak · xλk с


ненулевым коэффициентом (ak 6= 0) и со степенью (λk ), меньшей чем все осталь-
ные степени,
λk < λi , i 6= k,
и не превосходящей асимптотической степени,

λk 6 µ,

то он называется главным мономом, а число λk — главной степенью этого асимп-


тотического многочлена.
• Асимптотическим многочленом называется запись, составленная из простых асимпто-
тических многочленов, применением конечного числа операций
— умножение на число (когда из асимптотического многочлена A составляется
выражение α · (A)), или
— сложения (когда из двух асимптотических многочленов A и B составляется вы-
ражение (A) + (B)), или
— умножения (когда из двух асимптотических многочленов A и B составляется
выражение (A) · (B)), или
— композиции (когда в один асимптотический многочлен A вместо переменной x
подставляется другой асимптотический многочлен B).
Главный навык, которому учит эта наука, состоит в умении упрощать асимптотические много-
члены. Его можно неформально описать правилом

“меньшие степени переменной поглощают большие”

Это надо понимать не буквально, а со следующими уточнениями. Во-первых, напомним, что в


теореме 6.1.3 мы доказали формулу

xµ ≪ xλ , λ < µ, (6.1.29)
x→0

или, что эквивалентно, формулу


xµ = o (xλ ), λ < µ.
x→0

Она позволяет выделять главное слагаемое в линейных комбинациях элементарных функций, в


частности, в многочленах. Для асимптотических многочленов это правило нужно дополнить сле-
дующей важной теоремой, которая позволяет не только выделять главное слагаемое, но описывает
вообще всю процедуру упрощения.
Теорема 6.1.10. Если λ 6 µ, то
xλ ≫ o (xµ ). (6.1.30)
x→0 x→0
и
o (xλ ) ± o (xµ ) = o (xλ ). (6.1.31)
x→0 x→0 x→0

Если же λ < µ, то
o (xλ ) + C · xµ = o (xλ ). (6.1.32)
x→0 x→0

Доказательство. 1. Условие (6.1.30) эквивалентно условию

o (xµ )
x→0
−→ 0,
xλ x→0

которое при λ 6 µ действительно выполняется:

o (xµ ) xµ · o (1)
x→0 x→0 µ−λ
= = |x {z } · o (1) −→ 0 .
xλ xλ x→0
| {z
x→0
}
ограничено
o
в окрестности свойство 6 на с. 371
нуля при
µ−λ> 0
§ 1. Асимптотические отношения и формулы 375

2. Условие (6.1.31) доказывается цепочкой

u(x) = o (xλ ) ± o (xµ ) ⇔


x→0 x→0
⇔ u(x) = α(x) ·xλ ± β(x) ·xµ = α(x) ·xλ ± β(x) · µ−λ
|x {z } ·xλ =
|{z } |{z} |{z } |{z}
↓ ↓ ↓ ↓ ограничено
0 0 0 0 в окрестности
нуля при
µ−λ> 0
 
= α(x) ·xλ ± β(x) · xµ−λ ·xλ = α(x) ± β(x) · xµ−λ ·xλ ⇔
|{z } | {z } | {z }
↓ ↓

0 0
0

⇔ u(x) = γ(x) ·xλ ⇔ u(x) = o (xλ ).


|{z} x→0

0

3. Условие (6.1.32) доказывается цепочкой

u(x) = o (xλ ) + C · xµ ⇔
x→0
 
⇔ xµ−λ} ·xλ = α(x) + C · xµ−λ ·xλ
u(x) = α(x) ·xλ + C · xµ = α(x) ·xλ + |C · {z ⇔
| {z} |{z } | {z }
↓ ↓ ↓
0 ↓
0 0
(µ − λ > 0) 0

⇔ u(x) = β(x) ·xλ ⇔ u(x) = o (xλ ).


|{z} x→0

0

.
/
Перечислим важные следствия из теорем = 3x + x2 + o (x) = 3x + o (x).
6.1.10 и 6.1.3. Во-первых, из (6.1.32) мы получаем |{z} x→0 x→0


Следствие 6.1.11. В простом асимптотиче- здесь применяется
следствие 6.1.11
ском многочлене все неасимптотические моно-
мы со степенями, большими асимптотической Во-третьих, из (6.1.29) и (6.1.30) мы получаем
степени можно без потери информации обну-
лять. Следствие 6.1.13. Главный моном простого
асимптотического многочлена ak · xαk (если
⋄ 6.1.32. Например, он существует) является главным слагаемым
этого многочлена:
2x + 4x2 − 2x3 + 5x4 + o (x2 ) = ak ·xαk ≫ ai ·xαi (i 6= k), ak ·xαk ≫ o (xβ ).
x→0
.
/ .
/ x→0 x→0 x→0
= 2x + 4x2 − 2x3 + 5x4 + o (x2 ) =
x→0 (и поэтому весь многочлен эквивалентен свое-
2 2
= 2x + 4x + o (x ) му главному моному).
x→0
⋄ 6.1.34. Например,
Во-вторых, из (6.1.31) следует
2x + 4x2 − 2x3 + 5x4 + o (x2 ) ∼ 2x
x→0 x→0
Следствие 6.1.12. При сложении асимптоти-
ческих многочленов меньшая асимптотическая Из следствия 6.1.13 и свойства 7o на с.371 мы
степень поглощает большую. получаем

⋄ 6.1.33. В качестве иллюстрации можно приве- Следствие 6.1.14. При подстановке простого
сти такой пример: асимптотического многочлена A в символ o
x→0
возникающий асимптотический многочлен ра-
x + x2 + o (x2 ) + 2x + o (x) = вен как асимптотическое выражение бесконеч-
x→0 x→0
/
. но малому от главного монома: o (xαk ), где αk
x→0
= 3x + x2 + o (x2 ) + o (x) = – главная степень многочлена A.
x→0 x→0
376 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
.
/
⋄ 6.1.35. = (следствие 6.1.11) = x+x2+ o (x) = x+ o (x)
  x→0 x→0
o 2x + 4x2 − 2x3 + 5x4 + o (x2 ) =
x→0 x→0
 .
/ .
/ .
/ /
. ⋄ 6.1.37.
= o 2x + 4x − 2x + 5x4 + o (x2 ) =
2 3
x→0 x→0
= o (x)  2
x→0 x + x2 + o (x2 ) =
x→0
Теперь рассмотрим примеры, где применяет-    
ся много правил. = x + x + o (x2 ) · x + x2 + o (x2 ) =
2
x→0 x→0
 2
⋄ 6.1.36. = x2 + x4 + o (x2 ) + 2x3 + x o (x2 ) + x2 o (x2 ) =
  x→0
 
x→0
 
x→0
 
2 2
x + x + o (x ) + o x + x2 + o (x2 ) = = x2 +x4 + o x4 +2x3 + o x3 + o x4 =
x→0 x→0 x→0 x→0 x→0 x→0
= (следствие 6.1.14) = x + x2 + o (x2 )+ = (следствие 6.1.12) =
x→0 .
/    .
/ 
 .
/ .
/ 
2
+ o x + x + o (x ) = 2 = x + x + o x4 + 2x3 + o x3 + o x4 =
2 4
x→0 x→0 x→0 x→0 x→0
 
2 2 2 4 3 3
= x + x + o (x ) + o (x) = (следствие 6.1.12) = = x + x + 2x + o x = (следствие 6.1.11) =
x→0 x→0 x→0
/
. .
/    
= x + x + o (x ) + o (x) = x + x2 + o (x) =
2 2
= x + x + 2x + o x3 = x2 + 2x3 + o x3
2 4 3
x→0 x→0 x→0 x→0 x→0

Последний пример особенно важен, и поэтому будет полезно найти более экономный способ
упрощать подобные выражения. Представим себе, что нам нужно упростить асимптотическое вы-
ражение
     
A0 xl + A1 xl+1 + ... + Ak xl+k + o xl+k · B0 xm + A1 xm+1 + ... + An xm+n + o xm+n
x→0 x→0
(6.1.33)
Для этого можно пользоваться следующим алгоритмом.

Алгоритм экономного раскрытия скобок


при упрощении асимптотических многочленов:

1. Мысленно раскрываем скобки, и находим сначала минимальную степень M переменной x,


которая может получиться под символом o. В нашем случае, если A0 6= 0, B0 6= 0, получается

M = min{l + m + n, l + k + m}.

Это будет означать, что после упрощения наше выражение должно оканчиваться символом
 
o xM
x→0

2.
 Последствию 6.1.11 все слагаемые со степенями µ > M при упрощении “съедаются” слагаемым
o xM :
x→0 .
/    
xµ + o xM = o xM
x→0 x→0

Поэтому, раскрывая скобки, мы должны лишь найти коэффициенты перед степенями xi , i 6 M .


Это делается так же, как при обычном умножении многочленов.

Покажем, как этот алгоритм действует на конкретных примерах.

⋄ 6.1.38. Рассмотрим еще раз выражение из 1. Сначала замечаем, что минимальная сте-
примера 7.2: пень переменной x, стоящая под символом o, ко-
торая может получиться при раскрытии скобок
 2 равна 3. Это получается, когда слагаемое x умно-
x + x2 + o (x2 ) =
x→0 жается на слагаемое o (x2 ). Значит, наше упро-
    x→0
= x + x2 + o (x2 ) · x + x2 + o (x2 )
x→0 x→0
§ 1. Асимптотические отношения и формулы 377

щенное выражение должно оканчиваться на ⋄ 6.1.40. Упростим выражение


   
o (x3 ) 1
x→0 x2 − x3 + o (x3 ) · 2x3 + x5 + o (x6 )
2 x→0 x→0
2. Выписываем коэффициенты перед степе-
нями xλ , λ 6 3, которые получаются при рас- 1. Замечаем, что минимальная степень пере-
крытии скобок: менной x, стоящая под символом o, которая мо-
при раскрытии скобок; жет получиться при раскрытии скобок равна 6.
0 Это получается, когда слагаемое o (x3 ) умно-
x :0 степень x0 вообще ; x→0
получиться не может жается на слагаемое 2x3 . Значит, наше упрощен-
 
x1 : 0 степень x1 ное выражение должно оканчиваться на
тоже получиться не может ;
   
степень x2 может получиться, o x6
x2 : 1 когда x умножается на x ; x→0
 3

степень x может получиться,
2
 когда x умножается на x , . 2. Выписываем коэффициенты перед степе-
x3 : 1 + 1 = 2 и когда наоборот нями xi , i 6 6, которые получаются при раскры-
x2 умножается на x
тии скобок:
3. Выписываем результат:  
при раскрытии скобок степень x0
x0 : 0 вообще получиться не может ;
 2  
x + x2 + o (x2 ) = x2 + 2x3 + o x3 x1 : 0 (−′′ −);
x→0 x→0
x2 : 0 (−′′ −);
⋄ 6.1.39. Упростим выражение, отличающееся x3 : 0 (−′′ −);
от 7.2 степенью:
x4 : 0 (−′′ −);
 3  
степень x5 может получиться,
x + x2 + o (x2 ) = x5 : 2 2
когда x умножается на 2x 3 ;

x→0
    6

степень x может получиться,
= x + x + o (x2 ) · x + x2 + o (x2 ) ·
2 x6 : −1 когда − 1 x3 умножается на 2x3
.
2
x→0 x→0
 
· x + x + o (x2 )
2 3. Выписываем результат:
x→0
  
1. Сначала замечаем, что минимальная сте- 1
x2 − x3 + o (x3 ) · 2x3 + x5 + o (x6 ) =
пень переменной x, стоящая под символом o, ко- 2 x→0 x→0
торая может получиться при раскрытии скобок = 2x − x + o (x6 )
5 6
равна 4. Это получается, когда два слагаемых x x→0
2
умножаются на слагаемое o (x ). Значит, наше ⊲⊲ 6.1.41. Упростите выражения:
x→0
упрощенное выражение должно оканчиваться на  2
  1. −x2 + 32 x3 + o (x3 )
x→0
o x4  3
x→0 2. −x2 + 2 3
+ o (x3 )
3x x→0

2. Выписываем коэффициенты перед степе-  2


1 3
3. 3x + 5x + o (x4 )
нями xi , i 6 4, которые получаются при раскры- x→0
 3
тии скобок: 1 3
4. 3x + 5x + o (x4 )
при раскрытии скобок x→0
   
x0 : 0 степень x0 вообще ; 5. 3x2 + 1 3
4x + o (x3 ) · −2x + x2 + o (x2 )
получиться не может x→0 x→0
     
степень x1 тоже
x1 : 0 получиться не может ;
6. 3x2 + 1 3 3
4 x + o (x )
x→0
· −2x + x2 + o (x3 )
x→0
     
степень x2 тоже
x2 : 0 получиться не может ;
7. 3x2 + 1 3 4
4 x + o (x )
x→0
· −2x + x2 + o (x3 )
x→0
   
степень x3 может получиться, 8. 4x + 3x2 − 2x3 + x4 + o (x4 ) ·
3
x :1 когда x умножается ; 
x→0

на x и еще раз на x
! · −x + x2 + x3 − x4 + o (x4 )
x→0
степень x3 может
 
4 получиться в трех случаях,
x :1+1+1=3 когда в разных вариантах x . 9. 4x + 3x2 − 2x3 + x4 + o (x5 ) ·
x→0
умножается на x и на x2  
· −x + x2 + x3 − x4 + o (x4 )
x→0
3. Выписыаем результат:  
10. 4x + 3x2 − 2x3 + x4 + o (x5 ) ·
 3   
x→0

x + x2 + o (x2 ) = x3 + 3x4 + o x4 · −x + x2 + x3 − x4 + o (x5 )
x→0 x→0 x→0
378 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

Вычисление пределов с помощью асимптотических формул Объясним теперь, зачем нуж-


ны асимптотические формулы. Рассмотрим предел

x6 · arctg4 x + sin5 sin tg x2


lim (6.1.34)
x→0 x2 · sin8 x + ln cos 3x5
Для его вычисления не подходит теорема об эквивалентной замене 6.1.2, или принцип выделения
главного слагаемого 6.1.7 (не говоря уже о правиле Лопиталя 5.2.1, которое пришлось бы здесь
применять 10 раз).
Так вот, в этой ситуации как раз бывают полезны асимптотические формулы. Вместе с доказан-
ными в предыдущем параграфе свойствами 10 − 110 , они позволяют вычислять такие “сложные”
пределы. Покажем как это делается, начиная с более простых задач.

2 
⋄ 6.1.42.   − x2 + o (x2 ) + o x2
используем x→0 x→0
= свойство 1o = lim =
 
x→0 x2 · ln 2 + o (x2 )
arcsin 2x − sin x x→0
используем формулы
lim = = 2
x→0 x + ln(1 + 3x) (6.1.19) и (6.1.27)   − x2 + o (x2 )
  =
снова
= lim x→0
=
используем 20 x2 · ln 2 + o (x2 )
2x + o (2x) − x + o (x) x→0
x→0 x→0 x→0
= lim   = 2
x→0
x + 3x + o (3x)   − x2 + x2 o (1)
x→0 после этого x→0
= свойство 6o = lim =
x + o (x) − o (x) x + o (x) x→0 x2 · ln 2 + x2 o (1)
x→0 x→0 x→0 x→0
= lim = lim =
x→0 4x + o (x) x→0 4x + o (x)   − 21 + o (1)
x→0 x→0 делим все x→0
= на x2 = lim =
1 + o (1) x→0 ln 2 + o (1)
x→0 1+0 1 x→0
= lim = =  
x→0 4 + o (1) 4+0 4 применяем − 21 + 0 1
x→0 = свойство 7o = =−
ln 2 + 0 2 ln 2
⋄ 6.1.43. ⋄ 6.1.44.
 1 
1 ln (x+ex ) x
lim (x + ex ) x = lim e =
ln(cos x) используем формулы x→0 x→0
lim x2 = (6.1.21) и (6.1.24) = 1 x limx→0 1
x ·ln(x+1+x+x→0
o (x))
x→0 2 −1
  = elimx→0 x ·ln(x+e )
=e =
2
ln 1 − x2 + o (x2 ) limx→0 1
x ·ln(1+2x+x→0
o (x))
x→0 =e =
= lim =   
x→0 x2 · ln 2 + o (x2 ) 1
x→0 limx→0 x · 2x+ o (x)+ o 2x+ o (x)
 x2 2
 =e x→0 x→0 x→0
=
поскольку − 2 + o (x ) −→ 0,   
x→0 x→0
 можно сделать замену  limx→0 1
x · 2x+ o (x)+ o 2x+ o (2x)
 2
y = − x2 + o (x2 ),
 =e x→0 x→0 x→0
=
 
 x→0
и тогда получится, что y −→ 0,   
 x→0  limx→0 1
x · 2x+ o (x)+ o (2x)
=
 и по формуле
 (6.1.22) мы будем
 иметь  =
 =e x→0 x→0
=
 2
ln 1 − x2 + o (x2 ) =   
 x→0  1
  limx→0 x · 2x+ o (x)+ o (x)
 = ln(1 + y) = y + o (y) =
y→0 
=e x→0 x→0
=
2 2  
2 2
= − x2 + o (x ) + o − x2 + o (x ) 1
x→0 x→0 x→0 limx→0 x ·x· 2+ o (1)+ o (1)
2
 2
 =e x→0 x→0
=
− x2 + o (x ) + o 2
− x2 + o (x ) 2  
x→0 x→0 x→0 limx→0 2+ o (1)+ o (1)
= lim = =e x→0 x→0
= e2+0+0 = e2
x→0 x2 · ln 2 + o (x2 )
x→0
  ⋄ 6.1.45. Вернемся теперь к примеру (6.1.34):
используем
= свойство 3oo = x6 · arctg4 x + sin5 sin tg x2
2
 2 .
/  lim
x→0 x2 · sin8 x + ln cos 3x5
=
− x2 + o (x2 ) + o − x2 + o (x2 )   4  5 
x→0 x→0 x→0 = lim x6 · x + o (x) + sin tg x2 + o (sin tg x2 )
= lim = x→0 x→0
:
x→0
x→0 x2 · ln 2 + o (x2 ) (  8 !)
x→0 (3x )  
5 2
2
 2 : x2 · x + o (x) + ln + o 1− (3x5 )2 =
− x2 + o (x ) + o − x2
2 x→0
(
2 x→0

x→0 x→0  
= lim =
x→0 x2 · ln 2 + o (x2 ) = lim x6 · x4 + o (x4 ) +
x→0 x→0
x→0
§ 1. Асимптотические отношения и формулы 379

  !5 )  
применяем
+ tg x2 + o (tg x2 ) + o tg x2 + o (tg x2 ) : = свойства 10 и 30 §7 =
x→0 x→0 x→0
(   !) 1 1 1
9x10   o (x ) + 3x − o (x 4 )
4 4
: x2 · x8 + o (x8 ) + o 9x10 + ln 1− = x→0 x→0
x→0 2 x→0 = lim 2 2 =
  5  x→0 o (x 7 ) + x 7
x→0
= lim x10 + o (x10 ) + tg x2 + o (tg x2 ) :
x→0 x→0 x→0 1 1
( o (x 4 ) + 3x 4
9x10   x→0
: x10 + o (x10 ) − + o 9x10 + = lim 2 2 =
x→0 2 x→0 x→0 o (x 7 ) + x 7
!) x→0
9x10  
1 1
+ o − + o 9x10 = x 4 · o (1) + 3x 4
x→0 2 x→0
x→0
( = lim 2 2 =
= lim x
10
+ o (x
10
)+
x→0 x 7 · o (1) + x 7
x→0 x→0 x→0

   )
5
o (1) + 3
x→0
+ x2 + o (x2 ) + o x2 + o (x2 ) : = lim 1 1 =
x→0 x→0 x→0
( )
x→0 · o (1) + x 28
x 28
  x→0
9x10
: x
10
+ o (x
10
)− + o x
10
= по свойству 80 §7  0 + 3 
x→0 2 x→0
 5
= o (1) −→ 0 = =∞
x→0 x→0 0·0+0
x10 + o (x10 ) + x2 + o (x2 )
x→0 x→0
= lim
x→0 10
− 7x2 + o (x10 )
=
⋄ 6.1.47.
x→0

x10 + o (x10 ) + x10 + o (x10 ) √ √


x→0 x→0 4 3 x + 3 4 x − 2 sin x
= lim 10
= lim √ =
x→0 − 7x2 + o (x10 ) 7
x→0
x→∞ 1 − cos x + x2
1 1
2x10 + o (x10 ) 2 + o (1) 4x 3 + 3x 4 − 2 sin x
x→0 x→0
= lim
x→0 − 7x10
= lim
x→0 − 72 + o (1)
= = lim 2 =
2 + o (x10 ) x→0
x→∞ 1 − cos x + x 7
x→0
 1 1 
2+0 4 x4 = o (x 3 )
= =− x→∞
− 72 + 0 7  sin x = o (x 31 ) 
 
= x→∞
2  =
⋄ 6.1.46. o (x 7 )
cos x = x→∞
2
1= o (x 7 )
√ √ x→∞
4 3 x + 3 4 x − 2 sin x 1
4x 3 + 3 o (x 3 ) − 2 o (x 3 )
1 1
lim √7
= x→∞ x→∞
x→0 1 − cos x + x2 = lim =
  x→∞
2
o (x 7 ) − o (x 7 ) + x 7
2 2

= применяем формулы
(6.1.19) и (6.1.21) = x→∞ x→∞
1 1
1 1 4x 3 + o (x 3 )
4x + 3x − 2(x + o (x))
3 4
= lim x→∞
=
x→0 2 2
= lim 1 2 2 = x→∞ o (x 7 ) + x 7
x→0
2x + o (x2 ) +x 7 x→∞
x→0 1 1
 1 1
 4x 3 + x 3 · o (1)
x3 = o (x 4 ) x→∞
 x→0
1  = lim 2 2 =
= x = o (x 4 ) =
x→∞ x · o (1) + x 7
7
x→0 x→∞
2
x2 = o (x 7 ) 1 1

n
x→0 4x 21 + x 21 · o (1)
x→∞
1 1
= lim 4 o (x 4 ) + 3x 4 − = lim =
x→0 x→0
x→∞ o (1) + 1
x→∞
1 1 o 
по свойству 8 §7 0 
− 2 o (x 4 ) + o ( o (x 4 )) : = o (1) −→ 0 =
x→0 x→0 x→0 x→∞ x→∞
n1 2 2 2
o
: o (x 7 ) + o ( o (x 7 )) + x 7 = 1
4 + o (1)
x→∞
2 x→0 
x→0 x→0
 = lim x 21 · =
применяем
x→∞ o (1) + 1
= свойство 6o §7 = x→∞
 
1 1 1 1
4+0
4 o (x 4 ) + 3x 4 − 2( o (x 4 ) + o (x 4 )) = ∞· =∞
x→0 x→0 x→0 0+1
= lim 1 2 2 2 =
x→0 o (x 7 )
+ o (x 7 ) + x 7
2 x→0 x→0 ⊲⊲ 6.1.48. Вычислите пределы:
 
применяем 1−cos x
= свойства 10 и 20 §7 = 1. limx→0 ln(1+tg2 x)
1 1 1 ln(1+x+x2 )+arcsin 3x−5x3
o (x 4 ) + 3x 4 − 2( o (x 4 )) 2. limx→0 sin 2x+tg2 x+(ex −1)5
x→0 x→0
= lim 2 2 =  1
x→0 o (x 7 ) + x 7 3. limx→0 cos x + arctg2 x arcsin2 x
x→0
380 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

§2 Формулы Пеано и асимптотика


(a) Формулы Пеано
Формула Тейлора-Пеано. Асимптотические формулы (6.1.19) – (6.1.28), оказывается, являются
частными случаями одной общей формулы, которая описывается следующей теоремой:
Теорема 6.2.1 (Тейлора-Пеано). Пусть функция f определена и дифференцируема порядка n на
интервале (a, b). Тогда для всякой точки x0 ∈ (a, b) справедлива следующая асимптотическая
формула:

n
X f (k) (x0 )  
f (x) = · (x − x0 )k + o (x − x0 )n (6.2.35)
k! x→x0
k=0

• Эта формула называется формулой Тейлора с остаточным членом в форме Пеано порядка
(или точности) n для функции f в точке x0 .
Доказательство теоремы 6.2.1. Рассмотрим многочлен Тейлора
n
X f (k) (x0 )
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn (x) = f (x0 ) + · (x − x0 ) + · (x − x0 )2 + ... + · (x − x0 )n = · (x − x0 )k
1! 2! n! k!
k=0

и заметим, что

Tn (x0 ) = f (x0 ), Tn′ (x0 ) = f ′ (x0 ), Tn′′ (x0 ) = f ′′ (x0 ), ... Tn(n) (x0 ) = f (n) (x0 ) (6.2.36)

Действительно,

f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )


Tn (x0 ) = f (x0 ) + · (x0 − x0 ) + · (x0 − x0 )2 + ... + · (x0 − x0 )n =
1! 2! n!
= f (x0 ) + 0 + 0 + ... + 0 = f (x0 )

Затем,
f ′ (x0 ) f ′′ (x0 ) f (n) (x0 )
Tn′ (x) = 0 + ·1+ · 2(x − x0 ) + ... + · n(x − x0 )n−1
1! 2! n!
и поэтому

f ′′ (x0 ) f (n) (x0 ) f ′ (x0 )


Tn′ (x0 ) = f ′ (x0 ) + · 2(x0 − x0 ) + ... + · n(x0 − x0 )n−1 = + 0 + ... + 0 = f ′ (x0 )
2! n! 1!
И так далее. Для последней производной мы получим

f (n) (x0 )
Tn(n) (x) = 0 + 0 + ... + · n! = f (n) (x0 )
n!
и поэтому
Tn(n) (x0 ) = f (n) (x0 )
Формулы (6.2.36) позволяют вычислить следующий предел:

по первой формуле (6.2.36)


!
f (x) − Tn (x) получаем неопределенность 00 , f ′ (x) − Tn′ (x)
lim = поэтому можно применить = lim =
x→x0 (x − x0 )n правило Лопиталя
x→x0 n(x − x0 )n−1
по второй формуле (6.2.36)
!
получаем неопределенность 00 , f ′′ (x) − Tn′′ (x)
= поэтому опять применяем = lim =
правило Лопиталя
x→x0 n(n − 1)(x − x0 )n−2
по формулам (6.2.36)
!
(n)
всегда будет неопределенность 0
0,
f (n) (x) − Tn (x)
= ... = поэтому правило Лопиталя = ... = lim =
применяется n раз
x→x0 n!
  0
= применяем последнюю
формулу (6.2.36) = =0
n!
§ 2. Формулы Пеано и асимптотика 381

Итак, мы получили
f (x) − Tn (x)
−→ 0
(x − x0 )n x→x0
то есть,
f (x) − Tn (x) = o ((x − x0 )n )
x→x0

или
f (x) = Tn (x) + o ((x − x0 )n )
x→x0

а это как раз и есть формула (6.2.35).

  √ √ 
⋄ 6.2.1. Выпишем формулу Тейлора для функ- π 3 2 2 π
+ oπ x− = + · x− −
ции f (x) = sin x в точке x0 = π4 с точностью x→ 4 4 2 2 4
n = 2: √  √  
2 π 2 2  π 3 π 3
− · x− − · x− + oπ x−
f ′ (x0 ) 4 4 12 4 x→ 4 4
sin x = f (x) = f (x0 ) + · (x − x0 )+
1!
′′
f (x0 )   а без выкладок это будет выглядеть так:
+ · (x − x0 )2 + o (x − x0 )2 =
2! x→x0 √ √  √ 
π   − sin( π4 )  2 2 π 2 π 2
π cos 4 π π 2 sin x = + · x− − · x− −
= sin + · x− + · x− + 2√ 2 4 4 4
4 1! 4 √ 2! 4  
  √ 2  π 3 π 3
π 2 2 2  π − · x− + oπ x−
+ oπ x− = + · x− − 12 4 x→ 4 4
x→ 4 4 2 2 4
√   
2 π 2 π 2 ⋄ 6.2.2. Выпишем формулу Тейлора для функ-
− · x− + oπ x−
4 4 x→ 4 4 ции f (x) = ln x в точке x0 = 1 с точностью n = 3:
Если убрать выкладки, получается следующий
f ′ (x0 )
результат: ln x = f (x) = f (x0 ) + · (x − x0 )+
1!
√ √  √  f ′′ (x0 ) f ′′′ (x0 )
2 2 π 2 π 2 + · (x − x0 )2 + · (x − x0 )3 +
sin x = + · x− − · x− + 2! 3!
2 2 4 4 4  1
 
π 2 |x=1
+ oπ x− + o ((x − x0 )3 ) = ln 1 + x · (x − 1)+
x→ 4 4 x→x0 1!
− 12 |x=1 2
3 |x=1
Можно увеличить точность, например, до n = 3, + x · (x − 1)2 + x · (x − 1)3 +
2! 3!
и тогда получится 1
+ o ((x − 1)3 ) = (x − 1) − · (x − 1)2 +
f ′ (x0 ) x→x0 2
sin x = f (x) = f (x0 ) + · (x − x0 )+ 1
1! 3
+ · (x − 1) + o ((x − 1)3 )
f ′′ (x0 ) f ′′′ (x0 ) 3 x→x0
+ · (x − x0 )2 + · (x − x0 )3 +
2! 3! Если убрать выкладки, получается следующий
π cos π4  π результат:
+ o ((x − x0 )3 ) = sin + · x− +
x→x0 4 1! 4
− sin( π4 )  π 2 − cos( π4 )  π 3 (x − 1)2 (x − 1)3
+ · x− + · x− + ln x = (x− 1)− + + o ((x− 1)3 )
2! 4 3! 4 2 3 x→x0

Формулы Маклорена-Пеано.
• При x0 = 0 формула Тейлора называется формулой Маклорена:

f ′ (0) f ′′ (0) 2 f (n) (0) n


f (x) = f (0) + ·x+ · x + +... + · x + o (xn ) =
1! 2! n! x→0
Xn
f (k) (0) k
= · x + o (xn ) (6.2.37)
k! x→0
k=0
382 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

Некоторые примеры формул Маклорена нам уже знакомы:

Формулы Маклорена с точностью n = 1 или n = 2.

Нетрудно заметить, что асимптотические формулы (6.1.19) – (6.1.28) являются частными


случаями формулы Маклорена. Например, формула (6.1.19) получается, если подставить f (x) =
sin x и n = 1.
f ′ (0)
sin x = f (x) = f (0) + · x + o (x) = 0 + x + o (x)
1! x→0 x→0

А формула (6.1.20) – если f (x) = cos x и n = 2.

f ′ (0) f ′′ (0) 2 x2
cos x = f (x) = f (0) + ·x+ · x + o (x2 ) = 1 + 0 − + o (x2 )
1! 2! x→0 2 x→0

Формулы Маклорена с точностью n = 3

Для тех же функций, что и в (6.1.19) – (6.1.28) нетрудно выписать соответствующие формулы
с более высокой точностью, например, n = 3 или n = 4:

x3
sin x = x − + o (x3 ) (6.2.38)
6 x→0
3
x
tg x = x + + o (x3 ) (6.2.39)
3 x→0
x2
cos x = 1 − + o (x3 ) (6.2.40)
2 x→0
x2 x3
ln(1 + x) = x − + + o (x3 ) (6.2.41)
2 3 x→0
x x2 x3
loga (1 + x) = − + + o (x3 ) (6.2.42)
ln a 2 ln a 3 ln a x→0
x2 x3
ex = 1 + x + + + o (x3 ) (6.2.43)
2 6 x→0
2
x2
· ln a x3 · ln3 a
ax = 1 + x · ln a + + + o (x3 ) (6.2.44)
2 6 x→0
2
α(α − 1)x α(α − 1)(α − 2)x3
(1 + x)α = 1 + αx + + + o (x3 ) (6.2.45)
2 6 x→0
x3
arcsin x = x + + o (x3 ) (6.2.46)
6 x→0
3
x
arctg x = x − + o (x3 ) (6.2.47)
3 x→0

Полезно сразу же, для случая n = 3 объ- это означает, что нужно увеличить
яснить, зачем эти формулы нужны. Нам сей- точность формул Маклорена.
час важно, что формулы Маклорена позволя- (C) Если ответ получен, то дальнейшее
ют вычислять пределы, которые невозможно вы- увеличение точности формул Макло-
числить с помощью асимптотических формул рена не может привести к изменению
(6.1.19) – (6.1.28). Алгоритм их применения мож- ответа.
но выразить следующими эвристическими пра-
вилами.

⋄ 6.2.3.
Правила вычисления пределов

с помощью формул Маклорена: 1 + 2 tg x − ex + x2
lim
(A) При использовании формул Маклорена
x→0 arcsin x − sin x
может не получиться ответа, если Объясним сначала, почему здесь нужны фор-
возникнет неопределенность. мулы Маклорена. Если этот предел вычислять с
(B) Если возникает неопределенность, то помощью правила Лопиталя, то Вы увидите, что
§ 2. Формулы Пеано и асимптотика 383

дифференцировать придется 3 раза, а поскольку = (применяем (6.2.39)) =


функции в числителе и знаменателе не слишком  
x3 3
просты, это будет довольно утомительно. Пока- =1+ x+ + o (x ) −
3 x→0
жем, с другой стороны, что и асимптотические   2  3
3 3
формулы (6.1.19) – (6.1.28) здесь тоже не помо- x + x3 + o (x3 ) x + x3 + o (x3 )
x→0 x→0
гают: − + +
2  2

1 + 2 tg x − ex + x2 x3
lim = + o (x + + o (x3 ))3 =
x→0 arcsin x − sin x x→0 3 x→0
   упрощаем 
применяем формулы
= (6.1.26), (6.1.24), (6.1.27), (6.1.19) = = ... = с помощью = ... =
0 0
свойств 1 − 8 §7
1+ 1
2 2 tg x + o (2 tg x) − (1 + x + o (x)) + x2
x2 5x3
x→0 x→0
= lim =
x→0 x + o (x) − (x + o (x))
x→0 x→0 =1+x− + + o (x3 )
2 6 x→0
tg x + o (2 tg x) − x − o (x) + x2
= lim x→0 x→0
= Теперь можно вычислять предел:
x→0 o (x) − o (x) √

x→0 x→0
 1 + 2 tg x − ex + x2
применяем свойства lim =
= 10 , 30 = x→0 arcsin x − sin x
2 3

tg x + o (tg x) − x − o (x) + x2 1 + x − x2 + 5x6 + o (x3 ) − ex + x2


x→0
= lim x→0 x→0
= = lim =
o (x) x→0 arcsin x − sin x
x→0
x→0
 
применяем формулы
  = (6.2.43), (6.2.46), (6.2.47) =
применяем
= (5.2) = (
x2 5x3
x + o (x) + o (x + o (x)) − x − o (x) + x2 = lim 1 + x − + + o (x3 )−
= lim
x→0 x→0 x→0 x→0
= x→0 2 6 x→0
x→0 o (x)
x→0
  )
 
теперь x2 x3 3 2
= 40 = − 1+x+ + + o (x ) + x :
2 6 x→0
x + o (x) + o (x) − x − o (x) + x2 (  )
= lim x→0 x→0 x→0
= x3 3 x3 3
x→0 o (x) : x+ + o (x ) − x − + o (x ) =
x→0 6 x→0 6 x→0

  o (x) + x2   2x3 2x3


теперь x→0 теперь + o (x3 ) + x3 · o (1)
= 20 , 30 = lim = 10 = 3 x→0 3 x→0
x→0 o (x) = lim 3 = lim 3 =
x→0 x→0 x + o (x3 ) x→0 x + x3 · o (1)
3 x→0 3 x→0
2
x · o (1) + x o (1) + x 2
= lim x→0
= lim = x→0
3 + o (1) 2
+0
x→0 3
x→0 x · o (1) o (1)x→0 = lim = =2
x→0 x→0 x→0 1 + o (1) 1
+0
  0 + 0 3 x→0 3
теперь
= 80 = =? Число 2 будет ответом.
0
Теперь полезно убедиться в справедливости
Тем не менее, ситуация не безвыходна. Покажем правила (C). Проверим, что если увеличить точ-
как этот предел можно вычислить с помощью ность формул Маклорена, то ответ от этого не
формул Маклорена. Заметим только сразу, что изменится. Это можно сделать, например, выпи-
(6.1.19) – (6.1.28) уже представляют собой фор- сав более подробное разложение экспоненты:
мулы Маклорена с точностью n = 1. Что с их √
помощью не удалось найти ответ, есть иллюстри- 1 + 2 tg x − ex + x2
lim =
рация сформулированного выше правила (A). Но x→0 arcsin x − sin x
если их заменить на другие формулы с большей 2 3
1 + x − x2 + 5x6 + o (x3 ) − ex + x2
точностью, то чудесным образом пример стано- = lim x→0
=
вится решаемым. x→0 arcsin x − sin x
 
применяем формулы
Действительно, попробуем применить фор- = (6.2.46), (6.2.47) =
мулы (6.2.38) – (6.2.47) с точностью n = 3 (и убе- и (6.2.51) с k = 4
(
димся, что после этого сработает правило (B)).
x2 5x3
Для этого сначала выпишем отдельно корень в = lim 1 + x − + + o (x3 )−
x→0 2 6 x→0
числителе: )
!  
по формуле (6.2.45), x2 x3 x4
p √
1+y = − 1+x+ + + + o (x4 ) + x2 :
1 + 2 tg x = 1 y2 y3 3
= 2! 3! 4! x→0
=1+ 2y − + + o (y ) (
8 16 y→0  )
2 3 x3 3 x3 3
tg x tg x : x+ + o (x ) − x − + o (x ) =
= 1 + tg x − + + o (tg3 x) = 6 x→0 6 x→0
2 2 x→0
384 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

2x3
+ o (x3 ) + x4
+ o (x4 ) x2 x3
3 x→0 24 x→0 =x− + + o (x3 )−
= lim = 2 3 x→0
x→0 x3
+ o (x3 )  
3 x→0 x2 x3
− −x − − + o (x3 ) =
2x3 3 x4 2 3
3 + x · o (1) + 24 + x4 · o (1) x→0
x→0 x→0
= lim = 2x3
x→0 x3
3 + x3 · o (1) = 2x + + o (x3 )
x→0 3 x→0
2 x
3 + o (1) + 24 + x→0
o (1) Далее,
x→0
= lim 1 =
x→0 + o (1)
3 x→0 earctg x = (применяем (6.2.43)) =
2
3 +0+0+0 arctg2 x arctg3 x
= 1 =2 = 1 + arctg x + + +
3 +0 2 6
+ o (arctg3 x) = (применяем (6.2.47)) =
То же самое получится, если поменять форму- x→0
 
лу Маклорена на более точную в любом другом x3
месте (или в нескольких местах). =1+ x− + o (x3 ) +
3 x→0
 2
⋄ 6.2.4. 3
x − x3 + o (x3 )
1 x2
earctg x − 1−x + 2 + x→0
+
lim 2
x→0 ln 1+x
1−x − 2x  3
3
x − x3 + o (x3 )
Убедимся, что, как и в предыдущем случае, + x→0
+
этот предел не вычисляется с помощью формул 6 !
(6.1.19) – (6.1.28), то есть с помощью формул Ма-   3
x3
клорена с точностью n = 1: + o x− + o (x3 ) =
x→0 3 x→0
 упрощаем 
1 x2
earctg x − 1−x + 2 = ... = с помощью = ... =
lim = 0 0
свойств 1 − 8 §7
x→0 ln 1+x
1−x − 2x
x2 x3
1 + arctg x + o (arctg x) − (1 − x)−1 + x2
2 = 1+x+ − + o (x3 )
= lim
x→0
= 2 6 x→0
x→0 ln(1 + x) − ln(1 − x) − 2x
( И, наконец,
   
= lim 1 + x + o (x) + o x + o (x) −
x→0 x→0 x→0 x→0 1
) = (1 − x)−1 = (применяем (6.2.45)) =
  x2 1−x
− 1 − x + o (x) + : (−1)(−2)(−x)2
x→0 2 = 1 + (−1)(−x) + +
( ) 2
    (−1)(−2)(−3)(−x)3
: x + o (x) − −x + o (x) − 2x = + + o (x3 ) =
x→0 x→0 6 x→0
= 1 + x + x2 + x3 + o (x3 )
x2 x2 x→0
o (x) + 2 x · o (1) + 2
x→0 x→0
= lim = lim = Теперь вычисляем предел:
x→0 o (x) x→0 x · o (1)
x→0 x→0
o (1) + x   earctg x − 1
+ x2
x→0 2 0+0 1−x 2
= lim = =? lim 1+x =
x→0 o (1) 0 x→0 ln 1−x − 2x
x→0 ( 
x2 x3
Вы можете проверить самостоятельно, что даже = lim 1+x+ − + o (x3 ) −
если увеличить точность формул Маклорена до
x→0 2 6 x→0
)
n = 2, это все равно не поможет.   x2
Но если воспользоваться формулами Мак- − 1 + x + x2 + x3 + o (x3 ) + :
x→0 2
лорена с точностью n = 3 (то есть формулами ( )

(6.2.38) – (6.2.47)), то этот предел удается со- 2x3 3
считать. Только, как и в предыдущем примере, : 2x + + o (x ) − 2x =
3 x→0
перед вычислениями здесь следует выписать от- 3
дельно асимптотическое представление некото- − 7x6 + o (x3 )
x→0
рых фрагментов: = lim 2x3
=
x→0
3 + o (x3 )
x→0
1+x 3
ln = ln(1 + x) − ln(1 − x) = − 7x6 + x3 · o (1)
1−x = lim x→0
=
2x3
= (применяем (6.2.41)) = x→0
3 + x3 · o (1)
x→0
§ 2. Формулы Пеано и асимптотика 385

− 67 + o (1) 7 ⋄ 6.2.6.
x→0
= lim 2 =−
x→0 + o (1) 4 ctg x3
3 x→0 lim (cos(xex ) − ln(1 − x) − x)
x→0
⋄ 6.2.5.
√  Здесь мы не будем утомлять читателя предвари-
x3
ln x + 1 + x2 − x + 6
тельными прикидками, а сразу применим фор-
lim мулы Маклорена с “нужной” точностью. При
x→0 x − arcsin x
этом, в разных местах точность мы будем брать
Здесь мы сразу применим формулы Маклорена
разной, но важно понимать, согласно нашим пра-
с точностью n = 3. Выпишем отдельно асимп-
вилам, что если ты не знаешь какой должна быть
тотическое представление некоторых фрагмен-
точность, то можно брать наугад любую, а затем
тов:
уже, если получится неопределенность (а это са-
 p   
ln x + 1 + x2 = ln x + (1 + x ) 2 = 2 1 мое страшное, что может получиться) – повы-
 2 шать порядок точности до тех пор, пока не по-
  1 1 1
−1 x лучится определенность. И, кроме того, следует
= применяем
(6.2.45) = ln x + 1 + x + 2 2 + иметь в виду, что если на каком-то шаге ответ
2 2
  ! уже получен, а ты все равно продолжаешь вы-
1 1 1 3
− 1 − 2 x числения, увеличивая порядок точности, то ты
+ 2 2 2
+ o (x3 ) =
6 x→0 не сможешь получить другой ответ (если, конеч-
   но не делаешь арифметических ошибок).
1 1 1 1
3 2 −2 x
2
2 −2 − 23 x3 Выпишем получающиеся выражения:
= ln 1 + x + + +
2 2 6   
! cos(xex ) = cos x · 1 + x + o (x) =
x→0
+ o (x3 ) =  
x→0
= cos x + x + o (x2 ) =
2
  x→0
3 x2 3x3 3 1  2
= ln 1 + x − + + o (x ) = =1− x + x + o (x2 ) +
2
2 8 48 x→0
2
x→0
  3 
применяем
= (6.2.41) = + o 2
x + x + o (x ) 2
=
  x→0 x→0
3 x2 3x3
= x− + + o (x3 ) − 1
2 8 48 x→0 = ... = 1 − x2 − x3 + o (x3 )
 2 2 x→0
3 x2 3x3 3
2 x − 8 + 48 + x→0 o (x )
− + cos(xex ) − ln(1 − x) − x =
2
  3  
3 x2 3x3 3 1 2
2 x − 8 + 48 + o (x ) = 1 − x − x 3
+ o (x 3
) −
x→0 2 x→0
+ +  
3
 3 ! x2 x3 3
3 x 2
3x 3 − −x − − + o (x ) −x=
+ o x− + + o (x3 ) = 2 3 x→0
x→0 2 8 48 x→0
 упрощаем  2x3
3 =1− + o (x3 )
x 3 3 x→0
= ... = с 0помощью = ... = x − + o (x )
1 − 90 §7 6 x→0
1 1
ctg x3 = 3
= 3
Теперь вычисляем предел: tg x x + o (x3 )
x→0
√  3
ln x + 1 + x2 − x + x6 Теперь вычисляем предел:
lim =
x→0 x − arcsin x 3
! lim (cos(xex ) − ln(1 − x) − x)ctg x =
подставляем только
 что найденное
 x→0

= разложение ln x + 1 + x2 =   3 1 3
а также формулу (6.2.46) 2x3 x + o (x )

  = lim 1− + o (x3 ) x→0


=
x3 3 x→0 3 x→0
x− + o (x3 ) − x + x6
6  1

x→0   3
= lim   = 3 x + o (x3 )
x→0 3 ln 1− 2x3 + o (x3 ) x→0 
x − x + x6 + o (x3 ) x→0
x→0 = lim e =
3 3 x→0
o (x ) x · o (1) 
3

x→0 x→0 ln 1− 2x + o (x3 )
= lim 3 = lim 3 = 3 x→0
x→0 − x − o (x3 ) x→0 − x − x3 · o (1) x3 + o (x3 )
6 x→0 6 x→0
= lim e x→0 =
x→0
   
o (1) 0
3
− 2x + o (x3 ) + o
3
− 2x + o (x3 )
x→0 3 x→0 x→0 3 x→0
= lim = =0 x3 + o (x3 )
x→0 − 16 − o (1) − 61 −0 = lim e x→0 =
x→0 x→0
386 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

3 − 2 + o (1)
− 2x + o (x3 ) −x3 · 2 +x3 · o (1) 3 x→0
3 x→0 3 x→0 − 2 +0 2
1+ o (1) 3
= lim e
x3 + o (x3 )
x→0 = lim e
x3 +x3 · o (1)
x→0 = = lim e x→0 =e 1+0 = e− 3
x→0 x→0 x→0

Формулы Маклорена с произвольной точностью

Некоторые из формул Маклорена (6.2.38) – (6.2.47) можно обобщить на случай произвольной


точности:
x3 x5 x2k+1
sin x = x − + − ... + (−1)k · + o (x2k+1 ) =
3! 5! (2k + 1)! x→0
Xk
x2i+1
= (−1)i · + o (x2k+1 ) (6.2.48)
i=0
(2i + 1)! x→0

X k
x2 x4 x2k x2i
cos x = 1 − + − ... + (−1)k · + o (x2k ) = (−1)i · + o (x2k ) (6.2.49)
2! 4! (2k)! x→0 i=0
(2i)! x→0

X k
x2 x3 xk xi
ln(1 + x) = x − + + ... + (−1)k−1 · + o (xk ) = (−1)i−1 · + o (xk ) (6.2.50)
2 3 k x→0
i=1
i x→0

X xi k
x2 xk
ex = 1 + x + + ... + + o (xk ) = + o (xk ) (6.2.51)
2! k! x→0 i=0
i! x→0

x2 xk
(1 + x)α = 1 + α · x + α(α − 1) · + ... + α(α − 1)...(α − k + 1) · + o(xk ) =
2! k! x→0
k
X xi
=1+ α(α − 1)...(α − i + 1) · + o (xk ) (6.2.52)
i=1
i! x→0
X k
1
= 1 − x + x2 + ... + (−1)k · xk + o(xk ) = (−1)k · xi + o (xk ) (6.2.53)
1+x x→0 i=0
x→0

X k
1
= 1 + x + x2 + ... + xk + o(xk ) = xi + o (xk ) (6.2.54)
1−x x→0 i=0
x→0

X k
x3 x5 x2k+1 x2i+1
arctg x = x − + − ... + (−1)k · + o(xk ) = (−1)i · + o (xk ) (6.2.55)
3 5 2k + 1 x→0 i=0
2i + 1 x→0

 
⋄ 6.2.7. Вспомним о пределе (6.0.1), которым мы − ln(1 + x) + o (ln(1 + x)) =
x→0
начинали эту главу:    
= x + o (x) + o x + o (x) −
x→0 x→0 x→0
ln(1 + sin x) − sin ln(1 + x)    
lim
x→0 earctg x − 1 − arctg(ex − 1) − x + o (x) + o x + o (x) =
x→0 x→0 x→0

Как уже говорилось, вычислять его с помощью = o (x)


x→0
правила Лопиталя слишком тяжело. С другой
стороны, применять теорему об эквивалентной А знаменатель так:
замене или выделять главное слагаемое тут то-
же бесполезно. earctg x − 1 − arctg(ex − 1) =
 
Если применить асимптотические формулы = применяем формулы
(6.1.24), (6.1.28) =
(6.1.19) – (6.1.28) (то есть формулы Маклорена с
= 1 + arctg x + o (arctg x) − 1
точностью n = 1), то числитель разложится так: x→0
 
− e − 1 + o (ex − 1) =
x
ln(1 + sin x) − sin ln(1 + x) = x→0
     
= применяем формулы
= = x + o (x) + o x + o (x) −
(6.1.22), (6.1.19) x→0 x→0 x→0
   
= sin x + o (sin x)− − x + o (x) + o x + o (x) =
x→0 x→0 x→0 x→0
§ 2. Формулы Пеано и асимптотика 387

= o (x) Знаменатель тоже удобнее представлять


x→0
асимптотическими выражениями частями:
И подстановка в предел ничего не дает:
(arctg x)2
earctg x − 1 = 1 + arctg x + +
ln(1 + sin x) − sin ln(1 + x) 2
lim =
x→0 earctg x − 1 − arctg(ex − 1) (arctg x)3 
+ + o (arctg x)3 − 1 =
o (x) x · o (1) 6 x→0
 
= lim x→0 = lim x→0
= x3
x→0 o (x) x→0 x · o (1) = x− + o (x3 ) +
x→0 x→0 3 x→0
o (1)    3
2
x→0 0 1 x 3
= lim = =? + x− + o (x ) +
x→0 o (1) 0 2 3 x→0
x→0
 3
1 x3
В соответствии с правилом (B), это означа- + x− + o (x3 ) +
6 3 x→0
ет, что нужно увеличить точность формул Ма-  3 !
3
клорена. Возьмем n = 3 (то есть воспользуемся x 3
+ o x− + o (x ) =
формулами (6.2.38) – (6.2.47)). Тогда мы полу- x→0 3 x→0
чим:
x2 x3
= ... = x + − + o (x3 )
sin2 x sin3 x 2 6 x→0
ln(1 + sin x) = sin x − + +
и
 2 3 3 
3
 x 3
+ o sin x = x − + o (x ) −
x→0 6 x→0 arctg(ex − 1) =
 2  
1 x3 x2 x3
− x− + o (x3 ) + = arctg x + + + o (x3 ) =
2 6 x→0 2 6 x→0
 3  x2 x3 
1 x3
3 = x+ + + o (x3 ) −
+ x− + o (x ) + 2 6 x→0
3 6
1  3
x→0
 3 ! x2 x3
x3 − · x+ + + o (x3 ) +
+ o x− + o (x )3
= 3 2 6 x→0
 3 
x→0 6 x→0 x2 x3
+ o x+ + + o (x3 ) =
x2 x3 x→0 2 6 x→0
= ... = x − + + o (x3 ) x2 x3
2 6 x→0
= ... = x + − + o (x3 )
и 2 6 x→0

и поэтому
3
(ln(1 + x))
sin ln(1 + x) = ln(1 + x) − +
6 earctg x − 1 − arctg(ex − 1) =
   
x2 x3 x2 x3
+ o (ln(1 + x))3 = x − + + = x+ − 3
+ o (x ) −
x→0 2 3 2 6 x→0
  
! x2 x3
3 x2 x3
 x − 2 + 3 + o x3 − x+ − + o (x3 ) =
+ o x3 − x→0
+ 2 6 x→0
x→0 6 = o (x3 )
  ! x→0
x2 x3 3
 3
+ o x− + + o x = И опять при подстановке в предел получается
x→0 2 3 x→0
неопределенность:
x2 x3
= ... = x − + + o (x3 )
2 6 x→0 ln(1 + sin x) − sin ln(1 + x)
lim =
и поэтому x→0 earctg x − 1 − arctg(ex − 1)
o (x3 ) x3 · o (1)
x→0
ln(1 + sin x) − sin ln(1 + x) = = lim = lim 3 x→0 =
  x→0 o (x3 ) x→0 x · o (1)
x→0 x→0
x2 x3 3
= x− + + o (x ) −  
o (1)
2 6 x→0 x→0 0
  = lim = =?
x 2
x 3 x→0 o (1) 0
3
− x− + + o (x ) = x→0
2 6 x→0

= o (x3 ) Она снова означает, что нужно увеличить точ-


x→0 ность формул Маклорена (согласно правилу
388 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

(B)). Возьмем n = 4 (то есть воспользуемся фор- x2 x3 7x4


=x+ − − + o (x4 )
мулами (6.2.48), (6.2.50), (6.2.51), (6.2.55), выбрав 2 6 24 x→0
n так, чтобы в конце получилось o (x4 )): и
x→0

x3 arctg(ex − 1) =
sin x = x − + o (x4 )
6 x→0 x2 x3 11x4
=x+ − − + o (x4 )
2 6 24 x→0
x2 x3 x4
ln(1 + x) = x − + − + o (x4 ) Поэтому
2 3 4 x→0

x2 x3 x4 earctg x − 1 − arctg(ex − 1) =
ex = 1 + x + + + + o (x4 )
2 6 30 x→0 7x4 11x4
3 =− + + o (x4 ) =
x 24 24 x→0
arctg x = x − + o (x4 )
3 x→0 x4
= + o (x4 )
Тогда получим 6 x→0

Теперь, подставляя в предел, мы получим:


sin2 x sin3 x sin4 x
ln(1 + sin x) = sin x − + − + ln(1 + sin x) − sin ln(1 + x)
 2 3 3  4 lim =
 x x→0 earctg x − 1 − arctg(ex − 1)
+ o sin4 x = x − + o (x4 ) − 4 4
x→0 3! x→0 − x12 + o (x4 ) − x12 + x4 · o (1)
 2 = lim x→0
= lim x→0
=
1 x3 x→0 x4
+ o (x4 ) x→0 x4
+ x4 · o (1)
− x− + o (x4 ) + 6 x→0 6 x→0
2 3! x→0
1
 3 − 12 + o (1) 1
1 x3 4 = lim x→0
=− .
+ x− + o (x ) − x→0 1
+ o (1) 2
3 3! x→0 6 x→0
 4
1 x3 ⋄ 6.2.8. Разберем теперь пример (6.0.2):
− x− + o (x4 ) +
4 3! x→0
4 !
1
 sin(2− x2 )
x3 4 lim .
+ o x− + o (x ) = x→0
1
2− sin2 x
x→0 3! x→0
Здесь числитель можно записать так:
x2 x3 x4
= ... = x − + − + o (x4 )
2 6 12 x→0 1
sin(2− x2 ) = sin y − 12 =
и y=2 x

1
 1

3
= y + o (y) − 1
= 2 − x2 + o 2 − x2
(ln(1 + x)) y→0 y=2 x2 x→0
sin ln(1 + x) = ln(1 + x) − +
 6 А для знаменателя нужно провести предвари-
4 тельные вычисления:
+ o (ln(1 + x)) =
x→0
  x3
x2 x3 x4 sin x = x − + o (x3 )
= x− + − + o (x4 ) − 6 x→0
2 3 4 x→0
 2 3 4
3 ⇓
1 x x x 4
− x− + − + o (x ) +
6 2 3 4 x→0
 4 ! 1 1
= =
x2 x3 x4 4 sin x x− x3
+ o (x3 )
+ o x− + − + o (x ) = 6 x→0
x→0 2 3 4 x→0
1 1
x2 x3 = · x2
=
= ... = x − + + 0 + o (x4 ) x 1− 6 + o (x2 )
x→0
2 6 x→0
1  x2  −1
Поэтому = · 1+ − + o (x2 ) =
x | 6 {zx→0 }

ln(1 + sin x) − sin ln(1 + x) = 0

=−
x4
+ o (x4 ) 1  x2  x2 
= · 1− − + o (x2 ) + o − + o (x2 ) =
12 x→0 x 6 x→0 x→0 6 x→0
1  x2 
И для знаменателя = · 1+ + o (x2 )
x 6 x→0

earctg x − 1 = ⇓
§ 2. Формулы Пеано и асимптотика 389

1 1  x2 2 cos x−1− x2
2

2 = 2 · 1+ + o (x2 ) = 3. limx→0 x4
sin x x 6 x→0 arctg x−arcsin x
 2  4. limx→0 x2
1 x x4 tg x−x
= 2 · 1+ + + o (x4 ) = 5. limx→0
sin x−x
x 3 36 x→0 arctg x−arcsin x
1 1 x2 6. limx→0 tg x−sin x
= 2+ + + o (x2 ) 7. limx→0 2 arcsin x−arcsin 2x
x 3 36 x→0 √ x3
5
1+2x−1
8. limx→0 √ √
⇓ 4
1+x− 1−x √

1 1 1 x2
cos x− 1+2x
9. limx→0 1+xln(1+x)−x
− = − − − + o (x2 ) x √
− 1+2x
sin2 x x2 3 36 x→0 10. limx→0 e ln cos x √
x−3 3 1+x
⇓ 11. limx→0 3 cos x+arcsin
ln(1−x2 )
3
sin x+2x cos x2
12. limx→0 ln(1+x )−2 arctg x3
2 √
1 − x12 − 31 − x36 + o (x2 ) x 1+sin x− 12 ln(1+x2 )−x
2− sin2 x = 2 x→0 = 13. limx→0 3
√ tg x
2
− x36 + o (x2 ) esin x − 1+x2 −x cos x
1
= 2 − x2 · 2 − 3 · 2
1
x→0
14. limx→0 ln3 (1−x)

esin x ln cos x − 4 1+4x+x− 32 x2
15. limx→0 x sin x2
Теперь, подставляя числитель и знаменатель   1−cos
1
2 tg x x
в исходный предел, мы получим: 16. limx→0 x+sin x
    1
xex +1 x2
− x12
1
2 − x2 + o 2 − x2
1
17. limx→0 xπ x +1
sin(2 ) x→0  √ 1
lim = lim =
x→0 2 − sin12 x x→0 − x12 1
2
− x36 + o (x2 ) 18. limx→0 cos(sin x) + 21 arcsin2 x x2 ( 1+2x−1)
2 · 2− 3 ·2 x→0
√  1
1 + o (1) √ 19. limx→2 3 − x + ln x2 sin2 (x−2)
x→0 1+0 1 3  
= lim 2 = 1 = 23 = 2. 1
20. limx→0 sin x arctg − 1
x→0
2− 3 · 2
1 − x36 + o (x2 )
x→0 2− 3 · 20 x tg x arcsin x
esin x −1−sin(ex −1)
21. limx→0
⊲⊲ 6.2.9. Найдите пределы: arctg4 x
sin x3
1. limx→0 ln(1+x)−x 22. limx→0 ln cos x−cos ln(1+x)+1
x2 α
x x)α +1
2. limx→0 e −1−x
x2 23. limx→0 sin((1+x) −1)−(1+sin
tg4 x

(b) Асимптотика
Формула Тейлора-Пеано (6.2.35), с которой мы начинали этот параграф, является частным случаем
следующей общей конструкции.
Пусть a – какое-нибудь число или символ бесконечности.
• Последовательность функций {ϕn } называется асимптотической последовательностью
при x → a, если
∀k ∈ Z+ ϕk (x) ≫ ϕk+1 (x) (6.2.56)
x→a

или, более наглядно,

ϕ0 (x) ≫ ϕ1 (x) ≫ ϕ2 (x) ≫ ... ≫ ϕk (x) ≫ ...


x→a x→a x→a x→a x→a

• Асимптотическим разложением или асимптотикой порядка n функции f вдоль асимп-


тотической последовательности {ϕn } при x → a, называется всякая асимптотическая фор-
мула вида
n
X  
f (x) = λk · ϕk (x) + o ϕn (x) , λk ∈ R (6.2.57)
x→a
k=0

(если она верна). Из (6.2.56) следует, что коэффициенты λk ∈ R в формуле (6.2.57) опреде-
ляются однозначно (поэтому не бывает двух разных асимптотических разложений одного
порядка относительно данной асимптотической последовательности).
390 Глава 6. АСИМПТОТИЧЕСКИЕ МЕТОДЫ

√ q √
Степенная последовательность в нуле. e x2 +x−x
= x = 1t
=e
1
t2
+ 1t − 1t
=e
1+t−1
t =
t → +0
Функции
= (6.2.52) =
ϕk (x) = xk , k ∈ Z+ (
1+ 1 ·t+ 1 · 1 −1 · t2 + o (t2 )−1
) 1
2 2 2 2! t→+0 − 8t + o (t)
=e t = e2 t→+0
=
образуют асимптотическую последовательность
1 − 8t + o (t)
при x → 0, потому что =e ·e t→+0 2 = (6.2.51) =
√  t

t

1 = x0 ≫ x1 ≫ x2 ≫ ... ≫ xk ≫ ... = e · 1 − + t→+0
o (t) + o − + o (t) =
8 t→+0 8 t→+0
x→0 x→0 x→0 x→0 x→0   √
√ t √ t e
Для функции f , гладкой в окрестности точки 0 = e· 1 − + o (t) = e − + o (t) =
8 t→+0 8 t→+0
разложения вдоль такой последовательности – √  
√ e 1
это просто формулы Маклорена (6.2.37), о ко- = e− + o
торых мы уже говорили выше: 8x x→+∞ x

n
X f (k) (0) Другие асимптотические последователь-
f (x) = · xk + o (xn ) ности. Не всегда данная функция f име-
k! x→0
k=0 ет асимптотическое разложение вдоль данной
асимптотической последовательности {ϕn }.
Степенная последовательность на беско-
нечности. Функции ⋄ 6.2.12. Формула
√ Xn  
1 3
x = λ · xk
+ o xn
ϕk (x) = k , k ∈ Z+ k
x→0
x k=0
образуют асимптотическую последовательность не будет верна ни при каких n > 0 и λ0 , ..., λn ∈
при x → ∞, потому что R.
1 1 1 1 Доказательство. Это достаточно доказать для
1= ≫ 1 ≫ 2 ≫ ... ≫ k ≫ ...
0
x x→∞ x x→∞ x x→∞ x→∞ x x→∞ n = 1, потому что любую формулу большего по-
рядка можно записать в виде
Асимптотические разложения вдоль этой после-
довательности обычно получаются заменой x = √ n
X  
1
3
x = λ0 + λ1 · x + λk · xk + o xn
t с последующим применением формул Макло- x→0
k=2
рена. Объясним это на примерах. | {z }
 
⋄ 6.2.10. Пусть нам нужно найти асимптотиче- o
x→0
x

ское разложение порядка 3 при x → +∞ вдоль


степенной последовательности для функции и если эта формула верна, то будет верна и фор-
мула первого порядка:
p  
2
f (x) = x + 1 √
3
x = λ0 + λ1 · x + o x (6.2.58)
x→0
Сделаем замену x = 1t :
Чтобы убедиться, что эта формула неверна, нуж-
r √ но с самого начала заметить, что из нее следует,
p 1 1 1 + t2
x2 + 1 = tx→= +0
t = + 1 = = что λ0 должно быть нулевым, потому что при
t 2 t x → 0 получаем:
= (6.2.52) = √  
 4 3
x = λ0 + λ1 · x + o x
1 + 2 · t + 2 · 12 − 1 · t2! + o (t4 )
1 2 1
|{z} | {z } x→0
t→+0 | {z }
= = ↓ ↓

t 0 0
0
1 1 1 t3 1
= + · t − · + o (t3 ) = x t→=+∞ x =
t 2 4 2! t→+0 Подставим λ0 = 0 в (6.2.58):
   
1 1 1 √
=x+ − + o 3
x = λ1 · x + o x
2x 8x3 x→+∞ x3 x→0

⋄ 6.2.11. Найдем асимптотическое разложение Поделив все на x, при x → 0 мы получим соот-


порядка 1 при x → +∞ вдоль степенной после- ношение 1  
довательности для функции √3
= λ1 + o 1
x2 x→0
| {z }
√ | {z }
2
f (x) = e x +x−x ↓ ↓
0 ∞
1
Опять делаем замену x = t: которое не может быть верно ни при каком
λ1 .
§ 2. Формулы Пеано и асимптотика 391

Приведенный пример 6.2.12 имеет целью под- 1 x2 x3


11  11 
= x3 + − +o x 3
готовить читателя к мысли, что асимптотиче- 3 9
x→0
скую последовательность {ϕn }, вдоль которой
мы собираемся раскладывать данную функцию (одновременно из этих вычислений становит-
f , бывает удобно выбирать отдельно, в зависи- ся понятно, откуда берется последовательность
мости от вида функции f . 5k+1
ϕk (x) = x 3 ).
⋄ 6.2.13. Асимптотическое разложение функции
⋄ 6.2.14. Попробуем найти разложение той же
p функции
3
f (x) = x + x2 p
3
f (x) = x + x2
при x → 0 бессмысленно искать вдоль стандарт-
при x → ∞. Как и в предыдущих случаях, когда
ной степенной последовательности
ищется асимптотика на бесконечности, начнем с
ϕ (x) = xk замены x = 1t :
k
r
потому что здесь возникает тот же эффект, что p 1 1 (1 + t) 3
1
3 x = 1t 3
в примере 6.2.12: никакая формула вида (6.2.57) x + x2 = t→0 = + 2 = 2 =
t t t3
не будет верна, если n > 0. 1
 2 
1+ · t + 31 · 13 − 1 · t2! + o t2
Однако если взять последовательность 3
t→0
= (6.2.52) = 2 =
1
2 11 5k+1 t3
x 3 ≫ x ≫ x 3 ≫ ... ≫ x 3 ≫ ... 1 4  4
x→0 x→0 x→0 x→0 x→0 2 t3 t3 1
t= x
= t− 3 + − + o t3 = x→∞ =
то этот эффект исчезает, и разложение находит- 3 9
t→0
 
ся очень просто: 2 1 1 1
=x + 3
1 − 4 +o 4
p
3 1 5 1
3 · x3 9 · x3 x3
x + x2 = x 3 · (1 + x 3 ) 3 = (6.2.52) = x→∞
  5 2 
   2 
1 1 5 1 1 x3 5 Из вычислений видно, что разложение в этом
=x 3 ·
1 + · x 3 + · −1 · +o x3

 =
3 3 3 2!
x→0
случае удобно искать вдоль асимптотической по-
! следовательности
1 x
5
3 x
10
3
 10 
= x3 · 1+ − +o x 3 = 2 1 4 2
3 9 x 3 ≫ x− 3 ≫ x− 3 ≫ ... ≫ x 3 −k ≫ ...
x→0 x→∞ x→∞ x→∞ x→∞ x→∞
Глава 7

ИНТЕГРАЛ

§1 Неопределенный интеграл
В главе 5 мы определили понятие производной F ′ функции F и изучали его приложения в мате-
матике. Неопределенный интеграл представляет собой конструкцию, придуманную для решения
обратной задачи: дана функция f , нужно найти такую функцию F , для которой f была бы произ-
водной,
F ′ = f.
Такая функция F называется первообразной для функции f .
Как и в случае с производной, эта конструкция оказывается полезной в самых разных областях
естествознания, в частности, в геометрии, при вычислении площадей и объемов. Но, в отличие от
производной, задача нахождения первообразной не имеет однозначного решения: здесь решением
будет целый класс функций, который и называется неопределенным интегралом функции f .
Еще одна неприятная деталь в этой теории, отличающая ее от теории дифференцирования, —
что неопределенный интеграл от стандартной функции не всегда является стандартной функцией.
Поэтому в некоторых случаях “вычислить” неопределенный интеграл в том смысле, который вкла-
дывался в эту задачу в дифференциальном исчислении, то есть, выразив результат в элементарных
функциях, бывает невозможно.
Из-за того, что неопределенный интеграл — не одна функция, а целый их класс, эту тему при-
ходится начинать с изучения классов функций1 .

(a) Классы функций, тождественные на отрезках


Прежде, чем говорить о неопределенном интеграле, желательно обсудить понятие класса функций.
По идеологии теории множеств, функции тоже могут образовывать классы. Мы здесь и поговорим
о самых простых таких классах. Начнем с нескольких примеров.

⋄ 7.1.1. Рассмотрим класс F , состоящий из F можно сократить до записи


функций вида
F = sin x + A. (7.1.2)
f (x) = sin x + A, x ∈ R, (7.1.1)

где A ∈ R – произвольный параметр. Этот класс Эту запись нужно понимать так, что функции,
можно описать формулой описываемые правой частью формулы (7.1.2) (в
которой только x считается свободной перемен-
f ∈F ⇔ ∃A ∈ R ∀x ∈ R f (x) = sin x + A. ной, а все остальные переменные считаются па-
раметрами), и только такие функции, считаются
Если условиться, что под x всегда будет пони- элементами класса F .
маться переменная, используемая как аргумент
В соответствии с этой договоренностью, фор-
при описании функций из данного класса, а все
мула
остальные переменные считаются параметрами,
то при таких договоренностях описание класса G = cos x + B. (7.1.3)
1 Классы функций, которые мы будем рассматривать в этом параграфе, будут множествами (а не собственными

классами в смысле определения на с.30), но нам будет удобно называть их классами, а не множествами, чтобы не
провоцировать путаницы с числовыми множествами.

392
§ 1. Неопределенный интеграл 393

описывает класс функций вида где A ∈ R – произвольный параметр, а формула


g(x) = cos x + A, x ∈ R, (7.1.4)
G = cos(x + B). (7.1.7)
где B ∈ R – произвольный параметр.
⋄ 7.1.2. Точно так же формула описывает класс функций вида
F = sin(x + A). (7.1.5)
g(x) = sin(x + B), x ∈ R, (7.1.8)
описывает класс функций вида
f (x) = sin(x + A), x ∈ R, (7.1.6) где B ∈ R – произвольный параметр.

Равенство классов функций. Говорят, что два класса функций F и G равны,

F = G,

если они равны как классы (или множества), то есть если включение f ∈ F эквивалентно включе-
нию f ∈ G:
f ∈ F ⇔ f ∈ G.
Понятно, что это эквивалентно выполнению соотношений

F ⊆G & G ⊆ F.


⋄ 7.1.3. Рассмотрим два класса функций, опи- и, поделив на 2, мы получим тождество
санных в примере 7.1.1:
1 1 B
√ · sin x − √ · cos x = √ , x ∈ R,
F = sin x + A, G = cos x + B. 2 2 2

Будут ли они равны? Чтобы это понять, нужно или, что эквивалентно, тождество
проверить два включения: π B
sin x − =√ , x ∈ R.
F ⊆G 4 2
Понятно, что оно не может выполняться, потому
и
что синус — не постоянная функция.
G ⊆ F.
Мы делаем вывод, что
Уже первое из них неверно:
F=
6 G.
F 6⊆ G.
⋄ 7.1.4. Рассмотрим теперь классы функций из
Например, если взять функцию примера 7.1.2:
f (x) = sin x F = sin(x + A), G = cos(x + B).
которая принадлежит F , то нетрудно проверить, Будут ли они равны? Опять, чтобы это понять,
что она не будет принадлежать G, то есть не бу- нужно проверить два включения:
дет иметь вид
F ⊆G
f (x) = cos x + B
и
ни при каком значении параметра B. Действи- G ⊆ F.
тельно, если предположить, что это не так, то
есть существует некое число B ∈ R такое, что 1. Проверим первое включение. Выберем
выполняется тождество какую-нибудь функцию из класса F , то есть
функцию вида
sin x = cos x + B, x ∈ R,
f (x) = sin(x + A), x ∈ R,
то, перебросив cos x в левую часть,
где A ∈ R – какое-то фиксированное число. Что-
sin x − cos x = B, x ∈ R, бы проверить, принадлежит ли она классу G,
394 Глава 7. ИНТЕГРАЛ

нужно понять, существует ли число B ∈ R та- где B ∈ R – какое-то фиксированное число. Что-
кое, для которого будет выполняться тождество бы проверить, принадлежит ли она классу F ,
нужно понять, существует ли число A ∈ R та-
f (x) = sin(x + A) = cos(x + B), x ∈ R. кое, для которого будет выполняться тождество
Действительно, если положить
g(x) = cos(x + B) = sin(x + A), x ∈ R.
π
B =A− ,
2 Действительно, если положить
то
π
A=B+ , π
2 A=B+ ,
и мы получим 2

π то
f (x) = sin(x + A) = sin(x + B + ) = cos(x + B), π
2 B =A− ,
2
x ∈ R,
и мы получим
— здесь мы использовали доказанное ранее тож-
дество (4.1.101): π
g(x) = cos(x + B) = cos(x + A − ) = sin(x + A),
 π 2
sin t + = cos t. x ∈ R,
2
2. Теперь проверим второе включение. Выбе- — здесь мы использовали доказанное ранее тож-
рем какую-нибудь функцию из класса G, то есть дество (4.1.106):
функцию вида
 π
g(x) = cos(x + B), x ∈ R, cos t − = sin t.
2

Классы функций с общей областью определения. Будем говорить, что класс функций F
имеет общую область определения, если любые две функции из него имеют одинаковую область
определения:
∀f, g ∈ F D(f ) = D(g).
В этом случае множество D(f ), где f ∈ F (не зависящее от выбора f ∈ F ), называется областью
определения функций из F и обозначается D(F ):
D(F ) = D(f ) (f ∈ F ).

⋄ 7.1.5. Классы функций, рассматривавшиеся в тоже имеет общую область определения, которая
примерах 7.1.1 и 7.1.2, представляет собой прямую с выкинутой точкой
0:
sin x + A, cos x + B, sin(x + A), cos(x + B),
D(F ) = R \ {0}.
являются, конечно, классами с общей областью
определения, которая у них совпадает со всей ⋄ 7.1.7. Класс функций
прямой R.
1
⋄ 7.1.6. Класс функций F=
x+A
1
F = +A наоборот не имеет общей области определения.
x

Ограничение класса функций. Напомним, что понятие ограничения отображения было опре-
делено выше формулой (0.3.246) (с.44). Применительно к числовым функциям это определение
выглядит так: ограничением функции f : R ֒→ R на множество M ⊆ R называется функция f M ,
определенная правилами:
1) область определения f M
представляет собой пересечение M с областью определения f :

D(f M
) = M ∩ D(f ),
§ 1. Неопределенный интеграл 395

2) на множестве D(f M
) = M ∩ D(f ) функции f M
и f совпадают:

∀x ∈ M ∩ D(f ) f M
(x) = f (x).

Ограничением класса функций F на множество M называется класс функций F M


, определен-
ный правилом
g ∈ F M ⇔ ∃f ∈ F f M = g.

⋄ 7.1.8. Рассмотрим класс функций (состоящий из одних констант) и класс функций

F = ln |x| + A. G = sgn x + B.

Можно заметить, что его ограничением на мно- Можно заметить, что при ограничении на мно-
жество M = (0, +∞) будет класс функций жество M = (0, +∞) получающиеся классы
функций совпадают, потому что
F (0,+∞)
= ln x + A.
F (0,+∞)
= A, x > 0,
⋄ 7.1.9. Рассмотрим класс функций
и
F =A G (0,+∞)
= 1 + B, x > 0.

Тождественность на отрезках. Будем говорить, что два класса функций F и G тождественны


на отрезках, и изображать это записью
F ≡ G,
если
(i) это классы с общей областью определения, причем область определения у них одинакова:

D(F ) = D(G);

(ii) на любом отрезке [a, b] из их области определения D(F ) = D(G) ограничения этих классов
совпадают:
F [a,b] = G [a,b] ([a, b] ⊆ D(F ) = D(G), a 6= b).

! 7.1.10. Понятно, что если классы функций F не представимы в виде


и G равны, то они тождественны на отрезках: 1
g(x) = + sgn x + B
F = G ⇒ F ≡ G. x
Но обратное неверно: если F и G тождественны (и наоборот). Однако, эти классы функций тож-
на отрезках, то это не означает автоматически, дественны на отрезках,
что они совпадают: F ≡ G,
F ≡G 6⇒ F = G. потому что, во-первых, области определения у
В этом нас убеждает следующий пример. них общие и совпадают

⋄ 7.1.11. Рассмотрим следующие два класса D(F ) = D(G) = R \ {0},


функций: и, во-вторых, если отрезок [a, b] лежит в этой об-
1 ласти определения, то он полностью лежит либо
F = + A,
x на правой полупрямой
и
1 [a, b] ⊆ (0, +∞),
G = + sgn x + B.
x
Сами по себе они не совпадают либо на левой полупрямой

F 6= G, [a, b] ⊆ (−∞, 0),

потому что функции вида и тогда значение функции sgn x на нем равно
константе, и выражение sgn x + B в определении
1
f (x) = + A G можно заменить на выражение A.
x
396 Глава 7. ИНТЕГРАЛ

Алгебраические операции с классами функций. Если F и G — два класса функций с общими


областями определения, то их суммой называется класс функций F + G, определенный правилом

h∈F +G ⇔ ∃f ∈ F ∃g ∈ G h = f + g.

Область определения получаемого класса совпадает с пересечением областей определения F и G:

D(F + G) = D(F ) ∩ D(G).

Точно так же произведением класса функций F на скаляр α называется класс функций α · F ,


определяемый правилом
h ∈ α · F ⇔ ∃f ∈ F h = α · f.
Область определения получаемого класса совпадает с областью определения F :

D(α · F ) = D(F ).

Теорема 7.1.1. Нетривиальная линейная комбинация (то есть такая, чтобы хотя бы один из
коэффициентов α или β был ненулевым) классов f (x) + A и g(x) + B описывается формулой

α · (f (x) + A) + β · (g(x) + B) = α · f (x) + β · g(x) + C (7.1.9)

Доказательство. Если функция h лежит в классе α · (f (x) + A) + β · (g(x) + B), то

h(x) = α · (f (x) + A) + β · (g(x) + B)

для некоторых A, B ∈ R. Поэтому

h(x) = α · f (x) + β · g(x) + C

где C = α · A + β · B. Значит, h лежит в классе α · f (x) + β · g(x) + C. И наоборот, если h лежит в


классе α · f (x) + β · g(x) + C, то h имеет вид

h(x) = α · f (x) + β · g(x) + C.

для некоторого C ∈ R. Подберем A, B ∈ R так, чтобы C = α · A + β · B (это всегда можно сделать,


если хотя бы один из коэффициентов α или β был ненулевой). Тогда

h(x) = α · f (x) + β · g(x) + C = α · f (x) + β · g(x) + α · A + β · B = α · (f (x) + A) + β · (g(x) + B),

то есть h лежит в классе α · (f (x) + A) + β · (g(x) + B).


Теорема 7.1.2. Если
D(f ) ⊆ D(h) (7.1.10)
и
(f (x) + A) + (g(x) + B) ≡ h(x) + C
то
f (x) + A ≡ h(x) − (g(x) + B)
Доказательство. Пусть
(f (x) + A) + (g(x) + B) ≡ h(x) + C.
По уже доказанному свойству 1◦ ,

(f (x) + A) + (g(x) + B) = f (x) + g(x) + E,

поэтому это равносильно условию

f (x) + g(x) + E ≡ h(x) + C.

Это значит, что


D(f ) ∩ D(g) = D(h) (7.1.11)
§ 1. Неопределенный интеграл 397

и на всяком отрезке [a, b] ⊆ D(f ) ∩ D(g) = D(h) функция H представима в виде f (x) + g(x) + E тогда
и только тогда, когда она представима в виде h(x) + C:
∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (7.1.12)
и
∀[a, b] ⊆ D(f ) ∩ D(g) = D(h) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (7.1.13)
Заметим, что из условия (7.1.11) следует вложение
D(f ) ⊇ D(h)
которое вместе с (7.1.10)
D(f ) ⊆ D(h)
дает равенство
D(f ) = D(h). (7.1.14)
С другой стороны, из условия (7.1.11) следует вложение
D(g) ⊇ D(h)
из которого в свою очередь следует
D(h) = D(h) ∩ D(g)
Вместе с (7.1.14) это дает
D(f ) = D(h) = D(h) ∩ D(g).
Отсюда можно сделать вывод, что в формулах (7.1.12) и (7.1.13) множество D(f ) ∩ D(g) = D(h)
можно заменить на совпадающее с ним множество D(f ) = D(h) ∩ D(g):
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]) (7.1.15)
и
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + g(x) + E = h(x) + C (x ∈ [a, b]). (7.1.16)
Эти условия можно переписать, перебросив g(x) в правую часть:
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀E ∈ R ∃C ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]) (7.1.17)
и
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀C ∈ R ∃E ∈ R f (x) + E = h(x) − g(x) + C (x ∈ [a, b]). (7.1.18)
А затем можно сделать замену E = A и C = −B, и мы получим
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀A ∈ R ∃B ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]) (7.1.19)
и
∀[a, b] ⊆ D(f ) = D(h) ∩ D(g) ∀B ∈ R ∃A ∈ R f (x) + A = h(x) − (g(x) + B) (x ∈ [a, b]). (7.1.20)
Эти два условия означают, что на всяком отрезке [a, b] ⊆ D(f ) = D(h)∩D(g) функция F представима
в виде f (x)+A тогда и только тогда, когда она представима в виде h(x)−(g(x)+B), и это в точности
тождество
f (x) + A ≡ h(x) − (g(x) + B).

Если G — класс функций с общей областью определения, и f — функция, у которой область


значений лежит в области определения G,
R(f ) ⊆ D(G)
то композицией G и f называется класс функций G ◦ f , определенный правилом
h∈G◦f ⇔ ∃g ∈ G h = g ◦ f.

Композиция с функцией, непрерывной на отрезках.


• Условимся говорить, что функция f : R ֒→ R непрерывна на отрезках, если она непре-
рывна на всяком отрезке [a, b] из своей области определения.
398 Глава 7. ИНТЕГРАЛ

! 7.1.12. Непрерывность на отрезках эквива- {0} = [a, b]), но в точке 0 она разрывна, потому
лентна непрерывности на невырожденных отрез- что
ках (потому что на каждом вырожденном отрез- 1
D(f ) ∋ −→ 0 ∈ D(f ),
ке, то есть на одноточечном множестве [a, a] = 2n n→∞
{a}, любая функция непрерывна). но при этом
⋄ 7.1.13. Из непрерывности на отрезках не сле-  
1
дует непрерывность на всей области определе- f = 1 6−→ 0 = f (0).
ния. В качестве примера рассмотрим множество 2n n→∞

[∞  
В этом примере можно было отрезок [−1, 0] за-
1 1
M = [−1, 0] ∪ , , менить вырожденным отрезком [0; 0] = {0}, но
n=1
2n 2n − 1
мы задали такую область определения, чтобы
и определим функцию f на нем формулой она была интегральной в смысле определения на
( с.400, а получившаяся функция f была диффе-
0, x ∈ h[−1, 0] i ренцируемой в смысле определения на с.401 ни-
f (x) = 1 1
1, x ∈ 2n , 2n−1 . же. Как следствие, этот пример показывает по-
путно, что дифференцируемая функция необяза-
На каждом отрезке [a, b] в своей области опреде- тельно непрерывна на своей области определе-
ления D(f ) = M функция f непрерывна (точ- ния (хотя обязательно непрерывна на отрезках,
нее, равна или 1, если 0 ∈ / [a, b] или 0, если в силу формулируемой ниже теоремы 7.1.7).

Теорема 7.1.3. Если f — функция, непрерывная на отрезках,

R(f ) ⊆ D(G) = D(H) (7.1.21)

и
G ≡ H, (7.1.22)
то
G◦f ≡H◦f (7.1.23)

Доказательство. 1. Пусть p ∈ G ◦ f . Это означает, что существует функция g ∈ G такая, что


p = g ◦ f . Если зафиксировать отрезок [a, b] ⊆ D(f ) = D(G ◦ f ) = D(H ◦ f ), то поскольку функция
f непрерывна, по следствию 3.3.9, его образ f ([a, b]) при отображении f тоже будет отрезком (воз-
можно вырожденным) в R. Поэтому из (7.1.22) следует, что на множестве f ([a, b]) классы функций
G и H совпадают:
G f ([a,b]) = H f ([a,b]) .

Значит, для функции g ∈ G можно подобрать функцию h ∈ H такую, что

g f ([a,b])
=h f ([a,b])
.

Отсюда следует, что


p [a,b]
=g◦f [a,b]
=h◦f [a,b]
∈H◦f [a,b]
.

Мы доказали вложение
G◦f [a,b]
⊆H◦f [a,b]
.

2. Точно так же доказывается вложение

G◦f [a,b]
⊇H◦f [a,b]
.

3. Вместе эти два вложения означают равенство

G◦f [a,b]
=H◦f [a,b]
.

которое справедливо для всякого отрезка [a, b] ⊆ D(f ) = D(G ◦ f ) = D(H ◦ f ). Это доказывает
(7.1.23).
§ 1. Неопределенный интеграл 399

(b) Определение и свойства неопределенного интеграла


Дифференцируемые функции и первообразная на отрезке.
• Пусть функция h определена на отрезке [a; b]. Тогда
— ее правой производной в точке a называется предел

h(x) − h(a)
h′+ (a) := lim (7.1.24)
x→a+0 x−a
— ее левой производной в точке b называется предел

h(x) − h(b)
h′− (b) := lim (7.1.25)
x→b−0 x−b

• Если эти величины конечны, и кроме того функция h имеет (обычную) конечную произ-
водную в любой точке интервала (a; b), то говорят, что h дифференцируема на отрезке
[a; b], а ее производной на отрезке [a; b] называется функция

 ′
h+ (a), x = a
′ ′
h (x) = h (x), x ∈ (a; b) (7.1.26)

 ′
h− (a), x = b

Предложение 7.1.4. Всякая дифференцируемая функция на отрезке [a, b] непрерывна на нем.

Доказательство. Если функция h дифференцируема на отрезке [a; b], то по теореме 5.1.1, она будет
непрерывна в каждой внутренней точке этого отрезка. Остается убедиться, что на концах она тоже
непрерывна. Это делается тем же приемом, что и в теореме 5.1.1: если пределы (7.1.24) и (7.1.25)
существуют и конечны, то функция h непрерывна в точках a и b.

• Функция F называется первообразной для функции f на отрезке [a; b], если F определена
на [a; b], дифференцируема на нем и ее производная на нем равна f :

F ′ (x) = f (x), x ∈ [a; b] (7.1.27)

При этом, в соответствии с определением производной на отрезке формулой (7.1.26), на


концах отрезка формула (7.1.27) интерпретируется, как условие на односторонние произ-
водные:
F+′ (a) = f (a), F−′ (b) = f (b) (7.1.28)

Лемма 7.1.5. Пусть функция H определена и дифференцируема на отрезке [a, b], причем ее про-
изводная равна нулю на [a, b]:
H ′ (x) = 0, x ∈ [a, b] (7.1.29)
Тогда функция H(x) постоянна на [a, b]:

H(x) = C, x ∈ [a, b]

для некоторого C ∈ R.

Доказательство. Положим C = H(a). Для любого x ∈ (a, b] мы получим, что функция H


– дифференцируема на интервале (a; x) (потому что она дифференцируема на (a, b)), и
– непрерывна на отрезке [a; x] (по предложению 7.1.4)
поэтому, мы можем применить к функции H на отрезке [a; x] теорему Лагранжа 5.1.7, и тогда
получим, что существует такая точка ξ ∈ [a; x], что

H(x) − H(a)
= H ′ (ξ) = (7.1.29) = 0
x−a
отсюда
H(x) − H(a) = 0 =⇒ H(x) = H(a) = C
400 Глава 7. ИНТЕГРАЛ

Свойства первообразных на отрезке


10 . Если F – первообразная для некоторой функции f на отрезке [a; b], то F является непре-
рывной функцией на [a; b].
20 . Если F – какая-нибудь первообразная для функции f на отрезке [a; b], то все первообраз-
ные для функции f на отрезке [a; b] имеют вид

F (x) + C

где C – произвольные константы.


Доказательство. 1. Если F – первообразная для f на [a; b], то F дифференцируема на [a; b] (и ее
производной будет f ), поэтому в силу предложения 7.1.4, F непрерывна на [a; b].
2. Пусть F и G – две первообразные для f на отрезке [a; b]:

F ′ (x) = G′ (x) = f (x), x ∈ [a, b]

Тогда их разность H = G − F будет иметь нулевую производную на [a; b]

H ′ (x) = G′ (x) − F ′ (x) = f (x) − f (x) = 0, x ∈ [a; b]

Значит, по лемме 7.1.5, функция H постоянна:

H(x) = G(x) − F (x) = C, x ∈ [a; b]

(где C – некоторая константа). Следовательно,

G(x) = F (x) + C, x ∈ [a; b]

У нас получилось, что если F – какая-нибудь первообразная, то любая другая первообразная G


имеет вид G(x) = F (x) + C.

Интегральные множества и функции, дифференцируемые на области определения.


´
• Пусть M ⊆ R — какое-то числовое множество. Интегральной частью M множества M
называется объединение всех невырожденных отрезков, содержащихся в M :
´ [
M = [a, b].
[a,b]⊆M, a6=b

• Множество M называется интегральным, если оно совпадает со своей интегральной ча-


стью: ´
M =M

⋄ 7.1.14. Интегральная часть открытого интер- ⋄ 7.1.16. Интегральная часть дискретного2 мно-
вала (a, b) совпадает с ним самим: жества, например, N, пуста:
´
N = ∅,
´
(a, b) = (a, b),
поэтому никакое дискретное множество не ин-
поэтому любой интервал является интеграль-
тегрально
ным множеством.
⋄ 7.1.17. Интегральная часть последовательно-
⋄ 7.1.15. Интегральная часть отрезка [a, b] сов- сти тоже всегда пуста, например,
падает с ним самим:
 ´
1
; n∈N = ∅.
´
[a, b] = [a, b], n

поэтому любой отрезок является интегральным поэтому никакая последовательность не инте-


множеством гральна
2 Множество M называется дискретным, если каждая его точка x ∈ M обладает окрестностью U (x), в которой
ε
не содержится никаких других точек множества M .
§ 1. Неопределенный интеграл 401

• Будем говорить, что функция f : R ֒→ R дифференцируема (не на каком-то заданном


интервале, а прямо на своей области определения), если
(i) ее область определения D(f ) является интегральным множеством,
(ii) на каждом невырожденном отрезке [a, b] ⊆ D(f ) (a 6= b) функция f дифферен-
цируема (в смысле определения на с.399).

Теорема 7.1.6. Если функция F : R ֒→ R дифференцируема, то существует функция f : R ֒→ R


с той же областью определения,
D(f ) = D(F )
такая, что на любом невырожденном отрезке [a, b] ⊆ D(F ) ограничение f [a,b]
является производ-
ной ограничения F [a,b]
(в смысле определения на с.399):

(F [a,b]
)′ = f [a,b]
(7.1.30)

• Функция f : R ֒→ R с перечисленными в теореме 7.1.6 свойствами называется производной


функции F и обозначается
f = F′ (7.1.31)

Доказательство. Функция F дифференцируема, и это значит, что на каждом невырожденном от-


резке [a, b] ⊆ D(F ) она дифференцируема, и поэтому существует некая функция fa,b , являющаяся
производной F на этом отрезке:
(F [a,b] )′ = fa,b

Наша задача — показать, что все функции fa,b являются ограничениями f[a,b] некоторой единой
функции f : D(F ) → R:
f [a,b] = fa,b .

Для этого нужно просто проверить, что для любых двух отрезков [a, b], [c, d] ⊆ D(F ) соответствую-
щие функции fa,b и fc,d совпадают на пересечении [a, b] ∩ [c, d]:

∀x ∈ [a, b] ∩ [c, d] fa,b (x) = fc,d (x).

Действительно, если это пересечение [a, b] ∩ [c, d] непусто, то объединение отрезков [a, b] и [c, d]
представляет собой отрезок, содержащийся в D(F ):

[a, b] ∪ [c, d] = [A, B] ⊆ D(F ),

и для любой точки x ∈ [a, b] ∩ [c, d] мы получим

F (y) − F (x) F (y) − F (x)


fa,b (x) = (F [a,b]
)′ (x) = lim = lim = (F [A,B] )′ (x) =
y→x, y∈[a,b] y−x y→x, y∈[A,B] y−x
F (y) − F (x) F (y) − F (x)
= lim = lim = (F [c,d] )′ (x) = fc,d (x).
y→x, y∈[A,B] y−x y→x, y∈[c,d] y−x

Из предложения 7.1.4 следует

Теорема 7.1.7. Всякая дифференцируемая функция непрерывна на отрезках3 .

! 7.1.18. Однако, из дифференцируемости функ- всей своей области определения D(f ), как пока-
ции f : R ֒→ R не следует ее непрерывность на зывает пример 7.1.13.

3 Понятие функции, непрерывной на отрезках, было определено на с.397.


402 Глава 7. ИНТЕГРАЛ

Неопределенный интеграл.
• Функция F : R ֒→ R называется первообразной для функции f : R ֒→ R, если f является
производной для F в смысле определения на с.401.
• Класс всех первообразных для функции f называется ее неопределенным интегралом и
обозначается символом ˆ
f (x) d x

(символ d здесь называется дифференциалом и нужен он для того, чтобы показать, по


какой переменной ведется интегрирование).
Теорема 7.1.8. Если F – какая-нибудь первообразная для функции f , то неопределенный интеграл
функции f тождественен на отрезках классу функций F (x) + C:
ˆ
f (x) d x ≡ F (x) + C. (7.1.32)

Доказательство. Тождество на отрезках (7.1.32) означает две вещи:


— что области определения функциональных классов в обеих частях совпадают:
ˆ 
D f (x) d x = D(F (x) + C),

´
— и что на каждом отрезке [a, b] ⊆ D( f (x) d x) = D(F (x) + C) ограничения этих классов
совпадают: ˆ 

f (x) d x [a,b] = F (x) + C [a,b] .

1. Первое утверждение очевидно, потому что по определению всякая первообразная функции f


имеет область определения, совпадающую с областью определения f :
ˆ 
D f (x) d x = D(f ) = D(F (x) + C),

2. Проверим второе. Пусть [a, b] ⊆ D(f ). Тогда


— если G имеет вид F (x) + C, то на отрезке [a, b] ⊆ D(f ) производная G будет такая же
´как у F , и поэтому G будет первообразной для f , то есть G будет принадлежать классу
f (x) d x,
если G принадлежит классу f (x) d x, то G — первообразная для f , то G′ = f , и по
´

определению производной на с.401, на отрезке [a, b] выполнятеся равенство
′
G [a,b]
=f [a,b]
,

и поэтому по свойству 20 первообразных на отрезке (с.400) G [a,b]


отличается от F [a,b]
на

константу, то есть имеет вид F (x) + C [a,b] .

dx
ˆ
Таблица интегралов. Неопределенные инте- ≡ ln |x| + C (7.1.35)
гралы элементарных функций подсчитаны, и вот x
их список.4 ax
ˆ
ax d x ≡ + C, (0 < a 6= 1) (7.1.36)
ln a
ˆ ˆ
A dx ≡ A ·x + C (7.1.33) ex d x ≡ ex + C (7.1.37)

xα+1
ˆ ˆ
xα d x ≡ +C (α 6= −1) (7.1.34) sin x d x ≡ − cos x + C (7.1.38)
α+1
4 В формуле (7.1.34) правая часть считается определенной на области определения подынтегральной функции. В

остальных формулах это замечание излишне, потому что области определения первообразной и подынтегральной
функции совпадают по определению.
§ 1. Неопределенный интеграл 403
ˆ
cos x d x ≡ sin x + C (7.1.39) из формулы
 α+1 
dx ∂ x (α + 1) · xα
ˆ
≡ tg x + C (7.1.40) = = xα
cos2 x ∂x α + 1 α+1
dx
ˆ
≡ − ctg x + C (7.1.41) следует, формула (7.1.34):
sin2 x
dx 1 x
ˆ
xα+1
ˆ
2 2
≡ arctg + C (7.1.42) xα d x ≡ +C
a +x a a α+1
dx x
ˆ
√ ≡ arcsin + C (7.1.43) В доказательстве формул (7.1.35), (7.1.44) и
2
a −x 2 a
ˆ
dx 1 a+x (7.1.45) используется доказанная выше формула
≡ ln +C (7.1.44) (5.1.83).
a2 − x2 2a a−x
dx p
(7.1.45) ! 7.1.19. Понятное дело, в качестве парамет-
ˆ
√ ≡ ln x + x2 + A + C
x2 + A ра можно выбирать любую букву, кроме тех,
что входят в интегрируемое выражение, необя-
Доказательство. Здесь всюду используется тео- зательно C. Например, можно писать
рема 7.1.8, и доказательство состоит в том, чтобы
проверить, что производная от правой части сов- xα+1
ˆ
α
падает с подынтегральной функцией. Например, x d x = + D.
α+1

Свойства неопределенных интегралов.


1◦ . Линейность: если α 6= 0 или β 6= 0, и функции f , и g имеют первообразные, причем D(f )∩D(g)
— интегральное множество, то

ˆ ˆ ˆ
α · f (x) + β · g(x) d x ≡ α · f (x) d x + β · g(x) d x (7.1.46)

2◦ . Замена переменной: если функция g имеет первообразную, а f — дифференцируемая функ-


ция, у которой область значений содержится в области определения функции g,

R(f ) ⊆ D(g), (7.1.47)

то ˆ ˆ 
g(f (x)) · f ′ (x) d x ≡ g(y) d y (7.1.48)
y=f (x)

3◦ . Интегрирование по частям: если функции f и g дифференцируемы, D(f )∩D(g) — интеграль-


ное множество, а функции f · g ′ и f ′ · g имеют первообразные, то
ˆ ˆ
f (x) · g ′ (x) d x ≡ f (x) · g(x) − g(x) · f ′ (x) d x (7.1.49)

Доказательство. 1. В первом свойстве сначала нужно проверить, что левая и правая части имеют
одинаковые области определения. Действительно,
ˆ 
 
D α · f (x) + β · g(x) d x = D α · f + β · g = D(f ) ∩ D(g) =
 ˆ   ˆ   ˆ ˆ 
= D α · f (x) d x ∩ D β · g(x) d x = D α · f (x) d x + β · g(x) d x .

Далее, пусть F и G — первообразные для f и g соответственно:

F ′ (x) = f (x) (x ∈ D(f )), G′ (x) = g(x) (x ∈ D(g)).

Тогда для любого x из произвольного отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо равенство

(α · F + β · G)′ (x) = α · F ′ (x) + β · G′ (x) = α · f (x) + β · g(x)

А с другой стороны, множество

D(f ) ∩ D(g) = D(α · f + β · g)


404 Глава 7. ИНТЕГРАЛ

по условиям утверждения 1◦ интегрально. Значит, в соответствии с определениями производной и


первообразной на с.401, функция α · F + β · G – первообразная для функции α · f + β · g. Поэтому


ˆ
α · f (x) + β · g(x) d x ≡ (7.1.32) ≡ (α · F + β · G)(x) + C = α · F (x) + β · G(x) + C =
ˆ ˆ
= (7.1.9) = α · (F (x) + A) + β · (G(x) + B) ≡ (7.1.32) ≡ α · f (x) d x + β · g(x) d x

2. В тождестве (7.1.48) нужно сначала проверить, что области определения функциональных


классов слева и справа совпадают. Это следует из того, что условие дифференцируемости функции
f автоматически предполагает равенство

D(f ′ ) = D(f ),

а условие (7.1.47) дает условие


D(g ◦ f ) = D(f ).
Из них мы получаем цепочку:
ˆ  ˆ 
′ ′
 ′
D g(f (x)) · f (x) d x = D (g ◦ f ) · f = D(g ◦ f ) ∩ D(f ) = D(f ) = D g(y) d y
| {z } | {z } y=f (x)
k k
D(f ) D(f )

Пусть далее G — первообразная для функции g:

G′ (y) = g(y), y ∈ D(g).

Тогда, в силу (7.1.32), ˆ


g(y) d y ≡ G(y) + C (7.1.50)

Поскольку функция f дифференцируема, она непрерывна на отрезках (по теореме 7.1.7). Вдобавок
условие (7.1.47) означает, что
ˆ 
R(f ) ⊆ D g(y) d y = D(G(y) + C).

Отсюда, применяя теорему 7.1.3, мы можем заключить, что тождество (7.1.50) влечет за собой
тождество

ˆ
g(y) d y y=f (x) ≡ G(y) + C y=f (x) . (7.1.51)

Заметим далее, что функция G ◦ f является первообразной для функции (g ◦ f ) · f ′ :

(G ◦ f )′ (x) = G′ (f (x)) · f ′ (x) = g(f (x)) · f ′ (x).

Отсюда и из (7.1.32) мы получаем первое тождество в цепочке


ˆ
g(f (x)) · f ′ (x) d x ≡ (G ◦ f )(x) + C = G(f (x)) + C =

ˆ
= G(y) + C y=f (x)
≡ (7.1.51) ≡ g(y) d y y=f (x)

3. В тождестве (7.1.49) нужно опять сначала проверить, что девая и правая части имеют одну
и ту же область определения. Это следует из того, что функции f и g дифференцируемы: по этой
причине выполняются равенства

D(f ′ ) = D(f ), D(g ′ ) = D(g),

из которых мы получаем систему равенств

D(f · g ′ ) = D(f · g) = D(f ′ · g) (7.1.52)


| {z } | {z } | {z }
k k k
D(f ) ∩ D(g′ ) D(f ) ∩ D(g) D(f ′ ) ∩ D(g)
§ 1. Неопределенный интеграл 405

а из них — цепочку
ˆ 
D f (x) · g (x) d x = D(f · g ′ ) = D(f ) ∩ D(g ′ ) = D(f ) ∩ D(g) =

 
 
ˆ
′ ′
= D(f ) ∩ D(g) ∩ D(f ) ∩ D(g) = D f (x) · g(x) − g(x) · f (x) d x

Заметим далее, что для любого x из произвольного отрезка [a, b] ⊆ D(f ) ∩ D(g) справедливо
равенство
(f · g)′ (x) = f ′ (x) · g(x) + f (x) · g ′ (x).
А с другой стороны, множество

D(f ) ∩ D(g) = D(α · f + β · g)

по условиям утверждения 3◦ интегрально. Значит, в соответствии с определениями производной и


первообразной на с.401, функция f · g — первообразная для функции f ′ · g + f · g ′ :

(f · g)′ = f ′ · g + f · g ′ .

Поэтому


ˆ
(f · g)(x) + C ≡ (7.1.32) ≡ f ′ (x) · g(x) + f (x) · g ′ (x) d x ≡ (7.1.46) ≡
ˆ ˆ
≡ f ′ (x) · g(x) d x + f (x) · g ′ (x) d x (7.1.53)

Комбинируя это со вторым равенством в (7.1.52),

D(f · g ′ ) = D(f · g),

и применяя теорему 7.1.2, мы получим


ˆ ˆ ˆ
f (x) · g (x) d x ≡ (f · g)(x) + C − f (x) · g(x) d x ≡ (f · g)(x) − f ′ (x) · g(x) d x.
′ ′

(c) Вычисление неопределенных 1 2 3


ˆ
+2 2
d x = x 2 + 2 tg x + C
интегралов cos x 3

Покажем теперь на примерах, как с помощью пе- Внесение под знак дифференциала и при-
речисленных формул вычисляются неопределен- менение формулы замены переменной.
ные интегралы. Формулу (7.1.48) удобно применять, предаври-
тельно договорившись о следующем обозначе-
Применение формулы линейности. Пока- нии: для всякой функции f пусть символ d f (x)
жем, как применяется формула (7.1.46). обозначает выражение f ′ (x) d x:
⋄ 7.1.20. d f (x) = f ′ (x) · d x (7.1.54)
ˆ  
5 В частности, интеграл g(f (x))·f ′ (x) d x в левой
´
3
2 + x − 3 sin x − dx ≡
1 + x2 части (7.1.48) можно тогда переписать в таком
виде:
ˆ ˆ ˆ
≡ 2 d x + x3 d x − 3 sin x d x− ˆ ˆ
g(f (x)) · f ′ (x) d x = g(f (x)) d f (x).
1 x4
ˆ
−5 2
d x = 2x+ +3 cos x−5 arctg x+C
1+x 4
Если используя это обозначение переписать фор-
⋄ 7.1.21. мулу (7.1.48)
ˆ   ˆ 
√ 2
ˆ ˆ
1
x+ dx ≡ x 2 d x+ g(f (x)) d f (x) ≡ g(y) d y , (7.1.55)
cos2 x y=f (x)
406 Глава 7. ИНТЕГРАЛ

то переход в ней от правой части к левой можно = 2y − 2 ln y + C √ =


будет интерпретировать как замену переменной. y=1+ x
√ √
= 2(1 + x) − 2 ln(1 + x) + C
• Переход от левой части к правой в формуле
(7.1.54) называется вынесением из-под знака ⊲⊲ 7.1.27. Найдите неопределенные интегралы:
дифференциала, а переход от правой части к 1. ´ cosxln x d x
´
левой — внесением под знак дифференциала. 2. √ cos2 x dx
sin x+3
´ 2x
Покажем, какую пользу может принести вне- 3. 1+x4 d x
сение под знак дифференциала. ´ etg x
4. ´ cos 2x dx
2x−1
⋄ 7.1.22. 5. √1−x+x 2
dx
´ 3x2 3
ˆ ˆ 6. x3 +1 ln(x + 1) d x
esin x · cos x d x = esin x d sin x =
 ´ arcsin x
7. e√1−x2 d x
´ ex
8. √4−e dx
ˆ
= ey d y = ey + C = esin x + C ´ sin x 2x
y=sin x y=sin x 9. √ dx
´ cos
3
√x
⋄ 7.1.23. 10. x 2x4 − 3 d x
´ x5
11. √7−x dx
1 ´ cos x6
ˆ ˆ

cos 3x d x = cos 3x · 3 d x = 12. √3+sin x d x
3
1 1
ˆ ˆ
= cos 3x d 3x = cos y d y = Интегрирование по частям. Прежде, чем
3 3 y=3x
1 1 перейти к обсуждению формулы (7.1.49), пере-
= sin y + C = sin 3x + C пишем ее в следующем виде, используя формулу
3 y=3x 3
внесения под знак дифференциала (7.1.54):
⋄ 7.1.24. ˆ ˆ
f (x) d g(x) ≡ f (x)·g(x)− g(x) d f (x) (7.1.56)
sin x
ˆ ˆ
tg x d x = dx =
cos x
 ⋄ 7.1.28.
− sin x d x d cos x
ˆ ˆ
=− dx = − =  
cos x cos x
ˆ
ˆ
dy ln x d x = интегрирование
по частям =
=− = − ln |y| + C =
y y=cos x
ˆ
y=cos x
= ln x · x − x d ln x =
= − ln | cos x| + C
1
ˆ ˆ
Теперь покажем, чем может быть полезно вы- = ln x · x − x · d x = ln x · x − 1dx =
x
несение из-под знака дифференциала.
= ln x · x − x + C
⋄ 7.1.25.
⋄ 7.1.29.
y = 2x − 5
ˆ
10
(2x − 5) d x = =
ˆ ˆ  
x = y+5 2 xe d xH = x d ex = интегрирование
x
=
по частям
1
ˆ ˆ
10  y+5 10
= y d 2 = y dy =
ˆ
y=2x−5 2 y=2x−5 = xex − ex d x = xex − ex + C
1 1
= y 11 + C = (2x − 5)11 + C =
2 · 11 y=2x−5 2 · 11 ⋄ 7.1.30.
1 11
= (2x − 5) + C ˆ ˆ  
22 xsin x d x = − x d cos x = интегрирование

=
по частям
⋄ 7.1.26.  ˆ 
√ = − x cos x + cos x d x =
dx
ˆ
y =1+ x
√ = =
1+ x x = (y − 1)2 = − (x cos x + sin x + C1 ) = −x cos x − sin x + C
2
d (y − 1)
ˆ 
= √ = ⋄ 7.1.31.
y y=1+ x
ˆ
2(y − 1)dy
ˆ
1
ˆ  
2 3 интегрирование
= √ = x ln x d @ x = ln x d x = по частям =
y y=1+ x 3
   
1 1
ˆ ˆ
=2 1− dy √ = = ln x · x3 − x3 d ln x =
y y=1+ x 3
§ 1. Неопределенный интеграл 407
 
1 3 1 ⊲⊲ 7.1.35.
ˆ
== 3
ln x · x − x · d x = Найдите интегралы:
1) ´ x2 sin x d x
´
3 x
 
1 2) ´ x2 e−x d x
ˆ
= ln x · x3 − x2 d x = 3) ´ x ln2 x d x
3
  4) ´ x3 d cos x,
1 1 1 1
= ln x · x3 − x3 + C = ln x·x3 − x3 +C 5) ´ cos x d x3 ,
3 3 3 9
6) x d ex .
⊲⊲ 7.1.32. Найдите интегралы: Случается, что интегрирование по частям
´ ln x ´ x
приводит к исходным интегралам. В таких слу-
1) ´ x22xd x 6) sin2 x
dx чаях нужно поступать следующим образом.
2) ´√
´ xe d x 7) x ln x d x⋄ 7.1.36.
3) ´ arctg x d x ´ n
4) 8) x ln x d x  
´ x cos x d x
ˆ ˆ
5) x arctg x d x
´
9) arcsin x d x e sin x d > x = sin x d ex = интегрирование
x
по частям =
ˆ
Иногда бывает необходимо применять фор- = ex sin x − ex W d sin x =
мулу интегрирования по частям несколько раз. ˆ
= ex sin x − ex cos x d > x =
⋄ 7.1.33.
ˆ  
ˆ ˆ   = e x
sin x − cos x d ex = интегрирование =
2 x 2 x интегрирование по частям
x e d xH = x d e = по частям =
 ˆ 
x x x
ˆ ˆ
= e sin x − e cos x − e d cos x =
= x2 ex − ex U d x2 = x2 ex − 2 ex x d xD =
 
ˆ
x x
ˆ
2 x
= x e − 2 x de = x интегрирование
= = e sin x − e cos x + ex W d cos x =
по частям
  x x
ˆ
ex sin x d x
ˆ
= e sin x − e cos x −
= x2 ex − 2 xex − ex d x =
Мы вернулись к исходному интегралу. Если те-
= x2 ex − 2 (xex − ex − C1 ) =
перь обозначить
= x2 ex − 2xex − 2ex + C ˆ
I = ex sin x d x,
⋄ 7.1.34.
ˆ ˆ то мы получим уравнение
x2 cos x d x = x2 d sin x =

I = ex sin x − ex cos x − I, (7.1.57)
 
= интегрирование
по частям = из которого легко находится I:
2I = ex sin x − ex cos x
ˆ
= x2 sin x − ] sin x d x2 =
ˆ ⇓
= x2 sin x − 2 x sin x d x =
 1 x
I = (e sin x − ex cos x)
ˆ   2
= x2 sin x + 2 x d cos x = интегрирование = Теперь нужно вспомнить, что неопределенный
по частям
  интеграл вычисляется с точностью до констан-
ты, поэтому окончательный ответ будет таким:5
ˆ
= x2 sin x + 2 x cos x − cos x d x =
1
ˆ
= x2 sin x + 2 (x cos x − sin x − C1 ) = ex sin x d x = (ex sin x − ex cos x) + C
2
= x2 sin x − 2x cos x − 2 sin x + C (7.1.58)
5 В этом месте мы неаккуратно объясняем наши действия, точное объяснение состоит в следующем. Равенство

(7.1.57), которое мы получили, является равенством классов функций. Символ I обозначает в нем класс функций,
представимых в виде F (x) + A, где F — некоторая фиксированная первообразная для подынтегральной функции.
Равенство (7.1.57) поэтому формально означает высказывание
∀A ∃B ∀x F (x) + A = ex sin x − ex cos x − (F (x) + B),
В нем если выразить F (x) через все остальное, то мы получим высказывание
1 x
∀A ∃B ∀x F (x) = (e sin x − ex cos x) − A − B,
2
Из него следует, что любая первообразная F к функции ex sin x имеет вид
1 x
F (x) = (e sin x − ex cos x) − A − B
2
408 Глава 7. ИНТЕГРАЛ

⋄ 7.1.37. Теорема 7.1.9. Для интегралов


ˆ p   ˆ
dx
1 − x2 d x = интегрирование = In = (7.1.60)
по частям (x2 + a2 )n
p ˆ

= x 1 − x2 − x  d 1 − x2 = первый из которых, по формуле (7.1.42), равен
p ˆ
x2 1 x
=x 1−x + 2 √ dx = I1 = arctg + C (7.1.61)
1 − x2 a a
p ˆ
1 − x2
ˆ
1
= x 1 − x2 − √ dx+ √ dx = справедлива следующая рекуррентная формула
1−x 2 1 − x2
p ˆ p 1 x 2n − 1
= x 1 − x2 − 1 − x2 d x + arcsin x + C In+1 = 2
· 2 2 n
+ · In (n ∈ N)
2na (x + a ) 2na2
(7.1.62)
Мы вернулись к исходному интегралу. Если те-
перь обозначить Доказательство.
ˆ p
dx
ˆ
I= 1 − x2 d x, In+1 = =
(x2 + a2 )n+1
1 a2
ˆ
то получается алгебраическое уравнение, из ко- = 2 dx =
торого находится I: a (x + a2 )n+1
2
ˆ 2
p 1 x + a2 − x2
2
= 2
dx =
I = x 1 − x − I + arcsin x + C a (x2 + a2 )n+1
1 1 1 x2
ˆ ˆ
⇓ = 2 2 2 n
dx − 2
dx =
a (x + a ) a (x + a2 )n+1
2
p
1 1
ˆ
2I = x 1 − x2 + arcsin x + C = 2 In − 2 (x2 + a2 )−(n+1) · x· x d x =

a a
⇓ 1 1
ˆ
= 2 In − 2 (x2 + a2 )−(n+1) ·x d (x6 2 + a2 ) =
1 p  a 2a
I= x 1 − x2 + arcsin x + C 1 1
ˆ  
2 2 2 −n интегрируем
= 2 In + x d(x +a ) = по частям =
6 a 2na2
Выбрав новую константу , получаем оконча-
1 1
тельный ответ: = 2 In + 2
x · (x2 + a2 )−n −
a 2na
1 p 
ˆ p
1
ˆ
1 − x2 d x = x 1 − x2 + arcsin x + A − 2
(x2 + a2 )−n d x =
2 2na
(7.1.59) 1 1 x 1 dx
ˆ
= 2 In + − =
a 2na2 (x2 + a2 )n 2na2 (x2 + a2 )n
⊲⊲ 7.1.38.
´ √ Найдите интегралы: 1 1 x 1
1) ´ 1 + x2 d x = 2 In + − In =
a 2
2na (x + a )2 2 n 2na2
2) ´ ex cos x d x
3) ´ e2x sin2 x d x 1 x 2n − 1
= ·
2 (x2 + a2 )n
+ · In
4) ´ cos(ln x) d x 2na 2na2
5) earcsin x d x

Рекуррентные формулы Теперь покажем, как применяется рекуррент-


ная формула (7.1.62).
Теперь мы перейдем к специальным приемам вы-
числения неопределенных интегралов. ⋄ 7.1.39. Вычислим, например, интеграл I2 . Для
Некоторые интегралы удается найти только этого в формулу (7.1.62) подставим n = 1:
с помощью так называемых рекуррентных инте-
гральных формул. Что это такое станет ясно из 1 x 1
следующего примера. I2 = 2 · 2 2
+ 2 · I1 = (7.1.61) =
2a (x + a ) 2a
где A, B – какие-то константы. В частности, в качестве первообразной можно выбрать функцию
1 x
F (x) = (e sin x − ex cos x) .
2
И это нам дает ответ (7.1.58).
6 Здесь, как и в примере 7.1.36, в наших рассуждениях имеется небрежность, см. по этому поводу подстрочное

примечание 5.
§ 1. Неопределенный интеграл 409

x 1 x Интегрирование простейших дробей Са-


= + · arctg + C
2a2 (x2 + a2 ) 2a3 a мыми простыми рациональными функциями яв-
ляются так называемые простейшие дроби, то
То есть, есть дроби следующих четырех типов.

dx Типы простейших дробей


ˆ
I2 = =
(x2 + a2 )2 — простейшие дроби 1 типа:
x 1 x
= 2 2 2
+ 3 · arctg + C (7.1.63) A
2a (x + a ) 2a a
x−a
⋄ 7.1.40. Вычислим, интеграл I3 , для чего в — простейшие дроби 2 типа:
формулу (7.1.62) подставим n = 2: A
(n ∈ N, n > 1)
(x − a)n
1 x 3
I3 = · + 2 · I2 = (7.1.63) = — простейшие дроби 3 типа:
4a2 (x2 + a2 )2 4a
x Bx + C
= 2 2 + (p2 − 4q < 0)
4a (x + a2 )2 x2 + px + q
 
3 x 1 x — простейшие дроби 4 типа:
+ 2· + · arctg + C =
4a 2a2 (x2 + a2 ) 2a3 a
Bx + C
x 3x 3 x (p2 − 4q < 0, n ∈ N, n > 1)
= 2 2 2 2
+ 4 2 2
+ 5 ·arctg +C (x2 + px + q)n
4a (x + a ) 8a (x + a ) 8a a
Покажем, как они интегрируются.
То есть,
⋄ 7.1.43 (простейшая дробь 1 типа). Для таких
дробей можно вывести общую формулу:
dx
ˆ
I3 = =
(x + a2 )3
2 A y =x−a
ˆ
dx = =
x 3x 3 x x−a x=y+a
= 2 2 + + ·arctg +C
4a (x + a2 )2 8a4 (x2 + a2 ) 8a5 a A dy
ˆ ˆ
(7.1.64) = d(y + a) = A =
y y=x−a y y=x−a

⊲⊲ 7.1.41. Выведите рекуррентные формулы = A ln |y| + C = A ln |x − a| + C


y=x−a
для следующих интегралов, и вычислите их при
⋄ 7.1.44 (простейшая дробь 2 типа). Здесь так-
n = 2, 3: ´
же можно найти общую формулу
1) Jn = ´ xk lnn x d x (n ∈ N)
2) Kn = sinn x d x (n ∈ N) A y =x−a
ˆ
dx = =
(x − a) n x=y+a
A dy
ˆ ˆ
Интегрирование рациональных функций = d(y + a) =A =
yn y=x−a y n y=x−a
• Рациональной функцией называется всякая A A
функция R(x), которую можно представить = +C = +C
(n − 1)y n−1 y=x−a (n − 1)(x − a)n−1
в виде отношения двух многочленов:
⋄ 7.1.45 (простейшая дробь 3 типа). Здесь, хо-
P (x) тя и можно вывести общую формулу, но запом-
R(x) =
Q(x) нить ее уже будет вряд ли возможно. Поэтому
мы приведем лишь общий план действий. Чтобы
⋄ 7.1.42. Например, функции вычислить интеграл
Bx + C
ˆ
x2 + x + 1 2x + 1 5 dx (p2 − 4q < 0)
, 3
, x − 2x + 1 2
x + px + q
x−2 x −x+5
нужно сначала выделить полный квадрат в зна-
являются рациональными, а функции менателе, то есть переписать знаменатель так,
чтобы переменная x встречалась только один
x
sin x, √ , 2x раз:
x−3
p  p 2  p 2
не являются рациональными. x2 + px + q = x2 + 2 · · x + − +q =
2 2  2 
 p 2 p2
В этом параграфе мы покажем, как вычисля- = x+ + q−
ются интегралы от рациональных функций. 2 4
410 Глава 7. ИНТЕГРАЛ

 2 
а затем выражение в скобках заменить на новую 3 1 3 1 2 x − 12
переменную: = ln x− + + √ ·arctg √ +C =
2 2 4 3 3
p
x+ =y 3 1 2x − 1
2 = ln x2 − x + 1 + √ · arctg √ +C =
2 3 3
Оказывается, что при этом мы получим таблич-  
всегда
ные интегралы. = x2 − x + 1 > 0 =
Приведем иллюстрацию. Пусть требуется вы- 
3 1 2x − 1
числить интеграл = ln x2 − x + 1 + √ · arctg √ +C
2 3 3
3x − 1
ˆ
dx ⋄ 7.1.46 (простейшая дробь 4 типа). Для таких
x2 − x + 1 дробей вывести общую формулу и вовсе невоз-
Поскольку дискриминант знаменателя отрицате- можно. План действий же состоит в следующем.
лен, Чтобы вычислить интеграл
p2 − 4q = 1 − 4 = −3 < 0 Bx + C
ˆ
dx (n ∈ N, n > 1, p2 −4q < 0)
(x2 + px + q)n
выражение под интегралом действительно явля-
ется простейшей дробью третьего типа. Выделим нужно, как и в предыдущем случае, сначала вы-
полный квадрат в знаменателе: делить полный квадрат у квадратного трехчлена
в знаменателе,
 2  2
1 1 1 p  p 2  p 2
x2 − x + 1 = x2 − 2 · · x + − +1 = x2 + px + q = x2 + 2 · · x + − +q =
2 2 2 2 2
 2    2   2 
1 1 1 3 p 2 p2
= x− + 1− = x− + = x+ + q−
2 4 2 4 2 4

Теперь делаем замену переменной в интеграле: затем выражение в скобках заменить на новую
переменную:
p
3x − 1 3x − 1 x+ =y
ˆ ˆ
dx = 2 dx = 2
x2 − x + 1 x − 21 + 43 При этом получится несколько интегралов, из
  
y = x − 12 3 y + 21 − 1 1 которых одни окажутся табличными, а другие
ˆ
= = d y+ = можно будет вычислить с помощью рекуррент-
x = y + 12 y 2 + 34 2
ных формул §7.
3y + 21
ˆ
= dy = Приведем иллюстрацию. Пусть требуется вы-
y 2 + 34 числить интеграл
y 1 1
ˆ ˆ
x−1
ˆ
=3 dy + dy = dx
y 2 + 34 2 y 2 + 34 2
x + 2x + 3
 
в первом интеграле
= вносим y под знак = Поскольку дискриминант знаменателя отрицате-
дифференциала
лен,
3 dy 2 1 1
ˆ ˆ
= + dy = p2 − 4q = 4 − 12 = −8 < 0
3
2 2
y +4 2 y + 43
2
выражение под интегралом действительно явля-
в первом интеграле!
делаем замену
ется простейшей дробью четвертого типа. Выде-
= y 2 = z − 34 = лим полный квадрат в знаменателе:
z = y 2 + 43
3
 x2 + 2x + 3 = x2 + 2 · 1 · x + 12 − 12 + 3 = (x + 1)2 + 2
3 d z− 1 dy
ˆ ˆ
4
= + =
2 z 3 3
y=z− 4 z=y+ 4 2 y + 43
2
Теперь делаем замену переменной в интеграле:
3 dz 1 dy
ˆ ˆ
= +  √ 2 = x−1 x−1
ˆ ˆ
2 z 2
z=y + 43
2 d x = 2 dx =
y 2 + 23 2
(x + 2x + 3) 2
((x + 1)2 + 2)
 
y−2
ˆ
применяем y =x+1
= формулы = = = d(y − 2) =
(7.1.35) и (7.1.42) x=y−1 (y 2 + 2)2
3 1 2 2y y−2 y dy dy
ˆ ˆ ˆ
= ln |z| + · √ · arctg √ + C = = 2 2
d y = 2 2
−2 =
2 2 3
z=y + 4 2 3 3 (y + 2) (y + 2) (y + 2)2
2

3 3 1 2y 1 dy 2 dy
ˆ ˆ
= ln y 2 + + √ · arctg √ + C = = 2 2
− 2 =
2 4 3 3 2 (y + 2) (y + 2)2
2
 
возвращаемся 1 d(z − 2) dy
ˆ ˆ
= к исходной = = 2
− 2 =
переменной x 2 z 2
z=y +2 (y + 2)2
2
§ 1. Неопределенный интеграл 411

1 dz dy
ˆ ˆ
= −2 Мы не будем доказывать этот результат, а
2 z2 z=y 2 +2
 √ 2 2 = лишь объясним как он работает. Для этого по-
y2 + 2
  лезно запомнить следующие
применяем 1
= формулы =− −
(7.1.34) и (7.1.63) 2z Правила разложения на простейшие дроби:
z=y 2 +2
 
y 1 y
−2 + √ · arctg √ + C = — если в разложении знаменателя Q(x) на мно-
4(y 2 + 2) 2( 2)3 2 жители имеется множитель (x − a)n
1
=− −
2(y 2 + 2) Q(x) = ... · (x − a)n · ...
 
y 1 y
−2 + √ · arctg √ + C = то в разложении правильной дро-
4(y 2 + 2) 2( 2)3 2 P (x)
би Q(x) в сумму простейших дробей
1 y 1 y
=− − − √ · arctg √ + C = должны присутствовать слагаемые вида
2(y 2 + 2) 2(y 2 + 2) 2 2 2 A1 A2 An
√ x−a , (x−a)2 , ..., (x−a)n :
y+1 2 y
=− − · arctg √ + C =
2(y 2 + 2) 4 2 P (x) A1 A2 An
  = ...+ + 2
+...+ +...
возвращаемся Q(x) x − a (x − a) (x − a)n
= к исходной =
переменной x
√ — если в разложении знаменателя Q(x) на мно-
x+2 2 x+1 жители имеется множитель (x2 +px+q)n (p2 −
=− 2
− · arctg √ + C
2(x + 2x + 3) 4 2 4q < 0)
⊲⊲ 7.1.47. Вычислите интегралы:
Q(x) = ... · (x2 + px + q)n · ...
´ dx ´ x dx
1) x−7 ; 7) x2 +7x+13 ;
´ dx ´ 4x+8 то в разложении правильной дро-
2) 3−x ; 8) 3x2 +2x+5 d x; P (x)
´ dx би Q(x) в сумму простейших дробей
9) 2x2x+5
´
3) 1+5x ; d x; должны присутствовать слагаемые вида
´ +2x+3
10) 8x5x−7
´ dx
B1 x+C1 B2 x+C2 Bn x+Cn
4) (3x+2)2 ; +x+1 d x;
´ 2 3x+5 x2 +px+q , (x2 +px+q)2 , ..., (x2 +px+q)n :
dx 11) (x2 +2x+2)2 d x;
´
5) x2 +2x+1 ;
dx 3x+2
´ ´
6) 4x2 −4x+1 ; 12) (x2 −3x+3) 2 d x. P (x) B1 x + C1 B2 x + C2
= ...+ 2 + +...
Q(x) x + px + q (x2 + px + q)2
Интегрирование правильных дробей Bn x + Cn
... + 2 + ...
• Рациональная функция (x + px + q)n

P (x)
R(x) =
Q(x) Покажем теперь на примерах, что эти прави-
ла означают.
называется правильной дробью, если степень
многочлена в числителе меньше степени мно- ⋄ 7.1.49 (случай неповторяющихся множителей
гочлена в знаменателе: первой степени). Рассмотрим интеграл
deg P < deg Q ˆ
9x2 − 2x − 8
dx
⋄ 7.1.48. Например, дроби x3 − 4x

x+1 x3 x2 − 2x + 1 Разложим знаменатель дроби на множители:


, , ,
x2 +x+1 (x2 − 1)(x2 + 4) x3
x3 − 4x = x(x2 − 4) = x(x − 2)(x + 2)
будут правильными, а дроби
В соответствии с первым правилом, это означа-
x2 + 1 x3 x2 − 2x + 1
, , , ет, что в разложении нашей (правильной) дроби
2
x +x+1 (x − 1)(x + 4) x в сумму простейших дробей должны присутство-
– неправильными. вать следующие слагаемые:
Для интегрирования правильных дробей A B C
нужно научиться пользоваться следующей клас- , ,
x x−2 x+2
сической теоремой.
То есть,
Теорема 7.1.10. Всякая правильная дробь одно-
значным образом раскладывается в сумму про- 9x2 − 2x − 8 A B C
стейших дробей. = + +
x3 − 4x x x−2 x+2
412 Глава 7. ИНТЕГРАЛ

Теперь необходимо найти коэффициенты Оно должно выполняться при любом x. В част-
A, B, C. Для этого приведем правую часть к ности, при x = 0, x = 2 и x = −2. Посмотрим,
общему знаменателю во что превращаются левая и правая части при
этих значениях переменной:
9x2 − 2x − 8
= x = 0 : − 8 = −4A ⇒ A=2
x3 − 4x
A(x − 2)(x + 2) + Bx(x + 2) + Cx(x − 2) x = 2 : 24 = 8B ⇒ B = 3
=
x(x − 2)(x + 2) x = −2 : 32 = 8C ⇒ C =4
Эти дроби действительно будут совпадать, если Эта запись означает, что при x = 0 равенство
у них совпадают числители: (7.1.49) превращается в равенство −8 = −4A, от-
куда следует что A = 2, и т.д.
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2) В общем, каким способом ни считай, получа-
ется 
Далее коэффициенты A, B, C можно искать

A = 2
двумя разными методами.
Первый из них называется методом неопре- B=3


деленных коэффициентов. Он состоит в следу- C=4
ющем. Сначала приведем подобные слагаемые Это означает, что
справа:
9x2 − 2x − 8 2 3 4
9x2 − 2x − 8 = (A + B + C)x2 + (2B − 2C)x − 4A 3
= + +
x − 4x x x−2 x+2
Слева и справа записаны многочлены от пере- и теперь, наконец, можно вычислить наш инте-
менной x. Они будут совпадать только если у них грал:
совпадают коэффициенты:
9x2 − 2x − 8
ˆ
2
x : 9=A+B+C dx =
x3 − 4x
x1 : − 2 = 2B − 2C 2 3 4
ˆ ˆ ˆ
= dx + dx + dx =
0
x : − 8 = −4A x x − 2 x + 2
= 2 ln |x| + 3 ln |x − 2| + 4 ln |x + 2| + D
Эта запись означает, что число 9 является коэф-
фициентом перед x2 слева, и оно совпадает с чис- (D – постоянная интегрирования).
лом A+ B + C, которое является коэффициентом
⋄ 7.1.50 (случай повторяющихся множителей
перед x2 справа, и т.д. Мы получаем линейную
первой степени). Рассмотрим интеграл
систему, решая которую находим числа A, B, C:
3x + 2
ˆ
  dx

A + B + C = 9 
A + B + C = 9 x(x + 1)3
2B − 2C = −2 ⇔ B − C = −1 ⇔

 
 Знаменатель дроби уже разложен на множители:
−4A = −8 A=2
 
  x(x + 1)3
2 + B + C = 9 B + C = 7
⇔ B − C = −1 ⇔ B − C = −1 ⇔ В соответствии с первым правилом, в разложе-

 

A=2 A=2 нии нашей (правильной) дроби в сумму простей-
  ших дробей должны присутствовать следующие

B + C = 7 
B + C = 7 слагаемые:
⇔ 2B = 6 ⇔ B=3 ⇔

 
 A B C D
A=2 A=2 , , ,
  x x+1 (x + 1) 2 (x + 1)3

 3 + C = 7 
 C = 4
⇔ B=3 ⇔ B=3 Значит,

 

A=2 A=2 3x + 2 A B C D
3
= + + 2
+
x(x + 1) x x + 1 (x + 1) (x + 1)3
Мы нашли коэффициенты A, B, C методом
неопределенных коэффициентов. Теперь пока- Теперь необходимо найти коэффициенты
жем, как их можно было найти по-другому, а A, B, C, D. Для этого приведем правую часть
именно методом частных значений. к общему знаменателю
Еще раз рассмотрим равенство (7.1.49):
3x + 2
9x2 −2x−8 = A(x−2)(x+2)+Bx(x+2)+Cx(x−2) =
x(x + 1)3
§ 1. Неопределенный интеграл 413

A(x + 1)3 + Bx(x + 1)2 + Cx(x + 1) + Dx Чтобы найти коэффициенты A, B, C, D, приве-


=
x(x + 1)3 дем правую часть к общему знаменателю
Эти дроби действительно будут совпадать, если
x3 − 2x + 2
у них совпадают числители: =
(x − 1)2 (x2 + 1)
3x + 2 = A(x + 1)3 + Bx(x + 1)2 + Cx(x + 1) + Dx =
A(x − 1)(x2 + 1) + B(x2 + 1) + (Cx + D)(x − 1)2
(x − 1)2 (x2 + 1)
Теперь коэффициенты A, B, C, D лучше все-
го искать, комбинируя метод частных значений Эти дроби совпадают, если у них совпадают чис-
с методом неопределенных коэффициентов. лители:

x=0: 2=A ⇒ A=2 x3 − 2x + 2 =


x = −1 : − 1 = −D ⇒ D=1 = A(x−1)(x2 +1)+B(x2 +1)+(Cx+D)(x−1)2
3
x : 0=A+B =2+B ⇒ B = −2
2
Теперь коэффициенты A, B, C, D ищем, ком-
x : 0 = 3A + 2B + C = 2 + C ⇒ бинируя метод частных значений с методом
⇒ C = −2 неопределенных коэффициентов.

Таким образом, x = 1 : 1 = 2B
 x3 : 1 = A + C

 A=2

B = −2 x2 : 0 = −A + B − 2C + D

 C = −2 x0 : 2 = −A + B + D


D=1
Получается система
Значит,  

 2B = 1 
 A=0
3x + 2 2 2 2 1 
A + C = 1 
B = 1
= − − + 2
x(x + 1)3 x x + 1 (x + 1)2 (x + 1)3 ⇔ ... ⇔

 −A + B − 2C + D = 0 
 C = 1

 

и теперь можно вычислять наш интеграл: −A + B + D = 2 D = 23
3x + 2 2 2
ˆ ˆ ˆ
d x = d x − d x− Значит,
x(x + 1) 3 x x+1
2 1 x3 − 2x + 2 1 2x + 3
ˆ ˆ
− dx + dx = = +
(x + 1) 2 (x + 1)3 (x − 1)2 (x2 + 1) 2(x − 1)2 2(x2 + 1)
2 1 и теперь можно вычислять наш интеграл:
= 2 ln |x| − 2 ln |x + 1| + − +E
x + 1 2(x + 1)2
x3 − 2x + 2
ˆ
(E – постоянная интегрирования). dx =
(x − 1)2 (x2 + 1)
⋄ 7.1.51 (случай неповторяющихся множителей ˆ
1
ˆ
2x + 3
второй степени). Рассмотрим интеграл = 2
d x + dx =
2(x − 1) 2(x2 + 1)
1 2x 3
ˆ ˆ
x3 − 2x + 2
ˆ
dx =− + 2
d x+ 2
dx =
(x − 1)2 (x2 + 1) 2(x − 1) 2(x + 1) 2(x + 1)
1 d(x2 + 1) 3 dx
ˆ ˆ
Знаменатель дроби уже разложен на множители: =− + 2
+ 2
=
2(x − 1) 2(x + 1) 2 x +1
(x − 1)2 (x2 + 1) 1 1 3
=− + ln(x2 + 1) + arctg x + E
2(x − 1) 2 2
В соответствии с первым и вторым правилами,
в разложении нашей (правильной) дроби в сум- (E – постоянная интегрирования).
му простейших дробей должны присутствовать
следующие слагаемые: ⋄ 7.1.52 (еще один случай неповторяющихся
множителей второй степени). Рассмотрим инте-
A B Cx + D грал
, ,
2x2 − 3x + 1
ˆ
x−1 (x − 1)2 2
x +1
dx
x3 + 1
Значит,
Разложим знаменатель на множители:
x3 − 2x + 2 A B Cx + D
= + + 2 x3 + 1 = (x + 1)(x2 − x + 1)
(x − 1)2 (x2 + 1) x − 1 (x − 1)2 x +1
414 Глава 7. ИНТЕГРАЛ

В соответствии с первым и вторым правилами, 2 2y


= 2 ln |x + 1| − √ arctg √ =
в разложении нашей (правильной) дроби в сум- 3 3 y=x+ 12

му простейших дробей должны присутствовать 2 2 x + 21
следующие слагаемые: = 2 ln |x + 1| − √ arctg √ +D =
3 3
A Bx + C 2 2x + 1
, = 2 ln |x + 1| − √ arctg √ +D
x+1 x2−x+1 3 3
Значит, (D – постоянная интегрирования).
⋄ 7.1.53 (случай повторяющихся множителей
2x2 − 3x + 1 A Bx + C
3
= + 2 второй степени). Рассмотрим интеграл
x +1 x+1 x −x+1
x3 + 3
ˆ
Чтобы найти коэффициенты A, B, C, приведем dx
правую часть к общему знаменателю (x + 1)(x2 + 1)2
Знаменатель дроби уже разложен на множители:
2x2 − 3x + 1 A(x2 − x + 1) + (Bx + C)(x + 1)
=
x3 + 1 (x + 1)(x2 − x + 1) (x + 1)(x2 + 1)2

Эти дроби совпадают, если у них совпадают чис- В соответствии с первым и вторым правилами,
лители: в разложении нашей (правильной) дроби в сум-
му простейших дробей должны присутствовать
2x2 − 3x + 1 = A(x2 − x + 1) + (Bx + C)(x + 1) следующие слагаемые:

Теперь коэффициенты A, B, C ищем, комби- A Bx + C Dx + E


, ,
нируя метод частных значений с методом неопре- x+1 x2 + 1 (x2 + 1)2
деленных коэффициентов. Значит,
x = −1 : 6 = 3A x3 + 3 A Bx + C Dx + E
2
= + 2 + 2
x : 2=A+B (x + 1)(x2 + 1)2 x+1 x +1 (x + 1)2
x0 : 1 = A + C Чтобы найти коэффициенты A, B, C, D, E, при-
ведем правую часть к общему знаменателю
Получается система
  x3 + 3
  =
3A = 6 A = 2 (x + 1)(x2 + 1)2
A+B =2 ⇔ ... ⇔ B=0 A(x2 + 1)2 + (Bx + C)(x + 1)(x2 + 1) + (Cx + D)(x + 1)

 
 =
A+C =1 C = −1 (x + 1)(x2 + 1)2

Эти дроби совпадают, если у них совпадают чис-


Значит,
лители:
2x2 − 3x + 1 2 1
= − x3 + 3 = A(x2 + 1)2 +
x3 + 1 x + 1 x2 − x + 1
и теперь можно вычислять наш интеграл: + (Bx + C)(x + 1)(x2 + 1) + (Cx + D)(x + 1)
Теперь коэффициенты A, B, C, D, E ищем,
2x2 − 3x + 1
ˆ
dx = комбинируя метод частных значений с методом
x3 + 1 неопределенных коэффициентов.
2 1
ˆ ˆ
= dx − 2
dx = x = −1 : 2 = 4A
x+1 x −x+1
4
1 x : 0= A+B
ˆ
= 2 ln |x + 1| −   √ 2 d x = 3
2 x : 1=B+C
x + 21 + 23
2
1 x : 0 = 2A + B + C + D
y =x+ 2
= = 2 ln |x + 1|−
1 0
x : 3= A+C +E
x=y− 2
 
1 1
ˆ
− Получается система
 √ 2 d y − =
 
3 2 y=x+ 21
y2 +  4A = 2  A = 21
2 
 


 
 1
1 
A + B = 0 
B = − 2
ˆ
= 2 ln |x + 1| −  √ 2 d y = 3
3 y=x+ 21 B+C =1 ⇔ ... ⇔ C = 2
y2 + 2 
 

  
 2A + B + C + D = 0 
 D = −2

 

= применяем
= A + C + E = 3 E = 1
формулу (7.1.42)
§ 1. Неопределенный интеграл 415

Значит, Она позволяет вычислять интегралы от лю-


1
бых рациональных функций (потому что любую
x3 + 3 2 − 21 x + 32 −2x + 1 рациональную функцию можно представить в
2 2
= + 2
+ 2
(x + 1)(x + 1) x+1 x +1 (x + 1)2 виде суммы многочлена и правильной дроби, а
и теперь можно вычислять наш интеграл: их мы уже умеем интегрировать).

1 ⋄ 7.1.55. Рассмотрим интеграл


x3 + 3
ˆ ˆ
2
2 2
d x = d x+
(x + 1)(x + 1) x+1 ˆ
5x3 + 9x2 − 22x − 8
dx
− 12 x + 32 −2x + 1 x3 − 4x
ˆ ˆ
+ dx + dx =
x2 + 1 (x2 + 1)2
Разделив числитель на знаменатель с остатком,
1 dx 1 x dx 3 dx
ˆ ˆ ˆ
= − + − получим
2 x+1 2 x2 + 1 2 x2 + 1
2x d x dx 5x3 + 9x2 − 22x − 8 9x2 − 2x − 8
ˆ ˆ
− + = = 5 +
2
(x + 1) 2 (x + 1)2
2 x3 − 4x x3 − 4x
1 1 d(x2 + 1) 3
ˆ
= ln |x + 1| − + arctg x− Поэтому
2 4 x2 + 1 2
!
в последнем 5x3 + 9x2 − 22x − 8
ˆ
2
d(x + 1) dx
ˆ ˆ
− + = интеграле
= dx =
(x2 + 1)2 (x2 + 1)2 применяем x3 − 4x
формулу (7.1.63)
9x2 − 2x − 8
ˆ ˆ
1 1 3 1 = 5 dx + dx =
= ln |x + 1| − ln(x2 + 1) + arctg x + 2 + x3 − 4x
2 4 2 x +1  
второй интеграл
x 1 = мы уже нашли =
+ + · arctg x + H = в примере 7.1.49
2(x2 + 1) 2
1 1 = 5x + (2 ln |x| + 3 ln |x − 2| + 4 ln |x + 2| + D)
= ln |x + 1| − ln(x2 + 1) + 2 arctg x+
2 4
⋄ 7.1.56. Рассмотрим интеграл
1 x
+ 2 + 2
+H
x + 1 2(x + 1) ˆ
2x4 + 5x2 − 2
dx
(H – постоянная интегрирования). 2x3 − x − 1

⊲⊲ 7.1.54. Вычислите интегралы: Разделив числитель на знаменатель с остатком,


получим
´ 2 +x−1 dx
1) xx3 +x
´
2 −6x d x; 7) (x2 +2)(x−1) 2;
2x4 + 5x2 − 2 6x2 + x − 2
dx ´ x3 +3x2 −3x+1 = x +
´
2) (x+1)(x−2) ; 8) (x+1)2 (x2 +1) d x; 2x3 − x − 1 2x3 − x − 1
xdx
´
3) 3x2 −3x−2 ; 9) 3x
´ 3
−x2 −4x+13
x2 (x2 −4x+13) d x; Теперь надо подумать о том, как вычислить ин-
2x+11
´
4) (x2 +6x+13) 2 d x;
´ 4x2 −8x теграл от второго слагаемого (то есть от полу-
10) (x−1) 2 (x2 +1)2 d x;
´ 2
x dx
ченной правильной дроби). Для этого разложим
5) (x+2)2 (x+4)2 ; ´ x2 знаменатель на множители:
11) (x2 +2x+2) 2 d x;
dx
´
6) x3 (x−1) ; ´ x3 +2x2 +3x+4
12) x4 +x3 +2x2 d x. 2x3 − x − 1 = (x − 1)(2x2 + 2x + 1)

Интегрирование неправильных дробей. В соответствии с первым и вторым правилами,


Напомним (см. предыдущий подпункт (b)) , что в разложении нашей (правильной) дроби в сум-
рациональная функция му простейших дробей должны присутствовать
следующие слагаемые:
P (x)
R(x) = A Bx + C
Q(x) ,
x−1 2x2 + 2x + 1
называется неправильной дробью, если степень
многочлена в числителе больше или равна сте- Значит,
пени многочлена в знаменателе:
6x2 + x − 2 A Bx + C
= +
deg P > deg Q 2x3 − x − 1 x − 1 2x2 + 2x + 1

Оказывается, что справедлива Чтобы найти коэффициенты A, B, C, приведем


правую часть к общему знаменателю
Теорема 7.1.11. Всякая неправильная дробь
представима в виде суммы многочлена и пра- 6x2 + x − 2 A(2x2 + 2x + 1) + (Bx + C)(x − 1)
вильной дроби. =
2x3 − x − 1 (x − 1)(2x2 + 2x + 1)
416 Глава 7. ИНТЕГРАЛ

d y 2 + 41 1 dy
ˆ ˆ
Эти дроби совпадают, если у них совпадают чис-
+ 1 + 2 =
лители: 2
y +4 y=x+ 2 1
2 y 2 + 12 y=x+ 21
 
6x2 + x − 2 = A(2x2 + 2x + 1) + (Bx + C)(x − 1)
применяем x2
= формулы = + ln |x − 1|+
(7.1.35) и (7.1.42) 2
 
Теперь коэффициенты A, B, C ищем, комби- 1
нируя метод частных значений с методом неопре- + ln y 2 + + arctg(2y) +D =
4 y=x+ 21 y=x+ 12
деленных коэффициентов.  2 !
x2 1 1
= + ln |x − 1| + ln x+ + +
x=1: 5 = 5A 2 2 4
2  
x : 6 = 2A + B 1
0
+ arctg 2 x + +D =
x : −2=A−C 2
 
x2 1
Получается система = +ln |x−1|+ln x2 + x + +arctg(2x+1)+D
2 2
 

A = 1 
A = 1 (D – постоянная интегрирования).
2A + B = 6 ⇔ ... ⇔ B=4

 
 ⊲⊲ 7.1.57. Вычислите интегралы:
A − C = −2 C =3
x5 +x4 −8 x3 +x2 +x+3
´ ´
Значит, 1) x3 −4x d x; 4) (x+3)(x2 +x+1) d x;
3x3 +5x2 −25x−1 x9
´
2) d x;
´
(x+2)(x−1)2 5) (x4 −1)2 d x.
6x2 + x − 2 1 4x + 3 x5 −2x2 +3
= +
´
3) x2 −4x+4 d x;
2x3 − x − 1 x − 1 2x2 + 2x + 1
Отсюда Интегрирование рациональных тригоно-
метрических функций
2x4 + 5x2 − 2
= Рациональной функцией от двух переменных u и
2x3 − x − 1
v называется любая функция R(u, v), составлен-
6x2 + x − 2 1 4x + 3
=x+ 3 =x+ + 2 ная из u и v с помощью алгебраических операций
2x − x − 1 x − 1 2x + 2x + 1 +, −, ·, /. Например, функция
и теперь можно вычислять исходный интеграл:
3u2 v − 2uv 2 + 7v − 1
R(u, v) = √
2x4 + 5x2 − 2 v2 + 5
ˆ ˆ
d x = x d x+
2x3 − x − 1 является рациональной.
1 4x + 3
ˆ ˆ
+ dx + dx = Рациональной тригонометрической функци-
x−1 2x2 + 2x + 1 ей называется любая рациональная функция от
x2 2x + 23 переменных sin x и cos x, например,
ˆ
= + ln |x − 1| + dx =
2 x2 + x + 21
f (x) = R(sin x, cos x) =
x2
= + ln |x − 1|+ 3 sin2 x cos x − 2 sin x cos2 x + 7 cos x − 1
2 = √
2x + 32 cos2 x + 5
ˆ
+ 2 2 dx =
x2 + 2 · 21 x + 21 − 12 + 21 В этом пункте мы рассмотрим способы инте-
x2 2x + 32 грирования рациональных тригонометрических
ˆ
= + ln |x − 1| + 2 dx = функций.
2 x + 12 + 41
y = x + 12 x2
= 1 = + ln |x − 1|+ Универсальная тригонометрическая под-
x=y−2 2 становка Существует один универсальный
  
2 y − 21 + 32 1 x2 способ превратить интеграл от рациональной
ˆ
+ d y − = +
2
y +4 1 2 y=x+ 21
2 тригонометрической функции в интеграл от
обычной рациональной функции (который мы
2y + 21
ˆ
+ ln |x − 1| + dy = уже умеем вычислять). Он называется универ-
y 2 + 14 y=x+ 21
сальной тригонометрической подстановкой и
x2 2y d y состоит в следующем. Если необходимо вычис-
ˆ
= + ln |x − 1| + + лить интеграл
2 y 2 + 14 y=x+ 21
1 dy x2
ˆ ˆ
+ 1 = + ln |x − 1|+ R(sin x, cos x) d x
2 y 2 + 4 y=x+ 12 2
§ 1. Неопределенный интеграл 417

то сделать это можно заменой Частные тригонометрические подстанов-


 ки. Часто бывает, что универсальная триго-
x нометрическая подстановка приводит к слож-
x = 2 arctg t t = tg
2 ным выкладкам, которых можно избежать, ес-
тогда получится ли пользоваться другими подстановками. Такие
подстановки называются частными, и их имеет-
2t 1 − t2 2dt ся три:
sin x = , cos x = , dx =
1 + t2 1 + t2 1 + t2 — если функция R(sin x, cos x) нечетная относи-
Рассмотрим примеры. тельно синуса, то есть

⋄ 7.1.58. R(− sin x, cos x) = −R(sin x, cos x)

то применима подстановка
t = tg x2 ˆ 2dt
dx
ˆ
2t 1+t2 
= sin x = 1+t2 = 2t =  cos x = t
sin x 
dx = 1+t2dt
2
1+t2 sin x = √1 − t2 ,

ˆ
dt   (7.1.65)
= = ln |t| + C = квозвращаемся x = arccos t,

переменной x = 

t dt
dx = − √1−t
x 2

= ln tg +C
2 — если функция R(sin x, cos x) нечетная относи-
⋄ 7.1.59. тельно косинуса, то есть

R(sin x, − cos x) = −R(sin x, cos x)


t = tg x2 ˆ 2dt
dx
ˆ
1−t2 1+t2
= cos x = 1+t2 = 1−t2
= то применима подстановка
cos x 2dt
dx = 1+t 2
1+t2


 sin x = t
2dt 1+t
ˆ
= = ln +C cos x = √1 − t2 ,

1 − t2 1−t (7.1.66)
x = arcsin t,



⋄ 7.1.60. dt
dx = √1−t 2

t = tg x2 — если функция R(sin x, cos x) четная относи-


2t
dx sin x = 1+t тельно синуса и косинуса, то есть
ˆ
2
= 1−t2 =
8 − 4 sin x + 7 cos x cos x = 1+t 2
2dt R(− sin x, − cos x) = R(sin x, cos x)
d x = 1+t 2

ˆ 2dt то применима подстановка


1+t2
= 2t 1−t2
= 
8− 4 1+t 2 + 7 1+t2

 tg x = t,
ˆ
2dt 

 t
= = sin x = √1+t2 ,

8(1 + t2 ) − 8t + 7(1 − t2 ) 1
cos x = √1+t , (7.1.67)
2dt 2  2
ˆ ˆ
= = dt = 


 x = arctg t,
t2 − 8t + 15 (t − 3)(t − 5) 

здесь мы ”в уме”
! dt
dx = 1+t 2
раскладываем дробь
= =
под интегралом
на простейшие
⋄ 7.1.62.
ˆ    
1 1 подынтегральная
= − dt = ˆ 3
sin x функция нечетна 
t−5 t−3  относительно
  dx =  sin x  =
возвращаемся cos x − 3 поэтому используем
= ln |t−5|−ln |t−3|+C = = подстановку cos x = t
к переменной x √ 3 ˆ 2
1 − t2 dt t −1
ˆ
x x
= ln tg − 5 − ln tg − 3 + C =− √ = dt =
2 2 t−3 1 − t2 t−3
  ˆ  8

⊲⊲ 7.1.61. Найдите интегралы = делим многочлены
с остатком = t + 3 + dt =
t−3
t2  
dx sin x·cos x
+ 3t + 8 ln |t − 3| + C = квозвращаемся
´ ´
1) 5+4 sin x 4) (3+cos x)2 d x = переменной x =
´ dx sin x 2
2)
´
3 sin x−4 cos x 5) 1+tg x d x cos2 x
dx = + 3 cos x + 8 ln | cos x − 3| + C
´
3) 5+sin x+3 cos x 2
418 Глава 7. ИНТЕГРАЛ

1
ˆ
⋄ 7.1.63. = (cos(4x − 6x) − cos(4x + 6x)) d x =
  2
подынтегральная 1 1
ˆ ˆ
3 = cos 2x d x − cos 10x d x =
cos x функция нечетна 
ˆ
 относительно 2 2
dx =  cos x  =
sin4 x поэтому используем
1
ˆ
1
ˆ
подстановку sin x = t = cos 2x d(2x) − cos 10x d(10x) =
√ 3 4 20
1 − t2 dt 1 − t2
ˆ ˆ
= √ = dt = 1 1
t4 1 − t2 t4 = sin 2x − sin 10x + C
  4 20
1 1 1 1
ˆ
= − 2 dt = − 3 + + C = ⊲⊲ 7.1.67. Найдите интегралы
t 4 t 3t t 1) ´ cos x3 sin x4 d x
´
  1 1
возвращаемся
= к переменной x = − + +C 2) ´ cos 4x cos 7x d x
3 sin3 x sin x 3) ´ sin x3 sin x2 d x
⋄ 7.1.64. 4) ´ sin 3x cos 10x d x
5) sin 3x sin2 x d x
dx
ˆ
2 = Интегрирование функций sinα x·cosβ x Для
sin x − 4 sin x cos x + 5 cos2 x
  интегрирования таких произведений нужно за-
подынтегральная
 функция четна  помнить следующие правила:
= относительно sin x и cos x =
поэтому используем — если α – нечетное положительное целое число
подстановку tg x = t
(то есть α ∈ 2N − 1), то делается подстановка
ˆ dt
=  2
1+t2
 2 = 

 cos x = t,
√ t
sin x = √1 − t2 ,
t 1 1 
1+t2
− 4 · 1+t2 · 1+t2 + 5
√ √ √
1+t2
ˆ
dt
ˆ
dt (7.1.68)
= = = 
 x = arccos t,
t2 − 4t + 5 (t − 2)2 + 1 
 dt
d x = − √1−t 2
t−2=y dy
ˆ
= = =
t=y+2 y 2 + 1 y=t−2 — если β – нечетное положительное целое число
(то есть β ∈ 2N − 1), то делается подстановка
= arctg y + C = arctg(t − 2) + C =
y=t−2 
   sin x = t,
возвращаемся
= к переменной x = arctg(tg x − 2) + C 
 √
 cos x = 1 − t2 ,
(7.1.69)
⊲⊲ 7.1.65. Найдите интегралы 
 x = arcsin t,

 dt
1) ´ cos4 x sin3 x d x d x = √1−t
´
2
5 2
2) cos x sin x d x
´ sin3 x — если α + β – четное отрицательное целое чис-
3) 1+cos 2 dx
´ cos3 xx ло (α + β ∈ −2N), то делается подстановка
4) 4 sin2 x−1 d x 
dx 
tg x = t,
´
5) 3 cos2 x+4 sin2x


dx  t
´
6) 19 sin2 x−8 sin x cos x−3 sin x = √1+t2 ,

1
cos x = √1+t , (7.1.70)


2
Интегрирование тригонометрических про- 
 x = arctg t,


изведений  dt
dx = 1+t 2

Для интегрирования некоторых специальных


— если α и β – четные неотрицательные целые
тригонометрических функций полезно знать “до-
числа (α, β ∈ 2(N − 1)), то применяются фор-
полнительные хитрости”, которые мы обсудим в
мулы понижения степени:
этом параграфе.
1 − cos 2x 1 + cos 2x
sin2 x = , cos2 x =
Интегрирование функций sin ax·cos bx, sin ax· 2 2
⋄ 7.1.68. (7.1.71)
sin bx, cos ax · cos bx Для интегрирования таких
произведений применяются тригонометрические ˆ p поскольку
тождества (4.1.83)-(4.1.85). Рассмотрим приме- 3 2 3 β = 3 ∈ 2N − 1,
sin x cos x d x = подстановка =
ры. sin x = t
ˆ √ p 3 dt
⋄ 7.1.66.
3
= t2 1 − t2 √ =
1 − t2
ˆ ˆ ˆ  
2 2 8
sin 4x sin 6x d x = (4.1.83) = = t 3 (1 − t2 ) d t = t3 − t3 d t =
§ 1. Неопределенный интеграл 419

3 5 3 11  
= t 3 − t 3 + C = квозвращаемся Интегрирование некоторых алгебраиче-
переменной x =
5 11 ских иррациональностей.
3 5 3 11

= (sin x) 3 − (sin x) 3 + C = Интегрирование функций R(x, n x), n ∈ N.
5 11
3p3 3 p 3 Если R(x, y) – рациональная функция
√ от пере-
= sin5 x − sin11 x + C менных x и y, то функция R(x, n x) интегриру-
5 11
ется заменой
⋄ 7.1.69. √
t= nx (x = tn , d x = ntn−1 dt)
поскольку
ˆ
dx α + β = − 72 − 12 = ⋄ 7.1.72.
√ = = −4 ∈ −2N, =
cos7 x sin x подстановка √ √ 3
x ( 6 x)
ˆ ˆ
tg x = t
√3
d x = √ 4 dx =
ˆ dt ˆ dt x − x2 x − ( 6 x)
1+t2 1+t2
= r =  2 √ = t= 6x

7 t3
ˆ
√ 1 √ t
1
1+t2 t = x=t 6
= 6t5 dt =
1+t2 1+t2 dx = 6t5 dt t6 − t4
ˆ    
1 + t2 t4 делим
ˆ ˆ
1 3
= √ dt = t− 2 + t 2 d t = =6 d t = многочлены =
t t2 − 1 с остатком
   
2 5 1
ˆ
1
= 2t 2 + t 2 + C = квозвращаемся
переменной x = =6 2
t +1+ 2 dt =
5 q t −1
√ 2  
1
ˆ
= 2 tg x + tg5 x + C =6 2
t +1+ dt =
5 (t − 1)(t + 1)
 
раскладываем
⋄ 7.1.70. = на простейшие =
дроби
поскольку
ˆ  
2 1 1 1 1
α = 2 ∈ 2(N − 1), =6 t +1+ − dt =
ˆ
sin2 x cos4 x d x = β = 4 ∈ 2(N − 1), = 2t−1 2t+1
применяем формулы
(7.1.71) = 2t3 + 6t + 3 ln |t − 1| − 3 ln |t + 1| + C =
 2   √ 3 √
1 − cos 2x 1 + cos 2x = квозвращаемся
ˆ 6
переменной x = 2 x + 6 6 x+
= · dx =
2 2 √ √
+ 3 ln 6 x − 1 − 3 ln 6 x + 1 + C
1 − cos 2x 1 + 2 cos 2x + cos2 2x
ˆ
= · dx =
2 4 ⊲⊲ 7.1.73. Найдите интегралы
1
ˆ
√ √
= (1 + cos 2x − cos2 2x − cos3 2x) d x = 1)
´
√x
dx 3)
´ x
√ dx
8 1+ x 1+ 4 x
ˆ   ´ dx
=
1
1 + cos 2x −
1 + cos 4x

1 + cos 4x
= 2) √ √
8 2 2
cos 2x d x (1+ 3 x)· x
1
ˆ  q 
= (1 + cos 2x − cos 4x − cos 4x cos 2x) d x = Интегрирование функций R x, n ax+b
16 cx+d , n ∈
  N. Интегралы такого вида вычисляются заме-
применяем
= формулу (4.1.84) = ной
ˆ  
r
1 1 ax + b
= 1 + cos 2x − cos 4x − (cos 2x + cos 6x) d x = t= n
16 2 cx + d
1
ˆ
= (2 + cos 2x − 2 cos 4x − cos 6x) d x = ⋄ 7.1.74.
32
  q
1 1 1 1 r t= 1−x
= 2x + sin 2x − sin 4x − sin 6x + C = 1 1−x
ˆ 1+x
2
32 2 2 6 2
· dx = x = 1−t
1+t2
=
(1 − x) 1+x 4tdt
dx = − (1+t2 )2
x sin 2x sin 4x sin 6x
= + − − +C
16 64 64 192 1 4tdt
ˆ
=−  2 · t =
1−t 2 (1 + t2 )2
⊲⊲ 7.1.71. Найдите интегралы 1 − 1+t 2

(1 + t2 )2 4t2 dt dt 1
ˆ ˆ
1)
´
sin5 x cos4 x d x
´
6) √ dx =− 4 2 2
= − 2
= +C =
4
´ sin 3 x cos5 x 4t (1 + t ) t t
3
sin 5 x cos5 x d x 7) ´ cos2 x d x   r1 + x
´
2)
´ sin3 x 8) ´ cos4 x d x = квозвращаемся
переменной x = +C
3) √3 dx 1−x
cos4 x 9) ´sin4 x d x
dx
´
4) sin3 x cos x 10) ´ sin4 x cos2 x d x ⊲⊲ 7.1.75. Найдите интегралы
dx
´ √1+x
11) cos6 x d x
´
5) √
sin x cos3 x
1) x dx
420 Глава 7. ИНТЕГРАЛ

3
 p 
3x+4
´
2) √
1+ 3 3x+4
dx R x, x2 + a2 ,
q
1 1+x
´
3) (1−x)(1+x) 2 · 1−x dx  p 
´ q
3 1−x dx R x, x2 − a2
4) 1+x · (1+x)2

а затем делается тригонометрическая подстанов-


Интегрирование функций √ax2 +bx+c 1
После ка:
выделения полного квадрата под знаком радика-
— для
ла интегралы этого вида сводятся к следующим: ˆ  p 
R x, a 2 − x2 d x
— если a > 0, то получаем табличный ин-
теграл
1 используется подстановка
ˆ
√ dx
2
x +A
— если a < 0, то получаем табличный ин- x = a sin t (или x = a cos t)
теграл
1 — для
ˆ
√ dx ˆ  p 
B 2 − x2 R x, x2 + a2 d x
⋄ 7.1.76.
используется подстановка
dx 1 dx
ˆ ˆ
= √ q =
2x2 − x + 3 2 x2 − 12 x + 32 x = a tg t (или x = a ctg t)
1 dx t = x − 41
ˆ
= √ q  = x = t + 41 = — для
2 1 2
x − 4 + 16 23 dx = dt ˆ  p 
r R x, x2 − a2 d x
1 dt 1 23
ˆ
=√ q = √ ln t + t2 + +C = используется подстановка
2 2
t + 16 23 2 16
  a  a 
= квозвращаемся
переменной x =
x= или x =
cos t sin t
s 2
1 1 1 23 ⋄ 7.1.79.
= √ ln x − + x− + +C =
2 4 4 16
dx x = 3 sin t
ˆ
r √ = t = arcsin x3 =
1 1 1 3 2
(x + 16) 9 − x 2 dx = 3 cos tdt
= √ ln x − + x2 − x + +C
2 4 2 2 ˆ
3 cos tdt
= p =
⋄ 7.1.77. (9 sin t + 16) 9 − 9 sin2 t
2

3 cos tdt
ˆ
dx 1 dx = =
ˆ ˆ
2
√ =√ q = (9 sin t + 16)3 cos t
5 − 2x − 3x 2 3 5 2 2
3 − 3x − x применяем частную
подстановку (7.1.67)
dt
ˆ
1
1 dx t= 3 +x
ˆ
tg t = s
= √ q = x = t − 13 = = 2 = sin t = √ s 2
=
3 16 1
 2 dx = dt
9 sin t + 16 1+s

9 − 3 +x
ds
d t = 1+s 2

1 dt 1 3t ds
ˆ
ds
ˆ ˆ
=√ q  = √ arcsin + C = = 
1+s2
2 = =
3 4 2 2 3 4 9s 2 + 16(1 + s2 )
3 −t 9 √1+s s
+ 16
2
  1 1 + 3x
= квозвращаемся ds
ˆ
переменной x = √ arcsin +C = =
3 4 25s2 + 16
⊲⊲ 7.1.78. Найдите интегралы 1 ds 1 5s
ˆ
=  = arctg +C =
25 2 4 2 20 4
s + 5
1) √5x2dx dx
´ ´
2) √2+3x−2x  
+3x+2 2
1 5 tg t
= квозвращаемся
переменной t = arctg +C =
√  20 4
Интегрирование функций R x, ax2 + bx + c   1 5 tg arcsin x3
возвращаемся
Выделением полного квадрата √ и последующей
 = к переменной x = arctg +C =
20 4
заменой функция R x, ax2 + bx + c приводит- x

ся к виду 5q 3 x 2
 p  1 1−( 3 ) 1 5x
R x, a2 − x2 , = arctg +C = arctg √ +C
20 4 20 4 9 − x2
§ 1. Неопределенный интеграл 421

⋄ 7.1.80. ⊲⊲ 7.1.82. Найдите интегралы

x2 − x + 1 x = ctg t dx x2
ˆ ´ ´
√ d x = t = arcctg x = 1) 3 4) 3 dx
(9+x2 ) 2 (x2 +5) 2
(x2 + 1) x2 + 1 dx = − sindt
2t
dx dx
√ √
´ ´
2) 5)
ctg2 t − ctg t + 1 dt
ˆ
(5−x2 )3 (1+x+x2 )3
=− p · 2 = √ √
2 2 x2 −4
(ctg t + 1) ctg t + 1 sin t 1+x2
´ ´
3) x3 dx 6) 2+x2 d x
ctg2 t − ctg t + 1 dt
ˆ
dx
´
=− · 7) √ dx
1 1 2 = (x2 +4) 4x2 +1
2 ·
sin x sin x sin t
ˆ
= − (ctg2 t − ctg t + 1) sin x d t = Интегрирование функций xm · (a + bxn )p ,
m, n, p ∈ Q. Интегралы от таких функций вы-
 
заметим, что
= ctg2 t + 1 = 12 = ражаются через элементарные функции только
ˆ 
sin t
 если одно из чисел
1
=− − ctg t sin x d t = m+1 m+1
sin2 t p, , +p
ˆ   n n
1
=− − cos t d t = является целым. В соответствии с этим следует
sin t
  употреблять три различных подстановки:
dt первый интеграл
ˆ ˆ
=− + cos t d t = мы уже вычисляли = — если p целое отрицательное (p ∈ −N) и
sin t в примере 7.1.58
  m = qs , n = rs , то используется подста-
t
= − ln tg + sin t + C = квозвращаемся переменной x =
новка
2 x = ts
arcctg x
= − ln tg + sin arcctg x + C = — если m+1
n целое ( m+1
n ∈ Z), то исполь-
2
  зуется подстановка
применяем
= тригонометрические =
тождества a + bxn = t
1 p
= √ + ln x + 1 + x2 + C — если m+1 m+1
n + p целое ( n + p ∈ Z), то
1+x2
используется подстановка
⋄ 7.1.81.
ax−n + b = t
1
dx x = cos t
ˆ
√ = t = arccos 1
x = ⋄ 7.1.83.
(x2 + 2) x2 − 1 sin t
dx = cos 2 t dt ˆ
sin t 3
cos2 t d t cos t d t x3 (1 − x2 )− 2 d x =
ˆ ˆ
=  q = =
1
+ 2 1
− 1 1 + 2 cos2 t
2
cos t 2
cos t здесь m = 3, n = 2, p = − 23
и m+1
n =2∈Z
cos t d t ds
ˆ ˆ
= = sin t = s
= = = поэтому применяем =
2 ds = cos tdt подстановку
3ˆ− 2 sin t 3 − 2s2 t = 1 − x2 , xdx = − 12 dt
1 1  
применяем
1 1
ˆ ˆ
= q  d s = формулу (7.1.44) = − 32 3 1
2 3
2 =− (1 − t)t dt = − (t− 2 − t− 2 ) d t =
− s2 2 2
2  
q − 12 1 возвращаемся
3 = t + t + C = к переменной x =
2

1 2 +s
 
= √ ln q + C = квозвращаемся p
переменной t = 1
2 6 3
− s =√ + 1 − x2 + C
2 1 − x2
q
1
3
2 + sin t
  ⋄ 7.1.84.
= √ ln q + C = квозвращаемся
переменной x =
2 6 3
− sin t здесь m = 1, n = 4, p = 1
2
2 и m+1 +p=1∈Z
q ˆ p n
поэтому применяем
3 1 x 1 + x4 d x = =
2 + sin arccos x
подстановку
1 1
= √ ln q +C = t = x−4 + 1, x = (t − 1)− 4
2 6 3 1 5
2 − sin arccos x 4 dx = − 1 (t − 1)− 4 dt
q q q
1
ˆ
− 41 1 5
3
+ 1 − x12 =− (t − 1) 1 + (t − 1)− 4 ·4 (t − 1)− 4 dt =
1 2 4
= √ ln q q +C =
1 3p
ˆ
2 6 3
− 1 − 12
2 x =− (t − 1)− 2 1 + (t − 1)−1 d t =
√ √ √ 4
1 x 3 + 2 x2 − 1 √
1 t
ˆ
= √ ln √ √ √ +C =− − 32
(t − 1) √ dt =
2 6 x 3 − 2 x2 − 1 4 t−1
422 Глава 7. ИНТЕГРАЛ
√  
1 t возвращаемся
ˆ
=− − 23
(t − 1) √ dt = = =
к переменной x
4 t−1 √ √
√ √ 1 x−4 + 1 + 1 x−4 + 1
1 t y= t
ˆ
= ln √ + +C =
=− dt = t = y2 = 8 x−4 + 1 − 1 4x−4
4 (t − 1)2 dt = 2ydy

1 y 1 y2 1 1 + x4 + x2 x2 p
ˆ ˆ
=− 2 2
2ydy = − dy = = ln √ + 1 + x4 + C
4 (y − 1) 2 (y − 1)2
2 8 1+x −x4 2 4
 
= раскладываем дробь
на простейшие =
1
ˆ 1 1 1 1
! ⊲⊲ 7.1.85. Найдите интегралы
4 4 4 4
=− + − + dy =
2 y−1 (y − 1)2 y+1 (y + 1)2
1 1 1 1 √
x
r 3
= ln |y − 1| − + ln |y + 1| + +C =
´
8 8(y − 1) 8 8(y + 1) 1) √ 2 dx ´ 4 1
(1+ 3 x) 5) 1 + x2 dx
1 y+1 y 2
x√5 (1 + x2 ) 3
´
= ln
8 y−1
+ 2
4(y − 1)
+C = 2)

dx ´ √2− √
3 x

√ √ 3)
´ 4+ 3 x
√ dx 6) √
3
x
dx
  1 t+1 t
3 2
´ √ 3 √ p
x
= квозвращаемся = ln √ + +C = √ dx
´
переменной t
3
4) 3 x· 1 + 3 x2 d x 7) dx
8 t − 1 4(t − 1) x2 3
(1+x3 )2

§2 Определенный интеграл
Определенный интеграл функции f на отрезке [a; b] есть величина, геометрический смысл которой
– площадь криволинейной трапеции, ограничиваемой графиком функции f (при условии, что f
неотрицательна на [a; b]):

Точный смысл этих слов вряд ли может быть сейчас понятен читателю, поскольку в школьном
курсе геометрии не объясняется, что такое площадь фигуры (мы же даем соответствующие строгие
определения лишь в главе 15). Но всякий раз, когда вводится новое определение, полезно, чтобы
слушатель держал в голове какую-то геометрическую картинку, упрощающую понимание соот-
ветствующих формальных определений и математических результатов. В случае с определенным
интегралом такой картинкой, несомненно, будет площадь криволинейной трапеции (понимаемая
пока на интуитивном уровне).
В этой главе мы даем формальное определение этому новому понятию, приводим способ его
вычисления и описываем некоторые приложения.

(a) Определение определенного интеграла


Разбиения отрезка. Перед тем как давать определение определенному интегралу нужно проде-
лать некую предварительную работу – сказать несколько слов про разбиения отрезка.
Разбиением отрезка [a; b] называется произвольная конечная система точек {x0 ; x1 ; ...; xk } такая
что
a = x0 < x1 < x2 < ... < xk−1 < xk = b
Если нам дано какое-то разбиение {x0 ; x1 ; ...; xk }, то его удобно обозначать одной буквой, например,
τ:
τ = {x0 ; x1 ; ...; xk }
Наибольшее расстояние между соседними точками разбиения τ обозначается
diam τ = max (xi − xi−1 )
i=1,...,k

и называется диаметром разбиения τ = {x0 ; x1 ; ...; xk }.


§ 2. Определенный интеграл 423

⋄ 7.2.1. Система точек τ = {0; 12 ; 1; 2; 2} яв- ⊲ 7.2.2. Проверьте, что следующие системы то-
ляется разбиением отрезка [0; 2], потому что эти чек являются разбиениями данных отрезков и
числа образуют строго возрастающую конечную найдите диаметр этих разбиений:
последовательность, у которой концы совпадают 1) τ = {0; 32 ; 54 ; 11
5 ; 3}, [a; b] = [0; 3]
с концами отрезка [0; 2]: 2) τ = {−1; − 21 ; − 14 ; 0; 14 ; 21 ; 1}, [a; b] = [−1; 1]
√ √
1 √ 3) τ = {1; 2; 3; 2}, [a; b] = [1; 2]
0< <1< 2<2
2
Диаметр этого разбиения равен
 
1 1 √ √ √
diam τ = max ; ; 2 − 1; 2 − 2 = 2 − 2
2 2

Понятно, что у любого отрезка имеется много всяких разбиений. Поэтому можно рассматривать
последовательности разбиений.

⋄ 7.2.3. Рассмотрим, например, отрезок [0; 1] и ...


его разбиения:
Ясно, что для любого n точки τ (n) =
τ (1) = {0; 1} {0; n1 ; n2 ; ...; n−1
n ; 1} действительно являются раз-
  биением отрезка [0; 1]. Диаметр такого разбиения
1
τ (2) = 0; ; 1 равен
2 1
  diam τ (n) =
(3) 1 2 n
τ = 0; ; ; 1
3 3 Можно заметить, что при n → ∞ эта величина
... стремится к нулю:
 
(n) 1 2 n−1 1
τ = 0; ; ; ...; ;1 diam τ (n) = −→ 0
n n n n n→∞

• Последовательность разбиений τ (n) , у которой диаметр стремится к нулю

diam τ (n) −→ 0
n→∞

называется измельчающейся.

 n
⊲ 7.2.4. Проверьте, будут ли следующие после- 2) τ (n) = 0; 21n ; 22n ; ...; 2in ; ...; 2 2−1
n ;1

довательности разбиений отрезка [0; 1] измельча- n o


1 1 1
3) τ (n) = 0; 2n ; 2n−1 ; 2n−2 ; ...; n1 ; 1
ющимися:
n q q q o
4) τ (n) = 0; n1 ; n2 ; ...; n−1 ; 1
 n
1) τ (n) = 0; n1 ; n−1
n ;1 , n > 2 (здесь каждое n q q q o
(n) n 1 n 2 n n−1
разбиение состоит из четырех точек); 5) τ = 0; n ; n ; ...; n ;1

Определение определенного интеграла. Пусть функция f определена на отрезке [a; b] и пусть


дано разбиение этого отрезка τ = {x0 ; x1 ; ...; xk }. В каждом маленьком отрезке [xi−1 ; xi ] зафикси-
руем произвольную точку ξi ∈ [xi−1 ; xi ]. Такая система точек ξi называется системой выделенных
точек в данном разбиении τ . Рассмотрим сумму

k
X
f (ξi ) · ∆xi (где ∆xi = xi − xi−1 )
i=1
424 Глава 7. ИНТЕГРАЛ

Она называется интегральной суммой функции f , соответствующей разбиению τ = {x0 ; x1 ; ...; xk }


с выделенными точками ξi . Легко видеть, что эта величина равна площади ступенчатой фигуры,
построенной на точках ξi ∈ [xi−1 ; xi ]:

Представим теперь, что разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] меняются, становясь все более
мелкими. Тогда площадь ступенчатой фигуры должна приближаться к числу, которое естественно
считать "площадью криволинейной трапеции о которой мы говорили в начале этой главы.

Это число называется определенным интегралом функции f на отрезке [a; b]. Более точное опреде-
ление выглядит так:
• Число I называется определенным интегралом функции f на отрезке [a; b], и обозначается
ˆ
I= f (x) d x
[a,b]

если для всякой измельчающейся последовательности разбиений отрезка [a; b]


(n) (n) (n) (n)
τ (n) : a = x0 < x1 < ... < xk(n) −1 < xk(n) = b, diam τ (n) −→ 0
n→∞

и любой системы выделенных точек


(n) (n) (n)
ξi ∈ [xi−1 ; xi ]

соответствующие интегральные суммы стремятся к числу I:


(n)
k
X (n)
f (ξi ) · ∆xi −→ I
n→∞
i=1

Если такое число I существует, то функция f называется интегрируемой (по Риману) на


отрезке [a; b].
Это определение можно коротко записать в виде формулы:
ˆ k
X
f (x) d x = lim f ( ξi ) · ∆xi (7.2.72)
[a,b] diam {x0 ,...,xk }→0
i=1

[xi−1 ; xi ]

Ее удобно применять в случаях, когда не нужно следить за строгостью рассуждений.

Проверим, что в простейших случаях наше фигуры.


определение приводит к правильным результа-
там, то есть что, вычисляя интеграл, мы дей- ⋄ 7.2.5. Интеграл от константы. Рассмот-
ствительно получаем площадь соответствующей рим постоянную функцию f (x) = C и вычислим
определенный интеграл от нее на произвольном
§ 2. Определенный интеграл 425

отрезке [a; b]. Соответствующая картинка выгля- дей маленьких трапеций:


дит так:

Поскольку криволинейная трапеция в данном


случае представляет собой прямоугольник, ответ k
1 X f (xi−1 ) + f (xi )
нам известен заранее – интеграл должен быть ра- S= = · ∆xi =
вен C · (b − a). Проверим это: 2 i=1
2
k
X xi−1 + xi
= · ∆xi (7.2.74)
ˆ k
X i=1
2
f (x) d x = lim f (ξi ) · ∆xi =
[a,b] diam τ →0
i=1
Теперь мы получим
k
X k
X
= lim C · ∆xi = lim C· ∆xi =
diam τ →0 diam τ →0 Pk xi−1 +xi
i=1 i=1 · ∆xi
| {z } ξi i=1 2

=
(7.2.74)

=
b−a
k z }| {
z}|{
X 1
= lim C · (b − a) = C · (b − a) f (ξi ) ·∆xi − =
diam τ →0
i=1
2
k
X k
X
Запишем вывод: xi−1 + xi
= ξi · ∆xi − · ∆xi =
i=1 i=1
2
k  
ˆ
C d x = C · (b − a) (7.2.73) X xi−1 + xi
[a,b] = ξi − · ∆xi =
i=1
2
k
X
⋄ 7.2.6. Интеграл от линейной функции. 2ξi − xi−1 − xi
= · ∆xi =
Рассмотрим теперь функцию f (x) = x и вычис- i=1
2
лим определенный интеграл от нее на отрезке k
X (ξi − xi−1 ) + (ξi − xi )
[0; 1]. Соответствующая картинка выглядит так: = · ∆xi 6
i=1
2
6 (2.2.262) 6
k
X (ξi − xi−1 ) + (ξi − xi )
6 · ∆xi =
2 |{z}
i=1
6

0
k
X 1
= · (ξi − xi−1 ) + (ξi − xi ) · ∆xi 6
i=1
2
Криволинейная трапеция в данном случае
представляет собой треугольник, поэтому отве- 6 (3.1.10) 6
том должна быть площадь треугольника S = Xk
1  
1 1 6 · |ξi − xi−1 | + |ξi − xi | · ∆xi 6
2 · 1 · 1 = 2 (половина произведения основания на 2 | {z } | {z }
высоту). i=1
>

>

∆xi , ∆xi ,
Чтобы проверить это, возьмем какое-нибудь поскольку поскольку
разбиение τ = {x0 ; x1 ; ...; xk } отрезка [0; 1] и ξi ∈ [xi−1 ; xi ] ξi ∈ [xi−1 ; xi ]
какие-нибудь точки k
X k
X
∆xi + ∆xi
6 · ∆xi = ∆x ·∆xi 6
2 |{z}i
i=1 i=1
ξi ∈ [xi−1 ; xi ]
>

diam τ
k
X
Заметим, что тогда площадь нашего треугольни- 6 diam τ · ∆xi =
ка S = 21 можно представить, как сумму площа- i=1
426 Глава 7. ИНТЕГРАЛ

k
X Точки ξi ∈ [xi−1 ; xi ] можно выбирать по-
= diam τ · ∆xi = diam τ разному, но нас будут интересовать два способа:
i=1
| {z } – первый способ заключается в том, чтобы

=
1 в каждом отрезке [xi−1 ; xi ] выбрать какую-
нибудь рациональную точку ξi . Тогда полу-
Мы получили неравенство, справедливое для чится D(ξi ) = 1, и интегральные суммы ока-
любого разбиения τ = {x0 ; x1 ; ...; xk } отрезка жутся равны b − a:
[0; 1] и любых точек ξi ∈ [xi−1 ; xi ]:
k
X k
X
k
X 1 D(ξi ) · ∆xi = 1 · ∆xi = b − a
f (ξi ) · ∆xi − 6 diam τ
i=1
2 i=1 i=1

(n) (n) (n) – второй способ заключается в том, чтобы в


Если теперь τ (n) = {x0 ; x1 ; ...; xkn } – каждом отрезке [xi−1 ; xi ] выбрать какую-
какая-нибудь измельчающая последователь- нибудь иррациональную точку ξi . Тогда полу-
(n)
ность разбиений с выделенными точками ξi ∈ чится D(ξi ) = 0, и интегральные суммы ока-
(n) (n)
[xi−1 ; xi ], то мы получаем жутся равны 0:
(n)
k
X k k
(n) (n) 1 X X
f (ξi ) · ∆xi − 6 diam τ (n) −→ 0 D(ξi ) · ∆xi = 0 · ∆xi = 0
i=1
2 n→∞
i=1 i=1

Отсюда Если теперь взять измельчающуюся последо-


(n) (n) (n)
k(n) вательность разбиений τ (n) = {x0 ; x1 ; ...; xk }
X 1
(n)
f (ξi ) · ∆xi
(n)
− −→ 0 отрезка [a; b],
i=1
2 n→∞
diam τ (n) −→ 0
то есть n→∞
(n)
k
X (n) (n) 1 (n)
f (ξi ) · ∆xi −→ то выбрав точки ξi первым способом, мы полу-
n→∞ 2
i=1 чим, что интегральные суммы стремятся к числу
Это верно для любой измельчающейся последо- b − a:
(n) (n) (n)
вательности τ (n) = {x0 ; x1 ; ...; xk } разбиений (n)
k
X
отрезка [0; 1] и любой системы выделенных точек (n) (n)
(n) (n) (n) D(ξi ) · ∆xi = b − a −→ b − a
ξi ∈ [xi−1 ; xi ], значит число 21 действительно n→∞
´ i=1
является определенным интегралом [a,b] x d x.
Запишем вывод: а для второго способа получим, что они стремят-
ˆ 1 ся к нулю:
1
x dx =
0 2 k
X
(n)

(n) (n)
⋄ 7.2.7. Интеграл от функции Дирихле. По- D(ξi ) · ∆xi = 0 −→ 0
n→∞
i=1
кажем, что определенный интеграл не всегда су-
ществует. Классическим примером здесь являет- Спросим себя теперь: существует ли единое чис-
ся функция Дирихле, которую мы определили ло I, к которому бы стремились все интеграль-
выше формулой (3.1.4): ные суммы, независимо от того, какая выбрана
( измельчающаяся последовательность разбиений
1, если x – рациональное число (n)
D(x) = τ (n) = {x0 ; x1 ; ...; xk } и какие выбраны точки
0, если x – иррациональное число (n) (n) (n)
ξi ∈ [xi−1 ; xi ]? Понятно,´ что такого числа I
Попробуем понять, что будет интегралом этой (то есть интеграла [a,b] D(x) d x) не существует.
функции на произвольном отрезке [a; b]. Выбе- Значит, мы можем сделать
рем какое-нибудь разбиение τ = {x0 ; x1 ; ...; xk } Вывод: функция Дирихле не интегрируема
отрезка [a; b]. ни на каком отрезке [a; b].

(b) Когда существует определенный интеграл?


Из примера 7.2.7 видно, что не всякую функцию можно интегрировать. В этом пункте мы обсудим
вопрос о том, когда определенный интеграл существует.
§ 2. Определенный интеграл 427

Суммы Дарбу. Пусть функция f определена и ограничена на отрезке [a; b] и пусть τ = {x0 ; x1 ; ...; xk }
– какое-нибудь его разбиение. На каждом отрезке [xi−1 ; xi ] найдем нижнюю и верхнюю грань функ-
ции f
mi = inf f (ξ), Mi = sup f (ξ)
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]

и обозначим
k
X k
X
sτ = mi · ∆xi , Sτ = Mi · ∆xi
i=1 i=1

Поскольку f ограничена на [a; b], mi и Mi являются обычными числами, и поэтому sτ и Sτ тоже


являются числами, причем
s τ 6 Sτ (7.2.75)
• Величина sτ называется нижней, а величина Sτ – верхней суммой Дарбу (функции f на
отрезке [a; b] при разбиении τ ).
Перечислим главные

Свойства сумм Дарбу


10 . Если разбиение σ получено из разбиения τ добавлением новых точек

τ ⊆σ

то
s τ 6 s σ 6 Sσ 6 Sτ (7.2.76)
(то есть, при добавлении к данному разбиению τ новых точек нижняя сумма Дарбу
увеличивается, а верхняя уменьшается).
0
2 . Для любых двух разбиений σ и τ данного отрезка выполняется неравенство

s σ 6 Sτ (7.2.77)

(то есть, любая нижняя сумма Дарбу меньше любой верхней).


0
3 . Любая интегральная сумма лежит между нижней и верхней суммами Дарбу
k
X
sτ 6 f (ξi ) · ∆xi 6 Sτ (7.2.78)
i=1

причем нижняя сумма Дарбу есть нижняя грань всех интегральных сумм при данном
разбиении, а верхняя сумма Дарбу – верхняя грань:
k
X k
X
sτ = inf f (ξi ) · ∆xi , Sτ = sup f (ξi ) · ∆xi (7.2.79)
ξi ∈[xi−1 ;xi ] ξi ∈[xi−1 ;xi ] i=1
i=1

40 . Если функция f интегрируема на [a, b], то для произвольного разбиения τ отрезка [a, b]
интеграл от f лежит между нижней и верхней суммами Дарбу:
ˆ
sτ 6 f (x) d x 6 Sτ (7.2.80)
[a,b]

Доказательство. 1. Для доказательства 10 достаточно рассмотреть случай, когда к данному раз-


биению τ = {x0 ; x1 ; ...; xk } добавляется всего одна точка x∗ :

σ = τ ∪ {x∗ } = {x0 ; x1 ; ...; xk } ∪ {x∗ }

Тогда x∗ лежит в каком-то отрезке [xj−1 ; xj ]:

x∗ ∈ [xj−1 ; xj ] (7.2.81)

и поэтому
428 Глава 7. ИНТЕГРАЛ

k
X X X
sτ = mi · ∆xi = mj · ∆xj + mi · ∆xi = mj · (xj − xj−1 ) + mi · ∆xi = (7.2.81) =
i=1 i6=j i6=j
X
= inf f (ξ) ·(xj − x∗ ) + inf f (ξ) ·(x∗ − xj−1 ) + mi · ∆xi 6
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ]
| {z } | {z } i6=j

>

>
inf ξ∈[x∗ ,xj ] f (ξ), inf ξ∈[xj−1 ,x∗ ] f (ξ),
потому что потому что
[xj−1 ; xj ] ⊇ [x∗ , xj ] [xj−1 ; xj ] ⊇ [xj−1 , x∗ ]
X
6 inf

f (ξ) · (xj − x∗ ) + inf f (ξ) · (x∗ − xj−1 ) + mi · ∆xi = sσ
ξ∈[x ,xj ] ξ∈[xj−1 ,x∗ ]
i6=j

То есть, sτ 6 sσ . Аналогично доказывается. что Sτ > Sσ :

k
X X X
Sτ = Mi · ∆xi = Mj · ∆xj + Mi · ∆xi = Mj · (xj − xj−1 ) + Mi · ∆xi = (7.2.81) =
i=1 i6=j i6=j
X
= sup f (ξ) ·(xj − x∗ ) + sup f (ξ) ·(x∗ − xj−1 ) + Mi · ∆xi >
ξ∈[xj−1 ;xj ] ξ∈[xj−1 ;xj ] i6=j
| {z } | {z }
6

supξ∈[x∗ ,xj ] f (ξ), 6


supξ∈[xj−1 ,x∗ ] f (ξ),
потому что потому что
[xj−1 ; xj ] ⊇ [x∗ , xj ] [xj−1 ; xj ] ⊇ [xj−1 , x∗ ]
X
> sup f (ξ) · (xj − x∗ ) + sup f (ξ) · (x∗ − xj−1 ) + Mi · ∆xi = Sσ
ξ∈[xj−1 ;x∗ ] ξ∈[x∗ ;xj ] i6=j

Оставшееся неравенство в (7.2.76), sσ 6 Sσ , есть просто неравенство (7.2.75), в котором τ заменено


на σ.
2. Если σ и τ – два разбиения отрезка [a; b], то, добавлением новых точек, можно сделать из них
третье разбиение ρ, которое бы содержало и σ, и τ :

σ ⊆ ρ, τ ⊆ρ

Для него мы получим:


(7.2.76) (7.2.75) (7.2.76)
sσ 6 sρ 6 Sρ 6 Sτ
| {z } | {z }
σ⊆ρ ρ⊇τ

3. Неравенства (7.2.78) очевидны,


k
X k
X k
X
sτ = inf f (ζi ) · ∆xi 6 f (ξi ) · ∆xi 6 sup f (ζi ) · ∆xi 6 Sτ ,
ζi ∈[xi−1 ;xi ]
i=1 i=1 i=1 ζi ∈[xi−1 ;xi ]

и из них сразу следуют неравенства


k
X k
X
sτ 6 inf f (ξi ) · ∆xi , sup f (ξi ) · ∆xi 6 Sτ .
ξi ∈[xi−1 ;xi ] ξi ∈[xi−1 ;xi ] i=1
i=1

Поэтому, чтобы, например, доказать первое равенство в (7.2.79), достаточно доказать обратное
неравенство:
Xk
sτ > inf f (ξi ) · ∆xi (7.2.82)
ξi ∈[xi−1 ;xi ]
i=1

Для этого (зафиксировав разбиение τ = {x0 , ..., xk }) для каждого i = 1, ..., k выберем последова-
(n)
тельность точек ξi ∈ [xi−1 ; xi ] такую, что
(n)
f (ξi ) −→ inf f (ξi )
n→∞ ξi ∈[xi−1 ;xi ]

Тогда (7.2.82) получается так:


§ 2. Определенный интеграл 429

k
X k
X   k
X  
(n) (n)
inf f (ξi ) · ∆xi 6 inf f ξi · ∆xi = lim f ξi · ∆xi =
ξi ∈[xi−1 ;xi ] n→∞ n→∞
i=1 i=1 i=1
k
X   k
X
(n)
= lim f ξi · ∆xi = inf f (ξi ) · ∆xi = sτ
n→∞ ξi ∈[xi−1 ;xi ]
i=1 i=1

Второе равенство в (7.2.79) доказывается аналогично.


4. Для доказательства 40 , зафиксируем разбиение τ . Для всякого более мелкого разбиения σ ⊇ τ
и любой системы выделенных точек ξi разбиения σ мы получим:
(7.2.76) (7.2.78) k
X (7.2.78) (7.2.76)
sτ 6 sσ 6 f (ξi ) · ∆xi 6 Sσ 6 Sτ
i=1

Если теперь заморозить τ , а σ выбирать все более измельчающимся, то мы получим:


k
X
sτ 6 f (ξi ) · ∆xi 6 Sτ
i=1
| {z }
diam σ
↓ ↓
´ 0

[a,b]
f (x) d x

Отсюда и следует (7.2.80).


• Верхняя грань всех нижних сумм Дарбу для функции f на отрезке [a; b]
I∗ = sup sτ
τ

называется нижним интегралом Дарбу, а нижняя грань всех верхних сумм Дарбу
I ∗ = inf Sτ
τ

называется верхним интегралом Дарбу. Из неравенства (7.2.77) следует, что для любых
двух разбиений σ и τ данного отрезка выполняются неравенства
sσ 6 I∗ 6 I ∗ 6 Sτ (7.2.83)
Если вдобавок функция f интегрируема на [a, b], то эту цепочку можно дополнить так:
ˆ
sσ 6 I∗ 6 f (x) d x 6 I ∗ 6 Sτ (7.2.84)
[a,b]

⊲ 7.2.8. Найдите верхний и нижний интегра- и функции Дирихле (определенной формулой


лы Дарбу на отрезке [−1; 1] для функции сиг- (3.1.4)).
нум sgn x (определенной выше формулой (3.1.3))

Критерий интегрируемости.
Теорема 7.2.1 (критерий интегрируемости). 7 Ограниченная на отрезке [a; b] функция f тогда и
только тогда интегрируема на [a; b], когда для всякой измельчающейся последовательности τ (n)
разбиений отрезка [a; b]
diam τ (n) −→ 0
n→∞
соответствующие верхняя и нижняя суммы Дарбу стремятся друг к другу:
Sτ (n) − sτ (n) −→ 0 (7.2.85)
n→∞

В этом случае (для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b])
суммы Дарбу необходимо стремятся к интегралу от f на [a, b]:
ˆ
Sτ (n) −→ f (x) d x ←− sτ (n) (7.2.86)
n→∞ [a,b] ∞←n
7 Эта теорема используется ниже при доказательстве теорем 7.2.2 и 7.2.3.
430 Глава 7. ИНТЕГРАЛ

Доказательство. 1. Необходимость. Пусть f интегрируема на [a; b], покажем что тогда выполняется
(7.2.85). Возьмем какую-нибудь измельчающуюся последовательность разбиений τ (n) отрезка [a; b].
Из левой формулы (7.2.79)
Xk
sτ = inf f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ]
i=1
(n)
следует, что для всякого n можно выбрать точки ξi ∈ [xi−1 ; xi ] так, чтобы

Xk   1
(n)
sτ − f ξi · ∆xi 6
i=1
n

Тогда мы получим
k
X  
(n)
sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1

Теперь вспомним, что, по предположению, функция f интегрируема на [a; b], то есть существует
такое число I, что
Xk  
(n)
f ξi · ∆xi −→ I (7.2.87)
n→∞
i=1
(n)
для всякой измельчающейся последовательности τ (n) и любой системы точек ξi ∈ [xi−1 ; xi ]. В
частности, это должно быть верно для нашей последовательности τ (n) и выбранной нами системы
(n)
точек ξi ∈ [xi−1 ; xi ]. Отсюда
!
k
X   k
X  
(n) (n)
sτ (n) = sτ (n) − f ξi · ∆xi + f ξi · ∆xi −→ 0 + I = I
n→∞
i=1 i=1

Точно также из правой формулы (7.2.79)


k
X
Sτ = sup f (ξi ) · ∆xi ,
ξi ∈[xi−1 ;xi ] i=1

(n)
следует, что для всякого n можно выбрать (новые) точки ξi ∈ [xi−1 ; xi ] так, чтобы

Xk   1
(n)
Sτ − f ξi · ∆xi 6
i=1
n

Тогда мы получим
k
X  
(n)
Sτ (n) − f ξi · ∆xi −→ 0
n→∞
i=1

Поскольку функция f интегрируема, выполняется (7.2.87), значит


!
k
X   k
X  
(n) (n)
Sτ (n) = Sτ (n) − f ξi · ∆xi + f ξi · ∆xi −→ 0 + I = I
n→∞
i=1 i=1

Таким образом, мы получили, что

sτ (n) −→ I, Sτ (n) −→ I
n→∞ n→∞

откуда и следует (7.2.85):


Sτ (n) − sτ (n) −→ 0
n→∞

2. Докажем достаточность. Пусть для всякой измельчающейся последовательности τ (n) разбие-


ний отрезка [a; b]
diam τ (n) −→ 0
n→∞
§ 2. Определенный интеграл 431

соответствующие верхняя и нижняя суммы Дарбу стремятся друг к другу:

Sτ (n) − sτ (n) −→ 0
n→∞

Заметим, что тогда верхний и нижний интегралы Дарбу должны совпадать

I∗ = I ∗ ,

потому что из неравенств (7.2.83) следует

0 6 I ∗ − I∗ 6 Sτ (n) − sτ (n) −→ 0.
n→∞

Теперь положим
I = I∗ = I ∗
и покажем, что I является интегралом функции f на отрезке [a; b].
Для этого опять возьмем измельчающуюся последовательность τ (n) разбиений отрезка [a; b]. Из
неравенств (7.2.83) получаем две цепочки:

0 6 I − sτ (n) 6 Sτ (n) − sτ (n) 0 6 Sτ (n) − I 6 Sτ (n) − sτ (n)


| {z } | {z }
n n
↓ ↓ ↓ ↓
∞ ∞
0 0
⇓ ⇓
I − sτ (n) −→ 0 Sτ (n) − I −→ 0
n→∞ n→∞
⇓ ⇓
sτ (n) −→ I Sτ (n) −→ I
n→∞ n→∞

(n)
Теперь из формулы (7.2.78) при произвольном выборе точек ξi ∈ [xi−1 ; xi ] мы получаем
k
X (n) (n)
sτ (n) 6 f (ξi ) · ∆xi 6 Sτ (n)
| {z } | {z }
i=1
n n
↓ ↓ ↓ ↓
∞ ∞
I I

Последовательности по бокам этого двойного неравенства стремятся к I, значит, интегральная


сумма тоже стремится к I:
Xk
(n) (n)
f (ξi ) · ∆xi −→ I
n→∞
i=1

Это верно для всякой измельчающейся последовательности τ (n) разбиений отрезка [a; b] и любой
(n) (n) (n)
системы выделенных точек ξi ∈ [xi−1 ; xi ], значит I действительно является интегралом для f
на [a; b]. Это нам и нужно было доказать.

Ограниченность интегрируемой функции.


Теорема 7.2.2. Если функция f интегрируема на отрезке [a; b], то она ограничена на нем.
Доказательство. Докажем это утверждение в эквивалентной формулировке: если функция f (опре-
делена и) НЕ ограничена на отрезке [a; b], то она НЕ интегрируема на нем. Пусть функция f не
ограничена на отрезке [a; b]. Это означает, что она или неограничена сверху, или неограничена снизу:

sup f (x) = +∞ или inf f (x) = −∞


x∈[a;b] x∈[a;b]

Предположим, для определенности, что она неограничена сверху:

sup f (x) = +∞
x∈[a;b]

Зафиксируем какое-нибудь число M и возьмем произвольное разбиение τ = {x0 ; x1 ; ...; xk } отрезка


[a; b].
432 Глава 7. ИНТЕГРАЛ

Поскольку f неограничена на отрезке [a; b], она должна быть неограничена на каком-нибудь
отрезке [xi−1 ; xi ]. То есть, существует индекс j такой что

sup f (ξ) = +∞ (7.2.88)


ξ∈[xj−1 ;xj ]

Зафиксируем этот индекс j и выберем произвольным образом точки ξi ∈ [xi−1 ; xi ], i 6= j. Тогда в


интегральной сумме
Xk X
f (ξi ) · ∆xi = f (ξj ) · ∆xj + f (ξi ) · ∆xi
i=1 i6=j
P
величина i6=j f (ξi ) · ∆xi фиксирована, а слагаемое f (ξj ) · ∆xj – переменная, поскольку точка
ξj ∈ [xj−1 ; xj ] еще не выбрана. Из (7.2.88) следует, что недостающую точку ξj ∈ [xj−1 ; xj ] можно
выбрать так, чтобы вся сумма была больше числа M :
k
X X
f (ξi ) · ∆xi = f (ξj ) · ∆xj + f (ξi ) · ∆xi > M
i=1 i6=j

Мы получили, что для всякого разбиения τ = {x0 ; x1 ; ...; xk } отрезка [a; b] можно выбрать числа
ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M .
Значит, если взять измельчающуюся последовательность разбиений τ (n) , то для нее тоже можно
(n) (n) (n)
выбрать числа ξi ∈ [xi−1 ; xi ] так, чтобы интегральная сумма оказалась больше числа M :
(n)
k
X
f (ξi ) · ∆xi > M
i=1

Отсюда следует, что интеграл (то есть предел таких интегральных сумм), если он существует, не
может быть меньше M :
(n)
k
X
I = lim f (ξi ) · ∆xi > M
n→∞
i=1

Но число M мы выбирали произвольным: получается, что число I должно быть больше какого
хочешь другого числа M , а это абсурд.

Интегрируемость монотонной функции.

Теорема 7.2.3. Если функция f (определена и) монотонна на отрезке [a; b], то она интегрируема
на нем.

Доказательство. Пусть функция f (определена и) монотонна на отрезке [a; b], например, неубывает
на нем:
s 6 t =⇒ f (s) 6 f (t)
покажем, что тогда f интегрируема на [a; b]. Для этого возьмем какое-нибудь разбиение τ отрезка
[a; b] и покажем, что суммы Дарбу удовлетворяют неравенству:

Sτ − sτ 6 diam τ · {f (b) − f (a)} (7.2.89)

Действительно,

k
X k
X k
X k
X
Sτ −sτ = sup f (ξ) ·∆xi − inf f (ξ) ·∆xi = f (xi )·∆xi − f (xi−1 )·∆xi =
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1
| {z } i=1 | {z } i=1 i=1
k   k 
f xi , f xi−1 ,
поскольку f поскольку f
монотонно неубывает монотонно неубывает

k
X k
X k
X
= (f (xi ) − f (xi−1 )) · ∆xi 6 (f (xi ) − f (xi−1 )) · diam
| {z τ} = diam τ · (f (xi ) − f (xi−1 )) =
|{z}
i=1 i=1 не зависит i=1
>

от индекса i,
diam τ поэтому можно
вынести за знак суммы
§ 2. Определенный интеграл 433

f (b) сокращаются сокращаются сокращаются сокращаются


f (a)

=
n ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ o
= diam τ · f (xk ) − f (xk−1 ) + f (xk−1 ) − f (xk−2 ) + ... +f (x2 ) − f (x1 ) + f (x1 ) − f (x0 ) =
| {z } | {z } | {z } | {z }
i=k i=k−1 i=2 i=1
= diam τ · {f (b) − f (a)}

Если теперь взять измельчающуюся последовательность разбиений τ (n) отрезка [a; b], то мы полу-
чим
0 6 Sτ (n) − sτ (n) 6 (7.2.89) 6 diam τ (n) · {f (b) − f (a)} −→ 0
n→∞
значит,
Sτ (n) − sτ (n) −→ 0
n→∞

Это верно для любой измельчающейся последовательности разбиений τ (n) , значит, по теореме 7.2.1,
f интегрируема на [a; b].

Интегрируемость непрерывной функции.

Теорема 7.2.4. Если функция f (определена и) непрерывна на отрезке [a; b], то она интегрируема
на нем.

Для доказательства теоремы 7.2.4 нам понадобится следующая

Лемма 7.2.5. Если f – непрерывная функция на отрезке [a; b], то для любого разбиения τ отрезка
[a; b] существуют числа α, β ∈ [a; b], такие что расстояние между ними не превышает диаметра
разбиения τ
|α − β| 6 diam τ, (7.2.90)
а разность между верхней и нижней интегральными суммами Дарбу этого разбиения оценива-
ется неравенством:
Sτ − sτ 6 f (α) − f (β) · (b − a) (7.2.91)

Доказательство. По теореме Вейерштрасса об экстремумах 3.3.8, функция f достигает максимума


и минимума на каждом отрезке [xi−1 ; xi ], то есть существуют такие точки ηi , θi ∈ [xi−1 ; xi ], что

f (ηi ) = sup f (x) & f (θi ) = inf f (x) (7.2.92)


x∈[xi−1 ;xi ] x∈[xi−1 ;xi ]

Рассмотрим конечный набор чисел

f (η1 ) − f (θ1 ) , f (η2 ) − f (θ2 ) , ..., f (ηi ) − f (θi ) , ..., f (ηk ) − f (θk )

и выберем среди них максимальное: пусть соответствующий индекс обозначается j:

f (ηj ) − f (θj ) = max (f (ηi ) − f (θi )) (7.2.93)


i=1,2,...,k

Обозначив теперь
α = ηj , β = θj
мы получим нужные числа: с одной стороны, поскольку α, β ∈ [xj−1 ; xj ], получается
 
|α − β| 6 ∆xj 6 ∆ τ

А, с другой стороны,
!
 
f (α) − f (β) = max f (ηi ) − f (θi ) = max sup f (x) − inf f (x) (7.2.94)
16i6k 16i6k x∈[xi−1 ;xi ] x∈[xi−1 ;xi ]

Поэтому
434 Глава 7. ИНТЕГРАЛ

k k k
" #
X X X
Sτ −sτ = sup f (ξ)·∆xi − inf f (ξ)·∆xi = sup f (ξ) − inf f (ξ) ·∆xi 6
ξ∈[xi−1 ;xi ] ξ∈[xi−1 ;xi ]
i=1 ξ∈[xi−1 ;xi ] i=1 i=1 ξ∈[xi−1 ;xi ]
| {z }

>
(7.2.94)
f (α) − f (β)
Xk h i h i k
X h i
6 f (α) − f (β) ·∆xi = f (α) − f (β) · ∆xi = f (α) − f (β) · (b − a)
i=1 | {z } i=1
не зависит
| {z }
от индекса i длина отрезка [a,b]

Доказательство теоремы 7.2.4. Пусть τ (n) – измельчающаяся последовательность разбиений от-


резка [a; b]:
diam τ (n) −→ 0
n→∞
(n) (n)
По лемме 7.2.5, найдутся числа α ,β ∈ [a, b] такие, что

|α(n) − β (n) | 6 diam τ (n)

и h i
Sτ (n) − sτ (n) 6 f (α(n) ) − f (β (n) ) · (b − a)

Из первого условия следует, что последовательности α(n) и β (n) стремятся друг к другу:

α(n) − β (n) −→ 0
n→∞

Поэтому по теореме Кантора 3.3.10 (функция f непрерывна на [a; b], значит она должна быть
равномерно непрерывна на нем), получаем:

f (α(n) ) − f (β (n) ) −→ 0
n→∞

Отсюда уже следует


h i
0 6 Sτ (n) − sτ (n) 6 f (α(n) ) − f (β (n) ) · (b − a) −→ 0 =⇒ Sτ (n) − sτ (n) −→ 0
n→∞ n→∞

Это верно для любой измельчающейся последовательности разбиений τ (n) , значит, по теореме 7.2.1,
f интегрируема на [a; b].

(c) Свойства определенного интеграла

Свойства определенного интеграла


10 . Линейность: если функции f и g интегрируемы на отрезке [a; b] то для любых чисел
α, β ∈ R функция α · f + β · g тоже интегрируема на отрезке [a; b], причем
ˆ   ˆ ˆ
α · f (x) + β · g(x) d x = α · f (x) d x + β · g(x) d x (7.2.95)
[a,b] [a,b] [a,b]

20 . Аддитивность: пусть a < b < c и функция f интегрируема на отрезках [a; b] и [b; c],
тогда она интегрируема на отрезке [a; c], и при этом
ˆ ˆ ˆ
f (x) d x + f (x) d x = f (x) d x (7.2.96)
[a,b] [b,c] [a,c]

30 . Монотонность: если функции f и g интегрируемы на отрезке [a; b] и при этом

f (x) 6 g(x), x ∈ [a; b] (7.2.97)

то ˆ ˆ
f (x) d x 6 g(x) d x (7.2.98)
[a,b] [a,b]
§ 2. Определенный интеграл 435

40 . Выпуклость: если функция f интегрируема на отрезке [a; b], то функция |f | тоже


интегрируема на отрезке [a; b], и при этом
ˆ ˆ
f (x) d x 6 |f (x)| d x (7.2.99)
[a,b] [a,b]

50 . Оценка сверху: если функция f интегрируема на отрезке [a; b], то


ˆ
f (x) d x 6 (b − a) · sup |f (x)| (7.2.100)
[a,b] x∈[a,b]

60 . Непрерывность: если функция f интегрируема на отрезке [a; b], то для всякой точки
c ∈ [a, b]
ˆ ˆ
f (x) d x −→ f (x) d x (7.2.101)
[a,y] y→c [a,c]
ˆ ˆ b
f (x) d x −→ f (x) d x (7.2.102)
[y,b] y→c c

70 . Теорема о среднем: если функция f непрерывна на отрезке [a; b], то найдется такая
точка ξ ∈ [a; b], что ˆ
f (x) d x = f (ξ) · (b − a) (7.2.103)
[a,b]

80 . Интегрируемость произведения: если функции f и g интегрируемы на отрезке [a; b],


то их произведение f · g – тоже интегрируемая функция на отрезке [a; b].
90 . Замена переменной: пусть
1) функция f интегрируема на отрезке [a; b], и
2) функция ϕ определена на отрезке [α; β] и обладает свойствами:
a) ϕ – гладкая на отрезке [α; β];
b) ϕ – строго монотонная на отрезке [α; β];
c) ϕ сюръективно отображает отрезок [α; β] на отрезок [a; b]:
 
ϕ [α; β] = [a, b],

тогда функция (f ◦ ϕ) · ϕ′ интегрируема на отрезке [α, β], и


ˆ ˆ
f (x) d x = f (ϕ(t)) · |ϕ′ (t)| d t (7.2.104)
[a,b] [α,β]

Доказательство. 1. Линейность. Пусть функции f и g интегрируемы на отрезке [a; b], и


ˆ ˆ
F = f (x) d x, G= g(x) d x
[a,b] [a,b]

Для всякого разбиения τ = {x0 , ..., xk } отрезка [a; b] и любой системы выделенных точек ξi ∈
[xi−1 ; xi ] мы получим:
k 
X  k
X k
X
α · f (ξi ) + β · g (ξi ) · ∆xi = α · f (ξi ) · ∆xi +β · g (ξi ) · ∆xi −→ α·F +β·G
diam τ →0
i=1 i=1 i=1
| {z } | {z }
diam τ diam τ
↓ ↓ ↓ ↓
0 0
F F

Это нужно понимать так: если взять последовательность разбиений τ (n) , диаметры которых стре-
(n)
мятся к нулю, то какую ни выбирай систему выделенных точек ξi , интегральная сумма функции
436 Глава 7. ИНТЕГРАЛ

α·f +β ·g будет стремится к числу α·F +β ·G. То есть, функция α·f +β ·g получается интегрируемой,
и ˆ   ˆ ˆ
α · f (x) + β · g(x) d x = α · F + β · G = α · f (x) d x + β · g(x) d x
[a,b] [a,b] [a,b]

2. Аддитивность. Пусть f интегрируема на отрезках [a; b] и [b; c]. Тогда по теореме 7.2.2, f огра-
ничена на отрезках [a; b] и [b; c], а значит и на отрезке [a; c]:

∃M ∈ R ∀x ∈ [a; c] |f (x)| 6 M (7.2.105)

Обозначим через A и B интегралы по отрезкам [a; b] и [b; c]


ˆ ˆ
A= f (x) d x, B = f (x) d x
[a,b] [b,c]

Нам нужно показать, что f интегрируема на [a; c], причем


ˆ
f (x) d x = A + B
[a,c]

Возьмем разбиение τ = {x0 , ..., xk } отрезка [a; c]. Точка b попадет в какой-то полуинтервал (xj−1 , xj ]:

τ = {a = x0 < x1 < ... < xj−1 < b 6 xj < xj+1 < ... < xk = c}

Запомним этот индекс j и выберем произвольные точки ξi ∈ [xi−1 ; xi ]. Тогда:

интегральная сумма
на отрезке [a; c]
z }| {
X k j−1
X k
X
f (ξi ) · ∆xi = f (ξi ) · ∆xi + f (ξj ) · ∆xj + f (ξi ) · ∆xi =
i=1 i=1 i=j+1
j−1
X   k
X
= f (ξi ) · ∆xi + f (b) + f (ξj ) − f (b) · ∆xj + f (ξi ) · ∆xi =
i=1 i=j+1
j−1
X k
X  
= f (ξi ) · ∆xi + f (b) · ∆xj + f (ξi ) · ∆xi + f (ξj ) − f (b) · ∆xj =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · (xj − xj−1 ) + f (ξi ) · ∆xi + [f (ξj ) − f (b)] · ∆xj =
i=1 i=j+1
j−1
X k
X
= f (ξi ) · ∆xi + f (b) · (b − xj−1 ) + f (b) · (xj − b) + f (ξi ) · ∆xi + [f (ξj ) − f (b)] · ∆xj
i=1 i=j+1
| {z } | {z }
интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]

интегральная сумма
на отрезке [a; c] интегральная сумма на отрезке [a; b] интегральная сумма на отрезке [b; c]
z }| z }| {
z
k
}| {
j−1
!{ k
X X X
f (ξi ) · ∆xi − f (ξi ) · ∆xi + f (b) · (b − xj−1 ) − f (b) · (xj − b) + f (ξi ) · ∆xi  =
i=1 i=1 i=j+1
| {z } | {z }
diam τ
diam τ
↓ ↓
↓ ↓
0
0
A B
 
= f (ξj ) − f (b) · ∆xj 6 f (ξj ) + f (b) · ∆xj 6 2M · diam τ −→ 0
| {z } | {z } |{z} diam τ →0
>
>

>

M M diam τ


§ 2. Определенный интеграл 437

k
X
f (ξi ) · ∆xi −→ A+B
diam τ →0
i=1

Опять же, это нужно понимать так, что какую ни возьми последовательность разбиений τ (n) от-
(n)
резка [a, c], с диаметрами стремящимися к нулю, то при любом выборе выделенных точек ξi ,
интегральные суммы функции f на отрезке [a, c] будут стремиться к числу A + B. Это нам и нужно
было доказать.
3. Монотонность. Пусть функции f и g интегрируемы на отрезке [a; b], причем

f (x) 6 g(x), x ∈ [a; b]

Тогда для любых разбиений τ = {x0 , ..., xk } отрезка [a; c] и любых точек ξi ∈ [xi−1 ; xi ] мы получим

∀i f (ξi ) 6 g (ξi )


∀i f (ξi ) · ∆xi 6 g (ξi ) · ∆xi

ˆ k
X k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 g (ξi ) · ∆xi −→ g(x) d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1


ˆ ˆ
f (x) d x 6 g(x) d x
[a,b] [a,b]

4. Выпуклость. Здесь при доказательстве используются свойства точных граней функции, о


которых мы говорили на с.196. Сначала нужно доказать следующее неравенство, связывающее
верхние и нижние суммы Дарбу для f и |f |:

Sτ (|f |) − sτ (|f |) 6 Sτ (f ) − sτ (f ) (7.2.106)

Действительно:

k
!
X
Sτ (|f |) − sτ (|f |) = sup |f (η)| − inf |f (θ)| · ∆xi = (3.1.26) =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
!
k
X   k
X  
= sup |f (η)| + sup − |f (θ)| · ∆xi = sup |f (η)| − |f (θ)| · ∆xi 6
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
6 (3.1.11) 6 sup |f (η) − f (θ)| · ∆xi = (3.1.29) = sup (f (η) − f (θ)) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
!
k
X  
= sup f (η) + sup − f (θ) · ∆xi = (3.1.26) =
i=1 η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
k
!
X
= sup f (η) − inf f (θ) · ∆xi = Sτ (f ) − sτ (f )
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1

Если теперь функция f интегрируема на отрезке [a; b], то по критерию интегрируемости (теоре-
ма 7.2.1 этой главы), для любой измельчающейся последовательности τ (n) разбиений отрезка [a; b]
разность между верхними и нижними суммами Дарбу для функции f должна стремиться к нулю,
поэтому из (7.2.106) получаем:

0 6 Sτ (n) (|f |) − sτ (n) (|f |) 6 Sτ (n) (f ) − sτ (n) (f ) −→ 0


n→∞

откуда
Sτ (n) (|f |) − sτ (n) (|f |) −→ 0
n→∞
438 Глава 7. ИНТЕГРАЛ

То есть функция |f | тоже должна быть интегрируема на отрезке [a; b]. Нам остается доказать нера-
венство (7.2.99):
ˆ k
X k
X ˆ
f (x) d x ←− f (ξi ) · ∆xi 6 (2.2.262) 6 |f (ξi )| · ∆xi −→ |f (x)| d x
[a,b] 0←diam τ diam τ →0 [a,b]
i=1 i=1


ˆ ˆ
f (x) d x 6 |f (x)| d x
[a,b] [a,b]

5. Оценка сверху. Если функция f интегрируема на отрезке [a, b], то по теореме 7.2.2, она огра-
ничена. Обозначим C = supx∈[a,b] |f (x)|. Тогда
ˆ ˆ ˆ
f (x) d x 6 (7.2.99) 6 |f (x)| d x 6 C d x = (7.2.73) = (b − a) · C
[a,b] [a,b] [a,b]
| {z }
⇑ (7.2.98)
|f (x)| 6 C

6. Непрерывность. Из двух формул (7.2.101) и (7.2.102) мы докажем первую, имея в виду, что
вторая доказывается по аналогии:
ˆ ˆ
f (x) d x −→ f (x) d x
[a,y] y→c [a,c]

Ее, в свою очередь можно разбить на два односторонних предела,


ˆ ˆ ˆ ˆ
f (x) d x −→ f (x) d x, f (x) d x −→ f (x) d x,
[a,y] y→c−0 [a,c] [a,y] y→c+0 [a,c]

и доказать, например, второй, заявив, что первый доказывается аналогично:


ˆ ˆ ˆ y
f (x) d x − f (x) d x = f (x) d x 6 (7.2.100) 6 (y − c) · sup |f (x)| −→ 0
[a,y] [a,c] c | {z } x∈[c,y] y→c+0
| {z } ↓ | {z }
=

0
>

(7.2.96)
f (x) d x + cy f (x) d x
´ ´
[a,c] supx∈[c,y] |f (x)|
>

теорема 7.2.2

7. Теорема о среднем. Пусть f непрерывна на отрезке [a; b]. Тогда по теореме Вейерштрасса об
экстремумах (теорема 3.3.8), найдутся такие точки α, β ∈ [a; b], что

∀x ∈ [a; b] f (α) 6 f (x) 6 f (β)

Теперь по уже доказанному свойству монотонности 30 ,


ˆ ˆ ˆ
f (α) d x 6 f (x) d x 6 f (β) d x
[a,b] [a,b] [a,b]

Вспомнив теперь (7.2.73), получаем


ˆ
f (α) · (b − a) 6 f (x) d x 6 f (β) · (b − a)
[a,b]

откуда
1
ˆ
f (α) 6 · f (x) d x 6 f (β)
b−a [a,b]
1
´
Таким образом, число M = b−a · [a,b] f (x) лежит между значениями f (α) и f (β) непрерывной
функции f на отрезке [α; β]. Значит, по теореме Коши о промежуточном значении (теорема 3.3.6),
найдется точка ξ ∈ [α; β] ⊆ [a; b] такая что
1
ˆ
f (ξ) = · f (x) d x
b − a [a,b]
§ 2. Определенный интеграл 439

Отсюда и получается (7.2.103): ˆ


f (x) d x = f (ξ) · (b − a)
[a,b]

8. Произведение интегрируемых функций. Пусть функции f и g интегрируемы на отрезке [a; b].


Тогда по теореме 7.2.2 они должны быть ограничены на [a; b]:

∃A, B ∈ R ∀x ∈ [a; b] |f (x)| 6 A, |g(x)| 6 B

Заметим, что для любых η, θ ∈ [a, b] выполняется неравенство

|f (η) · g(η) − f (θ) · g(θ)| 6 B · |f (η) − f (θ)| + A · |g(η) − g(θ)| (7.2.107)

Действительно,

|f (η) · g(η) − f (θ) · g(θ)| = |f (η) · g(η) − f (θ) · g(η) + f (θ) · g(η) − f (θ) · g(θ)| 6
6 |f (η) · g(η) − f (θ) · g(η)| + |f (θ) · g(η) − f (θ) · g(θ)| = |f (η) − f (θ)| · |g(η)| + |f (θ)| · |g(η) − g(θ)| 6
6 |f (η) − f (θ)| · B + A · |g(η) − g(θ)|

Теперь, чтобы доказать, что f · g интегрируема на [a; b], возьмем разбиение τ отрезка [a; b] и оценим
разность между верхними и нижними суммами Дарбу для функции f (x) · g(x):

k
!
X
Sτ (f · g) − sτ (f · g) = sup f (η) · g(η) − inf f (θ) · g(θ) · ∆xi =
η∈[xi−1 ;xi ] θ∈[xi−1 ;xi ]
i=1
k
X
= sup f (η) · g(η) − f (θ) · g(θ) · ∆xi 6 (7.2.107) 6
i=1 η,θ∈[xi−1 ;xi ]
k
X  
6 sup B · f (η) − f (θ) + A · g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ]
k
X k
X
=B· sup f (η) − f (θ) · ∆xi + A · sup g(η) − g(θ) · ∆xi =
i=1 η,θ∈[xi−1 ;xi ] i=1 η,θ∈[xi−1 ;xi ]
   
= B · Sτ (f ) − sτ (f ) +A · Sτ (g) − sτ (g) −→ 0
| {z } | {z } diam τ →0
←−

←−

diam τ diam τ
↓ ↓
0 0
0, 0,
поскольку f поскольку g
интегрируема интегрируема

9. Замена переменной. Пусть функции f : [a, b] → R и ϕ : [α, β] → [a, b] обладают свойствами,


описанными на с.435. Поскольку f интегрируема, по теореме 7.2.2 должна быть конечна величина

M = sup |f (x)|
x∈[a,b]

Далее, функция ϕ строго монотонна, значит она либо возрастает, либо убывает. Будем считать для
начала, что ϕ возрастает. Тогда

ϕ(α) = a, ϕ(β) = b, ϕ′ (x) > 0, x ∈ [α, β]

Рассмотрим произвольное разбиение τ = {t0 , ..., ti , ..., tk } отрезка [α, β] с выделенной системой точек
ζi ∈ [ti−1 , ti ]. Положив xi = ϕ(ti ) и ξi = ϕ(ζi ), мы получим разбиение отрезка [a, b], причем по
теореме Лагранжа 5.1.7, для некоторых точек ηi ∈ [ti−1 , ti ] будет выполняться равенство

∆xi = xi − xi−1 = ϕ(ti ) − ϕ(ti−1 ) = (5.1.33) = ϕ′ (ηi ) · (ti − ti−1 ) = ϕ′ (ηi ) · ∆ti

Если теперь взять ε > 0, то по теореме Кантора 3.3.10 найдется δ > 0 такое, что для любых
s, t ∈ [α, β] выполняется импликация:
ε
|s − t| < δ =⇒ |ϕ′ (s) − ϕ′ (t)| <
M · (β − α)
440 Глава 7. ИНТЕГРАЛ

Поэтому если диаметр разбиения τ меньше δ, мы получим

k
X Xk Xk
 
f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6
| {z } | {z } |{z}
i=1 i=1 i=1

=
=
= ϕ′ (ζi ) ϕ′ (ηi ) · ∆ti
f (ξi )
k
X Xk
ε
6 |f (ξi )| · ϕ′ (ζi ) − ϕ′ (ηi ) ·∆ti < M · · ∆ti = ε
| {z } | {z } M · (β − α) i=1
i=1
| {z }

>

>
supx∈[a,b] |f (x)| ε

=
M ·(β−α)

=
β−α
M

Это означает, что при стремлении к нулю диаметра разбиения τ отрезка [α, β] интегральные суммы
стремятся друг к другу:
k
X k
X

f ϕ(ζi ) · ϕ′ (ζi ) · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1

С другой стороны, диаметр соответствующего разбиения ϕ(τ ) = {x0 , ..., xk } отрезка [a, b] тоже при
этом будет стремиться к нулю, потому что

diam ϕ(τ ) = max ∆xi = max ϕ′ (ηi ) · ∆ti 6 max ϕ′ (t) · max ∆ti = max ϕ′ (t) · diam τ −→ 0
i i t∈[α,β] i t∈[α,β] diam τ →0

Pk ´
Значит интегральные суммы i=1 f (ξi ) · ∆xi должны стремиться к интегралу [a,b] f (x) d x, и мы
получаем:
Xk k
X

f ϕ(ζi ) · ϕ′ (ζi ) · ∆ti − f (ξi ) · ∆xi −→ 0
diam τ →0
i=1 i=1
| {z }
diam ϕ(τ )
↓ ↓
´ 0
[a,b]
f (x) d x

То есть
k
X 
ˆ
f ϕ(ζi ) · ϕ′ (ζi ) · ∆ti −→ f (x) d x
diam τ →0 [a,b]
i=1

Остается рассмотреть случай, когда ϕ убывает. Тогда возрастающая последовательность

α = t0 < ... < ti < ... < tk = β

превращается в убывающую
b = x0 > ... > xi > ... > xk = a
Поэтому в интегральной сумме величину ∆xi нужно определять как разность xi−1 − xi , чтобы она
получилась положительной:
   
∆xi = − xi − xi−1 = − ϕ(ti ) − ϕ(ti−1 ) = (5.1.33) = −ϕ′ (ηi ) · (ti − ti−1 ) = −ϕ′ (ηi ) · ∆ti

Вдобавок, поскольку ϕ убывает, ее производная должна быть отрицательной

ϕ′ (t) 6 0 =⇒ |ϕ′ (ζi )| = −ϕ′ (ζi )

и в вычислениях мы получим
k
X Xk k
X
 
f ϕ(ζi ) · |ϕ′ (ζi )| ·∆ti − f (ξi ) · ∆xi = − f (ξi ) · ϕ′ (ζi ) − ϕ′ (ηi ) · ∆ti 6 ... < ε
| {z } | {z } |{z}
i=1 i=1 i=1
=
=
=

f (ξi )

−ϕ (ζi ) −ϕ′ (ηi ) · ∆ti

Таким образом, после взятия модуля ничто не меняется, и все рассуждения можно оставить преж-
ними.
§ 3. Формула Ньютона-Лейбница 441

§3 Формула Ньютона-Лейбница
Между двумя независимыми на первый взгляд понятиями – производной и определенным интегра-
лом, – как оказывается, существует глубокая связь. Эта связь устанавливается знаменитой форму-
лой Ньютона-Лейбница, которая считается главной в интегральном исчислении. Здесь мы погово-
рим об этой формуле.

(a) Основные результаты


Гладкие функции и интеграл с переменным верхним пределом на отрезке.
• Функция h называется гладкой на отрезке [a; b], если она дифференцируема на [a; b] (в
смысле определения на с.399), и ее производная h′ на этом отрезке (определенная фор-
мулой (7.1.26)) непрерывна на [a; b]. Класс всех гладких функций на [a; b] обозначается
символом C 1 [a, b]. Из предложения 7.1.4 следует, что любая гладкая функция автомати-
чески непрерывна, то есть выполняется включение:

C 1 [a, b] ⊂ C[a, b] (7.3.108)

Теорема 7.3.1 (об интеграле с переменным верхним пределом). Пусть функция f непрерывна на
отрезке [a; b], тогда функция ˆ
F (x) = f (t) d t (7.3.109)
[a,x]

является гладкой на [a; b] и будет первообразной для f на [a; b]:

F ′ (c) = f (c), c ∈ [a, b]. (7.3.110)

! 7.3.1. В соответствии с определением производной на отрезке формулой (7.1.26), соотношение


(7.3.110) следует понимать так:
— для точек внутри отрезка [a; b] эта формула расшифровывается как равенство
!
1
ˆ ˆ
F ′ (c) = lim f (t) d t − f (t) d t = f (c), c ∈ (a; b) (7.3.111)
x→c x − c [a,x] [a,c]

— а на концах отрезка [a; b] имеются в виду односторонние производные:

1
ˆ
F+′ (a) = lim f (t) d t = f (a), (7.3.112)
x→a+0 x − a [a,x]

!
b
1 1
ˆ ˆ ˆ
F−′ (b) = lim f (t) d t − f (t) d t = lim f (t) d t = f (b).
x→b−0 x − b [a,x] [a,b] x→b−0 b − x x
(7.3.113)

Доказательство. Заметим сразу, что здесь достаточно доказать тождество (7.3.110), потому что
остальное – то есть утверждение, что функция F является гладкой – будет следовать из (7.3.110) и
того факта, что f непрерывна. В свою очередь (7.3.110) разбивается на условия (7.3.111)-(7.3.113),
и каждое нужно проверить. Зафиксируем для этого какую-нибудь точку c ∈ [a; b] и найдем в ней
производную функции F . Нам придется рассмотреть несколько случаев.
1. Пусть для начала точка c лежит внутри отрезка [a; b], то есть a < c < b. Чтобы найти
производную функции F (x) в точке c,

F (x) − F (c)
F ′ (c) = lim ,
x→c x−c
вычислим по отдельности правый и левый пределы в этой точке.
a) Пусть x > c, то есть a < c < x < b. Тогда
(ˆ )
F (x) − F (c) 1
ˆ
= f (t) d t − f (t) d t =
x−c x−c [a,x] [a,c]
442 Глава 7. ИНТЕГРАЛ
(ˆ )
1
ˆ ˆ
= f (t) d t + f (t) d t − f (t) d t =
x−c [a,c] [c,x] [a,c]

1 1
ˆ
= · f (t) d t = · f (ξ) · (x − c) = f (ξ) −→ f (c)
x−c [c,x] x−c x→c+0
| {z } | {z }

=
(7.2.104)
f (ξ) · (x − c), ξ −→ c
x→c+0
ξ ∈ [c, x] ⇑
ξ ∈ [c, x]

Таким образом,
F (x) − F (c)
lim = f (c) (7.3.114)
x→c+0 x−c
b) Аналогично, если x < c, то есть a < x < c < b, то
(ˆ )
F (x) − F (c) 1
ˆ
= f (t) d t − f (t) d t =
x−c x−c [a,x] [a,c]
(ˆ !)
1
ˆ ˆ
= f (t) d t − f (t) d t + f (t) d t =
x−c [a,x] [a,x] [x,c]

1 1
ˆ
=− · f (t) d t =− · f (ξ) · (c − x) = f (ξ) f (ξ) −→ f (c)
x−c [x,c] x−c x→c−0
| {z } | {z }

=

(7.2.104)
f (ξ) · (c − x), ξ −→ c
x→c−0
ξ ∈ [x, c] ⇑
ξ ∈ [x, c]

Таким образом,
F (x) − F (c)
lim = f (c) (7.3.115)
x→c−0 x−c
Формулы (7.3.114) и (7.3.115) вместе дают

F (x) − F (c)
F ′ (c) = lim = f (c), c ∈ (a; b)
x→c x−c

2. Теперь рассмотрим случай, когда c = a. Тогда аналогично пункту a) получаем равенство

F (x) − F (a)
lim = f (a)
x→a+0 x−a

3. Остается случай, когда c = b, который нужно рассмотреть по аналогии с пунктом b), и тогда
получится формула
F (x) − F (b)
lim = f (b)
x→b−0 x−b

Формула Ньютона-Лейбница.

Теорема 7.3.2 (Ньютона-Лейбница). Пусть функция f непрерывна на отрезке [a; b] тогда для
любой ее первообразной Φ на этом отрезке выполняется равенство
ˆ
f (x) d x = Φ(b) − Φ(a) (7.3.116)
[a,b]

• Формула (7.3.116) называется формулой Ньютона-Лейбница.

Доказательство. Рассмотрим функцию


ˆ
F (x) = f (t) d t
[a,x]
§ 3. Формула Ньютона-Лейбница 443

По теореме 7.3.1, она является первообразной для функции f на отрезке [a; b]. Значит, F и Φ – две
первообразные для одной и той же функции f на отрезке [a; b]. Поэтому, по свойству 20 на с.400,
эти функции отличаются друг от друга на какую-то константу:

F (x) = Φ(x) + C, x ∈ [a; b]

То есть,
ˆ
f (t) d t = Φ(x) + C, x ∈ [a; b] (7.3.117)
[a,x]

Взяв x = a, мы получим
ˆ
0= f (t) d t = Φ(a) + C,
[a,a]

откуда
C = −Φ(a),

поэтому, подставив это в (7.3.117), получаем


ˆ
f (t) d t = Φ(x) − Φ(a), x ∈ [a; b]
[a,x]

и, если сюда подставить x = b, то получится как раз (7.3.116).

Если знать первообразную функции f на ⋄ 7.3.4. Поучительно было бы найти площадь


отрезке [a, b], то формуда Ньютона-Лейбница какой-нибудь известной фигуры, например, кру-
позволяет
´ сразу же вычислить интеграл га, с помощью теоремы Ньютона-Лейбница, и
[a,b]
f (x) d x, который, как мы говорили выше, убедиться, что при этом получается правильный
интерпретируется как площадь фигуры под гра- ответ. В качестве примера найдем интеграл
фиком функции, то есть фигуры, описываемой ˆ 1 p
условиями ( 1 − x2 d x
a6x6b −1

0 6 y 6 f (x). (то есть площадь полукруга радиуса 1).


⋄ 7.3.2. Например, площадь фигуры
(
06x61
0 6 y 6 x2 .

равна

x3 1 1
ˆ
S= x2 d x = (7.1.34) = +C = .
Здесь используется формула (7.1.59), кото-
[0,1] 3 0 3
рую мы вывели раньше. Подставляя ее в теорему
⋄ 7.3.3. Площадь фигуры, ограниченной аркой Ньютона-Лейбница, мы получаем:
синусоиды ( ˆ 1p
06x6π 1 − x2 d x = (7.1.59) =
0 6 y 6 sin x. −1
1 p  x=1
равна = x 1 − x2 + arcsin x =
2 x=−1
1 
1 π π π
= (arcsin 1 − arcsin(−1)) = + =
ˆ
S= sin x d x = (7.1.38) = 2 2 2 2 2
[0,π]
π Видно, что ответ правильный: площадь полукру-
= − cos x + C = − cos π − (− cos 0) = 2. га радиуса 1 равна π2 .
0
444 Глава 7. ИНТЕГРАЛ

(b) Интеграл по ориентированному отрезку и вычисления


Ориентированные отрезки в R.
• Ориентированным отрезком на прямой R называется произвольная пара чисел (a, b),
a, b ∈ R (здесь важно, какое из чисел стоит на первом месте, а какое на втором: пары (a, b)
и (b, a) считаются разными). Чтобы не путать такую пару (a, b) и интервалом (a, b) = {x ∈
R : a < x < b}, вводится специальное обозначение:


ab = (a, b)


Этому объекту приписывается некий геометрический образ: считается, что ab представ-
ляет собой обычный отрезок с концами a и b, относительно крайних точек которого a и
b имеется соглашение, что a в этой паре служит началом, а b концом (при этом, необяза-
тельно, чтобы a 6 b, возможно и наоборот, a > b).
• Частный случай, когда a = b, также считается ориентированным отрезком, в котором
конец и начало совпадают, и такой ориентированный отрезок называется вырожденным.

− →

• Носителем [ab] ориентированного отрезка ab называется тот же самый отрезок, но уже
обычный, неориентированный (то есть такой, у которого мы “забыли”, какая из его край-
них точек была началом, а какая концом). Понятно, что


[a, b], a < b


[ab] = {a}, a = b


[b, a], a > b
→ →
− −
• Суммой ориентированных отрезков ab и bc называется ориентированный отрезок −

ac:
− −
→ →
ab ⊕ bc := −

ac (7.3.118)

(подразумевается, что сумма определена только если конец предыдущего отрезка совпа-
дает с началом следующего).

− →

• Противоположным отрезком к отрезку ab называется отрезок ba, и обозначается он


символом ⊖ ab:

− →

⊖ab := ba (7.3.119)

− →
− →
− →

Сумму вида − →
ac ⊕ (⊖ bc) = −

ac ⊕ cb = ab принято записывать как −→
ac ⊖ bc и называть

− →

разностью ориентированных отрезков ac и bc:

→ →
− →
− → −
− →
ac ⊖ bc := −

ac ⊕ (⊖ bc) = −

ac ⊕ cb = ab (7.3.120)

−→
⋄ 7.3.5. Запись 0; 1 означает отрезок [0; 1], в ко- му
−→ −→
тором 0 считается началом, а 1 концом. Наобо- 1; 0 = ⊖0; 1
−→
рот, 1; 0 означает отрезок [0, 1], но в котором 0
считается концом, а 1 началом. Носители у этих ⋄ 7.3.6. Очевидно, справедливы равенства:
отрезков одинаковы −→ −→ −→
0; 1 ⊕ 1; 2 = 0; 2
−→ −→
[0; 1] = [0; 1] = [1; 0] −→ −→ −→
0; 2 ⊖ 1; 2 = 0; 1
−→ −→ −→
но ориентация у них противоположная, и поэто- 0; 1 ⊖ 2; 1 = 0; 2

Интеграл по ориентированному отрезку.


• Говорят, что числовая функция f определена (интегрируема, непрерывна, гладка) на ори-


ентированном отрезке ab, если она определена (интегрируема, непрерывна, гладка) на его


носителе [ab]. При этом
§ 3. Формула Ньютона-Лейбница 445



— скачком функции f на ориентированном отрезке ab называется число
x=b
f (x) := f (b) − f (a) (7.3.121)
x=a


— интегралом функции f по ориентированному отрезку ab, или анизотропным


интегралом по ab, называется число
´
ˆ b  [a,b] f (x) d x,
 a<b
f (x) d x := 0, a=b (7.3.122)
a 
 ´
− [b,a] f (x) d x, b < a

Свойства интеграла по ориентированному отрезку:


10 . Линейность: интеграл от линейной комбинации функций равен линейной комбинации
интегралов
ˆ b  ˆ b ˆ b
α · f (x) + β · g(x) d x = α · f (x) d x + β · g(x) d x (7.3.123)
a a a

20 . Аддитивность: интеграл по сумме ориентированных отрезков равен сумме интегралов


по этим отрезкам:
ˆ b ˆ c ˆ c
f (x) d x + f (x) d x = f (x) d x (7.3.124)
a b a
а интеграл по разности равен разности интегралов:
ˆ c ˆ b ˆ c
f (x) d x − f (x) d x = f (x) d x (7.3.125)
a a b



30 . Теорема о среднем: если функция f непрерывна на отрезке ab, то найдется такая


точка ξ ∈ ab, что
ˆ b
f (x) d x = f (ξ) · (b − a) (7.3.126)
a
4◦ Формула Ньютона-Лейбница: интеграл от непрерывной функции по ориентирован-
ному отрезку равен скачку какой-нибудь ее первообразной на этом отрезке:
ˆ b x=b
f (x) d x = Φ(x) (7.3.127)
a x=a

Доказательство. 1. Первое свойство следует из (7.2.95), и для его доказательства нужно просто
рассмотреть два случая взаимного расположения точек a и b на прямой. Если a < b, то
ˆ b   ˆ  
α · f (x) + β · g(x) d x = (7.3.122) = α · f (x) + β · g(x) d x = (7.2.95) =
a [a,b]
ˆ ˆ ˆ b ˆ b
= α· f (x) d x + β · g(x) d x = (7.3.122) = α · f (x) d x + β · g(x) d x
[a,b] [a,b] a a

А если a > b, то
ˆ b   ˆ  
α · f (x) + β · g(x) d x = (7.3.122) = − α · f (x) + β · g(x) d x = (7.2.95) =
a [b,a]
ˆ ˆ ˆ b ˆ b
= −α · f (x) d x − β · g(x) d x = (7.3.122) = α · f (x) d x + β · g(x) d x
[b,a] [b,a] a a

2. Равенство (7.3.124) эквивалентно (7.3.125) и следует из (7.2.96). Оно доказывается тем же


приемом: нужно рассмотреть несколько вариантов расположения точек a, b и c. В простейшем
случае, если a < b < c, мы получаем:
446 Глава 7. ИНТЕГРАЛ
ˆ b ˆ c ˆ ˆ
f (x) d x + f (x) d x = (7.3.122) = f (x) d x + f (x) d x = (7.2.96) =
a b [a,b] [b,c]
ˆ ˆ c
= f (x) d x = (7.3.122) = f (x) d x
[a,c] a

В случае, если, например, a < c < b, мы получаем:


ˆ b ˆ c ˆ ˆ
f (x) d x + f (x) d x = (7.3.122) = f (x) d x − f (x) d x = (7.2.96) =
a b [a,b] [c,b]
ˆ ˆ c
= f (x) d x = (7.3.122) = f (x) d x
[a,c] a

И в таком духе. Остальные варианты мы предлагаем читателю проверить самостоятельно.


3. Свойство 3◦ следует из (7.2.103): если a < b, то
ˆ b ˆ
f (x) d x = f (x) d x = (7.2.103) = f (ξ) · (b − a)
a [a,b]

Если же a > b, то
ˆ b ˆ
f (x) d x = − f (x) d x = (7.2.103) = −f (ξ) · (a − b) = f (ξ) · (b − a)
a [b,a]

4. Свойство 4◦ следует из (7.3.116): если a < b, то


ˆ b ˆ x=b
f (x) d x = (7.3.122) = f (x) d x = (7.3.116) = Φ(b) − Φ(a) = (7.3.121) = Φ(x)
a [a,b] x=a

Если же a > b, то
ˆ b ˆ
f (x) d x = (7.3.122) = − f (x) d x = (7.3.116) =
a [b,a]
  x=b
= − Φ(a) − Φ(b) = Φ(b) − Φ(a) = (7.3.121) = Φ(x)
x=a

⋄ 7.3.7. ⋄ 7.3.8.
4 √ ˆ 4 
1+ x 1 1
ˆ
π
dx = + √ dx = ˆ 2
1 x2 1 x2 x· x (1 + 2 cos x − sin x) d x = (7.3.123) =
ˆ 4 ˆ 4 0
3
= (7.3.123) = x−2 d x + x− 2 d x = ˆ π
2
ˆ π
2
ˆ π
2
1 1 = 1 dx + 2 · cos x d x − sin x d x =
1 x=4 1 x=4 0 0 0
= (7.1.34) = − − √ = π
2
π
2
π
2 π
x x=1 2 x x=1 =x + 2 sin x − cos x = +2−1=
1 1 1 0 0 0 2
= − + 1 − + = 1. π
4 4 2 = + 1.
2

Интегрирование вдоль гладкой функции.


• Если f – интегрируемая функция, а g – гладкая функция на ориентированном отрезке

− →

ab, то интегралом от функции f вдоль функции g по ориентированному отрезку ab
называется число ˆ ˆ b b
f (x) d g(x) := f (x) · g ′ (x) d x (7.3.128)
a a
В частном случае, когда f (x) = 1, это число обозначается также
ˆ b ˆ b
d g(x) := g ′ (x) d x (7.3.129)
a a
§ 3. Формула Ньютона-Лейбница 447

Теорема 7.3.3 (о скачке гладкой функции). Скачок гладкой функции g на ориентированном




отрезке ab равен интегралу от единицы вдоль g по этому отрезку:
ˆ b ˆ b x=b
d g(x) = g ′ (x) d x = g(x) (7.3.130)
a a x=a

Доказательство. Это следует из формулы Ньютона-Лейбница (7.3.127), если положить f = g ′ ,


Φ = g.

Следствие 7.3.4. Функция g : [a, b] → R является гладкой тогда и только тогда, когда она пред-
ставима в виде интеграла с переменным верхним пределом от некоторой непрерывной функции
f : [a, b] → R: ˆ x
g(x) = g(a) + f (t) d t
a

Доказательство. В качестве f нужно взять производную g ′ функции g, доопределенную произ-


вольным образом в точках недифференцируемости g.

В вычислениях удобно переход от левой части и говорим при этом, что "вносим g ′ (x) под знак
к правой и наоборот в формуле (7.3.128) оформ- дифференциала".
лять специальной записью и сопровождать под-
ходящей речевой конструкцией. В качестве за-
писи в таких случаях используется стрелка над ⋄ 7.3.9. В этом пункте нам нужны примеры, ил-
формулой, а речевых конструкций придумано люстрирующие формулу (7.3.128) как определе-
две: "вынесение из-под знака дифференциала"и ние интеграла вдоль гладкой функции, поэтому
"внесение под знак дифференциала". Именно, в вычислениях здесь мы будем выносить выра-
если нам нужно в (7.3.128) перейти от левой ча- жения из-под знака дифференциала:
сти к правой, то мы рисуем стрелку от выраже-
ния под дифференциалом в пространство перед ˆ 1 ˆ 1
ним,
x3 d x5 = x3 · 5x4 d x =
ˆ b ˆ b 0 0
f (x)  d g(x) = f (x) · g ′ (x) d x, ˆ 1
5 8 x=1 5
a a =5 x7 d x = x =
0 8 x=0 8
и говорим при этом, что "выносим g(x) из-под
знака дифференциала". А если наоборот, нам
нужно в (7.3.128) перейти от правой части к ле- ⋄ 7.3.10. Еще один такой же пример:
вой (такое тоже часто бывает нужно, см. приме-
ры, начиная с 7.3.13), то мы рисуем стрелку от
нужного выражения в пространство после знака ˆ π ˆ π
дифференциала, cos x  d sin x = cos2 x d x =
0 0
ˆ b ˆ b ˆ π π
′  1 + cos 2x 1 1 π
f (x) · g (x) d x = f (x) d g(x), = d x = · x + · sin 2x =
a a 0 2 2 4 0 2

Теорема о замене переменной в определенном интеграле.




• Говорят, что функция ϕ является преобразованием ориентированного отрезка αβ в ори-


ентированный отрезок ab, и обозначают это записью

→ →

ϕ : αβ → ab, (7.3.131)

если

→ →

(i) ϕ гладко отображает носитель αβ в носитель ab:

→ →

ϕ : [αβ] → [ab] (7.3.132)

→ →

(это, в частности, означает, что для всякого t ∈ [αβ] значение ϕ(t) лежит в [ab]);
448 Глава 7. ИНТЕГРАЛ

(ii) ϕ сохраняет ориентацию в следующем смысле:

ϕ(α) = a, ϕ(β) = b (7.3.133)

−−→
⋄ 7.3.11. Функция не будет преобразованием отрезка 0; 3π
2 в отрезок
−→
ϕ(t) = cos t 1; 0, хотя она по-прежнему гладкая, и сохраняет
ориентацию этих отрезков:
является преобразованием ориентированного от-
−→ −−−→ 3π
резка 0; π в ориентированный отрезок 1; −1: cos 0 = 1, cos =0
2
−→ −−−→
cos : 0; π → 1; −1
Дело в том, что эта функция не будет отображе-
потому что она гладко отображает носитель пер- нием носителя первого отрезка в носитель вто-
вого отрезка в носитель второго рого:
−→ −−−→ "−−−→#  
cos : [0; π] = [0, π] → [−1; 1] = [1; −1] 3π 3π −→
cos : 0; = 0, →
6 [0; 1] = [1; 0]
и сохраняет ориентацию: 2 2

cos 0 = 1, cos π = −1.  


потому что, например, в точке t = π ∈ 0, 3π
2 ее
⋄ 7.3.12. Но та же функция значения вылезают из отрезка [0; 1]:

ϕ(t) = cos t cos π = −1 ∈


/ [0; 1].

Теорема 7.3.5 (о замене переменной в определенном интеграле). Пусть даны


−→ −

(i) преобразование ϕ ориентированного отрезка αβ в ориентированный отрезок ab (удовле-
творяющее условиям (7.3.132) и (7.3.133)), и


(ii) функция f , непрерывная на ориентированном отрезке ab;
тогда ˆ b ˆ β ˆ β
f (x) d x = f (ϕ(t)) d ϕ(t) = f (ϕ(t)) · ϕ′ (t) d t (7.3.134)
a α α


Доказательство. Пусть F – первообразная функции f на отрезке [ab]:


F ′ (x) = f (x), x ∈ [ab] (7.3.135)

(такая первообразная существует, например, по теореме 7.3.1).




Тогда композиция F ◦ϕ будет первообразной для функции (f ◦ϕ)·ϕ′ , на отрезке [αβ], по формуле
(5.1.28):


(F ◦ ϕ)′ (t) = F ′ ( ϕ(t) ) · ϕ′ (t) = f (ϕ(t)) · ϕ′ (t), t ∈ [αβ] (7.3.136)
|{z}



[ab]
k
D(F ′ )

Поэтому
ˆ β t=β  
f (ϕ(t)) · ϕ′ (t) d t = (7.3.127) = (F ◦ ϕ)(t) =F ϕ(β) −F ϕ(α) =
α t=α | {z } | {z }
=

(7.3.133) (7.3.133)
b a
ˆ b
= F (b) − F (a) = (7.3.127) = f (x) d x
a
§ 3. Формула Ньютона-Лейбница 449

4 √
x dx
ˆ
В противоположность примерам на с.447 те- 1 + x = t, x = t2 − 1
√ = −→ −→
x ∈ 1; 4 ⇔ t ∈ 2; 3
=
перь оказывается полезным вносить под знак 1 1+ x
дифференциала. ˆ 3
(t2 − 1) d(t2 − 1)
ˆ 3 2
(t − 1) · 2t d t
= = =
⋄ 7.3.13. 2 t 2 t
ˆ 3  3 
ˆ 2 ˆ 2 t t=3
x2 1 2 =2 (t2 − 1) d t = 2 · −t =
ex · 2x d x =

x · e dx = · 2 3 t=2
0 2 0   
√ 8 32
1 2 x2 = 2 (9 − 3) − −2 =
ˆ
x = t, t = x2
= e d x2 = x ∈ − → −→
0; 2 ⇔ t ∈ 0; 4
= 3 3
2 0
1 4 t 1 4 e4 − 1 ⊲⊲ 7.3.16. Найдите определенные интегралы:
ˆ
= e d t = et = ´1√
2 0 2 0 2 1) 0 4 − x2 d x
´ ln 5 x √ x
⋄ 7.3.14. 2) 0 e exe+3−1 d x
´a
ˆ π4 π 3) 02 √adx2 2
sin x ´ 1 2 √−x
ˆ 4
tg x d x = dx = 4) 0 x 1 − x2 d x
0 cos x 0 ´ 1 dx
ˆ π4
− sin x d x
 ˆ π4
d cos x 5) 0 ex +e −x
=− dx = − = ´ π2
0 cos x 0 cos x 6) 0 1+sindx x+cos x
ˆ 21 ´π
x = arccos t, t = cos x dy 7) 04 1+2dx sin2 x
= −−→π
−−→
x ∈ 0; 4 ⇔ t ∈ 1; 21 = − =
1 y
1
⊲⊲ 7.3.17. Найдите определенные интегралы:
2 1
= − ln |y| = − ln + ln 1 = ln 2 ´1√
1 2 ´ − π4 cos3 x
1) 0 1 + x d x 5) −π

3 dx
sin x
⋄ 7.3.15. Иногда, однако, бывает удобно сразу ´π
2) 02 sin3 x d x ´1
2

dx
заменять переменную, не внося ничего под знак ´ 1 x dx 7) 0 x2 +4x+5
3) 0 (x2 +1)3
дифференциала: ´e ´1
4) 1 1+ln x
dx 8) √ dx
x 0 3+2x−x2

Интегрирование по частям.
Теорема 7.3.6 (об интегрировании по частям). Если f и g – гладкие функции на ориентиро-


ванном отрезке ab, то
ˆ b x=b
ˆ b
f (x) d g(x) = f (x) · g(x) − g(x) d f (x) (7.3.137)
a x=a a

Доказательство.
ˆ b ˆ b ˆ b ˆ b
f (x) d g(x) + g(x) d f (x) = (7.3.128) = f (x) · g ′ (x) d x + g(x) · f ′ (x) d x = (7.3.123) =
a a a a
ˆ b   ˆ b x=b x=b
= f (x) · g ′ (x) + f ′ (x) · g(x) dx = (f ·g)′ (x) d x = (7.3.130) = (f ·g)(x) = f (x)·g(x)
a | {z } a x=a x=a
=

(f · g)′ (x)


´b
(переносим a
g(x) d f (x) направо)
ˆ b x=b
ˆ b
f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
a x=a a

e ˆ e
x=e 1
ˆ
⋄ 7.3.18. − x d ln x = x · ln x − x · dx =
1 x=1 1 x
e x=e
ˆ e x=e x=e
x=e
ˆ
ln x d x = (7.3.137) = x · ln x − = x · ln x − 1 d x = x · ln x −x =
1 x=1 x=1 1 x=1 x=1
450 Глава 7. ИНТЕГРАЛ

π ˆ π
= e · ln e − 1 · ln 1 − (e − 1) = 1 π x
= e − 1 + sin x · e − ex  d sin x =
0
⋄ 7.3.19. | {z 0}
k
ˆ 2 ˆ 2 0
ex x d x = x d ex = (7.3.137) =
 ˆ π
0 0 = eπ − 1 − ex cos x d x = eπ − 1 − I
x=2
ˆ 2 x=2 x=2 0
= x · ex − ex d x = x · ex − ex =
x=0 0 x=0 x=0 Итогом этих вычислений будет равенство
= 2 · e2 − 0 · e0 − (e2 − e0 ) = e2 + 1
I = eπ − 1 − I,
⋄ 7.3.20. Повторное интегрирование по частям:
из которого I выражается формулой
2 2
eπ − 1
ˆ ˆ
ex x2 d x = x d ex = (7.3.137) =

I= .
0 0 2
x=2
ˆ 2
2
=x ·e x
− ex d x2 = ⊲⊲ 7.3.22. Найдите определенные интегралы:
x=0
| {z } 0 ´1 ´2
k 1) 0
arctg x d x 4) 1 x ln x d x
´π
4e2 ´1 5) 0 x3 sin x d x
2 2) 0 xe−x d x ´π x
6) 0 e sin x d x
ˆ
= 4e2 − ex 2x d x =

1 ´π
7) 02 e2x cos x d x
´
0 3) 0
2
arcsin x d x
ˆ 2
= 4e2 − 2 x d ex = (7.3.137) =
0
Использование рекуррентных соотноше-
x=2
ˆ 2 ний.
= 4e2 − 2x · ex +2 ex d x =
| {z x=0
} 0 ⋄ 7.3.23. Некоторые определенные интегралы
k вычисляются с помощью рекуррентных соотно-
4e2 шений. Например, следующие равенства8:
x=2
= 2ex = 2 · e2 − 2 ˆ π
2
ˆ π
2
x=0 n
sin x d x = cosn x d x =
⋄ 7.3.21. Следующий прием называется "воз- 0
( 0
(n−1)!! π
вращением к исходному интегралу". Чтобы со- n ∈ 2N − 1 n!! · 2,
= (7.3.138) (n−1)!!
считать интеграл n ∈ 2N ,
n!!
ˆ π
ex cos x d x, (напомним, что двойной факториал n!! был опре-
0 делен формулами (2.2.238) и (2.2.239)). Сначала
обозначим его какой-нибудь буквой, например, проверим, что эти интегралы совпадают:
π
x = π2 − y
ˆ
π
ex cos x d x.
ˆ
I= 2
n
0 sin x d x = x = 0 ⇔ y = π2 =
0 x = π2 ⇔ y = 0
Тогда, дважды применяя интегрирование по ча- ˆ 0 π  π 
стям, можно получить следующую цепочку, на- = sinn −y d −y =
чинающуюся с I и в итоге снова возвращающу- π
2
2 2
юся к I, но так, что из полученной формулы I ˆ 0 ˆ π2
можно выразить: =− cosn y d y = cosn y d y
π
2 0
ˆ π ˆ π
ex cos x d x = cos x d ex = (7.3.137) = После этого выведем рекуррентную формулу:

I=
0 0
π ˆ π ˆ π ˆ π
2 2
= cos x · ex − ex  d cos x = In = sinn x d x = sinn−1 x d(− cos x) =
0
| {z 0} 0 0
π
2
k
e −1π = − sinn−1 x · cos x +
0
ˆ π | {z }
=

= eπ − 1 + ex sin x d x =

0
ˆ π 0 ˆ π
2
π
=e −1+ sin x d ex = (7.3.137) = + (n − 1) · sinn−2 x · cos2 x d x =
0 0
8 Равенства (7.3.138) понадобятся нам на с.467 при доказательстве формулы Валлиса.
§ 3. Формула Ньютона-Лейбница 451
π
(2k − 1) · (2k − 3) · ... · 1 (2k − 1)!! π
ˆ 2
= (n − 1) · sinn−2 x · (1 − sin2 x) d x = = ... = ·I0 = ·
0
2k · (2k − 2) · ... · 2 (2k)!! 2
= (n − 1) · In−2 − (n − 1) · In
А для n = 1 получаем:

n−1 ˆ π
2
π
In = · In−2 I1 = sin x d x = − cos x
1
= 1,
n 0
0
Теперь для n = 0 получаем:
ˆ π2
π поэтому при n = 2k + 1,
I0 = dx =
0 2
2k 2k · (2k − 2)
и поэтому при n = 2k, I2k+1 = ·I2k−1 = ·I2k−3 =
2k + 1 (2k + 1) · (2k − 1)
2k − 1 (2k − 1) · (2k − 3) (2k) · (2k − 2) · ... · 2 (2k)!!
I2k = ·I2k−2 = ·I2k−4 = = ... = ·I1 =
2k 2k · (2k − 2) (2k + 1) · (2k − 1) · ... · 1 (2k + 1)!!

(c) Интегрирование кусочно-непрерывных и кусочно-гладких функций


Интегралы, с которыми нам придется иметь дело в дальнейшем, будут, как правило, интегралами
от непрерывных функций, возможно, вдоль гладких функций. Однако в главе 11, где речь пойдет
о рядах Фурье, а также в главе 6, где будут изучаться асимптотики, нам придется интегрировать
функции из несколько более широкого класса, а именно, кусочно-непрерывные функции, возможно,
вдоль непрерывных кусочно-гладких функций. В этом пункте мы поговорим о таких интегралах.

Кусочно-непрерывные функции.
• Функция f на отрезке [a, b] называется кусочно-непрерывной, если
1) на [a, b] функция f непрерывна во всех точках, кроме, возможно, конечного
набора;
2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый
предел
f (c − 0) = lim f (x), f (c + 0) = lim f (x) (7.3.139)
x→c−0 x→c+0

Теорема 7.3.7. Функция f кусочно-непрерывна на отрезке [a, b] тогда и только тогда, когда су-
ществует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ] можно
определить непрерывную функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):

f (x) = ϕi (x), x ∈ (ci−1 , ci )

Доказательство. Занумеруем по возрастанию точки разрыва функции f и добавим к ним, если


этого не произошло сразу, концы отрезка [a, b]. У нас получится некоторое разбиение:

a = c0 < c1 < ... < ck = b

На всяком отрезке [ci−1 , ci ] формула




f (x), x ∈ (ci−1 , ci )
ϕi (x) = f (ci−1 + 0), x = ci−1


f (ci − 0), x = ci

определяет непрерывную функцию ϕi , совпадающую с f на интервале (ci−1 , ci ).

⊲ 7.3.24. Проверьте, что функция

f (x) = sgn sin x


452 Глава 7. ИНТЕГРАЛ

имеющая график отрезке [0, 1], потому что имеет на нем бесконеч-
1
ное число точек разрыва (x = πn ).
⊲ 7.3.26. Функция
(
1
x, x 6= 0
f (x) =
0, x=0

с графиком
является кусочно-непрерывной на любом отрез-
ке [a, b].
⊲ 7.3.25. Наоборот, функция
(
sgn sin x1 , x 6= 0
f (x) =
0, x = 0
с графиком
тоже не будет кусочно-непрерывной на отрезке
[0, 1], потому что имеет бесконечный предел в
точке 0.

не является кусочно-непрерывной, например, на

Теорема 7.3.8. Всякая кусочно-непрерывная функция f на отрезке [a, b] интегрируема на нем.


Для доказательства теоремы 7.3.8 нам понадобится следующая
Лемма 7.3.9. Пусть функции f и ϕ определены на отрезке [a, b] и совпадают на интервале (a, b):
f (x) = ϕ(x), x ∈ (a, b)
Тогда если ϕ интегрируема на отрезке [a, b], то и f интегрируема на [a, b], причем
ˆ b ˆ b
f (x) d x = ϕ(x) d x
a a

Доказательство. Заметим сразу, что обе функции f и ϕ должны быть ограничены на [a, b]: функ-
ция ϕ ограничена по теореме 7.2.2, как интегрируемая на [a, b], а функция f отличается от нее не
более чем в двух точках. Мы можем даже считать, что они ограничены одной константой:
sup |f (x)| 6 M, sup |ϕ(x)| 6 M
x∈[a,b] x∈[a,b]

Теперь для произвольных разбиений τ отрезка [a; b] и выделенных точек ξi мы получим:

интегральная интегральная
сумма для f сумма для ϕ
z }| { z }| {
X k X k
f (ξi ) · ∆xi − ϕ(ξi ) · ∆xi =
i=1 i=1
| {z }
diam τ
↓ ↓
0
´b
a
ϕ(x) d x
 k−1
X   k−1
X 
= f (ξ1 ) · ∆x1 + f (ξi ) · ∆xi + f (ξk ) · ∆xk − ϕ(ξ1 ) · ∆x1 + ϕ (ξi ) · ∆xi +ϕ (ξk ) · ∆xk =
i=2 i=2
| {z } | {z }
↑ сокращаются, поскольку f (ξ) = ϕ(ξ) при ξ ∈ (a, b) ↑
§ 3. Формула Ньютона-Лейбница 453

   
= f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6

6 f (ξ1 ) − ϕ(ξ1 ) · ∆x1 + f (ξk ) − ϕ(ξk ) · ∆xk 6 4M · diam τ −→ 0


| {z } |{z} | {z } |{z} diam τ →0

6
6

6
diam τ diam τ
|f (ξ1 )| − |ϕ(ξ1 )| |f (ξk )| − |ϕ(ξk )|

6
2M 2M

Отсюда получаем:
k
X ˆ b
f (ξi ) · ∆xi −→ ϕ(x) d x
diam τ →0 a
i=1
´b
Это значит, что функция f интегрируема на [a, b] и ее интеграл равен a
ϕ(x) d x.
Доказательство теоремы 7.3.8. Подберем с помощью теоремы 7.3.7 разбиение отрезка [a, b]

a = c0 < c1 < ... < ck = b

такое, что на всяком интервале (ci−1 , ci ) функция f совпадает с некоторой функцией ϕi , непрерыв-
ной на отрезке [ci−1 , ci ]. Тогда по лемме 7.3.9, функция f будет интегрируемой на всяком отрезке
[ci−1 , ci ]. Значит, по свойству аддитивности интеграла (20 на с.434), f интегрируема на отрезке
[a, b] = [a, c1 ] ∪ [c1 , c2 ] ∪ ... ∪ [cn , b].

Кусочно-гладкие функции.
• Функция f на отрезке [a, b] называется кусочно-гладкой, если
1) на отрезке [a, b] она дифференцируема во всех точках, кроме, возможно, конеч-
ного набора;
2) в каждой точке c ∈ [a, b], где f дифференцируема, ее производная непрерывна,

f ′ (c) = lim f ′ (x) (7.3.140)


x→c

3) в каждой точке c ∈ [a, b], где f не дифференцируема, она обладает следующими


свойствами:
(i) f имеет конечные левый и правый пределы (либо один из них, если c
совпадает с каким-то из концов отрезка [a, b])

f (c − 0) = lim f (x), f (c + 0) = lim f (x) (7.3.141)


x→c−0 x→c+0

(ii) f имеет конечные левую и правую производные (либо одну из них,


если c совпадает с каким-то из концов отрезка [a, b])

′ f (x) − f (c − 0) f (x) − f (c + 0)

f− (c) = lim , f+ (c) = lim
x→c−0 x−c x−c x→c+0
(7.3.142)
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x)
′ ′
стремится соответственно к f− (c) или f+ (c):

f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (7.3.143)
x→c−0 x→c+0

Следующее утверждение доказывается в точности, как теорема 7.3.7:


Теорема 7.3.10. Функция f является кусочно-гладкой на отрезке [a, b] тогда и только тогда,
когда существует разбиение τ = {c0 , ..., ck } этого отрезка такое, что на каждом отрезке [ci−1 , ci ]
можно определить гладкую функцию ϕi , совпадающую с f на интервале (ci−1 , ci ):

f (x) = ϕi (x), x ∈ (ci−1 , ci )

Следующее утверждение мы считаем очевидным:


454 Глава 7. ИНТЕГРАЛ

Теорема 7.3.11. Пусть g – непрерывная кусочно-гладкая функция на отрезке [a, b]. Тогда
(i) произвольным образом доопределяя производную g ′ функции g в точках недифференци-
руемости g на [a, b], мы получим кусочно-непрерывную функцию на [a, b];
(ii) для любой интегрируемой функции f на [a, b] интеграл
ˆ b
f (x) · g ′ (x) d x
a

не зависит от того, как доопределена функция g ′ в точках недифференцируемости g.


• Как следствие, для любой интегрируемой функции f и любой непрерывной9 кусочно-
гладкой функции g на отрезке [a, b] формула
ˆ b ˆ b
f (x) d g(x) := f (x) · g ′ (x) d x (7.3.144)
a a

однозначно определяет число, называемое определенным интегралом от функции f вдоль


функции g на отрезке [a, b]. В частном случае, когда f = 1 эта величина обозначается
ˆ b ˆ b
d g(x) := g ′ (x) d x (7.3.145)
a a

Целью наших рассмотрений здесь является обобщение теорем 7.3.12 и 7.3.6 об интегрировании
вдоль функции на случай, когда эта функция является непрерывной кусочно-гладкой (а не просто
гладкой).
Теорема 7.3.12 (о скачке непрерывной кусочно-гладкой функции). Скачок непрерывной


кусочно-гладкой функции g на ориентированном отрезке ab равен интегралу от единицы вдоль g
по этому отрезку:
ˆ b ˆ b x=b
d g(x) = g ′ (x) d x = g(x) (7.3.146)
a a x=a

Доказательство. Понятно, что здесь достаточно считать, что a < b, потому что противоположный
случай получается умножением равенства (7.3.146) на −1.
1. Пусть сначала функция g дифференцируема везде внутри отрезка [a, b] (а недифференцируема
может быть только на концах этого отрезка). Тогда для любых точек α и β таких, что

a < α < β < b,

функция v будет гладкой на отрезке [α, β], и значит к ним применима теорема 7.3.12:
ˆ β
d g(x) = g(β) − g(α)
α

Переходя к пределам при α → a и β → b, мы получаем как раз (7.3.146):


ˆ β
d g(x) = g(β) − g(α)
α | {z }
| {z } ↓
=

(7.3.144) g(b) − g(a)


´β  
α
g′ (x) d x здесь используется
´b ′ ↓ непрерывность g
a
g (x) d x
=

´b (7.3.144)
a
d g(x)

2. В общем случае мы выбираем по теореме 7.3.10 разбиение отрезка [a, b]

a = c0 < c1 < ... < ck = b


9 Объяснение, почему функцию g в определении интеграла ab f (x) d g(x) нужно брать непрерывной кусочно-
´
гладкой (а не просто кусочно-гладкой) заключается в том, что только тогда этот интеграл можно определить фор-
мулой (7.3.144). В общем случае эта конструкция называется интегралом Римана-Стилтьеса и определяется она
по аналогии с интегралом Римана но с заменой ∆xi = xi − xi−1 на ∆gi = g(xi ) − g(xi−1 ). Для сходимости частичных
сумм необходимо требовать, чтобы g была функцией ограниченной вариации. Подробности можно найти, например,
в учебнике: А.Н.Колмогоров, С.В.Фомин, Элементы теории функций и функционального анализа, М.: Наука, 1981.
§ 3. Формула Ньютона-Лейбница 455

так, чтобы внутри каждого отрезка [ci−1 , ci ] функция g была дифференцируема, и, по уже дока-
занному, мы получим:
ˆ b k ˆ
X ci k
X x=ci x=a
d g(x) = d g(x) = g(x) = g(x)
a ci−1 x=ci−1 x=b
i=1 i=1

Следствие 7.3.13. Функция g : [a, b] → R является непрерывной кусочно-гладкой тогда и только


тогда, когда она представима в виде интеграла с переменным верхним пределом от некоторой
кусочно-непрерывной функции f : [a, b] → R:
ˆ x
g(x) = g(a) + f (t) d t
a

Доказательство. В качестве f нужно взять производную g ′ функции g, доопределенную произ-


вольным образом в точках недифференцируемости g.

Теорема 7.3.14 (об интегрировании по частям для непрерывных кусочно-гладких функ-




ций). Если f и g – непрерывные кусочно-гладкие функции на ориентированном отрезке ab, то
ˆ b x=b
ˆ b
f (x) d g(x) = f (x) · g(x) − g(x) d f (x) (7.3.147)
a x=a a

Доказательство. Как и в доказательстве теоремы 7.3.12, здесь достаточно считать, что a < b.
1. Пусть для начала функции f и g дифференцируемы везде внутри отрезка [a, b] (а недиф-
ференцируемы могут быть только на концах этого отрезка). Тогда для любых точек α и β таких,
что
a < α < β < b,
функции f и g будут гладкими на отрезке [α, β], и значит к ним применима теорема 7.3.6:
ˆ β x=β
ˆ β
f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
α x=α α

Переходя к пределам при α → a и β → b по формулам (7.2.101) и (7.2.102), мы получаем как раз


(7.3.147):
ˆ β x=β
ˆ β
f (x) d g(x) = f (x) · g(x) − g(x) d f (x)
x=α
| α
{z } | {z } | α
{z }

=

´β (7.3.144) x=b ´β (7.3.144)


α
f (x) · g′ (x) d x f (x) · g(x) α
g(x) · f ′ (x) d x
↓  x=a  ↓
´b здесь используется ´b
a
f (x) · g′ (x) d x непрерывность f и g a
g(x) · f ′ (x) d x
=

´b (7.3.144) ´b (7.3.144)
a
f (x) d g(x) a
g(x) d f (x)

2. В общем случае мы выбираем по теореме 7.3.10 разбиение отрезка [a, b]

a = c0 < c1 < ... < ck = b

так, чтобы внутри каждого отрезка [ci−1 , ci ] функции f и g были дифференцируемы, и, по уже
доказанному, мы получим:

ˆ b k ˆ
X ci k
X x=ci k ˆ
X ci
f (x) d g(x) = f (x) d g(x) = f (x) · g(x) − g(x) d f (x) =
a ci−1 x=ci−1 ci−1
i=1 i=1 i=1
x=b
ˆ b
= f (x) · g(x) − g(x) d f (x)
x=a a
456 Глава 7. ИНТЕГРАЛ

(d) Некоторые следствия формулы Ньютона-Лейбница


Первообразная на интервале. Напомним, что понятие первообразной для функции, определен-
ной на отрезке было введено нами на с.399. Для случая интервала определение ничем не отличается:
• Функция F называется первообразной для функции f на интервале (α, β), если производ-
ная F на этом интервале равна f :

F ′ (x) = f (x), x ∈ (α, β). (7.3.148)

Предложение 7.3.15. Для любой непрерывной функции f на интервале (α, β) и любой точки
c ∈ (α; β) формула ˆ x
F (x) = f (t) d t, x ∈ (α, β)
c
определяет первообразную функции f на интервале (α, β).
Доказательство. Здесь используется теорема 7.3.1 об интеграле с переменным верхним пределом.
1. Зафиксируем x0 ∈ (c, β). Взяв какое-нибудь b ∈ (x0 , β), мы можем считать, что переменная x
бегает по отрезку [c, b], на котором x0 будет внутренней точкой, поэтому производную функции F
в x0 можно вычислить по формуле (7.3.111):
ˆ x x0 
1
ˆ
F ′ (x0 ) = lim f (t) d t − f (t) d t =
x→x0 x − x0 c c
!
1
ˆ ˆ
= lim f (t) d t − f (t) d t = (7.3.111) = f (x0 ). (7.3.149)
x→x0 x − x0 [c,x] [c,x0 ]

Более того, представив F тем же интегралом с x бегающим по отрезку [c, b], мы можем найти
правую производную F в точке c по формуле (7.3.112):
x
F (x) − F (c) 1
ˆ
F+′ (c) = lim = lim f (t) d t =
x→c+0 x−c x→c+0 x−c c
1
ˆ
= lim f (t) d t = (7.3.112) = f (c). (7.3.150)
x→c+0 x − c [c,x]

2. Если α < x0 < c, то взяв какое-нибудь a : α < a < x0 , мы получим


ˆ x x0  ˆ x 
1 1
ˆ

F (x0 ) = lim f (t) d t − f (t) d t = (7.3.125) = lim f (t) d t =
x→x0 x − x0 c c x→x0 x − x0 x0
ˆ x ˆ x0 
1
= (7.3.125) = lim f (t) d t − f (t) d t =
x→x0 x − x0 a a
!
1
ˆ ˆ
= lim f (t) d t − f (t) d t = (7.3.111) = f (x0 ) (7.3.151)
x→x0 x − x0 [a,x] [a,x0 ]

И представив F тем же интегралом с x бегающим по отрезку [a, c], мы можем найти левую произ-
водную F в точке c по формуле (7.3.113):
x
F (x) − F (c) 1
ˆ
F−′ (c) = lim = lim f (t) d t =
x→c−0 x−c x→c−0 x − c c
c
1
ˆ
= lim f (t) d t = (7.3.113) = f (c). (7.3.152)
x→c−0 c − x x

3. Теперь мы получаем, что формулы (7.3.150) и (7.3.152) вместе дают (7.3.148) для случая x0 = c,
а для всех остальных точек x0 6= c то же самое утверждается в формулах (7.3.149) и (7.3.151).

Лемма Адамара.
Лемма 7.3.16 (Адамар). Для любой гладкой функции f на отрезке [a, b] и любой точки c ∈ [a, b]
найдется непрерывная функция g на [a, b] такая, что

f (x) − f (c) = (x − c) · g(x), x ∈ [a, b] (7.3.153)


§ 3. Формула Ньютона-Лейбница 457

Доказательство. Положим
ˆ 1  
g(x) = f ′ (x − c) · s + c d s, x ∈ [a, b]
0

Из непрерывности функции f ′ следует, что функция g тоже непрерывна на [a, b]. Действительно,
пусть ε > 0. По теореме Кантора 3.3.10, найдется δ > 0 такое, что для любых x, y ∈ [a, b]

|x − y| < δ =⇒ |f ′ (x) − f ′ (y)| < ε

Поэтому справедлива цепочка:


|x − y| < δ

 
∀s ∈ [0, 1] (x − c) · s + c − (y − c) · s + c = (x − y) · s = |x − y| · |s| 6 |x − y| < δ


 
∀s ∈ [0, 1] f ′ (x − c) · s + c − f ′ (y − c) · s + c < ε

ˆ 1 
ˆ 1 

|g(x) − g(y)| = f (x − c) · s + c d s − f ′ (y − c) · s + c d s =
0 0
 
ˆ ˆ
= f ′ (x − c) · s + c d s − f ′ (y − c) · s + c d s =
[0;1] [0;1]
ˆ   
= f ′ (x − c) · s + c − f ′ (y − c) · s + c ds 6
[0;1]
 
ˆ ˆ
6 f ′ (x − c) · s + c − f ′ (y − c) · s + c d s < ε ds = ε
[0;1] | {z } [0;1]
>

Остается проверить тождество (13.1.43). Для любого x > c мы получаем:

ˆ x t = (x − c) · s + c ˆ 1  
s ∈ [0, 1]
f (x) − f (c) = f ′ (t) d t = d t = (x − c) d s = f ′ (x − c) · s + c · (x − c) d s =
c → ⇔ s∈−

t ∈ cx

0; 1 0
ˆ 1  
= (x − c) · f ′ (x − c) · s + c d s = (x − c) · g(x)
0

(e) Приложения определенного задает на координатной плоскости некоторую об-


интеграла ласть D

Площадь правильной области на плоско-


сти. Пусть функции f и g непрерывны на от-
резке [a, b] и удовлетворяют неравенству

f (x) 6 g(x), x ∈ [a; b]

Тогда система неравенств


( Всякая такая область называется правильной
a6x6b (относительно оси OX).
f (x) 6 y 6 g(x)
458 Глава 7. ИНТЕГРАЛ

Теорема 7.3.17. Площадь SD правильной обла- 3) y = x3 , y = x;


сти ( 2
4) y = x2 , y = 2 − 3x
a6x6b 2 ;
D: 5) y = −x2 , y = x2 − 2x − 4;
f (x) 6 y 6 g(x) 3
6) y = 2x2 , y = x3 ;
равна
7) y = x(x − a)2 , y = 0.
ˆ b h i
SD = g(x) − f (x) d x (7.3.154) ⊲⊲ 7.3.29. Найдите площади фигур, ограничен-
a ных линиями:
⋄ 7.3.27. Найдем площадь фигуры, ограничен- 1) y = ex , y = e−x , x = 1,
ной кривыми 2) y = 2px2 , x = 2py 2 ,
y = x, y = 2 − x2 3) y = −x, y = 2x − x2 .

Найдем сначала точки пересечения этих линий: Площадь области, ограниченной парамет-
( ) ( ) ризованной кривой. Для любых непрерыв-
y=x y=x ных функций ϕ, χ : [α, β] → R система уравнений
⇔ ⇔ вида
y = 2 − x2 x = 2 − x2 
  
x = ϕ(t)
( )  y=x  y = χ(t)
y=x  " # 

⇔ ⇔ x = −2 ⇔ t ∈ [α; β]
x2 + x − 2 = 0 
 

x=1 задает на плоскости некоторое множество точек,
( ) называемых параметризованной кривой (пара-
x = −2 метр t необязательно бегает по отрезку).
 y = −2 
 
⇔  )  ⋄ 7.3.30 (эллипс). Можно проверить, что урав-
( 
 x=1  нения (
y=1 x = a cos t
, t∈R
y = b sin t
На плоскости эта область изображается картин- определяют эллипс:
кой (которую можно построить по точкам):

Действительно,
Теперь интересующая нас область в правильном
x2 y2
виде записывается следующим образом: + = cos2 t + sin2 t = 1
a b
(
−2 6 x 6 1 ⋄ 7.3.31 (астроида). Уравнения
D: 2 (
x6y 62−x x = a cos3 t
, t∈R
и остается применить формулу (7.3.154): y = a sin3 t
задают на плоскости кривую, называемую аст-
ˆ 1 роидой. Для ее построения можно составить таб-
SD = {2 − x2 − x} d x = лицу
−2
 
x3 x2 1
t 0 ± π6 ±π ± π3 ± π2
= 2x − − = √ √ 4
3 2 −2 3 3 2 1
    x a 8 a 4√ a 8√a 0
1 1 8 9
= 2− − − −4 + − 2 = y 0 ± 81 a ± 42 a 3 3
± 8 a ±a
3 2 3 2

⊲⊲ 7.3.28. Найдите площади фигур, ограничен-


ных линиями: t ± 2π
3 ± 3π
4 ± 5π
6 ±π
√ √
x − 18 a − 42 a −383a −a
1) y = 6x − x2 − 7, y = x − 3; √ √
2) y = 2x − x2 , y = x; y ±383a ± 42 a ± 81 a 0
§ 3. Формула Ньютона-Лейбница 459

затем отметить все эти точки на рисунке: задает на плоскости примерно такую область

если ϕ) возрастает, и
и соединить их “плавной линией”. Получится
картинка

если ϕ убывает.

Теорема 7.3.18. Пусть


⋄ 7.3.32 (циклоида). Уравнения
1) ϕ – гладкая монотонная функция на
отрезке t ∈ [α; β];
2) χ – непрерывная неотрицательная
функция на отрезке t ∈ [α; β]: χ(t) > 0.
(
x = a(t − sin t) Тогда площадь SD области, ограниченной па-
, t∈R
y = a(1 − cos t) раметризованной кривой

(
x = ϕ(t)
D: , t ∈ [α; β]
0 6 y 6 χ(t)
задают на плоскости кривую, называемую цик-
лоидой. Ее также можно построить по точкам, и равна
соответсвующая картинка будет выглядеть так:
ˆ β
SD = χ(t) d ϕ(t) (7.3.155)
α

⋄ 7.3.33 (площадь эллипса). Найдем площадь


эллипса из примера 7.3.30.

Область на плоскости можно определять па-


раметризованными кривыми. Например, систе-
ма

Для этого выделим четвертинку этой области,


определяемую системой

( (
x = ϕ(t) x = a cos t π
D: , t ∈ [α; β] D: , t ∈ [0; ]
0 6 y 6 ψ(t) 0 6 y 6 b sin t 2
460 Глава 7. ИНТЕГРАЛ

π  
3a2 1 + cos 4t
ˆ 2
= (1 − cos 2t) 1 − dt =
8 0 2
ˆ π2 2
3a
= (1 − cos 2t) (1 − cos 4t) d t =
16 0
ˆ π2
3a2
= (1 − cos 2t − cos 4t + cos 2t cos 4t) d t =
16 0
ˆ π2 
и найдем ее площадь: 3a2
= 1 − cos 2t − cos 4t+
16 0
π π

ˆ 2
ˆ 2
SD = b sin t d a cos t = ab sin2 t d t = 1
0 0
+ (cos 6t + cos 2t) d t =
2
π   π
1 − cos 2t ab sin 2t
ˆ 2 π
2
3a2
ˆ 2
= ab dt = t− = = (2 − cos 2t − 2 cos 4t + cos 6t) d t =
0 2 2 2 0
32 0
πab   π
= 3a2 1 1 1 2
4 = 2t − sin 2t − sin 4t + sin 6t =
32 6 2 6 0
Умножив это число на 4, получаем площадь эл- 3a2 π
липса: =
32
S = πab
⋄ 7.3.34. Найдем площадь фигуры, ограничен- Умножив это число на 4, получим площадь всей
ной астроидой из примера 7.3.31. фигуры:
3a2 π
S=
8

⋄ 7.3.35. Найдем площадь фигуры, ограничен-


ной аркой циклоиды
(
x = a(t − sin t)
D: , t ∈ [0; 2π]
0 6 y 6 a(1 − cos t)
Для этого выделим четвертинку, определяемую
системой
(
x = a cos3 t h πi
D: , t ∈ 0;
0 6 y 6 a sin3 t 2

Вычисляем площадь:

ˆ 2π
SD = a(1 − cos t) d a(t − sin t) =
0
и найдем ее площадь: ˆ 2π
2
=a (1 − cos t)2 d t =
π 0

ˆ 2
SD = a sin3 t d a cos3 t = 2π 
ˆ
2
0 =a 1 − 2 cos t + cos2 t d t =
0
2π  
ˆ π
2
1 + cos 2t
ˆ
2 4 2
= 3a sin t cos t d t = = a2 1 − 2 cos t + dt =
0 0 2
π  2  
ˆ 2 1 − cos 2t 1 + cos 2t 3 sin 2t 2π
= 3a 2
dt = = a2 t − 2 sin t + = 3πa2
0 2 2 2 4 0

π
3a2  ⊲⊲ 7.3.36. Найдите площади фигур, ограничен-
ˆ 2
= (1 − cos 2t) 1 − cos2 2t d t =
8 0 ных параметризованными кривыми:
§ 3. Формула Ньютона-Лейбница 461

1) x = a(t2 + 1), y = t2 (площадь петли) чается кривая:


3
b(t − 3t) (площадь пет- 3) x = 2t − t2 , y =
ли) 2t − t3 (площадь пет-
2
1 2
2) x = 3 (3 − t ), y = ли)

Площадь области в полярных координа-


тах. Положение точки A на плоскости можно
задавать не только декартовыми координатами
(то есть обычными значениями переменных x и
y), но также полярными координатами – значе- ⋄ 7.3.38 (лемниската Бернулли). Построим кри-
нием угла ϕ между лучом OX и лучом OA, со- вую, заданную уравнением в полярных коорди-
единяющим начало координат O с точкой A, и натах
p
расстояния ρ от A до начала координат O: ρ = a cos 2ϕ
Это также делается по точкам. Сначала состав-
ляется таблица (в которой знак ∄ говорит, что
для данного значения ϕ соответсвующее значе-
ние параметра ρ не определено):

ϕ 0 ± π6 ± π4 ± π3 ± π2
ρ a √a 0 ∄ ∄
2
При этом, полярные координаты связаны с
декартовыми формулами ϕ ± 2π ± 3π ± 5π ±π
( ( p 3 4 6
x = ρ · cos ϕ ρ = x2 + y 2 ρ ∄ 0 √a a
, , 2
y = ρ · sin ϕ tg ϕ = xy
Как и в случае с декартовыми координатами, Потом соответствующие точки строятся на плос-
всякое уравнение, связывающее полярные коор- кости:
динаты,
ρ = R(ϕ)
задает некоторую кривую на плоскости. Рас-
смотрим примеры.
⋄ 7.3.37 (кардиоида). Построим кривую, задан-
ную уравнением в полярных координатах
ρ = a · (1 + cos ϕ)
И в результате получается кривая:
Это можно сделать по точкам. Сначала состав-
ляется таблица

ϕ 0 ±π ±π ± π3 ± π2
 6√   4√ 
ρ 2a a 1 + 23 a 1 + 22 3a
2 a

ϕ ± 2π
3 ± 3π ± 5π ±π
 4√   6√ 
a
ρ a 1 − 22 a 1 − 23 0
2 ⋄ 7.3.39 (окружность). Построим кривую, за-
данную уравнением в полярных координатах
Потом соответствующие точки строятся на плос-
кости: ρ = a sin ϕ

Составляем таблицу

ϕ −π − 3π
4 − π2 − π4 0
ρ 0 ∄ ∄ ∄ 0

π π 3π
ϕ 4 2 4 π
ρ √a a √a 0
Эти точки соединяются плавной линией, и полу- 2 2
462 Глава 7. ИНТЕГРАЛ

(здесь знак ∄ мы пишем в случае, когда значение


ρ получается отрицательным; это должно озна-
чать, что при данном ϕ соответствующая точка
не существует, поскольку ρ есть расстояние до
нуля, и значит не может быть отрицательным).
Потом на плоскости строятся точки:

По теореме 7.3.19 получаем:


1
ˆ
SD = a2 · (1 + cos ϕ)2 d ϕ =
2 0
ˆ 2π
a2
В результате получается кривая: = · (1 + 2 cos ϕ + cos2 ϕ) d ϕ =
2 0
ˆ 2π  
a2 1 + cos 2ϕ
= · 1 + 2 cos ϕ + dϕ =
2 0 2
ˆ 2π  
a2 3 cos 2ϕ
= · + 2 cos ϕ + dϕ =
2 0 2 2
 
a2 3 sin 2ϕ ϕ=2π 3πa2
= · ϕ + 2 sin ϕ + =
2 2 4 ϕ=0 2

Нетрудно показать, что эта кривая – окруж- ⋄ 7.3.41. Вычислим площадь области, ограни-
ность. Для этого нужно перейти к декартовым ченной лемнискатой Бернулли (линией, постро-
координатам: енной нами в примере 7.3.38):
p
ρ = a sin ϕ ⇔ ρ2 = aρ sin ϕ ⇔ x2 +y 2 = ay ⇔ ρ=a cos 2ϕ
a2 a2  a 2  a 2
⇔ x2 +y 2 −ay+ = ⇔ x2 + y − =
4 4 2 2

Теорема 7.3.19. Площадь области на плоско-


сти, заданной неравенствами
(
α6ϕ6β
D:
ρ 6 R(ϕ)
Для этого достаточно найти площадь одного “ле-
пестка”:
π
1 a2 sin 2ϕ ϕ= π
ˆ 4 4
SA = a2 · cos 2ϕ d ϕ = · =
2 −π
4
2 2 ϕ=− π
4

a2 a2
= · (1 − (−1)) =
4 2

Общая площадь теперь получается удвоением


вычисляется по формуле площади одного лепестка:
β
1 SD = 2SA = a2
ˆ
SD = R(ϕ)2 d ϕ (7.3.156)
2 α
⋄ 7.3.42. Убедимся, что формула (7.3.156), бу-
⋄ 7.3.40. Вычислим площадь области, ограни- дучи применена к вычислению площади круга,
ченной кардиоидой (линией, построенной нами в построенного в примере 7.3.39, приводит к пра-
2
примере 7.3.37): вильному результату : πR2 = πa4 .

ρ = a · (1 + cos ϕ) ρ = a sin ϕ
§ 3. Формула Ньютона-Лейбница 463
p p
= 1 + e2b − 1 + e2a +
√ √
1 1 + e2b − 1 1 + e2a + 1
+ ln √ ·√
2 1 + e2b + 1 1 + e2a − 1
⋄ 7.3.45. Найдем длину куска полукубической
параболы:
3
y = x 2 , x ∈ [0; 1]
По формуле (7.3.157) имеем:
s  2
ˆ 1
3 1
π l= 1+ · x2 dx =
1 2
ˆ
0
SD = a2 · sin2 ϕ d ϕ = ˆ 1r
2 0 9
ˆ π  = 1 + · x dx =
a2 1 − cos 2ϕ 4
= · dϕ = 0
q
2 0 2 t = 1 + 94 x
 
a2 ϕ sin 2ϕ ϕ=π πa2 = x = 94 (t2 − 1) √ =
= · − = x ∈ [0; 1] ⇔ t ∈ [1; 213 ]
2 2 2 ϕ=0 4 √
13   ˆ √213
4 8
ˆ 2
⊲⊲ 7.3.43. Найдите площади фигур, ограничен- = td · (t2 − 1) = · ·t2 d t =
ных линиями: 1 9 9 1
 
√ √ !3  13√13 − 8
8 t3 2 8 
13
13
1) ρ = 4 sin2 ϕ 5) ρ = a cos 4ϕ = · = · −1 =
2) ρ = a(2 + sin ϕ) 9 3 1 27  2  27
6) ρ = a sin2 3ϕ
3) ρ = a cos ϕ
⋄ 7.3.46. Найдем длину куска обычной парабо-
4) ρ = a sin 3ϕ 7) ρ = a cos2 3ϕ
лы:
y = x2 , x ∈ [0; 1]
Длина кривой.
По формуле (7.3.157) (с использованием тожде-
Теорема 7.3.20. Если кривая задана уравнени- ства sin arctg x = √1+x x
2
) мы получаем:
ем
ˆ 1p
y = f (x), x ∈ [a; b]
l= 1 + 4x2 d x =
(в котором f – гладкая функция на отрезке 0
[a; b]), то ее длина равна 2x = tg t, t = arctg 2x ˆ arctg 4
dt dt
ˆ bq = d x = 2 cos2 t = 3t
=
−→ −− −− − −
→ 0 2 cos
l=
2
1 + (f ′ (x)) d x (7.3.157) x ∈ 0, 1 ⇔ t ∈ 0, arctg 4
a
1 arctg 4 d sin t 1 arctg 4 d sin t
ˆ ˆ
= = =
⋄ 7.3.44. Найдем длину куска экспоненты 2 0 cos4 t 2 0 (1 − sin2 t)2
y = ex , x ∈ [a, b] z = sin t, t = arcsin z
= −−−−−−→ −−−−−−−−→ −−−→ =
t ∈ 0, arctg 4 ⇔ z ∈ 0, sin arctg 4 = 0, √417
По формуле (7.3.157) имеем: ˆ √4  
1 17 dz раскладываем
p b = = на простейшие дроби =
(1 − z 2 )2
ˆ
2 0 по теореме 7.1.10
l= 1 + e2x d x = ˆ √4
a 1 17  
√ =
1 1
+
1
+
1
+
1
dz =
t = 1 + e2x , x = 12 ln(t2 − 1) 2 0 4 1−z 1+z (1 − z) 2 (1 + z) 2

= d x = tt2 d−1
t
=   √4
−→ −−−−−−−−√
√ −−−−−→ 1 1+z 1 1 17

x ∈ a, b ↔ t ∈ 1 + e , 1 + e2a 2b = · ln + − =
8 1−z 1−z 1+z 0
ˆ √1+e2b 2 ˆ √1+e2b 2 √ √ √ !
t dt t −1+1 1 17 + 4 17 17
= √ 2−1
= √ dt = = · ln √ +√ −√ =
1+e2a t 1+e 2a t2 − 1 8 17 − 4 17 − 4 17 + 4

ˆ 1+e2b  √
1  1 17 + 4 √
= √ 1+ 2 dt = = · ln √ + 17
1+e2a t −1 8 17 − 4
ˆ √1+e2b  
1 1 1  Теорема 7.3.21. Если кривая задана парамет-
= √ 1+ − dt =
1+e2a 2 t−1 t+1 рическими уравнениями
√ (
1+e2b
1 t−1 x = ϕ(t)
= t + ln = , t ∈ [α; β]
2 t + 1 √1+e2a y = χ(t)
464 Глава 7. ИНТЕГРАЛ

причем ϕ(t), χ(t) – гладкие функции на [α; β], то Теорема 7.3.22. Если кривая задана уравнени-
ее длина равна ем в полярных координатах,
β q
ρ = R(ϕ), ϕ ∈ [α; β]
ˆ
l= (ϕ′ (t))2 + (χ′ (t))2 d t (7.3.158)
α
(где R(ϕ) – гладкая функция на [α; β]), то ее
⋄ 7.3.47 (длина астроиды). Найдем длину аст- длина равна
роиды: ( ˆ βq
2
x = a cos3 t l= R(ϕ)2 + (R′ (ϕ)) d ϕ (7.3.159)
α
y = a sin3 t
⋄ 7.3.49 (длина кардиоиды). Найдем длину кар-
По формуле (7.3.158), длина четвертинки равна
диоиды:
ρ = a · (1 + cos ϕ)
l
= По формуле (7.3.159),
4
ˆ π2 q
2 2 ˆ 2π q
= (−3a cos2 t sin t) + 3a sin2 t cos t d t =
0 l= {a · (1 + cos ϕ)}2 + (a sin ϕ)2 d ϕ =
ˆ π2 p 0
= 3a cos4 t sin2 t + sin4 t cos2 t d t = ˆ 2π q
0 =a 1 + 2 cos ϕ + cos2 ϕ + sin2 ϕ d ϕ =
ˆ π2 p 0
= 3a |cos t sin t| cos2 t + sin2 t d t = ˆ 2π p
0 =a 2 + 2 cos ϕ d ϕ =
ˆ π2 √ ˆ π2 0
= 3a cos t sin t 1 d t = 3a sin t d sin t = ˆ 2π r ˆ 2π
ϕ ϕ
0 0 =a 4 cos2 d ϕ = 2a cos dϕ =
2 π 0 2 0 2
sin t 2 3a  
= 3a = разбиваем отрезок [0; 2π]
2 0 2 = на два отрезка, где cos ϕ2 =
имеет постоянный знак
Умножив на 4, получаем ответ: π 2π
ϕ ϕ
ˆ ˆ
= 2a cos d ϕ + 2a cos dϕ =
l = 6a 0 2 π 2
при ϕ ∈ [0; π] имеем
!
π
ϕ
ˆ
cos ϕ
2 = cos 2
ϕ
⋄ 7.3.48 (длина арки циклоиды). Вспомним кри- = а при ϕ ∈ [π; 2π] имеем = 2a cos d ϕ−
cos ϕ ϕ 0 2
вую из примера 7.3.35: 2 = − cos 2

ϕ ϕ π ϕ 2π
ˆ
(
x = a(t − sin t) − 2a d ϕ = 4a sin
cos − 4a sin =
, t ∈ [0; 2π] π 2 2 0 2 π
 π   
y = a(1 − cos t) 2π π
= 4a sin − 0 − 4a sin − sin =
2 2 2
По формуле (7.3.158) получаем: = 4a + 4a = 8a
2π q
⊲⊲ 7.3.50. Найдите длину кривой:
ˆ
l= a2 (1 − cos t)2 + a2 sin2 t d t =
0 1) y = 41 x2 − 21 ln x, x ∈ [1; e],
ˆ 2π p √
= a2 − 2a2 cos t + a2 cos2 t + a2 sin2 t d t = 2) y = 13 (3 − x) x, x > 0,
0 3) x = et cos t, y = et sin t, t ∈ [0; π],
ˆ 2π p
= 2a2 − 2a2 cos t d t = 4) ρ = eϕ , ϕ ∈ [0; 2π].
0
√ ˆ√ 2π
Объем тела вращения. Пусть на отрез-
=a 2 1 − cos t d t =
0 ке [a; b] задана непрерывная неотрицательная
r
√ ˆ 2π t функция f
=a 2 2 sin2 d t =
0 2
ˆ 2π ˆ 2π
t t
= 2a sin d t = 2a sin d t =
0 2
| {z } 0 2
6

0

t t t 2π
ˆ
= 4a sin d = −4a cos =
0 2 2 2 0
= −4a(cos π − cos 0) = 8a. Если ее график заставить вращаться вокруг оси
§ 3. Формула Ньютона-Лейбница 465

OX, получится поверхность, описываемая урав- Кривая, вращаемая вокруг оси, может быть
нением задана параметрически, и тогда соответствую-
щее тело вращения будет описываться системой
y 2 + z 2 = f (x)2 , x ∈ [a; b] (
x = ϕ(t)
и называемая поверхностью вращения. D: , t ∈ [α; β] (7.3.162)
y 2 + z 2 6 χ(t)2

Теорема 7.3.24. Объем тела вращения


(7.3.162) вычисляется по формуле
ˆ β
V =π χ(t)2 d ϕ(t) (7.3.163)
α

⋄ 7.3.53. Найдем объем эллипсоида, то есть те-


Эта поверхность ограничивает вместе с плоско- ла, образованного вращением эллипса
стями x = a и x = b область в терхмерном про-
(
странстве, которая называется телом вращения x = a cos t
и описывается системой неравенств
y = b sin t
(
y 2 + z 2 6 f (x)2
(7.3.160) вокруг оси OX:
a6x6b

Теорема 7.3.23. Объем тела вращения


(7.3.160) вычисляется по формуле
ˆ b
V =π f (x)2 d x (7.3.161)
a

⋄ 7.3.51. Найдем объем√тела, образованного вра-


щением параболы y = x и плоскостью x = b:
По формуле (7.3.163) получаем
ˆ π
2
V =π (b sin t) d (a cos t) =
0
ˆ π
= ab2 π sin2 t d cos t =
0
ˆ π
2

= ab π 1 − cos2 t d cos t =
0
 
По формуле (7.3.161) получаем 2 cos3 t π
= ab π cos t − =
ˆ b
√ 2
ˆ b b
3 0
π π 2  
V =π x dx = π x d x = x2 = b 2 4π 2
0 0 2 0 2 = ab2 π 2 − = ab
3 3
⋄ 7.3.52. Найдем объем тела, образованного вра-
щением полуволны синусоиды y = sin x, x ∈ ⊲⊲ 7.3.54. Найдите объем тел вращения:
[0; π]: 1) y = x3 , x ∈ [0; b]
2) y = ex , x ∈ [a; b]
3) x = a(t − sin t), y = a(1 − cos t), t ∈ [0; 2π]
4) x = a cos3 t, y = a sin3 t

Площадь поверхности вращения.

Теорема 7.3.25. Пусть f : [a, b] → R – гладкая


По формуле (7.3.161) получаем функция, причем

π π f (x) > 0, x ∈ (a.b) (7.3.164)


1 − cos 2x
ˆ ˆ
V =π sin2 x d x = π dx =
0 2 Тогда площадь поверхности вращения
0 
π sin 2x π π2
= x− = y 2 + z 2 = f (x)2 , x ∈ [a; b] (7.3.165)
2 2 0 2
466 Глава 7. ИНТЕГРАЛ

 p  ˆ 1
меняем местами
= пределы интегрирования 1 + t2 d t =
= 2π
−1
 
интегрируем по частям
= с возвращением к исходному =
интегралу (как в примере 7.1.37)
1p p  1
= t 1 + t2 + ln t + 1 + t2 =
2 −1

1 √ √ √ 
= 2 2 + ln 1 + 2 − ln −1 + 2 =
2

вычисляется по формуле √ 1 2+1 √ 1 √ 2
= 2 + ln √ = 2 + ln 2+1 =
ˆ b q 2 2−1 2
2 √ √ 
S = 2π f (x) · 1 + (f ′ (x)) d x (7.3.166)
a = 2 + ln 2+1
⋄ 7.3.55. Найдем площадь поверхности,
√ образо- Теорема 7.3.26. Пусть ϕ : [α, β] → R и χ :
ванной вращением параболы y = x, x ∈ [0; b]: [α, β] → R – две гладкие функции, причем

χ(t) > 0, t ∈ (α, β) (7.3.167)

и
ϕ′ (t) > 0, t ∈ (α, β). (7.3.168)
Тогда площадь поверхности вращения, образо-
ванной параметризованной кривой
(
По формуле (7.3.166) получаем x = ϕ(t)
D: , t ∈ [α; β] (7.3.169)
s y 2 + z 2 = χ(t)2
b  2
√ 1
ˆ
S = 2π x· 1+ √ dx = вычисляется по формуле
0 2 x
b
r ˆ br ˆ β q
√ 1 1
ˆ
2 2
= 2π 1+ x· d x = 2π x + dx = S = 2π χ(t) · (ϕ′ (t)) + (χ′ (t)) d t (7.3.170)
0 4x 0 4 α
ˆ br     23
1 1 2 1 b ⋄ 7.3.57. Найдем площадь поверхности, образо-
= 2π x+ d x+ = 2π x+ = ванной вращением астроиды
0 4 4 3 4 0
(  3   23 ) (
4π 1 2 1 x = a cos3 t
= b+ − =
3 4 4 y = a sin3 t
(  23 )
4π 1 1 вокруг оси OX:
= b+ −
3 4 8

⋄ 7.3.56. Найдем площадь поверхности, обра-


зованной вращением полуволны синусоиды y =
sin x, x ∈ [0; π]:

По формуле (7.3.170) получаем площадь поло-


винки равна

S
=
2
По формуле (7.3.161) получаем ˆ π
2
q
= 2π a sin3 t · (−3a cos2 t sin t)2 + (3a sin2 t cos t)2 d t =
0
ˆ p π ˆ π p
S = 2π sin x · 1 + cos2 x d x = = 2π 2
a sin3 t · 9a2 cos4 t sin2 t + 9a2 sin4 t cos2 t d t =
0 0
ˆ πp ˆ π
2 p
= −2π 1 + cos2 x d cos x = = 6a2 π sin3 t · | cos t sin t| cos2 t + sin2 t d t =
0 0

cos x = t
ˆ −1 p ˆ π
2
= x ∈ [0; π] ⇔ t ∈ [1; −1] = −2π 1 + t2 d t = = 6a2 π sin3 t · cos t sin t · 1 · d t =
1 0
§ 3. Формула Ньютона-Лейбница 467
ˆ π
2

= 6a π 2
sin4 t · cos t d t =
0 xk π xk
π < <
ˆ 2 sin5 t π
2
2k + 1 2 2k
= 6a2 π sin4 t d sin t = 6a2 π = ⇓
0 5 0
6 2 2k π 2k xk xk π
= a π · < · = <
5 2k + 1 |{z}
2 2k + 1 2k 2k + 1 2

>
Отсюда полная площадь xk
2k

12 2 ⇓
S= a π
5 2k π xk π
· < <
⊲⊲ 7.3.58. Найдите площади поверхностей, обра- 2k + 1
| {z } 2 2k + 1 2
зованных вращением следующих кривых вокруг ↓
оси OX: 1

1) x = a cos t, y = b sin t ⇓
2) x = a(t − sin t), y = b(1 − cos t), t ∈ [0; 2π] xk π
−→
ex +e−x
2k + 1 k→∞ 2
3) y = ch x = 2 ,x ∈ [a; b]

Формула Стирлинга. Закончить разговор о Доказательство формулы Стирлинга. Обо-


приложениях интеграла будет поучительно зна- значим
n! · en
менитой формулой Стирлинга, описывающей xn = n+ 1
асимптотическое поведение факториала: n 2
√ Из маклореновского разложения для логарифма
nn · 2πn (10.2.77) получаем такую цепочку:
n! ∼ (7.3.171)
n→∞ en ∞
X xm
Для ее доказательства нам понадобится еще од- ln(1 + x) = (−1)m−1 · , x ∈ (0, 1).
m=1
m
но соотношение, называемое формулой Валлиса:
 2 ⇓
1 (2k)!! π
· −→ (7.3.172)
2k + 1 (2k − 1)!! k→∞ 2
1+x
ln = ln(1 + x) − ln(1 − x) =
Доказательство формулы Валлиса. Здесь при- 1−x
X∞ ∞ 
X 
меняется формула (7.3.138). Обозначим xm xm
= (−1)m−1 · − − =
 2 m=1
m m=1
m
(2k)!! ∞
xk = X x2k
(2k − 1)!! 2x ·
= |{z} > 2x · |{z}
1 = 2x
2k + 1
k=0 | {z } k=0
<

Тогда:
<

0
h πi 0
sin2k+1 x < sin2k x < sin2k−1 x, x ∈ 0,
2 ⇓ подстановка: x =
1
2n + 1
⇓   1
1 1+ 2n+1 2 1
ln 1 + = ln 1 > = 1
ˆ π ˆ π n 1− 2n+1
2n + 1 n+ 2
2 2
sin2k+1 x d x < sin2k x d x < ⇓
0 0
π  n+ 21    
1 1 1
ˆ 2
< sin2k−1 x d x ln 1 + = n+ · ln 1 + >1
0
n 2 n

⇓ (7.3.138)
 n+ 21
(2k)!! (2k − 1)!! π (2k − 2)!! 1
< · < 1+ >e
(2k + 1)!! (2k)!! 2 (2k − 1)!! n


 2  2
1 (2k)!! π 1 (2k)!! n!·en 1
· < < · xn nn+ 2
1
(n + 1)n+1+ 2
2k + 1 (2k − 1)!! 2 2k (2k − 1)!! = (n+1)!·en+1
= 1 =
| {z } | {z } xn+1 1 (n + 1) · nn+ 2 · e
xk xk (n+1)n+1+ 2
468 Глава 7. ИНТЕГРАЛ

1  n+ 12  2
1 (n + 1)n+ 2 1 1 1 2k · k! · 2k−1 · (k − 1)!
= · 1 = · 1 + >1 = · =
e nn+ 2 e n 2k + 1 (2k − 1)!
 k 2
⇓ 1 2 · k! · 2k · k!
= · =
xn > xn+1 2k + 1 2k · (2k − 1)!
24k (k!)4 (7.3.173)
Мы получили, что {xn } – убывающая и ограни- = · 2 ∼
ченная снизу нулем последовательность. Значит, 2k + 1 k→∞
(2k)!
у нее имеется предел:  4
1
kk+ 2
n! · en a · ek 4k+2
xn = −→ a 24k 24k a4 · k e4k
nn+ 2
1
n→∞ ∼ · 2 = · 4k+1 =
k→∞ 2k 1
(2k)2k+ 2
2k a2 · (2k)4k
a · e2k e
Это соотношение можно понимать как эквива-
лентность
24k a2 · k 4k+2 24k a2 · k 4k+2 a2
n+ 21 = · = · 4k+1 4k+1 =
n 2k (2k) 4k+1 2k 2 ·k 4
n! ∼ a · , (7.3.173)
n→∞ en
в которой a ∈ R – пока неизвестное число. Для ⇓
его нахождения и нужна доказанная выше фор-
мула Валлиса (7.3.172): 2π = a2
 2 ⇓
π 1 (2k)!!
←− · = (2.2.257) = √
2 ∞←k 2k + 1 (2k − 1)!!
 2 2π = a
1 (2k)!! · (2k − 2)!!
= · = (2.2.256) = Это превращает (7.3.173) в (7.3.171).
2k + 1 (2k − 1)!
Глава 8

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ
И ЧИСЛОВЫЕ РЯДЫ

§1 Несобственные интегралы
Несобственный интеграл формализует в математическом анализе идею площади неограниченной
фигуры.

⋄ 8.1.1. В предыдущей главе мы изучали опре- нейной трапеции, ограниченной кривой y = √1


x
деленный интеграл, геометрический смысл кото-
рого – площадь криволинейной трапеции. Рас-
смотрим теперь какую-нибудь неограниченную
криволинейную трапецию (то есть такую, кото-
рая не лежит ни в каком прямоугольнике)

то Вас наверняка удивит наблюдение, что эта


площадь конечна и равна 2 (хотя сама фигура
неограничена).
Дело в том, что эту величину можно посчи-
тать как предел площадей ограниченных криво-
линейных трапеций:

Ее площадь будет непонятно чему равна, потому


что определенный интеграл от неограниченной
функции не существует (по теореме 7.2.2).

Тем более неожиданным должно быть наблю- ˆ 1


дение, что у некоторых неограниченных криво- 1 √ 1
S = lim √ d x = lim 2 x =
линейных трапеций все-таки имеется конечная t→+0 t x t→+0 t
 √
площадь. Точнее, понятие площади можно обоб-
= lim 2 − 2 t = 2
щить таким образом, что некоторые неограни- t→+0
ченные криволинейные трапеции будут иметь ко-
нечную площадь. Например, если Вы задумае- ⋄ 8.1.2. С другой стороны, если вместо кривой
тесь, чему должна быть равна площадь криволи- y = √1x взять ничем особенным, как будто, не

469
470 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

отличающуюся от нее кривую y = x1 , на полуинтервале [0; +∞):

Ее можно вычислить как предел площадей полу-


чающихся, когда x бегает по отрезкам [0, t], при
то окажется, что соответствующая площадь, по- t → ∞,
считанная тем же способом бесконечна:

1 1
1
ˆ
S = lim d x = lim ln x =
t→+0 t x t→+0 t

= lim (ln 1 − ln t) = +∞
t→+0

π
и оказывается, что она равна 2:

+∞ t
dx dx
ˆ ˆ
= lim =
0 1 + x2 t→+∞ 0 1 + x2
⋄ 8.1.3. Еще один пример – площадь криволи- t π
1
нейной трапеции, ограниченной кривой y = 1+x = lim arctg x = lim arctg t =
2 t→+∞ 0 t→+∞ 2

После этих примеров естественно спросить, какой должна быть неограниченная криволинейная
трапеция, чтобы ее площадь была конечна? И чему равны площади конкретных неограниченных
криволинейных трапеций? Об этом мы поговорим в настоящей главе.

(a) Определение несобственного интеграла и его свойства


Начнем со следующего определения.

• Функция f называется локально интегрируемой на множестве E, если она определена


на E и интегрируема на любом отрезке [a, b], содержащемся в E.

⋄ 8.1.4. Функция ⋄ 8.1.5. Функция Дирихле, которую мы опреде-


( ляли формулой (3.1.4),
1
x, x 6= 0 (
f (x) =
0, x=0 1, x ∈ Q
D(x) =
/Q
0, x ∈
конечно, не интегрируема на отрезке [0, 1] (по-
тому что не ограничена на нем). Но она локаль- не будет локально интегрируемой, например на
но интегрируема на полуинтервале (0, 1] (потому R, потому что она не интегрируема ни на каком
что непрерывна на (0, 1]). отрезке.

Несобственный интеграл по конечному промежутку.


§ 1. Несобственные интегралы 471

• Пусть функция f локально интегрируема на полуинтервале (a; b], где a, b – произвольные


числа. Тогда предел
ˆ b
lim f (x) d x
t→a+0 t

называется несобственным интегралом от f по конечному промежутку (a; b] и обозна-


чается ˆ b
f (x) d x
a
Если этот предел существует и конечен, то говорят, что несобственный интеграл схо-
дится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
• Аналогично, если f локально интегрируема на полуинтервале [a; b), то предел
ˆ t
lim f (x) d x
t→b−0 a

называется несобственным интегралом от f по конечному промежутку [a; b) и обозна-


чается ˆ b
f (x) d x
a
и опять если этот предел существует и конечен, то говорят, что несобственный интеграл
сходится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
Рассмотрим примеры.

⋄ 8.1.6. = cos 1 − lim cos y


y→+∞
  | {z }
1 1 x=1
dx dx 1
ˆ ˆ
предел не существует
= lim = lim − =
0 x2 t→+0 t x2 t→+0 x x=t
  Вывод: интеграл расходится.
1
= lim −1 + = +∞ ⋄ 8.1.9.
t→+0 t
1 ˆ 12
Вывод: интеграл расходится. dx dx
ˆ 2
= lim =
⋄ 8.1.7. 0 x ln2 x t→+0 t x ln2 x
ˆ 21
d(ln x) 1 12
ˆ 1
dx
ˆ t
dx = lim = − lim =
√ = lim √ = t→+0 t ln2 x t→+0 ln x t
 
0 1 − x2 t→1−0 0 1 − x2 1 1 1
x=t = lim − 1 =
t→+0 ln t ln 2 ln 2
= lim arcsin x = lim (arcsin t − 0) =
t→1−0 x=0 t→1−0
π Вывод: интеграл сходится и равен 1
= arcsin 1 = ln 2 .
2
π ⊲⊲ 8.1.10. Вычислите интегралы или установите
Вывод: интеграл сходится и равен 2. их расходимость:
⋄ 8.1.8. ´π
1) 04 ctg x d x
´ 1 dx
ˆ
sin x1 d x
1 ˆ 1
sin x1 d x 2) 0 √x1−x 2
= lim =
0 x2 t→+0 t x2 ´ 4 dx
3) 0 x+√x
ˆ 1
1 1 1 1 ´1
= − lim sin d = lim cos = 4) 02 x dlnxx
t→+0 t x x t→+0 x t
´0 1
1
t =y
5) −1 e x dx2x
 
1 t = y1 ´1 1
= lim cos 1 − cos = = 6) 0 e x xd 2x
t→+0 t t → +0 ´ π sin x+cos x
y → +∞ 7) 04 √ 3
sin x−cos x
472 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Несобственный интеграл по бесконечному промежутку. Выше мы определили несобствен-


ный интеграл по конечному промежутку, формализующий понятие площади криволинейной тра-
пеции специального вида: основанием такой трапеции является конечный полуинтервал, а “по вер-
тикали” эта фигура может быть неограничена (такие фигуры мы описывали в примерах 8.1.1 и
8.1.2).
Но помимо таких криволинейных трапеций можно рассматривать другие, основаниями которых
являются бесконечные полуинтервалы, и которые поэтому “неограничены по горизонтали” (эту си-
туацию мы описывали в примере 8.1.3). Соответствующий математический объект, формализующий
это понятие также называется неопределенным интегралом, но уже по бесконечному промежутку.

• Пусть функция f локально интегрируема на полуинтервале [a; +∞), где a – произвольное


число. Тогда предел
ˆ t
lim f (x) d x
t→+∞ a

называется несобственным интегралом от f по бесконечному промежутку [a; +∞) и


обозначается
ˆ +∞
f (x) d x
a

Если этот предел существует и конечен, то говорят, что несобственный интеграл схо-
дится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.
• Аналогично, если f локально интегрируема на полуинтервале (−∞; a], то предел
ˆ b
lim f (x) d x
t→−∞ t

называется несобственным интегралом от f по бесконечному промежутку (−∞; a] и


обозначается
ˆ b
f (x) d x
−∞

и опять если этот предел существует и конечен, то говорят, что несобственный интеграл
сходится, а если не существует или бесконечен, то говорят, что несобственный интеграл
расходится.

Рассмотрим примеры.

+∞ t
⋄ 8.1.11.
ˆ ˆ
cos x d x = lim cos x d x =
ˆ +∞ ˆ t 0 t→+∞ 0
dx dx t
= lim = = − lim sin x = − lim sin t
1 x t→+∞ 1 x t→+∞ 0 t→+∞
t | {z }
= − lim ln x = − lim ln t = ∞ предел не существует
t→+∞ 1 t→+∞

Вывод: интеграл расходится. Вывод: интеграл расходится.


⋄ 8.1.12.
ˆ 0 ⊲⊲ 8.1.14. Вычислите интегралы или установите
ˆ 0 0 их расходимость:
ex d x = lim ex d x = lim ex =
−∞ t→−∞ t t→−∞ t
t

= lim 1 − e = 1 ´ +∞ arctg x d x
´ +∞
t→−∞ 1) 2 x2 +1 4) 0 xex d x
´ +∞ d x
Вывод: интеграл сходится и равен 1. ´ +∞ 5) e
2) ex d x ´ +∞ xx lnd xx
0 6) 3 2
⋄ 8.1.13. ´0 ´ 0 x −1 dx
3) −∞
ex d x 7) −∞ x2 +2x+2
§ 1. Несобственные интегралы 473

(b) Несобственные интегралы от степенной и показательной функций


Мы видели, что несобственный интеграл может сходиться, а может расходиться. Здесь мы поймем,
в каких случаях сходится интеграл от конкретных двух функций – x1α и ax .

Теорема 8.1.1 (о несобственном интеграле по 2) Если α = 1, то интеграл расходится:


конечному промежутку от степенной функции).
ˆ b ( ˆ +∞
dx
ˆ +∞
dx
dx сходится, если α < 1 = =
α
←− a xα a x
0 x расходится, если α > 1 t
dx x=t
ˆ
Доказательство. Рассмотрим три случая. = lim = lim ln x =
t→+∞ a x t→+∞ x=a
1) Если α < 1, то интеграл сходится:
= lim {ln t − ln a} = ∞
ˆ b ˆ b ˆ b t→+∞
dx −α
α
= x d x = lim x−α d x = 3) Если α < 1, то интеграл расходится:
0 x 0 t→+0 t

x1−α x=b +∞ ˆ +∞
= lim = dx
ˆ
t→+0 (1 − α) x=t
α
= x−α d x =
 1−α  a x a
b t1−α ˆ t
= lim − = x1−α d x x=t
t→+0 (1 − α) (1 − α) = lim x−α d x = lim =
1 − α > 0 t→+∞ a t→+∞ (1 − α) x=a
b1−α  1−α   
= поэтому = t a1−α 1−α>0
t1−α → 0 (1 − α) = lim − = 1−αпоэтому =∞
t→+∞ (1 − α) (1 − α) t →∞
2) Если α = 1, то интеграл расходится:
ˆ b ˆ b ˆ b
dx dx dx
α
= = lim = Теорема 8.1.3 (о несобственном интеграле от
0 x 0 x t→+0 t x
x=b
показательной функции).
= lim ln x = lim {ln b − ln t} = ∞ (
t→+0 x=t t→+0 ˆ +∞
x сходится, если 0 < A < 1
3) Если α > 1, то интеграл расходится: A d x ←−
a расходится, если A > 1
ˆ b ˆ b ˆ b
dx −α Доказательство. Рассмотрим три случая.
α
= x d x = lim x−α d x =
0 x 0 t→+0 t 1) Если 0 < A < 1, то интеграл сходится:
x1−α d x x=b
= lim = ˆ +∞ ˆ t
t→+0 (1 − α) x=t
 1−α  1−α <0 Ax d x = lim Ax d x =
b d x t1−α d x a t→+∞ a
= lim − = 1−α поэтому = Ax t 1
t→+0 (1 − α) (1 − α) t →∞
= lim = lim (At − Aa ) =
=∞ t→+∞ ln A a ln A t→+∞
0 < A < 1
Aa
= поэтому = −
At → 0 ln A
Теорема 8.1.2 (о несобственном интеграле по
бесконечному промежутку от степенной функ- 2) Если A = 1, то интеграл расходится:
ции).
(
ˆ +∞ ˆ +∞ ˆ t
ˆ +∞
dx сходится, если α > 1 Ax d x = 1 d x = lim 1 dx =
←− a a t→+∞ a

a расходится, если α 6 1 x t t−a
= lim = lim = +∞
Доказательство. Рассмотрим три случая. t→+∞ ln A a t→+∞ ln A
1) Если α > 1, то интеграл сходится:
3) Если A > 1, то интеграл расходится:
ˆ +∞ ˆ +∞ ˆ t
dx −α
= x d x = lim x−α d x = ˆ +∞ ˆ t
a xα a t→+∞ a Ax d x = lim Ax d x =
t→+∞
x1−α d x x=t a a
= lim = Ax t 1
t→+∞ (1 − α) x=a = lim = lim (At − Aa ) =
 1−α    t→+∞ ln A a ln A t→+∞
t a1−α 1−α<0  A>1 
= lim − = поэтому =
t→+∞ (1 − α) (1 − α) t1−α → 0 = поэтому
t
=∞
A →∞
t1−α
=
(1 − α)
474 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

(c) Замена переменной в несобственном интеграле


Если функции f и g определены на полуинтервале [a; b), то символом
ˆ b
f (x) d g(x)
a

обозначается несобственный интеграл от функции f · g ′ по [a; b):


ˆ b ˆ b ˆ t

f (x) d g(x) := f (x) · g (x) d x = lim f (x) · g ′ (x) d x
a a t→b−0 a

   
2 t 2
⋄ 8.1.15. = lim − 1 = lim 2− 1 =2
ˆ +∞ ˆ +∞ ˆ t t→+∞ x2 1 t→+∞ t2
1 1 1
√ d ln x = 3 d x = lim 3 dx =
1 x 1 x2 t→+∞ 1 x 2

Теорема 8.1.4 (о замене переменной в несобственном интеграле). Пусть даны:


1) функция f , непрерывная на полуинтервале [a; b)
2) функция ϕ, определенная на полуинтервале [α; β), со следующими свойствами:
a) ϕ дифференцируема на полуинтервале [α; β) (то есть ϕ дифференцируема на
интервале (α; β), и в точке α имеет левую производную);
b) ∀t ∈ [α; β) ϕ(t) ∈ [a; b);
c) ϕ(α) = a, ϕ(t) −→ b.
t→β−0

Тогда ˆ b ˆ β ˆ β
f (x) d x = f (ϕ(t)) d ϕ(t) = f (ϕ(t)) · ϕ′ (t) d t (8.1.1)
a α α

Доказательство. Здесь используется тот же прием, что и при доказательстве теоремы 7.3.5 о за-
мене переменной в определенном интеграле.1 Пусть F – первообразная функции f на полуинтервале
[a, b):
F ′ (x) = f (x), x ∈ [a, b) (8.1.2)
Например, в качестве F можно взять интеграл с переменным верхним пределом:
ˆ ˆ x
F (x) = f (t) d t = f (t) d t, x ∈ [a, b)
[a,x] a

(тогда по теореме 7.3.1 F будет первообразной для f на каждом отрезке [a, c] ⊆ [a, b), и значит,
на всем полуинтервале [a, b)). Композиция F ◦ ϕ будет первообразной для функции (f ◦ ϕ) · ϕ′ , на
полуинтервале [α, β), по формуле (5.1.28):

(F ◦ ϕ)′ (t) = F ′ ( ϕ(t) ) · ϕ′ (t) = f (ϕ(t)) · ϕ′ (t), t ∈ [α, β) (8.1.3)


|{z}

[a, b)
k
D(F ′ )

Поэтому
ˆ β ˆ T t=T
f (ϕ(t)) · ϕ′ (t) d t = lim f (ϕ(t)) · ϕ′ (t) d t = (7.3.127) = lim (F ◦ ϕ)(t) =
α T →β−0 α T →β−0 t=α

1 Можно использовать теорему 7.3.5 напрямую, но для этого нужно ввести дополнительное условие, что функция

ϕ : [α, β) → [a, b) монотонна, чтобы для всякого T ∈ [α, β) ограничение ϕ|[α,T ] было отображением из [a, T ] в [a, ϕ(T )]
−−→ −−−−→
(и поэтому преобразованием ориентированного отрезка α, T в ориентированный отрезок a, ϕ(T )).
§ 1. Несобственные интегралы 475
     
= lim F ϕ(T ) − F ϕ(α) = lim F ϕ(T ) − F (a) = (7.3.127) =
T →β−0 | {z } T →β−0

=
(7.3.133)
a
ˆ ϕ(T ) ˆ y ˆ b
= lim f (x) d x = lim f (x) d x = f (x) d x
T →β−0 a y→b−0 a a

⋄ 8.1.16. ⋄ 8.1.17.
+∞ x = 1t , 1
dx t= x
ˆ
1 √
√ = x = 2 ⇔ t = 12 =
ˆ
dx t = 1 − x, x = 1 − t2
2 x x2 − 1 x → +∞ ⇔ t → +0 √ = x=0⇔t=1 =
0 ˆ 21 1 0 (2 − x) 1 − x x → 1 − 0 ⇔ t → +0
− dt dt π
ˆ
2 ˆ 0 ˆ 1
= √ = √ = arcsin t = −t d t dt 1 π
1 1−t 2
0 1−t 2 0 6 = 2 + 1)
= 2+1
= arctg t =
2
1 t(t 0 t 0 2

(d) Признаки сходимости несобственных интегралов


Не всякий несобственный интеграл можно явно вычислить, даже если известно, что он сходится.
Например, попробуйте найти несобственный интеграл
1
sin2 x1
ˆ
√ dx (8.1.4)
0 x

и Вы увидите, что это нелегко. Поэтому часто бывает важно просто понять, сходится или нет
данный несобственный интеграл, не вычисляя его. Например, интеграл (8.1.4), как будет показано
в примере 8.1.19 сходится (хотя и непонятно, чему равен).
В этом параграфе мы приведем некоторые признаки сходимости несобственных интегралов.

Признаки сходимости знакопостоянных интегралов


´b
• Несобственный интеграл a f (x) d x называется
— знакопостоянным, если его подынтегральная функция f не меняет знак на про-
межутке интегрирования;
— знакоположительным, если его подынтегральная функция f неотрицательная
на промежутке интегрирования

f (x) > 0, x ∈ (a, b)

Понятно, что исследование на сходимость знакопостоянных интегралов сводится исследованию


знакоположительных: если f (x) 6 0, то можно взять функцию g(x) = −f (x) > 0, и окажется, что
ˆ b ˆ t ˆ t ˆ b
f (x) d x = lim f (x) d x = − lim g(x) d x = − g(x) d x
a t→b−0 a t→b−0 a a

откуда и будет следовать, что интеграл


ˆ b
f (x) d x
a

сходится тогда и только тогда, когда сходится интеграл


ˆ b
g(x) d x
a
476 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Критерий сходимости знакоположительного интеграла.

Теорема 8.1.5. Пусть функция f локально интегрируема и неотрицательна на полуинтервале


[a; b)
f (x) > 0, x ∈ [a, b)
´b ´t
Тогда сходимость интеграла a f (x) d x эквивалентна ограниченности интегралов a f (x) d x, t ∈
[a, b):
ˆ b ˆ t
f (x) d x сходится ⇐⇒ sup f (x) d x < ∞
a t∈[a,b) a

´b
! 8.1.18. Условие справа (то есть утверждение, что интегралы a f (x) d x ограничены) принято
записывать неравенством
ˆ b
f (x) d x < ∞
a
´b
и, в силу теоремы 8.1.5, такая запись считается эквивалентной утверждению, что интеграл a f (x) d x
сходится (при неотрицательной f ).

Доказательство. Обозначим
ˆ t
F (t) = f (x) d x
a

и заметим, что это будет монотонно неубывающая функция, поскольку под интегралом стоит неот-
рицательная функция: если α 6 β, то
ˆ α ˆ α ˆ β ˆ β
F (α) = f (x) d x 6 f (x) d x + f (x) d x = f (x) d x = F (β)
a a
|α {z } a
6

Отсюда мы получим цепочку:


ˆ b
интеграл f (x) d x сходится
a

m
ˆ t
F имеет конечный предел слева в b: lim F (t) = lim f (x) d x < ∞
t→b−0 t→b−0 a
| {z }
(применяем (3.4.151), поскольку F – неубывающая функция) k
sup F (t)
t∈[a,b)

m
ˆ t
sup f (x) d x = sup F (t) < ∞.
t∈[a,b) a t∈[a,b)

Признак сравнения интегралов.

Теорема 8.1.6 (признак сравнения несобственных интегралов). Пусть f и g – локально интегри-


руемые функции на полуинтервале [a; c) (где c – число или символ бесконечности +∞), причем

0 6 f (x) 6 g(x), x ∈ [a; c) (8.1.5)


Соответствующая зависимость между несобственными интегралами коротко записывается
следующим образом: ˆ c ˆ c
f (x) d x 6 g(x) d x
a a

Тогда
§ 1. Несобственные интегралы 477
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a f (x) d x: ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится
a a
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится
a a

Доказательство. Обозначим
ˆ t ˆ t
F (t) = f (x) d x, G(t) = g(x) d x
a a

тогда из (8.1.5) следует, что, во-первых, как и в доказательстве теоремы 8.1.5,

F (t) и G(t) − неубывающие функции на промежутке t ∈ [a; c), (8.1.6)

и, во-вторых,
0 6 F (t) 6 G(t), t ∈ [a; c). (8.1.7)
1. Теперь мы получаем цепочку:
ˆ c
g(x) d x сходится
a

⇓ теорема 8.1.5
ˆ t
sup G(t) = sup g(x) d x < ∞
t∈[a,b) |{z} t∈[a,b) a
6

(8.1.7)
F (t)


ˆ t
sup F (t) = sup f (x) d x < ∞
t∈[a,b) t∈[a,b) a

⇓ теорема 8.1.5
ˆ c
f (x) d x сходится
a

´ c 2. Мы доказали утверждение (i). ´ c Утверждение (ii) является его следствием: если интеграл
a
f (x) d x расходится, то интеграл g(x) d x не может сходиться (потому что иначе мы получили
´c ´c a
бы что a f (x) d x расходится, а a g(x) d x сходится, а это невозможно в силу уже доказанного
утверждения 2 (A)).

⋄ 8.1.19. Чтобы понять, сходится ли интеграл причем больший интеграл сходится по теореме
8.1.1. Значит, по теореме 8.1.6, наш исходный ин-
sin2 x1
ˆ 1
√ dx теграл тоже сходится.
0 x ´ 1 sin2 1
Вывод: интеграл 0 √xx d x сходится.
заметим, что подынтегральная функция поло-
жительна и меньше функции √1x :
⋄ 8.1.20. Для следующего интеграла
sin2 1 1
06 √ x 6 √
x x 1
1
ˆ
Отсюда получаем dx
0 sin x
sin2 x1
ˆ 1 ˆ 1
1
06 √ dx 6 √ dx мы аналогичные рассуждения запишем более ко-
0 x 0 x
478 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

ротко: ⋄ 8.1.22. Снова рассмотрим интеграл по беско-


1 1
1 1 нечному промежутку:
ˆ ˆ
dx > dx
0 sin x x
|0 {z } +∞ +∞
3 + cos x 2
ˆ ˆ
расходится по √ dx > √ dx =
теореме 8.1.1 π x π x
ˆ +∞
Вывод: интеграл
´1 1
d x расходится. 1
0 sin x =2 1 dx
x2
⋄ 8.1.21. Теперь рассмотрим интеграл по беско- | π {z }
расходится по
нечному промежутку: теореме 8.1.2

+∞ +∞
3 + cos x 4
ˆ ˆ ´ +∞ 3+cos
√ x
√ dx 6 √ dx = Вывод: интеграл π x
d x расходится.
π x x π x x
⊲⊲ 8.1.23. Исследуйте на сходимость интегралы:
ˆ +∞
1
=4 3 dx

| π x
{z
2
} ´ +∞ sin2 x ´1 cos x 1
1) π x2 d x; 4) 0
√ 3 x d x;
сходится по
теореме 8.1.2
´ +∞ ln x ´ 1 e x1
2) e 3 x d x;

5) d x;
0 x3
´ +∞ 3+cos
´ +∞ arctg x ´ 0 e x1
Вывод: интеграл √ x d x сходится. 3) d x; 6) −1 x3 d x

π x x 2 x x

Критерий Коши сходимости несобственного интеграла


Теперь от знакопостоянных интегралов мы возвращаемся к произвольным.

Теорема 8.1.7 (критерий Коши сходимости несобственного интеграла). 2 Пусть функция f ло-
кально интегрируема на полуинтервале [a; b). Тогда следующие условия эквивалентны:
(i) несобственный интеграл
ˆ b
f (x) d x
a

сходится;
(ii) для любых двух числовых последовательностей sn , tn ∈ [a; b), стремящихся к b

sn −→ b, tn −→ b,
n→∞ n→∞

интеграл от функции f по отрезку [sn ; tn ] стремится к нулю при n → ∞:


ˆ tn
f (x) d x −→ b
sn n→∞

Доказательство. Рассмотрим функцию


ˆ t
F (t) = f (x) d x
a

Тогда мы получим следующую логическую цепочку:


ˆ b
несобственный интеграл f (x) d x сходится
a

существует конечный предел lim F (t)


t→b−0

m (теорема 3.4.12)

2 Этот результат понадобится ниже при доказательстве признака абсолютной сходимости несобственного интеграла

(теорема 8.1.8)
§ 1. Несобственные интегралы 479

∀sn −→ b, ∀tn −→ b F (tn ) − F (sn ) −→ 0


n→∞ n→∞ | {z } n→∞

=
´ tn ´ sn
a
f (x) d x − a
f (x) d x

=
´ tn
sn
f (x) d x

m
ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞

( 2  )
⋄ 8.1.24. Критерий Коши обычно бывает удобен 1 5π π 2
для доказательства расходимости несобственно- = + 2πn − + 2πn =
4 6 6
го интеграла (если он действительно расходит-
ся). Рассмотрим, например, интеграл 1 n 25π 2 5
= + π 2 n + π 2 · n2 −
ˆ +∞ 4 36 3
π2 1 2 o
x · sin x d x = − π n − π 2 · n2 =
0 36 3
Выберем следующие две числовые последова- 1 n 24π 2 4 o
= + π 2 n −→ ∞ = 6 0,
тельности: 4 36 3 n→∞

π 5π
sn = + 2πn, tn = + 2πn и по признаку Коши это означает, что наш инте-
6 6
грал расходится.
Тогда ´ +∞
Вывод: интеграл 0 x · sin x d x расходится.
1
∀x ∈ [sn ; tn ] sin x >
2
поэтому ⊲ 8.1.25. Проверьте по критерию Коши, что ин-
ˆ tn ˆ tn теграл
1 ˆ +∞
x · sin x d x > x · dx =
sn sn 2 x · cos x d x
0
x2 5π
6 +2πn
= = расходится.
4 π
6 +2πn

Признак абсолютной сходимости


Теорема 8.1.8 (признак абсолютной сходимости). Пусть функция f локально интегрируема на
полуинтервале [a; b). Тогда справедливы импликации:
ˆ b ˆ b ˆ t
f (x) d x сходится ⇐= |f (x)| d x сходится ⇐= sup |f (x)| d x < ∞
a a t∈[a,b) a

Доказательство.
ˆ b
интеграл |f (x)| d x сходится
a

⇓ (теорема 8.1.7)
ˆ tn
∀sn −→ b, ∀tn −→ b |f (x)| d x −→ 0
n→∞ n→∞ sn n→∞
| {z }
6

´ tn
sn
f (x) d x
6


ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞
480 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ


ˆ tn
∀sn −→ b, ∀tn −→ b f (x) d x −→ 0
n→∞ n→∞ sn n→∞

⇓ (теорема 8.1.7)
ˆ b
несобственный интеграл f (x) d x сходится
a

⋄ 8.1.26. Чтобы исследовать на сходимость исследуется тем же способом:


несобственный интеграл ˆ +∞ ˆ +∞
sin x 1
ˆ 1 0 6 2
d x 6 2
dx
1 1 x 1 x
sin d x
0 x
По признаку сравнения для знакопостоянных
рассмотрим соответствующий интеграл от моду- интегралов (теорема 8.1.6), из сходимости боль-
´ +∞ 1
ля шего интеграла – 1 x2 d x – следует сходи-
´ +∞ sinx
ˆ 1
1
ˆ 1 мость меньшего – 1 x2 d x. Отсюда по при-
06 sin dx 6 1 dx знаку абсолютной сходимости (теорема 8.1.8)
0 x 0 ´ +∞ sin x
Вывод: интеграл 1 x2 d x сходится.
и применим признак сравнения для знакопо-
стоянных интегралов (теорема 8.1.6): посколь- ⊲⊲ 8.1.28. Исследуйте на сходимость интегра-
´1
ку больший интеграл – 0 1 d x = 1 – сходится, лы:
´1 ´ +∞
меньший – 0 sin x1 d x – тоже должен сходить- 1) 0 e−x cos x d x;
ся. Отсюда по признаку абсолютной сходимости ´ +∞ √x cos x
2) 2 x2 +x+ln x d x;
(теорема 8.1.8) получаем √
´1 ´ +∞ (1+ x+ln x) sin x
Вывод: Интеграл 0 sin x1 d x сходится. 3) 2 x2 +x3 +x4 d x;
´ 1 cos x1
4) 0 √x+x+x2 d x;
⋄ 8.1.27. Интеграл
´ 1 cos x1
ˆ +∞ 5) 0 e√x −1 d x;
sin x √
x sin x12
dx ´ 1
6) 0 ln(1+x+x
x 2 2 ) d x.
1

Формула Бонне и признаки Дирихле и Абеля для интегралов.


Лемма 8.1.9. Если f – интегрируемая, а g – монотонная функции на ориентированном отрезке

− →

ab, то найдется точка ξ ∈ ab такая, что
ˆ b ˆ ξ ˆ b
f (x) · g(x) d x = g(a) · f (x) d x + g(b) · f (x) d x (8.1.8)
a a ξ

• Равенство (8.1.8) называется формулой Бонне3 .

Доказательство. Пусть для начала a < b. Рассмотрим функцию


ˆ t ˆ b
F (t) = g(a) · f (x) d x + g(b) · f (x) d x
a t

По свойству непрерывности интеграла 60 на с.435, это будет непрерывная функция на отрезке [a, b].
На концах этого отрезка она принимает такие значения:
ˆ b ˆ b
F (a) = g(b) · f (x) d x, F (b) = g(a) · f (x) d x
a a
3 П.О.Бонне (1819-1892) – французский математик
§ 1. Несобственные интегралы 481

Предположим теперь, что g – неубывающая функция на [a, b]. Тогда

g(a) 6 g(x) 6 g(b), x ∈ [a, b]


g(a) · f (x) 6 g(x) · f (x) 6 g(b) · f (x), x ∈ [a, b]

ˆ b ˆ b ˆ b
g(a) · f (x) d x 6 g(x) · f (x) d x 6 g(b) · f (x) d x
a a a
| {z } | {z }
=

=
F (b) F (a)
´b
Таким образом, число a g(x) · f (x) d x лежит между двумя значениями F (a) и F (b) функции F ,
непрерывной на отрезке [a, b]. По теореме Коши о промежуточном значении 3.3.6, найдется точка
ξ ∈ [a, b] такая, что
ˆ b
F (ξ) = g(x) · f (x) d x,
a

а это и есть формула (8.1.8).


Если же функция g невозрастает на [a, b], то мы получим ту же цепочку рассуждений, только в
ней неравенства будут глядеть в противоположную сторону.
Остается рассмотреть случай, когда a > b. По уже доказанному, мы получим, что для некоторой
точки ξ ∈ [b, a] должно выполняться равенство
ˆ a ˆ ξ ˆ a
f (x) · g(x) d x = g(b) · f (x) d x + g(a) · f (x) d x
b b ξ

Умножив это на −1, получим:


ˆ a ˆ ξ ˆ a
− f (x) · g(x) d x = −g(b) · f (x) d x −g(a) · f (x) d x
b b ξ
| {z } | {z }| {z }
´b ´ b ´ξ
a
f (x)·g(x) d x g(b)· ξ
f (x) d x g(a)· f (x) d x
a

– и это будет формула (8.1.8) для случая a > b.

Теорема 8.1.10 (признак Дирихле). Пусть даны:


(i) непрерывная функция f : [a; +∞) → R с ограниченной первообразной на [a; +∞):
ˆ t
sup f (x) d x < ∞ (8.1.9)
t>a a

(ii) монотонная функция g : [a; +∞) → R, стремящаяся к нулю:


монотонно
g(x) −→ 0. (8.1.10)
x→+∞

Тогда интеграл
ˆ +∞
f (x) · g(x) d x
a

сходится.

Доказательство. Обозначим
ˆ t
C = sup f (x) d x < ∞
t>a a
и заметим, что
ˆ t
∀s, t ∈ [a, ∞) f (x) d x 6 2C (8.1.11)
s
482 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Действительно,
ˆ t ˆ t ˆ s ˆ t ˆ s
f (x) d x = f (x) d x − f (x) d x 6 f (x) d x + f (x) d x 6 2C
s a a a a
| {z } | {z }

>

>
C C

´∞
Чтобы убедиться, что интеграл a f (x)·g(x) d x сходится, воспользуемся критерием Коши (теорема
8.1.7): выберем произвольные последовательности

sn −→ +∞, tn −→ +∞.
n→∞ n→∞

−−−→
По формуле Бонне (8.1.8), для любого n найдется точка ξn ∈ sn , tn такая, что
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x
sn sn ξn

−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞

ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x 6 |g(sn )| · f (x) d x + |g(tn )| · f (x) d x −→ 0
sn | {z } sn | {z } ξn n→∞
↓ | {z } ↓ | {z }
>

>
0 (8.1.11) 0 (8.1.11)
2C 2C

´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.

⋄ 8.1.29. Для исследования интеграла тоже сходится по признаку Дирихле (с f (t) =


1
ˆ +∞ sin t, g(t) = 2√ t
).
sin x
dx
1 x ⋄ 8.1.31. Интеграл
можно воспользоваться признаком Дирихле, по-
ложив f (x) = sin x и g(x) = x1 , и мы получим cos x1
1 1
x = t, x = 1t
ˆ
´ +∞ sin x √ d x = x=1⇔t=1 =
Вывод: интеграл 1 x d x сходится. 0 x x
3
x → +0 ⇔ t → +∞
ˆ 1   ˆ 1
⋄ 8.1.30. Интеграл √
3 1 cos t
= t t · cos t d =− 2 dt =
ˆ +∞ √ +∞ t +∞ t 3
x2 = t, x = t ˆ +∞
x2 · sin x2 d x = x=1⇔t=1 = cos t
1 x → +∞ ⇔ t → +∞ = 2 dt
+∞ +∞
1 t3
ˆ √ ˆ
sin t
= t · sin t d t = √ dt тоже сходится по признаку Дирихле.
1 1 2 t

Теорема 8.1.11 (признак Абеля). Пусть даны:


´∞
(i) сходящийся интеграл a f (x) d x и
(ii) монотонная и ограниченная функция g : [a, ∞) → R.
´∞
Тогда интеграл a f (x) · g(x) d x сходится.
Доказательство. Воспользуемся критерием Коши (теорема 8.1.7): выберем произвольные последо-
вательности
sn −→ +∞, tn −→ +∞.
n→∞ n→∞
−−−→
По формуле Бонне (8.1.8), для любого n найдется точка ξn ∈ sn , tn такая, что
ˆ tn ˆ ξn ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x
sn sn ξn
§ 1. Несобственные интегралы 483

−−−→
Поскольку при этом ξn −→ +∞ (это следует из условия ξn ∈ sn , tn ), мы получим:
n→∞
ограничена ограничена
ˆ tn z }| { ˆ ξn z }| { ˆ tn
f (x) · g(x) d x = g(sn ) · f (x) d x + g(tn ) · f (x) d x −→ 0
sn sn ξn n→∞
| {z } | {z }
↓ теорема 8.1.7 ↓ теорема 8.1.7
0, 0,
´поскольку
∞ ´поскольку

a
f (x) d x a
f (x) d x
сходится сходится
´∞
Это верно для любых последовательностей sn , tn , стремящихся к +∞. Значит, интеграл a f (x) ·
g(x) d x сходится.

⋄ 8.1.32. Для исследования интеграла Поскольку функция x 7→ cos x1 монотонна, по


´ +∞
ˆ +∞ признаку Абеля интеграл 1 x2 ·sin x2 ·cos x1 d x
sin x
· arctg x d x тоже сходится.
1 x

вспомним, что в примере (8.1.29) мы убедились, ⋄ 8.1.34. Следующий интеграл заменой пере-
что интеграл менных превращается в интеграл, который мож-
но исследовать по признаку Абеля:
ˆ +∞
sin x
dx
1 x ˆ 1 t = x1
arccos x 1
· cos d x = x = 1t =
сходится. Поскольку функция x 7→ arctg x мо- x x
0 d x = − dt2t
нотонна, по
´ +∞признаку Абеля мы получаем, что ˆ 1
sin x 1 dt
интеграл 1 x · arctg x d x тоже сходится. =− t · arccos · cos t · 2 =
+∞ t t
⋄ 8.1.33. Для исследования интеграла ˆ ∞
cos t 1
ˆ +∞ = · arccos d t
1 1 t t
x2 · sin x2 · cos d x
1 x ´∞
По признаку Дирихле интеграл 1 cost t d t схо-
вспомним, что в примере 8.1.30 мы доказали схо-
дится. А функция x 7→ arccos 1t монотонна и
димость интеграла
ограничена на [0, +∞).´Значит, по признаку Абе-

ˆ +∞ ля, сходится интеграл 1 cost t ·arccos 1t d t, а вме-
2 2
x · sin x d x ´ 1
сте с ним и интеграл 0 arccos x
· cos x1 d x.
1 x

(e) Асимптотика интегралов


Асимптотическая эквивалентность интегралов
Теорема 8.1.12 (признак эквивалентности несобственных интегралов). Пусть функции f и g об-
ладают следующими свойствами:
a) f и g непрерывны на полуинтервале [a; c);
b) f (x) ∼ g(x);
x→c−0
c) g(x) > 0, ∀x ∈ (a; c).
Соответствующая зависимость между несобственными интегралами коротко записывается
формулой: ˆ c ˆ c
f (x) d x ∼ g(x) d x
a c a
´c ´c
Тогда сходимость интеграла a f (x) d x эквивалентна сходимости интеграла a
g(x) d x:
ˆ c ˆ c
f (x) d x сходится ⇐⇒ g(x) d x сходится, (8.1.12)
a a

При этом,
484 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

(i) если эти интегралы сходятся, то справедливо следующее соотношение, показывающее,


что скорость их сходимости будет одинаковой:
ˆ c ˆ c
f (x) d x ∼ g(x) d x (8.1.13)
T T →c−0 T

(ii) если эти интегралы расходятся, то справедливо следующее соотношение, показываю-


щее, что скорость их расходимости будет одинаковой:
ˆ T ˆ T
f (x) d x ∼ g(x) d x (8.1.14)
a T →c−0 a

! 8.1.35. Если интегралы (8.1.12) расходятся, то то соотношение (8.1.14) для сходящихся инте-
формула (8.1.13) утрачивает смыл, и поэтому пе- гралов возможно только, если подынтегральные
рестает быть верной. А если интегралы (8.1.12) функции совпадают. Действительно, из неравен-
сходятся, то формула (8.1.14), хотя и сохраняет ства g(x) > 0 следует, что интеграл от g не может
смысл, но также перестает работать. Например, быть нулевым,
x−1 1
∼ ˆ c ˆ T
x3 x→+∞ x2 g(x) d x = lim g(x) d x 6= 0
однако a T →c−0 a

ˆ T ˆ T 
x−1 1 1 Поэтому соотношение (8.1.14), если оно выпол-
dx = − 3 dx = няется, означает просто равенство пределов:
1 x3 1 x2 x
  T
1 1 1 1 1 ˆ T ˆ T
= − + 2 =− +1+ 2
− ∼ lim f (x) d x = lim g(x) d x
x 2x T 2T 2 T →+∞ T →c−0 T →c−0
1 a a
T
1 1 1
∼ 6∼ 1 ∼ 1− =− = Отсюда
T →+∞ 2 T →+∞ T →+∞ T x 1
ˆ T
1 0
= dx
>

2
1 x z }|
ˆ T  {
То есть lim g(x) − f (x) d x =
T →c−0 a
T T
x−1 1
ˆ ˆ
T T
d x 6∼ dx
ˆ ˆ
1 x3 T →+∞ 1 x2 = lim g(x) d x − lim f (x) d x = 0
T →c−0 a T →c−0 a
Более того, можно заметить, что если одна из
функций не превосходит другую на интервале ⇓
интегрирования, например,
f (x) 6 g(x), x ∈ [a, c) f (x) = g(x), x ∈ [a, c)

Для доказательства теоремы 8.1.12 нам понадобится следующая


Лемма 8.1.13. Пусть функция f непрерывна на полуинтервале [a; c) и пусть b ∈ [a; c). Тогда
сходимость несобственного интеграла от f на промежутке [a; c) эквивалентна сходимости на
промежутке [b; c):
ˆ c ˆ c
f (x) d x сходится ⇐⇒ f (x) d x сходится
a b

Доказательство. Это следует из того, что интегралы по промежуткам [a; c) и [b; c) отличаются
друг от друга на константу
!
ˆ c ˆ ˆ t ˆ b t
f (x) d x = lim f (x) d x = lim f (x) d x + f (x) d x =
a t→c a t→c a b
ˆ b ˆ t ˆ b ˆ c
= f (x) d x + lim f (x) d x = f (x) d x + f (x) d x
a t→c b a b
§ 1. Несобственные интегралы 485

Доказательство теоремы 8.1.12. . 1. Сначала докажем (8.1.12). Условие (b) означает, что

f (x)
−→ 1 (8.1.15)
g(x) x→c−0
f (x)
По определению предела Коши (с.274), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ ( 12 ; 23 ), то
есть
1 f (x) 3
∀x ∈ [b; c) < <
2 g(x) 2
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
1 3
∀x ∈ [b; c) g(x) < f (x) < g(x)
2 2
Перепишем это иначе: (
g(x) < 2f (x)
∀x ∈ [b; c) (8.1.16)
f (x) < 32 g(x)
Отсюда получаются две цепочки следствий. Во-первых,
ˆ c
интеграл f (x) d x сходится, то
a

⇓ (применяем лемму 8.1.13)


ˆ c
интеграл f (x) d x сходится
b


ˆ c
интеграл 2f (x) d x сходится
b
 
вспоминаем первое неравенство
⇓ в (8.1.16) и теорему 8.1.6
ˆ c
интеграл g(x) d x сходится
b

⇓ (применяем лемму 8.1.13)


ˆ c
интеграл g(x) d x сходится
a

И, во-вторых, ˆ c
интеграл g(x) d x сходится, то
a

⇓ (применяем лемму 8.1.13)


ˆ c
интеграл g(x) d x сходится
b


c
3
ˆ
интеграл g(x) d x сходится
b 2
 
вспоминаем второе неравенство
⇓ в (8.1.16) и теорему 8.1.6
ˆ c
интеграл f (x) d x сходится
b

⇓ (применяем лемму 8.1.13)


ˆ c
интеграл f (x) d x сходится
a

Мы доказали (8.1.12).
486 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

2. Остается доказать (8.1.13) и (8.1.14). Обе эти формулы доказываются с помощью правила
Лопиталя. Сначала предположим, что оба интеграла сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a

Тогда  
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
и поэтому
´c  
T f (x) d x 0 −f (T ) f (T )
lim c = = (5.2.91) = lim = lim = (8.1.15) = 1
T →c−0 −g(T )
´
T →c−0
T
g(x) d x 0 T →c−0 g(T )

Наоборот, предположим, что оба интеграла расходятся, и обозначим


ˆ T ˆ T
F (T ) = f (x) d x, G(T ) = g(x) d x
a a

Тогда  
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim ´T = = (5.2.94) = lim = (8.1.15) = 1
T →c−0 g(x) d x ∞ T →c−0 g(T )
a

⋄ 8.1.36. Чтобы понять, сходится ли интеграл ⋄ 8.1.37. Рассмотрим интеграл


ˆ +∞ √ 2 ˆ 1 √
x +1 sin x
dx x
dx
x2 0 e −1
1
Здесь особой точкой (x = 0) будет нижняя грани-
заметим, что подынтегральная функция поло- ца интегрирования, но теорема 8.1.12 применима
жительна, и подберем к ней эквивалентную: и к этому случаю, в очевидным образом пере-
√ формулированном виде. Опять подынтегральная
x2 + 1 x 1 функция положительна. Подберем к ней экви-
∼ =
x2 x→+∞ x2 x валентную функцию при стремлении x к особой
точке: √ √
Теперь по теореме 8.1.12 получаем, что сходи- sin x x 1
мость нашего интеграла эквивалентна сходимо- ∼ = √
ex − 1 x→0 x x
сти более простого интеграла:
Мы получаем по теореме 8.1.12, что сходимость
ˆ +∞ √ 2 ˆ +∞ исходного интеграла эквивалентна сходимости
x +1 1
d x ∼ d x = более простого интеграла
1 x2 x→+∞ 1 x ˆ 1 √ ˆ 1
+∞ sin x 1 √ 1
x
d x ∼ √ dx = 2 x
= ln x = +∞ 0 e −1 0 0 x 0

1
Второй интеграл сходится, значит, наш исходный
Поскольку второй интеграл расходится, мы по- интеграл тоже сходится. Его скорость сходимо-
лучаем, что наш исходный интеграл тоже расхо- сти описывается формулой (8.1.13):
дится: ˆ T √ ˆ T √
ˆ +∞ √ 2 sin x 1
x +1 x
d x ∼ √ d x = 2 T.
dx = ∞ 0 e −1 T →+0 0 x
x 2
1
⋄ 8.1.38. Те же самые рассуждения для инте-
Из формулы (8.1.14) можно вывести скорость грала
ˆ 1
расходимости: 1 − cos x
dx
ˆ T √ 0 ln(1 + x3 )
T
x2 + 1 1
ˆ
dx ∼ d x = ln T запишем короче:
x2 T →+∞ 1 x
1
§ 1. Несобственные интегралы 487

1 1 x2
1 − cos x Последний интеграл расходится, значит, наш ис-
ˆ ˆ
2
dx ∼ dx = ходный интеграл тоже расходится. Скорость рас-
0 ln(1 + x3 ) 0 0 x3
1 1 ходимсоти:
1 1
ˆ
= d x = ln x
2 0 x 0 T ˆ T
x + sin x 1
ˆ
√ dx ∼ √ dx =
Второй интеграл расходится, значит, наш исход- 1 1 + x3 T →+∞ 1 x
ный интеграл тоже расходится. Скорость расхо- √ T √ √
=2 x =2 T −2 ∼ 2 T
димости описывается формулой 1 T →+∞

1
1 − cos x 1 1
1 ⊲⊲ 8.1.41. Исследуйте на сходимость интегралы
ˆ ˆ
dx ∼ d x = − ln T и оцените скорость сходимости и расходимости:
T ln(1 + x3 ) T →+0 2 T x
´ +∞ 1
1) 2 √ d x;
⋄ 8.1.39. Снова интеграл по бесконечному про- ´ +∞
1+ x

межутку: 2) 2 √1 d x;
1+ x+x5
´ −2 1
+∞ ˆ +∞ 3) −∞ 1+x5 d x;
x + sin x x
ˆ
√ dx ∼ √ dx = ´1
1 1+x 6 x→+∞ 1 x6 4) 0 arctg√ x d x;
x3x
ˆ +∞ ˆ +∞
x 1 1 +∞ ´ +∞ arctg x
5) 1 √ d x;
= d x = d x = − x3x
1 x3 1 x2 x 1 ´ 1 arctg x
6) 0 √ 3
x
d x;
Последний интеграл сходится, значит, наш ис- ´ +∞ arctg x
ходный интеграл тоже сходится. Скорость схо- 7) 1 √3x d x;
димости: ´ 1 ex −1
8) 0 x3 d x;
+∞ +∞
´0 x
x + sin x 1 1 9) −1 e x−1 d x;
ˆ ˆ
3
√ dx ∼ dx =
T 1 + x6 T →+∞ T x2 T ´1 1
10) 0 √x−1 d x;
⋄ 8.1.40. Еще один интеграл по бесконечному
´1 1
11) 0 √x−1 d x;
промежутку: ´1 1
12) 0 ex −cos x d x;
ˆ +∞
x + sin x
ˆ +∞
x ´ 1 ln(1+ √ 3 2
x )
√ dx ∼ √ dx = 13) 0 ex −1 d x;
1+x 3 x→+∞ x3
1 1 ´ +∞ ln(1+ x1 )
ˆ +∞
1 √ +∞ 14) e x+ln x d x;
= √ dx = 2 x ´ +∞ ln(1+ x1 +x)
x 1 15) e 1+ln x+sin x d x.
1

Асимптотическое сравнение интегралов


Теорема 8.1.14 (асимптотический признак сравнения). Пусть функции f и g обладают следую-
щими свойствами:
a) f и g непрерывны на полуинтервале [a; c);
b) f (x) ≪ g(x) (то есть f (x) = o (g(x)));
x→c−0 x→c−0
c) g(x) > 0, ∀x ∈ (a; c).
• Возникающая зависимость между несобственными интегралами коротко записывается
формулой ˆ c ˆ c
f (x) d x ≪ g(x) d x.
a c a

Тогда
´c
(i) из сходимости большего интеграла a g(x) d x следует сходимость меньшего интеграла
´c
a
f (x) d x:
ˆ c ˆ c
f (x) d x сходится ⇐= g(x) d x сходится, (8.1.17)
a a
причем скорости сходимости оцениваются соотношением
ˆ c ˆ c
f (x) d x ≪ g(x) d x; (8.1.18)
T T →c−0 T
488 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
´c
(ii) из расходимости меньшего интеграла a
f (x) d x следует расходимость большего инте-
´c
грала a g(x) d x:
ˆ c ˆ c
f (x) d x расходится =⇒ g(x) d x расходится (8.1.19)
a a

причем скорости расходимости оцениваются соотношением


ˆ T ˆ T
f (x) d x ≪ g(x) d x; (8.1.20)
a T →c−0 a

Доказательство. 1. Забудем на время о формулах (8.1.18) и (8.1.20). Оставшиеся в условиях (i) и


(ii) утверждения (8.1.17) и (8.1.19) эквивалентны, поэтому из них достаточно доказать какое-нибудь
одно, например, первое. Условие (b) означает, что

f (x)
−→ 0. (8.1.21)
g(x) x→c−0
f (x)
По определению предела Коши (с.274), существует b ∈ [a; c) такое что ∀x ∈ [b; c) g(x) ∈ (− 12 ; + 12 ),
то есть
1 f (x) 1
∀x ∈ [b; c) − < <+
2 g(x) 2
Поскольку g(x) > 0, можно умножить это двойное неравенство на g(x), и при этом знаки неравен-
ства не изменятся:
1 1
∀x ∈ [b; c) − g(x) < f (x) < g(x)
2 2
Перепишем это иначе:
1
∀x ∈ [b; c) |f (x)| < g(x) (8.1.22)
2
Отсюда получается следующая цепочка следствий:
ˆ c
интеграл g(x) d x сходится
a

⇓ лемма 8.1.13
ˆ c
интеграл g(x) d x сходится
b


c
1
ˆ
интеграл g(x) d x сходится
b 2
⇓ неравенство (8.1.22) и теорема 8.1.6
ˆ c
интеграл |f (x)| d x сходится
b

⇓ теорема 8.1.8
ˆ c
интеграл f (x) d x сходится
b

2. Теперь вспомним о формулах (8.1.18) и (8.1.20). Они доказывается тем же приемом (с помощью
правила Лопиталя), что и формулы (8.1.13)-(8.1.14) выше. Сначала предположим, что оба интеграла
сходятся, и обозначим
ˆ c ˆ c ˆ T ˆ c ˆ c ˆ T
F (T ) = f (x) d x = f (x) d x − f (x) d x, G(T ) = g(x) d x = g(x) d x − g(x) d x
T a a T a a

Тогда  
F ′ (T ) = −f (T ), G′ (T ) = −g(T ) T ∈ (a, c)
§ 1. Несобственные интегралы 489

и поэтому
´c  
f (x) d x 0 −f (T ) f (T )
lim ´Tc = = (5.2.91) = lim = lim = (8.1.21) = 0
T →c−0 g(x) d x 0 T →c−0 −g(T ) T →c−0 g(T )
T

Наоборот, предположим, что оба интеграла расходятся, и обозначим


ˆ T ˆ T
F (T ) = f (x) d x, G(T ) = g(x) d x
a a

Тогда  
F ′ (T ) = f (T ), G′ (T ) = g(T ) T ∈ (a, c)
и поэтому
´T
f (x) d x ∞ f (T )
a
lim ´T = = (5.2.94) = lim = (8.1.21) = 0
T →c−0 g(x) d x ∞ T →c−0 g(T )
a

⋄ 8.1.42. Чтобы исследовать на сходимость заметим, что


несобственный интеграл ex x
≫ e2
10 x→+∞
ˆ +∞ 10 x
x sin x Поэтому
dx
0 ex ˆ +∞ x ˆ +∞
e x x +∞
заметим, что 10
d x ≫ e 2 d x = 2e 2
1 x +∞ 1 1
10
x sin x 1 −x Поскольку меньший интеграл расходится, боль-
≪ x = e
2
ex x→+∞ e 2 ший тоже должен расходиться. Скорость расхо-
димости оценивается формулой
Поэтому
ˆ T x ˆ T
ˆ +∞ 10
x sin x
ˆ +∞ +∞ e x

d x ≪ e −x2 d x = −2e −x
2 10
d x ≫ e2 dx =
ex +∞ 0 0 1 x T →+∞ 1
0
T 1 T
= 2e 2 − 2e 2 ∼ 2e 2
Поскольку больший интеграл (справа от ≪) схо- T →+∞
дится, меньший (то есть наш исходный) интеграл и, если упростить,
тоже должен сходиться. Его скорость сходимости ˆ T x
оценивается формулой (8.1.18): e T

10
dx ≫ e2
ˆ +∞ 10 ˆ +∞ 1 x T →+∞
x sin x −x − T2
dx ≪ e 2 d x = 2e Применяя оценку
T ex T →+∞ T

или, если упростить, x10 ≪ eεx (ε > 0),


x→+∞
+∞ 10
x sin x можно доказать формулу
ˆ
T

x
d x ≪ e− 2
T e T →+∞ ˆ T x
e
10
d x ≫ aT (a < e)
Применяя оценку 1 x T →+∞

x10 ≪ eεx (ε > 0), ⋄ 8.1.44.


x→+∞
1 1 1
ln x = y, x=
ˆ √
3x y3
можно доказать более точную формулу: √ dx = x → +0 ⇔ y → +∞ =
0
3
x x=1⇔y=1
ˆ +∞ 10
x sin x ˆ 1
1 1
ˆ 1
−3
x
d x ≪ aT (a < e). = y ln d 3 = (−3y ln y) dy =
T e T →+∞ y 3 y y4
+∞ +∞
1 ˆ +∞
⋄ 8.1.43. Чтобы исследовать на сходимость ln y ln y
ˆ
=9 3
d y = −9 dy ≪
несобственный интеграл +∞ y 1 y3 +∞
ˆ +∞ ˆ +∞
ˆ +∞ x y 1 9 +∞
e ≪ −9 d y = −9 dy =
dx +∞ y 3 y 2 y 1
1 x10 1 1
490 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Последний интеграл сходится, значит меньший Последний интеграл расходится, значит боль-
(исходный) интеграл тоже сходится. Для ско- ший (исходный) интеграл тоже расходится. Для
рость сходимости с помощью той же оценки по- скорости расходимости получаем с помощью той
лучается формула: же оценки формулу:

T 3 x = y,
1
x = y3 1 1 1
= y, x = y1 1
ln x 1
ˆ √
ˆ ˆ
1 x
√ d x = x → +0 ⇔ y → +∞ = e x dx = x = T ⇔ y = T1 = ey d ≫
0
3
x x = T ⇔ y = T1 T x=1⇔y=1 1
T
y T →+0
ˆ +∞ ˆ +∞ 1
ln y y y2 1
1 1
ˆ T T
= −9 3
d y ≪ −9 3
dy = ≫ dy = y = −1 ∼
1
T
y T →+0
T
1 y T →+0 1 y2 1 T T →+0 T

9 +∞
= = 9T Применяя формулу
y 1
T

Сокращая константу 9, получаем: ey ≫ yε (ε > 0)


y→+∞
ˆ T
ln x можно добиться оценки
√ dx ≪ T
0
3
x T →+0
1
1
ˆ
1
Оценкой ex dx ≫ (n ∈ N)
T T →+0 Tn
ln y ≪ yε (ε > 0)
y→+∞ ⊲⊲ 8.1.46. Исследуйте на сходимость несобствен-
ные интегралы и найдите оценки сходимости и
можно добиться формулы расходимости:
ˆ T ´0 1
ln x 1) −1 e x d x;
√ dx ≪ Tα (α < 2).
0
3
x T →+0 ´1 1
2) 0 exx3 d x;
⋄ 8.1.45. ´0 1
3) −1 exx3 d x;
1 1 1
x = y, x= y
ˆ ´1
4) 02 x3dlnx x ;
1
ex dx = x → +0 ⇔ y → +∞ =
0 x=1⇔y=1 ´ +∞ ln(1+x+x2 )
1
ˆ 1 ˆ +∞ y 5) e d x;
1 −ey e 1+x+x2
ˆ
y
= e d = 2
dy = 2
dy ≫ 1 1
´ +∞ ln(1+ x + √x )
+∞ y +∞ y 1 y +∞ 6) e √ d x;
ln(1+x+ x)
ˆ +∞ 2 ˆ +∞
y +∞ ´ +∞ ln(1+ ln1x + √1x )
≫ 2
dy = 1 dy = y 7) e 5 4 d x;
+∞ 1 y 1 1 x+x 4 +x 3

Интегрирование асимптотических формул. Из теоремы 8.1.14 сразу следует


Теорема 8.1.15. Пусть функции f , g и h обладают следующими свойствами:
a) f , g и h непрерывны на полуинтервале [a; c);
b) f , g и h удовлетворяют асимптотическому соотношению

f (x) = g(x) + o (h(x))


x→c−0

c) h(x) > 0, ∀x ∈ (a; c).


Тогда
´c ´c ´c
(i) если несобственные интегралы a f (x) d x, a g(x) d x и a h(x) d x сходятся, то спра-
ведлива асимптотическая формула
ˆ c ˆ c ˆ c 
f (t) d t = g(t) d t + o f (t) d t (8.1.23)
x x x→c−0 x
´c
(ii) если несобственный интеграл a h(x) d x расходится, то справедлива асимптотическая
формула ˆ x ˆ x ˆ x 
f (t) d t = g(t) d t + o f (t) d t (8.1.24)
a a x→c−0 a
§ 1. Несобственные интегралы 491

Из теоремы 8.1.15 тут же следует метод на- Мы получили асимптотическую формулу:


хождения асимптотики интегралов ˆ xp
x2 1
ˆ x ˆ c t2 + 1 d t = + · ln x + o (ln x)
1 2 2 t→+∞
F (x) = f (t) d t, F (x) = f (t) d t
a x
Можно было бы поступить иначе: вместо то-
– для этого нужно найти асимптотику для го, чтобы огрублять формулу (8.1.25) перед тем
подынтегральной функции, а затем проинтегри- как ее интегрировать, можно переписать ее так,
ровать ее. Покажем, как это делается на приме- чтобы была применима часть (i) теоремы 8.1.15:
рах. p  
2
1 1 1
t +1−t− =− 3 + o (8.1.26)
⋄ 8.1.47. Найдем асимптотику интеграла 2t 8t t→+∞ t3
ˆ xp
Здесь правая часть бесконечно мала по срав-
F (x) = t2 + 1 d t, x → +∞
1 нению с функцией t12 , интеграл от которой на
[1, +∞) сходится. Поэтому по теореме 8.1.14, ин-
Оговоримся сразу, что этот интеграл можно вы- теграл от левой части тоже должен сходиться:
числить явно (мы даже предлагали это читате- ˆ ∞ p 
лю в упражнении 7.1.38), и как следствие, его 1
2
t +1−t− dt = A ∈ R
асимптотику можно вывести по аналогии с при- 1 2t
мерами § 2(b) (вычислив F (x), и, после преобра-
зований, разложив полученное выражение с по- Теперь, применяя к (8.1.26) теорему 8.1.15 (i), по-
мощью формул Пеано). Однако здесь наша цель лучаем:
– объяснить, как находится асимптотика подоб- ˆ ∞ p 
1
ных интегралов без их явного вычисления. Мы t2 + 1 − t − dt =
выбрали этот пример только чтобы не усложнять x 2t
ˆ ∞ ˆ ∞ 
вычисления. Читателю же мы предлагаем само- 1 1
=− d t + o d t =
стоятельно найти асимптотику так, как мы опи- x 8t3 t→+∞ x t3
сали, а затем сравнить ответы, полученные раз-  
1 t=∞ 1 t=∞
ными методами. = + o − =
16t2 t=x t→+∞ 2t2 t=x
Вспомним, что в примере 6.2.10 мы уже иска-  
1 1
ли асимптотику подынтегрального выражения, и =− + o =
(с точностью до замены переменной) мы получи- 16x2 t→+∞ 2x2
 
ли такой ответ: 1 1
  = − 2
+ o
p 16x t→+∞ x2
2
1 1 1
t +1=t+ − + o (8.1.25)
2t 8t3 t→+∞ t3 Отсюда следует:
К этой формуле, однако, невозможно применить ˆ x p 
2
1
часть (ii) теоремы 8.1.15, как нам бы хотелось, t +1−t− dt =
1 2t
потому что получающийся интеграл под симво- ˆ ∞ p 
1
лом o сходится. Но если огрубить эту формулу = 2
t +1−t− dt−
до формулы 2t
|1 {z }
p   A
1 1 ˆ ∞ p 
t2 + 1 = t + + o 2+1−t−
1
2t t→+∞ t − t dt =
x 2t
| {z }
то интеграл под o становится расходящимся, и
− 16x1
2+ o ( x12 )
теорема 8.1.15 (ii) становится применима: t→+∞
 
ˆ xp 1 1
=A+ 2
+ o
t2 + 1 d t = 16x t→+∞ x2
1
 x  ˆ x  ⇓
1 1
ˆ
= t+ dt+ o dt =
1 2t t→+∞ 1 t xp x p 
 2    1
ˆ ˆ
t 1 t=x t=x t2 + 1 dt = t2 +1−t− dt+
= + · ln t + o ln t = 1 2t
2 2 t=1 t→+∞ t=1 |1 {z }
x2
x2 1 1 2 + 12 ·ln x− 21
= + · ln x − + o (ln x) =  
2 2 2 t→+∞ 1 1
| {z } +A+ + o =
o (ln x) 16x2 t→+∞ x2
t→+∞  
x2 1 1 1 1
x2 1 = + · ln x − + A + + o
= + · ln x + o (ln x) 2 2 2 16x2 t→+∞ x2
2 2 t→+∞
492 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Мы получили асимптотическое разложение на- где p 



1
ˆ
шего интеграла порядка 2 вдоль степенной по- 2
A= t +1−t− d t.
следовательности на бесконечности: 1 2t
ˆ xp Заметим, наконец, что, выписывая более точ-
t2 + 1 d t = ную асимптотику для подынтегральной функ-
1
  ции (то есть заменяя формулу (8.1.25) на более
x2 1 1 1 1 точную), можно по этому алгоритму получать и
= + · ln x − + A + + o ,
2 2 2 16x2 t→+∞ x2 асимптотику интеграла нужной точности.

Нахождение асимптотики интегрированием по частям Описанный в предыдущем пункте


способ нахождения асимптотики интеграла не всегда работает. Например, асимптотику интегралов
ˆ x ˆ x
sin t
d t, t2 · e t d t (x → +∞)
1 t2 1

невозможно получить, раскладывая подынтегральную функцию в асимптотическую формулу, а


затем интегрируя ее (потому что асимптотику для подынтегральной функции здесь трудно приду-
мать). В таких случаях полезно держать в голове другой метод – интегрирование по частям. Здесь
мы рассмотрим несколько примеров на эту тему.

x
sin t
ˆ
⋄ 8.1.48. Найдем асимптотику интеграла F (x) = d t = ... =
ˆ x 1 t2
sin t ˆ ∞
F (x) = dt (8.1.27) cos x cos t
1 t2 = A− 2 −2 dt =
x x t3
ˆ ∞
Прежде всего заметим, что существует конечный cos x d sin t
=A− 2 −2 =
предел x x t3
ˆ ∞
ˆ ∞
sin t cos x 2 sin t ∞ sin t
A = lim F (x) = dt =A− 2 − 3
− 6 dt =
t2 x t x t4
x→∞ 1 ˆ ∞x
cos x 2 sin x sin t
´∞ t =A− 2 + −6 dt =
– поскольку интеграл 1 sin t2 d t сходится абсо- x x 3 t4
| {z } x | {z}
лютно: o
x→+∞ x
(
1
2 ) ( t13 )
o
t→+∞
ˆ ∞ ˆ ∞
sin t 1 1 ∞ | {z }
2
d t 6 2
dt = − =1 o ( x12 )
1 t 1 t t 1 x→+∞
 
Запомним это число A. Тогда, интегрируя по ча- cos x 1
= A− 2 + o
x x→+∞ x2
стям один раз, получим:
´∞ И так далее. Увеличивая число интегрирований
sin t
dt
1 t2
ˆ ∞ по частям, мы будем повышать точность асимп-
=

ˆ x
sin t sin t тотического разложения.
F (x) = 2
d t = A − dt =
1 t x t2
ˆ ∞ ˆ ∞ ⋄ 8.1.49. Найдем асимптотику интеграла
d cos t cos t ∞ cos t
= A+ 2
= A+ 2
−2 dt = ˆ x
x t t x x t3 F (x) = tα · et d t, x → +∞
ˆ ∞
cos x cos t 1
=A− 2
+2 dt =
|x{z } x t3 }
| {z Интегрируя по частям, получаем:
o 1
x→+∞ x
( ) o
t→+∞
( )
1
t2
ˆ x ˆ x
| {z } F (x) = tα · e t d t = tα d e t =
o (x 1 1
1
) ˆ x
x→+∞ t=x
  = tα · e t − e t d tα =
1 t=1
=A+ o 1
x→+∞ x ˆ x
α x
=x ·e −e−α· (8.1.28) tα−1 · et d t
Это первое асимптотическое разложение. Если 1
проинтегрировать по частям два раза, получится Поглядим внимательно на последний интеграл:
более точная формула:
tα−1 · et ≪ tα · et
t→+∞
§ 2. Числовые ряды 493

⇓ (8.1.20) ⇓
ˆ x ˆ x
tα−1 · et d t ≪ tα · et d t = F (x)
1 x→+∞ 1 ˆ x
Мы получаем: tα · et d t = (8.1.28) =
1
ˆ x
F (x) = xα · ex −e + o (F (x)) α x
x→+∞ =x ·e −e−α· tα−1 · et d t = (8.1.30) =
| {z } 1
o (F (x))  
x→+∞ α x α−1 x α−1 x

= x ·e −e−α· x ·e + o x ·e =
x→+∞
⇓ 
α x = xα · ex − α · xα−1 · ex −e + o xα−1 · ex =
F (x) = x · e + o (F (x)) |
x→+∞
{z }
x→+∞
o (xα−1 ·ex )
⇓ x→+∞

x = xα · ex − α · xα−1 · ex + o xα−1 · ex
ˆ
α t α x
F (x) = t ·e dt ∼ x ·e x→+∞
1 x→+∞

⇓ Получается разложение:
ˆ x 
x
tα ·et d t = xα ·ex −α·xα−1 ·ex + xα−1 · ex
ˆ
α t
t · e dt = x · e + α x
o α x
(x · e ) (8.1.29) o
1 x→+∞
1 x→+∞
(8.1.31)
Это первое асимптотическое разложение. Из Здесь также можно заменить α на α − 1 и после
него можно выводить асимптотики более высо- этого подставить полученную формулу в (8.1.28)
кого порядка. Заменив в (8.1.29) α на α − 1, мы – тогда появится асимптотика более высокого по-
получим цепочку: рядка, и так далее. Понятно, что асимптотиче-
ˆ x
 ская последовательность здесь берется такая:
tα−1 · et d t = xα−1 · ex + o xα−1 · ex
1 x→+∞
(8.1.30) xα · ex ≫ xα−1 · ex ≫ xα−2 · ex ≫ ...
x→+∞ x→+∞ x→+∞

§2 Числовые ряды
Представим, что у нас есть числовая последовательность {an } и нам захотелось сосчитать (беско-
нечную) сумму ее элементов:

X
an = a1 + a2 + a3 + ...
n=1

В таких случаях говорят, что нужно вычислить сумму числового ряда. Интересное наблюдение, с
которого начинается вся теория рядов, состоит в том, что иногда такая бесконечная сумма оказы-
вается конечной величиной.

⋄ 8.2.1. Например, нетрудно убедиться (это сле- (мы это сделаем в замечании 11.2.15 на с.647). С
дует из приводимой ниже формулы (8.2.34)), что другой стороны, сумма может оказаться и беско-
X∞ нечной, например,
1
= 1
2n ∞
n=1 X 1
Труднее доказать, что =∞
n=1
n
X∞
1 π2
= (8.2.32)
n=1
n2 6 (это будет доказано в примере 8.2.9).

Заинтриговав читателя этими заявлениями, мы можем перейти к точным формулировкам.


494 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

(a) Определение числового ряда


• Пусть задана числовая последовательность {an } и из нее составлена новая последователь-
ность {SN } по формуле
N
X
SN = an = a1 + a2 + a3 + ... + aN
n=1

Тогда такая пара последовательностей {an } и {SN } называется числовым рядом и обо-
значается ∞
X
an = a1 + a2 + a3 + ...
n=1
P∞
Числа an называются слагаемыми ряда n=1 an , а числа SN – частичными суммами
этого ряда.
• Если частичные суммы стремятся к некоторому конечному пределу

SN −→ S, (S ∈ R)
N →∞
P∞
то этот предел S называется суммой ряда n=1 an , а сам ряд называется сходящимся
(или про него говорят, что он сходится). Коротко это записывают формулой

X
an = S
n=1

• Если же последовательность частичных сумм не имеет конечного предела

6 ∃ lim SN ∈ R,
N →∞
P∞
то ряд n=1 an называется расходящимся (или про него говорят, что он расходится).

⋄ 8.2.2. Рассмотрим ряд преобразуем его слагаемые:



X 1 1  
умножаем на
n(n + 1) √ √ = сопряженный радикал =
n=1 n+ n+1
√ √
Чтобы понять, сходится он или нет, заметим, что n− n+1
= √ √ √ √ =
слагаемые можно разложить на простейшие дро- ( n + n + 1)( n − n + 1)
би: √ √ √ √
1 1 1 n− n+1 n− n+1
= − = = =
n(n + 1) n n+1 n − (n + 1) −1
√ √
Теперь найдем частичные суммы: =− n+ n+1
N
X N 
X  Теперь найдем частичные суммы:
1 1 1
SN = = − =
n(n + 1) n=1 n n + 1 N
n=1 X 1
сокращаются
SN = √ √ =
↓ ↓ ↓ ↓ ↓ ↓↓ ↓ n + n+1
n=1
1 1 1 1 1 1 1 1
= − + − + − +... + − = N
X √ √ 
1 2 2 3 3 4
| {z } | {z } | {z } N N +1 = − n+ n+1 =
| {z }
n=1 n=2 n=3 n=N n=1
1 ↓ ↓ ↓ ↓ ↓ ↓
=1− −→ 1 = S √ √ √ √ √ √
N + 1 N →∞ = − 1 + 2 − 2 + 3 − 3 + 4 +...
P∞ 1
| {z } | {z } | {z }
Вывод: ряд n=1 n(n+1) сходится, и его сум- n=1 n=2 n=3
ма равна 1. ↓ ↓
√ √ √
⋄ 8.2.3. Чтобы исследовать на сходимость ряд ... − N + N + 1 = −1 + N + 1 −→ +∞
| {z } N →∞

X n=N
1
√ √ P∞ 1
n=1
n+ n+1 Вывод: ряд n=1
√ √
n+ n+1
расходится.
§ 2. Числовые ряды 495

⋄ 8.2.4. Рассмотрим ряд Рассмотрим три случая:



X а) если |q| < 1, то
(−1)n
n=1 0
✁✕
Найдем первые несколько частичных сумм:
1
1 − q N +1 1
X SN = −→
n 1 1−q 1−q
S1 = (−1) = (−1) = −1 N →∞
n=1
и, значит в этом случае ряд сходится, причем мы
2
X сразу получаем формулу (8.2.33), из которой в
S2 = (−1)n = (−1)1 + (−1)2 = −1 + 1 = 0 свою очередь тут же следует формула (8.2.34):
n=1

X ∞
X ∞
X q
3
X qn = q · q n−1 = q · qk =
S3 = (−1)n = (−1)1 + (−1)2 + (−1)3 = n=1 n=1
1−q
k=0
| {z }
n=1

=
= −1 + 1 − 1 = −1 1
1−q

Теперь видна закономерность:


( б) если |q| > 1, то
−1, если N нечетное
SN = ∞
0, если N четное
✁✕
Ясно, что такая последовательность не имеет 1 − q N +1
предела: SN = −→ ∞
6 ∃ lim SN 1−q N →∞
N →∞
P∞ и, значит в этом случае ряд расходится.
Вывод: ряд n=1 (−1)n расходится.
в) если |q| = 1, то это означает, что q = 1 или
Следующий пример особенно важен. q = −1, и тогда
Теорема 8.2.1 (геометрическая прогрессия). — при q = 1 получается

(
X сходится, если |q| < 1 ∞
n
q ←
n=0
расходится, если |q| > 1
N ✁✁✕
X
причем SN = 1 = N + 1 −→ ∞;
N →∞
∞ n=0
X 1
qn = , |q| < 1 (8.2.33)
1−q — а если q = 1, то этот случай мы уже рассмот-
n=0
∞ рели в примереP∞ 8.2.4, и показали, что получа-
X q
qn = , |q| < 1 (8.2.34) ющийся ряд n=0 (−1)n расходится.
n=1
1−q

Доказательство. Здесь используется формула


(2.2.246) суммы конечного числа членов геомет-
⊲⊲ 8.2.5. Исследуйте на сходимость ряды:
рической прогрессии, которую мы доказали в P∞ 1
главе 2: 1) n=1 4n2 −1 ;
P∞ 2n+1
N 2)
X
n 1 − q N +1 n=1 n2 (n+1)2 ;
SN = q = , q 6= 1 (8.2.35) P∞ √ √ √
n=0
1−q 3) n=1 ( n − 2 n + 1 + n + 2).

(b) Арифметические свойства числовых рядов


P∞ P∞
10 . Если ряд n=1 an сходится, то для всякого числа λ ∈ R ряд n=1 λ · an тоже сходится,
причем

X ∞
X
λ · an = λ · an (8.2.36)
n=1 n=1
496 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ P∞ P∞
20 . Если ряды n=1 an и n=1 bn сходятся, то ряд n=1 (an + bn ) тоже сходится, причем

X ∞
X ∞
X
(an + bn ) = an + bn (8.2.37)
n=1 n=1 n=1
P∞
Доказательство. 1. Если ряд n=1 an сходится, то это означает, что его частичные суммы SN =
PN
n=1 an стремятся к какому-то числу S:

N
X
an = SN −→ S
N →∞
n=1

Поэтому для всякого λ ∈ R


N
X N
X
λan = λ an = λSN −→ λS
N →∞
n=1 n=1
P∞ P∞
Это означает, что ряд n=1 λan сходится, и его сумма равна λS = λ n=1 an , то есть справедлива
формула (8.2.36). P P∞

2. Пусть ряды n=1 an и n=1 bn сходятся. Это означает, что если обозначить через AN и BN
их частичные суммы, то они стремятся к каким-то числам A и B:
N
X N
X
an = AN −→ A, bn = BN −→ B
N →∞ N →∞
n=1 n=1

Поэтому
N
X N
X N
X
(an + bn ) = an + bn = AN + BN −→ A + B
N →∞
n=1 n=1 n=1
P∞ P∞ P∞
Это означает, что ряд n=1 (an + bn ) сходится, и его сумма равна A + B = n=1 an + n=1 bn , то
есть справедлива формула (8.2.37).

X∞ X∞  n  n 
⋄ 8.2.6. 2n + 3n 2 3
= + =
X∞ ∞   5 n 5 5
5 5X 1 делаем замену n=1 n=1
= = n−1=k = X∞  n X∞  n
2n 2 n=1 2n−1 тогда k = 0, 1, 2, ... 2 3
n=1 = + = (8.2.34) =
∞ 5 5
5 X 1 5 1 n=1 n=1
= · = · 1 =5 1 1 5 5 25
2 2k 2 1− 2 = + = + =
k=0 2 3
1− 5 1− 5
3 2 6
⋄ 8.2.7.

(c) Признаки сходимости рядов


Как правило, сумму ряда точно вычислить невозможно, даже если известно, что ряд сходится.
Например, формула, упомянутая нами в начале этой главы

X∞
1 π2
2
= ,
n=1
n 6

является результатом случайного наблюдения, а не какого-то найденного математиками способа


вычисления сумм, с помощью которого ее и другие подобные формулы можно было бы выводить.
Из-за этого в теории рядов становится важно просто понять, сходится данный ряд или нет, не
вычисляя его суммы.
Правила, объясняющие, когда данный ряд сходится, а когда нет, называются признаками схо-
димости. В этом параграфе мы приведем некоторые признаки сходимости рядов. Мы начнем со
знакопостоянных рядов.
§ 2. Числовые ряды 497

Сходимость знакопостоянных рядов


P∞
• Числовой ряд n=1 an называется
— знакопостоянным, если его члены an не меняют знак:
   
∀n ∈ N an > 0 или ∀n ∈ N an 6 0
— знакоположительным, если его члены an неотрицательны:
∀n ∈ N an > 0
Как и в случае с несобственными интегралами, исследование на сходимость знакопостоянных
рядов сводится к исследованию знакоположительных: если an 6 0, то можно взять последователь-
ность bn = −an > 0, и окажется, что

X N
X N
X ∞
X
an = lim an = − lim bn = − an
N →+∞ N →+∞
n=1 n=1 n=1 n=1

откуда и будет следовать, что ряд



X
an
n=1
сходится тогда и только тогда, когда сходится ряд

X
bn
n=1

Критерий сходимости знакоположительного ряда.


Теорема 8.2.2. Пусть последовательность an неотрицательна
an > 0, n∈N
P∞ PN
Тогда сходимость ряда n=1 an эквивалентна ограниченности его частичных сумм n=1 an , N ∈
N:

X N
X
an сходится ⇐⇒ sup an < ∞
n=1 N ∈N n=1
PN
! 8.2.8. Условие справа (то есть утверждение, что частичные суммы n=1 an , N ∈ N ограничены)
принято записывать неравенством
X∞
an < ∞
n=1
P∞
и, в силу теоремы 8.2.2, такая запись считается эквивалентной утверждению, что ряд n=1 an
сходится (при неотрицательных an ).
Доказательство. Поскольку an > 0, частичные суммы
N
X
SN = an
n=1

образуют монотонно неубывающую последовательность. Поэтому справедлива цепочка



X
ряд an сходится
n=1

m
SN имеет конечный предел lim SN ∈ R
N →∞
m SN – монотонно неубывает
N
X
SN – ограничена сверху: sup an = sup SN < ∞.
N ∈N n=1 N ∈N
498 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Интегральный признак Коши и постоянная Эйлера.


Теорема 8.2.3 (интегральный признак Коши). Пусть f – неотрицательная и невозрастающая
функция на полуинтервале [1; +∞). Тогда существует такое число C ∈ R, что
N
X ˆ N
f (n) − f (x) d x −→ C (8.2.38)
1 N →∞
n=1

P∞
• Число C в этой формуле называется постоянной Эйлера ряда n=1 f (n).
Как следствие,

X ˆ ∞
ряд f (n) сходится ⇐⇒ интеграл f (x) d x сходится
n=1 1

• Такую связь между рядом и несобственным интегралом (когда сходимость одного экви-
валентна сходимости другого) коротко записывают формулой

X ˆ ∞
f (n) ∼ f (x) d x.
n=1 1
P∞ ´∞
и говорят при этом, что ряд n=1 f (n) эквивалентен интегралу 1 f (x) d x.
Доказательство. 1. Рассмотрим сначала вспомогательную последовательность
N
X ˆ N +1
FN = f (n) − f (x) d x
n=1 1

и покажем, что она сходится. Для этого нужно просто заметить, что она ограничена и монотонна.
Действительно, во-первых,
∀x∈[n,n+1]
z }| {
f (n) > f (x) > f (n + 1)

ˆ n+1
f (n) > f (x) d x > f (n + 1) (8.2.39)
n

ˆ n+1
−f (n) 6 − f (x) d x 6 −f (n + 1)
n

ˆ n+1
0 6 f (n) − f (x) d x 6 f (n) − f (n + 1) (8.2.40)
n

FN
=

PN ´ N +1
n=1 f (n) − 1
f (x) d x
=

PN PN ´ n+1
n=1 f (n) − n=1 n
f (x) d x
=

z }| {
XN  ˆ n+1  XN  
06 f (n) − f (x) d x 6 f (n) − f (n + 1) =
n=1 n n=1

↓ ↓ ↓ ↓ ↓ ↓
z}|{ z}|{ z}|{ z }| {
= f (1) − f (2) + f (2) − f (3) + ... + f (N ) −f (N + 1) = f (1) − f (N + 1) 6 f (1)
| {z } | {z } | {z } | {z }
n=1 n=2 n=N
6

0
§ 2. Числовые ряды 499


0 6 FN 6 f (1)
И, во-вторых,
N +1
! N
!
X ˆ N +2 X ˆ N +1
FN +1 − FN = f (n) − f (x) d x − f (n) − f (x) d x =
n=1 1 n=1 1
N +1 N
! !
X X ˆ N +2 ˆ N +1 ˆ N +1 (8.2.40)
= f (n) − f (n) − f (x) d x − f (x) d x = f (N +1)− f (x) d x > 0
n=1 n=1 1 1 N


FN +1 > FN
Итак, FN монотонна и ограничена, и значит, имеет предел:
FN −→ A
N →∞

2. Заметим далее, что последовательность f (n) тоже монотонна и ограничена, и значит тоже
имеет предел:
f (n) −→ B
n→∞
Отсюда, в силу (8.2.39), следует, что
ˆ n+1
f (x) d x −→ B
n n→∞
´ n+1
(потому что n
f (x) d x заключена между двумя милиционерами, стремящимися к B). Теперь
получаем:
N
X ˆ N N
X ˆ N +1 ˆ N +1
f (n) − f (x) d x = f (n) − f (x) d x + f (x) d x −→ A + B = C
1 1 N N →∞
n=1 n=1
| {z } | {z }

=

B
FN

A

Это доказывает (8.2.38).


P∞ PN
3. Из (8.2.38) следует, что если ряд n=1 f (n) сходится, то есть n=1 f (n) −→ S ∈ R, то
N →∞
N N
!
ˆ N X X ˆ N
f (x) d x = f (n) − f (n) − f (x) d x −→ S − C
1 1 N →∞
n=1 n=1
| {z } | {z }
↓ ↓
S C

Отсюда следует, что ˆ y


f (x) d x −→ S − C
1 y→∞
´y
поскольку функция F (y) = 1 f (x) d x монотонна (из-за неотрицательности f ). То есть, интеграл
´∞
1 f (x) d x сходится. ´∞ ´y
4. Наоборот, если интеграл 1 f (x) d x сходится, то есть 1 f (x) d x −→ I ∈ R, то
y→∞
ˆ N
f (x) d x −→ I
1 N →∞
и поэтому !
N
X N
X ˆ N ˆ N
f (n) = f (n) − f (x) d x + f (x) d x −→ C − I
1 1 N →∞
n=1
|
n=1
{z } | {z }
↓ ↓
I
C
PN
То есть, ряд n=1 f (n) сходится.
500 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

⋄ 8.2.9. Гармонический ряд. Числовой ряд и тогда


X∞
1 XN XN
1
n > 1 = N −→ ∞,
n=1
n=1
nα n=1
N →∞

называется гармоническим. Он расходится, по-


тому что эквивалентен расходящемуся интегра- и значит, ряд расходится. Если же α > 0, то мож-
лу: но применить теорему 8.2.3, и мы получим:
X∞ ˆ ∞ ∞
1 1 ∞
∼ d x = ln x = ∞ X 1
ˆ ∞
1
n=1
n 1 x 1 ∼ dx .
n α xα
1
Несмотря на то, что суммы у этого ряда нет, у
n=1 | {z }
сходится
него есть постоянная Эйлера: только при α > 1,
по теореме 8.1.2
X
N 
1
C = lim − ln N
|{z} (8.2.41)
N →∞
n=1
n
=

´N 1
dx
1 x
⋄ 8.2.11.
Это число привлекает внимание специалистов по

X ∞
теории чисел тем, что за прошедшие с его от- 1 1
ˆ
крытия два с половиной века до сих пор так и не ∼ dx =
n=2
n ln n 2 x ln x
удалось понять, будет ли оно рациональным. ∞
1 ∞
ˆ
⋄ 8.2.10. Ряд Дирихле. Покажем, что d ln x = ln ln x = ∞
=
2 ln x 2

(
X 1 сходится, если α > 1 P∞ 1
← Вывод: ряд n=2 n ln n расходится.
n α
n=1
расходится, если α 6 1
(8.2.42) ⋄ 8.2.12.
Этот ряд называется рядом Дирихле. При α > 0

X ˆ ∞
к нему применима теорема 8.2.3, и в этом случае 1 1
ему соответствуют постоянные Эйлера 2 ∼ 2 dx =
n=2
n ln n 2 x ln x
XN  ˆ ∞
1 1 ∞ 1
1 N 1−α − 1 = d ln x = − =
Cα = lim − (8.2.43) 2
ln x ln x 2 ln 2
N →∞
n=1
nα | 1 − {z α }
2
P∞
=

´N 1
dx
Вывод: ряд n=2 n ln12 n сходится.
1 xα

Доказательство. Если α 6 0, то общий член ⊲⊲ 8.2.13. Исследуйте на сходимость ряды:


этого ряда не меньше единицы
P P∞ √
1) P∞ e−
1 n
1 n=2 n lnα n 3) n=1

n
> 1, ∞ 1
nα 2) n=2 n ln n lnα ln n

Признак сравнения рядов.


Теорема 8.2.4 (признак сравнения рядов). Пусть 0 6 an 6 bn . Соответствующая зависимость
между рядами коротко записывается следующим образом:

X ∞
X
an 6 bn (8.2.44)
n=1 n=1

Тогда
P∞ P∞
1) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :

X ∞
X
an сходится ⇐= bn сходится
n=1 n=1
P∞ P∞
2) из расходимости меньшего ряда n=1 an следует расходимость большего ряда n=1 bn :

X ∞
X
an расходится =⇒ bn расходится
n=1 n=1
§ 2. Числовые ряды 501
P∞ P∞
Доказательство. Обозначим через AN и BN частичные суммы рядов n=1 an и n=1 bn :

N
X N
X
AN = an , BN = bn
n=1 n=1

Тогда
B1 6 B2 6 B3 6 ... 6 BN 6 ...

6
A1 6 A2 6 A3 6 ... 6 AN 6 ...
1. Теперь возникает логическая цепочка:

X
ряд bn сходится
n=1

⇓ теорема 8.2.2

последовательность BN ограничена : B1 6 B2 6 B3 6 ... 6 BN 6 ... 6 B



последовательность AN ограничена : A1 6 A2 6 A3 6 ... 6 AN 6 ... 6 B
⇓ теорема 8.2.2

X
ряд an сходится
n=1
P∞ P∞
2. Мы доказали, что если n=1 bn сходится, то n=1 an тоже сходится. То есть,

X ∞
X
невозможна ситуация, когда an расходится. а bn сходится
n=1 n=1
P∞ P∞
Поэтому если n=1 an расходится, то n=1 bn тоже должен расходиться.

P∞
⋄ 8.2.14. Вывод: ряд n=1
2+cos n
n2 сходится.
X∞ X∞
cos2 n 1 ⋄ 8.2.17.
n
6
n=1
2 n=1
2n
| {z } ∞
X 1

X 1
сходится, √ > √ =
как сумма геометрической прогрессии
n=1
n · arctg(3 + sin n) n=1 n · arctg 4
со знаменателем |q| < 1
X∞
1 1
Больший ряд сходится, значит и меньший ряд = · √
сходится. arctg 4 n=1
n
P∞ 2 | {z }
Вывод: ряд n=1 cos2n n сходится. расходится,
⋄ 8.2.15. в силу примера 8.2.10

X∞
2 + cos n X∞
1 P∞ 1
> Вывод: ряд n=1

n·arctg(3+sin n)
расходится.
n=1
n n=1
n
| {z } ⊲⊲ 8.2.18. Исследуйте на сходимость ряды:
расходится,
в силу примера 8.2.9 P∞ 2 P∞ 4+cos n
1) Pn=1 e−n ; 4) n=1 nα ;
Меньший ряд расходится, значит и больший ряд ∞
2) n=1 √ ln n P∞
3 2; 5) + sin n) ·
расходится. P∞ 2nn n=1 (2
P∞ 3) n=1 n·3n ; nα .
Вывод: ряд n=1 2+cos
n
n
расходится.
⋄ 8.2.16.
X∞ X∞ X∞
2 + cos n 3 1
6 = 3 ·
n=1
n2 n=1
n 2
n=1
n2
| {z }
сходится,
в силу примера 8.2.10
502 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Признак Даламбера.

Теорема 8.2.5 (признак Даламбера). Пусть an > 0, и


an+1
D = lim (8.2.45)
n→∞ an
Тогда
P∞
— если D < 1, то ряд n=1 an сходится;
P∞
— если D > 1, то ряд n=1 an расходится.

• Число
P∞ D, определяемое формулой (8.2.45), называется числом Даламбера ряда
n=1 a n .
Для доказательства нам понадобится следующая
P∞
Лемма 8.2.6 (лемма об остатке). Пусть n=1 an – числовой ряд, и M ∈ N – произвольное число.
Тогда
∞ ∞ ∞
!
X X X
ряд an сходится ⇐⇒ сходится ряд an называемый остатком ряда an
n=1 n=M n=1

Доказательство. Обозначим через SN и RN частичные суммы самого ряда и его остатка:


N
X N
X
SN = an , RN = an
n=1 n=M

Очевидно, при N > M


N
X M−1
X N
X
SN = an = an + an = C + RN ,
n=1 n=1 n=M
PM−1
где C = n=1 an – константа, не зависящая от N . Теперь получаем следующую логическую це-
почку:

X
ряд an сходится
n=1

m
существует конечный предел lim SN
N →∞

m
существует конечный предел lim RN
N →∞

m

X
остаток an сходится
n=M

Доказательство теоремы 8.2.5. 1. Предположим, что


an+1
D = lim <1 (8.2.46)
n→∞ an

Возьмем какое-нибудь число ε > 0 так чтобы D + ε < 1. Из (8.2.46) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
§ 2. Числовые ряды 503

Если обозначить q = D + ε, то мы получим что q < 1 и


an+1
∀n > M <q
an
то есть
∀n > M an+1 < q · an
В частности,
aM+1 < q · aM
aM+2 < q · aM+1 < q · (q · aM ) = q 2 · aM
aM+3 < q · aM+2 < q · (q 2 · aM ) = q 3 · aM
...
aM+k < q · aM+k−1 < ... < q k · aM
Отсюда

X ∞
X ∞
X ∞
X

an = aM+k < q k · aM = aM · qk
n=M k=0 k=0 k=0

Последний ряд сходится как


P∞геометрическая прогрессия со знаменателем q < 1. Значит, по признаку
P∞
сравнения, меньший ряд n=M an тоже сходится. Отсюда по лемме об остатке 8.2.6, ряд n=1 an
сходится.
2. Предположим, что наоборот,
an+1
D = lim >1 (8.2.47)
n→∞ an

Возьмем какое-нибудь число ε > 0 так чтобы D − ε > 1. Из (8.2.47) следует, что ε-окрестность числа
D содержит почти все числа aan+1
n
, то есть
an+1
∃M ∀n > M D−ε< <D+ε
an
Если обозначить q = D − ε, то мы получим что q > 1 и
an+1
∀n > M q<
an
то есть
∀n > M an+1 > q · an
В частности,
aM+1 > q · aM
aM+2 > q · aM+1 > q · (q · aM ) = q 2 · aM
aM+3 > q · aM+2 > q · (q 2 · aM ) = q 3 · aM
...
aM+k > q · aM+k−1 > ... > q k · aM
Отсюда

X ∞
X ∞
X ∞
X

an = aM+k > q k · aM = aM · qk
n=M k=0 k=0 k=0

Последний ряд расходится как геометрическая


P∞ прогрессия со знаменателем q > 1. Значит, по при-
знаку
P∞ сравнения, больший ряд n=M a n тоже расходится. Отсюда по лемме об остатке 8.2.6, ряд
n=1 a n расходится.

⋄ 8.2.19. Чтобы исследовать на сходимость ряд найдем его число Даламбера:

X∞ (n+1)·2n+1
n · 2n an+1 3n+1
3n D = lim = lim n·2n =
n→∞ an n→∞
n=1 3n
504 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

(n + 1) · 2n+1 · 3n (n + 1)n+1 · n! (n + 1)n+1 · n!


= lim = = lim = lim =
n→∞ n · 2n · 3n+1 n→∞ nn · (n + 1)! n→∞ nn · (n + 1) · n!
(n + 1) · 2 2   n
= lim = <1 (n + 1)n n+1
n→∞ n·3 3 = lim = lim =
n→∞ nn n→∞ n
P∞ n·2n  n
Вывод: ряд n=1 3n сходится. 1
= lim 1 + =e>1
n→∞ n
⋄ 8.2.20. Рассмотрим ряд
P∞ nn
∞ Вывод: ряд n=1 n! расходится.
X nn
n! ⊲⊲ 8.2.21. Исследуйте на сходимость ряды:
n=1
P∞ 1
P∞ 3n ·n!
Его число Даламбера: 1) n=1 n!n ; 5) n=1 nn ;
P∞ e
2) n=1 n! ; P∞ (n!)2
(n+1)n+1 P∞ (n!)2 6) n=1 2n2 ;
an+1 (n+1)!
3) n=1 (2n)! ;
D = lim = lim = P∞ 2n ·n!
P∞ n5
nn 4) n=1
n→∞ an n→∞
n! nn ; 7) n=1 2n +3n .

Радикальный признак Коши.

Теорема 8.2.7 (радикальный признак Коши). Пусть an > 0, и



C = lim n
an (8.2.48)
n→∞

Тогда
P∞
— если C < 1, то ряд n=1 an сходится;
P∞
— если C > 1, то ряд n=1 an расходится.
P∞
• Число C, определяемое формулой (8.2.48), называется числом Коши ряда n=1 an .

Доказательство. 1. Предположим, что



C = lim n
an < 1 (8.2.49)
n→∞

Возьмем какое-нибудь число ε > 0 так чтобы C + ε < 1. Из (8.2.49) следует, что ε-окрестность числа

C содержит почти все числа n an , то есть

∃M ∀n > M C −ε< n
an < C + ε

Если обозначить q = C + ε, то мы получим что q < 1 и



∀n > M n
an < q

то есть
∀n > M an < q n
Отсюда

X ∞
X
an < qn
n=M n=M

Последний ряд сходится как


P∞геометрическая прогрессия со знаменателем q < 1. Значит, по признаку
P∞
сравнения, меньший ряд n=M an тоже сходится. Отсюда по лемме об остатке 8.2.6, ряд n=1 an
сходится.
2. Предположим, что наоборот

C = lim n an > 1 (8.2.50)
n→∞

Возьмем какое-нибудь число ε > 0 так чтобы C − ε > 1. Из (8.2.50) следует, что ε-окрестность числа

C содержит почти все числа n an , то есть

∃M ∀n > M C −ε< n
an < C + ε
§ 2. Числовые ряды 505

Если обозначить q = C − ε, то мы получим что q > 1 и



∀n > M n an > q

то есть
∀n > M an > q n
Отсюда

X ∞
X
an > qn
n=M n=M
Последний ряд расходится как геометрическая
P∞ прогрессия со знаменателем q > 1. Значит, по при-
знаку
P∞ сравнения, меньший ряд a
n=M n тоже расходится. Отсюда по лемме об остатке 8.2.6, ряд
a
n=1 n расходится.

P∞  2
⋄ 8.2.22. Чтобы исследовать на сходимость ряд Вывод: ряд 1+ 1 n
расходится.
n=1 n
X∞  n
n−1 ⊲⊲ 8.2.24. Исследуйте на сходимость ряды:
n=1
2n + 1 P∞ 1  2
1 n
1) n=1 2n · 1 + n ;
найдем его число Коши: P∞ 1  2
1 n
√ n−1 1 2) n=1 3n · 1 + n ;
C = lim n an = lim = <1 P∞ 1
n
n→∞ 2n + 1 2 3) n=1 n · arcsin n ;
n→∞
P∞  n−1 n P∞ nn+ n 1
Вывод: ряд n=1 2n+1 сходится. 4) n=1 (n+1)n (здесь признак Коши не дает ре-
⋄ 8.2.23. Рассмотрим ряд зультатов);
P∞ −n+sin n
X∞  n2 5) n=1 2 ;
1 P∞ 2+(−1)n
1+ 6) (этот ряд исследуется по при-
n=1
n n=1 2n
знаку Коши, но не по признаку Даламбера).
Его число Коши:
 n
√ 1
C = lim n
an = lim 1 + =e>1
n→∞ n→∞ n

Критерий Коши сходимости ряда


Теперь от знакопостоянных рядов мы возвращаемся к произвольным.
Теорема 8.2.8 (критерий Коши сходимости ряда). Пусть {an } – произвольная числовая последо-
вательность. Тогда следующие условия эквивалентны:
(i) ряд

X
an
n=1

сходится;
(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an стремится к нулю при i → ∞:
kX
i +li

an −→ 0
i→∞
n=ki +1
P∞
Доказательство. Рассмотрим частичные суммы ряда n=1 an :
N
X
SN = an
n=1
506 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Мы получаем следующую логическую цепочку:



X
ряд an сходится
n=1

m
последовательность SN сходится
 
вспоминаем критерий Коши сходимости
m последовательности – теорему 3.2.15

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
i→∞
выполняется соотношение: Ski +li − Ski −→ 0
i→∞
!
замечаем, что
m Ski +li − Ski =
Pki +li
n=k +1 an
i

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
Pki +li i→∞
выполняется соотношение: n=ki +1 a n −→ 0
i→∞

Общие признаки сходимости рядов


Необходимое условие сходимости.
P∞
Теорема 8.2.9. Если ряд n=1 an сходится, то an −→ 0.
n→∞
P∞
Теорема 8.2.10 (эквивалентная формулировка). Если an −→
6 0, то ряд n=1 an расходится.
n→∞
P∞
Доказательство. Если ряд n=1 an сходится, то для последовательностей ki = i − 1 и li = 1, по
критерию Коши (теорема 8.2.8), мы получим
−1+1
kiX
an = aki −1+1 = aki = ai −→ 0
i→∞
n=ki −1+1

⋄ 8.2.25. Чтобы исследовать на сходимость ряд nn+ n


1  
делим числитель
lim = и знаменатель на nn =
n→∞ (n + 1)n
X∞
1 1
√ nn 1
n
n = lim n = 6= 0
n=1 n→∞ 1 + n1 e
достаточно вычислить предел
P∞ 1
nn+ n
 1 
Вывод: ряд n=1 (n+1)n расходится.
1 1 ln n− n
lim √ = lim n− n = lim e =
n→∞ n n n→∞ n→∞ ⋄ 8.2.27. Чтобы исследовать на сходимость ряд
− lnnn 0 ∞
= lim e = e = 1 6= 0 X 1
n→∞
(−1)n · n · sin
P∞ 1 n=1
n
Вывод: ряд n=1

n
n
расходится.
достаточно вычислить предел
⋄ 8.2.26. Чтобы исследовать ряд
1 1
X∞ 1 lim |an | = lim n · sin = lim n · = 1 6= 0
nn+ n n→∞ n→∞ n n→∞ n
(n + 1)n . .
n=1 То есть |an | −→ 0, откуда an −→ 0.
вычисляем предел n→∞
P n→∞

Вывод: ряд n=1 (−1)
n
· n · sin n1 расходится.
§ 2. Числовые ряды 507
P∞
⊲⊲ 8.2.28. Исследуйте на сходимость ряды: 2) √1
n=1 n ln n ;
P∞ (−1)n P∞ 
1) n=1 n n ;
√ 3) n
n=1 (−1) · n2 · 1 − cos n1 .

Признак абсолютной сходимости.


P∞ P∞
Теорема 8.2.11. Если ряд n=1 |an | сходится, то ряд n=1 an тоже сходится.

Доказательство.

X
ряд |an | сходится
n=1
 
применяем критерий Коши
⇓ сходимости ряда – теорему 8.2.8

  kX
i +li

∀ li , ki ∈ N ki −→ ∞ |an | −→ 0
n→∞ i→∞
n=ki +1


kX
!
i +li kX
i +li kX
i +li kX
i +li

06 an 6 |an | −→ 0 ⇒ an −→ 0 ⇒ an −→ 0
i→∞ i→∞ i→∞
n=ki +1 n=ki +1 n=ki +1 n=ki +1

  kX
i +li

∀ li , ki ∈ N ki −→ ∞ an −→ 0
n→∞ i→∞
n=ki +1
 
снова применяем критерий Коши
⇓ сходимости ряда


X
ряд an сходится
n=1

⋄ 8.2.29. Чтобы исследовать ряд рассмотрим соответствующий ряд из модулей:



X (−1)n
√ X∞ X∞
n n sin n 1
n=1
n
6 n
2 2
рассмотрим соответствующий ряд из модулей: n=1 n=1
| {z }
X∞ X∞ X∞
(−1)n 1 1 сходится,
√ = √ = 3
как сумма геометрической прогрессии
n=1
n n n=1
n n n=1 n
2 со знаменателем |q| < 1
| {z }
сходится как ряд Дирихле P∞ sin n
с показателем степени α > 1 Вывод: ряд n=1 2n сходится.
P∞ (−1) n
Вывод: ряд √
n=1 n n сходится.
⋄ 8.2.30. Чтобы исследовать ряд ⊲⊲ 8.2.31. Исследуйте на сходимость ряды:
P∞ cos n
X∞ 1) n=1 n2 +n+ln n;
sin n
P∞ n(n−1) 5

n=1
2n 2) n=1 (−1) 2 n3n .
508 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Специальные признаки сходимости рядов


Признак Лейбница.
Теорема 8.2.12. Пусть последовательность {bn } обладает свойствами:
(i) она неотрицательна и невозрастает,

b0 > b1 > b2 > ... > 0 (8.2.51)

(ii) и стремится к нулю:


bn −→ 0 (8.2.52)
n→∞

Тогда
P∞
(a) ряд n=0 (−1)n bn сходится,
(b) его остаток оценивается сверху своим первым членом:

X
(−1)n bn 6 bN +1 (8.2.53)
n=N +1

! 8.2.32. То же справедливо и для ряда, у которого нижний предел суммирования равен 1:



X
(−1)n bn
n=1

Доказательство. Рассмотрим частичные суммы нашего ряда:


N
X
SN = (−1)n bn
n=1

Мы покажем, что SN образуют последовательность, которую можно изоборазить картинкой

(нечетные суммы образуют возрастающую последовательность, а четные – убывающую, причем


расстояние между четными и нечетными стремится к нулю).
Действительно, рассмотрим подпоследовательности нечетных и четных сумм:

Ak = S2k−1 , Bk = S2k

1. Покажем сначала, что Ak монотонна и ограничена:

A1 6 A2 6 A3 6 ... 6 b0 (8.2.54)

Действительно, с одной стороны,


2k+1
X 2k−1
X
Ak+1 = S2k+1 = (−1)n bn = (−1)n bn + b2k − b2k+1 > S2k−1 = Ak
| {z }
n=0 n=0
| {z }
6

0
k
S2k−1

А, с другой, –

Ak+1 = S2k+1 = b0 − (b1 − b2 ) − (b3 − b4 ) −... − (b2k−1 − b2k ) − b2k+1 6 b0


| {z } | {z } | {z } | {z }
6
6

0 0 0 0
§ 2. Числовые ряды 509

2. Докажем монотонность и ограниченность последовательности {Bk }:

0 6 ... 6 B2 6 B1 6 B0 (8.2.55)

С одной стороны, получаем:


2k+2
X 2k
X
Bk+1 = S2k+2 = (−1)n bn = (−1)n bn − (b2k+1 − b2k+2 ) 6 S2k = Bk
| {z }
n=0 n=0
| {z }

6
0
k
S2k

А, с другой, –
Bk = S2k = (b0 − b1 ) + (b2 − b3 ) +... + (b2k−1 − b2k ) > 0
| {z } | {z } | {z }

6
0 0 0

3. Из (8.2.54) и (8.2.55) следует, что последовательности {Ak } и {Bk } сходятся:

Ak −→ A = sup Ak , Bk −→ B = inf Bk (8.2.56)


n→∞ k∈Z+ n→∞ k∈Z+

При этом,

B − A = lim Bk − lim Ak = lim (Bk − Ak ) = lim (S2k − S2k−1 ) = lim b2k = 0,


k→∞ k→∞ k→∞ k→∞ k→∞

то есть
A = B,
и поэтому соотношения (8.2.56) удобно переписать так:

S2k−1 −→ sup S2k−1 = S = inf S2k ←− S2k (8.2.57)


k→∞ k∈Z+ k∈Z+ ∞←k

где S = A = B. Отсюда сразу следует, что последовательность SN сходится к S,

SN −→ S,
N →∞
P∞ n
то есть ряд n=0 (−1) bn сходится. С другой стороны, из (8.2.57) следует двойное неравенство

∀k, l ∈ N S2k−1 6 S 6 S2l (8.2.58)

из которого мы получаем, во-первых,

|S − S2k−1 | = S − S2k−1 6 S2k − S2k−1 = (−1)2k · b2k = b2k (8.2.59)

и, во-вторых,

|S − S2k | = S2k − S 6 S2k − S2k+1 = −(−1)2k+1 · b2k+1 = b2k+1 (8.2.60)



−S 6 −S2k+1

S2k+1 6 S

(8.2.58)

Цепочки (8.2.59) и (8.2.60) вместе дают оценку (8.2.53).

⋄ 8.2.33. Ряд поэтому по теореме Лейбница получаем


X∞ P∞ n
(−1)n Вывод: ряд n=1 (−1)
n сходится.
n
n=1
P∞ ⋄ 8.2.34. Ряд
можно представить в виде n=1 (−1)n bn , где
X∞
(−1)n ln n
1 монотонно
bn = −→ 0 n
n n→∞ n=1
510 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ n
можно представить в виде Поэтому f (x) монотонно убывает при x > 3,
n=1 (−1) bn , где
значит, наша последовательность bn = f (n) мо-
ln n
bn = нотонно убывает начиная с номера n = 3. От-
n сюда по теореме Лейбница получаем, что дол-
P (−1)n ln n
Эта последовательность стремится к нулю по жен сходиться ряд ∞ n=3 . Он является
n
теореме о шкале бесконечностей, но непонятно, остатком ряда P n
∞ (−1) ln n
n=1 n , значит этот ряд
будет ли это стремление монотоным. Для того, P∞ (−1)n ln n
n=1 тоже сходится (по лемме об остат-
чтобы это проверить, можно рассмотреть вспо- n
ке 8.2.6).
могательную функцию P∞ n
Вывод: ряд n=1 (−1)n ln n сходится.
ln x
f (x) =
x
⊲⊲ 8.2.35. Исследуйте на сходимость ряды:
Ее производная будет отрицательной на проме-
жутке x > 3 P∞ n P∞ (−1)n
1) n=1 (−1)
ln nn ; 3) n=1 n·(ln n)α .
1 − ln x P
f ′ (x) = < 0, x > 3 2)
∞ (−1)
;
x2 n=1 nα

Преобразование Абеля и признаки Дирихле и Абеля для рядов.


Лемма 8.2.13. Для любых числовых последовательностей {an } и {bn } справедливо равенство
q
X q−1
X
an · b n = An · (bn − bn+1 ) + Aq · bq , p6q (8.2.61)
n=p n=p

где
N
X
AN = an
n=p

Если вдобавок {bn } – монотонная последовательность, то справедливо неравенство


q
X N
X n o
an · bn 6 3 · max an · max |bp |, |bq | (8.2.62)
p6N 6q
n=p n=p

• Равенство (8.2.61) называется преобразованием Абеля4 , а неравенство (8.2.62) – неравен-


ством Абеля.
Доказательство. 1. Сначала докажем формулу (8.2.61).

Ap −Ap + Ap+1 −Aq−2 + Aq−1 −Aq−1 + Aq


=

q
X z}|{ z }| { z }|{ z}|{
an · bn = ap ·bp + ap+1 ·bp+1 + ... + aq−1 ·bq−1 + aq ·bq =
n=p
= Ap bp + (−Ap + Ap+1 )bp+1 + ... + (−Aq−2 + Aq−1 )bq−1 + (−Aq−1 + Aq )bq =
= Ap bp − Ap bp+1 + Ap+1 bp+1 + ... −Aq−2 bq−1 + Aq−1 bq−1 − Aq−1 bq +Aq bq =
| {z } | {z } | {z } | {z }
=

Ap (bp − bp+1 ) Aq−1 (bq−1 − bq )


q−1
X
= An · (bn − bn+1 ) + Aq · bq
n=p

2. Теперь предположим, что последовательность {bn } монотонна и докажем неравенство (8.2.62).


Здесь можно считать, что {bn } невозрастает, потому что случай, когда она неубывает, сводится к
этому умножением {bn } на −1:
b1 > b2 > b3 > ... (8.2.63)

PN
(8.2.61) можно ввести третий параметр, число M < p, и тогда в обозначении AN = n=M an формула примет
более привычный вид:
Xq q−1
X
an · bn = An · (bn − bn+1 ) + Aq · bq − Ap−1 · bp ,
n=p n=p
§ 2. Числовые ряды 511

Обозначим
N
X
A = max |AN | = max an (8.2.64)
p6N 6q p6N 6q
n=p

Тогда:
q
X q−1
X q−1
X
an · bn = (8.2.61) = An · (bn − bn+1 ) + Aq · bq 6 |An | ·|bn − bn+1 | + |Aq | ·|bq | 6
n=p n=p n=p
|{z} |{z}

>

>
(8.2.64)
A A
0

>
X
q−1 z
(8.2.63)
}| {  X
q−1 
6 A· | bn − bn+1 | +|bq | = A · (bn − bn+1 ) + |bq | =
n=p
| {z } n=p

=
bn − bn+1

 ↓ ↓ ↓ ↓↓ ↓ 
=A· bp − bp+1 + bp+1 − bp+2 +... + bq−1 − bq +|bq | =
| {z } | {z } | {z }
n=p n=p+1 n=q−1
= A · (bp − bq + |bq |) 6 A · (|bp | + |bq | + |bq |) 6 3 · A · max{|bp |, |bq |}

Теорема 8.2.14 (признак Дирихле). Пусть последовательности {an } и {bn } обладают следую-
щими свойствами:
P∞
(i) частичные суммы ряда n=1 an ограничены:
N
X
sup an < ∞
N ∈N n=1

(ii) последовательность {bn } монотонно стремится к нулю:


монотонно
bn −→ 0
n→∞
P∞
Тогда ряд n=1 an · bn сходится.
Доказательство. Обозначим
N
X
sup an = C < ∞
N ∈N n=1
и заметим, что
q
X
∀p, q ∈ N an 6 2C (8.2.65)
n=p

Действительно,
q
X q
X p−1
X q
X p−1
X
an = an − an 6 an + an 6 2C
n=p n=1 n=1 n=1 n=1
| {z } | {z }
>

>

C C
P∞
Чтобы убедиться, что ряд n=1 an · bn сходится, воспользуемся критерием Коши (теорема 8.2.8):
выберем произвольные последовательности li ∈ N и ki ∈ N (ki −→ ∞). По неравенству Абеля
n→∞
(8.2.62) получаем:
kX
i +li N
X n o
an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z } ↓ ↓
0 0
>

(8.2.65)
2C
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.
512 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

Признак Дирихле часто используется для исследования рядов вида



X ∞
X
bn · sin nx, bn · cos nx
n=1 n=1

В этих случаях бывают полезны следующие тригонометрические формулы:


N
X N
X
sin N2 x · sin N2+1 x sin N2 x · cos N2+1 x
sin nx = cos nx = (x 6= 2πk) (8.2.66)
n=1
sin x2 n=1
sin x2

Покажем как они применяются.

монотонно
⋄ 8.2.36. Исследуем на сходимость ряд то мы получим bn −→ 0, и
n→∞
X∞
sin n N N
X X
n=1
n sup an = sup sin nx =
N ∈N n=1 N ∈N n=1
Если положить = (8.2.66) =
N
1 sin 2x· sin N2+1 x 1
an = sin n, bn = = sup 6 < +∞
n N ∈N sin 2x
sin x2
монотонно
то мы получим bn −→ 0, и
n→∞ По признаку Дирихле, получаем, что наш ряд
сходится при x 6= 2πk.
N
X N
X Остается проверить, будет ли он сходиться
sup an = sup sin n = при x = 2πk. Подставим это значение в наш ряд:
N ∈N n=1 N ∈N n=1
= (8.2.66) = X∞ ∞
sin 2πkn X
= 0
sin N2 · sin N2+1 1 n
= sup 6 < +∞ n=1 n=1
N ∈N sin 12 sin 12
Ясно, что этот ряд
P∞сходится.
По признаку Дирихле,
P получаем Вывод: ряд n=1 sinnnx сходится при любом
Вывод: ряд ∞ sin n
n=1 n сходится. x ∈ R.

⋄ 8.2.37. Исследуем на сходимость ряд ⊲⊲ 8.2.38. Исследуйте на сходимость ряды:


P∞ cos n
X∞
sin nx 1) n=1 n ;
P∞ cos nx
n 2) n=1 n ;
n=1 P∞ sin πn
3) n=1 ln n ;
12

Если положить P∞ ln n πn
4) n=1 n · cos 12 ;
1 P∞ n(n+1)
an = sin nx, bn = 5) n=1 (−1)
2 · √1n .
n

Теорема 8.2.15 (признак Абеля). Пусть последовательности {an } и {bn } обладают следующими
свойствами:
P∞
(i) ряд n=1 an сходится;
(ii) последовательность {bn } монотонна и ограничена.
P∞
Тогда ряд n=1 an · bn сходится.
P∞
Доказательство. Заметим, что из сходимости ряда n=1 an следует, что для произвольных после-
довательностей li ∈ N и ki ∈ N (ki −→ ∞) выполняется соотношение
n→∞

N
X
max an −→ 0 (8.2.67)
ki 6N 6ki +li i→∞
n=ki +1
§ 2. Числовые ряды 513

Действительно, если бы это было не так,


N
X
max an −→
6 0
ki 6N 6ki +li i→∞
n=ki +1

то, переходя к подпоследовательности, мы получили бы, что для некоторого ε > 0 выполняется
соотношение
N
X
max an > ε
ki 6N 6ki +li
n=ki +1


Ni
X
∃Ni ∈ [ki , ki + li ] an >ε
n=ki +1
| {z }
здесь Ni > ki ,
потому что
иначе было бы
PN i
n=k +1 an = 0
i


kiX
+mi
∃mi = Ni − ki an > ε
n=ki +1
| {z }

это невозможно,
потому что
по критерию Коши
(теорема 8.2.8)
Pki +mi
n=k +1 an −→ 0
i i→∞

Теперь обозначим
B = sup |bn | < ∞
n∈N
P∞
Чтобы доказать сходимость ряда n=1 an · bn , снова воспользуемся критерием Коши (теоремой
8.2.8): для произвольных последовательностей li ∈ N и ki ∈ N (ki −→ ∞) по неравенству Абеля
n→∞
(8.2.62) мы получим
kX
i +li N
X n o
an · b n 6 3 · max an · max |bki +1 |, |bki +li | −→ 0
ki 6N 6ki +li | {z } | {z } i→∞
n=ki +1 n=ki +1
| {z }
>

>

↓ (8.2.67)
B B
0

P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.

⋄ 8.2.39. Рассмотрим ряд ⋄ 8.2.40. Следующий ряд



X ∞
sin n π X sin nx · cos nx
cos arctg(nx)
n=1
n n ln n
n=2
Если положить
исследуется таким же образом. Если положить
sin n π
an = , bn = cos sin nx · cos nx
n n an = , bn = arctg(nx)
P∞ ln n
то мы получим, что n=1 an – сходящийся ряд
(мы уже доказали это в примере 8.2.36), а bn то мы получим, что
– монотонная ограниченная последовательность.
P ∞ ∞ ∞
X X sin nx · cos nx X sin 2nx
Значит, по признаку Абеля, ряд ∞ sin n π
n=1 n cos n an = =
сходится. n=2 n=2
ln n n=2
2 ln n
514 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ cos n n
– сходящийся ряд при любом x ∈ R (это 1) n=1 n · arcsin n+1 ;
доказывается так же, как в примере 8.2.37), P∞ cos nx
2) n=1 n · arctg(nx);
а bn – монотонная ограниченная последова- P∞ sin πn
3) n=1 ln n · arcctg(−n);
12
тельность.
P∞ sin nx·cosЗначит, по признаку Абеля, ряд
nx P∞ ln n  
arctg(nx) сходится при любом πn n
4) n=1 n · cos 12 · arccos − n+1 ;
n=2 ln n
x ∈ R.
P∞ n(n+1) 1
cos n
⊲⊲ 8.2.41. Исследуйте на сходимость ряды: 5) n=1 (−1)
2 · √
n
.

(d) Асимптотика сумм и рядов


По аналогии с определением асимпотической эквивалентности функций на с.360, мы говорим, что
две числовые последовательности an и bn асимптотически эквивалентны, и изображаем это запи-
сью
an ∼ b n ,
n→∞
если их отношение стремится к единице:
an
−→ 1. (8.2.68)
bn n→∞
Это автоматически означает, что последовательность bn должна быть ненулевой, по крайней мере,
начиная с какого-то номера (потому что иначе делить на нее будет нельзя), и то же самое должно
быть справедливо для an (потому что иначе в пределе не получится единицы).

Асимптотическая эквивалентность рядов.


Теорема 8.2.16 (признак эквивалентности рядов). Пусть

an > 0, bn > 0, an ∼ b n (8.2.69)


n→∞

• Коротко эти три условия записываются формулой



X ∞
X
an ∼ bn
n=1 n=1
P∞ P∞
Тогда сходимость ряда n=1 an эквивалентна сходимости ряда n=1 bn :


X ∞
X
an сходится ⇐⇒ bn сходится
n=1 n=1

При этом,
(i) если эти ряды сходятся, то справедливо следующее соотношение, показывающее, что
скорость их сходимости будет одинаковой:

X ∞
X
an ∼ bn (8.2.70)
N →∞
n=N n=N

(ii) если эти ряды расходятся, то справедливо следующее соотношение, показывающее, что
скорость их расходимости будет одинаковой:
N
X N
X
an ∼ bn (8.2.71)
N →∞
n=1 n=1

Доказательство. Зафиксируем сначала какое-нибудь ε ∈ (0, 1) и заметим такую логическую це-


почку:
an ∼ b n
n→∞


§ 2. Числовые ряды 515

an
−→ 1
bn n→∞

an
∃L ∀n > L ∈ [1 − ε; 1 + ε]
bn

an
∃L ∀n > L 1 − ε 6 61+ε
bn

∃L ∀n > L (1 − ε) · bn 6 an 6 (1 + ε) · bn


X ∞
X ∞
X
(1 − ε) · bn 6 an 6 (1 + ε) · bn (8.2.72)
n=L n=L n=L

(последнее двойное неравенство понимается как почленное сравнение рядов, определенное форму-
лой (8.2.44)). P∞ P∞
1. Покажем теперь, что сходимость ряда n=1 an эквивалентна сходимости ряда n=1 bn . С
одной стороны, справедлива такая цепочка:

X
an сходится
n=1

⇓ (применяем лемму об остатке 8.2.6)



X
an сходится
n=L
 
применяем неравенство (8.2.72)
⇓ и признак сравнения 8.2.4


X
(1 − ε) · bn сходится
n=L

⇓ (применяем свойство 10 , §2)



X
bn сходится
n=L

⇓ (применяем лемму об остатке 8.2.6)



X
bn сходится
n=1

А, с другой стороны, справедлива цепочка в обратном направлении:



X
bn сходится
n=1

⇓ (применяем лемму об остатке 8.2.6)



X
bn сходится
n=L

⇓ (применяем свойство 10 , §2)



X
(1 + ε) · bn сходится
n=L
 
применяем неравенство (8.2.72)
⇓ и признак сравнения 8.2.4
516 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ


X
an сходится
n=L
⇓ (применяем лемму об остатке 8.2.6)

X
an сходится
n=1
2. Теперь предположим, что оба ряда сходятся и докажем формулу (8.2.70). Из (8.2.72) получаем:
X∞ X∞ ∞
X  

X ∞
X
∃L ∈ N ∀N > L (1 − ε) · bn 6 an 6 (1 + ε) · bn здесь уже an и bn – числа
n=N n=N
n=N n=N n=N


P∞  
an
∃L ∈ N ∀N > L 1 − ε 6 Pn=N
∞ 6 1+ε здесь ε ∈ (0; 1) с самого начала выбиралось произвольным
n=N bn

P∞
an
∀ε ∈ (0, 1) ∃L ∈ N ∀N > L 1 − ε 6 Pn=N
∞ 6 1+ε
n=N bn

P∞
a n
Pn=N
∞ −→ 1
n=N bn N →∞
то есть справедливо (8.2.70).
3. Нам остается доказать (8.2.71) в предположении, что оба ряда расходятся. Здесь применяется
теорема Штольца 3.2.18. Из условия an ∼ bn следует, что, начиная с некоторого номера M , все
числа bn ненулевые (мы отмечали это при определении асимптотически эквивалентных последова-
тельностей на с.514), и поэтому положительны:
∀n > M bn > 0 (8.2.73)
Зафиксируем это M и обозначим
N
X N
X
AN = an , BN = bn .
n=M n=M

Из (8.2.73) следует, что последовательность BN (N > M ) строго возрастает:


BM < BM+1 < ... < BN < ...
P∞
С другой стороны, она стремится к бесконечности, поскольку мы предполагаем ряд n=1 bn рас-
ходящимся:
XN
BN = bn −→ ∞
N →∞
n=M
Поэтому по теореме 3.2.18,
AN AN − AN −1 aN
lim = lim = lim =1
N →∞ BN N →∞ BN − BN −1 N →∞ bN

Если теперь обозначить


M−1
X M−1
X
A= an , B= bn ,
n=1 n=1
то мы получим:
0 1
✁✕ ✁✕
A AN
PN PM−1 PN +
an an + an A + AN BN BN
lim Pn=1
N
= lim Pn=1
M−1 PN
n=M
= lim = lim =1
N →∞
n=1 bn
N →∞
n=1 bn + n=M bn N →∞ B + BN N →∞ B
+1
BN

❆❯
0
То есть справедливо (8.2.71).
§ 2. Числовые ряды 517

P∞ α
⋄ 8.2.42. Вывод: ряд n=1 sin n1 сходится при α > 1.

X X∞
1 1
2+n−1
∼ 2
⋄ 8.2.45.
n=1
n n=1
n
| {z } ∞  ∞
сходится
X ln 1 + 1 X 1
n

P∞ 1 n=1
nα n=1
n α+1
Вывод: ряд n=1 n2 +n−1 сходится. | {z }
В соответствии с теоремой 8.2.16, можно дать сходится
при α + 1 > 1
асимптотическую оценку скорости сходимости то есть при α > 0
этого ряда:
N
X XN P∞ ln(1+ n
1
)
1 1 Вывод: ряд n=1 nα сходится при α > 0.
2+n−1
∼ 2
,
n=1
n N →∞
n=1
n
⊲⊲ 8.2.46. Исследуйте на сходимость ряды:
однако это будет мало информативно, потому
P∞ √  1+n2 2
что до теорем 8.2.18 и 8.2.19 мы не сможем вы- 1) n=1 n · 1+n3 ;
ражать асимптотику рядов через стандартные P∞ 1
функции. 2) n=1
√ ;
n(n+1)(n+2)
P∞ √ √ 
⋄ 8.2.43. 3) n=1 n · n+1− n−1 ;
P∞ 1
√ ∞ √ n+1
4) n=1 3 n · ln n−1 ;
X∞ X X∞ √
1+ n n 1
√ ∼ √ = P∞ √
ln(n+ n+ln n+1)
3
n + 2n n=1 n3 n 5)
n=1 n=1
| {z } n=1 3n−ln n+arctg n−1 ;
расходится P∞ ln(1+ n
1
+ n12 )
6) n=1 ln(n−n√n+ln n+3) ;
P∞ 1+√n
Вывод: ряд √
n=1 n3 +2n расходится. P∞  1 α
7) n=1 n · e n − 1 ;
⋄ 8.2.44. P∞ 1+n
∞  α ∞ 8) n=1 α;
X 1 X 1 ( n1 −sin n1 )
sin ∼ P∞ n 3 oα
α
n=1
n n=1
n 9) n=1 1 + n1 2 − 1 ;
| {z }
сходится P∞ (arctg n1 )
α

при α > 1 10) n=1 1−cos 1 .


n

Асимптотическое сравнение рядов.


Теорема 8.2.17 (асимптотический признак сравнения рядов). Пусть последовательности {an } и
{bn } обладают следующими свойствами:
(1) an ≪ bn (то есть an = o (bn ));
n→∞ n→∞
(2) bn > 0, ∀n ∈ N.
• Коротко эти два условия записываются формулой:

X ∞
X
an ≪ bn
n=1 n=1

Тогда
P∞ P∞
(i) из сходимости большего ряда n=1 bn следует сходимость меньшего ряда n=1 an :

X ∞
X
an сходится ⇐= bn сходится (8.2.74)
n=1 n=1

причем скорости сходимости оцениваются соотношением



X ∞
X
an ≪ bn ; (8.2.75)
N →∞
n=N n=N
518 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ
P∞ P∞
(ii) из расходимости меньшего ряда n=1 an следует расходимость большего ряда n=1 bn :


X ∞
X
an расходится =⇒ bn расходится (8.2.76)
n=1 n=1

причем скорости расходимости оцениваются соотношением


N
X N
X
an ≪ bn ; (8.2.77)
N →∞
n=1 n=1

Доказательство. Зафиксируем сначала какое-нибудь ε > 0 и заметим такую логическую цепочку:

an ≪ b n
n→∞


an
−→ 0
bn n→∞

|an |
−→ 0
bn n→∞

|an |
∃L ∀n > L <ε
bn

∃L ∀n > L |an | < ε · bn


X ∞
X
|an | < ε · bn (8.2.78)
n=L n=L

(последнее неравенство понимается как почленное сравнение рядов).


1. Докажем (8.2.74) и (8.2.76). Замечаем такую цепочку:

X
ряд bn сходится
n=1

⇓ (применяем лемму об остатке 8.2.6)



X
ряд bn сходится
n=L



X
ряд ε · bn сходится
n=L
 
вспоминаем неравенство (8.2.78)
⇓ и признак сравнения рядов 8.2.4


X
ряд |an | сходится
n=L

⇓ (применяем лемму об остатке 8.2.6)



X
ряд |an | сходится
n=1


§ 2. Числовые ряды 519


X
ряд an сходится
n=1

Это доказывает утверждение (8.2.74). Его можно переформулировать так:



X ∞
X
невозможна ситуация, когда an расходится. а bn сходится
n=1 n=1
P∞ P∞
и отсюда следует, что если n=1 an расходится, то n=1 bn тоже должен расходиться. То есть
выполняется и (8.2.76).
2. Теперь предположим, что оба ряда сходятся и докажем формулу (8.2.75). Из (8.2.78) получаем:

X ∞
X  

X ∞
X
∃L ∈ N ∀N > L |an | < ε · bn здесь уже an и bn – числа
n=N n=N
n=N n=N


P∞  
|an |
∃L ∈ N ∀N > L Pn=N
∞ <ε здесь ε > 0 с самого начала выбиралось произвольным
n=N bn

P∞
|an |
∀ε > 0 ∃L ∈ N ∀N > L Pn=N
∞ <ε
n=N bn

P∞
|an |
Pn=N
∞ −→ 0
n=N bn N →∞

P∞
an
Pn=N
∞ −→ 0
n=N bn N →∞

то есть справедливо (8.2.75).


3. Нам остается доказать (8.2.77) в предположении, что оба ряда расходятся. Здесь применяется
теорема Штольца 3.2.18. Из условия an ≪ bn следует, что начиная с некоторого номера M все
n→∞
числа bn ненулевые, и поэтому положительны:

∀n > M bn > 0 (8.2.79)

Зафиксируем это M и обозначим


N
X N
X
AN = an , BN = bn .
n=M n=M

Из (8.2.79) следует, что последовательность BN (N > M ) строго возрастает:

BM < BM+1 < ... < BN < ...


P∞
С другой стороны, она стремится к бесконечности, поскольку мы предполагаем ряд n=1 bn рас-
ходящимся:
XN
BN = bn −→ ∞
N →∞
n=M

Поэтому по теореме 3.2.18,


AN AN − AN −1 aN
lim = lim = lim =0
N →∞ BN N →∞ BN − BN −1 N →∞ bN

Если теперь обозначить


M−1
X M−1
X
A= an , B= bn ,
n=1 n=1
520 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

то мы получим:
0 0
✁✕ ✁✕
A AN
PN PM−1 PN +
an an + an A + AN BN BN
lim Pn=1
N
= lim Pn=1
M−1 PN
n=M
= lim = lim =0
N →∞
n=1 bn
N →∞
n=1 bn + n=M bn N →∞ B + BN N →∞ B
+1
BN

❆❯
0
То есть справедливо (8.2.77).

Асимптотический признак сравнения рядов ⊲⊲ 8.2.49. Исследуйте на сходимость ряды:


удобно применять, переписав и дополнив для P P∞ n
n5
дискретного аргумента шкалу бесконечностей 1) ∞ n=2 n; 4) n=2 ne100 ;
P∞ 2 n P 5n
(6.1.16) следующим образом: 2) n=2 (−1)n 5n! ; 5) ∞ n=2 n! .

P∞
3) n=2 sin n nln√nn ;
α
1 ≪ loga n ≪ n ≪
n→∞ n→∞ (α>0) n→∞
(a>1) ⋄ 8.2.50. Чтобы понять, сходится ли ряд
≪ an ≪ n! ≪ nn ∞  
n→∞ (a>1) n→∞ n→∞ X (−1)n
(8.2.80) ln 1 + √ , (8.2.81)
n=2
n ln n
⋄ 8.2.47. выпишем асимптотику его общего члена:
X∞ X∞ 1 ∞
X
ln n n2 1  
≪ = (−1)n (−1)n
n2 n2 n
3
2 ln 1 + √ = (6.2.50) = √ −
n=1 n=1 n=1
| {z } n ln n n ln n
 2  2 !
сходится, 1 (−1)n (−1)n
в силу примера 8.2.10 − · √ + o √ =
2 n ln n n→∞ n ln n
Больший ряд сходится, значит и меньший ряд  
(−1)n 1 1
сходится. = √ − + o
P∞ n ln n 2n ln2 n n→∞ n ln2 n
Вывод: ряд n=1 lnn2n сходится.
В соответствии с теоремой 8.2.17, можно дать Отсюда
асимптотическую оценку скорости сходимости
X∞   X ∞
этого ряда: (−1)n (−1)n
ln 1 + √ = √ −
N N n=2
n ln n n=2
n ln n
X ln n X 1  
≪ ∞ ∞
n 2 3 , 1 X 1 X 1
n=1
N →∞
n=1 n 2 − · + o (8.2.82)
2 n=2 n ln2 n n=2 n→∞ n ln2 n
но как и в примерах, иллюстрировавших теоре-
му 8.2.16, это мало что объяснит, поскольку, как причем последний ряд надо понимать так, что
мы уже говорили, до теорем 8.2.18 и 8.2.19 мы его общий член является последовательностью,
не сможем выражать асимптотику рядов через точное выражение которой через элементарные
стандартные функции. функции нам неважно, но про нее мы знаем, что
она бесконечно мала по сравнению с последова-
⋄ 8.2.48. тельностью n ln12 n . Отсюда следует, что ряды в
∞ ∞ правой части (8.2.82) сходятся:
X 1 X 1
≫ X∞
ln n n (−1)n
n=2 n=2
| {z } √
n=2
n ln n
расходится,
в силу примера 8.2.9
– по признаку Лейбница (теорема 8.2.12),
Меньший ряд расходится, значит и больший ряд ∞
расходится. X 1
P∞
Вывод: ряд n=2 ln1n расходится. n=2
n ln2 n
§ 2. Числовые ряды 521

∞  (−1)n
P 
– по интегральному признаку (теорема 8.2.3), а 1) 2 n ln n − 1 ;
X∞   n=2
1 q 
o P

3 (−1)n+1
n→∞ n ln2 n 2) 1+ n −1 ;
n=2 n=1
 
– по асимптотическому признаку сравнения ря- P
∞ (−1)n

дов (теорема 8.2.17). В итоге получаем, что ис- 3) e n ln n − 1 ;
n=2
ходный ряд (8.2.81) сходится. ∞  
P (−1)n+1

⊲⊲ 8.2.51. Исследуйте на сходимость ряды: 4) 4 n −1 .


n=1

Связь с несобственными интегралами и формула суммирования Эйлера. Связь между


рядами и несобственными интегралами, успевшая к настоящему времени проявить себя в интеграль-
ном признаке сходимости (теорема 8.2.3), позволяет в некоторых случаях выразить асимптотику
частичных сумм ряда в стандартных функциях. Первый результат на эту тему – очевидное след-
ствие теоремы 8.2.3:
Теорема 8.2.18. Пусть f – неотрицательная и невозрастающая функция на полуинтервале
[1; +∞). Тогда
XN ˆ N
f (n) = f (x) d x + C + o (1) (8.2.83)
1 N →∞
n=1
P∞ P∞
где C – постоянная Эйлера ряда n=1 f (n). Если вдобавок ряд n=1 f (n) расходится, то
N
X ˆ N
f (n) ∼ f (x) d x (8.2.84)
N →∞ 1
n=1

Доказательство. Формула (8.2.83) – просто по-другому переписанное соотношение (8.2.38):


N
X ˆ N
f (n) − f (x) d x −→ C
1 N →∞
n=1
P∞
Если ряд n=1 f (n) расходится, то есть
N
X
f (n) −→ ∞,
N →∞
n=1

то, мы получим:
P 
N
o n=1 f (n)
N →∞
!
=

N
X ˆ N z}|{ ˆ N XN
f (n) = f (x) d x + C + o (1) = f (x) d x + o f (n)
1 N →∞ 1 N →∞
n=1 | {z } n=1
=

P 
N
o n=1 f (n)
N →∞

а это эквивалентно формуле (8.2.83) по теореме 6.1.9.

⋄ 8.2.52. Частичные суммы гармонического ря- по теореме 8.2.18 удовлетворяют формуле


да N
X 1
ln N +C + o (1)
= |{z} (8.2.85)
n=1
n N →∞
=

´N 1
1 x dx

X 1 где C – постоянная Эйлера (8.2.41). Мы отме-
n=1
n чали в примере 8.2.9, и это видно из форму-
522 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

лы (8.2.85), что этот ряд расходится. Формула где Cα – постоянные Эйлера (8.2.43). При 0 <
(8.2.84) для него принимает вид: α < 1 этот ряд расходится, поэтому выполняется
соотношение (8.2.84)
XN
1
∼ ln N. XN
n N →∞ 1 N 1−α − 1
n=1
α
∼ .
n=1
n N →∞ 1−α
⋄ 8.2.53. Частичные суммы ряда Дирихле

Его можно немного упростить, воспользовав-
X 1
, шись теоремой 6.1.9,
n=1

N 1−α − 1 N 1−α 1 N 1−α
= + ∼ ,
который мы рассматривали в примере 8.2.10, при 1−α |1 −
{z α} |1 −
{z α} 1−α
N →∞
0 < α 6= 1 должны по теореме 8.2.18 удовлетво-

=

рять формуле ∞ o
N →∞
(1)

XN
1 N 1−α − 1 и в результате мы получим
α
= +Cα + o (1) (8.2.86)
n | 1−{z α }
N →∞
n=1 XN
1 N 1−α
∼ (0 < α < 1).
=

´N
1
1
xα dx n=1
nα N →∞ 1−α

Теорема 8.2.19. Для любой гладкой функции f на отрезке [1, N ], N ∈ N, справедлива формула:
N
X ˆ N ˆ N
f (n) = f (1) + f (x) d x + {x} · f ′ (x) d x (8.2.87)
n=1 1 1

(здесь {x} – дробная часть x).


• Эта формула называется формулой суммирования Эйлера.
! 8.2.54. Понятно, что выбор единицы в качестве нижнего предела суммирования здесь несуще-
ственен – сдвигом аргумента из (8.2.87) выводится, например, что для любой гладкой функции f
на отрезке [0, N ] справедлива формула
N
X ˆ N ˆ N
f (n) = f (0) + f (x) d x + {x} · f ′ (x) d x
n=0 0 0

Доказательство. Рассмотрим функцию


[x]
X
F (x) = f (n) + {x} · f (x)
n=1

(здесь [x] – целая часть x).


1. Заметим, что функция F кусочно-гладкая. Действительно, при x ∈ (k, k + 1), k ∈ N, выпол-
няется равенство [x] = k, поэтому {x} = x − [x] = x − k, и значит
[x] k
X X
F (x) = f (n) + {x} · f (x) = f (n) + (x − k) · f (x) (8.2.88)
n=1 n=1

Отсюда видно, что на интервале (k, k + 1) функция F гладкая и имеет конечные односторонние
производные на концах.
2. Заметим далее (и это неожиданно), что функция F непрерывна. Мы уже показали, что на
каждом интервале (k, k + 1), k ∈ N, она будет гладкой, поэтому ее непрерывность нужно проверить
только в целых точках. Зафиксируем какую-нибудь точку k ∈ N и вычислим в ней значение F и
значения ее односторонних пределов:
[k] k
X X
F (k) = f (n) + {k} ·f (k) = f (n)
n=1
|{z} n=1
=

0
§ 2. Числовые ряды 523

nX
[x] o k−1
X k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 1 · f (k) = f (n)
x→k−0 x→k−0
n=1 n=1 n=1
nX
[x] o Xk k
X
lim F (x) = lim f (n) + {x} · f (x) = f (n) + 0 · f (k) = f (n)
x→k+0 x→k+0
n=1 n=1 n=1

Видно, что эти три величины совпадают между собой, значит F непрерывна в k.
3. Заметим, что из формулы (8.2.88) следует, что на каждом интервале (k, k + 1), k ∈ N, произ-
водная функции F имеет вид:

d X  d  
k
F ′ (x) = f (n) + (x − k) · f (x) = (x − k) · f (x) = 1 · f (x) + (x − k) · f ′ (x) = f (x) + {x} · f ′ (x)
d x n=1 dx

Теперь по формуле перемещения непрерывной кусочно-гладкой функции (7.3.146) получаем:

f (1)
=

0
=

P1 z}|{
n=1 f (n) + {1} ·f (1)
=

z }| { ˆ N ˆ N ˆ N
F (N ) − F (1) = F ′ (x) d x = f (x) d x + {x} · f ′ (x) d x
| {z } 1 1 1
=

PN
n=1 f (n) + {N } ·f (N )
| {z }
=

0
=

PN
n=1 f (n)


N
X ˆ N ˆ N
f (n) − f (1) = f (x) d x + {x} · f ′ (x) d x
n=1 1 1

Остается перенести f (1) в правую часть, и получится формула (8.2.87).

Формула суммирования Эйлера сводит нахождение асимптотики суммы к асимптотике интегра-


ла. Чтобы объяснить, как ее применять, нам понадобится некое новое понятие:
• Функциями Эйлера называются функции, определенные индуктивным правилом

E0 (x) = {x} (8.2.89)


ˆ x ˆ 1
Ek (x) = Ek−1 (t) d t − x · Ek−1 (t) d t, (8.2.90)
0 0

Интегралы
ˆ 1
εk = Ek (t) d t (8.2.91)
0

называются числами Эйлера, и с их помощью формула (8.2.90) записывается в виде:


ˆ x
Ek (x) = Ek−1 (t) d t − εk−1 · x (8.2.92)
0

Предложение 8.2.20. Каждая функция Эйлера Ek


— кусочно-гладка, а если k > 0, то и непрерывна,
— периодична с периодом 1,
Ek (x + 1) = Ek (x), x∈R
— ограничена на R,
— равна нулю в целых точках:
Ek (n) = 0, n∈Z (8.2.93)
524 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

— имеет производную в нецелых точках:

Ek′ (x) = Ek−1 (x) − εk−1 , /Z


x∈ (8.2.94)

Доказательство. Кусочная гладкость и непрерывность при k > 0 следует из теоремы 7.3.13. Пе-
риодичность доказывается по индукции: для E0 (x) = {x} это верно, а если Ek−1 (x + 1) = Ek−1 (x),
то
ˆ x+1 ˆ x 
Ek (x + 1) − Ek (x) = Ek−1 (t) d t − εk−1 · (x + 1) − Ek−1 (t) d t − εk−1 · x =
0 0
ˆ x+1 ˆ 1
= Ek−1 (t) d t − εk−1 = Ek−1 (t) d t − εk−1 = 0.
x 0

После этого ограниченность становится следствием непрерывности и периодичности. А равенство


нулю в целых точках следует из равенства нулю в нуле:
ˆ 0
Ek (0) = Ek−1 (t) d t − εk−1 · 0 = 0.
0

Для приложений будет полезно вычислить несколько первых чисел Эйлера и функций Эйлера
на периоде [0, 1).
Предложение 8.2.21. При x ∈ [0, 1) справедливы формулы:
1
E0 (x) = x, ε0 = (8.2.95)
2
x2 x 1
E1 (x) = − , ε1 = − (8.2.96)
2 2 12
x3 x2 x
E2 (x) = − + , ε2 = 0 (8.2.97)
6 4 12
Доказательство. При x ∈ [0, 1) получаем цепочку:

E0 (x) = {x} = x


1 1
1
ˆ ˆ
ε0 = E0 (t) d t = t dt =
0 0 2

x x
x x2 x
ˆ ˆ
E1 (x) = E0 (t) d t − ε0 · x = t dt − = −
0 0 2 2 2

1 1     1
t2 t t3 t2 1 1 1
ˆ ˆ
ε1 = E1 (t) d t = − dt = − = − =−
0 0 2 2 6 4 0 6 4 12

x ˆ x 
t2 t x x3 x2 x
ˆ
E2 (x) = E1 (t) d t − ε1 · x = − dt+ = − +
0 0 2 2 12 6 4 12

1 1     1
t3 t2 t t4 t3 t2 1 1 1
ˆ ˆ
ε2 = E2 (t) d t = − + dt = − + = − + =0
0 0 6 4 12 24 12 24 0 24 12 24

Теперь перейдем к асимптотикам сумм.


§ 2. Числовые ряды 525
ˆ ∞
⋄ 8.2.55. В примере 8.2.52 мы нашли асимпто- ε0 + E0 (t) − ε0
=A− dt =
тическую формулу для частичной суммы гармо- N t2
ˆ ∞ ˆ ∞
нического ряда: 1 E0 (t) − ε0
= A − ε0 d t − dt =
N |{z} N t2 N t2
X 1

=
(8.2.95)
= ln N + C + o (1) (8.2.85) 1

n=1
n N →∞ 2
ˆ ∞ ′
1 ∞ E1 (t)
(C – постоянная Эйлера (8.2.41)). =A+ − dt =
2t N N t2
Покажем теперь, как с помощью формулы 1
ˆ ∞
1
Эйлера (8.2.87) можно эту асимптотику уточ- =A− − 2
d E1 (t) = (7.3.147) =
2N t
нять. Взяв f (x) = x1 , мы по формуле Эйлера по- N
ˆ ∞
лучим: 1 E1 (t) ∞ E1 (t)
=A− − 2 −2 dt =
2N t N N t3
N ˆ ∞
X 1
ˆ N
dx
ˆ N
{x} 1 E1 (N ) E1 (t)
=1+ − dx = =A− + 2
−2 dt =
n 1 x 1 x2 2N N
| {z } N t3 }
| {z
n=1
( )

=
(8.2.94) 1
ˆ N o
{x} 0 t→∞ t2
= 1 + ln N − d x. (8.2.98) | {z }
1 x2 o (1)
N →∞ N
Таким образом, нахождение асимптотики суммы  
1 1
свелось к нахождению асимптотики интеграла = A− + o
2N N →∞ N
ˆ N ˆ N
{t} E0 (t)
I(N ) = 2
dt = d t (8.2.99) Подставим это в (8.2.98):
1 t 1 t2
Он отличается от изучавшегося уже нами инте- XN ˆ N
1 {x}
грала (8.1.27) = 1 + ln N − dx =
ˆ x
sin t n=1
n 1 x2
dt  
1 t2 1 1
= 1 + ln N − A + + o .
тем, что синус sin t в подынтегральном выраже- 2N N →∞ N
нии заменен дробной частью {t}, а верхний пре-
дел стал дискретным. Метод нахождения асимп- Сравнив с (8.2.85), мы видим теперь, что посто-
тотики для (8.2.99) представляет собой модифи- янная A связана с постоянной Эйлера C равен-
кацию метода для (8.1.27). ством
Коротко идею можно сформулировать так: 1−A=C
здесь тоже нужно интегрировать по частям,
но сначала нужно добиваться, чтобы в диффе- и поэтому полученную асимптотику можно пере-
ренциале стояла функция Эйлера с подходящим писать так:
индексом. А это достигается добавлением и вы- N  
читанием чисел Эйлера в периодической части X 1 1 1
= ln N + C + + o . (8.2.100)
подынтегрального выражения. n=1
n 2N N →∞ N
Продемонстрируем это на интеграле (8.2.99).
Прежде всего замечаем, что существует конеч- Это уточняет асимптотическую формулу
ный предел (8.2.85).
ˆ ∞
E0 (t) Ее можно и дальше уточнять. Для этого нуж-
A = lim I(N ) = dt но заметить, что, вычисляя асимптотику для
N →∞ 1 t2
I(N ), мы попутно вывели формулу
´∞
– поскольку интеграл 1 E0t2(t) d t сходится абсо- ∞
1 E1 (t)
ˆ
лютно: I(N ) = A − −2 dt
ˆ ∞ ˆ ∞ 2N N t3
E0 (t) 1 1 ∞
2
d t 6 2
dt = − =1
1 t 1 t t 1 Подставим ее в (8.2.98):
Запомним это число A. Тогда:
XN ˆ N
1 {x}
ˆ N
E0 (t) = 1 + ln N − dx =
I(N ) = dt = n=1
n 1 x2
t2
ˆ1 ∞
ˆ ∞
ˆ ∞ 1 E1 (t)
E0 (t) E0 (t) = 1 + ln N − A + +2 dt =
= d t − dt = 2N t3
1 t 2
N t2 ˆ ∞ N
| {z } 1 E1 (t)
= ln N + C + +2 d t (8.2.101)
=

A
2N N t3
526 Глава 8. НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ И ЧИСЛОВЫЕ РЯДЫ

N
ε0 + E0 (x) − ε0
ˆ
Отдельно найдем асимптотику последнего инте-
= N · ln N − N + 1 + dx =
грала: 1 x

= N · ln N − N + 1+
E1 (t)
ˆ
ˆ N ˆ N
I2 (N ) = 2 dt = dx E0 (x) − ε0
N t3 + ε0 + dx =
ˆ ∞ |{z} 1 x 1 x
ε1 + E1 (t) + ε1

=
(8.2.95)
=2 dt = 1
t3 2
ˆ ∞N ˆ ∞ ˆ N
1 E1 (t) − ε1 1 d E1 (x)
= 2 ε1 dt+ 2 dt = = N · ln N − N + 1 + ln N + dx =
|{z} N t3 N t3 2 1 x
=

(8.2.96)
1
− 12
1 E1 (x) N
= N · ln N − N + 1 + ln N + +
ˆ ∞ 2 | x{z 1}
2 1 ∞ d E2 (t)
= · 2 +2 =

=
2 · 12 t N N t3 E1 (N ) E1 (1)
∞ N − 1
1 2E2 (t) ∞ E2 (t)
ˆ

=
(8.2.94)
=− + + 6 dt = 0
12N 2 t3 N t4
ˆ ∞N ˆ N
E1 (x) 1
1 2E2 (N ) E2 (t) + d x = N · ln N − N + 1 + ln N +
=− − +6 dt = x 2 2
12N 2 | N 3
{z } N t4 }
| {z 1
ˆ N
( ) E1 (x)
=

(8.2.94) 1
o
0 t→∞ t3 + dx
{z| } 1 x2
o ( N12 )
N →∞
  Теперь заметим, что поскольку функция E1
1 1 ограничена на R, сходится абсолютно интеграл
=− + o ´ ∞ E1 (x)
12N 2 N →∞ N 2 d x:
1 x2

Подставив это в (8.2.101), получим: ˆ ∞


E1 (x)
ˆ ∞
M
d x 6 dx < ∞
N 1 x2 1 x2
X 1 1
ˆ ∞
E1 (t)
= ln N + C + +2 dt = Обозначим буквой A его значение:
n=1
n 2N N t3
  ˆ ∞
1 1 1 E1 (x)
= ln N + C + − + o A= dx
2N 12N 2 N →∞ N 2 1 x2

Мы получили уточнение для формулы (8.2.100): Тогда

XN   N
X
1 1 1 1 1
= ln N + C + +− + o . ln n = N · ln N − N + 1 + ln N +
n 2N 12N 2 N →∞ N 2 n=1
2
n=1
(8.2.102) ˆ N
E1 (x) 1
И так далее. Применяя функции Эйлера нуж- + d x = N · ln N − N + 1 + ln N +
1 x2 2
ное число раз, можно добиться любой точности ˆ ∞ ˆ ∞
асимптотического разложения. E1 (x) E1 (x)
+ dx− dx
x2 | x
2
{z }
⋄ 8.2.56. Найдем асимптотику суммы |1 {z } N
=
=

1

A o x
N
X x→∞
| {z }
ln n
=

n=1 o (1)
N →∞

По формуле Эйлера (8.2.87) получаем: И в качестве ответа получаем:


N · ln N − (N − 1) N
X 1
=

N ln n = N · ln N − N + ln N + 1 − A + o (1)
2
´N
x · ln x − 1
x d ln x N →∞
1 n=1
=

0
z }| {
=

N z}|{ (A определено выше). Понятно, что эту асимп-


X ˆ N
{x}
ˆ N
ln n = ln 1 + ln x d x + d x = тотику можно уточнять.
n=1 1 1 x
ˆ N ⊲ 8.2.57. Уточните асимптотическую формулу
{x} (8.2.86) для частичных сумм ряда Дирихле:
= N · ln N − N + 1 + dx =
1 x
X∞
ˆ N
E0 (x) 1
= N · ln N − N + 1 + dx = , 0 < α 6= 1
x n=1

1
§ 2. Числовые ряды 527

Точное вычисление сумм. Неожиданное N3 − 1 N2 − 1


=1+ + +
следствие формулы Эйлера состоит в том, что, 3 2
если под знаком суммы стоит многочлен, то мы N
ˆ N

можем в точности сосчитать частичную сумму + 2x · E1 (x) −2 E1 (x) d x =


1
| {z } | 1
{z }
ряда.

=
⋄ 8.2.58. Выведем формулу для суммы 2N · E1 (N ) − 2 · E1 (1) ´1
(N − 1) 0
E1 (x) d x

=
(8.2.94)

=
N
X 0 (N − 1) · ε1
n2

=
(8.2.96)
n=1 − N12
−1

По формуле Эйлера получаем: N3 − 1 N2 − 1 N − 1


=1+ + + =
3 2 6
N
X ˆ N ˆ N 3 2
2 2 N N N
n =1+ x dx + 2 {x} · x d x = = + +
n=1 1 1 3 2 6
N3 − 1
ˆ N  
=1+ +2 ε0 + E0 (x) − ε0 · x d x = Вывод:
3 1
N
N3 − 1
ˆ
N
X
=1+ + 2 ε0 x d x+ N3 N2 N
3 |{z} 1 n2 = + + (8.2.103)
3 2 6
=

(8.2.95) n=1
1
2
ˆ N  
+2 E0 (x) − ε0 · x d x = ⊲ 8.2.59. Найдите формулы для сумм:
1 PN 3
N 1) n=1 n ,
N3 − 1 N2 − 1
ˆ
=1+ + +2 x d E1 (x) = PN 4
3 2 1
2) n=1 n .
Глава 9

ФУНКЦИОНАЛЬНАЯ
СХОДИМОСТЬ,
ФУНКЦИОНАЛЬНЫЕ РЯДЫ И
АППРОКСИМАЦИЯ

§1 Функциональные последовательности и функциональные


ряды
• Функциональной последовательностью называется последовательность, элементами ко-
торой являются функции:
f1 , f2 , f3 , ...
• Если задана функциональная последовательность {an }, то последовательностью ее ча-
стичных сумм называется функциональная последовательность
N
X
SN (x) = an (x) = a1 (x) + a2 (x) + a3 (x) + ... + aN (x)
n=1

Пара последовательностей {an } и {SN } называется функциональным рядом и обознача-


ется

X
an (x) = a1 (x) + a2 (x) + a3 (x) + ...
n=1
P∞
Функции an называются слагаемыми ряда n=1 an , а функции SN – его частичными
суммами.

(a) Поточечная сходимость


Область сходимости функциональной последовательности
• Пусть задана функциональная последовательность

fn (x).

При каждом фиксированном значении переменной x = x0 она превращается в числовую


последовательность
fn (x0 ).
Если эта числовая последовательность сходится

∃ lim fn (x0 ) = f (x0 ),


n→∞

то говорят, что функциональная последовательность fn (x) сходится в точке x = x0 .

528
§ 1. Функциональные последовательности и функциональные ряды 529

• Множество всех точек x, в которых последовательность fn (x) сходится называется обла-


стью сходимости

D = {x ∈ R : предел lim fn (x) существует и конечен},


n→∞

а функция x ∈ D 7→ f (x) – поточечным пределом функциональной последовательности


fn (x).
• Говорят, что функциональная последовательность {fn } стремится к функции f поточечно
на множестве E, если для всякого x ∈ E числовая последовательность {fn (x)} стремится
к числу f (x):
∀x ∈ E fn (x) −→ f (x) (9.1.1)
n→∞
коротко это записывается так:
x∈E
fn (x) −→ f (x)
n→∞

⋄ 9.1.1. Функциональная последовательность 1) если |x| > 1, то f (x) = limn→∞ 1


1+xn =
 
1
fn (x) = xn 1+∞ = 0;
1 1
2) если |x| < 1, то f (x) = limn→∞ 1+x n = 1+0 =
имеет область сходимости
0;
D = (−1; 1], 3) если x = 1, то получаем f (1) =
1 1 1 1
limn→∞ 1+x n = limn→∞ 1+1n = 1+1 = 2 ;
и ее пределом будет функция 1
4) если x = −1, то limn→∞ 1+x n не существует,
(
0, если x ∈ (−1; 1) и поэтому f (−1) не определено.
f (x) =
1, если x = 1 В результате получаем

Это следует из очевидного соотношения 
0, если |x| > 1
( f (x) = 1, если |x| < 1
∞, если |x| > 1 
1
2 , если x = 1
n
x −→ (9.1.2)
n→∞ 0, если |x| < 1
и график этой функции выглядит следующим
⋄ 9.1.2. Функциональная последовательность образом:

fn (x) = nx

имеет область сходимости

D = (−∞; 0]

и ее пределом будет функция


(
0, если x < 0 Видно, что x = 1 здесь является точкой раз-
f (x) =
1, если x = 0 рыва, а все остальные точки, в которых функ-
ция определена – то есть точки x ∈ (−∞; −1) ∪
Это следует из соотношения (−1; 1) ∪ (1; +∞) – являются точками непрерыв-
( ности f (x). (При этом, в точке x = −1 функция
α ∞, если α > 0
n −→ (9.1.3) f не определена, и поэтому не имеет смысла го-
n→∞ 0, если α < 0 ворить о непрерывности f в этой точке.)
⋄ 9.1.3. Рассмотрим функцию, заданную фор- ⋄ 9.1.4. Решим ту же задачу для функции
мулой
1 nx − n−x
f (x) = lim f (x) = lim x
n→∞ 1 + xn n→∞ n + n−x

Покажем, что, несмотря на такой необычный Рассмотрим несколько случаев (используя


способ задания функции, можно построить ее (9.1.3)):
график (и заодно найти точки разрыва). Здесь nx −n−x
надо использовать (9.1.2) и рассмотреть несколь- 1) если x > 0, то f (x) = limn→∞ nx +n−x =
1−n−2x 1−0
ко случаев: limn→∞ 1+n −2x = 1+0 = 1;
530Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

nx −n−x
2) если x < 0, то f (x) = limn→∞ nx +n−x = ⊲⊲ 9.1.6. Постройте графики и найдите точки
2x
−1
limn→∞ nn2x +1 = 0−1
= −1; разрыва следующих функций:
0+1

3) если x = 0, то f (x) = limn→∞ n0 −n0


= 1−1
= 1) f (x) = limn→∞ xn − xn+1 ;
n0 +n0 1+1
x−n −1
0. 2) f (x) = limn→∞ x−n +1 ;
q
В результате получаем 3) f (x) = limn→∞ x2 + 1
n2 .
n



 1, если x > 0 4) f (x) = limn→∞ x3 nx −n−x
nx +n−x
f (x) = 0, если x = 0 x
−1

 5) f (x) = limn→∞ arcsin nnx +1 .
−1, если x < 0
2n
6) f (x) = limn→∞ cos x;
то есть f (x) совпадает с функцией сигнум: 7) f (x) = limn→∞ (sin2n x − cos2n x);
x
8) f (x) = limn→∞ 1+(2 sin x)2n ;
9) f (x) = limn→∞ arctg(nx);
10) f (x) = limn→∞ x · arctg(n · ctg x);
11) f (x) = limn→∞ x2 · arctg(x2n );
12) f (x) = limn→∞ arctg nx ;
2−nx −2nx
13) f (x) = limn→∞ 2−nx +2nx ;
Видно, что x = 0 здесь является точкой раз- 14) f (x) = lim x+x2 2nx
n→∞ 1+2nx ;
рыва, а все остальные точки, – то есть точки
x2nx −3nx
x ∈ (−∞; 0)∪(0; +∞) – являются точками непре- 15) f (x) = limn→∞ 2nx +3nx ;
рывности f (x). 16) f (x) = limn→∞ 2n sin x −2−n sin x cos x
;
2n sin x +2−n sin x
⋄ 9.1.5. Рассмотрим функциональную последо- 2n cos x −2−n cos x sin x
17) f (x) = limn→∞ 2n cos x +2−n cos x ;
вательность
p log2 (1+2nx )
n 18) f (x) = limn→∞ log2 (1+2n ) .
fn (x) = 1 + x2n
Ее областью сходимости будет вся числовая пря- ⋄ 9.1.7. Докажем следующую формулу, выража-
мая ющую функцию Дирихле из (3.1.4) как двойной
D=R поточечный предел стандартных функций:
а пределом будет функция  
1, x ∈ Q
 D(x) = = lim lim cosm 2π · n! · x
 если |x| < 1 /Q
0, x ∈ n→∞ m→∞
1,
(9.1.4)
f (x) = 1, если |x| = 1

 2 (эту формулу надо понимать так: чтобы вычис-
x , если |x| > 1 лить значение в точке x нужно сначала взять
потому что предел при m → ∞, а затем предел при n → ∞).
— при |x| < 1 Доказательство. Пусть x ∈ Q, то есть x = p
q,
p
n
p ∈ Z, q ∈ N, тогда при n > q мы получим:
f (x) = lim 1 + x2n =
n→∞
1 n! ... q
x2n ) n = 10 = 1,
= lim (1 + |{z}
n→∞

0 ⇓
p
— при |x| = 1 n! · x = n! · ∈Z
q
1
x2n ) n = 20 = 1,
f (x) = lim (1 + |{z}
n→∞ ⇓
k
1
cos 2π · n! · x = 1
— при |x| > 1

1
f (x) = lim (1 + x2n ) n =
n→∞
  n1 cosm 2π · n! · x = 1
1
= lim x2 · 2n
+1 = x2 · 10 = x2 . ⇓
n→∞ x
|{z}

0
lim cosm 2π · n! · x = 1
m→∞
§ 1. Функциональные последовательности и функциональные ряды 531

Это верно для n > q, то есть для почти всех n. | cos 2π · n! · x| < 1
Поэтому

m
lim lim cos 2π · n! · x = 1 = D(x) m
lim cos 2π · n! · x = 0
n→∞ m→∞ m→∞

/ Q, то при любом n ∈ N
Наоборот, если x ∈ Это верно для всех n, значит
получим:
lim lim cosm 2π · n! · x = 0 = D(x)
/Z
n! · x ∈ n→∞ m→∞

Область сходимости функционального ряда


• Пусть задан функциональный ряд

X
an (x).
n=1

При каждом фиксированном значении переменной x = x0 последовательность его частич-


ных сумм превращается в числовую последовательность
N
X
SN (x0 ) = an (x0 )
n=1

Если эта числовая последовательность сходится



X
∃ lim SN (x0 ) = S(x0 ) = an (x0 )
N →∞
n=1
P
(то есть, если числовой ряд ∞
P n=1 an (x0 ) сходится), то говорят, что функциональный ряд

a
n=1 n сходится в точке x = x0 .
P
• Множество всех точек x, в которых ряд ∞ n=1 an (x) сходится (то есть, область сходимости
функциональной последовательности SN ) называется областью сходимости
N
X
D = {x ∈ R : предел lim an (x) существует и конечен},
N →∞
n=1
P
а функция x ∈ D 7→ S(x) – поточечной суммой функционального ряда ∞ n=1 an (x).
P∞
• Говорят, что функциональный ряд n=1 an сходится Pк функции S поточечно на множе-
стве E ⊆ R, , если для всякого x ∈ E числовой ряд ∞n=1 an (x) сходится к числу S(x):

N
X
∀x ∈ E an (x) −→ S(x). (9.1.5)
N →∞
n=1

⋄ 9.1.8. Областью сходимости ряда рисуют картинку:


X
xn
n=1

⋄ 9.1.9. Областью сходимости ряда Дирихле

X∞
будет, как мы уже отмечали в теореме 8.2.1, мно- 1
жество (−1; 1). Для наглядности в таких случаях n=1
nx
532Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

будет, как уже говорилось в примере 9.1.16, мно- Отсюда


жество (1; +∞).
1 √ 1
C= √ <1 ⇔ x+2> ⇔
3· x+2 3
1 1 17
⇔ x+2> ⇔ x> −2=−
9 9 9
Теперь можно сделать вывод, что ряд сходится
при x > − 17
9 :
⋄ 9.1.10. Найдем область сходимости ряда
X∞
(−1)n
n=1
nx

Для этого заметим, что




0, если x > 0 2. Посмотрим, что получается при x < − 17
(−1)n 1 9 :
= x −→ 1, если x = 0
nx n n→∞ 

∞, если x < 0 17 √ 1 1
x<− ⇒ x+2< ⇒ √ >1 ⇒
9 3 3· x+2
Отсюда получаем: .
P∞ n
(−1)n 1
1) если x > 0, то n1x −→ 0, и ряд n=1 (−1)
nx ⇒ √ = √ −→ 0 ⇒
n→∞ 3· x+2 3 · x + 2 n→∞
будет сходиться по признаку Лейбница;
.  
n
2) если x 6 0, то (−1) nx −→ 0, и ряд ⇒
вспоминаем
необходимое условие ⇒
n→∞ сходимости
P∞ (−1) n

n=1 nxбудет расходиться в силу необходи- ∞


X (−1)n
мого условия сходимости. ⇒ ряд p расходится
n (x + 2)n
n=1 n · 3 ·

Отмечаем это на картинке:

P∞ (−1)n
Вывод: областью сходимости ряда n=1 nx
является множество (0; +∞).
⋄ 9.1.11. Найдем область сходимости ряда 3. Нам остается посмотреть, что будет при

X n x = − 17
9 :
(−1)
p
n· 3n · (x + 2)n ∞
X X∞
n=1 (−1)n (−1)n
p = q  =
Для этого сразу заметим, что область определе- n (x + 2)n 1 n
n=1 n · 3 · 9 n=1 n · 3n ·
ния нашего ряда (то есть общая область опреде-
X∞ n X∞
ления слагаемых ряда) есть множество x > −2. (−1) (−1)n
1. Исследуем теперь ряд на абсолютную схо- = 1 =
n=1
n · 3n · 3n n=1
n
димость (то есть пробуем применить к нему тео-
рему 8.2.11): Этот ряд сходится по признаку Лейбница:

X (−1)n
p =
n=1 n · 3n · (x + 2)n

X 1
= p =
n=1 n· 3n · (x + 2)n

X 1 Вывод: областью сходимости ряда
= √ n P∞
n· 3· x+2 (−1)n
n=1 n=1 n
√ n
является множество
 17 n·3 · (x+2)
Находим число Коши: − 9 ; +∞ .
s
1 1 ⊲⊲ 9.1.12. Найдите область сходимости функци-
C = lim n
√ n = √
n→∞ n· 3· x+2 3· x+2 ональных рядов:
§ 1. Функциональные последовательности и функциональные ряды 533
P∞ cos nx
1) n=1 (признак Дирихле + необходимое
n условие сходимости);
P∞ 
условие сходимости); 6) n 1
(теорема об абсолютной
P∞ cos nx n=1 x + n·2n ·xn
2) n=1 n n (теорема об абсолютной сходимо-
√ сходимости + признак Даламбера + необхо-
сти); димое условие сходимости);
P∞ n! P∞  n
3) n x
n=1 xn (необходимое условие сходимости); 7) n=1 n+1 · 2x+1 (теорема об абсолютной
P∞ xn
4) n=1 1−xn (теорема об абсолютной сходи- сходимости + признак Даламбера + необхо-
мости + признак Даламбера + необходимое димое условие сходимости);
условие сходимости); P∞ n·32n n n
P∞ 2n ·sinn x 8) n=1 2n · x · (1 − x) (теорема об абсолют-
5) n=1 n2 (теорема об абсолютной сходи- ной сходимости + признак Даламбера + необ-
мости + признак Даламбера + необходимое ходимое условие сходимости).

(b) Равномерная сходимость


• Равномерной нормой функции f на множестве E, называется величина

kf kE = kf (x)kx∈E := sup |f (x)| (9.1.6)


x∈E

(здесь предполагается, что функция f определена на множестве E).

⋄⋄ 9.1.13. k sin x kx∈R = sup | sin x| = 1


x∈R
2 2
k x kx∈[0;2]= sup |x | = 4 π
x∈[0;2] karctg xkx∈R = sup | arctg x| =
x∈R 2
k x2 kx∈R = sup |x2 | = ∞
x∈R

Свойства равномерной нормы


1◦ . Неотрицательность:
kf kE > 0 (9.1.7)
причем
kf kE = 0 ⇐⇒ ∀x ∈ E f (x) = 0 (9.1.8)
2◦ . Однородность:
kλ · f kE = |λ| · kf kE , λ∈R (9.1.9)
3◦ . Полуаддитивность:
kf + gkE 6 kf kE + kgkE (9.1.10)
4◦ . Полумультпликативность:
kf · gkE 6 kf kE · kgkE (9.1.11)
5◦ . При расширении множества норма не убывает:

D⊆E =⇒ kf kD 6 kf kE (9.1.12)

Доказательство. Все эти свойства напрямую следуют из свойств модуля. Например, полуаддитив-
ность доказывается так:
 
kf + gkE = sup |f (x) + g(x)| 6 (3.1.10) 6 sup |f (x)| + |g(x)| = (3.1.27) =
x∈E x∈E
= sup |f (x)| + sup |g(x)| = kf kE + kgkE
x∈E x∈E
534Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Равномерная сходимость функциональной последовательности


• Говорят, что последовательность функций {fn } стремится к функции f равномерно на
множестве E, если равномерная норма разности fn − f на множестве E стремится к
нулю при n → ∞:
kfn − f kE −→ 0 (9.1.13)
n→∞

Коротко это записывается так:


x∈E
fn (x) ⇒ f (x)
n→∞

Теорема 9.1.1 (о связи между поточечной и равномерной сходимостью). Если последователь-


ность функций fn стремится к функции f равномерно на множестве E, то fn стремится к f
поточечно на E:
x∈E x∈E
fn (x) −→ f (x) ⇐= fn (x) ⇒ f (x)
n→∞ n→∞

Доказательство.
x∈E
fn (x) ⇒ f (x)
n→∞


k fn (x) − f (x) kx∈E = sup |fn (x) − f (x)| −→ 0
x∈E n→∞


∀x ∈ E 0 6 |fn (x) − f (x)| 6 sup |fn (x) − f (x)| −→ 0
x∈E n→∞


∀x ∈ E |fn (x) − f (x)| −→ 0
n→∞


∀x ∈ E fn (x) − f (x) −→ 0
n→∞


∀x ∈ E fn (x) −→ f (x)
n→∞


x∈E
fn (x) −→ f (x)
n→∞

Обсудим на примерах понятие равномерной поточечно стремится к функции


сходимости. Мы увидим, что утверждение, про- (
тивоположное теореме 9.1.1 неверно: из приме- 0, x ∈ (−1; 1)
f (x) = . (9.1.14)
ров 9.1.14 и 9.1.17 следует, что функции могут 1, x = 1
сходиться поточечно, но не равномерно:
Однако fn не стремится к f равномерно на
. x∈E
x∈E (−1, 1]:
fn (x) −→ f (x) =⇒ fn (x) ⇒ f (x).
n→∞ n→∞
kfn (x) − f (x)kx∈(−1,1] =
⋄ 9.1.14. Очевидно,
( = sup |fn (x) − f (x)| =
x∈(−1,1]
0, x ∈ (−1; 1)
xn −→ . = max{ sup |fn (x) − f (x)| , |fn (1) − f (1)|} =
n→∞ 1, x = 1 x∈(−1,1)

Это соотношение можно интерпретировать так, = max{ sup |xn − 0| , |1n − 1|} =
x∈(−1,1)
что функциональнгая последовательность .
= max{1, 0} = 1 −→ 0
fn (x) = xn , x ∈ (−1, 1], n→∞
§ 1. Функциональные последовательности и функциональные ряды 535

⋄ 9.1.15. Та же самая функциональная последо-


 = sup xn − xn+1
1 1 x∈[0;1]
вательность, рассмотренная на отрезке − 2 , 2 ,
  Это можно сделать, построив график функции
1 1
fn (x) = xn , x∈ − , , fn (x) = xn − xn+1 с помощью производной:
2 2
fn′ (x) = nxn−1 − (n + 1)xn =
будет равномерно на нем стремиться к функ-  
ции f (x) = 0 (получающейся из функции (9.1.14) = xn−1 (n − (n + 1)x) = 0 ⇔ x ∈ 0; n
ограничением на этот отрезок): n+1
Интервалы возрастания и убывания на отрезке
||fn (x) − f (x)||x∈E = ||xn − 0||x∈[− 1 ; 1 ] = [0; 1]:
2 2
 n
1
= sup |xn −0| = sup |xn | = −→ 0
x∈[− 12 ; 12 ] x∈[− 21 ; 12 ] 2 n→∞

⋄ 9.1.16. Последовательность
sin x
fn (x) = Значение функции в точке максимума:
n
 
стремится к функции f (x) = 0 поточечно на мно- n nn nn+1
fn = − =
жестве E = R: n+1 (n + 1)n (n + 1)n+1
 
sin x x∈R nn n nn 1
−→ 0, = 1 − = · =
n n→∞ (n + 1)n n+1 (n + 1)n n + 1
1 1
и эта сходимость равномерна на E = R: = n ·
1 + n1 n+1
sin x
||fn (x) − f (x)||x∈E =k − 0 kx∈R = График:
n
sin x 1 1
= sup − 0 = · sup | sin x| = −→ 0.
x∈R n n x∈R n n→∞

⋄ 9.1.17. Похожая последовательность


x
fn (x) = sin
n
тоже стремится к функции f (x) = 0 поточечно
на множестве E = R:
x x∈R Норма на отрезке [0; 1]:
sin −→ 0,
n n→∞
однако эта сходимость не равномерна: kfn (x) − f (x)kx∈[0;1] = sup xn − xn+1 =
x∈[0;1]
 
x n 1 1 1
||fn (x) − f (x)||x∈E =k sin − 0 kx∈R = = fn = n · −→ ·0 = 0
n . n+1 1+ n 1 n + 1 n→∞ e
x x
= sup sin − 0 = sup sin = 1 −→ 0.
x∈R n x∈R n Вывод: последовательность fn (x) = xn − xn+1
n→∞
стремится к f (x) = 0 (поточечно и) равномер-
⋄ 9.1.18. Рассмотрим функциональную последо- но на множестве E = [0; 1]:
вательность
x∈[0;1]
n n+1 xn − xn+1 ⇒ 0
fn (x) = x − x n→∞

на множестве E = [0; 1]. Ясно, что она поточечно ⋄ 9.1.19. Рассмотрим функциональную последо-
стремится к нулю: вательность
r
1
x∈[0;1]
xn − xn+1 −→ 0 fn (x) = x2 + 2
n→∞ n
на множестве E = R. Ясно, что она поточечно
Чтобы проверить стремится ли она равномерно,
стремится к функции f (x) = |x|:
нужно найти норму
r
1 x∈R p 2
kfn (x) − f (x)kx∈[0;1] = xn − xn+1 x∈[0;1] = x2 + 2 −→ x + 0 = |x|
n n→∞
536Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

x
Проверим, будет ли это стремление равномер- = sup =
arctg
ным: x∈[−a;a] n
ˆ x ′
r t
1 = sup arctg dt =
k fn (x) − f (x) kx∈R =k x2 + 2 − |x| kx∈R = x∈[−a;a] −a n t
n
r   ˆ x 1
1 домножаем на
= sup n
dt =
= sup x2 + 2 − |x| = сопряженный = t2
x∈R n радикал x∈[−a;a] −a 1 + n2
q 2 ˆ x 1
n
x2 + n12 − |x|2 = sup t2
dt 6
= sup q = x∈[−a;a] −a 1 + n2
x∈R x2 + n12 + |x|
ˆ x 1
n 1
6 sup d t = · (a − a) −→ 0
x∈[−a;a] −a 1 + 0 n n→∞
x2 + n12 − x2 1
n2
= sup q = sup q =
x∈R x2 + n12 + |x| x∈R x2 + n12 + |x| Вывод: последовательность fn (x) = arctg nx стре-
мится к f (x) = 0 (поточечно и) равномерно на
1 1
= 2· q  = множестве E = [−a; a]:
n inf x2 + n12 + |x|
x∈R

1 1 1
1 x x∈[−a;a]
= 2·q n2
= 1 = −→ 0 arctg ⇒ 0
n n n→∞
n n→∞
1
0 + n2 + 0 n

q ⊲⊲ 9.1.21. Проверьте соотношения:


Вывод: последовательность fn (x) = x2 + n12 x∈R
x
стремится к f (x) = |x| (поточечно и) равномерно 1) arctg n n→∞ ⇒ 0;
на множестве E = R: x∈[−a;a]
r 2) sin nx ⇒ 0 (воспользоваться тем же приемом, что
1 x∈R n→∞
x2 + 2 ⇒ |x| и в примере 9.1.20);
n n→∞
x∈(−∞;0)
⋄ 9.1.20. Рассмотрим функциональную последо- 3) nx ⇒ 0;
n→∞
вательность
x |x|< 43
fn (x) = arctg 4) 1
⇒ 1;
n 1+xn
n→∞
на множестве E = [−a; a]. Ясно, что она пото- |x|<1
1
чечно стремится к функции f (x) = 0: 5) 1+xn ⇒ 1;
n→∞
x x∈[−a;a] x
n −n −x x>0
arctg −→ arctg 0 = 0 6) nx +n−x ⇒ 1;
n n→∞ n→∞
|x|<1
Проверим, будет ли это стремление равномер-
7) sin2n x ⇒ 0;
ным: n→∞
|x|< π
x 8) sin2n x ⇒ 0;
2
k fn (x) − f (x) kx∈[−a;a]=k arctg kx∈[−a;a]=
n n→∞

Свойства равномерно сходящихся функциональных последовательностей.



1 . Если функции fn равномерно сходятся к функции f на множестве E, то равномерная
норма последовательности fn ограничена:
sup kfn kE < ∞.
n∈N

2◦ . Если функции fn непрерывны на множестве E и равномерно сходятся на нем к функции


f
x∈E
fn (x) ⇒ f (x),
n→∞
то функция f непрерывна на множестве E.
3◦ . Если функции fn непрерывны и равномерно сходятся на интервале (a, b), то для всякой
точки c ∈ (a, b) справедливо равенство
lim lim fn (x) = lim lim fn (x) (9.1.15)
x→c n→∞ n→∞ x→c
§ 1. Функциональные последовательности и функциональные ряды 537

4◦ . Если функции fn непрерывны и равномерно сходятся на отрезке [a, b], то


ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x (9.1.16)
a n→∞ n→∞ a

5◦ . Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке
[a, b], и хотя бы для одной точки c ∈ [a, b] существует конечный предел

lim fn (c) (9.1.17)


n→∞

Тогда функции fn равномерно сходятся на отрезке [a, b], причем


 ′
lim fn = lim fn′ (9.1.18)
n→∞ n→∞

Доказательство. 1. Если kfn − f kE −→ 0, то supn∈N kfn − f kE < ∞, и


n→∞

kfn kE 6 kfn − f kE + kf kE 6 sup kfn − f kE + kf kE < ∞.


n∈N

2. Пусть функции fn непрерывны на множестве E и равномерно сходятся к функции f на E.


Покажем, что f непрерывна на E, то есть что для любой последовательности xi ∈ E, сходящейся к
точке c ∈ E
xi −→ c
n→∞

обязательно выполняется соотношение

f (xi ) −→ f (c)
i→∞

Для этого зафиксируем какой-нибудь ε > 0 и покажем, что почти все числа f (xi ) содержатся в
интервале (f (c) − ε, f (c) + ε), то есть, что для почти всех номеров i ∈ N выполняется неравенство

|f (xi ) − f (c)| < ε (9.1.19)

Для этого заметим, что из равномерной сходимости fn к f то есть из соотношения

k fn (x) − f (x) kx∈E −→ 0


n→∞

следует что найдется номер N ∈ N, для которого


ε
k fN (x) − f (x) kx∈E <
3
Поскольку функция fN непрерывна на множестве E, должно выполняться соотношение

fN (xi ) −→ fN (c)
i→∞

Значит, найдется такой номер I ∈ N, что


ε
∀i > I |fN (xi ) − fN (c)| <
3
Теперь получаем ∀i > I

|f (xi ) − f (c)| = |f (xi ) − fN (xi ) + fN (xi ) − fN (c) + fN (c) − f (c)| 6


6 |f (xi ) − fN (xi )| + |fN (xi ) − fN (c)| + |fN (c) − f (c)| 6
ε ε ε
6k f (x) − fN (x) kx∈E +|fN (xi ) − fN (c)|+ k fN (c) − f (c) kx∈E < + + =ε
3 3 3
Мы получили то, что хотели: формула (9.1.19) выполняется для почти всех i ∈ N.
3. Пусть функции fn непрерывны и равномерно сходятся на интервале (a, b) к какой-то функции
f:
x∈(a,b)
fn (x) ⇒ f (x)
n→∞
538Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Тогда функция f будет непрерывна в силу уже доказанного свойства 10 , поэтому для всякой точки
c ∈ (a, b) мы получим
lim lim fn (x) = lim f (x) = f (c) = lim fn (c) = lim lim fn (x)
x→c n→∞ x→c n→∞ n→∞ x→c

4. Пусть функции fn непрерывны и равномерно сходятся на отрезке [a, b] к какой-нибудь функ-


ции f . Тогда
ˆ b ˆ b ˆ b ˆ b
fn (x) d x − f (x) d x = (fn (x) − f (x)) d x 6 |fn (x) − f (x)| d x 6
a a a a
ˆ b ˆ b
6 sup |fn (x) − f (x)| d x = sup |fn (x) − f (x)| · 1 d x =k fn (x) − f (x) kx∈[a,b] ·(b − a) −→ 0
a x∈[a,b] x∈[a,b] a n→∞

То есть ˆ b ˆ b
fn (x) d x − f (x) d x −→ 0
a a n→∞
или ˆ b ˆ b
fn (x) d x −→ f (x) d x
a n→∞ a
а это уже означает, что выполняется (9.1.16):
ˆ b ˆ b
lim fn (x) d x = lim fn (x) d x
n→∞ a a n→∞

5. Пусть fn – гладкие функции на [a, b], их производные fn′ равномерно сходятся на отрезке [a, b]
к какой-то функции g,
x∈E
fn′ (x) ⇒ g(x), (9.1.20)
n→∞
и хотя бы для одной точки c ∈ [a, b] существует конечный предел (9.1.17):
H = lim fn (c).
n→∞

Тогда, в силу доказанного уже свойства 1 , функция g непрерывна на отрезке [a, b]. Поэтому можно
рассмотреть функцию ˆ x
f (x) = H + g(t) d t, x ∈ [a, b] (9.1.21)
c
Покажем, что функции fn равномерно сходятся к функции f на отрезке [a, b]. Заметим, что
 ˆ x   ˆ x 

|fn (x) − f (x)| = fn (c) + fn (t) d x − H + g(t) d t =
ˆ x c ˆ x c ˆ x
= (fn (c) − H) + fn′ (t) d x − g(t) d t 6 |fn (c) − H| + (fn′ (t) − g(t)) d t 6
ˆc x c
ˆ x c


6 |fn (c) − H| + |fn (t) − g(t)| d t 6 |fn (c) − H| + sup |fn′ (t) − g(t)| d t =
c c t∈[a,b]

= |fn (c) − H| + sup |fn′ (t) − g(t)| · |x − c| = |fn (c) − H| + k fn′ (t) − g(t) kt∈[a,b] ·|x − c|
t∈[a,b]

Отсюда

k fn (x) − f (x) kx∈[a,b] = sup |fn (x) − f (x)| = |fn (c) − H|+ k fn′ (t) − g(t) kt∈[a,b] · sup |x − c| 6
x∈[a,b] x∈[a,b]

6 |fn (c) − H|+ k fn′ (t) − g(t) kt∈[a,b] ·|b − a| −→ 0 + 0 = 0


n→∞

То есть,
x∈E
fn (x) ⇒ f (x). (9.1.22)
n→∞
Теперь формула (9.1.18) становится очевидной:
 ′

lim fn = (9.1.22) = (f ) = (9.1.21) = g = (9.1.20) = lim fn′
n→∞ n→∞
§ 1. Функциональные последовательности и функциональные ряды 539

Критерий Коши равномерной сходимости последовательности.

Теорема 9.1.2 (критерий Коши равномерной сходимости функциональной последовательности).


Функциональная последовательность {fn } тогда и только тогда равномерно сходится на мно-
жестве E, когда она удовлетворяет следующим двум эквивалентным условиям:
(i) для любых двух бесконечно больших последовательностей индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞ (9.1.23)
i→∞ i→∞

соответствующие подпоследовательности {fpi } и {fqi } последовательности {fn } рав-


номерно стремятся друг к другу на множестве E:

k fpi (x) − fqi (x) kx∈E −→ 0 (9.1.24)


i→∞

(ii) для любой последовательности {li } ⊆ N и любой бесконечно большой последовательно-


сти {ki } ⊆ N
ki −→ ∞ (9.1.25)
i→∞
выполняется соотношение

k fki +li (x) − fki (x) kx∈E −→ 0 (9.1.26)


i→∞

Доказательство. Убедимся сначала, что условия (i) и (ii) действительно эквивалентны.


1. Импликация (i) ⇒ (ii) очевидна: если выполняется (i) то есть любые две подпоследователь-
ности {fpi (x)} и {fqi (x)} последовательности {fn (x)} стремятся друг к другу

k fpi (x) − fqi (x) kx∈E −→ 0,


i→∞

то автоматически выполняется и (ii), потому что для любой последовательности {li } ⊆ N и любой
бесконечно большой последовательности {ki } ⊆ N мы можем положить pi = ki + li и qi = ki , и тогда
будет выполняться соотношение

k fki +li (x) − fki (x) kx∈E =k fpi (x) − fqi (x) kx∈E −→ 0
i→∞

2. Докажем импликацию (ii) ⇒ (i). Пусть выполняется (ii), то есть для любой последовательно-
сти {li } ⊆ N и любой бесконечно большой последовательности {ki } ⊆ N выполняется соотношение
(9.1.26). Возьмем какие-нибудь две бесконечно большие последовательности индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

и положим
ki = min{pi ; qi }, li = max{pi ; qi } − ki
Тогда
ki + li = max{pi ; qi }
и поэтому
 
fmax{pi ;qi } (x) − fmin{pi ;qi } (x), если pi > qi
fpi (x) − fqi (x) =  fmin{pi ;qi } (x) − fmax{pi ;qi } (x), если pi < qi  =
0, если pi = qi
 
fki +li (x) − fki (x), если pi > qi
=  fki (x) − fki +li (x), если pi < qi 
0, если pi = qi

В любом случае получается

k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E

поэтому
k fpi (x) − fqi (x) kx∈E =k fki +li (x) − fki (x) kx∈E −→ 0
i→∞
540Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

и значит,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞

Последовательности {pi } и {qi } здесь выбирались с самого начала произвольными. Это значит, что
выполняется (i). Таким образом, мы доказали, что из (ii) следует (i).
3. Докажем теперь, что если последовательность {fn (x)} сходится равномерно к некоторой функ-
ции f , то есть
k fn (x) − f (x) kx∈E −→ 0
i→∞

то {fn (x)} обязательно должна обладать свойством (i). Возьмем любые две бесконечно большие
последовательности индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞
i→∞ i→∞

Соответствующие подпоследовательности {fpi (x)} и {fqi (x)} тоже сходится равномерно к f (x), по-
тому что
k fpi (x) − f (x) kx∈E −→ 0, k fqi (x) − f (x) kx∈E −→ 0
i→∞ i→∞
поэтому

0 6k fpi (x) − fqi (x) kx∈E =k fpi (x) − f (x) + f (x) − fqi (x) kx∈E 6 (9.1.10) 6
6k fpi (x) − f (x) kx∈E + k f (x) − fqi (x) kx∈E −→ 0 + 0 = 0
i→∞

То есть,
k fpi (x) − fqi (x) kx∈E −→ 0
i→∞

и это значит, что {fn (x)} действительно должна обладать свойством (i).
4. Пусть выполнено (i), то есть для любых последовательностей индексов

pi −→ ∞, qi −→ ∞
i→∞ i→∞

выполняется соотношение
k fpi (x) − fqi (x) kx∈E −→ 0 (9.1.27)
i→∞

Тогда для всякой точки a ∈ E мы получим

0 6 |fpi (a) − fqi (a)| 6 sup |fpi (x) − fqi (x)| =k fpi (x) − fqi (x) kx∈E −→ 0
x∈E i→∞

откуда по теореме о двух милиционерах,

fpi (a) − fqi (a) −→ 0


i→∞

Это значит, что для всякой точки a ∈ E числовая последовательность {fn (a)} сходится по критерию
Коши 3.2.15. Обозначим через f (a) ее предел:

f (a) = lim fn (a), a∈E (9.1.28)


n→∞

Мы получили функцию f , определенную на множестве x ∈ E.


Покажем, что функциональная последовательность fn (x) равномерно сходится к функции f на
множестве E.
k fn (x) − f (x) kx∈E −→ 0
n→∞

Предположим, что это не так, то есть что числовая последовательность cn =k fn (x) − f (x) kx∈E не
стремится к нулю:
cn =k fn (x) − f (x) kx∈E 6−→ 0 (9.1.29)
n→∞
0
Тогда, по свойству 2 на с.228, существуют подпоследовательность pi −→ ∞ и число ε > 0 такие,
i→∞
что
cpi > ε
То есть,
k fpi (x) − f (x) kx∈E = sup |fpi (x) − f (x)| > ε
x∈E
§ 1. Функциональные последовательности и функциональные ряды 541

Отсюда следует, что для всякого i существует точка ai ∈ E такая что

|fpi (ai ) − f (ai )| > ε

то есть
fpi (ai ) − ε < f (ai ) < fpi (ai ) − ε
Вспомним теперь формулу (9.1.28): число f (ai ) является пределом последовательности fn (ai ) и
лежит в интервале (fpi (ai ) − ε, fpi (ai ) − ε) Значит, почти все числа fn (ai ) лежат в этом интервале:

fpi (ai ) − ε < fn (ai ) < fpi (ai ) − ε

Обозначим через qi какое-нибудь значение n с таким свойством:

fpi (ai ) − ε < fqi (ai ) < fpi (ai ) − ε

Из этого двойного неравенства получаем

|fpi (ai ) − fqi (ai )| > ε

а отсюда
k fpi (x) − fqi (x) kx∈E > |fpi (ai ) − fqi (ai )| > ε
Это противоречит формуле (9.1.27). Таким образом, наше предположение (5.7) неверно.

Равномерная сходимость функционального ряда


Говорят, что функциональный ряд

X
an (x)
n=1

сходится равномерно на множестве E к сумме S, если последовательность его частичных сумм


N
X
SN (x) = an (x)
n=1

стремится к функции S равномерно на E:


x∈E
SN (x) ⇒ S(x) (9.1.30)
N →∞

(то есть ||SN (x) − S(x)||x∈E −→ 0).


N →∞

N N
⋄ 9.1.22. Сумма членов геометрической прогрес- X X
сии, рассматривавшаяся в теореме 8.2.1, пред- > lim xn = 1n = N −→ ∞.
x→1 N →∞
n=1 n=1
ставляетс собой функциональныцй ряд
(а в силу замечания (b) для сходимости ряда эта

X
n последовательность должна быть ограничена).
x
n=1 ⋄ 9.1.23. Выясним, будет ли ряд

X
сходящийся поточечно на интервале (−1, 1): (1 − x) · xn
∞ n=1
X 1
xn = , x ∈ (−1, 1). сходиться равномерно на множестве E = (0; 1).
1−x
n=1 Для этого найдем предел его частичных сумм:
Однако эта сходимость не равномерна на (−1, 1), N
X N
X
потому что частичные суммы ряда не ограниче- SN (x) = (1 − x) · xn = (xn − xn+1 ) =
ны по равномерной норме на этом интервале: n=1 n=1
= (x−x2 )+(x2 −x3 )+(x3 −x4 )+...+(xN −xN +1 ) =
N
X ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
kSN (x)kx∈(−1;1) = sup xn >
x∈(−1;1) n=1 = x − x2 + x2 − x3 + x3 − x4 + ... + xN − xN +1 =
542Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

x∈(0;1) ↓ ↓ ↓
= x − xN +1 −→ x = S(x)
N →∞ 1 1
+ ... + − =
(N − 1)x + 1 N x + 1
Теперь найдем норму остатка | {z }
n=N

||SN (x) − S(x)||x∈(0;1) = 1 1 x∈(0;1) 1


= − −→ = S(x)
 1 − x N x + 1 N →∞ 1 − x
= || x − xN +1 − x||x∈(0;1) =
. Теперь найдем норму
= sup xN +1 = 1 −→ 0
x∈(0;1)
N →∞ 1
P∞ ||SN (x) − S(x)||x∈(1;+∞) = sup =
Вывод: ряд n=1 (1 − x) · xn сходится на множе- x∈(1;+∞) Nx + 1
стве (0; 1) поточечно, но не равномерно к сумме 1
= −→ 0
S(x) = x. N + 1 N →∞
P∞ x
⋄ 9.1.24. Выясним, будет ли ряд Вывод: ряд n=1 (nx−x+1)(nx+1) сходится на
множестве (1; +∞) равномерно к сумме S(x) =

X 1
x 1−x .
(nx − x + 1)(nx + 1)
n=0 ⊲⊲ 9.1.25. Выясните, будет ли данный ряд схо-
диться равномерно на множестве E:
сходиться равномерно на множестве E = P∞ 
n 1
(1; +∞). Для этого сразу заметим, что слагаемые 1) n=1 (1 − x) · x , E = 0; 2 ;
P∞ x
раскладываются на простейшие дроби: 2) n=1 (nx−x+1)(nx+1) , E = (0; 1);
P∞ n n 1

x 1 1 3) n=1 (1 − x ) · x , E = (0; 1), E = 0; 2
= − (представить как сумму двух геомет-
(nx − x + 1)(nx + 1) nx − x + 1 nx + 1
рических прогрессий);
Вычислим частичные суммы:
P∞ x √
P∞ √ √ 
4) n=1 nx+x+ nx =

n=1 nx + x − nx ,
E = (0; 1);
XN   P∞ √ √ √ 
1 1
SN (x) = − = 5) n=1  nx + 2x − 2 nx + x + nx  =
nx − x + 1 nx + 1 P∞ x x
n=0 n=1
√ √
nx+2x+ nx+x
− √nx+x+√nx ,
↓ ↓ ↓ ↓ ↓ E = (0; +∞), E = (1; +∞);
1 1 1 1 1 1 P∞ xn +(x+1)n P∞  1 
= − + − + − + 6) n ·(x+1)n =
1
n + xn ,
|−x +{z1 1} |1 {z x + 1} |x + 1 {z2x + 1} n=1 x n=1 (x+1)

n=0 n=1 n=2


E = (0; 1), E = (1; +∞).

Свойства равномерно сходящихся функциональных рядов.

P∞
1◦ . Если ряд n=1 an (x) равномерно сходится на множестве E, то равномерная норма его
частичных сумм ограничена:
XN
sup an < ∞.
n∈N n=1 E
0
2 . Если функции an непрерывны на множестве E и ряд

X
an (x)
n=1

равномерно сходится на множестве E то его сумма



X
S(x) = an (x)
n=1

непрерывна на множестве E.
0
3 . Если функции an непрерывны на интервале (a, b) и ряд

X
an (x)
n=1
§ 1. Функциональные последовательности и функциональные ряды 543

равномерно сходится на (a, b), то для всякой точки c ∈ (a, b) справедливо равенство
! ∞ 
X∞ X 
lim an (x) = lim an (x) (9.1.31)
x→c x→c
n=1 n=1

40 . Если функции an непрерывны на отрезке [a, b] и ряд



X
an (x)
n=1

равномерно сходится на [a, b], то



! ∞
!
ˆ b X X ˆ b
an (x) dx = an (x) d x (9.1.32)
a n=1 n=1 a

50 . Пусть an – гладкие функции на отрезке [a, b], ряд из производных



X
a′n (x)
n=1

равномерно сходится на отрезке [a, b], и хотя бы для одной точки c ∈ [a, b] сходится
числовой ряд

X
an (c) (9.1.33)
n=1

Тогда функциональный ряд



X
an (x)
n=1

равномерно сходится на отрезке [a, b], причем его сумма будет гладкой на [a, b], и ее
производную можно вычислить почленным дифференцированием:

!′ ∞
X X
an = a′n (9.1.34)
n=1 n=1

Доказательство. 1. Свойство
P∞ 1◦ следует сразу из свойства 1◦ на с.536.
2. Пусть дан ряд n=1 an (x), коэффициенты которого an (x) – непрерывные функции на мно-
жестве E. Тогда частичные суммы
N
X
SN (x) = an (x)
n=1

будут непрерывны на множестве E (по теореме 3.3.2), как конечные суммы непрерывных функ-
ций). Если ряд сходится равномерно на E, то есть частичные суммы стремятся равномерно на E к
некоторой функции S(x)
x∈E
SN (x) ⇒ S(x),
N →∞

то по свойству 2 на с.536 эта функция

X
S(x) = an (x)
n=1

должна быть непрерывна на множестве E.


3. Пусть функции an (x) непрерывны и ряд

X
an (x)
n=1
544Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

равномерно сходятся на интервале (a, b). Это значит, что его частичные суммы
N
X
SN (x) = an (x)
n=1

непрерывны на (a, b) и стремятся равномерно на (a, b) к некоторой функции S(x)


x∈(a,b)
SN (x) ⇒ S(x),
N →∞

По свойству 3◦ на с.536, отсюда следует, что для всякой точки c ∈ (a, b) справедливо равенство

lim lim SN (x) = lim lim SN (x)


x→c N →∞ N →∞ x→c

то есть равенство !

X ∞ 
X 
lim an (x) = lim an (x)
x→c x→c
n=1 n=1

4. Пусть функции an непрерывны и ряд



X
an
n=1
PN
равномерно сходятся на отрезке [a, b]. Это означает, что частичные суммы ряда SN = n=1 an
непрерывны на [a, b] и стремятся равномерно на [a, b] к некоторой функции S
x∈(a,b)
SN (x) ⇒ S(x),
N →∞

По свойству 4◦ на с.537, отсюда следует, что


ˆ b ˆ b
lim SN (x) d x = lim SN (x) d x
a N →∞ N →∞ a

то есть, ! !
ˆ b ∞
X ∞
X ˆ b
an (x) dx = an (x) d x
a n=1 n=1 a

5. Пусть an – гладкие функции на [a, b], ряд из производных



X
a′n (x)
n=1

равномерно сходятся на отрезке [a, b], и для какой-нибудь точки c ∈ [a, b] сходится ряд

X
an (c)
n=1
PN
Тогда частичные суммы SN = n=1 an – гладкие функции на [a, b], последовательность их произ-
водных равномерно сходится на [a, b] к некоторой функции g(x)
x∈[a,b]

SN (x) ⇒ g(x),
N →∞

и для точки c ∈ [a, b] существует конечный предел

lim SN (c)
N →∞

По свойству 5◦ на с.537, отсюда следует, что функции SN равномерно на [a, b] сходится (к некоторой
гладкой функции S),
x∈[a,b]
SN (x) ⇒ S(x),
N →∞
§ 1. Функциональные последовательности и функциональные ряды 545

причем
 ′

lim SN = lim SN
N →∞ N →∞

Это означает, что ряд



X
an (x)
n=1

равномерно сходятся на отрезке [a, b], и


!′ ∞
X X
an = a′n
n=1 n=1

Критерий Коши равномерной сходимости ряда.

Теорема 9.1.3 (критерий Коши равномерной сходимости ряда). Пусть {an } – произвольная по-
следовательность функций, определенных на множестве x ∈ E. Тогда следующие условия эквива-
лентны:
(i) функциональный ряд

X
an
n=1

сходится равномерно на множестве E;


(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an (x) стремится к нулю при i → ∞ равномерно на множестве E:

kX
i +li

an −→ 0
i→∞
n=ki +1 E

PN
Доказательство. Для частичных суммы SN (x) = n=1 an (x) мы получаем следующую логиче-
скую цепочку:

X
ряд an (x) сходится равномерно на E
n=1

последовательность SN (x) сходится равномерно на E


критерий Коши (теорема 9.1.2)
m сходимости функциональной последовательности

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
i→∞
выполняется соотношение: k Ski +li (x) − Ski (x) kx∈E −→ 0
i→∞
Pki +li
m Ski +li (x) − Ski (x) = n=ki +1 an (x)

для любой последовательности li ∈ N,


и любой бесконечно большой последовательности ki ∈ N ki −→ ∞,
i→∞
Pki +li
выполняется соотношение: a
n=ki +1 n (x) −→ 0
x∈E i→∞
546Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Необходимое условие равномерной сходимости ряда. Часто бывает, что частичные суммы
функционального ряда не поддаются вычислению, как, например, в случае с рядом

X x
sin (9.1.35)
n=1
n2

Чтобы понять, сходится этот ряд равномерно, или нет, используются теоремы, называемые призна-
ками равномерной сходимости. Первый из них звучит так:

Теорема 9.1.4. Если функциональный ряд



X
an (x)
n=1

равномерно сходится на множестве E, то его общий член равномерно стремится к нулю на E:

x∈E
an (x) ⇒ 0
n→∞

Доказательство. По критерию Коши (теорема 9.1.3), если этот ряд сходится равномерно на E, то
для последовательностей li = 1, и ki = i должно выполняться условие

kX
i +li i+1
X
an (x) = an (x) = ||ai+1 (x)||x∈E −→ 0
i→∞
n=ki +1 x∈E n=i+1 x∈E

⋄ 9.1.26. Рассмотрим ряд (9.1.35): Это можно сделать, например, с помощью фор-

X мулы Ньютона-Лейбница: при x > 0 мы получа-
x ем
sin
n=1
n2

По признаку абсолютной сходимости (теорема 0


>

(4.1.129)
8.2.11), он сходится при любом x ∈ R: z }| { x
dt
ˆ

X ∞
X ∞
X | arctg x | = arctg x = 6
x x 1 0 1 + t2
sin 2 6 (4.1.92) 6 2
= |x|· <∞ x
n n n2
ˆ
n=1 n=1 n=1 6 1 d t = x = |x|
0
Поймем, будет ли он сходиться равномерно на
множестве E = R. Для этого вычислим норму
общего члена: и отсюда уже для x < 0 получаем
x x
sin 2 = sup sin 2 = 1 6−→ 0 0
n x∈R x∈R n n→∞ 0
<

>

(4.1.130)
Вывод: ряд сходится на R, но не равномерно. z }| { z}|{
arctg x = − arctg x = arctg( −x ) 6 −x = |x|
⊲ 9.1.27. Проверьте, будет ли ряд сходится рав-
номерно на множестве R:
∞ ⊲⊲ 9.1.28. Проверьте, будут ли данные ряды схо-
X x
arctg 2 дится равномерно на множестве E:
n=1
n P∞ n
1. x , E = (−1; 1);
Здесь предварительно нужно доказать формулу, Pn=1
∞ n n
аналогичную (4.1.92):
2. n=1 x · (1 − x ), E = [0; 1] (здесь необхо-
димо исследование функции xn · (1 − xn ) на
| arctg x| 6 |x|, x∈R (9.1.36) экстремум на множестве [0; 1]).
§ 1. Функциональные последовательности и функциональные ряды 547

Признак Вейерштрасса равномерной сходимости.


Теорема 9.1.5. Если числовой ряд, состоящий из норм функций an на множестве E

X
||an ||E (9.1.37)
n=1

сходится, то функциональный ряд



X
an
n=1

равномерно сходится на множестве E.


Доказательство. Если ряд (9.1.37) сходится, то, по критерию Коши сходимости числового ряда
(теорема 8.2.8), для любой последовательности li ∈ N, и любой бесконечно большой последователь-
ности ki ∈ N ki −→ ∞,
i→∞
kX
i +li

||an (x)||x∈E −→ 0
i→∞
n=ki +1

Отсюда
kX
i +li kX
i +li

06 an (x) 6 ||an (x)||x∈E −→ 0


i→∞
n=ki +1 x∈E n=ki +1


kX
i +li

an (x) −→ 0
i→∞
n=ki +1 x∈E

Поскольку это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), по критерию


Pi→∞

Коши равномерной сходимости функционального ряда (теорема 9.1.3), ряд n=1 an (x) равномерно
сходится на множестве E.

⋄ 9.1.29. Проверим, будет ли ряд (9.1.35) схо- Вывод: ряд сходится равномерно на отрезке [0; 1].
диться равномерно на множестве [0; 1]:
⊲⊲ 9.1.30. Проверьте, будут ли данные ряды схо-
X∞
x дится равномерно на множестве E:
sin 2 P∞
n 1. 1
E = R;
n=1 n=1 x2 +n2 ,
P∞ n  
Для этого вычислим норму общего члена: 2. n=1 x , E = − 21 ; 12 ;
P∞ x
x x 1 3. n=1 1+n4 ·x2 , E = R (здесь необходимо ис-
sin 2 = sup sin 2 = sin 2
n x∈[0;1] x∈[0;1] n n следование функции 1+nx4 ·x2 на экстремум);
P∞ n·x
Теперь получаем 4. n=1 1+n5 ·x , E = R;
P∞  n n+1

x x
X∞
x X∞
1 5. n=1 n − n+1 , E = R;
sin 2 = sin 2 6 P∞ n2  
n=1
n x∈[0;1] n=1 n 6. √ (xn + x−n ) , E = 1, 2 .
n=1 n! 2
X∞
1
6 (4.1.92) 6 2
<∞
n=1
n

Признак Лейбница равномерной сходимости.


Теорема 9.1.6. Пусть функциональная последовательность {bn ; x ∈ E} обладает следующими
свойствами:
(i) она неотрицательна и невозрастает,

b0 (x) > b1 (x) > b2 (x) > ... > 0 (9.1.38)


548Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

(ii) она стремится к нулю равномерно на E:

||bn ||E −→ 0 (9.1.39)


n→∞

Тогда
P∞ n
(a) функциональный ряд n=0 (−1) bn сходится равномерно на множестве E,
(b) его остаток оценивается сверху нормой своего первого члена:

X
(−1)n bn (x) 6 ||bN +1 ||E (9.1.40)
n=N +1 x∈E

Доказательство. Из признака Лейбница сходимостиP числового ряда (теорема 8.2.12) следует, что
при каждом фиксированном x ∈ E числовой ряд ∞ n=0 (−1)n
b n (x) сходится. Обозначим через S(x)
его сумму, а через SN (x) его частичные суммы:

X N
X
S(x) = (−1)n bn (x), SN (x) = (−1)n bn (x)
n=0 n=0

В силу (8.2.53), мы получаем:



X
∀x ∈ E |S(x) − SN (x)| = (−1)n bn (x) 6 bN +1 (x) 6 ||bN +1 ||E
n=N +1



X
||S(x) − SN (x)||x∈E = sup |S(x) − SN (x)| = sup (−1)n bn (x) 6 ||bN +1 ||E
x∈E x∈E n=N +1

То есть справедлива оценка (9.1.40). Из нее сразу следует равномерная сходимость ряда:

||S(x) − SN (x)||x∈E 6 ||bN +1 ||E −→ 0


N →∞


||S(x) − SN (x)||x∈E −→ 0
N →∞


x∈E
SN (x) ⇒ S(x)
N →∞

Признаки Дирихле и Абеля равномерной сходимости.


Теорема 9.1.7 (признак Дирихле). 1 Пусть функциональные последовательности {an } и {bn }
обладают следующими свойствами:
P
(i) частичные суммы ряда ∞n=1 an равномерно ограничены на множестве E:

N
X
sup an (x) <∞
N ∈N n=1 x∈E

(ii) последовательность {bn (x)} монотонна при любом x ∈ E;


(iii) последовательность {bn } равномерно стремится к нулю на множестве E:

kbn (x)kx∈E −→ 0 (9.1.41)


n→∞
P∞
Тогда ряд n=1 an (x) · bn (x) равномерно сходится на множестве E.
1 Теорема 9.1.7 часто называется также признаком Харди.
§ 1. Функциональные последовательности и функциональные ряды 549

Доказательство. Здесь с очевидными изменениями копируется доказательство теоремы 8.2.14.


Обозначим
XN
C = sup an (x) <∞
N ∈N n=1 x∈E
и заметим, что
q
X
sup an (x) 6 2C < ∞ (9.1.42)
p,q∈N n=p x∈E

Действительно,
q
X q
X p−1
X q
X p−1
X
an (x) = an (x) − an (x) 6 an (x) + an (x) 6 2C
n=p x∈E n=1 n=1 x∈E n=1 x∈E n=1 x∈E
| {z } | {z }

>

>
C C

Воспользуемся теперь критерием Коши (теорема 9.1.3): выберем произвольные последовательности


li ∈ N и ki ∈ N (ki −→ ∞). По неравенству Абеля (8.2.62) получаем:
n→∞

kX
i +li N
X n o
an (x) · bn (x) 6 3 · max an (x) · max |bki +1 (x)| , |bki +li (x)|
ki 6N 6ki +li | {z } | {z }
n=ki +1 n=ki +1
| {z }

>

>
bki +1 (x) bki +li (x)
>

x∈E x∈E
PN
n=ki +1 an (x)
x∈E
>

(9.1.42)
2C


kX
i +li n o
an (x) · bn (x) 6 6 · C · max kbki +1 (x)kx∈E , kbki +li (x)kx∈E −→ 0
n=ki +1
| {z } | {z } i→∞
x∈E ↓ (9.1.41) ↓ (9.1.41)
0 0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится.

⋄ 9.1.31. Проверим, будет ли ряд откуда



X N
xn X
√ sup an (x) 62<∞
n=1
n N ∈N n=1 x∈(−1;0)
сходиться равномерно на множестве (−1; 0). Обо- А, с другой стороны,
значим
1 монотонно
an (x) = xn , bn (x) = √ и равномерно
n 1 по x ∈ (−1, 0)
Тогда bn (x) = √ ⇒ 0
n n→∞
N
X N
X Вывод: ряд сходится равномерно на множестве
an (x) = sup an (x) = (−1; 0).
n=1 x∈(−1;0) n=1
x∈(−1;0)
⊲⊲ 9.1.32. Проверьте, будут ли данные ряды схо-
N
X 1 − xN дится равномерно на множестве E:
= sup xn = sup x· 6
x∈(−1;0) n=1 x∈(−1;0) 1−x P∞ (−1) 2
n(n−1)

1. n=1

3 2
n +ex
, E = R;
|x| · (1 + |xN |) P∞
6 sup 6 cos 2πn
x∈(−1;0) |1 − x| 2. n=1 , E = R (здесь нужно применить
√ 3
n2 +x2
supx∈(−1;0) |x| · (1 + |xN |) формулы (8.2.66));
2 P∞ sin x·sin nx
6 6 =2 3. √ , E = R (тоже нужны форму-
inf x∈(−1;0) |1 − x| 1 n=1 n+1
лы (8.2.66)).
550Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Теорема 9.1.8 (признак Абеля). Пусть функциональные последовательности {an } и {bn } на мно-
жестве E обладают следующими свойствами:
P∞
(i) ряд n=1 an сходится равномерно на E;
(ii) последовательность {bn } монотонна и равномерно ограничена на E:

sup kbn (x)kx∈E < ∞


n∈N
P∞
Тогда ряд n=1 an · bn сходится равномерно на E.
Доказательство. Здесь повторяются рассуждения, применявшиеся приPдоказательстве теоремы

8.2.15. Сначала нужно заметить, что из равномерной сходимости ряда n=1 an следует, что для
произвольных последовательностей li ∈ N и ki ∈ N (ki −→ ∞) выполняется соотношение
n→∞

N
X
max an −→ 0 (9.1.43)
ki 6N 6ki +li i→∞
n=ki +1 E

После этого, обозначив


B = sup kbn kE = sup sup |bn (x)| < ∞
n∈N n∈N x∈E

мы пользуемся критерием Коши (теоремой 9.1.3): для произвольных последовательностей li ∈ N и


ki ∈ N (ki −→ ∞) по неравенству Абеля (8.2.62) мы получим
n→∞

kX
i +li N
X n o
an (x) · bn (x) 6 3 · max an (x) · max |bki +1 (x)|, |bki +li (x)|
ki 6N 6ki +li | {z } | {z }
n=ki +1 n=ki +1
| {z }
>

>
B B
>

PN
n=ki +1 an
E


kX
i +li N
X
an · bn 6 3B · max an −→ 0
ki 6N 6ki +li i→∞
n=ki +1 n=ki +1
| {z }
↓ (9.1.43)
0
P∞
Это верно для любых последовательностей li ∈ N и ki ∈ N (ki −→ ∞), значит ряд n=1 an · b n
n→∞
сходится равномерно.

Всюду непрерывная, но нигде не диффе- мых этого ряда образуют сходящийся ряд
ренцируемая функция. X∞ X∞
bn kcos(an πx)kx∈R = bn < ∞
⋄ 9.1.33. Пусть числа a и b удовлетворяют n=0 n=0
условиям:
поэтому по признаку Вейерштрасса (теорема
3 9.1.5), функциональный ряд в (9.1.44) сходится
0 < b < 1, a ∈ 2N − 1, ab > 1 + π
2 равномерно, и значит, определяет непрерывную
функцию. Зафиксируем точку x ∈ R и убедимся,
Тогда функция
что f не дифференцируема в ней.
X∞ Заметим прежде всего, что
f (x) = bn cos(an πx) (9.1.44) 3
n=0 ab > 1 + π
2
определена и непрерывна всюду на R, но не диф- ⇓
ференцируема ни в одной точке.
3 π
Доказательство. Равномерные нормы слагае- > (9.1.45)
2 ab − 1
§ 1. Функциональные последовательности и функциональные ряды 551

k−1 
Далее рассмотрим три последовательности: X cos an π(x + hk ) − cos(an πx)
    6 bn · 6
1 1 1 1 n=0
hk
ξk = ak x + − ∈ − , k−1 k−1
2 2 2 2 X an πhk X
  6 bn · =π· (ab)n =
1 hk
αk = ak x + = ak x − ξk ∈ Z n=0 n=0
2
 k (ab)k − 1 πak bk
3 1 = (2.2.246) = π · 6
1 − ξk 2 − a x+ 2 ab − 1 ab − 1
hk = k
= k
a a
После этого оценим R. Пусть n > k. Тогда,
(здесь [·] и {·} – целая и дробная части числа, во-первых,
определенные формулами (2.2.286) и (2.2.292)).
Очевидно, что ak · (x + hk ) = ak · x + ak · hk =
 
3 k 3 k 1
0 < hk 6 (9.1.46) =a ·x+ − a x+ =
2ak 2 2
 
1 1
⇓ = ak · x + − ak x + +1=
2 2
hk −→ 0,  
1
k→∞ = ak x + + 1 = αk + 1
поэтому наша задача будет выполнена, если мы 2
докажем, что ⇓
f (x + hk ) − f (x)
−→ ∞ an · π · (x + hk ) = an−k · ak (x + hk ) · π =
hk k→∞
= an−k · (αk + 1) · π
Обозначим
 ⇓
k−1
X n n
n cos a π(x + hk ) − cos(a πx)    
S= b ·
n=0
hk cos an ·π·(x+hk ) = cos an−k · (αk + 1) ·π =
∞  | {z }
X n n
n cos a π(x + hk ) − cos(a πx)


R= b · . Z
hk
n=k
2N − 1

Тогда z }| {
 n−k αk +1
= (−1) an−k ·(αk +1)
= (−1) a = (−1)αk +1
f (x + hk ) − f (x)
=
hk Во-вторых,
∞ 
X n n ak · x = αk + ξk
n cos a π(x + hk ) − cos(a πx)
= b · =
n=0
hk ⇓
∞ n n−k
k−1
X X a ·x=a · (αk + ξk )
= + =S+R

n=0 n=k
   
Сначала оценим сверху S: cos an πx = cos an−k · π · (αk + ξk ) =
  
cos an π(x + hk ) − cos(an πx) = = cos an−k παk + an−k πξk = (10.3.135) =
    
= cos an πx + an πhk − cos(an πx) = (4.1.89) = = cos an−k αk π · cos an−k πξk −
| {z }
2an πx + an πhk an πhk
=

= 2 sin · sin 6 an πhk n−k ·α


2 2 (−1)a k
| {z } | {z }    
− sin an−k αk π · sin an−k πξk =
>

>

(4.1.92)
1 an πhk
2 | {z }
=

an πhk
2
0
n−k
 
·αk
⇓ = (−1)a · cos an−k πξk =
2N − 1


k−1
X n n z }| { 
n cos a π(x + hk ) − cos(a πx)  n−k αk  
|S| = b · 6
hk = (−1) a · cos an−k πξk =
n=0
552Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

= (−1)αk · cos an−k πξk 0

=
z }| {
Вместе мы получаем: 1 + cos a k − k πξ 
k
> bk · =
hk
 | {z }
cos an π(x + hk ) − cos(an πx) = n=k
αk +1 αk n−k
 
−π

π
= (−1) − (−1) · cos a πξk = 2, 2


  z}|{ 
= (−1)αk +1 1 + cos an−k πξk 1 + cos πξk bk 2ak bk
k
=b · > (9.1.46) >
hk hk 3
⇓ Теперь получаем:

 f (x + hk ) − f (x)

X1 + cos an−k πξk > |R| − |S| >
hk
|R| = (−1)αk · bn · =
hk 2ak bk πak bk
n=k
∞  > − =
X n−k 3 ab − 1
n 1 + cos a πξk  
= b · = 2 π
h = − (ab)k −→ ∞
n=k | {z k } 3 ab − 1 k→∞
| {z }
6

<
(9.1.45)
∞  0
X 1 + cos a n−k
πξk
= bn · >
hk
n=k

(c) Равномерная по производным сходимость


Пусть E – интервал или отрезок в R.
• Функция f называется гладкой на E порядка m, если она имеет m непрерывных производ-
ных на E, то есть если существует конечная последовательность непрерывных функций
f0 , f1 , ..., fm на E таких, что
f0 = f
и для всякого k = 0, ..., m − 1 функция fk дифференцируема на E (если E – отрезок, то
дифференцируемость на нем понимается в смысле определения на с.399) и ее производная
равна fk+1 :
fk′ = fk+1 , k<m
Множество всех функций, гладких на E порядка m, обозначается C m (E).
• Функция f называется бесконечно гладкой на E, если для всякого m ∈ N она является
гладкой на E порядка m:
∀m ∈ N f ∈ C m (E).
Множество всех бесконечно гладких функций на E обозначается C ∞ (E). Таким образом,

\
C ∞ (E) = C m (E)
m=0

Можно заметить, что бесконечная гладкость f эквивалентна просто существованию про-


изводной любого порядка, то есть существованию бесконечной последовательности функ-
ций {fk } на E такой, что

f0 = f, ∀k ∈ Z+ ∃fk′ = fk+1 .

• Нормой функции f ∈ C m (E), равномерной на множестве E по производным до порядка


m ∈ Z+ , называется величина
m
X m
X
(m) (m) 1 1
kf kE = kf (x)kx∈E := · f (k) = · sup |f (k) (x)| (9.1.47)
k! E k! x∈I
k=0 k=0
§ 1. Функциональные последовательности и функциональные ряды 553

Если для какого-нибудь k функция f (k) не ограничена на E, то эта величина считается


бесконечной. Однако такое может случиться только если E – интервал, потому что если
E – отрезок, то по теореме Вейерштрасса 3.3.7, все функции f (k) будут ограничены на E.
Отметим, что равномерная по производным норма мажорирует обычную равномерную
норму, которую мы определяли формулой (9.1.6):
(m)
kf kE 6 kf kE

⋄⋄ 9.1.34. 1
+ · sup |2| = 4 + 4 + 1 = 9
2 x∈[0;2]
(0)
x2 x∈[0;2]
= sup |x2 | = 4 (1)
ksin xkx∈R = sup | sin x| + sup | cos x| = 1 + 1 = 2
x∈[0;2] x∈R x∈R
(1) (2)
x2 x∈[0;2] 2
= sup |x | + sup |2x| = 4 + 4 = 8 ksin xkx∈R = sup | sin x| + sup | cos x|+
x∈[0;2] x∈[0;2] x∈R x∈R
(2) 1 1
x2 x∈[0;2] 2
= sup |x | + sup |2x|+ + · sup | − sin x| = 1 + 1 + = 2, 5
x∈[0;2] x∈[0;2] 2 x∈R 2

Свойства равномерной по производным нормы


1◦ . Неотрицательность:
(m)
kf kE >0 (9.1.48)
причем
(m)
kf kE =0 ⇐⇒ ∀k = 0, ..., m ∀x ∈ E f (k) (x) = 0 (9.1.49)
2◦ . Однородность:
(m) (m)
kλ · f kE = |λ| · kλ · f kE , λ∈R (9.1.50)
3◦ . Полуаддитивность:
(m) (m) (m)
kf + gkE 6 kf kE + kgkE (9.1.51)
4◦ . Полумультпликативность:
(m) (m) (m)
kf · gkE 6 kf kE · kgkE (9.1.52)

5◦ . При расширении множества норма не убывает:


(m) (m)
D⊆E =⇒ kf kD 6 kf kE (9.1.53)

6◦ . При увеличении индекса норма не убывает:


(m) (n)
m6n =⇒ kf kE 6 kf kE (9.1.54)

7◦ . Норма функции мажорирует норму ее производной: для любого k 6 m


(m)
(k+m)
f (k) 6 kf kE (9.1.55)
E

Доказательство. Как и в случае со свойствами равномерной нормы на с.533, все эти утверждения
следуют напрямую из свойств модуля. Мы предоставляем читателю самостоятельно проверить их
справедливость.

Равномерная по производным сходимость последовательности


• Говорят, что последовательность функций {fn } стремится к функции f равномерно по
производным до порядка m на множестве E, если
(m)
kfn − f kE −→ 0 (9.1.56)
n→∞
554Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Следующие свойства доказываются по аналогии со свойствами 1◦ и 5◦ на с.536.

Свойства функциональных последовательностей,


сходящихся равномерно по производным.
1◦ . Если функции fn равномерно по производным до порядка m сходятся к функции f на
(m)
множестве E, то норма k·k последовательности fn ограничена:
(m)
sup kfn kE < ∞.
n∈N

2◦ . Пусть функции fn ∈ C m [a, b] равномерно по производным до порядка m сходятся на


отрезке [a, b]. Тогда их поточечный предел лежит в C m [a, b],

lim fn ∈ C m [a, b],


n→∞

и для всякого k 6 m его производная порядка k совпадает с поточечным пределом про-


изводных порядка k:
 (k)
lim fn = lim fn(k) . (9.1.57)
n→∞ n→∞

Следующее утверждение аналогично теореме 9.1.2 и доказывается так же:


Теорема 9.1.9 (критерий Коши равномерной по производным сходимости функциональной после-
довательности). Функциональная последовательность fn ∈ C m (E) тогда и только тогда сходится
к некоторой функции f ∈ C m (E) равномерно по производным до порядка m на множестве E, когда
она удовлетворяет следующим двум эквивалентным условиям:
(i) для любых двух бесконечно больших последовательностей индексов {pi }, {qi } ⊆ N

pi −→ ∞, qi −→ ∞ (9.1.58)
i→∞ i→∞

соответствующие подпоследовательности {fpi } и {fqi } равномерно по производным до


порядка m стремятся друг к другу на множестве E:
(m)
kfpi − fqi kE −→ 0 (9.1.59)
i→∞

(ii) для любой последовательности {li } ⊆ N и любой бесконечно большой последовательно-


сти {ki } ⊆ N
ki −→ ∞ (9.1.60)
i→∞
выполняется соотношение
(m)
kfki +li − fki kE −→ 0 (9.1.61)
i→∞

Равномерная по производным сходимость ряда


P∞
• Говорят, что функциональный ряд n=0 an сходится на множестве E равномерно по
производным до порядка m к функции S, если частичные суммы этого ряда сходятся к S
на E равномерно по производным до порядка m:
n (m)
X
ak − S −→ 0 (9.1.62)
n→∞
k=0 E

Следующие свойства доказываются по аналогии со свойствами 1◦ и 5◦ на с.536.

Свойства функциональных рядов,


сходящихся равномерно по производным.
P∞
1◦ . Если функциональный ряд n=1 an равномерно по производным до порядка m сходятся
на множестве E, то норма k·k(m) последовательности его частичных сумм SN ограни-
чена:
N (m)
X
sup an < ∞.
N ∈N n=1 E
§ 1. Функциональные последовательности и функциональные ряды 555
P
2◦ . Пусть слагаемые функционального ряда ∞ m
n=1 an принадлежат пространству C [a, b],
и ряд равномерно по производным до порядка m сходятся на отрезке [a, b]. Тогда пото-
чечный предел этого ряда тоже лежит в C m [a, b],

X
an ∈ C m [a, b],
n=1

и для всякого k 6 m его производная порядка k совпадает с поточечной суммой произ-


водных порядка k:

!(k) ∞
X X
an = a(k)
n . (9.1.63)
n=1 n=1

Следующие две теоремы аналогичны теоремам 9.1.3 и 9.1.5, и доказывается так же:
Теорема 9.1.10 (критерий Коши равномерной по производным сходимости ряда). Для последова-
тельности функций an ∈ C m (E) следующие условия эквивалентны:
(i) функциональный ряд

X
an (x)
n=1

сходится равномерно по производным до порядка m на множестве E к некоторой сумме


S ∈ C m (E);
(ii) для любой последовательности li ∈ N, и любой бесконечно большой последовательности
ki ∈ N
ki −→ ∞,
i→∞
Pki +li
сумма n=ki +1 an стремится к нулю при i → ∞ равномерно по производным до порядка
m на множестве E:
kX (m)
i +li

an −→ 0
i→∞
n=ki +1 E

Теорема 9.1.11 (признак Вейерштрасса для равномерной по производным сходимости). Пусть


an ∈ C m (E), и числовой ряд
X∞
(m)
kan (x)kx∈E
n=1

сходится. Тогда функциональный ряд



X
an (x)
n=1

сходится равномерно по производным до порядка m на множестве E.

Контрпримеры в классе гладких функций. точки x 6= 0, поэтому нужно только доказать,


что она является бесконечно гладкой в окрест-
⋄ 9.1.35. Существует бесконечно гладкая функ-
ности точки x = 0. Чтобы это понять, вычислим
ция f ∈ C ∞ (R) со следующими свойствами:
сначала односторонние производные в этой точ-
(
f (x) = 0, x 6 0 ке. Ясно, что левая производная равна нулю:
f (x) > 0, x > 0 ′
f− (0) = 0
Доказательство. Рассмотрим функцию Найдем правую:
( 1
e− x , x > 0 ′
1
e− x 1
=t
f (x) = f+ (0) = lim = x = lim te−t = 0
0, x60 x→+0 x t → +∞ t→+∞

Все объявленные ее свойства очевидны, кроме Мы получили, что первая производная суще-
бесконечной гладкости. Очевидно, f будет беско- ствует в каждой точке. Существование осталь-
нечно гладкой в некоторой окрестности каждой ных проверяется по индукции. Предположим,
556Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

что мы доказали, что существует производная Лемма 9.1.12. Для любых ε > 0 и n ∈ Z+ суще-
порядка n. Очевидно, она имеет вид ствует гладкая функция ϕ ∈ C ∞ [−1; 1] со следу-
( P (x) 1 ющими свойствами:
n −x
e , x > 0
f (n) (x) = Qn (x) 1) в точке x = 0 все ее производные равны нулю,
0, x60 кроме производной порядка n, которая равна
единице,
где Pn (x) и Qn (x) некоторые многочлены. Отсю-
(
да получаем 0, k 6= n
(k)
ϕ (0) =
1 1, k = n
(n+1) Pn (x)e− x
f+ (0) = lim =
x→+0 xQn (x) 2) ее равномерная норма на отрезке [−1, 1] по
1 R (t)
= t n производным до порядка n − 1 меньше ε,
= x = lim e−t = 0
t → +∞ t→+∞ Sn (t)
(n−1)
kϕk[−1,1] < ε.
где Rn (t) и Sn (t) – некоторые новые многочле-
ны. Доказательство. Положим δ = εe (где e – чис-
ло Непера) и рассмотрим функцию η из примера
⋄ 9.1.36. Для любого интервала (a, b) на R 9.1.38 со следующими свойствами:
существует бесконечно гладкая функция g ∈ 
C ∞ (R) со следующими свойствами: 
η(x) = 0, x∈/ (−δ, δ)

( η(x) = 1, x ∈ − δ2 , 2δ
ga,b (x) = 0, x ∈ / (a, b) 

0 < η(x) < 1, – в остальных случаях
ga,b (x) > 0, x ∈ (a, b)
Рассмотрим последовательность функций fn ,
Доказательство. Можно положить определенную рекуррентными соотношениями:
ga,b (x) = f (b − x) · f (x − a), f0 = η,
(´ x
где f – функция из примера 9.1.35. 0 ´fm−1 (t) d t, x∈
/ [0, 1]
fm (x) = 0 , m>1
⋄ 9.1.37. Для любого интервала (a, b) на R су- − x fm−1 (t) d t, x∈
/ [−1, 0)
ществует бесконечно гладкая функция ha,b ∈
По предложению 7.3.15, все функции fm явля-
C ∞ (R) со следующими свойствами:
ются гладкими на отрезке [−1, 1], причем


ha,b (x) = 0, x6a ′
fm = fm−1 , m>1
0 < ha,b (x) < 1, x ∈ (a, b)

 Отсюда следует формула:
ha,b (x) = 1, x>b

Доказательство. Этими свойствами будет обла- 
fm−k , 06k<m
(k)
дать функция f m = η, k =m (9.1.64)

 (k−m)
´x η , k>m
a ga,b (t) d t
ha,b (x) = ´ b ,
g (t) d t Из нее, в свою очередь, следует три важных для
a a,b
нас соотношения:
где ga,b – функция из примера 9.1.36. (
(k) 0, k 6= m
⋄ 9.1.38. Для любой последовательности чисел fm (0) = , (9.1.65)
1, k = m
a<α<β<b kfm k[−1,1] = sup |fm (x)| 6 δ, m>1
x∈[−1,1]
существует бесконечно гладкая функция η ∈ (9.1.66)
C ∞ (R) со следующими свойствами: (m−1)
kfm k[−1,1] <ε (9.1.67)


η(x) = 0, x∈/ (a, b)
Здесь равенство (9.1.65) доказывается пере-
η(x) = 1, x ∈ (α, β) числением случаев: если 0 6 k < m, то


0 < η(x) < 1, x ∈ (a, α) ∪ (β, b) ˆ 0
(k)
Доказательство. Можно взять fm (0) = fm−k (0) = fm−1 (t) d t = 0,
0

η(x) = ha,α (x) + 1 − hβ,b (x), если k = m, то


(k)
где ha,α и hβ,b – функции из примера 9.1.37. fm (0) = η(0) = 1,
§ 1. Функциональные последовательности и функциональные ряды 557

и если же k > m, то И вместе получается (9.1.66) для m:


n o
(k)
fm (0) = η (k−m) (0) = 0. kfm k[−1,1] = max kfm k[−1,0] , kfm k[0,1] 6 δ

постоянная
на интервале Неравенство (9.1.67) доказывается вычисле-
(− δ2 , 2δ ) нием:
m−1
X
Неравенство (9.1.66) доказывается индукци- (m−1) 1 (k)
ей. При m = 1 получаем, с одной стороны, kfm k[−1,1] = · fm = (9.1.64) =
k! [−1,1]
k=0
x m−1
X 1
ˆ
kf1 k[0,1] = sup |f1 (x)| = sup η(t) d t = = · kfm−k k[−1,1] 6 (9.1.66) 6
x∈[0,1] x∈[0,1] 0 k!
k=0
ˆ x ˆ δ m−1 ∞
!
X 1 X 1 ε
= sup η(t) d t = η(t) d t 6 6 ·δ < ·δ =e· =ε
x∈[0,1] 0 0 k! k! e
k=0 k=0
6 δ · sup η(x) = δ
x∈[0,δ] После того, как соотношения (9.1.65)–(9.1.67)
доказаны, нам остается положить
С другой стороны,
ϕ = fn
kf1 k[−1,0] = sup |f1 (x)| = и мы получим
x∈[−1,0]
(
0 0
0, k 6= n
ˆ ˆ
= sup − η(t) d t = sup η(t) d t = (k)
ϕ = (9.1.65) =
x∈[−1,0] x x∈[−1,0] x 1, k = n
ˆ 0
и
= η(t) d t 6 δ · sup η(x) = δ (n−1)
−δ x∈[−δ,0] kϕk[−1,1] < (9.1.67) < ε

Вместе это дает


n o Теорема 9.1.13 (Борель). Для любой последо-
kf1 k[−1,1] = max kf1 k[−1,0] , kf1 k[0,1] 6 δ вательности чисел a = {an ; n ∈ Z+ } существу-
ет гладкая функция f на R такая, что
Далее, если для m − 1 неравенство (9.1.66) уже
∀n ∈ Z+ f (n) (0) = an (9.1.68)
доказано, то для m получаем: с одной стороны,
Доказательство. Выберем последовательность
kfm k[0,1] = sup |fm (x)| = функций ϕn со следующими свойствами:
x∈[0,1]
ˆ x 1) если an = 0, то ϕn = 0,
= sup fm−1 (t) d t 6 2) если an 6= 0, то ϕn выбирается по лемме 9.1.12
x∈[0,1] 0
так, чтобы выполнялись условия:
6 sup (x − 0) · sup |fm−1 (x)| 6 (
x∈[0,1] x∈[0,1] 0, k 6= n
(k)
6 1 · kfm−1 k[−1,1] 6δ ϕn = , (9.1.69)
1, k = n
| {z }
1
>

(n−1)
δ, kϕn k[−1,1] < (9.1.70)
по предположению 2n−1 · |an |
индукции
Заметим, что функциональный ряд
А с другой стороны, ∞
X
an · ϕn
kfm k[−1,0] = sup |fm (x)| = n=0
x∈[−1,0]
сходится на [−1, 1] равномерно по производным
ˆ 0
= sup fm−1 (t) d t 6 до произвольного порядка k. Действительно, при
x∈[−1,0] x любом фиксированном k мы получаем:
6 sup (0 − x) · sup |fm−1 (x)| 6 X (k)
X (n−1)
x∈[−1,0] x∈[−1,0] kan · ϕn k[−1,1] 6 kan · ϕn k[−1,1] =
6 1 · kfm−1 k[−1,1] 6δ n>k+1 | {z } n>k+1
>

| {z } (n−1)
kan · ϕn k[−1,1] ,
>

δ, ⇑
по предположению (9.1.55)
индукции ⇑
k 6n−1
558Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
X (n−1)
= |an | · kϕn k[−1,1] 6 (9.1.70) 6 кой. При этом, по свойству 2◦ на с.555,
n>k+1

X
X 1 X 1
6 |an | · = <∞ f (k) = an · ϕ(k)
n
2 n−1 · |an | 2n−1
n>k+1 n>k+1 n=0

и отсюда
Из сходимости этого ряда по признаку Вейер-

X
штрасса 9.1.11 следует, что его сумма
f (k) (0) = an · ϕ(k) (0) = (9.1.69) = ak
n=0
| n{z }

X ↑
f= an · ϕn среди этих чисел
n=0 отлично от нуля
только с индексом
n=k
является гладкой функцией порядка k. Это спра-
ведливо для любого k, значит f является глад-

(d) Интегральная сходимость


• Пусть функция f определена и интегрируема на отрезке [a, b]. Ее интегральной нормой
на отрезке [a, b], называется величина
´ ´ ˆ
kf k[a,b] = kf (x)kx∈[a,b] := |f (x)| d x. (9.1.71)
[a,b]

ˆ
⋄⋄ 9.1.39.
´
ksin xkx∈[0,2π] = | sin x| d x =
x3 x=2 8 [0,2π]
´ ˆ
2 2
x x∈[0;2]
= |x | d x = = ˆ π ˆ 2π
[0;2] 3 x=0 3
= sin x d x − sin x d x =
0 π
´ ˆ x=π x=2π
ksin xkx∈[0;π] = | sin x| d x = = − cos x + cos x =2+2=4
x=0 x=π
[0;π]
ˆ π x=π
= sin x d x = − cos x =2
0 x=0

Свойства интегральной нормы


1◦ . Неотрицательность: ´
kf k[a,b] > 0 (9.1.72)

2◦ . Однородность: ´ ´
kλ · f k[a,b] = |λ| · kλ · f k[a,b] , λ∈R (9.1.73)

3◦ . Полуаддитивность: ´ ´ ´
kf + gk[a,b] 6 kf k[a,b] + kgk[a,b] (9.1.74)

4◦ . Монотонность по отрезку [a, b]:


´ ´
[a, b] ⊆ [c, d] =⇒ kf k[a,b] 6 kf k[c,d] (9.1.75)

5◦ . Связь с равномерной нормой:


´
kf k[a,b] 6 |b − a| · kf k[a,b] . (9.1.76)

Доказательство. Как и в случаях с равномерной нормой и с равномерной по производным нормой


эти свойства следуют из свойств модуля (и в данном случае еще из свойств интеграла).
§ 1. Функциональные последовательности и функциональные ряды 559

Интегральная сходимость последовательности


• Говорят, что последовательность функций {fn } стремится к функции f интегрально на
отрезке [a, b], если ´
kfn − f k[a,b] −→ 0 (9.1.77)
n→∞

Следующие свойства доказываются по аналогии со свойствами 1◦ и 4◦ на с.536.

Свойства функциональных последовательностей,


сходящихся интегрально
1◦ . Если функции fn интегрально сходятся на отрезке [a, b], то интегральная норма после-
довательности fn ограничена: ´
sup kfn k[a,b] < ∞.
n∈N

2◦ . Пусть функции fn интегрально сходятся на отрезке [a, b], тогда интеграл их предела
совпадает с пределом интегралов:
ˆ b   ˆ b
lim fn (x) d x = lim fn (x) d x. (9.1.78)
a n→∞ n→∞ a

Из неравенства (9.1.76) следует


Теорема 9.1.14. Если последовательность интегрируемых функций fn сходится к интегрируе-
мой функции f равномерно на отрезке [a, b], то fn сходится к f интегрально на [a, b].

⋄ 9.1.40. Функциональная последовательность Однако эта сходимость не равномерна, потому


что
fn (x) = xn , x ∈ [0, 1],
kfn − f k[0,1] = max |fn (x) − f (x)| =
интегрально сходится к функции f (x) = 0, пото- x∈[0,1]
му что = max xn = 1 6−→ 0.
x∈[0,1] n→∞
´ ˆ 1
kfn − f k[0,1] = |fn (x) − f (x)| d x = Более того, эта сходимость и не поточечна, пото-
0 му что в точке x = 1 мы получаем
1
xn+1 1
ˆ
1
= xn d x = = −→ 0.
0 n+1 0 n + 1 n→∞ fx (1) = 1n = 1 6−→ 0 = f (1).
n→∞

Интегральная сходимость ряда


P∞
• Говорят, что функциональный ряд i=1 ai сходится к сумме S интегрально на отрезке
[a, b], если последовательность его частичных сумм сходится к S интегрально на [a, b]
´
n
X
ai − S −→ 0 (9.1.79)
n→∞
i=1 [a,b]

Следующие свойства следуют из свойств 1◦ и 2◦ на с.559.

Свойства функциональных рядов,


сходящихся интегрально
P∞
1◦ . Если функциональный ряд n=1 an интегрально сходятся на отрезке [a, b], то инте-
гральная норма последовательности его частичных сумм ограничена:
´
N
X
sup an < ∞.
N ∈N n=1 [a,b]
560Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
P
2◦ . Пусть функциональный ряд ∞ n=1 an интегрально сходится на отрезке [a, b], тогда ин-
теграл его суммы совпадает с суммой интегралов:
ˆ b X ∞
! ∞ ˆ b
X
an (x) d x = an (x) d x. (9.1.80)
a n=1 n=1 a

N N
⋄ 9.1.41. Ряд X X

X SN (x) = (1 − x) · xn = (xn − xn+1 ) =
n
x n=1 n=1
n=1 x∈[0;1]
= x− xN +1 −→ x = S(x)
не сходится интегрально на отрезке [0; 1], пото- N →∞
му что его частичные суммы не ограничены по
интегральной норме на этом отрезке: Интегральная норма остатка:

N
1X
ˆ ´
kSN (x) − S(x)kx∈[0;1] =
´
n
kSN (x)kx∈[0;1] = x dx =
0 n=1
ˆ 1
N ˆ N = (x − xN +1 ) − x d x =
X 1 X 1 0
= xn d x = −→ ∞. 1
xN +2 1
ˆ
n + 1 N →∞ 1
n=1 0 n=1 = xN +1 d x = 0
= −→ 0
0 N +2 N + 2 N →∞
(а в силу замечания (d) для сходимости ряда эта
последовательность должна быть ограничена). P∞
Вывод: ряд n=1 (1 − x) · xn сходится на отрезке
⋄ 9.1.42. Выясним, будет ли ряд [0; 1] интегрально к сумме S(x) = x.

X ⊲⊲ 9.1.43. Выясните, будет ли данный ряд схо-
(1 − x) · xn диться интегрально на отрезке [0, 1]:
n=1
P∞ x
1) n=1 (nx−x+1)(nx+1) ;
сходиться интегрально на отрезке [0; 1]. В приме- P∞ P∞ √ √ 
x √
ре 9.1.42 мы нашли поточечный предел его ча- 2) n=1 nx+x+ nx =

n=1 nx + x − nx ;
стичных сумм: P∞ xn +(x+1)n P∞  1 1

3) n=1 xn ·(x+1)n = n=1 (x+1)n + xn .

§2 Аппроксимация
(a) Приближение интегрируемых функций
Приближение интегрируемой функции кусочно постоянными.
• Функция g на отрезке [a, b] называется кусочно-постоянной, если существует разбиение
τ = {x0 , ..., xk } отрезка [a, b] такое, что на каждом интервале (xi−1 , xi ) функция g посто-
янна:
g(s) = g(t), s, t ∈ (xi−1 , xi )
Понятно, что всякая кусочно-постоянная функция g будет кусочно-гладкой, и значит, интегри-
руемой на [a, b]. Если через Ci обозначить значения g на интервалах постоянства (xi−1 , xi ),

g(x) = Ci , x ∈ (xi−1 , xi ),

то по лемме 7.3.9, интеграл по каждому отрезку [xi−1 , xi ] от g будет равен интегралу от Ci по этому
отрезку ˆ xi

g(x) d x = Ci · xi − xi−1
xi−1

Как следствие, интеграл от g по всему [a, b] будет равен

b k
X 
ˆ
g(x) d x = Ci · xi − xi−1 (9.2.81)
a i=1
§ 2. Аппроксимация 561

Теорема 9.2.1. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти кусочно-постоянную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (9.2.82)
a

Функцию g можно выбрать так, чтобы выполнялось условие:

sup |g(x)| 6 sup |f (x)| (9.2.83)


x∈[a,b] x∈[a,b]

Доказательство. Выберем разбиение τ = {x0 , ..., xk } отрезка [a, b] так, чтобы нижняя сумма Дарбу
sτ отличалась от интеграла меньше чем на ε:
ˆ b
06 f (x) d x − sτ < ε
a

(этого всегда можно добиться, в силу соотношений (7.2.86)). Положим

g(t) = inf f (x), t ∈ [xi−1 , xi )


x∈[xi−1 ,xi ]

(а в последней точке xk = b функцию g можно определить, например, положив g(b) = f (b)). Тогда
мы получим:
g(x) 6 f (x), x ∈ [a, b]
и поэтому
ˆ b ˆ b   ˆ b ˆ b
| f (x) − g(x) | d x = f (x) − g(x) d x = f (x) d x − g(x) d x = (9.2.81) =
a | {z } a a a
6

0
ˆ b k
X ˆ b
= f (x) d x − inf f (x) · ∆xi = f (x) d x − sτ < ε
a x∈[xi−1 ,xi ] a
i=1
| {z }
=

Условие (9.2.83) выполняется по построению g.

Приближение интегрируемой функции непрерывными.


Теорема 9.2.2. Для любой интегрируемой функции f на отрезке [a, b] и любого ε > 0 можно
найти непрерывную функцию g на [a, b] такую, что
´ ˆ b
kf − gk[a,b] = |f (x) − g(x)| d x < ε (9.2.84)
a

Функцию g можно выбрать так, чтобы выполнялось условие:

sup |g(x)| 6 sup |f (x)| (9.2.85)


x∈[a,b] x∈[a,b]

а также условие
g(a) = 0 = g(b) (9.2.86)
Доказательство. 1. Рассмотрим сначала случай, когда функция f представляет собой ступеньку,
то есть имеет вид (
C, x ∈ [α, β]
f (x) =
0, x ∈
/ [α, β]
для некоторого отрезка [α, β] ⊆ [a, b] и некоторого числа C ∈ R. Тогда для любого ε > 0 можно
поправить функцию f линейно в окрестностях точек разрыва α и β (или в окрестности одной из
них, если другая является концом отрезка [a, b]) так, чтобы получилась непрерывная функция g,
отличающаяся от f только в этих окрестностях, и интеграл от модуля разности будет маленьким.
562Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

На языке формул это можно выразить так: если a 6= α и β 6= b, то положим




 0, x<α−δ


  
 C C
ε  δ · x + C − δ · α, x ∈ [α − δ, α]
δ = min , α − a, b − β , g(x) = C, x ∈ [α, β]
3|C| 

 C C
− δ · x + C + δ · β, x ∈ [β, β + δ]


0, x>β+δ

и тогда g непрерывна, отличается от f только на интервалах (α − δ, α) и (β, β + δ), и разность f − g


нигде не превосходит |C|, поэтому
b α β+δ
ε 2ε
ˆ ˆ ˆ
|f (x) − g(x)| d x = |f (x) − g(x)| d x + |f (x) − g(x)| d x 6 2|C|δ 6 2|C| · = <ε
a α−δ β 3|C| 3

Если же a = α или β = b, то в определении g интервал (α−δ, α) или интервал (β, β+δ) соответственно
нужно исключить, и результат будет тем же. Условие (9.2.85) при этом выполняется автоматически.
2. После этого предположим, что функция f кусочно-постоянна. Тогда, если не считать ее значе-
ний в точках разрыва, она будет совпадать с суммой некоторого конечного набора ступенек f1 , ..., fn :
n
X
f= fi
i=1

Для каждой ступеньки fi подберем непрерывную функцию gi так, чтобы


ˆ b
ε
|fi (x) − gi (x)| d x <
a n
Pn
Тогда, положив g = i=1 gi , мы получим:

ˆ b ˆ b n
X n
X ˆ b n 
X 
|f (x) − g(x)| d x = fi (x) − gi (x) d x = fi (x) − gi (x) d x 6
a a i=1 i=1 a i=1
n
bX Xn ˆ b Xn
ε
ˆ
6 fi (x) − gi (x) d x = fi (x) − gi (x) d x < =ε
a i=1 i=1 a i=1
n

Если вдобавок gi выбирались так, чтобы выполнялось условие (9.2.85),

sup |gi (x)| 6 sup |fi (x)|


x∈[a,b] x∈[a,b]

то это условие будет выполняться и для g:

sup |g(x)| = max sup |gi (x)| 6 max sup |fi (x)| = sup |f (x)|
x∈[a,b] 16i6n x∈[a,b] 16i6n x∈[a,b] x∈[a,b]

3. Наконец, если f – произвольная интегрируемая функция, и ε > 0, то, подберем для нее по
теореме 9.2.1 кусочно-постоянную функцию, обозначим ее h, так, чтобы
ˆ b
ε
|f (x) − h(x)| d x <
a 2
Затем, по уже доказанному, мы можем подобрать для функции h непрерывную функцию g так,
чтобы ˆ b
ε
|h(x) − g(x)| d x <
a 2
И тогда мы получим:
ˆ b ˆ b ˆ b  
|f (x) − g(x)| d x = |f (x) − h(x) + h(x) − g(x)| d x 6 |f (x) − h(x)| + |h(x) − g(x)| dx =
a a a
b b
ε ε
ˆ ˆ
= |f (x) − h(x)| d x + |h(x) − g(x)| d x < + =ε
a a 2 2
§ 2. Аппроксимация 563

Если кроме того, h и g выбирались так, чтобы удовлетворять условиям (9.2.85) и (9.2.83), то мы
получим
(9.2.85) (9.2.83)
sup |g(x)| 6 sup |h(x)| 6 sup |f (x)|
x∈[a,b] x∈[a,b] x∈[a,b]

4. Последнее условие (9.2.86) можно обеспечить, поправив еще немного функцию g в окрестности
точки a или b так, как мы это делали в пункте 1 (то есть линейно).

(b) Свертка
• Сверткой функций f : R → R и g : R → R называется функция f ∗g : R → R, определенная
формулой
ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y, y ∈ R (9.2.87)
−∞ A → −∞ A
B → +∞

Здесь в правой части стоит несобственный интеграл, который, конечно, не для любых f , g
и x существует, и поэтому свертка f ∗ g не всегда определена. Среди достаточных условий для
существования свертки нас будет интересовать только одно, а именно, то, в котором функции f и g
локально интегрируемы, причем одна из них финитна. Понятие локально интегрируемой функции
было введено нами на с.470, а что такое финитная функция объясняется в следующем определении:
• Функция f : R → R называется финитной, если существует отрезок [a, b], вне которого
функция f обращается в нуль:

∀x ∈
/ [a, b] f (x) = 0

Наименьший из таких отрезков мы будем называть выпуклым носителем функции f и


обозначать conv supp f :
\n o
conv supp f = [a, b] : ∀x ∈
/ [a, b] f (x) = 0

(если f финитная и не везде нулевая, то такой отрезок всегда существует).


Теорема 9.2.3. Если функции f и g локально интегрируемы, причем одна из них финитна, то
свертка f ∗ g : R → R корректно определена и непрерывна.
Доказательство. Если финитна функция f , то интеграл в правой части (9.2.87) будет равен инте-
гралу по ее выпуклому носителю [a, b] = conv supp f :
ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y =
−∞ A → −∞ A
B → +∞
(ˆ )
a ˆ b ˆ B
= lim f (y) · g(x − y) d y + f (y) · g(x − y) d y + f (y) · g(x − y) d y =
A → −∞
B → +∞ |A {z } a
|b {z }
=

0 0
ˆ b
= f (y) · g(x − y) d y
a

Если же финитна функция g, и [a, b] = conv supp g – ее выпуклый носитель, то для всякого фик-
сированного x ∈ R функция y 7→ g(x − y) будет тоже финитной, и ее выпуклым носителем будет
отрезок [x − b, x − a]:

x−y ∈ [a, b] ⇔ a 6 x−y 6 b ⇔ −a > y−x > −b ⇔ x−a > y > x−b ⇔ y ∈ [x−b, x−a]

Поэтому интеграл в (9.2.87) будет интегралом по отрезку [x − b, x − a]:


ˆ +∞ ˆ B
(f ∗ g)(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y =
−∞ A → −∞ A
B → +∞
564Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ
(ˆ )
x−b ˆ x−a ˆ B
= lim f (y) · g(x − y) d y + f (y) · g(x − y) d y + f (y) · g(x − y) d y =
A → −∞ A x−b x−a
B → +∞ | {z } | {z }

=
0 0
ˆ x−a
= f (y) · g(x − y) d y
x−b

Остается проверить, что функция f ∗ g непрерывна – мы это сделаем позже, на с.566.

• Сдвигом функции f : R → R на величину a ∈ R называется функция Ta f : R → R,


определенная правилом
Ta f (x) := f (x + a), x∈R (9.2.88)

Свойства свертки
1◦ . Дистрибутивность:
(f + g) ∗ h = f ∗ h + g ∗ h (9.2.89)
2◦ . Коммутативность:
f ∗g =g∗f (9.2.90)
3◦ . Перестановочность со сдвигом:

(Ta f ) ∗ g = Ta (f ∗ g) = f ∗ (Ta g) (9.2.91)

4◦ . Оценка равномерной нормы: если функция g (локально интегрируема и) сосредоточена


на отрезке [a, b],
∀x ∈
/ [a, b] g(x) = 0,
то для любой (локально интегрируемой) функции f и любого отрезка [A, B] выполня-
ются неравенства:
´
kf ∗ gk[A,B] 6 kf k[A−b,B−a] · kgk[a,b] (9.2.92)
´
kf ∗ gk[A,B] 6 kf k[A−b,B−a] · kgk[a,b] (9.2.93)

Доказательство. 1. Первое свойство доказывается просто вычислением:

  ˆ +∞  
(f + g) ∗ h (x) = f (y) + g(y) · h(x − y) d y =
−∞
ˆ +∞ ˆ +∞
= f (y) · h(x − y) d y + g(y) · h(x − y) d y = (f ∗ h)(x) + (g ∗ h)(x)
−∞ −∞

2. Следующие два свойства доказываются заменой переменной. Коммутативность:


ˆ +∞ ˆ B x−y =t
f ∗ g(x) = f (y) · g(x − y) d y = lim f (y) · g(x − y) d y = y =x−t = (7.2.104) =
−∞ A → −∞ A dy = −dt
B → +∞
ˆ x−B ˆ x−A e =x−A
B −→ +∞
A→−∞
=− lim f (x − t) · g(t) d t = lim f (x − t) · g(t) d t = e= x−B
A −→ −∞
=
A → −∞ x−A A → −∞ x−B B→+∞
B → +∞ B → +∞
ˆ e
B ˆ +∞
= lim f (x − t) · g(t) d t = f (x − t) · g(t) d t = (g ∗ f )(x)
e → −∞
A e
A −∞
e → +∞
B

3. Перестановочность со сдвигами:
ˆ +∞ ˆ B y+a=t
(Ta f ) ∗ g(x) = Ta f (y) · g(x − y) d y = lim f (y + a) · g(x − y) d y = y =t−a = (7.2.104) =
−∞ A → −∞ A dy = dt
B → +∞
§ 2. Аппроксимация 565
ˆ B+a α=A+a −→ −∞
A→−∞
= lim f (t) · g(x + a − t) d t = β =B+a −→ +∞ =
A → −∞ A+a B→+∞
B → +∞
ˆ β ˆ +∞ 
= lim f (t) · g(x + a − t) d t = f (t) · g(x + a − t) d t = (g ∗ f )(x + a) = Ta (g ∗ f ) (x)
α → −∞ α −∞
β → +∞

И точно так же доказывается вторая формула в (9.2.91).


4. Докажем (9.2.92):

ˆ ∞ ˆ b
∀x ∈ [A, B] (f ∗ g)(x) = f (x − y) · g(y) d y = f (x − y) · g(y) d y 6
−∞ |{z} a

отлично от нуля
только при y ∈ [a, b]
[A − b, B − a]

[x − b, x − a]

ˆ b z }| { ˆ b ´
6 |f ( x − y )| · g(y) d y 6 kf k[A−b,B−a] · g(y) d y = kf k[A−b,B−a] · kgk[a,b]
a | {z } a
>

kf k[A−b,B−a]


´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]

Теперь (9.2.93):
ˆ ∞
∀x ∈ [A, B] (f ∗ g)(x) = f (x − y) · g(y) d y =
−∞ |{z}

отлично от нуля
только при y ∈ [a, b]
ˆ b ˆ b
= f (x − y) · g(y) d y 6 f (x − y) · |g(y)| d y 6 (7.2.97) 6
a a | {z }
>

kgk[a,b]
ˆ b x−y =t
ˆ x−b
6 f (x − y) d y · kgk[a,b] = y =x−t = − kgk[a,b] · fn (t) − f (t) d t =
a dy = −dt x−a
ˆ x−a ˆ B−a ´
= f (t) d t · kgk[a,b] 6 f (t) d t · kgk[a,b] = kf k[A−b,B−a] · kgk[a,b]
x−b ↑ A−b
[x − b, x − a] ⊆ [A − b, B − a]


´
kf ∗ gk[A,B] = sup (f ∗ g)(x) 6 kf k[A−b,B−a] · kgk[a,b]
x∈[A,B]

Лемма 9.2.4. Пусть f – непрерывная функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
kTsn f − f k[α,β] = kf (x + s) − f (x)kx∈[α,β] −→ 0 (9.2.94)
s→0

Доказательство. Функция f непрерывна на отрезке [α − 1, β + 1], значит по теореме Кантора 3.3.10


она равномерно непрерывна на нем, то есть для любого ε > 0 существует δ > 0 такое что для любых
x и y будет справедлива импликация:
 
y ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1] =⇒ |f (y) − f (x)| < ε
 
|y − x| < δ
566Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Здесь при необходимости число δ можно уменьшить так, чтобы выполнялось дополнительное нера-
венство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
 
 x + s ∈ [α − 1, β + 1] 
x ∈ [α − 1, β + 1]
|(x + s) − x| = |s| < δ 

|f (x + s) − f (x)| < ε

Поэтому
kTs f − f k[α,β] = sup |f (x + s) − f (x)| 6 ε (9.2.95)
x∈[α,β]

То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(9.2.95). Это и нужно было доказать.
Лемма 9.2.5. Пусть f – гладкая функция на R. Тогда для любого отрезка [α, β] справедливо
соотношение:
Ts f − f f (x + s) − f (x)
− f′ = − f ′ (x) −→ 0 (9.2.96)
s [α,β] s x∈[α,β]
s→0

Доказательство. Здесь тот же прием примененяется не к функции f , а к ее производной f ′ . Функ-


ция f ′ непрерывна на отрезке [α − 1, β + 1], значит по теореме Кантора 3.3.10 она равномерно
непрерывна на нем, то есть для любого ε > 0 существует δ > 0 такое что для любых x и y будет
справедлива импликация:
 
y ∈ [α − 1, β + 1]
x ∈ [α − 1, β + 1] =⇒ |f ′ (y) − f ′ (x)| < ε
 
|y − x| < δ

Опять замечаем, что при необходимости число δ можно уменьшить так, чтобы выполнялось допол-
нительное неравенство
δ61
Тогда для любых s ∈ (−δ, δ) и x ∈ [α, β] мы получим:
 
 x + τ ∈ [α − 1, β + 1] 
x ∈ [α − 1, β + 1]
|(x + τ ) − x| = |τ | 6 |s| < δ 

1   ⇓
· f (x + s) − f (x) −f ′ (x) = |f ′ (x + τ ) − f (x)| < ε ′
s |

{z } →

0s
=

(7.3.127)
´ x+s
x
f ′ (y) d y
=

´s
0
f ′ (x + t) d t
=

(7.3.126)
f ′ (x + τ ) · s,


τ ∈ 0s

Поэтому
Ts f − f f (x + s) − f (x)
− f′ = sup − f ′ (x) 6 ε (9.2.97)
s [α,β] x∈[α,β] s
То есть по произвольному данному ε > 0 мы нашли такое δ > 0, что для всех s ∈ (−δ, δ) выполняется
(9.2.97). Это и нужно было доказать.
Окончание доказательства теоремы 9.2.3. Вспомним, что в доказательстве теоремы 9.2.3 мы от-
ложили на будущее проверку того, что свертка f ∗g действительно является непрерывной функцией.
Теперь можем в этом убедиться.
1. Предположим сначала, что функция g непрерывна и финитна. Пусть [a, b] – ее выпуклый
носитель:
conv supp g = [a, b]
Тогда для любой последовательности sn → 0, по модулю не превосходящей 1,

|sn | 6 1
§ 2. Аппроксимация 567

сдвиги Tsn g функции g будут сосредоточены на отрезке [a − 1, b + 1]:

conv supp Tsn g ⊆ [a − 1, b + 1] (9.2.98)

Из леммы 9.2.4 мы получим цепочку:

kTsn g − gk[a−1,b+1] −→ 0 (лемма 9.2.4)


n→∞

∀x ∈ R |(f ∗ g)(x + sn ) − (f ∗ g)(x)| = |Tsn (f ∗ g)(x) − (f ∗ g)(x)| = kTsn (f ∗ g) − f ∗ gk[x,x] =


 
= (9.2.91) = kf ∗ (Tsn g) − f ∗ gk[x,x] = (9.2.89) = f ∗ Tsn g − g 6
[x,x]
´
6 (9.2.93) 6 kf k[x−b−1,x−a+1] · kTsn g − gk[a−1,b+1] −→ 0
| {z } n→∞

0

∀x ∈ R (f ∗ g)(x + sn ) −→ (f ∗ g)(x)
n→∞

Это верно для любой последовательности sn → 0 со свойством |sn | 6 1, значит,

∀x ∈ R (f ∗ g)(x + s) −→ (f ∗ g)(x)
s→0

то есть функция f ∗ g непрерывна.


2. Теперь пусть g – произвольная локально интегрируемая финитная функция и [a, b] – ее вы-
пуклый носитель. По теореме 9.2.2 можно подобрать последовательность непрерывных функций gn
так, чтобы выполнялись условия
´
kgn − gk[a,b] −→ 0, g(a) = 0 = g(b)
n→∞

Второе из этих условий означает, что функции gn можно продолжить нулем вне отрезка [a, b], и они
станут непрерывными функциями, определенными на всей прямой R, и, как и g, сосредоточенными
на отрезке [a, b], поэтому
∀n conv supp(gn − g) ⊆ [a, b]
После этого для всякого отрезка [A, B] ⊂ R мы получим:
´
kf ∗ gn − f ∗ gk[A,B] = (9.2.89) = kf ∗ (gn − g)k[A,B] 6 (9.2.92) 6 kf k[A−b,B−a] · kgn − gk[a,b] −→ 0
n→∞


x∈[A,B]
(f ∗ gn )(x) ⇒ (f ∗ g)(x)
n→∞

При этом, поскольку функции gn непрерывны, по уже доказанному, свертки f ∗ gn – тоже непрерыв-
ные функции. Значит, по свойству 1◦ на с.536, равномерный на отрезке [A, B] предел f ∗ g функций
f ∗ gn должен быть непрерывной функцией на [A, B]. Это верно для любого отрезка [A, B], значит
функция f ∗ g должна быть непрерывна всюду на R.

Теорема 9.2.6. Если одна из функций f или g является гладкой, то свертка f ∗g тоже является
гладкой, причем если гладкой является функция f , то

(f ∗ g)′ = f ′ ∗ g (9.2.99)

если же гладкой является функция g, то

(f ∗ g)′ = f ∗ g ′ (9.2.100)
568Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Доказательство. Пусть функция f – гладкая, а g – финитная (и локально интегрируемая) с носи-


телем [a, b]. Тогда для произвольной последовательности sn −→ 0, sn 6= 0, мы получим:
n→∞

1 
∀[α, β] ⊂ R Tsn f − f − f ′ −→ 0 (лемма 9.2.5)
sn [α,β]
n→∞

(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R − (f ′ ∗ g)(x) =
sn
1  1 
= (Tsn f ∗ g)(x) − (f ∗ g)(x) − (f ′ ∗ g)(x) = Tsn f ∗ g − f ∗ g − f ′ ∗ g =
sn sn [x,x]
   
1 1  ´
= Tsn f − f − f ′ ∗ g 6 (9.2.92) 6 Tsn f − f − f ′ · kgk[a,b] −→ 0
sn [x,x] sn [x−b,x−a]
n→∞
| {z }
n
↓ ↓

0


(f ∗ g)(x + sn ) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
sn n→∞

Это верно для любой последовательности sn → 0. Поэтому

(f ∗ g)(x + s) − (f ∗ g)(x)
∀x ∈ R −→ (f ′ ∗ g)(x)
s s→0

Мы получаем, что функция f ∗ g дифференцируема и ее производная будет равна f ′ ∗ g. Остается


вспомнить, что в силу только что законченного доказательства теоремы 9.2.3, функция f ′ ∗ g будет
непрерывна.
По аналогии рассматривается случай, когда функция f – произвольная (локально интегрируе-
мая), а g – гладкая и финитная.
Следствие 9.2.7. Если одна из функций f или g является бесконечно гладкой, то их свертка
тоже будет бесконечно гладкой.
Доказательство. Пусть f бесконечно гладкая. Тогда по теореме 9.2.6 свертка f ∗ g будет гладкой,
причем
(f ∗ g)′ = f ′ ∗ g
Поскольку f ′ тоже гладкая, опять по теореме 9.2.6 получаем, что свертка f ′ ∗ g, то есть функция
(f ∗ g)′ , будет гладкой, причем
(f ∗ g)′′ = (f ′ ∗ g)′ = f ′′ ∗ g
И так далее.

(c) Приближение непрерывных функций


Аппроксимативная единица.
• Последовательность локально интегрируемых функций ∆n : R → R называется аппрок-
симативной единицей, если выполняются следующие условия:
(i) функции ∆n имеют общий компактный носитель, то есть существует отрезок [α, β],
вне которого все они равны нулю:

∀x ∈
/ [α, β] ∀n ∈ N ∆n (x) = 0

если это верно, то в качестве [α, β] всегда можно выбрать отрезок вида [−D, D], где
D > 0, и тогда будет выполняться условие
 
∀x ∈ R |x| > D =⇒ ∀n ∈ N ∆n (x) = 0 (9.2.101)
§ 2. Аппроксимация 569

(ii) все функции ∆n неотрицательны:


∆n > 0 (9.2.102)
(iii) интеграл от всякой функции ∆n равен единице:
ˆ +∞
∆n (x) d x = 1 (9.2.103)
−∞

(iv) для всякого δ > 0 выполняется соотношение:


ˆ +δ
∆n (x) d x −→ 1 (9.2.104)
−δ n→∞

или, что равносильно, соотношение


ˆ
∆n (x) d x −→ 0 (9.2.105)
|x|>δ n→∞

π x
x
ˆ
⋄ 9.2.1. Покажем, что функции cos2ndx = 2
=y
=
( −π 2 x = 2y
1
´1
(1−x2 )n d x
· (1 − x2 )n , |x| 6 1 ˆ π2 ˆ π2
∆n (x) = −1
=2 cos2n y d y = 4 cos2n y d y >
0, |x| > 1 − π
0 | {z }
2
(9.2.106)

6
образуют аппроксимативную единицу. Условия 1 − 2y
π ,
потому что
(i)-(iii) здесь очевидны. Докажем (iv). Для вся- cos – выпуклая
 
кого δ > 0 мы получим: функция на 0, π
2
 2n
π
2y
ˆ 2
ˆ 1 ˆ 1 >4 1− dy =
(1 − x2 )n d x = 2 (1 − x2 )n d x > 0 π
−1 0  2n+1 y= π2
1
2π 2y 2π
(1 − x)n+1 x=1 2 =− 1− =
ˆ
>2 (1−x)n d x = −2· = 2n + 1 π y=0 2n +1
0 n+1 x=0 n+1
⇓ ⇓
2 1 2n + 1
6n+1 ´π x
6
´1 cos2n dx 2π
−1
(1 − x2 )n d x −π 2

⇓ ⇓

ˆ ˆ π
ˆ ˆ 1
∆n (x) d x = 2 · ∆n (x) d x = ∆n (x) d x = 2 ∆n (x) d x =
|x|>δ δ
|x|>δ δ
1
ˆ π  x 2n
1
2
ˆ
2 n = ´π ·2 cos dx 6
= ´1 · (1 − x ) d x 6 cos2n x
dx δ 2
− x2 )n d x | δ −π 2
−1 (1 {z } | {z }
| {z }
>
>
>

´1 2n+1
n+1 δ
(1 − δ 2 )n d x 2π

x 2n 
=

π x
2n + 1
ˆ
(1 − δ 2 )n · (1 − δ)
=y
6 ·2 dx = 2
cos =
2π δ 2 x = 2y
(3.2.58)
6 (n + 1) · (1 − δ 2 )n · (1 − δ) −→ 0 2n + 1
ˆ π2  2n
n→∞
= ·4 cos y dy 6
2π | {z }
⋄ 9.2.2. Покажем, что функции δ
>

( 1
cos δ,
´π
cos2n x
· cos2n x2 , |x| 6 π потому что
∆n (x) = −π 2 dx cos убывает
 
0, |x| > π на 0, π 2

(9.2.107) 4n + 2
ˆ π2
образуют аппроксимативную единицу. Как и в 6 · cos2n δ d x =
π δ
предыдущем примере, здесь нужно проверить
4n + 2  2
n  π  (3.2.58)
только условие (iv). Для всякого δ > 0 мы по- = · cos
| {z }δ · − δ −→ 0
лучим: π 2 n→∞
>

1
570Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

⋄ 9.2.3. Бесконечно гладкая аппроксима- =⇒ ∆n (x) = h(nx) = 0


тивная единица. Следуя примеру 9.1.36 по-
строим гладкую функцию g ∈ C ∞ (R) со следу- Интеграл от каждой такой функции будет равен
ющими свойствами: единице:
(
∞ ∞
g(x) = 0, x ∈
/ (−1, 1)
ˆ ˆ
∆n (x) d x = n · h(nx) d x =
g(x) > 0, x ∈ (−1, 1) −∞ −∞
ˆ ∞ ˆ ∞
Положив = h(nx) d(nx) = h(y) d y = 1
g(x) −∞ −∞
h(x) = ´ 1
g(t) d t
−1 А для каждого δ > 0 и любого n > 1δ мы полу-
мы получим функцию со следующими свойства- чим:
ми:  ˆ δ ˆ δ

h(x) = 0, x∈/ (−1, 1)
∆n (x) d x = n · h(nx) d x =
h(x) > 0, x ∈ (−1, 1) −δ −δ

 1
´
−1 h(x) d x = 1
ˆ δ ˆ nδ
= h(nx) d(nx) = h(y) d y =
Теперь положив −δ −nδ
| {z }
nδ>1
∆n (x) = n · h(nx) ˆ 1
= h(y) d y = 1
мы получим последовательность неотрицатель- −1

ных функций ∆n ∈ C (R), имеющих в качестве
общего носителя отрезок [−1, 1]: Таким образом, выполняются все четыре усло-
вия (i)-(iv) на с.568, и наша последовательность
x∈
/ (−1, 1) =⇒ nx ∈ / (−1, 1) =⇒ ∆n является аппроксимативной единицей.

Теорема 9.2.8. Пусть f : R → R – непрерывная функция на R. Тогда для всякой аппроксима-


тивной единицы ∆n последовательность сверток f ∗ ∆n стремится к f равномерно на каждом
отрезке [a, b]:
x∈[a,b]
f ∗ ∆n (x) ⇒ f (x) (9.2.108)
n→∞

Доказательство. Зафиксируем отрезок [a, b] и число D со свойством (9.2.101). Поскольку функция


f непрерывна на отрезке [a−D, b+D], по теореме Вейерштрасса 3.3.8 должна быть конечна величина
M = kf k[a−D,b+D] = sup |f (s)| (9.2.109)
s∈[a−D,b+D]

Пусть далее ε > 0. Поскольку функция f непрерывна на R, она непрерывна и на отрезке [a−D, b+D].
По теореме Кантора 3.3.10 это означает, что f равномерно непрерывна на [a − D, b + D], поэтому
для числа 2ε > 0 должно существовать δ > 0, которое можно подчинить дополнительному условию
δ < D, такое, что
ε
∀s, t ∈ [a − D, b + D] |s − t| < δ =⇒ |f (s) − f (t)| <
2
В частности, при t = x ∈ [a, b] и s = x − y, где y ∈ (−δ, δ), мы получим такое соотношение:
ε
∀x ∈ [a, b] ∀y ∈ (−δ, δ) |f (x − y) − f (x)| < (9.2.110)
2
Теперь для любого x ∈ [a, b] мы получаем:

f ∗ ∆n (x) 1
=

(9.2.87) (9.2.103)
zˆ }| { zˆ }| {
∞ ∞
f ∗ ∆n (x) − f (x) = f (x − y) · ∆n (y) d y −f (x) · ∆n (y) d y =
−∞ −∞
ˆ ∞ ˆ ∞ ˆ ∞ 
= f (x − y) · ∆n (y) d y − f (x − y) · ∆n (y) d y = f (x − y) − f (x) · ∆n (y) d y =
−∞ −∞ −∞ | {z }
=

0,
при |y| > D
§ 2. Аппроксимация 571
ˆ D   ˆ D
= f (x − y) − f (x) · ∆n (y) d y 6 f (x − y) − f (x) · ∆n (y) d y 6
−D −D
ˆ δ ˆ
6 f (x − y) − f (x) ·∆n (y) d y + f (x − y) − f (x) ·∆n (y) d y 6
−δ | {z } |y|>δ | {z }

>

>
(9.2.110)
ε
2 |f (x − y)| + |f (x)|

>
(9.2.109)
M +M

=
2M
δ
ε
ˆ ˆ
6 · ∆n (y) d y + 2M · ∆n (y) d y
2 −δ |y|>δ

Это верно для любого x ∈ [a, b]. Значит,


δ
ε ε
ˆ ˆ
kf ∗ ∆n − f k[a,b] = sup f ∗∆n (x)−f (x) 6 · ∆n (y) d y +2M · ∆n (y) d y −→ <ε
x∈[a,b] 2 −δ |y|>δ n→∞ 2
| {z } | {z }
n n
(9.2.104) ↓ ↓ (9.2.105) ↓ ↓
∞ ∞
1 0

И это верно для любого ε > 0. Мы получаем, что, какое ни возьми ε > 0, для почти всех n ∈ N
будет верно неравенство
kf ∗ ∆n − f k[a,b] < ε
То есть,
kf ∗ ∆n − f k[a,b] −→ 0,
n→∞

а это нам и нужно было доказать.

Аппроксимация гладкими функциями.

Теорема 9.2.9. Для любой непрерывной функции f : R → R можно подобрать последователь-


ность бесконечно гладких функций ϕn : R → R, равномерно сходящуюся к f на каждом отрезке
[a, b] ⊂ R:
x∈[a,b]
∀[a, b] ⊂ R ϕn (x) ⇒ f (x) (9.2.111)
n→∞

Доказательство. Пусть ∆n – бесконечно гладкая аппроксимативная единица, построенная в при-


мере 9.2.3. Тогда по следствию 9.2.7, функции

ϕn = f ∗ ∆n

будут бесконечно гладкими, а по теореме 9.2.8, они будут стремиться к f равномерно на каждом
отрезке в R.

Следствие 9.2.10. Для любой непрерывной функции f : [a, b] → R можно подобрать последо-
вательность бесконечно гладких функций ϕn : [a, b] → R, равномерно сходящуюся к f на [a, b]:

x∈[a,b]
ϕn (x) ⇒ f (x) (9.2.112)
n→∞

Доказательство. Нужно сначала продолжить f до непрерывной функции на всю прямую R. Это


можно сделать, например, положив
(
f (a), x < a
f (x) =
f (b), x > b

После этого по теореме 9.2.9, найдется последовательность гладких функций ϕn , приближающая f


равномерно на каждом отрезке, в частности, на отрезке [a, b].
572Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

Аппроксимация алгебраическими многочленами. Напомним, что


• функции вида
n
X
f (x) = ak · xk (x ∈ R),
k=0

где n ∈ N и ak ∈ R, называются алгебраическими многочленами или просто многочленами


(от одной переменной). Если an 6= 0, то число n называется степенью многочлена f .

Теорема 9.2.11 (Вейерштрасса об аппроксимации алгебраическими многочленами). Для любой


непрерывной функции f : [a, b] → R можно подобрать последовательность многочленов ϕn :
[a, b] → R, равномерно сходящуюся к f на [a, b]:

x∈[a,b]
fn (x) ⇒ f (x) (9.2.113)
n→∞

Доказательство. 1. Прежде всего заметим, что линейной заменой переменной утверждение сво-
дится к случаю [a, b] ⊂ (0, 1). Например, функция

ϕ(t) = 3(b − a) · t + 2a − b
1 2

превращает отрезок 3, 3 в отрезок [a, b]:
 
1 2
ϕ , = [a, b]
3 3
 
А функция f в композиции с ϕ превращается в функцию f ◦ ϕ на отрезке 31 , 23 . Если мы сможем
 
построить последовательность многочленов gn , приближающую f ◦ ϕ равномерно на отрезке 31 , 32
(содержащимся в интервале (0, 1))
t∈[ 13 , 32 ]  
gn (t) ⇒ f ϕ(t) ,
n→∞
−1
то функции fn = gn ◦ ϕ будут многочленами, приближающими f равномерно на [a, b]:
  x∈[a,b]  
fn (x) = gn ϕ−1 (x) ⇒ f ϕ ϕ−1 (x) = f (x)
n→∞

2. Итак, можно считать, что отрезок [a, b] лежит в интервале (0; 1):

[a, b] ⊂ (0, 1)

Тогда f можно доопределить непрерывно на всю прямую R так, чтобы ее выпуклым носителем был
отрезок [0, 1]. Например, можно на оставшихся кусках интервала (0, 1) доопределить функцию f
линейно, то есть положить
 f (a)

 a · x, x ∈ (0, a)
f (b)
f (x) = b−1 · (x − b) + f (b), x ∈ (b, 1)


0, x ∈ (−∞, 0] ∪ [1, +∞)

Запомним это, и рассмотрим аппроксимативную единицу (9.2.106):


(
Cn · (1 − x2 )n , |x| 6 1 1
∆n (x) = , Cn = ´ 1
0, |x| > 1 −1
(1 − x2 )n d x

По теореме 9.2.8, выполняется соотношение


x∈[a,b]
f ∗ ∆n (x) ⇒ f (x)
n→∞

Нам остается только заметить, что на отрезке [a, b] функции f ∗∆n представляют собой многочлены:
§ 2. Аппроксимация 573
ˆ +∞ ˆ x+1
f ∗ ∆n (x) = f (y) · ∆n (x − y) d y = f (y) · ∆n (x − y) d y =
−∞ | {z } x−1

=
0,
при y ∈/ [x − 1, x + 1],
поскольку
conv supp ∆n = [−1, 1]
ˆ x+1  n ˆ 1  n
= Cn · f (y) · 1 − (x − y)2 d y = Cn · f (y) · 1 − (x − y)2 dy =
x−1 |{z} 0 | {z }

=
многочлен по y
0,
при y ∈
/ [0, +1],
причем
x−1 6 0 < 1 6 x+1
число
z }| {
ˆ 1 2n
X 2n 
X ˆ 1
n n
= Cn · f (y) · pk (x) · y dy = Cn · f (y) · y d y · pk (x)
0 0 | {z }
k=0 k=0
многочлен
по x

Аппроксимация тригонометрическими многочленами.


• Функции вида
n n
X o
f (x) = c + ak · cos kx + bk · sin kx (x ∈ R),
k=1

где n ∈ N, c, ak , bk ∈ R, называются тригонометрическими многочленами. Если an 6= 0


или bn 6= 0, то число n называется степенью тригонометрического многочлена f .

Теорема 9.2.12 (Вейерштрасса об аппроксимации тригонометрическими многочленами). Для лю-


бой непрерывной 2π-периодической функции f : R → R можно подобрать последовательность
тригонометрических многочленов fn : R → R, равномерно сходящуюся к f на R:
x∈R
fn (x) ⇒ f (x) (9.2.114)
n→∞

Доказательство. Здесь нужно рассмотреть аппроксимативную единицу (9.2.107). По теореме 9.2.8,


выполняется соотношение
x∈[−π,π]
f ∗ ∆n (x) ⇒ f (x)
n→∞

и наша задача – убедиться, что функции f ∗ ∆n являются тригонометрическими многочленами.


Для этого нужно заметить, что на отрезке [−π, π] функции ∆n сами будут тригонометрическими
многочленами:
N n
X o
∆n (x) = c + ak cos kx + bk sin kx
k=1

Отсюда следует цепочка:


ˆ +∞ ˆ x+π
f ∗ ∆n (x) = f (y) · ∆n (x − y) d y = f (y) · ∆n (x − y ) d y =
−∞ | {z } x−π | {z }

=

0, [−π, π]
при y ∈/ [x − π, x + π],
поскольку
conv supp ∆n = [−π, π]
N n
!
ˆ x+π X o
интеграл по сдвинутому периоду
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) dy = равен интегралу по периоду =
x−π k=1
| {z }
2π-периодическая функция от y
N n
!
ˆ +π X o
= f (y) · c+ ak · cos k(x − y) + bk (x) · sin k(x − y) d y = (4.1.82), (4.1.81) =
−π k=1
574Глава 9. ФУНКЦИОНАЛЬНАЯ СХОДИМОСТЬ, ФУНКЦИОНАЛЬНЫЕ РЯДЫ И АППРОКСИМАЦИЯ

ˆ +π  N n
X o
= f (y) · C + Ak (x) · cos ky + Bk (x) · sin ky dy =
−π | {z } | {z }
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
число число число
zˆ }| { z }| { zˆ }| {
+π N n
X ˆ +π +π o
=C· f (y) d y + Ak (x) · f (y) · cos ky d y + Bk (x) · f (y) · sin ky d y
−π | {z } −π | {z } −π
k=1
тригоно- тригоно-
метрический метрический
многочлен многочлен
от x от x
Глава 10

СТЕПЕННЫЕ РЯДЫ И
АНАЛИТИЧЕСКИЕ ФУНКЦИИ

• Степенным рядом называется функциональный ряд следующего специального вида:



X
cn · (x − x0 )n (10.0.1)
n=0

Число x0 называется центром этого степенного ряда, а числа cn – его коэффициентами.


• Частным случаем степенного ряда будет ряд, в котором коэффициенты cn вычисляются
по формулам
f (n) (x0 )
c0 = (10.0.2)
n!
где f – некоторая функция, бесконечно гладкая в окрестности точки x0 . Такой степен-
ной ряд называется рядом Тейлора функции f в точке x0 . Его коэффициенты (10.0.2)
называются коэффициентами Тейлора функции f в точке x0 , а частичные суммы
N
X
TN (x) = cn · (x − x0 )n , N ∈ Z+ , (10.0.3)
n=0

– многочленами Тейлора функции f в точке x0 .


Среди всевозможных функций в математическом анализе важный класс образуют функции,
являющиеся суммами своего ряда Тейлора:

X
f (x) = cn · (x − x0 )n .
n=0

Такие функции называются аналитическими (точное определение см. на с.602), и в этой главе мы
поговорим о них.

§1 Степенные ряды, аналитические последовательности и про-


изводящие функции
(a) Степенные ряды
Область сходимости степенного ряда.

Теорема 10.1.1 (об области сходимости степенного ряда). Область сходимости D всякого сте-
пенного ряда
X∞
cn · (x − x0 )n (10.1.4)
n=0

имеет следующий вид:

575
576 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

— либо D состоит из одной точки: D = {x0 };


— либо D совпадает со всей числовой прямой: D = (−∞, +∞);
— либо существует такое число R > 0, что D совпадает с отрезком [x0 − R, x0 + R],
исключая, может быть, точки на границе: (x0 − R, x0 + R) ⊆ D ⊆ [x0 − R, x0 + R].

• Число R при этом называется радиусом сходимости, а интервал (x0 − R, x0 + R) – интер-


валом сходимости степенного ряда (10.1.4).
Доказательство этой теоремы использует следующую лемму.

Лемма 10.1.2 (Абель). Пусть нам дан степенной ряд



X
cn · z n . (10.1.5)
n=0

Тогда:
— если ряд (10.1.5) сходится в какой-то точке z = ζ, то он сходится также в любой
точке z = η по модулю меньшей ζ:
|η| < |ζ|
— если ряд (10.1.5) расходится в какой-то точке z = η, то он расходится также в любой
точке z = ζ по модулю большей η:
|η| < |ζ|.

Доказательство. 1. Докажем сначала первую часть. Здесь используется некий стандартный прием,
постоянно применяемый при изучении степенных рядов, и называемый логической цепочкой Абеля.
Он состоит в следующем.
Ряд (10.1.5) сходится в точке z = ζ


X
числовой ряд cn · ζ n сходится
n=0


общий член стремится к нулю: cn · ζ n −→ 0
n→∞

последовательность cn · ζ n ограничена: ∃M > 0 ∀n ∈ N |cn · ζ n | 6 M (10.1.6)



для всякого η : |η| < |ζ| получаем:
n n
ηn η η η
|cn · η n | = cn · ζ n · n
= |cn · ζ n | · 6 (применяем (10.1.6)) 6 M · , где <1
ζ ζ ζ ζ


X ∞
X n X∞ n
η η η
|cn · η n | 6 M· =M· − сходится, поскольку <1
n=0 n=0
ζ n=0
ζ ζ



X
|cn · η n | − сходится, по признаку сравнения (теорема 8.2.4)
n=0



X
cn · η n − сходится, по признаку абсолютной сходимости (теорема 8.2.11)
n=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 577

2. Для доказательства второй части достаточно


P∞ переформулировать доказанное
P∞ утверждение
так: не бывает, чтобы |η| < |ζ|, и при этом ряд n=0 cn ·η n расходился, а ряд n=0 cn ·ζ n сходился.
Отсюда сразу получается импликация

X ∞
X
|η| < |ζ| & ряд cn · η n расходится =⇒ ряд cn · ζ n расходится
n=0 n=0

Доказательство теоремы 10.1.1. Заметим сразу, что нам достаточно рассмотреть ряд (10.1.5), по-
тому что ряд (10.1.4) превращается в него заменой переменной

x − x0 = z

Обозначим через D его область сходимости. Нам нужно доказать, что либо D = {0}, либо D = R,
либо существует такое число R > 0, что (−R, R) ⊆ D ⊆ [−R, R].
Ясно, что D 6= ∅, поскольку 0 ∈ D. Кроме того, из леммы Абеля 10.1.2 следуют утверждения:

если z ∈ R и ∃ζ ∈ D : |z| < |ζ| то z ∈ D (10.1.7)

и
если z ∈ R и ∃η ∈
/D: |η| < |z| то z ∈
/D (10.1.8)
Положим
R = sup{|ζ|; ζ ∈ D}
и рассмотрим несколько возможных случаев.
1. Если R = 0, то это означает, что область сходимости состоит из одной точки: D = {0}.
2. Если R = ∞, то это означает, что для всякой точки z ∈ R найдется ζ ∈ D такое, что |z| < |ζ|.
Поэтому, в силу (10.1.7), z принадлежит D. Это верно для любой z ∈ R, поэтому D = R.
3. Пусть 0 < R < ∞, тогда мы получим
– если z ∈ (−R, R), то есть |z| < R, то это означает, что найдется ζ ∈ D такое, что |z| < |ζ|,
поэтому, в силу утверждения (10.1.7), z ∈ D;
– если же z ∈ / [−R, R], то есть |z| > R, то это означает, что найдется η ∈
/ D такое, что
|z| > |η|, поэтому, в силу утверждения (10.1.8), z ∈
/ D;
Таким образом, мы получаем, что D содержит интервал (−R, R) и не содержит точек, не лежа-
щих в отрезке [−R, R]. То есть,
(−R, R) ⊆ D ⊆ [−R, R]
Это нам и нужно было доказать.

Теорема 10.1.3 (о радиусе сходимости степенного ряда). Радиус сходимости R произвольного


степенного ряда
X∞
cn · (x − x0 )n
n=0

можно вычислить по формулам

cn 1
R = lim = lim p
n→∞ cn+1 n→∞ n |c |
n

(если такие пределы существуют). При этом, равенство

R=0

означает, что область сходимости D этого ряда имеет вид D = {x0 }, а равенство

R=∞

– что D = R.
578 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Достаточно рассмотреть ряды с нулевым центром, то есть рядов вида (10.1.5).
Мы докажем лишь первую формулу, сказав про вторую лишь, что она доказывается аналогично.
Пусть
cn
R = lim ,
n→∞ cn+1

причем предел справа существует и конечен. Тогда


P
— если |z| < R, то ряд ∞ n
n=0 |cn · z | будет сходиться по признаку Даламбера (теорема 8.2.5),
потому что число Даламбера будет меньше единицы:

cn+1 · z n+1 |cn+1 | |z| |z|


D = lim n
= lim · |z| = |c |
= < 1;
n→∞ |cn · z | n→∞ |cn | n
limn→∞ |cn+1 | R
P∞
значит, ряд n=0 cn · z n тоже должен сходиться;
·z
— cn
если |z| > R = limn→∞ cn+1 , то есть limn→∞ cn+1
cn > 1, то это означает, что существует
такое число C > 1, что, для некоторого номера N выполняется следующее:

cn+1 z
∀n > N >C
cn


∀n > N |cn+1 z| > C|cn |

∀n > N cn+1 z n+1 > C |cn z n |
то есть, последовательность cn+1 z n+1 должна быть неубывающей; отсюда следует, что

cn z n 6−→ 0,
n→∞
P∞
значит, ряд n=0 cn+1 z n+1 не может сходиться.
Мы доказали, что
(−R, R) ⊆ D ⊆ [−R, R]
и поэтому R действительно должен быть радиусом сходимости ряда (10.1.5).
Нам нужно только еще рассмотреть случай R = limn→∞ |c|cn+1 n|
| = ∞. Тогда мы получим для
P∞
любого z ∈ R ряд n=0 |cn · z n | снова будет сходиться по признаку Даламбера:
 
cn+1 · z n+1 |cn+1 | |z| |z|
D = lim = lim · |z| = = =0
n→∞ n
|cn · z | n→∞ |cn | limn→∞ |c|cn+1
n|
|

P∞
поэтому ряд n=0 cn · z n тоже сходится, и таким образом, D = R.
Перейдем, наконец, к примерам.

⋄ 10.1.1. Рассмотрим ряд ⋄ 10.1.2. Рассмотрим ряд



X X∞
xn
n! · xn
n=1 n=1
n!

Радиус сходимости в этом случае оказывается Радиус сходимости в этом случае оказывается
равным нулю равным бесконечности
cn n! 1 cn (n + 1)!
R = lim = lim = lim = 0 R = lim = lim = lim (n+1) = ∞
n→∞ cn+1 n→∞ (n + 1)! n→∞ n+1 n→∞ cn+1 n→∞ n! n→∞

поэтому область сходимости будет состоять из поэтому область сходимости будет совпадать со
одной точки – центра нашего ряда x0 = 0. всей прямой R.
Вывод: Область сходимости D = {0}. Вывод: Область сходимости D = R.
§ 1. Степенные ряды, аналитические последовательности и производящие функции 579

⋄ 10.1.3. Рассмотрим ряд ⋄ 10.1.4. Рассмотрим ряд с ненулевым центром:


∞ X∞
X xn (x + 1)n
n n=1
2n
n=1

Вычисляем радиус сходимости: Радиус сходимости:

cn n+1 cn 2n+1
R = lim = lim =1 R = lim = lim =2
n→∞ cn+1 n→∞ n n→∞ cn+1 n→∞ 2n

Это значит, что область сходимости D являет- Картинка:


ся отрезком [−1, 1], кроме, может быть, точек на
границе. Наглядно это удобно показать следую-
щей картинкой:

Проверяем точки x = −3 и x = 1.
1) При x = −3 получаем ряд

X∞ X∞
Нам остается лишь проверить точки x = −1 и (−2)n
n
= (−1)n
x = 1. n=1
2 n=1
1) При x = −1 получаем ряд
расходящийся по необходимому условию сходи-
X∞ мости (теорема 8.2.9).
(−1)n
2) При x = 1 получаем ряд
n=1
n
X∞ X∞
2n
который сходится по признаку Лейбница (теоре- = 1
2n
ма 8.2.12). n=1 n=1
2) При x = 1 получаем гармонический ряд
также расходящийся по необходимому условию

X ∞
X сходимости.
1n 1
= Поправленная картинка:
n=1
n n=1
n

который расходится, в силу примера 8.2.9.


Таким образом, нашу картинку можно попра-
вить следующим образом:

Вывод: Область сходимости D = (−3, 1).


⊲⊲ 10.1.5. Найдите область сходимости:
P∞ n P∞
1. P n=1 (x−2)
n2 ; 4. n=1 nn · xn ;

Вывод: Область сходимости D = [−1, 1). 2. Pn=1 n2 · (x − 2)n ; P∞ xn
3. ∞ n n
n=1 3 · (x + 2) ; 5. n=1 nn .

Равномерная сходимость степенного ряда.

Теорема 10.1.4. Всякий степенной ряд



X
cn · (x − x0 )n
n=0

сходится равномерно на каждом отрезке [a, b] внутри интервала сходимости (x0 − R, x0 + R).
580 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Поскольку [a, b] ⊆ (x0 − R, x0 + R), можно найти число C > 0 такое, что

x0 − R < x0 − C < a < b < x0 + C < x0 + R

Зафиксируем его и заметим, что


 
|x − x0 | |a − x0 | |b − x0 |
sup = max ; =λ<1 (10.1.9)
x∈[a,b] C C C

Наш ряд сходится в точке x0 + C ∈ (x0 − R, x0 + R), и это приводит к логической цепочке Абеля
(описывавшейся при доказательстве леммы 10.1.2):

X
cn · C n − сходится
n=0

cn · C n −→ 0
n→∞

последовательность cn · C n ограничена :

∃M > 0 ∀n |cn · C n | 6 M (10.1.10)

(x − x0 )n
||cn · (x − x0 )n ||x∈[a,b] = sup |cn · (x − x0 )n | = sup cn · C n · =
x∈[a,b] x∈[a,b] Cn
n
(x − x0 )
= |cn · C n | · sup 6 (применяем (10.1.10)) 6
x∈[a,b] Cn
!n
|x − x0 |
6M· sup 6 (применяем (10.1.9)) 6 M · λn (где λ < 1)
x∈[a,b] C



X ∞
X ∞
X
||cn · (x − x0 )n ||x∈[a,b] 6 M · λn = M · λn (где λ < 1)
n=0 n=0 n=0



X
||cn · (x − x0 )n ||x∈[a,b] − сходится
n=0
 
вспоминаем признак Вейерштрасса
⇓ равномерной сходимости (теорему 9.1.5)


X
cn · (x − x0 )n − сходится равномерно на отрезке [a, b]
n=0
§ 1. Степенные ряды, аналитические последовательности и производящие функции 581

Непрерывность суммы степенного ряда.


Теорема 10.1.5. Сумма всякого степенного ряда

X
S(x) = cn · (x − x0 )n
n=0

непрерывна на интервале сходимости (x0 − R, x0 + R).


Доказательство. По теореме 10.1.4, этот ряд сходится равномерно на любом отрезке [a, b] ⊆ (x0 −
R, x0 +R). С другой стороны, он состоит их непрерывных функций cn ·(x−x0 )n , поэтому, по свойству
20 на с.542, сумма S должна быть непрерывна на [a, b]. Это верно для любого отрезка [a, b] ⊆
(x0 −R, x0 +R), поэтому сумма S(x) должна быть непрерывна на всем интервале (x0 −R, x0 +R).

Дифференцирование и интегрирование степенных рядов. Зафиксируем произвольный сте-


пенной ряд

X
cn · (x − x0 )n (10.1.11)
n=0

и выпишем ряд, получающийся его почленным дифференцированием



X ∞
X

{cn · (x − x0 )n } = cn · n · (x − x0 )n−1 (10.1.12)
n=0 n=1

и ряд, получающийся почленным интегрированием:


∞ ˆ
X x X∞
cn
cn · (t − x0 )n d t = · (x − x0 )n+1 (10.1.13)
n=0 x0 n=0
n + 1

Теорема 10.1.6. Радиусы (и интервалы) сходимости рядов (10.1.11), (10.1.12) и (10.1.13) совпа-
дают, и
(i) сумма ряда (10.1.11) является гладкой функцией на интервале сходимости, и ее произ-
водную на нем можно вычислить почленным дифференцированием:
!
∂   X
∞ ∞ ∞
∂ X n
X
cn · (x − x0 ) = cn · (x − x0 )n = cn · n · (x − x0 )n−1 (10.1.14)
∂x n=0 n=0
∂x n=1

(ii) интеграл от суммы ряда (10.1.11) можно вычислить почленным интегрированием:


ˆ x X ∞
! ∞ ˆ x ∞
X X cn
n
cn · (t − x0 ) dt = cn · (t − x0 )n d t = · (x − x0 )n+1 (10.1.15)
x0 n=0 n=0 x0 n=0
n + 1

Доказательство. 1. Убедимся сначала, что радиусы сходимости рядов (10.1.11), (10.1.12) и (10.1.13)
совпадают. Заметим прежде всего, что для этого нам достаточно проверить совпадение радиусов
сходимости для рядов (10.1.11) и (10.1.12). Это будет означать, что при дифференцировании сте-
пенного ряда его радиус сходимости не меняется, значит, поскольку ряд (10.1.11) тоже получается
из ряда (10.1.13) почленным дифференцированием, их радиусы сходимости тоже будут совпадать.
Сделаем после этого замену переменной

x − x0 = z

Тогда ряды (10.1.11) и (10.1.12) перепишутся следующим образом:



X
cn · z n (10.1.16)
n=0


X
cn · n · z n−1 (10.1.17)
n=1

Обозначим через R1 радиус сходимости ряда (10.1.16), а через R2 – радиус сходимости ряда (10.1.17).
582 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
P∞
A) Докажем сначала, что R1 6 R2 . Это равносильно тому, что если
P∞ ряд n=0n−1 cn · ζ n сходится
при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд n=1 cn · n · z . Применяем
логическую цепочку Абеля:
X∞
cn · ζ n − сходится
n=0


cn · ζ n −→ 0
n→∞


∃M > 0 ∀n |cn · ζ n | 6 M

для всякого z : 0 < |z| < |ζ|
n n
n zn n z n z
|cn · n · z n−1 | = cn · ζ n · · = |cn · ζ n | · · 6M· ·
z ζn |z| ζ |z| ζ


X ∞
X n X∞ n
n z n z
|cn · n · z n−1 | 6 M· · =M· ·
n=1 n=1
|z| ζ n=1
|z| ζ

z
− сходится по признаку Даламбера, поскольку <1
ζ


X
|cn · n · z n−1 | − сходится по признаку сравнения
n=1



X
cn · n · z n−1 − сходится по признаку абсолютной сходимости
n=1
P∞
B) Теперь докажем, что R2 6 R1 . Это равносильно тому, чтоPесли ряд n=1 cn · n · ζ n−1 сходится

при каком-нибудь ζ, то при любом z : 0 < |z| < |ζ| сходится ряд n=0 cn ·z n . Применяем логическую
цепочку Абеля:
X∞
cn · n · ζ n−1 − сходится
n=1


n−1
cn · n · ζ −→ 0
n→∞


∃M > 0 ∀n |cn · n · ζ n−1 | 6 M

для всякого z : 0 < |z| < |ζ|
n n
ζ zn |ζ| z |ζ| z
|cn · z n | = cn · n · ζ n−1 · · = |cn · n · ζ n−1 | · · 6M· ·
n ζn n ζ n ζ


X ∞
X n X∞ n
n |ζ| z |ζ| z
|cn · z | 6 M· · =M· ·
n=0 n=0
n ζ n=0
n ζ

z
− сходится по признаку Даламбера, поскольку <1
ζ

§ 1. Степенные ряды, аналитические последовательности и производящие функции 583


X
|cn · z n | − сходится по признаку сравнения
n=0



X
cn · z n − сходится по признаку абсолютной сходимости
n=0

Итак, мы доказали, что


R1 6 R2 6 R1
то есть
R1 = R2
2. Докажем далее тождество (10.1.14). Возьмем какие-нибудь точки a, b так чтобы

x0 − R < a < x0 < b < x0 + R

Тогда, по теореме 10.1.4, мы получим, что ряд (10.1.12)



X ∞
X ′
cn · n · (x − x0 )n−1 = (cn · n · (x − x0 )n )
n=1 n=0

сходится равномерно на отрезке [a, b], а, с другой стороны, ряд



X
cn · (x − x0 )n
n=0

сходится в точке x0 , потому что все его члены, кроме нулевого равны нулю в этой точке:

X
cn · n · (x − x0 )n = c0 · 1 + c1 · 0 + c2 · 0 + ...
x=x0
n=0

По свойству 40 на с.543, это означает, что сумма ряда (10.1.11) будет дифференцируема на [a, b], и
ее производную в каждой точке x ∈ [a, b] можно вычислить почленным дифференцированием:
!
∂   X
∞ ∞ ∞
∂ X n
X
cn · (x − x0 ) = cn · (x − x0 )n = cn · n · (x − x0 )n−1 , x ∈ [a, b]
∂x n=0 n=0
∂x n=1

То есть тождество (10.1.14) выполняется для x ∈ [a, b]. Поскольку числа a, b здесь выбирались
произвольными, удовлетворяющими условию x0 − R < a < x0 < b < x0 + R, мы получаем, что это
тождество выполняется при любом x ∈ (x0 − R, x0 + R).
3. Теперь докажем (10.1.15). Зафиксируем x из интервала сходимости (общего для рядов (10.1.11)
и (10.1.13)). По теореме 10.1.4, мы получим, что ряд

X
cn · n · (t − x0 )n
n=0

сходится равномерно на отрезке [x0 , x]. Поэтому, по свойству 30 на с.543, должно выполняться
равенство

xX ∞ ˆ
X x X∞
cn
ˆ
cn · (t − x0 )n d t = cn · (t − x0 )n d t = · (x − x0 )n+1
x0 n=0 n=0 x0 n=0
n + 1

То есть справедливо (10.1.15).


Следствие 10.1.7. Сумма всякого степенного ряда является бесконечно гладкой функцией на
интервале сходимости (x0 − R, x0 + R) этого ряда, и производная порядка k этой функции вычис-
ляется по формуле

! ∞
∂k X n
X n!
k
c n · (x − x0 ) = · cn · (x − x0 )n−k , x ∈ (x0 − R, x0 + R) (10.1.18)
∂x n=0
(n − k)!
n=k
584 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Обозначим для удобства сумму нашего степенного ряда буквой P :



X
P (x) = cn · (x − x0 )n , x ∈ (x0 − R, x0 + R)
n=0

По теореме 10.1.6, P дифференцируема на (x0 − R, x0 + R), причем ее производная является суммой


степенного ряда с тем же интервалом сходимости:

X
P ′ (x) = cn · n · (x − x0 )n−1 , x ∈ (x0 − R, x0 + R)
n=1

Значит, опять по теореме 10.1.6, P ′ дифференцируема на (x0 − R, x0 + R), причем ее производная


является суммой степенного ряда с тем же интервалом сходимости:

X
P ′′ (x) = cn · n · (n − 1) · (x − x0 )n−2 , x ∈ (x0 − R, x0 + R)
n=2

И так далее. Индукцией по k получаем формулу (10.1.18).

Вычисление суммы степенного ряда. Тео- Точно так же, дифференцируя k раз, по индук-
рема 10.1.6 позволяет в некоторых случаях явно ции получаем:
вычислить сумму степенного ряда. Здесь мы по- ∞
кажем на примерах, как это делается. X n! k!
· xn−k = , |x| < 1
Все начинается с формулы для суммы чле- (n − k)! (1 − x)k+1
n=k
нов бесконечной геометрической прогрессии, ко-
(10.1.23)
торую мы выписывали в примере 8.2.1:
Далее, заменив в (10.1.20) x на x2 , мы полу-
X∞ чим
n 1
x = , |x| < 1 (10.1.19) X∞
1−x 1
n=0 (−1)n · x2n = , |x| < 1 (10.1.24)
n=0
1 + x2
Из нее выводится целый ряд других полезных
формул для сумм степенных рядов. Прежде все- Интегрируя (10.1.24) по теореме 10.1.6 (при |x| <
го, заменой x на −x мы получаем тождество 1) мы получаем:

X ∞ ˆ x
X

X 1 x2n+1
n n
(−1) · x = , |x| < 1 (10.1.20) (−1)n · = (−1)n · t2n d t =
1 + x n=0
2n + 1 n=0 0
n=0 ˆ x
dt
= = arctg x
Интегрируя его при |x| < 1 мы получаем 0 1 + t2
То есть

X X∞
n−1 xn xn+1
(−1) · = (−1)n · = ∞
X x2n+1
n=1
n n=0
n+1 (−1)n · = arctg x, |x| < 1
∞ ˆ x
2n + 1
X ˆ x
dt n=0
= (−1)n · tn d t = ln(1 + x) = (10.1.25)
n=0 0 0 1 +t
Полученных формул уже достаточно, чтобы
перейти к решению задач.
То есть,
⋄ 10.1.6. Предположим, нам нужно найти сум-

X xn му степенного ряда
(−1)n−1 · = ln(1 + x), |x| < 1 ∞
n=1
n X xn
(10.1.26)
(10.1.21) n=1
n
Наоборот, дифференцируя (10.1.19) при |x| <
1, получаем: Рецепт решения заключается в том, чтобы сооб-
разить, как этот ряд можно получить из фор-
X∞ мул (10.1.19)-(10.1.25) с помощью операций диф-
1
n · xn−1 = , |x| < 1 (10.1.22) ференцирования, интегрирования, замены пере-
n=1
(1 − x)2 менной и умножения на xk . Для данного ряда
§ 1. Степенные ряды, аналитические последовательности и производящие функции 585

последовательность действий выглядит следую- ⇓


щим образом. Сначала мы выписываем формулу
(10.1.19): Ответ:

X
X∞ x
1 n · xn =
xn = (1 − x)2
n=0
1 − x n=1

Затем меняем в ней индекс n на k − 1: ⋄ 10.1.8. Найти сумму степенного ряда



X ∞
1 X xn
xk−1 = (−1)n ·
1−x 2n + 1
k=1 n=1

После этого интегрируем: Здесь вычисления начинаются с формулы



X xk x ∞
X x (10.1.25), которую мы перепишем с переменной
1
ˆ ˆ
= tk−1 d t = d t = − ln(1−x)t вместо x:
k=1
k 0 k=1 0 1−t
X ∞
n t2n+1
Остается увидеть, что полученный ряд отлича- (−1) · = arctg t
n=0
2n + 1
ется от (10.1.26) только индексом. Если теперь
поменять k на n, то получится
Мы делим ее на t
Ответ:

Xx n

= − ln(1 − x) 1 X t2n+1 arctg t
n · (−1)n · =
n=1 t n=0 2n + 1 t
⋄ 10.1.7. Найти сумму степенного ряда


X
n
n·x X∞
t2n arctg t
n=1 (−1)n · =
n=0
2n + 1 t
Снова выписываем формулу (10.1.19):
Потом делаем замену переменной t2 = x и полу-
X∞
1 чается
xn =
1 − x Ответ:
n=0
X∞ √
Дифференцируем ее: xn arctg x
(−1)n · = √
(∞ )′  ′ n=0
2n + 1 x
X 1
n
x =
1−x ⊲⊲ 10.1.9. Найдите сумму ряда:
n=0 P∞
1. Pn=1 n2 · xn ;
⇓ ∞
2. n=1 2n · xn ;
P x3n
X∞
1 3. ∞ n=1 n ;
n·x n−1
= P ∞ n
(1 − x)2 4. n=1 n+1 · xn ;
n=1 P∞ xn (1+x)
5. Pn=1 ;
Умножаем на x: n
6. ∞ n=1 n · x n
(1 + x);
X∞ P∞ xn (1+xn )
x 7. n=1 ;
x· n · xn−1 = 2
P∞ n
n
n=1
(1 − x) 8. n=1 n · x (1 + xn ).

(b) Аналитические последовательности и производящие функции


• Числовая последовательность {an ; n ∈ Z+ } называется аналитической, если она удовле-
творяет следующим эквивалентным условиям:
P
(i) степенной ряд ∞ n
n=0 an · x имеет ненулевой радиус сходимости:

X
∃r > 0 ряд an · rn сходится (10.1.27)
n=0

(ii) для некоторого числа A > 0 последовательность An мажорирует последователь-


ность |an |:
∀n ∈ Z+ |an | 6 An (10.1.28)
586 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Множество всех аналитических последовательностей обозначается символом A.


P∞
• Радиус сходимости степенного ряда n=0 an · xn называется радиусом сходимости после-
довательности a и обозначается ρ(a):
( ∞
)
X
ρ(a) = sup r > 0 : ряд an · rn сходится
n=0

• Производящей функцией1 или генератриссой Gena аналитической последовательности a ∈


A называется функция, определенная в окрестности нуля (−ρ(a), ρ(a)) формулой

X
Gena (x) := an · xn
n=0

По теореме 10.1.6 эта функция является гладкой на интервале (−ρ(a), ρ(a)).

⋄ 10.1.10. Последовательность ⋄ 10.1.11. Наоборот, последовательность

an = n! 1
an =
n!
не будет аналитической, потому что в силу при-
мера 10.1.1, порождаемый ею ряд будет аналитической, потому что, как мы убеди-
лись в примере 10.1.2, порождаемый ею ряд

X
n! · xn X∞
xn
n=1
n=1
n!
имеет нулевой радиус сходимости. К такому
же выводу можно прийти, используя критерий имеет радиус сходимости R = ∞ (для нас глав-
(10.1.28). ное, что R 6= 0). Критерий (10.1.28) дает то же
самое.

Алгебраические операции с аналитическими последовательностями.


• Если a ∈ A, то есть a = {an ; n ∈ Z+ } – аналитическая последовательность, то противо-
положная последовательность −a определяется формулой

(−a)n := −an

Из (10.1.28) сразу следует, что −a ∈ A.


• Если же a, b ∈ A, то есть a = {an ; n ∈ Z+ } и b = {bn ; n ∈ Z+ } – аналитические последо-
вательности, то их сумма a + b и свертка a ∗ b определяются формулами
n
X
(a + b)n := an + bn , (a ∗ b)n := ak · bn−k
k=0

Сейчас мы покажем, что a + b ∈ A и a ∗ b ∈ A.


Доказательство. В силу (10.1.28), условия a ∈ A и b ∈ A означают, что для некоторых A > 0 и
B > 0 выполняются неравенства

|an | 6 An , |bn | 6 B n (n ∈ Z+ )

Отсюда следует, во-первых,


n
X
|(a + b)n | = |an + bn | 6 |an | + |bn | 6 An + B n 6 Cnk · Ak · B n−k = (A + B)n
k=0
1 Подробнее на эту тему можно прочитать в книжке: С. К. Ландо, Лекции о производящих функциях, М.: МЦНМО,
2007.
§ 1. Степенные ряды, аналитические последовательности и производящие функции 587

то есть последовательность |(a + b)n | мажорируется последовательностью (A + B)n , и значит, по


условию (10.1.28), a + b ∈ A.
И, во-вторых,
n
X n
X n
X n
X
|(a ∗ b)n | = ak · bn−k 6 |ak | · |bn−k | 6 Ak · B n−k 6 Cnk · Ak · B n−k = (A + B)n
k=0 k=0 k=0 k=0

то есть последовательность |(a ∗ b)n | мажорируется последовательностью (A + B)n , и опять в силу


(10.1.28), a ∗ b ∈ A.

Свойства алгебраических операций над аналитическими последовательностями:


1◦ . Операция сложения на множестве A удовлетворяет следующим тождествам:

a + b = b + a, (a + b) + c = a + (b + c), a + 0 = a, a + (−a) = 0 (10.1.29)

где 0 – последовательность, состоящая из нулей:

0n := 0

2◦ . Операция свертки на множестве A удовлетворяет следующим тождествам:

a ∗ b = b ∗ a, (a ∗ b) ∗ c = a ∗ (b ∗ c), a∗1=a (10.1.30)

где 1 – последовательность, у которой на нулевом месте стоит единица, а на осталь-


ных местах нули: (
1, n = 0
1n := (10.1.31)
0, n > 0
3◦ . Операции + и ∗ связаны между собой тождеством дистрибутивности:

(a + b) ∗ c = a ∗ c + b ∗ c (10.1.32)

4◦ . Производящая функция суммы равна сумме производящих функций,

Gena+b (x) = Gena (x) + Genb (x), (10.1.33)

причем ρ(a + b) > min{ρ(a), ρ(b)}.



5 . Производящая функция свертки равна произведению производящих функций,

Gena∗b (x) = Gena (x) · Genb (x), (10.1.34)

причем ρ(a ∗ b) > min{ρ(a), ρ(b)}.


Для доказательства нам понадобится следующая
P P∞
Лемма 10.1.8. Пусть ∞ k=0 uk и l=0 vl – два абсолютно сходящихся ряда. Положим
n
X
wn = uk · vn−k
k=0
P∞ P∞
Тогда
P∞ ряд n=0 wn абсолютно сходится, и его сумма равна произведению сумм рядов k=0 uk и
l=0 vl :

∞ N X
n N
! N
! ∞
! ∞
!
X X X X X X
wn = lim uk · vn−k = lim uk · lim vl = uk · vl (10.1.35)
N →∞ N →∞ N →∞
n=0 n=0 k=0 k=0 l=0 k=0 l=0

Доказательство. Для всякого N ∈ N получаем:

N
X N X
X n N X
X n X X
|wn | 6 uk · vn−k 6 |uk | · |vn−k | = |uk | · |vl | 6 |uk | · |vl | =
n=0 n=0 k=0 n=0 k=0 k+l6N max{k,l}6N
| {z }
k+l6N =⇒ max{k,l}6N
588 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

N X
N N
! N
! ∞
! ∞
!
X X X X X
= |uk | · |vl | = |uk | · |vl | 6 |uk | · |vl | <∞
k=0 l=0 k=0 l=0 k=0 l=0
P∞
Отсюда следует, что ряд n=0 wn абсолютно сходится. С другой стороны, снова для любого N ∈ N
имеем:
2N N
! N
! 2N X
n N X
N
X X X X X
wn − uk · vl = uk · vn−k − uk · vl =
n=0 k=0 l=0 n=0 k=0 k=0 l=0
X X X X
= uk · vl − uk · vl = uk · vl 6 |uk | · |vl | 6
   
k+l62N max{k,l}6N k + l 6 2N k + l 6 2N
| {z } max{k, l} > N max{k, l} > N
k+l62N ⇐= max{k,l}6N
X X X X
6 |uk | · |vl | = |uk | · |vl | = |uk | · |vl | + |uk | · |vl | =
 
max{k, l} 6 2N N <max{k,l}62N 06k6N N < k 6 2N
max{k, l} > N N < l 6 2N 0 6 l 6 2N
       
X X X X
= |uk | ·  |vl | +  |uk | ·  |vl | =
06k6N N <l62N N <k62N 06l6N

! ! ! ∞
!
X X X X
= |uk | · |vl | + |uk | · |vl | −→ 0
N →∞
k=0 l>N k>N l=0
| {z } | {z } | {z } | {z }
↓ ↓
<

<
∞ 0, 0, ∞
при N → ∞ при N → ∞

И поэтому
∞ 2N
" N
! N
!# ∞
! ∞
!
X X X X X X
wn = lim wn = lim uk · vl = uk · vl
N →∞ N →∞
n=0 n=0 k=0 l=0 k=0 l=0

Доказательство свойств 1◦ -5◦ . Свойство 1◦ мы считаем очевидным и сразу переходим к 2◦ . Ком-


мутативность свертки:
n
X X n
n − k = i, k = n − i
(a ∗ b)n = ak · bn−k = = an−i · bi = (b ∗ a)n
06k6n ⇔ 06i6n
k=0 i=0

Ассоциативность свертки:

n n k
!
X X X X
((a ∗ b) ∗ c)n = (a ∗ b)k · cn−k = ai · bk−i · cn−k = ai · bk−i · cn−k =
k=0 k=0 i=0 06k6n
06i6k
n n
!
X X X k − i = j, k =i+j
= ai · bk−i · cn−k = ai · bk−i · cn−k = =
i6k6n ⇔ 06j 6n−i
06i6n i=0 k=i
i6k6n
 
n
X Xn−i n
X
= ai ·  bj · cn−i−j  = ai · (b ∗ c)n−i = (a ∗ (b ∗ c))n
i=0 j=0 i=0

Единица относительно свертки:


n
X X
(a ∗ 1)n = ak · 1n−k = ak · 1 = an
| {z }
k=0 k=n
=

(
1, k=n
0, k 6= n
§ 1. Степенные ряды, аналитические последовательности и производящие функции 589

Остается свойство дистрибутивности 3◦ :


n
X n
X n
X n
X
((a + b) ∗ c)n = (a + b)k · cn−k = (ak + bk ) · cn−k = ak · cn−k + bk · cn−k = (a ∗ c)n + (b ∗ c)n
k=0 k=0 k=0 k=0

4. Если |x| < min{ρ(a), ρ(b)}, то


X X
Gena+b (x) = lim (a + b)n · xn = lim (an + bn ) · xn =
N →∞ N →∞
n6N n6N
 
X X ∞
X ∞
X
= lim  an · xn + bn · xn  = an · xn + bn · xn = Gena (x) + Genb (x)
N →∞
n6N n6N n=0 n=0

Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.
5. Если |x| < min{ρ(a), ρ(b)}, то

n
!
X X X
n
Gena∗b (x) = lim (a ∗ b)n · x = lim ak · bn−k · xn =
N →∞ N →∞
n6N n6N k=0
n ∞
! ∞
!
X X   X X
k n−k k l
= lim ak · x · bn−k · x = (10.1.35) = ak · x · bl · x = Gena (x) · Genb (x)
N →∞
n6N k=0 k=0 l=0

Это верно для любого x такого, что |x| < min{ρ(a), ρ(b)}, поэтому ρ(a + b) > min{ρ(a), ρ(b)}.

Порядок аналитической последовательности.


• Порядком аналитической последовательности b ∈ A называется число

ω(a) = min{n ∈ Z+ : an 6= 0}

Теорема 10.1.9. Справедливо неравенство:

ω(a ∗ b) > ω(a) + ω(b) (10.1.36)

Доказательство. Справедлива логическая цепочка:


n
X
(a ∗ b)n = ak · bn−k 6= 0
k=0


∃k ∈ {0, ..., n} ak · bn−k 6= 0

(
ak 6= 0
∃k ∈ {0, ..., n}
bn−k 6= 0

(
k > ω(a)
∃k ∈ {0, ..., n}
n − k > ω(b)

(
k > ω(a)
∃k ∈ {0, ..., n}
n > ω(b) + k > ω(b) + ω(a)

n > ω(b) + ω(a)
Из нее получаем: 
ω(a ∗ b) = min n ∈ Z+ : (a ∗ b)n 6= 0 > ω(b) + ω(a)
590 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Сравнение аналитических последовательностей.


• Неравенство a 6 b для последовательностей a, b ∈ A означает, что каждая компонента a
не превосходит соответствующую компоненту b:

a6b ⇐⇒ ∀n ∈ Z+ an 6 b n

Предложение 10.1.10. Производящая функция сохраняет неравенства для неотрицательных


аргументов:
a6b =⇒ ∀r ∈ (0, ρ(b)) Gena (r) 6 Genb (r) (10.1.37)

X ∞
X
Доказательство. Gena (r) = an · r n 6 bn · rn 6 Genb (r).
n=0 n=0
| {z }
an 6bn

Модуль аналитической последовательности.


• Модулем последовательности a ∈ A называется последовательность |a| ∈ A, определенная
формулой:
|a|n := |an | (10.1.38)
Очевидно, последовательность a = {an ; n ∈ Z+ } является аналитической тогда и только
тогда, когда ее модуль |a| = {|an |; n ∈ Z+ } является аналитической последовательностью:

a∈A ⇐⇒ |a| ∈ A (10.1.39)

Свойства модуля аналитической последовательности:



1 . Модуль суммы не превосходит суммы модулей:

|a + b| 6 |a| + |b| (10.1.40)

2◦ . Модуль свертки не превосходит свертки модулей:

|a ∗ b| 6 |a| ∗ |b| (10.1.41)

3◦ . Радиус сходимости модуля совпадает с радиусом сходимости исходной последователь-


ности:
ρ(|a|) = ρ(a) (10.1.42)
а производящие функции удовлетворяют неравенству:

| Gena (x)| 6 Gen|a| (|x|) (10.1.43)

Доказательство. Первые два свойства мы считаем очевидными, и перейдем сразу к 3◦ . В нем


неравенство (10.1.43) тоже очевидно

X ∞
X
| Gena (x)| = an · xn 6 |an | · |x|n = Gen|a| (|x|)
n=0 n=0

А равенство (10.1.42) доказывается двукратным применением логической цепочки Абеля (см. с.576).
С одной стороны,
0 < r < ρ(a)


X
числовой ряд an · rn сходится
n=0


общий член стремится к нулю: an · rn −→ 0
n→∞


§ 1. Степенные ряды, аналитические последовательности и производящие функции 591

последовательность an · rn ограничена: sup |an · rn | = M < ∞


n∈Z+


σ n σ n  σ 
∀σ ∈ (0, r) =⇒ |an | · σ n = |an · rn | · 6M· <1
r r r


X
для всякого σ ∈ (0, r) числовой ряд |an | · σ n сходится
n=0



X
радиус сходимости ряда |an | · xn не меньше r
n=0

ρ(|a|) > r ← верно для любого r ∈ (0, ρ(a))

ρ(|a|) > ρ(a)


А с другой стороны,
0 < r < ρ(|a|)



X
числовой ряд |an | · rn сходится
n=0

общий член стремится к нулю: |an | · rn −→ 0


n→∞

последовательность |an | · rn ограничена: sup |an | · rn = M < ∞


n∈Z+


σ n σ n  σ 
∀σ ∈ (0, r) =⇒ |an · σ n | = |an · rn | · 6M· <1
r r r


X
для всякого σ ∈ (0, r) числовой ряд an · σ n сходится
n=0



X
радиус сходимости ряда an · xn не меньше r
n=0

ρ(a) > r ← верно для любого r ∈ (0, ρ(|a|))

ρ(a) > ρ(|a|).


592 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Степень аналитической последовательности.


• Степень bk аналитической последовательности b ∈ A определяется индуктивно правила-
ми
b0 = 1, bk+1 = bk ∗ b, k ∈ Z+
(здесь 1 – единичная последовательность, определенная равенством (10.1.31)).

Свойства степени:
1◦ . Модуль степени не превосходит степени модуля:

|bk | 6 |b|k (10.1.44)

2◦ . Производящая функция степени равна степени производящей функции:


 k
Genbk (x) = Genb (x) (10.1.45)

3◦ . Порядок и степень аналитической последовательности связаны неравенством:

∀k ∈ Z+ ω(bk ) > k · ω(b) (10.1.46)

Доказательство. Свойство 1◦ следует из (10.1.41), 2◦ – из (10.1.34), а 3◦ – из (10.1.36) .

Композиция аналитических последовательностей.


• Пусть порядок аналитической последовательности b ∈ A отличен от нуля, то есть не
меньше единицы:
ω(b) > 1.
Тогда по формуле (10.1.46), порядок ее степени не меньше показателя степени:

ω(bk ) > k, k ∈ Z+ .

То есть
∀n < k (bk )n = 0
и это можно интерпретировать так, что при фиксированном номере n ∈ Z почти все числа
(bk )n ; k ∈ Z+ равны нулю:

∀n ∈ Z+ ∀k > n (bk )n = 0 (10.1.47)

Отсюда
P∞ следует, что для любой последовательности a ∈ A и любого n ∈ Z+ в ряде
k
k=0 ak · (b )n только первые n элементов (с индексами k = 1, ..., n) могут быть отличны
от нуля, поэтому он сходится. Его сумма обозначается (a ◦ b)n :

X n
X
(a ◦ b)n = ak · (bk )n = ak · (bk )n (10.1.48)
k=0 k=0

Эта формула определяет некую последовательность


n o
a ◦ b = (a ◦ b)n ; n ∈ Z+ ,

называемую композицией последовательностей a и b. Более коротко ее определение мож-


но записать формулой:

X n
X
a◦b= ak · b k = ak · b k . (10.1.49)
k=0 k=0

Теорема 10.1.11. Композиция аналитических последовательностей тоже является аналити-


ческой последовательностью:

a, b ∈ A & ω(b) > 1 =⇒ a◦b∈A (10.1.50)


§ 1. Степенные ряды, аналитические последовательности и производящие функции 593

Доказательство. Пусть a, b ∈ A и ω(b) > 1. Выберем ε ∈ (0, ρ(|a|)), то есть ε > 0 такое, что

X
Gen|a| (ε) = |an | · εm < ∞
n=0

Условие ω(b) > 1 означает, что b0 = 0, поэтому производящая функция последовательности |b| имеет
вид

X ∞
X
m
Gen|b| (x) = |bm | · x = |bm | · xm
m=0 m=1

Отсюда в свою очередь следует, что


Gen|b| (0) = 0
и, поскольку Gen|b| – непрерывная функция, существует δ > 0 такое, что

| Gen|b| (δ)| < ε

Теперь получаем:
∀k ∈ Z+ |bk | 6 |b|k (10.1.44)

⇓ (10.1.37)

 k
∀k ∈ Z+ Gen|bk | (δ) 6 Gen|b| (δ) < εk

∀K, N ∈ Z+ , K>N =⇒
N
X N
X K
X N X
X K K X
X N
|(a ◦ b)n | · δ n = ak · (bk )n · δ n 6 |ak | · |(bk )n | · δ n = |ak | · |(bk )n | · δ n =
n=0 n=0 k=0 n=0 k=0 k=0 n=0
K
X N
X K
X ∞
X K
X K
X ∞
X
= |ak | · |(bk )n | · δ n 6 |ak | · |(bk )n | · δ n = |ak | · Gen|bk |(δ) < |ak | · εk 6 |ak | · εk =
k=0 n=0 k=0 n=0 k=0 k=0 k=0
| {z }
Gen|bk |(δ)

= Gen|a| (ε) < ∞



X
Gen|a◦b| (δ) = |(a ◦ b)n | · δ n 6 Gen|a| (ε) < ∞
n=0

Это означает, что |a ◦ b| ∈ A, и по свойству (10.1.39), a ◦ b ∈ A.

Свойства композиции:

1◦ . Модуль композиции аналитических последовательностей не превосходит композиции


модулей:
|a ◦ b| 6 |a| ◦ |b| (10.1.51)
2◦ . Выполняется следующее правило дистрибутивности:

(a + b) ◦ c = a ◦ c + b ◦ c (10.1.52)

3◦ . Производящая функция композиции аналитических последовательностей равна компо-


зиции производящих функций в некоторой окрестности нуля:

∃δ > 0 ∀x ∈ (−δ, δ) Gena◦b (x) = (Gena ◦ Genb )(x) (10.1.53)


594 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Доказательство. Свойство 1◦ доказывается цепочкой:

n
X n
X
k
|a ◦ b|n = (10.1.38) = |(a ◦ b)n | = (10.1.48) = ak · (b )n 6 |ak | · |(bk )n | = (10.1.38) =
k=0 k=0
n
X n
X
= |a|k · |bk |n 6 (10.1.44) 6 |a|k · (|b|k )n = (10.1.48) = (|a| ◦ |b|)n
k=0 k=0

Свойство 2◦ :
n
X n
X
((a + b) ◦ c)n = (10.1.48) = (a + b)k · (ck )n = (ak + bk ) · (ck )n =
k=0 k=0
n
X n
X
= ak · (ck )n + bk · (ck )n = (10.1.48) = (a ◦ c)n + (b ◦ c)n = (a ◦ c + b ◦ c)n
k=0 k=0

Свойство 3◦ мы сначала докажем для случая, когда a – финитная последовательность, то есть


такая, у которой почти все элементы равны нулю:

sup{k ∈ Z+ : ak 6= 0} = K < ∞ (10.1.54)

В этом случае для всякого x ∈ (−ρ(b), ρ(b)) мы получим:


X ∞ X
X ∞ ∞ X
X K
Gena◦b (x) = (a ◦ b)n · xn = ak · (bk )n · xn = (10.1.54) = ak · (bk )n · xn =
n=0 n=0 k=0 n=0 k=0
K
X ∞
X K
X K
X  k
= ak · (bk )n · xn = ak · Genbk (x) = (10.1.45) = ak · Genb (x) =
k=0 n=0 k=0 k=0
| {z }
Genbk (x)

X  k  
= ak · Genb (x) = Gena Genb (x)
k=0

После этого рассматривается общий случай. Для любой последовательности a ∈ A и для всякого
N ∈ Z+ обозначим через PN a последовательность, определенную формулой
(
ak , k 6 K
(PK a)k =
0, k>K

Это будет финитная последовательность, поэтому по уже доказанному,


 
GenPK a◦b (x) = GenPK a Genb (x) , x ∈ (−ρ(b), ρ(b)) (10.1.55)

Зафиксируем ε > 0 такое, что Gen|a| (ε) < ∞, и подберем δ > 0 такое, что | Gen|b| (δ)| < ε. Покажем,
что при x ∈ (−δ, δ) и K → ∞ равенство (10.1.55) превращается в (10.1.53):
 
GenPK a◦b (x) = GenPK a Genb (x) , x ∈ (−δ, δ) (10.1.56)
| {z } | {z }
(K → ∞) ↓
↓ (K → ∞)
Gena◦b (x)
Gena◦b (x)

– это и будет доказательством для (10.1.53) в общем случае.


Предельный переход справа в (10.1.56) очевиден:
K
X ∞
X
GenPK a (y) = ak · y k −→ ak · y k = Gena (y), y ∈ (−ε, ε)
K→∞
k=0 k=0


   
GenPK a Genb (x) −→ Gena Genb (x) , x ∈ (−δ, δ)
K→∞
§ 2. Ряд Тейлора и аналитические функции 595

Докажем левый предельный переход. Для этого заметим прежде всего, что
(
0, k6K
ak − (PK a)k = (10.1.57)
ak , k > K

Тогда для всякого x ∈ (−δ, δ) мы получим:

|Gena◦b (x) − GenPK a◦b (x)| = (10.1.33) = |Gena◦b−PK a◦b (x)| = (10.1.52) = Gen(a−PK a)◦b (x) 6 (10.1.43) 6

X ∞ X
X ∞
n
6 Gen|(a−PK a)◦b| (|x|) 6 Gen|a−PK a|◦|b| (|x|) = (|a−PK a|◦|b|)n ·|x| = |a−PK a|k ·(|b|k )n ·|x|n =
n=0 n=0 k=0
∞ X
X ∞ ∞
X ∞
X
= |ak − (PK a)k | · (|b|k )n · |x|n = (10.1.57) = |ak | · (|b|k )n · |x|n =
n=0 k=0 n=0 k=K+1

X ∞
X ∞
X ∞
X  k
= |ak | · (|b|k )n · |x|n = |ak | · Gen|b|k (|x|) 6 |ak | · Gen|b| (|x|) 6
k=K+1 n=0 k=K+1 k=K+1

X  k ∞
X
6 |ak | · Gen|b| (δ) 6 |ak | · εk −→ 0,
K→∞
k=K+1 k=K+1
P∞
потому что k=0 |ak | · εk = Gen|a| (ε) < ∞. Отсюда уже следует нужное нам соотношение

GenPK a◦b (x) −→ Gena◦b (x), x ∈ (−δ, δ)


K→∞

§2 Ряд Тейлора и аналитические функции


(a) Формулы Тейлора
Теорема об остатке.
• Функция f называется
— дифференцируемой порядка n на интервале (a, b), если на (a, b) она имеет про-
изводные до порядка n включительно, то есть существует конечная последова-
тельность функций f0 , f1 , ..., fm на (a, b) таких, что

f0 = f,

и для всякого k = 0, ..., n − 1 функция fk дифференцируема на (a, b) и ее произ-


водная равна fk+1 :
fk′ = fk+1 , k < n.
Теорема 10.2.1. Пусть нам даны:
1) функция f , дифференцируемая порядка n + 1 на отрезке [a, b], и
2) функция g, непрерывная на отрезке [a, b], и имеющая внутри этого отрезка ненулевую
производную:
∀t ∈ (a, b) g ′ (t) 6= 0
Тогда найдутся:
– точка ζ ∈ (a; b), для которой будет справедливо равенство:
n
X f (k) (a) g(b) − g(a) (n+1)
f (b) = · (b − a)k + ·f (ζ) · (b − ζ)n (10.2.58)
k! g ′ (ζ) · n!
k=0

– точка η ∈ (a; b), для которой будет справедливо равенство:


n
X f (k) (b) g(a) − g(b) (n+1)
f (a) = · (a − b)k + ·f (η) · (a − η)n (10.2.59)
k! g ′ (η) · n!
k=0
596 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

! 10.2.1. Формулы (10.2.58) и (10.2.59) можно объединить в одну, усложнив формулировку тео-
ремы следующим образом:
 пусть x0 и xобозначают концы отрезка [a, b], причем возможны оба
x0 = a x=a
варианта, как , так и ; тогда найдется точка ξ ∈ (a; b) такая, что
x=b x0 = b
n
X f (k) (x0 ) g(x) − g(x0 ) (n+1)
f (x) = · (x − x0 )k + ·f (ξ) · (x − ξ)n (10.2.60)
k! g ′ (ξ) · n!
k=0
   
x0 = a x=a
В такой формулировке случай превращает формулу (10.2.60) в (10.2.58), а при
x=b x0 = b
формула (10.2.60) превращается в (10.2.59).

Доказательство. 1. Для доказательства (10.2.58) рассмотрим вспомогательную функцию


n
X f (k) (t)
F (t) = f (b) − · (b − t)k
k!
k=0

Применим к паре функций F и g теорему Коши об отношении приращений 5.1.8: должна существо-
вать точка ζ ∈ (a; b) такая, что
F (b) − F (a) F ′ (ζ)
= ′
g(b) − g(a) g (ζ)
Или, иначе
g(b) − g(a)
F (b) − F (a) = · F ′ (ζ) (10.2.61)
g ′ (ζ)
Выразим в этой формуле F через f . Во-первых,
n
X n
X
f (k) (b) f (k) (b) f (0) (b)
F (b) = f (b) − · (b − b)k = f (b) − 0k = f (b) −
· |{z} =0
k! k! 0! }
| {z
k=0 k=0 k
(
0, при k > 0 k
f (b)
0, при k = 0

Во-вторых,
n
X f (k) (a)
F (a) = f (a) − · (b − a)k
k!
k=0

И, в-третьих,

n
! n
!
∂ X f (k) (t) ∂ X f (k) (t)
′ k k
F (t) = f (b) − · (b − t) = f (b) − f (t) − · (b − t) =
∂t k! ∂t k!
k=0 k=1
X n  
∂ f (k) (t)
′ k
= 0 − f (t) − · (b − t) =
∂t k!
k=1
Xn    
∂ f (k) (t) f (k) (t) ∂ 
= −f ′ (t) − · (b − t)k + · (b − t)k =
∂t k! k! ∂t
k=1
Xn  (k+1) 
f (t) f (k) (t)
= −f ′ (t) − · (b − t)k + · k · (b − t)k−1 · (−1) =
k! k!
k=1
n
X X n
f (k+1) (t) f (k) (t)
= − f ′ (t) − · (b − t)k + · (b − t)k−1 =
| {z } k! (k − 1)!
k=1 k=1
k | {z }
f (1) (t) заменяем k − 1 на i
0! · (b − t)0
| {z }
объединяем в одну сумму
n
X n−1
X
f (k+1) (t) f (i+1) (t)
=− · (b − t)k + · (b − t)i =
k! i=0
i!
k=0
| {z }
отщепляем последнее слагаемое
§ 2. Ряд Тейлора и аналитические функции 597

n−1
X f (k+1) (t) n−1
X f (i+1) (t)
f (n+1) (t) f (n+1) (t)
=− · (b − t)n − · (b − t)k + · (b − t)i = − · (b − t)n
n! k! i=0
i! n!
k=0
| {z }
сокращаем

Подставляя ζ вместо t получим:

f (n+1) (ζ)
F ′ (ζ) = − · (b − ζ)n
n!
Теперь подставим полученные выражения в (10.2.61):
n
!  
X f (k) (a) g(b) − g(a) f (n+1) (ζ)
k n
0 − f (a) − · (b − a) = · − · (b − ζ)
k! g ′ (ζ) n!
k=0

Убрав минус в обеих частях, получим равенство, эквивалентное (10.2.58):


n
X f (k) (a) g(b) − g(a) f (n+1) (ζ)
f (a) − · (b − a)k = · · (b − ζ)n
k! g ′ (ζ) n!
k=0

2. Для доказательства (10.2.59) нужно рассмотреть другую вспомогательную функцию:


n
X f (k) (t)
F (t) = f (a) − · (a − t)k
k!
k=0

Тогда
n
X f (k) (b)
F (b) = f (a) − · (a − b)k
k!
k=0
n
X f (k) (a)
F (a) = f (a) − · (a − a)k = 0
k!
k=0

f (n+1) (t)
F ′ (t) = − · (a − t)n
n!
И при подстановке в (10.2.61) получается равенство, эквивалентное (10.2.59):
Xn  
f (k) (b) g(b) − g(a) f (n+1) (ζ)
f (a) − · (a − b)k − 0 = · − · (a − ζ)n
k! g ′ (ζ) n!
k=0

Формула Тейлора с остаточным членом в форме Лагранжа.


Теорема 10.2.2 (Тейлор-Лагранж). Пусть функция f определена и дифференцируема n + 1 раз
на интервале (a, b). Тогда для любых дух точек x0 , x ∈ (a, b) найдется точка ξ, лежащая между
ними (то есть ξ ∈ (x0 , x), если x0 < x, и ξ ∈ (x, x0 ), если x < x0 ) такая, что выполняется
равенство

n
X f (k) (x0 ) f (n+1) (ξ) (10.2.62)
f (x) = · (x − x0 )k + · (x − x0 )n+1
k! (n + 1)!
k=0

• Равенство (10.2.62) называется формулой Тейлора с остаточным членом в форме Лагран-


жа порядка n для функции f в точке x0 .
Доказательство. Этот факт следует из теоремы 10.2.1, если в ней выбрать в качестве g функцию

g(t) = (x − t)n+1
598 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Формула Тейлора с остаточным членом в форме Коши.

Теорема 10.2.3 (Тейлора-Коши). Пусть функция f определена и дифференцируема n + 1 раз на


интервале (a, b). Тогда для любых дух точек x0 , x ∈ (a, b) найдется точка ξ, лежащая между
ними (то есть ξ ∈ (x0 , x), если x0 < x, и ξ ∈ (x, x0 ), если x < x0 ) такая, что выполняется
равенство

n
X f (k) (x0 ) f (n+1) (ξ) (10.2.63)
f (x) = · (x − x0 )k + · (x − ξ)n · (x − x0 )
k! n!
k=0

• Равенство (10.2.63) называется формулой Тейлора с остаточным членом в форме Коши


порядка n для функции f в точке x0 :

Доказательство. Это следует из теоремы 10.2.1, если в ней выбрать в качестве g функцию

g(t) = x − t

Дифференциал функции и запись формулы Тейлора с его помощью.


• Дифференциалом k-го порядка функции f : R ֒→ R в точке x называется функция
p 7→ d f (x)[p] от нового переменного p ∈ R, которая в каждой точке p ∈ R определяется
равенством:
dk f (x)[p] = f (k) (x) · pk (10.2.64)
В частности, дифференциал нулевого порядка описывается формулой

d0 f (x)[p] = f (x) (10.2.65)

(и поэтому не зависит от p), а дифференциал первого порядка формулой

d f (x)[p] = f ′ (x) · p. (10.2.66)

(и поэтому линейно зависит от p).


Следующий факт следует из теоремы 10.2.2:

Теорема 10.2.4. Справедлива следующая модификация формулы Тейлора-Лагранжа (10.2.62):


m
X 1 1
f (x + p) = · dk f (x)[p] + · dm+1 f (x + θ · p)[p], θ ∈ [0, 1] (10.2.67)
k! (m + 1)!
k=0

(b) Ряд Тейлора


Формулы Тейлора (10.2.62)-(10.2.63)-(6.2.35) подсказывают следующую конструкцию.
• Если f – гладкая функция на интервале (a, b), то любой точке x0 ∈ (a, b) можно поставить
в соответствие степенной ряд

X∞
f (n) (x0 )
· (x − x0 )n (10.2.68)
n=0
n!

Этот ряд называется рядом Тейлора функции f в точке x0 .


• В частном случае, когда x0 = 0 ряд Тейлора называется рядом Маклорена:

X∞
f (n) (0) n
·x (10.2.69)
n=0
n!
§ 2. Ряд Тейлора и аналитические функции 599

От ряда Тейлора естественно ожидать, что он будет сходиться к порождающей его функции
f хотя бы в некоторой окрестности (x0 − δ; x0 + δ) точки x0 , то есть что выполняется следующее
тождество, называемое разложением Тейлора функции f в окрестности (x0 − δ; x0 + δ):
X∞
f (n) (0)
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (10.2.70)
n=0
n!

В частном случае, когда x0 = 0, оно называется разложением Маклорена (в окрестности (−δ; δ)):
X∞
f (n) (0) n
f (x) = ·x , x ∈ (−δ; δ) (10.2.71)
n=0
n!

Часто так и бывает (мы приведем примеры такого рода на с.600). Но не всегда. В следующих
примерах мы увидим, что ряд Тейлора функции f необязательно сходится, а если сходится, то его
сумма необязательно совпадает с функцией f .

Контрпримеры. Поскольку на левой полупрямой эта функция ну-


⋄ 10.2.2. Ряд Маклорена, расходящийся левая, в точке 0 все ее производные равны нулю,
везде, кроме точки 0. Рассмотрим последова- поэтому ряд Маклорена будет нулевой:
тельность
0
an = (n!)2 k
z }| {
По теореме Бореля 9.1.13 существует гладкая X∞ ∞
f (n) (0) n X
функция f на R такая, что ·x = 0 · xn
n=0
n! n=0
∀n ∈ Z+ f (n) (0) = an = (n!)2
Ее ряд Маклорена имеет вид Сумма такого ряда, понятное дело, тоже будет
∞ ∞ ∞ нулевой,
X f (n) (0) n X (n!)2 n X
·x = ·x = n! · xn X∞
f (n) (0) n
n=0
n! n=0
n! n=0 ·x =0
n=0
n!
В примере 10.1.1 мы уже рассматривали такой
степенной ряд, и поняли, что он сходится только
и поэтому она не может совпадать с f ни на ка-
в точке 0.
ком интервале (−δ, +δ): тождество
⋄ 10.2.3. Ряд Маклорена сходящийся всю-
ду, но не к порождающей его функции. X∞
f (n) (0) n
Рассмотрим функцию из примера 9.1.35, то есть · x = 0 = f (x), x ∈ (−δ, +δ),
n!
гладкую на R функцию f со свойствами: n=0
(
f (x) = 0, x 6 0 невозможно потому что при x > 0 функция f
f (x) > 0, x > 0 отлична от нуля.

Всякий сходящийся степенной ряд есть ряд Тейлора своей суммы. Несмотря на отме-
ченное нами нерегулярное поведение ряда Тейлора, эта конструкция оказывается центральным
примером в теории степенных рядов из-за следующей теоремы:
Теорема 10.2.5. Если функция f является суммой какого-то степенного ряда в некоторой окрест-
ности его центра

X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ, x0 + δ), (10.2.72)
n=0

то этот степенной ряд является рядом Тейлора функции f в точке x0 :

f (n) (x0 )
cn =
n!
Доказательство. В силу следствия 10.1.7, функция f является гладкой на интервале (x0 −δ, x0 +δ),
и по формуле (10.1.18),
600 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ


X n!
f (k) (x) = · cn · (x − x0 )n−k =
(n − k)!
n=k
k! (k + 1)! (k + 2)!
= · ck · (x − x0 )0 + · ck+1 · (x − x0 )1 + · ck+2 · (x − x0 )2 + ... =
(k − k)! (k + 1 − k)! (k + 2 − k)!
(k + 1)! (k + 2)!
= k! · ck + · ck+1 · (x − x0 ) + · ck+2 · (x − x0 )2 + ..., x ∈ (x0 − R, x0 + R)
1! 2!
Подставив сюда x = x0 , получим

(k + 1)! (k + 2)!
f (k) (x0 ) = k! · ck + · ck+1 · 0 + · ck+2 · 0 + ... = k! · ck
1! 2!
f (k) (x0 )
То есть, ck = k!
P
! 10.2.4. Из этой теоремы следует, что если степенной ряд ∞ n
n=0 cn · (x − x0 ) сходится хотя бы в
одной точке x, отличной от его центра x0 , то автоматически
P∞ он является рядом Тейлора для неко-
торой функции f , а именно, для своей суммы f (x) = n=0 cn · (x − x0 )n (которая будет определена
как минимум в окрестности точки x0 радиуса δ = |x − x0 |).

Сходимость ряда Тейлора. Обсудим теперь, когда все-таки ряд Тейлора сходится к порожда-
ющей его функции. Удобное достаточное условие для этого выглядит так:
Предложение 10.2.6. Пусть функция f определена в δ-окрестности некоторой точки x0 , бес-
конечно гладкая на (x0 − δ; x0 + δ), и имеет ограниченные в совокупности производные:

sup sup |f (n) (x)| = M < ∞ (10.2.73)


n∈Z+ x∈(x0 −δ;x0 +δ)

Тогда на интервале (x0 − δ; x0 + δ) функция f удовлетворяет тождеству:

X∞
f (n) (x0 )
f (x) = · (x − x0 )n (10.2.74)
n=0
n!

Доказательство. Выпишем формулу Тейлора-Лагранжа (10.2.62) для f : для любой точки x ∈


(x0 − δ; x0 + δ) найдется точка ξ, лежащая между x0 и x, такая что выполняется равенство
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) = · (x − x0 )k + · (x − x0 )n+1
k! (n + 1)!
k=0

Из него мы получаем:
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) − · (x − x0 )k = · (x − x0 )n+1
k! (n + 1)!
k=0


n
X f (k) (x0 ) f (n+1) (ξ) δn
f (x) − · (x − x0 )k = · (x − x0 )n+1 6 M · −→ 0
k! (n + 1)! (n + 1)! n→∞
k=0


n
X f (k) (x0 )
· (x − x0 )k −→ f (x)
k! n→∞
k=0

Стандартные разложения Маклорена. справедливы в интервале |x| < 1:

1
⋄⋄ 10.2.5. Следующие разложения Маклорена = 1 + x + x2 + ... + xk + ... =
1−x
§ 2. Ряд Тейлора и аналитические функции 601


X
= xn , (10.2.75) 
|1 + ξ|α−1 6 max (1 − |x|)α−1 ; (1 + |x|)α−1
n=0
(10.2.82)
1
= 1 − x + x2 + ... + (−1)k · xk + ... = И, во-вторых,
1+x

X |x − ξ| |x| − |ξ| 1 − |ξ| − (1 − |x|)
= (−1)n · xn (10.2.76) 6 = =
n=0 |1 + ξ| 1 − |ξ| 1 − |ξ|
x2 x3 xk 1 − |x| 1 − |x|
ln(1 + x) = x − + + ... + (−1)k · + ... = =1− 61− = |x| (10.2.83)
2 3 k 1 − |ξ| 1−0
X∞
xn
= (−1)n−1 · (10.2.77) Теперь остаток ряда Маклорена можно оценить
n=1
n так:
1
= 1 − x2 + x4 + ... + (−1)k · x2k + ... = n
X f (k) (0)
1 + x2 f (x) − · xk = (10.2.81) =
X∞ k!
k=0
= (−1)n · x2n (10.2.78)
f (n+1) (ξ)
n=0
= · (x − ξ)n · x =
x3 x5 x2k+1 n!
arctg x = x − + − ... + (−1)k · +
3 5 2k + 1 α(α − 1)...(α − n) · (1 + ξ)α−n−1

= ·
X x2n+1 n!
+ ... = (−1)n · (10.2.79)
2n + 1 · |x − ξ|n · |x| =
n=0  α  α
x2 = α 1− ... 1 − ·
(1 + x)α = 1 + α · x + α(α − 1) · + ... 2 n
2!
· |1 + ξ|α−n−1 · |x − ξ|n · |x| =
xk 
... + α(α − 1)...(α − k + 1) · + ... = α  α
k! = α 1− ... 1 − ·
∞ 2
 nn
X xn
=1+ α(α − 1)...(α − n + 1) · |x − ξ|
n! · |1 + ξ|α−1 · · |x| 6
n=1 |1 + ξ|
(10.2.80) 6 (10.2.82), (10.2.83) 6
 α  α
Доказательство. Тождества (10.2.75)-(10.2.79) 6 α 1− ... 1 − ·
 2 n
мы уже доказали на с.584, поэтому их доказы-
вать нет необходимости, нужно только заметить, · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1
что в силу теоремы 10.2.5 они будут разложени-
Обозначим последнюю величину Mn
ями Маклорена (поскольку центром ряда здесь
будет точка 0).  α  α
Таким образом, интерес в этом списке пред- Mn = α 1 − ... 1 − ·
 2 n
ставляет лишь формула (10.2.80). Для ее доказа- · max (1 − |x|)α−1 ; (1 + |x|)α−1 · |x|n+1 .
тельства заметим, что функция f (x) = (1 + x)α
имеет производные Нам нужно показать, что Mn стремится к нулю
при n → ∞. Зафиксируем какое-нибудь число q
f (n) (x) = α(α − 1)...(α − n + 1) · (1 + x)α−n такое, что
|x| < q < 1
Применим к этой функции теорему Тейлора-
Коши 10.2.3: для любого x ∈ (−1, 1) и любого (такое q найдется, поскольку |x| < 1). Теперь мы
n ∈ N найдется точка ξ, лежащая между 0 и x получаем:
такая, что α
1− −→ 1
n + 1 n→∞
X n
f (k) (0) k ⇓
f (x) = ·x +
k! Mn+1 α
k=0
= 1− · |x| −→ |x| < q
f (n+1) (ξ) n
M n n + 1 n→∞
+ · (x − ξ) · x (10.2.81)
n! ⇓
Заметим две вещи: во-первых, Mn+1
∃N ∈ N ∀n > N <q
Mn
1 − |x| 6 1 − |ξ| 6 |1 + ξ| 6 1 + |ξ| 6 1 + |x|

⇓ ∀k ∈ Z+ MN +k < MN · q k
602 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

⇓ интервале (−R, R) рядом (10.2.84). Поскольку



X ∞
X это верно для любого R > 0, мы получаем, что
MN +k 6 MN · q k < ∞ f (x) = ex формула (10.2.84) верна при любом
k=0 k=0 x ∈ R.
⇓ 2. Производные функции sin
Mn −→ 0 
n→∞ 
 sin x, n = 4k, k ∈ Z+
n


∂ cos x, n = 4k + 1, k ∈ Z+
sin x =
(∂x)n 
 − sin x, n = 4k + 2, k ∈ Z+
⋄⋄ 10.2.6. Следующие разложения Маклорена 

справедливы на всей числовой прямой x ∈ R: − cos x, n = 4k + 3, k ∈ Z+

x2 xk ограничены в совокупности на R (и как след-


ex = 1 + x + + ... + + ... = ствие, на любом интервале (−R, R)):
2! k!
X∞
xn
= (10.2.84) sup sup | sin(n) (x)| 6 1 < ∞
n=0
n! n∈Z+ x∈(−R,R)

x3 x5 x2k+1
sin x = x − + − ... + (−1)n · + ... = В силу предложения 10.2.6, это означает, функ-
3! 5! (2k + 1)! цию sin можно представить сходящимся на ин-
X∞ 2n+1
x тервале (−R, R) рядом (10.2.85). Поскольку это
= (−1)n · (10.2.85) верно для любого R > 0, мы получаем, что фор-
n=0
(2n + 1)!
мула (10.2.85) верна при любом x ∈ R.
x2 x4 k x2k 3. Производные функции cos
cos x = 1 − + − ... + (−1) · + ... =
2! 4! (2k)!

X∞
x2n 
 cos x, n = 4k, k ∈ Z+
= (−1)n · (10.2.86) 
− sin x, n = 4k + 1, k ∈ Z
n=0
(2n)! cos(n) x =
+

 − cos x, n = 4k + 2, k ∈ Z+


Доказательство. 1. Из формулы для производ- sin x, n = 4k + 3, k ∈ Z+
ных функции ex
∂n x ограничены в совокупности на R. Поэтому функ-
e = ex ция cos удовлетворяет условию (10.2.73) на лю-
(∂x)n
бом интервале (−R, R), R > 0:
видно, что она удовлетворяет условию (10.2.73)
на любом интервале (−R, R), R > 0: sup sup | sin(n) (x)| 6 1 < ∞
n∈Z+ x∈(−R,R)

sup sup |f (n) (x)| = В силу предложения 10.2.6, cos можно предста-
n∈Z+ x∈(−R,R)
вить сходящимся на интервале (−R, R) рядом
= sup sup |ex | = eR < ∞ (10.2.86). Поскольку это верно для любого R > 0,
n∈Z+ x∈(−R,R)
равенство (10.2.86) будет выполняться для любо-
В силу предложения 10.2.6, это означает, что го x ∈ R.
функцию f (x) = ex представить сходящимся на

(c) Аналитические и целые функции

Аналитические функции.
• Функция f называется аналитической на интервале (a, b), если она определена на (a, b)
и удовлетворяет следующим равносильным условиям:
(i) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f представима в виде суммы степенного ряда:

X
f (x) = cn · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (10.2.87)
n=0
§ 2. Ряд Тейлора и аналитические функции 603

иными словами, в окрестности (x0 − δ; x0 + δ) функция f должна быть сдвигом


производящей функции некоторой аналитической последовательности cn :

f (x) = Genc (x − x0 ), x ∈ (x0 − δ; x0 + δ) (10.2.88)

(ii) у любой точки x0 ∈ (a, b) найдется окрестность (x0 −δ; x0 +δ), в которой функция
f (является гладкой и) представима в виде суммы своего ряда Тейлора:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x ∈ (x0 − δ; x0 + δ) (10.2.89)
n=0
n!

иными словами, в окрестности (x0 − δ; x0 + δ) функция f должна быть сдвигом


производящей функции последовательности своих коэффициентов Тейлора:

f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ (x0 − δ; x0 + δ) (10.2.90)
n!
Доказательство. Равносильность условий (i) и (ii) следует из теоремы 10.2.5.
Теорема 10.2.7. Сумма всякого степенного ряда

X
f (x) = cn · (x − x0 )n , x ∈ (x0 − R; x0 + R)
n=0

является аналитической функцией на интервале сходимости (x0 − R; x0 + R) этого степенного


ряда.
Доказательство. Понятно, что здесь достаточно рассмотреть случай x0 = 0. Пусть

X
f (x) = cn · xn , |x| < R.
n=0

Зафиксируем какую-нибудь точку x1 ∈ (−R; R) и выберем произвольные числа ρ и r так, чтобы

0 < |x1 | < ρ < r < R.

Строим логическую цепочку Абеля (как на с.576):



X
числовой ряд cn · r n сходится
n=0

общий член стремится к нулю: cn · rn −→ 0


n→∞


последовательность cn · rn ограничена: ∃M > 0 ∀n ∈ Z+ |cn · rn | = |cn | · rn 6 M

M
∃M > 0 ∀n ∈ Z+ |cn | 6 (10.2.91)
rn
Выберем δ < min{ρ − |x1 |; r − ρ}. Тогда для любой точки ξ ∈ (x1 − δ; x1 + δ) мы получим |ξ| < ρ,
поэтому
M
rn
6

∞ ∞
z}|{ ∞
X cn · n! X |cn | ·n! n−k
X n! M · ρn−k
(k) n−k
f (ξ) = (10.1.18) = ·ξ 6 · |ξ| 6 · =
(n − k)! (n − k)! | {z } (n − k)! rn
n=k n=k n=k
>

ρn−k
604 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

M X

n!  ρ n−k M · k! M · r · k!
= k
· · = (10.1.23) = k+1 =
r (n − k)! r ρ
rk · 1 − r (r − ρ)k+1
n=k

n
X f (k) (x1 ) f (n+1) (ξ)
∀x ∈ (x1 − δ; x1 + δ) f (x) − · (x − x1 )k = (10.2.62) = · (x − x1 )n+1 =
k! (n + 1)!
k=0
 n+1
f (n+1) (ξ) M · r · (n + 1)! M ·r δ
= · |x − x1 |n+1 6 · δ n+1 = · −→ 0. (10.2.92)
(n + 1)! (n + 1)! · (r − ρ)n+2 r−ρ r−ρ n→∞

Выше на с.246 мы показывали, что сумма, разность, произведение, частное и композиция непре-
рывных функций снова является непрерывной функцией. Те же самые свойства для дифференци-
руемых функций доказывались нами на с.323: сумма, разность, произведение, частное и композиция
дифференцируемых функций снова является дифференцируемой функцией. Оказывается, что то
же самое верно и для аналитических функций.

Теорема 10.2.8 (о композиции аналитических функций). Если f – аналитическая функция на


множестве U , а g – аналитическая функция на множестве V ⊇ f (U ), то их композиция h(x) =
g(f (x)) – аналитическая функция на множестве U .

Доказательство. Зафиксируем точку x0 ∈ U и положим

F (x) = f (x) − f (x0 ), G(y) = g(y + f (x0 ))

Композиция этих функций тоже равна h:

G(F (x)) = g(f (x) − f (x0 ) + f (x0 )) = g(f (x)) = h(x), x∈U

С другой стороны, эти функции тоже аналитические, поэтому

F (x) = Genb (x − x0 ), G(y) = Gena (y), x ∈ Uδ (x0 ), y ∈ Uε (0)

для некоторых аналитических последовательностей a и b. При этом

b0 = Genb (0) = F (x0 ) = f (x0 ) − f (x0 ) = 0,

то есть порядок аналитической последовательности b ∈ A отличен от нуля:

ω(b) > 1.

Значит, определена композиция последовательностей a◦b, которая по теореме 10.1.11 тоже является
аналитической: a ◦ b ∈ A. А производящие функции этих последовательностей связаны формулой
(10.1.53), из которой получаем:

h(x) = (G ◦ F )(x) = G(F (x)) = Gena Genb (x − x0 ) = (10.1.53) = Gena◦b (x − x0 ), x ∈ Uδ (x0 )

Таким образом, в некоторой окрестности Uδ (x0 ) точки x0 функция h совпадает с производящей


функцией некоторой аналитической последовательности (a ◦ b). Поскольку это верно для произ-
вольной точки x0 ∈ U , функция h является аналитической на множестве U .

Теорема 10.2.9 (об арифметических операциях с аналитическими функциями). Если f и g –


аналитические функции на множестве U , то следующие функции – тоже аналитические на
множестве U :
f + g, f − g, C · f, f · g,
(C – произвольная константа). А функция
g
f
– аналитическая на множестве U \ {x : f (x) = 0}.
§ 2. Ряд Тейлора и аналитические функции 605

Доказательство. В первых четырех случаях утверждение следует из формул (10.1.33)-(10.1.34):


для произвольной точки x0 ∈ U выберем окрестность (x0 − δ, x0 + δ) и аналитические последова-
тельности a и b так, чтобы

f (x) = Gena (x − x0 ), g(x) = Genb (x − x0 ), x ∈ (x0 − δ, x0 + δ)

Тогда

(f +g)(x) = f (x)+g(x) = Gena (x−x0 )+Genb (x−x0 ) = (10.1.33) = Gena+b (x−x0 ), x ∈ (x0 −δ, x0 +δ)

То есть в некоторой окрестности (x0 − δ, x0 + δ) точки x0 функция f + g совпадает с производящей


функцией некоторой аналитической последовательности (a + b). Поскольку это верно для произ-
вольной точки x0 ∈ U , функция f + g является аналитической на множестве U . То же самое верно
для f − g, C · f , f · g (в последнем случае используется формула (10.1.34)).
Теперь для доказательства аналитичности fg достаточно доказать аналитичность обратной функ-
ции f1 . Это делается с помощью теоремы 10.2.8: поскольку функция G(y) = y1 аналитична в силу
примера 10.2.9, ее композиция с f
1
G(f (x)) =
f (x)
– тоже аналитична.

⋄ 10.2.7. Гладкая, но не аналитическая рена этой функции


функция. Рассмотрим функцию из примера
0
9.1.35, то есть гладкую на R функцию f со свой- k

ствами: z }| {
X∞
f (n) (0) n
x = 0,
( n!
n=0
f (x) = 0, x 6 0
f (x) > 0, x > 0 не сходится к ней ни в какой окрестности нуля
(−δ, +δ), потому что при x > 0 наша функция от-
лична от нуля. Отсюда следует, что f не может
В примере 10.2.3 мы отмечали, что ряд Макло- быть аналитической в точке x = 0.

Целые функции.
• Функция f называется целой, если она определена всюду на R и удовлетворяет следующим
равносильным условиям:
(i)∗ f представима в виде суммы всюду сходящегося на R степенного ряда в нуле:

X
f (x) = cn · xn , x∈R (10.2.93)
n=0

иными словами, функция f всюду на R должна совпадать с производящей функ-


цией некоторой аналитической последовательности cn :

f (x) = Genc (x), x∈R (10.2.94)

(i)∗∗ f представима в виде суммы всюду сходящегося на R степенного ряда в произ-


вольной точке x0 ∈ R:

X
f (x) = cn · (x − x0 )n , x∈R (10.2.95)
n=0

иными словами, функция f всюду на R должна совпадать со сдвигом произво-


дящей функции некоторой аналитической последовательности cn :

f (x) = Genc (x − x0 ), x∈R (10.2.96)


606 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

(ii)∗ f является гладкой и всюду на R совпадает с суммой своего ряда Маклорена:

X∞
f (n) (0) n
f (x) = ·x , x∈R (10.2.97)
n=0
n!

иными словами, функция f всюду на R должна совпадать с производящей функ-


цией последовательности своих коэффициентов Маклорена:

f (n) (0)
f (x) = Genc (x), cn = , x∈R (10.2.98)
n!
(ii)∗∗ f является гладкой и всюду на R совпадает с суммой своего ряда Тейлора в
произвольной точке x0 ∈ R:
X∞
f (n) (x0 )
f (x) = · (x − x0 )n , x∈R (10.2.99)
n=0
n!

иными словами, функция f всюду на R должна совпадать со сдвигом произво-


дящей функции последовательности своих коэффициентов Тейлора:

f (n) (x0 )
f (x) = Genc (x − x0 ), cn = , x ∈ R. (10.2.100)
n!
Доказательство. Равносильности (i)∗ ⇔(ii)∗ и (i)∗∗ ⇔(ii)∗∗ следуют из теоремы 10.2.5. С другой
стороны, импликация (i)∗ ⇐(i)∗∗ очевидна, и поэтому остается доказать импликацию (i)∗ ⇒(ii)∗∗ .
Здесь используется тот же прием, что при доказательстве теоремы 10.2.7: поскольку параметры r
и ρ мы можем выбирать произвольными (так, чтобы выполнялась 0 < |x1 | < ρ < r), для всякой
точки x ∈ R можно найти r, ρ и δ так, чтобы x ∈ (x1 − δ, x1 + δ) и выполнялось (10.2.92).
Из теоремы 10.2.7 сразу следует
Теорема 10.2.10. Всякая целая функция является аналитической (и поэтому бесконечно глад-
кой) на R.

X∞
⋄ 10.2.8.
P∞ В примере 10.1.2 мы убедились, что (−1)n n
xn = n+1 · (x − x0 )
ряд n=1 n! сходится всюду на R. В соответ- n=0
x0
ствии с нашим определением, это означает, что
порождаемая им функция Таким образом, функция f аналитическая. Ее,
X∞ однако, нельзя считать целой хотя бы потому что
xn
f (x) = она определена не на всей прямой R. Более то-
n=1
n! го, ее нельзя продолжить до целой функции на
является целой. R, потому что по теореме 10.1.5 целая функция
должна быть непрерывна на R, а f не продол-
⋄ 10.2.9. Аналитическая, но не целая функ-
жается до непрерывной функции на R из-за со-
ция. Покажем, что функция
отношения
1 lim f (x) = ∞.
f (x) = x→0
x
является аналитической (на области своего опре- ⋄ 10.2.10. Всюду определенная аналитиче-
деления x ∈ R \ {0}). Зафиксируем точку x0 6= 0. ская, но не целая функция. Функция
Тогда при |x−x0 | < |x0 | справедливо разложение 1
в степенной ряд: f (x) =
1 + x2
1 1 1 1 является аналитический по теореме 10.2.9, как
f (x) = = = · x − x0 =
x x0 + (x − x0 ) x0 1 + отношение двух аналитических функций. Но она
x не является целой, потому что ее ряд Маклорена
| {z0 }
по модулю ∞
меньше 1 X
единицы = (10.2.76) = (−1)n · x2n
1 + x2
∞  n n=0
1 X x − x0
= (10.2.76) = · (−1)n · = сходится только при |x| < 1.
x0 n=0 x0
§ 3. Приложения степенных рядов 607

§3 Приложения степенных рядов


(a) Доказательство зависимости Аксиомы степеней.
Читатель помнит, наверное, что степенное отображение

(a, b) 7→ ab ,

вводилось нами в общем случае (то есть для необязательно целых показателей b) с помощью Акси-
омы степеней B1 на с.278, зависимость которой от других аксиом мы пообещали доказать позже.
Теперь, наконец, мы можем выполнить данное тогда обещание. Собственно доказательству этой
аксиомы (на с.612), мы предпошлем 16 вспомогательных утверждений (леммы 10.3.1-10.3.16). Все
это время читателю предлагается делать вид, что до сих пор он не глядел на текст в двух колонках
и, как следствие не знает ничего об отображении (a, b) 7→ ab , по крайней мере, для случая нецелого
b (случай целых степеней можно считать известным, поскольку для него все необходимые факты
были аккуратно доказаны нами еще в главе 2 в теореме о степенном отображении 2.2.17). Только
после приведенного здесь доказательства Аксиомы степеней все сказанное нами ранее на этот счет
вступит в законную силу, и этой цели посвящен настоящий раздел.

Функция exp. 1
exp(−x) = (10.3.104)
exp x
Лемма 10.3.1. Формула
exp(x + y) = exp x · exp y, (10.3.105)

X n
x
exp x = (10.3.101) Доказательство. 1. Первое равенство доказы-
n=0
n! вается простым вычислением:
X∞
определяет функцию exp всюду на прямой R. 0n 00 01 02
exp 0 = = + + +... = 1
n! 0!
|{z} 1!
|{z} 2!
|{z}
Доказательство. Радиус сходимости этого сте- n=0
1 0 0
пенного ряда равен бесконечности:
2. Докажем затем последнее равенство. По
cn (n + 1)! определению, функция exp является целой, и
R = lim = lim =
n→∞ cn+1 n→∞ n! значит (по условию (ii)∗∗ на с.606), она совпада-
= lim (n + 1) = ∞ ет с суммой своего ряда Тейлора в произвольной
n→∞ точке a ∈ R:
поэтому ряд сходится всюду на R. X∞
exp(n) a n
exp(a + y) = ·y (10.3.106)
Лемма 10.3.2. Функция exp, определенная ря- n=0
n!
дом (10.3.101), имеет производную, причем
По лемме 10.3.2, производная функции exp равна
∂ самой этой функции, поэтому вторая, третья, и
exp x = exp x (10.3.102)
∂x все остальные производные exp тоже совпадают
с exp:
Доказательство. Продифференцируем ряд
exp(n) = exp
(10.3.101) с помощью теоремы 10.1.6:
Подставив это в (10.3.106), мы получим:
X∞ n X∞  n
∂ ∂ x ∂ x ∞ ∞
exp x = = = X exp(n) a n X exp a n
∂x ∂x n=0 n! n=0
∂x n! exp(a + y) = ·y = ·y =
∞ ∞ n=0
n! n=0
n!
X xn−1 X x k
= = = exp x X∞
(n − 1)! k! 1
n=1 k=0 = exp a · · y n = exp a · exp y
n=0
n!

От (10.3.105) это отличается только заменой a на


Лемма 10.3.3. Функция exp, определенная ря- x.
дом (10.3.101), удовлетворяет следующему ра- 3. Второе тождество оказывается следствием
венству и двум тождествам: первого и третьего:
exp 0 = 1, (10.3.103) 1 = exp 0 = exp(x − x) = exp x · exp(−x)
608 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

⇓ Функция ln.
1
exp(−x) = Лемма 10.3.7. Функция exp, определенная ря-
exp x дом (10.3.101), биективно отображает прямую
R на интервал (0; +∞)
Лемма 10.3.4. Функция exp, определенная ря- exp : R → (0; +∞) (10.3.110)
дом (10.3.101), всюду положительна, а в нуле
равна единице: и поэтому правило
exp x > 0 (10.3.107)
t = ln x ⇐⇒ exp t = x (10.3.111)
Доказательство. Предположим, что в какой-то
точке a функция exp равняется нулю: корректно определяет функцию ln, обратную к
exp:
exp a = 0. ln : (0; +∞) → R (10.3.112)
Тогда: Доказательство. 1. Прежде всего, неравенство
(10.3.107) означает, что отображение exp дей-
1 = exp 0 = exp(a − a) = (10.3.105) = ствительно переводит R в (0; +∞).
= exp a · exp(−a) = 0, 2. Далее из условия возрастания (10.3.109)
| {z }
0 следует, что отображение exp инъективно.
3. Покажем, что exp сюръективно отобра-
что, конечно, невозможно. Таким образом, exp
жает R на (0; +∞). Пусть C ∈ (0; +∞). По-
– непрерывная функция, определенная всюду на
скольку limx→−∞ exp x = 0 (первое равенство в
прямой R, нигде не обращающаяся в нуль, а в
(10.3.109)), найдется x ∈ R такое, что exp x < C.
точке 0 равная единице. Такое возможно только
С другой стороны, limx→+∞ exp x = +∞ (второе
если exp всюду положительна.
равенство в (10.3.109)), поэтому найдется y ∈ R
Лемма 10.3.5. Функция exp, определенная ря- такое, что exp y > C. Мы получаем, что
дом (10.3.101), возрастает на R:
exp x < C < exp y
x<y =⇒ exp x < exp y (10.3.108)
причем exp – непрерывная функция по теореме
Доказательство. Производная этой функции 10.1.5. Значит, по теореме Коши о среднем зна-
всюду положительна чении 3.3.6, найдется точка c ∈ R такая, что
∂ exp c = C
exp x = (10.3.102) = exp x > (10.3.107) > 0,
∂x
поэтому по теореме 5.2.7 о строгой монотонно- Мы получили, что какое ни возьми C ∈ (0; +∞),
сти, эта функция должна возрастать. для него найдется точка c ∈ R, в которой функ-
ция exp принимает значение C. Это и означа-
Лемма 10.3.6. Функция exp, определенная ря- ет сюръективность exp как отображения из R в
дом (10.3.101), имеет следующие пределы на бес- (0; +∞).
конечности: 4. Инъективность и сюръективность вместе
означают биективность exp : R → (0; +∞).
lim exp x = 0 lim exp x = +∞ (10.3.109)
x→−∞ x→+∞
Лемма 10.3.8. Функция ln, определенная пра-
Доказательство. Второй предел следует из оче- вилом (10.3.111), возрастает:
видного неравенства:
0<x<y =⇒ ln x < ln y (10.3.113)
x2
∀x > 0 exp x = 1 + x + + ... > 1 + x
2 Доказательство. Если бы оказалось, что ln x >
ln y, то, в силу возрастания exp, мы получили бы
После того, как он доказан, первый предел полу-
чается заменой переменных: ln x > ln y
 
y = −x ⇓
lim exp x = = lim exp(−y) =
x→−∞ y → +∞ y→+∞
  exp(ln x) > exp(ln y)
1 1 | {z } | {z }
= (10.3.104) = lim = = x y
y→+∞ exp y limy→+∞ exp y
  ⇓
1
= =0
+∞ x>y
§ 3. Приложения степенных рядов 609

Лемма 10.3.9. Функция ln, определенная пра- Доказательство. Если a > 0, то мы получаем:
вилом (10.3.111), удовлетворяет следующему
равенству и двум тождествам: ab = (10.3.117) = exp(b · ln a) =
 z }| { 
1
ln 1 = 0, (10.3.114) = sgn2 b ∨ sgn a · exp(b · ln |a| )
1 | {z } |{z}
ln = − ln x (10.3.115) 1
a
x
ln(x · y) = ln x + ln y, (10.3.116) Если же a < 0, то

Доказательство. Первое равенство следует ab = (10.3.117) = sgn2 b · exp(b · ln |a|) =


непосредственно из определения (10.3.111): −1
 z }| { 
exp 0 = (10.3.103) = 1 ⇐⇒ 0 = ln 1 = sgn2 b ∨ sgn a · exp(b · ln |a|)
| {z }
Чтобы доказать второе, достаточно вычис- sgn2 b

лить значения функции exp в обеих его частях:


 
1 1 1 Лемма 10.3.11. Отображение (a, b) 7→ ab ,
exp ln = = =
x x exp(ln x) определенное формулой (10.3.117), удовлетворя-
= (10.3.104) = exp(− ln x) ет показательным законам (4.1.1)-(4.1.3):
a0 = 1, (10.3.119)
Поскольку exp – инъективное отображение, ра-
венство exp ln x1 = exp(− ln x) означает, что ар- 1
a−x = , (10.3.120)
гументы у exp должны быть равны: ln x1 = − ln x. ax
Точно так же доказывается последнее равен- ax+y = ax · ay (10.3.121)
ство:
(каждое из этих равенств верно всякий раз, ко-
exp (ln(x · y)) = x · y = exp(ln x) · exp(ln y) = гда обе его части определены).
= (10.3.105) = exp(ln x + ln y)Доказательство. Здесь нужно рассмотреть
несколько случаев.
Опять, поскольку exp – инъективное отображе- 1. Проверим сначала эти равенства в случае,
ние, равенство exp (ln(x · y)) = exp(ln x + ln y) когда a > 0. Тогда, во-первых,
возможно только если аргументы у exp равны:
ln(x · y) = ln x + ln y. a0 = (10.3.117) = exp(0·ln a) = exp 0 = (10.3.103) = 1
Во-вторых,
Определение степеней ab и доказательство
Аксиомы степеней. Теперь мы можем опре- a−x = (10.3.117) = exp(−x · ln a) =
делить степенное отображение (a, b) 7→ ab . В 1 1
его определении участвует отображение sgn2 : = (10.3.104) = = (10.3.117) = x
Z exp(x · ln a) a
2N−1 → {−1; +1}, которое мы когда-то давно за-
давали формулой (2.2.349): И, в-третьих,


 exp(b · ln a), a>0 ax+y = (10.3.117) = exp((x + y) · ln a) =

0, a = 0, b > 0 = exp(x · ln a + y · ln a) = (10.3.105) =
ab :=

 1, a = 0, b = 0 = exp(x · ln a) · exp(y · ln a) = (10.3.117) = ax · ay

 Z
sgn2 b · exp(b · ln |a|), a < 0, b ∈ 2N−1
2. После этого перейдем к случаю a = 0. То-
(10.3.117) гда, во-первых,
Напомним, что еще в главе 2 (формула
(2.1.204)) мы условились символом a ∨ b обозна- a0 = 00 = (10.3.117) = 1
чать операцию взятия максимума двух чисел:
Во-вторых, в соответствии с определением
a ∨ b = max{a, b} (10.3.117), выражение 0−x имеет смысл только
при x 6 0, а и 0x – только при x > 0. Значит, од-
Такая запись позволяет сделать более наглядны- новременно то и другое имеет смысл только при
ми (или более “алгебраическими”) выкладки, ко- x = 0. Мы получаем, что равенство 0−x = 1x
0
торыми мы займемся в этом пункте. нужно проверять лишь для случая x = 0, но то-
Лемма 10.3.10. При a 6= 0 и b ∈ 2N−1 Z
справед- гда оно становится
0
следствием уже отмеченного
ливо тождество: равенства 0 = 1:
  1 1
ab = sgn2 b ∨ sgn a · exp(b · ln |a|) (10.3.118) 0−0 = 00 = 1 = = 0
1 0
610 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

В-третьих, выражения 0x+y , 0x , 0y имеют смысл Лемма 10.3.12. Отображение (a, b) 7→ ab ,


при x > 0 и y > 0. Поэтому для доказательства определенное формулой (10.3.117), удовлетворя-
равенства 0x+y = 0x · 0y придется рассмотреть ет степенным законам (4.1.4)-(4.1.6):
дополнительно четыре случая:  b
b 1 1
— если x = y = 0, то 1 = 1, = b, (x · y)b = xb · y b
x x
(10.3.122)
0x+y = 00+0 = 00 = 1 =
(каждое из этих равенств верно всякий раз, ко-
= 1 · 1 = 00 · 00 = 0x · 0y гда обе его части определены).
— если x = 0, y > 0, то Доказательство. 1. Первое равенство имеет
смысл при любом b ∈ R, и мы получаем:
0x+y = 00+y = 0y = (10.3.117) = 0 = 1b = (10.3.117) = exp(b · ln 1) = (10.3.114) =
0 y x y
= 1 · 0 = (10.3.117) = 0 · 0 = 0 · 0 = exp(b · 0) = exp 0 = (10.3.103) = 1

— если x > 0, y = 0, то 2. Для доказательства второго тождества


нужно рассмотреть три случая:
0x+y = 0x+0 = 0x = (10.3.117) = 0 = — если x > 0, то b ∈ R, и
x 0 x y  b  
= 0 · 1 = (10.3.117) = 0 · 0 = 0 · 0
1 1
= (10.3.117) = exp b · ln =
— если x > 0, y > 0, то x x
= (10.3.115) = exp(−b · ln x) = (10.3.104) =
0x+y = (10.3.117) = 0 = 1 1
= = (10.3.117) = b
= 0 · 0 = (10.3.117) = 0x · 0y exp(b · ln x) x
— если x = 0, то выражение x1 не имеет смысл,
3. Остается случай a < 0. Во-первых, поэтому проверять нечего;
Z
— если x < 0, то b ∈ 2N−1 , и
a0 = (10.3.117) = sgn2 0 · exp(0 · ln |a|) =
| {z }  b
1 1
= exp(0) = (10.3.103) = 1 = (10.3.117) =
x
 
1
Во-вторых, в соответствии с определением = sgn2 b · exp b · ln =
(10.3.117), выражения a−x и ax имеют смысл для x
 
Z 1
x ∈ 2N−1 . В этом случае получается: = sgn2 b · exp b · ln = (10.3.115) =
|x|
a−x = (10.3.117) = sgn2 (−x) · exp(−x · ln |a|) = = sgn2 b · exp(−b · ln |x|) = (10.3.104) =
1 1
= (2.2.351), (10.3.104) = sgn2 x · = = sgn2 b · = (2.2.350) =
exp(x · ln |a|) exp(b · ln |x|)
1 1 1 1
= (2.2.350) = = (10.3.117) = x = = (10.3.117) = b
sgn2 x · exp(x · ln |a|) a sgn2 b · exp(b · ln |x|) x
3. Для доказательства третьего тождества
В-третьих, выражения ax+y , ax , ay имеют смысл приходится рассматривать 6 случаев. Во-первых,
Z
при x, y ∈ 2N−1 , и мы получаем: нужно отдельно поглядеть, что получается, ко-
гда x или y равно нулю:
ax+y = (10.3.117) =
— если x = 0, то чтобы xb имело смысл, нужно
= sgn2 (x + y) · exp((x + y) · ln |a|) = чтобы b > 0, и при этом становится неважно,
= sgn2 (x + y) · exp(x · ln |a| + y · ln |a|) = каким будет y:
= (2.2.352), (10.3.105) = 1) при b = 0 получаем:
= sgn2 x · sgn2 y · exp(x · ln |a|) · exp(y · ln |a|) =
(x · y)b = (0 · y)0 = 00 = (10.3.117) = 1 =
= sgn2 x · exp(x · ln |a|) · sgn2 y · exp(y · ln |a|) =
| {z } | {z } = 1 · 1 = (10.3.117) = 00 · y 0 = xb · y b
ax ay
= (10.3.117) = ax · ay 2) при b > 0 получаем:

(x · y)b = (0 · y)b = 0b = (10.3.117) = 0 =


= 0 · y b = (10.3.117) = 0b · y b = xb · y b
§ 3. Приложения степенных рядов 611

— по тем же причинам при y = 0 нужно чтобы = (10.3.117) = ax·y


b > 0, при этом становится неважно каким
будет x, и тождество также выполняется. 2. Пусть a = 0 и x > 0, y > 0. Тогда:
После этого остается рассмотреть 4 случая, — если x = 0, то
когда x и y принимают разные знаки:
(ax )y = (|{z}
00 )y = 1y = (10.3.122) =
— если x > 0, y > 0, то b ∈ R, и 1

(x · y)b = (10.3.117) = exp(b · ln(x · y)) = = 1 = (10.3.117) = 00 = 00·y = ax·y


= (10.3.116) = exp(b · (ln x + ln y)) = — если x > 0 и y = 0, то
= exp(b · ln x + b · ln y) = (10.3.105) =
(ax )y = (|{z}
0x )0 = |{z}
00 = 0x·0 = ax·y
= exp(b·ln x)·exp(b·ln y) = (10.3.117) = xb ·y b
0 1
Z
— если x < 0, y > 0, то b ∈ 2N−1 , и — если x > 0 и y > 0, то

(x·y)b = (10.3.117) = sgn2 b·exp(b·ln |x·y|) = (ax )y = (|{z}


0x )y = |{z}
0y = 0x·y = ax·y
0 0
= sgn2 b · exp(b · ln(|x| · y)) = (10.3.116) =
= sgn2 b · exp(b · ln |x| + b · ln y) = (10.3.105) = Z
3. Пусть a < 0 и x, y ∈ 2N−1 . Тогда нужно вос-
= sgn2 b · exp(b · ln |x|) · exp(b · ln y) = xb · y b пользоваться формулами (10.3.118) и (2.2.353):
| {z } | {z }
xb yb
a x )y = (10.3.117) =
(|{z}
— то же самое, с точностью до очевидных пере-
<

становок, получается при x > 0, y < 0 (тогда 0


Z  y
опять b ∈ 2N−1 );
Z = sgn2 x · exp(x · ln |a|) = (10.3.118) =
— наконец, если x < 0, y < 0, то b ∈ 2N−1 , и | {z }
6=

0 0
  
>

z}|{ = sgn2 y ∨ sgn sgn2 x · exp(x · ln |a|) ·


(x · y)b = (10.3.117) = exp(b · ln(x · y)) = | {z }
1 x·y sgn2 x
z }| { z }| {  
= (sgn2 b)2 · exp(b · ln(|x| · |y|)) = · exp y · ln sgn2 x · exp(x · ln |a|) =
= (10.3.116) = (sgn2 b)2 ·exp(b·ln |x|+b·ln |y|) = | {z }
exp(x·ln |a|)
= (10.3.105) = 
= sgn2 y ∨ sgn2 x ·
= sgn2 b · exp(b · ln |x|) · sgn2 b · exp(b · ln |y|) = | {z }
| {z } | {z }
=

xb yb
(2.2.353)
= xb · y b
=

sgn2 (y · x)
  
· exp y · ln exp(x · ln |a|) =
Лемма 10.3.13. Отображение (a, b) 7→ ab , | {z }
определенное формулой (10.3.117), удовлетворя-
=

ет накопительному закону (4.1.7): x · ln |a|



(ax )y = ax·y (a > 0) (10.3.123) = sgn2 (y · x) · exp y · x · ln |a| = ay·x = ax·y

в следующих случаях:
— при a > 0 и x, y ∈ R, Лемма 10.3.14. Отображение (a, b) 7→ ab ,
— при a = 0 и x > 0, y > 0, определенное формулой (10.3.117), удовлетворя-
Z ет условию сохранения знака (2.2.279):
— при a < 0 и x, y ∈ 2N−1 .
Доказательство. 1. Пусть a > 0 и x, y ∈ R. То- a>0 ⇒ an > 0 (n ∈ Z) (10.3.124)
гда:
Доказательство.
x y x
(a ) = (10.3.117) = exp(y ·ln a ) = (10.3.117) = (10.3.117) (10.3.107)
  a>0 ⇒ an = exp(b · ln a) > 0
= exp y · ln exp(x · ln a) = exp(y · x · ln a) =
| {z }
x·ln a
612 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

Лемма 10.3.15. Отображение (a, b) 7→ ab , Доказательство. Если a > 1, то ln a > ln 1 = 0


определенное формулой (10.3.117), удовлетворя- (поскольку функция ln возрастает), поэтому при
ет условиям монотонности (4.1.10)-(4.1.11): умножении на ln a знак неравенства не меняется:
 
b>0 & 0<x<y =⇒ 0 < xb < y b x<y
(10.3.125)
  ⇓
b b
b<0 & 0<x<y =⇒ x >y >0
x · ln a < y · ln a
(10.3.126)
Доказательство. При b > 0 получаем: ⇓

0<x<y exp(x · ln a) < exp(y · ln a)


| {z } | {z }
ax ay

Если же 0 < a < 1, то ln a < ln 1 = 0 (посколь-
ln x < ln y
ку функция ln возрастает), поэтому при умноже-
⇓ нии на ln a знак неравенства меняется:
b · ln x < b · ln y
x<y

exp(b · ln x) < exp(b · ln y) ⇓
| {z } | {z }
xb yb
x · ln a > y · ln a
А при b < 0:
0<x<y ⇓
⇓ exp(x · ln a) > exp(y · ln a)
| {z } | {z }
ln x < ln y ax ay

b · ln x > b · ln y
Доказательство зависимости Аксиомы B1 на с.278.

Формула (10.3.117) определяет отображение
exp(b · ln x) > exp(b · ln y) (a, b) 7→ ab в точности для тех ситуаций, что
| {z } | {z }
xb yb перечислены в условии P0 Аксиомы степеней
B1. По леммам 10.3.11 и 10.3.12, это отображе-
ние удовлетворяет показательным и степенным
Лемма 10.3.16. Отображение (a, b) 7→ ab , законам, то есть условию P1 . По лемме 10.3.13,
определенное формулой (10.3.117), удовлетворя- оно удовлетворяет накопительному закону, то
ет условиям монотонности (4.1.12)-(4.1.13): есть условию P2 . По лемме 10.3.14, закон со-
  хранения знака (4.1.9) тоже выполняется, а в
a>1 & x<y =⇒ ax < ay (10.3.127) силу замечания 4.1.4, формула (4.1.8) выполня-
  ется автоматически, поэтому ее доказывать не
0<a<1 & x<y =⇒ ax > ay нужно. Наконец, по леммам 10.3.15 и 10.3.16 оно
(10.3.128) удовлетворяет условиям монотонности P4 .

(b) Доказательство зависимости Аксиомы тригонометрии.


Наступил момент вспомнить еще об одном важном результате, доказательство которого (как в слу-
чае с Аксиомой степеней B1 на с.278) было отложено нами на будущее. Это Аксиома тригонометрии
B2 на с.291, с помощью которой мы вводили функции синус и косинус. Теперь мы можем доказать
и ее. Мы предпошлем доказательству 11 вспомогательных утверждений (леммы 10.3.17-10.3.27).
Здесь (как в случае с Аксиомой степеней B1 на с.278) мы опять предлагаем читателю сделать вид,
что до настоящего времени он не глядел на текст в двух колонках и не знает ничего из того, что
писалось о синусе и косинусе вплоть до момента, когда мы собственно примемся за доказательство
Аксиомы тригонометрии (на с.617). Только в самом доказательстве мы вспомним, что следствия
из Аксиомы тригонометрии уже рассматривались ранее нами в иллюстрациях (и из этого будет
выводиться единственность функций sin и cos).
§ 3. Приложения степенных рядов 613

Лемма 10.3.17. Формулы Радиус сходимости последнего степенного ряда


будет таким:

X x2n+1
sin x = (−1)n · (10.3.129) cn (−1)n · (2n + 2)!
n=0
(2n + 1)! R = lim = lim =

n→∞ cn+1 n→∞ (−1)n+1 · (2n)!
X x2n
n = lim (2n + 1)(2n + 2) = ∞
cos x = (−1) · (10.3.130)
n=0
(2n)! n→∞

Значит ряд
определяют функции sin и cos всюду на прямой ∞
X yn
R. (−1)n ·
n=0
(2n)!
Доказательство. 1. Первый ряд перепишем в сходится при любом y. Как следствие, при под-
виде становке y = x2 получающийся ряд
∞ ∞ ∞
X
X x2n+1 X (x2 )n (x2 )n
(−1) · n
= x· (−1)n · = (−1)n ·
(2n + 1)! (2n + 1)! n=0
(2n)!
n=0 n=0

X тоже должен сходиться, независимо от того, ка-
yn
=x· (−1)n · кое значение принимает x. Мы получаем, что
n=0
(2n + 1)!
y=x2 формула (10.3.130) определяет функцию cos всю-
и вычислим радиус сходимости у последнего сте- ду на прямой R.
пенного ряда (от переменной y) по формуле Да- Лемма 10.3.18. Функции sin и cos, определен-
ламбера: ные рядами (10.3.129)-(10.3.130), удовлетворя-
ют тождествам:
cn (−1)n · (2n + 3)!
R = lim = lim =
n→∞ cn+1 n→∞ (−1)n+1 · (2n + 1)! sin(−x) = − sin x cos(−x) = cos x (10.3.131)
= lim (2n + 2)(2n + 3) = ∞ Доказательство.
n→∞


X
То есть ряд (−x)2n+1
sin(−x) = (10.3.129) = (−1)n · =
∞ (2n + 1)!
X yn n=0
(−1)n · ∞
X −(x2n+1 )
n=0
(2n + 1)! = (−1)n · =
n=0
(2n + 1)!
сходится при любом y. Значит при подстановке ∞
X
y = x2 получающийся ряд x2n+1
=− (−1)n · = (10.3.129) = − sin x
n=0
(2n + 1)!

X
n (x2 )n
(−1) ·
(2n + 1)! ∞
X
n=0 (−x)2n
cos(−x) = (10.3.130) = (−1)n · =
тоже сходится независимо от того, какое значе- n=0
(2n)!
ние принимает x. После умножения на x получа- ∞
X 2n
ющийся ряд x
= (−1)n · = (10.3.130) = cos x
n=0
(2n)!

X
n x2n+1
(−1) ·
n=0
(2n + 1)!
Лемма 10.3.19. Функции sin и cos, определен-
тоже должен сходиться в силу свойства 1◦ на ные рядами (10.3.129)-(10.3.130), удовлетворя-
с.495, каким бы ни был x. Все это означает, что ют равенствам:
формула (10.3.129) определяет функцию sin всю-
ду на прямой R. sin 0 = 0 cos 0 = 1 (10.3.132)
2. Второй ряд можно переписать так:
Доказательство.

X ∞
X
x2n (x2 )n ∞
X 02n+1
(−1)n · = (−1)n · = sin 0 = (10.3.129) = (−1)n · =
n=0
(2n)! n=0 (2n)! (2n + 1)!
n=0

X ∞
nyn X
= (−1) · = (−1)n · 0 = 0
n=0
(2n)!
y=x2 n=0
614 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ


X 02n Доказательство. Зафиксируем какое-нибудь
cos 0 = (10.3.130) = (−1)n · =
(2n)! число a ∈ R и рассмотрим три функции:
n=0

X 2n
0 02·0 F (x) = sin(x + a) − sin x · cos a − cos x · sin a
= (−1)n · = (−1)0 · +
(2n)! (2 · 0)! G(x) = cos(x + a) − cos x · cos a + sin x · sin a
n=0 | {z }
1 H(x) = F (x)2 + G(x)2

X 02n
+ (−1)n · =1 Заметим две вещи: во-первых,
n=1 |
(2n)!
{z } (
0 F (0) = sin a − sin 0 · cos a − cos 0 · sin a = 0
G(0) = cos a − cos 0 · cos a + sin 0 · sin a = 0
Лемма 10.3.20. Функции sin и cos, определен- ⇓
ные рядами (10.3.129)-(10.3.130), имеют следу-
ющие производные: H(0) = F (0)2 + G(0)2 = 0
∂ ∂ И, во-вторых,
sin x = cos x cos x = − sin x (10.3.133)
∂x ∂x  ′

 F (x) = cos(x + a) − cos x · cos a+
Доказательство. 
 + sin x · sin a = G(x)
∂ ′
G (x) = − sin(x + a) + sin x · cos a+

sin x = (10.3.129) = 

∂x + cos x · sin a = −F (x)

∂ X x2n+1
= (−1)n · = ⇓
∂x n=0 (2n + 1)!

X ∂ x2n+1
= (−1)n · = H ′ (x) = 2 · F (x) · F ′ (x) + 2 · G(x) · G′ (x) =
n=0
∂x (2n + 1)!

= 2 · F (x) · G(x) − 2 · G(x) · F (x) = 0
X (2n + 1) · x2n
n
= (−1) · = Вместе это означает, что функция H должна
n=0
(2n + 1)!
быть тождественно равна нулю, а значит F и G

X x2n тоже тождественно равны нулю:
= (−1)n · = cos x
(2n)!
n=0
H(x) = F (x)2 + G(x)2 ≡ 0

∂ ⇓
cos x = (10.3.130) = (
∂x
∞ F (x) ≡ 0
∂ X x2n
= (−1)n · = G(x) ≡ 0
∂x n=0 (2n)!
∞ Заменяя a на y, мы из последних тождеств по-
X ∂ x2n
= (−1) · n
= лучаем (10.3.134)-(10.3.135).
n=0
∂x (2n)!

Лемма 10.3.22. Функции sin и cos, определен-
X (2n) · x2n−1
n
= (−1) · 0 + (−1) · n
= ные рядами (10.3.129)-(10.3.130), удовлетворя-
n=1
(2n)! ют тождеству:
X∞  
n x2n−1 замена:
sin2 x + cos2 x = 1 (10.3.136)
= (−1) · = k = n − 1 =
n=1
(2n − 1)! n=k+1

Доказательство. Подставив y = −x в
X x2k+1 (10.3.135), мы получим:
k+1
= (−1) · =
(2k + 1)!
k=1

X 1 = (10.3.132) = cos 0 = cos(x − x) =
x2k+1
=− (−1)k · = − sin x = cos x · cos(−x) − sin x · sin(−x) =
(2k + 1)!
k=1
= (10.3.131) = cos2 x + sin2 x

Лемма 10.3.21. Функции sin и cos, определен-


ные рядами (10.3.129)-(10.3.130), удовлетворя- Лемма 10.3.23. Функция sin, определенная ря-
ют тождествам: дом (10.3.129), строго положительна на интер-
вале (0, 2):
sin(x + y) = sin x · cos y + cos x · sin y (10.3.134)
cos(x + y) = cos x · cos y − sin x · sin y (10.3.135) ∀x ∈ (0, 2) sin x > 0
§ 3. Приложения степенных рядов 615

Доказательство. Перепишем ряд, определяю- слагаемые в этом ряду неотрицательны. Значит,


щий sin таким образом: cos на отрезке x ∈ [0, 2] можно оценить сверху,
оборвав последний ряд после первого слагаемо-

X x2n+1 го:
sin x = (−1)n · =
n=0
(2n + 1)!  
X∞
x4k+2 x2
x3 x5 x7 · 1− >
=x− + − + ... = (4k + 2)! (4k + 3) · (4k + 4)
 3!
 5! 7! 
k=0
x2 x5 x2 X0  
=x· 1− − · 1− + ... = x4k+2 x2
2·3 5! 6·7 > · 1− =
(4k + 2)! (4k + 3) · (4k + 4)

X   k=0
 
x4k+1 x2 x2 x2
= · 1− = · 1−
(4k + 1)! (4k + 3) · (4k + 4) 2! 3·4
k=0

И заметим, что при x ∈ [0, 2] множитель в скоб-



ках в последнем ряде положителен:

x ∈ [0, 2]
cos x = 1−
⇓ X∞  
x4k+2 x2
x2 6 4 < (4k + 3) · (4k + 4) (k ∈ Z+ ) − · 1− 6
(4k + 2)! (4k + 3) · (4k + 4)
k=0
⇓  
x2 x2
2 61− · 1−
x 2! 3·4
<1 (k ∈ Z+ )
(4k + 3) · (4k + 4)
В частности, при x = 2 получаем:

 
2
22 22
x cos 2 6 1 − · 1− =
1− >0 (k ∈ Z+ ) 2! 3·4
(4k + 3) · (4k + 4)  
(10.3.137) 2 1 1
=1− · 1− =− <0
Отсюда следует, что при x ∈ (0, 2) в полученном 2! 3 3
ряде все слагаемые тоже положительны, и зна-
чит С другой стороны, в силу (10.3.132),

X∞  
x4k+1 x2 cos 0 = 1
sin x = · 1− >0
(4k + 1)! (4k + 3) · (4k + 4)
k=0
Мы получаем, что на отрезке [0, 2] функция cos
меняет знак. Значит, по теореме Коши о проме-
жуточном значении 3.3.6, она обращается в нуль
Лемма 10.3.24. Функция cos, определенная ря- в некоторой точке a ∈ (0, 2).
дом (10.3.130), имеет на промежутке (0, 2) ров-
Остается показать, что это единственный
но один нуль:
нуль на (0, 2). Действительно, по лемме 10.3.23,
∃! a ∈ (0, 2) cos a = 0 (10.3.138) производная этой функции отрицательна на ин-
тервале (0, 2):
Доказательство. Перепишем ряд, определяю-
щий cos, иначе: ∂
cos x = − sin x < 0
∂x
X∞
x2n
cos x = (−1)n · = Значит, по теореме 5.2.7 cos монотонно убывает
n=0
(2n)! на интервале (0, 2), и поэтому не может дважды
x2 x4 x6 x8 обращаться в нуль на нем.
=1− + − + − ... =
2
 2! 2 4!  6!6 8! 
x x x x2 Лемма 10.3.25. Точка a ∈ (0, 2), определенная
=1− · 1− − · 1− + ... =
2! 3·4 6! 7·8 условием (10.3.138), обладает следующими свой-
X∞   ствами:
x4k+2 x2
=1− · 1−
(4k + 2)! (4k + 3) · (4k + 4)
k=0 cos a = 0 sin a = 1 (10.3.139)
В силу (10.3.137), при x ∈ [0, 2] множитель в cos 2a = −1 sin 2a = 0 (10.3.140)
скобках в последнем ряде положителен, поэтому cos 4a = 1 sin 4a = 0 (10.3.141)
616 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ
   
Доказательство. Первая строчка: x2 x5 x2
=x· 1− + · 1− + ... =
2 4! 5·6
cos a = 0  
x2
=x· 1− +
⇓ 2
| {z }

<
sin2 a = 1 − cos2 a = 1 0,
при x ∈ (0, 1)
⇓ ∞  
  X x4k+1 x2
sin a = 1 + · 1− >0
(4k)! (4k + 1) · (4k + 2)
sin a = −1 ← невозможно, в силу леммы 10.3.23 k=1 | {z }

<
⇓ 0,
при x ∈ (0, 1)
sin a = 1
Вторая строчка: 2. Второе неравенство:
cos 2a = cos2 a − sin2 a = 0 − 1 = −1,
sin x − x · cos x =
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 X∞
x2n+1 X∞
x2n
= (−1)n · −x· (−1)n · =
Третья строчка: n=0
(2n + 1)! n=0
(2n)!

X X∞
cos 4a = cos2 2a − sin2 2a = 0 − 1 = −1, x2n+1
n x2n+1
= (−1) · − (−1)n · =
n=0
(2n + 1)! n=0 (2n)!
sin 2a = 2 · sin a · cos a = 2 · 1 · 0 = 0 ∞  2n+1 
X x x2n+1
n
= (−1) · − =
n=0
(2n + 1)! (2n)!
Лемма 10.3.26. Число 4a, где a ∈ (0, 2) опре- ∞
X x2n+1  
делено условием (10.3.138), является периодом = (−1)n · · 1 − (2n + 1) =
n=0
(2n + 1)!
для функций sin и cos, определенных рядами

X
(10.3.129)-(10.3.130): x2n+1
= (−1)n+1 · · 2n =
n=0
(2n + 1)!
sin(x + 4a) = sin x, cos(x + 4a) = cos x
3
x x5 x7 x9
=0+ ·2− ·4+ ·6− · 8 + ... =
Доказательство. Здесь просто применяется 3! 5! 7! 9! 
  
(10.3.141): x3 x2 x7 x2
= · 2− + · 6− · 8 + ... =
3! 5 7! 9
sin(x + 4a) = sin x · cos
| {z4a} + cos x · sin
| {z4a} = sin x ∞  
X x4k+3 x2
1 0 = · (4k + 2) − >0
(4k + 3)! 4k + 5
cos(x + 4a) = cos x · cos
k=0 | {z }
| {z4a} − sin x · sin
| {z4a} = cos x
<

1 0 0,
при x ∈ (0, 1)

Лемма 10.3.27. При x ∈ (0; 1) для функций sin 3. Третье неравенство:


и cos, определенных рядами (10.3.129)-(10.3.130)
выполняется следующее тройное неравенство: ∞
X x2n+1
x − sin x = x − (−1)n · =
0 < x cos x < sin x < x. (10.3.142) (2n + 1)!
n=0

Доказательство. Здесь всюду используется x3 x5 x7 x9


= − + − + ... =
прием, который мы применяли при доказатель-
3
 3! 2 5!  7!7 9! 
стве леммы 10.3.23 – нужно представить ряд, x x x x2
= · 1− + · 1− + ... =
которым записывается функция, в удобном для 3! 4·5 7! 8·9
оценок виде. X∞  
x4k+3 x2
1. Первое неравенство: = · 1− >0
(4k + 3)! (4k + 4) · (4k + 5)
k=0 | {z }

X x2n
<

x · cos x = x · (−1)n · = 0,
n=0
(2n)! при x ∈ (0, 1)

x3 x5 x7
=x− + − + ... =
2! 4! 6!
§ 3. Приложения степенных рядов 617

Доказательство зависимости Аксиомы B2. 1. функций sin и cos, удовлетворяющих условиям


Лемма 10.3.17 определяет функции sin и cos всю- T0 -T1 Аксиомы тригонометрии, уже доказана:
ду на числовой прямой R, а по лемме 10.3.26 эти в иллюстративном тексте мы, последовательно
функции являются периодическими. Это дока- выводя следствия из Аксиомы B2, получили, что
зывает условие T0 Аксиомы тригонометрии. если какие-то функции sin и cos удовлетворяют
2. Условие T1 доказывается леммами 10.3.21 условиям T0 -T2 Аксиомы B2, то они автомати-
и 10.3.22. чески должны описываться рядами (10.2.85) и
3. Условие T1 доказывается леммой 10.3.27. (10.2.86), или, что то же самое, рядами (10.3.129)-
4. Остается заметить, что единственность (10.3.130).

(c) Значение числа π


В заключение разговора о степенных рядах и аналитических функциях отметим еще одно приложе-
ние этой теории – формулу для нахождения числа π, которую мы обещали читателю еще на с.291,
когда определяли это число.

Предложение 10.3.28. Число π представимо Как сумма равномерно сходящегося ряда из


в виде суммы числового ряда формулой непрерывных функций, функция f должна быть
∞ непрерывна на отрезке [0, 1]. С другой стороны,
X (−1)n · 4
π= , (10.3.143) в силу тождества (10.1.25), функция f совпадает
n=0
2n + 1 с функцией arctg на полуинтервале [0, 1):
и для всякого N ∈ N удовлетворяет оценке ∞
X x2n+1
∀x ∈ [0, 1) arctg x = (−1)n · = f (x)
XN
(−1)n · 4 4 n=0
2n + 1
π− 6 (10.3.144)
n=0
2n + 1 2N + 3
При этом, как мы знаем, функция arctg непре-
или, что то же самое, оценке рывна на R (и значит на [0, 1]) в силу предло-
жения 4.1.46. Отсюда следует, что функции f и
XN
(−1)n · 4 4 arctg совпадают в точке 1:
− <π<
n=0
2n + 1 2N +3
arctg 1 = lim arctg x = lim f (x) = f (1)
XN x→1−0 x→1−0
(−1)n · 4 4
< + (10.3.145)
n=0
2n + 1 2N +3 Теперь мы получаем:
Доказательство. Рассмотрим функциональный π
ряд = arctg 1 = f (1) =
|4 {z }

X x2n+1 по определению
(−1)n · , x ∈ [0, 1] (10.3.146) арктангенса (4.1.124)
n=0
2n + 1 ∞ ∞
X x2n+1 X 1
x2n+1 = (−1)n · = (−1)n ·
Если обозначить bn (x) = , то при x ∈ [0, 1]
2n+1 n=0
x=1
n=0
2n + 1 2n + 1
это будет неотрицательная невозрастающая по-
следовательность Умножая это на 4, мы получим форму-
лу (10.3.143), а из оценки остатка знакоче-
b0 (x) > b1 (x) > b2 (x) > ... > 0 редующегося ряда (8.2.53) получаем оценку
стремящаяся к нулю равномерно на [0, 1]: (10.3.144).

1
||bn ||[0,1] = −→ 0 ! 10.3.1. Как и в случае с числом Непера e, зна-
2n + 1 n→∞
чение которого, как мы помним оценивались с
То есть ряд (10.3.146) удовлетворяет условиям помощью неравенства (3.2.99), значения π так-
теоремы 9.1.6 (признак Лейбница равномерной же можно оценивать, используя теперь неравен-
сходимости), и значит, он равномерно сходится ство (10.3.145), однако эти два случая качествен-
на отрезке [0, 1]. Обозначим его сумму буквой f : но различаются тем, что нужная точность для π

достигается гораздо медленнее, чем для e. На-
X x2n+1
f (x) = (−1)n · , x ∈ [0, 1] пример, для вычисления первых двух знаков по-
n=0
2n + 1 сле запятой для π нужно брать сумму 1000 сла-
618 Глава 10. СТЕПЕННЫЕ РЯДЫ И АНАЛИТИЧЕСКИЕ ФУНКЦИИ

1000
X
гаемых: во-первых, (−1)n · 4 4
< − <π<
4 2n + 1 2 · 1000 + 3
= 0, 0019970...
2·1000+3
n=0
⇓ 1000
X (−1)n · 4 4
4
0, 001 < 2·1000+3 < 0, 002 < − <
n=0
2n + 1 2 · 1000 + 3

4
−0, 002 < − 2·1000+3 < −0, 001 < 3, 142 + 0, 002 = 3, 144

во-вторых, ⇓
P1000 n
(−1) ·4
n=0 = 3, 14259165...
2n+1
⇓ 3, 14 < π < 3, 15 (10.3.147)
P1000 (−1)n ·4
3, 142 < n=0 2n+1 < 3, 143

и вместе это дает

3, 140 = 3, 142 − 0, 002 < π = 3, 14... (10.3.148)

(d) Числа Фибоначчи


Пример приложения теории степенных рядов, не упомянуть который нельзя, – способ нахожде-
ния явных формул для последовательностей, заданных рекуррентно. Мы проиллюстрируем его на
последовательности Фибоначчи, описанной нами в примере 3.2.2.


X ∞
X
Напомним, что числа Фибоначчи определя-
= x1 ·s2 + xk−1 · sk + xk−2 · sk =
ются рекуррентными соотношениями (3.2.38): |{z}
k=3 k=3
=

1
x1 = x2 = 1, xn+2 = xn+1 + xn , n∈N

X
= s2 + (xk−1 + xk−2 ) ·sk =
Предложение 10.3.29. Числа Фибоначчи опи- | {z }
k=3
сываются явно формулой xk

X
" √ !n √ !n # 2
= −s + |s +
{zs} + xk · sk =
1 1+ 5 1− 5
xn = √ − k=3
=

5 2 2
x1 · s1 + x2 · s2
(10.3.149) ∞
X
= −s + xk · sk = −s + F (s)
Доказательство. Рассмотрим производящую k=1
функцию этой последовательности: ⇓

X (s + s2 ) · F (s) = −s + F (s)
F (s) = xn · sn ⇓
n=1
s = (1 − s − s2 ) · F (s)
(суммирование начинается с номера n = 1; это ⇓
можно объяснить, например, так: мы будем счи-
тать, что x0 = 0). Помножив F (s) на многочлен s
F (s) = (10.3.150)
s + s2 , мы получим цепочку: 1 − s − s2
Разложим знаменатель на множители:

X 1 − s − s2 = −(s − a)(s − b)
(s + s2 ) · F (s) = (s + s2 ) · xn · sn =
n=1 где √ √

X ∞
X −1 − 5 −1 + 5
= xn · sn+1 + xn · sn+2 = a= , b=
2 2
n=1 n=1 Заметим попутно, что
| {z } | {z }
замена: n + 1 = k замена: n + 2 = k √ √
∞ ∞
−1 + 5 1 + 5 √
X X b−a= + = 5 (10.3.151)
= xk−1 · sk + xk−2 · sk = 2 2
k=2 k=3
§ 3. Приложения степенных рядов 619
√  
1 2 2 · (1 − 5) s 1 1 1 1
=− √ =− √ √ = = · · s − · = (10.2.75) =
a 1+ 5 (1 + 5) · (1 − 5) b−a a 1− a b 1 − as
√ √ !
1 X  s n 1 X  s n
∞ ∞
2 · (1 − 5) 1− 5 s
=− = (10.3.152) = · · − · =
1−5 2 b−a a n=0 a b n=0 b
∞ ∞
!
√ s X sn X sn
1 2 2 · (1 + 5) = · − =
=− √ =− √ √ = b−a an+1 n=0 bn+1
b 1− 5 (1 − 5) · (1 + 5) n=0
√ √ ∞  
2 · (1 + 5) 1+ 5 1 X 1 1
=− = (10.3.153) = · − ·sn+1 = |n + 1 = k| =
1−5 2 b − a n=0 an+1 bn+1
Тогда X∞  
1 1 1
= · − k · sk =
s 1 b−a ak b
F (s) = = −s · = k=1
1 − s − s2 (s − a)(s − b) = (10.3.151), (10.3.152), (10.3.153) =
| {z }  
раскладываем ∞ √ !k √ !k
1 X 1− 5  k
на простейшие дроби
= √ ·  1+ 5 − ·s
по правилам на с.411
! 5 2 2
1 1   k=1
a−b s
b−a 1 1
= −s· + = · − =
s−a s−b b−a s−b s−a
 
s 1 1 Выделяя коэффициенты перед sk , мы теперь по-
= · − = лучим (10.3.149).
b−a a−s b−s
Глава 11

ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

• Тригонометрическим рядом называется функциональный ряд вида

a0 X n πnx o

πnx
+ an · cos + bn · sin (11.0.1)
2 n=1
T T

Число T называется полупериодом этого тригонометрического ряда, а числа an и bn – его


коэффициентами.
• Частным случаем тригонометрического ряда будет ряд, в котором коэффициенты an и bn
найдены по формулам
1 T
ˆ
a0 = f (x) d x,
T −T
1 T πnx
ˆ
an = f (x) cos d x, (11.0.2)
T −T T
1 T πnx
ˆ
bn = f (x) sin dx
T −T T
где f – некоторая интегрируемая на отрезке [−T, T ] функция. Такой тригонометрический
ряд называется рядом Фурье функции f с полупериодом T . Его коэффициенты (11.0.2)
называются коэффициентами Фурье функции f , а частичные суммы

a0 X n πnx o
N
πnx
SN (x) = + an · cos + bn · sin (11.0.3)
2 n=1
T T

– многочленами Фурье функции f .


В этой главе нас будет интересовать вопрос, какой должна быть функция f , чтобы быть суммой
своего ряда Фурье:
a0 X n πnx o

πnx
f (x) = + an · cos + bn · sin (11.0.4)
2 n=1
T T
Понятно, что первым необходимым условием для этого должна быть интегрируемость функции f
на отрезке [−T, T ] (потому что иначе будет непонятно, что такое ряд Фурье для нее, то есть как
понимать интегралы (11.0.2)). С другой стороны, функции x 7→ cos πnx πnx
T и x 7→ sin T в тригономет-
рическом ряде (11.0.1) имеют период 2T :
πn(x + 2T )  πnx  πnx πn(x + 2T )  πnx  πnx
cos = cos + 2πn = cos , sin = sin + 2πn = sin
T T T T T T
поэтому, если функция f является суммой своего ряда Фурье (11.0.4), то она тоже должна иметь
период 2T :
f (x + 2T ) = f (x)
Отсюда становится понятно, что предметом изучения для нас должны быть периодические функции
f , интегрируемые на отрезке [−T, T ], где T – период. Всякая такая функция будет интегрируема
не только на отрезке [−T, T ], но и вообще на любом отрезке [a, b] ⊂ R, поэтому нам будет удобно
употреблять для таких функций следующий термин:

620
§ 1. Сходимость ряда Фурье в среднем квадратичном 621

• Функция f : R → R называется локально интегрируемой, если она интегрируема на


каждом отрезке [a, b] ⊂ R.

§1 Сходимость ряда Фурье в среднем квадратичном


Изучение рядов Фурье удобно проводить для случая, когда в качестве полупериода T выбрано
число π, потому что тогда формулы (11.0.1) и (11.0.2) упрощаются: тригонометрический ряд (11.0.1)
принимает вид
a0 X n o

+ an cos nx + bn sin nx , (11.1.5)
2 n=1

коэффициенты Фурье (11.0.2) вычисляются по формулам:


1 π 1 π 1 π
ˆ ˆ ˆ
a0 = f (x) d x, an = f (x) cos nx d x, bn = f (x) sin nx d x (11.1.6)
π −π π −π π −π
а многочлены Фурье записываются в виде

a0 X n o
N
SN (x) := + an cos nx + bn sin nx (11.1.7)
2 n=1

(здесь an и bn – коэффициенты Фурье (11.1.6)).


В соответствии с этим мы будем всюду далее до теоремы 11.2.16 рассматривать локально инте-
грируемые 2π-периодические функции (и их ряды Фурье с полупериодом π). Множество всех таких
функций удобно обозначить каким-нибудь символом:
• Символом R(π) мы обозначаем множество всех локально интегрируемых функций с по-
лупериодом π на R.

(a) Основная теорема


• Пусть f ∈ R(π), то есть f – локально интегрируемая функция с полупериодом π на R.
Поскольку f интегрируема на отрезке [−π, π], по свойству 80 на с.435 ее квадрат f 2 = |f |2
тоже интегрируем на отрезке [−π, π]. Значит, определено число
s ˆ
1 π
kf k = |f (x)|2 d x (11.1.8)
π −π

Оно называется среднеквадратичной нормой функции f в пространстве R(π). Слово “нор-


ма” употребляется применительно к этой величине потому, что, как мы убедимся ниже
на с.623, отображение f 7→ kf k обладает свойствами 1◦ -3◦ равномерной нормы, упоминав-
шимися на с 533 (правда, без условия kf k = 0 ⇔ f = 0).
Весь этот параграф посвящен доказательству следующего фундаментального факта:
Теорема 11.1.1 (о сходимости ряда Фурье в среднем квадратичном). Всякая локально интегриру-
емая 2π-периодическая функция f на прямой R единственным образом представима в виде суммы
в среднем квадратичном тригонометрического ряда с полупериодом π

a0 X n o

f (x) = + an cos nx + bn sin nx , (11.1.9)
2 n=1

и таким рядом будет ряд Фурье с полупериодом π функции f .


! 11.1.1. Эти слова следует понимать, как выполнение двух утверждений:
(i) если an и bn – коэффициенты Фурье (11.1.6) функции f , а SN – ее многочлены Фурье
(11.1.7), то справедливо соотношение
s ˆ
1 π
kf − SN k = |f (x) − SN (x)|2 d x −→ 0 (11.1.10)
π −π N →∞

(именно так интерпретируется в теореме 11.1.1 равенство (11.1.9)), и


622 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

(ii) если an и bn – две последовательности чисел, а SN – частичные суммы соответствующего


им тригонометрического ряда (11.1.5), то из соотношения (11.1.10) следует, что числа an и
bn являются коэффициентами Фурье (11.1.6) функции f (а SN – ее многочленами Фурье
(11.1.7)).

Неподготовленному читателю формулировка теоремы 11.1.1, несомненно, покажется обескура-


живающей, потому что из сказанного до сих пор должно быть решительно непонятно, отчего раз-
ложение функции f в ряд Фурье (11.1.9) следует понимать в таком экзотическом смысле (а не,
например, как поточечную или равномерную сходимость, к которым мы привыкли в главе 9). Объ-
яснение заключается в том, что теорема 11.1.1 встретилась нам сразу как готовое утверждение, при
том, что в математике она появилась в результате длительного процесса осмысления и привыкания
к накапливающимся фактам. Дисциплина, которая занимется этими вопросами, называется гармо-
нический анализ. В ней давно было замечено, что квадратичная норма (11.1.8) чудесным образом
упрощает формулировки и доказательства, и, если в этой науке и есть результат, который можно
признать центральным, то им будет как раз теорема о разложении функции в ряд Фурье в смыс-
ле среднего квадратичного (а не поточечно или в каком-нибудь другом смысле). Именно поэтому
мы начинаем изложение теории рядов Фурье с теоремы 11.1.1. Оставшаяся часть этого параграфа
посвящена ее доказательству.

Скалярное произведение функций. Оригинальная идея, приведшая к теореме 11.1.1, заклю-


чается в том, чтобы посмотреть на функции из R(π) с несколько неожиданной точки зрения: как
на векторы в пространстве со скалярным произведением.
• Пусть f, g ∈ R(π), то есть f и g – две локально интегрируемые 2π-периодические функции.
Поскольку они интегрируемы на отрезке [−π, π], их произведение f · g тоже будет инте-
грируемо на [−π, π] в силу свойства 80 на с.435. Поэтому можно рассмотреть величину

1 π
ˆ
hf, gi = f (x) · g(x) d x (11.1.11)
π −π
Она называется скалярным произведением функций f и g. Перечислим некоторые

Свойства скалярного произведения

10 . Положительная полуопределенность:

hf, f i > 0

20 . Симметричность:
hf, gi = hg, f i
30 . Билинейность:
hα · f + β · g, hi = α · hf, hi + β · hg, hi

Доказательство. Эти свойства очевидны, например, третье следует из линейности интеграла:

1
ˆ nπ o 1 π n
ˆ o
hα · f + β · g, hi = α · f (x) + β · g(x) · h(x) d x = α · f (x) · h(x) + β · g(x) · h(x) d x =
π −π π −π
1 π 1 π
ˆ ˆ
=α· f (x) · h(x) d x + β · g(x) · h(x) d x = α · hf, hi + β · hg, hi
π −π π −π

Еще одно свойство скалярного произведения – формула, связывающая его со среднеквадратич-


ной нормой (11.1.8):
s ˆ
1 π p
kf k = |f (x)|2 d x = hf, f i (11.1.12)
π −π
§ 1. Сходимость ряда Фурье в среднем квадратичном 623

Теорема 11.1.2 (неравенство Коши-Шварца для функций). Для любых функций f, g ∈ R(π) спра-
ведливо следующее неравенство, называемое неравенством Коши-Шварца:
hf, gi 6 kf k · kgk (11.1.13)
Доказательство. Зафиксируем f и g и рассмотрим многочлен второй степени:
2 2
p(t) = hf + tg, f + tgi = hf, f i + 2thf, gi + t2 hg, gi = kf k + 2thf, gi + t2 kgk
Поскольку hf + tg, f + tgi > 0, этот многочлен должен при любом значении t быть неотрицателен:
2 2
p(t) = kf k + 2thf, gi + t2 kgk > 0, ∀t ∈ R
Значит, он не может иметь двух вещественных корней, и поэтому его дискриминант должен быть
неположительным:
D = 4hf, gi2 − 4 kf k2 · kgk2 6 0

hf, gi 6 kf k2 · kgk2
2


hf, gi 6 hf, gi 6 kf k · kgk

Свойства среднеквадратичной нормы:


1◦ . Неотрицательность:
kf k > 0. (11.1.14)

2 . Однородность:
kλ · f k = |λ| · kf k , λ∈R (11.1.15)

3 . Неравенство треугольника:
kf + gk 6 kf k + kgk . (11.1.16)

4 . Тождество параллелограмма:
2 2
kf + gk + kf − gk
= kf k2 + kgk2 . (11.1.17)
2
Доказательство. Первые два свойства очевидны, докажем неравенство треугольника (11.1.16):
2 2
kf + gk 6 kf k + kgk ⇐⇒ kf + gk 6 kf k + kgk ⇐⇒ hf, gi 6 kf k · kgk
| {z } | {z } | {z }
k k ↑
hf + g, f + gi kf k2 + 2 · kf k · kgk + kgk2 неравенство
k k Коши-Шварца (11.1.13)
hf, f i + 2hf, gi + hg, gi hf, f i + 2 · kf k · kgk + hg, gi

Тождество параллелограмма (11.1.17) доказывается прямым вычислением:


2 2 2 2 2 2 2 2
kf + gk + kf − gk kf k + 2hf, gi + kgk + kf k − 2hf, gi + kgk 2 kf k + 2 kgk 2 2
= = = kf k + kgk
2 2 2

Теорема 11.1.3 (о непрерывности скалярного произведения). Если функции fn ∈ R(π) стремятся


к функции f ∈ R(π) в смысле среднеквадратичной нормы,
kf − fn k −→ 0,
n→∞

то для любой функции g ∈ R(π)


hfn , gi −→ hf, gi
n→∞

Доказательство.
hf, gi − hfn , gi = hf − fn , gi 6 (11.1.13) 6 kf − fn k · kgk −→ 0
n→∞
624 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Ортогональность тригонометрической системы и связь скалярного произведения с ко-


эффициентами Фурье.
• Говорят, что функции f и g из R(π) ортогональны, если их скалярное произведение равно
нулю:
hf, gi = 0
• Последовательность функций fn ∈ R(π) называется ортогональной системой, если в ней
любые две функции ортогональны:
∀i 6= j hfi , fj i = 0
• Обозначим символами cosn и sinn функции
cosn (x) = cos nx, sinn (x) = sin nx (11.1.18)
и условимся символом 1 обозначать не только число 1, но и функцию, тождественно
равную единице:
1(x) = 1, x ∈ R (11.1.19)
Функции 1, cosn , sinn называются тригонометрической системой.
Лемма 11.1.4. Справедливы следующие формулы, означающие, что тригонометрическая систе-
ма функций ортогональна:
h1, 1i = 2, h1, cosn i = 0, h1, sinn i = 0, (11.1.20)
   
0, n 6= m 0, n 6= m
hcosn , sinm i = 0, hcosn , cosm i = , hsinn , sinm i = (11.1.21)
1, n=m 1, n=m
Доказательство. Это проверяется прямым вычислением с помощью тригонометрических формул,
которые мы выводили в § 1 главы 4. Например, для произведения синусов при n 6= m мы получим:

1 π
ˆ π
1
ˆ
hsinn , sinm i = sin nx · sin mx d x = (4.1.83) = {cos(n − m)x − cos(n + m)x} d x =
π −π 2π −π
sin(n − m)x x=π sin(n + m)x x=π
= − =0
2π(n − m) x=−π 2π(n + m) x=−π
А при n = m получаем
π π
1 1 2π
ˆ ˆ
hsinn , sinn i = sin nx · sin nx d x = (4.1.72) = {1 + cos 2nx} d x = =1
π −π 2π −π 2π

Лемма 11.1.5. Коэффициенты ряда Фурье произвольной функции f ∈ R(π) связаны со скалярным
произведением следующими формулами:
D E D E D E
a0 = f, 1 , an = f, cosn , bn = f, sinn (11.1.22)

Доказательство. Эти формулы проверяются простым вычислением. Например,


1 π 1 π
ˆ ˆ
hf, cosn i = (11.1.11) = f (x) · cosn (x) d x = f (x) · cos nx d x = an
π −π π −π

Лемма 11.1.6. Многочлены Фурье произвольной функции f ∈ R(π)

a0 Xn N o
SN = ·1+ ak · cosk +bk · sink (11.1.23)
2
k=1

имеют те же коэффициенты Фурье порядка не больше N , что и функция f :


D E D E
SN , 1 = a0 = f, 1 ,
D E D E
SN , cosn = an = f, cosn , n6N (11.1.24)
D E D E
SN , sinn = bn = f, sinn , n6N
§ 1. Сходимость ряда Фурье в среднем квадратичном 625

Доказательство. Действительно,
!
a0 Xn N o a0 D E X n
N D E D Eo
hSN , 1i = ·1+ ak cosk +bk sink , 1 = · 1, 1 + ak · cosk , 1 + bk · sink , 1 =
2 2
k=1 k=1

a0 Xn N o
= (11.1.20) = ·2+ ak · 0 + b k · 0 = a0
2
k=1

Аналогично, если n 6 N , то
!
a0 Xn N o
hSN , cosn i = ·1+ ak cosk +bk sink , cosn =
2
k=1

a0 D E X N n D E D Eo
= · 1, cosn + ak · cosk , cosn + bk · sink , cosn =
2
k=1
XN n   o
a0 0, если k 6= n
= (11.1.20), (11.1.21) = ·0+ ak · + b k · 0 = an
2 1, если k = n
k=1

Точно также доказывается последняя формула из (11.1.24).

Минимальное свойство многочленов Фурье.


• Если f, g ∈ R(π), то расстоянием от f до g называется величина

kf − gk

Лемма 11.1.7. Среди всевозможных тригонометрических многочленов P степени N самым


близким к функции f ∈ R(π) по среднеквадратичной нормеn является o ее многочлен Фурье SN
a20 PN 2 2
степени N , расстояние до которого равно hf, f i − 2 − n=1 an + bn :

a20 X n 2 o
N
min kf − P k = kf − SN k = hf, f i − − an + b2n (11.1.25)
P 2 n=1

(an и bn – коэффициенты Фурье (11.1.22)).

Доказательство. Зафиксируем f и обозначим

λ0 X n o a0 X n o
N N
P = + λn cosn +µn sinn , SN = + an cosn +bn sinn
2 n=1
2 n=1

– здесь числа an и bn вычисляются по формулам (11.1.22), поэтому их мы считаем фиксированными,


а числа λn и µn , наоборот, могут меняться. Тогда:
* +
λ0 X n o λ0 X n o
N N
2
kf − P k = hf −P, f −P i = f − − λn cosn +µn sinn , f − − λn cosn +µn sinn =
2 n=1
2 n=1
  * +
λ0 λ0 Xn
N o XnN o
= hf, f i + , + λn cosn +µn sinn , λn cosn +µn sinn −
2 2
| {z } | n=1
{z
n=1
}
k k
λ2 PN n o
0 · h1, 1i
4 n=1 λ2n · hcosn , cosn i + µ2n · hsinn , sinn i
  * N + * +
λ0 Xn o λ0 X n
N o
− 2 · f, −2 · f, λn cosn +µn sinn −2 · , λn cosn +µn sinn =
2 2 n=1
| {z } |
n=1
{z } | {z }
k k k
λ0 · hf, 1i PN n o
λn · hf, cosn i + µn · hf, sinn i 0
n=1
626 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

XN n o XN n o
λ20
= hf, f i+ ·h1, 1i+ λ2n ·hcosn , cosn i+µ2n ·hsinn , sinn i −λ0 · hf, 1i −2· λn · hf, cosn i +µn · hf, sinn i =
4 n=1
| {z } n=1
| {z } | {z }
(11.1.24) k (11.1.24) k (11.1.24) k
a0 an bn

λ20 X n 2 o
N XN n o
= hf, f i + + λn + µ2n − λ0 · a0 − 2 · λn · an + µn · bn =
2 n=1 n=1

a2 X  2  X
N N   a2 X N n o
λ20
= hf, f i+ − λ0 · a0 + 0 + λn − 2 · λn · an + a2n + µ2n − 2 · µn · bn + b2n − 0 − a2n +b2n =
|2 {z 2} n=1 | {z } n=1 | {z } 2 n=1
k k k
(λ0 −a0 )2 (λn − an )2 (µn − bn )2
2

a2 X n 2 o
N N N
(λ0 − a0 )2 X X
= hf, f i + + (λn − an )2 + (µn − bn )2 − 0 − an + b2n >
2 n=1 n=1
2 n=1
| {z }
достигает минимума при λn = an , µn = bn
то есть при P = SN

a20 X n 2 o
N
2 2
> hf, f i − − an + b2n = kf − P k P =SN
= kf − SN k
2 n=1

Полнота тригонометрической системы.

Лемма 11.1.8. Для всякой функции f ∈ R(π) и любого ε > 0 найдется тригонометрический
многочлен P , расстояние от которого до f меньше ε:

kf − P k < ε (11.1.26)

Доказательство. Обозначим
M= sup |f (x)|
x∈[−π,π]

Воспользуемся сначала теоремой 9.2.2, и подберем непрерывную функцию g на [−π, π] так, чтобы
выполнялись условия:
π
π · ε2
ˆ
|f (x) − g(x)| d x < , sup |g(x)| 6 M, g(−π) = g(π)
−π 8M x∈[−π,π]

Тогда
π π
1 1
ˆ ˆ
2
kf − gk = |f (x) − g(x)|2 d x = |f (x) − g(x)| ·|f (x) − g(x)| d x 6
π −π π −π | {z }
>

|f (x)| + |g(x)|
>

2M
π
2M 2M π · ε2 ε2
ˆ
6 |f (x) − g(x)| d x < · =
π −π π 8M 4


ε
kf − gk <
2
Далее заметим, что поскольку функция g непрерывна на [−π, π] и принимает одинаковые значения
на концах этого отрезка, ее можно продолжить до непрерывной 2π-периодической функции на всю
прямую R. Тогда воспользовавшись теоремой 9.2.12 мы сможем подобрать тригонометрический
многочлен P так, чтобы
ε
sup |g(x) − P (x)| < √
x∈[−π,π] 2 2
§ 1. Сходимость ряда Фурье в среднем квадратичном 627

Для него мы получим:


π π
1 1 ε2 ε2
ˆ ˆ
kg − P k2 = |g(x) − P (x)|2 d x 6 dx =
π −π | {z } π −π 8 4

>
ε2
8


ε
kg − P k <
2
Вместе получается:
ε ε
kf − P k = k(f − g) + (g − P )k 6 (11.1.16) 6 kf − gk + kg − P k < + =ε
2 2

Неравенство Бесселя.

Лемма 11.1.9. Пусть an и bn – коэффициенты Фурье (11.1.22) функции f ∈ R(π). Тогда числовой
ряд
a20 X n 2 o

+ an + b2n
2 n=1

сходится, причем его сумма не превосходит величины hf, f i:

a20 X n 2 o
∞ π
1
ˆ
+ an + b2n 6 hf, f i = f (x)2 d x (11.1.27)
2 n=1
π −π

Доказательство. 1. Докажем следующую формулу:

a20 X n 2 o
N
hf, SN i = hSN , SN i = + an + b2n (11.1.28)
2 n=1

Действительно, с одной стороны,


* +
a0 Xn N o
hf, SN i = f, ·1+ ak · cosk +bk · sink =
2
k=1

a0 D E X n D E D Eo a2 X n 2 o
N N
= · f, 1 + ak · f, cosk + bk · f, sink = (11.1.22) = 0 + an + b2n
2 2 n=1
k=1

А с другой,
* N n
+
a0 X o
hSN , SN i = SN , ·1+ ak · cosk +bk · sink =
2
k=1

a0 D E XN n D E D Eo a2 X n 2 o
N
= · SN , 1 + ak · SN , cosk + bk · SN , sink = (11.1.24) = 0 + an + b2n
2 2 n=1
k=1

2. Обозначим
RN = f − SN
и заметим, что SN и RN ортогональны:
D E
SN , RN =0 (11.1.29)

Действительно,
D E D E D E D E
SN , RN = SN , f − SN = SN , f − SN , SN = (11.1.28) = 0
628 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

3. Теперь докажем формулу


D E D E D E
f, f = SN , SN + RN , RN (11.1.30)

Действительно,
D E D E D E D E
f, f = SN + RN , SN + RN = SN + RN , SN + SN + RN , RN =
D E D E D E D E D E D E
= SN , SN + RN , SN + SN , RN + RN , RN = SN , SN + RN , RN
| {z }
k
0
в силу (11.1.29)

4. Из (11.1.30) следует:

D E D E D E D E a2 X n 2
N o
f, f = (11.1.30) = SN , SN + RN , RN > SN , SN + 0 = (11.1.28) = 0 + an + b2n
| {z } 2 n=1
свойство 10
>

то есть,
a20 X n 2 o D E
N
+ an + b2n 6 f, f (11.1.31)
2 n=1

a2 P∞ n o
Это верно при любом N ∈ N, поэтому ряд 20 + n=1 a2n + b2n сходится. При этом, автоматически
выполняется (11.1.27):
!
a20 X n 2 o a20 X n 2 o
∞ N
1 π
ˆ
2 2
+ an + bn = lim + an + b n 6 (11.1.31) 6 hf, f i = f (x)2 d x
2 n=1
N →∞ 2 n=1
π −π

Равенство Парсеваля.
Лемма 11.1.10. Для всякой функции f ∈ R(π) выполняется следующее равенство, называемое
равенством Парсеваля:

a20 X n 2 o
∞ π
1
ˆ
+ an + b2n = hf, f i = f (x)2 d x (11.1.32)
2 n=1
π −π

(здесь an и bn – коэффициенты Фурье (11.1.22) функции f ).


Доказательство. По лемме 11.1.9, ряд в левой части этой формулы должен сходиться, причем его
сумма, обозначим ее C, не превосходит величины hf, f i:

a20 X n 2 o

+ an + b2n = C 6 hf, f i
2 n=1

Наша задача – убедиться, что C > hf, f i. Зафиксируем ε > 0 и по лемме 11.1.8 подберем тригоно-
метрический многочлен P , для которого выполняется (11.1.26):

kf − P k < ε

Пусть N – степень этого тригонометрического многочлена. Тогда:

kf − P k2 < ε2
| {z }
6

(11.1.25)
kf − SN k2
=

(11.1.25)
a2 PN n o
hf, f i − 0
2 − n=1 a2n + b2n
§ 1. Сходимость ряда Фурье в среднем квадратичном 629

a20 X n 2 o a2 X n 2 o
N ∞
hf, f i < + an + b2n + ε2 6 0 + an + b2n + ε2 = C + ε2
2 n=1
2 n=1

hf, f i < C + ε2

Это верно для любого ε > 0, значит hf, f i 6 C.

Доказательство основной теоремы.

Лемма 11.1.11. Для всякой функции f ∈ R(π) выполняется соотношение (11.1.10),

kf − SN k −→ 0,
N →∞

в котором SN – многочлены Фурье (11.1.7) функции f .

Доказательство.
 o
a20 X n 2
N
2 (11.1.25)
kf − SN k = hf, f i − + an + b2n −→ 0
2 n=1
N →∞
| {z }
N
↓ ↓

a2 P∞ n o
0
2 + n=1 a2n + b2n
=

(11.1.32)
hf, f i

Лемма 11.1.12. Пусть an и bn – две последовательности чисел и

a0 X n o
N
SN = + an · cosn +bn · sinn
2 n=1

– последовательность частичных сумм соответствующего им тригонометрического ряда с по-


лупериодом π. Если функции SN сходятся в среднем квадратичном к некоторой локально инте-
грируемой 2π-периодической функции f ,

kf − SN k −→ 0,
N →∞

то числа an и bn являются коэффициентами Фурье (11.1.6) функции f .

Доказательство. Для всякого k ∈ N

теорема 11.1.3
kf − SN k −→ 0 =⇒ hSN , cosk i −→ hf, cosk i =⇒ ak = hf, cosk i
N →∞ | {z } N →∞
=

D PN n o E
a0
2 + n=1 an · cosn +bn · sinn , cosk
=

ak ,
при N > k

и точно также, заменяя cosk на sink и на 1, мы получаем равенства

bk = hf, sink i, a0 = hf, 1i.


630 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

§2 Поточечная и равномерная сходимость ряда Фурье


Теорема 11.1.1 о разложении в ряд Фурье локально интегрируемой 2π-периодической функции f
ничего не говорит о том, будет ли этот ряд сходиться к функции f поточечно, то есть, можно ли
утверждать, что для всякого x ∈ R выполняется соотношение

a0 X n o
N
+ an cos nx + bn sin nx −→ f (x)
2 n=1
N →∞

(где an и bn – коэффициенты Фурье (11.1.6) функции f ). Следующий элементарный пример пока-


зывает, что это не всегда верно.

nxo 2π
⋄ 11.2.1. Рассмотрим функцию 1
ˆ
bn = · sin nx d x =
nxo 0π 2π
f (x) = 1 2π x
ˆ
2π = · sin nx d x =
x π 0 2π
(взятие дробной части от 2π ). Она локально ин- ˆ 2πn
тегрируема и имеет период 2π. Вычислим ее ко- 1
=− 2 x d cos nx =
эффициенты Фурье: 2π n 0
ˆ 2π
nxo 1 2π 1
1 π
1 2π n x o = − 2 · x · cos nx + 2 cos nx d x =
ˆ ˆ
a0 = dx = dx = 2π n | {z 0 } 2π n 0
π −π 2π π 0 2π

=
1 2π x x2 x=2π
ˆ

= dx = =1
π 0 2π 4π 2 x=0 1 1 2π 1
=− + 2 2 · sin nx =−
πn 2π n | {z 0 } πn
nxo

=

1
ˆ
an = · cos nx d x = 0
π0 2π
1 2π x
ˆ
Ряд Фурье получается такой:
= · cos nx d x =
π 0 2π

1 X 1
ˆ 2π
1
= x d sin nx = − · sin nx
2π 2 n 0 2 n=1 πn

ˆ 2π
1 1
= · x · sin nx − sin nx d x = и в точке x = 0 он сходится не к значению f (0):
2π 2 n | {z 0 } 2π n 0
2
=

N
0
1 X 1 1
1 2π − · sin 0 −→ 6= 0 = f (0)
= · cos nx =0 2 n=1 πn N →∞ 2
2π 2 n2 0 | {z }
=

Уже из этого примера видно, что если мы хотим, чтобы ряд Фурье сходился к функции f
поточечно, то нужно как-то сузить класс изучаемых функций, перейдя от класса R(π) (локально
интегрируемых функций с полупериодом π) к каким-то его подклассам. В этом параграфе мы
рассмотрим два таких подкласса, для которых поточечная сходимость ряда Фурье сохраняется, хотя
и в разных смыслах: это классы кусочно-непрерывных и кусочно-гладких функций с полупериодом
π. Попутно мы сформулируем для них теоремы о равномерной сходимости ряда Фурье.

(a) Кусочно-непрерывные и кусочно-гладкие функции на R


• Функция f на прямой R называется
— кусочно-непрерывной (на R), если она кусочно непрерывна на любом отрезке1 [a, b] ⊂ R;
это означает выполнение двух условий:
(1) на любом отрезке [a, b] она непрерывна во всех точках, кроме, возможно, конечного
набора;
1 Напомним, что определение кусочно-непрерывной функции на отрезке было дано выше на с. 451.
§ 2. Поточечная и равномерная сходимость ряда Фурье 631

(2) в каждой точке разрыва c ∈ R функция f имеет конечные левый и правый пределы

f (c − 0) = lim f (x), f (c + 0) = lim f (x) (11.2.33)


x→c−0 x→c+0

— кусочно-гладкой (на R), если она кусочно гладкая на любом отрезке2 [a, b] ⊂ R; это
означает выполнение следующих условий:
(1) на любом отрезке [a, b] она дифференцируема во всех точках, кроме, возможно,
конечного набора;
(2) в каждой точке c ∈ R, где f дифференцируема, ее производная непрерывна,

f ′ (c) = lim f ′ (x) (11.2.34)


x→c

(3) в каждой точке c ∈ R, где f не дифференцируема, она обладает следующими свой-


ствами:
(i) f имеет конечные левый и правый пределы

f (c − 0) = lim f (x), f (c + 0) = lim f (x) (11.2.35)


x→c−0 x→c+0

(ii) f имеет конечные левую и правую производные

′ f (x) − f (c − 0) ′ f (x) − f (c + 0)
f− (c) = lim , f+ (c) = lim (11.2.36)
x→c−0 x−c x→c+0 x−c
(iii) при приближении аргумента x к c справа или слева, значение f ′ (x) стремится
′ ′
соответственно к f− (c) или f+ (c):

f− (c) = lim f ′ (x), ′
f+ (c) = lim f ′ (x) (11.2.37)
x→c−0 x→c+0

Из теоремы 7.3.8 следует


Теорема 11.2.1. Любая кусочно-непрерывная функция f на R локально интегрируема.

⊲ 11.2.2. Функция с графиком

f (x) = sgn sin x

имеющая график

тоже 2π-периодическая и кусочно-гладкая.


⋄ 11.2.4. А функция
p
f (x) = | sin x|
с графиком

является 2π-периодической и кусочно-гладкой.

⊲ 11.2.3. Функция

f (x) = arcsin sin x хотя и 2π-периодическая, но не кусочно-гладкая,


2 Определение кусочно-гладкой функции на отрезке приводилось выше на с. 453.
632 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

потому что в точке x ∈ πZ не имеет односторон- них производных.

• Говорят, что кусочно-непрерывная функция f на прямой R удовлетворяет тождеству


Лебега, если в каждой точке c ∈ R ее значение f (c) равно среднему арифметическому
левого и правого пределов в этой точке:
f (x − 0) + f (x + 0)
f (x) = , x∈R (11.2.38)
2
Очевидно, это равенство автоматически выполняется в точках непрерывности, так как в
этом случае f (x − 0) = f (x) = f (x + 0), и значит
f (x − 0) + f (x + 0) f (x) + f (x)
= = f (x)
2 2
Поэтому тождество (11.2.38) нужно проверять только в точках разрыва функции f .

⋄ 11.2.5. Функция ⋄ 11.2.6. А наоборот, функция



 (
0, x<0
0, x<0
f (x) = 12 , x=0 f (x) =

 1, x>0
1, x>0
с графиком с графиком

очевидно, удовлетворяет тождеству Лебега. не удовлетворяет тождеству Лебега.

(b) Суммирование ряда Фурье обычным способом


Теорема 11.2.2 (о поточечной и равномерной сходимости ряда Фурье). Для всякой кусочно-
гладкой 2π-периодической функции f на прямой R ее ряд Фурье с полупериодом π сходится в
каждой точке x ∈ R к среднему арифметическому ее левого и правого пределов в этой точке:

a0 X n o

f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R. (11.2.39)
2 2 n=1

В частности, если f удовлетворяет тождеству Лебега (11.2.38), то она является поточечной


суммой своего ряда Фурье:

a0 X n o

f (x) = + an cos nx + bn sin nx , x ∈ R. (11.2.40)
2 n=1

Кроме того,
(i) если f – непрерывная (и по-прежнему, кусочно-гладкая и 2π-периодическая) функция на
R, то ряд (11.2.40) сходится к ней на прямой R равномерно:3

a0 X n o
N
f (x) − − an cos nx + bn sin nx −→ 0; (11.2.41)
2 n=1
N →∞
x∈R
3 Норма k·kE была определена формулой (9.1.6).
§ 2. Поточечная и равномерная сходимость ряда Фурье 633

(ii) если f – бесконечно гладкая (и по-прежнему, 2π-периодическая) функция на R, то ряд


(11.2.40) сходится к ней на прямой R равномерно по производным:4
(m)
a0 X n o
N
∀m ∈ Z+ f (x) − − an cos nx + bn sin nx −→ 0. (11.2.42)
2 n=1
N →∞
x∈R

Доказательство этого факта мы разобьем на несколько лемм, и посвятим ему оставшуюся часть
этого пункта.

Лемма Римана.

Лемма 11.2.3. Если функция W интегрируема на отрезке [a, b], то


ˆ b ˆ b
W (x) · cos p x d x −→ 0, W (x) · sin p x d x −→ 0 (11.2.43)
a p→+∞ a p→+∞

Доказательство. Эти соотношения доказываются одинаково, поэтому мы докажем только второе


(в действительности, только оно используется при доказательстве теоремы 11.2.2).
1. Прежде всего, нужно заметить, что если функция W постоянна, то утверждение будет оче-
видно:
 
C
p · cos p a − cos p b
=

x=b
−C
p · cos px
x=a
=

z }| {
b b
|C|
ˆ ˆ
W (x) · sin px d x = C · sin px d x = · cos p a − cos p b 6
a a p
|C|   |C|
6 · | cos p a| + | cos p b| 6 · 2 −→ 0
p p p→+∞

2. Из этого следует, что если функция W кусочно-постоянна,

W (x) = Ci , x ∈ (xi−1 , xi )

то соотношение также верно:


ˆ b k ˆ
X xi
W (x) · sin px d x = Ci · sin px d x −→ 0
a xi−1 p→+∞
i=1

3. Теперь если W – произвольная интегрируемая функция, то для всякого ε > 0 можно по


теореме 9.2.1 выбрать кусочно-постоянную функцию g на [a, b] так, чтобы выполнялось
b
ε
ˆ
|W (x) − g(x)| d x <
a 2
´b
Тогда, по уже доказанному, a g(x) · cos px d x −→ 0, и значит можно выбрать P так, чтобы
p→+∞

b
ε
ˆ
∀p > P g(x) · cos px d x < ,
a 2

В результате, для всякого p > P мы получим:

ˆ b ˆ b   ˆ b
W (x) · sin px d x = W (x) − g(x) · sin px d x + g(x) · sin px d x 6
a a a

4 Норма (m)
k·kE была определена формулой (9.1.47).
634 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

ˆ b   ˆ b
ε ε
6 W (x) − g(x) · sin px d x + g(x) · sin px d x < + =ε
a a 2 2
| {z } | {z }

>

>
´b ε
a
|W (x) − g(x)| · | sin px| d x 2

>
´b
a
|W (x) − g(x)| d x

>
ε
2

Это доказывает второе соотношение в (11.2.43).

Ядро Дирихле.
• Ядром Дирихле называется функция
N
1 X
DN (t) := + cos nt (11.2.44)
2 n=1

Свойства ядра Дирихле:


1◦ . Ядро Дирихле DN является четной непрерывной 2π-периодической функцией на R.
DN (−t) = DN (t), DN (t + 2π) = DN (t)
2◦ . Интеграл по периоду от ядра Дирихле равен π:
ˆ π ˆ π
DN (t) d t = 2 DN (t) d t = π (11.2.45)
−π 0

3◦ . Ядро Дирихле удовлетворяет тождеству:



N + 1 , t ∈ 2πZ
2
DN (t) = sin(N + 12 )t (11.2.46)
 t , t∈
/ 2πZ
2 sin 2

Доказательство. Свойство 1◦ вытекает из определения DN формулой (11.2.44), а формула (11.2.45)


доказывается прямым вычислением. Тождество (11.2.46) для точек вида t = 2πk доказывается
вычислением:
N N
1 X 1 X 1
DN (2πk) = + cos(2πnk) = + 1= +N
2 n=1 2 n=1 2
а для точек t 6= 2πk – умножением на 2 sin 2t :

1 N
X  N N      
t t X t t X 1 1
+ cos nt ·2 sin = sin + 2 cos nt·sin = sin + − sin n − t + sin n + t =
2 n=1 2 2 n=1 2 2 n=1 2 2
      
t t 3t 3t 5t 1  1
= sin + − sin + sin + − sin + sin + ... + − sin N − t + sin N + t =
| {z2} | {z 2} | {z2} | {z 2} | {z2} | {z 2 } 2
↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑
 
1
= sin N + t
2

Интегралы Дирихле.
Лемма 11.2.4. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен
Фурье SN с полупериодом π выражается через ядро Дирихле DN формулами
1 π
ˆ
SN (x) = f (x + t) · DN (t) d t, x∈R (11.2.47)
π −π

1 πn o
ˆ
SN (x) = f (x + t) + f (x − t) · DN (t) d t, x∈R (11.2.48)
π 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 635

• Интегралы в правых частых формул (11.2.47) и (11.2.48) называются интегралами Ди-


рихле.
Доказательство. Сначала (11.2.47):

a0 X n o
N
SN (x) = + ak cos kx + bk sin kx = (11.1.6) =
2
k=1
ˆ π XN  
1 1 1 π 1 π
ˆ ˆ
= · f (y) d y + cos kx f (y) cos ky d y + sin kx f (y) sin ky d y =
2 π −π π −π π −π
k=1
( N
) ( N
)
1 π 1 X 1 π 1 X
ˆ ˆ
= f (y) + cos kx · cos ky + sin kx · sin ky d y = f (y) + cos k(y − x) d y =
π −π 2 π −π 2
k=1 k=1
1 π 1 π−x
ˆ ˆ
y − x = t, y = x + t, d y = d t
= f (y) · D(y − x) d y = = f (x + t) · D(t) d t =
π −π y ∈ [−π, π] ⇔ t ∈ [−π − x, π − x] π −π−x
 
интеграл от периодической 1 π
ˆ
= функции по периоду равен = f (x + t) · DN (t) d t
интегралу по “сдвинутому периоду” π −π

После этого (11.2.47) следует (11.2.48):

1 π 1 0 1 π
ˆ ˆ ˆ
SN (x) = f (x + t) · DN (t) d t = f (x + t) · DN (t) d t + f (x + t) · DN (t) d t =
π −π π −π π 0
 
в первом интеграле 1 0 1 π
ˆ ˆ
= делаем замену =− f (x − s) · DN (−s) d s + f (x + t) · DN (t) d t =
t = −s π π π 0
 
вспоминием, что DN 1 0 1 π
ˆ ˆ
= – четная функция: = − f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
DN (−s) = DN (s) π π π 0
 
в первом интеграле 1 π 1 π
ˆ ˆ
= переворачиваем = f (x − s) · DN (s) d s + f (x + t) · DN (t) d t =
пределы интегрирования π 0 π 0
 
в первом интеграле 1 π 1 π
ˆ ˆ
= делаем замену = f (x − t) · DN (t) d t + f (x + t) · DN (t) d t =
s=t π 0 π 0
1 πn o
ˆ
= f (x + t) + f (x − t) · DN (t) d t
π 0

Поточечная сходимость ряда Фурье. Мы можем теперь доказать ту часть теоремы 11.2.2, где
речь идет о поточечной сходимости:
Лемма 11.2.5. Для всякой кусочно-гладкой 2π-периодической функции f на прямой R ее ряд Фурье
с полупериодом π сходится в каждой точке x ∈ R к среднему арифметическому ее левого и правого
пределов в этой точке:

a0 X n o

f (x − 0) + f (x + 0)
= + an cos nx + bn sin nx , x ∈ R.
2 2 n=1

Доказательство. Пусть f – кусочно-гладкая 2π-периодическая функция. Рассмотрим функции


 f (x+t)−f (x+0)   f (x−t)−f (x−0) 
, t ∈ (0, π] −t , t ∈ (0, π]
A(t) = t
′ , B(t) = ′
f+ (0), t = 0 f− (0), t = 0

Они должны быть кусочно-непрерывны на отрезке [0, π], потому что в точке t = 0 они непрерывны,
а при t ∈ (0, π] они получаются умножением кусочно-непрерывных функций g(t) = f (x+t)−f (x+0)
и h(t) = f (x − t) − f (x − 0) на непрерывную функцию 1t .
Кроме того, если рассмотреть функцию
( )
t
2 sin 2t
t ∈ (0, π]
C(t) =
1, t = 0
636 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

то она будет непрерывна на отрезке [0, π].


Из этого можно сделать вывод, что функция
n o
W (t) = A(t) − B(t) · C(t)

кусочно-непрерывна на отрезке [0, π].


f (x+0)+f (x−0)
Теперь рассмотрим разность между 2 и частичной суммой SN (x) ряда Фурье:

f (x + 0) + f (x − 0)
SN (x) − =
ˆ π n2 o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · DN (t) d t − · DN (t) d t =
π 2 π
| 0 {z } | 0 {z }
=

=
(11.2.48) (11.2.45)
SN (x) 1

1 nˆ π o 1 πn
ˆ o
= f (x + t) + f (x − t) · DN (t) d t − f (x + 0) + f (x − 0) · DN (t) d t =
π
0 π 0
1 πn o
ˆ
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · DN (t) d t =
π
ˆ 0
1 π nh i h io
= f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · DN (t) d t =
π 0
1 π nh
ˆ i h io sin N + 1  t
2
= (11.2.46) = f (x + t) − f (x + 0) + f (x − t) − f (x − 0) · dt =
π 0 2 sin 2t
ˆ    
1 π f (x + t) − f (x + 0) f (x − t) − f (x − 0) t 1
= − · · sin N + t dt =
π 0 | t
{z } | −t
{z } 2 sin 2t 2
| {z }
=

=
A(t) B(t) C(t)
| {z }
=

W (t)
π  
1 1
ˆ
= W (t) · sin N + t d t −→ 0
π 0 2 N →∞

Мы получили нужное соотношение:


f (x + 0) + f (x − 0)
SN (x) −→
N →∞ 2

Дифференцирование ряда Фурье. Если f – непрерывная кусочно-гладкая 2π-периодическая


функция на R, то ее производная f ′ может быть определена не всюду на R (потому что в некоторых
точках на R функция f может быть недифференцируема). Тем не менее, как мы помним, по теореме
7.3.11, будут однозначно определены интегралы вида
ˆ π ˆ π
g(x) · f ′ (x) d x = g(x) d f (x)
−π −π

где g – произвольная кусочно-непрерывная функция. В частности, поэтому для f ′ можно опреде-


лить коэффициенты ряда Фурье:
1 π ′ 1 π ′ 1 π ′
ˆ ˆ ˆ
α0 = f (x) d x, αn = f (x) · cos nx d x, βn = f (x) · sin nx d x, (11.2.49)
π −π π −π π −π
Таким образом, f ′ тоже порождает какой-то ряд Фурье (с коэффициентами αn , βn ). Оказывается,
что ряд Фурье для f ′ получается из ряда Фурье для f почленным дифференцированием. Вот как
точно выглядит это утверждение:
Лемма 11.2.6. Пусть f – непрерывная кусочно-гладкая 2π-периодическая функция на R. Тогда
коэффициенты Фурье (11.2.49) производной f ′ связаны с коэффициентами Фурье (11.1.6) функции
f формулами
α0 = 0, αn = n · bn , βn = −n · an , n∈N (11.2.50)
§ 2. Поточечная и равномерная сходимость ряда Фурье 637

! 11.2.7. Объясним, почему это интерпретируется, как возможность почленно дифференцировать


ряд Фурье. Обозначим символами SN [f ] и SN [f ′ ] соответственно частичные суммы рядов Фурье
функций f и f ′

a0 X n o α0 X n o
N N
SN [f ](x) = + an cos nx + bn sin nx , SN [f ′ ](x) = + αn cos nx + βn sin nx
2 n=1
2 n=1

Тогда из леммы 11.2.6 следует, что SN [f ′ ] получается из SN [f ] дифференцированием:


 ′
SN [f ′ ] = SN [f ] (11.2.51)

Действительно,
!
 ′ a0 X n
N o ′ X N n o
SN [f ] (x) = + an cos nx + bn sin nx = − n · an sin nx + n · bn cos nx =
2 n=1 n=1
XN n o α XN n o
α0 0
= (11.2.50) = + βn sin nx + αn cos nx = + αn cos nx + βn sin nx = SN [f ′ ](x)
2
|{z} n=1
2 n=1
=

Доказательство. Для α0 мы используем формулу (7.3.146):


1 π ′ 1 π 1 x=π
ˆ ˆ
α0 = f (x) d x = d f (x) = (7.3.146) = · f (x)
π −π π −π π x=−π

А для αn и βn это доказывается интегрированием по частям (с применением теоремы 7.3.14):


π π
1 1
ˆ ˆ
αn = f ′ (x) · cos nx d x = cos nx d f (x) = (7.3.147) =
π −π π −π
1 1 π
x=π 1 π
ˆ ˆ
= · cos nx · f (x) − f (x) d cos nx = n · f (x) · sin nx d x = n · bn
π x=−π π −π π −π
| {z }
=

0,
потому что cosn и f –
2π-периодические
функции

и
π
1 1 π
ˆ ˆ

βn = f (x) · sin nx d x = sin nx d f (x) = (7.3.147) =
π −π π −π
1 x=π 1 π 1 π
ˆ ˆ
= · sin nx · f (x) − f (x) d sin nx = −n · f (x) · cos nx d x = −n · an
π x=−π π −π π −π
| {z }
=

0,
потому что sinn и f –
2π-периодические
функции

Равномерная сходимость ряда Фурье непрерывной кусочно-гладкой функции. Теперь


мы можем доказать часть (i) теоремы 11.2.2, то есть следующее утверждение:
Лемма 11.2.7. Непрерывная кусочно-гладкая 2π-периодическая функция f является равномерной
суммой своего ряда Фурье (11.2.40).
Доказательство. Заметим, что, поскольку функция f ′ интегрируема на [−π, π], по лемме 11.1.9,
ряд из квадратов ее коэффициентов Фурье должен сходиться:
∞ n
X o
α2n + βn2 < ∞
n=1
638 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

Отсюда следует такая цепочка:


2 
1 2
0 6 |βn | − n1 = βn2 − 2|βnn | + 1
n2 0 6 |αn | − n = α2n − 2|αnn | + 1
n2
⇓ ⇓
2|βn | 2|αn |
n 6 βn2 + n12 n 6 α2n + n12
⇓ ⇓
 
|an | = |βnn | 6 12 · βn2 + n12 |bn | = |αn |
n 6 21 · α2n + n12
| {z }

X∞ n o 1 X ∞ n o X∞
2 2 1
|an | + |bn | 6 · αn + βn + 2
<∞
n=1
2 n=1 n=1
n


X ∞ n
X o ∞ n
X o
kan cos nx + bn sin nxkx∈R 6 kan cos nxkx∈R + kbn sin nxkx∈R = |an | + |bn | < ∞
n=1 n=1 n=1
⇓ теорема Вейерштрасса 9.1.5
∞ n
X o
ряд an cos nx + bn sin nx сходится равномерно на R
n=1
Мы получили, что ряд Фурье функции f сходится равномерно к некоторой функции S. Но с другой
стороны, по лемме 11.2.5 этот ряд должен поточечно сходиться к функции f . Значит, S = f , и ряд
Фурье этой функции сходится к ней равномерно.

Равномерная по производным сходимость ряда Фурье непрерывной кусочно-гладкой


функции. Теперь мы можем доказать часть (ii) теоремы 11.2.2, то есть следующее утверждение:
Лемма 11.2.8. Бесконечно гладкая 2π-периодическая функция f является равномерной по произ-
водным суммой своего ряда Фурье (11.2.40).
Доказательство. Для всякого k ∈ Z+ рассмотрим производную f (k) порядка k функции f , и пусть
SN [f (k) ] обозначает многочлен Фурье функции f (k) :
(k) XN n o
a0
SN [f (k) ](x) = + a(k) (k)
n cos nx + bn sin nx ,
2 n=1
π ˆ π
1 1 1 π (k)
ˆ ˆ
(k)
α0 = f (k) (x) d x, αn(k) = (k)
f (x) · cos nx d x, (k)
βn = f (x) · sin nx d x.
π −π π −π π −π
Формула (11.2.51), применительно к функции f (k) , означает, что SN [f (k+1) ] получается из SN [f (k) ]
дифференцированием:   ′
SN [f (k+1) ] = SN [f (k) ]
Отсюда по индукции можно заключить, что SN [f (k) ] есть просто производная порядка k из SN [f ]
(частичной суммы ряда Фурье исходной функции f ):
 (k)
SN [f (k) ] = SN [f ] (11.2.52)

Теперь заметим, что каждая функция f (k) является гладкой и 2π-периодической, поэтому по лемме
11.2.7 ее ряд Фурье должен сходиться к ней равномерно на R, то есть
f (k) − SN [f (k) ] −→ 0
R N →∞

В силу (11.2.52) это можно интерпретировать, как равномерное стремление к нулю производной
порядка k от разности f − SN [f ]:
 (k)  (k)
f − SN [f ] = f (k) − SN [f ] = (11.2.52) = f (k) − SN [f (k) ] −→ 0
R R R N →∞

Отсюда для всякого m ∈ Z+ получаем нужное нам соотношение:


(k) m
X 1  (k)
f − SN [f ] = (9.1.47) = · f − SN [f ] −→ 0
R k! R N →∞
k=0
§ 2. Поточечная и равномерная сходимость ряда Фурье 639

(c) Суммирование ряда Фурье методом арифметических средних


Если 2π-периодическая функция f не является кусочно-гладкой, а, скажем, только кусочно-непре-
рывной и удовлетворяющей тождеству Лебега (11.2.38), то из теоремы 11.2.2 не следует, что она
должна быть поточечной суммой своего ряда Фурье. Это не случайно: как оказывается, существу-
ют такие кусочно-непрерывные, и даже непрерывные, функции, у которых ряд Фурье не сходится
в некоторых точках. Несмотря на это, кусочно-непрерывную 2π-периодическую функцию f , удо-
влетворяющую тождеству Лебега, всегда можно считать поточечной суммой своего ряда Фурье, но
в несколько неожиданном смысле: для этого нужно f понимать как предел не многочленов Фу-
рье SN , а их арифметических средних. Это оригинальное наблюдение принадлежит венгерскому
математику Липоту Фейеру, и в этом пункте мы поговорим о его результатах.
• Пусть SN – частичные суммы ряда Фурье с полупериодом π для функции f :

a0 X n o
N
SN (x) = + an cos nx + bn sin nx
2 n=1

(коэффициенты вычисляются по формулам (11.1.6)). Арифметические средние этой по-


следовательности, то есть функции
N −1
1 X
σN (x) = Sn (x) (11.2.53)
N n=0

называются многочленами Фейера функции f .


Теорема 11.2.9 (Фейер). Для всякой кусочно-непрерывной 2π-периодической функции f на прямой
R ее многочлены Фейера σN сходятся в каждой точке x ∈ R к среднему арифметическому ее левого
и правого пределов в этой точке:
f (x − 0) + f (x + 0)
= lim σN (x), x ∈ R. (11.2.54)
2 N →∞

В частности, если f удовлетворяет тождеству Лебега (11.2.38), то она является поточечным


пределом своей последовательности многочленов Фейера:
f (x) = lim σN (x), x ∈ R. (11.2.55)
N →∞

Кроме того,
(i) если f – непрерывная (и, по-прежнему, 2π-периодическая) функция на R, то то много-
члены Фейера сходятся к ней на прямой R равномерно:5
kf (x) − σN (x)kx∈R −→ 0; (11.2.56)
N →∞

(ii) если f – бесконечно гладкая (и по-прежнему, 2π-периодическая) функция на R, то мно-


гочлены Фейера сходятся к ней на прямой R равномерно по производным:6
(m)
∀m ∈ Z+ kf (x) − σN (x)kx∈R −→ 0. (11.2.57)
N →∞

Как и в случае с теоремой 11.2.2, доказательство этого факта мы разобьем на несколько лемм.

Ядро Фейера.
• Ядром Фейера называется арифметическое среднее ядер Дирихле
N −1 N −1 n
!
1 X 1 X 1 X
ΦN (t) = Dn (x) = + cos kt (11.2.58)
N n=0 N n=0 2
k=1

Эта функция обладает свойствами, похожими на свойства ядра Дирихле, но главная разница
заключается в том, что ядро Фейера оказывается неотрицательной функцией (что оказывается
очень полезно для дальнейших выводов).

Свойства ядра Фейера:


5 Норма k·kE была определена формулой (9.1.6).
6 Норма (m)
k·kE была определена формулой (9.1.47).
640 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

1◦ . Ядро Фейера ΦN является непрерывной, четной, 2π-периодической и неотрицательной


функцией на R:
 
ΦN (−t) = ΦN (t), ΦN (t + 2π) = ΦN (t), ΦN (t) > 0 t∈R

2◦ . Интеграл по периоду от ядра Фейера равен π:


ˆ π ˆ π
ΦN (t) d t = 2 ΦN (t) d t = π (11.2.59)
−π 0

3◦ . Ядро Фейера удовлетворяет тождеству:


(N
2, t ∈ 2πZ
ΦN (t) = sin2 N2 t
(11.2.60)
2N ·sin2 2t
, t∈
/ 2πZ

4◦ . Для всякого δ > 0 равномерная норма функции Φ на отрезке [δ, π] стремится к нулю
при N → ∞:
kΦN (t)kt∈[δ,π] = max ΦN (t) −→ 0 (11.2.61)
t∈[δ,π] N →∞

◦ ◦
Доказательство. Свойства 1 и 2 вытекают сразу же из свойств ядра Дирихле на с.634, за исклю-
чением неотрицательности ΦN , которая, в свою очередь, является следствием тождества (11.2.60).
Поэтому для доказательства 1◦ , 2◦ и 3◦ достаточно проверить (11.2.60). Для точек t = 2πk мы
получаем:
N −1 N −1   N −1
1 X 1 X 1 1 X N N −1 1 N
ΦN (2πk) = Dn (2πk) = n+ = n + = + =
N n=0 | {z } N n=0 2 N n=1
2N 2 2 2
| {z }
=

(11.2.46)
1
n+ 2
= (2.2.253)
(N −1)·N
2

А для t 6= 2πk получаем:

N −1 N −1  
t 1 X t X 1 t
ΦN (t) · 2N sin2 = Dn (x) ·2N sin2 =2 sin n + t · sin =
2 N n=0 | {z } 2 n=0 |
2 2
{z }
=

 
(11.2.46)
=

sin n+ 1 t  (4.1.83) 
2
t 1
2 sin
2 2 cos nt − cos(n + 1)t

N
X −1        
= cos nt − cos(n + 1)t = cos 0 − cos
| {z } |{z} t + cos t − cos
|{z} | {z } 2t + ... + cos(N − 1)t − cos N t =
| {z }
n=0 ↑ ↑ ↑ ↑ ↑
=


1

N +1
= 1 − cos N t = (4.1.72) = sin2 t
2
Поделив это на 2N sin2 2t , мы получим нижнюю строчку в (11.2.60).
После того, как (11.2.60) доказано, свойство (11.2.61) становится его следствием:

sin2 N2 t maxt∈[δ,π] sin2 N2 t 1


kΦN (t)kt∈[δ,π] = max ΦN (t) = max 2 t 6 = −→ 0
t∈[δ,π] t∈[δ,π] 2N · sin 2 2N · mint∈[δ,π] sin2 2t 2N · sin2 δ N →∞
2

Интеграл Фейера.
Лемма 11.2.10. Для всякой 2π-периодической локально интегрируемой функции f ее многочлен
Фейера σN выражается через ядро Фейера ΦN формулами
1 π
ˆ
σN (x) = f (x + t) · ΦN (t) d t, x∈R (11.2.62)
π −π

1
ˆ π n o
σN (x) = f (x + t) + f (x − t) · ΦN (t) d t, x∈R (11.2.63)
π 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 641

• Интегралы справа в формулах (11.2.62) и (11.2.63) называются интегралами Фейера.

Доказательство. Это следует из формул для интеграла Дирихле (11.2.47) и (11.2.48): во-первых,

Sn (x)

=
(11.2.47)
N −1 N −1
z ˆ }| {
1 X 1 X 1 π
σN (x) = Sn (x) = f (x + t) · Dn (t) d t =
N n=0 N n=0 π −π
N −1
1 π 1 X 1 π
ˆ ˆ
= f (x + t) · Dn (t) d t = f (x + t) · ΦN (t) d t,
π −π N n=0 π −π
| {z }

=
(11.2.58)
ΦN (t)

и, во-вторых,

Sn (x)

=
(11.2.48)
z ˆ }| {
1 X 1 πn o
N −1 N −1
1 X
σN (x) = Sn (x) = f (x + t) + f (x − t) · Dn (t) d t =
N n=0 N n=0 π 0

1 πn o 1 πn o
N −1
1 X
ˆ ˆ
= f (x + t) + f (x − t) · Dn (t) d t = f (x + t) + f (x − t) · ΦN (t) d t.
π 0 N n=0 π 0
| {z }
=

(11.2.58)
ΦN (t)

Поточечная сходимость многочленов Фейера. Мы можем теперь доказать ту часть теоремы


11.2.9, где речь идет о поточечной сходимости:

Лемма 11.2.11. Для всякой кусочно-непрерывной 2π-периодической функции f на прямой R ее


многочлены Фейера сходятся в каждой точке x ∈ R к среднему арифметическому ее левого и
правого пределов в этой точке:

f (x − 0) + f (x + 0)
= lim σN (x), x ∈ R.
2 N →∞

Доказательство. Поскольку f кусочно-непрерывна и периодична, она ограничена на R. Обозначим


буквой M ограничивающую ее константу:

sup |f (x)| = M (M ∈ R).


x∈R

Зафиксируем точку x ∈ R. Из кусочной непрерывности f следует также, что существуют пределы

f (x + 0) = lim f (x + t), f (x − 0) = lim f (x − t)


t→+0 t→+0

Поэтому если зафиксировать ε > 0, то найдется δ > 0 такое, что

∀t ∈ (0, δ) |f (x + t) − f (x + 0)| < ε & |f (x − t) − f (x − 0)| < ε

Подберем такое N0 ∈ N, чтобы для всех N > N0 выполнялось неравенство


ε
max ΦN (t) < (11.2.64)
t∈[δ,π] 4M

(это всегда можно сделать, в силу (11.2.61)). Тогда для всех N > N0 мы получим:
ˆ π
f (x + t) − f (x + 0) · ΦN (t) d t =
0
642 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
ˆ δ ˆ π
= f (x + t) − f (x + 0) ·ΦN (t) d t + f (x + t) − f (x + 0) ·ΦN (t) d t 6
0 | {z } δ | {z }

>

>
ε |f (x + t)| + |f (x + 0)|

>
2M
δ π
π·ε π·ε
ˆ ˆ
6ε· ΦN (t) d t +2M · ΦN (t) d t 6 + = π·ε
2 2
|0 {z } |δ {z }

>

>
´π
0
ΦN (t) d t (π − δ) · maxt∈[δ,π] ΦN (t)

>
(11.2.59) (11.2.64)
π ε
2 (π − δ) · 4M

>
π·ε
4M

Таким образом,
π
1
ˆ
∀N > N0 · f (x + t) − f (x + 0) · ΦN (t) d t < ε (11.2.65)
π 0

Точно так же доказывается, что


π
1
ˆ
∀N > N0 · f (x − t) − f (x − 0) · ΦN (t) d t < ε (11.2.66)
π 0

f (x+0)+f (x−0)
Теперь оценим разность между 2 и многочленом Фейера:

f (x + 0) + f (x − 0)
σN (x) − =
2
ˆ πn o
1 f (x + 0) + f (x − 0) 2 π
ˆ
= f (x + t) + f (x − t) · ΦN (t) d t − · DN (t) d t =
π 2 π
| 0 {z } | 0 {z }
=

=
(11.2.63) (11.2.59)
σN (x) 1

1 nˆ π o 1 πn
ˆ o
= f (x + t) + f (x − t) · ΦN (t) d t − f (x + 0) + f (x − 0) · ΦN (t) d t =
0π π 0
1 πn o
ˆ
= f (x + t) + f (x − t) − f (x + 0) − f (x − 0) · ΦN (t) d t =
π 0
ˆ πh i ˆ πh i
1
= · f (x + t) − f (x + 0) · ΦN (t) d t + f (x − t) − f (x − 0) · ΦN (t) d t 6
π 0 0
ˆ π ˆ π
1 1
6 · f (x + t) − f (x + 0) · ΦN (t) d t + · f (x − t) − f (x − 0) · ΦN (t) d t < 2ε
π 0 π 0
| {z } | {z }
>

>

(11.2.65) (11.2.66)
ε ε

Мы получили, что для произвольной точки x ∈ R и любого ε > 0 можно подобрать такое N0 ∈ N,
что для любого N > N0 выполняется соотношение:

f (x + 0) + f (x − 0)
σN (x) − < 2ε
2

Это эквивалентно тому, что нам нужно:

f (x + 0) + f (x − 0)
∀x ∈ R σN (x) −→
N →∞ 2

Равномерная сходимость многочленов Фейера.

Лемма 11.2.12. Непрерывная 2π-периодическая функция f является равномерной суммой своей


последовательности многочленов Фейера (11.2.53).
§ 2. Поточечная и равномерная сходимость ряда Фурье 643

Доказательство. Пусть f – непрерывная 2π-периодическая функция на R. Поскольку f непрерыв-


на на [−π, π], должна быть конечной величина

M = sup |f (x)| = sup |f (x)| (11.2.67)


x∈R x∈[−π,π]

Зафиксируем число ε > 0 и выберем такое δ > 0, чтобы


ε
∀x ∈ [−π, π] ∀t ∈ (−δ, δ) f (x) − f (x + t) < (11.2.68)
3
(поскольку f непрерывна, и значит, равномерно непрерывна на [−π, π], это всегда можно сделать).
После этого найдем N0 такое, что
ε
∀N > N0 kΦN (t)kt∈[δ,π] < (11.2.69)
6M
Тогда для всякого N > N0 мы получим:
π π
1 1
ˆ ˆ
f (x) − σN (x) = f (x) · ΦN (t) d t − f (x + t) · ΦN (t) d t =
π −π π −π
| {z } | {z }
=

=
(11.2.59) (11.2.62)
1 σN (x)

1
ˆ π  1 π
ˆ
= f (x) − f (x + t) · ΦN (t) d t 6 f (x) − f (x + t) · ΦN (t) d t =
π −π π −π
1 −δ 1 δ
ˆ ˆ
= f (x) − f (x + t) ·ΦN (t) d t + f (x) − f (x + t) ·ΦN (t) d t+
π −π | {z } π −δ | {z }
>

>
ε
(11.2.68)
|f (x)| + |f (x + t)| 3
>

(11.2.67)
2M
ˆ π
1
+ f (x) − f (x + t) ·ΦN (t) d t 6
π δ | {z }
>

|f (x)| + |f (x + t)|
>

(11.2.67)
2M
−δ ˆ δ
2M ε 2M π
ˆ ˆ
6 ΦN (t) d t + ΦN (t) d t + ΦN (t) d t =
π−π 3π −δ π δ
| {z } | {z }
↑ ↑
ˆ δ ˆ π
ε 4M ε 4M πε ε 2ε
= · ΦN (t) d t + · ΦN (t) d t < ·π+ · = + =ε
3π −δ π δ 3π π 6M 3 3
| {z } | {z }
>
>

´π
ΦN (t) d t (π − δ) · kΦN (t)kt∈[δ,π]
−π
>
=

(11.2.59) (11.2.69)
ε
π (π − δ) · 6M
>

πε
6M

Отсюда
∀N > N0 kf (x) − σN (x)kx∈R = sup f (x) − σN (x) 6 ε
x∈R

Это доказывает (11.2.56).

Равномерная по производным сходимость многочленов Фейера.


Лемма 11.2.13. Бесконечно гладкая 2π-периодическая функция f является равномерной по про-
изводным суммой своей последовательности многочленов Фейера (11.2.53).
Доказательство. Это можно вывести как следствие пункта (ii) теоремы 11.2.2: из соотношения
(m)
∀m ∈ Z+ kf − SN kR −→ 0.
N →∞
644 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

следует, что при фиксированных m ∈ Z+ и ε > 0 существует N0 такое, что при N > N0 выполняется
(m)
kf − SN kR <ε

Отсюда следует, что при N > N0 будет выполняться

N −1 (m) N −1 N −1 (m)
(m) 1 X 1 X 1 X
kf − σN kR = f− Sn = f− Sn =
N n=0 N n=0 N n=0
R R
N −1 (m) N −1 N −1
1 X 1 X (m) 1 X
= (f − Sn ) 6 k(f − Sn )kR < ε=ε
N n=0 N n=0 N n=0
R

Поскольку m ∈ Z+ и ε > 0 выбирались произвольно, получаем


(m)
∀m ∈ Z+ kf − σN kR −→ 0.
N →∞

(d) Примеры 1 0 1 π
ˆ ˆ
=− sin nx d x + sin nx d x =
π −π π 0
В следующих примерах нас будет интересовать
поточечная сходимость, поэтому они будут ил- 1 x=0 1 x=π
= cos nx − cos nx =
люстрациями к теореме 11.2.2. πn x=−π πn x=0
1 1
= {1 − cos(−πn)} − {cos(πn) − 1} =
Разложение Фурье произвольной 2π- πn πn
периодической функции. 2 2
= {1 − cos(πn)} = {1 − (−1)n }
πn πn
⋄ 11.2.8. Найдем разложение Фурье функции
Вывод:


1, x ∈ (2πn, π + 2πn) X∞
2
f (x) = sgn sin x = 0, x = πn sgn sin x = {1 − (−1)n } · sin nx
 πn
 n=1
−1, x ∈ (−π + 2πn, 2πn)
⋄ 11.2.9. Вычислим разложение 2π-
Для этого нужно просто вычислить коэффици- периодической функции f , удовлетворяющей
енты Фурье: тождеству Лебега и заданной на интервале
(−π, π) формулой
1 π 1 0
ˆ ˆ
a0 = sgn sin x d x = (−1) d x+ 
π −π π −π 
1, x ∈ (0, π)
1
ˆ π
π π f (x) = 12 , x = 0
+ 1 dx = − + = 0 

π 0 π π 0, x ∈ (−π, 0)

1 π
ˆ
an = sgn sin x · cos nx d x =
π −π
1 0 1 π
ˆ ˆ
= (−1) · cos nx d x + 1 · cos nx d x =
π −π π 0
1 0 1 π
ˆ ˆ
=− cos nx d x + cos nx d x =
π −π π 0
1 x=0 1 x=π Вычисляем коэффициенты Фурье:
=− sin nx + sin nx = 0+0 = 0
πn x=−π πn x=0
π
1
ˆ
a0 = f (x) d x =
π
π −π
1
ˆ
0 π
bn = sgn sin x · sin nx d x = 1 1 π
ˆ ˆ
π −π = 0 dx + 1 dx = =1
0 π
π −π π 0 π
1 1
ˆ ˆ
= (−1) · sin nx d x + 1 · sin nx d x =
π −π π 0
§ 2. Поточечная и равномерная сходимость ряда Фурье 645

1 π 1 π 1 π
ˆ
an = f (x) · cos nx d x = =− {cos(πn) − cos } = {cos − (−1)n }
π −π πn 2 πn 2
1 0 1 π Вывод:
ˆ ˆ
= 0 · cos nx d x + 1 · cos nx d x =
π −π π 0
1 X n sin πn

2
1 x=π f (x) = + · cos nx+
= sin nx =0 4 n=1 πn
πn x=0
1 π o
{cos − (−1)n } · sin nx
+
πn 2
1 π
ˆ
bn = f (x) · sin nx d x = ⊲⊲ 11.2.11. Разложите в ряд Фурье 2π-
π −π
периодические функции, заданные на интервале
1 0 1 π
ˆ ˆ
(−π, π) формулами:
= 0 · sin nx d x + 1 · sin nx d x =
π −π π 0 1) f (x) = e(x
1 x=π 1 x, x ∈ (0, π)
=− cos nx = − {cos(πn) − 1} = 2) f (x) =
πn x=0 πn 0, x ∈ (−π, 0)
1 (
= {1 − (−1)n } 0, x ∈ (0, π)
πn 3) f (x) =
x, x ∈ (−π, 0)
Вывод: 

x, x ∈ (0, π)

1 X 1 4) f (x) = π2 , x = 0
f (x) = + {1 − (−1)n } · sin nx 

2 n=1 πn π, x ∈ (−π, 0)

⋄ 11.2.10. Вычислим разложение 2π-перио- Разложение Фурье четных и нечетных 2π-


дической функции f , удовлетворяющей тожде- периодических функций.
ству Лебега и заданной на интервале (−π, π)
формулой Предложение 11.2.14. Если 2π-периодическая
функция f четна
 
 π
1, x ∈ 0, 2 f (−x) = f (x) (11.2.70)
f (x) = 21 , x ∈ 0, π2

  то в ее ряде Фурье отсутствуют слагаемые с
0, x ∈ (−π, 0) ∪ π2 , π
синусами:

a0 X
f (x) = + an cos nx (11.2.71)
2 n=1

а коэффициенты a0 , an можно вычислять по


формулам
2 π
ˆ
a0 = f (x) d x,
π 0
(11.2.72)
2 π
ˆ
Вычисляем коэффициенты Фурье: an = f (x) cos nx d x
π 0
π
1
ˆ
a0 = f (x) d x = Доказательство. Коэффициенты bn обнуляют-
π −π ся:
π
0 π
1 1 1 π 1
ˆ ˆ ˆ
2
1 π
ˆ
= 0 d x+ 1 d x+ 0 dx = = bn = f (x) sin nx d x =
π −π π π π π
2
π 2 π −π
1 0 1 π
ˆ ˆ
= f (x) sin nx d x + f (x) sin nx d x =
1 π
ˆ π π 0
an = f (x) · cos nx d x = | −π {z }
π −π замена: x = −t
0 π
1 π sin πn 1 1
ˆ ˆ
1 x=π
ˆ
2 = f (−t) sin(−nt) d(−t)+ f (x) sin nx d x =
= 1 · cos nx d x = sin nx =
π π2 πn x= π
2
πn π π | {z } π 0
=

(11.2.70)
f (t)
0 π
1 π 1 1
ˆ ˆ ˆ
bn = f (x) · sin nx d x = = f (t) sin nt d t + f (x) sin nx d x = 0
π −π π π π 0
| {z }
1 π 1 x=π
ˆ
=

= 1 · sin nx d x = − cos nx = 1
−π
´π
f (t) sin nt d t
π π2 πn x= π
2
0
646 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

π
1
ˆ
Докажем формулы (11.2.72): во-первых, a0 = f (x) d x =
π −π
π
1
ˆ
0 π
1 1
ˆ ˆ
a0 = f (x) d x = = f (x) d x + f (x) d x =
π −π π π
−π 0
0 π | {z }
1 1
ˆ ˆ
= f (x) d x + f (x) d x = замена: x = −t
π −π π 0 1
ˆ 0
1
ˆ π
| {z } = f (−t) d(−t) + f (x) d x =
замена: x = −t π π | {z } π 0
0 π

=
1 1 (11.2.73)
ˆ ˆ
= f (−t) d(−t) + f (x) d x = −f (t)
π π | {z } π 0 0 π
1 1
ˆ ˆ
=

(11.2.70)
f (t) = f (t) d t + f (x) d x = 0
π π π 0
0 π π | {z }
1 1 2
ˆ ˆ ˆ

=
=− f (t) d t + f (x) d x = f (x) d x ´π
π π π 0 π 0
1
−π 0
f (t) d t
| {z }
=

1
´π а для коэффициентов an ,
π 0
f (t) d t

1 π
ˆ
и, во-вторых, an = f (x) cos nx d x =
π −π
1 π
ˆ
1 0 1 π
ˆ ˆ
an = f (x) cos nx d x = = f (x) cos nx d x + f (x) cos nx d x =
π −π π −π π 0
| {z }
1 0 1 π
ˆ ˆ
= f (x) cos nx d x + f (x) cos nx d x = замена: x = −t
π −π π 0 ˆ 0
1
| {z } = f (−t) cos(−nt) d(−t)+
замена: x = −t π π | {z }
ˆ 0

=
1 (11.2.73)
= f (−t) cos(−nt) d(−t)+ −f (t)
π π | {z } ˆ π
1
=

(11.2.70) + f (x) cos nx d x =


f (t) π 0
π 0 π
1
ˆ
1 1
ˆ ˆ
+ f (x) cos nx d x = = f (t) cos nt d t + f (x) cos nx d x = 0
π 0 π π π 0
0 π | {z }
1 1
ˆ ˆ
=

=− f (t) cos nt d t + f (x) cos nx d x = 1


´π
π π π 0 −π 0
f (t) cos nt d t
| {z }
=

1
´π Докажем формулу (11.2.75):
π 0
f (t) cos nt d t
π π
2
ˆ
1
ˆ
= f (x) cos nx d x bn = f (x) sin nx d x =
π 0 π −π
0 π
1 1
ˆ ˆ
= f (x) sin nx d x + f (x) sin nx d x =
π −π π 0
Предложение 11.2.15. Если 2π-периодическая | {z }
замена: x = −t
функция f нечетна ˆ 0
1
= f (−t) sin(−nt) d(−t)+
f (−x) = −f (x) (11.2.73) π π | {z }
=

(11.2.73)
то в ее ряде Фурье отсутствуют свободное сла- −f (t)
ˆ π
гаемое и слагаемые с косинусами: 1
+ f (x) sin nx d x =
∞ π 0
X
0 π
f (x) = bn sin nx (11.2.74) 1 1
ˆ ˆ
n=1
=− f (t) sin nt d t + f (x) sin nx d x =
π π π 0
| {z }
а коэффициенты bn можно вычислять по фор-
=

1
´π
мулам π 0
f (t) sin nt d t
π
2
ˆ
2 π = f (x) sin nx d x
ˆ
bn = f (x) sin nx d x (11.2.75) π 0
π 0

Доказательство. Для коэффициента a0 полу-


чим: ⋄ 11.2.12. Найдем разложение четной 2π-
периодической функции f , удовлетворяющей
§ 2. Поточечная и равномерная сходимость ряда Фурье 647

тождеству Лебега и заданной на интервале (0, π) Вывод:


формулой ∞
f (x) = x X 2(−1)n
f (x) = − · sin nx
n
Ясно, что график имеет вид n=1

⋄ 11.2.14. Разложим в ряд Фурье четную 2π-


периодическую функцию, заданную на интерва-
ле (−π, π) формулой

f (x) = x2

График имеет вид

Поскольку f четна, нужно вычислить только a0


и an :
2 π 2 x2 π
ˆ
a0 = x dx = · =π
π 0 π 2 0

π ˆ π
2 2
ˆ
an = x · cos nx d x = x d sin nx = Поскольку f четна, нужно вычислить только a0
π 0 πn 0
 π  и an :
2 π
ˆ
= x · sin nx − sin nx d x = 2 π 2
ˆ
2 x3 π 2π 2
πn 0 0 a0 = x dx = · =
2 n cos nx π o 2 π 0 π 3 0 3
= 0+ = {cos πn − 1} =
πn n 0 πn2
2
{(−1)n − 1} π ˆ π
= 2 2
ˆ
πn2 an = x2 · cos nx d x = x2 d sin nx =
π0 πn 0
Вывод: 2 n 2 o
π
ˆ π
= · x · sin nx −2 x · sin nx d x =

π X 2 πn | {z 0
} 0
f (x) = + {(−1)n − 1} · cos nx
=

2 n=1 πn2
0
ˆ π
⋄ 11.2.13. Найдем разложение нечетной 2π- 4
= · x d cos nx =
периодической функции f , удовлетворяющей πn2 0
4 n o
ˆ π
тождеству Лебега и заданной на интервале (0, π) π
формулой = · x · cos nx − cos nx d x =
πn2 0 0
f (x) = x 4 n 1 πo (−1)n
= 2
· π · (−1)n − · sin nx =4·
График здесь имеет вид πn |n {z 0
} n2
=

Вывод:
X∞
π2 (−1)n
f (x) = +4· · cos nx (11.2.76)
3 n=1
n2

! 11.2.15. Из тождества (11.2.76), между про-


Поскольку f нечетна, нужно вычислить только чим, следует формула (8.2.32), которую мы обе-
bn : щали доказать в параграфе о числовых рядах:
ˆ π ˆ π если положить x = π, то мы получим равенство
2 2
bn = x · sin nx d x = − x d cos nx = ∞
π 0 πn 0 π2 X (−1)n
 π  π 2
= + 4 · · (−1)n ,
2 π
ˆ
3 n 2
=− x · cos nx − cos nx d x = n=1
πn 0 0
 
2 sin nx π которое после упрощений как раз дает (8.2.32)
=− π · cos πn − =
πn n 0 X∞
π2 1
2 n 2 n = .
=− {π · (−1 ) − 0} = − · (−1) 6 n2
πn n n=1
648 Глава 11. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ

⊲⊲ 11.2.16. Разложите в ряд Фурье 2π- 2 T πnx


ˆ
an = f (x) cos dx
периодические функции, заданные на интервале T 0 T
(0, π), рассмотрев отдельно случай когда f четна
и нечетна:  (ii) если f нечетная, то
π


 1, x ∈ 0, 2 ∞
1) f (x) = 21 , x = π2 f (x − 0) + f (x + 0) X πnx
  = bn sin ,
 π 2 T
0 x ∈ 2,π n=1
( 
2 T πnx
ˆ
x, x ∈ 0, π2 b = f (x) sin dx
2) f (x) = π π
 n
T T
, x ∈ , π 0
2 2

 π
 x, x ∈ 0, 2 Доказательство. Заменой переменной
π π
3) f (x) = 4 , x = 2

  Ty
0, x ∈ π2 , π x=
π

Ряды Фурье функций с произвольным пе- функция f превращается в функцию с полупери-


риодом. одом π. После этого применяется теорема 11.2.2
и предложения 11.2.14 и 11.2.15.
Теорема 11.2.16. Для всякой кусочно-гладкой
⊲⊲ 11.2.17. Разложите в ряд Фурье 2T -
функции f с полупериодом T на прямой R, ее ряд
периодические функции, заданные на полупе-
Фурье (с коэффициентами (11.0.2)) сходится в
риоде (0, T ), рассмотрев отдельно случай когда
каждой точке к среднему арифметическому ее
f (x) четна и нечетна:
левого и правого пределов
1) f (x) = x, T = 4
f (x − 0) + f (x + 0) 2) f (x) = 3 − x, T = 3
= 
2
∞ n o 
0, x ∈ (0, 1)
a0 X πnx πnx 1
= + an cos + bn sin (11.2.77) 3) f (x) = 2, x=1 , T =2
2 T T 

n=1 1 x ∈ (1, 2)
(
При этом 1, x ∈ (0, 1]
4) f (x) = , T =2
(i) если функция f четная, то 2 − x x ∈ (1, 2)
(
f (x − 0) + f (x + 0) a0 X

πnx 2 − x, x ∈ (0, 1]
= + an cos , 5) f (x) = , T =2
2 2 T 1 x ∈ (1, 2)
n=1 (
2
ˆ T x, x ∈ (0, 1]
a0 = f (x) d x, 6) f (x) = , T =2
T 0 1 x ∈ (1, 2)
Часть III

ФУНКЦИИ НЕСКОЛЬКИХ
ВЕЩЕСТВЕННЫХ ПЕРЕМЕННЫХ

649
Глава 12

ЛИНЕЙНАЯ АЛГЕБРА

В § 1 главы 2 мы говорили, что вещественные числа появляются в науке как идея, упрощающая
понимание алгоритмов измерения по эталону. Физические величины, для измерения которых доста-
точно указать эталон и алгоритм сравнения по нему, называются скалярными. Таковыми, например,
являются длина, объем, масса, заряд и т.д. Помимо них есть и другие, для измерения которых нуж-
но дополнительно фиксировать систему координат. Такие величины называются векторными.

⋄ 12.0.1. Типичный пример векторной величи- ной точке. По определению, это дробь
ны – положение тела в пространстве. Если ука-
зан эталон длины и система координат в про- F
E=
странстве, то положение тела (точнее, матери- q
альной точки) однозначно описывается тремя ко-
где F – сила, действующая на пробный заряд ве-
ординатами. Точно так же скорость тела или си-
личиной q, помещенный в данную точку. Знаме-
ла, действующая на него являются векторными
нитые уравнения Максвелла связывают эту ве-
величинами.
личину с еще тремя векторными величинами: на-
⋄ 12.0.2. Еще один пример векторной величины пряжённостью H магнитного поля, электриче-
– напряженность электрического поля E в дан- ской индукцией B и магнитной индукцией D.

Если для данной векторной величины заданы эталон, алгоритм сравнения по нему и система
координат, то результат измерения этой величины в каждой конкретной ситуации будет конечной
последовательностью чисел фиксированной длины n. Напомним определение главы 2 (с.73):
• Конечной последовательностью элементов множества S (необязательно, числового) на-
зывается произвольное отображение a : {1, ..., k} → S из какого-нибудь отрезка {1, ..., k}
натурального ряда N. Значения такого отображения часто записывают с помощью индек-
сов
ai = a(i), i ∈ {1, ..., k}.
а само это отображение – в виде семейства {ai ; i ∈ N} или {ai }. Число k при этом
называется длиной последовательности {ai ; i ∈ N}.
• В частном случае, когда S = R – множество чисел, последовательность {ai ; i ∈ N} при-
нято называть (конечной) числовой последовательностью.
• Напомним, что до сих пор мы записывали конечные числовые последовательности в виде
строк 
x = x1 , x2 , ..., xn .
Такие объекты в математике принято также называть числовыми строками (длины n ∈
N). Множество всех числовых строк длины n называется координатным пространством
размерности n и обозначается Rn :

x ∈ Rn ⇔ x = x1 , x2 , ..., xn , xi ∈ R

Элементы этого множества, то есть строки, называются также точками или векторами
пространства Rn .

650
§ 1. Комбинаторика 651

• Конечная числовая последовательность может быть также записана в виде столбца


 1
x
 x2 
x= 
 ...  .
xn

(при этом индексы у элементов последовательности мы будем писать справа вверху). Та-
кие объекты принято называть числовыми столбцами (длины n ∈ N).1 Множество всех
числовых столбцов длины n также называется координатным пространством размерно-
сти n и обозначается Rn :
 1
x
 x2 
x ∈ Rn ⇔ x =   i
 ...  , x ∈ R
xn

Элементы этого множества, то есть столбцы, тоже называются точками или векторами
пространства Rn .
Координатные пространства Rn и Rn играют в изучении векторных величин ту же роль, что и
множество R вещественных чисел при изучении скалярных. Однако система фактов об Rn и Rn ,
необходимых для доказательства нужных утверждений, намного более сложна и менее очевидна,
чем в случае с R. В этой главе мы обсудим те свойства Rn и Rn , которые вытекают из наличия на
этих множествах естественных алгебраических операций.

§1 Комбинаторика
Разговор о пространствах Rn и Rn полезно начать с обсуждения свойств конечных последователь-
ностей, причем не только числовых. Это понадобится нам в дальнейшем, например, при описании
свойств определителя2 , многочленов и полилинейных форм (§ 3, (a) и § 5 этой главы3 ) а также
главы 144 . Область математики, где рассматриваются объекты такого типа, называется комбина-
торика. Свой предмет эта наука определяет, как изучение конечных множеств5. В этом параграфе
мы опишем некоторые ее результаты.
Область математики, изучающая конечные множества, называется комбинаторикой. Результа-
ты этого параграфа понадобятся нам ниже в главах 5 и 12.

(a) Основные понятия комбинаторики


Правило комбинаторного умножения.
Теорема 12.1.1. Пусть X0 , ..., Xn – конечная последовательность конечных множеств. Тогда
n
Y n
Y
card Xi = card Xi . (12.1.1)
i=1 i=1

Доказательство. Здесь нужно провести индукцию по числу n. При n = 1 мы получаем


1
Y 1
Y
card Xi = card X1 = card Xi .
i=1 i=1
1 При таком определении столбцы не отличаются от строк, потому что и то и другое – просто отображения из

{1, ..., n} в R. Однако для удобства вычислений с матрицами, о которых пойдет речь ниже в § 3, удобно различать
строки и столбцы, и на формальном языке это различие можно представлять как дополнительную метку, приписыва-
емую данной конечной последовательности x, скажем, 0, если эту последовательность мы представляем как строку, и
1, если как столбец. Иными словами, парой (x, 0) мы записываем последовательность x, представляемую как строку, а
парой (x, 1) ту же последовательность, представляемую как столбец. Далее в тексте мы, однако, такое представление
строк и столбцов использовать не будем, просто удовлетворившись тем, что формальный способ выразить разницу
между ними существует.
2 Группа перестановок Σ используется в самом определении определителя матрицы на с.699.
n
3 Это алгебраические результаты, но они применяются затем в анализе, например, в теореме 14.1.10 ниже.
4 Например, понятие мультииндекса используется при определении мультистепени элементарного дифференциала

на с.813.
5 Напомним, что конечные множества мы определили на с.70.
652 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Предположим, это верно при n = k:


k
Y k
Y
card Xi = card Xi . (12.1.2)
i=1 i=1

Тогда для n = k + 1 мы получим


Y
k  k+1
Y
Xi = (0.3.363) ∼
× Xk+1 ∼ = Xi
i=1 i=1

и поэтому

k+1
Y  Y
k   Y
k 
card Xi = card Xi × Xk+1 = (2.1.94) = card Xi · card Xk+1 = (12.1.2) =
i=1 i=1 i=1
Y
k  k+1
Y
= card Xi · card Xk+1 = (2.2.241) = card Xi .
i=1 i=1

Теорему 12.1.1 удобно переписать для приложений в следующем виде:


Теорема 12.1.2 (правило комбинаторного умножения). Пусть у нас имеется возможность по-
строить конечную последовательность (x1 , ..., xn ) длины n, причем
1) элемент x1 мы можем выбрать d1 способами,
2) после того, как выбран x1 , элемент x2 мы можем выбрать d2 способами,
...) ...
n) после того, как выбраны x1 ,...,xn−1 , элемент xn мы можем выбрать dn способами.
Тогда последовательность (x1 , ..., xn ) мы можем выбрать d1 · d2 · ... · dn способами.

⋄ 12.1.1. Сколько слов длины 3 можно соста- собами, второй – двумя. Значит маршрут можно
вить из алфавита, состоящего из двух букв X = выбрать
{a, b}? 3·2=6
Решение. Первую букву в слове можно вы-
брать двумя способами, вторую – тоже двумя способами.
способами, третью – тоже двумя. Получается по
теореме 12.1.2 все слово можно составить ⋄ 12.1.3. Сколько четырехзначных чисел можно
составить из цифр 0, 1, 2, 3, 4, 5, если
2·2·2 =8
1) цифры не повторяются,
способами. 2) цифры могут повторяться,
3) цифры могут повторяться, и получающееся
⋄ 12.1.2. Из пункта A в пункт C можно добрать-
число должно быть нечетным.
ся через пункт B следующими видами транспор-
та: Какова в каждом случае вероятность, что полу-
чающееся число оканчивается на 0?
1) сначала из A в B: автобусом, поездом или па-
роходом, Решение.
1. В первом случае (когда цифры не повторя-
2) потом B в C: пароходом, или самолетом.
ются):
Сколькими способами можно выбрать маршрут
— первую цифру можно выбрать 5 способами
из A в C?
(среди цифр 1, 2, 3, 4, 5),
Решение. Составить маршрут – это все равно
что составить последовательность из двух эле- — после того, как первая цифра выбрана, вто-
ментов: на первом месте должен быть какой-то рую цифру можно выбрать снова 5 способами
вид транспорта при путешествии от A до B, а (среди 0 и оставшихся 4 цифр из 1, 2, 3, 4, 5),
на втором – при путешествиии от B до C. Пер- — после того, как первые две цифры выбраны,
вый вид транспорта можно выбрать тремя спо- третью цифру можно выбрать 4 способами,
§ 1. Комбинаторика 653

— после того, как первые три цифры выбраны, (теперь понятно, почему). Вероятность, что в
четвертую цифру можно выбрать 3 способа- этом случае выбранное число оканчивается на 0,
ми. будет равна
180 1
Всего по теореме 12.1.2 в этом случае полу- P = = .
1080 6
чается
5 · 5 · 4 · 3 = 120 3. В третьем случае (когда цифры могут по-
вторяться и последняя лодна быть нечетной):
вариантов выбора. Среди этих 120 чисел име-
ется некоторое количество оканчивающихся на — первую цифру можно выбрать 5 способами
0. Чтобы их сосчитать, снова применим теорему (среди цифр 1, 2, 3, 4, 5),
12.1.2. Здесь выбрать число – это выбрать только — после того, как первая цифра выбрана, вто-
первые три цифры, потому что последняя цифра рую цифру можно выбрать 6 способами (сре-
будет 0. Получаем: ди цифр 0, 1, 2, 3, 4, 5),
— первую цифру можно выбрать 5 способами — после того, как первые две цифры выбраны,
(среди цифр 1, 2, 3, 4, 5), третью цифру можно выбрать 6 способами
— после того, как первая цифра выбрана, вто- (среди цифр 0, 1, 2, 3, 4, 5),
рую цифру можно выбрать 4 способами (сре- — после того, как первые три цифры выбраны,
ди оставшихся 4 цифр из 1, 2, 3, 4, 5), четвертую цифру можно выбрать 3 способа-
— после того, как первые две цифры выбраны, ми (среди цифр 1, 3, 5).
третью цифру можно выбрать 3 способами. Всего по теореме 12.1.2 в этом случае полу-
Всего в первом случае чисел, оканчивающих- чается
ся на 0, имеется 5 · 6 · 6 · 3 = 540
вариантов. Из них ни одно число не оканчивает-
5 · 4 · 3 = 60.
ся на 0. Поэтому вероятность получения такого
Вероятность, что в первом случае выбранное числа нулевая:
число оканчивается на 0, будет равна 0
P = = 0.
60 1 540
P = = .
120 2 ⋄ 12.1.4. Подбрасываются две игральные кости.
2. Во втором случае (когда цифры могут по- Найдите вероятность того, что
вторяться): 1) выпадут одинаковые цифры,
— первую цифру можно выбрать 5 способами 2) выпадут четные цифры.
(среди цифр 1, 2, 3, 4, 5),
Решение. Всего вариантов выпадения двух
— после того, как первая цифра выбрана, вто- костей имеется по теореме 12.1.2
рую цифру можно выбрать 6 способами (сре-
ди цифр 0, 1, 2, 3, 4, 5), 6 · 6 = 36
— после того, как первые две цифры выбраны,
третью цифру можно выбрать 6 способами (потому что первую цифру можно выбрать 6 спо-
(среди цифр 0, 1, 2, 3, 4, 5), собами, как и вторую). Количество вариантов, в
которых цифры одинаковые, равно 6. Поэтому
— после того, как первые три цифры выбраны, вероятность в первом случае равна
четвертую цифру можно выбрать 6 способа-
ми (среди цифр 0, 1, 2, 3, 4, 5). 6 1
P = = .
Всего по теореме 12.1.2 в этом случае полу- 36 6
чается Во втором случае количество вариантов будет
5 · 6 · 6 · 6 = 1080 равно
вариантов выбора, то есть четырехзначных чи- 3·3=9
сел, составленных из цифр 0, 1, 2, 3, 4, 5. Из них
и вероятность этого
оканчивающихся на 0 будет
9 1
5 · 6 · 6 = 180 P = = .
36 4
654 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Размещения. Последовательность {xi ; i = 1, ..., k} называется размещением (длины k), если она
инъективна, то есть ее элементы не повторяются:

∀i 6= j ∈ {1, ..., k} xi 6= xj

Множество всех размещений длины k из элементов множества S обозначается символом AkS .


Теорема 12.1.3. Мощность множества AkS всех размещений длины k в (конечном) множестве
S, мощности n (также конечна и) равна

n!
Akn = (12.1.3)
(n − k)!

Доказательство. Здесь используется правило комбинаторного умножения (теорема 12.1.2). По-


считаем, сколькими способами можно составить последовательность Длины k с неповторяющимися
элементами из множества S мощности n:
— первый элемент можно выбрать n способами (им может быть любой из элементов S)
— после того, как первый элемент выбран, второй можно выбрать n − 1 способами (им может быть
любой из элементов S, кроме уже выбранного первого),
— после того, как первые два элемента выбраны, третий можно выбрать n−2 способами (им может
быть любой из элементов S, кроме уже выбранных первых двух),
— и так далее, и когда мы дойдем до элемента с номером k, то его можно будет выбрать n − (k − 1)
способами (им может быть любой из элементов S, кроме уже выбранных k−1 первых элементов).
Всего по теореме 12.1.2 в этом случае получается
n!
n · (n − 1) · (n − 2) · ... · (n − (k − 1)) =
(n − k)!
вариантов.

⊲ 12.1.5. Сколькими способами можно расса- деть А и Б; таких пар имеется 8;


дить 10 человек на 25 местах? — после того как пара соседних стульев выбра-
25!
Ответ: A10
25 = 15! . на, выбираем из них, на каком конкретно из
⊲ 12.1.6. Сколькими способами могут разме- них будет сидеть А, а на каком Б; таких ва-
риатнтов имеется 2;
ститься 5 покупателей в очереди в кассу?
Ответ: A55 = 5!. — после того, как выбраны места для А и Б,
остается еще 6 свободных стульев и 6 чело-
⋄ 12.1.7. 8 человек рассаживаются за круглым век, которые нужно на них разместить; это
столом. Какова вероятность, что два конкретных можно сделать A66 = 6! способами.
человека, А и Б, окажутся рядом?
Всего способов рассадить 8 человек на 8 сту- В итоге вариантов, когда А и Б оказываются ря-
льев (будем считать их расставленными в круг) дом имеется
имеется A88 = 8!. Из них число вариантов, когда 8 · 2 · 6!.
А и Б оказываются рядом, считатеся по теореме
12.1.2: Вероятность, этого события будет
— сначала выбираем из 8 расставленнх в круг 8 · 2 · 6! 2
стульев пару соседних, на которых будут си- P = = .
8! 7

Подмножества.
Теорема 12.1.4. Если (конечное) множество S состоит из n элементов, то множество 2S всех
подмножеств в множестве S (также конечно и) состоит из 2n элементов.
Доказательство. Занумеруем элементы S:

S = {x1 , ..., xn }.
§ 1. Комбинаторика 655

Задать подмножество M в S – то же, что присвоить каждому элементу xi число ai , равное 1, если
xi ∈ M , и 0, если xi ∈
/ M . Это то же самое, что выбрать последовательность (a1 , ..., an ) из чисел 0
и 1. Таких последовательностей по теореме 12.1.2 имеется

· ... · 2} = 2n
|2 · 2 {z
n множителей

(потому что первое число a1 можно выбрать 2 способами, второе a2 – тоже 2 способами, и так
далее).
Напомним, что число сочетаний из n элементов по k было определено нами в главе 2 формулой
(2.2.249):
n!
Cnk = , (0 6 k 6 n) (12.1.4)
(n − k)! · k!
Теорема 12.1.5. Если (конечное) множество S состоит из n элементов, то для любого k 6 n
множество CSk всех подмножеств мощности k в множестве S (также конечно и) состоит из
Cnk элементов.
Доказательство. Обозначим буквой E число всех подмножеств мощности k в S. Наша задача –
показать, что E = Cnk .
По теореме (12.1.3), число последовательностей длины k из неповторяющихся элементов множе-
ства S равно
n!
Akn = . (12.1.5)
(n − k)!
То же самое число можно посчитать другим способом:
— сначала нужно выбрать какое-нибудь подмножество T мощности k в S – число таких
вариантов равно E (мы еще не знаем, сколько это);
— после того, как выбрано подмножество T мощности k в S, мы нумеруем его элементы
цифрами от 1 до k – это можно сделать Akk = k! способами (по теореме (12.1.3)).
В результате по правилу комбинаторного умножения (теорема 12.1.2) получается всего

E · k! (12.1.6)

вариантов выбрать размещение длины k в S.


Приравнивая (12.1.6) и (12.1.5), получаем:

n! n!
E · k! = =⇒ E= = Cnk .
(n − k)! k! · (n − k)!

⋄ 12.1.8. Сколько экзаменационных комиссий из из 13 оставшихся. А это то же самое, что выбрать


7 человек можно составить из 14 преподавате- подмножество мощности 6 из множества мощно-
лей? Какова вероятность, что в выбранной ко- сти 13. Таких подмножеств по теореме 12.1.5 име-
миссии окажется данный человек? ется
Пусть S – множество преподавателей (мощ- 6 13!
C13 =
ности 14), из которого выбирается комиссия. Вы- 6! · 7!
брать комиссию из 7 человек – это то же самое, Теперь верояность, что в выбранной комиссии
что выбрать подмножество в S мощности 7. Та- окажется данный человек равна
ких подмножеств по теореме 12.1.5 имеется 6 13!
C13 6!·7! 7! 1
P = 7 = 14!
= =
7 14! C14 (7!)2
6! · 14 2
C14 =
(7!)2
⋄ 12.1.9. Сколько имеется четырехзначных чи-
– и это ответ на первый вопрос. сел, у которых каждая следующая цифра мень-
Далее найдем число комиссий, в которые вхо- ше предыдущей? Какова вероятность, что вы-
дит данный человек. Выбрать такую комиссию – бранное наугад четырехзначное число будет та-
все равно, что добавить к этому человеку еще 6 ким?
656 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Решение. Выбрать четырехзначное чис- 7 7


= =
ло, у которого каждая следующая цифра 3 · 10 · 10 300
меньше предыдущей – все равно что вы-
брать подмножество мощности 4 в множестве ⊲ 12.1.10. В партии из 10 изделий 3 бракованы.
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} всех цифр (потому что Наудачу выбираются 3 изделия. Какова вероят-
когда мы такое подмножество выберем, его оста- ность, что
нется упорядочить по убыванию, и получится 1) все выбранные изделия бракованы?
число с нужным свойством). Таких подмножеств
имеется 2) все выбранные изделия качественные?
3) хотя бы одно из выбранных изделий бракова-
4 10! 10 · 9 · 8 · 7
C10 = = = 10 · 3 · 7. но?
4! · 6! 4·3·2
4) ровно 2 из выбранных изделий браковано?
Всего четырехзначных чисел по правилу комби-
наторного умножения (теорема 12.1.2) имеется Ответы:
1
9 · 10 · 10 · 10. 1) 3 ,
C10
C73
Вероятность, что выбранное наугад четырех- 2) 3 ,
C10
значное число будет таким, как нам надо, равна 3
C10 −C73
3) 3
C10
,
4
C10 10 · 3 · 7 C32 ·C71
P = = = 4) 3 .
9 · 10 · 10 · 10 9 · 10 · 10 · 10 C10

Разбиения. Пусть нам даны натуральное число m ∈ N и конечная последовательность натураль-


ных чисел (k1 , ..., kn ), причем
k1 + k2 + ... + kn = m.
И пусть S – множество мощности m.
• Разбиением множества S типа (k1 , ..., kn ) называется последовательность множеств K1 , ..., Kn
со свойствами:
n
[
S= Ki , ∀i 6= j Ki ∩ Kj = ∅, ∀i = 1, ..., k card Ki = ki .
i=1

Множество всех разбиений множества S типа (k1 , ..., kn ) обозначается CSk1 ,...,kn .
Теорема 12.1.6. Число разбиений типа (k1 , ..., kn ) конечного множества S мощности m равно

k1 ,...,kn m!
Cm = (12.1.7)
k1 ! · ... · kn !
Доказательство. Подсчитаем, сколькими способами можно выбрать разбиение K1 , ..., Kn множе-
ства S:
— первое множество K1 (из k1 элементов в множестве из m элементов) можно по теореме
k1
12.1.5 выбрать Cm способами,
— после того, как K1 выбрано, второе множество K2 (из k2 элементов в множестве из остав-
k1
шихся m − k1 элементов) можно по теореме 12.1.5 выбрать Cm−k 1
способами,
— после того, как K1 и K2 выбраны, третье множество K3 (из k3 элементов в множестве из
k1
оставшихся m − k1 − k2 элементов) можно по теореме 12.1.5 выбрать Cm−k 1
способами,
...
— и последнее множество, Kn уже нужно будет выбирать из множества мощности m − k1 −
k2 − ... − kn−1 = kn элементов, и оно уже будет выбираться однозначно.
В результате по правилу комбинаторного умножения (теорема 12.1.2) мы получаем, что способов
выбрать разбиение K1 , ..., Kn множества S имеется

k1 k2 k3 m−1 k
Cm · Cm−k1
· Cm−k1 −k2
· ... · Cm−k1 −k2 −...−km−2
·1 =
m! (m − k1 )! (m − k1 − k2 )! (m − k1 − k2 − ... − kn−1 )!
= · · · ... · =
k1 !(m − k1 )! k2 !(m − k1 − k2 )! k3 !(m − k1 − k2 − k3 )! kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )!
§ 1. Комбинаторика 657

m! m!
= =
k1 ! · k2 ! · k3 ! · ... · kn−1 !(m − k1 − k2 − k3 − ... − kn−1 )! k1 ! · k2 ! · k3 ! · ... · kn−1 ! · kn !

⋄ 12.1.11. Сколькими способами можно разде- (потому что каждое такое разбиение показывает,
лить 3m предметов между 3 людьми поровну? какой цвет имеет кубик с данным номером). Та-
Здесь речь идет о разбиении типа (m, m, m), ких разбиений имеется
поэтому по теореме 12.1.6 число разбиений равно
k1 ,...,kn m!
Cm = .
m,m,m (3m)! (3m)! k1 ! · ... · kn !
C3m = = .
m! · m! · m! (m!)3 Среди них имеются разбиения, у которых эле-
менты первого множества K1 находятся на пер-
⋄ 12.1.12. 10 человек случайно размещаются в
вых k1 местах. Выбрать такое разбиение –
гостиннице по трем номерам:
все равно что выбрать расположение остальных
— 2 номера 3-местных, и множеств K2 , ..., Kn , то есть выбрать разбиение
— 1 номер 4-местный. множества {k1 + 1, ..., m} (из m − k1 элементов)
по типу (k2 , ..., kn ). Таких разбиений имеется
Какова вероятность, что два конкретных чело-
века, А и Б, попадут в 4-местный номер? k2 ,...,kn (m − k1 )!
Cm−k = .
Разместить 10 человек по таким номерам – 1
k2 ! · ... · kn !
все равно что выбрать разбиение 10-элементного
Вероятность, что попадется именно такое разби-
множества (из 10 человек) типа (3, 3, 4). Таких
ение равна отношению числа таких разбиений к
разбиений имеется
числу всех разбиений:
3,3,4 10! (m−k1 )!
C10 = . C k2 ,...,k n
(m − k1 )! · k1 !
3!3!4! P = m−k 1
k1 ,...,kn
= k2 !·...·kn !
m!
= .
Cm k1 !·...·kn !
m!
Далее, разместить 10 человек так, чтобы двое по-
пали в 4-местный номер – все равно, что разме- ⋄ 12.1.14. Бросается 5 игральных костей. Найти
стить оставшихся 8 человек по номерам вмести- вероятности, что
мостью 3, 3 и 2 (оставшиеся 2 места в 4-местном
1) выпадут 2 единицы, 2 тройки и 1 шестерка,
номере). Это в свою очередь эквивалентно раз-
биению 8-элементного множества типа (3, 3, 2), и 2) выпадут неповторяющиеся цифры,
таких разбиений имеется 3) выпадут ровно 3 одинаковые цифры.

8! Решение. Результат бросания 5 костей мож-


C83,3,2 = . но понимать как последовательность длинной 5
3!3!2!
из цифр 1, 2, 3, 4, 5, 6. Например, последователь-
Вероятность, что А и Б попадут в 4-местный но- ность
мер равна отношению числа благоприятных ис- (3, 1, 4, 2, 2)
ходов для этого события к числу всех возможных
означает, что первая косточка выпала цифрой 3,
исходов:
вторая – цифрой 1, третья – цифрой 4, четвертая
C 3,3,2 8!
8!4! 4·3 1 и пятая – цифрой 2. Таких последовательностей
P = 83,3,4 = 3!3!2!
10!
= = = . имеется
C10 10!2! 10 · 9 15
3!3!4! 6 · 6 · 6 · 6 · 6 = 65 .
⋄ 12.1.13. В ящике имеется k1 + k2 + ... + kn = m 1. Заметим, что каждую последовательность,
кубиков разных цветов: удовлетворяющую первому условию (то есть та-
— k1 кубиков первого цвета, кую, в которой 2 единицы, 2 тройки и 1 шестер-
ка) можно понимать как разбиение типа (2, 2, 1)
— k2 кубиков второго цвета,
множества мест (индексов) {1, 2, 3, 4, 5}. Напри-
... мер, последовательность
— kn кубиков n-го цвета.
(1, 1, 3, 3, 6) (12.1.8)
Случайным образом кубики раскладываются в
ряд. Какова вероятность, что первые k1 кубиков порождает такое разбиение множества мест:
окажутся первого цвета? {1, 2}, {3, 4}, {5}.
Решение. Разложить кубики в ряд – все
равно, что разбить множество {1, 2, ..., m} на – здесь первое множество, {1, 2}, показывает, что
подмножества (K1 , K2 , ..., Kn ) типа (k1 , k2 , ..., kn ) на первых двух местах в (12.1.8) стоят единицы,
658 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

второе множество, {3, 4} – что на третьем и чет- По правилу комбинаторного умножения (теоре-
вертом месте стоят тройки, а последнее множе- ма 12.1.2), число таких последовательностей рав-
ство – что на пятом месте стоит шестерка. но
Наоборот, если дано, например, разбиение 5!
· 6 · 12.
3! · 2!
{2, 4}, {1, 5}, {3}.
Вероятность выпадения такой комбинавции
то ему соответствует последовательность выпвв-
ших цифр 5!
· 6 · 12 5!
(3, 1, 6, 1, 3). P = 3!·2! 5 = 4.
6 6
Таким образом, описать распределение вы-
павших костей с 2 единицами, 2 тройками и 1 ше- ⋄ 12.1.15. 52 карты раздаются по 4 игрокам
стеркой – то же самое, что задать разбиение типа (каждому по 13 карт). Найти вероятность того,
(2, 2, 1) множества мест (индексов) {1, 2, 3, 4, 5}. что
Получается, что между нужными распределе-
1) каждый игрок получит туза,
ниями выпавших костей и разбиенями имеется
взаимно однозначное соответствие. А по теореме 2) какой-то игрок получит карты только одной
12.1.6 таких разбиений имеется масти,
5! 3) все тузы попадут к одному игроку,
C52,2,1 = = 5 · 3 · 2 = 30. 4) двое определенных игроков не получат ни од-
2! · 2! · 1!
Теперь вероятность выпадения нужного распре- ного туза.
деления Здесь задать распределение карт – то же что
30 5 задать разбиение типа (13, 13, 13, 13) множества
P = 5 = 4.
6 6 из 52 карт. Таких разбиений всего
2. Во втором вопросе благоприятным исходом
является размещение длины 5 из элементов мно- 13,13,13,13 52!
жества {1, 2, 3, 4, 5, 6}. По формуле (12.1.3) таких C52 = .
(13!)4
последовательностей имеется
6! 1. В первом вопросе число благоприятных ис-
A56 = = 6!. ходов можно посчитать так:
(6 − 5)!
Вероятность, что выпадет такое распределение — сначала раздаем тузы по 4 игрокам, всего ва-
риантов
6! 5!
P = = 4. A44 = 4!,
65 6
3. В третьем вопросе число благоприятных — потом распределяем остальные 48 карт по 4
распределений выпавших костей можно посчи- игрокам, всего вариантов
тать с помощью правила комбинаторного умно-
жения. Выбрать последовательность длины 5, в 12,12,12,12 48!
которой ровно 3 одинаковых цифры из множе- C48 =
(12!)4
ства {1, 2, 3, 4, 5, 6} можно так:
— сначала выбираются 3 места, куда лягут эти В результате благоприятных исходов
одинаковые цифры; это то же самое, что вы-
48!
брать подмножество мощности 3 в множестве 4! · .
(12!)4
индексов мощности 5, поэтому таких вариан-
тов имеется
5! Вероятность такого распределения карт
C53 = ;
3! · 2!
48!
— после этого выбираем цифру, которая на эти 4! · (12!) 4 4! · 48! · 134 2 · 3 · 4 · 134
3 места ляжет; всего вариантов имеется P = 52!
= = =
4(13!)
52! 49 · 50 · 51 · 52
6 2 · 3 · 133 133
= = .
— затем на оставшиеся 3 места выбираем цифры 49 · 50 · 51 49 · 25 · 17
из оставшизся 4-х, причем с условием, чтобы
они не повторялись; это то же самое, что вы- 2. Во втором вопросе благоприятные исходы
брать размещение длины 2 в множестве мощ- считаются так:
ности 2, и по формуле (12.1.3) таких последо- — сначала выбираем игрока, который получит
вательностей имеется карты одной масти, таких вариантов имеется
4!
A24 = = 12. 4,
(4 − 2)!
§ 1. Комбинаторика 659

— затем выбираем масть, которую он получит, a) сначала считаем, что 1-й игрок получил все
таких вариантов имеется тоже 4 туза, а 2-й (и остальные) – ни одного; то-
гда оставшиеся 48 карт распределятся в про-
4 порции (9, 13, 13, 13), и число таких вариантов
— после этого распределяем оставшиеся 39 карт будет
9,13,13,13
по оставшимся 3 игрокам, это то же самое, C48 ,
что задать разбиенти типа 13, 13, 13 множе-
ства из 39 элементов, вариантов будет b) затем рассматриваем ситуацию, когда 1-й иг-
рок получил 3 туза, а 2-й – 1 туз; тогда остав-
13,13,13 39! шиеся 48 карт распределятся в пропорции
C39 = .
(13!)3 (10, 12, 13, 13), и число таких вариантов будет
По правилу комбинаторного умножения (теоре- 10,12,13,13
C48 ,
ма 12.1.2), всего благоприятных исходов будет
39! c) затем считаем, что 1-й игрок получил 2 ту-
4·4· .
(13!)3 за, и 2-й – 2 туза; тогда оставшиеся 48 карт
распределятся в пропорции (11, 11, 13, 13), и
Вероятность такого распределения карт число таких вариантов будет
39!
4·4· (13!)3 42 · 39! · 13 11,11,13,13
P = 52!
= . C48 ,
(13!)4
52!

3. В третьем вопросе: d) затем рассматриваем ситуацию, когда 1-й иг-


рок получил 1 туз, и 2-й – 3 туза; тогда остав-
— сначала выбираем игрока, которому попадут шиеся 48 карт распределятся в пропорции
тузы, таких вариантов имеется (12, 10, 13, 13), и число таких вариантов будет
4, 12,10,13,13
C48 ,
— после этого распределяем оставшиеся 48 карт,
это то же самое, что задать разбиенти типа e) наконец, остается вариант, когда 1-й игрок не
9, 13, 13, 13 множества из 48 элементов, вари- получает тузов, и 2-й получает все 4 туза; то-
антов будет гда оставшиеся 48 карт распределятся в про-
порции (13, 9, 13, 13), и число таких вариантов
9,13,13,13 48!
C48 = . будет
9! · (13!)3 13,9,13,13
C48 .
По правилу комбинаторного умножения (теоре-
ма 12.1.2), всего благоприятных исходов будет Эти множества исходов не пересекаются (то есть
не может быть, чтобы какое-то распределение
48! карт подходило, например, под случай a и од-
4· .
9! · (13!)3 новременно под случай b). Поэтому общее число
Вероятность такого распределения карт таких исходов равно сумме чисел в каждом ва-
рианте:
48!
4· 9!·(13!)3 4 · 13
P = 52!
= = 9,13,13,13
C48 10,12,13,13
+ C48 11,11,13,13
+ C48 +
(13!)4
9 · 49 · 50 · 51 · 52
12,10,13,13 13,9,13,13
1 + C48 + C48 .
= .
9 · 49 · 50 · 51
Вероятность такого распределения карт
4. В четвертом вопросе будем считать, что ту-
зы должны получить только 1-й и 2-й игроки (а 9,13,13,13 10,12,13,13 11,11,13,13
3-й и 4-й их не получат). Здесь придется рассмот- P = (C48 + C48 + C48 +
12,10,13,13 13,9,13,13 13,13,13,13
реть 5 случаев: + C48 + C48 )/C52

Мультииндексы Mn [m]. Выборкой из n элементов, или мультииндексом длины n, называется


произвольное отображение k : {1, ..., n} → Z+ . При этом
— число n
X
|k| = ki (12.1.9)
i=1
660 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

называется объемом выборки (мультииндекса) k,


— число
n
X
k! = ki ! (12.1.10)
i−1

называется факториалом выборки (мультииндекса) k.


Множество всех выборок (мультииндексов) длины n и объема m мы будем обозначать символом
Mn [m]. Множество всех мултииндексов длины n мы обозначаем Mn . Очевидно,
[
Mn = Mn [m] (12.1.11)
m∈Z+

Теорема 12.1.7. Число мультииндексов длины n и объема m равно

n−1 m (n + m − 1)!
card Mn [m] = Cm+n−1 = Cm+n−1 = (12.1.12)
m! · (n − 1)!

Доказательство. Обозначим символом E множество всех последовательностей длины m + n − 1,


состоящих из нулей и единиц и имеющих m единиц и n − 1 нулей:

ε∈E ⇐⇒ ε = (ε1 , ..., εm+n−1 ), εi ∈ {0; 1}, card{i : εi = 1} = m, card{i : εi = 0} = n − 1.

Заметим, что каждая такая последовательность порождает некоторый мультииндекс k : {1, ..., n} →
Z+ объема m по такому правилу:
1) k1 – число единиц в ε до первого нуля,
2) k2 – число единиц в ε между первым и вторым нулями,
...)
i) ki – число единиц в ε между i − 1-м и i-м нулями,
...)
n) kn – число единиц в ε после последнего нуля.
Более того, это правило устанавливает биекцию между мультииндексами k : {1, ..., n} → Z+
объема m и последовательностями ε ∈ E. Поэтому количество таких мультииндексов равно чилу
элементов в E. А задать последовательность в E – то же самое, что описать куда поставить n − 1
нулей в строке из m + n − 1 элементов. То есть выбрать подмножество мощности n − 1 в множестве
n−1
мощности m + n − 1. По теореме 12.1.5 таких подмножеств имеется Cm+n−1 .

⋄ 12.1.16. В кондитерской 10 видов пирожных. 9


выборок понятное дело, будет C17 − 10. Вероят-
Покупатель выбрал 8. Какова вероятность, что ность такого события
9
1) все выбранные пирожные будут одного вида, C17 − 10 10
P = 9 =1− 9 .
2) выбранные пирожные будут разных видов (то C17 C17
есть не все одного вида),
3. Во третьем случае сделать выбор – значит
3) будут выбраны по 2 пирожных одного вида? выбрать 4 вида пирожных из 10. Это то же са-
Здесь выбрать пирожные – это то же самое, мое, что выбрать подмножество мощности 4 в
что сделать выборку из 10 элементов объема 8. множестве мощности 10. По теореме 12.1.5 таких
4
По формуле (12.1.12) число таких выборок будет вариантов имеется C10 . Получается, вероятность
10−1
равно C8+10−1 9
= C17 . такого события равна
1. В первом случае имеется всего 10 способов 4
C10
выбрать пирожные (так, чтобы они были одного P = 9 .
C17
вида). Поэтому вероятность будет
⊲ 12.1.17. В библиотеке книги по 16 разделам.
10 Заказано 10 книг. Какова вероятность, что
P = 9 .
C17
1) все заказанные книги будут из одного разде-
2. Во втором случае сделать выбор – значит ла,
сделть выборку, отличную от случая 1. Таких 2) заказанные книги будут не из одного раздела,
§ 1. Комбинаторика 661

3) никакие две книги не будут из одного разде- 2. Во второй ситуации благоприятным исхо-
ла? дом является любая выборка (k1 , k2 , ..., kn ), у ко-
торой первый элемент нулевой, k1 = 0. Задать
⋄ 12.1.18. m одинаковых шаров случайно рас- такую выборку – то же самое, что задать остав-
кладываются по n урнам. Найти вероятность, шиеся элементы (k , ..., k ) (с условием, что их
2 n
что сумма будет равна m). Это то же самое, что за-
1) все шары лягут в 1-ю урну, дать выборку из n − 1 элементов объемом m.
2) в 1-у урну не попадет ни одного шара, По формуле (12.1.12) таких выборок имеется
n−2
Cm+n−2 . Вероятность такого события равна
3) все шары лягут в какую-то одну урну?
n−2
Здесь разложить шары по урнам – то же са- Cm+n−2
мое, что задать выборку из n элементов объемом P = n−1 .
Cm+n−1
m. По формуле (12.1.12) таких выборок имеется
n−1
Cm+n−1 . 3. В третьей ситуации благоприятных исхо-
1. В первой ситуации благоприятный исход дов будет n, потому что выбрать благоприятный
имеется один: (m, 0, ..., 0). Поэтому вероятность исход - то же самое, что выбрать урну, куда по-
этого события равна падут все шары. В результате вероятность будет
1 n
P = n−1 . P = n−1 .
Cm+n−1 Cm+n−1

• Представлением мультииндекса k ∈ Mn [m] называется произвольная последовательность


σ : {1, ..., |k|} → {1, ..., n} со свойством

∀i ∈ {1, ..., n} card σ −1 (i) = ki .

Множество всех представлений мультииндекса k ∈ Mn [m] обозначается Rep(k).

Теорема 12.1.8. Число представлений данного мультииндекса k ∈ Mn [m] равно

k1 ,...,kn |k|! |k|!


card Rep(k) = C|k| = = (12.1.13)
k! k1 ! · ... · km !

Доказательство. Задать представление мультииндекса k ∈ Mn [m] – то же самое, что задать разби-


k1 ,...,kn
ение типа k1 , ..., kn множества {1, ..., m}. А по теореме 12.1.6 таких разбиений имеется C|k| .

⋄ 12.1.19. В примере 12.1.16 предположим, что 12.1.6 (или по теореме 12.1.8) C84,3,1 = 4!·3!·1!
8!
.
выборка пирожных была такой: (4, 3, 1) (то есть 4
одного вида, 3 другого и еще 1 третьего). Сколь- ⊲ 12.1.20. Сколько разных слов можно полу-
кими способами их можно распределить между чить перестановками слов
8 людьми за столом?
1) “мама”,
Здесь распределить пирожные между людь-
ми – то же самое, что задать разбиение людей 2) “математика”,
типа (4, 3, 1). Таких разбиений будет по теореме 3) “комбинаторика”?

(b) Перестановки
• Перестановкой длины n ∈ N называется произвольное биективное отображение началь-
ного интервала {1, ..., n} натурального ряда в себя:

σ : {1, ..., n} → {1, ..., n}

На с.73 мы определили конечные последовательности как отображения с областью опре-


деления на конечном ординале. Нам будет удобно немного видоизменить это определение:
662 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

под конечной последовательностью мы будем понимать отображение с областью определе-


ния на начальном интервале {1, ..., n} натурального ряда. Поэтому перестановку σ длины
n также удобно записывать в виде конечной последовательности (строки):
σ = (σ(1), σ(2), ..., σ(n)) (12.1.14)
Множество всех перестановок длины n обозначается символом Sn .

Число перестановок.
Теорема 12.1.9. Число всех перестановок длины n равно n!:
card Sn = n! (12.1.15)
Доказательство. Каждую перестановку σ : {1, ..., n} → {1, ..., n} можно представлять себе как
размещение длины n в множестве мощности n. По формуле (12.1.3) число таких размещений будет
равно
n!
Ann = = n!.
(n − n)!

Пусть τ : {1, ..., m} → {1, ..., n} – произвольное отображение. Условимся говорить, что переста-
новка σ : {1, ..., m} → {1, ..., m} не меняет отображение τ , если
τ ◦ σ = τ.
Теорема 12.1.10. Число перестановок σ : {1, ..., m} → {1, ..., m} не меняющих отображение τ :
{1, ..., m} → {1, ..., n} равно
n
Y
card{σ ∈ Sm : τ ◦ σ = τ } = card τ −1 (i)!. (12.1.16)
i=1

В частном случае, если τ является представлением мультииндекса k, то число перестановок его


аргументов, не меняющих τ , равно факториалу мультииндекса k:
card{σ ∈ Sm : τ ◦ σ = τ } = k!. (12.1.17)
Доказательство. Выбрать такую перестановку σ – все равно что сначала выбрать перестановку
индексов, лежащих в множестве τ −1 (1) (таких перестановок имеется card τ −1 (1)!), затем выбрать
перестановку индексов, лежащих в множестве τ −1 (2) (таких перестановок имеется card τ −1 (2)!), и
так далее. Вместе по правилу комбинаторного умножения имеется card τ −1 (1)! · card τ −1 (2)! · ... ·
card τ −1 (n)! перестановок.

Группа перестановок Sn . Для любых двух перестановок σ и τ длины n их композиция σ ◦ τ


определяется как обычная композиция отображений6 из {1, ..., n} в {1, ..., n}:
(σ ◦ τ )(i) = σ(τ (i)), i ∈ {1, ..., n} (12.1.18)
Множество Sn всех перестановок образует группу относительно этой операции, Это означает, что,
во-первых, выполняется тождество ассоциативности,
(σ ◦ τ ) ◦ υ = σ ◦ (τ ◦ υ), σ, τ, υ ∈ Sn ,
во-вторых, существует некий элемент e ∈ Sn , а именно, тождественная перестановка
e(i) = i, i ∈ {1, ..., n}, (12.1.19)
характеризуемый условием
σ ◦ e = σ = e ◦ σ, σ ∈ Sn ,
и, в третьих, у любой перестановки σ ∈ Sn существует обратная перестановка σ −1 ∈ Sn (обратное
отображение7 для биекции σ), характеризуемая условием
σ ◦ σ −1 = e = σ −1 ◦ σ.
6 Напомним, что композиция отображений была определена на с.40 части I.
7 Обратное отображение определялось на с.42.
§ 1. Комбинаторика 663

Циклы. Говорят, что перестановка σ ∈ Sn оставляет неподвижным элемент k множества {1, ..., n},
если
σ(k) = k.
В противном случае, если
σ(k) 6= k,
говорят, что перестановка σ ∈ Sn сдвигает элемент k.
Говорят, что перестановка σ ∈ Sn связывает два элемента k и l множества {1, ..., n}, если для
некоторого m ∈ Z
σ m (k) = l.
Циклом или циклической перестановкой длины n ∈ N называется всякая перестановка σ ∈ Sn ,
которая связывает любые два сдвигаемых ею элемента k, l ∈ {1, ..., n}:
 
σ(k) 6= k & σ(l) 6= l =⇒ ∃m ∈ Z σ m (k) = l.

Всякая последовательность попарно различных элементов {a1 , ..., ar } множества {1, ..., n} опре-
деляет цикл, обозначаемый символом (a1 a2 ... ar ), по формуле


k, k∈/ {a1 , ..., ar }
(a1 a2 ... ar )(k) = ai+1 , k = ai , i < r . (12.1.20)


a1 , k = ar
(отличие от записи (12.1.14) в том, что здесь элементы строки ai разделяются пробелами, а не
запятыми).
Теорема 12.1.11. Всякая перестановка σ ∈ Sn представима в виде композиции некоторого числа
циклов.
Доказательство. Для любых двух элементов k и l множества {1, ..., n} условимся писать k ∼ l
если перестановка σ связывает эти элементы. Нетрудно видеть, что отношение ∼ является отно-
шением эквивалентности на {1, ..., n}. Поэтому оно разбивает {1, ..., n} на классы эквивалентности.
Обозначим их I1 , ..., Ip . Для каждого q = 1, ..., p положим
(
σ(k), k ∈ Iq
τq (k) =
k, k∈/ Iq

Нетрудно заметить, что каждое отображение τq является циклической перестановкой длины n. С


другой стороны, для всякого k ∈ {1, ..., n} выбрав номер q так, чтобы k ∈ Iq , мы получим

Ip Ip−1
6=

6=

Iq Iq

(τ1 ◦ ... ◦ τq ◦ ... ◦ τp )( k ) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τp−1 )( k ) = ... = (τ1 ◦ ... ◦ τq )(k) =
= (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−1 )(σ(k)) = (τ1 ◦ ... ◦ τq ◦ ... ◦ τq−2 )(σ(k)) = τ1 (σ(k)) = σ(k)

Iq Iq Iq
6=

6=

6=

Iq−1 Iq−2 I1

(мы здесь для наглядности считаем, что 2 < q < p − 1). То есть композиция циклов τq совпадает с
σ:
τ1 ◦ ... ◦ τp = σ
(при этом можно заметить, что последовательность перемножения циклов τq здесь не важна, при
любой их перестановке результатом все равно будет σ).

Транспозиции.
• Транспозицией называется цикл, сдвигающий ровно два элемента, то есть перестановка,
меняющая местами два числа i 6= j, а остальные оставляющая на месте:


k, k ∈/ {i, j}
(i j)(k) = j, k = i . (12.1.21)


i, k = j
664 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Отметим следующее тождество:

(a b) ◦ (a c) = (a c) ◦ (b c) (12.1.22)

Его достаточно проверить на трех элементах, a, b, c:


   
(a b) ◦ (a c) (a) = (a b) (a c)(a) = (a b)(c) = c = (a c)(a) = (a c) (b c)(a) = (a c) ◦ (b c) (a),
   
(a b) ◦ (a c) (c) = (a b) (a c)(c) = (a b)(a) = b = (a c)(b) = (a c) (b c)(c) = (a c) ◦ (b c) (c),
   
(a b) ◦ (a c) (b) = (a b) (a c)(b) = (a b)(b) = a = (a c)(c) = (a c) (b c)(b) = (a c) ◦ (b c) (b).
Теорема 12.1.12. Всякая перестановка представима в виде композиции транспозиций

π = τm ◦ ... ◦ τ1 (12.1.23)

(в частном случае, когда σ = e это утверждение следует понимать так, что в правой части
стоит пустое множество транспозиций).
Доказательство. По теореме 12.1.11 достаточно доказать это утверждение для циклов. Пусть σ –
какой-нибудь цикл. Выберем какой-нибудь элемент a1 ∈ {1, ..., n}, который σ сдвигает. Положим
затем
ai+1 = σ(ai ),
для всех i, меньших общего числа r сдвигаемых элементов. Тогда

σ = (a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 ).

Действительно, подставляя в качестве аргумента a1 , мы получим

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a2 ) = a2 ,

затем для a2

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a1 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a3 ) = a3 ,

затем для a3

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(a3 ) = (a1 ar ) ◦ ... ◦ (a1 a4 )(a1 ) = a4 ,

и так далее, и наконец для ar ,

(a1 ar ) ◦ ... ◦ (a1 a3 ) ◦ (a1 a2 )(ar ) = (a1 ar ) ◦ ... ◦ (a1 a3 )(ar ) = (a1 ar )(ar ) = a1 .

Остается заметить, что все остальные элементы, то есть не лежащие в множестве {a1 , ..., ar } явля-
ются неподвижными как для σ, так и для всех транспозиций (a1 ai ).
Теорема 12.1.13. Всякая транспозиция является композицией некоторого набора транспозиций
соседних чисел, а именно

(i i+k) = (i i+1)◦(i+1 i+2)◦...◦(i+k−2 i+k−1)◦(i+k−1 i+k)◦(i+k−1 i+k−2)◦...◦(i+2 i+1)◦(i+1 i)


(12.1.24)

Знак перестановки и четность.


Теорема 12.1.14. В разложении любой перестановки π ∈ Sn в композицию транспозиций

π = τp ◦ ... ◦ τ1 (12.1.25)

число
sgn π = (−1)p (12.1.26)
не зависит от выбора разложения (12.1.25).
• Число sgn π в (12.1.26) называется знаком перестановки π ∈ Sn . Если sgn π = 1, то π
называется четной перестановкой, а если sgn π = −1, то нечетной.
§ 1. Комбинаторика 665

Для доказательства нам понадобятся две леммы.

Лемма 12.1.15. Если σ и τ – две неодинаковые транспозиции, то для всякого элемента i ∈


{1, ..., n}, сдвигаемого транспозицией τ можно подобрать две транспозиции σ ′ и τ ′ так, чтобы

σ ◦ τ = σ′ ◦ τ ′ , σ ′ (i) 6= i, τ ′ (i) = i.

Доказательство. Пусть τ = (i j). Тогда возможны варианты:


— σ = (k l), где {k, l} ∩ {i, j} = ∅, и в этом случае

σ ◦ τ = (k l) ◦ (i j) = (i j) ◦ (k l),

— σ = (i k), где k ∈
/ {i, j}, и в этом случае

σ ◦ τ = (i k) ◦ (i j) = (12.1.22) = (i j) ◦ (j k),

— σ = (j k), где k ∈
/ {i, j}, и в этом случае

σ ◦ τ = (j k) ◦ (i j) = (12.1.22) = (i k) ◦ (j k).

Лемма 12.1.16. В любом разложении тождественной перестановки в композицию транспози-


ций
e = τp ◦ ... ◦ τ1 (12.1.27)
число сомножителей p четно.

Доказательство. Заметим сразу, что p не может быть единицей, потому что иначе мы получили
бы, что тождественная перестановка сама является транспозицией:

e = τ.

Предположим далее, что мы доказали, что p не может быть нечетным числом в интервале между
1 и некоторым P . Пусть p = P + 2 (то есть нечетное число, следующее за P ). Если в разложении
(12.1.27) какие-то две рядом стоящие транспозиции одинаковы

τi+1 = τi ,

то в композиции они дают e, и поэтому на них можно сократить, и мы опять получим равенство
(12.1.27), в котором p = P , и это равенство будет невозможно по предположению индукции.
Поэтому можно считать, что никакие две рядом стоящие транспозиции в (12.1.27) неодинаковы.
Выберем теперь элемент i, сдвигаемый транспозицией τ1 . По лемме 12.1.15 существуют транспози-
ции τ2′ и τ1′ такие, что
τ2 ◦ τ1 = τ2′ ◦ τ1′ , τ2′ (i) 6= i, τ1′ (i) = i.
После этого опять по лемме 12.1.15 существуют транспозиции τ3′ и τ2′′ такие, что

τ3 ◦ τ2′ = τ3′ ◦ τ2′′ , τ3′ (i) 6= i, τ2′′ (i) = i.

И так далее. В конце этой процедуры мы получим (вернув в обозначениях где нужно один штрих
вместо двух) равенство
e = τp′ ◦ ... ◦ τ1′
в котором последняя перестановка τp′ сдвигает элемент i, а первые p − 1 перестановок τ1′ , ..., τp−1

оставляют его на месте:


τp′ (i) 6= i, ′
τp−1 (i) = ... = τ1′ (i) = i.
Вместе это дает противоречие:

i = e(i) = τp′ ◦ ... ◦ τ1′ (i) = τp′ (i) 6= i.


666 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство теоремы 12.1.14. Пусть заданы два разложения перестановки π на транспозиции:

π = τp ◦ ... ◦ τ1 = σq ◦ ... ◦ σ1

Тогда

e = π ◦ π −1 = (τp ◦ ... ◦ τ1 ) ◦ (σq ◦ ... ◦ σ1 )−1 = τp ◦ ... ◦ τ1 ◦ σ1−1 ◦ ... ◦ σq−1 = τp ◦ ... ◦ τ1 ◦ σ1 ◦ ... ◦ σq

По лемме 12.1.16 число сомножителей здесь p + q должно быть четно. Поэтому либо оба числа p и
q четны, либо оба они нечетны. В каждом из вариантов

(−1)p = (−1)q .

Свойства перестановок:
10 . Тождественная перестановка четна:

sgn e = 1 (12.1.28)

20 . Знак композиции равен произведению знаков:

sgn(π ◦ σ) = sgn π · sgn σ (12.1.29)

30 . При переходе к обратной перестановке знак не меняется:

sgn π −1 = sgn π (12.1.30)

Доказательство. 1. Четность тождественной перестановки доказана в лемме 12.1.16.


2. Если перестановки π и σ обе четные, то есть их можно разложить в композицию трансвер-
сий с четным числом множителей, то их произведение также будет композицией четного набора
трансверсий, поэтому π ◦ σ тоже четное, и мы получаем

sgn(π ◦ σ) = 1 = 1 · 1 = sgn π · sgn σ.

Если перестановки π и σ обе нечетные, то есть их можно разложить в композицию трансверсий с


нечетным числом множителей, то их произведение снова будет композицией четного набора транс-
версий, поэтому π ◦ σ тоже четное, и мы получаем

sgn(π ◦ σ) = 1 = (−1) · (−1) = sgn π · sgn σ.

Если π четная, а σ нечетная, то π раскладывается в композицию четного набора трансверсий, а σ


в композицию нечетного набора, и поэтому их произведение будет композицией нечетного набора
трансверсий. То есть π ◦ σ в этом случае нечетное, и мы получаем

sgn(π ◦ σ) = −1 = 1 · (−1) = sgn π · sgn σ.

И точно так же если π нечетная, а σ четная.


3. Если π = τp ◦ ... ◦ τ1 , то π −1 = τ1−1 ◦ ... ◦ τp−1 = τ1 ◦ ... ◦ τp . То есть π и π −1 имеют разложения с
одинаковым числом трансверсий, поэтому четность этих перестановок тоже одинакова.

Перестановка, как смена порядка. Напомним, что в главе 2 на с.123 мы аксиоматически


ввели понятие сравнения чисел. В математике сравнивать можно не только числа, но и элементы
разных абстрактных множеств, например, функции, матрицы, подмножества и так далее. Точное
определение понятию порядка на множестве выглядит как естественная модификация определения
на с.123:
• Пусть N – некоторое множество и пусть среди всевозможных пар (a, b) его элементов
a, b ∈ N выделены такие, для которых справедливо (подходящим образом определенное)
высказывание «a меньше, либо равно b», записываемое a  b, и при этом выполняются
следующие правила.
O1. Рефлексивность: для любого a справедливо a  a.
§ 1. Комбинаторика 667

O2. Транзитивность: если a  b и b  c, то a  c.


O3. Антисимметричность: если a  b и b  a, то a = b.
Тогда говорят, что на множестве N задан частичный порядок .
• Если дополнительно выполняется аксиома
O4. Линейность: для любых a и b верно одно из двух:
– либо a  b;
– либо b  a.
порядок  на множестве N называется линейным.

⋄ 12.1.21. Индуцированный порядок на зательно задавать таким способом (то есть ин-
множестве чисел. Если N – подмножество в дуцируя его из R). Например, если выбрать про-
множестве чисел R, то на нем можно рассмот- извольную инъективную последовательность чи-
реть линейный порядок, индуцированный из R, сел x1 , ..., xk (то есть размещение, определенное
то есть такой, при котором неравенство a  b вы- на с.654), то в ней порядок можно определить
полняется, если оно верно, как неравенство чисел как порядок индексов:
(в линейно упорядочнном множестве R):
xi  xj ⇐⇒ i 6 j.
ab ⇐⇒ a 6 b.
⋄ 12.1.22. Порядок, заданный нумераци- (Понятно, что это необязательно то же самое,
ей. Но порядок на числовом множестве необя- что xi 6 xj .)

Ниже из линейно упорядоченных множеств нас будут интересовать только конечные. Справед-
лива
Теорема 12.1.17. Всякий линейный порядок на конечном множестве N задается некоторой ну-
мерацией элементов этого множества: существует биективное отображение
τN : {1, ..., n} → N
где n = card N – число элементов N , такое, что
 
∀i, j ∈ {1, ..., n} τN (i)  τN (j) ⇐⇒ i6j . (12.1.31)

• Отображение τN : {1, ..., n} → N с этими свойствами называется отображением нумера-


ции по возрастанию элементов линейно упорядоченного множества N .
Пусть N – линейно упорядоченное конечное множество. По теореме 12.1.17 его порядок задается
некоторой нумерацией его элементов. Если мы поменяем парядок на N , то это автоматически будет
означать, что нумерация его элементов тоже сменится. При этом нам будет удобно следить за тем,
как по новым номерам можно восстановить старые: элементу с новым номером 1 соответствует
определенный старый номер σ(1), элементу с новым номером 2 – старый номер σ(2), и так далее.
В результате у нас получится некоторое биективное отображение σ : {1, ..., n} → {1, ..., n}, то есть
перестановка σ ∈ Sn .
Это полезно изобразить некоей картинкой. Условимся считать, что буква N обозначает не только
множество N , но и исходный порядок на нем , а буква N ′ означает то же самое множество с новым
порядком ′ . Обозначим какой-нибудь буквой, например, ι, тождественное отображение N в себя,
ι(x) = x, x ∈ N, (12.1.32)
то перестановка σ, о которой мы говорим, становится элементом следующей диаграммы:
ι / N′
NO O (12.1.33)

τN τN ′

{1, ..., n} o σ {1, ..., n}

(где τN и τN ′ – отображения нумерации элементов N и N ′ ).


Мы получаем следующее утверждение:
668 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 12.1.18. Смена линейного порядка на конечном множестве N эквивалентна переста-


новке индексов в его нумерации.
! 12.1.23. В дальнейшем нас будет интересовать почти исключительно случай, когда N с самого
начала представляет собой отрезок натурального ряда {1, ..., n} с его обычным порядком 6 (ин-
дуцированным из N). Тогда τN , как и ι, будет просто тождественным отображением {1, ..., n} в
себя:
τN (i) = ι(i) = i, i ∈ {1, ..., n},
и поэтому диаграмма (12.1.33) превратится в диаграмму
ι / {1, ..., n}′
{1, ..., n} (12.1.34)
O O
ι τ′

{1, ..., n} o σ {1, ..., n}

в которой {1, ..., n}′ обозначает множество {1, ..., n} с новым порядком 6′ , а τ ′ – нумерация его
элементов по возрастанию. Здесь ι – тождественное отображение из (12.1.32), поэтому мы получаем,
что в этом случае перестановка σ, соответствующая смене порядка, просто совпадает с нумерацией
τ ′:
σ = τ ′.
• Если K и L – два непересекающихся линейно упорядоченных конечных множества (с
порядками K и L ), то на их объединении K ⊔ L можно задать линейный порядок ,
положив a  b в случае, если выполняется одно из трех:
— либо a, b ∈ K и a K b,
— либо a, b ∈ L и a L b,
— либо a ∈ K и b ∈ L.
Множество K ⊔ L с заданным таким образом линейным порядком называется склейкой
линейнго упорядоченных множеств K и L и обозначается K ⊳ L.
Понятно, что операция склеивания не коммутативна

K ⊳ L 6= L ⊳ K,

но ассоциативна
(K ⊳ L) ⊳ M = K ⊳ (L ⊳ M ).
• Рассмотрим частную ситуацию, когда K и L образуют разбиение отрезка натурального
ряда:
K ⊔ L = {1, ..., n}, n ∈ N.
Множества K и L мы будем считать линейно упорядоченными (с линейным порядком,
индуцированным из N). Их склейка K ⊳ L представляет собой то же самое множество
K ⊔ L = {1, ..., n}, только с новым линейным порядком, поэтому согласно замечанию
12.1.23, переход от K ⊔ L = {1, ..., n} к K ⊳ L можно себе представлять как перестановку σ
элементов {1, ..., n}, которая совпадает с отображением τK⊳L нумерации по возрастанию
элементов множества τK⊳L , потому что диаграмма (12.1.34) принимает здесь вид
ι
{1, ..., n} = K ⊔ L / K ⊳L
O (12.1.35)
O
ι τK⊳L

{1, ..., n} = K ⊔ L o σ=τK⊳L {1, ..., n} = K ⊔ L

Это отображение (перестановку) σ = τK⊳L мы будем называть в дальнейшем отображе-


нием склейки разбиения (K, L) множества {1, ..., n}.
Предложение 12.1.19. Пусть N = K ⊔ L, k = card K, l = card L. Тогда отображение склейки
σ = τK⊳L удовлетворяет условиям

σ(1) < σ(2) < ... < σ(k), σ(k + 1) < σ(k + 2) < ... < σ(k + l) (12.1.36)
§ 1. Комбинаторика 669

а множества K и L восстанавливаются по σ формулами

K = {xσ(1) , ..., xσ(k) }, L = {xσ(k+1) , ..., xσ(k+l) }. (12.1.37)

Наоборот, если какая-то перестановка σ ∈ Sk+l удовлетворяет условиям (12.1.36), то она явля-
ется отображением склейки σ = τK⊳L для множеств (12.1.37).
Предложение 12.1.20. Пусть {1, ..., k + l} = K ⊔ L, k = card K, l = card L и для некоторого
i ∈ {1, ..., k + l} множество K содержит ровно одно из чисел i и i + 1,
   
i∈K & i+1∈L ∨ i+1∈K & i∈L .

Пусть множества K ′ и L′ получаются из K и L перестановкой i и i + 1.

K ′ = (i i + 1)(K), L′ = (i i + 1)(L).

Тогда транспозиция θ = (i i + 1) превращает отображение склейки τK⊳L в отображение склейки


τK ′ ⊳L′ :
θ ◦ τK⊳L = τK ′ ⊳L′ . (12.1.38)
Доказательство. Обозначим σ = τK⊳L в σ ′ = τK ′ ⊳L′ . Чтобы доказать равенство

θ ◦ σ = σ′ ,

нужно проверить две вещи:


1) θ ◦ σ является биекцией между {1, ..., k} и K ′ и между {k + 1, ..., k + l} и L′ , и
2) θ ◦ σ монотонно возрастает на множествах {1, ..., k} и {k + 1, ..., k + l}.
Первое сразу следует из того, что σ является биекцией между {1, ..., k} и K и между {k+1, ..., k+
l} и L. А второе не очевидно, и его нужно доказывать. Обозначим i′ = σ −1 (i) и j ′ = σ −1 (i + 1).
1) Если считать, что i ∈ K и i + 1 ∈
/ K, то мы получаем, во-первых,
i+1 ∈
/K

′ ′
σ(1) < ... < σ(i − 1) < σ(i ) = i 6 i + 1 < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } | {z } |{z}
k  k k k k 
 
θ σ(1) θ σ(i′ − 1) θ(i) θ σ(i′ + 1) θ σ(k)
k 
θ σ(i′ )


    
θ σ(1) < ... < θ σ(i − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)

И, во-вторых,
i∈K


σ(k + 1) < ... < σ(j − 1) < i
|{z} < i + 1 = σ(j ′ ) < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z }
k k k k k
  θ(i + 1)  
θ σ(k + 1) θ σ(j ′ − 1) θ σ(j ′ + 1) θ σ(k + l)
k 
θ σ(j ′ )


    
θ σ(k + 1) < ... < θ σ(j ′ − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)
2) Если же i ∈
/ K и i + 1 ∈ K, то, во-первых,
i∈
/K


σ(1) < ... < σ(i − 1) < i
|{z} < i + 1 = σ(i′ ) < σ(i′ + 1) < ... < σ(k)
|{z} | {z } | {z } |{z}
k  k k k k 
 θ(i + 1) 
θ σ(1) θ σ(i′ − 1) θ σ(i′ + 1) θ σ(k)
k 
θ σ(i′ )


670 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА
    
θ σ(1) < ... < θ σ(i′ − 1) < θ σ(i′ ) < θ σ(i′ + 1) < ... < θ σ(k)
И, во-вторых,
i+1∈K

′ ′
σ(k + 1) < ... < σ(j − 1) < σ(j ) = i 6 i + 1 < σ(j ′ + 1) < ... < σ(k + l)
| {z } | {z } | {z } | {z } | {z }
k k k k k
   
θ σ(k + 1) θ σ(j ′ − 1) θ(i) θ σ(j ′ + 1) θ σ(k + l)
k 
θ σ(j ′ )


    
θ σ(k + 1) < ... < θ σ(j − 1) < θ σ(j ′ ) < θ σ(j ′ + 1) < ... < θ σ(k + l)

Свойства склейки:
10 . Если {1, ..., n} = K ⊔ L, то
sgn(τK⊳L ) = (−1)kl · sgn(τK⊳L ) (12.1.39)
где k = card K и l = card L.
0
2 . Если {1, ..., n} = K ⊔ L ⊔ M , то
sgn(τK⊳L ) · sgn(τ(K⊔L)⊳M ) = sgn(τK⊳L⊳M ) (12.1.40)
Доказательство. 1. Пусть {1, ..., n} = K ⊔ L. Заметим, что отображения склейки τK⊳L и τL⊳K
связаны между собой перестановкой υ, меняющей местами отрезки {1, ..., k} и {k + 1, ..., k + l}:
ι ι
L ⊳O K o K ⊔O L /K ⊳L
O
τL⊳K ι τK⊳L

τL⊳K τK⊳L
{1, ..., n} j / {1, ..., n} o {1, ..., n}

Поэтому
−1
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(τL⊳K ◦ τK⊳L ) = sgn(υ).
А последнюю величину легко вычислить: чтобы переставить множества A = {1, ..., k} и B = {k +
1, ..., k + l}, нужно сначала последовательно передвигать первый элемент b1 = k + 1 множества B
влево, так, чтобы он встал перед A, на это уйдет ровно k транспозиций соседних элементов (по
числу элементов множества A), затем точно так же нужно передвинуть второй элемент b2 = k + 2
множества B, так, чтобы он встал между b1 и множеством A, и на это опять уйдет k транспозиций.
И так далее, и в конце концов мы передвинем l элементов множества B, и на каждую операцию
уйдет k транспозиций. Значит, всего понадобится kl транспозиций, и мы получаем
sgn(τL⊳K )−1 · sgn(τK⊳L ) = sgn(υ) = (−1)kl .
2. Пусть {1, ..., n} = K ⊔ L ⊔ M . Построение склейки (K ⊳ L) ⊳ M можно представить как после-
довательность трех действий:
1) сначала строится склейка (K⊔L)⊳M , это эквивалентно построению отображения τ(K⊔L)⊳M :
{1, ..., n} → {1, ..., n}, которое первые k + l индексов {1, ..., k + l} тратит на нумерацию
элементов множества K ⊔ L, а оставшиеся m индексов {k + l + 1, ..., n} – на нумерацию
элементов M ;
2) после того, как это сделано, упорядоченное множество K ⊔ L оказывается занумеровано
индексами {1, ..., k + l}; обозначим
−1 −1
K ′ = τ(K⊔L)⊳M (K), L′ = τ(K⊔L)⊳M (L).

и построим новую склейку, K” ⊳ L′ , или, иными словами, отображение τK ′ ⊳L′ : {1, ..., k +
l} → {1, ..., k + l}, которое первые k индексов трати на нумерацию элементов K ′ , а остав-
шиеся l индексов на нумерацию L′ ;
§ 2. Векторные пространства 671

3) когда построено τK ′ ⊳L′ , мы полагаем


(
τK ′ ⊳L′ (i), i 6 k + l
σ(i) =
i, i>k+l

и это будет перестановка σ : {1, ..., n} → {1, ..., n}, композиция которой с τ(K⊔L)⊳M дает
τ(K⊳L)⊳M :
τ(K⊳L)⊳M = τ(K⊔L)⊳M ◦ σ. (12.1.41)
Наглядно это можно изобразить диаграммой
ι ι
K ⊔ LO ⊔ M / (K ⊔ L) ⊳ M / (K ⊳ L) ⊳ M
O O
ι τ(K⊔L)⊳M τ(K⊳L)⊳M

τ(K⊔L)⊳M σ
{1, ..., n} ol {1, ..., n} o {1, ..., n}

τ(K⊳L)⊳M

Из (12.1.41) мы получаем

sgn τ(K⊳L)⊳M = sgn τ(K⊔L)⊳M · sgn σ = sgn τ(K⊔L)⊳M · sgn τK⊳L ,

§2 Векторные пространства
Важное свойство векторных величин (из которых затем, при дополнительном предположении ко-
нечномерности, формально следуют все остальные их свойства) заключается в том, что их можно
складывать друг с другом и умножать на число. В математике эти свойства формализуются кон-
струкцией векторного пространства, и в этом параграфе мы объясним, что это такое.

(a) Векторные пространства


Определение векторного пространства и примеры.
• Множество X называется (вещественным) векторным пространством или (веществен-
ным) линейным пространством, если
(a) любым двум элементам x, y ∈ X поставлен в соответствие некоторый элемент
x + y ∈ X так, что выполняются следующие правила:
V1. Коммутативность сложения: для любых элементов x, y ∈ X вы-
полняется равенство
x+y = y+x (12.2.42)
V2. Ассоциативность сложения: для любых элементов x, y, z ∈ X вы-
полняется равенство

(x + y) + z = x + (y + z) (12.2.43)

V3. Существование нуля: существует такой элемент 0 ∈ X, что

x + 0 = x, x∈X (12.2.44)

V4. Существование противоположного элемента: для любого эле-


мента a ∈ X существует такой элемент −x ∈ X (называемый проти-
воположным к элементу a) что

x + (−x) = 0 (12.2.45)

(b) любому элементу x ∈ X и любому числу λ ∈ R поставлен в соответствие неко-


торый элемент λ · x ∈ X так, что выполняются следующие правила:
672 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

V5. Ассоциативность умножения: для любых чисел λ и µ и любого


элемента x ∈ X выполняется равенство

(λ · µ) · x = λ · (µ · x) (12.2.46)

V6. Действие единицы: умножение на единицу 1 ∈ R не меняет элемен-


ты X:
1 · x = x, x∈X (12.2.47)
(c) между собой операции сложения векторов и умножения вектора на скаляр свя-
заны правилом
V7. Дистрибутивность: для любых элементов x, y ∈ X и любого числа
λ ∈ R выполняется равенство

λ · (x + y) = λ · x + λ · y (12.2.48)

⋄ 12.2.1. Координатное пространство Rn явля- ленных на произвольном множестве T ,


ется вещественным векторным пространством с
операциями f ∈ RT ⇐⇒ f :T →R
 является вещественным векторным простран-
x + y := x1 + y1 , ..., xn + yn (12.2.49)
 ством относительно операций
λ · x := λ · x1 , ..., λ · xn . (12.2.50)
(f + g)(t) := f (t) + g(t), t∈T (12.2.51)
⋄ 12.2.2. Множество R всех функций, опреде-
T
(λ · f )(t) := λ · f (t), t ∈ T. (12.2.52)

Линейно независимые системы.


• Линейной комбинацией векторов x1 , ..., xk векторного пространства X называется всякий
вектор вида
λ1 · x1 + ... + λk · xk
где λ1 , ..., λk ∈ R.
• Линейной оболочкой векторов x1 , ..., xk векторного пространства X называется множество
в X, обозначаемое span{x1 , ..., xk } и состоящее из всевозможных линейных комбинаций
векторов x1 , ..., xk

span{x1 , ..., xk } = {λ1 · x1 + ... + λk · xk ; λ1 , ..., λk ∈ R}.

• Система векторов x1 , ..., xk векторного пространства X называется


— линейно зависимой, если какой-то из этих векторов, обозначим его xi , можно
выразить как линейную комбинацию остальных:

∃λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi = λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,

— линейно независимой, если никакой xi не является линейной комбинацией осталь-


ных:

∀λ1 , ..., λi−1 , λi+1 ..., λk ∈ R xi 6= λ1 ·x1 +...+λi−1 ·xi−1 +λi+1 ·xi+1 +...+λk ·xk ,

Свойства линейно независимых систем:


1◦ . В линейно независимой системе векторов x1 , ..., xk никакой вектор не может быть
нулевым:
xi 6= 0, i = 1, ..., k.
2◦ . Всякая подсистема xi1 , ..., xil линейно независимой системы x1 , ..., xk также линейно
независима.
§ 2. Векторные пространства 673

Доказательство. 1. Если какой-то вектор в системе равен нулю, xi = 0, то его можно представить
как тривиальную линейную комбинацию остальных векторов

xi = 0 · x1 + ... + 0 · xi−1 + 0 · xi+1 + ... + 0 · xk ,

и поэтому такая система будет линейно зависимой.


2. Если x1 , ..., xk – линейно независимая система, то есть любой вектор xi не выражается линейно
через остальные векторы xj , то тем более xi не будет выражаться линейно через остальные векторы
xj , лежащие в какой-то подсистеме M ⊆ {x1 , ..., xk }. Поэтому M тоже линейно независима.
Теорема 12.2.1. Система векторов x1 , ..., xk векторного пространства X линейно независима в
том и только в том случае, если равенство

λ1 · x1 + ... + λk · xk = 0 (12.2.53)

выполняется только при нулевых коэффициентах λ1 , ..., λk :

λ1 = ... = λk = 0

Доказательство. 1. Пусть равенство (12.2.53) выполняется для набора коэффициентов, среди ко-
торых есть какой-то ненулевой:
λi 6= 0.
Тогда можно выразить слагаемое λi · xi через все остальные

λi · xi = −λ1 · x1 − ... − λi−1 · xi−1 − λi+1 · xi+1 − ... − λk · xk ,

а затем выразить сам вектор xi :

λ1 λi−1 λi+1 λk
xi = − · x1 − ... − · xi−1 − · xi+1 − ... − · xk .
λi λi λi λi
Мы получаем, что система x1 , ..., xk линейно зависима.
2. Наоборот, если система x1 , ..., xk линейно зависима, то есть какой-то вектор выражается через
остальные,
xi = λ1 · x1 + ... + λi−1 · xi−1 + λi+1 · xi+1 + ... + λk · xk ,
то перебросив все в левую часть мы получим равенство (12.2.53)

−λ1 · x1 − ... − λi−1 · xi−1 + xi − λi+1 · xi+1 − ... − λk · xk = 0,

в котором коэффициент при xi ненулевой (а именно, равен 1).

Базис и размерность.
• Система векторов b1 , ..., bn векторного пространства X называется (конечным) базисом
этого пространства, если
1) она линейно независима, и
2) любой вектор x ∈ X представим в виде некоторой линейной комбинации векто-
ров b1 , ..., bn :
∃β 1 , ..., β n ∈ R x = β 1 · b1 + ... + β n · bn , (12.2.54)
(это свойство называется линейной полнотой системы b1 , ..., bn ).

⋄ 12.2.3. В координатном пространстве Rn си- λi ∈ R равенство


стема векторов
λ1 · e1 + ... + λn · en = 0
(
0, i 6= j означает для всякого i
(ei )j = (12.2.55)
1, i = j
λi = (λ1 · e1 + ... + λn · en )i = 0.

образует базис. Действительно, во-первых, при А, во-вторых, всякий вектор x = (x1 , ..., xn ) ∈ Rn
674 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

можно представлять себе как сумму (12.2.55), называется стандартным базисом


в Rn .
x = x1 · e1 + ... + xn · en ,
• Аналогичной формулой определяется стан-
то есть как сумму (12.2.54) с дартный базис {e1 , ..., en } в Rn :

β i = xi . (
i 0, i 6= j
(e )j = . (12.2.56)
• Базис {e1 , ..., en }, определенный формулой 1, i = j

Теорема 12.2.2. Коэффициенты β 1 , ..., β n разложения произвольного данного вектора x ∈ X по


заданному базису b1 , ..., bn в X
x = β 1 · b1 + ... + β n · bn ,
определяются однозначно.
Доказательство. Предположим противное, то есть что вектор x можно разложить двумя разными
способами по базису b1 , ..., bn :

x = β 1 · b1 + ... + β n · bn = λ1 · b1 + ... + λn · bn ,

где
∃k = 1, ..., n β k 6= λk .
Тогда
 
(β 1 − λ1 ) · b1 + ... + (β n − λn ) · bn = β 1 · b1 + ... + β n · bn − λ1 · b1 + ... + λn · bn = x − x = 0

причем для некоторого k


β k − λk 6= 0.
Мы получаем, что нетривиальная линейная комбинация векторов b1 , ..., bn равна нулю. Значит,
система b1 , ..., bn линейно зависима, а это противоречит тому, что она образует базис.
Лемма 12.2.3. Длина любой линейно независимой системы a1 , ..., am в векторном пространстве
X не превосходит длины базиса b1 , ..., bn этого пространства (если он существует):

m 6 n.

Доказательство. Предположим наоборот, что

m > n.

Покажем, что тогда векторы a1 , ..., an (то есть первые n векторов в последовательности a1 , ..., am )
образуют базис пространства X. Это делается индукцией.
1. Заметим сначала, что, перенумеровав, если нужно, векторы b1 , b2 , ..., bn , можно добиться, что-
бы система a1 , b2 , ..., bn (получающаяся заменой b1 на a1 ) была базисом в X.
Поскольку b1 , ..., bn – базис, вектор a1 выражается как линейная комбинация векторов b1 , ..., bn :

a1 = λ1 · b1 + ... + λn · bn ,

для некоторых λ1 , ..., λn ∈ R. При этом по свойству 1◦ на с.672 вектор a1 (будучи элементом линейно
независимой системы) не может быть нулевым:

0 6= a1 = λ1 · b1 + ... + λn · bn .

Поэтому какой-то из коэффициентов λi тоже должен быть ненулевым. Перенумеровав, если нужно
векторы b1 , ..., bn (вместе с коэффициентами λ1 , ..., λn ), мы можем считать, что ненулевым коэффи-
циентом в этой комбинации будет λ1 :
λ1 6= 0
Тогда мы получим, что b1 выражается через векторы a1 , b2 , ..., bn :

λ1 ·b1 + λ2 · b2 + ... + λn · bn ,
a1 = |{z} (12.2.57)
6=

0
§ 2. Векторные пространства 675


1 λ2 λn
1
· a1 = b1 + 1 · b2 + ... + 1 · bn ,
λ λ λ

1 λ2 λn
· a −
b1 =
1 · b 2 − ... − · bn ,
λ1 λ1 λ1
Отсюда следует, что вообще любой вектор x ∈ X выражается через векторы a1 , b2 , ..., bn :

x = β 1 · b1 + β 2 · b2 + ... + β n · bn ,

 
1 λ2 λn
x = β1 · 1
· a1 − 1 · b2 − ... − 1 · bn + β 2 · b2 + ... + β n · bn =
λ λ λ
   
β1 β 1 · λ2 β 1 · λn
= 1 · a1 + β 2 − · b 2 + ... + β 2
− · bn .
λ λ1 λ1

Покажем теперь, что система a1 , b2 , ..., bn должна быть линейно независима. Действительно,
пусть для каких то γ 1 , ..., γ n выполняется равенство

γ 1 · a1 + γ 2 · b2 + ... + γ n · bn = 0,

Тогда, мы сразу получаем, что γ 1 = 0, потому что иначе возникает цепочка

γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
6=


γ2 γn
a1 = 1
· b2 + ... + 1 · bn
γ γ
⇓ (вычитаем из (12.2.57))
   
γ2 γn
λ1 ·b1 + λ2 − 1 · b2 + ... + λn − 1 · bn ,
0 = |{z}
γ γ
6=

означающая, что система b1 , ..., bn линейно зависима (чего не может быть, поскольку b1 , ..., bn –
базис).
А из γ 1 = 0 затем следует, что все остальные γ i тоже равны нулю:

γ 1 ·a + γ 2 · b2 + ... + γ n · bn = 0,
|{z} 1
=


γ 2 · b2 + ... + γ n · bn = 0,

γ = ... = γ n = 0,
2

потому что подсистема b2 , ..., bn линейно независима (по свойству 2◦ на с.672).


Итак, мы получили, что система a1 , b2 , ..., bn линейно независима и любой вектор x ∈ X выра-
жается через нее. То есть a1 , b2 , ..., bn – базис в X.
2. Переходим ко второму шагу индукции. Предположим, что для некоторого r < n < m мы
(после некоторой перенумерации векторов b1 , ..., bn ) доказали, что система

a1 , ..., ar , br+1 , ..., bn


676 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

является базисом в X. Покажем теперь, что перенумеровав если нужно векторы br+1 , ..., bn , можно
добиться, чтобы система
a1 , ..., ar , ar+1 , br+2 , ..., bn
была базисом в X.
Выразим ar+1 через базис a1 , ..., ar , br+1 , ..., bn :

ar+1 = λ1 · a1 + ... + λr · ar + λr+1 · br+1 + ... + λn · bn

Заметим, что в этой линейной комбинации какой-то из коэффициентов λr+1 , ..., λn должен быть
ненулевым, потому что иначе мы получили бы, что ar+1 выражается через a1 , ..., ar

ar+1 = λ1 · a1 + ... + λr · ar ,

(то есть получилось бы, что система a1 , ..., am должна быть линейно зависима, а это невозможно,
потому что она – базис). Перенумеровав, если нужно векторы br+1 , ..., bn (вместе с коэффициентами
λr+1 , ..., λn ), мы можем считать, что ненулевым коэффициентом в этой комбинации будет λr+1 :

λr+1 6= 0

Теперь теми же рассуждениями, что в пункте 1, показываем, что система a1 , ..., ar , ar+1 , br+2 , ..., bn
– базис в X.
Описанная индукция доказывает, что подходящей перенумерацией векторов b1 , ..., bn , а затем по-
следовательной заменой bi на ai , мы получим систему базисов пространства X, в которой последним
будет базис a1 , ..., an :
b1 , b2 , b3 , ..., bn
7→

a1 , b2 , b3 , ..., bn
7→

a1 , a2 , b3 , ..., bn
7→

...
7→

a1 , a2 , a3 , ..., an .
Отсюда следует, в частности, что вектор am (как любой другой вектор пространства X) должен
выражаться через векторы базиса a1 , ..., an :

am = λ1 · a1 + ... + λn · an

То есть система a1 , ..., an , ..., am должна быть линейно зависима. Это противоречие означает, что
наше исходное предположение, что m > n было неверно.

Теорема 12.2.4. Любые два базиса a1 , ..., am и b1 , ..., bn векторного пространства X (если они
существуют) имеют одинаковую длину:
m = n.

Доказательство. Поскольку a1 , ..., am – линейно независимая система, а b1 , ..., bn – базис в X, по


лемме 12.2.3 получаем
m 6 n.
С другой стороны, b1 , ..., bn – линейно независимая система, а a1 , ..., am – базис в X, поэтому опять
по лемме 12.2.3 получаем
n 6 m.
Вместе это дает равенство m = n.
§ 2. Векторные пространства 677

• Векторное пространство X называется конечномерным, если оно обладает конечным ба-


зисом, и бесконечномерным, если конечного базиса в нем нет. Из теоремы 12.2.4 следует,
что если в X есть конечный базис b1 , ..., bn , то любой другой базис должен иметь то же
самое число элементов n. Это число n называется размерностью векторного пространства
X и обозначается dim X.

Лемма 12.2.5. Если a1 , ..., ak – линейно независимая система в векторном пространстве X,


не являющаяся базисом этого пространства, то найдется вектор ak+1 такой, что система
a1 , ..., ak , ak+1 также будет линейно независимой.

Доказательство. Поскольку a1 , ..., ak – не базис в X, найдется какой-то вектор ak+1 ∈ X, который


не выражается через вектора a1 , ..., ak :

ak+1 ∈
/ span{a1 , ..., ak }.

Система a1 , ..., ak , ak+1 будет линейно независимой, потому что если

λ1 · a1 + ... + λk · ak + λk+1 · ak+1 = 0,

то, во-первых, должно быть λk+1 = 0, потому что иначе мы получили бы, что ak+1 линейно выра-
жается через a1 , ..., ak :
λ1 · a1 + ... + λk · ak + |λk+1
{z } ·ak+1 = 0,
6=
0

λ1 λk
ak+1 = − · a 1 − ... − · ak .
λk+1 λk+1
А, во-вторых, из λk+1 = 0 следует равенство

λ1 · a1 + ... + λk · ak = 0,

которое может выполняться только если все коэффициенты λ1 , ..., λk равны нулю (потому что си-
стема a1 , ..., ak линейно независима):
λ1 = ... = λk = 0.

Теорема 12.2.6. В конечномерном пространстве X длина линейно независимой системы a1 , ..., am


всегда не больше размерности пространства X

m 6 dim X. (12.2.58)

и эта система тогда и только тогда является базисом, когда ее длина равна размерности этого
пространства:
m = dim X. (12.2.59)

Доказательство. 1. Неравенство (12.2.58) – непосредственное следствие леммы 12.2.3.


2. Если a1 , ..., am – базис, то по определению размерности длина m последовательности векторов
a1 , ..., am должна быть равна размерности X, то есть выполняется (12.2.59).
3. Наоборот, если a1 , ..., am – не базис, то по лемме 12.2.5 найдется элемент am+1 такой, что систе-
ма a1 , ..., an , am+1 снова будет линейно независимой. Но тогда по лемме 12.2.3 должно выполняться
неравенство
m + 1 6 dim X,
из которого следует, что (12.2.59) неверно.

Теорема 12.2.7. Если пространство X конечномерно, то в нем всякая линейно независимая си-
стема векторов a1 , ..., am дополняется до некоторого базиса a1 , ..., am , am+1 , ..., an (где n = dim X).
678 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство. По теореме 12.2.6, длина системы a1 , ..., am не превышает размерности простран-


ства X:
m 6 n.
Если m = n, то по теореме 12.2.6 a1 , ..., am уже является базисом, и доказывать нечего. Поэтому
интересен случай, когда
m < n.
Тогда по теореме 12.2.6 a1 , ..., am – не базис, и значит по лемме 12.2.5, найдется вектор am+1 такой,
что система a1 , ..., am , am+1 снова является линейно независимой. Если m + 1 < n, то опять по по
теореме 12.2.6 a1 , ..., am , am+1 – не базис, и снова по лемме 12.2.5, найдется вектор am+2 такой, что
система a1 , ..., am , am+1 , am+2 также является линейно независимой, и так далее.
Действуя так по индукции, мы в какой-то момент получим линейно независимую систему
a1 , ..., am , am+1 , ..., an длины n = dim X, и по теореме 12.2.6 она будет базисом в X.

Подпространства.
• Подмножество Y в векторном пространстве X называется подпространством в X, если
оно замкнуто относительно операций взятия суммы и умножения на скаляр, то есть

∀x, y ∈ Y x+y ∈Y

и
∀y ∈ Y ∀λ ∈ R λ·y ∈Y

Свойства подпространств:
1◦ . В конечномерном векторном пространстве X любое подпространство Y тоже конеч-
номерно, причем
dim Y 6 dim X, (12.2.60)
и равенство dim Y = dim X достигается только в случае, если Y = X.

2 . Если Y и Z – два подпространства в векторном пространстве X, то
(a) пересечение Y ∩ Z подпространств Y и Z является подпространством в X,
(b) множество
Y + Z = {y + z; y ∈ Y, z ∈ Z}
всех векторов вида y + z, где y ∈ Y и z ∈ Z образует подпространство в X
(называемое алгебраической суммой подпространств Y и Z),
(c) если вдобавок X конечномерно, то

dim(Y ∩ Z) + dim(Y + Z) = dim Y + dim Z (12.2.61)

Доказательство. 1. Сначала нужно рассмотреть тривиальный случай: если пространство Y состо-


ит из одного нуля
Y = {0},
то оно считается конечномерным, потому что в нем есть базис, состоящий из пустого множества (а
размерность Y в этом случае считается нулевой).
Если же Y содержит хотя бы один ненулевой элемент a1 , то зафиксировав его, мы можем при-
менить индукцию как при доказательстве теоремы 12.2.7: если a1 – не базис в Y , то по лемме 12.2.5,
найдется вектор a2 ∈ Y такой, что система a1 , a2 является линейно независимой. Если после этого
a1 , a2 все еще не базис в Y , то опять по лемме 12.2.5, найдется вектор a3 ∈ Y такой, что система
a1 , a2 , a3 является линейно независимой, и так далее. Это индуктивный процесс на каком-то шаге
приведет к конечной последовательности a1 , ..., am , являющейся базисом в Y , потому что длина
всех таких последовательностей a1 , ..., am ограничена размерностью dim X пространства X:

m 6 dim X

Из этого неравенства заодно и следует (12.2.60).


2. Утверждения 2◦ (a) и 2◦ (b) проверяются элементарно, поэтому перейдем сразу к 2◦ (c). По-
скольку пространство Y ∩ Z конечномерно (как подпространство в конечномерном пространстве
X), мы можем выбрать в нем базис
a1 , ..., ak ∈ Y ∩ Z.
§ 2. Векторные пространства 679

Если рассмотреть эту последовательность как систему векторов в пространстве Y , то она будет
линейно независима, и поэтому по теореме 12.2.7 ее можно дополнить до некоторого базиса в Y :

a1 , ..., ak , y1 , ..., ym ∈ Y.

С другой стороны, последовательность a1 , ..., ak можно считать системой векторов в Z, и там она
тоже будет линейно независимой. Поэтому по теореме 12.2.7 ее можно дополнить до некоторого
базиса в Z:
a1 , ..., ak , z1 , ..., zn ∈ Z.
Теперь покажем, что система векторов a1 , ..., ak , y1 , ..., ym , z1 , ..., zn будет базисом в Y + Z.
1. Сначала убедимся, что эта система линейно независима. Пусть

α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym + γ 1 · z1 + ... + γ n · zn = 0 (12.2.62)

Обозначим
z = γ 1 · z1 + ... + γ n · zn .
Тогда с одной стороны, поскольку z1 , ..., zn ∈ Z,

z ∈ Z.

А, с другой стороны,
z = −α1 · a1 − ... − αk · ak − β 1 · y1 − ... − β m · ym
где a1 , ..., ak , y1 , ..., ym ∈ Y , и поэтому
z ∈ Y.
Как следствие,
z ∈ Y ∩ Z,
и поскольку a1 , ..., ak – базис в Y ∩ Z, должны существовать числа λ1 , ..., λk такие, что

z = λ1 · a1 + ... + λk · ak .

Теперь мы получаем цепочку:

γ 1 · z1 + ... + γ n · zn = z = λ1 · a1 + ... + λk · ak .


γ 1 · z1 + ... + γ n · zn − λ1 · a1 − ... − λk · ak = 0.
⇓ (a1 , ..., ak , z1 , ..., zn – базис в Z )

γ 1 = ... = γ n = λ1 = ... = λk = 0.
⇓ i
подставляем γ = 0 в (12.2.62)

α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym + γ 1 · z1 + ... + γ n · zn = 0


| {z }
=


α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym = 0
⇓ (a1 , ..., ak , y1 , ..., ym – базис в Y )

α1 = ... = αk = β 1 = ... = β m = 0
Таким образом, равенство (12.2.62) влечет равенство нулю всех коэффициентов

α1 = ... = αk = β 1 = ... = β m = γ 1 = ... = γ n = 0,

и значит, система a1 , ..., ak , y1 , ..., ym , z1 , ..., zn линейно независима.


2. Теперь покажем, что она полна в Y + Z. Действительно, по определению, всякий вектор
x ∈ Y + Z имеет вид
x = y + z,
680 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

где y ∈ Y и z ∈ Z. Поскольку a1 , ..., ak , y1 , ..., ym – базис в Y , существуют коэффициенты α1 , ..., αk , β 1 , ..., β m ∈


R такие что
y = α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym .
e1 , ..., α
С другой стороны, поскольку a1 , ..., ak , z1 , ..., zn – базис в Z, существуют коэффициенты α ek , γ 1 , ..., γ n ∈
R такие что
z=α e1 · a1 + ... + α ek · ak + γ 1 · z1 + ... + γ n · zn .
Вместе это дает
   
x = y + z = α1 · a1 + ... + αk · ak + β 1 · y1 + ... + β m · ym + αe1 · a1 + ... + α
ek · ak + γ 1 · z1 + ... + γ n · zn =
= (α1 + α
e1 ) · a1 + ... + (αk + α
ek ) · ak + β 1 · y1 + ... + β m · ym + γ 1 · z1 + ... + γ n · zn

То есть x выражается через a1 , ..., ak , y1 , ..., ym , z1 , ..., zn .


Мы поняли, что система векторов a1 , ..., ak , y1 , ..., ym , z1 , ..., zn является базисом в пространстве
Y + Z. Теперь получаем:
k   k + m 
a1 , ..., ak a1 , ..., ak , y1 , ..., ym
=

=
– базис в Y ∩ Z – базис в Y
z }| { z }| {
dim(Y ∩ Z) + dim(Y + Z) = 2k + m + n = dim Y + dim
| {z Z}
| {z } 
a  a1 , ..., ak , z1 , ..., zn

=
1 , ..., ak , y1 , ..., ym , – базис в Z
=

z1 , ..., zn
– базис в Y + Z k+n
k+m+n

(b) Линейные функционалы и сопряженное пространство


• Линейным функционалом или линейной формой на векторном пространстве X называется
всякое отображение f : X → R, удовлетворяющее условию линейности:

f (α · x + β · y) = α · f (x) + β · f (y), x, y ∈ X, α, β ∈ R (12.2.63)

Линейные функционалы на Rn и Rn . следует (12.2.65):


⋄ 12.2.4. Всякая числовая строка α = Xn

(α1 , ..., αn ) ∈ Rn (αi ∈ R) определяет некоторый ∀j f (e j ) = α · e j = αi · eij = aj


|{z}
линейный функционал f : Rn → R по формуле: i=1
=

(
 1 0, i 6= j
x 1, i = j
f (x) = α · x = (α1 , ..., αn ) ·  ...  =
xn И наоборот, если f : Rn → R – линейный функ-
Xn ционал, то из (12.2.65)
= αi · xi , x ∈ Rn (12.2.64)
αi = f (ei )
i=1

И наоборот, всякий линейный функционал f : следует (12.2.64):


Rn → R определяет некую числовую строку n
! n
α = (α1 , ..., αn ) ∈ Rn (αi ∈ R) по формуле X X
f (x) = f xi · ei = xi · f (ei ) =
αi = f (ei ) (12.2.65) i=1 i=1
Xn
где e = (e1 , ..., en ) – стандартный базис в Rn . = xi · αi = α · x
Теорема 12.2.8. Формулы (12.2.64) и (12.2.65) i=1

устанавливают взаимно однозначное соответ-


ствие между числовыми строками α ∈ Rn и
линейными функционалами f : Rn → R. ⋄ 12.2.5. Для пространства строк Rn , естествен-
но, картина будет
 симметричной:
 всякий число-
Доказательство. Действительно, если α ∈ Rn , α1
то из (12.2.64) вой столбец α =  ...  ∈ Rn (αi ∈ R) определяет
f (x) = α · x αn
§ 2. Векторные пространства 681
 
некоторый линейный функционал f : Rn → R по α1
формуле: α =  ...  ∈ Rn по формуле
αn
 
α1 αi = f (ei ) (12.2.67)
f (x) = x · α = (x1 , ..., xn ) ·  ...  =  
1
αn e
n где e =  ...  – стандартный базис в Rn .
X
= xi · αi , x ∈ Rn (12.2.66) en
i=1
Теорема 12.2.9. Формулы (12.2.66) и (12.2.67)
устанавливают взаимно однозначное соответ-
И наоборот, всякий линейный функционал f : ствие между числовыми столбцами α ∈ Rn и
Rn → R определяет некий числовой столбец линейными функционалами f : Rn → R.

Столбец коэффициентов.
• Пусть X – векторное пространство и (b1 , ..., bn ) – его базис. Коэффициенты β i в раз-
ложении (12.2.54) вектора x по заданному базису (b1 , ..., bn ) мы условимся обозначать
h ii  i
x
специальным символом b1 ,...,bn
или xb :

n h ii
X n 
X i
x x
x= · bi = · bi (12.2.68)
i=1
b i=1
b1 , ..., bn

 i h x ii
По теореме 12.2.2 числа xb = b1 ,...,bn
определяются однозначно. Их удобно представ-
лять как столбец (соответствующий произвольному вектору x при фиксированном базисе
b = (b1 , ..., bn )):
  x 1 
h x i   xb 2 
= b
 ...
.

b
 x n
b

Свойства столбца коэффициентов:

1◦ . Однородность:
  hxi
λ·x
=λ· (12.2.69)
b b
2◦ . Аддитивность:   h i h i
x+y x y
= + (12.2.70)
b b b

! 12.2.6. Справедливо также следующее тожде- (здесь λ · b = (λ · b1 , ..., λ · bn ) – базис, получа-


ство обратной однородности, служащее опреде-
  ющийся умножением каждого вектора на число
ленным оправданием самому обозначению xb : λ). Доказывается это теми же приемами.
h x i 1 xh i
= · , λ 6= 0 (12.2.71)
λ·b λ b

Доказательство. 1. Подставив в (12.2.68) вместо x вектор λ · x, мы получим равенство


n 
X i
λ·x
λ·x = · bi
i=1
b
682 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

С другой стороны, умножив (12.2.68) на λ, мы получим равенство


n
X h x ii
λ·x= λ· · bi
i=1
b

Мы получаем, что один и тот же вектор λ · x двумя способами разложен по базису b1 , ..., bn :
n 
X i n
X h x ii
λ·x
· bi = λ · x = λ· · bi
i=1
b i=1
b

По теореме 12.2.2 коэффициенты этих разложений должны совпадать:


 i h x ii
λ·x
=λ· , i = 1, ..., n
b b

Это и есть (12.2.69):


    1     x 1 
λ·x 1
    b 2  λ · xb b
 
λ · x 2    x 2  hxi
λ· x  λ·x   
 b  = b
 = λ· b 

 =λ· .
b  ...  ... b
 λ·x n  x n  x...n
b
λ· b b

2. Равенство (12.2.70) доказывается так же: сначала подставив в (12.2.68) вместо x вектор x + y,
мы получим
Xn  i
x+y
x+y = · bi
i=1
b

Затем, сложив (12.2.68) с тем же равенством, только выписанном для вектора y, мы получим
n h ii
X n h ii
X n h ii
X h y ii  n h i
X h y ii
x y x x
x+y = · bi + · bi = + · bi = + · bi
i=1
b i=1
b i=1
b b i=1
b b
| {z } | {z }
x y

В результате один и тот же вектор x + y оказывается двумя способами разложен по базису b1 , ..., bn :
n 
X i n h i
X h y ii
x+y x
· bi = x + y = + · bi
i=1
b i=1
b b

и по теореме 12.2.2 коэффициенты этих разложений должны совпадать:


 i h x i h y ii
x+y
= +
b b b

Это и есть (12.2.70):


  
  x 1  y 1    x 1    y 1 
x+y 1
  b  b + b b b
x+y

 b   x 2 +  y 2    x 2    y 2  h x i h y i
 x+y 2 

=  = b b = b + b = + .
b  ...   ...   ...   ...  b b
 x+y n  x n  y n  x n  y n
b b + b b b

Линейные операции над функционалами и сопряженное пространство X ∗ .


• Если f : X → R и g : X → R – два линейных функционала на X, то их суммой называется
отображение
(f + g)(x) := f (x) + g(x), x ∈ X (12.2.72)
Нетрудно заметить, что оно также будет линейным функционалом на X.
§ 2. Векторные пространства 683

• Произведением линейного функционала f : X → R на число λ ∈ R называется отображе-


ние
(λ · f )(x) := λ · f (x), x ∈ X (12.2.73)
и оно тоже является линейным функционалом на X.
• Множество всех линейных функционалов на векторном пространстве X обозначается сим-
волом X ∗ и называется сопряженным пространством к пространству X. Оно будет век-
торным пространством относительно операций суммы функционалов и умножения функ-
ционала на число, определенных формулами (12.2.72) и (12.2.73).

Теорема 12.2.10. Если a = (a1 , ..., an ) – базис в векторном пространстве X, то линейные функ-
 i
ционалы a1 : X → R определенные формулой
 i h x ii
1
(x) := , x ∈ X, i = 1, ..., n. (12.2.74)
a a

образуют базис сопряженного пространства X ∗ . Разложение всякого линейного функционала f ∈


X ∗ по этому базису имеет вид
Xn  i
1
f= f (ai ) · (12.2.75)
i=1
a

Следствие 12.2.11. Если векторное пространство X конечномерно, то его сопряженное про-


странство X ∗ тоже конечномерно, и их размерности совпадают:

dim X = dim X ∗ (12.2.76)

(c) Линейные операторы


• Пусть X и Y – векторные пространства. Отображение A : X → Y называется линей-
ным оператором из X в Y , если оно удовлетворяет следующему тождеству, называемому
свойством линейности:

A(λ · p + µ · q) = λ · A(p) + µ · A(q) p, q ∈ X, λ, µ ∈ R (12.2.77)

Ядро и образ оператора.


• Пусть X и Y – векторные пространства и A : X → Y – линейный оператор. Тогда
– ядром оператора A называется множество Ker A векторов x ∈ X, которые A
переводит в нуль:
Ker A = {x ∈ X : Ax = 0} (12.2.78)
– образом оператора A называется множество Im A векторов y ∈ X, которые яв-
ляются значениями оператора A на каких-то векторах x ∈ X:

Im A = {y ∈ Y : ∃x ∈ X Ax = y} (12.2.79)

! 12.2.7. Понятно, что оператор A : X → Y то- Несколько менее очевидно, что оператор A :
гда и только тогда будет сюръективным, когда X → Y тогда и только тогда будет инъектив-
его образ совпадает с Y : ным, когда его ядро состоит из одного нуля:

Im A = Y Ker A = {0}.

Теорема 12.2.12. Ядро Ker A и образ Im A оператора A : X → Y являются подпространствами в


X и Y соответственно, причем если пространство X конечномерно, то Ker A и образ Im A тоже
конечномерны, и выполняется равенство

dim Ker A + dim Im A = dim X (12.2.80)


684 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Следствие 12.2.13. Если векторные пространства X и Y имеют одинаковую (и конечную) раз-


мерность
dim X = dim Y,
то для любого оператора A : X → Y следующие условия эквивалентны:
(i) A сюръективен;
(ii) A инъективен;
(iii) A биективен (то есть обратим).

Доказательство. Здесь достаточно доказать эквивалентность условий (i) и (ii). Это делается сле-
дующей цепочкой:
A сюръективен

Im A = Y

m свойство 1◦ на с.678

dim Im A = dim Y = dim X

m (12.2.80)

dim Ker A = 0

Ker A = {0}

A инъективен

Линейные операции над операторами.


• Если A : X → Y и B : X → Y – два линейных оператора, то их суммой называется
отображение
(A + B)(x) := A(x) + B(x), x ∈ X (12.2.81)
Нетрудно заметить, что оно также будет линейным оператором из X в Y .
• Произведением линейного оператора A : X → Y на число λ ∈ R называется отображение

(λ · A)(x) := λ · A(x), x∈X (12.2.82)

и оно тоже является линейным оператором из X в Y .


• Множество всех линейных операторов A : X → Y обозначается Hom(X, Y ). Оно будет
векторным пространством относительно операций суммы операторов и умножения опе-
ратора на число, определенных формулами (12.2.81) и (12.2.82). В частном случае, когда
X = Y , обозначение сокращается:

End(X) = Hom(X, X) (12.2.83)

Теорема 12.2.14. Если X и Y – конечномерные векторные пространства, то пространство опе-


раторов Hom(X, Y ) также конечномерно, и

dim Hom(X, Y ) = dim X · dim Y. (12.2.84)

В частности,
dim End(X) = (dim X)2 (12.2.85)
§ 2. Векторные пространства 685

Произведение операторов и обратимые операторы.


• Единичным оператором в векторном пространстве X называется линейный оператор IX :
X → X, действующий по формуле

IX (x) := x, x∈X (12.2.86)

• Если A : X → Y и B : Y → Z – два линейных оператора, то их произведением называется


композиция отображений A и B, то есть отображение

(BA)(x) := B(A(x)), x∈X (12.2.87)

Нетрудно заметить, что оно будет линейным оператором из X в Z.

Свойства операции умножения операторов:


(i) Справедливы тождества дистрибутивности:

(A + B) · C = A · C + B · C, A, B ∈ Hom(Y, Z), C ∈ Hom(X, Y ) (12.2.88)


A · (B + C) = A · B + A · C, A ∈ Hom(Y, Z), B, C ∈ Hom(X, Y ) (12.2.89)

(ii) Умножение на единичный оператор не меняет оператора:

A · I = A, A ∈ Hom(X, Y ), I ∈ Hom(X, X) (12.2.90)


I · A = A, A ∈ Hom(X, Y ), I ∈ Hom(Y, Y ) (12.2.91)

• Два линейных оператора A : X → Y и B : Y → X называются обратными друг другу (а


каждый из них называется обратным по отношению к другому), если их произведения
дают единичные операторы:

B · A = IX , A · B = IY .

В этом случае пишут


A = B −1 , B = A−1 .
• Линейный оператор A : X → Y называется обратимым, или изоморфизмом (векторных
пространств), если у него существует обратный линейный оператор A−1 .
Теорема 12.2.15. Для линейного оператора A : X → Y следующие условия эквивалентны:
(i) A обратим,
(ii) A является биективным отображением8 .
(iii) A переводит некоторый базис e1 , ..., ek пространства X в базис Ae1 , ..., Aek простран-
ства Y .

• Для всякого векторного пространства X его Заметим, что для всякого базиса a =
вторым сопряженным пространством X ∗∗ (a1 , ..., an ) в векторном пространстве X базис 11 ,
a
называется пространство сопряженное к про- сопряженный к сопряженному базису a1 к a пред-
странству X ∗ : ставляет собой просто образ базиса a под дей-
ствием отображения ιX :
X ∗∗ := (X ∗ )∗
 i
1
Естественным отображением из X в X на- ∗∗ 1 := ιX (ai ), i = 1, ..., n. (12.2.93)
a
зывается отображение ιX : X → X ∗∗ , дей-
ствующее по формуле Теорема 12.2.16. Для всякого конечномерно-
го векторного пространства X естественное
ιX (x)(f ) := f (x), x ∈ X, f ∈ X ∗. отображение ιX : X → X ∗∗ является изомор-
(12.2.92) физмом.

8 Биективные отображения были определены на с.42.


686 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Сопряженные операторы. Для всякого оператора A : X → Y формула

A∗ (f ) = f ◦ A, f ∈ Y ∗, (12.2.94)

определяет некое отображение


A∗ : Y ∗ → X ∗ ,
которое, как нетрудно убедиться, является линейным оператором. Он называется сопряженным
оператором к оператору A.

Алгебраические дополнения и проекторы.


• Говорят, что векторное пространство X разложено в прямую сумму своих подпространств
Y и Z, и записывают это формулой

X = Y ⊕ Z,

если выполняются следующие два условия:


(a) пересечение Y и Z состоит из нулевого вектора:

Y ∩ Z = {0}

(b) алгебраическая сумма Y и Z совпадает со всем X

X =Y +Z

(то есть любой вектор x ∈ X представим в виде суммы y + z, где y ∈ Y и z ∈ Z).


Эти условия вместе эквивалентны следующему одному условию:
(c) любой вектор x ∈ X единственным образом представим в виде суммы y + z, где
y ∈ Y и z ∈ Z:
∀x ∈ X ∃!y ∈ Y ∃!z ∈ Z x=y+z
При этом подпространство Z называется алгебраическим дополнением к подпространству
Y в пространстве X (и наоборот, Y – алгебраическим дополнением к Z). Из формулы
(12.2.61) следует импликация:

X =Y ⊕Z ⇒ dim X = dim Y + dim Z. (12.2.95)

Теорема 12.2.17. Всякое подпространство Y в (конечномерном9 ) векторном пространстве X


имеет алгебраическое дополнение (неединственное, если {0} 6= Y 6= X).

Доказательство. По свойству 1◦ на с.678 пространство Y конечномерно, значит в нем есть ко-


нечный базис a1 , ..., am . Эта система векторов линейно независима в Y и значит в X. Поэтому по
теореме 12.2.7 она дополняется до некоторого базиса a1 , ..., am , am+1 , ..., an в X. Линейная оболочка
новых присоединенных векторов
Z = span{am+1 , ..., an }
будет, как легко понять, алгебраическим дополнением для Y .

• Проектором в векторном пространстве X называется любой линейный оператор P : X →


X со свойством
P 2 = P.

Свойства проекторов:
1◦ . Если P – проектор в X, то I − P – тоже проектор в X, причем

Ker(I − P ) = Im P, Im(I − P ) = Ker P. (12.2.96)


9 Теорема12.2.17 верна не только для конечномерных пространств, но и для бесконечномерных также, однако мы
ограничиваемся конечномерным случаем.
§ 2. Векторные пространства 687

2◦ . Если P – проектор в X, то его ядро Ker P и образ Im P алгебраически дополняют друг


друга в X:
X = Ker P ⊕ Im P.
3◦ . Если X разложено в прямую сумму своих подпространств Y и Z,

X = Y ⊕ Z,

то существует единственный проектор P в X, для которого Y является ядром, а Z –


образом:
Ker P = Y, Im P = Z.
• Фраза “P является проектором на подпространство Z” означает, что P – проектор, и
Z = Im P , а фраза “P является проектором вдоль подпространства Y ” означает, что P
– проектор, и Y = Ker P .
Доказательство. 1. Если P – проектор в X, то есть P 2 = P , то

(I − P )2 = (I − P ) · (I − P ) = |{z}
I 2 − |P{z· I} − I| {z P 2 = I − P − P + P = I − P.
· P} + |{z}
=

=
I P P P

Для доказательства (12.2.96) заметим две цепочки: во-первых,

x ∈ Ker(I − P ) ⇒ x − P (x) = 0 ⇒ x = P (x) ⇒ x ∈ Im P

а, во-вторых,

x ∈ Im P ⇒ ∃y ∈ X x = P (y) ⇒ ∃y ∈ X P (x) = P (P (y)) = P (y) = x ⇒


⇒ P (x) = x ⇒ x − P (x) = 0 ⇒ x ∈ Ker(I − P ).

Вместе они дают равенство Ker(I −P ) = Im P (верное для любого проектора P ). Если в нем заменить
проектор P на проектор I − Q, мы получим равенство Ker Q = Im(I − Q) (верное для любого
проектора Q), то есть второе равенство в (12.2.96).
2. Пусть P – проектор в X. Тогда, во-первых,
(
P (y) = 0
y ∈ Ker P ∩ Im P =⇒ =⇒ 0 = P (y) = P (P (x)) = P (x) = y,
∃x ∈ X : y = P (x)

то есть Ker P ∩ Im P = 0. И, во-вторых, для любого x ∈ X векторы z = P (x) и y = x − z обладают


свойствами:


z ∈ Im P,
P (y) = P (x − z) = P (x) − P (z) = P (x) − P (P (x)) = P (x) − P (x) = 0 =⇒ y ∈ Ker P,


x = y + z.

То есть X = Ker P + Im P , и вместе это означает, что X = Y ⊕ Z.


3. Пусть X разложено в прямую сумму своих подпространств,

X = Y ⊕ Z.

Это означает, что всякий вектор x ∈ X единственным образом раскладывается в сумму

x=y+z

где y ∈ Y и z ∈ Z. Это в свою очередь можно переформулировать так: для любого вектора x ∈ X
существует единственный вектор z ∈ Z такой, что x − z ∈ Y . То есть, правило

x−z ∈Y ⇐⇒ P (x) = z (12.2.97)


корректно определяет некое отображение P : X → Z, и поскольку Z ⊆ X, его можно считать


отображением из X в X:
P :X →X
688 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Покажем, что P линейно. Для всякого λ ∈ R мы получим:


(12.2.97)
x − P (x) ∈ Y =⇒ λ · x − λ · P (x) ∈ Y =⇒ P (λ · x) = λ · P (x).
| {z } | {z }


Z Z

А для любых x, x′ ∈ X
  (12.2.97)
x − P (x) ∈ Y & x′ − P (x′ ) ∈ Y =⇒ x + x′ − P (x) + P (x′ ) ∈ Y =⇒
| {z } | {z } | {z }


Z Z Z

=⇒ P (x + x′ ) = P (x) + P (x′ ).

Заметим далее следующую цепочку, из которой следует, что P является проектором:


(12.2.97)
x − P (x) − 0 ∈ Y =⇒ P (x − P (x)) = 0 =⇒ P (x) − P (P (x)) = 0 =⇒ P (P (x)) = P (x).

Далее убедимся, что Ker P = Y :


(12.2.97)
x ∈ Ker P ⇐⇒ P (x) = 0 ⇐⇒ x−0 ∈Y ⇐⇒ x ∈ Y.


Z

И, наконец, что Im P = Z:
(12.2.97)
z ∈ Im P ⇐⇒ ∃x ∈ X P (x) = z ⇐⇒ ∃x ∈ X x−z ∈Y ⇐⇒ z ∈ Z.

Z

(d) Полилинейные отображения, полилинейные формы и тензоры


• Пусть X1 , ..., Xk , Y – векторные пространства. Отображение

ϕ : X1 × · · · × Xk → Y

называется полилинейным, если оно линейно по каждому аргументу, то есть для любого
i = 1, ..., k и любых фиксированных векторов a1 ∈ X1 , ..., ai−1 ∈ Xi−1 , ai+1 ∈ Xi+1 , ..., ak ∈
Xk отображение
x ∈ Xi 7→ ϕ(a1 , ..., ai−1 , x, ai+1 , ..., an ) ∈ Y
является линейным оператором:

ϕ(a1 , ..., ai−1 , λ · p + µ · q, ai+1 , ..., an ) =


= λ · ϕ(a1 , ..., ai−1 , p, ai+1 , ..., an ) + µ · ϕ(a1 , ..., ai−1 , q, ai+1 , ..., an )

Полилинейные формы.
• В частном случае, когда Y = R, полилинейное отображение

ϕ : X1 × · · · × Xk → R

называется полилинейной формой на последовательности пространств X1 , ..., Xk (при k =


2 – билинейной формой на паре пространств (X1 , X2 )). Множество всех полилинейных
форм на последовательности векторных пространств X1 , ..., Xk обозначается символом
L(X1 , ..., Xk ). В частном случае, когда пространства X1 , ..., Xk совпадают, мы будем ис-
пользовать обозначение
Lk (X) = L(X, ..., X). (12.2.98)
| {z }
k аргументов
§ 2. Векторные пространства 689

⋄ 12.2.8. Всякая последовательность функцио- действующую по правилу


налов ξ1 ∈ X1∗ , ..., ξk ∈ Xk∗ определяет некую по-
лилинейную форму (x1 ⊠ ... ⊠ xk )(ξ1 , ..., ξk ) = ξ1 (x1 ) · ... · ξk (xk ),
ξ1 ⊠ ... ⊠ ξk ∈ L(X1 , . . . , Xk ), ξ1 ∈ X1∗ , . . . , ξk ∈ Xk∗ . (12.2.100)

действующую по правилу ⋄ 12.2.9. Не всякая полилинейная форма на X


имеет вид (12.2.99). Например, формы α : R2 ×
(ξ1 ⊠ ... ⊠ ξk )(x1 , ..., xk ) = ξ1 (x1 ) · ... · ξk (xk ), R2 → R,
x1 ∈ X1 , . . . , xk ∈ Xk (12.2.99)
α(x; y) = x1 · y 1 + x2 · y 2
Наоборот, для последовательности векторов x1 ∈
X1 , ..., xk ∈ Xk символ x1 ⊠ ... ⊠ xk обозначает по- и
лилинейную форму на X1∗ , ..., Xk∗ , α(x; y) = x1 · y 2 − x2 · y 1
x1 ⊠ ... ⊠ xk ∈ L(X1∗ , . . . , Xk∗ ), нельзя представить в таком виде.

Теорема 12.2.18. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , и в соответствии
 i  j
с (12.2.74) a1 и 1b – сопряженные базисы в X ∗ и Y ∗ . Тогда билинейные формы
 i  j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
образуют базис в пространстве L(X, Y ) билинейных форм на X × Y . Разложение всякой билиней-
ной формы ϕ : X × Y → R по этому базису имеет вид
Xk X l  i  j
1 1
ϕ= ϕ(ai , bj ) · ⊠ (12.2.101)
i=1 j=1
a b

! 12.2.10. Этот результат очевидным образом обобщается на случай пространства L(X1 , ..., Xk ) с
произвольной последовательностью аргументов (X1 , ..., Xk ).
Доказательство. Сначала убедимся, что эта система линейно независима. Пусть для некоторых
скаляров λi,j выполняется равенство
k X
X l  i  j
1 1
λi,j · ⊠ = 0.
i=1 j=1
a b

Тогда для всякой пары индексов (p, q) мы получим:


 i  j  i  j (
1 1 1 1 0, (i, j) 6= (p, q)
⊠ (ap , bq ) = (ap ) · (bq ) = ,
a b a b 1, (i, j) = (p, q)
и поэтому
k X
X l  i  j
1 1
0= λi,j · ⊠ (ap , bq ) = λp,q .
i=1 j=1
a b
 i  j
Это верно для любых p и q, поэтому система a1 ⊠ 1b действительно линейно независима.
Теперь покажем, что она линейно полна. Пусть ϕ : X × Y → R – билинейная форма. Тогда для
любых x ∈ X и y ∈ Y
 
Xk h ii Xl h ii Xk X l h ii h ij
x y x y
ϕ(x, y) = ϕ  · ai , · bj  = · · ϕ (ai , bj ) = (12.2.99) =
i=1
a j=1
b i=1 j=1
a b

Xk X l  i  j !
1 1
= ϕ(ai , bj ) · ⊠ (x, y)
i=1 j=1
a b

Отбрасывая аргумент (x, y), мы получаем (12.2.101).


690 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

⋄ 12.2.11. Для любого числового семейства ет, что всякая билинейная форма α : Rn ×Rn → R
{αi,j ; i, j ∈ {1, ..., n}} ⊆ R формула имеет вид (12.2.102), где семейство чисел αi,j
X n определяется формулой
i j n
α(x, y) = αi,j · x · y , x, y ∈ R ,
i,j=1 αi,j = α(ei , ej ), (12.2.103)
(12.2.102)
очевидно, определяет билинейную форму α : в которой ei – стандартный базис в Rn , опреде-
Rn ×Rn → R. Наоборот, из теоремы 12.2.18 следу- ленный в (12.2.55).

Предложение 12.2.19. Для всякой последовательности конечномерных векторных пространств


X1 , ..., Xk размерность пространства L(X1 , . . . , Xk ) полилинейных форм на ней равна произведе-
нию размерностей пространств X1 , ..., Xk :

dim L(X1 , . . . , Xk ) = dim X1 · ... · dim Xk . (12.2.104)

Доказательство. В частном случае, когда множителей в тензорном произведении два, X и Y , это


равенство следует из теоремы 12.2.18

dim L(X, Y ) = dim X · dim Y,

потому что если a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y , то в L(X, Y ) число элементов
в базисе  i  j
1 1
⊠ ; i = 1, ..., k, j = 1, ..., l
a b
равно k · l. В общем случае те же рассуждения опираются на замечание 12.2.10.

Тензоры.
• Тензором в последовательности конечномерных векторных пространств X1 , ..., Xk назы-
вается всякий линейный функционал

T : L(X1 , ..., Xk ) → R

на пространстве L(X1 , ..., Xk ) полилинейных форм на X1 , ..., Xk . Множество всех тензоров


на X1 , ..., Xk обозначается символом X1 ⊗ ... ⊗ Xk и называется тензорным произведением
последовательности пространств X1 , ..., Xk . По определению,

X1 ⊗ ... ⊗ Xk := L(X1 , ..., Xk )∗ (12.2.105)

⋄ 12.2.12. Всякая последовательность x1 ∈ X1 , Точно так же, для последовательности функци-


..., xk ∈ Xk определяет некий тензор (функцио- оналов ξ1 ∈ X1∗ , ..., ξk ∈ Xk∗ символ ξ1 ⊗ ... ⊗ ξk
нал) обозначает тензор (функционал)

x1 ⊗ ... ⊗ xk ∈ X1 ⊗ ... ⊗ Xk = L(X1 , . . . , Xk )∗ , ξ1 ⊠ ... ⊠ ξk ∈ X1∗ ⊗ ... ⊗ Xk∗ = L(X1∗ , . . . , Xk∗ )∗ ,

действующий по правилу действующий по правилу

(x1 ⊗ · · · ⊗ xk )(α) := α(x1 , . . . , xk ), (ξ1 ⊗ · · · ⊗ ξk )(f ) = α(ξ1 , . . . , ξk ),


α ∈ L(X1 , . . . , Xk ) (12.2.106) f ∈ L(X1∗ , . . . , Xk∗ ). (12.2.107)

Теорема 12.2.20. Пусть a = (a1 , ..., ak ) – базис в X, а b = (b1 , ..., bl ) – базис в Y . Тогда тензоры

ai ⊗ b j ; i = 1, ..., k, j = 1, ..., l

образуют базис в тензорном произведении X ⊗ Y = L(X, Y )∗ .


§ 2. Векторные пространства 691

! 12.2.13. Этот результат очевидным образом обобщается на случай пространства X1 ⊗ ... ⊗ Xk с


произвольной последовательностью аргументов (X1 , ..., Xk ).
Доказательство. Опять начнем с того, что убедимся, что эта система линейно независима. Пусть
для некоторых скаляров λi,j выполняется равенство
k X
X l
λi,j · ai ⊗ bj = 0.
i=1 j=1

 1 i  1 j
Пусть в соответствии с (12.2.74) a и b – сопряженные базисы в X ∗ и Y ∗ . Для всякой пары
индексов (p, q) мы получим
 p  q   p  q  p  q (
1 1 1 1 1 1 0, (i, j) 6= (p, q)
ai ⊗ b j ⊠ = ⊠ (ai , bj ) = (ai ) · (bj ) = ,
a b a b a b 1, (i, j) = (p, q)

поэтому
k X
X l  p  q 
1 1
0= λi,j · ai ⊗ bj ⊠ = λp,q .
i=1 j=1
a b

Это верно для любых p и q, поэтому система ai ⊗ bj действительно линейно независима.


Теперь покажем, что она линейно полна. Пусть T ∈ X ⊗ Y = L(X, Y )∗ – произвольный тензор.
Тогда для любой билинейной формы ϕ ∈ L(X, Y )
 
k X
X l  i  j k l  i  j !
1 1  XX 1 1
T (ϕ) = (12.2.101) = T  ϕ(ai , bj ) · ⊠ = ϕ(ai , bj ) · T ⊠ =
i=1 j=1
a b i=1 j=1
a b

Xk X l  i  j !
1 1
= ai ⊗ bj (ϕ) · T ⊠
i=1 j=1
a b

Выбрасывая аргумент ϕ мы получаем, что T является линейной комбинацией билинейных форм


ai ⊗ b j :
Xk X l  i  j !
1 1
T = T ⊠ · ai ⊗ b j .
i=1 j=1
a b

Из этой леммы, или напрямую из предложения 12.2.19 следует


Предложение 12.2.21. Для всякой последовательности конечномерных векторных пространств
X1 , ..., Xk размерность тензорного произведения X1 ⊗ · · · ⊗ Xk равна произведению размерностей
пространств X1 , ..., Xk :
dim(X1 ⊗ · · · ⊗ Xk ) = dim X1 · ... · dim Xk . (12.2.108)

Изоморфизм X1 ⊗ ... ⊗ Xk ∼
= L X1∗ , ..., Xk∗ .
Теорема 12.2.22. Для любых конечномерных векторных пространств X1 , ..., Xk отображение

@ : L(X1 , . . . , Xk )∗ → L X1∗ , . . . , Xk∗ @T (ξ1 , ..., ξk ) = T (ξ1 ⊠...⊠ξk ), T ∈ L(X1 , . . . , Xk )∗ , ξi ∈ Xi∗ ,
| {z }
k
X1 ⊗ ... ⊗ Xk

является изоморфизмом векторных пространств, переводящим произвольный функционал x1 ⊗


... ⊗ xk в полилинейную форму ιX1 (x1 ) ⊠ ... ⊠ ιXk (xk ):10

x1 ⊗ ... ⊗ xk 7→ ιX1 (x1 ) ⊠ ... ⊠ ιXk (xk ). (12.2.109)



Всякое вообще линейное отображение L(X1 , . . . , Xk )∗ → L X1∗ , . . . , Xk∗ , удовлетворяющее условию
(12.2.109), совпадает с @.
10 Отображения вида ιX → X ∗∗ были определены формулой (12.2.92).
692 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство. Ограничимся случаем двух пространств X и Y и соответственно отображения



@ : L(X, Y )∗ → L X ∗ , Y ∗ @T (ξ, υ) = T (ξ ⊠ υ), T ∈ L(X, Y )∗ , ξ ∈ X ∗, υ ∈ Y∗

(общий случай рассматривается по аналогии).


1. Прежде всего нужно убедиться, что это отображение линейно. Для любых S, T ∈ L(X, Y )∗ ,
α, β ∈ R, ξ ∈ X ∗ , υ ∈ Y ∗ мы получим:

@(α · S + β · T )(ξ, υ) = (α · S + β · T )(ξ ⊠ υ) = α · S(ξ ⊠ υ) + β · T (ξ ⊠ υ) = α · @(S)(ξ, υ) + β · @(T )(ξ, υ).

Теперь отбрасывая ξ и υ, имеем:

@(α · S + β · T ) = α · @(S) + β · @(T ).

2. После этого проверим условие (12.2.109):

@(x ⊗ y)(ξ, υ) = (x ⊗ y)(ξ ⊠ υ) = (12.2.106) = (ξ ⊠ υ)(x, y) =


= ξ(x) · υ(y) = (12.2.92) = ιX (x)(ξ) · ιY (y)(υ) = (ιX (x) ⊠ ιY (y))(ξ, υ)

3. Зафиксируем теперь какие-нибудь базисы a1 , ..., ak и b1 , ..., bl в X и Y соответственно. По


теореме 12.2.20 тензоры вида

ai ⊗ b j , i = 1, ..., k, j = 1, ..., l

образуют базис в пространстве X ⊗ Y = L(X, Y )∗ . А по теореме 12.2.18 билинейные формы


 i  j
1 1
1 ⊠ 1 = (12.2.93) = ιX (ai ) ⊠ ιY (bj ); i = 1, ..., k, j = 1, ..., l
a b

образуют базис в пространстве L(X ∗ , Y ∗ ). При этом по уже доказанной формуле (12.2.109), при
отображении @ первый базис превращается во второй:

@(ai ⊗ bj ) = ιX (ai ) ⊠ ιY (bj ).



Мы получили, что линейное отображение @ : L(X, Y )∗ → L X ∗ , Y ∗ переводит базис в базис. По
теореме 12.2.15 это означает, что оно является изоморфизмом векторных пространств.

Универсальность пространства тензоров. Для всякой последовательности векторных про-


странств X1 , ..., Xk рассмотрим отображение

⊗ : X1 × ... × Xk → X1 ⊗ ... ⊗ Xk ⊗ (x1 , ..., xk ) = x1 ⊗ ... ⊗ xk , xi ∈ Xi .

и заметим, что оно полилинейно.

Теорема 12.2.23. Для всякого набора конечномерных векторных пространств X1 , ..., Xk , Y и вся-
кого полилинейного отображения ϕ : X1 ×...×Xk → Y найдется единственный линейный оператор
ϕ⊗ : X1 ⊗ ... ⊗ Xk → Y , замыкающий диаграмму

X1 × ... × Xk
♦♦ ❖❖❖
⊗ ♦♦♦♦ ❖❖❖
♦♦ ❖❖ϕ❖ .
♦♦♦ ❖❖❖
w♦♦ ❖❖❖
'
X1 ⊗ ... ⊗ Xk ❴ ❴ ❴ ❴ ❴ ❴ ❴ ⊗❴ ❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ

Доказательство. Каждому функционалу f ∈ Y поставим в соответствие полилинейную форму
на X1 , ..., Xk по формуле
ψ(f ) = f ◦ ϕ.
У нас получился линейный оператор

ψ : Y ∗ → L(X1 , ..., Xk ).
§ 3. Матрицы и определители 693

Рассмотрим отображение ιY : Y → Y ∗∗ , определенное формулой (12.2.92). По теореме 12.2.16 оно


является изоморфизмом, поэтому определено обратное отображение ι−1
Y :Y
∗∗
→ Y . Положим

ϕ⊗ = ι−1 ∗ ∗
Y ◦ ψ : L(X1 , ..., Xk ) → Y

Тогда возникает цепочка (в которой xi ∈ Xi , f ∈ Y ∗ ):

ιY (ϕ⊗ (⊗(x1 , ..., xk )))(f ) = ψ ∗ (⊗(x1 , ..., xk ))(f ) = ψ ∗ (x1 ⊗...⊗xk )(f ) = (12.2.94) = (x1 ⊗...⊗xk )(ψ(f )) =
= (x1 ⊗...⊗xk )(f ◦ϕ) = (12.2.106) = (f ◦ϕ)(x1 , ..., xk ) = f (ϕ(x1 , ..., xk )) = (12.2.92) = ιY (ϕ(x1 , ..., xk ))(f )

ιY (ϕ⊗ (⊗(x1 , ..., xk ))) = ιY (ϕ(x1 , ..., xk ))

ϕ⊗ (⊗(x1 , ..., xk )) = ϕ(x1 , ..., xk )

ϕ⊗ ◦ ⊗ = ϕ.

§3 Матрицы и определители
(a) Матрицы
Напомним, что начальным интервалом натурального ряда N мы условились называть (см. опре-
деление на с.154) произвольное множество вида

{1, ..., n} = {k ∈ N : k 6 n}

• Матрицей размера m × n, где m, n ∈ N, называется произвольная вещественнознач-


ная функция на декартовом произведении {1, ..., m} × {1, ..., n} начальных интервалов
{1, ..., m} и {1, ..., n}, то есть отображение вида

M : {1, ..., m} × {1, ..., n} → R

Значение такой функции в точке (i, j) ∈ {1, ..., m}×{1, ..., n} удобно обозначать с помощью
индексов:
Mij := M (i, j)
а всю матрицу удобно изображать в виде таблицы, в которой нижний индекс обозначает
номер столбца, а верхний – номер строки:
 1 
M1 M21 ... Mm1
 M12 M22 ... Mm2
M =  ...

... ... ... 
M1n M2n ... Mmn

Числа Mij в этой таблице (то есть значения функции M в точках (i, j)) называются эле-
ментами матрицы M , число m называется ее длиной, а число n – ее высотой.
• Множество всех матриц размера m × n (то есть длиной m и высотой n) мы будем обозна-
чать Rnm .
• Матрицы, у которых длина равна высоте, называются квадратными матрицами.
• Матрицы, у которых высота равна 1, можно отождествить со строками, которые мы
определили на с.650.
• Двойственным образом, матрицы, у которых длина равна 1 отождествляются со столб-
цами, определенными на с.651.
694 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Алгебраические операции над матрицами.


• Всякую матрицу M можно умножать поэлементно на произвольное число λ ∈ R – полу-
чающаяся при этом матрица обозначается λ · M и называется произведением матрицы
M на число λ:
(λ · M )ji := λ · Mij
• Если M и N – матрицы одинакового размера m×n, то их можно складывать поэлементно,
и получающаяся матрица (того же размера m × n) называется суммой матриц M и N и
обозначается M + N :

(M + N )ji := Mij + Nij (M, N ∈ Rnm )

• Кроме того, если M – матрица размера m × n, а N – матрица размера l × m, то формула


m
X
(M · N )ji := Mkj · Nik (M ∈ Rnm , N ∈ Rm
l ) (12.3.110)
k=1

определяет матрицу M · N размера l × n, называемую произведением матриц M и N .


• Для всякой матрицы M размера m × n ее транспонированной матрицей называется мат-
рица размера n × m, обозначаемая символом M ⊤ и определяемая формулой

(M ⊤ )ji := Mji

Действие матрицы на строку векторов и разложение по базису.


• Пусть M ∈ Rnm – матрица длины m и высоты n. Тогда для любого векторного простран-
ства X и любой строки (x1 , ..., xn ) длины n векторов из X строка длины m

(x1 , ..., xn ) · M := x1 · M11 + ... + xn · M1n , ..., x1 · Mm
1 n
+ ... + xn · Mm (12.3.111)

или, что эквивалентно, строка (y1 , ..., ym ), элементы которой определяются формулой
n
X
yi = xj · Mij ,
j=1

называется внешним действием матрицы M на строку (x1 , ..., xn ).


• Если (b1 , ..., bn ) – базис в векторном пространстве X, а (x1 , ..., xm ) – произвольная по-
следовательность элементов X, то мы можем разложить каждый элемент xi по базису
(b1 , ..., bn ),
n h
X xi ij
xi = · bj ,
j=1
b

выписать столбцы коэффициентов


  xi 1 
hx i  x  b
  xi 2 
i i
= 
= b  .
b b1 , ..., bn
 x...
i
 n
b

и рассмотреть матрицу, составленную из этих столбцов:


  x1 1  x2 1  xm 1 
  b b ... b
hxi x1 , ..., xm   x1 2  x2 2 ...  xm 2 
= 
:=  b b b  (12.3.112)
b b1 , ..., bn ... ... ... ... 
 x1 n  x2 n  xm n
b b ... b

Эта матрица называется матрицей коэффициентов последовательности векторов x =


(x1 , ..., xm ) в разложении по базису b = (b1 , ..., bn ). Коротко она определяется равенством
h x ij h x ij
i
:= , i = 1, ..., m, j = 1, ..., n (12.3.113)
b i b
§ 3. Матрицы и определители 695

Теорема 12.3.1. Строка векторов пространства X восстанавливается по матрице коэффици-


ентов их разложения по базису с помощью следующей формулы:
hxi
(x1 , ..., xm ) = (b1 , ..., bn ) · (12.3.114)
b
Доказательство.
hxi  h x i1 h x in h x i1 h x in 
(b1 , ..., bn ) · = (12.3.111) = b1 · + ... + bn · , . . . , b1 · + ... + bn · =
b b 1 b 1 b m b m
 h x i1 h x in h x i1 h x in 
1 1 m m
= b1 · + ... + bn · , . . . , b1 · + ... + bn · = (x1 , ..., xm )
| b {z b } | b {z b }

=
(12.2.68) (12.2.68)
x1 xm

Действие матрицы на столбец векторов и разложение по базису.


• Пусть M ∈ Rnm – матрицадлины  m и высоты n. Тогда для любого векторного простран-
x1
ства X и любого столбца  ...  высоты m векторов из X столбец высоты n
xm
 1  1 1 1

x M1 · x + ... + Mm · xm
M ·  ...  :=  ...  (12.3.115)
xm M1n · x1 + ... + Mm
n
· xm
 1
x
называется внешним действием матрицы M на столбец  ... .
xm

Матрица перехода к новому базису.


• В частном случае, если (a1 , ..., an ) и (b1 , ..., bn ) – два базиса в векторном пространстве
X, то (квадратная) матрица коэффициентов последовательности векторов (a1 , ..., an ) в
разложении по базису (b1 , ..., bn )
  a1  1  a2  1  an  1 
b b ... b
hai   a1 2  a2 2 ...  an 2 

:=  b b b  (12.3.116)
b ... ... ... ... 
 a1  n  a2  n  an  n
b b ... b

называется матрицей перехода от базиса (a1 , ..., an ) к базису (b1 , ..., bn ). Коротко ее опре-
деление записывается формулой
h a ij h a ij
i
:= , i, j = 1, ..., n (12.3.117)
b i b
Из теоремы 12.3.1 следует
Теорема 12.3.2. Базисы (a1 , ..., an ) и (b1 , ..., bn ) в векторном пространстве X связаны между
собой через матрицу перехода по следующей формуле:
hai
(a1 , ..., an ) = (b1 , ..., bn ) · (12.3.118)
b
Теорема 12.3.3. Если (a1 , ..., an ) и (b1 , ..., bn ) – два базиса в векторном пространстве X, то
hai hxi hxi
· = , x∈X (12.3.119)
b a b  
hai  b  b h a i
· =I= · (12.3.120)
b a a b
h a i−1  
b
= (12.3.121)
b a
(где I – единичная матрица размера n × n).
696 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство. 1. Равенство (12.3.119) выводится из цепочки

!  
Xn h i h ij Xn Xn h ij h ii n h ii
X n h ij
X
a x a x x a
· · bj = · · bj = · · bj  =
j=1
b a j=1 i=1
b i a i=1
a j=1
b i
 
n h ii n h
ai ij
X X n h ii
X n h ij
X
x x x
= · · bj  = · ai = x = · bj
i=1
a j=1
b i=1
a j=1
b

2. В (12.3.120) первое равенство выводится прямым вычислением:

n h i  j n h ij  k
! n h  k !
ak i j b i
X Xn X Xn X
a b a b
· · bj = · · bj = · · bj =
j=1
b a i j=1
b k a i j=1
b a
k=1 k=1

n
" Pn  bi k #j n  j n
X · ak X bi X
= k=1 a
· bj = · bj = bi = Iij · bj
j=1
b j=1
b j=1


h i  j
a b
· = Iij
b a i

hai  b 
· =I
b a
А после этого второе равенство в (12.3.120) тоже можно считать доказанным, потому что оно по-
лучается из первого перестановкой букв a и b.
3. Равенство (12.3.121) теперь – следствие (12.3.120).

Матрица линейного оператора.


• Пусть a1 , ..., am – базис в X, а b1 , ..., bn – базис в Y . Тогда матрицей линейного оператора
A : X → Y относительно этих базисов называется матрица, у которой в i-м столбце и j-й
строке стоит j-й коэффициент разложения вектора Aai по базису b1 , ..., bn :
 j  j
Aa Aai
:= (12.3.122)
b i b

Иными словами, характеристическим свойством этой матрицы является тождество


n 
X j n 
X j
Aa Aai
Aai = · bj = · bj (12.3.123)
j=1
b i j=1
b

Теорема 12.3.4. Если a1 , ..., am – базис в X, а b1 , ..., bn – базис в Y , то справедливы тождества:


   
Ax Aa h x i
= · (12.3.124)
b b b
 
Aa h x i
Ax = (b1 , ..., bn ) · · , x∈X (12.3.125)
b a
Доказательство. Равенство (12.3.125) доказывается цепочкой

n h ii
! n h ii n h ii X n  j
X x X x X x Aa
Ax = A · ai = · Aai = (12.3.123) = · · bj =
i=1
a i=1
b i=1
b j=1
b i
n  j h i ! n   j  
Aa h x i Aa h x i
Xn X X
Aa x i
= · ·bj = (12.3.110) = · ·bj = (12.3.111) = (b1 , ..., bn )· ·
j=1 i=1
b i b j=1
b b b a
§ 3. Матрицы и определители 697

После этого (12.3.124) становится следствием равенства


n  j n   j
X Ax X Aa h x i
· bj = Ax = · · bj
j=1
b j=1
b b

Следствие 12.3.5. Если a1 , ..., am – базис в X, а b1 , ..., bn – базис в Y , то тождества


hxi
Ax = (b1 , ..., bn ) · M · , x∈X (12.3.126)
  a
Aa
M= (12.3.127)
b

устанавливают взаимно однозначное соответствие между матрицами M длины m и высоты n


и линейными операторами A : X → Y .

Теорема 12.3.6. Если a1 , ..., an и b1 , ..., bn – два базиса в векторном пространстве X, то для
всякого оператора A : X → X справедливы тождества:
h a i  Aa   Ab  h a i
· = · (12.3.128)
b a b b
h a i  Aa  h a i−1  Ab  h a i  Aa   b 
· · = = · · (12.3.129)
b a b b b a a
Доказательство. Заметим, что левое равенство в (12.3.129) получается из (12.3.128) умножением
 −1
справа на матрицу ab :
h a i  Aa   Ab  h a i
· = ·
b a b b

h a i  Aa  h a i−1  Ab  h a i h a i−1  Ab   
Ab
· · = · · = ·I =
b a b b | b {z b } b b
I
 −1  
После этого правое равенство в (12.3.129) получается из левого заменой ab на ab по формуле
(12.3.121).
Поэтому нам нужно только доказать (12.3.128). Для всякого индекса i справедлива следующая
цепочка:
 
Xn h i  j X n X n h ij  k ! Xn  k Xn h ij
a Aa a Aa Aa a
· · bj = · · bj = · · bj  =
j=1
b a i j=1 k=1
b k a i a i j=1
b k
k=1
 
Xn  k Xn h i Xn  k Xn  k
Aa ak j Aa (Aa)i
= · · bj  = · ak = · ak = (Aa)i = A(ai ) =
a i j=1
b a i a
k=1 k=1 k=1
!  
Xn h ik X n h ik Xn h ik Xn h ik Xn  j
ai ai a a (Ab)k
=A · bk = · A(bk ) = · (Ab)k = · · bj  =
b b b i b i j=1
b
k=1 k=1 k=1 k=1
 
n h ik n  j n  j h i ! n   j
Ab h a i
X X Xn X X
a Ab Ab a k
= · · bj  = · · bj = · · bj
b i j=1
b k j=1
b k b i j=1
b b i
k=1 k=1

Отсюда мы получаем
h i  j   h ij
a Aa Ab a
· = · , i, j = 1, ..., n
b a i b b i

а это и есть (12.3.128).


698 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Матрица билинейной формы


• Билинейной формой на векторном пространстве X называется всякая полилинейная фор-
ма на последовательности пространств (X, X), то есть всякое отображение α : X ×X → R,
линейное по каждому аргументу:
α(λ1 · x1 + λ2 · x2 , y) = λ1 · α(x1 , y) + λ2 · α(x2 , y), x1 , x2 , y ∈ X, λ1 , λ2 ∈ R,
и
α(x, λ1 · y1 + λ2 · y2 ) = λ1 · α(x, y1 ) + λ2 · α(x, y2 ), x, y1 , y2 ∈ X, λ1 , λ2 ∈ R.
• Если α : X × X → R – билинейная форма на векторном пространстве X и a = (a1 , ..., an )
– какой-нибудь базис в X, то матрицей билинейной формы α в базисе a = (a1 , ..., an )
называется матрица, определяемая формулой
α[a; a]ij = α(ai ; aj ). (12.3.130)
Теорема 12.3.7. Справедлива формула
n
X h x ii h y ij h x i⊤ hy i
α(x; y) = α(ai ; aj ) · · = · α[a; a] · (12.3.131)
i,j=1
a a a a

Доказательство. Здесь используется билинейность α: для любых x, y ∈ X мы получим


   
Xn h ii Xn h ij Xn h ii Xn h ij
x y x y
α(x; y) = α  · ai ; · aj  = · α  ai ; · aj  =
i=1
a j=1
a i=1
a j=1
a
Xn h ii X n h ij X n h x ii h y ij
x y
= · · α (ai ; aj ) = α(ai ; aj ) · ·
i=1
a j=1
a i,j=1
a a

Это первое равенство в (12.3.131). Второе также проверяется вычислением:


 
h x i⊤ hy i X n h i⊤   h y ii X n h ii X n h y ij
x x
· α[a; a] · = · α[a; a] · = · α[a; a]ij · =
a a i=1
a i a i=1
a j=1
a
n
X h x ii h y ij
= α(ai ; aj ) · ·
i,j=1
a a

Следствие 12.3.8. Для всякого фиксированного базиса a = (a1 , ..., an ) в векторном пространстве
X тождества
h x i⊤ hyi
α(x; y) = ·M · , x, y ∈ X (12.3.132)
a a
M = α[a; a] (12.3.133)
устанавливают взаимно однозначное соответствие между матрицами M размера n × n и били-
нейными формами α на X.
Теорема 12.3.9. Если a1 , ..., an и b1 , ..., bn – два базиса в векторном пространстве X, то для
всякой билинейной формы α на X справедливо равенство
 ⊤  
b b
α[b, b] = · α[a, a] · (12.3.134)
a a
Доказательство. Здесь нужно просто вычислить матричный элемент матрицы справа:
 
 ⊤  ! k X n  ⊤ ! k   i X n  i Xn  j
b b b b b b
· α[a; a] · = · α[a; a] · = · α[a; a]ij · =
a a i=1
a a l i=1
a k j=1
a l
l i
n
X  i  j Xn  i  j
i b b bk bl
= α[a; a]j · · = α(ai ; aj )· · = (12.3.131) = α(bk ; bl ) = (12.3.130) = α[b; b]kl
i,j=1
a k a l i,j=1
a a
§ 3. Матрицы и определители 699

• Пусть A : X → X – произвольный линейный оператор. Для любой билинейной формы α


на X можно рассмотреть билинейную форму

(x, y) 7→ α(Ax, Ay)

называемую действием оператора A на форму α.


Теорема 12.3.10. Справедливо тождество:
 ⊤  
Ab Ab
α[Ab, Ab] = · α[b, b] · (12.3.135)
b b

Доказательство.
 
 ⊤  !k Xn  ⊤ ! k   i X n  i n  j
Ab Ab Ab Ab Ab X Ab =
· α[b; b] · = · α[b; b] · = · α[b; b]ij ·
b b i=1
b b l i=1
b k j=1
b l
l i
n
X 
i  j Xn  i  j
Ab Ab (Ab)k (Ab)l
= α[b; b]ij · · = α[bi ; bj ] · · = (12.3.131) =
i,j=1
b k b l i,j=1
b b

= α((Ab)k ; (Ab)l ) = (12.3.130) = α[Ab; Ab]kl

Если a = (a1 , ..., an ) – строка элементов векторного пространства X и M ∈ Rnm – матрица, то,
напомним, формулой (12.3.111) мы определили внешнее действие матрицы M на строку векторов
a = (a1 , ..., an ):

a · M = (a1 , ..., an ) · M := a1 · M11 + ... + an · M1n , ..., a1 · Mm
1 n
+ ... + an · Mm

Теорема 12.3.11. Если a = (a1 , ..., an ) – базис векторного пространства X и M ∈ Rnn – обратимая
матрица, то матрица билинейной формы α в преобразованном базисе a · M = (a1 , ..., an ) · M имеет
вид:
α[a · M, a · M ] = M ⊤ · α[a, a] · M (12.3.136)
Доказательство.

  X
m m
X 
α[a · M, a · M ]ij = α (a · M )i , (a · M )j = (12.3.111) = α ak · Mik , al · Mjl =
k=1 l=1
!
m
X m
X m
X m
X m
X i  k
= Mik · α(ak , al ) · Mjl = Mik · α[a; a]kl · Mjl = M⊤ k
· α[a, a] · M =
j
k=1 l=1 k=1 l=1 k=1
 i
= M ⊤ · α[a, a] · M
j

(b) Определитель
Определитель матрицы, как полилинейная кососимметрическая форма.
• Определителем квадратной матрицы A порядка n называется число
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n (12.3.137)
σ∈Sn

где Sn — множество перестановок длины n, определенное выше на с.662.


• Если (x1 , ..., xm ) – последовательность длины m элементов пространства Rn , то есть столб-
цов высоты n,  1  1
x1 xm
x1 =  ...  , ..., xm =  ...  ,
xn1 xnm
700 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

то условимся символом [x1 , ..., xm ] обозначать матрицу, составленную из этих столбцов:


 1 
x1 ... x1m
[x1 , ..., xm ] =  ... 
n n
x1 ... xm

Понятно, что любую матрицу N ∈ Rnm можно представить как строку из таких столбцов

N = [x1 , ..., xm ], xi ∈ Rn ,

Для любой матрицы M размером k × m справедливо равенство


произведение произведение
матрицы матрицы
на столбец на столбец
z }| { z }| {
M · [x1 , ..., xm ] = [ M · x1 , ..., M · xm ] (12.3.138)
| {z }
произведение
матриц

С другой стороны, для любого столбца y ∈ Rm выполняется

[x1 , ..., xm ] · y = y 1 · x1 + ... + y m · xm (12.3.139)

Рассмотрим теперь определитель det как функцию от этих столбцов матрицы,

(x1 , ..., xn ) 7→ det[x1 , ..., xn ]

то есть как функцию на декартовом произведении

det : Rn × ... × Rn → R
| {z }
n множителей

Теорема 12.3.12. Определитель, как функция от столбцов матрицы,

f (x1 , ..., xn ) = det[x1 , ..., xn ]

обладает следующими свойствами:


(i) полилинейность: f линейна по каждому аргументу, то есть для всякого индекса i ∈ N
и фиксированных xj , j 6= i, отображение

x → f (x1 , ..., x , ..., xn )



i-е место

является линейным отображением: для любых λ, µ ∈ R, y, z ∈ Rn

f (x1 , ..., λ · y + µ · z , ..., xn ) = λ · f (x1 , ..., y , ..., xn ) + µ · f (x1 , ..., z , ..., xn ) (12.3.140)
| {z } ↑ ↑
↑ i-е место i-е место
i-е место

(ii) кососимметричность: f меняет знак при транспозиции аргументов:

j-е место i-е место


↓ ↓
f (x1 , ..., xi , ..., xj , ..., xn ) = −f (x1 , ..., xj , ..., xi , ..., xn ) (12.3.141)
↑ ↑
i-е место j-е место

И наоборот, если f : Rn × ... × Rn → R – какая-то функция, обладающая этими свойствами, то


| {z }
n множителей
она имеет вид
f (x1 , ..., xn ) = λ · det[x1 , ..., xn ] (12.3.142)
где
λ = f (e1 , ..., en ) (12.3.143)
§ 3. Матрицы и определители 701

Лемма 12.3.13. Если x1 , ..., xn – последовательность векторов из X, в которой какой-то вектор


xi равен нулю
xi = 0,

то значение любой полилинейной формы f : X × ... × X → R на этой последовательности равно


| {z }
n множителей
нулю:
f (x1 , ..., xn ) = 0

Доказательство. Обозначим λ = f (x1 , ..., xi , ..., xn ). Тогда

λ = f (x1 , ..., xi , ..., xn ) = f (x1 , ..., 0, ..., xn ) = f (x1 , ..., 2 · 0, ..., xn ) =


= 2 · f (x1 , ..., 0, ..., xn ) = 2 · f (x1 , ..., xi , ..., xn ) = 2 · λ

λ=0

Лемма 12.3.14. Если x1 , ..., xn – последовательность векторов из X, в которой какие-то два


вектора совпадают
xi = xj , i 6= j,

... × X} → R на этой по-


| × {z
то значение любой кососимметрической полилинейной формы f : X
n множителей
следовательности равно нулю:
f (x1 , ..., xn ) = 0

Доказательство. Обозначим y = xi = xj ∈ X и λ = f (x1 , ..., xn ). Тогда

y y
=

λ = f (x1 , ..., xi , ..., xj , ..., xn ) = (12.3.141) = −f (x1 , ..., xj , ..., xi , ..., xn ) = −λ


=

y y

2λ = 0

λ=0

Лемма 12.3.15. При перестановке аргументов кососимметрическая форма меняет знак в соот-
ветствии с четностью этой перестановки:

f (xσ(1) , ..., xσ(n) ) = sgn σ · f (x1 , ..., xn ), σ ∈ Sn (12.3.144)

Доказательство. Это следует из теоремы 12.1.12: для транспозиций эта формула представляет со-
бой просто определение кососимметрической формы. А затем применяется индукция: если формула
(12.3.144) доказана для перестановок σ, которые можно разложить в композицию k транспозиций,
то добавляя еще одну транспозицию τ , мы получим:

f (xσ(τ (1)) , ..., xσ(τ (n)) ) = sgn σ · f (xτ (1) , ..., xτ (n) ) = sgn σ · sgn τ · f (x1 , ..., xn ) =
= (12.1.29) = sgn(σ ◦ τ ) · f (x1 , ..., xn )
702 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство теоремы 12.3.12. 1. Сначала докажем первую часть теоремы. Полилинейность


отображения f (x1 , ..., xn ) = det[x1 , ..., xn ] проверяется прямым вычислением, например, если вместо
x1 подставить λ · y + µ · z, y, z ∈ Rn , то мы получим:
X σ(2)
f (λ · y + µ · z, x2 , ..., xn ) = det[λ · y + µ · z, x2 , ..., xn ] = sgn σ · (λ · y + µ · z)σ(1) · x2 · ... · xσ(n)
n =
σ∈Sn
X σ(2) σ(2)
σ(1)
= λ· sgn σ · y · x2 · ... · xσ(n)
n + µ · sgn σ · z σ(1) · x2 · ... · xσ(n)
n =
σ∈Sn

= λ · det[y, x2 , ..., xn ] + µ · det[z, x2 , ..., xn ] = λ · f (y, x2 , ..., xn ) + µ · f (z, x2 , ..., xn )

Теперь кососимметричность: пусть τ – какая-нибудь транспозиция (12.1.21), тогда


X σ(1) σ(n)
f (xτ (1) , ..., xτ (n) ) = det[xτ (1) , ..., xτ (n) ] = sgn σ · xτ (1) · ... · xτ (n) =
σ∈Sn
X σ(τ (1)) σ(τ (n))
X σ(1)
X σ(1)
= sgn(σ◦τ )·xτ (1) ·...·xτ (n) = sgn(σ◦τ )·x1 ·...·xσ(n)
n =− sgn(σ)·x1 ·...·xσ(n)
n =
σ◦τ ∈Sn σ∈Sn σ∈Sn

= − det[x1 , ..., xn ] = −f (x1 , ..., xn )

2. Теперь наоборот, пусть f – произвольное отображение со свойствами (i) и (ii). Тогда

n n
!
X X X
f (x1 , ..., xn ) = f xσ1 1 · eσ1 , ..., xσnn · eσn = xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
σ1 =1 σn =1 σ1 ,...,σn ∈{1,...,n}
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) + xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) =
| {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}

=
∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 12.3.14

сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X X
= xσ1 1 · ... · xσnn · f (eσ1 , ..., eσn ) = (12.3.144) = xσ1 1 · ... · xσnn · sgn σ · f (e1 , ..., en ) =
| {z }
σ∈Sn σ∈Sn
λ
X
=λ· sgn σ · xσ1 1 · ... · xσnn = λ · det[x1 , ..., xn ]
σ∈Sn

Правило Крамера.

Теорема 12.3.16. Для последовательности (a1 , ..., an ) ⊂ Rn числовых столбцов высотой n следу-
ющие условия эквивалентны:
(i) уравнение
[a1 , ..., an ] · x = b (12.3.145)
разрешимо в Rn при любой правой части b ∈ Rn ;
(ii) уравнение
[a1 , ..., an ] · x = 0 (12.3.146)
имеет только одно решение x = 0 ∈ Rn ;
(iii) столбцы a1 , ..., an линейно независимы (то есть образуют базис) в векторном простран-
стве Rn ;
(iv) определитель матрицы [a1 , ..., an ] отличен от нуля:

det[a1 , ..., an ] 6= 0 (12.3.147)


§ 3. Матрицы и определители 703

При этом решение уравнения (12.3.145) описывается формулой


1
xi = · det[a1 , ..., b, ..., an ] (12.3.148)
det[a1 , ..., an ] ↑
этот столбец
подставлен в
[a1 , ..., an ] вместо
столбца ai

Лемма 12.3.17. Пусть a1 , ..., an , x, b ∈ Rn – числовые столбцы высотой n. Тогда если выполняется
равенство (12.3.145), то для всякого i = 1, ..., n справедливо равенство

xi · det[a1 , ..., an ] = det[a1 , ..., b , ..., an ] (12.3.149)



этот столбец
подставлен вместо
столбца ai

Доказательство. Перепишем равенство (12.3.145), расписав левую часть по формуле (12.3.139):

x1 · a1 + ... + xn · an = b

Теперь вычислим определитель в правой части (12.3.149) (здесь неявно предполагается, что 1 6= i 6=
n, но нетрудно переписать выкладки для i = 1 и i = n):

det[a1 , ..., b , ..., an ] = det[a1 , ..., x1 · a1 + ... + xi · ai + ... + xn · an , ..., an ] =


↑ | {z }
этот столбец ↑
подставлен вместо этот столбец
столбца ai подставлен вместо
столбца ai

i-й столбец i-й столбец i-й столбец


↓ ↓ ↓
1 i n
=x · det[a1 , ..., a1 , ..., an ] +... +x · det[a1 , ..., ai , ..., an ] +... +x · det[a1 , ..., an , ..., an ] =
| {z } | {z } | {z }
=

=
0, det[a1 , ..., an ] 0,
по лемме 12.3.14, по лемме 12.3.14,
поскольку поскольку
a1 повторяется an повторяется
в аргументе дважды в аргументе дважды

= xi · det[a1 , ..., an ]

Доказательство теоремы 12.3.16. Заметим сразу, что здесь нужно только доказать эквивалент-
ность условий (i)-(iv), потому что из (iv) и формулы (12.3.149) сразу же следует формула (12.3.148).
(i)⇔(ii). Рассмотрим оператор A : Rn → Rn , действующий по формуле

Ax = [a1 , ..., an ] · x, x ∈ Rn .

Условие (i) применительно к A означает, что отображение A : Rn → Rn должно быть сюръективно,


а условие (ii) – что A инъективно. По следствию 12.2.13 эти условия эквивалентны.
(ii)⇔(iii). Условие (ii) означает, что если для какого-то числового столбца x ∈ Rn справедливо
равенство
0 = [a1 , ..., an ] · x = x1 · a1 + ... + xn · an ,
то из этого автоматически следует, что x = 0, то есть что

x1 = ... = xn = 0.

Но это (в силу теоремы 12.2.1) как раз и есть условие линейной независимости векторов a1 , ..., an .
(iii)⇔(iv). 1. Пусть сначала столбцы a1 , ..., an линейно зависимы, то есть

0 = [a1 , ..., an ] · x = x1 · a1 + ... + xn · an ,

для некоторого x 6= 0 ∈ Rn . Тогда по лемме 12.3.17 для любого i = 1, ..., n выполняется равенство

xi · det[a1 , ..., an ] = det[a1 , ..., 0 , ..., an ] = (лемма 12.3.13) = 0 (12.3.150)



этот столбец
подставлен вместо
столбца ai
704 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Поскольку x 6= 0, найдется индекс i такой, что xi 6= 0. Для него тоже верно (12.3.150). Значит,

det[a1 , ..., an ] = 0.

2. Пусть наоборот столбцы a1 , ..., an линейно независимы (то есть образуют базис) в Rn . Тогда
каждый базисный вектор ei представим в виде линейной комбинации векторов a1 , ..., an :
h e i1 h e in
i i
ei = · a1 + ... + · an
a a
 j
(напомним, что обозначения xa вводились выше формулой (12.2.68)). Отсюда мы получаем такую
цепочку:
n h
" #
e1 iσ1
n h
X X en iσn
1 = det[e1 , ..., en ] = det · aσ1 , ..., · aσn = (12.3.140) =
σ =1
a σ =1
a
1 n
n
X h e iσ1 h e iσn
1 n
= · ... · · det[aσ1 , ..., aσn ] =
σ1 ,...,σn =1
a a
X h e iσ1 h e iσn X h e iσ1 h e iσn
1 n 1 n
= · ... · · det[aσ1 , ..., aσn ] + · ... · · det[aσ1 , ..., aσn ] =
a a a a | {z }
σ1 , ..., σn ∈ {1, ..., n} σ1 , ..., σn ∈ {1, ..., n}

=
∀s 6= t : σs 6= σt ∃s 6= t : σs = σt
| {z } 0,
по лемме 12.3.14

сумма по всем
инъективным
последовательностям
(σ1 , ..., σn )
где σk ∈ {1, ..., n},
то есть по всем
перестановкам σ ∈ Sn
X h e1 iσ1 h e iσn
n
X h e1 iσ1 h e iσn
n
= ·...· ·det[aσ1 , ..., aσn ] = (12.3.144) = ·...· ·sgn σ·det[a1 , ..., an ] =
a a a a
σ∈Sn σ∈Sn
X h e iσ1 h e iσn hei
1 n
= det[a1 , ..., an ] · sgn σ · · ... · = det[a1 , ..., an ] · det
a a a
σ∈Sn


hei
1 = det[a1 , ..., an ] · det
a

det[a1 , ..., an ] 6= 0.

Свойства определителей матриц. Докажем следующее.


1◦ . Определитель треугольной матрицы равен произведению ее диагональных элементов:
 
∀i < j Aji = 0 =⇒ det A = A11 · A22 · ... · Ann (12.3.151)

2◦ . Определитель не меняется при транспонировании матрицы:

det A⊤ = det A (12.3.152)

3◦ . Определитель произведения равен произведению определителей:

det(A · B) = det A · det B (12.3.153)

4◦ . Матрица M тогда и только тогда обратима, когда ее определитель ненулевой

∃M −1 ⇐⇒ det M 6= 0

При этом определитель обратной матрицы равен обратному числу:

det(M −1 ) = (det M )−1 (12.3.154)


§ 3. Матрицы и определители 705

Доказательство. 1. Пусть матрица A треугольна, то есть Aji 6= 0 только если i > j. Тогда можно
показать, что в сумме (12.3.137) ненулевым будет только одно слагаемое, а именно, то, которое
соответствует тривиальной перестановке:
 σ(1)  

 A1 6= 0 
 σ(1) 6 1 
 σ(1) = 1

Aσ(2) 6= 0 
σ(2) 6 2 
σ(2) = 2
σ(1) σ(2)
A1 · A2 · ... · Aσ(n)
n 6= 0 ⇐⇒ 2
⇐⇒ ⇐⇒

 ... 
 ... 
 ...
 σ(n)
 
 

An 6= 0 σ(n) 6 n σ(n) = n
(12.3.155)
В этой цепочке лишь последняя эквивалентность требует некоторых объяснений. Она доказывается
последовательной расшифровкой условий σ(i) 6 i:
1) первое неравенство σ(1) 6 1, вместе с условием σ(1) ∈ N сразу же дает σ(1) = 1;
2) после того, как мы это поняли, второе неравенство σ(2) 6 2 будет означать σ(2) = 2,
поскольку σ(2) ∈ N и σ(2) 6= σ(1) = 1;
...
n) так по индукции мы к n-му шагу доказываем равенство σ(i) = i для любых i < n, и тогда
на n-м шаге неравенство σ(n) 6 n будет означать, что σ(n) = n, поскольку, σ(n) ∈ N и
σ(n) 6= σ(i) = i при i = 1, ..., n − 1.
Из (12.3.155) следует, что в формуле (12.3.137) для матрицы A только одно слагаемое может быть
отлично от нуля – то, которое соответствует тождественной подстановке:
X σ(1)
det A = sgn σ · A1 · ... · Aσ(n)
n = sgn(1, 2, ..., n) ·A11 · A22 · ... · Ann = A11 · A22 · ... · Ann
| {z }
σ∈Sn
k
1

2. Для транспонированной матрицы получаем:

если упорядочить множители


по нижнему индексу
sgn σ−1 то получится
k σ−1 (1) −1 (n)
A1 · ... · Aσ
n
(12.1.30)

k z }| {
X σ(1) σ(n) X z }| {
det A⊤ = sgn σ · A⊤ 1
· ... · A⊤ n
= sgn σ · A1σ(1) · ... · Anσ(n) =
σ∈Sn σ∈Sn
X σ−1 (1) −1 X τ (1)
= sgn σ −1 · A1 · ... · Aσn (n)
= sgn τ · A1 · ... · Aτn(n) = det A
σ∈Sn τ ∈Sn

3. Пусть e1 , ..., en – стандартный базис в Rn . Зафиксируем матрицу A и рассмотрим функцию


 
f (x1 , ..., xn ) = det A · [x1 , ..., xn ] = det[A · x1 , ..., A · xn ], xi ∈ Rn

Она будет полилинейной формой, потому что

f (x1 , ..., λ · y + µ · z, ..., xn ) = det[A · x1 , ..., A · (λ · y + µ · z), ..., A · xn ] =


= det[A·x1 , ..., λ·A·y +µ·A·z, ..., A·xn] = λ·det[A·x1 , ..., A·y, ..., A·xn ]+µ·det[A·x1 , ..., A·z, ..., A·xn ] =
= λ · f (x1 , ..., y, ..., xn ) + µ · f (x1 , ..., z, ..., xn )

Эта форма будет кососимметрична, потому что

i-е место j-е место i-е место j-е место


↓ ↓ ↓ ↓
= det[A · x1 , ..., A · xi, ..., A · xj, ..., A · xn ] =
f (x1 , ..., xi , ..., xj , ..., xn )
= − det[A · x1 , ...,A · xj, ..., A · xi, ..., A · xn ] = −f (x1 , ..., xj , ..., xi , ..., xn )
↑ ↑ ↑ ↑
i-е место j-е место i-е место j-е место

Значит, по теореме 12.3.12, эта форма должна иметь вид:

f (x1 , ..., xn ) = λ · det[x1 , ..., xn ], (12.3.156)


706 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

где
 
λ = f (e1 , ..., en ) = det[A · e1 , ..., A · en ] = det A · [e1 , ..., en ] = det(A · I) = det A (12.3.157)
| {z }

единичная
матрица I

Поэтому
 
det(A·B) = det A·(B1 , ..., Bn ) = f (B1 , ..., Bn ) = (12.3.156) = λ·det(B1 , ..., Bn ) = (12.3.157) = det A·det B.

4. Представим матрицу M как строку из столбцов:


M = [a1 , ..., an ]
Ее обратимость означает, что уравнение
M ·x =b
однозначно разрешимо в R при любой правой части b ∈ Rn . По теореме 12.3.16 это эквивалентно
n

тому, что определитель M отличен от нуля:


det M 6= 0.
Далее из равенства
I = M · M −1
мы по уже доказанному свойству 3◦ получаем:

1 = det I = det M · M −1 = det M · det M −1

1
det M −1 = = (det M )−1
det M

Определитель оператора.
• Пусть X – конечномерное векторное пространство, (a1 , ..., an ) – произвольный базис в X,
и A : X → X – произвольный оператор. Число
 
Aa
det A = det (12.3.158)
a
не зависит от выбора базиса (a1 , ..., an ) и называется определителем оператора A.
Доказательство. Пусть (b1 , ..., bn ) – какой-нибудь другой базис в X. Тогда
  h i   
Ab a Aa h a i−1
det = (12.3.129) = det · · = (12.3.153) =
b b a b
hai   h a i−1  hai    
Aa Aa  h a i−1 Aa
= det · det · det = (12.3.154) = det · det · det = det
b a b b a b a

Из свойств определителей матриц на с.704 следуют

Свойства определителей операторов



1 . Определитель единичного оператора равен единице:
det I = 1 (12.3.159)

2 . Определитель произведения равен произведению определителей:
det(A · B) = det A · det B (12.3.160)
3◦ . Оператор A тогда и только тогда обратим, когда его определитель ненулевой
∃A−1 ⇐⇒ det A 6= 0,
при этом определитель обратной матрицы равен обратному числу:
det(A−1 ) = (det A)−1 (12.3.161)
§ 4. Симметрические формы и однородные многочлены 707

§4 Симметрические формы и однородные многочлены


(a) Общие симметрические формы и однородные многочлены
Симметрические формы Σm (X).
• Полилинейная форма ω на векторном пространстве X

ω : X × ... × X → R
| {z }
k множителей

называется симметрической формой степени k на X, если она инвариантна относительно


транспозиций:

ω(x1 , ..., xi , ..., xj , ..., xk ) = ω(x1 , ..., xj , ..., xi , ..., xk ), x1 , ..., xk ∈ X. (12.4.162)

Поскольку по теореме (12.1.14) любая вообще перестановка является композицией транс-


позиций, это эквивалентно инвариантности относительно всех перестановок:

ω(xσ(1) , ..., xσ(k) ) = ω(x1 , ..., xk ), σ ∈ Sk , x1 , ..., xk ∈ X. (12.4.163)

Множество всех симметрических форм степени k на X обозначается Σk (X). Ясно, что это
будет векторное пространство относительно поточечных алгебраических операций.

Симметрическое произведение функционалов. Если η 1 , ..., η m – произвольная последова-


тельность длины m линейных функционалов на X, то формула
1 X
(η 1 ⊓ ... ⊓ η m )(x1 , ..., xm ) := · η σ(1) (x1 ) · ... · η σ(m) (xm ) (12.4.164)
m!
σ∈Sm

или, эквивалентно, формула


1 X
η 1 ⊓ ... ⊓ η m := · η σ(1) ⊠ ... ⊠ η σ(m) (12.4.165)
m!
σ∈Sm

определяет симметрическую форму степени k на X, называемую симметрическим произведением


функционалов η 1 , . . . , η k .
Мы считаем очевидными следующие
Свойства симметрического произведения функционалов:
1◦ . При перестановке элементов последовательности η 1 , ..., η k симметрическое произведение не
меняется:
η σ(1) ⊓ ... ⊓ η σ(k) = η 1 ⊓ ... ⊓ η k , σ ∈ Sk . (12.4.166)
2◦ . При умножении какого-нибудь функционала η i на скаляр λ симметрическое произведение умно-
жается на скаляр:

η 1 ⊓ ... ⊓ λ · η i ⊓ ... ⊓ η k = λ · η 1 ⊓ ... ⊓ η i ⊓ ... ⊓ η k . (12.4.167)

3◦ . При замене какого-нибудь функционала η i на сумму функционалов α + β симметрическое про-


изведение заменяется на сумму конкатенаций с подставленными α и β вместо η i :

η 1 ⊓ ... ⊓ (α + β) ⊓ ... ⊓ η k = η 1 ⊓ ... ⊓ α ⊓ ... ⊓ η k + η 1 ⊓ ... ⊓ β ⊓ ... ⊓ η k (12.4.168)

Симметризация. Для всякой полилинейной формы ω : X m → R ее симметризацией называется


полилинейная форма
1 X
Sym ω(x1 , ..., xm ) = · ω(xσ(1) , ..., xσ(m) ) (12.4.169)
m!
σ∈Sm

Отображение, которое каждой форме ω ставит в соответствие ее симметризацию

ω 7→ Sym ω

называется симметрированием.
Свойства симметрирования:
708 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

1◦ Линейность:

Sym(λ · ω + µ · π) = λ · Sym ω + µ · Sym π, ω ∈ Lm (X),

2◦ Инвариантность при перестановке:

Sym ω(xσ(1) , ..., xσ(m) ) = Sym ω(x1 , ..., xm ), ω ∈ Lm (X), σ ∈ Sm , x1 , ..., xm ∈ X.


(12.4.170)
3◦ Всякую полилинейную форму операция симметрирования превращает в симметриче-
скую,
∀ω ∈ Lm (X) Sym ω ∈ Sm (X), (12.4.171)
и при этом всякую симметрическую форму она не меняет:

∀ω ∈ Sm (X) Sym ω = ω. (12.4.172)

4◦ Идемпотентность: при вторичном применении симметрирование не меняет резуль-


тат
Sym(Sym ω) = Sym ω, ω ∈ Lm (X). (12.4.173)

⋄ 12.4.1. Из формулы (12.4.165) видно, что если метризацией формы η 1 ⊠· · ·⊠η m является форма
η 1 , . . . , η m – произвольная последовательность η 1 ⊓ · · · ⊓ η m :
длины m линейных функционалов на X, то сим-
Sym(η 1 ⊠ · · · ⊠ η m ) = η 1 ⊓ · · · ⊓ η m (12.4.174)

Базис в пространстве симметрических форм Σm (X).


• Пусть X – векторное пространство и ω ∈ Σm (X) – симметрическая форма на нем. Пусть
кроме того x = (x1 , ..., xn ) – строка элементов X (длина которой n необязательно сов-
падает со степенью m формы ω), и k : |1, ..., n| → Z+ – мультииндекс объема m. Для
произвольного представления σ ∈ Rep(k) мультииндекса k рассмотрим величину

ω(xσ(1) , ..., xσ(m) ).

Поскольку ω – симметрическая форма, эта величниа не зависит от выбора представления


σ, а только от самого мультииндекса k. Поэтому определена величина

ω(xk ) = ω(xσ(1) , ..., xσ(m) ), σ ∈ Rep(k), (12.4.175)

называемая действием формы ω на мультистепень k строки x = (x1 , ..., xn ).


• Пусть X – векторное пространство и пусть η 1 , ..., η n – некая фиксированная последова-
тельность линейных функционалов на X. Если k : |1, ..., n| → Z+ – мультииндекс, то для
любого его представления σ ∈ Rep(k) симметрическая форма

η σ(1) ⊓ ... ⊓ η σ(m)

не зависит от выбора этого представления σ. Поэтому определена симметрическая форма

η ⊓k = η σ(1) ⊓ ... ⊓ η σ(m) ∈ Σm (X). (12.4.176)

называемая мультистепенью строки функционалов η 1 , ..., η n .


   n 
1
Лемма 12.4.1. Пусть a = (a1 , ..., an ) – базис в X, и a1 = a1 , ..., a1 – сопряженный ему базис

в X . Тогда для любых двух мультииндексов k, l : {1, ..., n} → Z+ одинакового объема,

|k| = m = |l|,

справедливо равенство (
 ⊓k k!
1 , k=l
(al ) = m! . (12.4.177)
a 0, k 6= l
§ 4. Симметрические формы и однородные многочлены 709

Доказательство. Выберем какие-нибудь представления σ ∈ Rep(k) и τ ∈ Rep(l). Тогда


 ⊓k  σ(1)  σ(m) !
1 1 1
(al ) = ⊓ ... ⊓ (aτ (1) , ..., aτ (m) ) = (12.4.164) =
a a a

1 X  1 σ(1)  σ(m)
1
= · (aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) (12.4.178)
m! a a
ρ∈Sm

Пусть теперь k 6= l. Тогда ki 6= li для некоторого i ∈ {1, ..., n}, и поэтому при любом ρ ∈ Sm

card σ −1 (i) = ki 6= li = card τ −1 (i) = card(τ ◦ ρ)−1 (i).


 σ(j)
Это означает, что в последовательностях a1 и aτ (ρ(j)) число элементов с индексами, равными
i неодинаково. Как следствие, найдется такой индекс j ∈ {1, ..., m}, что σ(j) = i 6= τ (ρ(j)), либо
σ(j) 6= i = τ (ρ(j)). Для такого j мы получим
 σ(j)
1
(aτ (ρ(j)) ) = 0,
a
и поэтому
 σ(1)  σ(m)
1 1
(aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) = 0
a a
Это верно для любого ρ ∈ Sm , и мы получаем, что вся сумма в конце (12.4.178) нулевая.
Наоборот, пусть k = l. Тогда в цепочке (12.4.178) с самого начала можно считать, что σ = τ .
Для того, чтобы слагаемое в конце (12.4.178) было ненулевым, должны выполняться равенства

τ (j) = τ (ρ(j)), j ∈ {1, ..., m},

(то есть чтобы перестановка ρ не меняла отображение τ ) и в этом случае все произведение будет
равно единице:
 σ(1)  σ(m)
1 1
(aτ (ρ(1)) ) · ... · (aτ (ρ(m)) ) = 1.
a a
Таких перестановок ρ, которые не меняют τ по теореме 12.1.10 имеется ровно k!. Поэтому вся сумма
в конце (12.4.178) будет равна k!.
Теорема 12.4.2 (о базисе в Σk (X)). Пусть η 1 , ..., η n – базис в сопряженном пространстве X ∗ .
Тогда для всякого числа m ∈ Z+ симметрические формы {η ⊓k ; |k| = m} определенные формулой
(12.4.176) (где k пробегает всевозможные мультииндексы длины n и объема m), образуют базис
 1  n
в пространстве Σm (X). В частном случае когда η 1 = a1 , ..., η n = a1 – сопряженный базис
к некоторому базису a = (a1 , ..., an ) в X, разложение всякой симметрической формы по базису
(12.4.176) имеет вид
X  ⊓k
m! 1
ω= · ω(ak ) · (12.4.179)
k! a
k : {1, ..., n} → Z+ :
|k| = m

(суммирование ведется по всевозможным мультииндексам k объема m).


Доказательство. 1. Докажем сначала линейную независимость. Пусть для некоторых λk выпол-
няется равенство
X X X  
1 X τk ρ(1)
0= λk ·η ⊓k = λk ·η τk (1) ⊓...⊓η τk (m) = (12.4.164) = λk · · η ⊠...⊠η τk ρ(m)
m!
|k|=m |k|=m |k|=m ρ∈Sm
(12.4.180)
где τk – какое-нибудь фиксированное представление мультииндекса k. Заметим, что при любом
выборе мультииндексов k, l и перестановок ρ, π ∈ Sm равенство
 
τk ρ(1) τk ρ(m)
η ⊠ ... ⊠ η = η τl (π(1)) ⊠ ... ⊠ η τl (π(m)) (12.4.181)

может выполняться только если k = l и τk ◦ ρ = τk ◦ π.


710 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Действительно, если k 6= l, то найдется какой-то индекс i ∈ {1, ..., n} такой, что ki 6= li . Как
следствие,
card(τk ◦ ρ)−1 (i) = card τk−1 (i) = ki =
6 li = card τl−1 (i) = card(τl ◦ π)−1 (i).
 
Это означает, что в последовательностях η τk ρ(1) , ..., η τk ρ(m) и η τl (π(1))
 , ..., η
τl (π(m))
имеется
 неоди-
наковое количество векторов η i . Уже по этой причине формы η τk ρ(1) ⊠ ... ⊠ η τk ρ(m)
и η τl (π(1)) ⊠
... ⊠ η τl (π(m)) не могут совпадать.
Наоборот, если k = l, то (12.4.181) эквивалентно равенству
 
η τk ρ(1) ⊠ ... ⊠ η τk ρ(m) = η τk (π(1)) ⊠ ... ⊠ η τk (π(m))
а это эквивалентно системе
τk (ρ(i)) = τk (π(i)), 1 6 i 6 m,
то есть τk ◦ ρ = τk ◦ π.
Разобьем теперь последнее выражение в (12.4.180) на подсуммы, в которых слагаемые одина-
ковы. В силу сказанного, это то же самое, что разбить последнюю сумму на подсуммы, в которых
перестановки ρ имеют одну и ту же композицию с τk . А это то же самое, что разбить эту сумму на
подклассы, соответствующие представлениям мультииндекса k:
X  
1 X τk ρ(1) X λk X X
0= λk · · η ⊠ ... ⊠ η τk ρ(m) = · η τ (1) ⊠ ... ⊠ η τ (m) =
m! m!
|k|=m ρ∈Sm |k|=m τ ∈Rep(k) σ∈Sm : τ ◦σ=τ
X λk X
= · card{σ ∈ Sm : τ ◦ σ = τ } ·η τ (1) ⊠ ... ⊠ η τ (m) =
m! | {z }
|k|=m τ ∈Rep(k)
k (12.1.17)
k!
X λk X
= · k! · η τ (1) ⊠ ... ⊠ η τ (m)
m!
|k|=m τ ∈Rep(k)

Теперь мы получаем, что в последнем выражении векторы η τ (1) ⊠ ... ⊠ η τ (m) не повторяются (при
изменении k и τ ∈ Rep(k)). А по замечанию 12.2.10 векторы вида η i1 ⊠ ... ⊠ η im (is ∈ {1, ..., n})
образуют базис в пространстве L(X, ..., X) всех полилинейных форм степени m на X. Значит, век-
торы η τ (1) ⊠ ... ⊠ η τ (m) должны быть линейно независимы (при изменении k и τ ∈ Rep(k)). Значит,
равенство нулю суммы означает равенство нулю клоэффициентов:
λk
∀k · k! = 0.
m!
или
∀k λk = 0.
2. Теперь докажем полноту. Если ω – какая-нибудь симметрическая форма, то, поскольку в
силу замечания 12.2.10 формы вида η i1 ⊠ ... ⊠ η ik (is ∈ {1, ..., n}) образуют базис в L(X, ..., X), ω
представима как их линейная комбинация:
X
ω= λi1 ,...,im · η i1 ⊠ ... ⊠ η im
is ∈{1,...,n}

Под действием симметрирования это равенство превращается в цепочку


X
ω = (12.4.172) = Sym ω = λi1 ,...,im · Sym(η i1 ⊠ ... ⊠ η im ) =
is ∈{1,...,n}
X
= (12.4.174) = λi1 ,...,ik · η i1 ⊓ ... ⊓ η im
is ∈{1,...,n}

То есть ω представима как линейная комбинация форм вида η i1 ⊓ ... ⊓ η im .


3. Мы убедились, что формы (12.4.176) образуют базис в Σm (X). Остается доказать формулу
 ⊓k
(12.4.179). Пусть a = (a1 , ..., an ) – базис в X. Разложим произвольную форму ω по базису a1 :
X  ⊓k
1
ω= λk · .
a
k : {1, ..., n} → Z+ :
|k| = m
§ 4. Симметрические формы и однородные многочлены 711

Рассмотрим произвольный мультииндекс l : {1, ..., n} → Z+ объема m и подставим в качестве


аргумента строчку al :

X  ⊓k
1 l!
ω(al ) = λk · (al ) = · λl .
a m!
k : {1, ..., n} → Z+ : | {z }
|k| = m k (12.4.177)
(
l!
m! , k=l
,
0, k 6= l

То есть
m!
λl = · ω(al ).
l!

(b) Однородные многочлены Pm (X)


• Многочленами на конечномерном векторном пространстве X называются функции f :
X → R, определенные следующими индуктивными правилами:
0) всякая постоянная функция f : X → R,

f (x) = λ, x∈X

является многочленом на X;
1) всякий линейный функционал f : X → R является многочленом на X;
2) если f : X → R и g : X → R – многочлены на X, то их произведение f ·g : X → R
тоже является многочленом на X;
3) если f : X → R и g : X → R – многочлены на X, то их сумма f + g : X → R
тоже является многочленом на X.
• Многочлен f : X → R называется однородным степени m, если выполняется тождество

f (λ · x) = λm · f (x), x ∈ X, λ ∈ R. (12.4.182)

Множество всех однородных многочленов степени m на X мы будем обозначать Pm (X).

Базис в пространстве однородных многочленов. Пусть X – векторное пространство раз-


мерности n ∈ N и η 1 , ..., η n – последовательность линейных функционалов на X. Каждому мульти-
индексу11 k : {1, ..., n} → Z+ поставим в соответствие функцию

n
Y
η k (x) = η i (x)ki , x ∈ X. (12.4.183)
i=1

называемую k-мономом последовательности η 1 , ..., η n . Понятно, что всякая такая функция явля-
ется однородным многочленом на X степени m = |k| (равной объему мультииндекса k).

Теорема 12.4.3. При фиксиорованном базисе η1 , ..., ηn – в сопряженном пространства X ∗ мономы


{η k ; |k| = m} (где k пробегает множество мультииндексов длины n и объема m) образуют базис в
пространстве Pm (X) всех однородных многочленов на X степени m: всякий многочлен f ∈ Pm (X)
однозначно раскладывается в сумму
X
f= λk · η k (12.4.184)
|k|=m

(где λk ∈ R, а суммирование ведется по всевозможным мультииндексам длины n и объема m).


11 Понятие мультииндекса было определено на с.659.
712 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Изоморфизм Pm (X ∗ ) ∼ = Σm (X)∗ . Пусть a = (a1 , ..., an ) – базис в векторном пространстве X.


Каждый вектор ai можно считать функционалом на сопряженном пространстве X ∗ , потому что
ему соответствует функционал ιX (ai ) ∈ (X ∗ )∗ , определенный формулой (12.2.92):

ιX (ai )(f ) = f (ai ), f ∈ X ∗.

Более того, поскольку по теореме 12.2.16 отображение ιX : X → (X ∗ )∗ является изоморфизмом


векторных пространств, функционалы a1 , ..., an образуют базис пространства (X ∗ )∗ .
Поэтому каждому мультииндексу k : {1, ..., n} → Z+ будет соответствовать некий k-моном базиса
a1 , ..., an в (X ∗ )∗ .
n
Y n
Y n
Y
ak (f ) = ai (f )ki = ιX (ai )(f )ki = f (ai )ki , f ∈ X ∗.
i=1 i=1 i=1

Каждому моному ak ∈ Pm (X ∗ ) можно приписать действие на симметрические формы ω ∈ Σm (X)


по формуле
@ak (ω) = ω(aσ(1) , ..., aσ(|k|) ) (12.4.185)
где σ : {1, ..., |k|} → {1, ..., n} – произвольное представление12 мультииндекса k (поскольку форма
ω симметрична, правая часть (12.4.185) не зависит от выбора представления σ). По теореме 12.4.3
мономы ak образуют базис в пространстве многочленов Pm (X ∗ ). Значит, каждый многочлен f ∈
Pm (X ∗ ) однозначно раскладывается по этому базису по формуле
X
f= λk · ak , λk ∈ R. (12.4.186)
|k|=m

Для любой формы ω ∈ Σm (X) положим


X
@f (ω) = λk · ω(ak ). (12.4.187)
|k|=m

Это число мы называем действием многочлена f ∈ Pm (X ∗ ) на форму ω ∈ Σm (X). При фикси-


рованном f ∈ Pm (X ∗ ) эта формула определает линейный функционал @f : Σm (X) → R, а если
считать, что f может меняться, то мы получаем отображение

@ : Pm (X ∗ ) → Σm (X)∗ .

Теорема 12.4.4. Действие (12.4.187) многочлена f ∈ Pm (X ∗ ) на симметрическую форму ω ∈


Σm (X) обладает следующими свойствами:
(i) определение @f (ω) не зависит от выбора базиса a = (a1 , ..., an ) в X;
(ii) если ω 6= 0, то существует f такой, что @f (ω) 6= 0;
(iii) если f 6= 0, то существует ω такая, что @f (ω) 6= 0;
(iv) отображение @ : Pm (X ∗ ) → Σm (X)∗ является изморфизмом векторных пространств.
Доказательство. 1. Пусть b = (b1 , ..., bn ) – другой базис в X. Для любых мультииндексов k, l :
{1, ..., n} → Z+ объема |k| = |l| = m, и любого представления σ ∈ Rep(k) обозначим
h a il X h aσ(1) iτ (1) ha iτ (m)
k σ(m)
= · ... · (12.4.188)
b b b
τ ∈Rep(l)

и заметим, что это число не зависит от выбора σ ∈ Rep(k). Действительно, если σ ′ – какое-то другое
представление мультииндекса k, то от σ оно отличается некоторой перестановкой аргументов

σ ′ = σ ◦ υ, υ ∈ Sm .

Поэтому
"a  #τ (1) "a  #τ (m)
X h aσ′ (1) iτ (1) ha ′
σ (m)
iτ (m) X σ υ(1) σ υ(m)
· ... · = · ... · =
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
если заменить τ на τ ◦ υ, то сумма не изменится

12 Представление мультииндекса было определено на с.661.


§ 4. Симметрические формы и однородные многочлены 713
 
"a  #τ υ(1) "a  #τ υ(m)
X σ υ(1) σ υ(m) X h aσ(1) iτ (1) ha
σ(m)
iτ (m)
= · ... · = · ... ·
b b b b
τ ∈Rep(l) τ ∈Rep(l)
| {z }
k
ha iτ (1) ha iτ (m)
σ(1) σ(m)
b · ... · b

Определение (12.4.188) позволяет выразить ak через bl : для произвольного σ ∈ Rep(k)


   
n h
aσ(1) ij1
n h
X X aσ(1) ijn
ak = aσ(1) · ... · aσ(m) = (12.2.68) =  · bj1  · ... ·  · bjn  =
j =1
b j =n
b
1 1

n
X ha ij1 ha ijn
σ(1) σ(1)
= · ... · · bj1 · ... · bjn =
j1 ,...,jn =1
b b
X X h aσ(1) iτ (1) ha
σ(1)
iτ (n) X h ak il
= · ... · · bτ (1) , ..., bτ (m) = · bl
b b b
|l|=m τ ∈Rep(l) |l|=m

Отсюда следует, что если многочлен f раскладывается по базису a формулой (12.4.186), то в раз-
ложении по базису b он принимает вид
X X X h ak il X X h a il
k
X
f= λk · ak = λk · · bl = λk · · bl = µl · b l
b b
|k|=m |k|=m |l|=m |l|=m |k|=m |l|=m

где
X h a il
k
µl = λk · .
b
|k|=m

Если теперь обозначить символами @a f (ω) и @b f (ω) действия многочлена f на форму ω опреде-
ленные правилом (12.4.187) примененном к базисам a и b соответственно,
X X
@a f (ω) = λk · ω(ak ), @b f (ω) = λl · ω(bl ).
|k|=m |l|=m

то мы получим, что эти действия совпадают:


X X
@a f (ω) = λk · ω(ak ) = λk · ω(aσ(1) · ... · aσ(m) ) = (12.2.68) =
|k|=m |k|=m
 
X Xn h ij1 Xn h ijn
a σ(1) a σ(1)
= λk · ω  · bj1 , ..., · bjn  =
j =1
b j =n
b
|k|=m 1 1

X n
X ha ij1 ha ijn
σ(1) σ(1)
= λk · · ... · · ω(bj1 , ..., bjn ) =
j1 ,...,jn =1
b b
|k|=m
X X X h aσ(1) iτ (1) ha
σ(1)
iτ (n)
= λk · · ... · · ω(bτ (1) , ..., bτ (m) ) =
b b
|k|=m |l|=m τ ∈Rep(l)
X X h a il X
k
= λk · · ω(bl ) = µl · ω(bl ) = @b f (ω).
b
|l|=m |k|=m |l|=m

2. Пусть ω 6= 0. Тогда эта форма отлична от нуля на какой-то последовательности aσ(1) , ..., aσ(m)
базисных векторов:
ω(aσ(1) , ..., aσ(m) ) 6= 0.
Последовательность σ(1), ..., σ(m) является представлением некоторого мультииндекса k, и поэтому
мы получаем
ω(ak ) 6= 0.
То есть @f (ω) 6= 0 при f = ak .
714 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

3. Наоборот, пусть f 6= 0. По тореме 12.4.3 многочлен f раскладывается по базису ak :


X
f= λk · ak .
|k|=m

Поскольку f 6= 0, какой-то коэффициент в этом разложении должен быть ненудевым: λl 6= 0. Если


 l
взять симметричевую форму ω = a1 , то мы получим

X X  l  l
1 1
@f (ω) = λk · ω(ak ) = λk · (ak ) = (12.4.177) = λl · (al ) = λl · l! 6= 0.
a a
|k|=m |k|=m

4. Докажем (iv). Понятно, что отображение @ : Pm (X ∗ ) → Σm (X)∗ лмнейно. Оно инъективно,


потому что если f 6= 0, то по свойству (iii) найдется ω такая, что @f (ω) 6= 0, и значит @f 6= 0.
Покажем, что оно сюръективно. Пусть F ∈ Σm (X)∗ – какой-нибудь функционал. Положим

X 1   k 
1
f= ·F · ak .
k! a
|k|=m

Тогда для любой формы ω ∈ Σm (X) мы получим

X 1   k   X  k 
1 1 1
@f (ω) = ·F · ω(ak ) = F · · ω(ak ) = (12.4.179) = F (ω).
k! a k! a
|k|=m |k|=m

Это значит, что @f = F .

Симметрическая поляризация Pm (X) = ∼ Σm (X). Пусть X – векторное пространство размер-


ности n, η 1 , ..., η n – базис его сопряженного пространства X ∗ и m ∈ N. По теореме (12.4.3) всякий
однородный многочлен f ∈ Pm (X) однозначно раскладывается по базису мономов {η k } степени m,
X
f= λk · η k , (12.4.189)
|k|=m

а по теореме 12.4.2 всякая симметрическая форма ω ∈ Σm (X) однозначно раскладывается по базису


элементарных форм {η ⊓k } степени m,
X
ω= λk · η ⊓k .
|k|=m

• Отображение
X X
Π:f = λk · η k 7→ ω= λk · η ⊓k (12.4.190)
|k|=m |k|=m

(которое каждому многочлену f ∈ Pm (X) ставит в соответствие симметрическую форму


ω ∈ Σm (X) с теми же коэффициенами в разложении по базису {η ⊓k }, что и у f в раз-
ложении по базису {η k }) называется симметрической поляризацией. Это отображение
однозначно определяется тем, что оно линейно и переводит базис {η k } в базис {η ⊓k }:

Π(η k ) = η ⊓k .

Теорема 12.4.5. Отображение симметрической поляризации Π : Pm (X) → Σm (X) линейно, би-


ективно, не зависит от выбора базиса η 1 , ..., η n в X ∗ , а обратное ему отображение Π −1 : Σm (X) →
Pm (X) совпадает с отображением ограничения на диагональ:

Π −1 (ω)(x) = ω(x, ..., x), x ∈ X. (12.4.191)

! 12.4.2. Ниже мы покажем, что поляризацию Π можно задать формулой

1 d d
Π(f )(x1 , ..., xm ) = · ... f (t1 · x1 + ... + tm · xm ) , xi ∈ X, (12.4.192)
m! d t1 d tm t1 =...=tm =0
§ 4. Симметрические формы и однородные многочлены 715

Доказательство. 1. Линейность и биективность этого отображения очевидны. Покажем, что оно


не зависит от базиса. Здесь повторяются рассуждения теоремы 12.4.4. Фиксируется какой-нибудь
другой базис θ1 , ..., θn в X ∗ . Затем определяется система чисел, аналогичная (12.4.188):
  X  η σ(1)   σ(m) 
ηk η
= · ... · ,
θ l θ τ (1) θ τ (m)
τ ∈Rep(l)

и отмечается, что они не зависят от выбора представления σ ∈ Rep(k). Отсюда следует, что если
многочлен f раскладывается по базису η k формулой (12.4.189), то в разложении по базису θl он
принимает вид X X
f= λk · η k = µl · θ l (12.4.193)
|k|=m |l|=m

где  
X ηk
µl = λk · .
θ l
|k|=m

Если теперь для многочлена (12.4.193) обозначить символом Πη (f ) форму, определенную правилом
(12.4.190), а символом Πθ (f ) форму, определенную тем же правилом (12.4.190), но а заменой η на
θ, X X
Πη (f ) = λk · η ⊓k , Πθ (f ) = µl · θ⊓l ,
|k|=m |l|=m

то мы получим, что эти формы совпадают:


X X
Πη (f ) = λk · η ⊓k = λk · η σ(1) ⊓ ... ⊓ η σ(m) ) = (12.2.68) =
|k|=m |k|=m
   
X X n  σ(1)  Xn  σ(1) 
η η
= λk ·  · θj1  ⊓ ... ⊓  · θjn  =
j =1
θ j1 j =n
θ jn
|k|=m 1 1

X n
X  σ(1)
  σ(1)

η η
= λk · · ... · · θj1 ⊓ ... ⊓ θjn =
j1 ,...,jn =1
θ j1 θ jn
|k|=m
X X X  η σ(1)   σ(1) 
η
= λk · · ... · · θτ (1) ⊓ ... ⊓ θτ (m) =
θ τ (1) θ τ (n)
|k|=m |l|=m τ ∈Rep(l)

X X  l X
ηk
= λk · · θl = µl · θl = Πθ (f ).
θ
|l|=m |k|=m |l|=m

2. Тождество (12.4.191) достаточно проверить на базисных векторах. Для ω = η ⊓k мы получим:

ω(x, ..., x) = η ⊓k (x, ..., x) = (12.4.176) = (η σ(1) ⊓ ... ⊓ η σ(m) )(x, ..., x) = (12.4.164) =
1 X
= · η σ(τ (1)) (x) · ... · η σ(τ (m)) (x) = η k (x) = Π −1 (η ⊓k )(x) = Π −1 (ω)(x)
m! | {z }
τ ∈Sm
k
η σ(1) (x) · ... · η σ(m) (x)
k
η k (x)

Универсальность пространства однородных многочленов. Пусть X – конечномерное веще-


ственное векторное пространство. Каждому числу k ∈ N и каждой последовательность (x1 , ..., xk )
векторов из X поставим в соответствие однородный многочлен x1 ⊔ ... ⊔ xm степени m на сопряжен-
ном пространстве X ∗ по формуле

(x1 ⊔ ... ⊔ xm )(f ) = f (x1 ) · ... · f (xm ), f ∈ X ∗. (12.4.194)

Заметим, что отображение


⊔k : (x1 , ..., xm ) 7→ x1 ⊔ ... ⊔ xm (12.4.195)
716 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

является кососимметрическим полилинейным отображением ⊔m : X × ... × X → Pm (X ∗ ). Кроме


того справедливо тождество

@(x1 ⊔ ... ⊔ xm )(ω) = ω(x1 , ..., xm ), x1 , ..., xm ∈ X. (12.4.196)

Действительно, если a = (a1 , ..., an ) – базис в X, то


 X h i   X h x ijm 
x j1 1 m
@(x1 ⊔ ... ⊔ xm )(ω) = @ · aj1 ⊔ ... ⊔ · ajm (ω) =
j1
a jm
a
 X h i   X h x ijm   X X h x1 ij1 h xm ijm 
x1 j1 m
=@ ·aj1 ⊔...⊔ ·ajm (ω) = @ ·...· ·aj1 ⊔...⊔ajm (ω) =
j1
a jm
a j1 jm
a a
h
X X x1 j1 i h i
xm jm X X x1 j1h i h xm ijm
= · ... · · ω(aj1 ⊔ ... ⊔ ajm ) = · ... · · ω(aj1 , ..., ajm ) =
j1 jm
a a j1 jm
a a
 X h i   X h x ijm 
x1 j1 m
=ω · aj1 , ..., · ajm = ω(x1 , ..., xm ).
j
a j
a
1 m

Теорема 12.4.6 (универсальность пространства однородных многочленов). Для любого симмет-


рического полининейного отображения ϕ : X × ... × X → Y найдется единственное линейное
| {z }
m множителей
отображение ϕ∨ : Pm (X ∗ ) → Y , замыкающее диаграмму

X × ... × X
t ❏❏
⊔m tt
tt ❏❏
❏❏ ϕ
ttt
t ❏❏
❏❏ .
tt ❏❏
zt ❏$
Pm (X ∗ ) ❴ ❴ ❴ ❴ ❴ ❴ ⊔❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ

Доказательство. Каждому функционалу f ∈ Y ∗ поставим в соответствие симметрическую форму


ψ(f ) степени m на X по формуле
ψ(f ) = f ◦ ϕ.
У нас получится линейный оператор

ψ : Y ∗ → Σm (X).

Ему соответствует сопряженное отображение

ψ ∗ : Σm (X)∗ → Y ∗∗ .

Рассмотрим отображение ιY : Y → Y ∗∗ , определенное формулой (12.2.92). По теореме 12.2.16 оно


является изоморфизмом векторных пространств, поэтому определено обратное отображение ι−1 Y :
Y ∗∗ → Y . Положим
ϕ⊔ = ι−1 ∗
Y ◦ ψ ◦ @ : Pm (X) → Y

ψ∗
Σm (X)∗ / Y ∗∗
O

@ ι=1


Pm (X) ⊔
/Y
ϕ

Тогда возникает цепочка (в которой xi ∈ X, f ∈ Y ∗ ):


   
f ϕ⊔ ⊔m (x1 , ..., xm ) = f ϕ⊔ (x1 ⊔ ... ⊔ xm ) = f (ι−1 ∗
Y ◦ ψ ◦ @)(x1 ⊔ ... ⊔ xm ) =
   
−1 ∗
   
= f ιY ψ @(x1 ⊔ ... ⊔ xm ) = ψ ∗ @(x1 ⊔ ... ⊔ xm ) (f ) = @(x1 ⊔ ... ⊔ xm ) ψ(f ) =
 
= @(x1 ⊔ ... ⊔ xm ) (f ◦ ϕ) = (12.4.196) = (f ◦ ϕ)(x1 , ..., xm ) = f ϕ(x1 , ..., xm )
§ 4. Симметрические формы и однородные многочлены 717



ϕ⊔ ⊔m (x1 , ..., xm ) = ϕ(x1 , ..., xm )

ϕ⊔ ◦ ⊔m = ϕ.

(c) Симметрические билинейные формы и критерий Сильвестра


Симметрические билинейные формы. Билинейная форма α на векторном пространстве X
называется симметрической, если она удовлетворяет тождеству

α(x, y) = α(y, x), x, y ∈ X (12.4.197)

Теорема 12.4.7. Для билинейной формы α на векторном пространстве X следующие условия


эквивалентны:
(i) α является симметрической;
(ii) матрица A билинейной формы α в каком-нибудь базисе b1 , ..., bn является симметриче-
ской:
A⊤ = A (12.4.198)
(iii) матрица A билинейной формы α в любом базисе b1 , ..., bn является симметрической.
Доказательство.
α(x, y) = α(y, x)
m
∀i, j α(bj , bi ) = α(bi , bj )
m
∀i, j Aj,i = Ai,j
m
AT = A

Квадратичные формы.
• Многочлен q : X → R на векторном пространстве X называется квадратичной формой на
X, если он удовлетворяет следующему так называемому тождеству параллелограмма:

q(x + y) + q(x − y)
= q(x) + q(y), x, y ∈ Rn (12.4.199)
2

⋄ 12.4.3. На пространстве R2 квадратичными как легко проверить, будет квадратичной фор-


формами будут, например, функции мой на X. В частности, произведение f на себя
2 2 будет квадратичной формой:
p(x) = x1 + x2
2 2 q(x) = f (x)2
q(x) = x1 − x2
⋄ 12.4.5. Если q(x) и r(x) – квадратичные фор-
r(x) = x1 · x2
мы, то любая их линейная комбинация
⋄ 12.4.4. Если f : X → R и g : X → R – два ли-
нейных функционала на X, то их произведение p(x) = α · q(x) + β · r(x), α, β ∈ R

q(x) = f (x) · g(x) тоже будет квадратичной формой.


718 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 12.4.8. Формулы


q(x) = α(x, x) (12.4.200)

q(x + y) − q(x) − q(y)


α(x, y) = (12.4.201)
2
устанавливают взаимно однозначное соответствие между квадратичными формами q и сим-
метрическими билинейными формами α на X.
Вместе с теоремой 12.4.5 это дает
Следствие 12.4.9. Для многочлена q на векторном пространстве X следующие условия эквива-
лентны:
(i) q является квадратичной формой,
(i) q является однородным степени 2, и поэтому удовлетворяет условиям:

q(0) = 0 (12.4.202)

q(λ · x) = λ2 · q(x) = q(−λ · x) (12.4.203)


С другой стороны, из теоремы 12.2.18 мы получаем
Следствие 12.4.10. Для любого базиса b в X всякая квадратичная форма q(x) на X имеет вид
h x i⊤ hxi n
X h x ii h x ij
q(x) = ·M · = Mji · · , x ∈ Rn (12.4.204)
b b i,j=1
b b

где M – некоторая симметрическая матрица, коэффициенты которой Mji можно вычислить по


формуле
q(bi + bj ) − q(bi ) − q(bj )
Mji = (12.4.205)
2
Для доказательства теоремы 12.4.8 нам понадобится следующая
Лемма 12.4.11. Для всякой квадратичной формы q справедливо тождество

q(x + y + z) = q(x + y) + q(y + z) + q(x + z) − q(x) − q(y) − q(z) (12.4.206)

Доказательство.
 
q(x + y) + q(y + z) + q(x + z) = q(x + y) + q(y + z) + q(x + z) = (12.4.199) =
   
q (x + y) + (y + z) + q (x + y) − (y + z) q x + 2y + z + q x − z
= + q(x + z) = + q(x + z) =
2   2
q x + 2y + z + q(x + z) + q x − z + q(x + z)
= =
 2  
q (x + y + z) + y + q (x + y + z) − y + q x − z + q(x + z)
= =
   2 
2q x + y + z + 2q y + q x − z + q(x + z)   q x − z + q(x + z)
= =q x+y+z +q y + =
2  2
= q x + y + z + q(y) + q(x) + q(z)

Доказательство теоремы 12.4.8. 1. Пусть α(x, y) – симметрическая билинейная форма на Rn . По-


кажем, что функция q(x), определенная формулой (12.4.201), является квадратичной формой на
Rn .
Во-первых, надо проверить непрерывность q(x). Она следует из непрерывности α(x, y) (следствие
2.3).
Во-вторых, проверим тождество параллелограмма (12.4.198):

q(x+y)+q(x−y) = α(x+y, x+y)+α(x−y, x−y) = α(x+y, x)+α(x+y, y)+α(x−y, x)−α(x−y, y) =


§ 4. Симметрические формы и однородные многочлены 719
.
/ .
/ .
/ /
.
= α(x, x) + α(y, x) + α(x, y) + α(y, y) + α(x, x) − α(y, x) − α(x, y) + α(y, y) = 2α(x, x) + 2α(y, y) =
= 2q(x) + 2q(y)

Это и есть тождество (12.4.198), только помноженное на двойку.


2. Наоборот, пусть q – квадратичная форма на Rn . Покажем, что функция α, определенная
формулой (12.4.201) является симметрической билинейной формой на Rn .
Докажем сначала аддитивность по первой переменной:

α(x + y, z) = α(x, z) + α(y, z)

m (12.4.201)

q(x + y + z) − q(x + y) − q(z) q(x + z) − q(x) − q(z) q(y + z) − q(y) − q(z)


= +
2 2 2
m
q(x + y + z) − q(x + y) − q(z) = q(x + z) − q(x) − q(z) + q(y + z) − q(y) − q(z)
m
q(x + y + z) = q(x + y) + q(x + z) + q(y + z) − q(x) − q(y) − q(z)
Последнее тождество – то самое, которое мы доказывали в лемме 12.4.11.
Далее нужно заметить, что форма α непрерывна: это следует из непрерывности q (и формулы
(12.4.201)). Вместе непрерывность и аддитивность дают линейность по первой переменной. Анало-
гично доказывается линейность по второй переменной.
Остается проверить, что α(x, y) – симметрическая форма, то есть, что она удовлетворяет (12.4.197).
Это делается непосредственно:

q(x + y) − q(x) − q(y) перегруппируем q(y + x) − q(y) − q(x)


α(x, y) = = слагаемые = = α(y, x)
2 2

! 12.4.6. Квадратичные формы, являющие- к функции от пары векторов x и y, и тогда она


ся одновременно билинейными. Функция от становится билинейной формой.
двух вещественных переменных Квадратичная форма q : X × X → R тогда
и только тогда будет билинейной формой от
f (x, y) = x · y
пары переменных x, y ∈ X, когда выполняется
если на нее глядеть как на функцию от векто- тождество
ра (x, y) ∈ R2 , является квадратичной формой.
С другой стороны, к ней можно относиться, как q(x, 0) = 0 = q(0, x), x ∈ X.

Ортогональное дополнение и невырожденные формы. Пусть α – симметрическая били-


нейная форма на пространстве X.
• Говорят, что два векторы x и y из X ортогональны (относительно формы α), и обознача-
ется это записью x ⊥ y, если форма α обращается в нуль на паре (x, y):

x⊥y ⇐⇒ α(x, y) = 0.

• Для любого подпространства Y ⊆ X его ортогональным дополнением (относительно фор-


мы α) называется множество Y ⊥ , состоящее из векторов, ортогональных всем векторам
из Y :
Y ⊥ = {x ∈ X : ∀y ∈ Y x ⊥ y} = {x ∈ X : ∀y ∈ Y α(x, y) = 0}.
Нетрудно заметить, что Y ⊥ тоже является подпространством в X.
720 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

! 12.4.7. Очевидно, всегда выполняется включе-


ние Y = {(a, 0); a ∈ R}
Y ⊆ (Y ⊥ )⊥ ,
мы получим:
но обратное включение не всегда верно. Напри-
мер, на плоскости R2 для формы Y ⊥ = {(0, b); b ∈ R}
α(x, y) = x1 · y 1
и
и подпространства (Y ⊥ )⊥ = R2 * Y.

Лемма 12.4.12. Для любой билинейной формы α на X и любого подпростраства Y в X справед-


ливо неравенство
dim Y + dim Y ⊥ > dim X (12.4.207)
Доказательство. Выберем базис e1 , ..., ek в Y . Тогда

Y ⊥ = {x ∈ X : ∀i = 1, ..., k α(x, ei ) = 0}

То есть Y ⊥ есть общее ядро функционалов fi (x) = α(x, ei ):


k
\
Y⊥ = Ker fi
i=1

Отсюда можно вывести нижнюю оценку для размерности Y ⊥ :

dim Y ⊥ > dim X − k = dim X − dim Y

Это эквивалентно неравенству (12.4.207).


• Ядром Ker α симметрической билинейной формы α на пространстве X называется орто-
гональное дополнение ко всему пространству X:

Ker α := X ⊥ = {x ∈ X : ∀y ∈ X x ⊥ y}.

• Говорят, что симметрическая билинейная форма α невырождена на X, если выполняются


следующие эквивалентные условия:
(a) для любого ненулевого вектора x ∈ X найдется вектор y ∈ X, неортогональный
x:
α(x, y) 6= 0
(b) ядро формы α состоит из единственного вектора – нуля:

Ker α = X ⊥ = {0}

Теорема 12.4.13. Для симметрической билинейной формы α на X и подпространства Y ⊆ X


следующие условия эквивалентны:
(i) X = Y ⊕ Y ⊥ ;
(ii) Y ∩ Y ⊥ = {0};
(iii) ограничение α|Y формы α на подпространство Y является невырожденной формой на
Y.

! 12.4.8. Можно заметить, что эти условия не казывается примером, построенном в замечании
зависят (ни в прямую, ни в обратную сторону) 12.4.7:
от равенства

Y = (Y ⊥ )⊥ (12.4.208)

Что, скажем, из (ii) не следует (12.4.208) до- X = R2 , α(a, b) = a1 · b1 , Y = {(a, 0); a ∈ R}


§ 4. Симметрические формы и однородные многочлены 721

Здесь но при этом


Y
|{z} ∩ Y⊥
|{z} = {0}, Y ∩ Y ⊥ = Y 6= {0}.
k k
{(t, 0); t ∈ R} {(0, t); t ∈ R}
Этот пример показывает также, что ограни-
однако чение невырожденной формы не обязано быть
невырожденной формой. Действительно, здесь
Y 6= (Y ⊥ )⊥ .
|{z} форма α невырождена, потому что если x 6= 0, то
| {z }
k k либо x1 6= 0, и тогда для y = (1; 0) мы получим
{(t, 0); t ∈ R} R2

А невозможность обратной импликации дока- α(x, y) = x1 · 1 − x2 · 0 = x1 6= 0,


зывается примером
либо x2 6= 0, и тогда для y = (0; 1) мы получим
2 1 1 2 2
X =R , α(x, y) = x · y − x · y ,
Y = {y ∈ R2 : y 1 = y 2 }. α(x, y) = x1 · 0 − x2 · 1 = x2 6= 0.

В нем Но на подпространстве

x∈Y⊥ ⇔ ∀t ∈ R x1 · t − x2 · t = 0 ⇔ Y = {x ∈ R2 : x1 = x2 }
⇔ x1 = x2 ⇔ x∈Y
эта форма становится нулевой:
то есть
Y ⊥ = Y. x2 · y 2 = 0,
α(x, y) = x1 · y 1 − |{z} x, y ∈ Y.
|{z}
Поэтому

=
Y ⊥⊥ = Y, x1 y1

Доказательство теоремы 12.4.13. Пусть α|Y – ограничение формы α на подпространство Y . За-


метим сразу цепочку

Ker(α|Y ) = {x ∈ Y : ∀y ∈ Y α(x, y) = 0} = Y ∩ {x ∈ X : ∀y ∈ Y α(x, y) = 0} = Y ∩ Y ⊥

из которой следует, что если Y ∩Y ⊥ = 0, то Ker(α|Y ) = 0 и наоборот. Это в точности равносильность


(ii) и (iii).
Нам остается доказать равносильность (i) и (ii). Импликация (i)⇒(ii) есть просто следствие
определения разложения на подпространства на с.686. А обратная импликация доказывается так:

Y ∩ Y ⊥ = {0}


⊥ ⊥
dim(Y + Y ) = dim(Y ∩ Y ) + dim(Y + Y ) = (12.2.61) = dim Y + dim Y ⊥ > (12.4.207) > dim X

| {z }
k
0


Y +Y⊥ ⊇X

вдобавок к этому, по-прежнему,
Y +Y⊥ =X ← Y ∩ Y ⊥ = {0}


X =Y ⊕Y⊥

• Проектор P : X → X называется ортогональным, если его ядро и образ являются орто-


гональными дополнениями друг для друга:

Ker P ⊥ = Im P & Ker P = Im P ⊥ .


722 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 12.4.14. Для симметрической билинейной формы α на X и подпространства Y ⊆ X


следующие условия эквивалентны:
(i) Y ⊥ ∩ Y ⊥⊥ = 0,
(ii) форма α невырождена на Y ⊥ ,
(iii) форма α невырождена на Y ⊥ и на Y ,
(iv) X = Y ⊕ Y ⊥ и Y = Y ⊥⊥ ,
(v) существует ортогональный проектор вдоль Y ,
(vi) существует ортогональный проектор на Y .

Доказательство. 1. Цепочка (i)⇔(ii)⇔(iii) следует из картинки:


Y

z }| {
Y ⊥ ∩ Y ⊥⊥ = 0 =⇒ Y⊥∩Y = 0
(теорема 12.4.13) m m (теорема 12.4.13)
α невырождена на Y ⊥ α невырождена на Y

2. (iii)⇔(iv). Пусть выполняется (iii). Тогда α невырождена на Y , и по теореме 12.4.13 мы сразу


получаем равенство X = Y ⊕ Y ⊥ . Из него следует, в частности, что для любого вектора x ∈ Y ⊥⊥
существуют y ∈ Y и z ∈ Y ⊥ такие, что x = y + z. Поэтому если справедливо (i), то
(i)
x − y = z ∈ Y ⊥⊥ ∩ Y ⊥ = 0 =⇒ x = y ∈ Y.


⊥⊥ ⊥
Y Y Y

Y ⊥⊥

Это доказывает включение Y ⊥⊥ ⊆ Y , а значит, и равенство Y ⊥⊥ = Y . Мы доказали импликацию


(iii)⇒(iv).
Наоборот, если выполнено (iv), то из равенства X = Y ⊕ Y ⊥ по теореме 12.4.13 сразу следует,
что форма α невырождена на Y . С другой стороны, подстановкой Y = Y ⊥⊥ мы получаем равенство
X = Y ⊥⊥ ⊕ Y ⊥ , которое по той же теореме 12.4.13 означает, что форма α невырождена на Y ⊥ тоже.
То есть доказана импликация (iii)⇐(iv).
3. (iv)⇔(v). Если выполняется (iv), то по свойству 3◦ на с.687, из X = Y ⊕Y ⊥ следует, что можно
выбрать проектор P с ядром Y и образом Y ⊥ :

Ker P = Y, Im P = Y ⊥ .

При этом сразу получится, что Ker P ⊥ = Y ⊥ = Im P , а из Y = Y ⊥⊥ (второго условия в (iv)) мы


получим Im P ⊥⊥ = Y ⊥⊥ = Y = Ker P . Таким образом, P является ортогональным проектором
вдоль Y , и это доказывает импликацию (iv)⇒(v).
Наоборот, если P – какой-то ортогональный проектор вдоль Y , то это означает, что

Y = Ker P, X = Ker P ⊕ Im P, Ker P ⊥ = Im P, Ker P = Im P ⊥ .

Отсюда
X = Ker P ⊕ Im P = Y ⊕ Y ⊥ , Y ⊥⊥ = Ker P ⊥⊥ = Im P ⊥ = Ker P = Y,
и это доказывает импликацию (iv)⇐(v).
4. По аналогии доказывается равносильность (iv)⇔(vi) (или здесь можно сослаться на очевидную
эквивалентность (v) и (vi)).

Ортогональный базис.
• Базис e = (e1 , ..., en ) пространства X называется ортогональным для симметрической
билинейной формы α на X, если его элементы ортогональны друг другу относительно α:

∀i 6= j ei ⊥ ej

Это означает, что в матрице α(e, e) все элементы, лежащие вне диагонали, равны нулю,
поэтому формула (12.3.131) в таком базисе принимает специальный вид:
§ 4. Симметрические формы и однородные многочлены 723

– разложение билинейной формы α по ортогональному базису имеет вид


n
X h x ii h y ii
α(x, y) = α(ei , ei ) · · (12.4.209)
i=1
e e

– и поэтому разложение соответствующей квадратичной формы q имеет вид


n
X h i 2
x i
q(x) = q(ei ) · (12.4.210)
i=1
e

Ортогональный базис e = (e1 , ..., en ) называется нормированным (часто говорят ортонор-


мированный базис вместо “ортогональный нормированный базис”), если числа α(ei , ei ) =
q(ei ) принимают значения {−1; 0; +1}.

Теорема 12.4.15. Для любой симметрической билинейной формы α на произвольном конечномер-


ном пространстве X существует ортогональный (если нужно, нормированный) базис.

Доказательство. Проведем индукцию по n. При n = 1 утверждение очевидно. Предполагаем, что


оно доказано для всех пространств с размерностями до n − 1 включительно, и рассмотрим случай
размерности n. Если форма α тождественно нулевая, то доказывать опять нечего, поэтому будем
считать, что она ненулевая. Из (12.4.201) следует, что тогда соответствующая квадратичная форма
q тоже не может быть нулевой, то есть существует какой-то вектор e1 ∈ X, для которого

α(e1 , e1 ) = q(e1 ) 6= 0

На линейной оболочке span e1 форма α невырождена, значит, по теореме 12.4.13, пространство X


раскладывается в прямую сумму span e1 и (span e1 )⊥ :

X = span e1 ⊕ (span e1 )⊥

Подпространство (span e1 )⊥ имеет размерность n − 1, и по предположению индукции, в нем должен


существовать ортогональный базис e2 , ..., en для формы α. Добавляя к нему вектор e1 , мы получим
ортогональный базис для α на X.
Построенный ортогональный базис e можно сделать нормированным, если положить
( 1
√ · ek , q(ek ) 6= 0
e′k = |q(ek )|
ek , q(ek ) = 0

– тогда мы получим
(
1
· q(ek ) ∈ {−1; +1}, q(ek ) 6= 0
q(e′k ) = |q(ek )|
0, q(ek ) = 0

то есть e′ – нормированный базис.

Теорема 12.4.16. Для симметрической билинейной формы α на конечномерном векторном про-


странстве X следующие условия эквивалентны:
(i) форма α невырождена;
(ii) для какого-нибудь (и тогда для любого) ее ортогонального базиса e = (e1 , ..., en ) все числа
α(ei , ei ) = q(ei ) ненулевые:

α(ei , ei ) = q(ei ) 6= 0, i = 1, ..., n; (12.4.211)

(iii) для какого-нибудь (и тогда для любого) базиса b = (b1 , ..., bn ) в X матрица α(b, b) разло-
жения формы α невырождена:
 
α(b1 , b1 ) . . . α(b1 , bn )
det α[b, b] = det  . . . ... . . .  6= 0 (12.4.212)
α(bn , b1 ) . . . α(bn , bn )
724 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Доказательство. (i)⇔(ii). Пусть e = (e1 , ..., en ) – какой-нибудь ортогональный базис для α. Пока-
жем, что условие (12.4.211) эквивалентно невырожденности формы α.
Предположим сначала, что α(ej , ej ) = 0 для некоторого j. Тогда для любого y ∈ X мы получаем
n
X h e ii h y ii
1
α(ej , y) = (12.4.209) = α(ei , ei ) · · = 0.
| {z } | {z e } e
i=1

=
0,
0,
при i = j
при i 6= j

То есть ej ∈ Ker α, и значит, α – вырожденная форма.


Наоборот, пусть все числа α(ei , ei ) = q(ei ) ненулевые. Для произвольного ненулевого вектора
x ∈ X выберем индекс j такой, что
h x ij
6= 0.
e
Тогда, положив y = ej , мы получим:
n
X h x ii h e ii h x ij h e ij
j j
α(x, y) = α(x, ej ) = (12.4.209) = α(ei , ei ) · · = α(ej , ej ) · · 6= 0.
i=1
e e
| {z } | {z } e e
| {z } | {z }

=
6=
6=

6=
0 1
0, 0
только если i = j

Это верно для любого x 6= 0, значит форма α невырождена.


(ii)⇔(iii). Пусть далее e = (e1 , ..., en ) – какой-нибудь ортогональный базис для α, а b = (b1 , ..., bn )
– произвольный базис пространства X. Определитель матрицы α(e, e) равен с точностью до знака
произведению чисел α(ei , ei ) = q(ei ),

det α[e, e] = ±q(e1 ) · ... · q(en ),

поэтому условие (12.4.211) эквивалентно условию

det α[e, e] 6= 0,

а оно в свою очередь эквивалентно условию


 ⊤  !  ⊤  
b b b b
det α[b, b] = (12.3.134) = det · α[e, e] · = det · det α[e, e] · det 6= 0,
e e e e
 ⊤    
– здесь det eb = (12.3.154) = det eb 6= 0, поскольку матрица eb перехода от одного базиса к
другому всегда невырождена (см., например, (12.3.121)).
Теорема 12.4.17. Если e = (e1 , ..., en ) – ортогональный базис для невырожденной симметриче-
ской билинейной формы α, то справедливы тождества:
h x ii α(x, ei )
= , i = 1, ..., n; (12.4.213)
e α(ei , ei )
X n
α(x, ei )
x= · ei , x ∈ X; (12.4.214)
i=1
α(ei , ei )
n
X α(x, ei ) · α(y, ei )
α(x, y) = , x, y ∈ X. (12.4.215)
i=1
α(ei , ei )

Доказательство. Для произвольного вектора x ∈ X получаем цепочку


n h ii
X n h ii
X h x ij
x x
x = (12.2.68) = · ei =⇒ α(x, ej ) = · α(ei , ej ) = · α(ej , ej ) =⇒
i=1
e i=1
e | {z } e
6=

0,
только если i = j
h x ij α(x, ej )
=⇒ = .
e α(ej , ej )
§ 4. Симметрические формы и однородные многочлены 725

Это доказывает (12.4.213), затем подстановкой получается (12.4.214)


n h ii
X Xn
x α(x, ei )
x = (12.2.68) = · ei = · ei
i=1
e i=1
α(ei , ei )

и (12.4.215):
n
X h x ii h y ii X n
α(x, ei ) · α(y, ei )
α(x, y) = (12.4.209) = α(ei , ei ) · · =
i=1
e e i=1
α(ei , ei )

Ортогонализация Грама-Шмидта.
Теорема 12.4.18 (Грам, Шмидт). Пусть α – симметрическая билинейная форма на векторном
пространстве X и пусть b = (b1 , ..., bn ) – базис в X, для которого все угловые миноры матрицы
α(b, b) отличны от нуля:
 
α(b1 , b1 ) . . . α(b1 , bk )
∀k = 1, ..., n det  . . . ... . . .  6= 0 (12.4.216)
α(bk , b1 ) . . . α(bk , bk )

Тогда найдется (единственный) ортогональный для α базис e = (e1 , ..., en ) в X такой, что всякий
вектор ek выражается через векторы b1 , ..., bk , причем коэффициент при bk равен 1:
k−1
X
ek = λik · bi + bk (12.4.217)
i=1

Как следствие,
 
(i) матрица eb перехода от базиса b к базису e является нижнетреугольной с единицами
на диагонали,  
1 0 0 ... 0
hei  λ
 1
1
1 1 0 ... 0  
=  λ2 λ2
2
1 ... 0  
b . . . . . . . . . . . . . . .
λ1n λ2n λ3n . . . 1
(ii) для всякого k = 1, ..., n выполняется равенство определителей:
 
α(b1 , b1 ) α(b1 , b2 ) . . . α(b1 , bk )
α(b2 , b1 ) α(b2 , b2 ) . . . α(b2 , bk )
det 
 ...
=
... ... ... 
α(bk , b1 ) α(bk , b2 ) . . . α(bk , bk )
 
α(e1 , e1 ) 0 ... 0
 0 α(e2 , e2 ) . . . 0 
= det  ...
 = q(e1 ) · ... · q(ek ) (12.4.218)
... ... ... 
0 0 . . . α(ek , ek )

Этот базис e = (e1 , ..., en ) можно определить индуктивными соотношениями


k−1
X α(bk , ei )
e1 = b1 , ek = bk − · ei . (12.4.219)
i=1
q(ei )

! 12.4.9. Условие (12.4.216) в теореме 12.4.18 мечании 12.4.8). Пусть X = R2 и


нельзя заменить более простым условием невы-
α(x, y) = x1 · y 1 − x2 · y 2 .
рожденности формы α. В этом нас убеждает сле-
дующий пример (рассматривавшийся выше в за- На с.720 мы показали, что форма α невырожде-
на. На базисе b1 = (1; 1), b2 = (1; −1) ее матрица
726 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

имеет вид Определитель этой матрицы отличен от нуля, но


    первый угловой минор нулевой.
α(b1 , b1 ) α(b1 , bk ) 0 2
α[b, b] = =
α(bk , b1 ) α(bk , bk ) 2 0

Доказательство. Покажем сначала, что из формулы (13.1.25) следуют условия (i) и (ii). Первое
из них – просто переформулировка (13.1.25). Второе же следует из равенства (12.3.134). Посколь-
ку, помимо прочего из (13.1.25) следует, что при любом k = 1, ..., n линейные оболочки векторов
(e1 , ..., ek ) и (b1 , ..., bk ) совпадают, (e1 , ..., ek ) и (b1 , ..., bk ) можно рассматривать как два базиса в
подпространстве span(e1 , ..., ek ) = span(b1 , ..., bk ) ⊆ X, поэтому для них можно записать равенство
(12.3.134):
 ⊥  
(e1 , ..., ek ) (e1 , ..., ek )
α((e1 , ..., ek ), (e1 , ..., ek )) = ·α((b1 , ..., bk ), (b1 , ..., bk )) ·
| {z } (b1 , ..., bk ) (b1 , ..., bk )
диагональная матрица | {z } | {z }
с элементами q(e1 ), ..., q(ek ) треугольная матрица треугольная матрица
на диагонали с единицами на диагонали с единицами на диагонали

Отсюда
 ⊥  
(e1 , ..., ek ) (e1 , ..., ek )
det α((e1 , ..., ek ), (e1 , ..., ek )) = det · det α((b1 , ..., bk ), (b1 , ..., bk )) · det
| {z } (b1 , ..., bk ) (b1 , ..., bk )
k | {z } | {z }
q(e1 ) · ... · q(en ) k k
1 1

(определитель треугольной матрицы с единицами на диагонали всегда равен 1).


Остается проверить, что такой базис e = (e1 , ..., en ) действительно существует и его можно
определить индуктивными соотношениями (12.4.219). Поскольку в формулах (12.4.219) приходит-
ся делить на число q(ei ) (и значит, нужно доказывать, что эти числа автоматически получаются
ненулевыми), мы не можем сразу объявить формулы (12.4.219) определением базиса e = (e1 , ..., en ),
и приходится проводить индукцию по размерности n пространства X.
При n = 1 формулы (12.4.219) тривиально определяют базис e (из одного элемента), удовлетво-
ряющий условию (13.1.25):
e1 = b1
Предположим далее, что для всех пространств размерности n − 1 формулы (12.4.219) определя-
ют ортогональный базис со свойством (13.1.25). Тогда, в частности, для подпространства Y =
span{b1 , ..., bn−1 } нашего исходного пространства X они тоже определяют ортогональный базис
(e1 , ..., en−1 ) в Y со свойством (13.1.25). Поскольку, как мы уже доказали, из (13.1.25) следует
(12.4.218), все числа q(ei ) должны быть ненулевыми:
(12.4.216)  
↓ α(b1 , b1 ) ... α(b1 , bn−1 )
0 6= det  ... ... ...  = q(e1 ) · ... · q(en−1 )
α(bn−1 , b1 ) . . . α(bn−1 , bn−1 )


∀i = 1, ..., k q(ei ) 6= 0
Теперь уже вектор en ∈ X можно определить формулой (12.4.219):
n−1
X α(bn , ei )
en = bn − · ei
i=1
q(ei )

Поскольку en ∈ X \ Y , система (e1 , ..., en−1 , en ) будет базисом в X. Этот базис будет ортогональным,
потому что en ортогонален всем остальным векторам e1 , ..., en−1 : для любого k = 1, ..., n − 1 имеем

при i 6= k
0
! k
α(bn , ei ) z }| {
n−1
X n−1
X
α(bn , ei )
α(en , ek ) = α bn − · ei , ek = α(bn , ek ) − · α(ei , ek ) =
i=1
q(ei ) i=1
q(ei )
§ 4. Симметрические формы и однородные многочлены 727

α(bn , ek )
= α(bn , ek ) − · α(ek , ek ) = 0
q(ek ) | {z }
k
q(ek )

Знакоопределенные квадратичные формы и критерий Сильвестра.


• Квадратичная форма q называется
– неотрицательной , если она неотрицательна при любых значениях аргумента:

q(x) > 0 ∀x ∈ Rn

– неположительная , если она неположительна при любых значениях аргумента:

q(x) 6 0 ∀x ∈ Rn

– положительной (или положительно определенной) , если она положительна


при любых ненулевых значениях аргумента:

q(x) > 0 ∀x 6= 0

– отрицательной (или отрицательно определенной) , если она отрицательна при


любых ненулевых значениях аргумента,

q(x) < 0 ∀x 6= 0

– знакоопределенной, если q(x) либо положительная, либо отрицательная;


– формой неопределенного знака, если q(x) не является ни положительной, ни
отрицательной.

⋄ 12.4.10. Квадратичная форма на R2 будет отрицательно определенной квадратичной


формой. А формы
p(x, y) = x2 + y 2
q(x, y) = x2 − y 2 ,
является, очевидно, положительно определен-
r(x, y) = x · y,
ной. Та же функция, но взятая с противополож-
ным знаком имеют неопределенный знак (потому что в неко-
торых точках принимают положительные значе-
−p(x, y) = −x2 − y 2 ния, а в других – отрицательные).

Теорема 12.4.19 (критерий Сильвестра). Пусть q – квадратичная форма на X и Q = (Qi,j ) – ее


матрица в каком-нибудь базисе (b1 , ..., bn )

q(bi + bj ) − q(bi ) − q(bj )


Qi,j =
2
Тогда
(i) q положительно определена тогда и только тогда, когда все главные миноры матрицы
Q положительны:

Q1,1 Q1,2 Q1,3 Q1,1 ... Q1,n


Q1,1 Q1,2
Q1,1 > 0, > 0, Q2,1 Q2,2 Q2,3 > 0, ..., ... ... ... >0
Q2,1 Q2,2
Q3,1 Q3,2 Q3,3 Qn,1 ... Qn,n
(12.4.220)
728 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

(ii) q отрицательно определена тогда и только тогда, когда знаки главных миноров мат-
рицы Q чередуются начиная с минуса:

Q1,1 Q1,2 Q1,3 Q1,1 ... Q1,n


Q1,1 Q1,2
Q1,1 < 0, > 0, Q2,1 Q2,2 Q2,3 < 0, ..., (−1)n ... ... ... >0
Q2,1 Q2,2
Q3,1 Q3,2 Q3,3 Qn,1 ... Qn,n
(12.4.221)

Доказательство. Обозначим через α билинейную форму, соответствующую q. Тогда Q = α[b, b] –


матрица формы α в базисе b.
1. Докажем сначала (i). Если все главные миноры матрицы Q = α(b, b) положительны, то они
ненулевые, и значит по теореме 12.4.18 существует ортогонализация e = (e1 , ..., en ) Грама-Шмидта
базиса b = (b1 , ..., bn ). Формулы (12.4.218) и (12.4.220) при этом вместе дадут условие:
 
α(b1 , b1 ) α(b1 , b2 ) . . . α(b1 , bk )
α(b2 , b1 ) α(b2 , b2 ) . . . α(b2 , bk ) 
∀k = 1, ..., n det 
 ...
 = q(e1 ) · ... · q(ek ) > 0. (12.4.222)
... ... ... 
α(bk , b1 ) α(bk , b2 ) . . . α(bk , bk )

Отсюда следует, что все числа q(e1 ), ..., q(en ) положительны, и, по формуле (12.4.210), при любом
x 6= 0 получаем:
Xn h i 2
x i
q(x) = q(ei ) · >0
| {z } e
i=1
здесь все числа | {z }
положительны все эти числа
неотрицательны,
и хотя бы одно
из них ненулевое

Наоборот, если квадратичная форма q положительно определена на X, то на любом подпростран-


стве вида span(b1 , ..., bk ) она тоже положительно определена, и значит, невырождена. Значит, били-
нейная форма α тоже невырождена на span(b1 , ..., bk ), и по формуле (12.4.212), мы получаем

det α((b1 , ..., bk ), (b1 , ..., bk )) 6= 0

То есть, главные миноры матрицы Q = α(b, b) ненулевые, и снова можно применить ортогонализа-
цию Грама-Шмидта. В новом ортогональном базисе e = (e1 , ..., en ) квадратичная форма q примет
вид (12.4.210),
Xn h i 2
x i
q(x) = q(ei ) · ,
i=1
e

и, поскольку она положительно определена, все числа q(ei ) должны быть положительны. Из этого
следуют неравенства (12.4.222), и вместе с ними, неравенства (12.4.220).
2. Теперь (ii) становится следствием (i). Отрицательная определенность формы q эквивалентна
положительной определенности формы −q, и в силу (i), это эквивалентно тому, что главные миноры
матрицы −α(b, b) положительны:
 
∀k = 1, ..., n det − α (b1 , ..., bk ), (b1 , ..., bk ) > 0
| {z }
k 
(−1)k · det α (b1 , ..., bk ), (b1 , ..., bk )

Но это как раз условие чередования знаков (12.4.221).

§5 Кососимметрические (внешние) формы и поливекторы


(a) Внешние формы Λm (X)
Теорема 12.5.1. Для полилинейной формы ω : X m → R следующие условия эквивалентны:
(i) при любой перестановке аргументов знак формы меняется на знак этой перестановки:

ω(xσ(1) , ..., xσ(m) ) = sgn(σ) · ω(x1 , ..., xm ), σ ∈ Sm , x1 , ..., xm ∈ X. (12.5.223)


§ 5. Кососимметрические (внешние) формы и поливекторы 729

(ii) при любой транспозиции аргументов знак формы меняется на противоположный:

ω(x1 , ..., xi , ..., xj , ..., xm ) = −ω(x1 , ..., xj , ..., xi , ..., xm ), x1 , ..., xm ∈ X. (12.5.224)

(iii) при любой транспозиции соседних аргументов знак формы меняется на противополож-
ный:

ω(x1 , ..., xi , xi+1 , ..., xm ) = −ω(x1 , ..., xi+1 , xi , ..., xm ), x1 , ..., xm ∈ X. (12.5.225)

(iv) форма ω обнуляется на последовательностях, в которых какие-то два аргумента по-


вторяются:

∃i 6= j xi = xj =⇒ ω(x1 , ..., xi , ..., xj , ..., xm ) = 0 (12.5.226)

(v) форма ω обнуляется на последовательностях, в которых какие-то два соседних аргу-


мента повторяются:

∃i xi = xi+1 =⇒ ω(x1 , ..., xm ) = 0 (12.5.227)

• Полилинейная форма ω на векторном пространстве X

... × X} → R
| × {z
ω: X
m множителей

называется кососимметрической, или внешней формой степени m, если она удовлетво-


ряет условиям (i)-(iv) теоремы 12.5.1. Множество всех внешних форм степени m на X
обозначается Λm (X). Ясно, что это будет векторное пространство относительно поточеч-
ных алгебраических операций.
Доказательство. 1. (i)⇔(ii). Импликация (i)⇒(ii) очевидна, а обратная импликация (i)⇐(ii) сле-
дует из теоремы 12.1.12 (о разложении любой перестановки в комбинацию транспозиций).
2. (ii)⇔(iii). Импликация (ii)⇒(iii) очевидна, а обратная импликация (ii)⇐(iii) следует из теоре-
мы 12.1.13 (о разлодении любой транспозиции в композицию транспозиций соседних элементов).
3. (ii)⇔(iv). Докажем сначала (ii)⇒(iv). Пусть выполнено (ii). Рассмотрим последовательность
аргументов x1 , ..., xm , в которой xi = xj для некоторых i 6= j. Тогда

ω(x1 , ..., xi , ..., xi , ..., xm ) = ω(x1 , ..., xi , ..., xj , ..., xm ) =


= −ω(x1 , ..., xj , ..., xi , ..., xm ) = −ω(x1 , ..., xi , ..., xi , ..., xm ).

(во втором равенстве мы применяем транспозицию, меняющую местами аргументы с номерами i и


j). Это возможно только если ω(x1 , ..., xi , ..., xi , ..., xm ) = 0.
Обратная импликация (iv)⇒(ii) доказывается так. Пусть выполнено (iv). В последовательно-
сти аргументов x1 , ..., xm зафиксируем все векторы, кроме xi и xj , и рассмотрим вспомогательную
форму
ψ(xi , xj ) = ω(x1 , ..., xi , ..., xj , ..., xm ).
Это будет билинейная форма, причем из (12.5.227) будет следовать тождество

ψ(y, y) = 0, y ∈ X.

Из него будет следовать такая цепочка:

0 = ψ(xi + xj , xi + xj ) = ψ(xi , xi ) +ψ(xj , xi ) + ψ(xi , xj ) + ψ(xj , xj ) =


| {z } | {z }
k k
0 0

= ψ(xj , xi ) + ψ(xi , xj )


ψ(xi , xj ) = −ψ(xj , xi ).

ω(x1 , ..., xi , ..., xj , ..., xm ) = −ω(x1 , ..., xj , ..., xi , ..., xm ).
4. Точно так же доказывается эквивалентность (iii)⇔(v).
730 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Конкатенация функционалов. Рабочим примером внешней формы является следующая кон-


струкция.
• Пусть η 1 , ..., η m – последовательность линейных функционалов на вектороном простран-
стве X. Их конкатенацией называется полилинейная форма η 1 ∧ ... ∧ η m : X m → R,
определенная формулой
 1 
η (x1 ) . . . η 1 (xm )
(η 1 ∧ · · · ∧ η m )(x1 , . . . , xm ) = det  . . . ... ... , ηi ∈ X ∗. (12.5.228)
m m
η (x1 ) . . . η (xm )

В этой форме транспозиция аргументов соответствует транспозиции столбцов матрицы,


и при такой операции определитель, а вместе с ним и форма, меняют знак. Поэтому такая
форма является внешей формой степени m на X:

η 1 ∧ · · · ∧ η m ∈ Λm (X).

Свойства конкатенации функционалов:


1◦ . При перестановке элементов последовательности η 1 , ..., η m знак конкатенации меняется на
знак перестановки:

η σ(1) ∧ ... ∧ η σ(m) = sgn(σ) · η 1 ∧ ... ∧ η m , σ ∈ Sm . (12.5.229)

2◦ . Если в последовательности η 1 , ..., η m какой-то элемент η i встречается дважды, то конкате-


нация этих функционалов равна нулю:

η 1 ∧ ... ∧ η i ∧ ... ∧ η i ∧ ... ∧ η m = 0. (12.5.230)

3◦ . При умножении какого-нибудь функционала η i на скаляр λ конактенация умножается на ска-


ляр:
η 1 ∧ ... ∧ λ · η i ∧ ... ∧ η m = λ · η 1 ∧ ... ∧ η i ∧ ... ∧ η m . (12.5.231)
4◦ . При замене какого-нибудь функционала η i на сумму функционалов α + β конактенация заме-
няется на сумму конкатенаций с подставленными α и β вместо η i :

η 1 ∧ ... ∧ (α + β) ∧ ... ∧ η m = η 1 ∧ ... ∧ α ∧ ... ∧ η m + η 1 ∧ ... ∧ β ∧ ... ∧ η m (12.5.232)

5◦ . Конкатенация η 1 ∧ · · · ∧ η m тогда и только тогда не равна нулю, когда функционалы η 1 , . . . , η m


линейно независимы.

6 . Если n = dim X и η 1 , . . . , η n – линейно независимая последовательность функционалов на X,
то конкатенация η 1 ∧ · · · ∧ η n обращается в нуль только на линейно зависимых последователь-
ностях векторов x1 , . . . , xn .

Доказательство. 1. Первое утверждение следует их свойства кососимметричности определителя


(12.3.141) (при перестановек строк определитель меняет знак).
2. Если в последовательности η 1 , ..., η m имеется два одинаковых элемента η i = η j , то при их
перестановке форма η 1 ∧ ... ∧ η m , понятное дело, не может измениться. Но с другой стороны, по
доказанному свойству (12.5.229) она должна поменять знак:

η 1 ∧ ... ∧ η i ∧ ... ∧ η i ∧ η m = −η 1 ∧ ... ∧ η i ∧ ... ∧ η i ∧ η m .

Такое возможно только если она нулевая:

η 1 ∧ ... ∧ η i ∧ ... ∧ η i ∧ η m = 0

3 и 4. Утверждения 3◦ и 4◦ следуют из соответствующего свойства определителя (12.3.141).


5. Если функционалы η 1 , . . . , η m линейно независимы, то их можно дополнить до базиса η 1 , . . . , η m , ..., η n
в пространстве X. Тогда можно взять сопряженный базис в X,
 
1
xi = ,
η i
§ 5. Кососимметрические (внешние) формы и поливекторы 731

для которого (
1, i = j
η j (xi ) = ,
6 j
0, i =
и поэтому
   
η 1 (x1 ) . . . η 1 (xm ) 1 ... 0
(η ∧ · · · ∧ η )(x1 , . . . , xm ) = det  . . .
1 m
... . . .  = det . . . . . . . . . = 1.
η m (x1 ) . . . η m (xm ) 0 ... 1

Наоборот, пусть функционалы η 1 , . . . , η m линейно зависимы, то есть какой-то из них выражается


как линейная комбинация остальных: X
ηj = λi · η i .
i6=j

Тогда
 
X
η 1 ∧ · · · ∧ η m = η 1 ∧ ... ∧ η j ∧ ... ∧ η m = η 1 ∧ ... ∧  λi · η i  ∧ ... ∧ η m =
i6=j
X
= λi · η 1 ∧ ... ∧ η i ∧ ... ∧ η m = (12.5.230) = 0.
| {z }
i6=j
здесь элемент η i
встречается дважды

6. Пусть m = n = dim X, η 1 , ..., η n – линейно независимая система функционалов на X, и


x1 , ..., xn ∈ X. Тогда равенство нулю формы η 1 ∧ ... ∧ η n на последовательности векторов x1 , ..., xn ,
 1 
η (x1 ) . . . η 1 (xn )
(η 1 ∧ · · · ∧ η n )(x1 , . . . , xn ) = det  . . . ... ...  = 0
η n (x1 ) . . . η n (xn )

по правилу Крамера (теорема 12.3.16) эквивалентно линейной зависимости столбцов матрицы в


определителе  1   1 
η (x1 ) η (xn )
λ1 ·  . . .  + · · · + λn ·  . . .  = 0
η n (x1 ) η n (xn )
(для некоторой последовательности коэффициентов λi , из которых не все равны нулю). Это в свобю
очередь эквивалентно системе

 1 1
λ1 · η (x1 ) + ... + λn · η (xn ) = 0
...


λ1 · η n (x1 ) + ... + λn · η n (xn ) = 0
и системе   

 η 1
λ1 · x1 + ... + λn · xn =0

. . . 


η n λ · x + ... + λ · x = 0
1 1 n n

Здесь в скобках стоит один и тот же вектор, а функционалы η 1 , ..., η n образуют базис в X ∗ . Отсюда
следует, что вектор в их аргументах равен нулю

λ1 · x1 + ... + λn · xn = 0

То есть векторы x1 , ..., xn линейно зависимы.

Альтернация. Для всякой полилинейной формы ω : X n → R ее альтернацией называется поли-


линейная форма
1 X
Alt ω(x1 , ..., xm ) = · sgn(σ) · ω(xσ(1) , ..., xσ(m) ) (12.5.233)
m!
σ∈Sm
732 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Отображение, которое каждой форме ω ставит в соответствие ее альтернацию

ω 7→ Alt ω

называется альтернированием.
Свойства альтернирования:
1◦ Линейность:
Alt(λ · ω + µ · π) = λ · Alt ω + µ · Alt π, ω ∈ Lm (X),

2 Сохранение знака перестановки:

Alt ω(xσ(1) , ..., xσ(m) ) = sgn(σ) · Alt ω(x1 , ..., xm ), ω ∈ Lm (X), σ ∈ Sm , x1 , ..., xm ∈ X.
(12.5.234)
3◦ Всякую полилинейную форму операция альтернирования превращает во внешнюю,

∀ω ∈ Lm (X) Alt ω ∈ Λm (X), (12.5.235)

и при этом всякую внешнюю форму она не меняет:

∀ω ∈ Λm (X) Alt ω = ω. (12.5.236)

4◦ Идемпотентность: при вторичном применении альтернирование не меняет результат

Alt(Alt ω) = Alt ω, ω ∈ Lm (X). (12.5.237)

Доказательство. 1. Линейность очевидна.


2. Для всякой полилинейной формы ω и любой перестановки σ ∈ Sm мы получим:

1 X σ◦π =τ
Alt ω(xσ(1) , ..., xσ(m) ) = sgn(π) · ω(xπ(σ(1)) , ..., xπ(σ(m)) ) = =
m! π = σ −1 ◦ τ
π∈Sm
1 X
= sgn(σ −1 ◦ τ ) · ω(xτ (1) , ..., xτ (m) ) = (12.1.29), (12.1.30) =
m!
τ ∈Sm
sgn(σ) X
= sgn(τ ) · ω(xτ (1) , ..., xτ (m) ) = sgn(σ) · Alt ω(x1 , ..., xm ).
m!
τ ∈Sm

3. Если ω ∈ Lm (X), то равенство (12.5.234) означает, что форма Alt ω является внешней. Если
же ω ∈ Λm (X), то

1 X
Alt ω(x1 , ..., xm ) = sgn(π) · ω(xπ(1) , ..., xπ(m) ) =
m!
π∈Sm
1 X 1 X
= sgn(π) · sgn(π) ·ω(x1 , ..., xm ) = ω(x1 , ..., xm ) = ω(x1 , ..., xm ).
m! | {z } m!
π∈Sm π∈Sm
k
1

4. Тождество (12.5.237) следует из (12.5.235) и (12.5.236):


(12.5.235) (12.5.236)
ω ∈ Lm (X) =⇒ Alt ω ∈ Λm (X) =⇒ Alt(Alt ω) = Alt ω.

⋄ 12.5.1. Если η 1 , . . . , η m – произвольная после- является форма m! 1


· η1 ∧ · · · ∧ ηm :
довательность длины m линейных функциона-
лов на X, то альтернацией формы η 1 ⊠ · · · ⊠ η m 1
Alt(η 1 ⊠ · · · ⊠ η m ) = · η 1 ∧ · · · ∧ η m (12.5.238)
m!
Доказательство.
§ 5. Кососимметрические (внешние) формы и поливекторы 733

Alt(η 1 ⊠ ... ⊠ η m )(x1 , ..., xm ) = = (12.3.137) =


 1 
1 X η (x1 ) . . . η 1 (xm )
= · sgn(σ) · η 1 ⊠ ... ⊠ η m(xσ(1) , ..., xσ(m) ) = 1
m! = · det  . . . ... ...  =
σ∈Sm m!
η m (x1 ) . . . η m (xm )
= (12.2.99) =
X 1
1 = (12.5.228) = · (η 1 ∧ · · · ∧ η m )(x1 , . . . , xm )
= · sgn(σ) · η 1 (xσ(1) ) · ... · η m (xσ(m) ) = m!
m!
σ∈Sm

Базис в пространстве внешних форм Λm (X). Напомним, что на с.667 мы определили отоб-
ражение τX : {1, ..., n} → X нумерации элементов линейно упорядоченного конечного множества.
• Пусть X – векторное пространство, и пусть x = (x1 , ..., xn ) – строка длины n ∈ N из
элементов X. Каждому подмножеству M ⊆ {1, ..., n} поставим в соответствие числовую
строку, называемую ограничением строки x = (x1 , ..., xn ) на множество M ,

xM = (xτM (1) , ..., xτM (m) ), (12.5.239)

где m – число элементов в M , а τM : {1, ..., m} → M возрастаяющая нумерация элементов


M . Если теперь ϕ ∈ Λm (X) – внешняя форма степени m на X, то для заданной строки
x = (x1 , ..., xn ) (длина которой n необязательно совпадает с m, и может быть больше) и
для всякого подмножества M ⊆ {1, ..., n} мощности m можно найти значение формы ϕ на
строке xM :
ϕ(xM ) = ϕ(xτM (1) , ..., xτM (m) ), (12.5.240)
• Пусть X – векторное пространство и пусть η 1 , ..., η n – некая фиксированная последова-
тельность линейных функционалов на X. Каждому подмножеству M ⊆ {1, ..., n} поставим
в соответствие внешнюю форму на X

η M = η τM (1) ∧ ... ∧ η τM (m) (12.5.241)

где m – число элементов в M , а τM : {1, ..., m} → M возрастающая нумерация элементов


M (определенная на с.667). Очевидно,

η M ∈ Λm (X).

• Если A : X → Y – линейный оператор, то символ Am пусть обозначает оператор

Am : X m → Y m , Am (x1 , ..., xm ) = (Ax1 , ..., Axm ), xi ∈ X

и для него мы будем использовать обозначение

Am (xM ) = (Ax)M , M ⊆ {1, ..., m}. (12.5.242)


    
1 n
Лемма 12.5.2. Пусть a = (a1 , ..., an ) – базис в X, и 1
a = a1 , ..., a1 – сопряженный ему базис

в X . Тогда для любых двух подмножеств M ⊆ {1, ..., n} и L ⊆ {1, ..., n}, одинаковой мощности,

card M = m = card L,

справедливо равенство (
 M
1 1, L=M
(aL ) = . (12.5.243)
a 0, L 6= M
Доказательство. Прежде всего,
 M  τM (1)  τM (m)
1 1 1
(aL ) = ∧ ... ∧ (aτL (1) , ..., aτL (m) ) = (12.5.228) =
a a a
  τ (1)  1 τM (1) 
1 M
(a τ (1) ) . . . (a τ (m) )
 a L a L

= det  ... ... ... .
 1 τM (m)  1 τM (m)
a (a τL (1) ) . . . a (a τL (m) )
734 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Теперь предположим, что L = M . Тогда последовательности τM и τL совпадают

τM (s) = τL (s), s = 1, ..., m,

и, по определению сопряженного базиса,


 τM (i)  τM (i) (
1 1 0, i 6= j
(aτM (j) ) = (aτM (j) ) = ,
a a 1, i = j

Поэтому матрица под знаком определителя становится единичной:


  τ (1)  1 τM (1)   
1 M
a (aτM (1) ) . . . a (aτM (m) ) 1 ... 0
 
det  ... ... ...  = det . . . . . . . . . = 1
 1 τM (m)  1 τM (m)
(aτM (1) ) . . . (aτM (m) ) 0 ... 1
a a

Наоборот, если L 6= M , то найдется какой-то элемент τM (i) ∈ M , которого нет среди элементов
τL (1), ..., τL (m) ∈ L. Это означает, что в матрице под определителем целая строка с индексом τM (i)
должна быть нулевой, и значит определитель тоже будет нулевым.
Теорема 12.5.3 (о базисе в Λm (X)). Пусть η 1 , ..., η n – базис в сопряженном пространстве X ∗ .
Тогда для всякого числа m 6 n внешние формы (12.5.241)

η M = η τM (1) ∧ η τM (2) ∧ ... ∧ η τM (m) (12.5.244)

где M пробегает всевозможные подмножества в {1, ..., n} мощности m, образуют базис в про-
 1  n
странстве Λm (X). В частном случае когда η 1 = a1 , ..., η n = a1 – сопряженный базис к неко-
торому базису a = (a1 , ..., an ) в X, разложение всякой внешней формы по базису (12.5.244) имеет
вид13  M
X 1
ω= ω(aM ) · (12.5.245)
a
M ⊆ {1, ..., n} :
card M = m

(суммирование ведется по всевозможным подмножествам M ⊆ {1, ..., n} мощности m).


Доказательство. 1. Докажем сначала линейную независимость. Пусть для некоторых λM выпол-
няется равенство
X X
0= λM · η M = λM · η τM (1) ∧ ... ∧ η τM (m) = (12.5.238) =
M⊆{1,...,n} M⊆{1,...,n}
X X X  
= λM ·m!·Alt(η τM (1) ⊠...⊠η τM (m) ) = λM · sgn(ρ)·η τM ρ(1)
⊠...⊠η τM ρ(m)
=
M⊆{1,...,n} M⊆{1,...,n} ρ∈Sm
X X  
= sgn(ρ) · λM · η τM ρ(1)
⊠ ... ⊠ η τM ρ(m)
(12.5.246)
M⊆{1,...,n} ρ∈Sm

Заметим, что при любом выборе множеств M ⊆ {1, ..., n} и L ⊆ {1, ..., n} и перестановок ρ, π ∈ Sm
равенство  
η τM ρ(1) ⊠ ... ⊠ η τM ρ(m) = η τL (π(1)) ⊠ ... ⊠ η τL (π(m)) (12.5.247)
может выполняться только если M = L и ρ = π.
Действительно, если M 6= L, то найдется какой-то индекс τM (s) ∈ M , которого нет среди индек-
сов τL (1), ..., τL (m) ∈ L. Это уже означает, что равенство (12.5.247) не может выполняться. Если же
M = L, то (12.5.247) эквивалентно равенству
 
η τM ρ(1) ⊠ ... ⊠ η τM ρ(m) = η τM (π(1)) ⊠ ... ⊠ η τM (π(m))

а это эквивалентно системе

τM (ρ(s)) = τM (π(s)), 1 6 s 6 m.
13 В
 1 M
формуле (12.5.245) обозначение aM описано в (12.5.239), а a
– в (12.5.241).
§ 5. Кососимметрические (внешние) формы и поливекторы 735

то есть, поскольку отображение τM инъективно, системе

ρ(s) = π(s), 1 6 s 6 m.

τM ρ(1)
Итак, мы поняли, что в последнем выражении в цепочке (12.5.246) элементы η ⊠ ... ⊠
τM ρ(m)
η строго различны при различных вариантах значений τM (1), ..., τM (m) и ρ. Поскольку в
силу замечания 12.2.10 формы вида η p1 ⊠ ... ⊠ η pm (ps ∈ {1, ..., n}) образуют базис в L(X, ..., X), и
значит, линейно независимы, числовые коэффициенты в (12.5.246) должны быть нулевыми:

sgn(ρ) · λM = 0, M ⊆ {1, ..., n}, ρ ∈ Sm .

То есть
λM = 0, M ⊆ {1, ..., n}, ρ ∈ Sm .
2. Теперь докажем полноту. Если ω – какая-нибудь внешняя форма, то, поскольку в силу заме-
чания 12.2.10 формы вида η i1 ⊠ ... ⊠ η im (is ∈ {1, ..., n}) образуют базис в L(X, ..., X), ω представима
как их линейная комбинация:
X
ω= λi1 ,...,im · η i1 ⊠ ... ⊠ η im
is ∈{1,...,n}

Под действием альтернирования это равенство превращается в цепочку


X
ω = (12.5.236) = Alt ω = λi1 ,...,im · Alt(η i1 ⊠ ... ⊠ η im ) =
is ∈{1,...,n}
X 1
= (12.5.238) = λi1 ,...,im · · η i1 ∧ ... ∧ η im
m!
is ∈{1,...,n}

То есть ω представима как линейная комбинация форм η i1 ∧ ... ∧ η im . При этом если в последова-
тельности i1 , ..., im какие-то индексы повторяются, то, в силу (12.5.230), форма η i1 ∧ ... ∧ η im автома-
тически обнуляется. Значит, можно считать, что ω есть линейная комбинация форм η i1 ∧ ... ∧ η im с
неповторяющимися индексами. Если кроме того переставить эти индексы так, чтобы они возраста-
ли, то при такой перестановке перед каждым выражением η i1 ∧...∧η im просто добавится скалярный
множитель в виде знака перестановки. И мы можем сделать вывод, что ω есть линейная комбинация
форм η i1 ∧ ... ∧ η im со строго возрастающими индексами.
3. Мы убедились, что формы (12.5.244) образуют базис в Λm (X). Остается доказать формулу
 M
(12.5.245). Пусть a = (a1 , ..., an ) – базис в X. Разложим произвольную форму ω по базису a1 :
X  M
1
ω= λM · .
a
M ⊆ {1, ..., n} :
card M = m

Рассмотрим произвольное множество L ⊆ {1, ..., n} мощности m и подставим в качестве аргумента


строчку aL :
X  M
1
ω(aL ) = λM · (aL ) = λL .
a
M ⊆ {1, ..., n} : | {z }
card M = m k (12.5.243)
(
1, M =L
,
0, M 6= L

Теорема 12.5.4. Если n – размерность пространства X, то размерность пространства Λm (X)


равна Cnm :
dim Λm (X) = Cnm (12.5.248)
Доказательство. Пусть η 1 , ..., η n – базис в сопряженном пространстве X ∗ . По теореме 12.5.3 формы
η M , M ⊆ {1, ..., n}, card M = m, образуют базис в пространстве Λm (X). Таких форм ровно столько
сколько подмножеств M ⊆ {1, ..., n} мощности card M = m. А число таких подмножеств по теореме
12.1.5 равно Cnm .
736 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Внешние формы максимальной степени. поэтому форма η 1 ∧ · · · ∧ η n (поскольку она нену-


Пусть η 1 , ..., η n – последовательность линейно левая) представляет собой базис в Λn (X). Это
независимых функционалов на векторном про- значит, что любая другая форма ω ∈ Λn (X) име-
странстве X размерности n (то есть базис сопря- ет вид
женного пространства X ∗ ). Их конкатенация
ω = λ · η1 ∧ · · · ∧ ηn ,
(η 1 ∧ · · · ∧ η n )(x1 , . . . , xn ) =
 1  где λ – некоторое число. Если ω 6= 0, то λ 6= 0,
η (x1 ) . . . η 1 (xn )
и в этом случае ω обращается в нуль там же где
= det  . . . ... ... .
η 1 ∧ · · · ∧ η n , то есть на линейно зависимых по-
η n (x1 ) n
. . . η (xn )
следовательностях векторов.
является внешней формой степени n на X. Это доказывает
По свойству 6◦ на с.730, эта форма обращает-
ся в нуль в точности на линейно зависимых по-
Предложение 12.5.5. Всякая ненулевая внеш-
следовательностях векторов x1 , ..., xn . С другой
няя форма ω максимальной степени n =
стороны, по теореме 12.5.4 пространство Λn (X)
dim X на векторном пространстве X обраща-
внешних форм степени n на X одномерно:
ется в нуль в точности на последовательно-
dim Λn (X) = Cnn = 1, стях x1 , ..., xn линейно зависимых векторов.

Конкатенация внешних форм. Операцию конкатенации линейных функционалов, введенную


выше формулой (12.5.228), как оказывается, можно продолжить до более широкой операции, дей-
ствующей на всех внешних формах. Этот факт описывается в следующей теореме.
Теорема 12.5.6. Для всякого конечномерного вещественного векторного пространства X суще-
ствет единственная операция, которая любым двум внешним формам ψ ∈ Λk (X) и ω ∈ Λl (X)
ставит в соответствие внешнюю форму ψ ∧ ω ∈ Λk+l (X) так, что при этом выполняются
следующие условия.
(i) Конкатенация с формой степени 0 совпадает с умножением на константу:
λ ∧ ω = λ · ω, λ ∈ Λ0 (X) = R, ω ∈ Λl (X). (12.5.249)
(ii) Билинейность:
λ · (ψ ∧ ω) = (λ · ψ) ∧ ω = ψ ∧ (λ · ω), λ ∈ R, ψ ∈ Λk (X), ω ∈ Λl (X). (12.5.250)
(iii) Антикоммутативность:
ψ ∧ ω = (−1)deg ψ·deg ω ω ∧ ψ, ψ ∈ Λk (X), ω ∈ Λl (X). (12.5.251)
В частности, для линейных функционалов
η ∧ θ = −θ ∧ η, η, θ ∈ X ∗ . (12.5.252)
(iv) Ассоциативность:
(ϕ ∧ ψ) ∧ ω = ϕ ∧ (ψ ∧ ω), ϕ ∈ Λk (X), ψ ∈ Λl (X), ω ∈ Λm (X). (12.5.253)
(v) Конкатенация функционалов: На произвольной последовательности η 1 , . . . , η m линейных
функционалов на X эта операция совпадает с введенной ранее формулой (12.5.228) кон-
катенацией линейных функционалов:
 1 
η (x1 ) . . . η 1 (xm )
(η 1 ∧ · · · ∧ η m )(x1 , . . . , xm ) = det  . . . ... ... , ηi ∈ X ∗ .
m m
η (x1 ) . . . η (xm )
Эта операция называется конкатенацией внешних форм ψ ∈ Λk (X) и ω ∈ Λl (X) и определяется
формулой
X
(ψ ∧ ω)(x1 , ..., xk+l ) = sgn(τK⊳L ) · ψ(xK ) · ω(xL ), xi ∈ X (12.5.254)
k,l
(K,L)∈C{1,...,k+l}

(в которой множества K, L образуют разбиение типа (k, l) множества {1, ..., k + l}, и суммиро-
вание ведется по всем таким разбиениям).
§ 5. Кососимметрические (внешние) формы и поливекторы 737

Доказательство. 1. Сначала убедимся, что полилинейная форма ψ ∧ ω, определенная формулой


(12.5.254), действительно является внешней формой: ψ ∧ ω ∈ Λk+l (X). Здесь нужно проверить, что
она кососимметрична. Для этого мы воспользуемся теоремой 12.5.1(v). Пусть в последовательности
x1 , ...xk+l два элемента с соседними индексами одинаковы:

∃i xi = xi+1 .

Зафиксируем этот i и после этого разделим слагаемые в правой части (12.5.254) на три группы:
1) в первую группу пусть входят слагаемые, соответствующие разбиениям {1, ..., k + l} =
K ⊔ L, в которых оба индекса i и i + 1 лежат в K,
2) во вторую группу пусть входят слагаемые,соответствующие разбиениям {1, ..., k + l} =
K ⊔ L, в которых оба индекса i и i + 1 лежат в L,
3) в третью группу пусть входят остальные слагаемые, то есть те, которые соответствуют
разбиениям {1, ..., k + l} = K ⊔ L, в которых K содержит ровно один из индексов i и i + 1.
Тогда
X
(ψ ∧ ω)(x1 , ..., xk , xk+1 , ..., xk+l ) = sgn(τK⊳L ) · ψ(xK ) · ω(xL )+
{i,i+1}⊆K
X X
+ sgn(τK⊳L ) · ψ(xK ) · ω(xL ) + sgn(τK⊳L ) · ψ(xK ) · ω(xL ).
{i,i+1}⊆L (i∈K & i+1∈L) ∨ (i+1∈K & i∈L)
(12.5.255)

Заметим теперь, что в первой сумме в каждом слагаемом (то есть при любом выборе рабине-
ния (K, L)) у формы ψ среди аргументов xK = (xj ), j ∈ K, имеются два одинаковых с разными
индексами: xi = xi+1 . Поэтому здесь ψ(xK ) = 0, и вообще вся первая сумма равна нулю:
X
sgn(τK⊳L ) · ψ(xK ) · ω(xL ) = 0.
{i,i+1}⊆K

Точно так же, во второй сумме в (12.5.255) в каждом слагаемом (то есть при любом выборе
рабинения (K, L)) у формы ω среди аргументов xL = (xj ), j ∈ L, имеются два одинаковых с
разными индексами: xi = xi+1 . Поэтому здесь ω(xK ) = 0, и вообще вся вторая сумма равна нулю:
X
sgn(τK⊳L ) · ψ(xK ) · ω(xL ) = 0.
{i,i+1}⊆L

Наконец, чтобы понять, что происходит в третьей сумме в (12.5.255), рассмотрим транспози-
цию14 , меняющую местами i и i + 1:


s, s∈/ {i, i + 1}
τ (s) = (i i + 1)(s) = i + 1, s = i .


i, s=i+1

Пусть в разбиении (K, L) множества K и L содержат по одному из чисел i и i + 1. Положим


K ′ = τ (K) и L′ = τ (L). Тогда из равенства (12.1.38)

K ′ ⊳ L′ = τ ◦ (K ⊳ L).

мы получим следствие

sgn(τK ′ ⊳L′ ) = sgn(τ ◦ (K ⊳ L)) = sgn(τ ) · sgn(τK⊳L ) = − sgn(τK⊳L ). (12.5.256)

С другой стороны, поскольку (K ′ , L′ ) получено из (K, L) перестановкой индексов i и i+1, у которых


значения аргументов постоянны, xi = xi+1 , мы получаем, что

ψ(xK ′ ) = ψ(xK ), ω(xL′ ) = ω(xL ).

Вместе с (12.5.256) это дает

sgn(τK ′ ⊳L′ ) · ψ(xK ′ ) · ω(xL′ ) = − sgn(τK⊳L ) · ψ(xK ) · ω(xL ).


14 Понятие транспозиции было определено на с.663.
738 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Это можно интерпретировать так, что у каждого слагаемого в третьей сумме в (12.5.255), соответ-
ствующего какому-то разбиению (K, L) (где K и L содержат ровно по одному из чисел i и i + 1)
найдется парное слагаемое, соответствующее разбиению (K ′ , L′ ) (получающемуся перестановкой i
и i + 1), такое, что эти слагаемые компенсируют друг друга:

sgn(τK⊳L ) · ψ(xK ) · ω(xL ) + sgn(τK ′ ⊳L′ ) · ψ(xK ′ ) · ω(xL′ ) = 0.

Разбив третью сумму на такие пары, мы получим, что она вся равна нулю.
2. Для форм λ ∈ Λ0 (X) и ω ∈ Λk (X) в определении конкатенации формулой (12.5.254) мнодже-
ство K должно быть пустым, поэтому в сумме имеется только одно слагаемое:

(λ ∧ ω)(x1 , ..., xl ) = sgn(τ∅⊳L )λ · ω(xL ) = λ · ω(xL )

3. Умножение формулы (12.5.254) на константу λ ∈ R эквивалентно умножению какого-то мно-


жителя ψ или ω на λ.
4. Пусть ψ ∈ Λk (X), ω ∈ Λl (X), тогда
X
(ψ ∧ ω)(x1 , ..., xk+l ) = sgn(τK⊳L ) · ψ(xK ) · ω(xL ) = (12.1.39) =
k,l
(K,L)∈C{1,...,k+l}
X
= (−1)kl · sgn(τL⊳K ) · ω(xL ) · ψ(xK ) =
k,l
(K,L)∈C{1,...,k+l}
X
= (−1)kl · sgn(τL⊳K ) · ω(xL ) · ψ(xK ) = (−1)kl · (ω ∧ ψ)(x1 , ..., xk+l )
k,l
(K,L)∈C{1,...,k+l}

5. Пусть ϕ ∈ Λk (X), χ ∈ Λl (X), ψ ∈ Λm (X), тогда, с одной стороны,


X
((ϕ ∧ χ) ∧ ψ)(x1 , ..., xk+l+m ) = sgn(τM ′ ⊳M ) · (ϕ ∧ χ)(xM ′ ) · ψ(xM ) =
k+l,m
(M ′ ,M)∈C{1,...,k+l+m}
X  X 
= sgn(τM ′ ⊳M ) · sgn(τK⊳L ) · ϕ(xK ) · χ(xL ) · ψ(xM ) =
k+l,m k,l
(M ′ ,M)∈C{1,...,k+l+m} (K,L)∈C{1,...,k+l}
X 
= sgn τ(K⊔L)⊳M · sgn(τK⊳L ) · ϕ(xK ) · χ(xL ) · ψ(xM ) = (12.1.40) =
k,l,m
(K,L,M)∈C{1,...,k+l+m}
X
= sgn(τK⊳L⊳M ) · ϕ(xK ) · χ(xL ) · ψ(xM ).
k,l,m
(K,L,M)∈C{1,...,k+l+m}

А с другой –
X
(ϕ ∧ (χ ∧ ψ))(x1 , ..., xk+l+m ) = sgn(τK⊳K ′ ) · ϕ(xk ) · (χ ∧ ψ)(xK ′ ) =
k,l+m
(K,K ′ )∈C{1,...,k+l+m}
X X
= sgn(τK⊳K ′ ) · ϕ(xk ) · sgn(τL⊳M ) · χ(xL ) · ψ(xM ) =
k,l+m l,m
(K,K ′ )∈C{1,...,k+l+m} (L,M)∈C{1,...,l+m}
X
= sgn(τK⊳K ′ ) · sgn(τL⊳M ) · ϕ(xk ) · χ(xL ) · ψ(xM ) = (12.1.40) =
k,l,m
(K,L,M)∈C{1,...,k+l+m}
X
= sgn(τK⊳L⊳M ) · ϕ(xK ) · χ(xL ) · ψ(xM ).
k,l,m
(K,L,M)∈C{1,...,k+l+m}

6. Если η 1 , . . . , η k – последовательность линейных функционалов на X, то точно так же как


в предыдущем свойстве, последовательно измельчая разбиение множества {1, ..., k}, мы получим
цепочку:
X
(η 1 ∧ · · · ∧ η k )(x1 , ..., xk ) = sgn(τMk′ ⊳Mk ) · (η 1 , . . . , η k−1 )(xMk′ ) · η k (xMk ) =
k−1,1
(Mk′ ,Mk )∈C{1,...,k}
§ 5. Кососимметрические (внешние) формы и поливекторы 739
X
1 k−2
= sgn(τMk−1
′ ⊳Mk−1 ⊳Mk ) · (η , . . . , η )(xMk−1
′ ) · η k−1 (xMk−1 ) · η k (xMk ) = ... =
′ k−2,1,1
(Mk−1 ,Mk−1 ,Mk )∈C{1,...,k}
X
= sgn(τM1 ⊳...⊳Mk ) · η 1 (xM1 ) · ... · η k (xMk ) =
1,...,1
(M1 ,...,Mk )∈C{1,...,k}
 
X η 1 (x1 ) . . . η 1 (xk )
= 1 k
sgn(σ) · η (xσ(1) ) · ... · η (xσ(k) ) = det  ... ... ... .
σ∈Sk η k (x1 ) k
. . . η (xk )

7. Остается доказать, что операция (ψ, ω) 7→ ψ ∧ω с такими свойствами единственна. Это следует
из теоремы 12.5.3: формы ψ и ω являются линейными комбинациями форм вида (12.5.228), а на
них операция (ψ, ω) 7→ ψ ∧ ω определена однозначно, потому что она совпадает с конкатенацией,
определенной формулой (12.5.228).

(b) Поливекторы Vm (X)


• Поливектором степени m в векторном пространстве X называется произвольный линей-
ный функционал
p : Λm (X) → R
на пространстве Λm (X) внешних форм степени m на X. Множество всех поливекторов
степени m в X обозначается Vm (X). По определению,
 ∗
Vm (X) := Λm (X)

В случае m = 2 поливекторы называются бивекторами.

Конкатенация векторов. Как и в случае с внешними формами, для поливекторов имеется стан-
дартная конструкция, служащая типичным примером.
Пусть x1 , ..., xm – произвольная последовательность длины m векторов пространства X. Всякой
внешней форме α ∈ Λm (X) можно поставить в соответствие число

(x1 ∨ ... ∨ xm )(α) := α(x1 , ..., xm ) (12.5.257)

В результате мы получаем отображение

x1 ∨ · · · ∨ xm : Λm (X) → R,

являющееся линейным функционалом, потому что

(x1 ∨ · · · ∨ xm )(α + β) := (α + β)(x1 , ..., xm ) = α(x1 , ..., xm ) + β(x1 , ..., xm ) =


= (x1 ∨ · · · ∨ xm )(α) + (x1 ∨ · · · ∨ xm )(β)

и 
(x1 ∨ · · · ∨ xm )(λ · α) := (λ · α)(x1 , ..., xm ) = λ · α(x1 , ..., xm ) = λ · (x1 ∨ · · · ∨ xm )(α)
Это значит, что x1 ∨ · · · ∨ xm представляет собой поливектор степени m в X.
• Поливектор x1 ∨ ... ∨ xm ∈ Vm (X) называется конкатенацией векторов x1 , ..., xm ∈ X.

Свойства конкатенации векторов:


1◦ При перестановке элементов последовательности x1 , ..., xm знак конкатенации меняет-
ся в зависимости от знака перестановки:

xσ(1) ∨ ... ∨ xσ(m) = sgn(σ) · x1 ∨ ... ∨ xm , σ ∈ Sm . (12.5.258)

2◦ Если в последовательности x1 , ..., xm какой-то элемент xi встречается дважды, то


конкатенация этих векторов равна нулю:

x1 ∨ ... ∨ xi ∨ ... ∨ xi ∨ ... ∨ xm = 0. (12.5.259)


740 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

3◦ При умножении какого-нибудь вектора xi на скаляр λ конактенация умножается на


скаляр:
x1 ∨ ... ∨ λ · xi ∨ ... ∨ xm = λ · x1 ∨ ... ∨ xi ∨ ... ∨ xm . (12.5.260)
4◦ При замене какого-нибудь вектора xi на сумму векторов a+ b конактенация заменяется
на сумму конкатенаций с подставленными a и b вместо xi :
x1 ∨ ... ∨ (a + b) ∨ ... ∨ xm = x1 ∨ ... ∨ a ∨ ... ∨ xm + x1 ∨ ... ∨ b ∨ ... ∨ xm (12.5.261)
5◦ Конкатенация x1 ∨ ... ∨ xm тогда и только тогда не равна нулю, когда векторы x1 , ..., xm
линейно независимы.
Доказательство. 1. Для σ ∈ Sm мы получаем:

(xσ(1) ∨ ... ∨ xσ(m) )(α) = (12.5.257) = α(xσ(1) , ..., xσ(m) ) = (12.5.223) =


= sgn(σ) · α(x1 , ..., xm ) = (12.5.257) = sgn(σ) · (x1 ∨ ... ∨ xm )(α)
2. Пусть в последовательности x1 , ..., xm какой-то элемент xi встречается дважды. Тогда для
всякой формы α ∈ Λm (X)

(x1 ∨ ... ∨ xm )(α) = (12.5.257) = α(x1 , ..., xi , ..., xi , ..., xm ) = (меняем местями агрументы с xi ) =
= −α(x1 , ..., xi , ..., xi , ..., xm ) = −(x1 ∨ ... ∨ xm )(α)
Такое возможно только если (x1 ∨ ... ∨ xm )(α) = 0.
3. Для λ ∈ R

(x1 ∨ ... ∨ λ · xi ∨ ... ∨ xm )(α) = (12.5.257) = α(x1 , ..., λ · xi , ..., xm ) = λ · α(x1 , ..., xi , ..., xm ) =
= (12.5.257) = λ · (x1 ∨ ... ∨ xm )(α)
4. Если заменить xi на a + b, то

(x1 ∨...∨(a+b)∨...∨xm )(α) = (12.5.257) = α(x1 , ..., a+b, ..., xm ) = α(x1 , ..., a, ..., xm )+α(x1 , ..., b, ..., xm ) =
= (12.5.257) = (x1 ∨...∨a∨...∨xm )(α)+(x1 ∨...∨b∨...∨xm )(α) = (x1 ∨...∨a∨...∨xm +x1 ∨...∨b∨...∨xm )(α).
5. Если векторы x1 , ..., xm линейно независимы, то их можно дополнить до базиса x1 , ..., xm , ..., xn
в пространстве X. Тогда можно взять сопряженный базис в X ∗ ,
 i
i 1
η = ,
x
для которого (
j 1, i = j
η (xi ) = ,
0, i 6= j
и поэтому

(x1 ∨ ... ∨ xm )(η 1 ∧ · · · ∧ η m ) = (12.5.257) = (η 1 ∧ · · · ∧ η m )(x1 , ..., xm ) =


 1   
η (x1 ) . . . η 1 (xm ) 1 ... 0
= det  . . . ... . . .  = det . . . . . . . . . = 1 6= 0.
m m
η (x1 ) . . . η (xm ) 0 ... 1
Наоборот, пусть векторы x1 , ..., xm линейно зависимы, то есть какой-то из них выражается как
линейная комбинация остальных: X
xj = λi · xi .
i6=j

Тогда
 
X
x1 ∨ · · · ∨ xm = x1 ∨ ... ∨ xj ∨ ... ∨ xm = x1 ∨ ... ∨  λi · xi  ∨ ... ∨ xm =
i6=j
X
= λi · x1 ∨ ... ∨ xi ∨ ... ∨ xm = (12.5.259) = 0.
| {z }
i6=j
здесь элемент xi
встречается дважды
§ 5. Кососимметрические (внешние) формы и поливекторы 741

Базис в пространстве поливекторов. Пусть x = (x1 , ..., xn ) – последовательность векторов


векторного пространства X и M ⊆ {1, ..., n} – произвольное множество индексов и τM : {1, ..., m} →
M – возрастающая нумерация его элементов (см. определение на с.667). Обозначим

x∨M = xτM (1) ∨ ... ∨ xτM (m) ∈ Vm (X). (12.5.262)

Из определения конкатенации векторов (12.5.257) следует, что на всякую внешнюю форму ω ∈


Λm (X) конкатенация x∨M действует так же, как форма ω действует на последовательность векторов
xM :
x∨M (ω) = ω(xM ), ω ∈ Λm (X). (12.5.263)
Напомним, что для всякой последовательности η = (η 1 , ..., η m ) линейных функционалов на X
формулой (12.5.241) мы определили внешнюю форму степени m = card M на X:

η M = η τM (1) ∧ ... ∧ η τM (m) ∈ Λm (X).

Эти обозначения полезны в следующей теореме:


Теорема 12.5.7. Пусть a1 , ..., an – базис в пространстве X и 0 6 m 6 n. Тогда поливекторы вида

a∨M = aτM (1) ∨ ... ∨ aτM (m) , M ⊆ {1, ..., n}, card M = m,

образуют базис в пространстве Vm (X) поливекторов степени m в X, а разложение всякого по-


ливектора p ∈ Vm (X) по этому базису имеет вид

X  M !
1
p= p · a∨M . (12.5.264)
a
M ⊆ {1, ..., n} :
card M = m

Доказательство. Опять начнем с того, что убедимся, что эта система линейно независима. Пусть
для некоторых скаляров λM выполняется равенство
X
λM · a∨M = 0.
M ⊆ {1, ..., n} :
card M = m

 i
Пусть в соответствии с (12.2.74) a1 – сопряженный базис в X ∗ . Для всякого множества L ⊆
{1, ..., n}, card L = m, мы получим
 L !  L (
1 1 0, L 6= M
a∨M = (12.5.263) = (aM ) = (12.5.243) = ,
a a 1, L = M
поэтому
X  L !
M 1
0= λ · a∨M = λL .
a
M ⊆ {1, ..., n} :
card M = m

Это верно для любого множества L ⊆ {1, ..., n}, card L = m, поэтому система aM действительно
линейно независима.
Теперь покажем, что она линейно полна. Пусть p ∈ Vm (X) = Λm (X)∗ – произвольный поливек-
тор. Тогда для любой внешней формы ω ∈ Λm (X)
 
 X  M  X  M !
 1  1
p(ω) = (12.5.245) = p  ω(aM ) · = ω(aM )·p = (12.5.263) =
 a  a
M ⊆ {1, ..., n} : M ⊆ {1, ..., n} :
card M = m card M = m

X  M !
1
= a∨M (ω) · p
a
M ⊆ {1, ..., n} :
card M = m

Выбрасывая аргумент ω мы получаем равенство (12.5.264).


742 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Из теоремы 12.5.4 следует


Теорема 12.5.8. Если n – размерность пространства X, то размерность пространства Vm (X)
равна Cnm :
dim Vm (X) = Cnm (12.5.265)

  x 1  xn 1 
Поливекторы максимальной степени. a
1
... a
= det  ... ...  ...  · a1 ∨ ... ∨ an
⋄ 12.5.2. Поливекторы степени m = n (рав-  x1 n xn n
a ... a
ной размерности пространства X) описывают-
(12.5.267)
ся довольно просто. Если зафиксировать базис
a1 , ..., an в X, то по теореме 12.5.7 поливектор
(в определителе матрица коэффициентов разло-
a1 ∨ ... ∨ an жения элементов xi по базису aj ).

Доказательство. Коэффициент перед a1 ∨...∨an


представляет собой базис (состоящий из одно-
в (12.5.267) вычисляется по формуле (12.5.264):
го элемента) в пространстве поливекторов Vn (X)
(которое поэтому будет одномерно). Это значит,  1  n !

что любой поливектор p ∈ n (X) представим в
x1 ∨ ... ∨ xn
1
∧ ... ∧
1
= (12.5.257) =
виде a a
p = λ · a1 ∨ ... ∨ an ,  1  n
1 1
где λ ∈ R – некоторое число. Как следствие, = ∧ ... ∧ (x1 , ..., xn ) = (12.5.228) =
a a
пространство Vn (X) поливекторов максималь-   1 1  1 1 
ной степени всегда одномерно: a (x1 ) ... a (xn )
= det  =
 1 n... ...   ...
1 n
dim Vn (X) = 1, n = dim X. (12.5.266) a (x1 ) ... a (xn )
  x 1  x 1 
В частности, любой элементарный поливектор a
1
... n
a
= det  ... 
x1 ∨ ... ∨ xn ∈ Vn (X) записывается в виде  x1 n ...  x... n
a ... a
n

hxi
x1 ∨ ... ∨ xn = det · a1 ∨ ... ∨ an =
a

Кососимметрическая поляризация Vm (X) ∼


= Λm (X ∗ ). Следующую теорему можно рассмат-
ривать как аналог теоремы 12.2.22:
Теорема 12.5.9. Отображение

Π : Vm (X) → Λm (X ∗ ) Πp(ξ1 , ..., ξm ) = p(ξ1 ∧ ... ∧ ξm ), p ∈ Vm (X), ξ1 , ..., ξm ∈ X ∗ ,

является изоморфизмом векторных пространств, переводящим произвольный поливектор x1 ∨


... ∨ xm в пространстве X во внешнюю форму ιX x1 ∧ ... ∧ ιX xm на пространстве X ∗ :

x1 ∨ ... ∨ xm 7→ ιX x1 ∧ ... ∧ ιX xm . (12.5.268)

Всякое вообще линейное отображение Vm (X) → Λm (X ∗ ), удовлетворяющее условию (12.5.268),


совпадает с Π.
Доказательство. 1. Прежде всего нужно убедиться, что это отображение линейно. Для любых
p, q ∈ L(X, Y )∗ , α, β ∈ R, ξi ∈ X ∗ , υ ∈ Y ∗ мы получим:

Π(α · p + β · q)(ξ1 , ..., ξm ) = (α · p + β · q)(ξ1 ∧ ... ∧ ξm ) =


= α · p(ξ1 ∧ ... ∧ ξm ) + β · q(ξ1 ∧ ... ∧ ξm ) = α · Π(p)(ξ1 , ..., ξm ) + β · Π(q)(ξ1 , ..., ξm ).

Теперь отбрасывая ξi , имеем:

Π(α · p + β · q) = α · Π(p) + β · Π(q).

2. После этого проверим условие (12.5.268):


§ 5. Кососимметрические (внешние) формы и поливекторы 743

Π(x1 ∨ ... ∨ xm )(ξ1 , ..., ξm ) = (x1 ∨ ... ∨ xm )(ξ1 ∧ ... ∧ ξm ) = (12.5.257) = (ξ1 ∧ ... ∧ ξm )(x1 , ..., xm ) =
   
ξ1 (x1 ) . . . ξ1 (xm ) ιX (x1 )(ξ1 ) . . . ιX (xm )(ξ1 )
= (12.5.228) = det  . . . ... . . .  = (12.2.92) = det  ... ... ... =
ξm (x1 ) . . . ξm (xm ) ιX (x1 )(ξm ) . . . ιX (xm )(ξm )
= (12.5.228) = (ιX (x1 ) ∧ ... ∧ ιX (xm ))(ξ1 , ..., ξm )

3. Зафиксируем теперь какой-нибудь базис a1 , ..., an в X. По теореме 12.5.7 поливекторы

ai1 ∨ ... ∨ aim , i1 < ... < im

образуют базис в пространстве Vm (X). А по теореме 12.5.3 внешние формы


 i1  im
1 1
1 ∧ ... ∧ 1 = (12.2.93) = ιX (ai1 ) ∧ ... ∧ ιY (aim ); i1 < ... < im
a a

образуют базис в пространстве Λm (X ∗ ). При этом по уже доказанной формуле (12.5.268), при отоб-
ражении Π первый базис превращается во второй:

Π(ai1 ∨ ... ∨ aim ) = ιX (ai1 ) ∧ ... ∧ ιY (aim ).

Мы получили, что линейное отображение Π : Vm (X) → Λm (X ∗ ) переводит базис в базис. По теореме


12.2.15 это означает, что оно является изоморфизмом векторных пространств.

Конкатенация поливекторов. Из теорем 12.5.9 и 12.5.6 следует

Теорема 12.5.10. Для всякого конечномерного вещественного векторного пространства X суще-


ствет единственная операция, которая любым двум поливекторам p ∈ Vk (X) и q ∈ Vl (X) ставит
в соответствие поливектор p∨q ∈ Vk+l (X) так, что при этом выполняются следующие условия.
(i) Конкатенация с поливектором степени 0 совпадает с умножением на константу:

λ ∨ q = λ · q, λ ∈ V0 (X) = R, q ∈ Vl (X). (12.5.269)

(ii) Билинейность:

λ · (p ∨ q) = (λ · p) ∨ q = p ∨ (λ · q), λ ∈ R, p ∈ Vk (X), q ∈ Vl (X). (12.5.270)

(iii) Антикоммутативность:

p ∨ q = (−1)deg p·deg q · q ∨ p, p ∈ Vk (X), q ∈ Vl (X). (12.5.271)

В частности, для линейных функционалов

x ∨ y = −y ∨ x, x, y ∈ X. (12.5.272)

(iv) Ассоциативность:

(ϕ ∨ p) ∨ q = ϕ ∨ (p ∨ q), ϕ ∈ Vk (X), p ∈ Vl (X), ∨ ∈ Vm (X). (12.5.273)

(v) Конкатенация векторов: на произвольной последовательности x1 , . . . , xk векторов в X


эта операция совпадает с введенной ранее формулой (12.5.257) конкатенацией векторов:

(x1 ∨ ... ∨ xk )(ω) := ω(x1 , ..., xk ), xi ∈ X, ω ∈ Λk (X).

Доказательство. Рассмотрим изоморфизмы, строящиеся в теореме 12.5.9:

Πk : Vk (X) → Λk (X ∗ ), Πl : Vl (X) → Λl (X ∗ ), Πk+l : Vk+l (X) → Λk+l (X ∗ ),

и положим 
−1
p ∨ q = Πk+l Πk (p) ∧ Πl (q) ,
где символ ∧ обозначает конкатенацию внешних форм, существование которой устанавливается в
теореме 12.5.6. Свойства (i)-(v) следуют сразу из аналогичных утверждений теоремы 12.5.6.
744 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Универсальность пространства поливекторов. Заметим, что отображение

∨k : (x1 , ..., xk ) 7→ x1 ∨ ... ∨ xk (12.5.274)

является кососимметрическим полилинейным отображением ∨k : X × ... × X → Vk (X)


Теорема 12.5.11 (универсальность пространства поливекторов). Для любого кососимметрическо-
го полининейного отображения ϕ : X × ... × X → Y найдется единственное линейное отобра-
| {z }
k множителей
жение ϕ∨ : Vk (X) → Y , замыкающее диаграмму

X × ... × X
❏❏
tt ❏❏
∨k ttt ❏❏ ϕ
ttt ❏❏
❏❏ .
t
ztt ❏❏
$
Vk (X) ❴ ❴ ❴ ❴ ❴ ❴ ∨❴ ❴ ❴ ❴ ❴ ❴/ Y
ϕ

Доказательство. Каждому функционалу f ∈ Y поставим в соответствие внешнюю форму ψ(f )
степени k на X по формуле
ψ(f ) = f ◦ ϕ.
У нас получился линейный оператор
ψ : Y ∗ → Λk (X).
Ему соответствует сопряженное отображение

ψ ∗ : Λk (X)∗ → Y ∗∗ .

Рассмотрим отображение ιY : Y → Y ∗∗ , определенное формулой (12.2.92). По теореме 12.2.16 оно


является изоморфизмом, поэтому определено обратное отображение ι−1
Y :Y
∗∗
→ Y . Положим

ϕ∨ = ι−1 ∗ ∗
Y ◦ ψ : Vk (X) = Λk (X) → Y

Тогда возникает цепочка (в которой xi ∈ X, f ∈ Y ∗ ):

ιY (ϕ∨ (∨k (x1 , ..., xk )))(f ) = ψ ∗ (∨k (x1 , ..., xk ))(f ) = ψ ∗ (x1 ∨...∨xk )(f ) = (12.2.94) = (x1 ∨...∨xk )(ψ(f )) =
= (x1 ∨...∨xk )(f ◦ϕ) = (12.5.257) = (f ◦ϕ)(x1 , ..., xk ) = f (ϕ(x1 , ..., xk )) = (12.2.92) = ιY (ϕ(x1 , ..., xk ))(f )



ιY (ϕ (∨k (x1 , ..., xk ))) = ιY (ϕ(x1 , ..., xk ))

ϕ∨ (∨k (x1 , ..., xk )) = ϕ(x1 , ..., xk )


ϕ ◦ ∨k = ϕ.

(c) Действие матрицы и оператора на внешнюю форму и поливектор


Действие оператора на внешнюю форму и поливектор. Пусть A : X → Y – линейный
оператор между (конечномерными) векторными пространствами. Всякой внешней форме ω ∈ Λk (Y )
степени k на Y можно поставить в соответствие внешнюю форму ω · A ∈ Λk (X) по формуле

(ω · A)(x1 , ..., xk ) = ω(Ax1 , ..., Axk ), xi ∈ X (12.5.275)

Наоборот, если p : Λk (X) → R – поливектор степени k в X, то ему соответствует поливектор


Ak p : Λk (Y ) → R, определяемый формулой

∨k Ap(ω) = p(ω · A), ω ∈ Λk (Y ). (12.5.276)

Получающееся отображение пространств поливекторов ∨k A : Vk (X) → Vk (Y ), очевидно, линейно и


называется внешней степенью k оператора A.
§ 5. Кососимметрические (внешние) формы и поливекторы 745

⋄ 12.5.3. Действие оператора A : X → Y на Доказательство. Это достаточно доказать для


каждую элементарную внешнюю форму описы- элементарных поливекторов. Выберем какой-
вается формулой нибудь базис a1 , ..., an в X. Для любой последо-
вательности векторов x1 , ..., xn ∈ X мы получим
(η 1 ∧ · · · ∧ η k ) · A = (η 1 · A) ∧ · · · ∧ (η k · A)
(12.5.277)
(здесь η 1 , . . . , η k – линейные функционалы на Y ). ∨n A(x1 ∨...∨xn ) = (12.5.278) = Ax1 ∨...∨Axn =
 
Ax
⋄ 12.5.4. Похожим образом, на каждый элемен- = (12.5.267) = det · a1 ∨ ... ∨ an =
a
тарный поливектор оператор A : X → Y дей-   h i
ствует по формуле Aa x
= (12.3.124) = det · · a1 ∨ ... ∨ an =
a a
∨k A(x1 ∨ · · · ∨ xk ) = (Ax1 ) ∨ · · · ∨ (Axk )   hxi
Aa
(12.5.278) = (12.3.153) = det · det · a1 ∨ ... ∨ an =
a | a {z }
| {z }
(здесь x1 , . . . , xk – векторы из X). k (12.3.158) k (12.5.267)
det A x1 ∨ ... ∨ xn
⋄ 12.5.5. Если n = dim X, то действие операто-
ра A : X → X на поливекторы степени n в X = det A · x1 ∨ ... ∨ xn .
совпадает с умножением на определитель A:
∨n Ap = det A · p, p ∈ Vn (X) (12.5.279)

Действие матрицы на форму и на поливектор. Напомним, что формулой (12.3.111)


m
X

a·M i
= ak · Mik
k=1

мы определили действие матрицы


 
M11 ... Mm 1

M =  ... ... ... 


M1m ... Mm m

на произвольную строку векторов (a1 , . . . , am ) векторного пространства X. В соответствии с этим,


— действие матрицы M на внешнюю форму ω ∈ Λm (X) определяется формулой

(M · ω)(a1 , . . . , am ) := ω (a1 , . . . , am ) · M

— действие матрицы M на поливектор p ∈ Vm (X) определяется формулой

(p · M )(ω) := p(M · ω)

Отметим следующее тождество:


 
∨m (a1 , ..., am ) · M = ∨m (a1 , ..., am ) · M (12.5.280)

Здесь ∨m – отображение, определенное формулой (12.5.274). Действительно, для всякой внешней


формы ω мы получаем:

m m
!
 X X
∨m (a1 , ..., am ) · M (ω) = (12.3.111) = ∨m ak · M1k , ..., ak · k
Mm (ω) =
k=1 k=1
m m
! m m
!
X X X X 
= ak · M1k ∨ ... ∨ ak · k
Mm (ω) = ω ak · M1k , ..., ak · k
Mm = ω (a1 , ..., am ) · M =
k=1 k=1 k=1 k=1

= (M · ω)(a1 , ..., am ) = (a1 ∨ ... ∨ am )(M · ω) = ∨m (a1 , ..., am )(M · ω) = ∨m (a1 , ..., am ) · M (ω)

и теперь опуская аргумент ω мы получаем (12.5.280).


746 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Теорема 12.5.12. Действие матрицы M ∈ Rm m на произвольную форму ω ∈ Λm (X) и на произ-


вольный поливектор p ∈ Vm (X) совпадает с умножением ω и p на определитель M :

M · ω = det M · ω p · M = det M · p (12.5.281)

В частности, действие M на элементарный поливектор x1 ∨ · · · ∨ xm описывается формулой

(a1 ∨ · · · ∨ am ) · M = det M · (a1 ∨ · · · ∨ am ) (12.5.282)

Доказательство. Здесь нужно сразу заметить, что достаточно доказать формулу (12.5.282). Идею
доказательства удобно описать случаем m = 2: если
 
α γ
x, y ∈ X, M=
β δ
то

(x ∨ y) · M = (αx + βy) ∨ (γx + δy) = αγ · x ∨ x} +βγ · y ∨ x +αδ · x ∨ y + βδ · y ∨ y =


| {z | {z } | {z }
k k k
0 −x ∨ y 0

= −βγ · x ∨ y + αδ · x ∨ y = (αδ − βγ) · x ∨ y = det M · (x ∨ y)

В общем же случае
 
(a1 ∨ ... ∨ am ) · M = ∨m (a1 , ..., am ) · M = (12.5.280) = ∨m (a1 , ..., am ) · M = (12.3.111) =
 
= ∨m a1 · M11 + ... + am · M1m , ..., a1 · M1m + ... + am · Mm m
=
1 m
 m m

= a1 · M1 + ... + am · M1 ∨ ... ∨ a1 · M1 + ... + am · Mm =
X σ(1)
= (−1)sgn σ · M1 · ... · Mm
σ(m)
· a1 ∨ ... ∨ am = det M · a1 ∨ ... ∨ am
σ∈Σ(m)

Следствие 12.5.13. Если A : X → Y – линейный оператор, и M ∈ Rm m – матрица, то



∨m A (a1 ∨ ... ∨ am ) · M = det M · ∨m A(a1 ∨ ... ∨ am ) (12.5.283)

Доказательство.
 
∨m A (a1 ∨ ... ∨ am ) · M = ∨m A det M · (a1 ∨ ... ∨ am ) = det M · ∨m A(a1 ∨ ... ∨ am )

(d) Ориентация
Линейный векторный порядок. Напомним, что на с.667 мы определили понятие частичного
порядка на произвольном множестве X. Предположим теперь, что X – вещественное векторное
пространство, и на нем задан неколторый частичный порядок .
• Частичный порядок  на вещественном векторном пространстве X называется вектор-
ным порядком, если (помимо аксиом O1-O3 на с.667) он удовлетворяет следующим двум
дополнительным аксиомам:
O5. Трансляционность: если a  b, то для любого x ∈ X выполняется a+x  b+x.
O6. Однородность: если a  b, то для любого λ > 0 выполняется λ · a  λ · b.

⋄ 12.5.6. На прямой R, рассматриваемой как ряет аксиомам O5 и O6. Но это не единствен-


(одномерное) вещественное векторное прост- ный возможный векторный порядок, потому что
транство обычное сравнение чисел a 6 b являет- можно положить
ся векторным порядком, потому что удовлетво-
a  b ⇐⇒ b 6 a,
§ 5. Кососимметрические (внешние) формы и поливекторы 747

и это тоже будет векторный порядок на R. пример, можно положить


(
⋄ 12.5.7. На плоскости R2 векторный порядок a1 6 b 1
(a1 , a2 )  (b1 , b2 ) ⇐⇒ .
тоже можно задавать разными способами, на- a1 6 b 2

С векторным порядком на векторном пространстве тесно связано следующее важное понятие.


• Конусом в вещественном векторном пространстве X называется произвольное множество
C ⊆ X, удовлетворяющее следующим условиям:
C1. Замкнутость относительно сложения:

∀x, y ∈ C x+y ∈C (12.5.284)

C2. Замкнутость относительно умножения на неотрицательный скаляр:

∀λ > 0 ∀x ∈ C λ·x ∈C (12.5.285)

C3. Множество C содержит только один элемент, именно, 0, остающийся в C при


умножении на −1:
 
x∈C & −x∈C =⇒ x = 0 (12.5.286)

Теорема 12.5.14. Пусть X – вещественное векторное пространство. Тогда


(a) Для всякого векторного порядка  на X формула

C = {x ∈ X : 0  x} (12.5.287)

определяет конус в X.
(b) Всякий конус C в X определяет векторный порядок  на X правилом

xy ⇐⇒ y − x ∈ C, (12.5.288)

(c) Если C – конус в X, определяемый некотороым векторным порядком  на X по правилу


(12.5.287), то  восстанавливается по C правилом (12.5.288). И наоборот, если  –
векторный порядок на X, определяемый некоторым конусом C в X по правилу (12.5.288),
то C восстанавливается по  правилом (12.5.287).

⋄ 12.5.8. Из теоремы 12.5.14 следует, что на пря- ⋄ 12.5.9. Наоборот, применительно к плоскости
мой R существует только два векторных поряд- R2 теорема 12.5.14 означает, что здесь существу-
ка, потому что в R имеется только два множе- ет бесконечно много векторных порядков, пото-
ства, удовлетворяющие условиям 1◦ − 3◦ , а имен- му что конусов в R2 бесконечно много: помимо
но конуса
C = {x ∈ R : x > 0}
и C = {(x1 , x2 ) ∈ R2 : x1 > 0 & x2 > 0}
C = {x ∈ R : x 6 0}. существуют разные другие конусы, получающи-
Первое из них явлется конусом обычного вектор- еся из этого множества поворотами на разные уг-
ного порядка 6, определенного на с.123. А второе лы относительно точки 0.
– конусом противоположного порядка:
ab ⇐⇒ b 6 a.

Из примера 12.5.8 сразу следует


Теорема 12.5.15. Если X – одномерное вещественное векторное пространство

dim X = 1,

то
748 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

(i) на X существует только два векторных паорядка, и


(ii) каждый такой порядок линеен (то есть удовлетворяет аксиоме линейности O4 на
с.667),
(iii) выбрать такой порядок – то же самое, что выбрать какой-нибудь ненулевой элемент
a ∈ X и объявить, что он удовлетворяет неравенству
0  a.
Доказательство. Здесь X ∼ = R, поэтому в X, как и в R имеется ровно два конуса, и значит, ровно
два векторных порядка. На R каждый такой порядок линеен, поэтому то же справедливо и для X.
Наконец, чтобы выбрать один из этих двух конусов в X достаточно просто указать какой-нибудь
вектор a ∈ X и объявить, что он лежит в этом конусе, то есть удовлетворяет неравенству 0  a.

Ориентация, как порядок на пространстве поливекторов Vn (X). Пусть X – векторное про-


странство размерности n. Напомним, что по формуле (12.5.266) пространство Vn (X) поливекторов
максимальной степени в X одномерно:
dim Vn (X) = 1.
По теореме 12.5.15 это означает, что на Vn (X) существуют только два векторных порядка.
• Ориентацией на конечномерном вещественном векторном пространстве X называется
произвольный (из двух возможных) векторный порядок  на пространстве Vn (X) поли-
векторов максимальной степени (n = dim X) в X.
• При заданной ориентации  на X ненулевые поливекторы p ∈ Vn (X), удовлетворяющие
условию
0  p, (12.5.289)
называются положительно ориентированными (относительно ориентации ), и для за-
писи этого будет использоваться более привычный символ <:
p > 0.
А ненулевые поливекторы, удовлетворяющие противоположному условию
p  0, (12.5.290)
называются отрицательно ориентированными (относительно этой ориентации), и запи-
сываться это будет так:
p < 0.
• В частном случае, когда p – элементарный поливектор степени n, то есть конкатенация n
векторов a1 , ..., an ∈ X,
p = a1 ∨ ... ∨ an ,
то, в силу свойства 5◦ на с.740, он будет ненулевым только если векторы a1 , ..., an линейно
независимы, то есть образуют базис пространства X. Поэтому условие
a1 ∨ ... ∨ an > 0
означает, помимо того, что a1 ∨ ... ∨ an больше нуля в выбранной ориентации , еще что
векторы a1 , ..., an образуют базис в X. В этом случае мы будем говорить, что a1 , ..., an –
положительно ориентированный базис в X (относительно выбранной ориентации X).
В противоположноий ситуации, когда
a1 ∨ ... ∨ an < 0,
векторы a1 , ..., an также образуют базис в X, и мы говорим, что a1 , ..., an – отрицательно
ориентированный базис в X (относительно выбранной ориентации X).
По определению, выбрать ориентацию на X – значит выбрать векторный порядок на Vn (X), а
это то же самое, что выбрать конус C (из двух возможных) в Vn (X), то есть описать положительно
ориентированные поливекторы p ∈ Vn (X)
p > 0.
А по теореме 12.5.15, чтобы описать все такие поливекторы достаточно выбрать какой-нибудь один
(произвольный) ненулевой поливектор p ∈ Vn (X), и объявить его положительно ориентирован-
ным.
§ 5. Кососимметрические (внешние) формы и поливекторы 749

Теорема 12.5.16. Пусть a1 , ..., an – базис в X, определяющий ориентацию этого пространства:

a1 ∨ .. ∨ an > 0.

Тогда для любой последовательсноти x1 , ..., xn ∈ X


— поливектор x1 ∨ ... ∨ xn положительно ориентирован в X, если матрица элементов x1 , ..., xn
в базисе a1 , ..., an имеет положительный определитель:
hxi
x1 ∨ ... ∨ xn > 0 ⇐⇒ det > 0;
a
— поливектор x1 ∨ ... ∨ xn отрицательно ориентирован в X, если матрица элементов x1 , ..., xn в
базисе a1 , ..., an имеет отрицательный определитель:
hxi
x1 ∨ ... ∨ xn > 0 ⇐⇒ det < 0.
a
Доказательство. Это следует из формулы (12.5.267):
hxi
x1 ∨ ... ∨ xn = det · a1 ∨ ... ∨ an .
a
x
 x a 1 ∨ .. ∨ an > 0, то x1 ∨ .. ∨ xn > 0 эквивалентно det a > 0. А x1 ∨ .. ∨ xn < 0 эквивалентно
Если
det a < 0.

⋄ 12.5.10. В пространстве Rn условие тированные положительно относительно такой


ориентации, мы будем назвать стандартно ори-
e1 ∨ ... ∨ en > 0,
ентированными. По теореме 12.5.16 это в точно-
в котором ei – стандартный базис сти базисы, у которых матрица перехода к стан-
дартному базису ei имеет положительный опре-
e1 = (1, 0, ..., 0, 0), ..., en = (0, 0, ..., 0, 1)
делитель:
 
задает ориентацию, которую мы будем также b
называть стандартной. Базисы b1 , ..., bn , ориен- det > 0.
e

Заметим еще вот что. Всякая ориентация на векторном пространстве X, то есть векторный
порядок на пространстве Vn (X) поливекторов максимальной степени, n = dim X, автоматически
порождает некоторый векторный порядок на пространстве Λn (X) внешних форм этой степени на X:
если C – конус в пространстве Vn (X), то в пространстве Λn (X) он порождает множество, состоящее
из форм, на которых все поливекторы p ∈ C неотрицательны

Γ = {ω ∈ Λn (X) : ∀p ∈ C p(ω) > 0},

и легко проверить, что это множество будет конусом в Λn (X). Как следствие, оно порождает век-
торный порядок на Λn (X).
И наоборот, если нам дан какой-то векторный порядок на Λn (X), то мы можем рассмотреть его
конус Γ , и тогда множество поливекторов, неотрицательных на Γ ,

C = {p ∈ Vn (X) : ∀ω ∈ Γ p(ω) > 0},

будет, как легко понять, конусом в Vn (X).


Вывод из всего этого, можно сформулировать так.

Теорема 12.5.17. Следующие действия эквивалентны:


(i) задать ориентацию на пространстве X размерности n = dim X;
(ii) задать векторный порядок на пространстве поливекторов Vn (X);
(iii) задать конус C на пространстве поливекторов Vn (X);
(iv) задать векторный порядок на пространстве внешних форм Λn (X);
(v) задать конус Γ на пространстве внешних форм Λn (X).
750 Глава 12. ЛИНЕЙНАЯ АЛГЕБРА

Сторона ориентированной гиперплоскости в ориентированном пространстве. Рассмот-


рим такую ситуацию. Пусть X – конечномерное вещественное векторное пространство размерности
n, и пусть Y – подпространство в нем размерности n − 1. Такое подпространство Y называется
гиперплоскостью в X.
Пусть далее в X и в Y выбрана ориентация. Зафиксируем какую-нибудь положительную форму
на X,
ω ∈ Λn (X), ω > 0,
и какой-нибудь положительно ориентированный базис a1 , ..., an−1 в Y ,

a1 ∨ ... ∨ an−1 ∈ Vn−1 (Y ), a1 ∨ ... ∨ an−1 > 0.

Рассмотрим отображение f : X → R, определенное правилом

f (x) = ω(a1 ∨ ... ∨ an−1 ∨ x), x ∈ X.

Очевидно, это будет линейный функционал на X. Заметим, что его ядром является пространство
Y:
Y = {x ∈ X : f (x) = 0}.
Действительно, равенство

f (x) = ω(p ∨ x) = ω(a1 ∨ ... ∨ an−1 ∨ x) = 0

означает по предложению 12.5.5, что векторы a1 , ..., an−1 , x должны быть линейно зависимы. По-
скольку при этом a1 , ..., an−1 – линейно независимы, это значит, что x должен выражаться как
линейная комбинация a1 , ..., an−1 :

x = λ1 · a1 + ... + λn−1 · an−1 .

То есть x ∈ Y .
Теперь разобьем пространство X на три части: ту, где функция f положительна, где f равна
нулю, и где f отрицательна:

X+ = {x ∈ X : f (x) > 0}, Y = {x ∈ X : f (x) = 0}, X− = {x ∈ X : f (x) < 0}.

Гиперплоскость Y лежит между двумя полупространствами X+ и X− .


• Мы будем говорить, что полупространство X+ примыкает к положительной стороне
ориентированной гиперплоскости Y в ориентированном пространстве X, а полупростран-
ство X− – к ее отрицательной стороне.
Глава 13

ЕВКЛИДОВЫ ПРОСТРАНСТВА

§1 Евклидовы пространства
Напомним, что невырожденные билинейные формы были определены нами на с.720, а положитель-
ные (положительно определенные) на с.727.
• Евклидовым пространством называется произвольное конечномерное векторное простран-
ство X с заданной на нем невырожденной положительно определенной симметрической
билинейной формой (x, y) 7→ hx, yi, то есть удовлетворяющей условиям:
— положительная определенность:
∀x ∈ X x, x > 0,
причем
x, x = 0 ⇔ x=0
— симметричность:
x, y = y, x
— билинейность:
α · x + β · y, z = α · x, z + β · y, z
— невырожденность: для всякого x 6= 0 найдется y такой что
hx, yi 6= 0.
• Билинейная форма (x, y) 7→ hx, yi называется скалярным произведением евклидова про-
странства X.

(a) Модуль вектора


• Модулем вектора x в евклидовом пространстве X называется число
q
x = x, x .
Теорема 13.1.1. Скалярное произведение выражается через модуль формулой
|x|2 + |y|2 − |x − y|2
hx, yi = , (13.1.1)
2
Доказательство. Это проверяемой прямым вычислением:
2 2 2

|x| + |y| − |x − y| hx, xi + hy, yi − hx − y, x − yi hx, xi + hy, yi − hx, xi − 2hx, yi + hy, yi
= = =
2 2 2
2hx, yi
= = hx, yi
2

• Расстоянием между двумя векторами x и y в евклидовом пространстве X называется


число q
x−y = x − y, x − y .

751
752 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

⋄ 13.1.1. Координатное пространство Rn и модулем


(числовых строк длины n ∈ N) является евкли- p p
довым пространством со скалярным произведе- |x| = hx, xi = (x1 )2 + ... + (xn )2 . (13.1.3)
нием
Расстоянием между точками x, y ∈ Rn будет чис-
ло
q 2 2
hx, yi = x1 · y1 + ... + xn · yn (13.1.2) |x − y| = x1 − y1 + ... + xn − yn .

Свойства модуля
1◦ . Неотрицательность:
|x| > 0, x ∈ Rn (13.1.4)
2◦ . Однородность:
λ · x = |λ| · |x| , x ∈ Rn , λ ∈ R (13.1.5)
3◦ . Неравенство треугольника:

|x + y| 6 |x| + |y| , x, y ∈ Rn (13.1.6)

4◦ . Обратное неравенство треугольника:

|x − y| > |x| − |y| , x, y ∈ Rn (13.1.7)

5◦ . Тождество параллелограмма:
2 2
|x + y| + x − y
= |x|2 + |y|2 , x, y ∈ Rn (13.1.8)
2
Доказательство. Первые два свойства очевидны, докажем неравенство треугольника (13.1.6):
2
|x + y| 6 |x| + |y| ⇐⇒ |x + y|2 6 |x| + |y| ⇐⇒ hx, yi 6 |x| · |y|
| {z } | {z } | {z }
k k ↑
hx + y, x + yi |x|2 + 2 · |x| · |y| + |y|2 неравенство
k k Коши-Шварца (13.1.9)
hx, xi + 2hx, yi + hy, yi hx, xi + 2 · |x| · |y| + hy, yi

Обратное неравенство треугольника (13.1.7) теперь следует из (13.1.6): если обозначить a = x + y и


b = y, то мы получим

|x + y| 6 |x| + |y| ⇐⇒ |a| 6 |a − b| + |b| ⇐⇒ |a| − |b| 6 |a − b|

– это и есть (13.1.7), только с заменой x = a и y = b.


Тождество параллелограмма доказывается прямым вычислением:

|x + y|2 + |x − y|2 |x|2 + 2hx, yi + |y|2 + |x|2 − 2hx, yi + |y|2 2|x|2 + 2|y|2
= = = |x|2 + |y|2
2 2 2

Неравенство Коши-Шварца. Следующее утверждение обобщает теорему 11.1.2 тома 1 и дока-


зывается так же.
Теорема 13.1.2. Если X – векторное пространство со скалярным произведением h·, ·i, то для
любых x, y ∈ X справедливо неравенство Коши-Шварца:

x, y 6 |x| · y , (13.1.9)

Если кроме того x 6= 0, y 6= 0, то это неравенство превращается в равенство в том и только в


том случае, когда векторы x и y сонаправлены:

x, y = |x| · y ⇔ x = λ · y, где λ>0 (13.1.10)


§ 1. Евклидовы пространства 753

Доказательство. 1. Для доказательства (13.1.9) зафиксируем два вектора x, y ∈ Rn и рассмотрим


многочлен второй степени:

f (t) = hx + ty, x + tyi = hx, xi + 2thx, yi + t2 hy, yi = |x|2 + 2thx, yi + t2 |y|2

Поскольку hx + ty, a + tyi > 0, этот многочлен должен при любом значении t быть неотрицателен:

f (t) = |x|2 + 2thx, yi + t2 |y|2 > 0, ∀t ∈ R

Значит, он не может иметь двух вещественных корней, и поэтому его дискриминант должен быть
неположительным:
D = 4hx, yi2 − 4 · |x|2 · |y|2 6 0

hx, yi 6 |x|2 · |y|2
2


hx, yi 6 hx, yi 6 |x| · |y|
|x|
2. Теперь докажем (13.1.10). Если hx, yi = |x| · |y|, то положив λ = |y| , получим
2
|x − λy|2 = hx − λy, x − λyi = hx, xi − 2λ hx, yi +λ2 hy, yi = |x|2 − 2λ|x||y| + λ2 |y|2 = |x| − λ |y| =0
| {z } k
|x|
k |y|
|x||y|

То есть, x = λy.
Следствие 13.1.3. Если x = (x1 , ..., xn ) и y = (y1 , ..., yn ) – две числовые последовательности, то
v v
n u n u n
X uX uX
xi · yi 6 t xi · t
2 yi2 (13.1.11)
i=1 i=1 i=1

Доказательство. Последовательности x и y можно считать элементами евклидова пространства


Rn , тогда неравенство (13.1.9) превращается в неравенство (13.1.11).
Теорема 13.1.4. Для всякого вектора x ∈ Rn справедлива формула:

|x| = sup x, y (13.1.12)


|y|=1

Доказательство. Во-первых,

sup x, y 6 (13.1.9) 6 sup |x| · y = sup |x| · 1 = |x|


|y|=1 |y|=1 |y|=1

и, во-вторых,
 
верхняя грань функции на множестве  
не элементе,
меньше, чем значение на конкретном x 1 1
sup x, y > в частности на элементе > x, = · x, x = · |x|2 = |x|
|y|=1 x
y = |x| |x| |x| |x|

(b) Ортогональность
Ортогональные векторы.
• В соотоветствии с определением на с.719, два вектора x и y в евклидовом пространстве
X называются ортогональными, если их скалярное произведение нулевое:

x⊥y ⇐⇒ hx, yi = 0,

Предложение 13.1.5. Если x ⊥ y, то


2 2
|x + y| = |x − y| = |x|2 + |y|2 . (13.1.13)
754 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Доказательство. Прежде всего,


2 2
|x + y| = |x|2 + 2 hx, yi +|y|2 = |x|2 − 2 hx, yi +|y|2 = |x − y|
| {z } | {z }

=
0 0

Отсюда уже следует, что тождество параллелограмма в этой ситуации можно переписать так:
|x + y|2

=
z }| {
2 2
|x + y| + |x − y| 2
|x|2 + |y|2 = = |x + y| .
2

Ортонормированный базис. В соответствии с определением на с.723, ортонормированным ба-


зисом в евклидовом пространстве X называется всякая последовательность векторов e = (e1 , ..., en )
этого пространства (длины n, равной размерности X), удовлетворяющая условию
(
0, i 6= j
hei , ej i = (13.1.14)
1, i = j

Из теоремы 12.4.15 следует


Теорема 13.1.6. В евклидовом пространстве X всегда существует ортогональный нормирован-
ный базис.
С другой стороны, из теоремы 12.4.17 следует
Теорема 13.1.7. Если e = (e1 , ..., en ) – ортонормированный базис в евклидовом пространстве X,
то справедливы тождества:
h x ii
= hx, ei i , i = 1, ..., n; (13.1.15)
e
n
X
x= hx, ei i · ei , x ∈ X; (13.1.16)
i=1
n
X
hx, yi = hx, ei i · hy, ei i , x, y ∈ X. (13.1.17)
i=1
v
u n
uX
|x| = t
2
hx, ei i , x ∈ X. (13.1.18)
i=1

Ортогональное проектирование. В соответствии с определениями на с.719 и 721,


— ортогональным дополнением к подпространству Y в евклидовом пространстве X назы-
вается подпространство

Y ⊥ = {x ∈ X : ∀y ∈ Y hx, yi = 0}, (13.1.19)

— ортогональным проектором в евклидовом пространстве X называется проектор P (то


есть оператор, удовлетворяющий равенству P 2 = P ), ядро и образ которого являются
ортогональными дополнениями друг для друга:

Ker P ⊥ = Im P, Ker P = Im P ⊥ . (13.1.20)

Теорема 13.1.8. Для всякого подпространства Y в евклидовом пространстве X выполняется


следующее:
(i) Y ∩ Y ⊥ = 0,
(ii) Y = Y ⊥⊥ ,
(iii) X = Y ⊕ Y ⊥.
§ 1. Евклидовы пространства 755

(iv) существует ортогональный проектор вдоль Y ,


(v) существует ортогональный проектор на Y .
Доказательство. Здесь можно сослаться на теорему 12.4.14: ограничение скалярного произведения
с X на любое подпространство, в частности, на Y ⊥ , является невырожденной формой из-за условия
hx, xi > 0 при x 6= 0. Это означает, что справедливо утверждение (ii) теоремы 12.4.14, а значит и
все остальные утверждения этой теоремы.

Свойства ортогональных проекторов:



1 . Если P – ортогональный проектор на Y , то I − P – ортогональный проектор на Y ⊥ .
2◦ . Для любого подпространства Y евклидова пространства X ортогональный проектор на
Y можно определить формулой
m
X
P (x) = hx, ei i · ei , x ∈ X, (13.1.21)
i=1

где (e1 , ..., em ) – произвольный ортонормированный базис в Y (и такое определение не


зависит от выбора (e1 , ..., em )).
3◦ . Всякий ортогональный проектор P в евклидовом пространстве удовлетворяет неравен-
ству
|P (x)| 6 |x|, x ∈ X, (13.1.22)
причем равенство достигается только в случае P (x) = x:
|P (x)| = |x| ⇐⇒ P (x) = x (13.1.23)
Доказательство. 1. Пусть P – ортогональный проектор на Y , то есть P 2 = P , Im P = Y и Ker P =
Y ⊥ . Тогда оператор I − P тоже будет проектором в силу свойства 1◦ на с.686. А равенства
Im(I − P ) = (12.2.96) = Ker P = Y ⊥ , Ker(I − P ) = (12.2.96) = Im P = Y,
означают, что I − P – ортогональный проектор на Y ⊥ .
2. Пусть оператор P определен равенством (13.1.21). Чтобы убедиться, что он является ортого-
нальным проектором на Y , нам достаточно просто проверить равенства
Ker P = Y ⊥ , Im P = Y,
потому что по свойству 3◦ на с.687, они однозначно определяют проектор на Y вдоль Y ⊥ .
Действительно, во-первых,
m
X
x ∈ Ker P ⇔ P (x) = hx, ei i · ei = 0 ⇔ ∀i = 1, ..., m hx, ei i = 0 ⇔
i=1
m
X
⇔ ∀y ∈ Y = span{e1 , ..., em } hx, y i = λi · hx, ei i = 0 ⇔ x ∈ Y ⊥.
=

Pm i=1
i=1 λi · ei

И, во-вторых,
m
X
y ∈ Im P ⇔ ∃x ∈ X y = P (x) = hx, ei i · ei ⇔ y ∈ span{e1 , ..., em } = Y.
i=1

3. Пусть P – ортогональный проектор на Y , а Q = I − P – ортогональный проектор на Y ⊥ . Тогда


всякий вектор x ∈ X разложим в сумму
x = P (x) + Q(x), P (x) ⊥ Q(x),
поэтому
2 2 2 2
|x| = (13.1.13) = |P (x)| + |Q(x)| > |P (x)| ,
| {z }
6

и это доказывает (13.1.22). Более того, из этой цепочки видно, что равенство |x|2 = |P (x)|2 возможно
только если Q(x) = 0, а это эквивалентно равенству x = P (x).
756 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Ортогонализация Грама-Шмидта в евклидовом пространстве. Матрицей Грама последо-


вательности a1 , ..., ak векторов евклидова пространства X называется матрица билинейной формы
h·, ·i на этих векторах:
 
ha1 , a1 i ha1 , a2 i ... ha1 , ak i
ha2 , a1 i ha2 , a2 i ... ha2 , ak i
(a1 , ..., ak ), (a1 , ..., ak ) = 
 ...

... ... ... 
hak , a1 i hak , a2 i ... hak , ak i

Предложение 13.1.9. У матрицы Грама произвольного базиса b = (b1 , ..., bn ) в евклидовом про-
странстве X все главные миноры отличны от нуля1 :
 
hb1 , b1 i . . . hb1 , bk i
∀k = 1, ..., n det  . . . ... ...  = 6 0 (13.1.24)
hbk , b1 i . . . hbk , bk i

Доказательство. Скалярное произведение h·, ·i невырождено на любом подпространстве Y в X,


в частности, на линейной оболочке Y = span{b1 , ..., bk } первых k векторов базиса b. Поэтому по
теореме 12.4.16 матрица формы h·, ·i на базисе (b1 , ..., bk ) пространства Y = span{b1 , ..., bk } должна
быть невырождена.

Это наблюдение позволяет следующим образом упростить теорему Грама-Шмидта 12.4.18 для
случая евклидова пространства:

Теорема 13.1.10 (Грам, Шмидт). Для всякого базиса b = (b1 , ..., bn ) (необязательно ортогональ-
ного) в евклидовом пространстве X найдется (единственный) ортогональный базис e = (e1 , ..., en )
в X такой, что всякий вектор ek выражается через векторы b1 , ..., bk , причем коэффициент при
bk равен 1:
k−1
X
ek = λik · bi + bk (13.1.25)
i=1

Как следствие,
 
(i) матрица eb перехода от базиса b к базису e является нижнетреугольной с единицами
на диагонали,  
1 0 0 ... 0
hei  λ
 1
1
1 1 0 ... 0  
=  λ2 λ2
2
1 ... 0  
b . . . . . . . . . . . . . . .
λ1n λ2n λ3n . . . 1
(ii) для всякого k = 1, ..., n выполняется равенство определителей:
 
hb1 , b1 i hb1 , b2 i . . . hb1 , bk i
hb2 , b1 i hb2 , b2 i . . . hb2 , bk i
det 
 ...
=
... ... ... 
hbk , b1 i hbk , b2 i . . . hbk , bk i
 
he1 , e1 i 0 ... 0
 0 he , e2 i ... 0 
= det  2  = |e1 |2 · ... · |ek |2 (13.1.26)
 ... ... ... ... 
0 0 . . . hek , ek i

Этот базис e = (e1 , ..., en ) можно определить индуктивными соотношениями

k−1
X hbk , ei i
e1 = b1 , ek = bk − 2 · ei . (13.1.27)
i=1 |ei |

и он называется ортогонализацией Грама-Шмидта базиса b.


1 Из свойства 1◦ ниже на с.761 будет следовать, что главные миноры матрицы Грама на любом базисе b = (b , ..., b )
1 n
не просто отличны от нуля, но всегда положительны.
§ 1. Евклидовы пространства 757

(c) Евклидова структура на пространстве функционалов X ∗


Если X – евклидово пространство, то его пространство линейных функционалов X ∗ обладает есте-
ственным скалярным произведением, о котором мы поговорим здесь.

Скалярное произведение в X ∗ . Пусть X – евклидово пространство и e = (e1 , ..., en ) – его


ортонормированный базис. Для любых двух линейных функционалов f, g ∈ X ∗ их скалярным про-
изведением называется число
n
X
hf, gi = f (ei ) · g(ei ) (13.1.28)
i=1

Свойства скалярного произведения в X ∗ :


10 . Для любых двух линейных функционалов f, g ∈ X ∗ их скалярное произведение hf, gi не
зависит от выбора ортонормированного базиса e в X.
20 . Операция (f, g) 7→ hf, gi обладает свойствами абстрактного скалярного произведения,
определенного на с.751, и поэтому превращает сопряженное пространство X ∗ в евкли-
дово пространство.
30 . Если e = (e1 , ..., en ) – ортонормированный базис в X, то соряженный ему базис
   1  n !
1 1 1
= , ...,
e e e

будет ортонормированным в X ∗ .

Доказательство. 1. Пусть b = (b1 , ..., bn ) – какой-нибудь другой ортонормированный базис в X.


Тогда
n
X Xn Xn h ij
ei  X n h ik
ei 
hf, gi = (13.1.28) = f (ei ) · g(ei ) = (12.2.68) = f · bj · g · bk =
i=1 i=1 j=1
b b
k=1
n
X n X
X n h ij h ik  Xn n X
X n 
ei ei
= f (bj ) · · · g(bk ) = (13.1.15) = f (bj ) · hei , bj i · hei , bk i · g(bk ) =
j=1 i=1
b b j=1 i=1
k=1 k=1
n
X n
X n
X
= (13.1.17) = f (bj ) · hbj , bk i · g(bk ) = (13.1.14) = f (bj ) · g(bj ).
j=1 k=1 j=1

То есть hf, gi выражается через bj по той же формуле (13.1.28), только с подставленным вместо
базиса e базисом b. Это и нужно было доказать в 1◦ .
2. Во втором утверждении нужно проверить свойства положительной определенности, симмет-
ричности, билинейности и невырожденности операции (f, g) 7→ hf, gi. Это можно считать очевид-
ным.
3. Если e = (e1 , ..., en ) – ортонормированный базис в X, то для i 6= j мы получаем
*    + n  i  j
i j X
1 1 1 1
, = (13.1.28) = (ek ) · (ek ) = 0,
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= j

а с другой стороны,
*    + n  i  i  i  i
i i X
1 1 1 1 1 1
, = (13.1.28) = (ek ) · (ek ) = (ei ) · (ei ) = 1.
e e e e e e
k=1 | {z } | {z } | {z } | {z }
k k k k
0 0 1 1
при k 6= i при k 6= i
758 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Градиент линейного функционала. Пусть X – евклидово пространство и e = (e1 , ..., en ) –


его ортонормированный базис. Для любого линефного функционала f : X → R его градиентом
называется вектор
Xn
∇f = f (ei ) · ei . (13.1.29)
i=1

Свойства градиента линейного функционала:


10 . Градиент ∇f линейного функционала f : X → R не зависит от выбора ортонормирован-
ного базиса e = (e1 , ..., en ) в X.
0
2 . Для всякого ортонормированного базиса e = (e1 , ..., en ) в X справедливы равенства
 j
1
∇ = ei , i = 1, ..., n. (13.1.30)
e

30 . Операция взятия градиента f 7→ ∇f является биекцией векторных пространств X ∗ и


X:
X∗ ∼
=X (13.1.31)
и удовлетворяет тождеству

h∇f, ∇gi = hf, gi, f, g ∈ X ∗ . (13.1.32)

Доказательство. 1. Пусть b = (b1 , ..., bn ) – какой-нибудь другой ортонормированный базис в X.


Тогда
n
X n
X n h ij
X ei  X
n h ik
ei 
∇f = (13.1.29) = f (ei ) · ei = (12.2.68) = f · bj · · bk =
b b
i=1 i=1 j=1 k=1
n
X n X
X n h ij h ik  Xn n X
X n 
ei ei
= f (bj ) · · · bk = (13.1.15) = f (bj ) · hei , bj i · hei , bk i · bk =
j=1 i=1
b b j=1 i=1
k=1 k=1
n
X n
X n
X
= (13.1.17) = f (bj ) · hbj , bk i · bk = (13.1.16) = f (bj ) · bj .
j=1 k=1 j=1

То есть ∇f выражается через bj по той же формуле (13.1.29), только с подставленным вместо базиса
e базисом b. Это и нужно было доказать в 1◦ .
2. Равенство (13.1.30) проверяется вычислением:
 j X n  j  i
1 1 1
∇ = (ei ) ·ei = (ei ) · ei = ei .
e i=1 |
e e
{z }
k
0
при i 6= j

3. Отображение f 7→ ∇f , очевидно, линейно. При этом, в силу (13.1.30), ∇ отображает базис в


X ∗ в базис в X. Это означает, что ∇ – биективное отображение. Чтобы доказать (13.1.32), выберем
f, g ∈ X ∗ , тогда
* n n
+
X X
h∇f, ∇gi = (13.1.29) = f (ei ) · ei , g(ej ) · ej =
i=1 j=1
n
XXn n
X
= f (ei ) · g(ej ) · hei ej i = f (ei ) · g(ei ) = (13.1.28) = hf, gi.
i=1 j=1 i=1

(d) Евклидова структура на пространстве операторов L(X, Y )


Если X и Y – евклидовы пространства, то пространство линейных операторов L(X, Y ) обладает
естественным скалярным произведением. Здесь мы опишем эту конструкцию.
§ 1. Евклидовы пространства 759

Скалярное произведение в L(X, Y ). Пусть X и Y – евклидовы пространства, и e = (e1 , ..., en ) –


ортонормированный базис в X. Для любых двух линейных операторов A, B ∈ L(X, Y ) их скалярным
произведением называется число
n
X
hA, Bi = hA(ei ), B(ei )i (13.1.33)
i=1

Свойства скалярного произведения в L(X, Y ):


10 . Для любых двух операторов A, B ∈ L(X, Y ) их скалярное произведение hA, Bi не зависит
от выбора ортонормированного базиса e в X.
20 . Операция (A, B) 7→ hA, Bi обладает свойствами абстрактного скалярного произведения,
определенного на с.751, и поэтому превращает пространство операторов L(X, Y ) в ев-
клидово пространство.
30 . Если e = (e1 , ..., en ) – ортонормированный базис в X, а f = (f1 , ..., fn ) – ортонормирован-
ный базис в Y , то система операторов
 i
1
⊙ fj
e

действующих по формуле
 i h x ii
1
⊙ fj (x) = · fj , x ∈ X,
e e

будет ортонормированным базисом в L(X, Y ).

Доказательство. 1. Пусть b = (b1 , ..., bn ) – какой-нибудь другой ортонормированный базис в X.


Тогда
* +
n
X n
X Xn h ij
ei  X n h ik
ei 
hA, Bi = (13.1.28) = hA(ei ), B(ei )i = (12.2.68) = A · bj , B · bk =
i=1 i=1 j=1
b b
k=1
n
* n X n h ij h ik 
+
X X ei ei
= A(bj ), · · B(bk ) = (13.1.15) =
j=1
b b
k=1 i=1
* n X
+ * +
n
X X n  Xn n
X
= A(bj ), hei , bj i · hei , bk i · B(bk ) = (13.1.17) = A(bj ), hbj , bk i · B(bk ) =
j=1 k=1 i=1 j=1 k=1
n
X
= (13.1.14) = hA(bj ), B(bj )i .
j=1

То есть hA, Bi выражается через bj по той же формуле (13.1.33), только с подставленным вместо
базиса e базисом b. Это и нужно было доказать в 1◦ .
2. Во втором утверждении нужно проверить свойства положительной определенности, симмет-
ричности, билинейности и невырожденности операции (A, B) 7→ hA, Bi. Это можно считать очевид-
ным.
3. Если e = (e1 , ..., en ) – ортонормированный базис в X, а f = (f1 , ..., fn ) – ортонормированный
базис в Y , то для i 6= i′ и любых j и j ′ мы получаем
*   i′ + n   i  i′ 
i X
1 1 1 1
⊙ fj , ⊙ fj ′ = (13.1.33) = (ek ) ·fj , (ek ) ·fj ′ = 0.
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= i′

Для случая i = i′ и j 6= j ′
760 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
*   i′ + n   i  i 
i X
1 1 1 1
⊙ fj , ⊙ fj ′ = (13.1.33) = (ek ) ·fj , (ek ) ·fj ′ =
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= i
  i  i 
1 1
= (ei ) ·fj , (ei ) ·fj ′ = hfj , fj ′ i = 0.
e e
| {z } | {z }
k k
1 1

Наконец, для случая i = i′ и j = j ′ мы получим


*   i + n   i  i 
i X
1 1 1 1
⊙ fj , ⊙ fj = (13.1.33) = (ek ) ·fj , (ek ) ·fj =
e e e e
k=1 | {z } | {z }
k k
0 0
при k 6= i при k 6= i
  i  i 
1 1
= (ei ) ·fj , (ei ) ·fj = hfj , fj i = 1.
e e
| {z } | {z }
k k
1 1

Модуль и норма оператора. Если A : X → Y – линейный оператор между евклидовыми


пространствами, то его модулем называется его модуль как вектора в евклидовом пространстве
L(X, Y ): v v
u n u n
p uX uX
|A| = hA, Ai = t hAei , Aei i = t |Aei |
2
(13.1.34)
i=1 i=1

(e = (e1 , ..., en ) – произвольный ортонормированный базис в X, и правая часть не зависит от выбора


e в силу свойства 1◦ на с.759).
Единичным шаром евклидова пространства X называется множество
B = {x ∈ X : |x| 6 1}.
Лемма 13.1.11. У всякого линейного оператора A : X → Y между двумя евклидовыми простран-
ствами X и Y множество значений на единичном шаре в X ограничено модулем оператора A:

sup |A(x)| 6 |A| . (13.1.35)


|x|61

Доказательство. При |x| 6 1 имеем:


n
! n n
X X X
|A(x)| = (13.1.16) = A hx, ei i · ei = hx, ei i · A(ei ) 6 (13.1.6) 6 |hx, ei i · A(ei )| =
i=1 i=1 i=1
v v
n u n u n
X uX uX
= (13.1.5) = |hx, ei i| · |A(ei )| 6 (13.1.11) 6 t |hx, ei i| · t
2
|A(ei )2 | 6 |A| .
i=1 i=1 i=1
| {z } | {z }
k (13.1.18) k
|x| |A|
>

• Нормой линейного оператора A : X → Y на евклидовых пространствах называется число


kAk = sup A(x) (13.1.36)
|x|61

(в силу (13.1.35), величина справа конечна).


§ 1. Евклидовы пространства 761

Свойства нормы в L(X, Y ):


10 . Для всякого линейного оператора A : X → Y и любого вектора x ∈ X

|A(x)| 6 kAk · |x|, x∈X (13.1.37)

20 . Норма оператора удволетворяет двойному неравенству


1
√ · |A| 6 kAk 6 |A| (13.1.38)
dim X

Доказательство. 1. Из (13.1.36) следует, что для всякого вектора p со свойством |p| 6 1 выполня-
ется неравенство
|A(p)| 6 kAk .
x
Поэтому для любого x 6= 0, из очевидного равенства |x| = 1 должно следовать
 
x
A 6 kAk
|x|

Отсюда уже получаем


     
x x x
|A(x)| = A |x| · = |x| · A = |x| · A 6 |x| · kAk
|x| |x| |x|

Это доказывает (13.1.37) для ненулевых векторов x ∈ X. А для нулевого это неравенство очевидно.
2. В (13.1.38) второе неравенство есть переформулировка (13.1.35). А первое доказывается це-
почкой
v v v
u n u n u n
uX u X uX
|A| = (13.1.34) = t 2
|Aei | 6 (13.1.37) 6 t kAk · |ei | = t
2 2
kAk2 = n · kAk .
i=1 i=1 i=1

(e) Евклидова структура на пространстве поливекторов Vk (X)


Если X – евклидово пространство, то для всякого k > 0 пространство поливекторов Vk (X) также
является евклидовым пространством.

Определитель Грама. Определителем Грама последовательности a1 , ..., ak векторов евклидова


пространства X называется определитель матрицы билинейной формы h·, ·i на этих векторах:
 
ha1 , a1 i ha1 , a2 i ... ha1 , ak i
ha2 , a1 i ha2 , a2 i ... ha2 , ak i
Gram(a1 , ..., ak ) = det (a1 , ..., ak ), (a1 , ..., ak ) = det 
 ...

... ... ... 
hak , a1 i hak , a2 i ... hak , ak i

Свойства определителя Грама:


10 . Двусторонняя оценка: для любых векторов (a1 , ..., ak )

0 6 Gram(a1 , ..., ak ) 6 |a1 |2 · ... · |ak |2 (13.1.39)

причем нижняя граница достигается только если система векторов a1 , ..., ak линейно
зависима,
0 = Gram(a1 , ..., ak ) ⇐⇒ ∃i ai ∈ span{aj ; j 6= i} (13.1.40)
а верхняя (при ненулевых ai ) – только если любые два вектора ai и aj ортогональны,

Gram(a1 , ..., ak ) = |a1 |2 · ... · |ak |2 ⇐⇒ ∀i 6= j ai ⊥ aj (13.1.41)


762 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

20 . Индуктивное равенство: пусть pr{a1 ,...,ak−1 }⊥ (ak ) – ортогональная проекция вектора


ak на ортогональное дополнение {a1 , ..., ak−1 }⊥ к векторам a1 , ..., ak−1 , тогда
2
Gram(a1 , ..., ak−1 , ak ) = Gram(a1 , ..., ak−1 ) · pr{a1 ,...,ak−1 }⊥ (ak ) , (13.1.42)

30 . Неравенство Адамара: для любых векторов (a1 , ..., ak , b1 , ..., bl )

Gram(a1 , ..., ak , b1 , ..., bl ) 6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl ) (13.1.43)

40 . Линейное искажение: для любых векторов (a1 , ..., ak ) и любой матрицы M ∈ Rkk

Gram((a1 , ..., ak ) · M ) = Gram(a1 , ..., ak ) · (det M )2 , (13.1.44)

в частности, при перестановке векторов определитель Грама не меняется:

∀i, j Gram(a1 , ..., ai , ..., aj , ..., ak ) = Gram(a1 , ..., aj , ..., ai , ..., ak ) (13.1.45)

50 . Координатное представление: если число векторов a1 , ..., an совпадает с размерно-


стью пространства X, то
  2
ha1 , e1 i ... ha1 , en i
Gram(a1 , ..., an ) = det  .... ... ...  , (13.1.46)
han , e1 i ... han , en i

где e1 , ..., en – ортогональный нормированный базис в X.


60 . Выражение через ортогонализацию Грама-Шмидта: для любых векторов a1 , ..., ak ∈
Rn
Gram(a1 , ..., an ) = |e1 |2 · ... · |ek |2 . (13.1.47)
где ei – ортогонализация Грама-Шмидта системы ai (определенная формулой (13.1.27)).
Доказательство. 1. Пусть сначала векторы a1 , ..., ak линейно зависимы. Тогда найдутся числа
λ1 , ..., λk , не все равные нулю, такие, что

λ1 · a1 + ... + λk · ak = 0

Скалярно умножая это равенство слева на векторы ai , мы получим линейную систему



 1 k
λ · a1 , a1 + ... + λ · a1 , ak = 0
.......................................................

 1
λ · ak , a1 + ... + λk · ak , ak = 0
 1
λ
Левую часть можно представить как произведение матрицы Грама на вектор λ =  ... :
λn
   1
ha1 , a1 i ... ha1 , ak i λ
 ... ... ...  ·  ...  = 0
hak , a1 i ... hak , ak i λn
 1
λ
Поскольку λ =  ...  – ненулевой столбец, матрица hai , aj i вырождена, и значит ее определитель
λn
равен нулю:  
ha1 , a1 i ... ha1 , ak i
Gram(a1 , ..., ak ) = det  ... ... ...  = 0
hak , a1 i ... hak , ak i
Пусть теперь наоборот, система векторов a1 , ..., ak линейно независима. Рассмотрим ее линейную
оболочку Y = span{a1 , ..., ak }. Всякий вектор y ∈ Y раскладывается по базису a = (a1 , ..., ak ):
k h ii
X y
y= · ai
i=1
a
§ 1. Евклидовы пространства 763

Рассмотрим на Y квадратичную форму


* k +
X h y ii Xk h ij
y Xk h y ii h y ij
q(y) = y, y = · ai , · aj = ai , aj · ·
i=1
a j=1
a i=1
a a

Поскольку q положительно определена на всем пространстве X, она и на подпространстве Y тоже


положительно определена:

∀y ∈ Y y 6= 0 =⇒ q(y) > 0

Поэтому по критерию Сильвестра (теорема 12.4.19), определитель ее матрицы в (произвольном


базисе, в частности в) базисе a = (a1 , ..., ak ) должен быть положительным:
 
ha1 , a1 i ... ha1 , ak i
Gram(a1 , ..., ak ) = det  ... ... ...  > 0
hak , a1 i ... hak , ak i

Мы доказали первое неравенство в цепочке (13.1.39) и условие (13.1.40). Теперь докажем второе
неравенство и условие (13.1.41). Если система векторов (a1 , ..., ak ) линейно зависима, то, как мы
уже показали, ее определитель Грама Gram(a1 , ..., ak ) равен нулю, и тогда неравенство

Gram(a1 , ..., ak ) 6 |a1 |2 · ... · |ak |2

выполняется автоматически. Поэтому для нас важен случай, когда система (a1 , ..., ak ) линейно неза-
висима. Тогда любая ее подсистема (a1 , ..., ai ), 1 6 i 6 k, также будет линейно независима, и мы
уже показали, что определитель Грама такой системы должен быть положительным:
 
ha1 , a1 i ... ha1 , ai i
Gram(a1 , ..., ai ) = det  ... ... ...  > 0, ∀i 6 k (13.1.48)
hai , a1 i ... hai , ai i

Значит, по теореме 12.4.18 мы можем провести ортогонализацию Грама-Шмидта, которая базис


a = (a1 , ..., ak ) пространства span{a1 , ..., ak } превратит в ортогональный базис e = (e1 , ..., ek ) со
свойством (12.4.218):
 
ha1 , a1 i ... ha1 , ai i
∀i 6 k Gram(a1 , ..., ai ) = det  ... ... ...  = |e1 |2 · ... · |ei |2
hai , a1 i ... hai , ai i

Каждый вектор ei представляет собой ортогональную проекцию вектора ai на ортогональное до-


полнение {e1 , ..., ei−1 }⊥ к векторам {e1 , ..., ei−1 }:

ei = pr{e1 ,...,ei−1 }⊥ (ai )

Поскольку ортогональная проекция не увеличивает модуль, справедливо неравенство:

|ei | = pr{e1 ,...,ei−1 }⊥ (ai ) 6 (13.1.22) 6 |ai |.

Вдобавок, никакой вектор ei не может быть нулевым (поскольку (e1 , ..., ek ) образуют базис), и
значит |ei | > 0. В результате мы получаем систему
(
Gram(a1 , ..., ak ) = |e1 |2 · ... · |ek |2 6 |a1 |2 · ... · |ak |2
,
0 < |ei | 6 |ai |

из которой следует, во-первых, второе неравенство в цепочке (13.1.39), а, во-вторых, что равенство

Gram(a1 , ..., ak ) = |e1 |2 · ... · |ek |2 = |a1 |2 · ... · |ak |2

возможно только при |ei | = pr{e1 ,...,ei−1 }⊥ (ai ) = |ai | для любого i = 1, ..., k, то есть, в силу (13.1.23),
при ei = ai для всех i = 1, ..., k (такое возможно только если векторы ai изначально были ортого-
нальны друг другу).
2. Докажем индуктивное равенство (13.1.42). Если векторы (a1 , ..., ak−1 , ak ) линейно зависи-
мы, то либо подсистема (a1 , ..., ak−1 ) тоже линейно зависима, и тогда Gram(a1 , ..., ak−1 , ak ) = 0 =
764 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Gram(a1 , ..., ak−1 ), и обе части в (13.1.42) получаются нулевыми, либо подсистема (a1 , ..., ak−1 ) ли-
нейно независима, но тогда ak ∈ span{a1 , ..., ak−1 }, поэтому d = pr{a1 ,...,ak−1 }⊥ (ak ) = 0, и опять
получается, что обе части в (13.1.42) нулевые.
Таким образом, нам нужно рассмотреть случай, когда векторы (a1 , ..., ak−1 , ak ) линейно незави-
симы. Тогда получается ситуация, которую мы уже рассматривали: из-за линейной независимости
всякой подсистемы вида (a1 , ..., ai ), i 6 k, определители Грама всех этих систем будут ненулевыми
(неравенства (13.1.48)), поэтому можно применить ортогонализацию Грама-Шмидта, которая даст
ортогональный базис (e1 , ..., ek ) со свойствами:
 
ha1 , a1 i ... ha1 , ai i
∀i 6 k Gram(a1 , ..., ai ) = det  ... ... ...  = |e1 |2 · ... · |ei |2 ,
hai , a1 i ... hai , ai i

ei = pr{e1 ,...,ei−1 }⊥ (ai ) = pr{a1 ,...,ai−1 }⊥ (ai )


Из этих равенств мы получаем:
2
Gram(a1 , ..., ak ) = |e1 |2 · ... · |ek−1 |2 · | ek |2 = Gram(a1 , ..., ak−1 ) · pr{a1 ,...,ak−1 }⊥ (ak )
| {z } |{z}
k k
Gram(a1 , ..., ak−1 ) pr{a ⊥ (ak )
1 ,...,ak−1 }

3. Докажем неравенство Адамара (13.1.43). Если векторы (a1 , ..., ak , b1 , ..., bl ) линейно зависимы,
то это неравенство выполняется автоматически, потому что слева стоит нуль, а справа – неотрица-
тельные числа:
0 6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl )
Поэтому нам нужно рассмотреть случай, когда (a1 , ..., ak , b1 , ..., bl ) – линейно независимая система.
Здесь мы организуем индукцию по числу l ∈ N. Прежде всего, при l = 1 мы получаем:

2
Gram(a1 , ..., ak , b1 ) = (13.1.42) = Gram(a1 , ..., ak ) · pr{a1 ,...,ak }⊥ (b1 ) 6
6 Gram(a1 , ..., ak ) · |b1 |2 = Gram(a1 , ..., ak ) · Gram(b1 )

Далее мы предполагаем, что неравенство (13.1.43) верно при некотором l. Тогда для l + 1 мы полу-
чаем:

{a1 , ..., ak , b1 , ..., bl }⊥ ⊆ {b1 , ..., bl }⊥



2
pr{b ⊥ (bl+1 )
1 ,...,bl }
Gram(a1 , ..., ak ) · Gram(b1 , ..., bl )
6
6

предположение индукции z }| {
z }| { 2
Gram(a1 , ..., ak , b1 , ..., bl , bl+1 ) = (13.1.42) = Gram(a1 , ..., ak , b1 , ..., bl ) · pr{a1 ,...,ak ,b1 ,...,bl }⊥ (bl+1 ) 6
2
6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl ) · pr{b1 ,...,bl }⊥ (bl+1 ) 6 Gram(a1 , ..., ak ) · Gram(b1 , ..., bl , bl+1 )
| {z }
k
Gram(b1 , ..., bl , bl+1 ),
в силу (13.1.42)

4. Формула линейного искажения (13.1.44) следует из формулы (12.3.136):



Gram(a · M ) = det a · M, a · M = (12.3.136) = det M ⊤ · a, a · M =
= det M ⊤ · det a, a · det M = Gram(a) · (det M )2

5. Для любых векторов ai , aj получаем


n
X
hai , aj i = hai , ek i · hek , aj i
k=1


§ 1. Евклидовы пространства 765
 
ha1 , a1 i ha1 , a2 i ... ha1 , an i
 ha2 , a1 i ha2 , a2 i ... ha2 , an i 
 =
 ... ... ... ... 
han , a1 i han , a2 i ... han , an i
   
ha1 , e1 i ha1 , e2 i ... ha1 , en i he1 , a1 i he1 , a2 i ... he1 , an i
 ha2 , e1 i ha2 , e2 i ... ha2 , en i   
=  ·  he2 , a1 i he2 , a2 i ... he2 , an i  =
 ... ... ... ...   ... ... ... ... 
han , e1 i han , e2 i ... han , en i hen , a1 i hen , a2 i ... hen , an i
   ⊤
ha1 , e1 i ha1 , e2 i ... ha1 , en i ha1 , e1 i ha1 , e2 i ... ha1 , en i
 ha2 , e1 i ha2 , e2 i ... ha2 , en i   ha2 , e1 i ha2 , e2 i ... ha2 , en i 
=
 ...
· 
... ... ...   ... ... ... ... 
han , e1 i han , e2 i ... han , en i han , e1 i han , e2 i ... han , en i

 
ha1 , a1 i ha1 , a2 i ... ha1 , an i
 ha2 , a1 i ha2 , a2 i ... ha2 , an i 
det 
 ...
=
... ... ... 
han , a1 i han , a2 i ... han , an i
   ⊤
ha1 , e1 i ha1 , e2 i ... ha1 , en i ha1 , e1 i ha1 , e2 i ... ha1 , en i
 ha2 , e1 i ha2 , e2 i ... ha2 , en i   ha2 , e1 i ha2 , e2 i ... ha2 , en i 
= det 
 ...
 · det   =
... ... ...   ... ... ... ... 
han , e1 i han , e2 i ... han , en i han , e1 i han , e2 i ... han , en i
  2
ha1 , e1 i ha1 , e2 i ... ha1 , en i
  ha2 , e1 i ha2 , e2 i ... ha2 , en i 
= (12.3.152) =  
det  ...

... ... ... 
han , e1 i han , e2 i ... han , en i

6. Если векторы ai линейно независимы, то формула (13.1.47) сразу следует из (13.1.26). Если
же они линейно зависимы, то в (13.1.47) левая часть будет нулевой в силу уже доказанного свойства
(13.1.40), а правая – потому что какой-то вектор ei окажется нулевым.

Скалярное произведение поливекторов. Пусть X – евклидово пространство со скалярным


произведением h·, ·i. Рассмотрим полилинейную форму на X m × X m :
 
hx1 , y1 i ... hx1 , ym i
x1 , ..., xm | y1 , ..., ym = det  ... ... ...  (13.1.49)
hxm , y1 i ... hxm , ym i

и заметим, что для всякого ортонормированного базиса a1 , ..., an в X справедлива формула2


(
0, L 6= M
aL | aM = , card L = card M = m. (13.1.50)
1, L = M.

Доказательство. Пусть L 6= M . Тогда найдется индекс i ∈ L \ M . Для него

∀j ∈ M hai , aj i = 0,

и3
 
haτL (1) , aτM (1) i ... haτL (1) , aτM (m) i
aL | aM = aτL (1) , ..., aτL (m) | aτM (1) , ..., aτM (m) = det  ... ... ... =0
haτL (m) , aτM (1) i ... haτL (m) , aτM (m) i

потому что в этом определителе строчка с индексом τL (s) = i полностью нулевая.


2 Обозначение aM было определено формулой (12.5.239).
3 Обозначение τL определено правилом (12.1.31).
766 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Наоборот, если L = M , то под определителем будет стоять единичная матрица, и поэтому он


будет сам единичным:
 
haτL (1) , aτL (1) i ... haτL (1) , aτL (m) i
aτL (1) , ..., aτL (m) | aτL (1) , ..., aτL (m) = det  ... ... ... =
haτL (m) , aτL (1) i ... haτL (m) , aτL (m) i
 
haτL (1) , aτL (1) i ... 0
= det  ... ... ...  = 1.
0 ... haτL (m) , aτL (m) i

Теорема 13.1.12. Полилинейная форма (13.1.49) единственным образом продолжается до скаляр-


ного произведения на пространстве Vm (X) поливекторов степени m, удовлетворяющего тожде-
ству  
hx1 , y1 i . . . hx1 , ym i
x1 ∨ ... ∨ xm | y1 ∨ ... ∨ ym = det  . . . ... ...  (13.1.51)
hxm , y1 i . . . hxm , ym i
Модуль поливектора x1 ∨ · · · ∨ xm относительно такого скалярного произведения равен корню из
определителя Грама этих векторов:
v  
u
u hx1 , x1 i . . . hx1 , xm i p
u
x1 ∨ · · · ∨ xm = tdet  . . . ... . . .  = Gram(x1 , . . . , xm ) (13.1.52)
hxm , x1 i . . . hxm , xm i

Как следствие, справедливо неравенство:


p p
x1 ∨ · · · ∨ xm | y1 ∨ · · · ∨ ym 6 Gram(x1 , . . . , xm ) · Gram(y1 , . . . , ym ) (13.1.53)

Доказательство. 1. Зафиксируем ортонормированный базис a1 , ..., an в X. Пусть p, q ∈ Vm (X) –


произвольные поливекторы. Разложим их по базису a1 , ..., an как в формуле (12.5.264):
X X
p= pL · a∨L , q= q M · a∨M ,
card L=m card M=m

и положим
X X X
p | q := pL · q M · aL | aM = pM · q M (13.1.54)
card L=m card M=m
| {z } card M=m
( k (13.1.50)
0, L 6= M
1, L=M

Поскольку отображения p 7→ pL и q 7→ q L являются линейными функционалами (как коэффициенты


разложения вектора по базису), полученное отображение

(p, q) 7→ p | q

является билинейной формой на X. Она, очевидно, симметрическая, и положительно определенная,


потому что если p 6= 0, то какой-то коэффициент pL должен быть отличен от нуля, и поэтому
X  2
p | p := pL > 0.
card L=m

2. Покажем, что это скалярное произведение действительно продолжает полилинейную форму


(13.1.49). Если обозначить α(x1 , ..., xm , y1 , ..., ym ) = hx1 , ..., xm | y1 , ..., ym i и β(p, q) = hp|qi, то мы
получаем диаграмму
∨m ×∨m
Xm × X m
■■
/ Vm (X) × Vm (X)
■■ qq
■■
■ qqqq
α q
■$ xqqqq β
■■ q
R
§ 1. Евклидовы пространства 767

и нам остается доказать ее коммутативность, то есть что композиция отображений β ◦ ∨m × ∨m


совпадает с α:

?
β(∨m (x1 , ..., xm ), ∨m (y1 , ..., ym )) = x1 ∨ ... ∨ xm | y1 ∨ ... ∨ ym = x1 , ..., xm | y1 , ..., ym =
= α(x1 , ..., xm , y1 , ..., ym ).

Поскольку эти отображения полилинейны по аргументам x1 , ..., xm , y1 , ..., ym , это равенство доста-
точно доказать, подставляя вместо xk и yl элементы базиса a1 , ..., an :
?
ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = ak1 , ..., akm | al1 , ..., alm (13.1.55)

Заметим, что если в последовательности k1 , ..., km или в последовательности l1 , ..., lm есть повторя-
ющиеся индексы, то обе части равенства будут равны нулю, и оно выполняется автоматически:

ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = 0 = ak1 , ..., akm | al1 , ..., alm .

Поэтому важно проверить равенство в случае, когда в k1 , ..., km и l1 , ..., lm нет повторяющихся индек-
сов. Это, в свою очередь, сводится к случаю, когда последовательности k1 , ..., km и l1 , ..., lm строго
возрастают. Действительно, выбрав перестановки σ, τ ∈ Σm так, чтобы

kσ(1) < ... < kσ(m) , lτ (1) < ... < lτ (m) ,

мы получим, что равенство (13.1.55) превращается в равенство


?
sgn σ · sgn τ · akσ(1) ∨ ... ∨ akσ(m) | alτ (1) ∨ ... ∨ alτ (m) = sgn σ · sgn τ · akσ(1) , ..., akσ(m) | alτ (1) , ..., alτ (m)

и после сокращений, в равенство


?
akσ(1) ∨ ... ∨ akσ(m) | alτ (1) ∨ ... ∨ alτ (m) = akσ(1) , ..., akσ(m) | alτ (1) , ..., alτ (m)

Итак, можно считать, что последовательности индексов k1 , ..., km и l1 , ..., lm строго возрастают.
Тогда они представляют собой отображения нумерации4 τK и τL неких множеств K, L ⊆ {1, ..., n}.
Тогда при K 6= L мы получаем:

ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = a∨K | a∨L = (13.1.54) =


X
= (a∨K )M · (a∨L )M = 0 = (13.1.50) = aK | aL = ak1 , ..., akm | al1 , ..., alm ,
| {z } | {z }
card M=m
k k
 1 M  1 M
a∨K ( a ) a∨L ( a )
( k ( k
0, K=6 M 0, L 6= M
1, K=M 1, L=M
| {z }
k
0

а при K = L

ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = a∨K | a∨K = (13.1.54) =


X  2
= (a∨K )M = 1 = (13.1.50) = aK | aK = ak1 , ..., akm | al1 , ..., alm ,
| {z }
card M=m
k
 1 M
a∨K ( a )
( k
0, K 6= M
1, K =M

3. Покажем теперь, что скалярное произведение (p, q) 7→ p | q , удовлетворяющее тождеству


(13.1.51), единственно. Если (p, q) 7→ β(p, q) – какое-то другое скалярное произведение с тем же
свойством, то эти скалярные произведения должны совпадать на элементах нашего фиксированного
ранее базиса a1 , ..., am :

4 Отображение нумерации τN определено на с.667.


768 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

β ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm = (13.1.51) = ak1 , ..., akm | al1 , ..., alm =
= (13.1.51) = ak1 ∨ ... ∨ akm | al1 ∨ ... ∨ alm

Поскольку билинейные формы однозначно определяются своими значениями на базисе (формула


(12.3.131)), мы получаем, что эти формы совпадают всюду: β(p, q) = p | q .
4. Формулы (13.1.52) и (13.1.53) теперь следуют из общих свойств скалярного произведния.

Следствие 13.1.13. Справедливо неравенство

|x ∨ y| 6 |x| · |y| (13.1.56)

Доказательство. p
|x ∨ y| = (13.1.52) = Gram(x, y) 6 (13.1.39) 6 |x| · |y|

(f) Изометрии и движения


Изометрии и теорема о представлении.

Теорема 13.1.14. Для отображения евклидовых пространств ϕ : X → Y следующие условия


эквивалентны:
(i) ϕ линейно и сохраняет скалярное произведение:

hϕ(x), ϕ(y)i = hx, yi, x, y ∈ X. (13.1.57)

(ii) ϕ сохраняет нуль


ϕ(0) = 0 (13.1.58)
и модуль
|ϕ(x)| = |x| . (13.1.59)

Доказательство. 1. (i)⇒(ii). Если ϕ : X → X удовлетворяет условию (i), то оно сохраняет нулевой


вектор, как любой линейный оператор. С другой стороны,
2 2
|ϕ(x)| = hϕ(x), ϕ(x)i = (13.1.57) = hx, xi = |x| ,

и это равносильно тождеству (13.1.59).


2. (i)⇐(ii). Наоборот, пусть ϕ : X → X удовлетворяет (ii). Тогда сразу видно, что ϕ удовлетворяет
также тождеству (13.1.57), потому что

2 2 2 2 2 2
|ϕ(x)| + |ϕ(y)| − |ϕ(x) − ϕ(y)| |ϕ(x)| + |ϕ(y)| − |ϕ(x − y)|
ϕ(x), ϕ(y) = (13.1.1) = = =
2 2
2 2 2
|x| + |y| − |x − y|
= (13.1.59) = = (13.1.1) = hx, yi.
2
Нужно только еще проверить, что ϕ – линейный оператор. Для этого зафиксируем какой-нибудь
ортогональный нормированный базис e (существование которого гарантируется теоремой 13.1.6).
Из уже доказанного свойства (13.1.57) следуют равенства
(
1, i = j
ϕ(ei ), ϕ(ej ) = hei , ej i =
0, i 6= j

означающие, что векторы ϕ(e1 ), ..., ϕ(en ) тоже образуют ортогональный нормированный базис в X.
Теперь для всякого вектора x ∈ X мы получаем
n
X n
X
ϕ(x) = hϕ(x), ϕ(ei )i · ϕ(ei ) = (13.1.57) = hx, ei i · ϕ(ei )
i=1 i=1

Отсюда мы получаем:
§ 1. Евклидовы пространства 769

n
X n
X 
ϕ(α · x + β · y) = hα · x + β · y, ei i · ϕ(ei ) = α · hx, ei i + β · hy, ei i · ϕ(ei ) =
i=1 i=1
n
X n
X
=α· hx, ei i · ϕ(ei ) + β · hy, ei i · ϕ(ei ) = α · ϕ(x) + β · ϕ(y)
i=1 i=1

то есть ϕ – линейное отображение.


• Отображение евклидовых пространств ϕ : X → Y называется изометрией, или ортого-
нальным отображением, если оно удовлетворяет условиям (i) и (ii) теоремы 13.1.14.
• Если дополнительно ϕ : X → Y биективно, то оно называется изоморфизмом (евклидовых
пространств).
• Говорят, что два евклидовых пространства X и Y изоморфны, если существует изомор-
физм (евклидовых пространств) ϕ : X → Y .
Теорема 13.1.15. Пусть ϕ : X → Y – изометрия евклидовых пространств. Тогда следующие
условия эевивалентны:
(a) пространства X и Y имеют одинаковую размерность
dim X = dim Y,
(b) ϕ : X → Y является биекцией (и значит, изоморфизмом).
Доказательство. 1. Заметим, что всякая изометрия ϕ инъективна, потому что
x 6= 0 =⇒ 0 6= |x| = |ϕ(x)| =⇒ ϕ(x) 6= 0.
Отсюда следует, что если X и Y имеют одинаковую размерность, то по следствию 12.2.13, ϕ является
биекцией.
2. Наоборот, если ϕ – биекция, то всякий базис a = (a1 , ..., an ) в X она превращает в базис
(ϕ(a1 ), ..., ϕ(an )) в Y , поэтому размерность у Y будет та же, что у X.
Вспомним пример 13.1.1, в котором объяснялось, что коордлинатное пространство Rn является
евклидовым. Следующая теорема очень важна, потому что показывает, что с точки зрения этой
науки, структурно, то есть на уровне эффектов, которые можно различить с помощью описанных
в определении структур – суммы, умножения на скаляр, размерности и скалярного произведения –
никаких других евклидовых пространств не существует.
Теорема 13.1.16 (о представлении евклидова пространства). Всякое евклидово пространство X
изоморфно некоторому координатному пространству Rn .
Доказательство. Выберем в X какой-нибудь ортогональный нормированный базис e = (e1 , ..., en )
и рассмотрим отображение ϕ : X → Rn , которое всякому вектору x ∈ X ставит в соответствие
столбец его коэффициентов в разложении по базису e = (e1 , ..., en ):
 
hx, e1 i
ϕ(x) =  ...  .
hx, en i
Оно, понятное дело, сохраняет нуль, ϕ(0) = 0. С другой стороны, оно сохраняет модуль:
  v
hx, e1 i u n
uX
= (13.1.3) = t
  2
|ϕ(x)| = ... hx, ei i = (13.1.18) = |x| .
hx, en i i=1

Значит, оно является изометрией. Вдобавок, поскольку размерность Rn такая же как у X, по тео-
реме 13.1.15, ϕ является биекцией, и значит, изоморфизмом евклидовых пространств (впрочем,
биективность ϕ видна из его определения).

Движения в евклидовом пространстве. Отображение Φ : X → X евклидова пространства X


в себя называется движением в X, если оно сохраняет расстояние, то есть если для любых x, y ∈ X
выполняется равенство
|Φ(x) − Φ(y)| = |x − y| . (13.1.60)
770 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

⋄ 13.1.2. Сдвиг. Простейшим примером движе- где a – некоторый фиксированный вектор в X.


ния является сдвиг на вектор, то есть отображе-
ние вида ⋄ 13.1.3. Изометрии. Всякая изометрия ϕ :
X → X является движением, потому что

Ψ (x) = x + a, x ∈ X, |ϕ(x) − ϕ(y)| = |ϕ(x − y)| = |x − y| .

Теорема 13.1.17. Всякое движение Φ в евклидовом пространстве представимо в виде компози-


ции сдвига и изометрии:
Φ(x) = ϕ(x) + a, x ∈ X. (13.1.61)
Доказательство. Обозначим a = Φ(0) и рассмотрим отображение ϕ : X → X, действующее по
формуле
ϕ(x) = Φ(x) − a, x ∈ X.
Оно сохраняет нуль (то есть удовлетворяет условию (13.1.58)), потому что

ϕ(0) = Φ(0) − a = 0.

С другой стороны, но является движением, будучи композицией двух движений: Φ и сдвига на


вектор −a. Отсюда следует, что оно сохраняет модуль:

|ϕ(x)| = |ϕ(x) − 0| = (13.1.58)) = |ϕ(x) − ϕ(0)| = |x − 0| = |x| .

То есть ϕ удовлетворяет также условию (13.1.59). Поэтому по теореме 13.1.14, ϕ является изомет-
рией.
Следствие 13.1.18. Всякое движение Φ : X → X в евклидовом пространстве X является биек-
цией.
Доказательство. Разложим Φ в композицию изометрии и сдвига, по теореме 13.1.17:

Φ(x) = ϕ(x) + a, x ∈ X.

По теореме 13.1.15 изометрия ϕ является биекцией. С другой стороны, отображение сдвига y 7→ y +a


тоже является биекцией. Значит, Φ является биекцией (как композиция двух биекций).

§2 Топология евклидова пространства


Пусть X – евклидово пространство.
• Открытой окрестностью точки x ∈ X радиуса r > 0 (или просто окрестностью, или
открытым шаром с центром x ∈ X радиуса r > 0) называется множество точек y из X,
расстояние от которых до x меньше r:
n o
Ur (x) = y ∈ Rn : |y − x| < r

• Выколотой открытой окрестностью точки x ∈ X радиуса r > 0 называется множество


точек y 6= x из X, расстояние от которых до x меньше r:
n o
U̇r (x) = y ∈ X : y 6= x & |y − x| < r

• Замкнутой окрестностью точки x ∈ X радиуса r > 0 (или замкнутым шаром с центром


в точке x ∈ X радиуса r > 0) называется множество точек y из X, расстояние от которых
до x не превосходит r: n o
Br (x) = y ∈ X : |y − x| 6 r
§ 2. Топология евклидова пространства 771

⋄⋄ 13.2.1. В случае n = 1 окрестность Ur (x) бу- (без границы) на плоскости Rn с центром в x:


дет интервалом на прямой R с центром в x (и
именно так мы ее определили на с.207):
Ur (x) = (x − ε, x + ε)

Наконец, в случае n = 3 окрестность Ur (x) будет


шаром (без границы) в трехмерном пространстве
R3 с центром в x:

А в случае n = 2 окрестность Ur (x) будет кругом

(a) Сходимость последовательности в евклидовом пространстве


• Пусть X – евклидово пространство и пусть каждому натуральному числу m ∈ N по
какому-нибудь правилу поставлена в соответствие точка xm ∈ X. Тогда говорят, что
задана последовательность точек {xm } из X.
• Последовательность точек {xm } из X называется сходящейся к точке x ∈ X,

xm −→ x
m→∞

если расстояние между xm и x стремится к нулю:

|xm − x| −→ 0 (13.2.62)
m→∞

Предложение 13.2.1. В пространстве Rn по- ⋄ 13.2.2. Покажем, что последовательность


 на
следовательность xm стремится к x, если она 1 πm 1 πm
плоскости Am = m cos 2 ; m sin 2 стремится
стремится к x по каждой координате:
к точке 0 = (0; 0).
∀ i = 1, ..., n xim −→ xi (13.2.63) 1 πm 1 πm 
m→∞ Am = cos ; sin −→ (0, 0) = 0
m 2 m 2 m→∞
Доказательство.

|xm − x| −→ 0
m→∞

m
r 2  2
x1m − x1 + ... + xnm − xn −→ 0
m→∞

m Это можно сделать двумя способами. Первый


способ – это проверить, что расстояние между
∀ i = 1, ..., n 0 6 xim − xi −→ 0 Am и 0 стремится к нулю:
m→∞

m |Am | =
s 2  2
1 πm 1 πm
∀ i = 1, ..., n xim − xi −→ 0 = cos −0 + sin −0 =
m→∞ m 2 m 2
r
m 1 πm πm 1
= cos2 + sin2 = −→ 0
m 2 2 m m→∞
∀ i = 1, ..., n xim −→ xi
m→∞
Второй способ – проверить, что каждая коорди-
ната точки Am стремится к соотвествующей ко-
772 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

ординате точки 0: показать, что расстояние между Am и 0 не стре-


мится к нулю,
1 πm 1 πm
cos −→ 0, sin −→ 0, r
m 2 m→∞ m 2 m→∞ 2  2
πm πm
Это можно считать очевидным. |Am | = cos − 0 + sin −0 =
2 2
r
⋄ 13.2.3. Наоборот, покажем, что последова-  πm πm
= cos2 + sin2 = 1 6−→ 0
тельность на плоскости Am = cos πm 2 ; sin πm
2
2 2 m→∞

не стремится к точке 0 = (0; 0): либо убедиться, что какая-нибудь из координат


 πm πm  точки Am не стремится к соответствующей коор-
Am = cos ; sin 6−→ (0, 0) = 0
2 2 m→∞ динате точки 0. В данном случае обе координаты
не будут стремиться куда надо:
πm πm
cos 6−→ 0 sin 6−→ 0
2 m→∞ 2 m→∞

⊲⊲ 13.2.4. Проверьте справедливость следую-


щих соотношений.
 1 
1) e m ; 2m+1
m+2 −→ (1; 2)
m→∞
 
Это тоже можно сделать двумя способами: либо 2) ln m+1
ln m+2 , ln m+1
m+2 −→ (1; 2).
m→∞

Теорема 13.2.2. Для последовательности {xm } в евклидовом пространстве X следующие условия


эквивалентны:
(i) xm стремится к x в X,
xm −→ x;
m→∞

(ii) для любого базиса e = (e1 , ..., em ) в Y последовательность xm стремится к x покоорди-


натно  i  i
1 1
(xm ) −→ (x);
e m→∞ e

(ii) для какого-то базиса e = (e1 , ..., em ) в Y последовательность xm стремится к x покоор-


динатно  i  i
1 1
(xm ) −→ (x).
e m→∞ e

(b) Внутренность и открытые множества в евклидовом пространстве


Внутренние точки. Пусть E – какое-нибудь множество в евклидовом пространстве X. Точка
x ∈ E называется внутренней точкой множества E, если некоторая окрестность Uε (x) точки x
содержится в множестве E.
∃ε > 0 Uε (x) ⊆ E

⋄ 13.2.5. Рассмотрим на плоскости R2 множе- для E, потому что ее окрестность U 12 (A) (с ра-
ство точек с неотрицательной ординатой: диусом ε = 21 ) содержится в множестве E. Более
n o
того, любая точка B(x; y) с ординатой y > 0 то-
E = (x; y) : y > 0
же будет внутренней для E (потому что в этом
случае можно взять ε = y2 ).
Наоборот, точка C(0; 0) не будет внутренней
для E потому что никакая ее окрестность не бу-
дет содержаться в E.

Точка A(0; 1), например, является внутренней


§ 2. Топология евклидова пространства 773

Теорема 13.2.3 (о секвенциальной характеризации внутренних точек). Пусть даны множество


E и точка x в евклидовом пространстве X. Тогда следующие условия эквивалентны:
(i) x есть внутренняя точка для множества E;
(ii) если какая-нибудь последовательность {xm } сходится к x в X, то почти все ее элемен-
ты xm лежат в E:
xm −→ x =⇒ ∃N ∀m > N xm ∈ E
m→∞

Доказательство. 1. (i) ⇒ (ii) Пусть x – внутренняя точка для множества E, то есть


∃ε > 0 Uε (x) ⊆ E
Зафиксируем это число ε. Пусть xm – произвольная последовательность, стремящаяся к x, то есть
|xm − x| −→ 0
m→∞

Тогда для почти всех индексов m ∈ N должно выполняться условие


|xm − x| < ε
то есть, условие
xm ∈ U (x)
Отсюда получаем, что
xm ∈ Uε (x) ⊆ E
для почти
/ всех/ индексов m ∈ N. Мы доказали, что из (i) следует (ii).
2. (i) ⇒ (ii)
Предположим, что наоборот, x не является внутренней точкой множества E, то есть никакая ее
окрестность не содержится в E:
∀ε > 0 Uε (x) 6⊆ E
В частности, окрестности вида U m1 (x) тоже не должны содержаться в E.
∀m ∈ N U m1 (x) 6⊆ E
Это значит, что для всякого m можно выбрать точку xm так чтобы
xm ∈ U m1 (x) & xm ∈
/E
Теперь получаем логическую цепочку:
xm ∈ U m1 (x)

1
0 6 |xm − x| < −→ 0
m m→∞

|xm − x| −→ 0
m→∞

xm −→ x
m→∞
Таким образом, имеется последовательность {xm } которая стремится к точке x ∈ E, и при этом,
ни один ее элемент не заходит в множество E:
xm ∈
/E
Значит, (ii) не выполняется. Мы получили, что если (i) не выполняется, то (ii) тоже не выполняется.

Внутренность множества. Внутренностью Int(E) множества E в евклидовом пространстве X


называется множество всех внутренних точек множества E:
n o n o
Int(E) = x ∈ X : x – внутренняя точка для E = x ∈ X : ∃ε > 0 Uε (x) ⊆ E
774 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
n o
⊲⊲ 13.2.6. Найдите внутренность следующих 3) E = (x; y) : x = 0 & 0 < y < 1 ;
множеств: n o
4) E = (x; y) : 0 6 x 6 1 & 0 6 y 6 x ;
n o n o
1) E = (x; y) : 0 6 x 6 1 & 0 6 y 6 1 ; 5) E = (x; y) : 0 6 x 6 1 & x 6 y 6 2x ;
n o n  o
1
2) E = (x; y) : 0 < x < 1 & 0 < y < 1 ; 6) E = 0; m ; m∈N .

Теорема 13.2.4. Операция перехода к внутренности E 7→ Int(E) в евклидовом пространстве X


обладает следующими свойствами:
(i) Int(X) = X;
(ii) Int(E) ⊆ E;
(iii) Int(D ∩ E) = Int(D) ∩ Int(E);
 
(iv) Int Int(E) = Int(E).

Открытые множества. Множество E в евклидовом пространстве X называтся открытым, если


любая его точка x ∈ E является внутренней для E:

∀x ∈ E ∃ε > 0 Uε (x) ⊆ E

Теорема 13.2.5. Множество E ⊆ X открыто тогда и только тогда, когда оно совпадает со
своей внутренностью:
E – открыто ⇐⇒ Int(E) = E

Теорема 13.2.6. Внутренность Int(E) произвольного множества E ⊆ X есть наибольшее от-


крытое множество, содержащееся в E.

⋄ 13.2.7. Покажем, что любой интервал (a, b) на разом, любая точка x ∈ (a, b) автоматически яв-
прямой R является открытым множеством. Возь- ляется внутренней точкой для (a, b), значит (a, b)
мем какую-нибудь
n o x ∈ (a, b), и положим действительно является открытым множеством.
точку
ε = min |x − a|, |b − x| .
Предложение 13.2.7. На прямой R всякое от-
крытое множество U представляет собой объ-
единение некоторой последовательности (воз-
можно, конечной) интервалов:

[
U= (ai , bi )
i=1

⊲ 13.2.8. Проверьте, что из множеств на плос-


Тогда окрестность Uε (x) = (x − ε, x + ε) будет кости
лежать в (a, b): n o n o
Uε (x) = (x − ε, x + ε) ⊆ (a, b) E = (x; y) : y > 0 , N = (x; y) : y > 0

то есть x – внутренняя точка для (a, b). Таким об- второе открыто, а первое – нет.

Из теоремы 3.2 следует, что открытые множества характеризуются тем свойством, что после-
довательность, стремящаяся к какой-нибудь точке такого множества, обязательно заходит в это
множество:

Теорема 13.2.8 (о секвенциальной характеризации открытых множеств). Для множества E в


евклидовом пространстве X следующие условия эквивалентны.
(i) множество E открыто;
§ 2. Топология евклидова пространства 775

(ii) если какая-нибудь последовательность {xm } сходится в Rn , и ее предел x лежит в E,


то почти все ее элементы xm лежат в E:

xm −→ x ∈ E =⇒ ∃N ∀m > N xm ∈ E
m→∞

Доказательство. 1. (i) ⇒ (ii) Пусть xm – какая-нибудь последовательность, стремящаяся к


какой-нибудь точке x ∈ E. Если E открыто, то x будет внутренней точкой для E (как любая
другая точка из E), поэтому по теореме 3.2, почти все xm должны лежать в E.
2. (ii) ⇒ (ii) Пусть выполняется (ii), и пусть x – какая-нибудь точка из E. Если xm – какая-
нибудь последовательность, стремящаяся к x, то по условию (ii), почти все ее элементы должны
лежать в E. Значит, по теореме 3.2, x – внутренняя точка для E. Мы получили, что любая точка
x ∈ E является внутренней точкой для E. Значит, E – открытое множество.

⊲ 13.2.9. Определите, какие из множеств упраж- нения 13.2.6 будут открытыми.

Свойства открытых множеств


1◦ . Объединение любого семейства открытых множеств снова является открытым мно-
жеством:
n o [
Ui , i ∈ I − открытые множества =⇒ Ui − тоже открытое множество
i∈I

2◦ . Пересечение любых двух открытых множеств тоже является открытым множеством

U, V − открытые множества =⇒ U ∩ V − тоже открытое множество

(c) Замыкание и замкнутые множества


Точки прикосновения. Пусть E – какое-нибудь множество в Rn . Точка x ∈ Rn называется
точкой прикосновения множества E, если всякая окрестность Uε (x) точки x содержит какую-нибудь
точку множества E:
∀ε > 0 ∃y ∈ E ∩ Uε (x)
Это условие можно переписать по-другому:

∀ε > 0 E ∩ Uε (x) 6= ∅

(то есть требуется, чтобы пересечение E ∩ Uε (x) множества E с любой окрестностью Uε (x) было
непусто).


⋄ 13.2.10. Рассмотрим на плоскости R2 множе- 0; 2ε , или саму точку C(0, 0)). Более того, лю-
ство точек с неотрицательной ординатой: бая точка B(x; y) с ординатой y > 0 будет точкой
n o прикосновения для E (потому что в этом случае
E = (x; y) : y > 0 B ∈ E ∩ Uε (B)).
Наоборот, точка D(0; −1) не будет точкой
Точка C(0, 0) является точкой прикосновения прикосновения для E, потому что, например, ее
для E, потому что любая ее окрестность Uε (C) окрестность U 12 (D) (с радиусом ε = 21 ) не будет
содержит точки множества E (например, точку пересекаться с E.

Теорема 13.2.9 (о секвенциальной характеризации точек прикосновения). Пусть даны множе-


ство E и точка x в Rn . Тогда следующие условия эквивалентны:
(i) x – точка прикосновения для множества E;
776 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

(ii) существует последовательность {xm } элементов из E, стремящаяся к x:


x ←− xm ∈ E
∞←m | {z }
выполняется
для всех m

(iii) существует последовательность {xm } стремящаяся к x, у которой почти все элемен-


ты лежат в E:
x ←− xm ∈ E
∞←m | {z }
выполняется
для почти всех m

Доказательство. 1. (i) ⇒ (ii) Пусть x – точка прикосновения для E, то есть такая точка, у
которой всякая окрестность Uε (x) пересекается с E.
∀ε > 0 E ∩ Uε (x) 6= ∅
В частности, это должно выполняться для окрестностей вида U m1 (x).
∀m ∈ N E ∩ U m1 (x) 6= ∅
Значит, можно выбрать точки xm :
xm ∈ E ∩ U m1 (x)
Мы получим некоторую последовательность {xm }. Покажем, что она стремится к x. Для этого
выпишем логическую цепочку:
xm ∈ U m1 (x)

1
0 6 |xm − x| < −→ 0
m m→∞

|xm − x| −→ 0
m→∞

xm −→ x
m→∞
2. Импликация (ii) ⇒ (iii) очевидна.
3. (iii) ⇒ (i) Пусть наоборот, имеется последовательность {xm } стремящаяся к x, у которой
почти все элементы лежат в E.
xm −→ x, & ∃N ∀m > N xm ∈ E (13.2.64)
m→∞

Тогда мы получим цепочку:


xm −→ x
m→∞

|xm − x| −→ 0
m→∞

∀ε > 0 ∃K ∀m > K |xm − x| < ε

∀ε > 0 ∃K ∀m > K xm ∈ Uε (x)

 
вспоминаем про N из условия (13.2.64)

∀ε > 0 ∃K ∀m > max{K, N } xm ∈ Uε (x)

∀ε > 0 ∃m xm ∈ Uε (x)
Мы получили, что в любой окрестности Uε (x) точки x найдется некоторая точка xm (m > N ) из
множества E. Значит, x – точка прикосновения для E.
§ 2. Топология евклидова пространства 777

Замыкание множества. Замыканием E множества E ⊆ Rn называется множество всех точек


прикосновения множества E:
n o n o
E = x ∈ Rn : x – точка прикосновения для E = x ∈ Rn : ∀ε > 0 Uε (x) ∩ E =
6 ∅

⊲ 13.2.11. Найдите замыкания множеств из упражнения 13.2.6.


Теорема 13.2.10. Операция перехода к замыканию E 7→ E обладает следующими свойствами:
(i) ∅ = ∅
(ii) E ⊆ E
(iii) D∪E =D∪E
(iv) E=E

Замкнутые множества. Множество E в евклидовом пространстве X называется замкнутым,


если любая его точка прикосновения x ∈ X обязательно лежит в E:
 
∀x ∈ Rn ∀ε > 0 E ∩ Uε (x) 6= ∅ =⇒ x ∈ E

Теорема 13.2.11. Множество E ⊆ X замкнуто тогда и только тогда, когда оно совпадает со
своим замыканием:
E – замкнуто ⇐⇒ E = E
Теорема 13.2.12. Замыкание E произвольного множества E ⊆ X есть наименьшее замкнутое
множество, содержащее E.

⋄ 13.2.12. Покажем, что любой отрезок [a, b] то есть x ∈ [a, b].


на прямой R является замкнутым множеством.
Возьмем какую-нибудь точку прикосновения x
для [a, b]. По теореме 13.2.9, найдется последо-
вательность точек xm ∈ [a, b] сходящаяся к x:

xm −→ x
m→∞

Поскольку xm ∈ [a, b], должны выполняться Мы получили, что любая точка прикосновения
неравенства x для [a, b] автоматически принадлежит [a, b],
то есть [a, b] действительно является замкнутым
множеством.
a 6 xm 6 b
⊲ 13.2.13. Проверьте, что из множеств на плос-
кости
Поэтому, по теореме о переходе к пределу в нера-
n o n o
венстве E = (x; y) : y > 0 , N = (x; y) : y > 0 ,

a6x6b первое замкнуто, а второе – нет.

Замкнутые множества, как и открытые, имеют характеризацию с помощью сходящихся последо-


вательностей. Именно, множество E замкнуто, если предел любой сходящейся последовательности,
лежащей в E тоже лежит в E:
Теорема 13.2.13 (о секвенциальной характеризации замкнутых множеств). Для множества E в
евклидовом пространстве X следующие условия эквивалентны:
(i) множество E замкнуто;
(ii) если какая-нибудь последовательность {xm } сходится в Rn , и все ее элементы лежат
в E, то предел этой последовательности лежит в E:
x ←− x ∈E =⇒ x∈E
∞←m | m{z }
выполняется
для всех m
778 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

(iii) если какая-нибудь последовательность {xm } сходится в Rn , и почти все ее элементы


лежат в E, то предел этой последовательности x лежит в E:

x ←− x ∈E =⇒ x∈E
∞←m | m{z }
выполняется
для почти всех m

Доказательство. 1. (i) ⇒ (ii) Пусть множество E замкнуто, покажем что тогда выполняется
(ii). Возьмем сходящуюся последовательность xm −→ x, почти все элементы которой лежат в E:
m→∞

∃N ∀m > N xm ∈ E

Тогда по теореме 13.2.9, x должна быть точкой прикосновения для E, значит, поскольку E замкнуто,
x ∈ E.
2. Импликация (ii) ⇒ (iii) очевидна.
3. (iii) ⇒ (i) Наоборот, пусть выполняется (ii), покажем что тогда множество E замкнуто.
Возьмем какую-нибудь точку прикосновения x для E. По теореме 13.2.9, найдется последователь-
ность {xm } стремящаяся к x
xm −→ x
m→∞

у которой почти все элементы лежат в E.

∃N ∀m > N xm ∈ E

По свойству (ii) это означает, что x ∈ E. Мы получили, что всякая точка прикосновения x для E
обязательно должна лежать в E. Значит E – замкнутое множество.

⊲ 13.2.14. Определите, какие из множеств упражнения 13.2.6 будут замкнутыми.

Свойства замкнутых множеств


1◦ . Пересечение любого семейства замкнутых множеств снова является замкнутым мно-
жеством:
n o \
Ci , i ∈ I − замкнутые множества =⇒ Ci − тоже замкнутое множество
i∈I

2◦ . Объединение любых двух замкнутых множеств тоже является замкнутым множе-


ством

C, D − замкнутые множества =⇒ C ∪ D − тоже замкнутое множество

(d) Двойственность между открытыми и замкнутыми множествами


Дополнения открытых и замкнутых множеств. Дополнением множества E в евклидовом
пространстве X называется разность множеств5 X и E, то есть множество всех точек x ∈ X, не
принадлежащих E: n o
X \E = x∈X : x∈ /E

⊲ 13.2.15. Найдите дополнения к множествами из упражнения 13.2.6.

Теорема 13.2.14. Пусть E – множество в евклидовом пространстве X. Тогда


– если E открыто в X, то его дополнение X \ E замкнуто в Rn ;
5 Разность множеств была определена формулой (0.3.171).
§ 2. Топология евклидова пространства 779

– если E замкнуто в X, то его дополнение X \ E открыто в Rn .


Доказательство. Обозначим буквой L дополнение к множеству E:
L = Rn \ E.
1. Пусть E открыто, то есть любая его точка – внутренняя. Отсюда следует, что если x – не внут-
ренняя точка для E, то x не принадлежит E:
x – не внутренняя точка для E =⇒ x∈
/E (13.2.65)
Запомним это, и покажем, что тогда L должно быть замкнуто.
Для произвольной точки прикосновения x множества L получается следующая логическая це-
почка:
x – точка прикосновения для L

∀ε > 0 ∃y ∈ L ∩ Uε (x)

∀ε > 0 ∃y : y∈L & y ∈ Uε (x)

∀ε > 0 ∃y : y∈
/E & y ∈ Uε (x)

∀ε > 0 Uε (x) 6⊆ E
⇓ (13.2.65)

x∈
/E

x∈L
Мы получили, что любая точка прикосновения x для множества L автоматически принадлежит L.
Это означает, что L – замкнутое множество.
2. Предположим, что наоборот, E замкнуто, то есть любая точка прикосновения x для E автома-
тически лежит в E. Отсюда следует, что если x не лежит в E, то x не является точкой прикосновения
для E:
x∈/ E =⇒ x – не точка прикосновения для E (13.2.66)
Запомним это, и покажем, что тогда L открыто.
Возьмем любую точку x из L. Получаем следующую логическую цепочку:
x∈L

x∈
/E
⇓ (13.2.66)

x – не точка прикосновения для E



∃ε > 0 E ∩ Uε (x) = ∅

∃ε > 0 Uε (x) ⊆ Rn \ E

∃ε > 0 Uε (x) ⊆ L

x – внутренняя точка для L
Мы получили, что любая точка x ∈ L автоматически является внутренней для L. Это означает, что
L – открытое множество.
780 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Разность открытых и замкнутых множеств. Разностью множеств D и E в евклидовом


пространстве X называется множество D \ E, состоящее из тех точек D, которые не попадают в E:

D \ E = {x ∈ D : x ∈
/ E}

Очевидно, разность связана с дополнением формулой


 
D \ E = D ∩ Rn \ E

Вместе с теоремой 13.2.14 эта формула делает очевидным следующее свойство разности множеств:
Теорема 13.2.15. Пусть U – открытое, а M – замкнутое множества в евклидовом простран-
стве X. Тогда
– разность U \ M – открытое множество в X;
– разность M \ U – замкнутое множество в X.

Двойственность между замыканием и внутренностью.


Теорема 13.2.16. Для всякого множества M в евклидовом пространстве X справедливы форму-
лы

Rn \ M = Rn \ Int(M ) (13.2.67)
n n
Int(R \ M ) = R \ M (13.2.68)

(e) Некоторые дополнительные понятия из топологии


Граница множества. Точка x в евклидовом пространстве X называется граничной точкой для
множества E ⊆ X, если любая ее окрестность Uε (x) содержит точки лежащие в E и точки не
лежащие в E:
∀ε > 0 Uε (x) ∩ E 6= ∅ & Uε (x)\E 6= ∅
Лемма 13.2.17 (о секвенциальной характеризации граничных точек). Точка x ∈ Rn тогда и толь-
ко тогда будет граничной точкой для множества E ⊆ Rn , когда существуют последовательно-
сти
xm ∈ E, xf m ∈
/E
такие, что
xm −→ x ←− xf
m
m→∞ ∞←m

• Границей Fr(E) множества E в евклидовом пространстве X называется множество всех


граничных точек множества E:
n o
Fr(E) = x ∈ X : x – граничная точка для E =
n o
= x ∈ X : ∀ε > 0 Uε (x) ∩ E 6= ∅ & Uε (x)\E 6= ∅

Теорема 13.2.18. Граница Fr(E) произвольного множества E ⊆ X есть разность между замы-
канием и внутренностью множества E:

Fr(E) = E \ Int(E)

Теорема 13.2.19. Для любых множеств A, B ⊆ X справедливы формулы:

Fr(A ∪ B) ⊆ Fr(A) ∪ Fr(B), Fr(A ∩ B) ⊆ Fr(A) ∪ Fr(B), Fr(A\B) ⊆ Fr(A) ∪ Fr(B) (13.2.69)

Ядро и нарост.
• Для всякого замкнутого множества E в евклидовом пространстве X
– его ядром называется замыкание его внутренности:

Nuc(E) = Int(E) (13.2.70)


§ 2. Топология евклидова пространства 781

– его наростом называется оставшаяся часть:

Rem(E) = E \ Nuc(E) = E \ Int(E) (13.2.71)

• Множество D в евклидовом пространстве X называется (замкнутой) областью в X, если


оно совпадает со своим ядром:

D = Nuc(D) = Int(D)

Всюду плотные множества.


• Множество M ⊆ X называется всюду плотным в X, если каждый открытый шар Ur (x)
содержит какую-нибудь точку этого множества. Это эквивалентно тому, что всякое от-
крытое множество U ⊆ X содержит какую-нибудь точку множества M .

⋄ 13.2.16. Множество Q рациональных чисел всюду плотно в Rn .


всюду плотно в R, потому что по теореме 2.2.32
всякий интервал (a, b) (и поэтому всякий интер-
⋄ 13.2.17. В противоположность этому, ника-
вал Ur (x) = (x−r, x+r)) содержит какую-нибудь
кой отрезок [α, β] (и никакой конечный интервал
точку из Q. Отсюда следует, что множество Qn
(α, β)) не будет всюду плотен в R, потому что
точек из Rn с рациональными координатами
если взять, например, интервал (β, β + 1), то в
 
x ∈ Qn ⇐⇒ x = x1 , x2 , ..., xn нем не будет содержаться элементов множества
[α, β] (и множества (α, β)). По тем же причинам,
& ∀i = 1, ..., n xi ∈ Q никакой шар не будет всюду плотен в Rn .

Теорема 13.2.20. Для множества M в евклидовом пространстве X следующие условия эквива-


лентны:
(i) M всюду плотно в X,
(ii) замыкание M совпадает с X:
M =X

(iii) дополнение к M в X имеет пустую внутренность:

Int(X \ M ) = ∅.

Доказательство. Эквивалентность (i)⇔(ii) очевидна, а (ii)⇔(iii) следует из (13.2.68).

Связные множества.
• Множество M в евклидовом пространстве X называется
— несвязным, если в X найдутся два непересекающихся открытых множества U
и V , объедиение которых содержит M :

M ⊆U ∪V & U ∩ V = ∅,

— связным, если таких множеств нет, то есть если любые два открытые множества
U и V в X, объедиение которых содержит M , обязательно пересекаются:

M ⊆U ∪V =⇒ U ∩ V 6= ∅.

• Компонентой связности множества M в X называется всякое связное подмножество A


в M , которое не содержится ни в каком другом связном подмножестве B из M .
782 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

§3 Компактность и паракомпактность
(a) Ограниченные множества
• Множество E в евклидовом пространстве X называется ограниченным, если оно содер-
жится в некотором шаре Br (0):

∃r > 0 E ⊆ Br (0)

Это равносильно условию


sup |x| < ∞
x∈E

или условию конечности следующей величины, называемой диаметром множества E:

diam E = sup |x − y|
x,y∈E

Ограниченные последовательности и теорема Больцано-Вейерштрасса. Последователь-


ность {xm } в евклидовом пространстве X называется ограниченной, если

sup |xm | < ∞


m∈N

Как и в случае R, в произвольно евклидовом пространсрве X бывает полезно вместе с последо-


вательностями рассматривать также их подпоследовательности. Напомним, как они определяются.
• Пусть нам дана какая-то последовательность точек в евклидовом пространстве X

xm

и пусть кроме того дана бесконечно большая последовательность натуральных чисел:

mk −→ +∞
k→∞

Тогда можно рассмотреть последовательность yk = xmk (зависящую от индекса k). Она


называется подпоследовательностью последовательности xm .

Свойства подпоследовательностей
1◦ . Если последовательность {xm } стремится к точке a ∈ X, то любая ее подпоследователь-
ность {xmk } тоже стремится к a:

xm −→ a =⇒ xmk −→ a
m→∞ k→∞

2◦ . Если последовательность {xm } не стремится к точке a ∈ X, то найдется такая подпосле-


довательность {xmk } и такое число ε > 0, что расстояние от xmk до a больше ε:

xm 6−→ a =⇒ ∃ε > 0 ∀k |xmk − a| > ε


m→∞

3◦ . Если последовательность {xm } неограничена, то она содержит некоторую бесконечно


большую подпоследовательность:

sup |xm | = +∞ =⇒ ∃xmk −→ ∞


m∈N k→∞

Теорема 13.3.1 (Больцано-Вейерштрасса). Всякая ограниченная последовательность {xm } в ев-


клидовом пространстве X имеет сходящуюся подпоследовательность {xmk }.
Для доказательства нам понадобится следующие определение и лемма после него.
• Клеткой в пространстве Rn называется множество вида

[a1 , b1 ] × [a2 , b2 ] × ... × [an , bn ] = {x ∈ Rn : ∀i = 1, ...n x(i) ∈ [ai , bi ]}

где [a1 , b1 ],...,[an , bn ] – отрезки в R, называемые ребрами этой клетки.


§ 3. Компактность и паракомпактность 783

Лемма 13.3.2. Всякое ограниченное множество E в Rn содержится в некоторой клетке K с


ребрами, не превосходящими по длине диаметра E.

Доказательство. Поскольку B ограничено, каждая его проекция на координатную ось

B i = {xi ; x ∈ B}, i = 1, ..., n

является ограниченным множеством в R. Обозначим через ai и bi нижнюю и верхнюю грани этого


множества:
ai = inf B i , bi = sup B i

и положим:
K = {x ∈ Rn : xi ∈ [ai , bi ]}

Тогда, во-первых,
v
uX
u n
∀i = 1, ..., n ∀x, y ∈ B |y − x | 6 t
i i
|y j − xj |2 = |y − x| 6 diam B
j=1

∀i = 1, ..., n bi − ai = sup y i − inf xi = sup |y i − xi | 6 diam B


y∈B x∈B x,y∈B

И, во-вторых,
∀i = 1, ..., n B i ⊆ [ai , bi ]

B ⊆ {x ∈ Rn : xi ∈ [ai , bi ]}

Доказательство теоремы 13.3.1. По теореме о представлении 13.1.16, X изоморфно некоторому


пространству Rn . Поэтому можно считать, что X = Rn . Пусть {xm } – ограниченная последователь-
ность в Rn . По лемме 13.3.2, {xm } содержится в некоторой клетке [a1 , b1 ] × ... × [an , bn ]. Рассмотрим
первые координаты {x1m } векторов {xm }. Они содержатся в отрезке [a1 , b1 ]:

x1m ⊆ [a1 , b1 ].

По теореме 3.2.13 Больцано-Вейерштрасса для R, последовательность {x1m } содержит сходящуюся


подпоследовательность x1mk . Если перейти от исходной последовательности {xm } к подпоследова-
тельности {xmk }, то в ней уже первая координата x1mk будет сходиться. Поэтому можно считать,
что нам с самого начала была дана последовательность {xm }, у которой первая координата {x1m }
сходится. Тогда точно так же мы рассматриваем вторую координату {x2m }, и, поскольку она лежит
в отрезке [a2 , b2 ], она по теореме 3.2.13 Больцано-Вейерштрасса для R, имеет сходящуюся подпосле-
довательность x2mk . Опять переходя от {xm } к {xmk }, мы получаем последовательность, у которой
уже первые две координаты x1mk и x2mk сдодятся, и это означает, что мы с самого начала могли
считать, что у исходной последовательности {xm } первые две координаты сходились. И так да-
лее. Применяя этот прием, мы получим подпоследовательность {xmk }, у которой все координаты
сходятся, и по предложению 13.2.1, это означает, что последовательность {xmk } сходится.

Теорема 13.3.3 (секвенциальная характеризация ограниченных множеств). Для множества E в


евклидовом пространстве X следующие условия эквивалентны:

(i) множество E ограничено;


(ii) всякая последовательность {xm } элементов множества E ограничена.
784 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

(b) Компактные множества


Определение компакта и примеры Множество K в евклидовом пространстве X называется
компактным множеством (или компактом) если всякая последовательность его точек

xm ∈ K

имеет сходящуюся подпоследовательность

xmk −→ x
k→∞

причем ее предел x принадлежит K:


x∈K

⋄ 13.3.1. Полуинтервал на прямой [0, +∞) не бу- на иметь сходящуюся подпоследовательность


дет компактом, например, потому что он содер- {xmk }:
жит последовательность точек xm = m, у кото- xmk −→ x
k→∞
рой нет сходящихся подпоследовательностей.
⋄ 13.3.2. Интервал (0, 1) на прямой R не будет При этом, поскольку [a, b] – замкнутое множе-
компактом, например, потому что он содержит ство в R (в силу примера 13.2.12), предел лю-
последовательность точек xm = 2m 1
, у которой бой последовательности его элементов должен
любая подпоследовательность сходится к точке лежать в [a, b]. В частности предел x последо-
0, которая не принадлежит множеству (0, 1). Та- вательности xmk ∈ [a, b] тоже лежит в [a, b]:
ким же образом доказывается, что любой интер-
x ∈ [a, b]
вал (a, b) не является компактом.
⋄ 13.3.3. Любой отрезок [a, b] на прямой R Мы получили, что любая последовательность
будет компактом, потому что если взять по- xm ∈ [a, b] имеет сходящуюся подпоследователь-
следовательность точек xm ∈ [a, b], то по тео- ность xmk , предел которой тоже лежит в [a, b].
реме Больцано-Вейерштрасса 3.2.13, она долж- Значит [a, b] – действительно компакт.

Критерий компактности

Теорема 13.3.4 (критерий компактности). Множество K в евклидовом пространстве X тогда


и только тогда компактно, когда оно
(a) замкнуто и
(b) ограничено.

Доказательство. 1. Пусть K компактно, покажем что тогда оно замкнуто и ограничено.


a) Пусть x – точка прикосновения множества K. По теореме 13.2.9, должна существовать по-
следовательность xm ∈ K, сходящаяся к x:

xm −→ x
m→∞

Поскольку K компактно, найдется подпоследовательность xmk , сходящаяся к некоторому элементу


y ∈ K:
xmk −→ y ∈ K
k→∞

С другой стороны, любая подпоследовательность xmk сходящейся последовательности xm будет


иметь тот же предел, что и xm :
xmk −→ x
k→∞

Значит, x = y, и поэтому x ∈ K. Таким образом, мы получили, что любая точка прикосновения x


множества K обязательно принадлежит K. Это значит, что K – замкнутое множество.
b) Предположим, что K не ограничено, то есть K не содержится ни в одном шаре с центром в
нуле 0:
∀r > 0 K 6⊆ Ur (0)
§ 3. Компактность и паракомпактность 785

Тогда, в частности, K не будет содержаться ни в одном шаре вида Um (0), m ∈ N:

∀m ∈ N K 6⊆ Um (0)

Это значит, что для всякого m ∈ N можно выбрать точку xm ∈ K которая не будет лежать в Um (0):

∀m ∈ N xm ∈ K & xm ∈
/ Um (0)

Рассмотрим последовательность xm . Условие xm ∈


/ Um (0) означает, что

|xm | > m

и поэтому {xm } стремится к бесконечности:

|xm | −→ +∞
m→∞

Ясно, что тогда любая подпоследовательность {xmk } тоже будет стремиться к бесконечности:

|xmk | −→ +∞
k→∞

и поэтому {xmk } не может сходиться ни к какому x:

|xmk | 6 |xmk − x| + |x|


|xmk − x| > |xmk | − |x| −→ +∞ − |x| = +∞
k→∞


|xmk − x| −→ +∞
k→∞

Мы получили, что имеется последовательность точек xm ∈ K, у которой никакая подпоследова-


тельность {xmk } не сходится. Значит, K не может быть компактом.
Таким образом, если предположить, что K не ограничено, то получится, что K – не компакт.
Значит K ограничено.
2. Пусть наоборот, K замкнуто и ограничено, покажем, что тогда K должно быть компактом.
Пусть {xm } – какая-нибудь последовательность точек из K. Поскольку K ограничено, последова-
тельность {xm } тоже должна быть ограничена. Значит, по теореме Больцано-Вейерштрасса 13.3.1,
{xm } содержит некоторую сходящуюся подпоследовательность {xmk }:

xmk −→ x
k→∞

При этом, поскольку xmk ∈ K, а K – замкнутое множество, по теореме 13.2.13 получаем что x ∈ K.
Мы доказали, что всякая последовательность {xm } точек из K содержит подпоследовательность
{xmk }, сходящуюся к точке из K. Это значит, что K – компактное множество.
Следствие 13.3.5. Замкнутое подмножество в компакте само является компактом.
Доказательство. Если A – компакт в Rn и B – замкнутое подмножество в A, то B замкнуто и
ограничено в Rn , и значит, по критерию компактности 13.3.4 B тоже является компактом.

⋄ 13.3.4 (сходящиеся последовательности как является компактом в Rn (потому что оно за-
компакты). Из теоремы 13.3.4 следует, что ес- мкнуто и ограничено).
ли {xk } – сходящаяся последовательность в Rn ,
и x – ее предел, Сходящиеся последовательности могут счи-
таться примерами “сложно устроенных” компак-
xk −→ x, тов, потому что, если xk попарно не совпадают,
k→∞
то множество то M состоит из бесконечного набора компонент
связности6 – отдельно стоящих точек xk (и x, ес-
M = {x} ∪ {xk ; k ∈ N} ли она не совпадает ни с какой xk ).
6 Компоненты связности были определены на с.781.
786 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Отделимость компакта.
Теорема 13.3.6 (об отделимости компакта). Пусть E и K – непересекающиеся множества в
евклидовом пространстве X
K ∩E =∅ (13.3.72)
причем K – компакт, а E – замкнуто в X. Тогда найдется такое число ε > 0 что расстояние
между любыми точками из K и E не меньше ε:

∃ε > 0 ∀x ∈ K ∀y ∈ E |x − y| > ε (13.3.73)

Доказательство. Предположим, что это не так, то есть

∀ε > 0 ∃x ∈ K ∃y ∈ E |x − y| 6 ε (13.3.74)
1
Тогда, в частности, для ε = m получим:

1 1
∀ε = ∃xm ∈ K ∃ym ∈ E |xm − ym | 6
m m
Поскольку K – компакт, из последовательности xm ∈ K можно выбрать сходящуюся подпоследо-
вательность:
xmk −→ a ∈ K
k→∞

Тогда получится, что ym тоже стремится к x, потому что


1
|ymk −a| = |ymk −xmk +xmk −a| 6 |ymk −xmk |+|xmk −a| 6 + |xm − a| −→ 0 =⇒ ymk −→ a
mk | k{z } k→∞ k→∞
|{z} ↓
↓ 0
0

Поскольку E замкнуто, и ymk ∈ E, это означает, что a ∈ E. Таким образом, точка a лежит в обоих
множествах K и E:
a ∈ K ∩ E,
что противоречит условию (13.3.72). Это противоречие означает, что наше предположение (13.3.74)
неверно. Значит, должно быть верно (13.3.73).
• Для всякого множества A ⊆ Rn и любого числа ε > 0 множество точек, отстоящих от A
не более чем на ε n o
Bε (A) = y ∈ Rn : ∀x ∈ A |y − x| 6 ε (13.3.75)

называется замкнутой ε-окрестностью множества A, а множество точек, отстоящих от


A строго меньше, чем на ε
n o
Uε (A) = y ∈ Rn : ∀x ∈ A |y − x| < ε (13.3.76)

называется открытой ε-окрестностью множества A.


• Просто окрестностью множества A (без упоминания ε) называется любое открытое
множество U , содержащее замыкание A:

A⊆U

В частности, если A компактно, то его окрестностью считается любое открытое множество


U , содержащее A:
A⊆U
Следствие 13.3.7. 7 Всякая окрестность U произвольного компакта K в евклидовом простран-
стве X содержит некоторую замкнутую ε-окрестность компакта K:

Bε (K) ⊆ U (13.3.77)
7 Этот результат используется при доказательстве леммы 15.3.2 и теоремы 14.1.13
§ 3. Компактность и паракомпактность 787

Доказательство. Положим E = Rn \U , тогда E будет замкнутым множеством (по теореме 13.2.14),


не пересекающимся с K, потому что

K⊆U =⇒ E = Rn \U не содержит точек множества K =⇒ K ∩E =∅

Значит, по теореме 13.3.6, можно выбрать ε > 0 так, чтобы

∀x ∈ K ∀y ∈ E |x − y| > ε

Для этого ε получим:

y ∈ Bε (K) =⇒ ∃x ∈ K |y − x| 6 ε =⇒ / E = Rn \U
y∈ =⇒ y∈U

Стягивание к компакту.
• Последовательность компактов Ki называется сужающейся, если в ней каждый следую-
щий компакт содержится в предыдущем:

K1 ⊇ K2 ⊇ ... ⊇ Ki ⊇ Ki+1 ⊇ ...

Теорема 13.3.8. Любая сужающаяся


T последовательность компактов Ki имеет непустое (и необ-
ходимо компактное) пересечение ∞
i=1 Ki .

Доказательство. Для каждого i выберем произвольную точку xi ∈ Ki . Поскольку все Ki содер-


жатся в K1 , последовательность xi будет лежать в компакте K1 , и значит, из нее можно выделить
сходящуюся подпоследовательность
xis −→ x
s→∞

С другой стороны, для всякого t

xit ∈ Kit , xit+1 ∈ Kit+1 ⊆ Kit , xit+2 ∈ Kit+2 ⊆ Kit+1 ⊆ Kit , ...

то есть, начиная с номера s = t, все элементы последовательности {xis ; s ∈ N} лежат в компакте


Kit :
xit , xit+1 , xit+2 , ... ∈ Kit
Отсюда следует, что предел x этой последовательности тоже лежит в Kit :

lim xis = x ∈ Kit


s→∞

Это верно для любого t ∈ N. То есть точка x принадлежит каждому компакту вида Kit . Отсюда
следует, что x принадлежит каждому компакту вида Ki , потому что выбрав для данного i номер t
так, чтобы it > i, мы получим:
x ∈ Kit ⊆ Ki
То есть x принадлежит пересечению компактов Ki ,

\
x∈ Ki
i=1

Следовательно, это пересечение непусто.

⋄ 13.3.5 (ковер Серпинского). Приведем теперь со стороной 1.


пример замкнутого множества на плоскости с
“бесконечно большим количеством дыр”, уж ес-
ли мы заговорили на эту тему. Такое множество
строится необычно. Рассмотрим снова квадрат

Разделим его на 9 равных квадратов со сторона-


788 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

ми 13 и выбросим внутренность среднего. У нас квадратами, и так далее бесконечное количество


получится фигура склеенная из 8 (замкнутых) раз.
квадратов со стороной 13 : В результате мы получим сужающуюся по-
следовательность компактов, которая по теоре-
ме 13.3.8 должна иметь непустое компактное пе-
ресечение. Интуитивно это означает, что после
того как мы “выбросим из исходного квадрата
все ненужные маленькие квадраты”, на плоско-
сти все равно останется некоторое непустое ком-
пактное множество S (оно содержит стороны ис-
ходного компакта, поэтому будет бесконечно).
Проделаем то же самое с каждым из этих 8 квад- Это множество называется ковром Серпинского,
ратов. Получится фигура, склеенная из 64 (за- по имени математика, впервые его обнаружив-
мкнутых) квадратов со стороной 91 : шего. Оно обладает множеством замечательных
свойств, и в частности, будет связно8 , то есть,
пользуясь терминологией примера 13.3.4, состо-
ит “из одного куска” (хотя по построению имеет
бесконечно много “дырок”).

Затем мы проделываем то же самое с этими 64

• Говорят, что последовательность компактов Ki стягивается к компакту K, если она


сужается и ее пересечение совпадает с K:

\
K= Ki
i=1

Теорема 13.3.9. Если последовательность компактов Ki стягивается к компакту K, то для


любой окрестности U компакта K
K⊆U
почти все компакты Ki содержатся в U :

∃i0 ∈ N ∀i > i0 Ki ⊂ U
Доказательство. Предположим, что это не так, то есть что существует последовательность индек-
сов is −→ ∞ такая, что
s→∞
Kis 6⊆ U
Для каждого s выберем точку
xs ∈ Kis \ U (13.3.78)
Поскольку все компакты Kis содержатся в компакте K1 , последовательность xs тоже лежит в K1 ,
и значит из нее можно выбрать сходящуюся подпоследовательность

xsj −→ x
j→∞
T∞
Точно так же, как при доказательстве теоремы 13.3.8 можно убедиться, что x ∈ K = i=1 Ki .
Поскольку K ⊆ U , мы получаем, что
x∈U
При этом U – открытое множество, значит x – внутренняя точка для U . Следовательно, по теореме
13.2.3, почти все элементы последовательности xsj должны лежать в U :
∃j0 ∀j > j0 xsj ∈ U

Но это противоречит условию (13.3.78), согласно которому все xs должны лежать вне U .
8 Связные множества были определены на с.781.
§ 3. Компактность и паракомпактность 789

Исчерпывание компактами. Последовательность компактов Ki называется расширяющейся,


если в ней каждый следующий компакт содержит в предыдущий:

K1 ⊆ K2 ⊆ ... ⊆ Ki ⊆ Ki+1 ⊆ ...

Говорят, что расширяющаяся последовательность {Ki } исчерпывает множество M , если



[
Ki = M
i=1

Теорема 13.3.10. Всякое открытое множество U в евклидовом пространстве X исчерпывается


некоторой последовательностью компактов Ki :

[
Ki = U (13.3.79)
i=1

Доказательство. Это можно доказывать по-разному, например, можно в качестве Ki взять мно-
жества  
n 1
Ki = x ∈ R : |x| 6 i & inf |x − y| >
y ∈U
/ i
Всякое такое Ki замкнуто и ограничено, значит компактно. Покажем, что Ki исчерпывают U . Пусть
x ∈ U , тогда найдется ε > 0 такое, что
Uε (x) ⊆ U,
поэтому
inf |x − y| > ε > 0
y ∈U
/

и значит, найдется l ∈ N такое, что


1
inf |x − y| >
y ∈U
/ l
С другой стороны, для данного x всегда найдется m ∈ N такое, что

|x| 6 m

Взяв
i = max{l, m}
мы получим:
1 1
|x| 6 m 6 i & inf |x − y| > > ,
y ∈U
/ l i
то есть
x ∈ Ki .
Таким образом, для каждого x ∈ U найдется i ∈ N такое, что x ∈ Ki , и это означает, что справедливо
(13.3.79).

(c) Открытые покрытия


• Семейство {Mi ; i ∈ I} множеств в евклидовом пространстве X называется покрытием
множества K, если K содержится в объединении Mi :
[
K⊆ Mi
i∈I

• Покрытие {Mi ; i ∈ I} множества K называется


— открытым, если все множества {Mi ; i ∈ I} открыты,
— замкнутым, если все множества {Mi ; i ∈ I} замкнуты.
• Подсемейство {Mis ; s ∈ S} называется подпокрытием покрытия {Mi ; i ∈ I} множества
K, если оно также является покрытием для K:
[
K⊆ Mis
s∈S
790 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

Открытые покрытия компакта.


Теорема 13.3.11 (о покрытиях компакта). Множество K ⊆ Rn компактно в том и только в
том случае, если всякое его открытое покрытие {Ui ; i ∈ I}
[
K⊆ Ui
i∈I

содержит его конечное подпокрытие, то есть существует конечная последовательность индек-


сов {i1 , ..., ik } такая, что
k
[
K⊆ Uis
s=1

Доказательство. 1. Пусть K – компакт и {Ui ; i ∈ I} – его открытое покрытие. Покажем, что


из {Ui ; i ∈ I} можно выделить конечное подпокрытие. Предположим, что это не так, то есть что
конечное подпокрытие для K выделить из {Ui ; i ∈ I} невозможно. Добавим, если это нужно, к
системе {Ui ; i ∈ I} еще множество Rn \ K – тогда эта система станет открытым покрытием всего
пространства Rn .
Поскольку K компактно, по теореме 13.3.4 оно ограничено, значит можно подобрать клетку
Q1 = [a1 , b1 ] × ... × [an , bn ], содержащую K:

K ⊆ Q1

Система {Ui ; i ∈ I} является покрытием всего Rn , значит, в частности, она покрывает и Q1 . При
этом, из нее невозможно выделить конечное подпокрытие для Q1 , потому что оно было бы конечным
подпокрытием для K.
Теперь разделим каждый отрезок [ai , bi ] пополам. Тогда клетка Q1 разделится на 2n клеток
P1 , ..., P2n :
Q1 = P1 ∪ ... ∪ P2n
Среди этих маленьких клеток P1 , ..., P2n найдется хотя бы одна Pj , для которой покрытие {Ui ; i ∈ I}
не содержит конечного подпокрытия (потому что иначе получилось бы, что у объединения этих
клеток P1 ∪ ... ∪ P2n = Q1 тоже есть конечное подпокрытие). Обозначим эту клетку Pj символом
Q2 :
Q2 = Pj
Затем повторим эту процедуру: поделим каждое ребро клетки Q2 пополам, тогда Q2 разделится
на 2n клеток P1 , ..., P2n ,
Q2 = P1 ∪ ... ∪ P2n ,
и опять среди этих маленьких клеток P1 , ..., P2n найдется хотя бы одна Pj , для которой покрытие
{Ui ; i ∈ I} не содержит конечного подпокрытия (потому что иначе получилось бы, что для Q2 тоже
есть конечное подпокрытие). Мы обозначаем эту клетку Pj символом Q3 :

Q3 = Pj

Организовав индукцию таким образом, мы получим сужающуюся последовательность клеток


со стремящимся к нулю диаметром

Q1 ⊇ Q2 ⊇ ... ⊇ Qk ⊇ ..., diam Qk −→ 0,


k→∞

для каждой из которых покрытие {Ui ; i ∈ I} не допускает конечного подпокрытия. По теореме


13.3.8, эта последовательность имеет непустое пересечение. Пусть

\
x∈ Qk
k=1

Поскольку множества {Ui ; i ∈ I} покрывают все пространство Rn , какое-то из них Ui должно


содержать точку x:
x ∈ Ui
Множество Ui открыто, значит вместе с точкой x оно содержит некоторую ее окрестность Uε (x):

x ∈ Uε (x) ⊆ Ui
§ 3. Компактность и паракомпактность 791

Поскольку diam Qk −→ 0, найдется k такое, что


k→∞

diam Qk < ε

Для этого индекса k множество Qk должно содержаться в Uε (x), потому что если y ∈ Qk , то
|y − x| 6 diam Qk < ε. Значит
Qk ⊆ Uε (x) ⊆ Ui
Мы получаем, что множество Ui уже образует покрытие клетки Qk . Это противоречит выбору
клеток Qk , по которому система {Ui ; i ∈ I} не допускает конечного подпокрытия для Qk .
2. Предположим теперь, что K – не компакт, то есть что существует последовательность {xk } ⊆
K, такая, что никакая ее подпоследовательность не сходится к точке из K. Это значит, в частности,
что точки {xk } не могут бесконечно повторяться, то есть равенство вида

xk = x

не может выполняться для бесконечного набора индексов k (потому что тогда точка x была бы пре-
делом некоторой подпоследовательности xki ). Отсюда, в свою очередь, следует, что можно выбро-
сить из {xk } повторяющиеся точки, если такие найдутся, и добиться, чтобы точки не повторялись.
Далее, пусть x ∈ K. Тогда найдется выколотая окрестность U̇ε (x), не содержащая точек {xk }
(если бы это было не так, то есть если бы любая выколотая окрестность U̇ε (x) содержала точку из
{xk }, то x была бы пределом некоторой подпоследовательности {xki }). Итак, выберем для каждой
точки x ∈ K число εx так, чтобы выколотая окрестность U̇εx (x) не содержала бы точек {xk }. Тогда
обычная, невыколотая окрестность Uεx (x) будет содержать точку x, и
— / {xk }, то Uεx (x) ∩ {xk ; k ∈ N} = ∅,
если x ∈
— если x ∈ {xk }, то Uεx (x) ∩ {xk ; k ∈ N} = {x},
Поглядим теперь на полученные множества Uεx (x), x ∈ K. Это будет система открытых мно-
жеств, покрывающая K: [
K⊆ Uεx (x)
x∈K

(потому что ∀x ∈ K x ∈ Uεx (x)). Но из этого покрытия невозможно выделить конечное подпокры-
тие, потому что всякая конечная подсистема {Uεxi (xi ); i = 1, ..., m} будет содержать не больше m
точек последовательности {xk } (из-за того, что каждое Uεxi (xi ) содержит не больше одной такой
точки).
Теорема 13.3.12 (свойство равномерности открытого покрытия компакта). Если U1 , ..., Uk – от-
крытое покрытие компакта K в евклидовом пространстве X, то найдется число δ > 0 такое,
что всякое множество A в Rn , пересекающееся с K и имеющее диаметр, меньший δ, обязательно
содержится в некотором Us :
 
A ∩ K 6= ∅, diam A < δ =⇒ ∃s ∈ {1, ..., k} A ⊆ Us . (13.3.80)

Доказательство. Предположим, что это неверно. Тогда существует последовательность множеств


Al со следующими свойствами:
1
Al ∩ K 6= ∅, diam Al < , ∀s ∈ {1, ..., k} Al * Us .
l
Для всякого l ∈ N выберем какую-нибудь точку al ∈ Al ∩ K 6= ∅. Поскольку последовательность
{al } содержится в компакте K, она содержит подпоследовательность, сходящуюся к некоторой
точке x ∈ K:
ali −→ x ∈ K.
i→∞

Поскольку x ∈ K ⊆ U1 ∪...∪Ul , найдется индекс s ∈ {1, ..., k} такой, что x ∈ Us . При этом множество
Us открыто, поэтому x содержится в Us вместе с некоторой своей окрестностью Uε (x):

Uε (x) ⊆ Us , ε>0

Выберем теперь l такое, что


ε ε
|al − x| < , diam Al <
2 2
792 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА

1
(первое можно обеспечить, поскольку ali −→ x, а второе – поскольку diam Al < l ). Тогда мы
i→∞
получим:
ε ε
∀b ∈ Al |b − x| 6 |b − al | + |al − x| 6 diam Al + |al − x| < + = ε,
2 2
поэтому
∀b ∈ Al b ∈ Uε (x) ⊆ Us ,
то есть Al ⊆ Us , что противоречит выбору последовательности {Al }.

Счетные подпокрытия.

Теорема 13.3.13. Всякое открытое покрытие {Ui ; i ∈ I} открытого множества U в евклидовом


пространстве X содержит счетное подпокрытие {Uik ; k ∈ N}.

Доказательство. Построим с помощью теоремы 13.3.10 последовательность компактов Km , исчер-


пывающую U :
[∞
Km = U.
m=1

Возьмем теперь первый компакт K1 . Поскольку множества {Ui ; i ∈ I} покрывают его, среди них
найдется конечное подпокрытие Ui1 , ..., Uil1 :

K1 ⊆ Ui1 ∪ ... ∪ Uil1

Рассмотрим далее второй компакт K2 . Опять поскольку множества {Ui ; i ∈ I} покрывают его,
среди них найдется конечное подпокрытие, обозначим его Uil1 +1 , ..., Uil1 +l2 :

K2 ⊆ Uil1 +1 ∪ ... ∪ Uil1 +l2

Организовав такую индукцию по компактам Km , мы получим последовательность Uis такую, что


каждый компакт Km содержится в объединении некоторого набора ее элементов, и значит

[
Km ⊆ Uis
s=1

Отсюда получаем:

[ ∞
[
U= Km ⊆ Uis
m=1 s=1

Локально конечные семейства множеств.


• Семейство множеств {Ai ; i ∈ I} в евклидовом пространстве X называется локально-
конечным, если для любой точки x ∈ Rn существует окрестность Uε (x), пересекающаяся
лишь с конечным набором множеств {Ai ; i ∈ I}.

Свойства локально конечных семейств множеств


1◦ . Если {Ai ; i ∈ I} – локально конечное семейство множеств, то любое его подсемейство
{Aij ; j ∈ J} тоже будет локально конечным.
2◦ . Семейство множеств {Ai ; i ∈ I} локально конечно тогда и только тогда, когда семей-
ство его замыканий {Ai ; i ∈ I} локально конечно.
3◦ . Для каждого локально конечного семейства множеств {Ai ; i ∈ I} в евклидовом про-
странстве X справедливо равенство
[ [
Ai = Ai (13.3.81)
i∈I i∈I
S
4◦ . Объединение i∈I Ai локально конечного семейства {Ai ; i ∈ I} замкнутых множеств в
евклидовом пространстве X тоже будет замкнутым множеством в Rn .
§ 3. Компактность и паракомпактность 793

Вписанные покрытия и паракомпактность.


• Пусть {Ui ; i ∈ I} и {Vj ; j ∈ J} – два покрытия множества M . Говорят, что
— покрытие {Vj ; j ∈ J} вписано в покрытие {Ui ; i ∈ I}, если для каждого j ∈ J
существует i ∈ I такое, что
Vj ⊆ Ui
— покрытие {Wj ; j ∈ J} комбинаторно вписано в покрытие {Ui ; i ∈ I}, если их
множества индексов совпадают
I = J,
и для всякого i ∈ I
Wi ⊆ Ui
Теорема 13.3.14. В любое открытое покрытие {Ui ; i ∈ I} открытого множества U в евклидо-
вом пространстве X можно вписать локально конечное открытое покрытие {Vj ; j ∈ J} множе-
ства U , состоящее из ограниченных множеств.
Доказательство. Каждая точка x ∈ U содержится в некотором Ui(x) . Поскольку Ui(x) – открытое
множество, найдется некоторая открытая окрестность Uε(x) (x), содержащаяся в Ui(x) .

Uε(x) (x) ⊆ Ui(x)

Для каждой точки x ∈ U выберем такое ε(x) > 0 и рассмотрим семейство множеств {U ε(x) (x); x ∈
3
U }. Поскольку каждое x ∈ U лежит в своей окрестности U ε(x) (x), мы получаем, что семейство
3
{U ε(x) (x); x ∈ U } есть покрытие множества U .
3

[
U= U ε(x) (x)
3
x∈U

Применим к этому покрытию теорему 13.3.13 и выделим из него некоторое счетное подпокрытие:

[
U= U ε(xj ) (xj )
3
j=1

Теперь рассмотрим множества


 
Vj = U 2ε(xj ) (xj ) \ B ε(x1 ) (x1 ) ∪ B ε(x2 ) (x2 ) ∪ ... ∪ B ε(xj−1 ) (xj−1 )
3 3 3 3

Поскольку каждое Vj содержится в шаре U 2ε(xj ) (xj ), оно ограничено.


3
Покажем, что Vj покрывают U . Пусть x ∈ U . Тогда x принадлежит некоторому U ε(xj ) (xj ) и
3
значит, некоторому U 2ε(xj ) (xj ). Отсюда следует, что множество индексов
3

J(x) = {j ∈ N : x ∈ U 2ε(xj ) (xj )}


3

непусто. Значит, у этого множества есть минимальный элемент

j(x) = min J(x) = min{j ∈ N : x ∈ U 2ε(xj ) (xj )}


3

Для этого индекса j(x) справедливо вот что:

∀k < j(x) x∈
/ U 2ε(xk ) (xk )
3


∀k < j(x) x∈
/ B ε(xk ) (xk )
3


x ∈ U ε(xj(x) ) (xj(x) ) & ∀k < j(x) x∈
/ B ε(xk ) (xk )
3 3


794 Глава 13. ЕВКЛИДОВЫ ПРОСТРАНСТВА
 
x ∈ Uε(xj(x) ) (xj(x) ) \ B ε(x1 ) (x1 ) ∪ B ε(x2 ) (x2 ) ∪ ... ∪ B ε(xj(x)−1 ) (xj(x)−1 ) = Vj(x)
3 3 3

С другой стороны, покрытие Vj строго вписано в покрытие Ui , потому что

Vj ⊆ U 2ε(xj ) (xj ) ⊆ B 2ε(xj ) (xj ) ⊆ Ui(xj )


3 3

Наконец, покажем, что {Vj } локально конечно. Пусть x ∈ U . Выберем k так, чтобы

x ∈ U ε(xk ) (xk )
3

Поскольку U ε(xk ) (xk ) – открытое множество, найдется δ > 0 такое, что


3

x ∈ Uδ (x) ⊆ U ε(xk ) (xk )


3

С другой стороны, для любого j > k мы получим

U ε(xk ) (xk ) ∩ Vj = ∅
3


Uδ (x) ∩ Vj = ∅
То есть, окрестность Uδ (x) точки x может пересекаться только с конечным набором множеств Vj ,
а именно с теми, у которых номер не больше k.
Теорема 13.3.15. В любое открытое покрытие {Ui ; i ∈ I} открытого множества U в евкли-
довом пространстве X можно комбинаторно вписать локально конечное открытое покрытие
{Wi ; i ∈ I} множества U .
Доказательство. По теореме 13.3.14 в {Ui ; i ∈ I} можно вписать локально конечное открытое
покрытие {Vj ; j ∈ J}:
∀j ∈ J ∃i ∈ I Vj ⊆ Ui
Зафиксируем для каждого индекса j ∈ J какой-нибудь индекс f (j) ∈ I такой, что

Vj ⊆ Uf (j)

У нас получится некое отображение f : J → I. Положим


[
Wi = Vj
j∈J :
f (j) = i

(объединяются все множества Vj , у которых индекс j обладает свойством f (j) = i). Тогда
1) множества Wi будут открытыми, как объединения открытых множеств,
2) получающееся семейство {Wi ; i ∈ I} будет покрытием для U , потому что
[ [ [ [ [
Wi ⊇ Wf (k) = Vj = Vj = U
i∈I k∈J k∈J j∈J : j∈J
f (j) = f (k)

3) семейство {Wi ; i ∈ I} будет комбинаторно вписано в семейство {Ui ; i ∈ I}, потому что

∀j ∈ J Vj ⊆ Uf (j)


 
∀j ∈ J f (j) = i =⇒ Vj ⊆ Ui


[ [
Wi = Vj = (13.3.81) = Vj ⊆ Ui
j∈J : j∈J :
f (j) = i f (j) = i
§ 3. Компактность и паракомпактность 795

4) остается показать, что семейство {Wi ; i ∈ I} будет локально конечно; пусть x ∈ U ;


поскольку семейство {Vj ; j ∈ J} локально конечно, по свойству 2◦ на с.792 семейство
{Vj ; j ∈ J} тоже локально конечно; значит, найдется ε > 0 такое, что множество

Jx = {j ∈ J : Vj ∩ Uε (x) 6= ∅}

будет конечно; отсюда следует, что множество

Ix = {i ∈ I : Wi ∩ Uε (x) 6= ∅}

тоже будет конечно, потому что оно является образом конечного множества Jx при отоб-
ражении f : J → I:
Ix = f (Jx )
это доказывается следующей цепочкой:

i ∈ Ix

m
[    [   [ 
Vj ∩Uε (x) = Vj ∩Uε (x) = (13.3.81) = Vj ∩Uε (x) = Wi ∩Uε (x) 6= ∅
j∈J : j∈J : j∈J :
f (j) = i f (j) = i f (j) = i

m
∃j ∈ J f (j) = i & Vj ∩ Uε (x) 6= ∅
m
∃j ∈ J f (j) = i & j ∈ Jx
m
∃j ∈ Jx f (j) = i
m
f (Jx ) ∋ i.
Глава 14

ГЛАДКАЯ СТРУКТУРА НА
ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

§1 Гладкие функции на евклидовых пространствах


Как, может быть, помнит читатель, в § 1 главы 3 мы выводили происхождение понятия функции из
идеи взаимной зависимости физических величин: при фиксированных правилах измерений разные
величины оказываются связанными между собой жесткими соотношениями, которые избавляют
нас от необходимости измерять некоторые величины, если известны значения (возможно, прибли-
женные) других величин. К примерам на с.188 можно добавить следующие.

⋄ 14.1.1. Мощность P электрического тока опре- m2 притягиваются по направлению друг к другу


деляется через силу тока I и падение напряже- с силой F , прямо пропорциональной произведе-
ния U на данном участке цепи через формулу нию масс и обратно пропорциональной квадрату
расстояния между ними:
P =I·U
m1 · m2
Из этой формулы следует, что если мы знаем F =G· (14.1.1)
значения I и U , то измерять величину P не нуж- r2
но, ее можно просто вычислить. Здесь G ≈ 6, 674 · 10−11 Н · м2 · кг−2 – гравитаци-
⋄ 14.1.2. Материальные частицы массами m1 и онная постоянная.

Эти примеры иллюстрируют часто встречающуюся в природе ситуацию, когда одна физическая
величина выражается сразу через несколько других. Необходимость изучать такого рода зависимо-
сти как раз и привела к понятию функции многих переменных. Формально под этим понимается
обобщение понятия числовой функции (определенной на с.188), в котором область определения счи-
тается подмножеством (не на прямой R, а) в каком-нибудь координатном пространстве Rn (или Rn ).
Чтобы не отвлекать внимание на несущественные детали, мы будем заменять Rn более абстрактным
объектом, произвольным евклидовым пространством X.
• Числовой функцией на евклидовом пространстве X называется произвольное отображе-
ние f : D(f ) → R, у которого область определения D(f ) содержится в X. В дальнейшем
мы будем использовать в таких случаях запись

f : X ֒→ R

(которая будет означать, что f является функцией с областью определения D(f ) ⊆ X).

⋄ 14.1.3. Самыми простыми примерами функ- деления и возведения в степень:


ций на евклидовых пространствах являются опе-
рации суммирования, вычитания, умножения, f (x, y) = x + y
f (x, y) = x − y

796
§ 1. Гладкие функции на евклидовых пространствах 797

f (x, y) = x · y ременных равенством


x
f (x, y) = u(x1 , ..., xn ) = U (14.1.2)
y
f (x, y) = xy в котором U представляет собой числовое выра-
жение над упорядоченным набором переменных
Их области определения соответственно устрое-
(x1 , ..., xn ). Там же в § 2 главы 4 давалось ин-
ны так:
дуктивное определение области D(u) определе-
ния такой функции. Такие функции, конечно, об-
D(f ) = R2
разуют очень широкий подкласс в классе функ-
D(f ) = R2 ций многих переменных в смысле определения на
D(f ) = R2 с.796, однако не исчерпывают его, как мы увидим
D(f ) = {(x, y) ∈ R2 : y 6= 0} в следующем примере.

D(f ) = (x, y) ∈ R2 : x > 0 ∨ (x = 0 & y > 0) ∨ ⋄ 14.1.5. Функция Дирихле от двух перемен-
ных1 , определенная правилом
 
Z (
∨ x<0&y∈ 1, x ∈ Q & y ∈ Q
2N − 1 D(x, y) =
0, иначе
⋄ 14.1.4. Вспомним, что в главе 4 на с.306 мы
определили стандартную функцию многих пе- не является стандартной.

(a) Непрерывность, предел и асимптотические формулы


Непрерывные функции на еквлидовом пространстве. Прежде чем находить экстремумы
функций многих переменных, полезно понять в каких случаях эти экстремумы существуют. На
этот вопрос отвечает теорема Вейерштрасса об экстремумах, которая верна не только для случая
непрерывной функции на отрезке (теорема 3.3.8), но и, как мы увидим в этом параграфе, обобщается
на случай многих переменных.
• Пусть X – евклидово пространство. Функция f : X ֒→ R называется непрерывной на
множестве E ⊆ X, если она определена всюду на E, то есть E ⊆ D(f ), и для любой
точки a ∈ E и любой последовательности {xm } ⊂ E, сходящейся к точке a,

xm −→ a (xm ∈ E)
m→∞

соответствующая (числовая) последовательность {f (xm )} значений функции f стремится


к f (a):
f (xm ) −→ f (a)
m→∞

Теорема 14.1.1 (Вейерштрасса для функций многих переменных). Если функция f : X ֒→ R на


евклидовом пространстве X, непрерывна на каком-нибудь компакте E ⊆ Rn , то она ограничена
на нем
−∞ < inf f (x) 6 sup f (x) < +∞
x∈E x∈E

и достигает свой нижней и верхней грани:

∃ xmin , xmax ∈ E f (xmin ) = inf f (x) f (xmax ) = sup f (x)


x∈E x∈E

Доказательство. Это утверждение доказывается так же, как теоремы Вейерштрасса 3.3.7 и 3.3.8
для одномерного случая.
1. Сначала доказывается, что f ограничена на E. Предположим обратное, то есть что f не огра-
ничена на E. Значит f не ограничена сверху или снизу. Пусть для определенности f не ограничена
сверху:
∀B ∈ R ∃x ∈ E f (x) > B
Тогда для всякого m ∈ N можно подобрать точку xm ∈ E такую, что

f (xm ) > m (14.1.3)


1 Функция Дирихле от одной переменной была описана на с.189.
798 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Последовательность точек {xm } принадлежит E и значит ограничена. Следовательно, по теореме


Больцано-Вейерштрасса 2.4 этой главы, {xm } содержит сходящуюся подпоследовательность {xmk }:

xmk −→ c ∈ E (14.1.4)
k→∞

Из формулы (2.1) получаем


f (xmk ) > mk −→ +∞
k→∞
поэтому
f (xmk ) −→ +∞ (14.1.5)
k→∞

Но с другой стороны, функция f непрерывна в любой точке E, и в частности в точке c ∈ E, значит


из (14.1.4) следует
f (xmk ) −→ f (c) 6= +∞ (14.1.6)
k→∞

Мы получили противоречие между (14.1.5) и (14.1.6), которое означает, что наше исходное предпо-
ложение было неверно. Значит, функция f все-таки ограничена.
2. Затем доказывается, что f достигает нижней и верхней грани на E. Например, докажем
существование максимума. Поскольку, как мы уже убедились, функция f ограничена сверху на E

∃C ∀x ∈ E f (x) 6 C,

по теореме 2.1.23 о точной границе, мы получаем, что у функции f существует точная верхняя
грань на этом множестве:
∃ sup f (x) = H
x∈E

Это значит, что во-первых, все значения функции f на E не превосходят H

∀x ∈ E f (x) 6 H (14.1.7)

и во-вторых если взять любое число α < H, то обязательно оно окажется меньше, чем какое-то
значение f на E
∀α < H ∃x ∈ E α < f (x)
1
Возьмем в качестве α числа вида H − m . Тогда у нас получится целая последовательность {xm }:

1
∀m ∈ N ∃xm ∈ E H− < f (xm ) (14.1.8)
m
Поскольку последовательность {xm } лежит в E, она ограничена. Значит по теореме Больцано-
Вейерштрасса 3.2.13, из нее можно выбрать сходящуюся подпоследовательность:

xmk −→ c (c ∈ E)
k→∞

Поскольку f непрерывна в любой точке E и, в частности, в точке c ∈ E, мы получаем

f (xmk ) −→ f (c)
k→∞

С другой стороны, из 14.1.7 и 14.1.8 следует


1
H− < f (xmk ) 6 H
mk
откуда  
1
H = lim H − 6 lim f (xmk ) = f (c) 6 H
k→∞ mk k→∞

то есть
f (c) = H
Еще раз вспомнив 14.1.7, получим

∀x ∈ E f (x) 6 H = f (c)

Это означает, что c ∈ E является точкой максимума функции f на множестве E.


§ 1. Гладкие функции на евклидовых пространствах 799

Теорема 14.1.2 (Кантора для функций многих переменных). Если функция f : X ֒→ R на евкли-
довом пространстве X определена и непрерывна на компакте K ⊆ Rn , то она равномерно непре-
рывна на этом компакте: для любых двух последовательностей аргументов αk ∈ K и βk ∈ K
стремящихся друг к другу, соответствующие последовательности значений {f (αk )} и {f (βk )}
тоже стремятся друг к другу:
∀αk , βk ∈ E αk − βk −→ 0 =⇒ f (αk ) − f (βk ) −→ 0
k→∞ k→∞

Доказательство. Это доказывается так же как теорема Кантора в одномерном случае (часть I
с.253).
Теорема 14.1.3 (Коши о промежуточном значении для функций многих переменных). Пусть M
– связное множество в евклидовом пространстве X и f : M → R – непрерывная функция. Для
любых двух точек a, b ∈ M , таких, что f (a) 6= f (b), и любого числа C, лежащего между f (a) и
f (b),  
f (a) < C < f (b) или f (a) > C > f (b)
найдется точка c ∈ M такая, что
f (c) = C

⋄ 14.1.6. Рассмотрим какую-нибудь простень-


кую функцию от двух переменных:
f (x, y) = sin(x · y), ⋄ 14.1.8. Непрерывность билинейных
x, y ∈ R.
форм. Всякая билинейная форма3 α : X × X →
Ее непрерывность (всюду на R2 ) следует из тео-
R на евклидовом пространстве X является
рем о непрерывности элементарных функций ча-
непрерывной функцией на X × X.
сти I: если
R R
xm −→ a, ym −→ b, Доказательство. Здесь снова нужно воспользо-
m→∞ m→∞
ваться теоремой 13.1.16: X изоморфно некоторо-
то
му Rn , поэтому достаточно рассмотреть случай
R
f (xm , ym ) = sin(xm · ym ) −→ sin(a · b) = f (a, b). X = Rn . В примере 12.2.11 мы показали, что вся-
m→∞
кая билинейная форма α : Rn × Rn → R имеет
⋄ 14.1.7. Непрерывность линейных функ- вид
ционалов. Всякий линейный функционал2 f :
X → R на евклидовом пространстве X являет- n
X
ся непрерывной функцией на X. α(x, y) = αi,j ·xi ·y j , x, y ∈ Rn , (14.1.10)
i,j=1
Доказательство. По теореме 13.1.16 о представ-
лении евклидова пространства X изоморфно
где αi,j ∈ Rn – некоторое семейство чисел.
некоторому Rn , поэтому достаточно рассмотреть
n Теперь если
случай X = R . В примере 12.2.4 мы показали,
n
что всякий линейный функционал f : R → R Rn Rn
имеет вид xm −→ a, ym −→ b,
m→∞ m→∞
n
X
f (x) = αi · xi , x ∈ Rn (14.1.9) то по всякой координате i выполняются соотно-
i=1 шения
где α = (α1 , ..., αn ) ∈ Rn – некоторая числовая Rn Rn
строка. Отсюда следует, что Действительно, ес- xim −→ ai , i
ym −→ bi ,
m→∞ m→∞
ли n
R и поэтому
xm −→ a,
m→∞
то это означает, что по всякой координате i вы- n
X
полняется соотношение R
α(xm , ym ) = αi,j · xim · ym
j
−→
n m→∞
R
xim −→ ai , i=1
m→∞ n
X
R
и поэтому −→ αi · ai · bj = α(a, b)
m→∞
n n i=1
X R
X
f (xm ) = αi · xim −→ αi · ai = f (a)
m→∞
i=1 i=1
2 Линейные функционалы на векторном пространстве были определены на с.680.
3 Билинейные формы были определены на с.688.
800 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Предел функции на евклидовом пространстве. Говорят, что функция f : X ֒→ R имеет


предел в точке a на евклидовом пространстве X, равный A, если
1) f определена в некоторой выколотой окрестности точки a (то есть на некотором множе-
стве вида n o
x ∈ X : 0 6= |x − a| < ε
и
2) для любой последовательности {xm }, сходящейся к a,

xm −→ a
m→∞

и не попадающей в a
∀m ∈ N xm 6= a
соответствующая последовательность {f (xm )} значений функции f стремится к A:

f (xm ) −→ A
m→∞

В таком случае пишут


f (x) −→ A
x→a
или
lim f (x) = A
x→a

Теорема 14.1.4 (о единственности предела). Всякая функция f : X ֒→ R в произвольной данной


точке a ∈ X может иметь не более одного предела.
Доказательство. Если f (x) −→ A и f (x) −→ B, то выбрав какую-нибудь последовательность
x→a x→a

xm −→ a, ∀m ∈ N xm 6= a
m→∞

мы получим, что с одной стороны,


f (xm ) −→ A
m→∞

а с другой –
f (xm ) −→ B,
m→∞

и по теореме 3.2.3 о единственности предела числовой последовательности, получаем A = B.

⋄ 14.1.9. Выясним, будет ли справедливо соот- Нам нужно убедиться, что


ношение
x2 · y x2m · ym
−→ 0 −→ 0 (14.1.11)
x2 + y 2 (x,y)→(0,0) (xm )2 + (ym )2 m→∞

Для этого возьмем произвольную последователь- Для этого оценим нашу дробь по модулю:
ность (xm , ym ) на плоскости R2 , сходящуюся к
точке (0, 0), но не попадающую в (0, 0) x2m · ym x2m · |ym |
06 = 6
(xm )2 + (ym )2 (xm )2 + (ym )2
(xm , ym ) −→ (0, 0), (xm , ym ) 6= (0, 0) 6 (2.1.207), (2.1.209) 6
m→∞
3
max{|xm |, |ym |}
Это означает, что последовательности {xm } и 6 2 = max{|xm |, |ym |} m→∞
−→ 0
{ym } должны обладать следующими свойства- max{|xm |, |ym |}
ми:  
 xm −→ 0,  По теореме о двух милиционерах, это означает,
 m→∞  что
ym −→ 0, x2m · ym

 m→∞ 
 −→ 0,
2 2
(xm ) + (ym ) 6= 0 (xm )2 + (ym )2 m→∞
§ 1. Гладкие функции на евклидовых пространствах 801

а отсюда уже получается (14.1.11). Нужно убедиться, что


2
·y
Вывод: xx2 +y 2 −→ 0.  
(x,y)→(0,0) sin xm · yn
⋄ 14.1.10. Выясним, будет ли справедливо соот- −→ 0
max{|xm |, |ym |} m→∞
ношение
x·y
−→ 0 Оцениваем нашу дробь по модулю:
x + y 2 (x,y)→(0,0)
2

Можно убедиться, что в этом случае рассуж-    


sin xm · ym sin xm · ym
дения предыдущего примера не проходят: если 06 = ∼
взять {xm } и {ym } так чтобы max{|xm |, |ym |} max{|xm |, |ym |} m→∞
  применяем формулу

 xm −→ 0, 
 ∼ ∼
m→∞ sin x ∼ x
m→∞ x→0 m→∞
ym −→ 0,

 m→∞ 
 |xm · ym |
(xm )2 + (ym )2 6= 0 ∼
m→∞ max{|xm |, |ym |}
6
то нужная величина не оценивается так, как хо-  2
телось бы: max{|xm |, |ym |}
6 (2.1.207) 6 −→ 0
xm · ym |xm | · |ym | max{|xm |, |ym |} m→∞
06 = 6
(xm )2 + (ym )2 (xm )2 + (ym )2 Отсюда
2
max{|xm |, |ym |}  
6 (2.1.209) 6 2 = 1 6−→ 0 sin xm · ym
max{|xm |, |ym |} m→∞
−→ 0,
max{|xm |, |ym |} m→∞
Это следует понимать как намек на то, что
наш предел не равен тому, что нам нужно:
x·y и значит, справедливо (3.2).
x2 +y 2 6−→ 0. sin(x·y)
(x,y)→(0,0) Вывод: max{|x|,|y|} −→ 0.
(x,y)→(0,0)
Чтобы это доказать, нужно найти какую-
нибудь конкретную последовательность (xm , ym ) ⊲⊲ 14.1.12. Проверьте соотношения:
на плоскости R2 , сходящуюся к точке (0, 0), но не √
·ym 1+x·y 2 −1 ?
попадающую в (0, 0) такую, что (xmx)m 2 +(y )2
m

6 → 1) x2 +y 2 −→ 0;
m→∞ (x,y)→(0,0)
0.  
cos x·y −1
Это обычно бывает нетрудно сделать. Возь- ?
2) x4 +y 4 −→ 0;
мем, скажем, следующую последовательность: (x,y)→(0,0)
   
1
xm = m cos x·y −1
?
ym = m 1 3) x2 +y 2 −→ 0;
(x,y)→(0,0)
 
Ясно, что ln 1+x·y
?
4) |x|+|y| −→ 0;
1 1 (x,y)→(0,0)
xm = −→ 0, ym = −→ 0,  
m m→∞ m m→∞ ln 1+x+y
1 5) max{|x|,|y|}
?
−→ 0;
(xm )2 + (ym )2 = 2 6= 0 (x,y)→(0,0)
m
но при этом x+y ?
6) e 2 −1 −→ 0.
x +|y| (x,y)→(0,0)
1 1 1
xm · ym m · m m2 1 ex·y −1 ?
= 1 1 = 2 = 6−→ 0 7) −→ 0.
(xm )2 + (ym )2 m2 + m2 m2
2 m→∞ x2 +|y| (x,y)→(0,0)

x·y
Вывод: x2 +y 2 6−→ 0. ⋄ 14.1.13. Выясните, существует ли предел у
(x,y)→(0,0) функции
⋄ 14.1.11. Проверим соотношение x2 − y 2
f (x, y) =
  |x| + |y|
sin x · y
−→ 0 в точке (0, 0) и, если да, найдите его.
max{|x|, |y|} (x,y)→(0,0) Для решения, посмотрим сначала, к чему
стремится наша функция на нескольких проб-
Берем последовательности {xm } и {ym } такие
ных последовательностях. Возьмем, например,
что  
 xm −→ 0,  последовательность
 m→∞ 
ym −→ 0,  1

 m→∞  xm = m
 
(xm )2 + (ym )2 6= 0 ym = 0
802 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Тогда ⋄ 14.1.14. Выясните, существует ли предел у


1
функции
x2m − ym 2
m2 − 0 1 x2 − y 2
f (xm , ym ) = = 1 = −→ 0. f (x, y) = 2
|xm | + |ym | m +0
m m→∞ x + y2
Если взять другую последовательность в точке (0, 0) и, если да, найдите его.
  Возьмем последовательность
xm = 0
1
ym = m  1

xm = m
то ym = 0

x2m − ym 2 0 − m12 1
f (xm , ym ) = = −→ 0. Тогда
1 = − m m→∞
|xm | + |ym | 0+ m
1
x2 − ym2
m2 − 0
Эти два примера рождают подозрение, что f (xm , ym ) = m = 1 = 1 −→ 1
x2m + ym
2
m2 + 0
m→∞
f (x, y) стремится к нулю при (x, y) → (0, 0). По-
пробуем доказать это: Возьмем после этого другую последовательность
2
x −y 2
?  
f (x, y) = −→ 0 xm = 0
|x| + |y| (x,y)→(0,0) ym = m1

Берем последовательности {xm } и {ym } такие


Тогда
что  

 xm −→ 0, 
 1
m→∞ x2 − ym2 0− m2
ym −→ 0, f (xm , ym ) = m
2 2
= 1 = −1 −→ −1

 m→∞ 
 xm + y m 0+ m2
m→∞
(xm )2 + (ym )2 6= 0
Нужно убедиться, что Мы получили, что на двух различных последова-
тельностях (xm , ym ) → (0, 0) значение функции
x2m − ym 2
f (x, y) стремится к различным числам: 1 и −1.
−→ 0 (14.1.12)
|xm | + |ym | m→∞ По теореме 3.1 это означает, что предела в точке
быть не может.
Оцениваем нашу дробь по модулю: 2
Вывод: 6 ∃ lim(x,y)→(0,0) xx2 −y
2

+y 2 .

x2m − ym 2
x2m + ym 2
⊲⊲ 14.1.15. Проверьте, существуют ли пределы,
06 6 6
|xm | + |ym | |xm | + |ym | и если да, то найдите их:
 2 √
1+x·y−1
2 max{|xm |, |ym |} 1) lim(x,y)→(0,0) x2 +y 2 ;
6 (2.1.208), (2.1.209) 6 = cos(x2 ·y)−1
max{|xm |, |ym |} 2) lim(x,y)→(0,0) ;
x4 +y 4
= 2 max{|xm |, |ym |} −→ 0 cos(x2 ·y)−1
m→∞ 3) lim(x,y)→(0,0) x2 +y 2 ;
По теореме о двух милиционерах, это означает, 4) lim(x,y)→(0,0) ln(1+x·y)
|x|+y 2 ;
что
x2m − ym 2 ln(1+x2 +y 2 )
−→ 0, 5) lim(x,y)→(0,0) max{|x|,|y|} ;
|xm | + |ym | m→∞ 2
ex+y −1
6) lim(x,y)→(0,0) x2 +|y| .
откуда и получаем (3.3).
2
x2 −y 2 ex ·y −1
Вывод: lim(x,y)→(0,0) |x|+|y| = 0. 7) lim(x,y)→(0,0) x2 +y 2 .

Асимптотические формулы на евклидовых пространствах. Пусть f : X ֒→ R и g : X ֒→ R


– две функции на евклидовом пространстве X, определенные в окрестности точки a ∈ X, и
f (x)
−→ 0. (14.1.13)
g(x) x→a
Тогда говорят, что функция f бесконечно мала по сравнению с функцией g при x → a и записывают
это так
f (x) ≪ g(x)
x→a
или так
f (x) = o (g(x)) (14.1.14)
x→a
§ 1. Гладкие функции на евклидовых пространствах 803

⋄ 14.1.16. Проверим, что ⋄ 14.1.17. Проверим, выполняется ли


x2 + y 2 = o (|x| + |y|) (14.1.15) p p 
3
(x,y)→(0,0) x · y2 = o x2 + y 2 (14.1.16)
(x,y)→(0,0)
Доказательство. Действительно,
Доказательство. Это равносильно условию
x2 + y 2
06 6 (2.1.208), (2.1.209) 6 p
|x| + |y| 3
x · y2
p −→ 0.
2 max2 {|x|, |y|} x2 + y 2 (x,y)→(0,0)
6 = 2 max{|x|, |y|} −→ 0.
max{|x|, |y|} (x,y)→(0,0)
1
Последнее соотношение следует понимать так, Чтобы  его проверить,подставим xm = m , ym =
2 2 1 2 2 2
что если xm → 0, ym → 0, xm + ym 6= 0, m xm + ym = m2 6= 0 :
то 2 max{|xm |, |ym |} → 0. Отсюда следует, что
x2m +ym
2 q
|xm |+|ym | → 0, поэтому p 3 1 1
2
xm · ym m · m2
3
1
p = q = √ 6−→ 0
x2 + y 2 x2 + y2 1 1 2 m→∞
−→ 0 m2 + m2
m m
|x| + |y| (x,y)→(0,0)
То есть мы доказали (14.1.15). То есть (14.1.16) не выполняется.

Помимо соотношений вида (14.1.14) используются более сложные асимптотические формулы с


функциями многих переменных. Как и в случае с одной переменной,
  для их понимания достаточно
знать, что если в какой-то формуле встречается символ o f (x) , то это означает, что на этом
x→a
месте
 стоит
 некоторая (неизвестная) функция α(x), для которой справедливо соотношение α(x) =
o f (x) .
x→a

⋄ 14.1.18. Проверим, что Доказательство. Это условие равносильно со-


p  отношению
x2 + y 2 = 2x − 1 + o (x − 1)2 + y 2  
(x,y)→(1,0)
cos(x + y) − 1 = o max{|x|, |y|}
(x,y)→(0,0)
Доказательство. Это условие равносильно со-
отношению то есть соотношению
p 
2 2 2 2
x + y − 2x + 1 = o (x − 1) + y
(x,y)→(1,0) cos(x + y) − 1
−→ 0
то есть соотношению max{|x|, |y|} (x,y)→(0,0)
x2 + y 2 − 2x + 1 Докажем его:
p −→ 0
(x − 1)2 + y 2 (x,y)→(1,0)

Докажем его: cos(x + y) − 1 |cos(x + y) − 1|


06 = ∼
max{|x|, |y|} max{|x|, |y|} (x,y)→(0,0)
x2 + y 2 − 2x + 1 (x − 1)2 + y 2 (x+y)2
p =p = 2 |x + y|2
2
(x − 1) + y 2 (x − 1)2 + y 2 ∼ = 6
p (x,y)→(0,0)max{|x|, |y|} 2 max{|x|, |y|}
= (x − 1)2 + y 2 −→ 0 2 2
(x,y)→(1,0) x + y + 2|xy|
6 6 (2.1.207), (2.1.209) 6
2 max{|x|, |y|}
4 max2 {|x|, |y|}
⋄ 14.1.19. Проверим, что 6 = 2 max{|x|, |y|} −→ 0
2 max{|x|, |y|} (x,y)→(0,0)
 
cos(x + y) = 1 + o max{|x|, |y|}
(x,y)→(0,0)
804 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

(b) Непрерывно дифференцируемые функции


Дифференциал и непрерывно дифференцируемые функции порядка 1. Пусть X – ев-
клидово пространство.
• Производной функции f : X ֒→ R в точке a ∈ D(f ) по направлению вектора p ∈ X
называется число
f (a + tp) − f (a)
∂p f (a) = lim (14.1.17)
t→0 t
• Дифференциалом (1-го порядка) функции f : X ֒→ R в точке a ∈ D(f ) называется функ-
ция d f (a) : X ֒→ R, которая каждому вектору p ∈ X ставит в соответствие производную
отображения ϕ в точке a по направлению p:
f (a + tp) − f (a)
d f (a)[p] = ∂p f (a) = lim (14.1.18)
t→0 t
• Частными производными функции f : X ֒→ R в точке a ∈ D(f ) относительно базиса
e = (e1 , ..., en ) в X называются числа

∇i f (x) = d f (a)[ei ] = ∂ei f (a), i = 1, ..., n. (14.1.19)

Теорема 14.1.5. Для функции f : X ֒→ R на евклидовом пространстве X с открытой областью


определения D(f ) следующие условия эквивалентны:
(i) в каждой точке a ∈ D(f ) области определения функции f существует дифференциал
d f (a), являющийся непрерывным отображением d f : D(f ) → X ∗ и удовлетворяющий
асимпотическому соотношению
 
f (x) = f (a) + d f (a)(x − a) + o |x − a| ; (14.1.20)
x→a

(ii) для всякого вектора p ∈ X функция f имеет производную ∂p f (a) по направлению p в


каждой точке a ∈ D(f ), причем функция ∂p f : D(f ) → R непрерывна;
(iii) для всякого базиса e = (e1 , ..., en ) в X функция f имеет частные производные ∇1 f (a),...,
∇n f (a) относительно этого базиса в каждой точке a ∈ D(f ), причем функции ∇i f :
D(f ) → R непрерывны;
(iv) существует базис e = (e1 , ..., en ) в X, относительно которого функция f имеет частные
производные ∇1 f (a),...,∇n f (a) в каждой точке a ∈ D(f ), причем функции ∇i f : D(f ) → R
непрерывны.
Если эти условия выполнены, то дифференциал d f функции f выражается через ее частные
производные по произвольному базису e = (e1 , ..., en ) по формуле
n
X  i X n  i
1 1
d f (a) = d f (a)[ei ] · = ∇i f (a) · , a ∈ D(f ). (14.1.21)
i=1
e i=1
e

или, что эквивалентно, справедливо тождество


h p i1 h p in
d f (a)[p] = ∂p f (a) = ∇1 f (a) · + ... + ∇n f (a) · , a ∈ D(f ), p ∈ Rn . (14.1.22)
e e
Как следствие, дифференциал d f (a) : X → R всякой такой функции f : X ֒→ R в каждой точке
a ∈ D(f ) является линейным функционалом на X.
• Функция f : X ֒→ R, удовлетворяющая условиям (i)-(iv) этой теоремы, называется непре-
рывно дифференцируемой (порядка 1).
! 14.1.20. Из соотношения (14.1.20) следует, что непрерывно дифференцируемая функция всегда
непрерывна.
Доказательство теоремы 14.1.5. Здесь импликации (i)⇒(ii)⇒(iii)⇒(iv) очевидны, и нужно только
доказать замыкающую этот круг импликацию (iv)⇒(i). Пусть выполняется (iv). В силу теоремы о
представлении евклидова пространства 13.1.16, мы можем считать, что X = Rn . Для доказатель-
ства достаточно рассмотреть случай двух переменных, потому что на произвольное n обобщение
очевидно. Одновременно под e1 = (1, 0), e1 = (0, 1) мы будем подразумевать стандартный базис в
§ 1. Гладкие функции на евклидовых пространствах 805

R2 . Пусть функция f : R2 ֒→ R определена на открытом множестве D(f ) и имеет частные произ-


водные ∇1 f , ∇2 f (относительно стандартного базиса e1 = (1, 0), e1 = (0, 1)) непрерывные на D(f ),
и пусть (a, b) ∈ D(f ) – какая-нибудь точка. Тогда, обозначив

A = ∇1 f (a, b), B = ∇2 f (a, b),

получим

f (x, y)−f (a, b)−A·(x−a)−B·(y−b) = f (x, y) − f (a, y) + f (a, y) − f (a, b) −A·(x−a)−B·(y−b) =


| {z } | {z }
теорема Лагранжа 5.1.7 k k теорема Лагранжа 5.1.7
∇1 f (u, y) · (x − a) ∇2 f (a, v) · (y − b)
для некоторого для некоторого
u ∈ [a, x] v ∈ [b, y]

= ∇1 f (u, y) · (x − a) + ∇2 f (a, v) · (y − b) − A(x − a) − B(y − b) =


 
= ∇1 f (u, y) − A · (x − a) + ∇2 f (a, v) − B · (y − b)

Отсюда

f (x, y) − f (a, b) − A · (x − a) − B · (y − b)
p =
(x − a)2 + (y − b)2
 x−a  y−b
= ∇1 f (u, y) − A · p + ∇2 f (a, v) − B · p −→ 0.
| {z } 2
(x − a) + (y − b) 2 | {z } (x − a)2 + (y − b)2 (x,y)→(a,b)
↓ | {z } ↓ | {z }
>

>
0 0
1 1

То есть,
p 
f (x, y) = f (a, b) + A · (x − a) + B · (y − b) + o (x − a)2 + (y − b)2 ,
(x,y)→(a,b)

и f дифференцируема в точке (a, b). Теперь для всякого вектора (p, q) ∈ R2 мы получим

f (a, b) + t · (p, q) − f (a, b) f (a + t · p, b + t · q) − f (a, b)
lim = lim =
t→0 t 
t→0 t
1  p 
= lim · A · t · p + B · t · q + o 2
(tp) + (tq) 2 =
t→0 t t→0
 p 
|t| 2 2
= lim A · p + B · q + · o p +q = A · p + B · q.
t→0 t t→0

Это означает, что у функции f имеется дифференциал в каждой точке (a, b) ∈ D(f ), и он имеет вид

d f (a, b)[p, q] = A · p + B · q = ∇1 f (a, b) · p + ∇2 f (a, b) · q. (14.1.23)

Поскольку по условию (iv), функции ∇1 f и ∇2 f непрерывны, отображение d f : D(f ) → (R2 )∗ тоже


непрерывно.
Остается доказать формулу (14.2.123). Для этого нужно заметить, что из (14.1.23) следует, что
отображение d f (a) : X → R является линейным функционалом. Как следствие, для любого базиса
e = (e1 , ..., en )
n
X  i Xn  i
1 1
d f (a) = (12.2.75) = d f (a)[ei ] · = (14.1.19) = ∇i f (a) ·
i=1
e i=1
e

Теорема 14.1.6. Если f : X ֒→ R и g : X ֒→ R – непрерывно дифференцируемые функции на


евклидовом пространстве X, то на их общей области определения D(f ) ∩ D(g) их произведение
f · g также непрерывно дифференцируемо, и его дифференциал вычисляется по формуле

d(f · g)(a) = d f (a) · g(a) + f (a) · d g(a), p ∈ Rn . (14.1.24)


806 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Непрерывно дифференцируемые функции со значением в этой точке функции, определяе-


порядка 1 на Rn . В случае X = Rn под част- мой выражением ∂x ∂U
i
:
ными производными и градиентом понимают
обычно соответствующие конструкции со стан- ∂U
∇i f (a1 , ..., an ) = .
дартным базисом (12.2.56): ∂xi (x1 ,...,xn)=(a1 ,...,an)
( ⋄ 14.1.21. Например, для функции
i 0, i 6= j
(e )j = .
1, i = j f (x, y) = x2 − 3x · y

В этом случае частные производные вычисляют- частная производная ∇1 f вычисляется как ре-
ся по формуле зультат формальной операции дифференцирова-
ния по переменной x:
f (a + t · ei ) − f (a)
∇i f (a) = lim = ∂  2 
t→0 t   ∇ 1 f (x, y) = x − 3x · y = 2x − 3y
∂x
f a1 , ..., ai + t, ..., an − f a1 , ..., ai , ..., an
= lim . И точно так же, частную производную ∇ f мож-
t→0 t 1
но найти как результат формального дифферен-
Частные производные стандартных функ- цирования по переменной y:
ций. Напомним, что числовые выражения бы- ∂  2 
ли определены на с.302 части I. На с. 806 части I ∇2 f (x, y) = x − 3x · y = 0 − 3x = −3x
∂y
было затем определено понятие производного вы-
ражения ∂x∂
(P), или ∂(P)
∂x , числового выражения В частности, в точке (−1, 2), получаются числа
P по переменной x. Там же приводились правила
вычисления производного выражения. ∇1 f (−1, 2) = −8, ∇2 f (−1, 2) = 3

Теорема 14.1.7. Если стандартная функ- ⊲⊲ 14.1.22. Найдите частные производные


ция f над упорядоченным набором переменных функций:
(x1 , ..., xn ), определяется числовым выражением 1) f (x, y) = x2 − xy 2 + y 3 ;
U,
2) f (x, y) = arctg xy ;
f (x1 , ..., xn ) = U,
3) f (x, y) = x sin y 2 ;
∂U
производная которого ∂x i
по какой-нибудь пе- 4) f (x, y) = x ln(x + 2y);
ременной xi определена в точке (a1 , ..., an ), то y
частная производная функции f по переменной 5) f (x, y) = x ;
2
xi существует в точке (a1 , ..., an ) и совпадает 6) f (x, y) = exy .

Градиент функции. По теореме 14.1.5, дифференциал d f (a) : X → R всякой непрерывно диф-


ференцируемой функции f : X ֒→ R в каждой точке a ∈ D(f ) является линейным функционалом
на X. Отсюда следует, что имеет смысл следующее определение.

• Градиентом ∇f (a) непрерывно дифференцируемой функции f : X ֒→ R в точке a ∈ D(f )


называется градиент линейного функционала4 d f (a) : X → R, то есть вектор
n
X n
X
∇f (a) = ∇ d f (a) = d f (a)[ei ] · ei = ∂ei f (a) · ei (14.1.25)
i=1 i=1

где e = (e1 , ..., en ) – произвольный ортонормированный базис в X (по свойству 1◦ на с.758,


вектор ∇f (a) не зависит от выбора ортонормированного базиса e = (e1 , ..., en ) в X).

Свойства градиента функции:

10 . Дифференциал выражается через градиент тождеством

d f (a)[p] = h∇f (a), pi , a ∈ D(f ), p ∈ X. (14.1.26)


4 Градиент линейного функционала был определен выше формулой (13.1.29).
§ 1. Гладкие функции на евклидовых пространствах 807

20 . В произвольной точке a ∈ D(f ) производная f вдоль любого единичного вектора p (то


есть вектора единичной длины) не превосходит модуля градиента этой функции в точке
a
∂p f (a) 6 |∇f (a)|, |p| = 1, (14.1.27)
p
и если ∇f (a) 6= 0, равна ему только если e сонаправлен с ∇f (a):

∇f (a)
∂p f (a) = |∇f (a)| ⇔ p= .
|∇f (a)|

30 . Градиент функции f в точке a показывает направление ее наибольшего возрастания:


если продифференцировать f вдоль единичного вектора p, сонаправленого с градиентом
∇f (a), то получится максимальная производная вдоль единичного вектора в данной
точке a.
Доказательство. 1. Формула (14.1.26) доказывается цепочкой

n
X  i Xn h p ii
1
d f (a)[p] = (14.2.123) = d f (a)[ei ] · [p] = d f (a)[ei ] · =
i=1
e i=1
e
n
* n +
X X
= (13.1.15) = d f (a)[ei ] · hei , pi = d f (a)[ei ] · ei , p = (14.1.25) = h∇f (a), pi
i=1 i=1

2. После этого неравенство (14.1.27) становится следствеим неравенства Коши-Шварца:

∂p f (a) = (14.1.22) = h∇f (a), pi 6 (13.1.9) 6 |∇f (a)| · |p| = |∇f (a)| · 1 = |∇f (a)|,

а равенство достигается только если p сонаправлен с ∇f (a), то есть p = λ · ∇f (a), λ > 0. Поскольку
∇f (a)
|p| = 1, получаем λ · |∇f (a)| = 1 откуда λ = |∇f1(a)| . То есть p = |∇f (a)| .
◦ ◦
3. Свойство 3 есть переформулировка 2 .

⋄ 14.1.23. Проиллюстрируем это понятие на торы, получится картинка:


примере функции

f (x, y) = x2 + y 2

Поскольку

∂f (x, y) ∂f (x, y)
= 2x, = 2y
∂x ∂y Если ее наложить на рисунок из §1, где изобра-
жались линии уровня функции f (x, y) = x2 + y 2 ,
получаем то получится интригующая картинка
∇f (x, y) = (2x, 2y)

Поэтому для нескольких наугад взятых точек


получаются векторы:

∇f (0, 0) = (0, 0), ∇f (0, 1) = (0, 2),


f (1, 0) = (2, 0), ∇f (1, 1) = (2, 2),
∇f (0, −1) = (0, −2), в которой векторы градиента подозрительно пер-
∇f (−1, 0) = (0, −2),
пендикулярны линиям уровня. Это – не слу-
∇f (−1, −1) = (−2, −2)
чайное совпадение. Оказывается, действительно
градиент всякой функции f (x, y) в произвольной
Для всякой точки a градиент ∇f (a) принято во- точке (a, b) перпендикулярен линии уровня, про-
ображать как вектор, выходящий из точки a. По- ходящей через эту точку. И более того, градиент
этому, если изобразить на плоскости наши век- ∇f (x, y) указывает направление, вдоль которого
808 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

функция f (x, y) возрастает с наибольшей скоро- Аналогично, для трех переменных:


стью. Чтобы понять, почему это так, нам придет-
ся ввести понятие производной по направлению d f (x, y, z)[p, q, r] = ∇1 f (x, y, z) · p+
и производной вдоль кривой.
+ ∇2 f (x, y, z) · q + ∇3 f (x, y, z) · r (14.1.29)
! 14.1.24. В частности, для функции двух пере-
менных ⋄ 14.1.25. Пусть f (x, y) = x2 · y. Тогда
d f (x, y)[p, q] = ∇1 f (x, y) · p + ∇2 f (x, y) · q  
(14.1.28) d f (x, y)(p, q) = d x2 · y (p, q) = 2x · y · p + x2 · q

Непрерывная дифференцируемость порядка 2 и теорема Шварца. Для данной функции


многих переменных f : Rn ֒→ R ее частные производные ∇i f тоже являются функциями многих
переменных, поэтому у ∇i f тоже можно вычислять частные производные:

∇j ∇i f

У этих функций в свою очередь тоже можно вычислять частные производные, и так далее.

⋄ 14.1.26. Пусть ∂  
∇1 ∇2 f (x, y) = 2x · y + 3y 2 = 2y,
∂x
f (x, y) = x2 + x · y 2 + y 3
тогда ∂  
∇2 ∇2 f (x, y) = 2x · y + 3y 2 = 6y
∂  2  ∂y
∇1 f (x, y) = x + x · y 2 + y 3 = 2x + y 2 ,
∂x
Можно заметить, что
∂  2 
∇2 f = x + x · y 2 + y 3 = 2x · y + 3y 2
∂y ∇2 ∇1 f (x, y) = ∇1 ∇2 f (x, y).
и
∂  
∇1 ∇1 f (x, y) = 2x + y 2 = 2,
∂x Оказывается, это не случайное совпадение, это
∂   тождество выполняется для любой “достаточно
∇2 ∇1 f (x, y) = 2x + y 2 = 2y гладкой” функции.
∂y

• Функция f : X ֒→ R на евклидовом пространстве X называется непрерывно дифферен-


цируемой порядка 2, если она непрерывно дифференцируема порядка 1, и все ее част-
ные производные ∇1 f ,...,∇n f относительно какого-нибудь базиса e = (e1 , ..., en ) являются
непрерывно дифференцируемыми функциями порядка 1.
Теорема 14.1.8 (Шварца). Пусть функция f : X ֒→ R на евклидовом пространстве X непрерывно
дифференцируема порядка 2, тогда ее смешанные производные совпадают:

∇j ∇i f (x) = ∇i ∇j f (x), x ∈ U. (14.1.30)

Доказательство. По теореме о представлении 13.1.16 мы можем считать, что X = Rn .


1. Рассмотрим сначала случай двух переменных: n = 2. Зафиксируем (a, b) ∈ D(f ) и обозначим

Φ(x, y) = f (x, y) − f (a, y) − f (x, b) + f (a, b).

Если при фиксированном y обозначить ϕ(x) = f (x, y) − f (x, b), то мы получим


n o n o
Φ(x, y) = f (x, y) − f (x, b) − f (a, y) − f (a, b) =

= ϕ(x) − ϕ(a) = ∇1 ϕ(u) · (x − a) = ∇1 f (u, y) − ∇1 f (u, b) ·(x − a) =
| {z } | {z }
k теорема Лагранжа 5.1.7 k теорема Лагранжа 5.1.7
ϕ′ (u) · (x − a) ∇2 ∇1 f (u, v) · (y − b)
для некоторого для некоторого
u ∈ [a, x] v ∈ [b, y]
§ 1. Гладкие функции на евклидовых пространствах 809

= ∇2 ∇1 f (u, v) · (y − b) · (x − a).

С другой стороны, если при фиксированном x обозначить ψ(y) = f (x, y) − f (a, y), то
n o n o
Φ(x, y) = f (x, y) − f (a, y) − f (x, b) − f (a, b) =

= ψ(y) − ψ(b) = ∇2 ψ(ṽ) · (y − b) = v ) ·(y − b) =
∇2 f (x, ve) − ∇2 f (a, e
| {z } | {z }
k теорема Лагранжа 5.1.7 k теорема Лагранжа 5.1.7
ψ ′ (ṽ) · (y − b) ∇1 ∇2 f (e v ) · (x − a)
u, e
для некоторого для некоторого
ṽ ∈ [b, y] e ∈ [a, x]
u

= ∇1 ∇2 f (e
u, ve) · (x − a) · (y − b).

Теперь, раморозив x и y, мы получим цепочку:

∇2 ∇1 f (u, v) · (y − b) · (x − a) = Φ(x, y) = ∇1 ∇2 f (e v ) · (x − a) · (y − b),


u, e

⇓ сокращаем на (x − a) · (y − b)

∇2 ∇1 f (a, b) ←− ∇2 ∇1 f (u, v) = ∇1 ∇2 f (e
u, e
v) −→ ∇1 ∇2 f (a, b)
(x,y)→(a,b) (x,y)→(a,b)


∇2 ∇1 f (a, b) = ∇1 ∇2 f (a, b).
2. Рассмотрим теперь случай произвольного n ∈ N. Зафиксируем точку a ∈ D(f ), индексы
i 6= j ∈ {1, ..., n}, и положим

ϕ(x, y) = f (a + x · ei + y · ej ), x, y ∈ R.

Тогда, по уже доказанному,

∇j ∇i f (a) = ∇2 ∇1 ϕ(0, 0) = ∇1 ∇2 ϕ(0, 0) = ∇i ∇j f (a).

Непрерывная дифференцируемость порядка m и производная по мультииндексу. На-


помним (см. определение на с.659), что мультииндексом длины n и объема m называется про-
извольное отображение k : {1, ..., n} → Z+ , то есть числовая последовательность k = (k1 , ..., kn ),
состоящая из неотрицательных целых чисел: ki ∈ Z+ , удовлетворяющая равенству

|k| = k1 + ... + kn = m.

Множество всех мультииндексов длины n и объема m обозначается Mn [m]. Представлением муль-


тииндекса k ∈ Zn+ называется произвольная последовательность σ : {1, ..., |k|} → {1, ..., n} такая,
что каждое число i ∈ {1, ..., n} присутствует в ней с кратностью ki :

∀i ∈ {1, ..., n} card σ −1 (i) = card{s ∈ {1, ..., |k|} : σs = i} = ki

• Функция f : X ֒→ R на евклидовом пространстве X называется непрерывно дифференци-


руемой порядка m, если она непрерывно дифференцируема порядка 1, и все ее частные
производные ∇1 f ,...,∇n f относительно какого-нибудь базиса e = (e1 , ..., en ) в X являются
непрерывно дифференцируемыми функциями порядка m − 1.
Из теоремы Шварца 14.1.8 следует
Теорема 14.1.9. Для любой функции f : X ֒→ R на евклидовом пространстве X, непрерывно
дифференцируемой порядка |k|, любого базиса e = (e1 , ..., en ) в X, любой точки a ∈ D(f ), любого
мультииндекса k ∈ Zn+ и любого представления σ : {1, ..., |k|} → {1, ..., n} мультииндекса k число

∇k f (a) = ∇σ1 ...∇σ|k| f (a) (14.1.31)

не зависит от представления σ мультииндекса k.


• Число ∇k f (a) называется производной функции f в точке a по мультииндексу k.
810 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Дифференциалы высших порядков Пусть f : X ֒→ R – нерерывно дифференцируемая по-


рядка m функция на евклидовом пространстве X. Зафиксируем вектор p ∈ Rn . Производная ∂p f
функции f по направлению p будет непрерывно дифференцируемой функцией порядка m − 1 на U :

∂p f : Rn ֒→ R x ∈ U 7→ ∂p f (x) ∈ R.

От этой функции также можно брать производную по направлению p, и мы получим непрерывно


дифференцируемую функцию порядка m − 2 на U :

∂p2 f : Rn ֒→ R x ∈ U 7→ (∂p2 f )(x) = ∂p (∂p f )(x) ∈ R.

И так далее. Общая формула


∂pm f = ∂p (∂pm−1 f ), m∈N (14.1.32)
определяет по индукции производную по направлению p порядка m от функции f :

∂pm f : X ֒→ R x ∈ U 7→ (∂pm f )(x) = ∂p (∂pm−1 f )(x) ∈ R.

• Дифференциалом (порядка m) функции f в точке a называется функция dm f (a) : X → R,


которая каждому вектору p ∈ X ставит в соответствие производную порядка m функции
f в точке a по направлению p:
dm f (a)[p] = ∂pm f (a) (14.1.33)
Эту величину можно определить по индукции правилом

dm−1 f (a + tp)[p] − dm−1 f (a)[p]


dm f (a)[p] = lim , (14.1.34)
t→0 t
где дифференциал нулевого порядка определяется формулой

d0 f (a)[p] = f (a) (14.1.35)

! 14.1.27. Если зафиксировать a и p и рассмотреть ограничение функции f на одномерное аффин-


ное подпространство {a + tp; t ∈ R},

h(t) = f (a + tp), t ∈ R,

то производная порядка m этой функции будет совпадать с дифференциалом порядка m от f в


точке a + tp по направлению p:

h(m) (t) = dm f (a + tp)[p], t ∈ R. (14.1.36)

Теорема 14.1.10. Дифференциал dm f (a) порядка m функции f : X ֒→ R выражается через ее


частные производные относительно базиса e = (e1 , ..., en ) формулой5
n
X h p ii1 h p iim X m! h p ik
dm f (a)[p] = ∇i1 ...∇im f (a) · · ... · = · ∇k f (a) · (14.1.37)
i1 ,...,im =1
e e k1 ! · ... · kn ! e
|k|=m

(суммирование ведется по всевозможным мультииндексам k объема m).


Доказательство. 1. Сначала докажем первое равенство в (14.1.37). Для m = 1 это верно в силу
формулы (14.1.22):

f (a + tp) − f (a) X n h p ii1


∂p f (a) = lim = (14.1.22) = ∇i1 f (a) ·
t→0 t i =1
e
1

Предположим, мы доказали это для m − 1:


n
X h p iim−1 h p ii1
∂pm−1 f (a) = ∇im−1 ...∇i1 f (a) · · ... · (14.1.38)
i1 ,...,im−1 =1
e e
 k  1  n
k-моном pe
5 Здесь последовательности функционалов pe , ..., pe определяется формулой (12.4.183), а сами
 p i
функционалы e определяются формулой (12.2.68).
§ 1. Гладкие функции на евклидовых пространствах 811

Тогда

∂pm−1 f (a + tp) − ∂pm−1 f (a)


∂pm f (a) = lim = (14.1.38) =
t→0 t
 X n h p iim−1 h p ii1
1
= lim · ∇im−1 ...∇i1 f (a + tp) · · ... · −
t→0 t e e
i1 ,...,im−1 =1
X n h p iim−1 h p ii1 
− ∇im−1 ...∇i1 f (a) · · ... · =
i ,...,i =1
e e
1 m−1

∇im−1 ...∇i1 f (a + tp) − ∇im−1 ...∇i1 f (a) h p iim−1 h p ii1


n
X
= lim · · ... · = (14.1.22) =
i1 ,...,im−1 =1
t→0 t e e
!
X n X n h p iim h p iim−1 h p ii1 X n h p iim h p ii1
= ∇im ...∇i1 f (a) · · ·...· = ∇im ...∇i1 f (a)· ·...·
i ,...,i =1 i =1
e e e i ,...,i =1
e e
1 m−1 m 1 m

2. После того, как первое равенство в (14.1.37) доказано, сгруппируем слагаемые в этой сумме
так, чтобы последовательности i1 , ..., im были представлениями одного мультииндекса и применим
формулу (12.1.13):
n
X h p iσ1 h p iσm
dm f (a)[p] = ∇σ1 ...∇σm f (a) · · ... · =
σ1 ,...,σm =1
e e
X X h p iσ1 h p iσm X m! h p ik
= ∇σ1 ...∇σm f (a) · · ... · = · ∇k f (a) ·
e e k1 ! · ... · kn ! e
|k|=m σ∈Rep(k) |k|=m

Следствие 14.1.11. Дифференциал второго порядка d2 f (a) всякой функции f : X ֒→ R в произ-


вольной точке a ∈ D(f ) является квадратичной формой на X.

Формула Тейлора.
Теорема 14.1.12. (Тейлора с остаточным членом в форме Лагранжа) Пусть X – евклидово
пространство, функция f : X ֒→ R непрерывно дифференцируема порядка m + 1 и определена в
некоторой окрестности Uε (a) точки a ∈ X. Тогда для любой точки p ∈ Uε (0) найдется число
ξ ∈ [0, 1] такое что

1 1 1 m
f (a + p) = f (a) + d f (a)[p] + d2 f (a)[p] + ... + d f (a)[p]+
1! 2! m!
1
+ dm+1 f (a + ξp)[p] (14.1.39)
(m + 1)!

• Формула (14.1.39) называется формулой Тейлора для функции многих переменных с оста-
точным членом в форме Лагранжа.
Доказательство. Зафиксируем точку p ∈ Uε (0) и рассмотрим одномерное ограничение функции f
в точке a по направлению p:
h(t) = f (a + tp), t ∈ [0, 1]
Поскольку все производные по направлению функции f до порядка m + 1 включительно непрерыв-
ны, функция h должна быть непрерывно дифференцируема до порядка m + 1. Значит, по теореме
Тейлора 10.2.2,
1 1 1 1
h(1) = h(0) + · h′ (0) ·t + · h′′ (0) ·t2 + ... + · h(m) (0) ·tm + · h(m+1) (ξ) ·tm+1
|{z} |{z} 1! | {z } 2! | {z } m! | {z } m! | {z }
k k k k k k
f (a + p) f (a) d f (a)[p] d2 f (a)[p] dm f (a)[p] dm+1 f (a + ξ · p)[p]

где ξ ∈ (0, 1) – некоторая точка.


812 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

! 14.1.28. Для случая двух переменных форму- А для случая трех переменных – вид
ла (14.1.39) принимает вид
1
f (a+p, b+q, c+r) = f (a, b, c)+ d f (a, b, c)(p, q, r)+
1 1!
f (a + p, b + q) = f (a, b) + d f (a, b)(p, q)+ 1 1 m
1! + d2 f (a, b, c)(p, q, r)+...+ d f (a, b, c)(p, q, r)+
1 2 1 m 2! m!
+ d f (a, b)(p, q) + ... + d f (a, b)(p, q)+ 1
2! m! + dm+1 f (a + ξp, b + ξq, c + ξr)(p, q, r)
1 m+1 (m + 1)!
+ d f (a + ξp, b + ξq)(p, q) (14.1.40)
(m + 1)! (14.1.41)

где ξ ∈ [0, 1]. где ξ ∈ [0, 1].

Теорема 14.1.13. (Тейлора с равномерной оценкой остатка) Пусть X – евклидово простран-


ство и f : X ֒→ R – функция, непрерывно дифференцируемая порядка m + 1. Тогда для всякого
компакта K ⊂ D(f ) найдутся два числа ε > 0 и M > 0 такие что справедлива формула
1 1 1 m
f (x+p) = f (x)+ d f (x)[p]+ d2 f (x)[p]+...+ d f (x)[p]+Rm (x, p), x ∈ K, |p| 6 ε (14.1.42)
1! 2! m!
где функция Rm (x, p), называемая остатком формулы Тейлора порядка m для f , удовлетворяет
следующей оценке:
|Rm (x, p)| 6 M · |p|m+1 , x ∈ K, |p| 6 ε
• Формула (14.1.42) называется формулой Тейлора для функции многих переменных с рав-
номерной оценкой остатка.
Доказательство. Напомним, что по определению на с.804, область определения D(f ) функции f
должна быть открытым множеством в X. Воспользуемся следствием 13.3.7, и выберем ε > 0 так,
чтобы замкнутая ε-окрестность Bε (K) множества K лежала в D(f ):
Bε (K) ⊆ D(f )
Положим
X (m + 1)!
M= · max |∇k f (y)|
k1 ! · ... · kn ! y∈Bε (K)
|k|=m+1

Тогда если x ∈ K и |p| 6 ε, то точка x + ξp (ξ ∈ [0, 1]) всегда принадлежит множеству Bε (K),
поэтому

1
|Rm (x, p)| = (14.1.39) = dm+1 f (x + ξp)[p] = (14.1.37) =
(m + 1)!
X (m + 1)! X (m + 1)!
= · ∇k f (x + ξp) · pk 6 · |∇k f (x + ξp)| · |pk | 6
k1 ! · ... · kn ! k1 ! · ... · kn ! | {z } |{z}
|k|=m+1 |k|=m+1
>

k
max |∇k f (y)| k
p1 1 · ... · pk
n
n
y∈Bε (K)
k
k
p1 1 · ... · pk n
n
>

|p|k1 · ... · |p|kn


k
|p|m+1
X (m + 1)!
6 · max |∇k f (y)| ·|p|m+1 = M · |p|m+1
k1 ! · ... · kn ! y∈Bε (K)
|k|=m+1
| {z }
k
M

Теорема 14.1.14. (Тейлора с остаточным членом в форме Пеано) Пусть X – евклидово


пространство и f : X ֒→ R – функция, дифференцируемая порядка m + 1. Тогда для всякой точки
a ∈ D(f )
1 1 1 m
f (a + p) = f (a) + d f (a)[p] + d2 f (a)[p] + ... + d f (a)[p] + o (|p|m ) (14.1.43)
1! 2! m! x→a
§ 1. Гладкие функции на евклидовых пространствах 813

• Формула (14.1.43) называется формулой Тейлора для функции многих переменных с оста-
точным членом в форме Пеано.
Доказательство. Здесь надо просто проверить, что остаток Rm (x, p) в формуле Тейлора (14.1.42)
является бесконечно малой функцией порядка |p|m при p → 0:

Rm (x, p) = o (|p|m ) .
x→a

Действительно,
Rm (x, p) M · |p|m+1
m
6 = M · |p| −→ 0.
|p| |p|m p→0

(c) Дифференциальные выраже- И это будет дифференциальное выражение,


ния и формальный дифферен- и мы называем его мультистепенью элемен-
циал тарных дифференциалов.

• Дифференциальными выражениями называ- Тождественное равенство дифференци-


ются конечные последовательности симво- альных выражений. Напомним, что понятие
лов, составленные из приведенных6 числовых мультииндекса мы определили на с.659.
выражений и специального символа d, на-
зываемого формальным дифференциалом, по • Два дифференциальных выражения U и V
следующим индуктивным правилам: называются тождественно равными, и изоб-
ражается это формулой
(0) всякое приведенное числовое выражение
F считается дифференциальным выраже- U ≡ V,
нием;
если их можно отождествить с помощью сле-
(1) для любого дифференциального выраже- дующих индуктивных правил (здесь F и G –
ния U запись числовые выражения, а U, V, W – дифферен-
d(U) циальные):
считается дифференциальным выражени-
(a) числовые выражения F и G тождествен-
ем;
но равны как дифференциальные выра-
(2) если U и V — дифференциальные выраже- жения тогда и только тогда, когда они
ния, то записи тождественно равны как числовые выра-
(U) + (V), (U) − (V), (U) · (V) жения (то есть определяют одну и ту же
стандартную функцию),
также считаются дифференциальными (b) тождества эквивалентности:
выражениями.
• Пусть x – переменная. Запись d x является
U ≡U (14.1.46)
дифференциальным выражением, и мы назы-
ваем его элементарным дифференциалом. U ≡ V =⇒ V ≡ U (14.1.47)
• Пусть x – переменная. Для всякого числа U ≡ V & V ≡ W =⇒ U ≡W
k ∈ Z+ введем обозначение (14.1.48)

d xk = (d x)k = (d x) · ... · (d x) . (14.1.44) (c) алгебраические тождества:


| {z }
k множителей U +V ≡V +U (14.1.49)
Это будет тоже дифференциальное выраже- (U + V) + W ≡ U + (V + W) (14.1.50)
ние, и мы называем его степенью элементар- 0+V ≡V ≡V +0 (14.1.51)
ного дифференциала. U ·V ≡ V ·U (14.1.52)
• Пусть x1 , ..., xn – переменные. Для всякого    
мультииндекса7 k ∈ Mn введем обозначение U · V ·W ≡ U ·V ·W (14.1.53)
1·V ≡ V ≡V ·1 (14.1.54)
d xk == (d x1 )k1 · ... · (d xn )kn . (14.1.45)  
| {z } U +V ·W ≡U ·W +V ·W (14.1.55)
n множителей
6 Приведенные числовые выражения были определены нами на с.308.
7 Понятие мультииндекса было определено на с.659.
814 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
  1
(d) тождества подстановки: если U1 ≡ U2 и d arccos F ≡ − √ ·dF
V1 ≡ V2 , то 1 − F2
(14.1.74)
d U1 ≡ d U2 (14.1.56)   1
d arctg F ≡ · d F (14.1.75)
U1 + V 1 ≡ U2 + V 2 (14.1.57) 1 + F2
  1
U1 − V 1 ≡ U2 − V 2 (14.1.58) d arcctg F ≡ − · dF
U1 · V 1 ≡ U2 · V 2 (14.1.59) 1 + F2
(14.1.76)
(e) правила вычисления дифференциалов:
— дифференциал d a от любого парамет- f) линейная независимость мультистепе-
ра a всегда нулевой: ней переменных: для любых переменных
x1 , ..., xn и любых двух конечных семейств
d a ≡ 0, (14.1.60)
числовых выражений Fk и Gk , индексиро-
— дифференциал d x от всякой свободной ванных мультииндексами k ∈ Mn ,
переменной x называется элементар- X X
ным дифференциалом; отдельно посту- Fk d xk ≡ Gk d xk ⇐⇒ ∀k Fk ≡ Gk
k k
лируется, что дифференциал от всяко-
(14.1.77)
го элементарного дифференциала все-
гда нулевой: ⋄ 14.1.29. Из (14.1.61) и (14.1.63) следует, что
дифференциал от любой мультистепени элемен-
d(d x) ≡ 0, (14.1.61) тарных дифференциалов равен нулю:
 
— дифференциал от суммы, разности и
d d xk = 0.
произведения дифференциальных вы-
ражений подчиняется правилам:
Отсюда, в свою очередь, для всякого дифферен-
  циального выражения U мы получаем формулу:
d U ± V ≡ dU ± dV (14.1.62)
         
d U · V ≡ dU · V + U · dV d U · d xk = d U · d xk (14.1.78)

(14.1.63) ⋄ 14.1.30. Всякий параметр a можно выносить


за знак дифференциала:
— дифференциалы от элементарных ком-

позиций вычисляются по следующим d a· V ≡ a· dV (14.1.79)
правилам:
Доказательство.
Таблица дифференциалов:
здесь α и a – параметры 0
=

(14.1.60)
 z}|{
  d a · V ≡ (14.1.63) ≡ d a ·V + a · d V =
d F α ≡ α · F α−1 · d F (14.1.64)
= 0 · V + a · d V = 0 + a · d V = (14.1.51) = a · d V
 
F F
d a ≡ ln a · a · d F (14.1.65)
 
d eF ≡ eF · d F (14.1.66) ⋄ 14.1.31. Для числового выражения F и диф-
  1 ференциального выражения U справедливо ра-
d loga F ≡ · d F (14.1.67) венство
F · ln a
  1    
d ln F ≡ · dF (14.1.68)   d U · F − U · d F
U
  F d ≡ (14.1.80)
d sin F ≡ cos F · d F (14.1.69) F F2
 
d cos F ≡ − sin F · d F (14.1.70) Дифференциал числового выражения.
  1 Теорема 14.1.15. Дифференциал всякого при-
d tg F ≡ · dF (14.1.71)
cos2 F веденного числового выражения F над перемен-
  1 ными x1 , ..., xn раскладывается по элементар-
d ctg F ≡ − 2 · d F (14.1.72)
sin F ным дифференциалам
  1
d arcsin F ≡ √ · dF Xn
∂F
1 − F2 dF ≡ · d xi , (14.1.81)
(14.1.73) i=1
∂xi
§ 1. Гладкие функции на евклидовых пространствах 815
X
Доказательство. Это доказывается индукцией d U ≡ (14.1.56) ≡ d Fk · d xk ≡
по построению F . k∈Mn
X  
1. Если F представляет собой десятичную за-
≡ (14.1.62) ≡ d Fk · d xk ≡
пись числа или параметр или переменную, то это
k∈Mn
очевидно верно. X  
2. Если это верно для какого-то выражения ≡ (14.1.78) ≡ d Fk · d xk ≡
F , то для выражений F α , aF , F и остальных в k∈Mn
списке (14.1.64)–(14.1.76) это будет верно в силу X Xn
∂Fk
этих самых формул (14.1.64)–(14.1.76). ≡ (14.1.84) ≡ · d xi · d xk ,
i=1
∂xi
3. Если это верно для каких-то двух числовых k∈Mn

выражений F и G, то для их суммы, разности,


и произведения это будет верно в силу правил и это эквивалентно записи (14.1.84). Мы перебра-
(14.1.62) и (14.1.63). Для отношения F G
это тоже ли все шаги индуктивного определения диффе-
будет верно, поскольку его можно представить ренциального выражения.
в виде произведения G · F −1 , а затем применить
правило для F α с α = −1 и для произведения.
Мы перебрали все правила, по которым стро- Однородные дифференциальные выраже-
ятся приведенные числовые выражения. ния.
• Степенью deg U дифференциального выра-
Следствие 14.1.16. Для всякого числового вы-
жения U называется максимальный объем
ражения F над переменной x справедливо равен-
мультииндекса k в разложении (14.1.84) с
ство
∂F ненулевым коэффициентом Fk .
dF ≡ ·dx (14.1.82) • Дифференциальное выражение U от перемен-
∂x
ной x называется однородным, если в раз-
Теорема 14.1.17. Если F и G — числовые выра-
ложении (14.1.84) слагаемые со степенями,
жения, причем G — одноместное над перемен-
меньшими deg U, равны нулю:
ной y, то
   
∂ k < deg U =⇒ Fk = 0.
d G ≡ G ·dF (14.1.83)
y=F ∂y y=F
Или, иными словами, если разложение
Разложение по мультистепеням элемен- (14.1.84) принимает вид
тарных дифференциалов. X
U≡ Fk · d xk ,(14.1.85)
Теорема 14.1.18. Всякое дифференциальное |k|=n
выражение U над переменными x1 , ..., xn един-
ственным образом раскладывается по мульти- где n – степень выражения U.
степеням элементарных дифференциалов
X Понятно, что дифференциальное выражение
U≡ k
Fk · d x , (14.1.84) U степени n от переменной x однородно тогда и
k∈Mn только тогда, когда оно представимо в виде

где коэффициенты Fk — числовые выражения U ≡ P d xn (14.1.86)


над переменными x1 , ..., xn .

Доказательство. Единственность этого разло- где P — некоторое числовое выражение от пере-


жения следует из условия (14.1.77), поэтому менной x.
нужно доказать только существование. Это де-
лается индукцией по построению U.
Область допустимых значений переменной
1. Если U – числовое выражение, то это оче-
в дифференциальном выражении.
видно.
2. Если это верно для каких-то дифференци- • Областью допустимых значений перемен-
альных выражений U и V, то для U +V, U −V, U ·V ных D(U) в дифференциальном выражении U
это тоже верно в силу формул (14.1.49)-(14.1.55), над переменными x1 , ..., xn называется пере-
позволяющих перегруппировывать слагаемые и сечение областей допустимых значений пере-
множители. менных в числовых выражениях Fk , участву-
3. Если это верно для какого-то дифференци- ющих в разложении (14.1.84):
ального выражения U, то для его дифференциа-
\
ла мы получаем: D(U) = D(Fk ) (14.1.87)
k
816 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Связь с дифференциалом функции. Диф- = − cos x · p3


ференциал выражения связан с дифференциа-
лом функции, определенным формулой (10.2.64), Эти формулы позволяют выписать формулу
следующей теоремой. Тейлора-Лагранжа порядка 2 для этой функции:

Теорема 14.1.19. Пусть стандартная функ- 1


sin(x + p) = sin x + cos x · p − sin x · p2 −
ция f определяется числовым выражением F 2
от переменной x (с заданным фиксированным 1
− cos(x + θp) · p3 , θ ∈ [0, 1]
набором значений параметров), 6
π
f (x) = F , В частности, в точке x = 4 получаем:

π √
 √ √
и при этом F не содержит переменной p и (при 2 2 2 2
этих значениях параметров) его дифференциал sin +p = + ·p− ·p −
4 2 2 4
порядка k ∈ Z+ определен на интервале (a, b): 1  π 
− cos + θp · p3 , θ ∈ [0, 1]
6 4
(a, b) ⊆ D(dk F ). (14.1.88)
⋄ 14.1.33. Найдем дифференциалы до 3 порядка
Тогда дифференциал функции f порядка k опре- включительно от функции
делен на интервале (a, b), и получается из диф-
ференциала выражения F заменой d x на p: f (x) = arctg x

Первый дифференциал определяющего ее выра-


dk f (x)[p] = dk F , жения выписывается из таблицы дифференциа-
d x=p
x ∈ (a, b), p ∈ R. (14.1.89) лов: 1
d arctg x = · dx
⋄ 14.1.32. Найдем дифференциалы до 3 поряка 1 + x2
включительно от функции Второй получается применением правил вычис-
ления:
f (x) = sin x  
1
d2 arctg x = d · d x =
Первый дифференциал определяющего эту 1 + x2
функцию выражения выписывается из таблицы  
1 2x
дифференциалов: = d · dx = − · dx· dx =
1 + x2 (1 + x2 )2
d sin x = cos x · d x 2x
=− · (d x)2
(1 + x2 )2
Второй получается применением правил вычис-
ления: Третий:
 
2 3 2x 2
d sin x = d (cos x · d x) = (14.1.78) = d arctg x = d − · (d x) =
2
(1 + x2 )2
= d (cos x)·d x = − sin x·d x·d x = − sin x·(d x)  
2x
=d − · (d x)2 =
Третий: (1 + x2 )2
 −2(1 + x2 )2 + 2x · 2(1 + x2 ) · 2x
3 2
d sin x = d − sin x · (d x) = (14.1.78) = = · d x · (d x)2 =
(1 + x2 )4
= − d (sin x) · (d x)2 = − cos x · d x · (d x)2 = −2(1 + x2 ) + 2x · 2 · 2x
= · (d x)3 =
= − cos x · (d x)3 (1 + x2 )3
−2 − 2x2 + 8x2
Теперь можно выписать дифференциалы функ- = · (d x)3 =
(1 + x2 )3
ции f :
3x2 − 1
0 =2· · (d x)3
d f (x)[p] = f (x) = sin x (1 + x2 )3
d1 f (x)[p] = cos x · d x = Теперь можно выписать дифференциалы функ-
d x=p
ции f :
= cos x · p
2 d0 f (x)[p] = f (x) = arctg x
d f (x)[p] = − sin x · (d x)2 =
d x=p 1
d1 f (x)[p] = ·dx =
= − sin x · p2 1 + x2 d x=p
1
d3 f (x)[p] = − cos x · (d x)3 = = ·p
d x=p 1 + x2
§ 1. Гладкие функции на евклидовых пространствах 817

2x Теорема 14.1.20. Пусть стандартная функ-


d2 f (x)[p] = − · (d x)2 =
(1 + x2 )2 d x=p ция f определяется числовым выражением F
2x от переменных (x1 , ..., xn ) (с заданным фикси-
=− · p2
(1 + x2 )2 рованным набором значений параметров),
3x2 − 1
d3 f (x)[p] = 2 · · (d x)3 = f (x) = F ,
(1 + x2 )3 d x=p

3x2 − 1
=2· · p3 и при этом F не содержит переменных
(1 + x2 )3
(p1 , ..., pn ) и (при этих значениях параметров)
Формула Тейлора-Лагранжа порядка 2 для этой его дифференциал порядка k ∈ Z+ определен на
функции имеет поэтому вид: открытом множестве U ⊆ Rn :
1 1 2x
arctg(x+p) = arctg x+ 2
·p− · ·p2 + U ⊆ D(dk F ). (14.1.90)
1+x 2 (1 + x2 )2
1 3(x + θp)2 − 1
+ · · p3 Тогда дифференциал функции f порядка k опре-
3 (1 + (x + θp)2 )3
делен на множестве U , и получается из диффе-
Можно выписать ее в конкретной точке, напри- ренциала выражения F заменой d xi на pi :
мер, в x = 1:
π 1 1 dk f (x1 , ..., xn )[p1 , ..., pn ] = dk F ,
arctg(1 + p) = + · p − · p2 + d xi =pi
4 2 4
n
1 3(1 + θp)2 − 1 x ∈ U, p ∈ R . (14.1.91)
+ · · p3
3 (1 + (1 + θp)2 )3
⊲⊲ 14.1.34. Найдите дифференциалы 1-го, 2-го ⊲⊲ 14.1.35. Найдите дифференциалы 1-го, 2-го
и 3-го порядка для многочленов: и 3-го порядка для функций:
2 3 2
1) f (x, y) = x + y + x · y ; 1) f (x, y) = x2 + y 3 + x · y 2 ;
2) f (x, y, z) = xy 2 z 3 ;
2) f (x, y, z) = xy 2 z 3 ;
3) f (x, y, z) = x + y 2 + z 3 ;
3) f (x, y, z) = x + y 2 + z 3 ;
Связь с дифференциалом числового вы- 4) f (x, y) = x · sin y;
ражения. Напомним, что дифференциальные 5) f (x, y) = x ;
y
выражения и формальный дифференциал были
6) f (x, y) = x + cos y;
определены нами в главе 5 на с.813. Аналог тео-
y
ремы 14.1.20 для многих переменных выглядит 7) f (x, y) = x ;
так: 8) f (x, y, z) = xyz .

(d) Локальный экстремум на евклидовом пространстве


• Пусть X – евклидово пространства и функция f : X ֒→ R определена в некоторой окрест-
ности точки a ∈ X. Точка a называется
— точкой локального минимума функции f если для некоторой окрестности Uε (a)
выполняется неравенство

f (a) 6 f (x), x ∈ Uε (a)

— точкой локального максимума функции f если для некоторой окрестности Uε (a)


выполняется неравенство

f (a) > f (x), x ∈ Uε (a)

— точкой локального экстремума функции f если она является точкой локально


минимума или локального максимума функции f .

Условия локального экстремума в терминах свойств дифференциалов.


818 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Теорема 14.1.21 (необходимое условие локального экстремума). Пусть функция f дифференци-


руема в точке a ∈ Rn . Тогда если a – точка локального экстремума функции f , то первый диф-
ференциал функции f в точке a равен нулю:

d f (a) = 0 (14.1.92)

Иными словами, производная по всякому направлению p ∈ Rn функции f в точке a должна быть


равна нулю:
∀p ∈ Rn d f (a)[p] = ∂p f (a) = 0 (14.1.93)
Доказательство. Если p = 0, то производная по такому направлению будет нулем, потому что
дифференцировать приходится константу:

f (a + tp) − f (a) f (a) − f (a)


d f (a)[0] = ∂0 f (a) = lim = lim =0
t→0 t t→0 t
Поэтому важно рассмотреть случай, когда p 6= 0. Пусть f имеет, например, локальный минимум в
точке a:
f (a) 6 f (x), x ∈ Uε (a)
Тогда для произвольного p 6= 0 функция

h(t) = f (a + tp)

будет иметь локальный минимум в точке t = 0:

h(0) = f (a) 6 f (a + tp) = h(t), t ∈ U |p|


ε (0)

Значит, по теореме Ферма 5.1.5, h должна иметь нулевую производную в точке t = 0:

h′ (0) = 0

Это и означает выполнение (14.1.93).


Теорема 14.1.22 (достаточное условие локального экстремума). Пусть функция f – непрерывно
дифференцируемая порядка 2 в некоторой окрестности точки a ∈ Rn и ее первый дифференциал
в точке a равен нулю:
d f (a) = 0
Тогда
(i) если второй дифференциал d2 f (a) функции f в точке a представляет собой положи-
тельно определенную квадратичную форму,

∀p 6= 0 d2 f (a)[p] = ∂p2 f (a) > 0, (14.1.94)

то a – точка локального минимума функции f ;


(ii) если второй дифференциал d2 f (a) функции f в точке a представляет собой отрица-
тельно определенную квадратичную форму,

∀p 6= 0 d2 f (a)[p] = ∂p2 f (a) < 0, (14.1.95)

то a – точка локального максимума функции f ;


(iii) если второй дифференциал d2 f (a) функции f в точке a по некоторым направлениям p
положителен, а по другим отрицателен,

∃p, q ∈ Rn d2 f (a)[p] = ∂p2 f (a) > 0 & d2 f (a)[p] = ∂p2 f (a) < 0, (14.1.96)

то в точке a нет локального экстремума функции f .


Для доказательства нам понадобится следующая
Лемма 14.1.23. Пусть функция h : R ֒→ R – непрерывно дифференцируемая порядка 2 на отрезке
[0, δ], и
1) h′ (0) = 0,
§ 1. Гладкие функции на евклидовых пространствах 819

2) ∃t ∈ [0, δ] h(0) > h(t),


Тогда
3) ∃t ∈ [0, δ] h′′ (t) < 0.
Доказательство. Предположим, что условие 3 не выполняется, то есть, что

h′′ (t) > 0, t ∈ [0, δ]

Тогда
h′ (t) − h′ (0) = (теорема Лагранжа 5.1.7) = h′′ (ξ) · (t − 0) > 0, t ∈ [0, δ]

′ ′
h (t) > h (0) = 0, t ∈ [0, δ]

h(t) − h(0) = (теорема Лагранжа 5.1.7) = h′ (ξ) · (t − 0) > 0, t ∈ [0, δ]

h(t) > h(0), t ∈ [0, δ]
Последнее противоречит условию 2.
Доказательство теоремы 14.1.22. Рассмотрим какой-нибудь замкнутый шар U ε (a) с центром в a,
на котором функция f определена:

U ε (a) = {x ∈ Rn : |x − a| 6 ε}

Пусть Sε обозначает его границу:

Sε = {x ∈ Rn : |x − a| = ε}

Рассмотрим функцию
hp (t) = f (a + tp), p ∈ Sε , t ∈ [0, 1]
Из (14.1.36) получаем
n
X n
X
h′p (t) = ∇i f (a + tp) · pi , h′′p (t) = ∇j ∇i f (a + tp) · pj · pi
i=1 i,j=1

Из последней формулы следует, между прочим, что h′′p – непрерывная функция от переменных
(p, t) ∈ Sε × [0, 1].
1. Предположим теперь, что выполняется условие (i), но при этом a – не точка локального
минимума для f . Тогда
∀δ > 0 ∃x ∈ Uδ (a) f (x) < f (a)

∀δ > 0 ∃p ∈ Sε ∃t ∈ [0, δ] hp (t) = f (a + tp) < f (a) = hp (0)
⇓ применяем лемму 14.1.23

∀δ > 0 ∃p ∈ Sε ∃t ∈ [0, δ] h′′p (t) < 0



 
1
∀m ∈ N ∃pm ∈ Sε ∃tm ∈ 0, h′′pm (tm ) < 0
m
Вспомним теперь, что Sε – компакт. Поэтому из последовательности pm ∈ Sε можно выбрать сходя-
щуюся подпоследовательность pmi :
pmi −→ p ∈ Sε
m→∞
h i
При этом, поскольку tmi ∈ 0, m1i , получаем

tmi −→ 0
m→∞
820 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Значит,
0 > h′′pm (tmi ) −→ h′′p (0)
i m→∞

0 > h′′p (0) = ∂p2 f (a)

Таким образом,
∃p ∈ Sε ∂p2 f (a) 6 0

а это противоречит предположению (i).


2. Мы доказали утверждение (i). Утверждение (ii) можно считать его следствием, потому что
для его доказательства достаточно взять функцию g(x) = −f (x), для которой (i) будет означать то
же, что (ii) для f .
3. Докажем теперь (iii). Условие

∃p ∈ Rn ∂p2 f (a) > 0

означает, что для функции


hp (t) = f (a + tp)

выполняется условие
h′′p (0) > 0

Поскольку h′′p (t) непрерывна, это означает, что существует целый отрезок, на котором h′′p (t) поло-
жительна:
∃δ > 0 ∀t ∈ [0, δ] h′′p (t) > 0

Отсюда
h′p (t) − h′p (0) = (теорема Лагранжа 5.1.7) = h′′p (ξ) · (t − 0) > 0, t ∈ (0, δ]

h′p (t) > h′p (0) = 0, t ∈ (0, δ]

hp (t) − hp (0) = (теорема Лагранжа 5.1.7) = h′p (ξ) · (t − 0) > 0, t ∈ (0, δ]

hp (t) > hp (0), t ∈ (0, δ]

f (a + tp) > f (a), t ∈ (0, δ]

a не может быть точкой локального максимума для f

Аналогично доказывается, что


∃q ∈ Rn ∂q2 f (a) < 0

a не может быть точкой локального минимума для f


§ 1. Гладкие функции на евклидовых пространствах 821

Условия локального экстремума в терминах свойств частных производных Для практи-


ческих целей теоремы 14.1.21 и 14.1.22 удобно переформулировать, заменив в них дифференциалы
частными производными функции f . Первая из этих теорем, применением тождества (14.1.22),
d f (a)[p] = ∇1 f (a) · p1 + ... + ∇n f (a) · pn , p ∈ Rn ,
сводится к следующей:
Теорема 14.1.24 (необходимое условие локального экстремума). Пусть функция f дифференци-
руема в точке a ∈ Rn . Тогда если f имеет в точке a локальный экстремум, то ее частные
производные в этой точке равны нулю:
∇1 f (a) = ... = ∇n f (a) = 0 (14.1.97)
Доказательство. Равенство нулю дифференциала в каждом направлении p ∈ Rn равносильно ра-
венству нулю каждой производной.
• Пусть функция f : Rn ֒→ R – непрерывно дифференцируемая порядка 2 в некоторой
окрестности точки a ∈ D(f ). Матрица, состоящая из вторых производных функции f в
точке a  
∇1 ∇1 f (a) ∇2 ∇1 f (a) ... ∇n ∇1 f (a)
 ∇1 ∇2 f (a) ∇2 ∇2 f (a) ... ∇n ∇2 f (a) 
Hf (a) = 


 (14.1.98)
... ... ... ...
∇1 ∇n f (a) ∇2 ∇n f (a) ... ∇n ∇n f (a)
называется матрицей Гессе8 (функции f в точке a).
Ее определитель называется Гессианом (функции f в точке a):
∇1 ∇1 f (a) ∇2 ∇1 f (a) ... ∇n ∇1 f (a)
∇1 ∇2 f (a) ∇2 ∇2 f (a) ... ∇n ∇2 f (a)
det Hf (a) = (14.1.99)
... ... ... ...
∇1 ∇n f (a) ∇2 ∇n f (a) ... ∇n ∇n f (a)
Лемма 14.1.25. Пусть функция f : Rn ֒→ R непрерывно дифференцируема порядка 2 в некоторой
окрестности точки a ∈ Rn . Тогда
(i) матрица Гессе Hf (a) функции f в точке a является симметрической:
Hf (a)T = Hf (a)
(ii) второй дифференциал d2 f (a) функции f в точке a является квадратичной формой на
Rn (от переменной p), для которой матрица Гессе Hf (a) является порождающей мат-
рицей: D E
d2 f (a)[p] = Hf (a)p, p (14.1.100)

Доказательство. Симметричность матрицы Гессе есть условие, доказанное в теореме Шварца 14.1.8:
∇i ∇j f (a) = ∇j ∇i f (a)
Равенство (14.1.100) следует из формулы (14.1.37):
D E n
X
Hf (a)p, p = ∇i ∇j f (a) · pi · pj = (14.1.37) = d2 f (a)[p]
i,j=1

После этого по теореме 12.4.8, из формулы (14.1.100) и симметричности матрицы Hf (a), следует
что d2 f (a) – квадратичная форма (и Hf (a) – ее порождающая матрица).
Применяя к теореме 14.1.22 критерий Сильвестра (теорему 12.4.19), мы получаем
Теорема 14.1.26 (достаточное условие локального экстремума). Пусть функция f : Rn ֒→ R
непрерывно дифференцируема порядка 2 в некоторой окрестности точки a ∈ Rn и ее частные
производные первого порядка в точке a равны нулю:
∇1 f (a) = ... = ∇n f (a) = 0.
Тогда
8 Людвиг Отто Гессе (Ludwig Otto Hesse) (1811-1874) – немецкий математик.
822 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

(i) если главные миноры матрицы Гессе функции f в точке a положительны:

∇1 ∇1 f (a) ∇2 ∇1 f (a)
∇1 ∇1 f (a) > 0, > 0, ...,
∇1 ∇2 f (a) ∇2 ∇2 f (a)
∇1 ∇1 f (a) ... ∇n ∇1 f (a)
... ... ... > 0, (14.1.101)
∇1 ∇n f (a) ... ∇n ∇n f (a)

то a – точка локального минимума функции f ;


(ii) если главные миноры матрицы Гессе функции f в точке a имеют чередующиеся знаки,
начиная с минуса

∇1 ∇1 f (a) ∇2 ∇1 f (a)
∇1 ∇1 f (a) < 0, > 0, ...,
∇1 ∇2 f (a) ∇2 ∇2 f (a)
∇1 ∇1 f (a) ... ∇n ∇1 f (a)
(−1)n · ... ... ... > 0, (14.1.102)
∇1 ∇n f (a) ... ∇n ∇n f (a)

то a – точка локального максимума функции f .

Локальный экстремум функции двух переменных.


Теорема 14.1.27. Пусть функция f : R2 ֒→ R дважды непрерывно дифференцируема в некоторой
окрестности точки (a, b) ∈ R2 . Для того, чтобы f имела локальный экстремум в точке (a, b)
необходимо, чтобы частные производные f в точке (a, b) были равны нулю:

∇1 f (a, b) = ∇2 f (a, b) = 0. (14.1.103)

Пусть это условие выполнено, тогда


(i) если Гессиан функции f в точке (a, b) положителен

∇1 ∇1 f (a, b) ∇2 ∇1 f (a, b)
det Hf (a, b) = >0 (14.1.104)
∇1 ∇2 f (a, b) ∇2 ∇2 f (a, b)

то (a, b) – точка локального экстремума функции f , причем


— если ∇1 ∇1 f (a, b) > 0 то (a, b) – точка локального минимума для f (x, y);
— если ∇1 ∇1 f (a, b) < 0 то (a, b) – точка локального максимума для f (x, y).
(ii) если Гессиан функции f в точке (a, b) отрицателен

∇1 ∇1 f (a, b) ∇2 ∇1 f (a, b)
det Hf (a, b) = <0 (14.1.105)
∇1 ∇2 f (a, b) ∇2 ∇2 f (a, b)

то f не имеет локального экстремума в точке (a, b).


! 14.1.36. В теореме ничего не сказано о случае, когда Гессиан равен нулю

∇1 ∇1 f (a, b) ∇2 ∇1 f (a, b)
det Hf (a, b) = =0
∇1 ∇2 f (a, b) ∇2 ∇2 f (a, b)

Тогда f может иметь, а может и не иметь локального экстремума в точке (a, b).
Доказательство. C самого начала обозначим

A = ∇1 ∇1 f (a, b), B = ∇2 ∇1 f (a, b) = ∇1 ∇2 f (a, b), C = ∇2 ∇2 f (a, b).

Тогда
A B
det Hf (a, b) = = A · C − B2.
B C
1. Рассмотрим сначала случай, когда Гессиан положителен:

A · C − B2 > 0
§ 1. Гладкие функции на евклидовых пространствах 823

Тогда, во-первых,
A 6= 0, C 6= 0, sgn A = sgn C
и, во-вторых, дискриминанты квадратных трехчленов
B C A B
λ2 + 2 λ+ , + 2 µ + µ2
A A C C
отрицательны:    
B2 C B2 A
4 2
− < 0, 4 2
− < 0,
A A C C
Отсюда следует, что квадратные трехчлены всегда положительны:
B C A B
λ2 + 2 λ+ > 0, + 2 µ + µ2 > 0
A A C C
Поэтому, если взять вместо λ число вида pq , то получится

p2 Bp C
+2 + >0
q2 Aq A
откуда  
sgn Ap2 + 2Bpq + Cq 2 = sgn A, q 6= 0 (14.1.106)

Аналогично, если взять вместо µ число вида pq , то получится

C Bq q2
+2 + 2 >0
A Ap p
откуда  
sgn Ap2 + 2Bpq + Cq 2 = sgn C, p 6= 0 (14.1.107)

Из (14.1.104) и (14.1.105) следует, что если p 6= 0 или q 6= 0 (то есть, если (p, q) 6= 0), то
 
sgn Ap2 + 2Bpq + Cq 2 = sgn A = sgn C (14.1.108)

Поэтому вторая производная функции f (x, y) в точке (a, b) по направлению (p, q) 6= 0 должна иметь
тот же знак, что и A:
 
sgn d2 f (a, b)(p, q) = sgn Ap2 + 2Bpq + Cq 2 = sgn A

Если A > 0, то мы получаем

d2 f (a, b)(p, q) = Ap2 + 2Bpq + Cq 2 > 0, ∀(p, q) 6= 0

и это означает, что (a, b) должна быть точкой локального минимума.


Если же A < 0, то мы получаем

d2 f (a, b)(p, q) = Ap2 + 2Bpq + Cq 2 < 0, ∀(p, q) 6= 0

и это означает, что (a, b) должна быть точкой локального максимума.


2. Рассмотрим теперь случай, когда Гессиан отрицателен:

A · C − B2 < 0

Тогда дискриминант квадратного трехчлена

Aλ2 + 2Bλ + C

положителен, и это означает, что найдутся такие две точки λ1 , λ2 , что

Aλ21 + 2Bλ1 + C > 0, Aλ22 + 2Bλ2 + C < 0

Возьмем теперь
p1
p1 , q1 : = λ1
q1
824 Глава 14. ГЛАДКАЯ СТРУКТУРА НА ЕВКЛИДОВОМ ПРОСТРАНСТВЕ

Тогда
 2 !
2 p1 p1
d f (a, b)(p1 , q1 ) = Ap21 + 2Bp1 q1 + Cq1 = q12 A + 2B + C = Aλ21 + 2Bλ1 + C > 0
q1 q1

С другой же стороны, если взять


p2
p2 , q2 : = λ2
q2
то получится
 2 !
2 p2 p2
d f (a, b)(p2 , q2 ) = Ap22 + 2Bp2 q2 + Cq2 = q22 A + 2B + C = Aλ22 + 2Bλ2 + C < 0
q2 q2

Вместе это означает, что выполняется условие (iii) теоремы 5.6, то есть (a, b) не может быть точкой
локального экстремума.

⋄ 14.1.37. Исследуем на локальный экстремум а вторая производная по первой переменной по-


функцию ложительна

f (x, y) = x3 + y 3 − 3xy. ∇1 ∇1 f (1, 1) = 6 > 0.


Поэтому по теореме 14.1.27, в этой точке имеется
Сначала вычисляем диффер

Вам также может понравиться